本发明涉及大数据营销,尤其涉及需要大量符合概率分布的数据生成。
背景技术:
1、在大数据营销领域中,档案、用户、用户事件、业务单据等数据的存储和使用是不可缺少的基础环节,因此在开发过程中,无论是系统的演示还是进行压测,大量符合概率分布以及符合物理世界业务逻辑的数据都是必不可少的。因为无法使用真实业务产生数据,因此需要有模拟真实物理世界业务逻辑,产生符合要求的数据的方法。
2、在大数据营销领域中,目前生成数据的方法只能生成静态数据或者完全随机的数据。即使有些方法具备通过配置动态生成无状态数据字段,但是如何通过配置自动生成有状态数据,至今还没有简单有效的解决方案。
技术实现思路
1、为了克服上述技术缺陷,本发明的目的在于提供一种基于配置文件自动生成符合概率分布的数据的方法,其包括:
2、步骤s1:配置需要生成的无状态数据对应的第一配置文件,所述第一配置文件包括需要生成的无状态数据的生成规则和规则对应的权重;
3、步骤s2:配置需要生成的有状态数据对应的第二配置文件,所述第二配置文件包括需要生成的有状态数据的状态机跳转概率和生成规则;
4、步骤s3:解析第一配置文件和第二配置文件中的配置信息;
5、步骤s4:按照第一配置文件自动生成指定数量的符合权重分布的无状态数据,同时,按照第二配置文件自动生成指定数量的符合概率分布的有状态数据。
6、值得注意的是,本申请中的配置、解析和生成方法采用本领域的常规技术手段即可实现,本申请不做特别限定。
7、进一步地,第一配置文件和第二配置文件分别由一个或多个配置表构成。
8、进一步地,所述方法应用于大数据营销领域。
9、进一步地,无状态数据为业务场景中的业务对象,所述有状态数据为业务场景中的业务事件。
10、进一步地,无状态数据为客户和商品,所述有状态数据为客户浏览商品并下单事件。
11、本申请的第二个方面提供一种基于配置文件自动生成符合概率分布的数据的系统,其包括:
12、配置模块,所述配置模块用于配置需要生成的无状态数据对应的第一配置文件,所述第一配置文件包括需要生成的无状态数据的生成规则和规则对应的权重;还用于配置需要生成的有状态数据对应的第二配置文件,所述第二配置文件包括需要生成的有状态数据的状态机跳转概率和生成规则;
13、解析模块,所述解析模块用于解析第一配置文件和第二配置文件中的配置信息;
14、生成模块,所述生成模块用于按照第一配置文件自动生成指定数量的符合权重分布的无状态数据,同时,按照第二配置文件自动生成指定数量的符合概率分布的有状态数据。
15、进一步地,第一配置文件和第二配置文件分别由一个或多个配置表构成。
16、进一步地,所述系统应用于大数据营销领域。
17、进一步地,无状态数据为业务场景中的业务对象,所述有状态数据为业务场景中的业务事件。
18、进一步地,无状态数据为客户和商品,所述有状态数据为客户浏览商品并下单事件。
19、采用了上述技术方案后,与现有技术相比,具有以下有益效果:
20、本申请在大数据营销领域中首次实现通过简单配置即可实现自动生成大量符合概率要求的有状态数据和无状态数据,从而应用于大数据营销领域中的各种需要大量使用模拟数据的场景中。
1.一种基于配置文件自动生成符合概率分布的数据的方法,其特征在于,包括:
2.如权利要求1所述的自动生成符合概率分布的数据的方法,其特征在于,第一配置文件和第二配置文件分别由一个或多个配置表构成。
3.如权利要求1所述的自动生成符合概率分布的数据的方法,其特征在于,所述方法应用于大数据营销领域。
4.如权利要求3所述的自动生成符合概率分布的数据的方法,其特征在于,无状态数据为业务场景中的业务对象,所述有状态数据为业务场景中的业务事件。
5.如权利要求4所述的自动生成符合概率分布的数据的方法,其特征在于,无状态数据为客户和商品,所述有状态数据为客户浏览商品并下单事件。
6.一种基于配置文件自动生成符合概率分布的数据的系统,其特征在于,包括:
7.如权利要求6所述的自动生成符合概率分布的数据的系统,其特征在于,第一配置文件和第二配置文件分别由一个或多个配置表构成。
8.如权利要求6所述的自动生成符合概率分布的数据的系统,其特征在于,所述系统应用于大数据营销领域。
9.如权利要求8所述的自动生成符合概率分布的数据的系统,其特征在于,无状态数据为业务场景中的业务对象,所述有状态数据为业务场景中的业务事件。
10.如权利要求9所述的自动生成符合概率分布的数据的系统,其特征在于,无状态数据为客户和商品,所述有状态数据为客户浏览商品并下单事件。