数据生成方法、装置、设备及存储介质与流程

文档序号:35668447发布日期:2023-10-07 13:02阅读:27来源:国知局
数据生成方法、装置、设备及存储介质与流程

本申请涉及大数据领域,尤其涉及一种数据生成方法、装置、设备及存储介质。


背景技术:

1、随着数据量的增加,需要进行大数据批量验证,以提高海量数据的准确性。

2、在大数据批量验证的过程中,测试人员对数据表之间的数据关联情况没有途径进行检查和分析,需要依赖于开发设计人员提供的逻辑文档进行数据准备。其中,逻辑文档中记载着数据表之间的数据关联情况。

3、然而,逻辑文档可能存在数据表缺失、数据关联的缺失,导致数据测试中测试人员准备数据的工作量大、效率低。


技术实现思路

1、本申请提供一种数据生成方法、装置、设备及存储介质,用以解决数据准备的工作量大、效率低的问题。

2、第一方面,本申请提供一种数据生成方法,包括:

3、获取待造数的第一数据表的标识信息;

4、以所述标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找所述第一数据表对应的字段关系清单,所述第一数据表对应的字段关系清单中包括所述第一数据表中的字段对应的关联关系,所述关联关系中包括所述第一数据表中的字段和所述第一数据表中字段对应的关联字段,所述多个数据表分别对应的字段关系清单是通过对所述多个数据表进行字段相似性和关联性分析得到的;

5、基于所述第一数据表对应的字段关系清单,构建所述第一数据表与第二数据表之间的数据表关联关系图,所述第二数据表为所述关联字段所属的数据表;基于所述数据表关联关系图,为所述第一数据表中的字段和所述第二数据表中的字段赋值,所述第一数据表中字段的值与所述第一数据表中字段对应的关联字段的值一致。

6、第二方面,本申请提供一种数据生成装置,包括:

7、获取模块,用于获取待造数的第一数据表的标识信息;

8、查找模块,用于以所述标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找所述第一数据表对应的字段关系清单,所述第一数据表对应的字段关系清单中包括所述第一数据表中的字段对应的关联关系,所述关联关系中包括所述第一数据表中的字段和所述第一数据表中字段对应的关联字段,所述多个数据表分别对应的字段关系清单是通过对所述多个数据表进行字段相似性和关联性分析得到的;

9、构建模块,用于基于所述第一数据表对应的字段关系清单,构建所述第一数据表与第二数据表之间的数据表关联关系图,所述第二数据表为所述关联字段所属的数据表;

10、赋值模块,用于基于所述数据表关联关系图,为所述第一数据表中的字段和所述第二数据表中的字段赋值,所述第一数据表中字段的值与所述第一数据表中字段对应的关联字段的值一致。

11、第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的数据生成方法。

12、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现第一方面所述的数据生成方法。

13、第五方面,本申请提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如第一方面提供的数据生成方法。

14、本申请提供的数据生成方法、装置、设备及存储介质,预先通过对多个数据表进行字段相似性和关联性分析,得到多个数据表分别对应的字段关系清单,其中包括第一数据表对应的字段关系清单。在准备对第一数据表进行造数时,可从多个数据表分别对应的字段关系清单中,查询第一数据表对应的字段关系清单,该字段关系清单中记录着第一数据表中的字段和第一数据表中的字段对应的关联字段,因此,可以基于该字段关系清单建立第一数据表与第二数据表之间的数据表关联关系图,第二数据表是关联字段所属的数据表;基于该数据表关联关系图,为第一数据表中的字段和第二数据表中的字段进行赋值,确保第一数据表中字段的值与对应的关联字段的值一致。如此,无需用户人工查找与第一数据表有关联的其他数据表,也无需用户一一手动修改各个数据表中字段的值,有效减少了数据准备的工作量,提高了数据准备的效率。



技术特征:

1.一种数据生成方法,其特征在于,包括:

2.根据权利要求1所述的数据生成方法,其特征在于,所述多个数据表分别对应的字段关系清单是通过如下方式生成的:

3.根据权利要求2所述的数据生成方法,其特征在于,所述对所述多个数据表的表结构进行特征提取,得到所述多个数据表分别对应的表特征,包括:

4.根据权利要求3所述的数据生成方法,其特征在于,所述对所述多个数据表分别对应的表特征进行相似度分析,得到所述多个数据表分别对应的初始关系清单,包括:

5.根据权利要求4所述的数据生成方法,其特征在于,所述特征组合方式为多个,不同的特征组合方式对应不同的组合特征,所述不同的组合特征中均包括特征类型为数据表表名的表特征和特征类型为数据表字段名的表特征;

6.根据权利要求4所述的数据生成方法,其特征在于,所述基于所述多个数据表分别对应的多个表特征和所述多个数据表分别对应的组合特征进行字段的相似度识别,得到所述多个数据表之间的字段相似度,包括:

7.根据权利要求2至6中任一项所述的数据生成方法,其特征在于,所述基于所述多个数据表的表内数据,对所述多个数据表分别对应的初始关系清单中字段对应的相似关系进行验证和筛选,得到所述多个数据表分别对应的字段关系清单,包括:

8.根据权利要求1至6中任一项所述的数据生成方法,其特征在于,所述基于所述数据表关联关系图,为所述第一数据表中的字段和所述第二数据表中的字段赋值,包括:

9.一种数据生成装置,其特征在于,包括:

10.一种电子设备,其特征在于,包括:

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至8中任一项所述的数据生成方法。


技术总结
本申请提供一种数据生成方法、装置、设备及存储介质,涉及大数据领域。该方法包括:获取第一数据表的标识信息;以标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找第一数据表对应的字段关系清单,该字段关系清单中包括第一数据表中的字段和第一数据表中字段对应的关联字段,字段关系清单是通过对多个数据表进行字段相似性和关联性分析得到的;基于第一数据表对应的字段关系清单,构建第一数据表与第二数据表之间的数据表关联关系图,第二数据表为关联字段所属的数据表;基于数据表关联关系图,为第一数据表中的字段和第二数据表中的字段赋值。从而,基于数据表字段之间的关联关系,提高了为数据表赋值的效率和准确性。

技术研发人员:盛燕芬,徐彩霞
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1