一种模糊数据生成方法、装置、设备及存储介质与流程

文档序号:35855150发布日期:2023-10-26 00:04阅读:34来源:国知局
一种模糊数据生成方法、装置、设备及存储介质与流程

本申请涉及数据库,尤其涉及一种模糊数据生成方法、装置、设备及存储介质。


背景技术:

1、随着分布式国产化数据库的发展,许多企业开始丢掉集中式数据库,开始青睐使用分布式数据库。

2、在进行从旧的集中式数据库到新的分布式数据库之间的数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用。

3、当前为了更快的进行国产化数据库替换,对数据库模拟割接的时间要求越来越高,减少前期投入,减少数据泄露途径,为了更加方便异构数据库进行快速割接测试,可以快速的模拟客户数据库的真实数据库信息,将其数据库的表结构信息通过不可逆的方式模拟生成对应的表结构以及模糊信息,将每个表的数据特征信息都提取出来,不需要知道用户的具体表名称以及对应数据,进行模拟割接测试,因此需要一种提取客户数据特征并生成模糊数据的方法。


技术实现思路

1、本申请提供了一种模糊数据生成方法、装置、设备及存储介质,解决了新旧数据库进行数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用,容易造成数据泄露的技术问题。

2、有鉴于此,本申请第一方面提供了一种模糊数据生成方法,所述方法包括:

3、s1、解析原数据库中的数据表结构以及数据,对应得到包含数据表结构以及数据量的二进制数据文件;

4、s2、根据所述二进制数据文件,随机构造匹配所述数据表结构以及数据量的模拟数据;

5、s3、将所述模拟数据进行打包并导入应用于目标数据库中。

6、可选地,所述步骤s1之前还包括:

7、构建与原数据库的加密连接通道,通过所述加密连接通过获取基于加密算法加密的所述原数据库中的数据表结构以及数据。

8、可选地,所述步骤s1具体包括:

9、将加密后的所述原数据库中的数据表结构以及数据,进行表结构相似归类模糊解析,并根据数据量的级别进行表模糊分类,生成包含数据表结构以及数据量的二进制数据文件。

10、可选地,所述步骤s2具体包括:

11、根据所述二进制数据文件,调用算法存储库中的预设数据模型推演算法,随机构造与目标数据库结构相同,目标数据库数据类型一致,且匹配所述数据表结构以及数据量的模拟数据。

12、可选地,所述步骤s3之后还包括:

13、导入成功后,断开与所述原数据库的加密连接通道。

14、本申请第二方面提供一种模糊数据生成装置,所述装置包括:

15、解析单元,用于解析原数据库中的数据表结构以及数据,对应得到包含数据表结构以及数据量的二进制数据文件;

16、模拟单元,用于根据所述二进制数据文件,随机构造匹配所述数据表结构以及数据量的模拟数据;

17、导入单元,用于将所述模拟数据进行打包并导入应用于目标数据库中。

18、可选地,还包括:

19、连接单元,用于构建与原数据库的加密连接通道,通过所述加密连接通过获取基于加密算法加密的所述原数据库中的数据表结构以及数据。

20、可选地,还包括:

21、断连单元,用于导入成功后,断开与所述原数据库的加密连接通道。

22、本申请第三方面提供一种模糊数据生成设备,所述设备包括处理器以及存储器:

23、所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

24、所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的模糊数据生成的方法的步骤。

25、本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的模糊数据生成的方法的步骤。

26、从以上技术方案可以看出,本申请实施例具有以下优点:

27、本申请中,提供了一种模糊数据生成方法、装置、设备及存储介质,通过解析原数据库中的数据表结构以及数据,随机模糊生成与目标数据库匹配的数据表结构及相等数据量的模拟数据,将对应的模糊表结构信息和模拟数据输出,可以直接导入到对应类型的目标数据库中,进行前期的表结构和数据全模拟割接测试,减少模拟割接生成环境次数,快速完成数据库前期割接测试任务,解决了新旧数据库进行数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用,容易造成数据泄露的技术问题。



技术特征:

1.一种模糊数据生成方法,其特征在于,包括:

2.根据权利要求1所述的模糊数据生成方法,其特征在于,所述步骤s1之前还包括:

3.根据权利要求2所述的模糊数据生成方法,其特征在于,所述步骤s1具体包括:

4.根据权利要求3所述的模糊数据生成方法,其特征在于,所述步骤s2具体包括:

5.根据权利要求4所述的模糊数据生成方法,其特征在于,所述步骤s3之后还包括:

6.一种模糊数据生成装置,其特征在于,包括:

7.根据权利要求6所述的模糊数据生成装置,其特征在于,还包括:

8.根据权利要求7所述的模糊数据生成装置,其特征在于,还包括:

9.一种模糊数据生成设备,其特征在于,所述设备包括处理器以及存储器:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-5任一项所述的模糊数据生成方法。


技术总结
本申请公开了一种模糊数据生成方法、装置、设备及存储介质,通过解析原数据库中的数据表结构以及数据,随机模糊生成与目标数据库匹配的数据表结构及相等数据量的模拟数据,将对应的模糊表结构信息和模拟数据输出,可以直接导入到对应类型的目标数据库中,进行前期的表结构和数据全模拟割接测试,减少模拟割接生成环境次数,快速完成数据库前期割接测试任务,解决了新旧数据库进行数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用,容易造成数据泄露的技术问题。

技术研发人员:王国生,刘骏,张玲东,沈旭婷,管天云,吕伟初
受保护的技术使用者:金篆信科有限责任公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1