基于区块链的数据血缘存储方法、系统、设备及介质与流程

文档序号:35867528发布日期:2023-10-27 03:56阅读:160来源:国知局
基于区块链的数据血缘存储方法、系统、设备及介质与流程

本申请涉及数据血缘存储,尤其涉及一种基于区块链的数据血缘存储方法、系统、设备及介质。


背景技术:

1、数据血缘关系,从概念角度来讲,即数据的全生命周期中,数据与数据之间会形成多种多样的关系,这些关系与人类的血缘关系类似,所以被称作数据的血缘关系。从技术角度来讲,数据在产生、处理、流转到消亡过程中,数据之间形成的一种类似于人类社会血缘关系的关系。在大数据治理过程中,数据质量的好坏直接决定着数据价值的高低,通过数据血缘关系存储可以解决数据质量问题。

2、数据的生产加工最终是要回归和赋能业务,什么数据,被哪个业务场景使用,需要使用血缘关系进行串联,因此数据血缘可以帮助数据生产者以及消费者更好地对数据进行追根溯源,提升数据运维、数据治理的效率,具有对数据质量的准确性、一致性、及时性、完整性等维度进行监控覆盖,触发报警机制后的能力,具体有对下游应用进行通知提醒的作用。

3、但是,现有的数据血缘存储在对数据流转过程中产生并记录的各种元数据信息进行采集、处理和存储、对数据之间的血缘关系进行系统性梳理、关联、并将梳理完成信息后,仅仅采用简单原始方式的存储方式,很容易被篡改或者产生脏数据而导致数据质量不高,可信度不高。


技术实现思路

1、针对现有技术的上述不足,本申请提供一种基于区块链的数据血缘存储方法、系统、设备及介质,以解决现有的数据血缘存储方法较为简单,容易被篡改,或者产生脏数据而导致数据质量不高的问题。

2、第一方面,本申请提供了一种基于区块链的数据血缘存储方法,方法包括:在数据实体发生改变时,获取改变前的数据实体,获取改变后的数据实体,获取数据实体发生改变产生的数据血缘记录;确定改变后的数据实体对应的存储节点;当存储节点不存在时,创建存储节点;在存储节点中生成新区块;其中,新区块包括区块头和区块体,且区块头包括改变前的数据实体对应存储区块的哈希值、当前区块的哈希值、merkele根、随机数及时间戳;区块体包括数据血缘记录;向新区块对应存储节点发送验证请求,以验证数据血缘记录是否真实;在真实时,通过区块共识机制确定记账者;将新区块打包发送至记账者,以完成数据血缘记录上链存储。

3、进一步地,在数据实体发生改变之前,方法还包括:通过预设stat()函数,实时检测数据实体是否发生改变;其中,数据实体至少包括结构化数据、半结构化数据、非结构化数据。

4、进一步地,数据血缘记录至少包含改变后的数据实体对应的数据实体id、区块id、数据实体name、实体类型、时间、更新次数以及更新的内容;验证数据血缘记录是否真实,具体包括:确定数据血缘记录对应的数据实体是否存在于当前存储节点,在存在于当前存储节点时,确定数据血缘记录真实。

5、进一步地,在向新区块对应存储节点发送验证请求,以验证数据血缘记录是否真实之后,方法还包括:在验证数据血缘记录不真实之后,生成验证失败信息并结束数据血缘记录上链存储流程。

6、第二方面,本申请提供了一种基于区块链的数据血缘存储系统,系统包括:获取模块,用于在数据实体发生改变时,获取改变前的数据实体,获取改变后的数据实体,获取数据实体发生改变产生的数据血缘记录;生成模块,用于确定改变后的数据实体对应的存储节点;当存储节点不存在时,创建存储节点;在存储节点中生成新区块;其中,新区块包括区块头和区块体,且区块头包括改变前的数据实体对应存储区块的哈希值、当前区块的哈希值、merkele根、随机数及时间戳;区块体包括数据血缘记录;上链模块,用于向新区块对应存储节点发送验证请求,以验证数据血缘记录是否真实;在真实时,通过区块共识机制确定记账者;将新区块打包发送至记账者,以完成数据血缘记录上链存储。

7、进一步地,获取模块包括检测单元,用于通过预设stat()函数,实时检测数据实体是否发生改变;其中,数据实体至少包括结构化数据、半结构化数据、非结构化数据。

8、进一步地,数据血缘记录至少包含改变后的数据实体对应的数据实体id、区块id、数据实体name、实体类型、时间、更新次数以及更新的内容;上链模块包括确定单元,用于确定数据血缘记录对应的数据实体是否存在于当前存储节点,在存在于当前存储节点时,确定数据血缘记录真实。

9、进一步地,上链模块包括结束单元,用于在验证数据血缘记录不真实之后,生成验证失败信息并结束数据血缘记录上链存储流程。

10、第三方面,本申请提供了一种基于区块链的数据血缘存储设备,设备包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被执行时,使得处理器执行如上述任一项的一种基于区块链的数据血缘存储方法。

11、第四方面,本申请提供了一种非易失性计算机存储介质,其上存储有计算机指令,计算机指令在被执行时实现如上述任一项的一种基于区块链的数据血缘存储方法。

12、本领域技术人员能够理解的是,本申请至少具有如下有益效果:

13、本申请通过基于区块链的数据血缘存储方法、系统、设备及介质,通过在数据实体发生改变时,获取改变前的数据实体,获取改变后的数据实体,获取数据实体发生改变产生的数据血缘记录,实现了跟踪数据实体的变化引起的血缘信息的改变;通过在存储节点中生成新区块、将新区块打包发送至记账者,以完成数据血缘记录上链存储,实现了将变化的数据血缘记录在区块链中存储,利用区块链的去中心化、安全可靠性的特点,确保完整准确地存储数据血缘记录,解决数据流通中的信任问题,保证了数据质量。



技术特征:

1.一种基于区块链的数据血缘存储方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于区块链的数据血缘存储方法,其特征在于,在数据实体发生改变之前,所述方法还包括:

3.根据权利要求1所述的基于区块链的数据血缘存储方法,其特征在于,

4.根据权利要求1所述的基于区块链的数据血缘存储方法,其特征在于,在向新区块对应存储节点发送验证请求,以验证数据血缘记录是否真实之后,所述方法还包括:

5.一种基于区块链的数据血缘存储系统,其特征在于,所述系统包括:

6.根据权利要求5所述的基于区块链的数据血缘存储系统,其特征在于,获取模块包括检测单元,

7.根据权利要求5所述的基于区块链的数据血缘存储系统,其特征在于,数据血缘记录至少包含改变后的数据实体对应的数据实体id、区块id、数据实体name、实体类型、时间、更新次数以及更新的内容;

8.根据权利要求5所述的基于区块链的数据血缘存储系统,其特征在于,上链模块包括结束单元,

9.一种基于区块链的数据血缘存储设备,其特征在于,所述设备包括:

10.一种非易失性计算机存储介质,其特征在于,其上存储有计算机指令,所述计算机指令在被执行时实现如权利要求1-4任一项所述的一种基于区块链的数据血缘存储方法。


技术总结
本申请公开了一种基于区块链的数据血缘存储方法、系统、设备及介质,主要涉及数据血缘存储技术领域,用以解决现有的数据血缘存储方法较为简单,容易被篡改,或者产生脏数据而导致数据质量不高的问题。包括:在数据实体发生改变时,获取改变前的数据实体,获取改变后的数据实体,获取数据实体发生改变产生的数据血缘记录;确定改变后的数据实体对应的存储节点;当存储节点不存在时,创建存储节点;在存储节点中生成新区块;区块体包括数据血缘记录;向新区块对应存储节点发送验证请求,以验证数据血缘记录是否真实;在真实时,通过区块共识机制确定记账者;将新区块打包发送至记账者,以完成数据血缘记录上链存储。

技术研发人员:赖成宾
受保护的技术使用者:中孚安全技术有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1