本发明属于区块链技术和信息安全领域,尤其涉及一种面向异构区块链的信息内容风险检测方法及系统。
背景技术:
1、区块链融合了分布式存储、点对点网络、共识机制、密码学和智能合约等计算机技术,使得数据公开透明、不可篡改、不可伪造、可追溯。以区块链为载体的信息和价值的协同和传递已经在社会经济生活中显现出强大的创新驱动能力。与此同时,随着区块链应用深度和广度的急速提升,区块链上的信息内容安全问题凸显,已发生过利用区块链匿名、不可篡改、不可删除的特性进行违法不良信息传播的现象。
2、我国区块链监管的核心思路是实名制、备案制、和设置监管节点,也即要求境内使用区块链网络服务的用户必须是实名制的、境内提供区块链网络服务的主体必须取得中央网信办的备案许可、境内运行的区块链网络服务系统必须设置监管节点。
3、面向境内的异构区块链及其多样化的链上应用与内容,区块链监管在高效接入与风险检测方面存在技术挑战。
4、(1)通过构建监管节点服务,将应用区块链纳入监管中,支撑内容安全监管。应用区块链及其应用系统的多样性对信息检测系统的高效接入提出了较大挑战,需要设计一种业务无关、灵活易扩展的信息检测接入方法,能够使得企业能以较低成本配合实行信息安全检测服务且不影响其常规业务。
5、(2)在多轮区块链创新应用浪潮中,区块链应用范围大大扩展,由单纯的加密货币交易信息到多媒体信息内容,多样化链上内容对信息检测系统提出了新的挑战。围绕信息服务的应用规模和信息内容存储与传播能力,如何对接入信息内容高效且准确的检测是关键。
技术实现思路
1、本发明的目的在于克服面向异构区块链及其多样化应用系统的高效接入与风险检测技术的不足,提出一种面向异构区块链的信息内容风险检测方法及系统,解决了大规模多类型区块链应用数据的高效且准确的检测问题。
2、具体来说,本发明结合基于异构区块链应用多样性兼容机制与适配多样性的多级动态关键词过滤引擎,实现区块链多类型应用的高效接入与风险检测。该方案是以一个区块链统一接入与风险检测平台为载体实现的。该平台是前后端分离模式实现的,前端由vue框架实现,后端是基于springboot+mybatis+elasticsearch实现的restful api接口服务的形式供前端页面调用,针对异构区块链及链上应用的数据多样性,采用主流的分布式搜索引擎elasticsearch对数据进行统一存储与检索,而对于服务部署方式的选择,考虑到服务的快速部署与扩缩,结合海量数据多样性的接入检测场景,实现服务编排管理模块,提供服务的调度、核心控制和运行时管理等功能。
3、本发明的技术方案,包括:
4、一种面向异构区块链的信息内容风险检测方法,所述方法包括:
5、构建若干个字典树;其中,每一所述字典树包括与一数据类型相关的关键词;
6、对异构区块链中的数据经过统一接入、数据类型与核心要素提取后,得到待检测数据集;
7、基于数据类型选择一字典树,遍历所述字典树的节点并将所述节点添加到一空ac自动机中后,得到该数据类型对应的ac自动机;
8、基于所述ac自动机,对所述待检测数据集中对应数据类型的待检测数据进行匹配,并基于匹配结果,生成信息内容风险检测结果。
9、进一步地,所述关键词包括:相关人的关键词、相关机构的关键词或相关事件的关键词。
10、进一步地,所述对异构区块链中的数据经过统一接入、数据类型与核心要素提取后,得到待检测数据集,包括:
11、定义一个统一标准化模型;其中,所述统一标准化模型用于:
12、所述数据模型包括异构区块链涉及的所有数据类型,所述数据类型包括:交易信息、账户信息、合约发布、合约调用、合约代码和元数据信息;
13、和,
14、为每个数据类型明确定义必要的数据字段,所述必要的数据字段包括:数据类型、数据长度和数据格式;
15、和,
16、对各种数据类型的差异化数据进行统一封装,并结合关键通用字段,提供对外格式统一的数据;
17、和,
18、使用规范的命名规则,以以确保不同数据元素之间的交互和解释一致性;其中,所述规范的命名规则包括:驼峰命名法或下划线分隔符;
19、和,
20、在不同区块链使用不同的数据格式或编码方式的情况下,定义一数据转换规则,以确保数据在不同区块链之间的传输和解释;
21、基于所述统一标准化模型,获取异构区块链中数据的统一表达,以构建待检测数据集。
22、进一步地,基于所述ac自动机,对所述待检测数据集中对应数据类型的待检测数据进行匹配,包括:
23、针对包含k个字符的待检测数据,按字符逐个遍历所述ac自动机;
24、如果当前字符char_j在当前节点node_i的子节点中,则继续向下匹配;
25、如果当前字符char_j不在当前节点node_i的子节点中,则返回到所述ac自动机的根节点node_0,重新开始匹配;
26、当匹配到叶子节点node_k时,记录关键词在待检测数据中的起始位置startj和结束位置endj。
27、进一步地,所述基于匹配结果,生成信息内容风险检测结果,还包括:
28、基于关键词在待检测数据中的起始位置startj和待检测数据的文本长度,得到该关键词的位置重要性;
29、结合关键词的前后语境,得到该关键词的上下文分析结果;
30、计算关键词长度;
31、根据该关键词的位置重要性、上下文分析结果和关键词长度,得到所述关键词的级别;
32、基于所述关键词的级别,得到该关键词的危害级别;
33、依据该关键词的危害级别,确定信息内容风险检测结果。
34、进一步地,基于所述关键词的级别,得到该关键词的危害级别,包括:
35、在所述关键词的级别大于第一阈值thresholdhigh risk的情况下,将该关键词划为高危害关键词;
36、在所述关键词的级别大于第二阈值thresholdlow risk,且小于第一阈值thresholdhigh risk的情况下,将该关键词划为低危害关键词;
37、在所述关键词的级别小于第二阈值thresholdlow risk,将该关键词划为疑似关键词;其中,thresholdlow risk<thresholdhigh risk。
38、进一步地,基于所述ac自动机,对所述待检测数据集中对应数据类型的待检测数据进行匹配,并基于匹配结果,生成信息内容风险检测结果之后,还包括:
39、上链请求拦截所述信息内容风险检测结果对应的命中内容;
40、和,
41、上报所述信息内容风险检测结果对应的命中内容。
42、进一步地,基于所述ac自动机,对所述待检测数据集中对应数据类型的待检测数据进行匹配,并基于匹配结果,生成信息内容风险检测结果之后,还包括:
43、接收用户从web前台界面发起查询请求;
44、针对所述查询请求,通过webservice服务层调用业务计算层,以使业务计算层可对从数据层返回的信息内容风险检测结果进行统计与分析后,通过所述webservice服务层返回给web前台界面。
45、一种面向异构区块链的信息内容风险检测系统,所述系统包括:
46、引擎编排管理模块,用于发出引擎编排调用请求,并对请求进行内部认证与鉴权;
47、资源调度模块,用于将字典树写入元数据;其中,每一所述字典树包括与一数据类型相关的关键词;
48、节点管理模块,用于调用引擎容器镜像服务拉取镜像,以创建引擎容器;
49、核心控制模块,用于实现引擎容器的运行时管理;
50、动态管理模块,用于通过核心控制模块实现引擎容器的运行时管理,其中,所述通过核心控制模块实现引擎容器的运行时管理,包括:
51、对异构区块链中的数据经过统一接入、数据类型与核心要素提取后,得到待检测数据集;
52、基于数据类型选择一字典树,遍历所述字典树的节点并将所述节点添加到一空ac自动机中后,得到该数据类型对应的ac自动机;
53、基于所述ac自动机,对所述待检测数据集中对应数据类型的待检测数据进行匹配,并基于匹配结果,生成信息内容风险检测结果。
54、相较于现有的异构区块链应用检测方案,本发明提出的面向异构区块链的信息内容风险检测方法及系统具有以下益处:
55、1.本发明所述的兼容异构区块链应用多样性的接入检测方法,对接入的应用数据进行了统一化表达,为适配多级动态关键词引擎,通过数据解析模型提取关键数据类型与检测要素,为后续的数据风险检测提供了规范统一的数据输入,使方案具备业务无关性与可扩展性。
56、2.本发明在基于异构区块链应用多样性兼容机制的基础上,针对区块链数据类型的特征设计基于区块链核心数据特征的ac自动机匹配机制,引入多级动态关键词引擎技术,实现适配区块链应用数据多样性的检测方法,极大提升了数据风险的检测效率,解决了大规模多类型区块链应用数据的高效且准确的检测问题。
57、本发明不仅满足了不同类型的区块链数据的协同接入,保证数据格式的一致性。还对接入的区块链数据进行针对性适配的风险识别与发现,以便及时提升链上数据风险检测效率。