一种面向隐患的法规标准条文自动匹配方法及装置与流程

文档序号:22314708发布日期:2020-09-23 01:38阅读:72来源:国知局
一种面向隐患的法规标准条文自动匹配方法及装置与流程

本发明属于消防隐患法规技术领域,特别的涉及一种面向隐患的法规标准条文自动匹配方法及装置。



背景技术:

隐患排查是指根据国家安全生产法律、法规,利用安全生产管理相关方法,对生产经营单位的人、机械设备、工作环境和生产管理进行逐项排查,目的是发现安全生产事故隐患;在发现隐患后,根据各种治理手段,将其消除,从而把生产安全事故消灭在萌芽状态,达到安全生产的目标。

参照中国专利号为cn110808957a的一种漏洞信息的匹配处理方法及装置,方法包括:获取网络中的漏洞相关信息,对漏洞相关相信进行词性标注和区块提取,得到预处理漏洞信息;将预处理漏洞信息中符合预设语法结构的若干个区块组合为新的名词区块,得到区块漏洞信息;根据预设敏感动词对区块漏洞信息中的动词进行匹配,将匹配到的目标动词所连接的目标名词确定为漏洞信息。

结合上述提到的漏洞信息处理方式,会发现安全人员在进行隐患排查时无法精确判断是否存在隐患,且当判断出存在隐患时,无法提供准确、让人信服的法规依据;同时在采用处理方式时不能结合收集的反馈信息进行优化,使结果缺少合理性。



技术实现要素:

本发明目的是提供一种面向隐患的法规标准条文自动匹配方法及装置,用以解决上述提到的安全人员在进行隐患排查时无法精确判断是否存在隐患,且当判断出存在隐患时,无法提供准确、让人信服的法规依据;同时在采用处理方式时不能结合收集的反馈信息进行优化,使结果缺少合理性。

本发明解决其技术问题采用的技术方案是,提出一种面向隐患的法规标准条文自动匹配方法,其包括以下步骤:

从法规库中提取关键词信息;

获取被检测的隐患信息及其关键词,按照预设匹配规则将关键词与法规库关键词信息匹配,并输出匹配后的法规及法规条文;

获取所述匹配后的法规及法规条文的反馈信息,并结合反馈信息对匹配规则调整优化。

进一步优选地,所述“从法规库中提取关键词信息”具体包括:调取法规库文本,对法规库文本全文过滤,按照预设词频筛选出候选词库;计算所述候选词库中候选词的候选词词频和候选词逆向频率;结合所述候选词词频和候选词逆向频率计算候选词统计特征权重,并根据预设关键词阈值把前topk词语列为关键词信息。

进一步优选地,所述“按照预设匹配规则将关键词与法规库关键词信息匹配,并输出匹配后的法规及法规条文”具体包括:对关键词信息按照隐患信息关键词进行全文的精确匹配;对未精确匹配的隐患信息关键词进行预设同义词库匹配,并得出相应关键词信息;将匹配的关键词信息对应于法规库,得出含有关键词信息的法规及法规条文。

进一步优选地,所述“反馈信息”包括匹配精度差、匹配精度好、匹配效率低、匹配效率高的一种。

进一步优选地,所述“结合反馈信息对匹配规则调整优化”具体包括:当检测到反馈信息为“匹配精度差”时,增大法规库关键词阈值的选取范围;当检测到反馈信息为“匹配效率低”时,减少法规库关键词阈值的选取范围。

本发明解决其技术问题采用的另一技术方案是,提出一种面向隐患的法规标准条文自动匹配装置,包括以下:

调取模块,用于从法规库中提取关键词信息;

匹配输出模块,用于获取被检测的隐患信息及其关键词,按照预设匹配规则将关键词与法规库关键词信息匹配,并输出匹配后的法规及法规条文;

反馈处理模块,用于获取所述匹配后的法规及法规条文的反馈信息,并结合反馈信息对匹配规则调整优化。

进一步优选地,所述“从法规库中提取关键词信息”具体包括:调取法规库文本,对法规库文本全文过滤,按照预设词频筛选出候选词库;计算所述候选词库中候选词的候选词词频和候选词逆向频率;结合所述候选词词频和候选词逆向频率计算候选词统计特征权重,并根据预设关键词阈值把前topk词语列为关键词信息。

进一步优选地,所述“按照预设匹配规则将关键词与法规库关键词信息匹配,并输出匹配后的法规及法规条文”具体包括:对关键词信息按照隐患信息关键词进行全文的精确匹配;对未精确匹配的隐患信息关键词进行预设同义词库匹配,并得出相应关键词信息;将匹配的关键词信息对应于法规库,得出含有关键词信息的法规及法规条文。

进一步优选地,所述“反馈信息”包括匹配精度差、匹配精度好、匹配效率低、匹配效率高的一种。

进一步优选地,所述“结合反馈信息对匹配规则调整优化”具体包括:当检测到反馈信息为“匹配精度差”时,增大法规库关键词阈值的选取范围;当检测到反馈信息为“匹配效率低”时,减少法规库关键词阈值的选取范围。

本发明的有益效果:

通过提取法规库的关键词信息与被检测的隐患信息及其关键词进行精确匹配和同义词匹配,确保结果的精确性,同时通过用户反馈的匹配结果,不断优化匹配规则,从而提高隐患排查的准确性,减少人工查询法规条文的时间,提高隐患排查的工作效率。

附图说明

图1为本发明实施例的一种面向隐患的法规标准条文自动匹配方法的流程示意图;

图2为本发明实施例的一种面向隐患的法规标准条文自动匹配方法的又一流程示意图;

图3为本发明实施例的一种面向隐患的法规标准条文自动匹配方法的再一流程示意图;

图4为本发明实施例的一种面向隐患的法规标准条文自动匹配装置的结构示意图。

具体实施方式

为了更清楚地说明本发明实施例和/或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。另,涉及方位的属于仅表示各部件间的相对位置关系,而不是绝对位置关系。

请参阅图1,示出本实施例的一种面向隐患的法规标准条文自动匹配方法,其包括以下步骤:

s1从法规库中提取关键词信息;

s2获取被检测的隐患信息及其关键词,按照预设匹配规则将关键词与法规库关键词信息匹配,并输出匹配后的法规及法规条文;

s3获取所述匹配后的法规及法规条文的反馈信息,并结合反馈信息对匹配规则调整优化。

其中,如图2所示,步骤s1从法规库中提取关键词信息具体包括:

s101调取法规库文本,对法规库文本全文过滤,按照预设词频筛选出候选词库;

s102计算所述候选词库中候选词的候选词词频和候选词逆向频率;

s103结合所述候选词词频和候选词逆向频率计算候选词统计特征权重,并根据预设关键词阈值把前topk词语列为关键词信息。

可通过互联网调取所需的消防领域法规库,将预设的关键词词频代入法规库中查找筛选出候选词库(此处预设的词频可通过查找关键词历史记录或是网络查找得出),得到候选词库,对于在某任一法规来说,的词频可表示为:

其中是词语在法规中的出现次数,分母则是在法规中所有候选词出现次数之和;越高,则候选词对法规越重要,越低,则候选词对法规越不重要。

同时需要注意的是,对于法规中无意义的词语中如“的”、“了”、“呢”等字或词,在法规中的出现频率较高,却并不属于关键词范畴,所以对于某一特定的词语可以由总法规数除以包含该词语的法规数,再将得到的商取对数得到候选词逆向频率,如下所示:

其中,是法规库中所有法规的总数,分母是包含词语的所有法规数。

综合以上,对于某一特定法规内的高候选词频率,以及该候选词在整个法规库中的低文件频率,可以产生出这个候选词统计特征权重,如下式所示:

法规库的关键词提取算法经过计算后会得到一系列候选词的统计特征权重,由于得到的词比较多,会依照实际情况把前topk词语列为关键词(此处关键词阈值可选取前10)。

其中,如图3所示,步骤s2中“按照预设匹配规则将关键词与法规库关键词信息匹配,并输出匹配后的法规及法规条文”具体包括:

s201对关键词信息按照隐患信息关键词进行全文的精确匹配;

s202对未精确匹配的隐患信息关键词进行预设同义词库匹配,并得出相应关键词信息;

s203将匹配的关键词信息对应于法规库,得出含有关键词信息的法规及法规条文。

针对被检测的隐患信息,一方面可人工调取隐患信息中的关键词,在选取关键词时一定要对所选的词或词组进行界定;另一方面也可通过上述步骤s1的方式来提取关键词信息,本实施例采用上述步骤s1的方式来调取关键词;调取出的关键词一一与上述法规库中提取的关键词信息配对,其中包括与法规库中关键词信息完全一致的关键词和与法规库中关键词信息意思相近的关键词,此方式杜绝查漏消息的现象,还进一步提高准确性;需要说明的是,步骤s202中提到的预设同义词库可基于步骤s1从法规库中提取关键词信息的方式,其中关键词阈值可设定为20-30,扩大关键词范围及其同义词范围,保证数据的真实性和可靠性;将匹配出的关键词信息对应相关法规及法规条文调取,并发送给操作人员或终端。

其中,步骤s3的“反馈信息”可包括匹配精度差、匹配精度好、匹配效率低、匹配效率高的一种;“结合反馈信息对匹配规则调整优化”具体包括有当检测到反馈信息为“匹配精度差”时,增大法规库关键词阈值的选取范围;当检测到反馈信息为“匹配效率低”时,减少法规库关键词阈值的选取范围。

操作人员在接受到对应的法规及法规条文后,可根据实际情况进行反馈;若操作人员在界面或终端选择“匹配精度好”或“匹配效率高”的一种,表明该匹配方法结果准确;若操作人员在界面或终端选择“匹配精度差”,则可增大topk取值,扩大法规库关键词的选取范围(每篇由10改为选取15-20),使法规库的关键词描述更精确,与隐患信息匹配更准确;若操作人员在界面或终端选择“匹配效率低”,说明用时较长,可适当缩小topk取值,减少运算量,加快匹配速度。

如图4所示,本实施例还可公开一种面向隐患的法规标准条文自动匹配装置,包括:

调取模块,用于从法规库中提取关键词信息;

匹配输出模块,用于获取被检测的隐患信息及其关键词,按照预设匹配规则将关键词与法规库关键词信息匹配,并输出匹配后的法规及法规条文;

反馈处理模块,用于获取所述匹配后的法规及法规条文的反馈信息,并结合反馈信息对匹配规则调整优化。

进一步的,“从法规库中提取关键词信息”具体包括:调取法规库文本,对法规库文本全文过滤,按照预设词频筛选出候选词库;计算所述候选词库中候选词的候选词词频和候选词逆向频率;结合所述候选词词频和候选词逆向频率计算候选词统计特征权重,并根据预设关键词阈值把前topk词语列为关键词信息。

进一步的,“按照预设匹配规则将关键词与法规库关键词信息匹配,并输出匹配后的法规及法规条文”具体包括:对关键词信息按照隐患信息关键词进行全文的精确匹配;对未精确匹配的隐患信息关键词进行预设同义词库匹配,并得出相应关键词信息;将匹配的关键词信息对应于法规库,得出含有关键词信息的法规及法规条文。

进一步的,“反馈信息”可包括匹配精度差、匹配精度好、匹配效率低、匹配效率高的一种。

“结合反馈信息对匹配规则调整优化”具体包括:当检测到反馈信息为“匹配精度差”时,增大法规库关键词阈值的选取范围;当检测到反馈信息为“匹配效率低”时,减少法规库关键词阈值的选取范围。

本实施例还可公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法。

本实施例还可一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1