一种信息提取的方法、装置及电子设备与流程

文档序号:34136904发布日期:2023-05-12 18:26阅读:51来源:国知局
一种信息提取的方法、装置及电子设备与流程

本技术实施例涉及信息提取领域,具体涉及一种信息提取的方法、装置及电子设备。


背景技术:

1、记录对目标事件相关人员的询问过程的记录文件是如实记录事件事实的重要文件,正确提取其中的有效信息对于目标事件的串联和合并都有非常重要的意义。为了获取准确的有效信息现在一般是靠人工去分析记录文件中的数据,并提取记录文件中的重要信息,比如目标时间信息等,但是当面对大量记录文件时,目前的现有技术方案的信息提取效率低,无法快速且准确地提取案发信息。

2、因此,如何高效且准确提取记录文件中的信息成为亟待解决的问题。


技术实现思路

1、本技术实施例提供一种信息提取的方法、装置及电子设备,通过本技术的一些实施例至少能够在文字较多且时间信息出现次数较多的记录文件中,提取获得目标时段,从而依据目标时段等有效信息,对事件进行串联和合并。

2、第一方面,本技术实施例中提供一种信息提取的方法,所述方法包括:获取待提取文件,从所述待提取文件中提取时间信息,其中,所述时间信息包括目标事件的发生时间、为所述目标事件发生提供准备工作的准备时间,发现所述目标事件发生的发现时间和记录与所述目标事件相关人员的询问过程的记录时间中的至少一个时间;当所述时间信息包含所述发生时间时,将所述发生时间作为目标时间信息;当所述时间信息包含所述准备时间、发现时间和记录时间中的一个时间时,将所述准备时间、发现时间或记录时间作为目标时间信息;当所述时间信息包括所述准备时间、发现时间和记录时间中的至少两个时间,且所述至少两个时间中包括所述准备时间时,将所述准备时间作为开始时间,将所述发现时间或所述记录时间作为结束时间,根据所述开始时间和所述结束时间获取目标时间段。

3、因此,本技术实施例通过在待提取文件中提取目标时段,能够在文字较多且时间信息出现次数较多的文件中,提取获得目标时段,从而依据目标时段等有效信息,对事件进行串联和合并。

4、结合第一方面,在一种实施方式中,当所述时间信息为发现时间和记录时间时,将所述开始时间设为空,将所述发现时间或所述记录时间作为结束时间,根据所述开始时间和所述结束时间获取目标时间段;或者,将所述发现时间或所述记录时间作为目标时间信息。

5、因此,本技术实施例通过将准备时间和发现时间组合成为目标时段,能够在发生时间缺失的情况下,使得目标时段最大程度的贴近真实的目标时间信息。

6、结合第一方面,在一种实施方式中,根据目标时段与时间的映射关系,获取所述目标时间信息对应的目标时段,其中,所述目标时段为一天之内的时间分布。

7、因此,本技术实施例通过将具体的发生时间对应到预设时段中,能够快速的分析得到具体的目标时段。

8、结合第一方面,在一种实施方式中,所述将所述发现时间或所述记录时间作为结束时间,包括:若所述时间信息同时包含发现时间和记录时间时,将所述发现时间作为结束时间。

9、结合第一方面,在一种实施方式中,将目标时间信息进行归一化处理,获得所述处理后的目标时间信息;或者,将所述目标时间段的开始时间和结束时间进行归一化处理,获得所述处理后的目标时间段。

10、结合第一方面,在一种实施方式中,所述从所述待提取文件中提取时间信息,包括:根据构造的本体表达式从所述待提取文件中提取时间信息,其中,所述本体表达式采用关键词和时间正则表达式进行表征。

11、因此,本技术实施例通过构造的本体表达式对目标时段进行提取,能够在使用表达式进行提取的过程中直接调用时间正则表达式,将提取的关键词与时间正则表达式进行组合,从而提高提取的效率。

12、结合第一方面,在一种实施方式中,所述待提取文件中还包括物品属性信息和金额信息,在所述获取待提取文件之后,所述方法还包括:根据所述物品属性信息,获取目标物品数量;在确定所述目标物品数量为一的情况下,根据物品金额提取规则从所述金额信息中获取目标金额。

13、因此,本技术实施例通过确认物品数目以及金额数量,能够明确事件中的关注信息,以使操作人员能够根据获得的关注信息进行后续的事件处理,提高事件处理的效率。

14、结合第一方面,在一种实施方式中,所述根据所述物品属性信息,获取目标物品数量,包括:从所述待提取文件中提取物品属性信息;从所述物品属性信息中直接获取物品数量,将物品数量去重,如果去重后的物品数量唯一,将所述物品数量作为所述目标物品数量;或者,当不能直接提取所述物品数量的情况下,从所述待提取文件中提取目标物品描述字符串;从所述目标物品描述字符串中提取所述物品属性信息;根据所述物品属性信息获取物品颜色、物品品牌和/或物品类型,将所述物品颜色、物品品牌和/或物品类型去重;当不满足去重后的物品颜色、物品品牌和物品类型为多个的情况下,则目标物品数量确定为一个。

15、因此,本技术实施例能够在复杂的文件中确认物品是一个还是多个,从而能够明确目标物品的金额数量,以使操作人员能够明确事件的细节,提高事件处理的效率。

16、第二方面,本技术实施例中提供一种信息提取的装置,所述装置包括:文件获取模块,被配置为获取待提取文件,从所述待提取文件中提取时间信息,其中,所述时间信息包括目标事件的发生时间、为所述目标事件发生提供准备工作的准备时间,发现所述目标事件发生的发现时间和记录与所述目标事件相关人员的询问过程的记录时间中的至少一个时间中的至少一个时间;时间输出模块,被配置为:当所述时间信息包含所述发生时间时,将所述发生时间作为目标时间信息;当所述时间信息包含所述准备时间、发现时间和记录时间中的一个时间时,将所述准备时间、发现时间或记录时间作为目标时间信息;当所述时间信息包括所述准备时间、发现时间和记录时间中的至少两个时间,且所述至少两个时间中包括所述准备时间时,将所述准备时间作为开始时间,将所述发现时间或所述记录时间作为结束时间,根据所述开始时间和所述结束时间获取目标时间段。

17、结合第二方面,在一种实施方式中,一种信息提取的装置,还被配置为当所述时间信息为发现时间和记录时间时,将所述开始时间设为空,将所述发现时间或所述记录时间作为结束时间,根据所述开始时间和所述结束时间获取目标时间段;或者,将所述发现时间或所述记录时间作为目标时间信息。

18、结合第二方面,在一种实施方式中,一种信息提取的装置,还被配置为:根据目标时段与时间的映射关系,获取所述目标时间信息对应的目标时段,其中,所述目标时段为一天之内的时间分布。

19、结合第二方面,在一种实施方式中,时间处理模块还被配置为:若所述时间信息同时包含发现时间和记录时间时,将所述发现时间作为结束时间。

20、结合第二方面,在一种实施方式中,一种信息提取的装置,还被配置为:将目标时间信息进行归一化处理,获得所述处理后的目标时间信息;或者,将所述目标时间段的开始时间和结束时间进行归一化处理,获得所述处理后的目标时间段。

21、结合第二方面,在一种实施方式中,时间提取模块还被配置为:根据构造的本体表达式从所述待提取文件中提取时间信息,其中,所述本体表达式采用关键词和时间正则表达式进行表征。

22、结合第二方面,在一种实施方式中,当所述待提取文件中还包括物品属性信息和金额信息时,所述信息提取装置还包括物品提取模块,所述物品提取模块被配置为:在所述获取待提取文件之后,根据所述物品属性信息,获取目标物品数量;在确定所述目标物品数量为一的情况下,根据物品金额提取规则从所述金额信息中获取目标金额。

23、结合第二方面,在一种实施方式中,所述物品提取模块还被配置为:从所述待提取文件中提取物品属性信息;从所述物品属性信息中直接获取物品数量,将物品数量去重,如果去重后的物品数量唯一,将所述物品数量作为所述目标物品数量;或者,当不能直接提取所述物品数量的情况下,从所述待提取文件中提取目标物品描述字符串;从所述目标物品描述字符串中提取所述物品属性信息;根据所述物品属性信息获取物品颜色、物品品牌和/或物品类型,将所述物品颜色、物品品牌和/或物品类型去重;当不满足去重后的物品颜色、物品品牌和物品类型为多个的情况下,则目标物品数量确定为一个。

24、第三方面,本技术实施例提供一种电子设备,包括:处理器、存储器和总线;所述处理器通过所述总线与所述存储器相连,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,用于实现如第一方面任一实施例所述方法。

25、第四方面,本技术实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被执行时实现如第一方面任一实施例所述方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1