文本内容理解方法、装置及服务器

文档序号:30967443发布日期:2022-07-30 18:55阅读:67来源:国知局
文本内容理解方法、装置及服务器

1.本发明涉及计算机人工智能技术领域,尤其涉及一种文本内容理解方法、装置及服务器。


背景技术:

2.文本内容理解装置用于对存在漏词或语病的语句进行理解。
3.目前,现有技术公开了一种文本内容理解方法通过构建网络训练模型的对文本内容进行训练可得到语义纠正后的纠正内容。
4.采用上述方式,仅能对文本内容中的语义问题进行纠正,但文本内容中存在的自然词,例如后天、昨天等,没有得到纠正,如果次日及之后,人员才看到纠正内容,会影响人员对纠正内容理解的准确性。


技术实现要素:

5.本发明的目的在于提供一种文本内容理解方法、装置及服务器,旨在解决现有的文本内容理解方法得到的纠正内容会对人员的理解精确度造成影响造成影响的问题。
6.为实现上述目的,本发明提供了一种文本内容理解装置,包括实体识别模块、语义理解模块、处理模块、储存模块和显示模块,所述实体识别模块、所述语义理解模块、所述处理模块和所述储存模块依次连接,所述显示模块于所述处理模块连接;
7.所述实体识别模块,用于识别文本内容中的实体类型,得到关键词组;
8.所述语义理解模块,用于对所述关键词组进行表达,得到表达内容;
9.所述处理模块,用于将当前时间与所述表达内容整理,得到纠正内容;
10.所述储存模块,用于储存所述纠正内容;
11.所述显示模块,用于显示所述纠正内容。
12.其中,所述语义理解模块包括语义联想单元和语义表达单元,所述语义联想单元和所述语义表达单元分别与所述实体识别模块连接;
13.所述语义联想单元,用于根据所述关键词组进行相关搜索,得到联想内容;
14.所述语义表达单元,用于对所述关键词组进行表达转换,得到表达内容。
15.其中,所述处理模块包括输入框构建单元和内容对应单元,所述输入框构建单元和所述内容对应单元连接;
16.所述输入框构建单元,用于构建时间输入框和内容输入框;
17.所述内容对应单元,用于将所述关键词组、每一所述关键词对应的所述联想内容和每一所述关键词对应的所述表达内容对应到所述内容输入框,并将当前时间对应到所述时间输入框,得到纠正内容。
18.其中,所述处理模块还包括标注单元,所述标注单元与所述内容对应单元连接;
19.所述标注单元,用于将所述内容输入框中的所述联想内容和所述表达内容标注。
20.第二方面,本发明提供了一种文本内容理解方法,应用于第一方面的文本内容理
解装置,包括以下步骤:
21.通过实体识别模块识别文本内容中的实体类型,得到关键词组;
22.通过语义理解模块对关键词组进行表达,得到表达内容;
23.通过处理模块将当前时间与表达内容整理,得到纠正内容;
24.通过储存模块储存纠正内容。
25.第三方面,本发明提供了一种文本内容理解服务器,所述文本内容理解服务器用于运行程序,所述运行程序运行时执行第二方面的文本内容理解方法。
26.本发明的一种文本内容理解装置,通过所述实体识别模块识别文本内容中的实体类型,得到关键词组;所述语义理解模块对所述关键词组进行表达,得到表达内容;所述处理模块将当前时间与所述表达内容整理,得到纠正内容;所述储存模块储存所述纠正内容;所述显示模块显示所述纠正内容,通过所述语义理解模块将为自然词的关键词表达为具体词,解决了现有的文本内容理解方法得到的纠正内容会对人员的理解精确度造成影响造成影响的问题。
附图说明
27.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
28.图1是本发明提供的一种文本内容理解装置的结构示意图。
29.图2是处理模块的结构示意图。
30.图3是语义表达单元的结构示意图。
31.图4是内容对应单元的结构示意图。
32.图5是本发明提供的一种文本内容理解方法的流程图。
33.1-实体识别模块、2-语义理解模块、3-处理模块、4-储存模块、5-显示模块、6-定时提醒模块、7-语义联想单元、8-语义表达单元、9-输入框构建单元、10-内容对应单元、11-标注单元、12-内容对应子单元、13-模型构建子单元、14-训练子单元、15-整理子单元、16-自然语言识别子单元、17-语言表达子单元、18-关键词保留子单元。
具体实施方式
34.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
35.请参阅图1至图4,第一方面,本发明提供一种文本内容理解装置,包括实体识别模块1、语义理解模块2、处理模块3、储存模块4和显示模块5,所述实体识别模块1、所述语义理解模块2、所述处理模块3和所述储存模块4依次连接,所述显示模块5于所述处理模块3连接;
36.所述实体识别模块1,用于识别文本内容中的实体类型,得到关键词组;
37.所述语义理解模块2,用于对所述关键词组进行表达,得到表达内容;
38.所述处理模块3,用于将当前时间与所述表达内容整理,得到纠正内容;
39.所述储存模块4,用于储存所述纠正内容;
40.所述显示模块5,用于显示所述纠正内容。
41.具体的,首先通过所述实体识别模块1识别文本内容中的实体类型,得到关键词组,所述实体类型包括人、地点、机构等几种或者十几种的实体类型,其次通过所述语义理解模块2对所述关键词组的自然词进行表达,得到表达内容,将所述自然词(后天)表达为具体词(具体的日期),接着通过所述处理模块3将当前时间与所述表达内容整理,得到纠正内容,所述当前时间为xxx年xx月xx日xx时xx分xx秒,便于人员在阅读时可以当前时间作为对所述具体的日期的推断依据,然后通过所述显示模块5对所述纠正内容进行显示,便于人员阅读,同时通过所述储存模块4对所述纠正内容进行储存,便于后续调阅,解决了现有的文本内容理解方法得到的纠正内容会对人员的理解精确度造成影响造成影响的问题。
42.进一步的,所述语义理解模块2包括语义联想单元7和语义表达单元8,所述语义联想单元7和所述语义表达单元8分别与所述实体识别模块1连接;
43.所述语义联想单元7,用于根据所述关键词组进行相关搜索,得到联想内容;
44.所述语义表达单元8,用于对所述关键词组进行表达转换,得到表达内容。
45.所述处理模块3包括输入框构建单元9和内容对应单元10,所述输入框构建单元9和所述内容对应单元10连接;
46.所述输入框构建单元9,用于构建时间输入框和内容输入框;
47.所述内容对应单元10,用于将所述关键词组、每一所述关键词对应的所述联想内容和每一所述关键词对应的所述表达内容对应到所述内容输入框,并将当前时间对应到所述时间输入框,得到纠正内容。
48.所述处理模块3还包括标注单元11,所述标注单元11与所述内容对应单元10连接;
49.所述标注单元11,用于将所述内容输入框中的所述联想内容和所述表达内容标注。
50.具体的,通过所述语义联想单元7根据所述关键词组进行相关搜索,例如所述关键词组中存在“热门电影”,则对当下影院上映的电源进行搜索,获取每一上映电源的名字,得到联想内容“电影a、电影b、电影c”;所述语义表达单元8,用于对所述关键词组进行表达转换,将所述自然词(后天)表达为具体词(具体的日期),得到表达内容“xxx年xx月xx日”;所述输入框构建单元9构建时间输入框和内容输入框;所述内容对应单元10将所述关键词组、每一所述关键词对应的所述联想内容和每一所述关键词对应的所述表达内容对应到所述内容输入框,并将当前时间对应到所述时间输入框,得到纠正内容;所述标注单元11将所述内容输入框中的所述联想内容和所述表达内容标注,标注通过为所述联想内容和所述表达内容两侧添加“()”、“{}”、“【】”等等,例如热门电影(电影a、电影b、电影c)、后天(xxx年xx月xx日),增加阅读的流畅度。
51.进一步的,所述内容对应单元10包括内容对应子单元12、模型构建子单元13、训练子单元14和整理子单元15,所述内容对应子单元12、所述模型构建子单元13、所述训练子单元14和所述整理子单元15依次连接;
52.所述内容对应子单元12,用于将所述关键词组、每一所述关键词对应的所述联想内容和每一所述关键词对应的所述表达内容对应到所述内容输入框,并将当前时间对应到
所述时间输入框,分别得到语言内容和时间内容;
53.所述模型构建子单元13,用于构建网络模型;
54.所述训练子单元14,用于将所述语言内容输入到所述网络模型中进行训练,得到训练内容;
55.所述整理子单元15,用于将所述训练内容和所述时间内容整理,得到纠正内容。
56.具体的,所述内容对应子单元12,用于将所述关键词组、每一所述关键词对应的所述联想内容和每一所述关键词对应的所述表达内容对应到所述内容输入框,并将当前时间对应到所述时间输入框,分别得到语言内容和时间内容;所述模型构建子单元13,用于构建网络模型,所述网络模型为bert网络模型,;所述训练子单元14,用于将所述语言内容输入到所述网络模型中进行训练,所述bert网络模型包括self-attention机制层及memoryattention机制层,在对输入的所述语言内容进行语义理解时,进行两层的注意力机制处理后得到训练内容;所述整理子单元15,用于将所述训练内容和所述时间内容整理,得到纠正内容。
57.进一步的,所述语义表达单元8包括自然语言识别子单元16、语言表达子单元17和关键词保留子单元18,所述自然语言识别子单元16、所述语言表达子单元17和所述关键词保留子单元18依次连接;
58.所述自然语言识别子单元16,用于对所述关键词组进行识别,得到自然词和类型词;
59.所述语言表达子单元17,用于将所述自然词表达转换为具体词;
60.所述关键词保留子单元18,用于将所述类型词和所述具体词整理,得到表达内容。
61.具体的,所述自然语言识别子单元16,用于对所述关键词组进行识别,得到自然词和类型词,所述类型词包括人、地点、机构等;所述语言表达子单元17,用于将所述自然词(天气)表达转换为具体词“xxx年xx月xx日”;所述关键词保留子单元18,用于将所述类型词和所述具体词整理,得到表达内容。
62.进一步的,所述文本内容理解装置还包括定时提醒模块6,所述定时提醒模块6与所述显示模块5连接;
63.所述定时提醒模块6,基于所述纠正内容通过所述显示模块5向用户发出执行提醒。
64.具体的,例如所述纠正内容为“后天(xxx年xx月xx日)提醒我买热门电影(电影a、电影b、电影c)的电影票,xxx年xx月xx日xx时xx分xx秒”,所述定时提醒模块6则会在次日的工作时间内进行提醒,例如工作时间为9:00-17:30,则所述定时提醒模块6通过所述显示模块5在9:00-17:30中的任意时间发出执行提醒。
65.请参阅图5,第二方面,本发明提供了一种文本内容理解方法,应用于第一方面的文本内容理解装置,包括以下步骤:
66.s1通过实体识别模块1识别文本内容中的实体类型,得到关键词组;
67.具体的,通过所述实体识别模块1识别文本内容中的实体类型,得到关键词组,所述实体类型包括人、地点、机构等几种或者十几种的实体类型。
68.s2通过语义理解模块2对关键词组进行表达,得到表达内容;
69.具体的,通过所述语义理解模块2对所述关键词组的自然词进行表达,得到表达内
容,将所述自然词(后天)表达为具体词(具体的日期)。
70.s3通过处理模块3将当前时间与表达内容整理,得到纠正内容;
71.具体的,通过所述处理模块3将当前时间与所述表达内容整理,得到纠正内容,所述当前时间为xxx年xx月xx日xx时xx分xx秒,便于人员在阅读时可以当前时间作为对所述具体的日期的推断依据。
72.s4通过储存模块4储存纠正内容。
73.具体的,通过所述储存模块4对所述纠正内容进行储存,便于后续调阅。
74.第三方面,本发明提供了一种文本内容理解服务器,所述文本内容理解服务器用于运行程序,所述运行程序运行时执行第二方面的文本内容理解方法。
75.具体的,所述文本内容理解服务器包括处理器的存储器,所述处理器用于运行程序,所述存储器用于记录所述运行程序运行时的全过程。
76.以上所揭露的仅为本发明一种文本内容理解方法、装置及服务器较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1