一种基于人工智能的关键数据提取方法、系统及存储器与流程

文档序号：37750525发布日期：2024-04-25 10:37阅读：31来源：国知局

本发明涉及一种基于人工智能的关键数据提取方法、系统及存储器，属于人工智能。

背景技术：

1、随着深度学习、自然语言处理技术的飞速发展，通过大量标注数据训练得到的语言模型，能够快速高效的完成对文本数据的理解分析，具备情感分析、语言翻译、文本分类、信息抽取、文本生成的能力，通过数据驱动模型可完成对文档内容的理解、分析和概括，智能生成关键问题。

2、但目前流行的预训练语言模型与特种领域之间存在领域差异，直接通过现有的语言模型对各专家提出的关键问题汇总，准确性较低。

技术实现思路

1、本发明提供一种基于人工智能的关键数据提取方法、系统及存储器，其将各专家修改的关键问题作为训练语句对初训练模型进行训练，提高了汇总效率和准确性。

2、为实现所述发明目的，本发明一种基于人工智能的关键数据提取方法，其包括如下步骤：

3、s01:建立人工智能语言模型，利用预训练语料对人工智能语言模型进行预训练，当人工智能语言模型对预训练语料的处理达到第一模型精度时得到初训练人工智能语言模型；而后利用微调语料对初训练人工智能语言模型进行训练，当初训练人工智能语言模型对微调语料的处理达到第二模型精度时得到第一已训练人工智能语言模型；

4、s02:将关键文本输入第一已训练人工智能语言模型，从第一已训练人工智能语言模型提取出关键问题；

5、s03:向专家组的每个成员分发由第一已训练人工智能语言模型提取出多个第一关键问题，由专家组的每个成员对多个第一关键问题进行修正得到多个第二关键问题，将多个第二关键问题重新输入到第一已训练人工智能语言模型模型中进行训练，当第一已训练人工智能语言模型对关键文本的处理达到第三模型精度时得到第二已训练人工智能语言模型；

6、s04:将第二已训练人工智能语言模型提取出的多个第三关键问题用向量表示；

7、s05:根据第二已训练人工智能语言模型提取出的第三关键问题向量，获取关键问题的语义信息，对第三关键问题进行聚类；

8、s06:将聚类结果分发至专家组的每个成员，由专家组的每个成员对聚类后的第三关键问题进行修正得到多个第四关键问题，并将多个第四关键问题重新输入到第二已训练人工智能语言模型中；

9、重复上述步骤s04、s05和s06，直至关键问题收敛，所有专家达成一致，输出收敛的关键问题，作为最终生成的关键问题。

10、本发明还提供一种基于人工智能的关键数据提取系统，其包括存储器和一个或者多个处理器，所述存储器用于存储利用计算机语言编成的程序，所述处理器调用程序代码以实施上述的方法。

11、本发明还提供一种存储器，其特征在于，所述存储器用于存储利用计算机语言将本发明第一到第三实施例所述的方法编成的计算机程序。

12、与现有技术相比，本发明具有如下有益效果：

13、本发明提供基于人工智能的关键数据提取方法、系统及存储器通过对建立人工智能语言模型，利用预训练语料对人工智能语言模型进行预训练，当人工智能语言模型对预训练语料的处理达到第一模型精度时得到初训练人工智能语言模型；而后利用微调语料对初训练人工智能语言模型进行训练，当初训练人工智能语言模型对微调语料的处理达到第二模型精度时得到第一已训练人工智能语言模型；将关键文本输入第一已训练人工智能语言模型，从第一已训练人工智能语言模型提取出关键问题；向专家组的每个成员分发由第一已训练人工智能语言模型提取出多个第一关键问题，由专家组的每个成员对多个第一关键问题进行修正得到多个第二关键问题，将多个第二关键问题重新输入到第一已训练人工智能语言模型模型中进行训练，当第一已训练人工智能语言模型对关键文本的处理达到第三模型精度时得到第二已训练人工智能语言模型，从而能够达到提高人工智能语言模型提炼关键问题的准确性的有益效果。

14、通过将第二已训练人工智能语言模型提取出的多个第三关键问题用向量表示；根据第二已训练人工智能语言模型提取出的第三关键问题向量，获取关键问题的语义信息，对第三关键问题进行聚类；将聚类结果分发至专家组的每个成员，由专家组的每个成员对聚类后的第三关键问题进行修正得到多个第四关键问题，并多个第四关键问题重新输入到第二已训练人工智能语言模型中；重复上述步骤，直至关键问题收敛，所有专家达成一致，输出收敛的关键问题，而达到提升关键问题的科学性，提高汇总效率的有益效果。

技术特征：

1.一种基于人工智能的关键数据提取方法，其特征在于，

2.根据权利要求1所述的基于人工智能的关键数据提取方法，其特征在于，预训练语料的构建包括如下步骤：

3.根据权利要求1所述的基于人工智能的关键数据提取方法，其特征在于，第一模型精度通过模糊度flcs进行评估：

4.根据权利要求1所述的基于人工智能的关键数据提取方法，其特征在于，对n个第三关键问题进行聚类具体包括：

5.根据权利要求1所述的基于人工智能的关键数据提取方法，其特征在于，对n个第三关键问题进行聚类具体包括：

6.根据权利要求1所述的基于人工智能的关键数据提取方法，其特征在于，对n个第三关键问题进行聚类具体包括：

7.一种基于人工智能的关键数据提取系统，其特征在于，包括存储器和一个或者多个处理器，所述存储器用于存储利用计算机语言编成的程序，所述处理器调用程序代码以实施权利要求1-6任一所述的方法。

8.一种存储器，其特征在于，所述存储器用于存储利用计算机语言将权利要求1-6任一所述的方法编成的计算机程序。

技术总结
一种基于人工智能的关键数据提取方法、系统及存储器，属于数据处理技术领域。所述方法包括：分别通过预训练语料、关键文本、专家提供的问题对人工智能语言模型进行训练得到已训练人工智能语言模型，将已训练人工智能语言模型提取出的多个关键问题用向量表示，并获取关键问题的语义信息，对多个关键问题进行聚类；将聚类结果分发至专家组的每个成员，由专家组的每个成员对聚类后的关键问题进行修正得到多个修正后的关键问题，并多个修正后的关键问题重新输入到已训练人工智能语言模型中，直至关键问题收敛，所有专家达成一致，输出收敛的关键问题，作为最终生成的关键问题。本发明能够智能生成关键问题，从而提高了专家汇总效率。

技术研发人员：白梅,赵俊严,李世民,贾宇飞,唐晓明,罗朝璋,娄锋,朱锐,张钰,闫旭,薛大兵
受保护的技术使用者：中国人民解放军63963部队
技术研发日：
技术公布日：2024/4/24

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：白梅,赵俊严,李世民,贾宇飞,唐晓明,罗朝璋,娄锋,朱锐,张钰,闫旭,薛大兵
技术所有人：中国人民解放军63963部队
我是此专利的发明人

上一篇：一种烟气急冷装置的制作方法
上一篇：一种用于钢箱梁人孔孔口的临时防护装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。