基于自然语义理解的模型训练方法及系统与流程

文档序号：35871010发布日期：2023-10-28 04:41阅读：75来源：国知局

本发明涉及ai，具体而言，涉及一种基于自然语义理解的模型训练方法及系统。

背景技术：

1、自然语言理解(natural language understanding,简称nlu)是所有支持机器理解文本内容的方法模型或任务的总称，它主要用于计算机系统能够理解自然语言并从文本中提取出实体和关系，构建出文本的概念模型，从而实现人机对话的自然交互，此外，自然语言理解还可以用于创建机器翻译，这是一种将文本从一种语言翻译为另一种语言的自动化技术，机器翻译系统使用语法分析，语义理解，模型识别以及规则库等技术来分析文本的语义特征，并将文本翻译为不同语言，当前使用自然语言理解用于创建机器翻译发展非常迅速，它的应用越来越广范，为了提高用户的体验感，需要对自然语义理解的模型进行训练，加强目标对话文本的准确语义理解，而如何通过自然语义理解的模型训练来加强目标对话文本的准确语义理解是本领域亟待解决的技术问题。

技术实现思路

1、为解决上述问题，本发明提供一种基于自然语义理解的模型训练方法，包括：

2、获取目标对话文本；

3、将所述目标对话文本输入文本语义理解网络，生成所述目标对话文本的文本语义理解信息，其中，所述文本语义理解网络是基于基础训练代价值和扩展训练代价值，对自然语义理解网络进行网络权重参数更新生成的；所述基础训练代价值是基于所述自然语义理解网络输出的每个参考对话文本的文本语义理解信息，和每个参考对话文本的先验文本语义标注数据确定的；所述扩展训练代价值是基于所述自然语义理解网络输出的每个参考对话文本的文本语义理解信息，和每个参考对话文本的模糊文本语义标注数据确定的，一个参考对话文本的模糊文本语义标注数据是基于各参考对话文本被估计为该参考对话文本的先验文本语义标注数据的支持度确定的。

4、一种可替代的实施方式，所述文本语义理解网络通过以下步骤训练：

5、获取多个具有先验文本语义标注数据的参考对话文本，并加载至自然语义理解网络，生成每个参考对话文本的文本语义理解信息；

6、基于每个参考对话文本的文本语义理解信息和该参考对话文本的先验文本语义标注数据之间的特征距离，确定所述基础训练代价值；

7、基于每个参考对话文本的文本语义理解信息和该参考对话文本的模糊文本语义标注数据之间的特征距离，确定所述扩展训练代价值；依据所述基础训练代价值和所述扩展训练代价值，对所述自然语义理解网络进行网络权重参数更新，生成所述文本语义理解网络。

8、一种可替代的实施方式，基于每个参考对话文本的文本语义理解信息和该参考对话文本的模糊文本语义标注数据之间的特征距离，确定所述扩展训练代价值，包括：

9、基于每个参考对话文本的文本语义理解信息和该参考对话文本具有的先验文本语义标注数据，确定特征描述阵列，所述特征描述阵列中的描述对象用于反映：先验文本语义数据为该描述对象所在行的文本语义数据的多个参考文本数据，被估计为该描述对象所在列的文本语义数据的平均支持度；

10、取所述特征描述阵列中每个参考对话文本对应的列向量作为该参考对话文本的模糊文本语义标注数据，一个参考对话文本对应的列向量用于反映各参考文本数据被估计为该参考文本数据的先验文本语义标注数据的支持度；基于每个参考对话文本的文本语义理解信息和该参考对话文本对应的列向量之间的特征距离，确定所述扩展训练代价值。

11、一种可替代的实施方式，基于每个参考对话文本的文本语义理解信息和该参考对话文本具有的先验文本语义标注数据，确定特征描述阵列，包括：

12、获取每个参考对话文本被估计为除语气文本语义数据之外的各文本语义标注数据的支持度；

13、对所述每个参考对话文本被估计为除语气文本语义数据之外的各文本语义标注数据的支持度进行规则化转换，生成每个参考对话文本的规则化转换估计结果；

14、基于所述每个参考对话文本的规则化转换估计结果和具有的先验文本语义标注数据，确定特征描述阵列。

15、一种可替代的实施方式，生成每个参考对话文本的文本语义理解信息，包括：

16、得到在不同网络学习轮数每个参考对话文本的文本语义理解信息；基于每个参考对话文本的文本语义理解信息和该参考对话文本具有的先验文本语义标注数据，确定特征描述阵列，包括：

17、基于每个参考对话文本的先验文本语义标注数据和在每个网络学习轮数该参考对话文本的文本语义理解信息，确定不同网络学习轮数的特征描述阵列；

18、对所述不同网络学习轮数的特征描述阵列中对应阵列节点的描述对象进行平均化处理，生成特征描述阵列的描述对象，进而构建特征描述阵列。

19、一种可替代的实施方式，所述自然语义理解网络为初始化的文本语义分句单元的语义理解子网络，所述初始化的文本语义分句单元还包括分句定位子网络；所述文本语义分句单元中的语义理解子网络通过以下步骤训练获得：

20、获取包含参考文本段数据的文本分句数据的文本分句向量，所述各参考文本段数据具有自身的先验文本语义标注数据；

21、将所述文本分句数据的文本分句向量加载至初始化的文本语义分句单元，生成所述分句定位子网络生产的所述文本分句数据中各参考文本段数据的第一估计分句节点，以及所述语义理解子网络输出的所述文本分句数据中各参考文本段数据的第一估计文本语义数据；

22、依据所述各参考文本段数据的第一估计分句节点以及第一估计文本语义数据，对所述文本分句数据的文本分句向量进行优化；

23、依据所述文本分句数据优化后的文本分句向量，生成所述语义理解子网络生成的所述文本分句数据中各参考文本段数据的第二估计文本语义数据；

24、基于每个参考文本数据中各参考文本段数据的第二估计文本语义数据，以及各参考文本段数据的先验文本语义标注数据之间的特征距离，确定所述语义理解子网络的基础训练代价值；

25、基于每个参考文本数据中各参考文本段数据的第二估计文本语义数据，以及各参考文本段数据被估计为该参考文本段数据的先验文本语义标注数据的支持度之间的特征距离，确定所述语义理解子网络的扩展训练代价值；

26、依据所述语义理解子网络的基础训练代价值和扩展训练代价值，对所述语义理解子网络进行网络权重参数优化。

27、一种可替代的实施方式，还包括：获取所述分句定位子网络依据所述文本分句数据优化后的文本分句向量输出的所述文本分句数据中各参考文本段数据的第二估计分句节点；依据所述语义理解子网络的基础训练代价值和扩展训练代价值，对所述语义理解子网络进行网络权重参数优化，包括：

28、依据所述语义理解子网络的基础训练代价值以及对应的网络参数信息和所述语义理解子网络的扩展训练代价值以及对应的网络参数信息，对所述语义理解子网络进行网络权重参数优化，生成候选子网络；

29、以所述候选子网络为所述语义理解子网络、以所述第二估计分句节点为所述第一估计分句节点、以所述第二估计文本语义数据为所述第一估计文本语义数据，循环对语义理解子网络进行网络权重参数优化得到候选子网络的步骤；

30、以最终一轮生成的候选子网络，作为所述文本语义分句单元的语义理解子网络。

31、本发明还提供一种基于自然语义理解的模型训练系统，包括处理器以及可读存储介质，所述可读存储介质中存储有计算机程序，当所述计算机程序被所述处理器执行时实现以上任意一个方法所述的基于自然语义理解的模型训练方法。

32、综上所述，本发明提供的基于自然语义理解的模型训练方法及系统，基于基础训练代价值对自然语义理解网络进行网络权重参数更新，可以引导自然语义理解网络在对参考对话文本进行语义理解时，尽可能将该参考对话文本分为该参考对话文本所属的先验文本语义数据，基于扩展训练代价值对自然语义理解网络进行网络权重参数更新，结合基础训练代价值和扩展训练代价值对自然语义理解网络进行网络权重参数更新，可以获得更强文本语义理解性能的文本语义理解网络，从而依据文本语义理解网络实现对目标对话文本的准确语义理解。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张军
技术所有人：上海京知信息科技有限公司
我是此专利的发明人

上一篇：音频信号的生成方法、装置、可读存储介质和电子设备与流程
上一篇：大直径滚筒洗衣机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。