文本分割方法、训练方法、装置、设备及存储介质与流程

文档序号：39057232发布日期：2024-08-17 22:23阅读：5来源：国知局

本申请涉及文本处理，尤其涉及一种文本分割方法、训练方法、装置、设备及存储介质。

背景技术：

1、目前，文本分割模型常应用于由语音、录音等等音频文件转录的文本之中。举例而言，文本分割模型可以用于金融领域。例如，对于金融领域中的保险回访业务，需要与客户进行电话回访，并获取保险回访业务的保险回访音频。基于此，可以借助文本分割模型对由保险回访音频进行文本分割处理，获取保险回访业务的保险回访文本。然而，现有的文本分割模型仅仅关注文本包括的语句之间、字符之间的语义信息，容易出现无法识别文本中的段落信息的情形，或者容易出现需要依赖下游任务的微调对文本中的段落信息进行识别的情形，则容易导致对文本进行段落分割的准确性不佳，以及对文本进行段落分割的分割效果不佳。举例而言，若对保险回访业务的保险回访文本进行段落分割的准确性不佳，或者对保险回访业务的保险回访文本进行段落分割的分割效果不佳，则需要人为对保险回访文本进行段落分割。在保险回访文本数量较多的情况下，需要耗费大量的人力与时间，容易造成对保险回访业务的运行效率不利影响。

技术实现思路

1、本申请的主要目的在于提供一种文本分割方法、训练方法、装置、设备及存储介质，旨在提高对文本进行段落分割的准确性，提升对文本进行段落分割的分割效果。基于对文本进行段落分割的准确性的提高，以及对文本进行段落分割的分割效果的提升，在金融领域中的保险回访业务，有利于避免出现由于对保险回访业务的保险回访文本进行段落分割的准确性不佳，或者对保险回访业务的保险回访文本进行段落分割的分割效果不佳而导致的需要人为对保险回访文本进行段落分割，耗费大量的人力与时间等情形，有利于提升保险回访业务的运作效率。

2、第一方面，本申请提供一种文本分割方法，所述文本分割方法包括以下步骤：

3、获取目标音频，所述目标音频至少包括语音信息；

4、对所述目标音频进行文本识别，得到目标音频文本，所述目标音频文本包括若干语音文本以及若干语音文本之间的分隔符；

5、基于嵌入模型，对所述分隔符对应的语音文本以及所述分隔符进行嵌入处理，得到所述分隔符对应的分隔符向量，所述分隔符向量携带有所述分隔符对应的语音文本的文本信息；

6、基于文本分割模型，根据所述分隔符向量，识别所述分隔符向量对应的分隔符是否为段落分隔符；

7、根据所述分隔符向量对应的分隔符是否为段落分隔符的第一确定结果，对所述若干语音文本进行分段处理，得到目标文本，所述目标文本包括若干语音文本段落。

8、第二方面，本申请还提供一种文本分割模型的训练方法，所述训练方法包括：

9、获取训练样本集，所述训练样本集包括多个目标音频文本，所述目标音频文本包括若干语音文本以及若干语音文本之间的分隔符，所述训练样本集还包括所述目标音频文本中各所述分隔符是否为段落分隔符的分隔符标签；

10、基于嵌入模型，对所述分隔符对应的语音文本以及所述分隔符进行嵌入处理，得到所述分隔符对应的分隔符向量，所述分隔符向量携带有所述分隔符对应的语音文本的文本信息；

11、基于文本分割模型，根据所述分隔符向量，识别所述分隔符向量对应的分隔符是否为段落分隔符；

12、基于预设的第一损失函数，根据所述分隔符向量对应的分隔符是否为段落分隔符的第一确定结果，以及所述分隔符是否为段落分隔符的分隔符标签确定第一损失值；

13、根据所述第一损失值，调整所述文本分割模型的模型参数。

14、第三方面，本申请还提供一种文本分割装置，所述文本分割装置包括：

15、获取模块，用于获取目标音频，所述目标音频至少包括语音信息；

16、第一识别模块，用于对所述目标音频进行文本识别，得到目标音频文本，所述目标音频文本包括若干语音文本以及若干语音文本之间的分隔符；

17、嵌入处理模块，用于基于嵌入模型，对所述分隔符对应的语音文本以及所述分隔符进行嵌入处理，得到所述分隔符对应的分隔符向量，所述分隔符向量携带有所述分隔符对应的语音文本的文本信息；

18、第二识别模块，用于基于文本分割模型，根据所述分隔符向量，识别所述分隔符向量对应的分隔符是否为段落分隔符；

19、分段处理模块，用于根据所述分隔符向量对应的分隔符是否为段落分隔符的第一确定结果，对所述若干语音文本进行分段处理，得到目标文本，所述目标文本包括若干语音文本段落。

20、第四方面，本申请还提供一种计算机设备，所述计算机设备包括存储器和处理器；

21、所述存储器，用于存储计算机程序；

22、所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如上述的文本分割方法的步骤，或实现如上述的文本分割模型的训练方法的步骤。

23、第五方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现如上述的文本分割方法的步骤，或者实现如上述的文本分割模型的训练方法的步骤。

24、本申请提供一种文本分割方法、训练方法、装置、设备及存储介质，文本分割方法包括：获取目标音频，目标音频至少包括语音信息；对目标音频进行文本识别，得到目标音频文本，目标音频文本包括若干语音文本以及若干语音文本之间的分隔符；基于嵌入模型，对分隔符对应的语音文本以及分隔符进行嵌入处理，得到分隔符对应的分隔符向量，分隔符向量携带有分隔符对应的语音文本的文本信息；基于文本分割模型，根据分隔符向量，识别分隔符向量对应的分隔符是否为段落分隔符；根据分隔符向量对应的分隔符是否为段落分隔符的第一确定结果，对若干语音文本进行分段处理，得到目标文本，目标文本包括若干语音文本段落。通过文本分割模型，依据携带有分隔符对应的语音文本的文本信息的分隔符向量，对目标音频文本中的若干语音文本进行分段处理，以提高对文本进行段落分割的准确性，提升对文本进行段落分割的分割效果。例如，可以用于金融领域的保险回访业务。对于保险回访业务的保险回访音频，可以根据该文本分割方法进行处理，有利于提高对保险回访音频对应的保险回访文本进行段落分割的准确性，以及提高对保险回访音频对应的保险回访文本进行段落分割的分割效果，则无需耗费大量的人力与时间，对保险回访音频对应的保险回访文本进行检查以及人为进行段落分割，有利于维护保险回访业务的运行效率。

技术特征：

1.一种文本分割方法，其特征在于，包括：

2.根据权利要求1所述的文本分割方法，其特征在于，所述基于文本分割模型，根据所述分隔符向量，识别所述分隔符向量对应的分隔符是否为段落分隔符，包括：

3.根据权利要求1所述的文本分割方法，其特征在于，所述根据所述分隔符向量对应的分隔符是否为段落分隔符的第一确定结果，对所述若干语音文本进行分段处理，得到目标文本，包括：

4.根据权利要求1至3中任一项所述的文本分割方法，其特征在于，所述语音文本包括若干语音字词；

5.根据权利要求4所述的文本分割方法，其特征在于，所述基于所述文本分割模型，识别各所述语音字词是否为错别字，包括：

6.一种文本分割模型的训练方法，其特征在于，所述训练方法包括：

7.根据权利要求6所述的训练方法，其特征在于，所述语音文本包括若干语音字词；

8.一种文本分割装置，其特征在于，所述文本分割装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器；

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1至5中任一项所述的文本分割方法的步骤，或者实现如权利要求6至7中任一项所述的文本分割模型的训练方法的步骤。

技术总结
本申请涉及文本处理领域，提供一种文本分割方法、训练方法、装置、设备及存储介质，方法包括：获取目标音频；对目标音频进行文本识别，得到目标音频文本，目标音频文本包括若干语音文本以及若干语音文本之间的分隔符；基于嵌入模型，对分隔符对应的语音文本以及分隔符进行嵌入处理，得到分隔符对应的分隔符向量，分隔符向量携带有分隔符对应的语音文本的文本信息；基于文本分割模型，根据分隔符向量，识别分隔符向量对应的分隔符是否为段落分隔符；根据分隔符向量对应的分隔符是否为段落分隔符的第一确定结果，对若干语音文本进行分段处理，得到目标文本，以提高对文本进行段落分割的准确性，提升对文本进行段落分割的分割效果。

技术研发人员：舒畅,陈又新
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：
技术公布日：2024/8/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：舒畅,陈又新
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

上一篇：基于大语言模型的结构化知识查询系统
上一篇：一种阻断单核巨噬细胞功能的CD38抑制剂在治疗ITP中的应用

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。