一种术前语音识别与交互评估方法

文档序号：40271205发布日期：2024-12-11 13:05阅读：148来源：国知局

本发明涉及语音交互及指标评估，尤其涉及一种术前语音识别与交互评估方法。

背景技术：

1、语音识别技术是一种让智能设备能够听懂人类的语音的技术。其主要涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。

2、近年来，随着人工智能的兴起，语音识别技术在理论和应用方面都取得大突破，开始从实验室走向市场，已逐渐走进我们的日常生活。现在语音识别己用于许多领域，主要包括语音识别听写器、语音寻呼和答疑平台、自主广告平台，智能客服等。因此语音识别与人机交互的理解能力是评估智能语音产品智能化的重要指标。

3、但是，目前就手术之前如何使得机器合理评估患者和理解患者的意思，我们采用了许多的模型训练或者机器人学习技术，可是达到的效果并不理想。往往是考虑的不够充分、声音波形识别不够，没有贴近于实际生活。如何使得模型对于声音识别的准确率提高以及对患者进行评估分析，依然是研发人员研究的重点和热点。

技术实现思路

1、本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊，而这种简化或省略不能用于限制本发明的范围。

2、鉴于上述现有存在的问题，提出了本发明。因此，本发明提供了一种术前语音识别与交互评估方法，用来解决背景技术中提到的问题。

3、为解决上述技术问题，本发明提供如下技术方案：一种术前语音识别与交互评估方法，包括：

4、获取手术前患者的语音数据和个人信息数据，将所述语音数据转换为语音信号，对所述语音信号进行特征提取；

5、建立语音识别模型和交互评估模型，通过梅尔频率倒谱系数的线性序列，计算语音识别模型中的每一个提取信号特征向量的特征得分，将所述特征得分存储在特征表中；

6、将患者的个人信息数据转换为特征值，建立特征表与特征值之间的连通图，引入发音字典，根据所述特征表训练发音字典，利用所述发音字典作为交互评估模型的输入；

7、根据所述交互评估模型的输出结果，设计患者评价指标，得到患者在手术前的交互评估得分。

8、作为本发明所述的术前语音识别与交互评估方法的一种优选方案，其中：获取手术前患者的语音数据和个人信息数据，将所述语音数据转换为语音信号，对所述语音信号进行特征提取，包括：

9、在对所述语音信号进行特征提取之前，把语音信号过滤为波形信号，并将所述波形信号分为无障碍波形信号和有障碍波形信号。

10、作为本发明所述的术前语音识别与交互评估方法的一种优选方案，其中：

11、还包括：

12、分析所述无障碍波形信号和有障碍波形信号中的情感特征，将所述有障碍波形信号中的情感特征进行标记并重新排列。

13、作为本发明所述的术前语音识别与交互评估方法的一种优选方案，其中：

14、梅尔频率倒谱系数的线性序列，包括：

15、定义语音信号过程，得到梅尔频率倒谱系数的线性序列：

16、

17、其中，m表示为所有提取信号中的单元向量；α表示为无障碍波形信号；β表示为有障碍波形信号；θ表示为情感特征的标记；x和y表示为每一个提取信号i的特征向量。

18、作为本发明所述的术前语音识别与交互评估方法的一种优选方案，其中：计算语音识别模型中的每一个提取信号特征向量的特征得分，将所述特征得分存储在特征表中，包括：

19、所述特征表定义为数据结构表，所述数据结构表的行对应特征向量，列对应特征向量的得分。

20、作为本发明所述的术前语音识别与交互评估方法的一种优选方案，其中：将患者的个人信息数据转换为特征值，建立特征表与特征值之间的连通图，包括：

21、所述特征值包括患者个人信息的多类型值，若所述多类型值都包含在所述特征表中对应单元格内，则连通图建立完成；否则，重新转换患者的个人信息数据的特征值。

22、作为本发明所述的术前语音识别与交互评估方法的一种优选方案，其中：根据所述特征表训练发音字典，利用所述发音字典作为交互评估模型的输入，包括：

23、利用所述特征表训练发音字典的过程采用交叉式训练，且每一次交叉式训练结果传递至后一次训练结果，更新模型的当前训练过程。

24、作为本发明所述的术前语音识别与交互评估方法的一种优选方案，其中：根据所述交互评估模型的输出结果，设计患者评价指标，得到患者在手术前的交互评估得分，包括：

25、所述患者评价指标包括患者身体状况、心理状况、疼痛状况以及满意度评价；

26、所述交互评估得分根据交互评估模型的当前训练过程进行得分替换。

27、与现有技术相比，发明有益效果为：本发明通过获取手术前患者的语音数据和个人信息数据，将语音数据转换为语音信号，对语音信号进行特征提取；建立语音识别模型和交互评估模型，通过梅尔频率倒谱系数的线性序列，计算语音识别模型中的每一个提取信号特征向量的特征得分，将特征得分存储在特征表中；将患者的个人信息数据转换为特征值，建立特征表与特征值之间的连通图，引入发音字典，根据特征表训练发音字典，利用发音字典作为交互评估模型的输入；根据交互评估模型的输出结果，设计患者评价指标，得到患者在手术前的交互评估得分；首先，本发明将患者的语音数据和患者的个人信息数据结合起来，其中语音数据可以反映患者的声音特征和语音表达能力，而个人信息数据可以提供更多关于患者健康状况和生活方式的信息，为医疗评估提供更全面的信息；其次，将发音字典引入交互评估模型，帮助语音识别模型更准确地理解患者的语音信息、提供更准确以及贴近实际的评估结果，进一步提高了语音识别模型的准确性和可靠性；最后，通过设计患者评价指标，增加了患者对医疗服务的满意度和信任度，促进患者与医护人员之间的沟通和合作。

技术特征：

1.一种术前语音识别与交互评估方法，其特征在于，包括：

2.如权利要求1所述的术前语音识别与交互评估方法，其特征在于，获取手术前患者的语音数据和个人信息数据，将所述语音数据转换为语音信号，对所述语音信号进行特征提取，包括：

3.如权利要求2所述的术前语音识别与交互评估方法，其特征在于，还包括：

4.如权利要求2或3所述的术前语音识别与交互评估方法，其特征在于，梅尔频率倒谱系数的线性序列，包括：

5.如权利要求4所述的术前语音识别与交互评估方法，其特征在于，计算语音识别模型中的每一个提取信号特征向量的特征得分，将所述特征得分存储在特征表中，包括：

6.如权利要求5所述的术前语音识别与交互评估方法，其特征在于，将患者的个人信息数据转换为特征值，建立特征表与特征值之间的连通图，包括：

7.如权利要求6所述的术前语音识别与交互评估方法，其特征在于，引入发音字典，根据所述特征表训练发音字典，利用所述发音字典作为交互评估模型的输入，包括：

8.如权利要求7所述的术前语音识别与交互评估方法，其特征在于，根据所述交互评估模型的输出结果，设计患者评价指标，得到患者在手术前的交互评估得分，包括：

技术总结
本发明公开了一种术前语音识别与交互评估方法包括，本发明将患者的语音数据和患者的个人信息数据结合起来，其中语音数据可以反映患者的声音特征和语音表达能力，而个人信息数据可以提供更多关于患者健康状况和生活方式的信息，为医疗评估提供更全面的信息；其次，将发音字典引入交互评估模型，帮助语音识别模型更准确地理解患者的语音信息、提供更准确以及贴近实际的评估结果，进一步提高了语音识别模型的准确性和可靠性；最后，通过设计患者评价指标，增加了患者对医疗服务的满意度和信任度，促进患者与医护人员之间的沟通和合作。

技术研发人员：姚伟锋,容典,韩雪,关山,罗雀华,银琳,罗刚健,黑子清
受保护的技术使用者：中山大学附属第三医院
技术研发日：
技术公布日：2024/12/10

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：姚伟锋,容典,韩雪,关山,罗雀华,银琳,罗刚健,黑子清
技术所有人：中山大学附属第三医院
我是此专利的发明人

上一篇：一种消防器材内部水压检测装置的制作方法
上一篇：一种磷酸化产品出料设备的改进装置的制作方法