语音识别方法、装置、系统、电子设备及存储介质与流程

文档序号：37931002发布日期：2024-05-11 00:10阅读：来源：国知局

技术特征：

1.一种语音识别方法，其特征在于，包括：

2.根据权利要求1所述的语音识别方法，其特征在于，根据所述待识别语音数据的语音类别，提取所述待识别语音数据的fbank语音特征，包括：

3.根据权利要求1所述的语音识别方法，其特征在于，通过以下步骤获取所述已训练好的融合语音识别模型，包括：

4.根据权利要求3所述的语音识别方法，其特征在于，在获取语音数据训练样本后，所述方法还包括：

5.根据权利要求3所述的语音识别方法，其特征在于，基于所述fbank语音特征集，对初始化语音识别模型进行训练，得到已训练好的在线语音识别模型和已训练好的离线语音识别模型，包括：

6.根据权利要求3所述的语音识别方法，其特征在于，利用知识蒸馏对所述已训练好的在线语音识别模型和所述已训练好的离线语音识别模型进行模型融合，得到所述已训练好的融合语音识别模型，包括：

7.一种语音识别装置，其特征在于，包括：

8.一种语音识别系统，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1～6中任意一项所述的语音识别方法。

技术总结
本公开提供了一种语音识别方法、装置、系统、存储介质及电子设备，涉及人工智能技术领域。其中，语音识别方法包括：获取目标对象输入的待识别语音数据，根据所述待识别语音数据的语音类别，提取所述待识别语音数据的fbank语音特征，将待识别语音数据的fbank语音特征输入至由已训练好的在线语音识别模型和已训练好的离线语音识别模型进行模型融合得到融合语音识别模型中，输出得到待识别语音数据的语音识别结果。本公开可同时适用于在线和离线两种场景下的语音识别，提高了语音识别的效率以及准确率。

技术研发人员：汪洋
受保护的技术使用者：中国电信股份有限公司
技术研发日：
技术公布日：2024/5/10

完整全部详细技术资料下载

当前第2页1 2