技术总结
本发明公开了一种基于自注意力和迁移学习的声纹识别方法,获取开源英文语音数据,构建一级基础数据集;获取开源中文语音数据,构建二级基础数据集;采集应用场景语音数据,构建应用场景数据集;基于注意力模型和一级基础数据集,训练一级基础模型;而后,在二级基础数据集上,对一级基础模型进行迁移微调训练,获取二级基础模型;最终,在具体的应用场景数据上,迁移微调二级基础模型,获得适应具体应用场景的最终模型。本发明不仅学习到噪音、混响、信道的鲁棒性,且学习到中文的发音特色和更适应真实应用场景的识别能力,具有噪音、混响、信道的鲁棒性,很好满足真实场景的应用。
技术研发人员:高登科
受保护的技术使用者:中科智云科技有限公司
技术研发日:2019.11.21
技术公布日:2020.02.28