一种基于时域合成语音检测网络的欺骗语音检测方法

文档序号:38216803发布日期:2024-06-06 18:51阅读:来源:国知局

技术特征:

1.一种基于时域合成语音检测网络的欺骗语音检测方法,其特征在于包括以下步骤:

2.根据权利要求1所述的一种基于时域合成语音检测网络的欺骗语音检测方法,其特征在于:所述时域合成语音残差网络结构为一个20层结构的时域合成语音残差网络结构,该时域合成语音残差网络结构的输入尺寸为(2*1*95680);当语音数据输入到该网络结构中时,首先进行第一层的卷积,其中输入通道为1,kernel_size=7,输出通道为16,经过批归一化后接着进入连续的四个残差块,每个残差块前都跟一个最大池化层进行下采样,并且在最后一个残差块后通过全局平均池化将特征汇总成一个向量后,最后经过全连接层进行分类,从而输出最终结果。

3.根据权利要求2所述的一种基于时域合成语音检测网络的欺骗语音检测方法,其特征在于:所述残差块的结构为三个用于特征提取的卷积层,并且每个卷积层后面都跟着一个批归一化层和relu激活函数。


技术总结
本发明涉及一种基于时域合成语音检测网络的欺骗语音检测方法,其特征在于包括语音数据数据预处理;其次是选定时域合成语音残差网络结构作为基准网络;之后将经过预处理的语音数据并输入到选定好的时域合成语音残差网络结构中进行训练,从而得到最终的欺骗语音检测模型;最后将待检测的语音数据输入到欺骗语音检测模型中,从而输出语音的检测结果。本发明仅贴合语音信号的特点,还能更好地处理语音数;而且在深度的网络中,保证更好的学习收敛的同时,避免了梯度消失或爆炸的问题。

技术研发人员:王泳,于拴帅
受保护的技术使用者:广东技术师范大学
技术研发日:
技术公布日:2024/6/5
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1