1.一种基于时域合成语音检测网络的欺骗语音检测方法,其特征在于包括以下步骤:
2.根据权利要求1所述的一种基于时域合成语音检测网络的欺骗语音检测方法,其特征在于:所述时域合成语音残差网络结构为一个20层结构的时域合成语音残差网络结构,该时域合成语音残差网络结构的输入尺寸为(2*1*95680);当语音数据输入到该网络结构中时,首先进行第一层的卷积,其中输入通道为1,kernel_size=7,输出通道为16,经过批归一化后接着进入连续的四个残差块,每个残差块前都跟一个最大池化层进行下采样,并且在最后一个残差块后通过全局平均池化将特征汇总成一个向量后,最后经过全连接层进行分类,从而输出最终结果。
3.根据权利要求2所述的一种基于时域合成语音检测网络的欺骗语音检测方法,其特征在于:所述残差块的结构为三个用于特征提取的卷积层,并且每个卷积层后面都跟着一个批归一化层和relu激活函数。