一种身份认证方法及装置的制造方法

文档序号:9491803阅读:440来源:国知局
一种身份认证方法及装置的制造方法
【技术领域】
[0001] 本申请涉及生物识别技术领域,尤其涉及一种身份认证方法及装置。
【背景技术】
[0002] 随着信息技术的飞速发展,特别是Internet的发展,数据信息化的不断深入。越 来越多的事务,其办理过程都需要进行身份认证,例如:在公共安全领域的用于智能门禁、 智能视频监控、公安布控、海关身份验证、实际驾照验证等的智能机器人;在民事和经济领 域对各类银行卡、金融卡、信用卡、存蓄卡的持卡人进行身份验证的智能机器人。为了信息 安全,办理业务之前通常需要通过验证人员身份后。
[0003] 生物识别技术就是利用人体生物特征进行身份认证的一种技术。生物特征是唯一 的,可以测量或可自动识别和验证的生理特性或行为方式。生物识别系统对生物特征进行 取样,提取其唯一的特征并且转化为数字代码,并进一步将这些代码组成特征模板,人们同 识别系统交互进行身份认证时,识别系统获取其特征并于特征模板进行对比,以确定是否 匹配。
[0004] 生物识别技术是目前最为方便与安全的识别技术,不需要记住复杂的密码,也不 需要随身携带钥匙、智能卡之类的东西。常见的生物识别的特征有指纹、虹膜、视网膜、DNA 和语音等。语言作为人类的自然属性之一,说话人的语音具有各自的生物特征,每个人的发 音器官不仅有先天的生理差异,还带有后天的行为差异,这使得越来越多的身份认证技术 中采用语音分析来进行说话人身份识别。
[0005] 但是人的语音文件也容易被复制或窃取,如果待验证的人的语音文件被恶意复制 并被用于办理未经当事人同意的业务,这样就带来了很大的风险。
[0006] 此外,通过语音来鉴别人员的身份,在接收语音输入时,周围环境噪音会影响对于 语音鉴别的准确性。如何解决环境噪音对于语音识别的影响也是亟待解决的一个问题。

【发明内容】

[0007] 有鉴于此,本申请提供一种用于身份认证方法及装置,其能避免恶意复制及降低 识别准确率的问题,实现以高准确率地进行人员身份鉴别。
[0008] 本申请提供一种身份认证方法,所述方法包括: 步骤一,建立语音认证数据库; 步骤二,接收并存储待认证的语音文件; 步骤三,鉴定待认证的语音文件的真伪,若为真,则进入步骤四,若有假,则结束直接输 出认证失败消息; 步骤四,提取语音信号特征并重建语音信号中的可靠语音特征; 步骤五,对语音的可靠特征向量进行认证并输出身份认证结果。
[0009] 在本申请一具体实施例中,所述步骤一包括:采集所有人的可靠语音、可靠语音的 特征提取以及在所述语音认证数据库中记录语音特征信息。
[0010] 在本申请一具体实施例中,所述步骤三为:鉴定语音文件中由于复制带来的特定 特征是否超过设定的第一阈值。
[0011] 在本申请一具体实施例中,计算所述复制带来的特定特征包括:
表示帧数为T的语音信号,则第q( if:)帧信号
的离散傅里叶变换为:
其中,N为语音信号中马科夫链的状态数; 则均值帧的表达式为:
通过公式(3-3)来提取原始的真实语音与复制语音在频率部分存在的差异:
其中,filterO为现有技术中任意的滤波函数。
[0012] 在本申请一具体实施例中,所述步骤四包括: 采用语音识别库建立时使用的语音特征提取算法,提取日常生活中输入的语音信号 的特征向量X ; 将日常生活中输入的语音信号#的特征向量X进行分离,分为语音向量矣和噪声向 量足; 将特征向量X根据其高斯函数的均值和方差分为语音向量_和噪声向量乂,并计算 第V个给定的语音向量%的先验概率八v|i;):
将语音信号的语音向量@;非为输入语音信号的可靠特征向量。
[0013] 本申请还公开了一种身份认证装置,所述装置包括: 语音认证数据库1,用于存储所有人员的语音特征信息; 采集模块2,采集待认证人员的语音信息; 真伪鉴定模块3,用于鉴定待认证的语音文件的真伪; 特征提取模块4,提取语音信号特征并重建语音信号中的特征; 认证模块5,对语音的可靠特征向量进行认证并输出身份认证结果。
[0014] 在本申请一具体实施例中,所述语音认证数据库1用于采集所有人的可靠语音、 可靠语音的特征提取以及在所述语音认证数据库中记录语音特征信息。
[0015] 在本申请一具体实施例中,所述真伪鉴定模块3具体用于鉴定语音文件中由于复 制带来的特定特征是否超过设定的第一阈值。
[0016] 在本申请一具体实施例中,计算所述复制带来的特定特征包括: 若
·表示帧数为T的语音信号,则第帧信号
的离散傅里叶变换为:
其中,N为语音信号中马科夫链的状态数; 则均值帧的表达式为:
通过公式(3-3)来提取原始的真实语音与复制语音在频率部分存在的差异:
其中,filterO为现有技术中任意的滤波函数。
[0017] 在本申请一具体实施例中,所述认证模块5包括: 采用语音识别库建立时使用的语音特征提取算法,提取日常生活中输入的语音信号A 的特征向量X ; 将日常生活中输入的语音信号亦的特征向量X进行分离,分为语音向量工和噪声向 旦卞 里今 将特征向量X根据其高斯函数的均值和方差分为语音向量:?,和噪声向量足,并计算 第V个给定的语音向量,_先验概率P(Vll):
将语音信号的语音向量1<作为输入语音信号的可靠特征向量。
【附图说明】
[0018] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他 的附图。
[0019] 图1是本申请中建立语音认证数据库的流程图; 图2本申请中身份认证方法流程图是; 图3是本申请中身份认证装置结构图。
【具体实施方式】
[0020] 为了使本领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例 中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅 是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人 员所获得的所有其他实施例,都应当属于本申请保护的范围。
[0021] 为了解决现有技术中存在的使用语音进行身份认证中由于恶意复制和环境噪音 使得语音识别准确率下降的问题,本申请公开了 一种身份认证方法及装置。
[0022] 下面结合本申请附图进一步说明本申请具体实现。
[0023] 如图1所示,进行语音认证前首先需要建立语音认证数据库,语音数据库的建立 过程可以利用任意现有的语音特征提取技术,优选地,可以使用以下建立过程: 根据需要,采集所有η个需要认证人员的语音信息。为了保证语音识别的准确率,可以 不断增加所有人员在不同情况下的语音信息,以提高识别率。
[0024] 对于采集到的人员i的语音信息对应音频信号x(i)存储至语音识别数据库中的 原始语音存储区,i=l,……,n(i为正整数)。
[0025] 语音的特征提取过程包括以下步骤: 对于在原始语音存储区中存储的每个音频信号x(i)进行以下处理: (1)将音频信号x(i)划分成一系列连续的帧,对每帧信号做傅里叶变换。
[0026] (2)使用滤波器对音频信号进行处理,以降低相邻频带之间频谱能量的相互泄露; 滤波器中使用的滤波函数为:
其中: 参数Θ为滤波器的初始相位,η为滤波器的阶数; 当 t〈0 时,u (t) =0,当 t>0 时,u (t) =1 ; B=L 019*ERB ( /〇 ),ERB ( /〇 )为滤波器的等价矩形带宽,它同滤波器中心频率感的关 系为: ERB ( J )=24. 7+0. 108 公式(2)。
[0027] (3)移除音频信号的中间偏差。
[0028] 在音频信号分帧后,把一定数量的帧组成一个分段,在本发明优选将7个帧组成 一个分段,这个可以根据系统的处理能力进行设置。
[0029] 大多数语音识别系统使用的帧长为20ms-30ms,在本发明优选使用26. 5ms作为海 明窗口,重叠帧长为l〇ms,每帧的中间量Q(i,j)通过计算段内帧能量P(i,j)的平均值得 到:
公式(3)中由于本发明优选7个帧组成一个分段,因而M=3。i为频道序号,j为所求帧 的序列,j'为所求分段中各帧的序列。
[0030] 在噪声能量去除过程中,使用算术平均值与几何平均值的比值(AM/GM)可以表示 语音信
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1