专利名称:声纹密码语音提示的声纹认证系统及其实现方法
技术领域:
本发明涉及一种声纹认证系统,尤其涉及一种声纹密码语音提示的声纹认证系统;此外,本发明还涉及一种声纹密码语音提示的声纹认证系统的实现方法。
背景技术:
声纹认证的密码通常分为固定密码和随机密码两种,由于固定密码容易被盗录、 攻击、破解,而随机密码则无法事先获取,每次都不固定,具有较好的安全性。然而,任何一种密码认证系统都有其薄弱的地方。对于声纹认证系统也是这样,网络上存在各种安全隐患,若攻击者直接得到密码内容,则有可能进行各种攻击,如通过偷录、拼接用户语音等方式威胁用户的密码安全。其中,危害最大的是通过恶意程序进行攻击。因此,需要研发一种声纹认证系统,用来增加恶意程序破解声纹识别密码的难度, 以提高系统的安全性。
发明内容
本发明要解决的技术问题是提供一种声纹密码语音提示的声纹认证系统,由于语音内容识别技术的困难及于服务器对于用户登录的严格的时间限制,这将大大增加破解的难度,提高系统的安全性。为此,本发明还提供一种声纹密码语音提示的声纹认证系统的实现方法。为解决上述技术问题,本发明提供一种声纹密码语音提示的声纹认证系统,包括 密码建立模块、语音识别模块和声纹识别模块;该密码建立模块与服务器相连,服务器产生随机密码,以语音格式提示用户密码内容,用户根据提示提供相应的语音;该语音识别模块用于对用户提供的语音进行内容分析,对提供的语音内容与服务器产生的密码内容进行模式匹配,若两者不符合,说明用户提供的密码不合要求,若两者相符,则进入声纹识别模块; 该声纹识别模块分为注册单元和测试单元,在注册单元建立说话人模型,在测试单元调用说话人模型,分析测试时提供的语音特征,进行一个确认判决,接受或拒绝。所述密码建立模块中用户根据提示提供相应的语音,该语音的提供方式是人工拼接的,或者是机器合成的,或者采用对语音进行加噪处理。所述密码建立模块中用户根据提示提供相应的语音,该语音的提供方式是每次读一个字或者将密码分成若干段读,或者通过视频方式提供密码。所述密码建立模块中的密码是随机密码或者由随机密码和固定密码组成,当密码由随机密码和固定密码组成时,只提供语音格式的随机密码给用户。所述声纹识别模块中在注册单元建立说话人模型,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型的基础上,通过最大后验概率自适应算法对该说话人的模型参数进行估计,建立该说话人模型。所述声纹识别模块中在测试单元调用说话人模型,分析测试时提供的语音特征, 获得测试语音与该说话人模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,反之,若评分低于阈值,则拒绝。此外,本发明还提供一种声纹密码语音提示的声纹认证系统的实现方法,包括如下步骤(1)服务器产生随机密码,以语音方式提示用户密码内容;(2)用户根据提示提供相应的语音;(3)语音识别模块对用户提供的语音进行内容分析,对提供的语音内容与密码内容进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应予以拒绝,回到步骤⑵;若相符,则进入步骤⑷;(4)在注册阶段,声纹识别模块建立说话人模型;在测试阶段,声纹识别模块调用说话人模型,分析测试时提供的语音特征,进行一个确认判决,接受或拒绝。步骤O)中,所述用户根据提示提供相应的语音,该语音的提供方式是人工拼接的,或者是机器合成的,或者采用对语音进行加噪处理。步骤O)中,所述用户根据提示提供相应的语音,该语音的提供方式是每次读一个字或者将密码分成若干段读,或者通过视频方式提供密码。步骤中,所述在注册阶段建立说话人模型,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型的基础上,通过最大后验概率自适应算法对该说话人的模型参数进行估计,建立该说话人模型。步骤中,所述在测试阶段声纹识别模块调用说话人模型,分析测试时提供的语音特征,获得测试语音与该说话人模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,结束流程;反之,若评分低于阈值,则拒绝,回到步骤⑵。本发明的有益效果在于本发明通过语音的方式提供声纹识别的登录密码内容, 增加了恶意工具破解声纹识别密码的难度,却基本不会给用户带来不便,可以方便的与其他安全措施相结合,提高声纹认证系统的安全性。
图1是本发明系统的模块结构示意图;图2是本发明方法中注册阶段的流程示意图;图3是本发明方法中测试阶段的流程示意图。
具体实施例方式如图1所示,本发明声纹密码语音提示的声纹认证系统主要由以下三部分构成1.密码建立模块。该密码是随机密码或者由随机密码和固定密码组成,固定密码可由用户自己设定。该密码建立模块与服务器相连,服务器产生随机密码,以语音方式提示用户密码内容,用户根据提示提供相应的语音。如用户密码由固定密码和随机密码组成,只提供语音格式的随机密码给用户。语音的提供方式是多变的,可以是人工拼接的,也可以是机器合成的,为了增加攻击者的识别困难,在不影响真是用户听取密码的前提下,通常要对语音进行加噪等处理,如为语音叠加一定程度的噪声等。该语音的提供方式可以是每次读一个字或者将密码分成若干段读,或者通过视频方式提供密码。2.语音识别模块。该模块对用户提供的语音进行内容分析,对提供的语音内容与服务器产生的密码内容进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应予以拒绝。若相符,则进入下面的声纹识别模块。例如,服务器产生随机密码 “789100”,该随机密码以语音格式提示用户密码内容(即以语音“789100”的方式提示用户),用户根据该语音提示提供相应的语音(即读出“789100”的语音);然后,语音识别模块对用户提供的语音进行内容分析,得到语音的内容为“789100”,对提供的语音内容(即 “789100”)与服务器产生的密码内容(即“789100”)进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应予以拒绝;若相符,则进入下一阶段的声纹识别模块。3.声纹识别模块,该模块由两部分组成注册单元,说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型(例如高斯混合模型)的基础上,通过最大后验概率自适应算法(本领域公知的经典算法)对该说话人的模型参数进行估计,建立该说话人的模型;测试单元,系统调用声明的说话人模型,分析测试时提供的语音特征,获得测试语音与该声明模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,反之,若评分低于阈值,则拒绝。本发明通过语音提示声纹密码的声纹认证系统,来提高声纹身份认证的安全性。 本发明中,用户的密码是由服务器通过随机数生成算法产生的随机密码(如成语或数字串等),即每次用户登录采用的密码是随机的,在登录时才能获取。其次,该随机密码是通过语音的方式提供给用户的,要求用户在听到提示语音后,提供本人的指定内容(密码)的语音用于登录。对于用户而言,识别语音的提示内容是比较容易的,而对于恶意攻击程序而言, 这个过程是比较困难的,获取密码内容需要消耗一定的时间。而声纹认证的过程相对来说较短,如正常语速读8个数字需要3秒左右,为了安全,故服务器提供给用户的每一步骤的登录时间也是有限的,通过增加恶意程序获取密码内容的难度,可以有效的提高系统的安全性。并且,语音识别是一个专业性非常强的复杂技术,这大大提高了攻击者破解的门槛。声纹识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。如图2和图3所示,本发明声纹密码语音提示的声纹认证系统的实现方法,主要包括如下步骤(1)服务器产生语音格式随机密码,以语音方式提示用户密码内容;(2)用户根据提示提供相应的语音;(3)语音识别模块对用户提供的语音进行内容分析,对提供的语音内容与密码内容进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应予以拒绝,重新回到步骤(2)用户根据提示提供相应的语音;若相符,则进入步骤;(4)在注册阶段,声纹识别模块建立说话人模型(即注册模型,见图2、,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型(例如高斯混合模型)的基础上,通过最大后验概率自适应算法(本领域公知的经典算法)对该说话人的模型参数进行估计,建立该说话人的模型;在测试阶段,声纹识别模块调用说话人模型(即注册模型),分析测试时提供的语音特征,获得测试语音与该声明模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,结束流程;反之,若评分低于阈值,则拒绝,重新回到步骤(2) 用户根据提示提供相应的语音(见图3)。 本发明提出了声纹密码的语音提示方法,用户在进行语音密码登录时,根据语音提示读出密码内容;而对于恶意程序而言,首先要获得语音的文本内容,这需要语音识别技术,这是一个难度较大的课题,由于语音内容识别技术的困难及于服务器对于用户登录的严格的时间限制,这将大大增加破解的难度,提高系统的安全性。而人脑高度发达,识别语音内容没有困难,本发明将不会给真实的用户带来负面影响。
权利要求
1.一种声纹密码语音提示的声纹认证系统,其特征在于,包括密码建立模块、语音识别模块和声纹识别模块;该密码建立模块与服务器相连,服务器产生随机密码,以语音格式提示用户密码内容, 用户根据提示提供相应的语音;该语音识别模块用于对用户提供的语音进行内容分析,对提供的语音内容与服务器产生的密码内容进行模式匹配,若两者不符合,说明用户提供的密码不合要求,若两者相符, 则进入声纹识别模块;该声纹识别模块分为注册单元和测试单元,在注册单元建立说话人模型,在测试单元调用说话人模型,分析测试时提供的语音特征,进行一个确认判决,接受或拒绝。
2.如权利要求1所述的声纹密码语音提示的声纹认证系统,其特征在于,所述密码建立模块中用户根据提示提供相应的语音,该语音的提供方式是人工拼接的,或者是机器合成的,或者采用对语音进行加噪处理。
3.如权利要求1或2所述的声纹密码语音提示的声纹认证系统,其特征在于,所述密码建立模块中用户根据提示提供相应的语音,该语音的提供方式是每次读一个字或者将密码分成若干段读,或者通过视频方式提供密码。
4.如权利要求1所述的声纹密码语音提示的声纹认证系统,其特征在于,所述密码建立模块中的密码是随机密码或者由随机密码和固定密码组成,当密码由随机密码和固定密码组成时,只提供语音格式的随机密码给用户。
5.如权利要求1所述的声纹密码语音提示的声纹认证系统,其特征在于,所述声纹识别模块中在注册单元建立说话人模型,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型的基础上,通过最大后验概率自适应算法对该说话人的模型参数进行估计,建立该说话人模型。
6.如权利要求1所述的声纹密码语音提示的声纹认证系统,其特征在于,所述声纹识别模块中在测试单元调用说话人模型,分析测试时提供的语音特征,获得测试语音与该说话人模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,反之,若评分低于阈值,则拒绝。
7.一种声纹密码语音提示的声纹认证系统的实现方法,其特征在于,包括如下步骤(1)服务器产生随机密码,以语音方式提示用户密码内容;(2)用户根据提示提供相应的语音;(3)语音识别模块对用户提供的语音进行内容分析,对提供的语音内容与密码内容进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应予以拒绝,回到步骤(2);若相符,则进入步骤⑷;(4)在注册阶段,声纹识别模块建立说话人模型;在测试阶段,声纹识别模块调用说话人模型,分析测试时提供的语音特征,进行一个确认判决,接受或拒绝。
8.如权利要求7所述的声纹密码语音提示的声纹认证系统的实现方法,其特征在于, 步骤O)中,所述用户根据提示提供相应的语音,该语音的提供方式是人工拼接的,或者是机器合成的,或者采用对语音进行加噪处理。
9.如权利要求7所述的声纹密码语音提示的声纹认证系统的实现方法,其特征在于, 步骤O)中,所述用户根据提示提供相应的语音,该语音的提供方式是每次读一个字或者将密码分成若干段读,或者通过视频方式提供密码。
10.如权利要求7所述的声纹密码语音提示的声纹认证系统的实现方法,其特征在于, 步骤中,所述在注册阶段建立说话人模型,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型的基础上,通过最大后验概率自适应算法对该说话人的模型参数进行估计,建立该说话人模型。
11.如权利要求7所述的声纹密码语音提示的声纹认证系统的实现方法,其特征在于, 步骤(4)中,所述在测试阶段声纹识别模块调用说话人模型,分析测试时提供的语音特征, 获得测试语音与该说话人模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,结束流程;反之,若评分低于阈值,则拒绝,回到步骤O)。
全文摘要
本发明公开了一种声纹密码语音提示的声纹认证系统,包括密码建立模块、语音识别模块和声纹识别模块;该密码建立模块与服务器相连,服务器产生随机密码,以语音方式提示用户密码内容,用户根据提示提供相应的语音;该语音识别模块用于对用户提供的语音进行内容分析,对提供的语音内容与服务器产生的密码内容进行模式匹配,若不符合,说明用户提供的密码不合要求,若相符,则进入声纹识别模块;该声纹识别模块分为注册单元和测试单元,在注册单元建立说话人模型,在测试单元调用说话人模型,分析测试时提供的语音特征,进行一个确认判决,接受或拒绝。此外,本发明还公开了该系统的实现方法。本发明能提高声纹认证的安全性。
文档编号H04L29/06GK102413101SQ201010290330
公开日2012年4月11日 申请日期2010年9月25日 优先权日2010年9月25日
发明者陈大年 申请人:盛乐信息技术(上海)有限公司