声纹生成方法、服务器、客户端及系统的制作方法
【专利摘要】本发明公开了一种声纹生成方法、服务器、客户端及系统,属于计算机【技术领域】。所述方法包括:获取操作客户端的合法用户的合法用户信息;获取与合法用户信息相关的注册语料;向客户端发送注册语料;分预设次数获取合法用户根据注册语料输入的注册声音数据,得到预设次数个注册声音数据;根据预设次数个注册声音数据生成注册声纹。本发明通过获取合法用户的合法用户信息,并获取与合法用户信息相关的注册语料来触发声纹生成过程。由于注册语料为与合法用户的合法用户信息相关的语料,因此,能成功获取到合法用户根据与其合法用户信息相关的注册语料输入的注册声音数据,不仅能增加声纹生成的成功率,而且使得声纹生成方法更具灵活性。
【专利说明】声纹生成方法、服务器、客户端及系统
【技术领域】
[0001]本发明涉及计算机【技术领域】,特别涉及一种声纹生成方法、服务器、客户端及系统。
【背景技术】
[0002]为了保障用户信息或用户财产的安全,很多应用场景均需要对用户进行身份验证。例如,各种社交应用软件的客户端、银行应用软件的客户端在操作时均需要对操作客户端的用户进行身份验证。由于不同用户的声音往往具有不同的特征,因此,在进行身份验证时,可以根据不同用户的声音数据生成声纹,从而通过声纹对用户进行身份验证,而为了实现声纹验证,需要先生成声纹。
[0003]相关技术在生成声纹时,所采取的方法为:服务器向客户端发送预设注册语料;客户端接收该预设注册语料,分预设次数获取合法用户根据该预设注册语料输入的注册声音数据,得到预设次数个注册声音数据,并将该预设次数个注册声音数据提交至服务器;月艮务器接收客户端提交的预设次数个注册声音数据,并根据该预设数值个注册声音数据生成注册声纹。在后续通过声纹验证实现身份验证时,每次均使用该注册声纹实现。
[0004]在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
[0005]对于不同用户的客户端,相关技术在生成声纹时,服务器均会通过向不同用户对应的客户端发送相同的预设注册语料来触发声纹生成过程。然而,由于不同用户的喜好、地域等信息各不相同,因此,向不同客户端下发相同的预设注册语料时,可能出现客户端不能根据该预设注册语料获取合法用户输入的注册声音数据,不仅可能导致声纹生成失败,使得声纹生成的成功率不高,而且声纹生成方法不够灵活。
【发明内容】
[0006]为了解决相关技术的问题,本发明实施例提供了一种声纹生成方法、服务器、客户端及系统。所述技术方案如下:
[0007]第一方面,提供了一种声纹生成方法,所述方法包括:
[0008]获取操作客户端的合法用户的合法用户信息;
[0009]获取与所述合法用户信息相关的注册语料,并向所述客户端发送所述注册语料;
[0010]分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数个注册声音数据;
[0011]根据所述预设次数个注册声音数据生成注册声纹。
[0012]第二方面,提供了一种声纹生成方法,所述方法包括:
[0013]接收服务器发送的与操作客户端的合法用户的合法用户信息相关的注册语料;
[0014]分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数个注册声音数据;
[0015]将所述预设次数个注册声音数据提交至所述服务器,使所述服务器根据所述预设次数个注册声音数据生成注册声纹。
[0016]第三方面,提供了一种声纹生成服务器,所述服务器包括:
[0017]第一获取模块,用于获取操作客户端的合法用户的合法用户信息;
[0018]第二获取模块,用于获取与所述合法用户信息相关的注册语料;
[0019]发送模块,用于向所述客户端发送所述注册语料;
[0020]第三获取模块,用于分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数个注册声音数据;
[0021]生成模块,用于根据所述预设次数个注册声音数据生成注册声纹。
[0022]第四方面,提供了一种客户端,所述客户端包括:
[0023]接收模块,用于接收服务器发送的与操作客户端的合法用户的合法用户信息相关的注册语料;
[0024]获取模块,用于分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数个注册声音数据;
[0025]提交模块,用于将所述预设次数个注册声音数据提交至所述服务器,使所述服务器根据所述预设次数个注册声音数据生成注册声纹。
[0026]第五方面,提供了一种声纹生成系统,所述系统包括服务器和客户端;
[0027]其中,所述服务器如上述第三方面所述的服务器;
[0028]所述客户端如上述第四方面所述的客户端。
[0029]本发明实施例提供的技术方案带来的有益效果是:
[0030]通过获取合法用户的合法用户信息,并获取与合法用户信息相关的注册语料来触发声纹生成过程。由于注册语料为与合法用户的合法用户信息相关的语料,因此,能成功获取到合法用户根据与其合法用户信息相关的注册语料输入的注册声音数据,不仅能增加声纹生成的成功率,而且使得声纹生成方法更具灵活性。
【专利附图】
【附图说明】
[0031]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1是本发明一实施例提供的一种声纹生成方法所涉及的实施环境示意图;
[0033]图2是本发明另一实施例提供的一种声纹生成方法的流程图;
[0034]图3是本发明另一实施例提供的一种声纹生成方法的流程图;
[0035]图4是本发明另一实施例提供的一种声纹生成方法的流程图;
[0036]图5是本发明另一实施例提供的一种存储的注册声音数据及验证声音数据及每个验证声音数据对应的属性信息的示意图;
[0037]图6是本发明另一实施例提供的一种筛选进化声音数据的示意图;
[0038]图7本发明另一实施例提供的一种根据拼接的注册声音数据和进化声音数据生成进化声纹的过程示意图;
[0039]图8本发明另一实施例提供的一种服务器的结构示意图;
[0040]图9本发明另一实施例提供的一种服务器的结构示意图;
[0041]图10本发明另一实施例提供的一种客户端的结构示意图;
[0042]图11本发明另一实施例提供的一种客户端的结构示意图;
[0043]图12本发明另一实施例提供的一种声纹生成系统的结构示意图。
【具体实施方式】
[0044]为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
[0045]如图1所示,其示出了本发明实施例提供的声纹生成方法所涉及的实施环境示意图。如图1所示,该实施环境包括服务器101和客户端102。其中,服务器101和客户端102通过无线网络或有线网络连接。
[0046]当需要通过声纹实现身份验证时,需要先生成操作客户端102的合法用户的声纹。其中,在生成合法用户的声纹时,服务器101通过向客户端102发送与合法用户的合法用户信息相关的注册语料来触发。客户端102接收该注册语料后,获取合法用户根据该注册语料输入的注册声音数据,并将获取到的注册声音数据提交至服务器101,服务器101根据该注册语料生成合法用户的声纹。
[0047]其中,客户端102可以是任何需要对操作该客户端102的当前用户通过声纹实现身份验证的客户端,包括但不限于社交应用客户端,财产账户客户端,等等。服务器101为与客户端102对应,且能够为客户端102提供对应服务的服务器。具体的声纹生成方法详见下述各个实施例:
[0048]图2是根据一示例性实施例提供的一种声纹生成方法的流程图。以服务器执行本发明实施例提供的方法的角度为例,参见图2,本发明实施例提供的方法流程包括:
[0049]201:获取操作客户端的合法用户的合法用户信息。
[0050]202:获取与合法用户信息相关的注册语料。
[0051]203:向客户端发送注册语料。
[0052]204:分预设次数获取合法用户根据注册语料输入的注册声音数据,得到预设次数个注册声音数据。
[0053]可选地,分预设次数获取合法用户根据注册语料输入的注册声音数据,包括:
[0054]分预设次数获取客户端分片提交的合法用户每次根据注册语料输入的注册语音数据;
[0055]拼接客户端分片提交的合法用户每次根据注册语料输入的注册语音数据,得到合法用户每次根据注册语料输入的注册语音数据;
[0056]组合合法用户每次根据注册语料输入的注册语音数据,得到预设次数个合法用户根据注册语料输入的注册声音数据。
[0057]可选地,得到预设次数个注册声音数据之后,还包括:
[0058]确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值;
[0059]如果预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值,则执行根据预设次数个注册声音数据生成注册声纹的步骤。
[0060]205:根据预设次数个注册声音数据生成注册声纹。
[0061]可选地,根据预设次数个注册声音数据生成注册声纹,包括:
[0062]拼接预设次数个注册声音数据;
[0063]根据拼接后的注册声音数据生成注册声纹。
[0064]可选地,根据预设次数个注册声音数据生成注册声纹之后,还包括:
[0065]存储注册语料、预设次数个注册声音数据及注册声纹,并形成注册语料、预设次数个注册声音数据及注册声纹的映射关系。
[0066]可选地,存储注册语料、预设次数个注册声音数据及注册声纹,包括:
[0067]对注册语料、预设次数个注册声音数据及注册声纹进行加密,并存储加密后的注册语料、预设次数个注册声音数据及注册声纹。
[0068]可选地,根据预设次数个注册声音数据生成注册声纹之后,还包括:
[0069]确定是否需要进化注册声纹;
[0070]如果确定需要进化注册声纹,则获取预设数值个进化声音数据,其中,预设数值个进化声音数据为根据每次使用注册声纹进行声纹验证,且每次声纹验证通过后存储的验证声音数据筛选的至少一个验证声音数据;
[0071]根据预设次数个注册声音数据和预设数值个进化声音数据进化注册声纹,得到进化声纹,并使用进化声纹进行后续的声纹验证。
[0072]可选地,确定是否需要进化注册声纹,包括:
[0073]确定是否接收到客户端发送的声纹进化请求;
[0074]如果接收到客户端发送的声纹进化请求,则确定需要进化注册声纹。
[0075]可选地,确定是否需要进化注册声纹,包括:
[0076]确定是否达到自动进化注册声纹的预设条件;
[0077]如果确定达到自动进化注册声纹的预设条件,则确定需要进化注册声纹。
[0078]可选地,获取预设数值个进化声音数据,包括:
[0079]获取每次声纹验证通过后存储的验证声音数据以及每个验证声音数据的属性信息;
[0080]根据每个验证声音数据的属性信息筛选预设数值个满足声纹进化条件的验证声音数据,将预设数值个满足声纹进化条件的验证声音数据作为预设数值个进化声音数据。
[0081]本发明实施例提供的方法,通过获取合法用户的合法用户信息,并获取与合法用户信息相关的注册语料来触发声纹生成过程。由于注册语料为与合法用户的合法用户信息相关的语料,因此,能成功获取到合法用户根据与其合法用户信息相关的注册语料输入的注册声音数据,不仅能增加声纹生成的成功率,而且使得声纹生成方法更具灵活性。
[0082]图3是根据一示例性实施例提供的一种声纹生成方法的流程图。以客户端执行本发明实施例提供的方法的角度为例,参见图3,本发明实施例提供的方法流程包括:
[0083]301:接收服务器发送的与操作客户端的合法用户的合法用户信息相关的注册语料。
[0084]302:分预设次数获取合法用户根据注册语料输入的注册声音数据,得到预设次数个注册声音数据。
[0085]303:将预设次数个注册声音数据提交至服务器,使服务器根据预设次数个注册声音数据生成注册声纹。
[0086]可选地,将预设次数个注册声音数据提交至服务器,包括:
[0087]分预设次数对合法用户每次根据注册语料输入的注册语音数据进行分片;
[0088]将合法用户每次根据注册语料输入的注册语音数据分片提交至服务器,使服务器分片获取合法用户每次根据注册语料输入的注册语音数据,并组合合法用户每次根据注册语料输入的注册语音数据,得到预设次数个合法用户根据注册语料输入的注册声音数据。
[0089]可选地,方法还包括:
[0090]确定是否需要进化注册声纹;
[0091]如果确定需要进化注册声纹,则向服务器发送进化注册声纹的声纹进化请求,使服务器根据声纹进化请求进化注册声纹。
[0092]本发明实施例提供的方法,通过接收服务器发送的与合法用户的合法用户信息相关的注册语料,并获取合法用户根据注册语料输入的注册声音数据后,向服务器提交获取到的合法用户根据注册语料输入的注册声音数据,并根据注册声音数据生成注册声纹。由于注册语料为与合法用户的合法用户信息相关的语料,因此,能成功获取到合法用户根据与其合法用户信息相关的注册语料输入的注册声音数据,不仅能增加服务器生成声纹的成功率,而且使得声纹生成方法更具灵活性。
[0093]图4是根据一示例性实施例提供的一种声纹生成方法的流程图。以服务器和客户端进行交互来实现本发明实施例提供的方法为例,参见图4,本发明实施例提供的方法流程包括:
[0094]401:服务器获取操作客户端的合法用户的合法用户信息,并获取与合法用户信息相关的注册语料,向客户端发送注册语料。
[0095]为了保证在生成注册声纹时,向操作客户端的合法用户展示的注册语料是合法用户感兴趣的内容,使得能够顺利生成合法用户的注册声纹,在生成注册声纹时,服务器可以获取合法用户的合法用户信息,并获取与合法用户信息相关的注册语料,从而向客户端发送与其用户信息相关的注册语料来触发声纹生成过程。
[0096]其中,本发明实施例不对合法用户信息的具体内容进行限定。具体实施时,合法用户信息包括但不限于为合法用户的爱好信息、地域信息,等等。例如,如果合法用户爱好数学,则服务器下发的注册语料可以为数字。又例如,如果合法用户为英国人,则服务器下发的注册语料可以为英文字母、英文短语、英文句子,等等。
[0097]本发明实施例不对注册语料的具体内容进行限定,具体实施时,注册语料可以为诗词歌赋、随机数字、随机字母、随机词语组合、名词名句,等等。例如,注册语料可以为“0-9”这十个数字,也可以“白日依山尽,黄河入海流”,还可以为“A-Η”等。当然,注册语料还可以为诗词歌赋、随机数字、随机字母、随机词语、名词名句中的至少两种的组合,等等。
[0098]关于服务器向客户端发送注册语料的方式,本发明实施例不作具体限定。服务器通过根据合法用户的合法用户信息向客户端发送与合法用户信息相关的注册语料,使得不同用户可以使用不同类型的注册语料,不仅选择注册语料的方式灵活多变,而且保证后续生成的注册声纹差异比较大,从而便于后续的声纹验证。
[0099]需要说明的是,注册语料的具体内容与后续将注册声纹作为声纹验证的参考时,服务器向客户端下发的验证语料的具体内容有关。具体地,验证语料为与注册语料中的全部字符一致的字符串、或者为与注册语料中的部分字符一致的字符串、或者为注册语料中的全部字符组成的倒序字符串、或者为注册语料中的部分字符组成的倒序字符串、或者为注册语料中的全部字符组成的乱序字符串、或者为注册语料中的部分字符组成的乱序字符串、或者为注册语料中的至少一个字符组成的重复字符串中的一种字符串。
[0100]例如,如果注册语料为“0-9”这十个数字,则后续以生成的注册声纹为参考进行声纹验证时使用的验证语料可以为“ 0-9 ”这十个数字;也可以是“ 0-9 ”这十个数字中的任意几个数字,如“ 0-7 ”、“02468 ”;还可以是“ 0-9 ”这十个数字中的全部或部分数字的倒序字符串,如“9-0”、“7-0”、“86420”;还可以是“0-9”这十个数字中的全部或部分数字组成的乱序字符串,如“3698521470”、“257369”;还可以是验证语料中的至少一个字符组成的重复字符串,如“000111”、“115577”等。当然,该举例仅以注册语料为数字时,验证语料的可能形式进行了举例说明。具体实施时,当注册语料为字母、数字、诗词等文本的组合形式时,验证语料的形式与当注册语料为数字时的形式类似,此处不再举例说明。
[0101]402:客户端接收服务器发送的注册语料,分预设次数获取合法用户根据注册语料输入的注册声音数据,得到预设次数个注册声音数据,将预设次数个注册声音数据提交至服务器。
[0102]关于客户端接收服务器发送的注册语料的方式,本发明实施例不作具体限定。另夕卜,本发明实施例同样不对客户端获取合法用户根据注册语料输入的注册声音数据的方式进行限定。具体实施时,在合法用户根据注册语料输入注册声音数据时,客户端通过录制合法用户输入的声音数据来实现。具体地,在录制注册声音数据时,可以先获取麦克风或话筒的启动指令,并根据麦克风或话筒的启动指令录制合法用户根据注册语料输入的声音数据。其中,获取麦克风或话筒的启动指令的方式可以有很多种,具体实施时,包括但不限于通过检测麦克风或话筒被长按来实现。
[0103]为了使得生成的注册声纹更加准确,以便于后续可以顺利根据生成的注册声纹进行声纹验证,客户端可以分预设次数获取合法用户根据注册语料输入的注册声音数据,从而得到合法用户的预设次数个注册声音数据。关于预设次数的具体数值,本发明实施例不作具体限定。具体实施时,可以根据需要设定。然而,为了使得生成的注册声纹更加准确,从而使得声纹验证的可靠性更高,该预设次数可以为两次,也可以为三次,等等。
[0104]关于将预设次数个注册声音数据提交至服务器的方式,本发明实施不作具体限定。具体实施时,由于声音数据比较大,因此,在提交每次获取到的注册声音数据之前,可以对每次获取到的注册声音数据进行分片。因此,在将预设次数个注册声音数据提交至服务器时,可以分预设次数对合法用户每次根据注册语料输入的注册语音数据进行分片;将合法用户每次根据注册语料输入的注册语音数据分片提交至服务器,使得服务器分预设次数获取客户端分片提交的合法用户每次根据注册语料输入的注册语音数据,并组合合法用户每次根据注册语料输入的注册语音数据,得到预设次数个合法用户根据注册语料输入的注册声音数据。
[0105]其中,在对合法用户每次根据注册语料输入的注册语音数据进行分片时,可以将合法用户每次根据注册语料输入的注册声音数据切分为相等大小的声音数据,也可以切分为不等大小的声音数据。本发明实施例不对切分后的声音数据的具体大小进行限定。例如,可以将合法用户某一次根据注册语料输入的注册声音数据切分为相等大小的三等份,得到声音数据1、声音数据2和声音数据3,因此,客户端在向服务器提交该次获取到的注册声音数据时,分别提交声音数据1、声音数据2和声音数据3。
[0106]另外,针对于不同次数获取到的合法用户的注册声音数据,可以切分同样的次数,也可以切分不同的次数,本发明实施例对此不作具体限定。具体实施时,可以根据每次获取到的注册声音数据的时长等特征决定。例如,可以将第一次获取到的注册声音数据切分3次,而将第二次获取到的注册声音数据切分4次,等等。
[0107]客户端在将预设次数个声音数据提交至服务器时,可以采用很多种方式。例如,客户端在录制合法用户的注册声音数据时,可以在录制注册声音数据的页面提供提交选项,客户端通过检测该提交选项是否被选中来确定是否将该次录制的注册声音数据提交至服务器。当客户端检测到提交选项被选中后,触发将该次录制的注册声音数据提交至服务器。
[0108]可选地,为了确保能够在安静的环境下获取合法用户的注册声音数据,以避免周围噪音或其它声音的干扰,保证获取到的合法用户的注册声音数据的质量比较高,客户端在获取合法用户根据注册语料输入的注册声音数据之前,还可以:检测周围环境音量是否满足注册声音数据的获取条件;如果周围环境音量满足注册声音数据的获取条件,则获取合法用户根据注册语料输入的注册声音数据;如果周围环境音量不满足注册声音数据的获取条件,则可以向客户端发送提示信息,以提示用户当前环境不满足注册声音数据的获取条件,需要到安静环境中获取注册声音数据。关于向客户端发送提示信息的方式,本发明实施例不作具体限定。
[0109]关于客户端检测周围环境音量是否满足注册声音数据的获取条件的方式,包括但不限于:检测周围环境音量是否达到预设阈值,如果周围环境音量未达到该预设阈值,则确定周围环境音量满足注册声音数据的获取条件。其中,周围环境音量可以是环境噪音,也可以是多个其他用户说话的声音,等等。另外,本发明实施例不对周围环境音量的预设阈值的数值大小进行限定,具体实施时,可以根据需要设定。
[0110]另外,为了保证获取到的注册声音数据确实为合法用户的声音数据,在分预设次数获取合法用户根据注册语料输入的注册声音数据之前,客户端还需要检测客户端所在的设备是否为预先认证的安全设备,且如果客户端所在的设备是否为预先认证的安全设备,则确定可以获取到合法用户的注册声音数据;否则,需要进一步验证客户端当前所在的设备是否为安全设备。
[0111]关于检测客户端所在的设备是否为预先认证的安全设备的方式,包括但不限于通过获取客户端所在的终端的标识,并将客户端所在的终端的标识与预先认证的安全设备的标识进行比对来实现。其中,获取到的客户端所在的终端的标识包括但不限于客户端所在的终端的 IMEI (Internat1nal Mobile Equipment Identificat1n Number,国际移动设备识别码)等。另外,在获取客户端的合法用户的注册声音数据时,当检测到客户端所在的终端为预先认证的安全设备时,默认操作客户端的当前用户为操作客户端的合法用户。
[0112]进一步地,在检测客户端所在的终端是否为预先认证的安全设备之前,服务器需要预先认证安全设备。关于服务器预先认证安全设备的方式,包括但不限于通过确定该客户端在某一终端成功登录的次数是否达到预设次数来实现。如果确定该客户端在某一终端成功登录的次数达到预设次数,则将该终端认证为安全设备。其中,本发明实施例不对预设次数的具体数值进行限定,具体实施时,为了保证认证的安全设备的可靠性更高,该预设次数设置的越大越好。
[0113]403:服务器分预设次数获取合法用户根据注册语料输入的注册声音数据,得到预设次数个注册声音数据。
[0114]关于服务器分预设次数获取合法用户根据注册语料输入的注册声音数据的方式,包括但不限于:分预设次数获取客户端分片提交的合法用户每次根据注册语料输入的注册语音数据;拼接客户端分片提交的合法用户每次根据注册语料输入的注册语音数据,得到合法用户每次根据注册语料输入的注册语音数据;组合合法用户每次根据注册语料输入的注册语音数据,得到预设次数个合法用户根据注册语料输入的注册声音数据。关于拼接客户端分片提交的合法用户每次根据注册语料输入的注册语音数的方式,以及组合合法用户每次根据注册语料输入的注册语音数据的方式,本发明实施例均不作具体限定。
[0115]可选地,为了确定获取到的注册声音数据是否能够作为生成注册声纹的可用声音数据,服务器在每次获取到注册声音数据后,还可以确定每次获取到的注册声音数据是否满足预设条件。其中,本发明实施例不对预设条件的具体内容进行限定,具体实施时,预设条件可以为每个注册声音数据的持续时间是否达到预设时长,等等。另外,需要说明的是,如果该预设条件为每个注册声音数据的持续时间是否达到预设时长,则在设定该预设时长时,需要结合注册语料的具体内容而定。例如,如果根据统计经验确定普通用户读完注册语料的时长为30s (秒),则该预设时长可以设置为25s。此时,当确定注册声音数据的持续时间达到25s,则确定该注册声音数据满足预设条件。
[0116]进一步地,如果获取到的预设次数个注册声音数据不满足预设条件,则可以向客户端下发重新获取合法用户根据注册语料输入的注册声音数据的提示信息,使合法用户根据该提示信息重新输入注册声音数据,直至服务器确定获取到的预设次数个注册声音数据满足预设条件为止。
[0117]可选地,在获取到预设次数个注册声音数据后,为了确定能否根据获取到的预设次数个注册声音数据生成注册声纹,服务器需要确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值;如果预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值,再执行步骤404。本发明实施例不对声纹注册相似度分值的具体数值进行限定,具体实施时,可以根据经验设定。然而,为了使得注册声纹可以作为后续声纹验证的可靠参考,该声纹注册相似度分值越高越好。
[0118]其中,服务器在确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值之前,需要先计算预设次数个注册声音数据之间的相似度分值。关于服务器计算预设次数个注册声音数据之间的相似度分值的方式,本发明实施例不作具体限定。具体实施时,可以结合声音数据的特征所包括的维度、每个维度的特征值以及每个维度所占的权重来实现。具体包括但不限于:分别确定每个声音数据的每个维度的特征值,并确定每个维度所占的权重;根据每两个声音数据的各个维度的特征值、每个维度所占的权重计算每两个注册声音数据之间的相似度分值。另外,在确定每两个注册声音数据之间的相似度分值之后,可以确定所有注册声音数据的相似度分值的平均值,并将该相似度分值的平均值作为预设次数个注册声音数据之间的相似度分值
[0119]例如,如果声音数据包括的维度为波长、频率、强度,且在计算每两个注册声音数据之间的相似度分值时波长、频率、强度所占的权重分别为0.3、0.4和0.3。其中,服务器获取到的一个注册声音数据的波长、频率和强度的特征值分别为73、75和85,另一个注册声音数据的波长、频率和强度的特征值分别为75、80和90,则这两个注册声音数据之间的相似度分值为:100-(0.3* (75-73)+0.4* (80-75)+0.3* (90-85)) = 95.9。也就是说,两个注册声音数据之间的特征值越接近,则这两个注册声音数据之间的相似度分值越高。
[0120]关于服务器确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值的方式,包括但不限于在计算得到预设次数个注册声音数据之间的相似度分值之后,将预设次数个注册声音数据之间的相似度分值与预先设定的声纹注册相似度分值进行比对来实现。
[0121]需要说明的是,在确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值时,还可以结合预设次数的不同数值而有不同的方法。
[0122]例如,如果预设次数为两次,则获服务器取到的注册声音数据为两个,此时,在确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值时,通过确定这两次获取到的注册声音数据之间的相似度分值是否达到声纹注册相似度分值来确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值。
[0123]又例如,如果预设次数超过两个,如为三个、四个,等等,则在确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值时,可以计算每两个注册声音数据之间的相似度分值,并在确定每两个注册声音数据之间的相似度分值均达到预设声纹注册相似度分值时确定预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值。
[0124]然而,当预设次数超过两次时,在确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值时,还可以根据每两个注册声音数据之间的相似度分值达到声纹注册相似度分值的数量确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值。如果每两个注册声音数据之间的相似度分值达到声纹注册相似度分值的数量超过预设阈值,则确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值。例如,如果预设次数为三个,且当每两个注册声音数据之间的相似度分值达到声纹注册相似度分值的数量超过两个时,则确定该三个注册声音数据达到声纹注册相似度分值。
[0125]404:服务器根据预设次数个注册声音数据生成注册声纹。
[0126]关于服务器根据预设次数个注册声音数据生成注册声纹的方式,包括但不限于:拼接预设次数个注册声音数据,并根据拼接后的注册声音数据生成注册声纹。其中,在根据拼接后的注册声音数据生成注册声纹时,也可以通过一定的声纹生成算法实现。
[0127]关于服务器根据声纹生成算法将拼接后的注册声音数据生成注册声纹的方式,本发明实施例不作具体限定。具体实施时,可以通过提取拼接后的注册声音数据中的典型特征来实现。具体地,由于声音的波长、频率、强度、节奏等特征能体现用户声音的特点,因此,在根据拼接后的注册声音数据生成注册声纹时,可以提取拼接后的注册声音数据中波长、频率、强度、节奏等特征,并确定拼接后的注册声音数据中波长、频率、强度、节奏等特征的特征值,将拼接后的注册声音数据中波长、频率、强度、节奏等特征的特征值等作为注册声纹。
[0128]可选地,服务器根据拼接后的注册声音数据生成注册声纹之后,为了后续可以使用注册声音数据进化注册声纹,并不断扩充注册语料的内容,还可以存储注册语料、预设次数个注册声音数据及注册声纹,并形成注册语料、预设次数个注册声音数据及注册声纹的映射关系。
[0129]其中,本发明实施例不对存储注册语料、预设次数个注册声音数据及注册声纹的方式进行限定,具体实施时,为了保证存储的注册语料、预设次数个注册声音数据及注册声纹的映射关系的安全性,可以对注册语料、预设次数个注册声音数据及注册声纹进行加密,并存储加密后的注册语料、预设次数个注册声音数据及注册声纹。
[0130]关于对注册语料、预设次数个注册声音数据及注册声纹进行加密的方式,本发明实施例不作具体限定。关于加密时使用的密码的形式,本发明实施例同样不作具体限定。具体实施时,该密码形式可以为数字密码,也可以为图案密码,等等。
[0131]如表一所示,其示出了一种存储的注册语料、预设次数个注册声音数据及注册声纹的映射关系的表格示意图。
[0132]表一
[0133]
【权利要求】
1.一种声纹生成方法,其特征在于,所述方法包括: 获取操作客户端的合法用户的合法用户信息; 获取与所述合法用户信息相关的注册语料; 向所述客户端发送所述注册语料; 分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数个注册声音数据; 根据所述预设次数个注册声音数据生成注册声纹。
2.根据权利要求1所述的方法,其特征在于,所述得到预设次数个注册声音数据之后,还包括: 确定所述预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值; 如果所述预设次数个注册声音数据之间的相似度分值达到所述声纹注册相似度分值,则执行根据所述预设次数个注册声音数据生成注册声纹的步骤。
3.根据权利要求1所述的方法,其特征在于,所述根据所述预设次数个注册声音数据生成注册声纹,包括: 拼接所述预设次数个注册声音数据; 根据拼接后的注册声音数据生成所述注册声纹。
4.根据权利要求1所述的方法,其特征在于,所述根据所述预设次数个注册声音数据生成注册声纹之后,还包括: 存储所述注册语料、所述预设次数个注册声音数据及所述注册声纹,并形成所述注册语料、所述预设次数个注册声音数据及所述注册声纹的映射关系。
5.根据权利要求4所述的方法,其特征在于,所述存储所述注册语料、所述预设次数个注册声音数据及所述注册声纹,包括: 对所述注册语料、所述预设次数个注册声音数据及所述注册声纹进行加密,并存储加密后的注册语料、预设次数个注册声音数据及注册声纹。
6.根据权利要求1所述的方法,其特征在于,所述分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,包括: 分预设次数获取所述客户端分片提交的所述合法用户每次根据所述注册语料输入的注册语音数据; 拼接所述客户端分片提交的所述合法用户每次根据所述注册语料输入的注册语音数据,得到所述合法用户每次根据所述注册语料输入的注册语音数据; 组合所述合法用户每次根据所述注册语料输入的注册语音数据,得到预设次数个所述合法用户根据所述注册语料输入的注册声音数据。
7.根据权利要求1至6中任一权利要求所述的方法,其特征在于,所述根据所述预设次数个注册声音数据生成注册声纹之后,还包括: 确定是否需要进化所述注册声纹; 如果确定需要进化所述注册声纹,则获取预设数值个进化声音数据,所述预设数值个进化声音数据为根据每次使用所述注册声纹进行声纹验证,且每次声纹验证通过后存储的验证声音数据筛选的至少一个验证声音数据; 根据所述预设次数个注册声音数据和所述预设数值个进化声音数据进化所述注册声纹,得到进化声纹,并使用所述进化声纹进行后续的声纹验证。
8.根据权利要求7所述的方法,其特征在于,所述确定是否需要进化所述注册声纹,包括: 确定是否接收到所述客户端发送的声纹进化请求; 如果接收到所述客户端发送的声纹进化请求,则确定需要进化所述注册声纹。
9.根据权利要求7所述的方法,其特征在于,所述确定是否需要进化所述注册声纹,包括: 确定是否达到自动进化所述注册声纹的预设条件; 如果确定达到自动进化所述注册声纹的预设条件,则确定需要进化所述注册声纹。
10.根据权利要求7所述的方法,其特征在于,所述获取预设数值个进化声音数据,包括: 获取每次声纹验证通过后存储的验证声音数据以及每个验证声音数据的属性信息;根据每个验证声音数据的属性信息筛选预设数值个满足声纹进化条件的验证声音数据,将所述预设数值个满足声纹进化条件的验证声音数据作为预设数值个进化声音数据。
11.一种声纹生成方法,其特征在于,所述方法包括: 接收服务器发送的与操作客户端的合法用户的合法用户信息相关的注册语料; 分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数个注册声音数据; 将所述预设次数个注册声音数据提交至所述服务器,使所述服务器根据所述预设次数个注册声音数据生成注册声纹。
12.根据权利要求11所述的方法,其特征在于,所述将所述预设次数个注册声音数据提交至所述服务器,包括: 分预设次数对所述合法用户每次根据所述注册语料输入的注册语音数据进行分片; 将所述合法用户每次根据所述注册语料输入的注册语音数据分片提交至所述服务器,使所述服务器分片获取所述合法用户每次根据所述注册语料输入的注册语音数据,并组合所述合法用户每次根据所述注册语料输入的注册语音数据,得到预设次数个所述合法用户根据所述注册语料输入的注册声音数据。
13.根据权利要求11所述的方法,其特征在于,所述方法还包括: 确定是否需要进化所述注册声纹; 如果确定需要进化所述注册声纹,则向所述服务器发送进化所述注册声纹的声纹进化请求,使所述服务器根据所述声纹进化请求进化所述注册声纹。
14.一种声纹生成服务器,其特征在于,所述服务器包括: 第一获取模块,用于获取操作客户端的合法用户的合法用户信息; 第二获取模块,用于获取与所述合法用户信息相关的注册语料; 发送模块,用于向所述客户端发送所述注册语料; 第三获取模块,用于分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数个注册声音数据; 生成模块,用于根据所述预设次数个注册声音数据生成注册声纹。
15.根据权利要求14所述的服务器,其特征在于,所述服务器,还包括: 第一确定模块,用于确定所述预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值; 所述生成模块,用于当所述预设次数个注册声音数据之间的相似度分值达到所述声纹注册相似度分值时,执行根据所述预设次数个注册声音数据生成注册声纹的步骤。
16.根据权利要求14所述的服务器,其特征在于,所述生成模块,包括: 拼接单元,用于拼接所述预设次数个注册声音数据; 生成单元,用于根据拼接后的注册声音数据生成所述注册声纹。
17.根据权利要求14所述的服务器,其特征在于,所述服务器,还包括: 存储模块,用于存储所述注册语料、所述预设次数个注册声音数据及所述注册声纹; 形成模块,用于形成所述注册语料、所述预设次数个注册声音数据及所述注册声纹的映射关系。
18.根据权利要求17所述的服务器,其特征在于,所述存储模块,包括: 加密单元,用于对所述注册语料、所述预设次数个注册声音数据及所述注册声纹进行加密; 存储单元,用于存储加密后的注册语料、预设次数个注册声音数据及注册声纹。
19.根据权利要求14所述的服务器,其特征在于,所述第三获取模块,包括: 第一获取单元,用于分预设次数获取所述客户端分片提交的所述合法用户每次根据所述注册语料输入的注册语音数据; 拼接单元,用于拼接所述客户端分片提交的所述合法用户每次根据所述注册语料输入的注册语音数据,得到所述合法用户每次根据所述注册语料输入的注册语音数据; 组合单元,用于组合所述合法用户每次根据所述注册语料输入的注册语音数据,得到预设次数个所述合法用户根据所述注册语料输入的注册声音数据。
20.根据权利要求14至19中任一权利要求所述的服务器,其特征在于,所述服务器,还包括: 第二确定模块,用于确定是否需要进化所述注册声纹; 第四获取模块,用于当确定需要进化所述注册声纹时,获取预设数值个进化声音数据,所述预设数值个进化声音数据为根据每次使用所述注册声纹进行声纹验证,且每次声纹验证通过后存储的验证声音数据筛选的至少一个验证声音数据; 进化模块,用于根据所述预设次数个注册声音数据和所述预设数值个进化声音数据进化所述注册声纹,得到进化声纹,并使用所述进化声纹进行后续的声纹验证。
21.根据权利要求20所述的服务器,其特征在于,所述第二确定模块,包括: 第一确定单元,用于确定是否接收到所述客户端发送的声纹进化请求; 第二确定单元,用于当接收到所述客户端发送的声纹进化请求时,确定需要进化所述注册声纹。
22.根据权利要求20所述的服务器,其特征在于,所述第二确定模块,包括: 第三确定单元,用于确定是否达到自动进化所述注册声纹的预设条件; 第四确定单元,用于当确定达到自动进化所述注册声纹的预设条件时,确定需要进化所述注册声纹。
23.根据权利要求20所述的服务器,其特征在于,所述第四获取模块,包括: 第二获取单元,用于获取每次声纹验证通过后存储的验证声音数据以及每个验证声音数据的属性信息; 筛选单元,用于根据每个验证声音数据的属性信息筛选预设数值个满足声纹进化条件的验证声音数据,将所述预设数值个满足声纹进化条件的验证声音数据作为预设数值个进化声音数据。
24.一种客户端,其特征在于,所述客户端包括: 接收模块,用于接收服务器发送的与操作客户端的合法用户的合法用户信息相关的注册语料; 获取模块,用于分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数个注册声音数据; 提交模块,用于将所述预设次数个注册声音数据提交至所述服务器,使所述服务器根据所述预设次数个注册声音数据生成注册声纹。
25.根据权利要求24所述的客户端,其特征在于,所述提交模块,包括: 分片单元,用于分预设次数对所述合法用户每次根据所述注册语料输入的注册语音数据进行分片; 提交单元,用于将所述合法用户每次根据所述注册语料输入的注册语音数据分片提交至所述服务器,使所述服务器分片获取所述合法用户每次根据所述注册语料输入的注册语音数据,并组合所述合法用户每次根据所述注册语料输入的注册语音数据,得到预设次数个所述合法用户根据所述注册语料输入的注册声音数据。
26.根据权利要求24所述的客户端,其特征在于,所述客户端还包括: 确定模块,用于确定是否需要进化所述注册声纹; 发送模块,用于当确定需要进化所述注册声纹时,向所述服务器发送进化所述注册声纹的声纹进化请求,使所述服务器根据所述声纹进化请求进化所述注册声纹。
27.一种声纹生成系统,其特征在于,所述系统包括服务器和客户端; 其中,所述服务器如上述权利要求14至23中任一权利要求所述的服务器; 所述客户端如上述权利要求24至26中任一权利要求所述的客户端。
【文档编号】H04L9/32GK104184587SQ201410389788
【公开日】2014年12月3日 申请日期:2014年8月8日 优先权日:2014年8月8日
【发明者】龙强, 张翔 申请人:腾讯科技(深圳)有限公司