语音用户识别方法、装置、电子设备及存储介质与流程

文档序号：33128428发布日期：2023-02-01 06:35阅读：来源：国知局

技术特征：
1.一种语音用户识别方法，其特征在于，包括：通过提取用户语音的声纹特征确定与所述用户语音对应的第一声纹标识；将所述第一声纹标识与预先设置的声纹标识对照表中的声纹标识进行对比，确定与所述第一声纹标识对应的第一主声纹标识；所述声纹标识对照表中包含各个用户的主声纹标识和副声纹标识，其中，每一用户的主声纹标识为在预设时间段内被识别到的频率大于设定频率阈值的声纹标识，该用户的副声纹标识是与该用户的主声纹标识的声纹相似度大于设定相似度阈值的声纹标识。2.根据权利要求1所述的方法，其特征在于，将所述第一声纹标识与预先设置的声纹标识对照表中的声纹标识进行对比，确定与所述第一声纹标识对应的第一主声纹标识，包括：将所述第一声纹标识与预先设置的声纹标识对照表中的副声纹标识进行对比；若所述声纹标识对照表中存在与所述第一声纹标识相同的副声纹标识，则从所述声纹标识对照表中查询与所述第一声纹标识相同的副声纹标识对应的主声纹标识，作为与所述第一声纹标识对应的第一主声纹标识；若所述声纹标识对照表中不存在与所述第一声纹标识相同的副声纹标识，则将所述第一声纹标识作为与所述第一声纹标识对应的第一主声纹标识。3.根据权利要求1所述的方法，其特征在于，将所述第一声纹标识与预先设置的声纹标识对照表中的声纹标识进行对比，确定与所述第一声纹标识对应的第一主声纹标识，包括：将所述第一声纹标识与预先设置的声纹标识对照表中的主声纹标识进行对比；若所述声纹标识对照表中存在与所述第一声纹标识相同的主声纹标识，则将与所述第一声纹标识相同的主声纹标识作为与所述第一声纹标识对应的第一主声纹标识；若所述声纹标识对照表中不存在与所述第一声纹标识相同的主声纹标识，则从所述声纹标识对照表中查询与所述第一声纹标识相同的副声纹标识对应的主声纹标识，作为与所述第一声纹标识对应的第一主声纹标识。4.根据权利要求1所述的方法，其特征在于，所述声纹标识对照表通过如下处理得到：获取预设时间段内识别到的声纹标识；根据预设时间段内声纹标识被识别出的频率，确定所有声纹标识中的主声纹标识和副声纹标识；根据主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，从所有副声纹标识中，确定各个主声纹标识对应的副声纹标识，得到所述声纹标识对照表。5.根据权利要求4所述的方法，其特征在于，还包括：将主声纹标识对应的副声纹标识的语音交互信息均合并存储到所述主声纹标识对应的语音交互信息中；将主声纹标识对应的副声纹标识对应的偏好数据合并存储到所述主声纹标识对应的偏好数据中。6.根据权利要求4所述的方法，其特征在于，根据预设时间段内声纹标识被识别出的频率，确定所有声纹标识中的主声纹标识和副声纹标识，包括：将所有声纹标识中的、在预设时间段内被识别出的天数大于预设天数，且平均每天被识别出的次数大于预设次数的声纹标识，作为主声纹标识；将所有声纹标识中的主声纹标识以外的声纹标识作为副声纹标识。
7.根据权利要求4所述的方法，其特征在于，根据主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，从所有副声纹标识中，确定各个主声纹标识对应的副声纹标识，包括：基于主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，计算主声纹标识和副声纹标识之间的声纹相似度；根据主声纹标识与各个副声纹标识之间的声纹相似度和设定相似度阈值，从所有副声纹标识中，选取所述主声纹标识对应的副声纹标识。8.根据权利要求7所述的方法，其特征在于，基于主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，计算主声纹标识和副声纹标识之间的声纹相似度，包括：利用主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，计算所述主声纹标识和所述副声纹标识之间的单属性相似度；其中，所述语音交互信息包括：语音文本、语音说话人年龄段、语音说话人性别以及语音生成时间；所述单属性相似度包括：语义相似度、年龄相似度、性别相似度和活跃时段相似度中的至少一种；根据所有单属性相似度以及预先设置的各单属性相似度对应的权重，计算所述主声纹标识和所述副声纹标识之间的声纹相似度。9.根据权利要求8所述的方法，其特征在于，若所述单属性相似度包括语义相似度，利用主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，计算所述主声纹标识和所述副声纹标识之间的语义相似度，包括：提取主声纹标识对应的语音交互信息的语音文本集合，以及提取副声纹标识对应的语音交互信息的语音文本集合；计算主声纹标识对应的语音文本集合与副声纹标识对应的语音文本集合之间的重合度，作为所述主声纹标识和所述副声纹标识之间的语义相似度。10.根据权利要求8所述的方法，其特征在于，若所述单属性相似度包括年龄相似度，利用主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，计算所述主声纹标识和所述副声纹标识之间的年龄相似度，包括：根据主声纹标识对应的语音交互信息的语音说话人年龄段和副声纹标识对应的语音交互信息的语音说话人年龄段，确定所述主声纹标识对应的年龄段次数分布和副声纹标识对应的年龄段次数分布；计算所述主声纹标识对应的年龄段次数分布和副声纹标识对应的年龄段次数分布之间的相似度，作为所述主声纹标识和所述副声纹标识之间的年龄相似度；若所述单属性相似度包括性别相似度，利用主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，计算所述主声纹标识和所述副声纹标识之间的性别相似度，包括：根据主声纹标识对应的语音交互信息的语音说话人性别和副声纹标识对应的语音交互信息的语音说话人性别，确定所述主声纹标识对应的性别次数分布和副声纹标识对应的性别次数分布；计算所述主声纹标识对应的性别次数分布和副声纹标识对应的性别次数分布之间的相似度，作为所述主声纹标识和所述副声纹标识之间的性别相似度。11.根据权利要求8所述的方法，其特征在于，若所述单属性相似度包括活跃时段相似
度，利用主声纹标识对应的语音交互信息和副声纹标识对应的语音交互信息，计算所述主声纹标识和所述副声纹标识之间的活跃时段相似度，包括：根据主声纹标识对应的语音交互信息的语音生成时间和副声纹标识对应的语音交互信息的语音生成时间，确定所述主声纹标识与所述副声纹标识之间的共同活跃时段；所述共同活跃时段为所述主声纹标识和所述副声纹标识均被识别出的时段；根据主声纹标识对应的语音交互信息的语音生成时间、副声纹标识对应的语音交互信息的语音生成时间以及所述共同活跃时段，确定所述主声纹标识的共同活跃时段次数分布、所述副声纹标识的共同活跃时段次数分布以及所述共同活跃时段的数量对应的权重；计算所述主声纹标识的共同活跃时段次数分布和所述副声纹标识的共同活跃时段次数分布之间的相似度，将所述相似度与所述权重之间的乘积作为所述主声纹标识和所述副声纹标识之间的活跃时段相似度。12.根据权利要求7所述的方法，其特征在于，根据主声纹标识与各个副声纹标识之间的声纹相似度和设定相似度阈值，从所有副声纹标识中，选取所述主声纹标识对应的副声纹标识，包括：从所有副声纹标识中，选取与主声纹标识之间的声纹相似度大于设定相似度阈值的副声纹标识，作为所述主声纹标识对应的候选副声纹标识；根据所述候选副声纹标识与所述主声纹标识之间的单属性相似度，从所述候选副声纹标识中选取所述主声纹标识对应的副声纹标识。13.根据权利要求1所述的方法，其特征在于，还包括：基于预先设置的声纹标识与偏好数据对应表，获取所述第一主声纹标识对应的偏好数据，作为所述第一主声纹标识对应的用户的偏好数据。14.根据权利要求13所述的方法，其特征在于，还包括：对预设采集时长内所述第一声纹标识的用户语音对应的语音交互信息，进行用户偏好分析，确定所述第一声纹标识对应的当前偏好数据；利用所述第一声纹标识对应的当前偏好数据与所述第一主声纹标识对应的偏好数据融合后得到的偏好数据，对所述声纹标识与偏好数据对应表进行更新。15.根据权利要求1所述的方法，其特征在于，还包括：将所述用户语音对应的语音交互信息合并到所述第一主声纹标识对应的语音交互信息中。16.一种语音用户识别装置，其特征在于，包括：声纹标识确定模块，用于通过提取用户语音的声纹特征确定与所述用户语音对应的第一声纹标识；声纹标识对比模块，用于将所述第一声纹标识与预先设置的声纹标识对照表中的声纹标识进行对比，确定与所述第一声纹标识对应的第一主声纹标识；所述声纹标识对照表中包含各个用户的主声纹标识和副声纹标识，其中，每一用户的主声纹标识为在预设时间段内被识别到的频率大于设定频率阈值的声纹标识，该用户的副声纹标识是与该用户的主声纹标识的声纹相似度大于设定相似度阈值的声纹标识。17.一种电子设备，其特征在于，包括：存储器和处理器；其中，所述存储器与所述处理器连接，用于存储程序；
所述处理器，用于通过运行所述存储器中的程序，实现如权利要求1至15中任一项所述的语音用户识别方法。18.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现如权利要求1至15中任一项所述的语音用户识别方法。

技术总结
本申请提出一种语音用户识别方法、装置、电子设备及存储介质，方法包括：通过提取用户语音的声纹特征确定与用户语音对应的第一声纹标识；将第一声纹标识与预先设置的声纹标识对照表中的声纹标识进行对比，确定与第一声纹标识对应的第一主声纹标识；声纹标识对照表中包含各个用户的主声纹标识和副声纹标识。采用本申请的技术方案，利用声纹标识对照表可以将同一用户的所有副声纹标识与主声纹标识对应关联，当用户语音对应的声纹发生偏移时，可以通过声纹偏移后的副声纹标识，从声纹标识对照表准确查询到该用户的主声纹标识，提高了用户信息确定的准确度。信息确定的准确度。信息确定的准确度。

技术研发人员：张志勇邵剑业蒋兵兵龙明康
受保护的技术使用者：科大讯飞股份有限公司
技术研发日：2022.09.27
技术公布日：2023/1/31

完整全部详细技术资料下载

当前第2页1 2