接待段数量的统计方法、装置、设备及介质与流程

文档序号：35423904发布日期：2023-09-13 13:10阅读：32来源：国知局

本申请涉及深度学习，尤其涉及一种接待段数量的统计方法、装置、设备及介质。

背景技术：

1、为了提高员工处理用户业务事项的效率及提高用户体验，各领域普遍将员工接待用户的数量这一指标作为员工的重要考核指标，例如，金融领域中，银行通过统计员工接待用户数量这一项指标作为员工的绩效考核。传统方式统计出来的接待段和真实值差异比较大，因为会话环境中会出现很多的影响因素导致统计结果不准确，比如：销售录音可能会将其他销售的销售录音也录进来，导致数据中有冗余；销售人员之间的谈话被作为接待数据进行统计，会干扰统计结果。

2、针对上述“会话环境中会出现很多的影响因素导致统计结果不准确”的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本申请提供了一种接待段数量的统计方法、装置、设备及介质，以解决上述“会话环境中会出现很多的影响因素导致统计结果不准确”的技术问题。

2、根据本申请实施例的一个方面，本申请提供了一种接待段数量的统计方法，包括：获取在接待时间段内接收到的至少一个语音数据，并将各个语音数据组合得到语音数据集；识别语音数据集中的会话文本，以及对语音数据集进行分割，得到分割结果；根据会话文本以及分割结果确定语音数据集中的目标语音；通过目标语音确定接待时间段内的接待段数量。

3、可选地，识别语音数据集中的会话文本包括：对语音数据集中的各个语音数据进行文本识别，获得初始文本；获取与初始文本中的字词对应的会话时刻，以确定各个字词与会话时刻的对应关系；保存初始文本与对应关系，得到会话文本。

4、可选地，对语音数据集进行分割，得到分割结果包括：对语音数据集中的各个语音数据进行切分，得到多个预设长度的语音片段；提取各个语音片段中的声纹向量；组合各个声纹向量得到声纹向量矩阵；根据声纹向量矩阵获得相似度矩阵；对相似度矩阵中的各个语音片段进行聚类，并将聚类结果作为分割结果。

5、可选地，根据会话文本以及分割结果确定语音数据集中的目标语音包括：根据分割结果确定语音数据集中的无效语音，其中，无效语音为不包括第一对象语音的语音；根据会话文本确定语音数据集中的重复语音，其中，重复语音为被不同语音采集设备采集到的相同语音；滤除语音数据集中的无效语音以及重复语音，得到目标语音。

6、可选地，根据会话文本确定语音数据集中的重复语音包括：按照对应关系将会话文本中的初始文本与会话时刻对齐；在同一时间段内存在多个文本片段的情况下，对多个文本片段进行对比，获得文本相似度；将与文本相似度大于相似度阈值的文本片段对应的语音确定为重复语音。

7、可选地，根据分割结果确定语音数据集中的无效语音包括：获取第二对象的第一声纹特征；确定分割结果中与第一声纹特征匹配的语音片段；将语音片段确定为无效语音。

8、可选地，通过目标语音确定接待时间段内的接待段数量包括：提取目标语音中的第二声纹特征；根据第二声纹特征对目标语音进行聚类，得到不同的语音簇；根据目标语音的会话文本合并处于同一会话中的语音簇，得到目标簇；统计目标簇的数量，并将目标簇的数量确定为接待时间段内的接待段数量。

9、根据本申请实施例的另一个方面，本申请还提供了一种接待段数量的统计装置，包括：获取模块，用于获取在接待时间段内接收到的至少一个语音数据，并将各个语音数据组合得到语音数据集；识别模块，用于识别语音数据集中的会话文本，以及对语音数据集进行分割，得到分割结果；第一确定模块，用于根据会话文本以及分割结果确定语音数据集中的目标语音；第二确定模块，用于通过目标语音确定接待时间段内的接待段数量。

10、根据本申请实施例的另一个方面，本申请还提供了一种电子设备，包括存储器、处理器、通信接口及通信总线，存储器中存储有可在处理器上运行的计算机程序，存储器、处理器通过通信总线和通信接口进行通信，处理器执行计算机程序时实现上述任一方法的步骤。

11、根据本申请实施例的另一个方面，本申请还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质，程序代码使处理器执行上述任一方法。

12、本申请技术方案可以应用于深度学习技术进行语音识别与处理的设计。

13、本申请实施例提供的上述技术方案与相关技术相比具有如下优点：

14、本申请提供一种接待段数量的统计方法，包括：获取在接待时间段内接收到的至少一个语音数据，并将各个语音数据组合得到语音数据集；识别语音数据集中的会话文本，以及对语音数据集进行分割，得到分割结果；根据会话文本以及分割结果确定语音数据集中的目标语音；通过目标语音确定接待时间段内的接待段数量。本申请通过提取录音数据中的有效录音方法，解决了存在干扰语音导致统计结果不准确的问题。

技术特征：

1.一种接待段数量的统计方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述识别所述语音数据集中的会话文本包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述语音数据集进行分割，得到分割结果包括：

4.根据权利要求2所述的方法，其特征在于，所述根据所述会话文本以及所述分割结果确定所述语音数据集中的目标语音包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述会话文本确定所述语音数据集中的重复语音包括：

6.根据权利要求4所述的方法，其特征在于，所述根据所述分割结果确定所述语音数据集中的无效语音包括：

7.根据权利要求5所述的方法，其特征在于，所述通过所述目标语音确定所述接待时间段内的接待段数量包括：

8.一种接待段数量的统计装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器、通信接口及通信总线，所述存储器中存储有可在所述处理器上运行的计算机程序，所述存储器、所述处理器通过所述通信总线和所述通信接口进行通信，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。

10.一种具有处理器可执行的非易失的程序代码的计算机可读介质，其特征在于，所述程序代码使所述处理器执行所述权利要求1至7任一所述方法。

技术总结
本申请涉及一种接待段数量的统计方法、装置、设备及介质，该方法包括：获取在接待时间段内接收到的至少一个语音数据，并将各个语音数据组合得到语音数据集；识别语音数据集中的会话文本，以及对语音数据集进行分割，得到分割结果；根据会话文本以及分割结果确定语音数据集中的目标语音；通过目标语音确定接待时间段内的接待段数量。本申请通过提取录音数据中的有效录音方法，解决了存在干扰语音导致统计结果不准确的问题。

技术研发人员：赵亮,姜平,雍坤,何敏
受保护的技术使用者：北京明略昭辉科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵亮姜平雍坤何敏
技术所有人：北京明略昭辉科技有限公司
我是此专利的发明人

上一篇：基于双滤波器的定位方案切换方法、装置、设备及介质与流程
上一篇：金属门窗的除尘装置的制作方法