语音数据的处理方法、装置、存储介质以及电子设备与流程

文档序号：31459130发布日期：2022-09-07 15:30阅读：111来源：国知局

1.本技术涉及音频信号处理领域，具体而言，涉及一种语音数据的处理方法、装置、存储介质以及电子设备。

背景技术：

2.在电话叫车等场景，需要对乘客上车地点进行录音，如果乘客在系统设置的录音时间内(比如9秒)提前挂机(比如6秒就挂机)，录音文件会有挂机嘟嘟音(例如，表现为0.35s高-0.35s低交替的嘟嘟音)，在听取此类录音时，会对听觉造成听觉冲击，体验不佳，无效音降低了使用体验，也占用了存储空间和传输带宽。
3.针对上述的问题，目前尚未提出有效的解决方案。

技术实现要素：

4.本技术实施例提供了一种语音数据的处理方法、装置、存储介质以及电子设备，以至少解决由于相关技术中对录音进行保存时存在无效音频，额外占用存储空间和传输宽带，影响用户听觉体验的技术问题。
5.根据本技术实施例的一个方面，提供了一种语音数据的处理方法，包括：确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据。
6.可选地，对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据，包括：获取第一语音段数据中各个分段数据对应的各个波形；确定各个波形中波形类型为正弦波的分段数据为待检测的第三语音段数据；检测第三语音段数据对应的正弦波波形的波峰以及波谷；确定波峰出现的第一次数以及波谷出现的第二次数；确定第一次数与第二次数的第一比值，在第一比值在第一预设范围之内的情况下，确定第三语音段数据为满足预设条件的第二语音段数据。
7.可选地，对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据，包括：获取第一语音段数据中各个分段数据对应的各个波形；确定各个波形中波形类型为正弦波的分段数据为待检测的第三语音段数据；检测第三语音段数据对应的正弦波波形的波峰以及波谷；获取正弦波波形的波峰值与波谷值，确定波峰值与波谷值的第二比值，在第二比值在第二预设范围之内的情况下，确定第三语音段数据为满足预设条件的第二语音段数据。
8.可选地，根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据，包括：确定第二语音段数据所占用的目标字节数n；根据目标字节数n对原始语音数据进行截取确定有效音频段数据。
9.可选地，根据目标字节数对原始语音数据进行截取确定有效音频段数据，包括：获取原始语音数据所占用的总字节数m；截取原始语音数据除语音文件头之外的前m-n个字节，得到目标段语音数据；计算目标段语音数据所占用的字节数，并对语音文件头信息进行重写，得到有效音频段数据。
10.可选地，在得到有效音频段数据之后，方法还包括：确定目标存储位置指示的目标存储路径，其中，目标存储位置与原始语音数据的存储位置不同；根据目标存储路径将有效音频段数据存储至目标存储位置。
11.可选地，待参与检测的字节大小通过如下方式确定：获取样本语音数据，其中，样本语音数据的采样频率与原始语音数据的采样频率相同，且样本语音数据中的杂音数据类型与原始语音数据中的杂音数据类型相同；确定杂音数据中各分段杂音数据的时长以及所占用的字节数；根据各分段杂音数据的时长以及所占用的字节数确定待参与检测的字节大小。
12.根据本技术实施例的另一方面，还提供了一种语音数据的处理装置，包括：第一检测模块，用于确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；第二检测模块，用于对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；确定模块，用于根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据。
13.根据本技术实施例的另一方面，还提供了一种非易失性存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行任意一种语音数据的处理方法。
14.根据本技术实施例的另一方面，还提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为执行指令，以实现任意一种语音数据的处理方法。
15.在本技术实施例中，采用对原始语音数据进行正弦检测截取有效音频的方式，通过确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据，达到了去除无效音频数据的目的，从而实现了避免无效音频数据对存储空间以及传输宽带的占用，提升了用户听觉体验的技术效果，进而解决了由于相关技术中对录音进行保存时存在无效音频，额外占用存储空间和传输宽带，影响用户听觉体验的技术问题。
附图说明
16.此处所说明的附图用来提供对本技术的进一步理解，构成本技术的一部分，本技术的示意性实施例及其说明用于解释本技术，并不构成对本技术的不当限定。在附图中：
17.图1是根据本技术实施例的一种可选的语音数据的处理方法的流程示意图；
18.图2是本技术的语音数据的处理方法应用在在处理电话挂机无效音时的流程示意
图；
19.图3是本技术一示例性实施例中的挂机音波形示意图；
20.图4是本技术一示例性实施例中的挂机音波形放大示意图；
21.图5是本技术一示例性实施例中的静音波形示意图；
22.图6是本技术一示例性实例中的带有嘟嘟音的声波示意图；
23.图7是本技术一示例性实施例中的经过算法过滤后的声波示意图；
24.图8是根据本技术实施例的一种可选的语音数据的处理装置的结构示意图；
25.图9示出了可以用来实施本技术的实施例的示例电子设备900的示意性框图。
具体实施方式
26.为了使本技术领域的人员更好地理解本技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分的实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本技术保护的范围。
27.需要说明的是，本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
28.为了便于本领域技术人员更好的理解本技术相关实施例，现对本技术相关实施例可能涉及的技术术语或者部分名词解释如下：
29.正弦曲线可表示为定义为函数在直角坐标系上的图象，其中sin为正弦符号，x是直角坐标系x轴上的数值，y是在同一直角坐标系上函数对应的y值，k、ω和是常数(k、ω、且ω≠0)，其中，a——振幅，当物体作轨迹符合正弦曲线的直线往复运动时，其值为行程的1/2。——相位，反映变量y所处的状态。——初相，x＝0时的相位；反映在坐标系上则为图像的左右移动。k——偏距，反映在坐标系上则为图像的上移或下移。ω——角速度，控制正弦周期(单位弧度内震动的次数)。
30.根据本技术实施例，提供了一种语音数据的处理方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。
31.图1是根据本技术实施例的语音数据的处理方法，如图1所示，该方法包括如下步骤：
32.步骤s102，确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙
音检测，得到第一语音段数据；
33.步骤s104，对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；
34.步骤s106，根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据。
35.在上述语音数据的处理方法中，通过确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据，达到了去除无效音频数据的目的，从而实现了避免无效音频数据对存储空间以及传输宽带的占用，提升了用户听觉体验的技术效果，进而解决了由于相关技术中对录音进行保存时存在无效音频，额外占用存储空间和传输宽带，影响用户听觉体验的技术问题。
36.本技术一些实施例中，对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据，可通过如下方式实现：获取第一语音段数据中各个分段数据对应的各个波形；确定各个波形中波形类型为正弦波的分段数据为待检测的第三语音段数据；检测第三语音段数据对应的正弦波波形的波峰以及波谷；确定波峰出现的第一次数以及波谷出现的第二次数；确定第一次数与第二次数的第一比值，在第一比值在第一预设范围之内的情况下，确定第三语音段数据为满足预设条件的第二语音段数据。
37.在本技术另一些可选的实施例中，对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据，也可通过如下方式实现：获取第一语音段数据中各个分段数据对应的各个波形；确定各个波形中波形类型为正弦波的分段数据为待检测的第三语音段数据；检测第三语音段数据对应的正弦波波形的波峰以及波谷；获取正弦波波形的波峰值与波谷值，确定波峰值与波谷值的第二比值，在第二比值在第二预设范围之内的情况下，确定第三语音段数据为满足预设条件的第二语音段数据。
38.作为一种可选的实施方式，根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据，包括：确定第二语音段数据所占用的目标字节数n；根据目标字节数n对原始语音数据进行截取确定有效音频段数据。
39.可选地，根据目标字节数对原始语音数据进行截取确定有效音频段数据，包括：获取原始语音数据所占用的总字节数m；截取原始语音数据除语音文件头之外的前m-n个字节，得到目标段语音数据；计算目标段语音数据所占用的字节数，并对语音文件头信息进行重写，得到有效音频段数据。
40.本技术一些实施例中，在得到有效音频段数据之后，还可以确定目标存储位置指示的目标存储路径，其中，目标存储位置与原始语音数据的存储位置不同；根据目标存储路径将有效音频段数据存储至目标存储位置。
41.需要说明的是，待参与检测的字节大小可通过如下方式确定：获取样本语音数据，其中，样本语音数据的采样频率与原始语音数据的采样频率相同，且样本语音数据中的杂音数据类型与原始语音数据中的杂音数据类型相同；确定杂音数据中各分段杂音数据的时
长以及所占用的字节数；根据各分段杂音数据的时长以及所占用的字节数确定待参与检测的字节大小。
42.图2是本技术的语音数据的处理方法应用在在处理电话挂机无效音时的流程示意图，如图2所示，该方法包括如下步骤：s1读取原始录音文件，s2截取音频文件末尾数据，s3挂机嘟嘟音特征正弦波检测，s4挂机嘟嘟音数据统计，s5有效音频截取，s6重写有效音频文件。
43.以下对以上各个步骤进行进一步解释说明：
44.读取语音文件：根据文件格式，先读取文件头中存储的真实音频数据长度，再根据长度读取相应的音频数据；
45.截取音频文件末尾数据：标准挂机嘟嘟音三长三短0.35s高-0.35s低-0.35s高-0.35s低-0.35s高-0.35s低，如图3所示，为挂机音波形示意图，对于采样率是8khz的wav音频文件来说，0.35秒占用字节为0.35*8000＝2600字节，三段嘟嘟音为2800*6＝16800字节，有的会提前挂机，可能不是三段完整的挂机音。为检测方便，从语音波形从后往前取16800字节进行忙音检测；
46.正弦波检测：挂机音是标准的正弦波，如图4所示是挂机音波形放大示意图，可按照正弦信号的特点进行数值对比，符合该特点，且最大值、最小值在-5k～+5k范围，则认为是挂机音。挂机音的正弦信号值符合公式i＝
±
5000*sin(ωt+θi),其中(ωt+θi)称为是正弦信号的相位，t＝0时的相位θi称为初相位，简称初相，单位是弧度(rad)或度(
°
)。通常规定初相在|θi|≤π范围内取值；为了简化计算，便于理解，可使用简便算法，即统计波形数值在波峰、波谷出现的次数(假设为h，l)，经过统计，两者数值基本接近，h/l的范围在0.95到1.05之间，在此范围可确定为挂机音。
47.挂机嘟嘟音数据统计：对符合挂机嘟嘟音正弦波的数值进行倒序统计，直到发现异常波动数据(数值持续为0表示为挂机音嘟嘟声中间的静音状态，图5是静音波形示意图，如图5中的箭头所示，此数据在统计范围内，也可同时统计出空白音占用字节)或达到16800字节，此时假设符合挂机音规则的字节数为n；
48.有效音频截取：结合第四步中的统计数值n，对原始语音文件(假设长度为m字节)进行截取，截取原始语音文件除语音文件头之外的前m-n个字节，重新计算语音长度，并对语音文件头信息进行重写(主要是重写长度值m-n，其他信息可复制)。音频文件的文件头，以freeswitch为例，wav格式录音文件前缀一般为152字节，有一些设备为58字节；重写有效音频文件：将文件头和有效音频截取获得的数据，保存为新文件。
49.图6为带有嘟嘟音的声波示意图，如图6所示，可以看到在声音的后半部分(4.4秒以后)有明显的嘟嘟音三次(0.3秒嘟-0.3秒无音交替播放)。图7是经过算法过滤后的声波示意图，如图7所示，在4.4秒后已经处理掉了嘟嘟音。
50.图8是根据本技术实施例的一种语音数据的处理装置，如图8所示，该装置包括：
51.第一检测模块80，用于确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；
52.第二检测模块82，用于对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；
53.确定模块86，用于根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据。
54.该语音数据的处理装置中，第一检测模块80，用于确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；第二检测模块82，用于对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；确定模块86，用于根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据，达到了去除无效音频数据的目的，从而实现了避免无效音频数据对存储空间以及传输宽带的占用，提升了用户听觉体验的技术效果，进而解决了由于相关技术中对录音进行保存时存在无效音频，额外占用存储空间和传输宽带，影响用户听觉体验的技术问题。
55.根据本技术实施例的另一方面，还提供了一种非易失性存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行任意一种语音数据的处理方法。
56.具体地，上述存储介质用于存储以下功能的程序指令，实现以下功能：
57.确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据。
58.可选地，在本实施例中，上述存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。上述存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
59.在本技术一示例性实施例中，还提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现上述任一项的语音数据的处理方法。
60.可选地，该计算机程序在被处理器执行时可实现如下步骤：
61.确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据。
62.根据本技术的实施例提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述任一项的语音数据的处理方法。
63.可选地，上述电子设备还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入设备输出设备和上述处理器连接。
64.图9示出了可以用来实施本技术的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本技术的实现。
65.如图9所示，设备900包括计算单元901，其可以根据存储在只读存储器(rom)902中的计算机程序或者从存储单元908加载到随机访问存储器(ram)903中的计算机程序，来执行各种适当的动作和处理。在ram 903中，还可存储设备900操作所需的各种程序和数据。计算单元901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
66.设备900中的多个部件连接至i/o接口905，包括：输入单元906，例如键盘、鼠标等；输出单元907，例如各种类型的显示器、扬声器等；存储单元908，例如磁盘、光盘等；以及通信单元909，例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
67.计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理，例如语音数据的处理方法。例如，在一些实施例中，语音数据的处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到ram 903并由计算单元901执行时，可以执行上文描述的语音数据的处理方法的一个或多个步骤。备选地，在其他实施例中，计算单元901可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行语音数据的处理方法。
68.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
69.用于实施本技术的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
70.在本技术的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供
指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
71.为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
72.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
73.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。
74.在本技术相关实施例中，采用对原始语音数据进行正弦检测截取有效音频的方式，通过确定对原始语音数据进行忙音检测时的检测顺序，以及原始语音数据待参与检测的字节大小，基于检测顺序以及待参与检测的字节大小对原始语音数据进行忙音检测，得到第一语音段数据；对第一语音段数据进行正弦波检测，得到检测结果，确定检测结果中满足预设条件的第一语音段数据为第二语音段数据；根据第二语音段数据对原始语音数据进行截取，得到有效音频段数据，达到了去除无效音频数据的目的，从而实现了避免无效音频数据对存储空间以及传输宽带的占用，提升了用户听觉体验的技术效果，进而解决了由于相关技术中对录音进行保存时存在无效音频，额外占用存储空间和传输宽带，影响用户听觉体验的技术问题。
75.上述本技术实施例序号仅仅为了描述，不代表实施例的优劣。
76.在本技术的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
77.在本技术所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或
者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。
78.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
79.另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
80.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
81.以上所述仅是本技术的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本技术的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：安文政
技术所有人：中国电信股份有限公司
我是此专利的发明人