通话音量调节方法和设备与流程

文档序号:33173094发布日期:2023-02-04 02:58阅读:129来源:国知局
通话音量调节方法和设备与流程

1.本发明涉及终端设备技术领域,尤其涉及一种通话音量调节方法和设备。


背景技术:

2.随着终端技术的发展,越来越多的终端设备支持建立设备间的语音通话。用户在基于终端设备与对端用户通话时,用户可以通过音量调整按键调整终端设备的音量大小。在此过程中,用户手动调整通话音量可能会影响用户的通话体验。


技术实现要素:

3.有鉴于此,本发明实施例提供了一种通话音量调节方法和设备,能够根据影响本地通话音量的本地影响参数和对端影响参数自适应调整通话音量,无需用户手动调节通话音量,提高用户通话体验。
4.第一方面,本发明实施例提供了一种通话音量调节方法,包括:
5.获取影响本地通话音量的本地影响参数和对端影响参数;
6.将所述本地影响参数和所述对端影响参数输入音量调节模型,所述音量调节模型用于根据所述本地影响参数和所述对端影响参数输出通话音量值;
7.根据所述通话音量值设置本地通话音量。
8.可选的,所述本地影响参数,包括:本地环境噪声。
9.可选的,所述对端影响参数,包括:对端用户的音量值、对端环境噪声、对端用户音源与对端设备的距离值。
10.可选的,所述获取影响本地通话音量的本地影响参数和对端影响参数,包括:
11.在与对端用户通话的过程中,周期性地获取影响本地通话音量的本地影响参数和对端影响参数;
12.将当前周期获取的本地影响参数和对端影响参数输入所述音量调节模型,通过所述音量调节模型获取当前周期的通话音量值,所述当前周期的通话音量值用于动态调整本地通话音量。
13.可选的,所述音量调节模型为残差网络模型。
14.可选的,所述音量调节模型的训练过程包括:获取本地历史通话记录,每个所述历史通话记录均包含:本地环境噪声、对端用户的标识信息、对端用户的音量值、对端环境噪声、对端用户音源与对端设备的距离值,以及本地实际设置的通话音量值;
15.将所述历史通话记录包含的所述本地环境噪声、对端用户的标识信息、对端用户的音量值、对端环境噪声以及对端用户音源与对端设备的距离值作为输入值,将所述历史通话记录包含的本地实际设置的通话音量值作为验证值,对所述音量调节模型进行训练。
16.可选的,所述方法还包括:与对端用户通话结束后,确定在与所述对端用户通话的过程中是否检测到本地通话音量调整操作;
17.若在与所述对端用户通话的过程中检测到本地通话音量调整操作,则基于本次通
话生成通话样本,所述通话样本包含根据所述本地通话音量调整操作设置的通话音量值;
18.基于所述通话样本执行对所述音量调节模型的训练。
19.第二方面,本发明实施例提供了一种终端设备,包括:
20.获取模块,用于获取影响本地通话音量的本地影响参数和对端影响参数;
21.音量确定模块,用于将所述本地影响参数和所述对端影响参数输入音量调节模型,所述音量调节模型用于根据所述本地影响参数和所述对端影响参数输出通话音量值;
22.音量设置模块,用于根据所述通话音量值设置本地通话音量。
23.第三方面,本发明实施例提供了一种终端设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行如第一方面或者第一方面任一项所述的方法。
24.第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行如第一方面或者第一方面任一项所述的方法。
25.本发明实施例方案中,终端设备集成有音量调节模型。当终端设备与其它设备(称为对端设备)建立通话后,终端设备可以获取影响本地通话音量的本地影响参数和对端影响参数。音量调节模型基于本地影响参数和对端影响参数可以自主计算通话音量。基于该通话音量可以对本地终端设备的通话音量进行设置。可见,基于本发明实施例方案,可以实现对终端设备通话音量的自适应调整设置,无需人工手动调节通话音量,提高用户通话体验。
附图说明
26.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1为本发明实施例提供的一种通话场景示意图;
28.图2为本发明实施例提供的一种通话音量调节方法的流程图;
29.图3为本发明实施例提供的另一种通话音量调节方法的流程图;
30.图4为本发明实施例提供的一种音量调节模型的训练流程图;
31.图5为本发明实施例提供的一种终端设备的结构示意图;
32.图6为本发明实施例提供的另一种终端设备的结构示意图。
具体实施方式
33.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
34.参见图1,为本发明实施例提供的一种通话场景示意图。如图1所示,终端设备1与
终端设备2建立语音通话。可选的,终端设备1和终端设备2可以通过电话呼叫建立语音通话。可选的,终端设备1和终端设备2可以通过即时通信软件、远程会议软件等建立语音通话。可选的,终端设备1可以和一个终端设备(如图1中的终端设备2)建立语音通话。可选的,终端设备1也可以同时和多个终端设备建立语音通话。
35.在一些实施例中,终端设备1为了实现本地通话音量的自动调节,终端设备1集成有音量调节模型1。当终端设备1与终端设备2建立语音通话后,终端设备1可以获取影响本地通话音量的自身影响参数(本发明实施例也称为本地影响参数)。可选的,终端设备1还可以获取影响本地通话音量的终端设备2侧的影响参数(本发明实施例也称为对端影响参数)。终端设备1将终端设备1侧的本地影响参数和终端设备2侧的对端影响参数输入音量调节模型1,音量调节模型1输出第一通话音量值。终端设备1基于第一通话音量值设置本地通话音量。由此,终端设备1基于音量调节模型1实现了在通话过程中的音量自动调节。
36.在一些实施例中,终端设备2也支持在通话过程中进行音量自动调节。相应的,终端设备2集成有音量调节模型2。当终端设备2与终端设备1建立语音通话后,终端设备2可以获取自身侧的通话影响参数。可选的,终端设备2还可以获取终端设备1侧的通话影响参数。终端设备2将终端设备1侧的影响参数(即对端影响参数)和终端设备2侧的影响参数(即本地影响参数)输入音量调节模型2。音量调节模型2输出第二通话音量值。终端设备2基于第二通话音量值设置本地通话音量。由此,终端设备2基于音量调节模型2实现了在通话过程中的音量自动调节。
37.在一些实施例中,在终端设备的通话场景中,终端设备本地的环境噪声会影响终端设备输出音量的大小。因此,上述本地影响参数可以包括本地环境噪声。在图1给出的示例中,对于终端设备1而言,其本地影响参数包括终端设备1所处环境的环境噪声。对于终端设备2而言,其本地影响参数包括终端设备2所处环境的环境噪声。
38.在一些实施例中,在终端设备的通话场景中,通话对端的对端用户的音量大小、对端的环境噪声以及对端用户距离对端设备的远近也会影响本地终端输出音量的大小。因此,上述对端影响参数包括对端用户的音量值、对端环境噪声、对端用户音源与对端设备的距离值。在图1给出的示例中,对于终端设备1而言,其对端设备为终端设备2。终端设备1获取的对端影响参数包括:终端设备2侧的用户音量值、终端设备2所处环境的环境噪声、终端设备2侧的用户音源与终端设备2的距离值。对于终端设备2而言,其对端设备为终端设备1。终端设备2获取的对端影响参数包括:终端设备1侧的用户音量值、终端设备1所处环境的环境噪声、终端设备1侧的用户音源与终端设备1的距离值。在一些实施例中,每个对端用户的通话习惯、声音特色等也会影响本地终端输出的音量大小。因此,上述对端影响参数还可以包括对端用户的标识信息。可选的,对端用户的标识信息例如可以包括对端用户的电话号码。在图1给出的示例中,终端设备1获取的对端影响参数还包括:终端设备2的电话号码。终端设备2获取的对端影响参数还包括:终端设备1的电话号码。
39.在一些实施例中,可以在终端设备的通话场景中周期性地进行音量调节。具体的,终端设备可以周期性地获取影响本地通话音量的本地影响参数和对端影响参数。终端设备可以将当前周期的本地影响参数和对端影响参数输入音量调节模型。音量调节模块可以输出当前周期的通话音量值。终端设备可以根据当前周期的通话音量值调整本地通话音量。通过此方式,可以实现在通话过程中实时动态地调整本地通话音量。
40.在一些实施例中,上述音量调节模型可以是残差网络模型。更为具体的,所述残差网络模型为50层的resnet。采用残差网络模型进行音量自动调整,可以解决深层网络的梯度弥散和精度下降温度。在保证运算精度的前提下,还能够控制运算速度。
41.参见图2,为本发明实施例提供的一种通话音量调节方法的流程图。图2所示方法应用于终端设备。例如可以应用于图1所示的终端设备1,也可以应用于图1所示的终端设备2。当应用于终端设备1时,终端设备1为本地终端设备,终端设备2为对端设备。当应用于终端设备2时,终端设备2为本地终端设备,终端设备1为对端设备。如图2所示,该方法的处理步骤包括:
42.101,本地终端设备与对端设备建立通话。
43.102,本地终端设备获取影响本地通话音量的本地影响参数和对端影响参数。可选的,本地影响参数包括本地环境噪声。可选的,对端影响参数包括对端用户的音量值、对端环境噪声、对端用户音源与对端设备的距离值。可选的,对端影响参数还可以包括对端用户的标识信息。可选的,对端用户的标识信息例如可以包括对端用户的电话号码。通过对端用户的标识信息不仅可以标识当前通话的对端用户,而且可以根据标识信息确定对端用户的通话习惯、声音特色等。可选的,当本地终端设备与对端设备通过电话呼叫建立语音通话时,本地终端设备可以通过电话信令,如at信令获取对端设备的对端影响参数。可选的,当本地终端设备与对端设备通过即时通信软件、远程会议软件等建立语音通话时,本地终端设备可以通过网络传输命令获取对端设备的对端影响参数。
44.103,本地终端设备将本地影响参数和对端影响参数输入音量调节模型,所述音量调节模型用于根据本地影响参数和对端影响参数输出通话音量值。
45.104,本地终端设备根据通话音量值设置本地通话音量。
46.本发明实施例中,本地终端设备集成有音量调节模型。本地终端设备与对端设备建立通话后,本地终端设备可以获取影响本地通话音量的本地影响参数和对端影响参数。音量调节模型基于本地影响参数和对端影响参数可以自主计算通话音量。基于该通话音量可以对本地终端设备的通话音量进行设置。可见,基于本发明实施例方案,可以实现对本地终端设备的通话音量的自适应调整设置,无需人工手动调节通话音量。
47.参见图3,为本发明实施例提供的另一种通话音量调节方法的流程图。如图3所示,该方法的处理步骤包括:
48.201,本地终端设备与对端设备建立通话。
49.202,本地终端设备在时间t1获取影响本地通话音量的本地影响参数和对端影响参数。
50.203,本地终端设备将本地影响参数和对端影响参数输入音量调节模型,音量调节模型用于根据本地影响参数和对端影响参数输出第一通话音量值。
51.204,本地终端设备计算当前实际设置的第二通话音量值与第一通话音量值的第一差值。
52.205,本地终端设备判断第一差值是否大于预设阈值;若大于,执行步骤206;若不大于,则本地设备终端不对本地通话音量进行调整,并跳转到步骤208。
53.206,本地终端设备将本地通话音量调整为第一通话音量值,并跳转到步骤208。
54.207,本地终端设备确定与对端设备是否通话结束;若是,则方法结束;若否则执行
步骤208。
55.208,本地终端设备等待至当前时间t2与时间t1的差值大于等于第一步长时,将当前时间t2赋值为t1并跳转到步骤202。
56.基于本发明实施例方法,可以在本地终端设备与对端设备通话的过程中,周期性对获取本地影响参数和对端影响参数,并可以根据获取的本地影响参数和对端影响参数对本地通话音量进行周期性调节,由此以使本地通话音量与本地通话情境以及对端通话情境相适应。
57.参见图4,为本发明实施例提供的一种音量调节模型的训练流程图。如图4所示,该方法的处理步骤包括:
58.301,本地终端设备获取本地历史通话记录。可选的,本地终端设备获取本地联系人的所有历史通话记录。可选的,每个历史通话记录均包含:本地环境噪声、对端用户的标识信息、对端用户的音量值、对端环境噪声、对端用户音源与对端设备的距离值,以及通话过程中本地实际设置的通话音量值。可选的,对端用户的标识信息例如可以是对端用户的电话号码,基于电话号码可以区分并标识各个通话记录。可选的,基于电话号码还可以表征各个对端用户的通话习惯、声音特色等。
59.302,本地终端设备将本地历史通话记录分为训练样本和测试样本。可选的,训练样本和测试样本均包括若干本地历史通话记录。可选的,训练样本和测试样本包含的本地历史通话记录的数量比例可以为3:1。
60.303,本地终端设备基于训练样本对音量调节模型进行训练。具体包括:将训练样本的各历史通话记录中的本地环境噪声、对端用户的标识信息、对端用户的音量值、对端环境噪声以及对端用户音源与对端设备的距离值作为输入值,将训练样本的各历史通话记录中的本地实际设置的通话音量值作为验证值,对音量调节模型进行训练。
61.304,本地终端设备基于测试样本对音量调节模型进行测试,得到训练完成的音量调节模型。其中,训练完成的音量调节模式可以将本地环境噪声、对端环境噪声、对端用户的音量值、对端用户音源与对端设备的距离值作为输入值,并输出通话音量值。可选的,音量调节模型的输入参数还可以包括对软用户的标识信息,如对端用户的电话号码。在一个具体示例中,将电话号码130 0000xxxx、本地环境噪声50分贝、对端环境噪声60分贝、对端用户的音量值60分贝以及对端用户音源与对端设备的距离值8厘米输入音量调节模型,音量调节模型输出的通话音量值为60分贝,则基于音量调节模型的输出值可以将本地终端设备的通话音量设置为60分贝。
62.在一些实施例中,当本地终端设备与对端用户通话结束后,还基于本次通话生成通话样本,基于通话样本可以对音量调节模型进行优化训练。
63.在一些实施例中,如果根据音量调节模型设置的通话音量不满足本地用户的通话需求,则本地用户会手动调整本地终端设备的通话音量。因此在本地终端设备与对端用户通话结束后,可以判断在此次通话过程中本地用户是否手动调整了通话音量。如果用户手动调整了通话音量,则基于本次通话生成通话样本,并基于通话样本对音量调节模型进行优化训练。其中包括:本地终端设备与对端用户通话结束后,本地终端设备确定在与对端用户通话的过程中是否检测到本地通话音量调整操作。若在与对端用户通话的过程中检测到本地通话音量调整操作,则本地终端设备基于本次通话生成通话样本,该通话样本包含根
据本地通话音量调整操作设置的通话音量值。可选的,该通话样本还包括:此次通话过程中的本地环境噪声、对端环境噪声、对端用户的音量值、对端用户音源与对端设备的距离值。可选的,该通话样本还包括对端用户的标识信息。
64.基于通话样本执行对音量调节模型的优化训练。本发明实施例中,当用户手动设置的通话音量后,可以基于用户手动设置的通话音量值对音量调节模型进行优化训练,由此可以使音量调节模型输出的音量值更为准确,更能满足用户的通话需求。
65.对应上述通话音量调节方法,本发明实施例提供了一种终端设备。该终端设备支持上述通话音量调节方法。如图5所示,该终端设备包括:获取模块401、音量确定模块402以及音量设置模块403。其中,获取模块401,用于获取影响本地通话音量的本地影响参数和对端影响参数。音量确定模块402,用于将所述本地影响参数和所述对端影响参数输入音量调节模型,所述音量调节模型用于根据所述本地影响参数和所述对端影响参数输出通话音量值。音量设置模块403,用于根据所述通话音量值设置本地通话音量。
66.可选的,上述所述本地影响参数,包括:本地环境噪声。
67.可选的,所述对端影响参数,包括:对端用户的音量值、对端环境噪声、对端用户音源与对端设备的距离值。
68.可选的,获取模块401具体用于:在与对端用户通话的过程中,周期性地获取影响本地通话音量的本地影响参数和对端影响参数;音量确定模块,具体用于将当前周期获取的本地影响参数和对端影响参数输入所述音量调节模型,通过所述音量调节模型获取当前周期的通话音量值。音量设置模块,具体用于根据当前周期的通话音量值动态调整本地通话音量。
69.可选的,所述音量调节模型为残差网络模型。
70.可选的,所述终端设备还包括模型训练模块。所述模型训练模块用于:获取本地历史通话记录,每个所述历史通话记录均包含:本地环境噪声、对端用户的标识信息、对端用户的音量值、对端环境噪声、对端用户音源与对端设备的距离值,以及本地实际设置的通话音量值;将所述历史通话记录包含的所述本地环境噪声、对端用户的标识信息、对端用户的音量值、对端环境噪声以及对端用户音源与对端设备的距离值作为输入值,将所述历史通话记录包含的本地实际设置的通话音量值作为验证值,对所述音量调节模型进行训练。
71.可选的,所述模型训练模块还用于与对端用户通话结束后,确定在与所述对端用户通话的过程中是否检测到本地通话音量调整操作;若在与所述对端用户通话的过程中检测到本地通话音量调整操作,则基于本次通话生成通话样本,所述通话样本包含根据所述本地通话音量调整操作设置的通话音量值;基于所述通话样本执行对所述音量调节模型的训练。
72.本发明实施例的终端设备可以执行图2至图4所示实施例的方法。本实施例未详细描述的部分,可以参考对图2至图4所示实施例的相关说明。该技术方案的执行过程和技术效果参见图2至图4所示实施例中的描述,在此不再赘述。
73.应理解,图5所示终端设备的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块以软件通过处理元件调用的形式实现,部分模块通过硬件的形式实现。例如,获取模块401、音量
确定模块402和音量设置模块403可以分别为单独设立的处理元件,获取模块401、音量确定模块402和音量设置模块403也可以集成在电子设备的某一个芯片中实现。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
74.例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit;以下简称:asic),或,一个或多个微处理器(digital singnal processor;以下简称:dsp),或,一个或者多个现场可编程门阵列(field programmable gate array;以下简称:fpga)等。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip;以下简称:soc)的形式实现。
75.参见图6,为本发明实施例提供的另一种终端设备的结构示意图。如图6所示,该终端设备以通用计算设备的形式表现。终端设备的组件可以包括但不限于:一个或者多个处理器510,通信接口520,存储器530,连接不同系统组件(包括存储器530、通信接口520和处理器510)的通信总线540。
76.通信总线540表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(industry standard architecture;以下简称:isa)总线,微通道体系结构(micro channel architecture;以下简称:mac)总线,增强型isa总线、视频电子标准协会(video electronics standards association;以下简称:vesa)局域总线以及外围组件互连(peripheral component interconnection;以下简称:pci)总线。
77.电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
78.存储器530可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(random access memory;以下简称:ram)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。存储器530可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明实施例的方法步骤。
79.具有一组(至少一个)程序模块的程序/实用工具,可以存储在存储器530中,这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本说明书所描述的实施例中的功能和/或方法。
80.处理器510通过运行存储在存储器530中的程序,从而执行各种功能应用以及数据处理,例如实现发明实施例提供的通话音量调节方法。
81.具体实现中,本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可实现包括本技术提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:rom)或随机存储记忆体(英文:random access memory,简称:ram)等。
82.具体实现中,本发明实施例还提供了一种芯片,包括:处理器,其用于执行存储在
存储器中的计算机程序指令,其中,当该计算机程序指令被该处理器执行时,触发所述芯片执行本发明实施例的通话音量调节方法。
83.具体实现中,本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包含可执行指令,当所述可执行指令在计算机上执行时,使得计算机执行上述方法实施例中的部分或全部步骤。
84.本发明实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示单独存在a、同时存在a和b、单独存在b的情况。其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
85.本领域普通技术人员可以意识到,本文中公开的实施例中描述的各单元及算法步骤,能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
86.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
87.在本发明所提供的几个实施例中,任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
88.以上所述,仅为本发明的具体实施方式,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1