自动调节设备语音播报音量的方法及装置与流程

文档序号：21549016发布日期：2020-07-17 18:21阅读：769来源：国知局

本发明涉及电子设备技术领域，特别涉及一种自动调节设备语音播报音量的方法及装置。

背景技术：

随着互联网技术的飞速发展，人机交互设备越来越多，其中人机交互设备的一大特点就是用户可以直接通过语音来控制设备，例如，控制设备播放音乐、讲故事等。通常情况下，用户会根据个人喜好设置符合自己倾听的播放音量，已达到清晰倾听的目的。然而由于噪声环境影响，默认设置的音量可能会导致播放语音听不清楚的问题，需要用户重新设置音量大小。

现有技术中，在噪声较大时，用户需要通过语音控制或设备音量按键控制设备调大音量，在噪声较小时，就需要用户人工控制设备调小音量，用户需根据环境噪声多次人工调节，体验较差。

技术实现要素：

本发明实施例提供了一种自动调节设备语音播报音量的方法及装置，以在环境噪声下实现设备语音播报音量的自动调节，提高用户体验。

第一方面，本发明提供了一种自动调节设备语音播报音量的方法，包括：

在设备处于语音采集状态下采集环境语音，当确定达到环境噪声提取条件时，执行下一步骤；

获取设备功放输出的语音播报音量值和语音播报信号；

根据所述语音播报信号，确定所述环境语音中包含的环境噪声所对应的环境噪声值；

比较所述语音播报音量值和所述环境噪声值，根据比较结果调整设备的语音播报音量，并利用调整后的语音播报音量进行语音播报。

优选地，设备处于未播报状态中，当设备在所述环境语音中识别出语音播报指令时，则确定达到所述环境噪声提取条件；或，

设备处于语音播报状态中，在达到设定的提取时间点时，则确定达到所述环境噪声提取条件；或，

设备处于语音播报状态中，在当前采集阶段的所述环境语音对应的音量值相对于上一采集阶段所述环境语音对应的音量值，其变化率达到设定阈值时，则确定达到所述环境噪声提取条件。

优选地，所述根据所述语音播报信号，确定所述环境语音中包含的环境噪声所对应的环境噪声值，包括：从所述环境语音中将所述语音播报信号剔除，得出所述环境噪声，并计算所述环境噪声对应的环境噪声值。

优选地，所述根据比较结果调整设备的语音播报音量，包括：

在所述环境噪声值小于所述语音播报音量值时，且小于量大于设定阈值时，则不调整设备的语音播报音量，或者，根据预设的第一对应关系将设备的语音播报音量调小到对应音量；

在所述环境噪声值小于所述语音播报音量值时，且小于量小于所述设定阈值时，或，在所述环境噪声值大于等于所述语音播报音量值时，则根据预设的第二对应关系将设备的语音播报音量调大到对应音量。

优选地，所述根据比较结果调整设备的语音播报音量，包括：将语音播报音量调大到比所述环境噪声值大设定音量值的音量上，且在所述环境噪声值与所述设定音量值之和大于设备最大音量值时，将语音播报音量调大到所述设备最大音量值。

第二方面，本发明实施例还提供了一种自动调节设备语音播报音量的装置，包括：

采集单元，用于在设备处于语音采集状态下采集环境语音，当确定达到环境噪声提取条件时，触发语音播报回采单元执行相应步骤；

语音播报回采单元，用于获取设备功放输出的语音播报音量值和语音播报信号；

环境噪声提取单元，用于根据所述语音播报信号，确定所述环境语音中包含的环境噪声所对应的环境噪声值；

音量调整单元，用于比较所述语音播报音量值和所述环境噪声值，根据比较结果调整设备的语音播报音量，并利用调整后的语音播报音量进行语音播报。

优选地，设备处于未播报状态中，当设备在所述环境语音中识别出语音播报指令时，则确定达到所述环境噪声提取条件；或，

设备处于语音播报状态中，在达到设定的提取时间点时，则确定达到所述环境噪声提取条件；或，

优选地，所述环境噪声提取单元具体用于：从所述环境语音中将所述语音播报信号剔除，得出所述环境噪声，并计算所述环境噪声对应的环境噪声值。

优选地，所述音量调整单元具体用于：在所述环境噪声值小于所述语音播报音量值时，且小于量大于设定阈值时，则不调整设备的语音播报音量，或者，根据预设的第一对应关系将设备的语音播报音量调小到对应音量；在所述环境噪声值小于所述语音播报音量值时，且小于量小于所述设定阈值时，或，在所述环境噪声值大于等于所述语音播报音量值时，则根据预设的第二对应关系将设备的语音播报音量调大到对应音量。

优选地，所述音量调整单元具体用于：将语音播报音量调大到比所述环境噪声值大设定音量值的音量上，且在所述环境噪声值与所述设定音量值之和大于设备最大音量值时，将语音播报音量调大到所述设备最大音量值。

本发明实施例提供了一种自动调节设备语音播报音量的方法及装置，在确定达到环境噪声提取条件时，获取设备功放输出的语音播报音量值和语音播报信号，根据采集的环境语音和语音播报信号可以获取到环境噪声，并利用获取到的环境噪声计算出对应的环境噪声值，通过比较语音播报音量值和环境噪声值来调整设备的语音播报音量。本方案无需人工调节音量，即可根据环境噪声自动调整设备的语音播报音量，提高了用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种自动调节设备语音播报音量的方法流程图；

图2是本发明实施例提供的一种自动调节设备语音播报音量的装置结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供了一种自动调节设备语音播报音量的方法，该方法可以包括以下步骤：

步骤101：在处于语音采集状态下采集环境语音，当确定达到环境噪声提取条件时，执行步骤102。

人机交互设备中均设置有麦克风，设备带电情况下处于语音采集状态，麦克风实时采集环境语音，以便于根据设置的敏感词识别出用户发起的语音指令，并按照用户发起的语音指令对设备进行相应控制。其中，该敏感词为预先设置的，例如，某款音响具有人机交互功能，其预先设置的敏感词为“xx音箱”，在麦克风人机交互设备的语音识别模块识别出麦克风采集的环境语音中包括“xx音箱”时，则确定用户准备发起语音指令，并识别接下来设定时间段内环境语音中包含的语音指令。

设备只有在进入播报状态时才会需要对语音播报音量进行调整，才会进入语音播报音量的调整过程，因此，需要一个触发条件，该触发条件可以是设备在确定达到环境噪声提取条件时，进入语音播报音量的调整过程。

在本发明一个实施例中，设备包括两个状态，一个是设备处于未播报状态中，另一个是设备处于语音播报状态中，在设备处于不同状态时，至少可以在满足如下任一个触发条件时，确定达到环境噪声提取条件：

a：设备处于未播报状态，当设备在所述环境语音中识别出语音播报指令时，确定达到环境噪声提取条件；

在该触发条件下，设备处于未播报状态，当在环境语音中识别出敏感词之后，会将设备唤醒，以识别接下来用户输入的指令，例如，该语音播报指令为“播放王菲的歌曲”，此时则确定达到环境噪声提取条件，即需要进入语音播报音量调整过程。

b：设备处于语音播报状态中。

1、在达到设定的提取时间点时，确定达到环境噪声提取条件；

在该触发条件下，可以设定提取时间点作为触发条件，例如，在进入语音播报状态之后，每隔半个小时调整一次语音播报音量，以满足当前环境下的噪声状态，每当达到半个小时，则确定达到设定的提取时间点，将此确定达到环境噪声提取条件。

2、在当前采集阶段的所述环境语音对应的音量值相对于上一采集阶段所述环境语音对应的音量值，其变化率达到设定阈值时，确定达到环境噪声提取条件。

在该触发条件下，设备可以预先设定环境语音的采集阶段，并设定每一个采集阶段对应的采集时长，例如，设定一个采集阶段对应采集时长为1分钟，在每一个采集阶段采集完环境语音之后，计算该采集阶段下所采集环境语音对应的音量值，在确定当前采集阶段所采集环境语音对应音量值相对于上一采集阶段所采集环境语音对应音量值，其变化率达到设定阈值时，则确定达到环境噪声提取条件，即需要进入语音播报音量调整过程。

其中，该设定阈值可以为10～20db，例如，为12db，当前采集阶段所采集环境语音的音量值为50db，上一采集阶段所采集环境语音的音量值为35db，那么变化率为15db，比设定阈值12db大，因此，确定达到环境噪声提前条件，需要进入语音播报音量调整过程。

需要说明的是，本实施例中环境语音的音量值通过现有技术方案计算，本实施例对此不做具体说明。

步骤102：获取设备功放输出的语音播报音量值和语音播报信号。

由于采集的环境语音中包括语音播报信号和环境噪声，为了确定环境语音中的环境噪声，需要获取环境语音中的语音播报信号，在本实施例中，设备中语音播报信号在输出时，会经过功放设备进行音频放大处理，因此，可以直接从功放设备输出端获取语音播报信号，并计算根据功放设备的放大电路计算出相应语音播报音量值，从而可以保证获取的语音播报信号更准确。

在设备处于未播报状态下，设备在识别到环境语音中包含语音播报指令时，一般设备会重复一下用户输入的语音播报指令，设备在重复该语音播报指令时，可以获取功放输出的语音播报信号并计算对应的语音播报音量值。

在设备处于语音播报状态下，当设备达到设定的提取时间点，或，在当前采集阶段的所述环境语音对应的音量值相对于上一采集阶段所述环境语音对应的音量值，其变化率达到设定阈值时，设备可以直接获取功放输出的语音播报信号并计算对应的语音播报音量值。

步骤103：根据所述语音播报信号，确定所述环境语音中包含的环境噪声所对应的环境噪声值。

环境语音中包括环境噪声和语音播报信号，当设备处于语音播报状态时，可以直接根据采集的环境语音和获取的语音播报信号确定环境噪声，具体地，从所述环境语音中将所述语音播报信号剔除，得出所述环境噪声，在确定出环境噪声后可以利用现有方式计算出所述环境噪声对应的环境噪声值。

当设备处于未播报状态时，采集的环境语音中只包括环境噪声，此时可以直接将采集的环境语音确定为环境噪声，环境噪声值直接由环境语音计算所得。

步骤104：比较所述语音播报音量值和所述环境噪声值，根据比较结果调整设备的语音播报音量，并利用调整后的语音播报音量进行语音播报。

在语音播报音量值一定时，环境噪声值的大小会影响用户倾听语音播报的清晰度，因此，需要根据环境噪声值的大小来调整语音播报音量。例如，在语音播报音量值大于环境噪声值时，则无需调整语音播报音量，而在语音播报音量值小于环境噪声值时，则需要调整语音播报音量。

在本发明一个实施例中，至少还可以通过如下一种调整方式实现对设备语音播报音量的调整：

在所述环境噪声值小于所述语音播报音量值时，且小于量大于设定阈值时，则不调整设备的语音播报音量，或者，根据预设的第一对应关系将设备的语音播报音量调小到对应音量。

其中，该设定阈值为预先设定，可以为3-5db，以5db为例，语音播报音量值为40db，环境噪声值为30db，此时环境噪声值小于语音播报音量值，且小于量为10db，比设定阈值5db大，因此，可以确定该环境噪声对用户听到的语音播报清晰度影响较小，可以不用调整设备的语音播报音量。

或者，可以预先设定第一对应关系，该第一对应关系包括多个环境噪声区间，每一个环境噪声区间对应一个语音播报音量调整量，当环境噪声值小于语音播报音量值时，小于量位于哪个环境噪声区间，则将语音播报音量按照该环境噪声区间对应的语音播报音量调整量调小。例如，该第一对应关系包括：环境噪声区间[q1,q2)→语音播报音量调整量l1，环境噪声区间[q2,q3)→语音播报音量调整量l2，环境噪声区间[q3,q4)→语音播报音量调整量l3。例如，语音播报音量值为40db，环境噪声值为20db，该小于量20db位于环境噪声区间[q1,q2)，则将设备的语音播报音量调小到40-l1。

在所述环境噪声值小于所述语音播报音量值时，且小于量小于所述设定阈值时，或，在所述环境噪声值大于等于所述语音播报音量值时，则根据预设的第二对应关系将设备的语音播报音量调大到与所述环境噪声值对应的音量。

同样以设定阈值为5db为例，若语音播报音量值为40db，环境噪声值为38db，此时环境噪声值小于语音播报音量值，且小于量为2db，比设定阈值5db小，因此，可以确定该环境噪声对用户听到的语音播报清晰度影响较大，需要调整设备的语音播报音量。或者，若环境噪声值大于等于语音播报音量值时，更可以确定环境噪声对用户听到的语音播报清晰度影响较大，需要调整设备的语音播报音量。

可以预先设定第二对应关系，该第二对应关系包括至少一个小于量对应的环境噪声区间和至少一个大于量对应的环境噪声区间，每一个环境噪声区间对应一个语音播报音量调整量，小于量或大于量位于哪个环境噪声区间，则将语音播报音量按照该环境噪声区间对应的语音播报音量调整量进行调大。例如，该第二对应关系包括：小于量对应的环境噪声区间[p1,p2)→语音播报音量h1，大于量对应的环境噪声区间[p2,p3)→语音播报音量h2，大于量对应的环境噪声区间[p3,p4)→语音播报音量h3。例如，语音播报音量值为40db，环境噪声值为45db，大于量为5db，假设该大于量对应环境噪声区间[p2,p3)，则将语音播报音量调大到40+h2。

在本发明一个实施例中，还可以直接通过如下方式对语音播报音量进行调整：将语音播报音量调大到比所述环境噪声值大设定音量值的音量上，且在所述环境噪声值与所述设定音量值之和大于设备最大音量值时，将语音播报音量调大到所述设备最大音量值。该设定音量值为20-30db，以20db为例，不管环境噪声值为多少，均需要保证语音播报音量比环境噪声值大20db，才能保证用户清晰的听到语音播报的内容。需要说明的是，每一个设备均有设备最大音量值，若环境噪声值+设定音量值大于设备最大音量值时，只需将语音播报音量调大到所述设备最大音量值即可。

请参考图2，本发明实施例还提供了一种自动调节设备语音播报音量的装置，可以包括：

采集单元201，用于在设备处于语音采集状态下采集环境语音，当确定达到环境噪声提取条件时，触发语音播报回采单元执行相应步骤；

语音播报回采单元202，用于获取设备功放输出的语音播报音量值和语音播报信号；

环境噪声提取单元203，用于根据所述语音播报信号，确定所述环境语音中包含的环境噪声所对应的环境噪声值；

音量调整单元204，用于比较所述语音播报音量值和所述环境噪声值，根据比较结果调整设备的语音播报音量，并利用调整后的语音播报音量进行语音播报。

在本发明一个实施例中，设备处于未播报状态中，当设备在所述环境语音中识别出语音播报指令时，则确定达到所述环境噪声提取条件；或，

设备处于语音播报状态中，在达到设定的提取时间点时，则确定达到所述环境噪声提取条件；或，

在本发明一个实施例中，所述环境噪声提取单元具体用于：从所述环境语音中将所述语音播报信号剔除，得出所述环境噪声，并计算所述环境噪声对应的环境噪声值。

在本发明一个实施例中，所述音量调整单元具体用于：在所述环境噪声值小于所述语音播报音量值时，且小于量大于设定阈值时，则不调整设备的语音播报音量，或者，根据预设的第一对应关系将设备的语音播报音量调小到对应音量；在所述环境噪声值小于所述语音播报音量值时，且小于量小于所述设定阈值时，或，在所述环境噪声值大于等于所述语音播报音量值时，则根据预设的第二对应关系将设备的语音播报音量调大到对应音量。

在本发明一个实施例中，所述音量调整单元具体用于：将语音播报音量调大到比所述环境噪声值大设定音量值的音量上，且在所述环境噪声值与所述设定音量值之和大于设备最大音量值时，将语音播报音量调大到所述设备最大音量值。

综上，本发明各个实施例至少可以实现如下有益效果：

1、在本发明实施例中，在确定达到环境噪声提取条件时，获取设备功放输出的语音播报音量值和语音播报信号，根据采集的环境语音和语音播报信号可以获取到环境噪声，并利用获取到的环境噪声计算出对应的环境噪声值，通过比较语音播报音量值和环境噪声值来调整设备的语音播报音量。本方案无需人工调节音量，即可根据环境噪声自动调整设备的语音播报音量，提高了用户体验。

上述装置内的各单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

需要说明的是，在本文中，诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个······”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储在计算机可读取的存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的介质中。

最后需要说明的是：以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭晓东;郭海峰
技术所有人：四川虹美智能科技有限公司
我是此专利的发明人

上一篇：页面渲染方法和装置与流程
上一篇：笔迹绘制方法、装置、设备和存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。