定向录音方法和装置与流程

文档序号：26720616发布日期：2021-09-22 20:32阅读：268来源：国知局

1.本技术属于通信技术领域，具体涉及一种定向录音方法和装置。

背景技术：

2.在很多场景下用户会使用手机进行录音，但是在录音的场景比较复杂时，涉及的人员较多，不能对指定的方向或人员录音，录音的效果较差，且录音过程中无法对声音进行处理，得到的录音中含有无效信息。

技术实现要素：

3.本技术实施例的目的是提供一种定向录音方法、装置，能够解决相关技术中录音效果较差、含有无效信息的问题。
4.第一方面，本技术实施例提供了一种定向录音方法，该方法包括：
5.第一电子设备基于超宽带uwb技术获取多个第二电子设备的位置信息；
6.第一电子设备基于各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息；
7.基于各所述第二电子设备对应用户的语音输出状态信息，对各所述第二电子设备对应用户的语音信号进行录音，得到各所述第二电子设备对应的录音音频。
8.第二方面，本技术实施例提供了一种定向录音装置，该装置包括：
9.定位单元，用于基于超宽带uwb技术获取多个第二电子设备的位置信息；
10.识别单元，用于基于各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息；
11.录音单元，用于基于各所述第二电子设备对应用户的语音输出状态信息，对各所述第二电子设备对应用户的语音信号进行录音，得到各所述第二电子设备对应的录音音频。
12.第三方面，本技术实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的定向录音方法的步骤。
13.第四方面，本技术实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的定向录音方法的步骤。
14.第五方面，本技术实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的定向录音方法。
15.在本技术实施例中，通过基于超宽带uwb技术获取多个被录音对象的位置信息，基于位置信息识别语音输出状态信息，基于各被录音对象的语音输出状态信息进行录音，可以实现对被录音对象的定向录音，提升录音效果。
附图说明
16.图1为本技术实施例提供的定向录音方法的流程示意图；
17.图2为本技术实施例提供的识别多个第二电子设备的示意图；
18.图3为本技术实施例提供的识别各所述第二电子设备对应用户的语音输出状态信息的示意图；
19.图4为本技术实施例提供的用户选择第二电子设备的声音进行导出的示意图；
20.图5为本技术实施例提供的设置录音范围的示意图；
21.图6为本技术实施例提供的定向录音装置的结构示意图；
22.图7为本技术实施例提供的电子设备的结构示意图；
23.图8为实现本技术实施例的一种电子设备的硬件结构示意图。
具体实施方式
24.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本技术保护的范围。
25.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。
26.本技术实施例中术语“多个”是指两个或两个以上，其它量词与之类似。
27.下面结合附图，通过一些实施例及其应用场景对本技术实施例提供的定向录音方法进行详细地说明。本技术实施例提供的定向录音方法，执行主体为电子设备，本技术实施例提及的电子设备包括但不限于手机、平板电脑、电脑、可穿戴设备等。
28.图1为本技术实施例提供的定向录音方法的流程示意图，如图1所示，所述定向录音方法包括以下步骤：
29.步骤100、第一电子设备基于超宽带uwb技术获取多个第二电子设备的位置信息；
30.其中，超宽带(ultra wide band，uwb)技术是一种精确的定位技术，有着定位精度高的优点，但uwb信号传播距离较近，隔着楼层或者墙壁误差较大。
31.本技术实施例中，第一电子设备作为主录音设备，通过识别当前环境中支持uwb技术的第二电子设备，从而定位使用第二电子设备的用户与主录音设备的相对位置，即第一电子设备基于超宽带uwb技术获取多个第二电子设备的位置信息。
32.例如，参加会议的多个用户通过使用第二电子设备扫描二维码加入会议，第一电子设备识别加入会议的多个第二电子设备，获取多个第二电子设备的位置信息。图2为本技术实施例提供的识别多个第二电子设备的示意图。
33.步骤101、第一电子设备基于各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息；
34.可选地，第一电子设备在获取各所述第二电子设备的位置信息后，开启录音功能，
在录音过程中，基于各所述第二电子设备的位置信息，识别正在进行语音输出的用户，即识别各第二电子设备对应用户的语音输出状态信息。
35.其中，语音输出状态信息包括正在进行语音输出和未进行语音输出。图3为本技术实施例提供的识别各所述第二电子设备对应用户的语音输出状态信息的示意图。
36.步骤102、基于各所述第二电子设备对应用户的语音输出状态信息，对各所述第二电子设备对应用户的语音信号进行录音，得到各所述第二电子设备对应的录音音频。
37.可选地，第一电子设备在录音过程中，基于各所述第二电子设备对应用户的语音输出状态信息，可以实现对各所述第二电子设备对应用户的语音信号进行录音，从而得到各所述第二电子设备对应的录音音频。
38.在本技术实施例中，通过基于超宽带uwb技术获取多个被录音对象的位置信息，基于位置信息识别语音输出状态信息，基于各被录音对象的语音输出状态信息进行录音，可以实现对被录音对象的定向录音，提升录音效果。
39.可选地，所述第一电子设备基于超宽带uwb技术获取多个第二电子设备的位置信息，包括：
40.在第二电子设备加入会议的情况下，所述第一电子设备基于超宽带uwb技术识别各所述第二电子设备，获取各所述第二电子设备到所述第一电子设备的距离信息以及方向信息。
41.本技术实施例应用于会议场景，在第二电子设备加入会议的情况下，电子设备基于uwb技术对加入会议的各第二电子设备进行定位和识别，通过定位可以获得各第二电子设备到所述第一电子设备的距离信息以及方向信息。
42.可选地，所述第一电子设备基于各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息，包括：
43.获取各所述第二电子设备的麦克风信息，基于各所述第二电子设备的位置信息和麦克风信息，识别各所述第二电子设备对应用户的语音输出状态信息；
44.或者，基于声音传播模型和各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息。
45.一种实施方式中，在第二电子设备加入会议后，各第二电子设备均将麦克风权限共享给第一电子设备，第一电子设备获得了各第二电子设备的麦克风权限，即可以获取各第二电子设备的麦克风信息。第一电子设备基于各所述第二电子设备的麦克风信息，识别各所述第二电子设备是否正在使用，并结合各所述第二电子设备的位置信息，判断各所述第二电子设备对应用户的语音输出状态信息。
46.一种实施方式中，第一电子设备基于声音传播模型和各所述第二电子设备的位置信息，判断各所述第二电子设备对应用户的语音输出状态信息。
47.其中，声音传播模型是符合声音传播理论的物理学模型。
48.其中，基于声音传播模型和各所述第二电子设备的位置信息，可以得到各所述第二电子设备对应的用户输出的语音到达第一电子设备的时间，即若第二电子设备对应的用户正在进行语音输出，该第二电子设备输出的语音到达第一电子设备的时间是确定的。第一电子设备基于语音到达该设备与语音输出的时间差可以确定当前正在进行语音输出的第二电子设备。
49.在本技术实施例中，基于各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息，可以实现对被录音对象的定向录音，提升录音效果。
50.可选地，所述定向录音方法还包括：
51.接收第一输入；
52.响应于第一输入，确定录音合成对象，输出所述录音合成对象对应的录音音频。
53.可选地，第一电子设备接收第一输入，响应于所述第一输入，确定录音合成对象，基于各所述第二电子设备对应的录音音频，对所述录音合成对象对应的录音音频进行合成，输出所述录音合成对象对应的录音音频。
54.可选地，所述第一输入包括以下至少一项：
55.选择第二电子设备的操作；
56.设置录音范围的操作；
57.设置录音方向的操作。
58.一种实施方式中，用户可以对第二电子设备进行选择。例如，通过识别到哪些设备正在说话，直接点击设备上的关闭按钮，如关闭设备1、设备4，则对应设备1、设备4方向的录音将会屏蔽掉。图4为本技术实施例提供的用户选择第二电子设备的声音进行导出的示意图。
59.可选地，在所述第一输入为选择第二电子设备的操作的情况下，所述确定录音合成对象包括：
60.将选择的第二电子设备或除了所述选择的第二电子设备外的其他第二电子设备作为录音合成对象。
61.一种实施方式中，用户可以设置录音范围。图5为本技术实施例提供的设置录音范围的示意图。
62.可选地，在所述第一输入为设置录音范围的操作的情况下，所述确定录音合成对象包括：
63.基于各所述第二电子设备到所述第一电子设备的距离信息，确定在所述录音范围内的第二电子设备；
64.将在所述录音范围内的第二电子设备作为录音合成对象。
65.一种实施方式中，用户可以设置录音方向。
66.可选地，在所述第一输入为设置录音方向的操作的情况下，所述确定录音合成对象包括：
67.基于各所述第二电子设备的方向信息，确定所述录音方向对应的第二电子设备；
68.将所述录音方向对应的第二电子设备作为录音合成对象。
69.可以理解的是，第一电子设备根据各第二电子设备的位置信息，由于位置信息包括方向信息，即第一电子设备根据各第二电子设备的方向信息，可以确定满足用户设置的录音方向的第二电子设备。
70.在本技术实施例中，通过基于超宽带uwb技术获取多个被录音对象的位置信息，基于位置信息识别语音输出状态信息，基于各被录音对象的语音输出状态信息进行录音，获得各第二电子设备的录音音频，实现了定向录音，并可以按照用户的设置输出相应的录音音频，提升录音效果。
attached storage，nas)、个人计算机(personal computer，pc)、电视机(television，tv)、柜员机或者自助机等，本技术实施例不作具体限定。
91.本技术实施例中的定向录音装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本技术实施例不作具体限定。
92.本技术实施例提供的定向录音装置能够实现图1至图5的方法实施例实现的各个过程，为避免重复，这里不再赘述。
93.可选地，如图7所示，本技术实施例还提供一种电子设备700，包括处理器701，存储器702，存储在存储器702上并可在所述处理器701上运行的程序或指令，该程序或指令被处理器701执行时实现上述定向录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
94.需要说明的是，本技术实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
95.图8为实现本技术实施例的一种电子设备的硬件结构示意图。
96.该电子设备800包括但不限于：射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、以及处理器810等部件。
97.本领域技术人员可以理解，电子设备800还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器810逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图8中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。
98.其中，处理器810，用于：
99.基于超宽带uwb技术获取多个第二电子设备的位置信息；
100.基于各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息；
101.基于各所述第二电子设备对应用户的语音输出状态信息，对各所述第二电子设备对应用户的语音信号进行录音，得到各所述第二电子设备对应的录音音频。
102.在本技术实施例中，通过基于超宽带uwb技术获取多个被录音对象的位置信息，基于位置信息识别语音输出状态信息，基于各被录音对象的语音输出状态信息进行录音，可以实现对被录音对象的定向录音，提升录音效果。
103.可选地，所述基于超宽带uwb技术获取多个第二电子设备的位置信息，包括：
104.在第二电子设备加入会议的情况下，所述第一电子设备基于超宽带uwb技术识别各所述第二电子设备，获取各所述第二电子设备到所述第一电子设备的距离信息以及方向信息。
105.可选地，所述基于各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息，包括：
106.获取各所述第二电子设备的麦克风信息，基于各所述第二电子设备的位置信息和麦克风信息，识别各所述第二电子设备对应用户的语音输出状态信息；
107.或者，基于声音传播模型和各所述第二电子设备的位置信息，识别各所述第二电子设备对应用户的语音输出状态信息。
108.可选地，用户输入单元807用于接收第一输入；
109.处理器810还用于响应于第一输入，确定录音合成对象，音频输出单元803用于输出所述录音合成对象对应的录音音频；
110.可选地，所述第一输入包括以下至少一项：
111.选择第二电子设备的操作；
112.设置录音范围的操作；
113.设置录音方向的操作。
114.应理解的是，本技术实施例中，输入单元804可以包括图形处理器(graphics processing unit，gpu)8041和麦克风8042，图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元806可包括显示面板8061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板8061。用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071，也称为触摸屏。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器809可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器810可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器810中。
115.本技术实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述定向录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
116.其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(read
‑
only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等。
117.本技术实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述定向录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
118.应理解，本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
119.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述
的特征可在其他示例中被组合。
120.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本技术各个实施例所述的方法。
121.上面结合附图对本技术的实施例进行了描述，但是本技术并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本技术的启示下，在不脱离本技术宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本技术的保护之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：彭业
技术所有人：维沃移动通信有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。