音频设备、包括所述音频设备的音频采集播放系统和方法与流程

文档序号：12462829阅读：515来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开总体上涉及电子技术领域，具体地，涉及一种音频设备、包括所述音频设备的音频采集播放系统和方法。

背景技术：

随着生活水平的提高，越来越多的消费者会在家里或各种娱乐场所进行K歌等活动。一般情况下，爱好唱歌的消费者会在家里单独购买K歌系统。然而，这种K歌系统往往使用起来比较繁琐且需要占据一定空间，从而导致利用率不高。

因此，为了解决上述问题，需要一种音频设备、包括所述音频设备的音频采集播放系统和方法，其中所述音频设备具有多工作模式，能够实施检测用户声音，并根据用户需求在所述多工作模式之间切换，从而提供更智能化的服务，改善用户体验。

技术实现要素：

本公开的方面在于解决至少上述问题和/或缺点并提供至少下述优点。

本公开的一个方面提供了一种多工作模式的音频设备，所述多工作模式的音频设备可以包括：音频采集单元，配置为采集用户语音；通信单元，配置为与外部设备相连，并向外部设备发送由音频采集单元采集的用户语音，并从外部设备接收对所述用户语音的声音反馈；音频输出单元，配置为在第一工作模式下，从所述通信单元接收并播放所述声音反馈；且在第二工作模式下，从音频采集单元接收并播放实时采集的用户语音。

本公开的另一方面提供了一种音频采集播放系统，包括：如上所述的音频设备；以及中央控制器，与所述音频设备相连，所述中央控制器配置为：从音频设备接收所采集的用户语音；以及确定并向所述音频设备提供针对用户语音的声音反馈，其中所述中央控制器进一步配置为根据所述用户语音，控制所述音频设备在第一工作模式和第二工作模式之间切换。

本公开的另一方面提供了一种用于音频采集和播放的方法，包括：采集用户语音；确定针对用户语音的声音反馈；以及根据所述用户语音，在第一工作模式和第二工作模式之间切换，其中在所述第一工作模式下，播放所述声音反馈；且在所述第二工作模式下，播放实时采集的用户语音。

附图说明

以下结合附图，将更清楚本公开的示例实施例的上述和其它方面、特征以及优点，附图中：

图1示出了根据本公开示例实施例的音频设备的结构框图。

图2示出了根据本公开示例实施例的音频采集播放系统的框图。

图3示出了根据本公开示例实施例的音频采集播放系统应用于家居环境下的示例的示意图。

图4示出了根据本公开示例实施例的用于音频采集和播放方法的流程图。

具体实施方式

根据结合附图对本公开示例性实施例的以下详细描述，本公开的其它方面、优势和突出特征对于本领域技术人员将变得显而易见。

在本说明书中，术语“包括”和“含有”及其派生词意为包括而非限制；术语“或”是包含性的，意为和/或。

在本说明书中，下述用于描述本公开原理的各种实施例只是说明，不应该以任何方式解释为限制发明的范围。参照附图的下述描述用于帮助全面理解由权利要求及其等同物限定的本公开的示例性实施例。下述描述包括多种具体细节来帮助理解，但这些细节应认为仅仅是示例性的。因此，本领域普通技术人员应认识到，在不背离本公开的范围和精神的情况下，可以对本文中描述的实施例进行多种改变和修改。此外，为了清楚和简洁起见，省略了公知功能和结构的描述。此外，贯穿附图，相同参考数字用于相似功能和操作。

根据本公开示例实施例的音频设备具有多工作模式，能够实施采集用户声音，根据用户声音确定用户需求，并根据用户需求在所述多工作模式之间切换，从而提供更智能化的服务，改善用户体验。此外，本公开还提供了一种包括上述音频设备的音频采集播放系统和一种用于音频采集和播放的方法。以下参考附图描述了本公开的示例实施例。

图1示出了根据本公开示例实施例的音频设备的结构框图。

如图1所示，根据本公开示例实施例的多工作模式的音频设备100可以包括：音频采集单元110，配置为采集用户语音；通信单元120，配置为与外部设备相连，并向外部设备发送由音频采集单元110采集的用户语音，并从外部设备接收对所述用户语音的声音反馈；以及音频输出单元130，配置为在第一工作模式下，从所述通信单元120接收并播放所述声音反馈；且在第二工作模式下，从音频采集单元110接收并播放实时采集的用户语音。备选地，在第二工作模式下，在播放实时采集的用户语音期间，还可以同时播放从所述通信单元120接收的声音反馈。

具体地，所述音频采集单元110可以包括具有音频采集功能的任何设备，例如，麦克风。所述音频输出单元130可以包括具有音频输出功能的任何设备，例如，扬声器。音频输出单元130可以具有两个或多个工作模式。假设音频输出单元130具有两个工作模式，在第一工作模式下，音频输出单元130可以从通信单元120接收并播放针对用户语音的音频反馈(在本描述中，将这种工作模式称作普通工作模式)。在第二工作模式下，音频输出单元130从音频采集单元110接收并播放实时采集的用户语音(在本描述中，将上述模式称作K歌模式)。备选地，与此同时，音频输出单元130还可以接收并播放来自通信模块120的声音反馈。应注意，音频输出模块130不限于上述两种工作模式，且还可以包括除了上述两种工作模式之外的其他工作模式。尽管在本说明书中将音频采集单元110和音频输出单元130描述为单独的单元，然而应注意，二者还可以集成在同一单元中，即，可以实现为具有音频收发功能的音频单元。当将音频采集单元110和音频输出单元13集成在同一单元时，所述单元同样可以在多个工作模式下进行工作，以便支持音频设备100根据用户需求在多个工作模式下进行切换。

通信单元120可以在音频设备100与外部设备之间设置通信。例如，通信单元120可以通过经由有线或无线通信与外部设备进行通信。无线通信例如可以使用以下至少一项作为蜂窝通信协议：长期演进(LET)、LTE-高级(LTE-A)、码分多址(CDMA)、宽带CDMA(WCDMA)、通用移动电信系统(UMTS)、无线宽带(WiBro)和全球移动通信系统(GSM)。此外，无线通信可以包括例如短距离通信164。短距离通信可以包括以下至少一项：例如，Wi-Fi、低能量蓝牙(BLE)、近场通信(NFC)或Zigbee。有线通信可以包括例如通用串行总线(USB)、高清多媒体接口(HDMI)、推荐标准232(RS-232)和普通老式电话服务(POTS)中的至少一个。

此外，所述外部设备可以是处理器、计算机或具有处理功能的其他设备。外部设备可以通过第二通信网络与云端或服务器相连，以便当从音频设备100接收到用户语音时，确定要响应于所述用户语音执行的操作，并提供声音反馈。

以上描述了根据本公开示例实施例的音频设备，所述音频设备能够实时采集用户声音，基于所采集的用户声音确定用户需求，并根据用户需求在所述多个工作模式之间切换，从而提供更智能化的服务，改善用户体验。下文将参考图2-3来详细描述包括所述音频设备的音频采集播放系统。

图2示出了根据本公开示例实施例的音频采集播放系统的框图。如图2所示，所述音频采集播放系统20可以包括：一个或更多个如图1所示的音频设备210A-C；以及中央控制器220，与所述音频设备210A-C相连。所述中央控制器220可以配置为：从音频设备210A-C接收所采集的用户语音；根据由所述音频设备210A-C采集的用户语音，确定并向所述音频设备210A-C提供针对用户语音的声音反馈。此外，所述中央控制器220可以进一步配置为根据所述用户语音，控制所述音频设备在第一工作模式和第二工作模式之间切换。

中央控制器220可以是单个控制器，但也可以包括两个或更多个控制单元。例如，中央控制器220可以包括通用控制器、指令集处理器和/或相关芯片组和/或专用微控制器(例如，专用集成电路(ASIC))。中央控制器220可以实现为单个集成电路(IC)芯片的部分或单个设备(例如，个人计算机)。如图所示，中央控制器220可以与用户识别设备230(诸如，摄像头、智能地板、声纹识别设备等)相连，以便更加提供个性化的服务。中央控制器220还可以配置为与诸如电视、空调、冰箱等的其他设备250相连，以便通过来自音频设备的用户语音控制所述其他设备。另一方面，中央控制器220还可以配置为与网络240相连以便根据用户需要通过网络执行相应的服务。此外，中央控制器220还可以配置为外部云相连，以便通过云服务提供针对用户需要的反馈信息。在另一示例中，中央控制器220还可以包括内部云，以便执行快速响应、个人信息备份、安全控制等功能。例如，可以将涉及个人隐私的信息备份到私有云，即，中央控制器220的内部云，以便实现对个人隐私保护。此外，还可以将与安全控制系统相关的数据存储在私有云上，以防恶意攻击者攻击外部云导致安全系统出现漏洞。当然，还可以将一些常用的信息备份到所述内部云，以便在用户需要所述信息时提供快速响应，从而提高响应速度，改善用户体验。

在一个实施例中，所述中央控制器可以被进一步配置为：响应于确定所采集的用户语音是用于切换工作模式的用户指令，根据所述用户指令在所述第一工作模式和所述第二工作模式之间切换所述音频设备。例如，当所述用户语音是用于将音频设备从普通工作模式切换到K歌模式的指令(例如，“进入K歌模式”的语音信息)时，中央控制器可以控制音频设备从当前工作模式进入K歌模式，以便播放实时采集的用户声音。当然，所述中央控制器还可以控制音频设备在播放实时采集的用户声音的同时播放音乐旋律(即，声音反馈)。

在一个实施例中，所述中央控制器可以被进一步配置为：将所采集的用户语音与歌曲库中的歌曲进行匹配；以及响应于确定所述用户语音与歌曲库中的歌曲匹配，将所述歌曲作为针对所述用户语音的声音反馈，并控制所述音频设备进入第二工作模式。所述歌曲库可以被存储在音频采集播放系统的外部云或内部云中。例如，当用户哼唱某个曲调或某首歌时，音频设备可以采集用户语音并将所述用户语音提供给中央控制器。此时，中央控制器通过对所接收的用户语音进行分析来获得与音频、音调或歌词相关的信息，并利用大数据搜索技术在被存储于外部云(诸如，互联网)和/或内部云(诸如，内部存储设备)的歌曲库中搜索与所述信息相匹配的歌曲。当搜索到相匹配的歌曲时，将所述歌曲作为针对所述用户语音的声音反馈，同时可以控制所述音频设备进入K歌模式。例如，当搜索到相匹配的歌曲时，所述系统可以通过音频设备询问用户是否要进入K歌模式，并响应于接收到用户的肯定应答，进入K歌模式。或者，所述系统也可以响应于搜索到相匹配的歌曲，直接进入K歌模式。音频采集播放系统在进行模式切换时是否需要询问用户可以取决于对音频采集播放系统的设置。

在上述情况下，所述中央控制器可以被进一步配置为：响应于接收到用于改变所述歌曲的播放模式的命令，控制所述音频设备播放相应播放模式的歌曲，其中所述播放模式包括原声模式和伴唱模式。例如，当在K歌模式下，中央控制器从音频设备接收到诸如“播放原声”/“播放伴唱”的用户指令或输入命令时，可以控制所述音频设备播放相应播放模式的歌曲。

具体地，下文将结合图3详细描述根据本公开示例实施例的音频采集播放系统应用于家居环境下的示例的示意图。

如图3所示，根据本公开示例实施例的音频设备可以布置在房间的任何位置，且中央处理器同样可以布置在任何位置。音频设备通过有线或无线的方式与中央处理器相连，从而形成音频采集播放系统。尽管图中示出了每个独立空间存在一个音频设备且整个家居环境下存在一个中央处理器，然而音频设备和中央处理器的数量和布置不限于此。

当音频设备采集到用户语音时，将所采集的用户语音传送给中央控制器。中央控制器接收来自音频设备的用户语音，首先通过对接收的用户语音进行声音和/或语义分析，来确定用户期望获取的数据或期望执行的操作，接着通过互联网技术和大数据搜索技术来搜索针对所述操作或数据的反馈数据，最后将所述反馈数据转换为声音反馈并经由音频设备提供所述声音反馈。所述用户语音可以是各种类型的声音，例如，用于执行某操作的指令、对某种信息的询问或对歌曲的哼唱。

在一个示例中，当所述用户语音是关于当前天气的询问时，中央控制器可以通过声音和/或语义分析确定用户希望知道当前天气信息，并通过使用互联网技术和/或大数据搜索技术在互联网上搜索当前天气信息，并将所述信息转换为声音反馈并经由音频设备提供给用户。

在另一示例中，当所述用户语音是用于将音频设备从普通工作模式切换到K歌模式的指令(例如，“进入K歌模式”)时，中央控制器可以控制音频设备进入K歌模式，从而播放实时采集的用户声音，或者在播放音乐旋律的同时播放实时采集的用户声音。反之亦然，当所述用户语音是用于将音频设备从K歌模式切换到普通工作模式的指令(例如，“进入K歌模式”)时，中央控制器可以控制音频设备进入普通工作模式，从而为用户提供智能语音服务。

此外，作为另一示例，所述用户语音还可以是对旋律的哼唱。当用户哼唱某首歌曲时，音频设备可以采集用户语音并将所述用户语音提供给中央控制器。中央控制器通过对所接收的用户语音进行分析以获得与音频、音调或歌词相关的信息，并利用大数据搜索技术在被存储于外部云(诸如，互联网)和/或内部云(诸如，内部存储设备)的歌曲库中搜索与所述信息相匹配的歌曲。当搜索到相匹配的歌曲时，将所述歌曲作为针对所述用户语音的声音反馈，并控制所述音频设备进入K歌模式。

在K歌模式下，所述中央控制器进一步配置为：响应于接收到用于改变所述歌曲的播放模式的命令，控制所述音频设备播放相应播放模式的歌曲，其中所述播放模式包括原声模式和伴唱模式。例如，当在K歌模式下，中央控制器从音频设备接收到诸如“播放原声”/“播放伴唱”的用户指令或输入命令时，可以控制所述音频设备播放相应播放模式的歌曲。

备选地，在如图3所示地将一个或多个音频设备布置在家居环境中的情况下，当用户从一个房间移动到另一房间时，两个房间的音频设备可以无缝地播放针对用户语音的声音反馈，而无论音频设备工作在哪种工作模式下。例如，在音频设备处于普通工作模式的情况下，当用户从卧室走到客厅时，所述音频采集播放系统根据用户位置，由通过卧室的音频设备播放当前天气改变为通过客厅的音频设备播放当前天气。相应地，在音频设备处于K歌模式的情况下，当用户从卧室走到客厅时，所述音频采集播放系统由通过卧室的音频设备播放声音反馈和实时采集的用户语音改变为通过客厅的音频设备播放声音反馈和实时采集的用户语音。这样可以提高用户体验，更智能地提供服务。

此外，图4示出了根据本公开示例实施例的用于音频采集和播放方法的流程图。

具体地，如图4所示，所示方法可以包括：在步骤S410，采集用户语音；在步骤S420，确定针对用户语音的声音反馈；以及在步骤S430，根据所述用户语音，在第一工作模式和第二工作模式之间切换，其中在所述第一工作模式下，播放所述声音反馈；且在所述第二工作模式下，播放实时采集的用户语音。备选地，在所述第二工作模式下，可以在播放所述音声反馈的同时播放实时采集的用户语音。具体地，根据所述用户语音在第一工作模式和第二工作模式之间切换可以包括：响应于确定所采集的用户语音是用于切换工作模式的用户指令，根据所述用户指令在所述第一工作模式和所述第二工作模式之间切换。

此外，所述方法还可以包括：将所采集的用户语音与歌曲库中的歌曲进行匹配；以及响应于确定所述用户语音与歌曲库中的歌曲匹配，将所述歌曲作为针对所述用户语音的声音反馈，并进入第二工作模式，例如，K歌模式。在这种情况下，所述方法还可以进一步包括：响应于接收到用于改变所述歌曲的播放模式的命令，播放相应播放模式的歌曲，其中所述播放模式包括原声模式和伴唱模式。

因此，上述音频设备、包括所述音频设备的音频采集播放系统和方法，其中所述音频设备具有多工作模式，能够实施检测用户声音，并根据用户需求在所述多工作模式之间切换，从而提供更智能化的服务，改善用户体验。

根据本公开各实施例的上述方法、装置、单元和/或模块可以通过有计算能力的电子设备执行包含计算机指令的软件来实现。该系统可以包括存储设备，以实现上文所描述的各种存储。所述有计算能力的电子设备可以包含通用处理器、数字信号处理器、专用处理器、可重新配置处理器等能够执行计算机指令的装置，但不限于此。执行这样的指令使得电子设备被配置为执行根据本公开的上述各项操作。上述各设备和/或模块可以在一个电子设备中实现，也可以在不同电子设备中实现。这些软件可以存储在计算机可读存储介质中。计算机可读存储介质存储一个或多个程序(软件模块)，所述一个或多个程序包括指令，当电子设备中的一个或多个处理器执行所述指令时，所述指令使得电子设备执行本公开的方法。

这些软件可以存储为易失性存储器或非易失性存储装置的形式(比如类似ROM等存储设备)，不论是可擦除的还是可重写的，或者存储为存储器的形式(例如RAM、存储器芯片、设备或集成电路)，或者被存储在光可读介质或磁可读介质上(比如，CD、DVD、磁盘或磁带等等)。应该意识到，存储设备和存储介质是适于存储一个或多个程序的机器可读存储装置的实施例，所述一个程序或多个程序包括指令，当所述指令被执行时，实现本公开的实施例。实施例提供程序和存储这种程序的机器可读存储装置，所述程序包括用于实现本公开的任何一项权利要求所述的装置或方法的代码。此外，可以经由任何介质(比如，经由有线连接或无线连接携带的通信信号)来电传递这些程序，多个实施例适当地包括这些程序。

根据本公开各实施例的方法、装置、单元和/或模块还可以使用例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC)或可以以用于对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及固件三种实现方式的适当组合来实现。该系统可以包括存储设备，以实现上文所描述的存储。在以这些方式实现时，所使用的软件、硬件和/或固件被编程或设计为执行根据本公开的相应上述方法、步骤和/或功能。本领域技术人员可以根据实际需要来适当地将这些系统和模块中的一个或多个，或其中的一部分或多个部分使用不同的上述实现方式来实现。这些实现方式均落入本公开的保护范围。

如本领域技术人员将会理解的，为了任何的以及所有的目的，例如在提供书面说明书的方面，本申请中所公开的所有范围也涵盖任何的以及所有的可能的子范围以及其子范围的组合。任何所列出的范围均能够被容易地识别成充分的描述以及使同样的范围能够至少被分解成同等的两部分、三部分、四部分、五部分、十部分，等等。作为非限制性的例子，本申请中所讨论的每个范围均能够被容易地分解成下三分之一、中三分之一以及上三分之一等等。如本领域技术人员还将会理解的，诸如“直到”、“至少”、“大于”、“小于”等的所有语言均包括所表述的数量并且是指能够随之被分解成如以上所讨论的子范围的范围。最后，如本领域技术人员将会理解的，范围包括各个单独的成分。所以，例如，具有1-3个单元的组是指具有1、2或者3个单元的组。类似地，具有1-5个单元的组是指具有1、2、3、4或者5个单元的组，等等。

尽管已经参照本公开的特定示例性实施例示出并描述了本公开，但是本领域技术人员应该理解，在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下，可以对本公开进行形式和细节上的多种改变。因此，本公开的范围不应该限于上述实施例，而是应该不仅由所附权利要求来进行确定，还由所附权利要求的等同物来进行限定。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑婉秋
技术所有人：联想（北京）有限公司
我是此专利的发明人

上一篇：音频播放方法及装置与流程
上一篇：一种应用于智能交通的拼装式摄像头支撑装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。