数字语音助理计算设备当中的信号处理协调的制作方法

文档序号:21849744发布日期:2020-08-14 17:24阅读:139来源:国知局
数字语音助理计算设备当中的信号处理协调的制作方法

背景技术
:计算设备可以被范围内的另一计算设备无线地发现。但是,随着更多计算设备在可发现范围内,计算设备均可以彼此连接,从而带来计算设备之间不期望的干扰的风险,并增加不必要的网络带宽使用和处理器利用。技术实现要素:至少一个方面针对一种在语音驱动的计算环境中在计算设备当中协调信号处理的系统。该系统可以包括多个数字助理计算设备,所述多个数字助理计算设备包括第一数字助理计算设备和第二数字助理计算设备。多个数字助理计算设备可以能够操作用于控制多个网络连接的设备。该系统可以包括数据处理系统,该数据处理系统包括一个或多个处理器和存储器以执行协调器组件和直接动作应用编程接口(“api”)。数据处理系统可以将第一数字助理计算设备设置为主信号处理器,并且可以将第二数字助理计算设备设置为辅助信号处理器。该系统可以包括第一数字助理计算设备的传感器以检测输入的音频信号。该系统可以包括由第一数字助理计算设备执行的信号质量检查器,以确定由第一数字助理计算设备的传感器检测到的输入的音频信号满足用于信号处理的阈值。信号质量检查器可以将第一数字助理计算设备能够操作用于处理输入音频信号的指示传输到数据处理系统。该系统可以包括第二数字计算设备的传感器以检测输入音频信号。该系统可以包括由第二数字助理计算设备执行的信号质量检查器,以确定由第二数字助理计算设备的传感器检测到的输入音频信号满足用于信号处理的阈值。第二数字助理计算设备可以将第二数字助理计算设备能够操作用于处理输入音频信号的指示传输到数据处理系统。数据处理系统的协调器组件可以从第一数字助理计算设备接收指示,并从第二数字助理计算设备接收指示。数据处理系统的协调器组件可以基于第一数字助理计算设备被设置为主信号处理器和第一数字助理计算设备能够操作用于处理输入音频信号的指示来选择第一数字助理处理输入音频信号。数据处理系统的协调器组件可以指令第一数字助理计算设备处理输入的音频信号。数据处理系统的协调器组件可以指令第二数字助理计算设备进入待机模式,以防止第二数字助理计算设备处理输入的音频信号。直接动作api可以从第一数字助理计算设备接收包括命令的数据分组。该命令可以由第一数字助理基于输入音频信号来生成。直接动作api可以基于命令针对从多个网络连接的设备中选择的网络连接的设备生成动作数据结构。直接动作api可以将动作数据结构传输到网络连接的设备以控制网络连接的设备。至少一个方面针对一种在语音驱动的计算环境中在计算设备当中协调信号处理的方法。该方法可以包括第一数字助理计算设备的传感器检测输入音频信号。该方法可以包括由第一数字助理计算设备执行的信号质量检查器确定由第一数字助理计算设备的传感器检测到的输入音频信号满足用于信号处理的阈值。该方法可以包括第一数字助理计算设备向包括一个或多个处理器和存储器的数据处理系统传输第一数字助理计算设备能够操作用于处理输入音频信号的指示。该方法可以包括通过第二数字计算设备的传感器来检测输入音频信号。该方法可以包括,由第二数字助理计算设备执行的信号质量检查器确定第二数字助理计算设备的传感器检测到的输入音频信号满足用于信号处理的阈值。该方法可以包括将第二数字助理计算设备能够操作用于处理输入音频信号的指示传输到数据处理系统。该方法可以包括由数据处理系统接收来自第一数字助理计算设备的指示和来自第二数字助理计算设备的指示。该方法可以包括由数据处理系统基于第一数字助理计算设备设置为主信号处理器和第一数字助理计算设备能够操作用于处理输入音频信号的指示来选择。第一数字助理处理输入的音频信号。该方法可以包括数据处理系统指令第一数字助理计算设备处理输入音频信号。该方法可以包括数据处理系统指令第二数字助理计算设备进入待机模式以防止第二数字助理计算设备处理输入音频信号。该方法可以包括数据处理系统从第一数字助理计算设备接收包括命令的数据分组。该命令可以由第一数字助理基于输入音频信号来生成。该方法可以包括数据处理系统基于该命令针对从多个网络连接的设备中选择的网络连接的设备生成动作数据结构。该方法可以包括数据处理系统将动作数据结构传输到网络连接的设备以控制网络连接的设备。至少一个方面针对一种数字助理计算设备。数字助理计算设备可以包括传感器,其用于检测输入音频信号。该数字助理计算设备可以包括音频驱动器和由预处理器组件执行的信号质量检查器。预处理器组件可以耦合到传感器和音频驱动器。预处理器组件可以确定由数字助理计算设备的传感器检测到的输入音频信号满足用于信号处理的阈值。预处理器组件可以经由网络将数字助理计算设备能够操作用于处理输入音频信号的指示传输到数据处理系统以使数据处理系统从数字助理计算设备接收该指示。数据处理系统可以确定将数字计算设备设置为主信号处理器,并且将检测输入音频信号的第二数字计算设备设置为辅助信号处理器。第二数字计算设备能够操作用于处理输入音频信号。数据处理系统可以基于数字助理计算设备被设置为主信号处理器和数字助理计算设备能够操作用于处理输入音频信号的指示来选择数字助理以处理输入音频信号。数据处理系统可以向数字助理计算设备传输处理输入音频信号的指令。数据处理系统可以向第二数字助理计算设备传输进入待机模式的指令,以防止第二数字助理计算设备处理输入音频信号。数字助理计算设备的预处理器组件可以接收指令以处理输入音频信号。数字助理计算设备的预处理器组件可以基于输入音频信号生成包括命令的数据分组。数字助理计算设备的预处理器组件可以将数据分组传输到数据处理系统,以使数据处理系统基于从数字计算设备接收到的命令针对从多个网络连接的设备中选择的网络连接的设备生成动作数据结构。数据处理系统可以将动作数据结构传输到网络连接的设备以控制网络连接的设备。数据处理系统可以确定音频输入信号包括使用第二数字助理计算设备的指令,并且选择第一数字助理来处理输入音频信号可以包括覆写(override)使用第二数字助理计算设备的指令。多个数字助理计算设备可以是异构设备。例如,第一数字助理计算设备可以包括第一类型的设备,并且第二数字助理计算设备可以包括第二类型的设备。第一数字助理计算设备、第二数字助理计算设备和网络连接的设备中的每一个可以被配置有助理软件开发工具包。第一类型的设备可以包括扬声器设备、电视设备、移动设备和可穿戴设备中的至少一个。第二类型的设备可以包括扬声器设备、电视设备、移动设备和可穿戴设备中的至少一个。网络连接的设备可以包括扬声器设备、电视设备、移动设备、可穿戴设备、数字灯、数字恒温器、数字电器和数字汽车中的至少之一。该方法可以进一步包括,在数据处理系统处,轮询第一数字助理计算设备以获得第一数字助理计算设备的一个或多个特性;轮询第二数字助理组件以获得第二数字助理计算设备的一个或多个特性;基于第一数字助理计算设备的一个或多个特性与第二数字助理计算设备的一个或多个特性的比较,确定将第一数字助理计算设备设置为主信号处理器,并且将第二数字助理计算设备设置为辅助信号处理器;以及将第一数字助理计算设备设置为主信号处理器,并且将第二数字助理计算设备设置为辅助信号处理器。该方法可以进一步包括:由数据处理系统在存储器中的集中式账户中存储第一数字助理计算设备和网络连接的设备之间的第一链接以及第二数字助理计算设备和网络连接的设备之间的第二链接。响应于对第一数字助理计算设备的选择并且基于第一链接,数据处理系统可以访问集中式账户,以响应于检索信息以生成动作数据结构。集中式账户可以存储与具有到第一数字助理和第二数字助理中至少一个的链接的多个异构网络连接的设备相关联的信息。数据处理系统可以基于机器学习模型来确定将第一数字助理计算设备设置为主信号处理器。数据处理系统可以检测到第一数字助理计算设备的状态的变化,并且基于第一数字助理计算设备的状态的变化,将第二数字助理计算设备切换为主信号处理器,并将第一数字助理计算设备切换为辅助信号处理器。数据处理系统可以基于机器学习模型来确定用于信号处理的阈值,并将该阈值存储在存储器中的集中式账户中。第一数字助理计算设备的传感器可以接收第二输入音频信号。由第一数字助理计算设备执行的信号质量检查器可以确定由第一数字助理计算设备的传感器检测到的第二输入音频信号不满足用于信号处理的阈值,并且可以将第一数字助理计算设备不能够操作用于处理第二输入音频信号的指示传输到数据处理系统。第二数字助理计算设备的传感器可以接收第二输入音频信号。由第二数字助理计算设备执行的信号质量检查器可以确定由第二数字助理计算设备的传感器检测到的第二输入音频信号满足用于信号处理的阈值,并且可以将第二数字助理计算设备能够操作用于处理第二输入音频信号的指示传输给数据处理系统。数据处理系统可以从第一数字助理计算设备接收第一数字助理计算设备不能够操作用于处理第二输入音频信号的指示,从第二数字助理计算设备接收第二数字助理计算设备能够操作用于处理第二输入音频信号的指示,并基于第一数字助理计算设备不能够操作用于处理第二输入音频信号以及第二数字助理计算设备能够操作用于处理第二输入音频信号,选择第二数字助理计算处理第二输入音频信号。直接动作api可以从第二数字助理计算设备接收包括第二命令的数据分组。至少一个方面针对一种系统,该系统被配置成在语音驱动的计算环境中执行在计算设备当中协调信号处理的方法。例如,该系统可以包括多个数字助理计算设备,所述多个数字助理计算设备包括第一数字助理计算设备和第二数字助理计算设备。该系统可以包括网络连接的设备,其执行由第一数字助理计算设备和第二数字助理计算设备两者均可控制的接口。该系统可以包括数据处理系统,该数据处理系统包括一个或多个处理器和存储器以执行协调器组件和直接动作应用编程接口(“api”)。数据处理系统可以将第一数字助理计算设备设置为主信号处理器,并且可以将第二数字助理计算设备设置为辅助信号处理器。该系统可以包括第一数字助理计算设备的传感器以检测输入的音频信号。该系统可以包括由第一数字助理计算设备执行的信号质量检查器以确定由第一数字助理计算设备的传感器检测到的输入音频信号满足用于信号处理的阈值。信号质量检查器可以将第一数字助理计算设备能够操作用于处理输入音频信号的指示传输到数据处理系统。该系统可以包括第二数字计算设备的传感器以检测输入音频信号。该系统可以包括由第二数字助理计算设备执行的信号质量检查器以确定由第二数字助理计算设备的传感器检测到的输入音频信号满足用于信号处理的阈值。第二数字助理计算设备可以将第二数字助理计算设备能够操作用于处理输入音频信号的指示传输到数据处理系统。数据处理系统的协调器组件可以从第一数字助理计算设备接收指示,并从第二数字助理计算设备接收指示。数据处理系统的协调器组件可以基于第一数字助理计算设备被设置为主信号处理器和第一数字助理计算设备能够操作用于处理输入音频信号的指示来选择第一数字助理以处理输入音频信号。数据处理系统的协调器组件可以指令第一数字助理计算设备处理输入的音频信号。数据处理系统的协调器组件可以指令第二数字助理计算设备进入待机模式,以防止第二数字助理计算设备处理输入的音频信号。直接动作api可以从第一数字助理计算设备接收包括命令的数据分组。该命令可以由第一数字助理基于输入音频信号来生成。直接动作api可以基于命令生成动作数据结构。直接动作api可以将动作数据结构传输到网络连接的设备以控制网络连接的设备。至少一个方面针对一种数字助理设备,该数字助理设备被配置成在语音驱动的计算环境中执行在计算设备当中协调信号处理的方法。例如,数字助理设备可以包括传感器以检测输入的音频信号。该数字助理设备可以包括音频驱动器和由预处理器组件执行的信号质量检查器。预处理器组件可以耦合到传感器和音频驱动器。预处理器组件可以确定由数字助理计算设备的传感器检测到的输入音频信号满足用于信号处理的阈值。预处理器组件可以经由网络将数字助理计算设备能够操作用于处理输入音频信号的指示传输到数据处理系统以使数据处理系统从数字助理计算设备接收该指示。数据处理系统可以确定将数字计算设备设置为主信号处理器,并且将检测输入音频信号的第二数字计算设备设置为辅助信号处理器。第二数字计算设备能够操作用于处理输入音频信号。数据处理系统可以基于数字助理计算设备被设置为主信号处理器和数字助理计算设备能够操作用于处理输入音频信号的指示,来选择数字助理来处理输入音频信号。数据处理系统可以向数字助理计算设备传输处理输入的音频信号指令。数据处理系统可以向第二数字助理计算设备传输进入待机模式的指令,以防止第二数字助理计算设备处理输入音频信号。数字助理计算设备的预处理器组件可以接收处理输入音频信号指令。数字助理计算设备的预处理器组件可以基于输入音频信号生成包括命令的数据分组。数字助理计算设备的预处理器组件可以将数据分组传输到数据处理系统,以使数据处理系统基于从数字计算设备接收的命令来生成动作数据结构。数据处理系统可以将动作数据结构传输到网络连接的设备以控制网络连接的设备。数字助理设备可以包括音频驱动器和扬声器组件。预处理器组件可以接收传输到网络连接的设备的动作数据结构的状态的指示,并指令音频驱动器生成输出音频信号,以使扬声器组件传输与状态的指示相对应的音频输出。这些和其他方面以及实施方式将在下面详细讨论。前述信息和以下具体实施方式包括各个方面和实施方式的说明性示例,并提供用于理解所要求保护的方面和实施方式的性质和特性的概述或框架。附图提供对各个方面和实施方式的图示和进一步的理解,并且被并入本说明书中并构成本说明书的一部分。附图说明附图无意按比例绘制。在各个附图中,相似的附图标记和名称指示相似的元素。为了清楚起见,并非在每个附图中都标记了每个组件。在附图中:图1是在语音驱动的计算环境中在计算设备当中协调信号处理的系统的图示。图2是在语音驱动的计算环境中在计算设备当中协调信号处理的系统的操作的图示。图3是在语音驱动的计算环境中在计算设备当中协调信号处理的方法的图示。图4是图示可以被采用以实现本文描述和图示的系统和方法的元件的计算机系统的总体架构的框图。具体实施方式以下是与经由计算机网络路由分组化动作的方法、装置和系统有关以及其实施方式的各种概念的更详细描述。可以以许多方式中的任何一种来实现上面介绍的和下面将更详细讨论的各种概念。本公开总体上针对在数字语音助理计算设备之间协调信号处理。例如,多个网络连接的设备可以位于房间内,并且处于开启、始终开启、可发现或始终可发现的模式。当网络连接的设备可发现时,数字助理计算设备可以响应于指令或命令来尝试控制网络连接的设备。如果多个数字助理计算设备位于房间中,则每个数字助理计算设备可以响应于语音查询而尝试与相同的网络连接的设备进行交互或控制该网络连接的设备。此外,如果存在能够由一个或多个数字助理计算设备控制的多个网络连接的设备,则系统可能会错误地控制错误的网络连接的设备。因此,在其中多个数字助理计算设备可以接收语音命令并且控制多个网络连接的设备的基于语音的计算环境中,由于冗余处理可能会浪费计算资源,或者由于传输到不正确的网络控制的设备的冗余命令可能会出现错误。例如,如果语音命令是要升高客厅中的温度,并且两个数字助理计算设备检测到语音命令,则它们都可能不经意地向房屋中的多个恒温器(例如,客厅恒温器和卧室恒温器)发送指令来升高温度,从而导致恒温器两次升高温度,或导致多个恒温器升高温度,或导致错误的恒温器忽略指令,从而导致计算资源浪费。本解决方案的系统和方法在数字语音助理计算设备或网络连接的设备当中协调信号处理。数字语音助理计算设备均可以检测相同的输入音频信号,并且然后将指示传输到集中式数据处理系统。数据处理系统可以解析输入的音频信号或携载输入的音频信号的数据分组,从多个网络连接的设备中选择网络连接的设备,并为所选择的网络连接的设备生成动作数据结构。数据处理系统可以将动作数据结构传输到对应的网络连接的设备以执行期望的动作。数据处理系统可以使用机器学习来选择数字助理计算设备或网络连接的设备之一来执行动作。例如,可能存在可以执行所期望的操作的多个网络连接的设备。数据处理系统可以利用机器学习来选择网络连接的设备以执行所期望的操作。在一些情况下,数据处理系统可以利用平局决胜(tie-breaking)逻辑来选择联网的计算设备之一来执行该动作。图1图示示例系统100,其在语音驱动的计算环境中在计算设备当中协调信号处理。系统100可以包括内容选择基础架构。系统100可以包括数据处理系统102。数据处理系统102可以经由网络105与数字助理计算设备104或网络连接的设备106中的一个或多个通信。网络105可以包括计算机网络,诸如互联网、局域网、广域网、城域网或其他区域网、内联网、卫星网络以及诸如语音或数据移动电话网络的其他通信网络。网络105可以用于访问信息资源,诸如可以在至少一个数字助理计算设备104上呈现、输出、渲染或显示的网页、网站、域名或统一资源定位符。例如,经由网络105,数字助理计算设备104的用户可以访问由数据处理系统102提供的信息或数据,或者与网络连接的设备106进行交互。网络105可以是任何类型或形式的网络,并且可以包括以下任何一种:点对点网络、广播网络、广域网、局域网、电信网络、数据通信网络、计算机网络、atm(异步传输模式)网络、sonet(同步光网络)网络、sdh(同步数字体系)网络、无线网络和有线网络。网络105可以包括无线链路,诸如红外信道或卫星频带。网络105的拓扑可以包括总线、星形或环形网络拓扑。该网络可以包括使用被用于在移动设备当中进行通信的任何一个或多个协议的移动电话网络,所述协议包括高级移动电话协议(“amps”)、时分多址(“tdma”)、码分多址(“cdma”)、全球移动通信系统(“gsm”)、通用分组无线业务(“gprs”)或通用移动电信系统(“umts”)。可以经由不同的协议传输不同类型的数据,或者可以经由不同的协议传输相同类型的数据。系统100可以包括一个或多个数字助理计算设备104。数字助理计算设备104可以包括或指代膝上型计算机、台式计算机、平板计算机、计算设备、本地计算设备、智能电话、便携式计算机或扬声器,其配置有数字助理软件开发工具包或功能以提供基于语音的交互。数字助理计算设备104可以包括或可以不包括显示器;例如,计算设备可以包括有限类型的用户接口,诸如麦克风和扬声器。在一些情况下,数字助理计算设备104的主要用户接口可以是麦克风和扬声器或语音接口。虽然数字助理计算设备104可以指代硬件设备,但是在一些情况下,数字助理计算设备104可以指代硬件和软件组件的组合。在一些情况下,数字助理计算设备104可以指代软件组件或模块,诸如在计算设备104上执行的应用,其被配置成执行与本公开的系统和方法相关联的一个或多个功能。数字助理计算设备104可以包括至少一个光源126、传感器128、换能器130、音频驱动器132或预处理器134,与至少一个光源126、传感器128、换能器130、音频驱动器132或预处理器134对接或以其他方式与其通信。光源126可以包括光指示器、发光二极管(“led”)、有机发光二极管(“oled”)或其他配置成提供视觉或光学输出的视觉指示器。传感器128可以包括例如环境光传感器、接近传感器、温度传感器、加速计、陀螺仪、运动检测器、gps传感器、位置传感器、麦克风或触摸传感器。换能器130可以包括扬声器或麦克风。音频驱动器132可以向硬件换能器130提供软件接口。音频驱动器可以执行音频文件或由数据处理系统102提供的其他指令,以控制换能器130产生对应的声波或音波。预处理器134可以包括具有硬件的处理单元,其被配置成检测关键字并基于关键字执行动作。预处理器134可以在将词项(term)传输到数据处理系统102以进行进一步处理之前过滤掉一个或多个词项或修改词项。预处理器134可以将由麦克风检测到的模拟音频信号转换为数字音频信号,并且经由网络105将携载数字音频信号的一个或多个数据分组传输到数据处理系统102。在一些情况下,预处理器134可以响应于检测到执行这种传输的指令来传输携载一些或全部输入音频信号的数据分组。该指令可以包括例如触发关键字或其他关键字或批准以将包括输入音频信号的数据分组传输到数据处理系统102。预处理器134可以包括或执行信号质量检查器136,其检测输入信号并确定输入信号是否满足用于信号处理的阈值。数字助理计算设备104可以与最终用户相关联,该最终用户将语音查询作为音频输入(经由传感器128)录入到数字助理计算设备104中,并以计算机生成的语音形式接收从换能器130(例如,扬声器)输出的音频输出,该计算机生成的语音可以从数据处理系统102提供给本地客户数字助理计算设备104。计算机生成的语音可以包括来自真实人的录音或计算机生成的语言。数字助理计算设备104可以定位在允许用户使用语音输入或其他输入与数字助理计算设备104交互的位置。数字助理计算设备104可以位于远离远程服务器(诸如数据处理系统102)。数字助理计算设备104可以被定位在房屋、公寓大厦、公寓房间、办公室、酒店房间、购物中心、小卧室或用户可以使用语音输入与数字助理计算设备104进行交互的其他建筑物或住所,而数据处理系统102可以远程位于例如数据中心。系统100可以包括多个数字助理计算设备104,其能够操作用于从用户接收输入音频信号。例如,第一数字助理计算设备104和第二数字助理计算设备104可以被放置、定位或以其他方式位于地区、区域或房间内,使得第一数字助理计算设备104和第二数字助理计算都设备104都可以检测输入音频信号。输入音频信号可以包括由最终用户提供或说出的语音或声波。可以由第一数字助理计算设备104和第二数字助理计算设备104两者检测输入音频信号。输入音频信号可以不包括指定第一数字助理计算设备104或第二数字助理计算设备104中的一个将处理输入音频信号的标识信息。在某些情况下,输入音频信号可以包括标识信息,该标识信息指定第一数字助理计算设备104或第二数字助理计算设备104中的哪一个将处理输入音频信号。标识信息可以包括指派给第一或第二数字助理计算设备104的标签或其他标识符,诸如“第一”、“家庭”、“客厅”或“厨房”。标识信息可以包括字母数字值。在一些情况下,如果输入音频信号包括可用于选择第一或第二数字计算设备104中的一个以进行进一步处理的标识信息,则数据处理系统102可以指令对应的数字助理计算设备执行进一步的信号处理。在一些情况下,数据处理系统102可以确定覆写标识信息,并选择在输入音频信号中可能未标识的数字助理计算设备104。数据处理系统102可以基于策略确定在输入音频信号中未标识的数字助理计算设备相对于在输入音频信号中标识的数字助理计算设备可能更适合于处理输入音频信号。在输入音频信号中未标识的数字助理计算设备可能更适合处理输入音频信号,因为其可能已经检测到更高质量版本的输入音频信号(例如,输入音频信号的源可能位于更近的位置,或者麦克风的质量可能更高),处理器速度更快,可用存储器更多,网络连接速度更快,剩余的电池电量更多或者连接到电源插座,或者具有更多或更高质量的输入/输出接口(例如,多个麦克风、扬声器、显示器、触摸接口、手势接口、传感器、键盘或鼠标)。以这种方式,系统100可以促进对输入音频信号的更准确的处理。数字助理计算设备104可以包括,访问信号质量检查器136或以其它方式与信号质量检查器136交互。信号质量检查器136可以指代硬件或软件组件或模块。信号质量检查器136可以包括一个或多个处理器、电路、逻辑阵列、应用、程序、应用编程接口或其他组件或模块。信号质量检查器136可以包括至少一个处理单元或其他逻辑设备,诸如可编程逻辑阵列引擎,或配置成与预处理器134、传感器128、换能器130或音频驱动器132通信的模块。信号质量检查器136和预处理器134可以是单个组件或数字助理计算设备104的一部分。数字助理计算设备104可以包括硬件元件,诸如一个或多个处理器、逻辑设备或电路。信号质量检查器136可以接收检测到的输入音频信号,并分析输入音频信号以确定输入音频信号的质量参数。信号质量检查器136可以确定输入音频信号的质量参数是否满足阈值。信号质量检查器136可以确定检测到的输入音频信号是否具有足够的质量以进行进一步的信号处理。为了处理输入音频信号,数字助理计算设备104可以检测一定质量水平的输入音频信号。例如,如果由数字助理计算设备104检测到的输入音频信号的质量低或差,则数字助理计算设备104对输入音频信号的下游处理可能是错误的、不可靠的、失败的,或者要求有过多的处理器或存储器利用率。在一些情况下,下游处理可能会生成其他提示,诸如音频提示,要求最终用户重复某些词项。在一些情况下,错误的下游处理可能导致具有错误指令或命令的动作数据结构被传输到不正确的网络连接的设备106。因此,因为系统100可能包括多个数字助理计算设备104,所以检查由多个数字助理计算设备104接收到的输入音频信号的质量,并且选择数字助理计算设备104中的一个进行进一步的信号处理可以减少错误,降低处理器利用率,减少存储器消耗,同时增加信号处理的准确性并生成具有正确的指令和命令的动作数据结构。质量参数可以包括例如,信噪比(例如,以分贝为单位的信号强度作为与本底噪声之比)、采样率、无杂散动态范围(例如,基本信号与最强杂散信号的强度之比;可以定义为在模数转换器输入端处的载波或者最大信号分量的均方根(“rms”)值与下一个最大噪声或者谐波失真分量的rms值之比);总谐波失真比(例如,对输入音频信号中存在的谐波失真的测量,并且可以定义为谐波分量的功率之和与基本频率的功率之比);频率范围;或动态范围。附加质量参数可以基于语音辨识质量度量,诸如词错误率(例如,通过将参考转录与语音辨识器输出的转录进行比较来计算)、词准确性或与词准确性相关联的置信度(例如,由预处理器134指派的、预处理器134准确地辨识输入信号中的词的可能性)。例如,信号质量检查器136可以将策略应用于输入音频信号以确定输入音频信号是否满足阈值。信号质量检查器136可以从数据处理系统102获得策略。信号质量检查器136可以从账户数据结构118或阈值数据结构120接收策略,账户数据结构118或阈值数据结构120可以存储一个或多个策略以及相关联的阈值以供使用以应用该政策。例如,该策略可以是将信噪比与阈值信噪比进行比较。阈值snr可以是动态的。可以基于历史机器学习模型来设置阈值snr。可以针对一种类型的数字助理计算设备104来定制阈值snr。可以基于数字助理计算设备的特性(例如,麦克风的数量或麦克风的其他特性)来定制阈值snr。阈值snr可以应用于通过组合或求和从同一数字助理计算设备104的多个麦克风检测到的多个输入音频信号而确定的聚合输入音频信号。阈值snr可以是例如-18db、-15db、-12db、-9db、-6db、-3db、0db、3db、6db或一些其它值。如果输入信号的信噪比大于或等于阈值,则信号质量检查器136确定由第一数字助理计算设备104检测到的输入信号满足阈值。如果信号质量检查器136确定输入音频信号的质量参数满足阈值,则信号质量检查器136可以确定第一数字助理计算设备104能够操作用于处理输入音频信号,因为检测到具有足够的质量的输入音频信号以在没有过多错误的情况下可靠且准确地处理输入音频信号。在一些情况下,信号质量检查器136可以分析输入音频信号的一部分以确定检测到的输入音频信号的质量。信号质量检查器136可以分析完整检测到的输入音频信号。信号质量检查器136可以分析输入音频信号的预定部分(例如,前1秒、前2秒、3秒、4秒、5秒、10秒)。在一些情况下,信号质量检查器136可以对检测到的输入音频信号的一部分执行语音到文本的辨识,以确定检测到的输入音频信号的质量是否令人满意。在一些情况下,数字助理计算设备104可以将输入的音频信号传输到数据处理系统102,并且数据处理系统102可以执行信号质量检查。例如,信号质量检查器136可以在数据处理系统102上执行。数字助理计算设备104可以将输入音频信号的预定部分(例如,前1秒、2秒、3秒或5秒)传输到数据处理系统102,并且数据处理系统102可以对信号执行信号质量检查。数据处理系统102在执行信号质量检查后,可以指令数字助理计算设备104之一对输入的音频信号执行进一步的处理。信号质量检查器136可以向数据处理系统102传输指示。信号质量检查器136可以传输数字助理计算设备104能够操作用于处理输入音频信号的指示。如果信号质量检查器136确定检测到具有足够的质量的输入音频信号以可靠且准确地执行下游处理,则信号质量检查器136可以响应于该确定而传输数字助理计算设备104能够操作用于处理输入音频信号。信号质量检查器136可以传输数字助理计算设备104不能够操作用于处理输入音频信号的指示。如果信号质量检查器136确定检测到的输入音频信号不具有足够的质量(例如,snr低于阈值),则信号质量检查器136可以响应于该确定而传输数字助理计算设备不能够操作用于处理所检测到的输入音频信号的指示。系统100可以包括、访问至少一个网络连接的设备106或以其它方式与其交互。网络连接的设备106可以指代第三方设备。网络连接的设备106可以包括至少一个逻辑设备,诸如具有处理器或电路以经由网络105与例如数字助理计算设备104或数据处理系统102进行通信的计算设备。网络连接的设备106可以包括至少一个计算资源、服务器、处理器或存储器。例如,网络连接的设备106可以包括位于至少一个数据中心中的多个计算资源或服务器。网络连接的设备106可以包括或指代物联网设备。网络连接的设备106可以包括例如扬声器设备、电视设备、移动设备、可穿戴设备、数字灯、数字恒温器、数字电器或数字汽车中的至少一个。例如,数字助理计算设备104可以控制包括数字灯的网络连接的设备106的输出光强度水平。数字助理计算设备104可以检测来自最终用户的具有,调整光强度(例如,降低强度、增加强度、关闭光源或打开光源)的命令的输入音频信号,并且然后将命令提供给网络连接的设备106(例如,经由数据处理系统102)。系统100可以包括至少一个数据处理系统102。数据处理系统102可以包括至少一个逻辑设备,诸如具有处理器以经由网络105例如与数字助理计算设备104或网络连接的设备106进行通信的计算设备。数据处理系统102可以包括至少一个计算资源、服务器、处理器或存储器。例如,数据处理系统102可以包括位于至少一个数据中心中的多个计算资源或服务器。数据处理系统102可以包括多个按逻辑分组的服务器,并且促进分布式计算技术。服务器的逻辑组可以称为数据中心、服务器群或机器群。服务器也可以在地理位置上分散。数据中心或机器群可以作为单个实体进行管理,或者机器群可以包括多个机器群。每个计算机群中的服务器可以是异构的-一个或多个服务器或机器可以根据一种或多种类型的操作系统平台进行操作。机器群中的服务器可以与关联的存储系统一起存储在高密度机架系统中,并且可以位于企业数据中心中。例如,通过使服务器和高性能存储系统位于本地化的高性能网络上,以这种方式整合服务器可以改善系统的可管理性、数据安全性、系统的物理安全性和系统性能。包括服务器和存储系统在内以及将它们与高级系统管理工具耦合在一起的数据处理系统102组件的全部或者一些的集中化,可以更有效率地利用服务器资源,其节省功率和处理需求并减少带宽使用。数据处理系统102可以包括至少一个接口108、与至少一个接口108对接或以其他方式与其通信。数据处理系统102可以包括至少一个自然语言处理器组件110、与至少一个自然语言处理器组件110对接,或以其他方式与其通信。数据处理系统102可以包括至少一个协调器组件112、与至少一个协调器组件112对接,或以其他方式与其通信。协调器组件112可以协调数字助理计算设备当中的信号处理。数据处理系统102可以包括至少一个直接动作应用编程接口(“直接动作api”)114、与至少一个直接动作应用编程接口(“直接动作api”)114对接或以其他方式与其通信。数据处理系统102可以包括至少一个数据存储库116,与至少一个数据存储库116对接或以其他方式与其通信。数据存储库116可以包括一个或多个本地或分布式数据库,并且可以包括数据库管理系统。数据存储库116可以包括计算机数据存储或存储器,并且可以存储一个或多个账户118、一个或多个阈值120、一个或多个模型122或一个或多个模板124。账户数据结构118可以指代中央账户或者集中式账户,其可以包括与数字助理计算设备104或网络连接的设备106相关联的信息。该信息可以包括状态信息、模式信息、链接或简档信息。阈值数据结构120可以包括可以由信号质量检查器136用来确定所检测的音频信号的质量是否足以进行信号处理的阈值的值。阈值可以包括数字值或字母数字值。模板124可以包括直接动作api114用来生成动作数据结构的字段和值。模型122可以指代机器学习模型。例如,可以基于与数字助理计算设备104相关联的历史指示来生成机器学习模型122。可以基于由数字助理计算设备104检测到的输入音频信号的历史质量参数值来生成机器学习模型。可以基于与数字助理计算设备104相关联的特性或配置来生成机器学习模型。接口108、nlp组件110、协调器组件112或直接动作api114可以均包括至少一个处理单元或其他逻辑设备,诸如可编程逻辑阵列引擎、或配置成与数据库存储库或数据存储库116通信的模块。接口108、自然语言处理器组件110、协调器组件112、直接动作api114或数据存储库116可以是单独的组件、单个组件或数据处理系统102的一部分。系统100及其组件,诸如数据处理系统102,可以包括诸如一个或多个处理器、逻辑设备或电路的硬件元件。数据处理系统102可以获得与多个计算设备104相关联的匿名计算机网络活动信息。数字助理计算设备104的用户可以肯定地核准数据处理系统102获得与数字助理计算设备104相对应的网络活动信息。例如,数据处理系统102可以提示数字助理计算设备104的用户同意获得一种或多种类型的网络活动信息。数字助理计算设备104的用户身份可以保持匿名,并且计算设备104可以与唯一标识符(例如,该用户的唯一标识符或数据处理系统提供的计算设备的唯一标识符或者计算设备的用户的唯一标识符)相关联。数据处理系统可以将每个观察与对应的唯一标识符相关联。数据处理系统102可以包括接口108,其被设计、被配置、被构造或操作以使用例如数据分组来接收和传输信息。接口108可以使用一种或多种协议(诸如网络协议)来接收和传输信息。接口108可以包括硬件接口、软件接口、有线接口或无线接口。接口108可以促进将数据从一种格式转换或格式化为另一种格式。例如,接口108可以包括应用编程接口,该应用编程接口包括用于在诸如软件组件的各种组件之间进行通信的定义。接口108可以经由网络105与数字助理计算设备104或网络连接的设备106中的一个或多个通信。数据处理系统102可以与安装在数字助理计算设备104上的应用、脚本或程序交互,诸如进行以下操作的应用:将输入音频信号传达到数据处理系统102的接口108并驱动数字助理计算设备的组件以渲染输出音频信号。数据处理系统102可以接收包括或标识音频输入信号的数据分组或其他信号。数据处理系统102可以包括协调器组件112,与协调器组件112对接或以其他方式访问协调器组件112,该协调器组件112被设计、构造和操作以从数字助理计算设备104接收指示,选择数字助理计算设备104之一来处理输入音频信号,并指令所选数字助理计算设备104处理检测到的输入音频信号。协调器组件112可以协调信号处理以减少系统100的整体处理器、存储器和带宽利用率,系统100包括多个数字助理计算设备104,每个数字助理计算设备104检测到携载命令来控制相同的网络连接的设备106的相同的输入音频信号。不同于允许两个数字助理计算设备104处理相同的检测到的输入音频信号,协调器组件112可以选择数字助理计算设备104之一来执行下游处理以解析输入音频信号并生成包括命令的数据分组,并将数据分组传输到数据处理系统102,数据处理系统102可以应用进一步的自然语言处理来识别命令,生成动作数据结构,并将动作数据结构传输到对应的网络连接的设备106以控制网络连接的设备106。协调器组件112可以从每个数字助理计算设备104接收检测到输入音频信号的指示。在一些情况下,协调器组件112可以在数字助理计算设备104对输入音频信号执行进一步处理之前接收指示。例如,协调器组件112可以在数字助理计算设备104解析输入音频信号以将输入音频信号转换为数据分组,执行自然语言处理,过滤或以其他方式处理输入音频信号之前接收指示。在对输入音频信号执行进一步处理之前,数字助理计算设备104可以传输指示并等待来自数据处理系统102的指令。数字助理计算设备104(例如,经由信号质量检查器136)可以阻止、暂停或搁置进一步的下游处理,直到数据处理系统102提供进一步的指令,从而避免或减少浪费的计算资源利用。协调器组件112接收到的指示可以包括时间戳、账户标识符和位置信息。协调器组件112可以使用时间戳、账户标识符和位置信息来确定由多个数字助理计算设备104检测到的输入信号是相同的输入音频信号,尽管具有各个质量水平。时间戳可以指示数字助理计算设备104检测到输入音频信号的时间。协调器组件112可以比较与多个指示相关联的时间戳,以确定数字助理计算设备104检测到相同的输入音频信号。协调器组件112可以进一步比较时间戳和账户标识符,以确定指示是否对应于相同的输入音频信号。协调器组件112可以进一步比较与每个指示相关联的时间戳、账户标识符和位置信息,以确定指示是否对应于相同的输入音频信号。例如,如果指示对应于在时间戳3:34:10pm开始并且具有和与相同无线网关相关联的相同互联网协议地址相对应的位置的输入音频信号,则协调器组件112可以确定指示与相同的输入音频信号相关联。在另一示例中,时间戳可以包括输入音频信号的开始时间戳和输入音频信号的持续时间。协调器组件112可以比较开始时间戳、持续时间和账户标识符,以确定多个数字助理计算设备是否检测到相同的输入音频信号。账户标识符可以对应于用于配置或设置数字助理计算设备104的账户或简档。该账户可以用于启用或登录数字助理计算设备104。数字助理计算设备104可以链接到该账户。账户信息可以存储在数据处理系统102中的数据存储库116上的账户数据结构118中。一个或多个数字助理计算设备104可以链接到存储在账户数据结构118中的相同账户。一个或多个网络连接的设备106可以链接到同一账户。该账户可以包括标识符,诸如字母数字值。协调器组件112可以从第一数字助理计算设备104接收第一数字助理计算设备104能够操作用于处理输入音频信号的指示。协调器组件112还可以从第二数字助理计算设备104接收第二数字助理计算104能够操作用于处理输入音频信号的指示。在一些情况下,协调器组件112可以从第一或第二数字助理计算设备104中的至少一个接收第一或第二数字助理计算设备104中的至少一个不能够操作用于处理输入音频信号的指示。如果协调器组件112接收到第一数字助理计算设备104和第二数字助理计算设备104都能够操作用于处理相同的输入音频信号的指示,则协调器组件112可以选择第一数字助理计算设备104或第二数字助理计算设备104中的一个来执行进一步的信号处理。例如,协调器组件112可以将第一数字助理计算设备104或第二数字助理计算设备104之一指派或设置为主信号处理器,而将第一或第二数字助理计算设备104中的另一个指派或设置为辅助信号处理器。协调器组件112可以响应于接收到主信号处理器能够操作用于处理输入音频信号的指示来默认选择主信号处理器。协调器组件112可以将第一或第二数字助理计算设备104中的一个设置为主信号处理器,而将第一或第二数字助理计算设备104中的另一个设置为辅助信号处理器。协调器组件112可以轮询与账户标识符相关联的一个或多个数字助理计算设备104以获得与一个或多个数字助理计算设备104相关联的特性,并且基于对特性的分析来将一个或多个数字助理计算设备104之一设置为主信号处理器。例如,协调器组件112可以轮询第一数字助理计算设备以获得第一数字助理计算设备的一个或多个特性。协调器组件112可以轮询第二数字助理计算设备104以获得第二数字助理计算设备104的一个或多个特性。协调器组件112可以基于对第一数字助理的一个或多个特性与第二数字助理计算设备104的一个或多个特性的比较,确定将第一数字助理计算设备104设置为主信号处理器,并且将第二数字助理计算设备104设置为辅助信号处理器。然后,协调器组件112可以将第一数字助理计算设备104设置为主信号处理器,并且将第二数字助理计算设备104设置为辅助信号处理器。该特征可以包括或基于设备的类型或设备的配置。例如,设备的类型可以包括扬声器设备、电视设备、移动设备和可穿戴设备。协调器组件112可以使某些类型的设备优先于其他类型的设备。例如,设备类型的优先级可以如表1所示。设备的类型优先级排名(1为最高)专用数字助理计算设备1扬声器设备2电视设备3移动设备4可穿戴设备5表1:数字助理计算设备类型的优先级排序的示例在无需关于特定设备的特定信息的情况下,设备的类型可以允许基于该类型的设备的共同特征来进行快速确定。另外或者可替选地,数据处理系统102可以基于设备的特性或设备的当前配置来对设备进行排名。特性可以指代处理器速度、麦克风质量、麦克风数量、扬声器质量、输入/输出接口的类型、设备的型号年份或设备的网络速度。当前配置可以指代设备是连接到电源插座还是依靠电池运行、操作系统版本或应用版本。协调器组件112可以将策略应用于数字助理计算设备104的特性或配置,以确定将数字助理计算设备104设置为主信号处理器或辅助信号处理器。例如,如果数字助理计算设备104连接到电源插座并且是专用的数字助理计算设备(例如,其主要目的是设计用作基于语音的数字助理的计算设备),则数据处理系统102可以将专用数字助理计算设备设置为主信号处理器。在另一示例中,如果第一数字助理计算设备104连接到电源插座,并且第二数字助理计算设备104是未连接到电源插座而是依靠电池电量运行的可穿戴设备,则数据处理系统102可以将第一数字助理计算设备104设置为主信号处理器,并且将第二数字助理计算设备104设置为辅助信号处理器。在另一个示例中,如果第一数字电器和第二数字电器都连接到电源插座,但是第一数字助理计算设备具有更高质量的麦克风和具有更多存储器的更快硬件处理器,则协调器组件112可以将第一数字助理计算设备104设置为主信号处理器。协调器组件112可以将数字助理计算设备动态设置为主或辅助信号处理器。协调器组件112可以检测第一数字助理计算设备的状况(例如,特性或配置)的变化。协调器组件112可以基于第一数字助理计算设备的状况的变化将第二数字助理计算设备切换到主信号处理器,并且可以将第一数字助理计算设备切换到辅助信号处理器。状况的变化可以指代特性或配置的变化。状况的变化可能包括软件版本过时、从电源插座中拔出设备、电池电量水平变低(例如,小于20%)、电池水平变得高于主信号处理器的电池水平、或诊断检查失败的组件(例如,麦克风故障或检测到高噪音水平)。协调器组件112可以使用机器学习算法、模型或过程来将一个或多个数字助理计算设备104中的一个设置为主数字助理计算设备。协调器组件112可以基于机器学习模型来确定将第一数字助理计算设备设置为主信号处理器。机器学习模型可以存储在数据存储库116中的模型数据结构122中。机器学习模型122可以基于与数字助理计算设备104相关联的历史指示来生成。机器学习模型可以基于由数字助理计算设备104检测到的输入音频信号的历史质量参数值来生成。可以基于与数字助理计算设备104相关联的特性或配置来生成机器学习模型。例如,可以基于关于以下的两个或者多个历史指示的组合来生成机器学习算法或者模型:数字助理计算设备是否能够操作用于处理输入音频信号、设备特性(例如,麦克风质量或者麦克风的数量、处理器速度,可用存储器)、当前配置(例如,软件版本、是连接到电源插座还是依靠电池运行)、以及创建以提供输入音频信号的最终用户期望的方式成功控制网络连接的设备106的动作数据结构。协调器组件112可以接收反馈以确定动作数据结构是否成功地控制网络连接的设备106。该反馈可以是直接反馈或间接反馈的形式。直接反馈可以包括用户说“no,thatisnotcorrect(不,那是不正确的)”或“stop(停止)”或“undo(撤消)”。间接反馈可以包括例如用户响应于动作数据结构未能按期望的方式调整网络连接的设备106而手动调整网络连接的设备106,或者提供重复相同指令的第二输入音频信号。协调器组件112可以使用机器学习模型或算法来确定用于信号处理的阈值。协调器组件112可以将阈值存储在存储器(例如,数据存储库116)或数字助理计算设备104的本地存储器中的集中式账户数据结构118中。协调器组件112可以基于机器学习模型来确定要使用的阈值,该机器学习模型是基于关于以下的一个或多个历史指示而生成的:数字助理计算设备是否能够操作用于处理输入音频信号、设备特性(例如,麦克风质量或麦克风的数量、处理器速度、可用存储器)、当前配置(例如,软件版本,是连接到电源插座还是依靠电池运行)、以及创建以提供输入音频信号的最终用户所需的方式成功控制网络连接的设备106的动作数据结构。例如,如果snr阈值先前被设置为-15db,并且接收到的反馈为肯定,则协调器组件112可以确定将阈值保持在-15db或将snr阈值进一步降低至-16db。在另一个示例中,如果snr阈值先前为-15db并且反馈为否定,则协调器组件112可以将最小阈值例如从-15db增加至-12db。在一些情况下,协调器组件112可以基于来自与多个账户相关联的多个数字助理计算设备104的聚合数据来设置用于特定数字助理计算设备104的阈值。在选择一个或多个数字助理计算设备104中的一个以选择作为主信号处理器时,协调器组件112可以指令第一数字助理计算设备104中的一个来处理输入信号,并且指令接收相同输入信号并传输指示的一个或多个其他数字助理计算设备104进入待机模式。例如,协调器组件112可以指令第一数字助理计算设备104处理输入音频信号。协调器组件112还可以指令第二数字助理计算设备104进入待机模式,以防止第二数字助理计算设备104处理输入的音频信号。第一数字助理计算设备104在接收到处理输入音频信号的指令后可以继续进行输入音频信号的下游处理并基于输入音频信号生成数据分组。预处理器134可以被配置成检测关键字并基于该关键字执行动作。预处理器134可以在将词项传输到数据处理系统102以进行进一步处理之前过滤掉一个或多个词项或修改词项。预处理器134可以将由麦克风检测到的模拟音频信号转换为数字音频信号,并且经由网络105将携载数字音频信号的一个或多个数据分组传输到数据处理系统102。在一些情况下,预处理器134可以响应于检测到执行这种传输的指令来传输携载一些或全部输入音频信号的数据分组。该指令可以包括例如触发关键字或其他关键字或批准,以将包括输入音频信号的数据分组传输到数据处理系统102。在一些情况下,预处理器134可以在将剩余的音频信号发送到数据处理系统之前过滤掉某些词项,诸如热词“okaydevice(好的设备)”或“heydevice(嘿设备)”或“device(设备)”。在一些情况下,预处理器134可以过滤掉附加词项或生成关键字以传输到数据处理系统以进行进一步处理。预处理器134可以生成数据分组,该数据分组可以包括用于控制网络连接的设备106的命令,并且将数据分组传输到数据处理系统102。因此,通过仅让数字助理计算设备104之一执行进一步处理以过滤输入音频信号并将其转换为数据分组,协调器组件112可以协调信号处理以减少系统100中的计算处理。数据处理系统102(例如,nlp组件110和直接动作api114)可以从第一数字助理计算设备接收包括命令的数据分组。数据处理系统102可以基于命令生成动作数据结构,并将动作数据结构传输到网络连接的设备以控制网络连接的设备。例如,数据处理系统102可以执行或运行nlp组件110以接收或获得基于音频信号生成的数据分组并解析该数据分组。例如,nlp组件110可以提供人与计算机之间的交互。nlp组件110可以配置有用于理解自然语言并允许数据处理系统102从人类或自然语言输入中导出含义的技术。nlp组件110可以包括或配置有基于诸如统计机器学习的机器学习的语音辨识技术。nlp组件110可以利用决策树、统计模型或概率模型来解析输入音频信号。nlp组件110可以执行例如诸如以下的功能:命名实体辨识(例如,给定文本流,确定文本中的哪些项映射到诸如人或地方的专有名称,以及每个这样的名称属于什么类型,诸如人员、位置或组织)、自然语言生成(例如,将语义意图或计算机数据库中的信息转换为可理解的人类语言)、自然语言理解(例如,将文本转换为更正式的表示形式,诸如计算机模块可以操纵的一阶逻辑结构)、机器翻译(例如,自动将文本从一种人类语言翻译成另一种人类语言)、形态学分割(例如,将词分离为个体词素并识别词素的类别,这基于所考虑语言的词的词法形态或结构的复杂性可能是挑战性的)、问题回答(例如,确定对人类语言问题的回答,可以是特定的或开放式的)、语义处理(例如,可以在识别词并对其含义进行编码后进行的处理,以便于使识别的词与具有相似含义的其他词相关联)。在一些情况下,预处理器134可以将输入音频信号转换成可辨识的文本。例如,预处理器134可以包括nlp组件110的一种或多种功能。在一些情况下,数据处理系统102(例如,经由nlp组件110)通过将输入信号与存储的代表性音频波形集(例如,在数据存储库116中)进行比较并选择最接近的匹配将由数据分组携载的音频输入信号转换成辨识的文本。音频波形集可以存储在数据存储库116或数据处理系统102可访问的其他数据库中。代表性波形跨一大组用户生成,并且然后可以用来自用户的语音样本来增强。在音频信号被转换成辨识的文本之后,nlp组件110将文本与例如经由跨用户的训练或通过手动指定来和与数据处理系统102可以服务的动作相关联的词匹配。nlp组件110可以获得携载输入音频信号的数据分组。从输入音频信号,nlp组件110可以识别至少一个请求或与该请求相对应的至少一个触发关键字。该请求可以指示输入音频信号的意图或主题。触发关键字可以指示可能采取的动作的类型。例如,nlp组件110可以解析数据分组以识别晚上离开家参加晚餐和电影的至少一个请求。触发关键字可以包括至少一个词、短语、词根或部分词,或指示要采取的动作的派生词。例如,来自输入音频信号的触发关键字“go”或“togoto”可以指示针对运送的需求。在此示例中,输入音频信号(或识别的请求)没有直接表达运送的意图,但是触发关键字指示运送是请求所指示的至少一个其他动作的辅助动作。nlp组件110可以解析输入音频信号(或携载输入音频信号的数据分组)以识别、确定、检索或以其他方式获得请求和触发关键字。例如,nlp组件110可以将语义处理技术应用于输入音频信号以识别触发关键字或请求。nlp组件110可以将语义处理技术应用于输入音频信号以识别包括一个或多个触发关键字的触发短语,诸如第一触发关键字和第二触发关键字。例如,输入的音频信号可以包括句子“turnoffthedigitallamp(关闭数字灯)”、“turnupthetemperatureinthelivingroom(调高客厅的温度)”、“playmystudyplaylistonthespeaker(在扬声器上播放我的学习播放列表)”或“ineedsomeonetodomylaundryandmydrycleaning(我需要找人帮我洗衣服和干洗)。”nlp组件110可以将语义处理技术或其他自然语言处理技术应用于包括句子的数据分组以识别触发短语。触发短语可以包括例如“turnupthetemperature(调高温度)”、“play(播放)”、“turnoff(关闭)”、“domylundry(帮我洗衣服)”或“domydrycleaning(帮我干洗)”。nlp组件110可以进一步识别多个触发关键字,诸如洗衣服和干洗。例如,nlp组件110可以确定触发短语包括触发关键字和第二触发关键字。nlp组件110可以过滤输入音频信号以识别触发关键字。例如,携载输入音频信号的数据分组可以包括“itwouldbegreatiflcouldgetsomeonethatcouldhelpmegototheairport(如果我能找到可以帮助我去机场的人,那将是太棒了)”,在这种情况下,nlp组件110可以如下过滤掉一个或多个词项:“it”、“would”、“be”、“great”、“if”、“i”、“could”、“get”、“someone”、“that”、“could”、或“help”。通过过滤掉这些词项,nlp组件110可以更准确和可靠地识别触发关键字,诸如“gototheairport(去机场)”,并确定这是对出租车或乘车共享服务的请求。在某些情况下,nlp组件可以确定携载输入音频信号的数据分组包括一个或多个请求。例如,输入的音频信号可以包括句子“ineedsomeonetodomylaundryandmydrycleaning”。nlp组件110可以确定这是针对洗衣服务和干洗服务的请求。nlp组件110可以确定这是对可以提供洗衣服务和干洗服务两者的服务提供者的单个请求。nlp组件110可以确定这是两个请求:对执行洗衣服务的服务提供者的第一请求,以及对提供干洗服务的服务提供者的第二请求。在一些情况下,nlp组件110可以将多个确定的请求组合成单个请求,并将该单个请求传输给第三方设备146。在一些情况下,nlp组件110可以将各个请求传输给另一个服务提供者设备,或将两个请求单独传输到同一第三方设备146。数据处理系统102可以包括直接动作api114,该直接动作api114被设计和构造成基于触发关键字生成响应于请求的动作数据结构。数据处理系统102的处理器可以调用直接动作api114以执行脚本,该脚本生成数据结构以提供给网络连接的设备106或其他服务提供者以订购服务或产品,诸如从汽车共享服务订车。直接动作api114可以获得来自数据存储库116数据,以及在最终用户同意的情况下从数字助理计算设备104接收的数据以确定位置、时间、用户账户、物流或其他信息以允许网络连接的设备106或其他第三方设备来执行诸如从汽车共享服务订车的操作。使用直接动作api114,数据处理系统102还可以与第三方设备通信以通过在该示例中进行汽车共享接送预订来完成转换。直接动作api114可以执行识别实现用户请求所需的参数的代码或对话脚本。这样的代码可以例如在数据存储库116中查找附加信息,诸如家庭自动化服务的名称、网络连接的设备106的标签或第三方服务,或者其可以提供音频输出以在数字助理计算设备104处渲染以询问最终用户诸如以下的问题:对网络连接的设备106的所意图的控制或所请求出租车的目的地。直接动作api114可以确定参数并且可以将信息打包为动作数据结构,该动作数据结构可以作为控制指令被传输到网络连接的设备106。直接动作api114可以从nlp组件110或数据处理系统102的其他组件接收指令或命令,以生成或构造动作数据结构。直接动作api114可以确定动作的类型,以便从存储在数据存储库116中的模板存储库124中选择模板。动作的类型可以包括与网络连接的设备106相关联的控制动作,诸如调节恒温器、光强度、在扬声器上播放音乐、在电视上播放视频、控制厨房用具(例如,咖啡壶、电热水壶、烤箱、微波炉、冰箱、火炉、机器人吸尘器)、启动汽车或调节汽车内的恒温器。动作类型可以包括例如服务、产品、预订或票务。动作类型可以进一步包括服务或产品的类型。例如,服务类型可以包括汽车共享服务、送餐服务、洗衣服务、家政服务、维修服务、家庭服务、设备自动化服务或媒体流服务。产品类型可以包括例如,衣服、鞋子、玩具、电子产品、计算机、书籍或珠宝。预订的类型可以包括例如晚餐预订或美发沙龙预约。票务的类型可以包括例如电影票、运动场馆票或机票。在一些情况下,可以基于价格、位置、运输方式、可用性或其他属性对服务、产品、预订或票务的类型进行归类。nlp组件110可以解析基于输入音频信号生成的数据分组,以识别请求和与该请求相对应的触发关键字,并将该请求和触发关键字提供给方向动作api116以使直接动作api基于触发关键字和账户118生成动作数据结构。直接动作api114可以使用账户118来标识链接到账户标识符的网络连接的设备106。一旦识别请求的类型,直接动作api114可以从模板存储库124访问对应的模板。模板可以包括结构化数据集中的字段,其可以由直接动作api114填充以进一步进行经由第三方设备146的数字助理计算设备104检测到的输入音频所请求的操作(诸如,叫出租车以在接送位置处接送最终用户并将最终用户运送到目的地位置的操作)。直接动作api114可以在模板存储库124中执行查找以选择与触发关键字和请求的一个或多个特性匹配的模板。例如,如果请求对应于控制诸如恒温器的网络连接的设备106,则数据处理系统102可以选择恒温器模板,该恒温器模板可以包括以下字段中的一个或多个:唯一的设备标识符和新的温度值。在另一个示例中,如果该请求对应于对到目的地的汽车或搭车的请求,则数据处理系统102可以选择汽车共享服务模板。汽车共享服务模板可以包括以下述字段中的一个或多个:设备标识符、接送位置、目的地位置、乘客人数或服务类型。直接动作api114可以用值填充字段。为了用值填充字段,直接动作api114可以ping、轮询或者以其它方式从数字助理计算设备104的一个或多个传感器128、设备104的用户接口、对应的网络连接的设备106或数据存储库106获得信息。例如,直接动作api114可以使用诸如gps传感器的位置传感器来检测源位置。直接动作api114可以通过向数字助理计算设备104的用户端提交调查、提示或查询来获得进一步的信息。直接动作api114可以经由数据处理系统102的接口108和数字助理计算设备104的用户接口(例如,音频接口、基于语音的用户接口、显示器或触摸屏)来提交调查、提示或查询。因此,直接动作api114可以基于触发关键字或请求为动作数据结构选择模板,用一个或多个传感器128检测到的或经由用户接口获得的信息填充模板中的一个或多个字段,并且生成、创建或以其他方式构造动作数据结构以促进第三方设备或网络连接的设备106执行操作。为了构造或生成动作数据结构,数据处理系统102可以识别所选模板中的一个或多个字段以填充值。可以使用数字值、字符串、unicode值、布尔逻辑、二进制值、十六进制值、标识符、位置坐标、地理区域、时间戳或其他值填充这些字段。字段或数据结构本身可以被加密或掩码以维护数据安全性。在确定模板中的字段之后,数据处理系统102可以识别字段的值以填充模板的字段以创建动作数据结构。数据处理系统102可以通过在数据存储库116上执行查找或其他查询操作来获得、检索、确定或以其他方式识别字段的值。数据处理系统102(例如,经由直接动作api114或接口108)可以将动作数据结构传输到对应的网络连接的设备106。因此,在多个数字助理计算设备104可以检测到来自于用户的输入音频信号并且生成具有命令的数据分组以控制网络连接的设备106的情况下,数据处理系统102可以指令单个数字助理计算设备104执行进一步的处理以生成数据分组,并且数据处理系统102可以生成和经由网络105向网络连接的设备106传输动作数据结构。当向网络连接的设备106传输动作数据结构时,数据处理系统102可以绕过一个或多个数字助理计算设备104。数据处理系统102可以绕过第一和第二数字助理计算设备104,并经由网络105将动作数据结构直接传输到网络连接的设备106。数据处理系统102可以绕过至少第一数字助理计算设备104并将动作数据结构传输到网络连接的设备106,而无需将动作数据结构传输到第一数字助理计算设备104,或以其他方式与第一数字助理计算设备104通信。继生成动作数据结构之后,直到动作数据结构已传输到网络连接的设备106,数据处理系统102可以不与第一数字助理计算设备104通信。数据处理系统102可以向生成命令的第一数字助理计算设备104提供状态更新。状态更新可以指示动作数据结构已生成并传输到网络连接的设备106。状态更新可以指示动作数据结构将由网络连接的设备106执行、当前正在由网络连接的设备106执行、动作数据结构的完成百分比、或者动作数据结构刚刚由网络连接的设备106完成。状态更新可以指示与执行动作数据结构相关联的错误或失败,诸如无法定位网络连接的设备106或网络连接的设备106中的故障。第一数字助理计算设备(例如,经由预处理器)可以接收传输到网络连接的设备的动作数据结构的状态的指示,并指令音频驱动器132生成输出音频信号以使扬声器组件(例如,换能器130)传输与状态指示相对应的音频输出。数据处理系统102可以基于轮询设备或者基于建立或配置过程来识别多个数字助理计算设备。数据处理系统可以在数据存储库116中的集中式账户118中存储第一数字助理计算设备与网络连接的设备之间的第一链接,以及第二数字助理计算设备与网络连接的设备之间的第二链接。为了生成和传输动作数据结构,数据处理系统102可以响应于对第一数字助理计算设备的选择并且基于第一链接来访问集中式账户118以检索用于生成动作数据结构的信息。集中式账户118可以包括或存储与具有到第一数字助理和第二数字助理中的至少一个的链接的多个异构网络连接的设备相关联的信息。异构网络连接的设备可以指代可以具有不同组件、软件或功能的不同类型的网络连接的设备(例如,联网的咖啡机对比联网的机器人真空吸尘器)。在一些情况下,系统100可以包括能够进行或执行动作数据结构的多个网络连接的设备。在数据处理系统102(例如,经由账户118)识别可以进行或执行动作数据结构的多个网络连接的设备106的情况下,协调器组件112可以选择网络连接的设备106之一。协调器组件112可以使用策略来选择网络连接的设备106以执行动作数据结构。该策略可以基于网络连接的设备的特性或配置。协调器组件112可以轮询链接到该账户的可用的网络连接的设备106,并识别特性(例如,可用输入/输出接口、电池、插入电源、处理器速度、可用存储器或与检测到输入音频信号的数字助理计算设备的接近度)。为了选择网络连接的设备106以执行动作数据结构,协调器组件112可以使用来自模型数据结构122的机器学习模型。机器学习模型可以包括有关网络连接的设备106的特性或特征的信息和与设备106相关联的反馈。反馈可以指示设备106是否成功执行动作数据结构。如果出现平局,某些类型的网络连接的设备106的排名可以高于其他类型,如表1所示例,并且数据处理系统可以选择排名更高的设备106以执行动作数据结构。数据处理系统102可以基于在由相应数字助理计算设备检测到输入音频信号时与该输入音频信号相关联的特性的比较来从多个网络连接的设备中选择网络连接的设备。例如,数据处理系统可以识别、确定、计算或运算由第一数字助理计算设备的传感器检测到的输入音频信号的特性(或参数或度量)的第一值。数据处理系统102可以识别、确定、计算或计算由第二数字助理计算设备的传感器检测到的输入音频信号的特性(或参数或度量)的第二值。数据处理系统102可以将第一值与第二值进行比较。数据处理系统可以基于比较来从多个网络连接的设备中选择网络连接的设备。输入音频信号的特性(或度量或参数)可以包括声音的一个或多个特性。该特性可以包括例如音量、幅度、声压、强度、响度、频率、波长、音高、速度或方向。例如,对于音量、幅度或强度,特性的值可以以分贝(“db”)为单位进行测量。例如,对于频率,该特性的值可以以赫兹(例如,1/秒)来测量。例如,对于波长,该特性的值可以以距离为单位(例如,米或厘米)来测量。如果特性是方向,则该值可以包括相对于预定轴的水平角或垂直角。为了确定方向,数字助理计算设备104(或数据处理系统102)可以执行声源定位。声源位置可以包括给定声场的测量结果来定位声源(例如,输入音频信号的源,诸如用户),声场的测量结果可以包括诸如声压或粒子速度的特性。粒子速度可以作为矢量进行测量,其可以提供源方向。数字助理计算设备104或数据处理系统102还可以使用多个传感器来确定方向,并确定在传感器检测到输入音频信号时之间的时差(例如,输入音频信号的到达时间差;三角测量)。数据处理系统可以通过比较从不同位置的多个传感器计算出的特性值来确定方向。数据处理系统可以基于由说话者(例如,用户)传输的声波的直接和回声路径长度的比率来确定方向或执行声音定位。例如,输入音频信号可以包括“turnoffthelight(关闭灯)”的命令。输入音频信号可能不提供网络连接的设备的唯一标识符(例如,图2中所描绘的房间234可以包括位于遍布整个房间的多个连接的灯208)。由于命令中的歧义,数据处理系统可以应用策略、模型、机器学习或其他技术,以从多个连接的灯208中选择一个或多个连接的灯208。例如,如果存在位于房间234中的多个数字助理,则数据处理系统可以基于如由不同数字助理计算设备检测到的输入音频信号的幅度来确定哪个数字助理计算设备位于离用户更近的位置。数据处理系统可以确定检测到具有最大幅度的输入音频信号的数字助理计算设备是离用户最近的数字助理计算设备。然后,数据处理系统可以识别位于离所选数字助理计算设备最近的已连接的灯208。然后数据处理系统可以确定控制位于离最靠近用户的数字助理计算设备最近的连接的灯208。在另一个示例中,数据处理系统102可以确定声音的方向。数据处理系统102可以使用声音的方向来识别网络连接的设备106。例如,如果房间中存在三个网络连接的设备106,则用户可以面向他们期望控制的网络连接的设备106,并且然后说出命令。网络连接的设备106可以包括麦克风以检测声音的音量。然而,网络连接的设备106可以包括或可以不包括处理器以解析输入音频信号,将它们转换为数据分组或执行任何自然语言处理。网络连接的设备106可以包括最小的信号处理电路,该信号处理电路可以测量输入音频信号的幅度,并将指示提供给数据处理系统102。因此,如果每个网络连接的设备106都测量输入音频信号的幅度,并将幅度值提供给数据处理系统102,数据处理系统102便可以选择检测到具有最高幅度的输入音频信号的网络连接的设备。数据处理系统102(例如,经由协调器组件112)可以基于说话者(例如,提供输入音频信号的用户)的位置来从多个网络连接的设备106中选择网络连接的设备106。数据处理系统102可以确定选择与说话者位于同一房间的一个或多个网络连接的设备106,所述一个或者多个网络连接的设备106能够执行输入音频信号中提供的命令。数据处理系统102可以确定在说话者的一距离(或半径)内选择一个或多个网络连接的设备106。距离可以是预先确定、固定、基于命令选择、基于网络连接的设备106的类型选择,或者基于输入音频信号的特性动态确定(例如,如果输入音频信号具有小于阈值的低幅度,诸如耳语,则半径较小,并且如果输入音频信号具有大于阈值的高幅度,则半径较长)。例如,如果说话者叫吼来关闭灯,则数据处理系统102可以关闭整个房屋中的所有灯。如果说话者使用正常的声音说话以关闭灯,则数据处理系统102可以确定关闭与说话者在同一房间中的所有灯。如果用户低声地说关闭灯,则数据处理系统102可以仅关闭最靠近说话者或用户的灯(例如,床头柜上的台灯)。数据处理系统102可以从被配置成使用语义分析执行命令的多个网络连接的设备106中选择网络连接的设备106。数据处理系统102可以识别输入音频信号中的上下文信息,以确定要选择的网络连接的设备106。例如,输入音频信号可以包括期望的网络连接的设备的标识符(即使不是唯一标识符)以执行命令。例如,标识符可以是“"lowerthelight(调低光)”。数据处理系统102可以确定(例如,通过针对状态信息轮询网络连接的设备106)在房间234中可能存在多个连接的灯208时,仅连接的灯208的子集能够使输出光强度变暗。因此,数据处理系统102可以首先过滤掉不可调光的灯。在能够变暗的剩余的灯当中,数据处理系统102可以确定每个灯的当前输出强度水平。然后,数据处理系统102可以确定仅可调光灯之一能够变暗。因此,通过淘汰过程,数据处理系统102可以识别说话者希望控制的网络连接的设备106。其他指示可以包括,例如,提供与说话者期望控制的网络连接的设备106相关联的上下文信息。例如,命令可以是“turnoffthelightnexttothetelevision(关闭电视旁边的灯)”。数据处理系统102可以确定哪些连接的灯208在电视机附近(例如,连接的多媒体显示器212)。例如,数据处理系统102可以基于接近传感器、设置、分析扬声器输出或对提示的响应来确定灯208在所连接的多媒体显示器212附近。数据处理系统102可以基于机器学习模型来确定从配置成执行命令的多个网络连接的设备106中选择的网络连接的设备106。数据处理系统102可以使用输入值(例如,与输入音频信号相关联的特征或特性或围绕输入音频信号的提供的上下文)和对应的输出值(例如,选择哪个网络连接的设备106)来生成模型。数据处理系统102可以基于与输入音频信号相关联的特性来生成机器学习模型。数据处理系统102可以基于反馈来生成模型。特征可以包括输入音频信号的特性、一天中的时间、一周中的一天、房间234中其他连接的设备106的状态(例如,扬声器210正在以什么音量播放音乐和音乐是什么类型,电视212是否开着;或者用户是否正在使用连接的电信设备216拨打电话)。反馈可以包括指示选择了正确的网络连接的设备的反馈,或者指示选择了不正确的网络连接的设备的反馈。数据处理系统102可以将特征输入到模型中并且使该特征与说话者在历史上识别或确定来控制的哪一个网络连接的设备106相关。例如,在早上6点,说话者可以提供“turnonthelampontheleftnightstand(打开左床头柜上的灯)”的命令。第二天,说话者可以在早上6点提供“turnonthelamp(打开灯)”命令。数据处理系统102可以基于在早上6点接收到的先前的与灯有关的命令来确定说话者希望在早上6点打开左床头柜上的灯。数据处理系统102可以预测在早上6点或前后(例如,正负1分钟、2分钟、5分钟、10分钟、20分钟)提供的命令“turnonthelamp”可能是指代命令“turnonthelampontheleftnightstand。”因此,数据处理系统102可以选择相同的网络连接的设备106,并为所选的网络连接的设备106生成动作数据结构。数据处理系统102还可以使用来自诸如环境光传感器的其他传感器的信息来确定哪个房间是黑暗的,并且打开该房间的灯。图2是在语音驱动的计算环境中在计算设备当中协调信号处理的系统的操作的图示。系统200可以包括图1中所描绘的系统100或图4中所描绘的系统400的一个或多个组件。系统200可以包括位于房间234中的多个数字助理计算设备202和204。房间234可以包括任何类型或大小的物理空间,包括例如客厅、卧室、厨房、饭厅、地下室、办公室、大厅、购物中心、零售店、餐厅、公园、室外空间、汽车或房车。第一数字助理计算设备202可以包括图1中描绘的数字助理计算设备104的一个或多个组件或功能。第一数字助理计算设备202可以包括扬声器设备或专用数字助理计算设备。第二数字助理计算设备204可以包括图1中描绘的数字助理计算设备104的一个或多个组件或功能。第二数字助理计算设备204可以包括执行数字助理应用的智能电话。第一和第二数字助理计算设备204可以链接到具有唯一标识符并与用户232相关联的中央账户。系统200可以包括位于房间234中的多个网络连接的设备106,诸如连接的电信设备216(例如,连接的电话)、连接的恒温器206、连接的灯208、连接的扬声器210(或声音系统)或连接的多媒体显示器212(或智能电视)。互联网连接的设备可以位于房间234的外部或远离房间234,同时仍可经由数据处理系统102经由数字助理计算设备202或204进行控制。互联网连接的设备206、208、210、212或216可以经由可以提供对网络105的访问的无线网关214(例如,网络路由器、无线路由器或调制解调器)连接到网络105。可以经由数据处理系统102监视、管理或控制互联网连接的设备206、208、210、212或216。在一些情况下,互联网连接设备206、208、210、212或216可以由第一或第二数字助理计算设备202或204经由数据处理系统102进行监视、管理或控制。互联网连接的设备206、208、210、212或216可以链接到具有唯一标识符的中央账户,该中央账户可以链接到用户232。在动作218处,位于房间234中的用户232可以说出命令或查询。用户可以生成与输入音频信号相对应的声波。在动作218处,第一数字助理计算设备202和第二数字助理计算设备204都可以检测到输入音频信号。示例输入音频信号218可以包括命令“playtoday'snewsclipsonthetelevision(在电视上播放今天的新闻剪辑)”。因为设备202和204都位于用户232的检测接近度内,所以设备202和204都可以在动作218处检测到输入音频信号。这两个设备都可以配置成侦听输入音频信号并处理输入音频信号。第一数字计算设备202和第二数字计算设备204可以对输入音频信号执行初始处理,并确定检测到具有足够的质量的输入音频信号,使得数字计算设备202和204均可以生成有可能用于生成动作数据结构以成功控制房间232中的网络连接的设备的数据分组。初始处理可以指代或包括信号质量检查过程。在动作220处,第一数字助理计算设备220可以将第一数字助理计算设备220能够操作用于处理输入音频信号218的第一指示传输给数据处理系统102的协调器组件112。可以响应于信号质量检查过程来生成第一指示。在动作222处,协调器组件112可以基于策略来确定指令第一数字助理计算设备202处理输入音频信号218。在动作226处,数据处理系统102从第二数字助理计算设备204接收指示第二数字助理计算设备204能够操作用于处理输入音频信号的第二指示。然而,为了减少系统200中的处理,数据处理系统102(例如,经由协调器组件112)可以在动作228处指令第二数字助理计算设备进入待机模式。待机模式可以指代或指令设备204不进一步处理当前的输入音频信号218。待机模式可以指代或指令设备204不进一步处理后续输入音频信号,直到状况已经触发或事件被触发为止。待机模式可以使设备204不生成数据分组。在待机模式下,设备204可以或可以不对后续的输入音频信号执行信号质量检查,并将指示传输到数据处理系统102。待机模式可以禁用设备204的一个或多个组件或功能。可以(经由228)指令设备204进入待机模式达预定的时间间隔(例如,1分钟、2分钟、3分钟、5分钟、10分钟、15分钟或30分钟)。可以(经由228)指令设备204进入待机模式,直到设备204移动或更改位置,诸如在房间232周围建立的虚拟地理围栏之外。在动作224处,第一数字助理计算设备202响应于动作222处的指令,可以对输入音频信号218执行下游处理,并提供携载命令的数据分组。在动作224处,第一数字助理计算设备202可以将携载命令的数据分组传输到数据处理系统102。nlp组件110和直接动作api114可以处理该数据分组以创建动作数据结构,并且将在动作230处的动作数据结构传输到对应的联网的计算设备。例如,数据处理系统102可以识别触发关键字“play”、“television”和“newsclips”。数据处理系统102可以在存储在数据存储库116中的账户数据结构118中执行查找,以识别链接到具有唯一标识符的账户的所连接的多媒体显示器212。数据处理系统102可以确定“television”对应于“连接的多媒体显示器212”(例如,基于历史使用或通过淘汰过程)。数据处理系统102可以使用内容选择器或在视频平台上对新闻剪辑进行查询来识别新闻剪辑。数据处理系统102可以生成具有指向新闻剪辑的链接或指针的动作数据结构,并且将该动作数据结构传输到连接的多媒体显示器212以使连接的多媒体显示器212渲染或播放新闻剪辑。当将动作数据结构传输到网络连接的设备106时,数据处理系统102可以绕过一个或多个数字助理计算设备104。数据处理系统102可以绕过第一和第二数字助理计算设备104,并且经由网络105将动作数据结构直接传输到网络连接的设备106。数据处理系统102可以绕过至少第一数字助理计算设备104,并将动作数据结构传输到网络连接的设备106,而无需将动作数据结构传输到第一设备数字助理计算设备104或以其它方式与第一数字助理计算设备104通信。继生成动作数据结构之后,并且直到动作数据结构已经被传输到网络连接的设备106为止,数据处理系统102可以不与第一数字助理计算设备104通信。数据处理系统102可以向生成命令的第一数字助理计算设备202提供状态更新。状态更新可以指示动作数据结构已生成并传输到显示器212。状态更新可以指示新闻剪辑将要在显示器212上播放、正在播放或刚刚播放完毕。状态更新可以指示与执行动作数据结构相关联的错误或失败,诸如由于账户中不存在链接的显示器而无法定位显示器212。第一数字助理计算设备(例如,经由预处理器)可以接收传输到网络连接的设备的动作数据结构的状态的指示,并指示音频驱动器生成输出音频信号,以使扬声器组件传输与状态指示相对应的音频输出。因此,协调器组件112可以协调信号处理以减少系统200中的资源利用率,使得并非每个数字助理计算设备202或204都处理输入的音频信号以生成具有语法的数据分组,以发送给数据处理系统,并且并非每个网络连接的设备接收操作数据结构来执行操作数据结构。图3是在语音驱动的计算环境中在计算设备当中协调信号处理的示例方法的图示。方法300可以由图1中描绘的系统100、图2中描绘的系统200或者图4中描绘的系统400的一个或多个组件、系统或元件来执行。方法300可以包括在动作302处检测输入音频信号。输入音频信号可以由一个或多个数字助理计算设备检测。例如,第一数字助理计算设备和第二数字助理计算设备可以均在动作302处检测相同的输入音频信号。在动作304处,方法300可以包括确定检测到的输入信号是否满足信号处理并且传输指示。一个或多个数字助理计算设备可以执行信号质量检查过程,以确定检测到的输入音频信号是否具有足够的质量以进行可靠的下游处理。例如,第一数字助理计算设备可以确定检测到的输入音频信号的snr,并且确定该snr满足阈值(例如,大于或等于-3db)。第二数字助理计算设备可以确定由第二数字助理计算设备检测到的检测到的输入音频信号的snr也满足阈值。第一数字助理计算设备和第二数字助理计算设备可以将相应的指示传输到数据处理系统,该指示指示该设备能够操作用于处理所检测的输入音频信号,因为所检测的输入音频信号的质量满足信号质量检查。在一些情况下,一个或多个数字助理计算设备中的仅一个可以检测具有足够质量来通过信号质量检查的输入音频信号。在动作306处,数据处理系统可以选择数字助理计算设备之一进行进一步处理。例如,数据处理系统可以选择第一数字助理计算设备以执行进一步的处理。数据处理系统可以基于第一数字助理计算设备被设为主信号处理器来选择第一数字助理计算设备。例如,第一数字助理计算设备和第二数字助理计算设备都能够操作用于处理输入音频信号,但是数据处理系统可以基于数字助理计算设备被设为主信号处理器来选择数字助理计算设备之一。在动作308处,数据处理系统可以指令第一数字助理执行进一步的处理,并指令第二数字助理计算设备进入待机模式或不执行进一步的处理。待机模式可以指代不处理当前的输入音频信号。在动作310处,数据处理系统可以接收具有命令的数据分组。数据分组可以由所选的第一计算设备生成。在动作312处,数据处理系统可以从多个网络连接的设备中选择网络连接的设备,并且基于数据分组为所选择的网络连接的设备生成动作数据结构。动作数据结构可以与用于控制所选的网络连接的设备的指令一起生成。数据处理系统可以使用策略、特性、机器学习技术、启发法或规则中的一个或者多个来选择网络连接的设备。在动作314处,数据处理系统可以将动作数据结构传输到所选择的网络连接的设备。图4是示例计算机系统400的框图。计算机系统或计算设备400可以包括或用于实现系统100或其诸如数据处理系统102的组件。计算设备400可以包括、提供智能个人助理或基于语音的数字助理或者与其接口。计算系统400包括总线405或用于传送信息的其他通信组件,以及耦合到总线405以用于处理信息的处理器410或处理电路。计算系统400还可包括耦合到总线以用于处理信息的一个或多个处理器410或处理电路。计算系统400还包括诸如随机存取存储器(ram)或其他动态存储设备的主存储器415,其耦合到总线405以用于存储信息以及将由处理器410执行的指令。主存储器415可以是数据存储库145或包括数据存储库145。主存储器415也可以在由处理器410执行指令期间用于存储位置信息、临时变量或其他中间信息。计算系统400进一步可以包括耦合到总线405的只读存储器(rom)420或其他静态存储设备,用于存储用于处理器410的静态信息和指令。诸如固态设备、磁盘或光盘的存储设备425可以耦合到总线405,以持久地存储信息和指令。存储设备425可以包括数据存储库145或者是数据存储库145的一部分。计算系统400可以经由总线405耦合到诸如液晶显示器或有源矩阵显示器的显示器435,以向用户显示信息。诸如包括字母数字和其他键的键盘的输入设备430可以耦合到总线405,以用于向处理器410传送信息和命令选择。输入设备430可以包括触摸屏显示器435。输入设备430可以还包括诸如鼠标、轨迹球或光标方向键的光标控件,以用于向处理器410传送方向信息和命令选择,以及用于控制显示器435上的光标移动。显示器435可以是例如数据处理系统102、客户端计算设备150或图1的另一个组件的一部分。本文中描述的过程、系统和方法可以由计算系统400响应于处理器410执行包含在主存储器415中的指令的布置来实现。这样的指令可以从诸如存储设备425的另一个计算机可读介质读入主存储器415中。包含在主存储器415中的指令的布置的执行使计算系统400执行本文中描述的说明性过程。也可以采用多处理布置中的一个或多个处理器来执行包含在主存储器415中的指令。硬连线电路可替代软件指令或与软件指令结合地与本文中所述的系统和方法一起使用。本文中描述的系统和方法不限于硬件电路和软件的任何特定组合。尽管已经在图4中描述了示例计算系统,但是包括在本说明书中描述的操作的主题可以在其他类型的数字电子电路中或在计算机软件、固件或硬件中实现,包括在本说明书中公开的结构及其等同结构,或其一种或多种的组合。对于本文中讨论的系统收集关于用户的个人信息或可以利用个人信息的情况,可以为用户提供机会来控制是否可以收集个人信息的程序或功能(例如,关于用户的社交网络,社交动作或活动,用户的偏好或用户的位置的信息),或控制是否或如何从内容服务器或其他数据处理系统接收与用户更相关的内容。另外,某些数据可以在存储或使用之前以一种或多种方式匿名化,以便在生成参数时移除个人身份信息。例如,可以对用户的身份进行匿名,以便不能确定该用户的个人可识别信息,或者可以在获得位置信息的情况下将用户的地理位置泛化(例如,到城市、邮政编码或州级别),以便不能确定用户的具体位置。因此,用户可以控制如何收集关于他的或她的信息以及如何由内容服务器使用。本说明书中描述的主题和操作可以在数字电子电路或在计算机软件、固件或硬件中实现,包括本说明书中公开的结构及其等同结构,或其一种或多种的组合。本说明书中描述的主题可以被实现为编码在一个或多个计算机存储介质上的一个或多个计算机程序(例如,计算机程序指令的一个或多个电路),以用于由数据处理装置执行或控制数据处理装置的操作。可替选地或附加地,程序指令可以被编码在人工生成的所传播的信号上,例如机器生成的电信号、光信号或电磁信号,其被生成以对信息进行编码以用于传输到适当的接收器装置以由数据处理装置执行。计算机存储介质可以是或包括在计算机可读存储设备、计算机可读存储基板、随机或串行访问存储器阵列或设备,或它们中的一个或多个的组合中。尽管计算机存储介质不是所传播的信号,但是计算机存储介质可以是以人工生成的所传播的信号编码的计算机程序指令的源或目的地。计算机存储介质还可以是一个或多个单独的组件或介质(例如,多个cd、磁盘或其他存储设备)或包含在其中。本说明书中描述的操作可以被实现为由数据处理设备对存储在一个或多个计算机可读存储设备上或从其他源接收到的数据执行的操作。术语“数据处理系统”、“计算设备”、“组件”或“数据处理设备”包含用于处理数据的各种装置、设备和机器,包括例如可编程处理器、计算机、片上系统、多个或上述的组合。该设备可以包括专用逻辑电路,例如fpga(现场可编程门阵列)或asic(专用集成电路)。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行环境、虚拟机或它们中一个或多个的组合的代码。装置和执行环境可以实现各种不同的计算模型基础架构,例如web服务、分布式计算和网格计算基础架构。例如,直接操作api114、内容选择器组件118或nlp组件110和其他数据处理系统102组件可以包括或共享一个或多个数据处理装置、系统、计算设备或处理器。计算机程序(也称为程序、软件、软件应用、应用程序、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言、声明或过程语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子例程、对象或适合于在计算环境中使用的其他单元。计算机程序可以对应于文件系统中的文件。计算机程序可以存储在保存其他程序或数据的文件的一部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于所讨论的程序的单个文件中或多个协调文件中(例如,存储一个或多个模块、子程序或部分代码的文件)。可以将计算机程序部署为在位于一个站点或分布在多个站点并通过通信网络互连的一台计算机或多台计算机上执行。本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序(例如,数据处理系统102的组件)的一个或多个可编程处理器来执行,以通过对输入数据进行操作并生成输出来执行动作。处理和逻辑流程也可以由专用逻辑电路执行,并且装置也可以被实现为专用逻辑电路,例如,fpga(现场可编程门阵列)或asic(专用集成电路)。适合于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储设备,包括例如半导体存储设备(例如eprom、eeprom和闪存设备)、磁盘(例如内部硬盘或可移动磁盘);磁光盘以及cdrom和dvd-rom磁盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。本文中描述的主题可以在包括后端组件(例如,作为数据服务器)或包括中间件组件(例如,应用服务器)或包括前端组件(例如,具有图形用户界面或web浏览器,用户通过该用户通过web浏览器与本说明书中描述的主题的实施方式交互)或一个或多个这种后端组件、中间件组件或前端组件的组合的计算系统中实现。系统的组件可以通过数字数据通信的任何形式或介质(例如,通信网络)互连。通信网络的示例包括局域网(“lan”)和广域网(“wan”)、网际网络(例如,互联网)和对等网络(例如,adhoc对等网络)。诸如系统100或系统400的计算系统可以包括客户端和服务器。客户端和服务器通常彼此远离,并且通常通过通信网络(例如,网络105)进行交互。客户端和服务器之间的关系是借助于在各自计算机上运行并且彼此具有客户端-服务器关系的计算机程序而产生的。在一些实施方式中,服务器将数据(例如,表示内容项的数据分组)发送到客户端设备(例如,出于向与客户端设备交互的用户显示数据并从该用户接收用户输入的目的)。可以从服务器处的客户端设备接收在客户端设备处生成的数据(例如,用户交互的结果)(例如,由数据处理系统102从数字助理计算设备104或内容提供者计算设备106或第三方设备146接收)。虽然在附图中以特定顺序描绘了操作,但是不需要以示出的特定顺序或以顺序次序来执行这样的操作,并且不需要执行所有示出的操作。本文中描述的动作可以以不同顺序执行。各个系统组件的分离并不需要在所有实施方式中都进行分离,并且所描述的程序组件可以包含在单个硬件或软件产品中。例如,nlp组件110或内容选择器选择器118可以是单个组件、应用或程序,或者是具有一个或多个处理电路的逻辑设备,或者是数据处理系统102的一个或多个服务器的一部分。现在已经描述了一些说明性的实施方式,很明显,已经以示例的方式给出的前述内容是说明性的而不是限制性的。特别地的,尽管本文中呈现的许多示例涉及方法动作或系统元素的特定组合,但是可以以其他方式组合那些动作和那些元素以实现相同的目标。结合一个实施方式所讨论的动作、要素和特征不旨在被排除在其他一个或多个实施方式中的类似角色之外。本文中使用的措词和术语是出于描述的目的,而不应被认为是限制性的。本文中“包括”、“包含”、“具有”、“涉及”、“以…为特征”、“特征在于”及其变体的使用意在涵盖其后列出的项、其等同物以及附加项,以及由其后专门列出的项组成的替代实施方式。在一个实施方式中,本文中描述的系统和方法由所描述的元素、动作或组件中一个、多于一个的每种组合或全部组成。对本文中以单数形式提及的系统和方法的实现或元素或动作的任何引用也可包含包括多个这些元素的实施方式,并且在本文中对任何实施方式或元素或动作的复数形式的任何引用也可以包含包括仅单数元素的实现。单数或复数形式的引用不旨在将当前公开的系统或方法、它们的组件、动作或元素限制为单数或复数配置。对基于任何信息、动作或元素的任何动作或元素的引用可以包括其中该动作或元素至少部分基于任何信息、动作或元素。本文中公开的任何实施方式可以与任何其他实施方式或实施例组合,并且对“实施方式”、“一些实施方式”、“一个实施方式”等的引用不一定是互斥的,并且旨在指示结合实施方式描述的特定的特征、结构或特性可以被包括在至少一个实施方式或实施例中。如本文中所使用的这样的术语不一定全部指代相同的实施方式。任何实施方式可以以与本文公开的方面和实施方式一致的任何方式与任何其他实施方式相结合地包括在内或排它地。对“或”的引用可以解释为包括性的,以使得使用“或”描述的任何术语可以指示单个、一个以上以及所有所描述术语中的任何一个。例如,对“'a'和'b'中的至少一个”的引用可以仅包括“a”、仅包括“b”以及“a”和“b”两者。与“包含”或其他开放式术语结合使用的此类参考可以包括附加项。在附图、具体实施方式或任何权利要求中的技术特征之后具有附图标记的情况下,已经包括附图标记以增加附图、具体实施方式和权利要求书的可理解性。因此,附图标记无论存在与否都不对任何权利要求要素的范围具有任何限制作用。本文中描述的系统和方法可以以其他特定形式来实现而不背离其特征。前述实施方式是说明性的,而不是限制所描述的系统和方法。因此,本文中描述的系统和方法的范围由所附权利要求书来指示,而不是由前述说明书来指示,并且其中包含在权利要求书的等同的含义和范围内的改变。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1