识别移动计算设备中的重复语音的制作方法

文档序号：2827146阅读：190来源：国知局

识别移动计算设备中的重复语音的制作方法
【专利摘要】本文公开了一种方法，用于经由处理器识别移动计算设备中的重复话语。第一话语被检测正被说出至第一移动计算设备(404)。同样地，在预定时间段内第二话语被检测正被说出至第二移动计算设备(406)。第二话语实质上匹配第一说出的话语，并且第一移动计算设备和第二移动计算设备彼此通信地耦合。处理器能够至少临时地捕获匹配话语用于后续处理功能(408)。执行的后续处理功能基于捕获话语的类型。
【专利说明】识别移动计算设备中的重复语音

【技术领域】
[0001]本公开总体上涉及识别和分析向移动计算设备说出的有声表达，并且更具体地涉及监控用于匹配的有声表达。

【背景技术】
[0002]移动计算设备(有时还被称为移动通信设备，下文被称为“设备”)诸如智能电话和平板计算设备例如装配有用于与另一设备的另一用户通信话语(这里被限定为该设备的用户的有声表达)的收发器。在设备的用户谈话期间大量信息可以设备的用户之间传递。

【专利附图】

【附图说明】
[0003]其中相似参考标号指代各视图中相同或功能相似的元件的附图与下文【具体实施方式】一起被并入并且形成说明书的一部分，并且用于进一步说明包括本发明的概念的实施方式，并且解释那些实施方式的各种原理和优势。
[0004]图1是使用单独移动计算设备的两个说话者的图示。
[0005]图2是在图1所示两个说话者之间传递的语音的短片段的图示。
[0006]图3是在图1所示两个说话者之间传递的语音的不同片段的另一图示。
[0007]图4是用于识别两个说话者之间经分段的语音的示例流程图。
[0008]图5是用于利用处理器实现一个或多个实施方式的另一示例流程图。
[0009]图6是用于识别移动计算设备中重复话语的又一示例流程图。
[0010]图7是移动计算设备的示例框图。
[0011]本领域技术人员容易理解附图中的元件出于简洁清楚的目的示出并且不需要按比例绘制。例如，附图中某些元件的尺寸相对于其他元件被扩大以助于增强对本发明实施方式的理解。
[0012]装置和方法组件已经在合适的地方由附图中的常规符号代表，从而仅示出与理解本发明实施方式相关的那些特定细节进而不使用本领域普通技术人员已经理解对这里描述有益的细节来混淆本公开。

【具体实施方式】
[0013]这里公开了一种方法，用于经由处理器识别移动计算设备中的重复话语。第一话语被检测正被说出至第一移动计算设备。同样地，在预定时间段内第二话语被检测正被说出至第二移动计算设备。第二话语实质上匹配第一说出的话语，并且第一移动计算设备和第二移动计算设备彼此通信地耦合。处理器能够至少临时地捕获匹配话语用于后续处理功能。待执行的后续处理功能基于捕获话语的类型。
[0014]这里公开了另一方法，用于经由处理器、收发器和用户接口识别移动计算设备中的重复话语。收发器包括至少接收器，并且可以包括发射器。第一设备地址的至少一部分在移动计算设备与第二计算设备之间基于话音的会话期间由收发器从第二计算设备接收。第二设备地址的至少一部分在从该第二计算设备接收第一设备地址的至少一部分之后直接在用户接口处检测。处理器确定第一设备地址与第二设备地址实质上匹配。第一设备地址与第二设备地址的实质上匹配可以响应于确定第一设备地址与第二设备地址实质上匹配被捕获在存储器中。基于话音的会话的终止由移动计算设备的组件之一(诸如收发器或处理器)检测。移动计算设备的功能响应于检测基于话音的会话的终止由处理器基于第一设备地址与第二设备地址的实质上匹配激活。
[0015]图1是示出了第一说话者110向移动计算设备115说话的图示100。移动计算设备115例如可以是智能电话、无绳电话、蜂窝电话、平板计算机、游戏设备、可穿戴计算设备或有线电话。图1还示出了第二说话者120向第二移动计算设备125说话。设想一组呼叫中可以存在若干移动计算设备的说话者和用户。然而，出于简洁清楚的目的，以下描述了谈话中的两个说话者。
[0016]第二移动计算设备125例如也可以是智能电话、无绳电话、蜂窝电话、平板计算机、游戏设备、可穿戴计算设备或有线电话。注意，第一移动计算设备和第二移动计算设备不需要相似。第一移动计算设备115经由网络130通信地耦合到第二移动计算设备125。网络130可以是采用蜂窝技术的蜂窝网络，诸如2G、3G、4G、LTE和HSPA+。备选地，网络130可以是采用WiFi技术或有线网络或者采用于提供通信链路的已经描述的网络技术的组合的无线网络。
[0017]第一说话者110和第二说话者120从事谈话，该谈话被针对谈话中说话者之一的重复话语进行分析。图2图示了第一说话者110与第二说话者120之间交换的话语或语音或有声表达的示例200。在一个实施方式中，第一说话者110说出话语210( “847”)，同时第二说话者120说出话语220 ( “847”)。话语210和话语220在图2中完全匹配，因此第二说话者120完全重复了第一说话者的话语。重复的话语在预定时间段270内出现以避免包括作为识别的话语或语音的偏离或无关谈话或噪声。
[0018]继续图2中所示的谈话，第一说话者110说出话语230 ( “2012”)。第二说话者120说出话语240( “2012”)，其与第一说话者的话语完全匹配；因此第二说话者120完全重复第一说话者的话语。匹配的话语以格式化的数据串250组合。该格式化的数据串250可以是电话号码、地址、编码、人的名字、企业名称、商店名称或其他字符化信息。该格式化的数据串250可以被临时存储在存储位置260中。存储位置260可以是ROM、闪存驱动、高速缓存、服务器、缓冲器或适于存储数据的其他存储器设备。因此，匹配的话语255被至少临时存储在存储位置260中。
[0019]当匹配的话语被确定时，其例如可以被显示为书面文本、动画或超链接。同样地，所显示的匹配的话语的书面文本可以被采用为去往网站的超链接。
[0020]图3图示了第二说话者120说出的不匹配话语的示例300。最初，第一说话者110说出话语210 ( “847”)，之后第二说话者120说出话语220 ( “847”)。话语210与话语220在图2中完全匹配，因此第二说话者120完全重复了第一说话者的话语。重复的话语在预定时间段270内出现。该时间段例如可以以秒或分钟为单位。
[0021]继续图3中所示的谈话，第一说话者110说出话语230 ( “2012”)。第二说话者120之后说出话语310 ( “2000”)，其不匹配在预定时间段270中由第一说话者110说出的话语230。因此，没有形成格式化的数据串并且没有所示格式化的数据串的临时存储。另夕卜，说话者和重复话语的顺序可以被颠倒。即，第一说话者可以重复第二说话者的语句。
[0022]图2和图3中重复的话语在预定时间段期间被分段、解析、分割或分离。因此，其完整的含义无法立即了解。在从分段话语中形成格式化的数据串之后，便可以了解其全部分段的话语是否形成例如地址、电话号码、银行号码或零售店名称。
[0023]图4通过示例示出了用于利用处理器来实现一个或多个实施方式的流程图400。步骤402初始化过程或方法。步骤404检测向第一移动通信设备第一说出的话语。步骤406检测向第二移动通信设备第二说出的话语。
[0024]由步骤408执行关于在步骤404检测的第一说出的话语是否匹配在步骤406检测的第二说出的话语的质询。如果发现肯定的匹配，则匹配的说出的话语由步骤410临时存储。步骤412确定话语的特定类型。后续处理功能由步骤414基于移动通信设备的话语的类型执行或发起。可选地，步骤416可以被采用以在第一移动通信设备或第二移动通信设备或者多个移动通信设备上显示匹配的说出的话语。
[0025]如果步骤408没有找到匹配的话语，则由步骤404对将来说出的话语执行进一步检测。
[0026]图5通过示例示出了用于利用处理器来实现一个或多个实施方式的流程图500。步骤502初始化过程或方法。步骤504检测向第一移动计算设备说出的多个分段话语。向第一移动计算设备说出的多个分段话语可以形成完整消息。步骤406检测限定时间段内向第二移动计算设备说出的每个重复话语分段是否匹配向第一移动计算设备说出的多个分段话语的每个分段话语。
[0027]由步骤508执行关于步骤504中检测的第一说出的话语是否匹配步骤506中检测的第二说出的话语的质询。当检测到分段的说出的话语不匹配时，步骤510警告第二移动计算设备。该警告可以包括不匹配话语的显示或者其他视觉通知，诸如颜色改变、标记、字体改变。另外，听觉警告可以包括移动计算设备说出不匹配话语或者另一听觉信号的使用，包括口哨、汽笛、喇叭或可以意味着出现错误的任意声音。步骤512启用检测到的不匹配分段说出的话语的校正。可选地，移动通信设备可以提供有允许用户禁用此自动校正特征的用户特征，如果移动通信设备的用户更情愿这样做的话。
[0028]步骤508的质询继续直到从多个匹配的分段话语形成的消息向第二移动计算设备完整说出。如果发现肯定的匹配，则匹配的说出的话语由步骤514临时存储。因此，分段话语中说出的分段电话号码可以被存储为完整电话号码，这是因为其是完整消息。步骤516确定话语的特定类型。后续处理功能由步骤518基于话语的类型或所捕获消息的类型执行或发起用于移动通信设备。
[0029]后续处理功能例如可以包括发起显示的地图；打开浏览器窗口；初始化银行运营；打开联系人或地址列表；附加照片或图像；提供零售店运营信息，或初始化相机传感器的应用或操作功能。附加后续功能可以包括对应于电话号码的拨号功能；位置搜索功能；信息搜索功能；音乐播放器功能；电子书阅读器功能。一个或多个过滤器可以被采用来辨别某些说出的话语，例如，针对说出的零售店的过滤器可以迅速产生关于该零售店的结果而不需要凭借查找联系人列表或网站上的信息。同样地，关于音乐分组的说出的话语可以过滤以提供关于该特定音乐分组的音乐选集。
[0030]应当注意，第一设备地址与第二设备地址可以是与设备相关联的各种不同地址，诸如但不限于，电话号码、消息传输地址(诸如电子邮件地址、即时消息传输地址、SMS地址等)以及计算设备的其他标识地址。还应当注意，针对某些实施方式，在第一设备地址的第一部分被接收之后可以直接检测第二设备地址的第一部分(即，其间没有其他基于话音的信号)，并且在第一设备地址的第二部分被接收之后可以直接检测第二设备地址的第二部分。针对这些实施方式，在第二设备地址的第一部分被检测之后可以直接接收第一设备地址的第二部分。在其他实施方式中，在从第二计算设备接收第一设备地址之后可以直接检测第二设备地址。
[0031]图6通过示例图示了用于识别移动计算设备中重复话语的流程图600。步骤602初始化基于话语的会话。步骤604指导收发器接收第一设备地址的至少一部分。因此，第一设备地址的至少一部分可以在移动计算设备与第二计算设备之间基于话音的会话期间从第二计算设备接收。设备地址可以包括电话号码、电子邮件地址、短消息传输服务(SMS)地址或其他消息传输地址，诸如多媒体消息传输服务(MMS)。
[0032]流程图600的步骤606针对第一设备在用户接口检测第二设备地址。该第二设备地址可以在多个部分中并且可以包括电话号码、电子邮件地址、短消息传输服务(SMS)地址或其他消息传输地址，诸如多媒体消息传输服务(MMS)。因此，在从第二计算设备接收第一设备地址的至少一部分之后直接检测第二设备地址的至少一部分。
[0033]步骤608具有处理器，针对移动计算设备检测第一设备地址与第二设备地址的匹配是否出现或存在。在一个实施方式中，如果不是完全相同，地址的匹配可以是实质上或近似相同。步骤610检测基于话音的会话的终止。
[0034]随后，步骤612基于第一设备地址与第二设备地址的匹配激活第一设备的功能。附加或可选步骤可以包括步骤620-626。步骤620在第二设备接收第一设备地址之后检测第二设备地址。因此，在接收第一设备地址的第一部分之后直接检测第二设备地址的至少第一部分。
[0035]步骤622在收到第一设备地址之后检测第二设备地址。因此，在接收第一设备地址的第二部分之后直接检测第二设备地址的至少第二部分。
[0036]步骤624在接收第一设备地址之后检测第二设备地址。因此，如果在接收第一设备地址的至少一部分之后直接检测第二设备地址的至少一部分，则在从第二计算设备接收第一设备地址之后直接检测第二设备地址。
[0037]步骤626将第一计算设备与第二计算设备的匹配地址捕获在存储器位置中。因此，响应于检测到第一设备地址与第二设备地址实质上匹配，将第一设备地址与第二设备地址的实质上匹配捕获在存储器中。
[0038]图7示出了移动计算设备700的示例框图。移动计算设备700包括收发器710，该收发器710进一步包括发射器712和接收器714，用于通过网络发射和接收电通信信号。移动计算设备700还包括显示器720，该显示器720进一步包括用户接口 725，用于向移动通信设备700的用户显示有用信息并且使得用户能够输入数据。处理器730针对移动通信设备700进行说明、指导和分析。处理器730被配置为运行或操作这里所述方法中的任意方法。处理器730通信地耦合至存储器位置740、一个或多个传感器750、麦克风760和一个或多个音频扬声器770。另外，处理器730通信地耦合至显示器720和收发器710，并且可以包括时钟732。时钟732使得处理器730能够以及时方式执行若干步骤，并且还使得处理器730能够追踪与时间有关的事件的出现。
[0039]在上述说明书中，已经描述了【具体实施方式】。然而，本领域普通技术人员容易理解可以进行各种修改和改变而不脱离下文权利要求书中阐述的本发明的范围。因此，说明书和附图被认为是说明性而不是限制性，并且所有此类修改旨在被包括在本教导的范围内。
[0040]益处、优势、问题的解决方案以及可以使得任何益处、优势或解决方案出现或变得更显著的任何元素不被理解为任意或所有权利要求的关键、所需或必须的特征或元素。本发明仅由所附权利要求书限定，包括在所发布权利要求的所有等同物和本申请的未决期间进行的任意修改。
[0041]此外在本文档中，相关术语(诸如第一和第二、顶部和底部等)可以仅用于从另一实体或动作中区分一个实体或动作而不必要求或暗示此类实体或动作之间的任何实际这种关系或顺序。术语“由…组成”、“由…构成”、“具有”、“拥有”、“包括”、“包括有”、“包含”、“包含有”或其任意其他变体旨在覆盖非排他性包括，使得由…组成、具有、包括、包含元素列表的过程、方法、制品或装置不仅包括那些元素还可以包括未清楚列出或此类过程、方法、制品或装置固有的其他元素。由“由一个…组成”、“具有一个”、“包括一个”、“包含一个”处理的元素不(没有更多约束)排除在由…组成、具有、包括、包含该元素的过程、方法、制品或装置中存在附加相同元素。术语“一”和“一个”被限定为一个或多个除非这里另外明确指出。术语“实质上”、“基本上”、“近似”、“大约”或其任意其他版本被限定为如本领域普通技术人员理解的靠近，并且在一个非限制实施方式中，该术语被限定为在10%以内，在另一实施方式中在5%以内，在另一实施方式中在1%以内，以及在另一实施方式中在0.5%以内。这里使用的术语“耦合”被限定为连接，即便不必是直接地并且不必是机械地连接。以特定方式“配置”的设备或结构被以至少该方式配置，但还可以通过未列出的方式配置。
[0042]容易理解，某些实施方式可以包括一个或多个通用或专用处理器(或“处理设备”)诸如微处理器、数字信号处理器、定制处理器和现场可编程门阵列(FPGA)以及控制一个或多个处理器结合某些非处理器电路实现这里所述方法和/或装置的某些、大部分或所有功能的唯一存储的程序指令。备选地，某些或所有功能可以由状态机实现，该状态机不具有存储的程序指令或者在一个或多个专用集成电路(ASIC)中，其中每个功能或特定功能的某些组合被实现为定制逻辑。当然，可以使用两种方法的组合。
[0043]此外，实施方式可以被实现为其上存储有计算机可读代码的计算机可读存储介质，用于编程计算机(例如，包括处理器)执行这里所述和要求的方法。同样地，计算机可读存储介质可以包括非瞬态机器可读存储设备，其上存储有计算机程序，该计算机程序包括用于执行操作、步骤或指令集的多个代码段。
[0044]这种计算机可读存储介质的示例包括但不限于硬盘、⑶-ROM、光存储设备、磁存储设备、ROM (只读存储器)、PROM (可编程只读存储器)、EPROM (可擦可编程只读存储器)、EEPROM(电可擦可编程只读存储器)和闪存。此外，尽管可能的显著效果和许多设计选择由例如有效时间、当前技术和经济条件驱使，但是本领域普通技术人员期望当由这里公开的概念和原理引导时能够利用最少的实验过程生成这种软件指令和程序以及1C。
[0045]本公开的摘要被提供用于允许阅读者快速查明本技术公开的本质。容易理解该摘要并不用于解释或限制权利要求的范围或含义。另外，在之前的【具体实施方式】中，可以看出为了简化本公开的目的在各实施方式中各种特征被分组在一起。本公开的方法不被解释为反映本发明要求保护的实施方式要求比每个权利要求中明确记载的特征更多的特征。相反，如以下权利要求所反映，发明的主题在于小于单个公开实施方式的所有特征。因此，以下权利要求由此并入【具体实施方式】，其中每个权利要求站在其自己单独要求的主题上。
【权利要求】
1.一种用于识别移动计算设备中的重复话语的方法，包括: 经由处理器，检测向第一移动计算设备中说出的第一话语；经由所述处理器，检测在预定时间段内向第二移动计算设备中说出的第二话语，说出的所述第二话语实质上匹配说出的所述第一话语；其中所述第一移动计算设备与所述第二移动计算设备彼此通信地耦合；以及经由所述处理器，至少临时地捕获用于执行后续处理功能的匹配话语；其中所述后续处理功能基于所捕获话语的类型。
2.根据权利要求1所述的方法，进一步包括使得至少所述第二移动计算设备能够将所述匹配话语显示为文本。
3.根据权利要求2所述的方法，进一步包括使得所述匹配话语的所显示的文本能够作为超链接被采用。
4.根据权利要求1所述的方法，其中所述后续处理功能是拨号功能。
5.根据权利要求1所述的方法，其中所述后续处理功能是位置搜索功能。
6.根据权利要求1所述的方法，其中所述后续处理功能是信息搜索功能。
7.一种用于识别移动计算设备中的重复话语的方法，包括: 经由处理器，检测向第一移动计算设备中说出的多个分段话语；其中当被组合时所述多个分段话语形成完整消息；经由所述处理器，检测在限定时间段内向第二移动计算设备中说出的每个重复话语分段是否匹配向所述第一移动计算设备中说出的所述多个分段话语的每个分段话语；其中所述第一移动计算设备与所述第二移动计算设备彼此通信地耦合；经由所述处理器，当检测到分段话语不匹配时，警告所述第二移动计算设备；经由所述处理器，启用所检测到的不匹配的分段话语的校正；继续上述步骤直到从多个匹配的所述分段话语形成的所述完整消息被完整地向所述第二移动计算设备中说出；以及经由所述处理器，至少临时地捕获用于后续处理功能的所述完整消息；其中所述后续处理功能基于所捕获消息的类型。
8.根据权利要求7所述的方法，其中所述后续处理功能是拨号功能。
9.根据权利要求7所述的方法，其中所述后续处理功能是位置搜索功能。
10.根据权利要求7所述的方法，其中所述后续处理功能是信息搜索功能。
11.根据权利要求10所述的方法，其中所述信息搜索功能包括零售店信息。
12.根据权利要求11所述的方法，进一步包括过滤器以用于在预定时间段内说出的零售店。
13.根据权利要求7所述的方法，其中所述分段话语是电话号码的多个部分并且所述完整消息包括完整的电话号码。
14.一种用于识别移动计算设备中的重复话语的方法，所述移动计算设备包括处理器、收发器和用户接口，所述方法包括: 在所述移动计算设备与第二计算设备之间基于话音的会话期间在所述收发器从所述第二计算设备接收第一设备地址的至少一部分；在从所述第二计算设备接收所述第一设备地址的所述至少一部分之后在所述用户接口直接检测第二设备地址的至少一部分；由所述处理器确定所述第一设备地址与所述第二设备地址实质上匹配；在所述收发器或所述处理器检测所述基于话音的会话的终止；以及响应于检测所述基于话音的会话的所述终止，由所述处理器基于所述第一设备地址与所述第二设备地址的所述实质上匹配来激活所述移动计算设备的功能。
15.根据权利要求14所述的方法，进一步包括响应于确定所述第一设备地址与所述第二设备地址实质上匹配，将所述第一设备地址与所述第二设备地址的所述实质上匹配捕获到存储器中。
16.根据权利要求14所述的方法，其中所述第一设备地址与所述第二设备地址是电话号码。
17.根据权利要求14所述的方法，其中所述第一设备地址与所述第二设备地址是消息传输地址。
18.根据权利要求14所述的方法，其中在接收所述第一设备地址的所述至少一部分之后直接检测第二设备地址的所述至少一部分包括在从所述第二计算设备接收所述第一设备地址之后直接检测所述第二设备地址。
19.根据权利要求14所述的方法，其中: 在接收所述第一设备地址的所述至少一部分之后直接检测第二设备地址的所述至少一部分包括在接收所述第一设备地址的第一部分之后直接检测所述第二设备地址的第一部分并且在接收所述第一设备地址的第二部分之后直接检测所述第二设备地址的第二部分。
【文档编号】G10L15/26GK104285252SQ201380020667
【公开日】2015年1月14日申请日期:2013年4月19日优先权日:2012年4月20日
【发明者】R·M·阿拉梅, J·萨拉比, H·D·瓦塔纳贝申请人:摩托罗拉移动有限责任公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：R·M·阿拉梅;J·萨拉比;H·D·瓦塔纳贝
技术所有人：摩托罗拉移动有限责任公司
我是此专利的发明人

上一篇：用于吸收飞机机舱的涡轮喷气发动机发出的声波的薄面板
上一篇：声音识别装置制造方法