语音控制装置、语音控制方法和程序的制作方法

文档序号：7992891阅读：249来源：国知局

语音控制装置、语音控制方法和程序的制作方法
【专利摘要】根据说明性实施例，提供一种信息处理设备。所述信息处理设备，包括：通信装置，用于接收与目标区域内的相应位置对应的多条标签信息，所述目标区域的位置通过所述设备的位置来定义；以及输出装置，用于输出多种声音，使得对于每种声音，该声音的至少一部分与另一种声音的至少一部分重叠，每种声音指示相应的标签信息。
【专利说明】语音控制装置、语音控制方法和程序
【技术领域】
[0001]本发明涉及语音控制装置、语音控制方法和程序。
【背景技术】
[0002]近来，在伴随着配置有成像装置和显示器的移动终端的普及的焦点下，出现了使用AR(增强现实)技术的应用。例如，作为使用AR技术的应用，AR应用基于移动设备的位置对实际空间的图片图像增加诸如图片、文本或语音的标签信息。
[0003]AR应用允许用户观看并操作添加到实际空间的一条标签信息。然而，当添加到实际空间的标签信息数增多时，由于屏幕的可视性降低，用户将难于找到希望的信息。关于该问题，JP-A-2010-49158公开了一种语音控制装置，其根据移动终端与对象位置之间的关系通过语音引导用户。
[0004]引用列表
[0005][专利文献]
[0006]专利文献1:JP2010-49158A

【发明内容】

[0007]技术问题
[0008]然而，在通过语音串行输出与移动终端周围的区域关联的多条标签信息的情况中，当标签信息数增大时，需要相当长的时间以输出用户优选的标签信息。从而用户不容易提取希望的标签信息。
[0009]本发明提出一种新颖的改善的语音控制装置、语音控制方法和程序，其允许从多条信息中通过语音快速提取希望输出的信息。
[0010]解决问题的技术方案
[0011]根据示意实施例，提供一种信息处理设备。所述信息处理设备，包括:通信装置，用于接收对应于目标区域内的各个位置的多条标签信息，所述目标区域具有由所述设备的位置定义的位置；以及输出装置，用于输出多种声音，使得对于每种声音，所述声音的至少一部分与另一种声音的至少一部分重叠，每种所述声音指不相应的标签信息。
[0012]发明的有益效果
[0013]如上所述，本发明使得可以从多条信息迅速提取将通过语音输出的一条信息。
【专利附图】

【附图说明】
[0014]图1示出根据本发明实施例的语音控制系统的配置；
[0015]图2示出添加有标签信息的实际空间的图片图像；
[0016]图3示出根据第一实施例的移动终端的使用模式的具体示例；
[0017]图4为示出根据本发明第一实施例的移动终端的配置的功能框图；
[0018]图5示出通过区域设置部分设置的目标区域的具体示例；[0019]图6示出在当移动终端附近的标签信息密度高的情况中的目标区域的具体示例；
[0020]图7示出在当移动终端附近的标签信息密度低的情况中的目标区域的具体示例；
[0021]图8示出重排序的标签信息；
[0022]图9示出通过语音控制部分的语音控制的具体示例；
[0023]图10示出标签信息列表的具体示例；
[0024]图11为示出根据本发明第一实施例的移动终端的操作的流程图；
[0025]图12示出根据本发明第二实施例的移动终端和语音输出单元；
[0026]图13为示出根据第二实施例的移动终端的配置的功能框图；
[0027]图14示出根据第二实施例的显示器的示例；以及
[0028]图15示出移动终端的硬件配置。
【具体实施方式】
[0029]下文中，将参照附图详细描述本发明的优选实施例。注意，在该说明书和附图中，以相同的标号表示具有基本相同的功能和结构的构成元件，并省略对这些构成元件的重复的说明。
[0030]下文中，将参照附图详细描述本发明的优选实施例。在该说明书和附图中，将对具有基本相同的结构和功能的构件提供相同的标号，以避免重复说明。
[0031]另外，在说明书和附图中，将通过在相同标号后面标上不同字母而彼此区分具有基本相同结构和功能的多个构件。然而，当可以不用彼此区分具有基本相同的结构和功能的多个构件时，将仅提供相同的标号。
[0032]将以如下顺序描述本发明。
[0033]1.语音控制系统的基本配置
[0034]2.第一实施例
[0035]2-1.第一实施例的概述
[0036]2-2.根据第一实施例的移动终端的配置
[0037]2-3.根据第一实施例的移动终端的操作
[0038]3.第二实施例
[0039]4.移动终端的硬件配置
[0040]5.结论
[0041]〈〈L语音控制系统的基本配置》
[0042]如在作为示例的“2.第一实施例”至“3.第二实施例”中详细描述，将以各个模式实施本发明中所述的技术。根据实施例的语音控制装置(移动终端20)包括:
[0043]A.信息获取部分(通信部分228和信息分析部分236)，其获取与周围区域中的位置关联的一条信息；以及
[0044]B.语音控制部分(240)，其执行语音控制，使得当通过信息获取部分获取多条信息时，同时输出多条信息。
[0045]首先，将参考图1描述对于各实施例共有的语音控制系统的基本配置。
[0046]图1示出根据本发明实施例的语音控制系统的配置。根据本发明实施例的语音控制系统包括AR服务器10和移动终端20，如图1所示。[0047]AR服务器10和移动终端20经通信网络12彼此连接，并且可以经通信网络12在它们之间传输各种信息。通信网络12是从连接到通信网络12的设备传输的信息的有线或无线传输信道。例如，通信网络12可包括诸如互联网、电话网、卫星通信网络的公众网络或各种LAN(局域网)、包括以太网(注册商标)的WAN(广域网)。另外，通信网络12可包括租用专线网络，诸如IP_VPN(互联网协议-虚拟专用网络)。
[0048]AR服务器10把位置信息和标签信息彼此关联地存储，并经通信网络12将位置信息和标签信息传送到移动终端20。例如，当从移动终端20接收一条表示移动终端20的当前位置的位置信息时，AR服务器10向移动终端20传送一条表示移动终端20周围位置的位置信息和标签信息。另外，当从移动终端20接收一条表示其中移动终端20的特定部分的朝向的方向的方向信息时，AR服务器10可以向移动终端20传送一条表不位置方向的位置信息和标签信息，该位置方向通过从移动终端20的当前位置观察的方向信息表示。
[0049]对于标签信息，例如可以采用诸如图片、或运动图片的图像信息、文本信息和语音信息。标签信息可以是通过关联位置信息表示的关于位置的一条PR信息、或者相对于由关联位置信息表示的位置通过普通用户提供和上载的一条信息。
[0050]移动终端20获取关于当前位置的周围区域的一条位置信息和标签信息，并将标签信息提供给用户。例如，移动终端20向AR服务器10传送表示当前位置的一条位置信息，以从AR服务器10获取关于当前位置的周围区域的一条标签信息和位置信息。并且移动终端20可以将一条标签信息添加到实际空间的图片图像，并在触摸面板22上显示该图片图像。
[0051]移动终端20包括扬声器24作为用于输出语音的语音输出部分的不例；以及麦克风26，作为用于拾取语音的语音输入部分的示例。在该说明书中，在移动终端20中，将设置扬声器24的端部称为上侧US ;并将设置麦克风26的端部称为下侧LS。
[0052]图1示出智能电话作为移动终端20的示例。然而，移动终端20不限制于智能电话。例如，移动终端20可以是PDA(个人数字助理)、移动电话、移动音乐再现器、移动图像处理器、或移动游戏机。
[0053](实施例的背景)
[0054]随着诸如智能电话的移动终端的普及，如上所述的用于对实际空间的图片图像添加诸如图片、文本和/或语音的标签信息的应用正受到更多关注。使用这样的应用，例如，显示如图2所示添加有多条标签信息的实际空间的图片图像。从而，允许用户观看和操作从实际空间几乎不能获取的多条标签信息。
[0055]然而，当添加到实际空间的标签信息条数增多时，由于屏幕的可视性降低，用户将难于找到希望的信息。设想通过语音输出标签信息。在通过语音顺序输出与移动终端周围的区域关联的多条标签信息的情况中，当标签信息数增大时，由于需要相当长的时间输出用户关注的一条标签信息，从而用户不容易提取希望的标签信息。
[0056]在上述情况下，提出了本发明实施例。该实施例使得可以迅速从通过语音输出的多条标签信息提取信息。下文将详细描述提供该效果的本发明第一实施例和第二实施例。
[0057]〈〈2.第一实施例》
[0058]〈2-1.第一实施例的概述〉
[0059]已知这样的事实，即使在充满各种噪声的情况中，人们仍可以无意识地认出他/她关注的词和对话(鸡尾酒会效应)。根据本发明第一实施例的移动终端20-1使用该鸡尾酒会效应。当对用户提供通过语音输出的标签信息时，用户可以迅速提取喜欢的标签信息。参考图3，下文将描述根据第一实施例的移动终端20-1的使用模式的具体示例。
[0060]图3示出根据第一实施例的移动终端20-1的使用模式的具体示例。当用户如图3所示在他/她的耳朵上握持移动终端20-1的扬声器24时，移动终端20-1同时执行对与周围区域中的位置关联的多条标签信息的语音输出。具体地说，移动终端20-1设置包括作为基准的方向的目标区域，其中作为移动终端20-1的特定部分的下侧LS朝向该方向，并同时输出与目标区域中的位置Pl至P3关联的多条标签信息TA至TC。S卩，移动终端20-1同时执行以下语音输出:一条标签信息TA “酷！ KKK的专集”、一条标签信息TB “美味蛋糕！就在FFF咖啡店”、一条标签信息TC “女演员A在BBB出现！ ”。
[0061]通过这样，当用户例如关注女演员A时，他/她基于鸡尾酒会效应迅速听到关于女演员A的标签信息，并知道女演员A在移动终端20-1的下侧LS所朝向的方向出现。移动终端20-1可以在与标签信息关联的位置与当前位置之间的距离增大时以更小音量级输出标签信息。在该情况中，用户可以感觉到与希望的标签信息关联的位置与当前位置之间的距离。
[0062]〈2-2.根据第一实施例的移动终端的配置〉
[0063]上文描述了本发明的第一实施例的概述。随后，将详细描述根据本发明第一实施例的移动终端20-1的配置。
[0064]图4为示出根据本发明第一实施例的移动终端20-1的配置的功能框图。如图4所不，根据本发明第一实施例的移动终端20-1包括触摸面板22、扬声器24、GPS220、加速传感器224、通信部分228、区域设置部分232、信息分析部分236、语音控制部分240和显示控制部分244。移动终端20-1可包括方向传感器(未示出)，诸如电子罗盘。可以包括方向传感器作为加速传感器224的补充或者作为加速传感器224的替换。
[0065](GPS)
[0066]GPS (全球定位系统)220接收从人造卫星传送的导航消息以基于导航消息的接收结果获取移动终端20-1的当前位置。这里提出GPS仅作为用于获取移动终端20-1的当前位置的部件的示例。可以通过其它配置获取移动终端20-1的当前位置。例如，移动终端20-1可以基于接收的从周围无线通信装置发送的WiFi无线电波的强度估计当前位置，或者可以基于用户的输入操作获取当前位置。
[0067](加速度传感器)
[0068]加速传感器224测量移动终端20-1的加速度。基于加速传感器224的测量结果，可以估计移动终端20-1的朝向，例如移动终端20-1的下侧LS所朝向的方向。
[0069](通信部分)
[0070]通信部分228是与AR服务器10的接口，用于与AR服务器10交换各种信息。例如，通信部分228将通过GPS220获取的移动终端20-1的一条位置信息发送给AR服务器10，并与位置信息一起从AR服务器10接收与移动终端20-1周围的区域关联的一条标签信息。另外，除了移动终端20-1的位置信息之外，通信部分228还可以将通过加速传感器224、方向传感器或者加速传感器224和方向传感器二者进行的测量的结果发送给AR服务器10。在该情况中，可以从AR服务器10接收一条标签信息，该标签信息与在移动终端20-1的下侧LS所朝向的方向中的位置关联。从而，将在下文描述的通信部分228或信息分析部分236用作信息获取部分，用于获取用于输出语音信息的标签信息。
[0071]在该实施例中，给出了其中移动终端20-1从AR服务器10获取标签信息的示例。然而，实施例不限于上述实施例。例如，移动终端20-1可具有其中位置信息与标签信息相互关联的数据库，并且可以从数据库获取与移动终端20-1周围的区域关联的标签信息。
[0072](区域设置部分)
[0073]区域设置部分232基于从GPS提供的移动终端20_1的位置信息和通过加速传感器224、方向传感器、或加速传感器224和方向传感器二者获取的测量结果设置与标签信息的语音输出相关的目标区域。语音输出的对象是通过区域设置部分232设置的目标区域内与位置信息关联的标签信息。这里，参考图5，下面具体描述通过区域设置部分232设置的目标区域。
[0074]图5示出通过区域设置部分232设置的具体目标区域的示例。区域设置部分232可以设置例如通过半径“r”和相对于作为基准的移动终端20-1的下侧LS所朝向的方向的角度“P”表示的扇形区域作为目标区域。
[0075]这里，如果在目标区域中包括过多的以声音形式同时输出的多条标签信息，则鸡尾酒会效应可能降低，从而导致用户难于捕获喜欢的标签信息。相反地，如果在目标区域中包括过少的以声音形式同时输出的多条标签信息，则输出用户的喜好标签信息的概率也降低。从而，信息提取的效率下降。
[0076]从而，区域设置部分232可以根据区域内的多条标签信息的密度改变目标区域的范围。例如，区域设置部分232可以将目标区域设置为使得与目标区域内的位置信息关联的标签信息条数大于下限值、小于上限值、或等于预定数值。参考图6和图7，将关于这点进行具体描述。
[0077]图6示出其中移动终端20-1周围的区域中的多条标签信息的密度过高的目标区域的具体示例。而图7示出其中移动终端20-1周围的区域中的多条标签信息的密度过低的目标区域的具体示例。当周围区域中的标签信息的密度如图6所示过高时，区域设置部分232可以通过减小半径“r”和角度“P”而将目标区域设置得更窄。相反地，当周围区域中的标签信息的密度如图7所示过低时，区域设置部分232可以通过增大半径“r”和角度“P”而将目标区域设置得更宽。
[0078]通过如上所述配置区域设置部分232，可以提高用户对标签信息的理解程度并确保信息提取的效率。
[0079](信息分析部分)
[0080]信息分析部分236从通过通信部分228接收的周围区域中的多条标签信息提取若干条标签信息，每条标签信息与通过区域设置部分232设置的目标区域内的一条位置信息关联。另外，信息分析部分236分析与提取的标签信息关联的每个位置以及到移动终端20-1的距离和角度，并将分析结果提供给语音控制部分240。
[0081](语音控制部分)
[0082]语音控制部分240控制通过信息分析部分236提取的标签信息从扬声器24输出的语音。具体地说，语音控制部分240执行语音控制，使得从扬声器24同时输出通过信息分析部分236提取的标签信息(第一控制模式)。通过该配置，使得用户可以基于鸡尾酒会效应从同时输出的多条标签信息有效地捕获他的/她的喜欢的标签信息。另外，语音控制部分240可以在输出语音标签信息时执行以下控制，即，示例A至示例E。
[0083]控制示例A
[0084]语音控制部分240可以根据移动终端20-1与关联于标签信息的位置之间的距离控制标签信息的音量级。例如，语音控制部分240可以进行控制使得随着移动终端20-1与关联于标签信息的位置之间的距离的增大，标签信息的音量级减小。该配置使得用户可以捕获当前位置与关联于标签信息的位置之间的距离感。
[0085]控制示例B
[0086]语音控制部分240可以执行语音控制使得通过彼此不同的语音特征输出多条标签信息中的每一个。例如，语音控制部分240可以执行语音控制使得通过彼此不同的基本频率或音质输出多条标签信息中的每一个。该配置确保鸡尾酒会效应更有效地发挥作用。
[0087]控制示例C
[0088]当标签信息不是语音信息时，语音控制部分240可以从标签信息生成一条语音信息。例如，当标签信息是一条文本信息时，语音控制部分240可以生成对应于该文本信息的一条语音信息。另外，当标签信息是图片信息时，语音控制部分240可以生成对应于添加到该图片标签的评论的一条语音信息。该配置使得语音控制部分240可以处理多条标签信息作为语音输出的对象。
[0089]控制示例D
[0090]语音控制部分240可以从各条标签信息提取关键字，并执行语音控制以分散输出标签信息的关键字的定时。例如，假设标签信息TA “酷！ KKK的专辑”的关键字是“KKK” ；标签信息TB “美味蛋糕！就在FFF咖啡店”的关键字是“FFF咖啡店”;以及标签信息TC “女演员A在BBB出现”的关键字是“女演员A”。在该情况中，当原样输出这些标签信息时，同时输出标签信息TA的关键字“KKK”和标签信息TB的关键字“FFF咖啡店”。在该情况中，语音控制部分240可以如图8所示重排序标签信息TB的内容，使得以与标签信息TB的关键字“FFF咖啡店”不同的定时输出标签信息TA的关键字“KKK”。该配置允许更容易地捕获标签信息的关键字。
[0091]控制示例E
[0092]语音控制部分240可以基于用户的喜好重排序标签信息的内容使得首先输出用户喜欢的词。在该情况中，当用户例如关注“女演员A”时，语音控制部分240可以将标签信息TC的内容例如重排序为“女演员A !在BBB出现”，使得“女演员A”首先输出。该配置使得用户可以在更早的定时提取他/她喜欢的标签信息。
[0093]语音控制部分240将语音控制切换到第二模式，其中基于诸如轻敲的预定用户操作顺序输出通过信息分析部分236提取的多条标签信息。在该模式中，允许用户通过在希望的标签信息通过语音输出时执行第一用户操作而选择希望的一条标签信息。语音控制部分240可以响应于诸如轻弹的第二用户操作切换将通过语音输出的对象的标签信息。下文将参考图9具体描述一系列这样的操作。
[0094]图9示出通过语音控制部分240的语音控制的具体示例。当如图9所示用户在多条标签信息被同时输出时进行轻敲操作时，语音控制部分240切换其中顺序输出多条标签信息的语音控制模式。语音控制部分240可执行语音控制使得从各自与离移动终端20-1较近的位置关联的多条标签信息顺序输出多条标签信息。字符的大小对应于音量级，如图9所示。
[0095]然后，当通过语音输出希望的标签信息时，当进行摇动操作以摇动移动终端20-1，则选择希望的标签信息。例如，当用户在输出标签信息TB时进行摇动操作时，显示控制部分244在触摸面板22上显示与标签信息TB关联的位置。
[0096]如上所述，用户基于鸡尾酒会效应选择包括一条喜欢的标签信息的组，然后从该组指定喜欢的标签信息，从而获取喜欢的标签信息的具体信息。
[0097](显示控制部分)
[0098]显示控制部分244生成各个显示画面，并在触摸面板22上显示生成的显示画面。具体地，在其中顺序输出多条标签信息的第二模式中，当用户进行诸如摇动操作的操作时，根据实施例的显示控制部分244在进行摇动操作时控制对与通过语音输出的标签信息关联的位置的显示(图9)。
[0099]上文描述了其中顺序输出多条标签信息的第二模式作为用于允许用户从一组多条标签信息选择一条喜欢的标签信息的方法。然而，允许用户从组中选择喜欢的标签信息的方法不限于上述方法。例如，当在其中同时输出多条标签信息的第一模式中进行预定用户操作时，显示控制部分244可以将多条标签信息固定在用户进行操作时的点，并在触摸面板22上显示固定的多条标签信息的列表，如图10所示。该配置允许用户从多条标签信息的列表选择希望的标签信息。
[0100]〈2-3.根据第一实施例的移动终端的操作〉
[0101]上文已经详细描述了根据本发明第一实施例的移动终端20-1的配置。现在，参考图11，下文将描述根据本发明第一实施例的移动终端20-1的操作。
[0102]图11为示出根据本发明第一实施例的移动终端20-1的操作的流程图。如图11所示，移动终端20-1的GPS220测量移动终端20-1的当前位置，并且加速传感器224测量移动终端20-1的下侧LS的朝向(S304)。然后，通信部分228向AR服务器10发送移动终端20-1的一条位置信息，从而从AR服务器10获取与移动终端20-1周围的区域关联的一条标签信息(S308)。另外，方向传感器可以测量移动终端20-1指向的方向，并且该测量的方向可以被包括在位置信息中。
[0103]另一方面，区域设置部分234基于移动终端20-1的位置信息以及通过加速传感器224获取的测量结果和从方向传感器获取的测量结果中的任一个或二者，对于标签信息的语音输出设置目标区域。然后，信息分析部分236从与移动终端20-1周围的区域关联的标签信息提取目标区域中的一条标签信息(S316)。语音控制部分240执行语音控制，使得从扬声器24同时输出目标区域中的多条标签信息(S320)。
[0104]然后，当用户在触摸面板22上进行轻敲操作时(S324)，语音控制部分240切换语音控制模式，使得顺序输出目标区域中的多条标签信息(S328)。当用户进行摇动操作时(S332)，显示控制部分244在触摸面板22上显示表示与在进行摇动操作时通过语音输出的标签信息关联的位置的显示画面(S336)。
[0105]如上所述，根据本发明第一实施例，通过同时输出多条标签信息，用户可以基于鸡尾酒会效应选择包括他/她喜欢的标签信息的组。
[0106]〈〈3.第二实施例》[0107]下文中，将描述本发明第二实施例。本发明第二实施例不同于第一实施例在于，不是通过扬声器24而是通过可佩戴语音输出单元进行语音输出。下文中，将具体描述本发明第二实施例。
[0108]图12示出根据第二实施例的移动终端20-2和根据本公开的语音输出单元30。如图12所示，根据第二实施例的移动终端20-2将语音信号发送到语音输出单元30，并且语音输出单元30以立体声输出所接收的来自移动终端20-2的语音信号。
[0109]图12示出其中移动终端20-2和语音输出单元30通过近场通信彼此连接的示例。然而，移动终端20-2和语音输出单元30可通过有线相互连接。图12示出作为可佩戴语音输出单元30的示例的头戴式耳机。然而，语音输出单元30不限于头戴式耳机，而可以是例如耳塞式耳机。
[0110](根据第二实施例的移动终端的配置)
[0111]下面，参考图13，将描述根据本发明第二实施例的移动终端20-2的配置。图13为示出根据第二实施例的移动终端20-2的配置的功能框图。如图13所示，根据第二实施例的移动终端20-2包括触摸面板22、GPS220、加速传感器224、通信部分228、区域设置部分234、信息分析部分236、语音控制部分240、显示控制部分246、声源设置部分248、语音处理部分252以及邻近通信部分256。由于触摸面板22、GPS220、加速传感器224、通信部分228和语音控制部分240与第一实施例中基本相同，因此在此省略对其的详细描述。移动终端20-2可包括方向传感器(未示出)，诸如电子罗盘。可以包括方向传感器作为加速传感器224的补充或者作为加速传感器224的替换。
[0112]区域设置部分234基于从GPS220提供的移动终端20_1的位置信息以及通过加速传感器224获取的测量结果和从方向传感器获取的测量结果中的任一个或二者，对标签信息的语音输出设置目标区域。这里，与第一实施例不同的是，用户不需要在耳朵边握持扬声器24，区域设置部分234利用其中将移动终端20-2的例如上侧US (而不是下侧LS)的朝向为基准的方向来设置目标区域。
[0113]声源设置部分248对通过信息分析部分236提取的多条标签信息的每个设置虚拟声源位置。例如，声源设置部分248可以在对应虚拟声源位置设置各自与多条标签信息关联的位置。声源设置部分248可以对于多条标签信息设置与关联于多条标签信息的位置不同的位置作为虚拟声源位置。从而，通过对多条标签信息设置相互不同的虚拟声源位置，期望增强鸡尾酒会效应。
[0114]语音处理部分252在多条标签信息的每条上执行语音处理，从而使得用户捕获通过声源设置部分248设置的虚拟声源位置作为声源位置。根据用户的朝向执行该处理。从而，用户可佩戴用于检测用户朝向的传感器，或者可以将移动终端20-2的上侧US的朝向视为用户的朝向。
[0115]邻近通信部分256将通过语音处理部分252处理的语音信号发送到语音输出单元30。语音输出单元30以立体声输出所接收的来自邻近通信部分256的语音信号。
[0116]显示控制部分246在从语音输出单元30同时输出多条标签信息的同时在触摸面板22上显示多条标签信息。这里，显示控制部分246可以执行显示控制，使得在相对于通过声源设置部分248设置的作为基准的当前位置的虚拟声源位置的每个处显示多条标签信息，如图14所示。该配置允许用户还视觉捕获通过听觉捕获的多条标签信息的位置。[0117]〈〈4.移动终端的硬件配置》
[0118]上文已经详细描述了本发明的实施例。通过移动终端20的软件和硬件之间的协作实现通过根据本发明实施例的移动终端20的上述信息处理。下文将参考图15描述移动终端20的硬件配置。
[0119]图15为示出移动终端20的硬件配置的说明图。如图15所示,移动终端20包括中央处理单元(CPU) 201、只读存储器(ROM) 202、随机存取存储器(RAM) 203、输入设备208、输出设备210、存储设备211、驱动器212、成像设备213、以及通信设备215。
[0120]CPU201用作算术处理单元和控制设备，并根据各个程序控制移动终端20中的整体操作。CPU201还可以为微处理器。R0M202存储由CPU201使用的程序和运算参数。RAM203临时存储用于CPU201的执行的程序和在执行程序期间适当改变的参数。这些元件通过由CPU总线等构成的主机总线相互连接。
[0121]输入设备208包括:由用户使用以输入信息的输入单元，诸如鼠标、键盘、触摸面板、按钮、麦克风、开关和控制杆；以及输入控制电路，其基于来自用户的输入生成输入信号并将输入信号输出到CPU201。移动终端20的用户可以将各种数据输入移动终端20或通过操作输入设备208指示移动终端20执行处理操作。
[0122]输出设备210包括，例如，诸如液晶显示器(IXD)设备的显示设备、有机发光二极管(OLED)设备、和灯。另外，输出设备210包括诸如扬声器和耳机的声音输出设备。例如，显示设备显示拍摄图像和生成的图像。另一方面，声音输出设备将声音数据等转换为声音并输出声音。
[0123]存储设备211是用于数据存储的设备，其被配置为根据该实施例的移动终端20的存储单元。存储设备211可以包括存储介质、在存储介质上记录数据的记录设备、从存储介质读取数据的读取设备、或删除在存储介质上记录的数据的删除设备。存储设备211存储由CPU201执行的程序和各种数据。
[0124]驱动器212是用于存储介质的读取器/写入器，其被内部或外部地附接到移动终端20。驱动器212读取存储在可移动存储介质23 (诸如插入的磁盘、光盘、磁光盘、和半导体存储器)上的信息，并将信息输出给RAM203。驱动器212还可以向可移动存储介质23写入数据。
[0125]成像设备213包括成像光学系统，诸如会聚光的摄影透镜和变焦透镜，以及信号转换元件，诸如电荷耦合器件(CCD)和互补金属氧化物半导体(CMOS)。成像光学系统会聚从被摄体发出的光以在信号转换单元上形成被摄体图像，并且信号转换元件将形成的被摄体图像转换为电图像信号。
[0126]通信装置215是通过将被连接到例如通信网络12的通信装置等构成的通信接口。这里，通信装置215可以为无线局域网(LAN)兼容通信装置、LTE(长期演进)兼容通信装置或有线通信装置，以执行与缆线的通信。
[0127]?5.结论》
[0128]如上所述，根据本发明实施例，通过同时输出多条标签信息，用户可以基于鸡尾酒会效应迅速选择包括他/她喜欢的标签信息的组。然后，用户视觉地或听觉地从组中指定他/她喜欢的标签信息，从而获取喜欢的标签信息的详细信息。
[0129]另外，根据本发明，在标签信息是通过普通用户提供的信息同时将其与当前位置关联的情况中，用户可以基于输出标签信息的音量级捕获到与普通用户的距离感。另外，通过将本发明的标签信息应用于与其它聚会的位置信息关联的邮件或聊天，用户可以捕获其它聚会的方向和距离。
[0130]上文已经参照附图详细描述了本发明的优选实施例。然而，本发明的技术范围不限于上述示例。显然，本领域技术人员在权利要求公开的技术主旨的范围内可以容易想到各种修改和校正。因此，应理解，这样的修改和校正也属于本发明的技术范围内。
[0131]例如，在本发明中的移动终端20的处理步骤可以不按照流程图中的时间顺序处理。例如，可以以不同于流程图中的顺序或并行地处理移动终端20的处理中的步骤。
[0132]另外，可以创建计算机程序，其使得安装在包括CPU201、R0M202和RAM203等的移动终端20中的硬件起到与上述移动终端20的配置相同地作用。还可以提供存储计算机程序的记录介质。
[0133]另外，还可以如下配置本发明的技术。
[0134](I) 一种信息处理设备，包括:通信装置，用于接收与目标区域内的相应位置对应的多条标签信息，所述目标区域的位置通过所述设备的位置来定义；以及输出装置，用于输出多种声音，使得对于每种声音，该声音的至少一部分与另一种声音的至少一部分重叠，每种声音指示相应的标签信息。
[0135](2)根据(I)所述的设备，其中所述声音是语音。
[0136](3)根据(I)所述的设备，其中每条标签信息与相对于设备的方向关联。
[0137](4)根据(I)所述的设备,其中每种声音具有关联的声音特征,并且任一种声音的关联的声音特征都不同于任何其它声音的关联的声音特征。
[0138](5)根据(4)所述的设备，其中所述关联声音特征是音量。
[0139](6)根据(4)所述的设备，其中所述关联声音特征是频率。
[0140](7)根据(4)所述的设备，其中所述关联声音特征是虚拟声源位置。
[0141](8)根据(I)所述的设备，其中所述声音是语音并且对于每条标签信息包括至少一个关键字，并且，其中执行声音的输出使得两个关键字不被同时输出。
[0142](9)根据(I)所述的设备，其中以立体声形式输出所述声音。
[0143](10)根据(I)所述的设备，其中根据所述多条标签信息的位置的密度确定所述目标区域的尺寸。
[0144](11)根据(I)所述的设备，其中基于各条标签信息生成所述声音。
[0145](12)根据(11)所述的设备，其中所述声音是语音并且被生成为包括用户优选单词作为第一单词。
[0146](13)根据(I)所述的设备，还包括触摸面板显示器，其中当所述设备同时输出多种声音并且在该输出期间执行用户操作时，在所述触摸面板显示器上显示指示与所述声音关联的多条标签信息的列表。
[0147](14)根据(I)所述的设备，其中当所述设备同时输出多种声音并且在该输出期间执行用户操作时，所述设备串行输出所述多种声音。
[0148](15)根据(14)所述的设备，其中所述用户操作包括轻敲所述设备。
[0149](16)根据(I)所述的设备，还包括显示器，其中当所述设备同时输出所述多种声音时，在所述显示器上显示相应的标签信息的指示符，在相对于所述设备的位置的虚拟声源位置处显示所述指示符。
[0150](17) 一种信息处理设备，包括:与目标区域内的相应位置对应的多条标签信息的数据库，通过所述设备的位置定义所述目标区域的位置；以及输出装置，用于输出多种声音，使得对于每种声音，该声音的至少一部分与另一种声音的至少一部分重叠，每种声音指示相应的标签信息。
[0151](18)根据(17)所述的设备，其中每条标签信息与相对于所述设备的方向关联。
[0152](19)根据(17)所述的设备,其中每种声音具有关联的声音特征,并且任一种声音的关联的声音特征都不同于任何其它声音的关联的声音特征。
[0153](20) 一种信息处理方法，包括:接收与目标区域内的相应位置对应的多条标签信息，通过所述设备的位置定义所述目标区域的位置；以及
[0154]输出多种声音,使得对于每种声音,该声音的至少一部分与另一种声音的至少一部分重叠，每种声音指示相应的标签信息。
[0155](21) 一种非暂态计算机可读介质，其具有存储在其上的用于实施信息处理方法的计算机可读程序，所述方法包括接收与目标区域内的相应位置对应的多条标签信息，通过所述设备的位置定义所述目标区域的位置；以及输出多种声音，使得对于每种声音，该声音的至少一部分与另一种声音的至少一部分重叠，每种声音指不相应的标签信息。
[0156]附图标记列表
[0157]10 AR 服务器
[0158]20 移动终端
[0159]22 触摸面板
[0160]24 扬声器
[0161]26 麦克风
[0162]30 语音输出单元
[0163]220 GPS
[0164]224加速度传感器
[0165]228通信部分
[0166]232、234区域设置部分
[0167]236信息分析部分
[0168]240语音控制部分
[0169]244、246显示控制部分
[0170]248声源设置部分
[0171]252语音处理部分
[0172]256邻近通信部分
【权利要求】
1.一种信息处理设备,包括: 通信装置，用于接收与目标区域内的相应位置对应的多条标签信息，所述目标区域的位置通过所述设备的位置来定义；以及输出装置，用于输出多种声音，使得对于每种声音，该声音的至少一部分与另一种声音的至少一部分重叠，每种声音指示相应的标签信息。
2.根据权利要求1所述的设备，其中所述声音是语音。
3.根据权利要求1所述的设备，其中每条标签信息与相对于设备的方向关联。
4.根据权利要求1所述的设备，其中每种声音具有关联的声音特征，并且任一种声音的关联的声音特征都不同于任何其它声音的关联的声音特征。
5.根据权利要求4所述的设备，其中所述关联的声音特征是音量。
6.根据权利要求4所述的设备，其中所述关联的声音特征是频率。
7.根据权利要求4所述的设备，其中所述关联的声音特征是虚拟声源位置。
8.根据权利要求1所述的设备，其中所述声音是语音并且对于每条标签信息包括至少一个关键字，并且，其中执行声音的输出使得两个关键字不被同时输出。
9.根据权利要求1所述的设备，其中以立体声形式输出所述声音。
10.根据权利要求1所述的设备，其中根据所述多条标签信息的位置的密度确定所述目标区域的尺寸。
11.根据权利要求1所述的设备，其中基于相应的标签信息生成所述声音。
12.根据权利要求11所述的设备，其中所述声音是语音并且被生成为包括用户优选单词作为第一单词。
13.根据权利要求1所述的设备，还包括触摸面板显示器，其中当所述设备同时输出多种声音并且在该输出期间执行用户操作时，在所述触摸面板显示器上显示指示与所述声音关联的多条标签信息的列表。
14.根据权利要求1所述的设备，其中当所述设备同时输出多种声音并且在该输出期间执行用户操作时，所述设备串行输出所述多种声音。
15.根据权利要求14所述的设备，其中所述用户操作包括轻敲所述设备。
16.根据权利要求1所述的设备，还包括显示器，其中当所述设备同时输出所述多种声音时，在所述显示器上显示相应的标签信息的指示符，在相对于所述设备的位置的虚拟声源位置处显示所述指示符。
17.—种信息处理设备,包括: 与目标区域内的相应位置对应的多条标签信息的数据库，通过所述设备的位置定义所述目标区域的位置；以及输出装置，用于输出多种声音，使得对于每种声音，该声音的至少一部分与另一种声音的至少一部分重叠，每种声音指示相应的标签信息。
18.根据权利要求17所述的设备，其中每条标签信息与相对于所述设备的方向关联。
19.根据权利要求17所述的设备,其中每种声音具有关联的声音特征,并且任一种声音的关联的声音特征都不同于任何其它声音的关联的声音特征。
20.一种非暂态计算机可读介质，其上存储有用于实施信息处理方法的计算机可读程序，所述方法包括:接收与目标区域内的相应位置对应的多条标签信息，通过所述设备的位置定义所述目标区域的位置；以及输出多种声音，使得对于每种声音，该声音的至少一部分与另一种声音的至少一部分重叠，每种声音指示相应的标签信息。
【文档编号】H04S7/00GK103918284SQ201280053462
【公开日】2014年7月9日申请日期:2012年8月23日优先权日:2011年11月9日
【发明者】森麻纪, 笠原俊一, 繁田脩, 铃木诚司, 深泽辽申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：森麻纪;笠原俊一;繁田脩;铃木诚司;深泽辽
技术所有人：索尼公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。