服务器、发话控制方法、发话装置以及发话系统的制作方法
【技术领域】
[0001]本发明涉及提供虚拟交流的服务器、发话控制方法以及发话装置、发话系统。
【背景技术】
[0002]已知通过输出与用户输入的语句对应的应答,执行与用户的模拟会话的模拟会话系统。专利文献I中,记载了如下技术:在这种模拟会话系统中,更新存储包含对用户输入的语句的评价的累计值的、模拟会话的会话历史,在所述会话历史中包含的评价的累计值满足了会话变更条件时,输出与正在执行的模拟会话的话题不同话题的应答。另外,所述模拟会话系统在未识别出由所述用户输入的语句的情况、或者在与所述用户输入的语句对应的应答不存在的情况下,输出与所述会话历史相应的历史,并继续模拟会话。
[0003]现有技术文献
[0004]专利文献
[0005]专利文献1:日本专利公开公报“特开2002-169804号(2002年6月14日公开)”
[0006]另一方面,除了所述模拟会话系统以外,还积极地研宄另一种发话系统,该系统包括能够与网络连接的家电设备,在该家电设备与用户之间实现虚拟的交流。这种发话系统通常具备控制发话系统整体动作的服务器、以及进行语音数据的输入输出的发话装置(家电设备)。发话装置向服务器发送来自用户的询问(语音输入),服务器对语音数据进行语音识别,返回对应的回答数据,发话装置对回答数据进行语音输出,从而将回答数据传达给用户。
[0007]在这种发话系统中,发话装置作为声音数据,不仅有可能取得用户对发话装置语音输入的声音,还有可能取得日常会话、宠物的叫声、从电视机输出的语音等,发话装置附近产生的各种声音。此时存在的问题是,服务器错误地进行语音识别,在用户没有输入语音(没有收到询问)时,也输出不期望的回答数据。
【发明内容】
[0008]本发明鉴于上述问题而作,其目的是实现进行适当语音交流的服务器。
[0009]为了解决上述问题,本发明的一方式的服务器具备:回答方针切换单元,在判定对象的声音数据的音量包含在第一指定音量范围内的情况下,根据已识别出该声音数据所示的内容的情况、和未识别出该声音数据所示的内容的情况,来切换对用户的回答方针。
[0010]为了解决上述问题,本发明的一方式的发话控制方法包括:回答方针切换过程,在判定对象的声音数据的音量包含在第一指定音量范围内的情况下,根据已识别出该声音数据所示的内容的情况、和未识别出该声音数据所示的内容的情况,来切换对用户的回答方针。
[0011]为了解决上述问题,本发明的一方式的发话装置具备:语音数据提取单元,从取得的声音数据中,提取仅包含人类发出的语音频带的语音数据;音量判定单元,判定由所述语音数据提取单元提取出的语音数据的音量;语音识别单元,在所述音量判定单元判定的音量包含在指定范围内的情况下,作为识别内容,识别由所述语音数据提取单元提取的语音数据所示的语音的内容;回答方针切换单元,根据所述语音识别单元已识别出所述语音数据所示的内容的情况、和未识别出所述声音数据所示的内容的情况,来切换对用户的回答方针,决定回答内容;以及回答输出部,输出由所述回答方针切换单元决定的回答内容所示的语音。
[0012]为了解决上述问题,本发明的一方式的发话系统是具备发话装置和服务器的发话系统,所述发话装置具备:语音数据提取单元,从取得的声音数据中,提取仅包含人类发出的语音频带的语音数据;语音数据发送部,发送由所述语音数据提取单元提取出的语音数据;回答数据接收部,接收对所述语音数据的回答数据;以及回答输出部,在所述回答数据接收部接收到回答数据的情况下,输出该回答数据所示的语音,所述服务器具备:语音数据接收部,从所述发话装置接收所述语音数据;音量判定单元,判定所述语音数据接收部接收的语音数据的音量;回答方针切换单元,在由所述音量判定单元判定的所述语音数据的音量包含在指定范围内的情况下,根据已识别出该语音数据所示的内容的情况和未识别出该语音数据所示的内容的情况,来切换对用户的回答方针,决定回答内容;以及回答发送单元,发送表示所述回答方针切换单元决定的回答内容的回答数据。
[0013]为了解决上述问题,本发明的一方式的发话装置具备:语音数据提取单元,从取得的声音数据中,提取仅包含人类发出的语音频带的语音数据;语音数据发送部,发送由所述语音数据提取单元提取出的语音数据;回答数据接收部,接收对所述语音数据的回答数据;以及回答输出部,在所述回答数据接收部接收到回答数据的情况下,输出该回答数据所示的语音,所述回答数据是表示回答内容的回答数据,在所述语音数据发送部发送的语音数据的音量包含在指定范围内的情况下,根据已识别出该语音数据所示的内容的情况和未识别出该语音数据所示的内容的情况,来切换对用户的回答方针从而决定所述回答内容。
[0014]根据本发明的一方式,能够防止不适当时机的应答,实现更适当的会话交流。
【附图说明】
[0015]图1是表示本发明实施方式I的发话系统的主要部件结构的框图。
[0016]图2是表示本发明实施方式I的发话系统的概要的外观图。
[0017]图3是表示本发明实施方式I的发话系统的应答语音输出处理流程的时序图。
[0018]图4表不本发明实施方式I的服务器的存储部中存储的应答方针表的一例。
[0019]图5是表示本发明实施方式I的服务器的存储部中存储的通常应答数据库的一例的图。
[0020]图6是表示本发明实施方式I的服务器的存储部中存储的模糊应答数据库的一例的图。
[0021]图7是表示本发明实施方式I的服务器的存储部中存储的促进应答数据库的一例的图。
[0022]图8是表示本发明实施方式2的发话系统的主要部件结构的框图。
[0023]图9是表示本发明实施方式2的发话系统的应答语音输出处理流程的时序图。
[0024]图10是表示本发明实施方式3的发话系统的主要部件结构的框图。
[0025]图11是表示本发明实施方式3的发话系统的应答语音输出处理流程的时序图。
[0026]图12是表示本发明实施方式4的发话系统的主要部件结构的框图。
[0027]图13是表示本发明实施方式4的发话系统的应答语音输出处理流程的时序图。
[0028]图14是表示本发明实施方式5的发话系统的主要部件结构的框图。
【具体实施方式】
[0029]实施方式I
[0030]以下参考图1至图7说明本实施方式的发话系统I。其中,只要没有专门进行特定的记载,该实施方式中记载的结构并不用于将该发明的范围仅限于此,而仅仅是单纯的说明例。
[0031]发话系统的概要
[0032]首先,参考图2说明本实施方式的发话系统I的概要。图2是表示本实施方式的发话系统I的概要的外观图。
[0033]如图2所示,本实施方式的发话系统I由清洁机器人(发话装置)10以及服务器20构成。
[0034]发话系统I在清洁机器人10中输入了人类(用户)发出的语音时,从清洁机器人10输出在服务器20中决定的、表示对输入了的语音的应答内容的语音(以后也记载为“应答语音”)。由此,本实施方式的发话系统I实现用户与清洁机器人10的虚拟会话。
[0035]此外,本实施方式中,作为对用户输出应答语音的语音输出装置,举例说明清洁机器人10,但本发明不限于此。例如,作为语音输出装置,还能够采用具有语音输出功能的玩偶、清洁机器人10以外的家电(例如电视机、微波炉等)等。
[0036]另外,本实施方式中,举例说明服务器20由一个服务器实现的结构,但本发明不限于此,也可以采用由其它服务器实现服务器20具备的各部件(各功能)中的至少一部分的结构。
[0037]接着,参考图1说明本实施方式的发话系统I的主要部件的结构。图1是表示本实施方式的发话系统I的主要部件结构的框图。
[0038]清洁机器人
[0039]参考图1说明本实施方式的清洁机器人10的结构。如图1所示,本实施方式的清洁机器人10具备通信部(语音数据发送部、回答数据接收部)101、控制部102、麦克风103、扬声器(回答输出部)104、清洁部105、以及驱动部106。
[0040]通信部
[0041]通信部101是与外部进行通信的单元。具体而言,通信部101例如经由因特网等网络与服务器20进行无线通信。
[0042]麦克风
[0043]麦克风103从外部接收声音输入。此外,本实施方式中,表示麦克风103接收输入的声音的“声音数据”中,主要包括人类发出的语音频带中包含的声音数据(以后也记为“声音数据”)、以及包含语音数据频带以外的频带的声音数据(以后也记为“其它声音数据”)。
[0044]麦克风103将表示输入的声音的声音数据逐一提供给控制部102。
[0045]扬声器
[0046]扬声器104输出表示应答内容的应答语音,该应答内容由从控制部102提供的应答内容数据表示。以后,将清洁机器人10经由扬声器104进行的应答语音输出也记为“发话”。此外,关于应答内容的详细情况在后面进行描述。
[0047]清洁部、驱动部
[0048]清洁部105基于来自控制部102的指示,实现作为清洁机的功能。另外,驱动部106基于来自控制部102的指示移动清洁机10。
[0049]通过清洁部105以及驱动部106的共同动作,清洁机器人10能够自动进行房间的清洁。
[0050]控制部
[0051]控制部102统一控制清洁机器人10的各个部件。具体而言,控制部102通过控制清洁部105以及驱动部106,控制清洁机器人10的清洁动作。另外,控制部102将表示通过麦克风103从外部取得的声音的声音数据,经由通信部101逐一发送到服务器20。
[0052]控制部102的功能通过由CPU(Central Processing Unit,中央处理单元)执行例如RAM (Random Access Memory,随机存取存储器)以及闪存存储器等存储装置中存储的程序来实现(均不图示)。
[0053]另外,控制部102经由通信部101从服务器20取得应答内容数据。并且,控制部102控制(驱动)扬声器104,以输出表示应答内容的语音,该应答内容由取得的应答内容数据表示。
[0054]服务器
[0055]接着,参考图1说明本实施方式