导航装置制造方法
【专利摘要】本发明提供一种导航装置,根据用户的识别词语理解度,不仅变更呈现给用户的引导(导航),还变更所有引导、操作步骤、操作画面及识别词语,即变更由引导、操作步骤、操作画面及识别词语所规定的操作切换来呈现,从而,对于识别词语理解度较低的用户,能够提高能完成任务的可能性,对于识别词语理解度较高的用户,能够提高操作的舒适性,由此,能够向所有用户呈现最佳的操作切换。
【专利说明】导航装置
【技术领域】
[0001]本发明涉及一种能够通过用户与装置的语音对话来进行导航的导航装置。
【背景技术】
[0002]通常,车载用语音对话装置等导航装置所具有的住址检索、电话簿检索、设施检索、音乐检索等各个功能都被预先设定了操作切换,无论是哪个用户(例如对于识别词语的理解度不相同的用户)使用时,通过语音输出/画面输出的用于呈现可输入语音的内容及其操作步骤的引导信息都是一样的。
因此存在以下问题,即在舒适性和理解容易度方面,有时并不一定能实现对于所有用户来说都是最佳的操作切换。
[0003]对于这一问题,例如在专利文献I中记载了一种车载用语音识别装置,其根据用户的识别词语理解度,变更语音输出/画面输出的引导信息,从而呈现用户能够理解的引导(导航)。在该专利文献I所记载的发明中,根据用户的修正次数等来判定识别词语理解度,并基于该识别词语理解度来变更引导。因此,对于识别词语理解度较低的用户,能够通过将引导变得详细来使其易于理解。另外,对于识别词语理解度较高的用户,则能够通过简化引导来提高舒适性。
现有技术文献 专利文献
[0004]专利文献1:国际公开第2008/084575号
【发明内容】
发明所要解决的技术问题
[0005]然而,在上述现有的装置中,仅仅改变了向用户呈现的引导(导航),而预先设定的操作步骤、操作画面及识别词语并没有变化,因此,对于识别词语理解度较低的用户,即使引导变得详细,对于包含有复合词等的复杂识别词语仍然难以理解,而对于识别词语理解度较高的用户,即使引导被简化,但输入步骤数还是很多,仍然十分繁琐。
[0006]本发明是为了解决上述问题而完成的,其目的在于提供一种导航装置,该导航装置能够根据用户的识别词语理解度来变更操作切换,以呈现对于所有用户来说均为最佳的操作切换(引导、操作步骤、操作画面及识别词语均包括在内)。
解决技术问题所采用的技术方案
[0007]为实现上述目的,本发明的导航装置包括:接受通过语音输入的指令的语音输入部、以及对所述语音输入部所接受的指令进行语音识别的语音识别部,其特征在于,具备:识别词语理解度判定部,该识别词语理解度判定部至少根据与所述语音识别部正在进行语音识别的所述指令相对应的操作中的修正操作次数或超时次数,来判定所述语音识别部能够识别的指令即识别词语的理解度;操作切换确定部,该操作切换确定部基于所述识别词语理解度判定部的判定结果,确定由引导、操作步骤、操作画面及识别词语所规定的操作切换;以及操作切换呈现部,该操作切换呈现部呈现所述操作切换确定部所确定的操作切换。 发明效果
[0008]根据本发明的导航装置,根据用户的识别词语理解度,不仅变更呈现给用户的引导(导航),还变更所有引导、操作步骤、操作画面及识别词语,即变更由引导、操作步骤、操作画面及识别词语所规定的操作切换,从而,对于识别词语理解度较低的用户,提高了能完成任务的可能性,对于识别词语理解度较高的用户,能够提高操作的舒适性,由此,能够向所有用户呈现最佳的操作切换。
【专利附图】
【附图说明】
[0009]图1是表示实施方式I的车载用语音对话装置的一个示例的框图。
图2是表示实施方式I的动作的流程图。
图3是表示通过语音或者按键(手动)来接受用户输入的操作画面的一个示例的图。
图4是表示识别词语理解度判定表的一个示例的图。
图5是表示与识别词语理解度相对应的设施检索时的操作切换的一个示例的图。
图6是表示功能的例子、以及各个功能的输入内容的一个示例的图。
图7是表示实施方式2的车载用语音对话装置的一个示例的框图。
图8是表示实施方式2的动作的流程图。
图9是表示实施方式3的车载用语音对话装置的一个示例的框图。
图10是表示实施方式3的动作的流程图。
图11是表示实施方式4的车载用语音对话装置的一个示例的框图。
图12是表示实施方式4的动作的流程图。
图13是表示实施方式5的车载用语音对话装置的一个示例的框图。
图14是表示实施方式5的动作的流程图。
图15是表示实施方式6中在操作切换变更时用户取消了操作切换变更的情况下的动作的流程图。
图16是表示实施方式6中在任意时刻用户将操作切换变更恢复原样的情况下的动作的流程图。
图17是表示实施方式7的车载用语音对话装置的一个示例的框图。
图18是表示实施方式7的动作的流程图。
图19是表示实施方式8的车载用语音对话装置的一个示例的框图。
图20是表示实施方式8的动作的流程图。
图21是表示实施方式9的车载用语音对话装置的一个示例的框图。
图22是表示实施方式9的动作的流程图。
图23是表示实施方式10的车载用语音对话装置的一个示例的框图。
图24是表示实施方式10的动作的流程图。
图25是表示实施方式11的车载用语音对话装置的一个示例的框图。
图26是表示实施方式11中用户登记时的动作的流程图。
图27是表示实施方式11中用户选择时的动作的流程图。
图28是表示实施方式11中用户选择后的基本动作的流程图。【具体实施方式】
[0010]下面,参照附图,详细说明本发明的实施方式。
实施方式1.图1是表示本发明的实施方式I的车载用语音对话装置的一个示例的框图。该车载用语音对话装置包括:按键输入部1、语音输入部2、语音识别部3、操作信息存储部4、识别词语理解度判定表5、识别词语理解度判定部6、操作切换信息存储部7、操作切换确定部8、操作切换控制部9、语音输出部10、画面输出部11。
[0011]按键输入部I接受通过触摸屏或遥控器等输入装置的按键(手动)输入的指令,并将与该按键输入信号相对应的指令输出到操作信息存储部4和操作切换确定部8。
语音输入部2接受由麦克风等所收集的用户发声,即接受通过语音输入的指令,并将与该语音输入信号相对应的指令输出到语音识别部3。
语音识别部3对语音输入部2所接受的指令进行识别,将与用户发声内容最匹配的命令或字符串作为识别结果而输出到操作信息存储部4和操作切换确定部8。
操作信息存储部4将与通过按键输入和语音输入的指令相对应的命令或字符串、超时次数和修正操作次数等操作内容及与操作相关的各种信息作为操作信息(历史)进行存储。
[0012]识别词语理解度判定表5中,定义了各操作状态下表示用户对识别词语的掌握程度的识别词语理解度与用户的操作信息之间的关系(参照图4)。
识别词语理解度判定部6通过参照操作信息存储部4所存储的用户操作历史和识别词语理解度判定表5,判定当前操作状态下的识别词语理解度。
操作切换信息存储部7是对各任务的每一个识别词语理解度定义了至少一个以上操作切换的操作切换组的数据库。
操作切换确定部8基于识别词语理解度,从操作切换信息存储部7所存储的操作切换组中确定全部或部分操作切换,并将与用户输入相对应的切换目标的操作画面和语音输出所需的信息(导航等引导)输出到操作切换控制部9。
[0013]操作切换控制部9基于从操作切换确定部8取得的信息,指示在合适的时刻输出
画面/语音。
语音输出部10通过扬声器等语音输出介质输出导航等的引导语音。
画面输出部11通过监视器等影像输出介质来输出由图像或字幕等构成的画面。
其中,该语音输出部10和画面输出部11构成将操作切换确定部8所确定的操作切换呈现给用户的操作切换呈现部100。
[0014]这里,对“识别词语”与“操作切换”的定义进行说明。本发明中的“识别词语”所指的词语是在其操作中能够被语音识别部3识别的指令。另外,本发明中的“操作切换”由向用户呈现的用于操作的引导(导航)、操作画面、操作步骤及识别词语所规定。
[0015]接着,对于将如上述那样构成的实施方式I的车载用语音对话装置应用于检索设施的系统时的动作进行说明。图2是表示实施方式I的动作的流程图。
首先,例如呈现图3所示的操作画面和引导(导航),接受用户通过语音进行的语音输入或通过按键(手动)进行的按键输入(步骤ST01)。将与上述用户输入相关联的信息(与通过按键输入和语音输入的指令相对应的命令或字符串、与该指令相对应的操作中的超时次数和修正操作次数等操作内容及与操作相关的各种信息)作为操作信息保存到操作信息存储部4中,并以能够通过与输入步骤同步等将操作信息作为历史进行获取的形式进行保存(步骤ST02)。此时,在语音识别部3进行语音识别期间,对与语音输入操作相关联的信息(与通过语音输入的指令相对应的操作中的超时次数和修正操作次数等)进行监视,并作为操作信息进行保存。
[0016]接着,根据图4所示的识别词语理解度判定表5、和例如过去10次用户输入过程中的修正操作次数的操作信息(历史),判定识别词语理解度(步骤ST03)。这里,“识别词语理解度”是表示用户对于能够被语音识别的词语的理解程度的指标,即表示用户是否能够理解语音识别部3所能识别的指令即“识别词语”并执行恰当操作的指标。在本实施例中,将识别词语理解度划分为3个等级,其数值越小,表示理解度越低,数值越大,表示理解度越高。另外,在首次使用时等用于判定识别词语理解度的操作信息不充分的情况下,将识别词语理解度设定为预先确定的默认值(例如2)。另外,识别词语理解度并不限于3个等级,也可以划分为任意个等级。另外,作为判定识别词语理解度的条件,这里使用了修正操作次数,但也可以不使用修正操作次数,而使用某个规定时间内没能进行输入的超时次数。此外,也可以使用说话停顿、心跳数等任意条件来判定。另外,本发明中,至少根据修正操作次数或超时次数来进行判定。
[0017]然后,确定与用户输入和识别词语理解度相对应的操作切换(步骤ST04)。在操作切换信息存储部7中,对于识别词语理解度较低的用户,存放有“通过限定每一步骤的输入内容和增加步骤数来使理解变得更容易的操作切换”,对于识别词语理解度较高的用户,存放有“通过增加每一步骤能够输入的信息和减少步骤数来使操作变得舒适的操作切换”。
由此,对于识别词语理解度较低的用户,通过限定输入内容,能够呈现更加具体的导航(引导)和操作画面,并且不易发生“误识别”或“由误识别引起的意料之外的动作”等,因此,能够防止用户在进行语音操作时发生混乱,能够提高用户完成任务的可能性。另外,对于识别词语理解度较高的用户,若将操作切换到更易理解的操作,则会限定输入内容或对输入内容进行相关的详细 说明,从而会增加完成任务所需的时间,容易使人感觉繁琐,因此,对于识别词语理解度较高的用户,通过变更到能够一并输入多个信息的操作切换,能够减少对话步骤数,减少用户完成任务所花费的时间,从而能够提高用户操作的舒适性。
[0018]这里,在图5中示出了呈现给用户的操作切换的具体例。图5示出了设施检索时的操作切换,图5(a)是针对识别词语理解度I的操作切换,图5(b)是针对识别词语理解度
2的操作切换,图5(c)是针对识别词语理解度3的操作切换。图5(a)所示的针对识别词语理解度I的操作切换尽管在显示检索结果列表时需要进行3次输入步骤,但每一次输入的信息量较小,成为对象的词语量也较少。另外,各操作画面右下的对话框中所记载的语句是通过语音或画面显示的导航(引导)。各操作画面左下被『』圈住的词语是用户对该操作画面及导航(引导)说出的词语。另外,图5(c)所示的针对识别词语理解度3的操作切换与图5(a)所示的操作切换对称,通过一次输入就能实现针对识别词语理解度I的操作切换中的3次输入。
[0019]这样,对于操作切换,随着识别词语理解度1 — 2 — 3逐渐增大,会基于理解容易度和步骤数等呈阶梯性地进行变更。而且,设定为不会出现识别词语理解度从I突然变到
3、或者从3突然变到I的非阶梯性变更的情况。其结果是,操作切换不会极端地变更,不会使操作切换变更到所需程度以上,因此能够防止用户更加烦躁或混乱。
[0020]在图5(a)的初始操作画面中的识别词语为“大阪府”等都道府县名称,显示该操作切换的该操作画面时,若用户说出例如“动物园”或“大阪府大阪市的动物园”等非都道府县的词语,将无法识别。这是为了避免给不熟悉语音识别的用户带来意料之外的情况。即,这是因为,若在无论哪种操作切换的哪个操作画面都能够识别所有词语,则有可能发生例如在设施检索过程中广播发出语音等完全在意料之外的情况,而不习惯的用户有可能不知道该如何应对。
由此,在各操作切换的操作画面中,语音识别部所能识别的指令即识别词语各不相同,若识别词语理解度发生变化,则所有向用户呈现的引导(导航)、操作步骤、操作画面及识别词语都将发生变更,即,由引导、操作步骤、操作画面及识别词语所规定的操作切换将发生变更。
[0021]另外,考虑到同车人员不小心说话而导致误识别的修正操作等、与识别词语理解度无关的修正操作等的情况,也可以根据过去任务完成的经验等对修正操作次数进行加权,由此判定识别词语理解度。具体而言,考虑以下情况:例如当识别词语理解度为2时,若通常在该理解度下能够被识别的词语、即之前没有经过修正就能够被识别的词语未被识别而进行了修正操作,则将其修正操作次数计为I次,并将识别词语理解度下降为I。然而,这并不是识别词语理解度低造成的,而是与识别词语理解度无关的其他原因造成的修正操作。对于这种情况,在判定识别词语理解度时,基于过去的操作内容历史进行调整,即,无视对过去未进行过修正操作的识别词语所进行的修正操作,且不计数,或者进行将通常计I次的情况计为0.2次等的加权,从而能够防止识别词语理解度变得不恰当。其结果是,即使检测出被认为是识别词语理解度较低的用户操作,在其原因很有可能不是识别词语理解度的情况下,能够防止将操 作切换变得不恰当。
[0022]另外,图5所示的设施检索是通过输入地址和类别来检索目的地,除此以外,一般也可以通过输入电话号码来完成同一任务。因此,也可以根据识别词语理解度来呈现功能不同但能实现同一目的的代替切换,例如在识别词语理解度较低的情况下,可分配基于电话号码进行电话簿检索的操作切换(未图示),使得仅通过数字的输入就能实现目的,而在识别词语理解度较高的情况下,分配基于地址和类别来检索设施的操作切换(参照图5(c))等。此外,还可以呈现功能相同但输入方法不同的代替切换。
[0023]这里,所谓“功能”,根据是基于什么来进行检索而被分为住址检索功能、电话簿检索功能、设施检索功能、音乐检索功能等。
即,“呈现功能不同但能够实现同一目的的代替切换”是指以下情况:例如,为了检索目的地,呈现输入该目的地的住址进行检索的住址检索功能的操作切换,但即使显示了该操作切换仍然无法完成任务的情况下,则不再呈现该住址检索功能的操作切换,而是呈现输入电话号码进行检索的电话簿检索功能的操作切换,并再次催促用户进行操作。于是,在向用户呈现的功能(或用户选择的功能)与用户说出的内容不同的情况下,通过呈现上述代替切换,能够提高用户完成任务的可能性。
[0024]图6是表示功能的例子、以及各个功能的输入内容的一个示例的图。如该图所示,例如即使是同一“设施检索”功能的操作切换,根据输入内容是“〇〇动物园”这样的设施名称、还是如图5所示的地址和类别,进行不同的操作切换。即,即使是同一功能的操作切换,也可以根据用户的识别词语理解度或所熟悉的识别词语而呈现不同输入内容的代替切换,另外,如前文所述,也可以呈现变更为不同功能的代替切换。
基于这样确定的操作切换和输入内容,通过画面输出或导航等的语音输出而呈现给用户(步骤ST05 )。之后,每次用户输入时都重复与上述相同的动作。
[0025]此时,在车载导航系统等上述具有多种功能的系统中,不同功能下用户的识别词语理解度也会不同,因此,即使是同一用户,也可能对住址检索功能的识别词语理解度较高,而对设施检索功能的识别词语理解度较低,因此,也可以针对各个功能独立地进行识别词语理解度的判定并基于该判定的操作切换变更。从而,对于整个系统能够进行更加详细的调整,因此,能够提供与各个功能的识别词语理解度分别相应的、更便于用户使用的操作切换。
[0026]如上所述,根据本实施方式1,根据用户的识别词语理解度,不仅变更呈现给用户的引导(导航),还变更所有引导、操作步骤、操作画面及识别词语,即变更由引导、操作步骤、操作画面及识别词语所规定的操作切换,从而,对于识别词语理解度较低的用户,提高了能完成任务的可能性,对于识别词语理解度较高的用户,能够提高操作的舒适性,由此,能够向所有用户呈现最佳的操作切换。
[0027]实施方式2.图7是表示本发明的实施方式2的车载用语音对话装置的一个示例的框图。此外,对于和实施方式I所说明的结构相同的结构,标注相同的标号,并省略重复的说明。以下所示的实施方式2中,还具备从语音识别结果中提取出特定关键词的关键词提取部12。该关键词与其它操作信息一起存储在操作信息存储部4中,操作切换确定部8在用户输入与识别词语理解度判定结果的基础上,进一步考虑关键词,由此来确定操作切换。
[0028]另外,对于识别词语理解度较高的情况分配“输入设施名称检索目的地的操作切换”,对于识别词语理解度较低的情况分配“输入住址检索目的地的操作切换”和“输入电话号码检索目的地的操作切换”这2个。当识别词语理解度从“高”变为“低”,操作切换变更前的用户语音识别结果中含有较多的表示等数字的关键词时,呈现“输入电话号码检索目的地的操作切换”。
[0029]下面,对动作进行说明。图8是表示实施方式2的动作的流程图。接受用户通过语音或按键的输入(步骤ST11)及确定了操作切换后的处理(步骤ST16)与图2的流程图所说明的实施方式I的相同,因此,省略说明。在接受了用户的语音输入之后,从语音识别的结果中提取出关键词(步骤ST12)。将所提取出的关键词与用户输入同步,并作为操作信息保存到操作信息存储部4中(步骤ST13)。
[0030]然后,与实施方式I相同,根据图4所示的识别词语理解度判定表5、和例如过去10次用户输入过程中的修正操作次数等的操作信息(历史),判定识别词语理解度(步骤ST14)。接着,在当前的用户输入和当前的识别词语理解度的基础上,进一步参照步骤ST13中作为操作信息保存的该切换下提取出的关键词,来确定操作切换(步骤ST15)。
[0031]如上所述,根据本实施方式2,具备从用户的说话内容中提取出特定关键词的关键词提取部,基于过去所说内容中的关键词和识别词语理解度来变更操作切换,因此,通过提取出例如表示等数字的关键词,即使在输入住址检索目的地的住址检索功能的识别词语理解度较低的情况下,也能够变更为输入该用户认为能够识别的电话号码检索目的地的电话簿检索功能的操作切换。即,通过呈现能够输入用户实际所说内容、或与所说内容相近的信息的操作切换来作为代替切换,能够提高用户完成任务的可能性。
[0032]实施方式3.图9是表示本发明的实施方式3的车载用语音对话装置的一个示例的框图。此外,对于和实施方式I及2所说明的结构相同的结构,标注相同的标号并省略重复的说明。在以下所示的实施方式3中,与实施方式I相比,还包括获取车辆的方向盘转向角、车速、制动器状态、方向灯状态等来自与车辆行驶状态相关的传感器的信息的车辆行驶状态获取部13,通过考虑这些车辆行驶状态来判定识别词语理解度,从而避免不恰当的操作切换的变更。
[0033]例如,当急转弯过程中语音输入超时(用户无法发声)时,判断为在系统接受语音输入时,用户因集中精力进行驾驶而有意地停止说话。即,急转弯过程中的输入超时不会被判断为是由于识别词语理解度较低而引起的。具体而言,在将方向盘转向角为90度以上的操作中的操作信息排除在外后再判定识别词语理解度等。
[0034]下面,对动作进行说明。图10是表示实施方式3的动作的流程图。接受用户通过语音或按键的输入(步骤ST21)及判定了识别词语理解度后的处理(步骤ST24和步骤ST25)与实施方式I的相同,因此,省略说明。在接受了用户通过语音或按键的输入后,除用户的输入信息以外,还将车辆行驶状态获取部13取得的信息(本实施例中为来自检测方向盘转向角的传感器的信息)以与输入信息相关联的方式作为操作信息,来保存到操作信息存储部4中(步骤ST22)。然后,与实施方式I相同,根据图4所示的识别词语理解度判定表5、和例如过去10次用户输入过程中的修正操作次数等的操作信息(历史),判定识别词语理解度,但此时,还考虑与各输入相关联的车辆行驶状态(本实施例中为方向盘转向角)来判定识别词语理解度(步骤ST23)。
[0035]如上所述,根据本实施方式3,即使检测到被判断为识别词语理解度较低的用户操作,也可以根据车辆行驶状态来调整上述识别词语理解度的判定标准,因此,在其原因很有可能不是识别词语理解度的情况下,例如语音识别失败时车辆正在左右转弯等能够判定为用户在集中精力进行驾驶的情况,不会判定为识别词语理解度较低,或者抑制识别词语理解度的下降幅度,从而能够防止操作切换发生不恰当的变更。
[0036]实施方式4.图11是表示本发明的实施方式4的车载用语音对话装置的一个示例的框图。此外,对于和实施方式I?3所说明的结构相同的结构,标注相同的标号,并省略重复的说明。在以下说明的实施方式4中,与实施方式I相比,还包括:暂时保存判定得到的识别词语理解度的识别词语理解度保存部14、以及对操作切换变更后该操作切换中的用户操作次数进行计数并进行存储的操作次数存储部15,在操作切换变更后的一定期间(操作次数达到规定次数以上为止)内使用变更前的识别词语理解度,从而不会使操作切换再次发生变更。
[0037]接着,对动作进行说明。图12是表示实施方式4的动作的流程图。接受用户通过语音或按键的输入(步骤ST31)及到判定识别词语理解度为止的处理(步骤ST32和步骤ST33)与实施方式I的相同,因此,省略说明。在判定了识别词语理解度之后,操作切换确定部8临时确定与该识别词语理解度和用户输入相对应的操作切换(步骤ST34)。接着,获取该切换下用户的操作次数(步骤ST35)。然后,当上述取得的用户操作次数在规定次数以上时(步骤ST36:是),将步骤ST33中所判定的识别词语理解度保存到识别词语理解度保存部14中(步骤ST37)。另一方面,当上述用户操作次数小于规定次数时(步骤ST36:否),不保存识别词语理解度。即,识别词语理解度保存部14处于不保存步骤ST33中判定的识别词语理解度,而保存在此之前的识别词语理解度的状态,识别词语理解度不发生变更。然后,操作切换确定部8获取最后保存的识别词语理解度(步骤ST38),确定与该识别词语理解度和用户输入相对应的操作切换(步骤ST39)。接着,基于所确定的操作切换和输入内容,通过画面输出或导航等的语音输出而呈现给用户(步骤ST40)。
[0038]另外,在本实施方式4中,即使在识别词语理解度判定部的判定结果使识别词语理解度发生了变更的情况下,在操作切换变更后的一定期间内也不会改变识别词语理解度,但也可以是在操作切换变更后的一定期间内,即使识别词语理解度发生变更,操作切换也不改变。
[0039]如上所述,根据本实施方式4,在操作切换变更后的一定期间内(操作次数达到规定次数以上为止),识别词语理解度不发生变更,或者即使识别词语理解度发生变更,操作切换也不改变,因此,能够防止单纯因用户不习惯等与识别词语理解度无关的原因而出现不正确的判定结果。
[0040]实施方式5.图13是表示本发明的实施方式5的车载用语音对话装置的一个示例的框图。对于和实施方式I?4所说明的结构相同的结构,标注相同的标号,并省略重复的说明。在以下说明的实施方式5中,与实施方式I相比,还包括存储有与操作切换变更内容相关的基于画面字幕和语音导航等的引导信息的操作切换变更引导存储部16,在操作切换变更时向用户呈现操作切换的变更、以及操作切换如何变更的情况。
[0041]例如,若用图5所示的各识别词语理解度的操作切换来进行说明,则当识别词语理解度判定部6判定的用户识别词语理解度从3变为2时,操作切换确定部8将操作切换从图5(c)的设施检索-3变为图5(b)的设施检索-2。此时,输入方式从一个步骤中组合输入“地址+类别”变为分开2个步骤输入“地址”和“类别”,因此,在操作切换变更的时刻向用户呈现“变更为说完地址后再说类别的操作切换”等的操作切换变更引导。
[0042]下面,对动作进行说明。图14是表示实施方式5的动作的流程图。从接受用户通过语音或按键的输入(步骤ST41)到确定操作切换(步骤ST44)为止的处理与实施方式I的相同,因此省略说明。在步骤ST44中确定了操作切换后,判定操作切换是否有变更(步骤ST45)。在操作切换不变的情况下(步骤ST45:否),与实施方式I相同,基于之前确定的操作切换,通过画面输出或导航等的语音输出而呈现给用户(步骤ST47)。而当操作切换有变更时(步骤ST45:是),在变更为之前确定的操作切换之前,从操作切换变更引导存储部16获取与该变更内容相关的引导信息,并通过画面字幕或语音导航等将操作切换变更引导呈现给用户(步骤ST46)。接着,变更为之前所确定的操作切换,并基于该操作切换,通过画面输出或导航等的语音输出而呈现给用户(步骤ST47)。
[0043]如上所述,根据本实施方式5,在操作切换变更之前,向用户呈现操作切换如何变更,从而能够防止用户因操作切换突然变更而感到混乱,能够使用户尽早适应变更后的操作切换。
[0044]实施方式6.实施方式I?5中,根据识别词语理解度来变更操作切换,但在本实施方式6中,能够由用户来变更操作切换。
例如,当识别词语理解度变高而变更到输入步骤数较少的操作切换时,若想要继续使用之前所用的输入步骤稍多但容易理解的操作切换等,用户可以解除(取消)其变更。作为该解除(取消)的方法,可以是任意方法,例如可以设置解除按钮,用户通过按下该按钮来进行解除,或者当通过语音提出“要变更操作切换吗? ”的问题时,用户说“是”或“否”等。
此外,本实施方式6中车载用语音对话装置的框图与实施方式I所说明的图1所示的结构相同,因此省略说明。
[0045]图15是表示在操作切换变更时用户取消操作切换变更的动作的流程图。从接受用户通过语音或按键的输入(步骤ST51)到确定操作切换(步骤ST54)为止的处理与实施方式I的相同,因此省略说明。然而,当根据步骤ST54中确定的操作切换要变更操作切换时(步骤ST55:是),再次接受用户输入,判定用户要不要解除(取消)变更(步骤ST56)。在要解除(取消)变更的情况下(步骤ST56:是),放弃操作切换变更(步骤ST57)。然后,根据与之前相同(操作切换变更前)的操作切换,通过画面输出或导航等的语音输出而呈现给用户(步骤ST58)。另一方面,在不要解除(取消)变更的情况下(步骤ST56:否),根据变更后的操作切换,通过画面输出或导航等的语音输出而呈现给用户(步骤ST58)。
[0046]此外,除了在操作切换变更时以外(自操作切换发生变更起经过一定时间后亦可),用户也可以在任意时刻恢复变更前的操作切换。图16是表示在任意时刻用户将操作切换恢复到变更前的动作的流程图。首先,接受并处理操作切换变更解除的用户输入(步骤ST61),操作切换确定部8恢复变更前的操作切换(步骤ST62)。接着,根据恢复到前一个的操作切换,通过画面输出或导航等的语音输出而呈现给用户(步骤ST63)。
[0047]如上所述,根据本实施方式6,在操作切换变更时,用户能够解除(取消)操作切换的变更,从而能够防止与用户意图相反的操作切换变更。此外,用户能够在任意时刻恢复变更前的操作切换,从而在用户无法适应变更后的操作切换等的情况下,随时都能返回变更前的操作切换。
[0048]实施方式7.图17是表示本发明的实施方式7的车载用语音对话装置的一个示例的框图。对于和实施方式I?6所说明的结构相同的结构,标注相同的标号,并省略重复的说明。以下所示的实施方式7中,在实施方式6的基础上,还包括在每次操作切换时对其变更解除次数进行计数并存储的操作切换变更解除次数存储部17,通过将被用户解除操作切换变更的次数达到规定次数以上的操作切换、或者在经过规定次数以上的变更后恢复的操作切换排除在确定操作切换时的变更目标对象以外等,从而将各操作切换的操作切换变更解除次数考虑在内,由此确定操作切换。
[0049]下面,对动作进行说明。图18是表示实施方式7的动作的流程图。从接受用户通过语音或按键的输入(步骤ST71)到判定识别词语理解度(步骤ST73)为止的处理、以及确定操作切换后的处理(步骤ST78)与实施方式I的相同,因此省略说明。在判定了识别词语理解度之后,用户输入为解除操作切换变更或在变更后恢复操作切换(以下将两者合称为“操作切换变更解除”)时(步骤ST74:是),对该切换下的操作切换变更解除次数进行计数,并保存到操作切换变更解除次数存储部17中(步骤ST75),在用户输入不是操作切换变更解除的情况下(步骤ST74:否),不进行步骤ST75的保存处理。然后,操作切换确定部8获取各操作切换的变更解除次数(步骤ST76),将各操作切换的变更解除次数考虑在内,根据用户输入和识别词语理解度确定操作切换(步骤ST77)。这里,所谓考虑各操作切换的变更解除次数是指,如上文所述,被用户解除操作切换变更的次数达到规定次数以上、或者在经过规定次数以上的变更后恢复的操作切换可解释为用户所不希望的操作切换,将其从操作切换变更目标的对象中排除等,从而在规定期间内或永久性地不会去确定该操作切换。
[0050]如上所述,根据本实施方式7,在通过用户操作而解除操作切换变更的次数达到规定次数以上时,或者在操作切换变更后恢复操作切换的次数达到规定次数以上时,在规定期间内或永久性地将该解除变更的操作切换从操作切换变更目标的对象中排除等,从而能够消除因再次变更到用户所不期望的操作切换而给用户带来的不适感,能够向用户呈现更加舒适的操作切换。
[0051]实施方式8.图19是表示本发明的实施方式8的车载用语音对话装置的一个示例的框图。对于和实施方式I?7所说明的结构相同的结构,标注相同的标号,并省略重复的说明。以下所示的实施方式8中,与实施方式I相比,还包括操作次数存储部15和代替方案引导存储部18。于是,在变更为最容易理解的操作切换(若是图5的操作切换,则变更到图5(a)所示的设施检索-1)后,经过一定期间(在该切换下的用户操作次数达到规定次数以上)仍然没有看到效果(识别词语理解度未得到提高)时,呈现功能不同但能够实现同一目的的代替切换、基于语音操作以外的按键(手动)操作的代替切换、或相同的操作切换但更加详细的引导(导航),或者呈现促使参照更加详细的手册等的方案即代替方案。操作次数存储部15与实施方式4中说明的相同,对各操作切换下的用户操作次数进行计数并存储。此外,代替方案引导存储部18包括功能不同但能够实现同一目的的代替切换、语音操作以外的按键(手动)操作等或促使参照手册等方案,其中存储有与代替方案相关的画面或导航等的引导信息。
[0052]下面,对动作进行说明。图20是表示实施方式8的动作的流程图。接受用户通过语音或按键的输入(步骤ST81)以及到判定识别词语理解度为止的处理(步骤ST82、步骤ST83)与实施方式I的相同,因此省略说明。但在本实施方式8中,在判定了识别词语理解度之后,当该识别词语理解度为最低等级时(步骤ST84:是),对该操作切换下的用户操作次数进行计数并存储(步骤ST85)。然后,当上述计数得到的该切换下的用户操作次数在规定次数以上时(步骤ST86:是),呈现上述与代替方案相关的引导的画面字幕或导航等语音引导(步骤ST87)。另一方面,当步骤ST83中判定的识别词语理解度不是最低等级时(步骤ST84:否)、或者步骤ST85中计数得到的该切换下的用户操作次数小于规定次数时(步骤ST86:否),与实施方式I相同,确定与用户输入内容和识别词语理解度相对应的操作切换(步骤ST88),并基于确定的操作切换和输入内容,通过画面输出或导航等的语音输出而呈现给用户(步骤ST89)。
[0053]如上所述,根据本实施方式8,在变更为最容易理解的操作切换后,经过一定期间识别词语理解度仍未得到提高时,呈现操作切换的代替方案,因此,即使存在用户对语音识别功能本身的理解不够、或者语音输入部未正常工作等本质性问题,也能够呈现功能不同但能够实现同一目的的代替切换、基于语音操作以外的按键(手动)操作的代替切换、或相同的操作切换但更加详细的引导(导航),或者呈现促使参照更加详细的手册等的方案,即呈现代替方案,从而能够提高用户完成任务的可能性,帮助解决本质问题。[0054]实施方式9.图21是表示本发明的实施方式9的车载用语音对话装置的一个示例的框图。对于和实施方式I?8所说明的结构相同的结构,标注相同的标号,并省略重复的说明。以下所示的实施方式9中,与实施方式I相比,还包括能够根据按键(手动)或语音的输入来将操作切换变更功能设定为有效或无效的操作切换变更功能开/关设定部19。即,用户能够选择“是/否”进行操作切换的变更,在用户不想变更操作切换的情况下,将操作切换变更功能开/关设定部设定为关闭,从而能够使操作切换确定部8不变更操作切换。
[0055]下面,对动作进行说明。图22是表示实施方式9的动作的流程图。从接受用户通过语音或按键的输入(步骤ST91)到判定识别词语理解度(步骤ST93)为止的处理、以及确定操作切换后的处理(步骤ST98)与实施方式I的相同,因此省略说明。在判定了识别词语理解度之后,基于用户输入设定操作切换变更功能的打开/关闭(步骤ST94)。然后,在操作切换变更功能的设定为打开时(步骤ST95:是),保存识别词语理解度(步骤ST96),在设定为关闭时(步骤ST95:否),不保存识别词语理解度。之后,根据最后保存的识别词语理解度和用户输入,确定操作切换(步骤ST97)。这里,最后保存的识别词语理解度是指操作切换变更功能的设定为关闭时,在将要变为关闭之前的操作切换。
[0056]如上所述,根据本实施方式9,用户能够选择“是/否”使操作切换确定部变更操作切换,从而在尽管识别词语理解度发生了变化但仍然想继续使用此前的操作切换等的情况下,能够取消用户不想要的操作切换变更。
[0057]实施方式10.图23是表示本发明的实施方式10的车载用语音对话装置的一个示例的框图。对于和实施方式I?9所说明的结构相同的结构,标注相同的标号,并省略重复的说明。在以下所示的实施方式10中,与实施方式I相比,还包括通过按键输入、或者根据语音输入的语音的特征来识别正在进行输入的用户的用户识别部20,并设置有针对各用户分别存储操作信息的各用户操作信息存储部21来代替操作信息存储部4,从而能够呈现适合使用用户的操作切换。即,对于用户识别部20所识别的各用户,分别进行识别词语理解度的判定和操作切换的确定。另外,用户识别部20通过按键输入或者根据语音输入的语音特征来识别用户,但作为用户识别的方法,也可以用照相机根据人脸图像等进行识别、或者根据指纹进行用户识别等任意方法。
[0058]下面,对动作进行说明。图24是表示实施方式10的动作的流程图。接受用户通过语音或按键的输入(步骤ST101)以及判定识别词语理解度后的处理(步骤ST105、步骤ST106)与实施方式I的相同,因此省略说明。根据所接受的用户输入(通过语音输入的语音的特征、通过按键输入的用户识别码、用户名等)识别用户(步骤ST102),将输入内容作为识别用户的操作信息(操作内容及与操作相关的各种信息)保存到各用户操作信息存储部21中(步骤ST103)。接下来,从所保存的各用户操作信息中参照当前使用用户的信息,从而判定其识别词语理解度(步骤ST104)。
[0059]如上所述,根据本实施方式10,对用户识别部所识别出的各个用户,分别进行识别词语理解度的判定和操作切换的确定,从而在车辆为家族共有等所使用的用户频繁改变等的情况下,能够消除因各用户的识别词语理解度不同而产生的问题(理解容易度或舒适性的问题),能够向各使用用户分别提供适合的操作切换。[0060]实施方式11.图25是表示本发明的实施方式11的车载用语音对话装置的一个示例的框图。对于和实施方式I?10所说明的结构相同的结构,标注相同的标号,并省略重复的说明。在以下所示的实施方式11中,与实施方式I相比,还包括能够将使用的用户登记到用户列表中的用户登记部22、以及能够从所登记的用户中任意地指定使用用户的用户指定部23,并且与实施方式9相同,还设置有针对各用户分别存储操作信息的各用户操作信息存储部21来代替操作信息存储部4。即,利用用户指定部23,用户能够在已登记的用户列表中指定任意用户,并对该指定的用户分别进行识别词语理解度的判定和操作切换的确定。
[0061]下面,对动作进行说明。图26是表示实施方式11中用户登记时的动作的流程图。这里,通过语音或按键(手动)的操作,在用户登记部22中新登记用户(步骤ST111)。
图27是表示实施方式11中用户选择时的动作的流程图。这里,通过语音或按键(手动)的操作,在用户登记部22所登记的登记用户中指定用户,使当前指定用户的操作信息有效(步骤 STl 12)。
[0062]图28是表示实施方式11中用户选择后的基本动作的流程图。接受用户通过语音或按键的输入(步骤ST113)以及判定识别词语理解度后的处理(步骤ST116、步骤ST117)与实施方式I的相同,因此省略说明。在接受了用户输入后,将该输入内容作为步骤ST112中所指定的用户的操作信息而保存到各用户操作信息存储部21中(步骤ST114)。接下来,从所保存的各用户操作信息中参照当前指定用户的信息,从而判定其识别词语理解度(步骤ST115)。
[0063]如上所述,根据本实施方式11,利用用户指定部,用户能够从已登记的用户列表中指定任意用户,并对所指定的各个用户,分别进行识别词语理解度的判定和操作切换的确定,从而在车辆为家族共有等所使用的用户频繁改变等的情况下,能够明确地指定某一用户的操作切换,从而能够消除因各用户的识别词语理解度不同而产生的问题(理解容易度或舒适性的问题),能够向各使用用户分别提供适合的操作切换。
[0064]另外,在本实施方式中,对车载用语音对话装置进行了说明,但本发明的导航装置并不限于车载用,只要是便携式导航装置等能够通过用户与装置的语音对话来进行导航的装置,可以应用于任意方式。
此外,本发明申请可以在该发明的范围内对各实施方式进行自由组合,或对各实施方式的任意构成要素进行变形、或在各实施方式中省略任意的构成要素。
工业上的实用性
[0065]本发明的导航装置适用于能够通过用户与装置的语音对话来进行导航的车载用语音对话装置或便携式导航装置。
标号说明
[0066]I按键输入部、2语音输入部、3语音识别部、4操作信息存储部、5识别词语理解度判定表、6识别词语理解度判定部、7操作切换信息存储部、8操作切换确定部、9操作切换控制部、10语音输出部、11画面输出部、12关键词提取部、13车辆行驶状态获取部、14识别词语理解度保存部、15操作次数存储部、16操作切换变更引导存储部、17操作切换变更解除次数存储部、18代替方案引导存储部、19操作切换变更功能开/关设定部、20用户识别部、21各用户操作信息存储部、22用户登记部、23用户指定部、100操作切换呈现部。
【权利要求】
1.一种导航装置,包括接受通过语音输入的指令的语音输入部、以及对所述语音输入部接受的指令进行语音识别的语音识别部,其特征在于,包括: 识别词语理解度判定部,该识别词语理解度判定部至少根据与所述语音识别部正在进行语音识别的所述指令相对应的操作中的修正操作次数或超时次数,来判定所述语音识别部能够识别的指令即识别词语的理解度; 操作切换确定部,该操作切换确定部基于所述识别词语理解度判定部的判定结果,确定由引导、操作步骤、操作画面及识别词语所规定的操作切换;以及 操作切换呈现部,该操作切换呈现部呈现所述操作切换确定部所确定的操作切换。
2.如权利要求1所述的导航装置,其特征在于, 所述操作切换确定部在基于所述识别词语理解度判定部输出的判定结果来变更操作切换时,通过“通过增加特定操作切换下的输入步骤数来限定每一步骤的输入内容”、或者“通过增加特定操作切换下每一步骤能够输入的信息来减少输入步骤数”,由此来确定所述操作切换。
3.如权利要求1所述的导航装置,其特征在于, 所述操作切换确定部在基于所述识别词语理解度判定部输出的判定结果来变更操作切换时,将操作切换变更为能够实现同一目的的代替切换。
4.如权利要求1或2所述的导航装置,其特征在于, 所述操作切换确定部在基于所述识别词语理解度判定部输出的判定结果来变更操作切换时,预先准备多个模式的切换,基于理解容易度和输入步骤数来阶梯性地进行变更。
5.如权利要求1至3的任一项所述的导航装置,其特征在于, 还包括关键词提取部,该关键词提取部从所述语音识别部所识别的内容中提取出特定的关键词, 所述操作切换确定部基于该切换下过去所说内容中的关键词和所述识别词语理解度,来变更操作切换。
6.如权利要求1至5的任一项所述的导航装置,其特征在于, 所述识别词语理解度判定部根据过去的操作内容历史,调整其判定标准。
7.如权利要求1至6的任一项所述的导航装置,其特征在于, 所述识别词语理解度判定部根据车辆行驶状态,调整其判定标准。
8.如权利要求1至7的任一项所述的导航装置,其特征在于, 所述识别词语理解度判定部在操作切换变更后的一定期间内,不变更所述识别词语理解度,或者即使所述识别词语理解度发生变更,也不变更操作切换。
9.如权利要求1至8的任一项所述的导航装置,其特征在于, 所述识别词语理解度判定部对识别词语理解度的判定、以及基于该判定进行的操作切换变更以功能为单位进行。
10.如权利要求1至9的任一项所述的导航装置,其特征在于, 在基于所述识别词语理解度判定部的判定结果来变更操作切换的情况下,通过语音输出或画面输出,在所述变更前向用户呈现如何进行变更的情况。
11.如权利要求1至10的任一项所述的导航装置,其特征在于, 在所述操作切换确定部变更操作切换时,用户能够解除所述操作切换的变更。
12.如权利要求1至11的任一项所述的导航装置,其特征在于, 在所述操作切换确定部变更操作切换后,用户能够在任意时刻恢复变更前的操作切换。
13.如权利要求11或12所述的导航装置,其特征在于, 在通过用户操作解除操作切换变更的次数达到规定次数以上的情况下、或者在操作切换变更后恢复操作切换的次数达到规定次数以上的情况下,在规定期间内或者永久性地将所述解除变更的操作切换或恢复的操作切换排除在操作切换变更目标的对象之外。
14.如权利要求1至12的任一项所述的导航装置,其特征在于, 在所述操作切换确定部将操作切换变更为最容易理解的操作切换后,若经过一定期间后所述识别词语理解度仍然没有得到提高,则呈现所述操作切换的代替方案。
15.如权利要求1至14的任一项所述的导航装置,其特征在于, 用户能够选择“是/否”使所述操作切换确定部变更操作切换。
16.如权利要求1至15的任一项所述的导航装置,其特征在于, 还包括用于识别用户的用户识别部,所述识别词语理解度判定部及所述操作切换确定部对于所述用户识别 部所识别的各个用户,分别进行所述识别词语理解度的判定和所述操作切换的确定。
17.如权利要求1至15的任一项所述的导航装置,其特征在于, 还包括能够从已登记的用户列表中指定任意用户的用户指定部,所述识别词语理解度判定部及所述操作切换确定部对于所述用户指定部所指定的各个用户,分别进行所述识别词语理解度的判定和所述操作切换的确定。
【文档编号】G01C21/36GK103842773SQ201180073394
【公开日】2014年6月4日 申请日期:2011年9月13日 优先权日:2011年9月13日
【发明者】武井匠, 古本友纪 申请人:三菱电机株式会社