用于登记用户命令的显示装置和方法
【专利说明】用于登记用户命令的显示装置和方法
[0001]交叉申请的相关引用
[0002]本申请要求来自于2 014年11月2 O日在韩国知识产权局递交的韩国专利申请N0.10-2014-0162654的优先权,其公开在此以整体通过参考引入本文。
技术领域
[0003]以下描述涉及用于登记用户命令的显示装置和方法,并更具体涉及用于登记用户定义的用户命令的显示装置和方法。
【背景技术】
[0004]根据技术发展,随着例如智能电话、智能TV等显示装置能够识别用户的语音,用户可以通过所说语音控制显示装置的操作或可以具有各种内容服务,而无需执行单独的操作。上述语音识别方法基于识别与向显示装置预登记的命令相关联的所说语音的嵌入式方法。
[0005]然而,存在以下问题:用户不确切知晓向显示装置预登记的命令,并不通过显示装置有效地使用语音识别服务。因此,为了在解决上述问题的同时,使得用户能够用更有趣和更灵活的方式来使用显示装置,已经开发了一种用于登记用户命令的方法的技术,其中向显示装置登记用户定义的用户命令。
[0006]然而,根据相关技术的登记用户命令的方法关注用于登记用户简单定义的用户命令的方法。也就是说,根据相关技术的登记用户命令的方法不考虑对用户定义的用户命令的误识别概率的问题,而是仅关注相应用户命令的登记。
[0007]在其中通过根据相关技术的登记用户命令的方法来登记用户命令的状态中,响应于输入相应用户命令的所说语音,可能发生显示装置由于周围环境因素而不能准确地识别用户所说语音的问题。此外,在其中预登记了与相应用户命令类似的其他命令的状态下,响应于输入相应用户命令的所说语音,可能发生以下问题:显示装置基于与通过输入的所说语音的用户命令相类似的其他命令,执行并非用户意在的控制操作。
【发明内容】
[0008]在以下的描述中将部分地阐述附加方面和/或优点,并且附加方面和/或优点将部分地从该描述中显而易见,或可以通过本公开的实践来获知。
[0009]本公开的示例实施例克服以上缺点和以上未描述的其他缺点。此外,不要求本公开克服上述缺点,并且本公开的示例实施例可以不解决上述问题中的任何一个。
[0010]本公开提供了一种能够登记用户定义的用户命令中抗误识别并保证高识别率的用户命令的显示装置。
[0011]根据本公开的一方面,显示装置包括:输入单元,被配置为接收用户命令;输出单元,被配置为输出用户命令的登记合适性确定结果,以及处理器,被配置为生成用户命令的音标,分析生成的音标以确定用户命令的登记合适性,并控制所述输出单元输出针对用户命令的登记合适性确定结果。
[0012]处理器可以分析生成的音标的总数量和生成的音标中的元音和辅音的连续配置中的至少一个,以确定用户命令的登记合适性。
[0013]处理器还分析以下各项的至少一个以确定用户命令的登记合适性:生成的音标的配置形式、每个单词的音标的数量、以及音标是否包括弱音标,以及所述弱音标可以包括由于周围环境而降低或丢失频带或能量幅度使得其识别率降级的特定发音的音标。
[0014]响应于确定用户命令的登记不合适,输出单元可以显示引导可登记用户命令的引导用户界面(UI),并且响应于确定用户命令的登记合适,输出用户命令的音频。
[0015]显示装置还可以包括存储单元,其中,响应于在其中输出用户命令的音频的状态下输入用户命令的所说语音,处理器根据用户命令的文本与所说语音的文本之间的相似性,在存储单元中登记并存储用户命令。
[0016]处理器可以确定用户命令的登记合适性,并且在用户命令的登记既不属于合适情况也不属于不合适情况的情况下,根据用户的选择命令在存储单元中登记并存储用户命令。
[0017]处理器可以测量多个预登记的命令的音标与用户命令的音标之间的相似性,以根据测量出的相似性来确定用户命令的登记合适性。
[0018]处理器可以根据用户命令是否与禁用命令相对应来确定用户命令的登记合适性。
[0019]响应于输入了用户命令的所说语音,输入单元可以从语音识别装置接收所说语音的一个或更多个文本,以及处理器可以确定用户在一个或更多个输出文本中选择的文本,作为用户命令的文本。
[0020]用户命令可以包括用于进入语音识别模式的触发命令和用于控制显示装置的操作的控制命令中的至少一个。
[0021]根据本公开的一方面,一种登记用户命令的方法包括:接收用户命令;基于预定义的音标集生成用户命令的音标;通过分析生成的音标来确定用户命令的登记合适性;以及提供针对用户命令的登记合适性确定。
[0022]在确定登记合适性时,可以通过分析生成的音标的总数量和生成的音标中的元音和辅音的连续配置中的至少一个,来确定用户命令的登记合适性。
[0023]在确定登记合适性时,还通过分析以下各项的至少一个来确定用户命令的登记合适性:生成的音标的配置形式、每个单词的音标的数量,以及音标是否包括弱音标,以及所述弱音标包括由于周围环境而降低或丢失频带或能量幅度使得其识别率降级的特定发音的首标。
[0024]在提供针对用户命令的登记合适性确定结果时,可以响应于确定用户命令的登记不合适,提供引导可登记用户命令的引导用户界面(UI),并且可以响应于确定用户命令的登记合适,输出用户命令的音频。
[0025]该方法还包括:响应于在输出用户命令的音频的状态下输入用户命令的所说语音,根据用户命令的文本与所说语音的文本之间的相似性来登记用户命令。
[0026]在登记用户命令时,可以确定用户命令的登记合适性,并且可以在用户命令的登记不属于合适情况也不属于不合适情况的情况下,根据用户的选择命令来登记用户命令。
[0027]在确定用户命令的登记合适性时,可以根据多个预登记命令的音标与用户命令的音标之间的相似性来确定用户命令的登记合适性。
[0028]在确定用户命令的登记合适性时,可以根据用户命令是否与禁用命令相对应,来确定用户命令的登记合适性。
[0029]在接收用户命令时,响应于输入用户命令的所说语音,可以从语音识别装置输入所说语音的一个或更多个文本,并且可以将一个或更多个输入文本中用户选择的文本确定为用户命令的文本。
[0030]用户命令可以包括用于进入语音识别模式的触发命令和用于控制显示装置的操作的控制命令中的至少一个。
[0031]根据本公开的一方面,提供了一种在与显示装置耦合的记录介质中存储以执行以下步骤的计算机程序:接收用户命令;基于预定义的音标集生成用户命令的音标;通过分析生成的音标来确定用户命令的登记合适性;以及提供针对用户命令的登记合适性确定结果,其中计算机程序登记用户命令。
【附图说明】
[0032]通过参照附图描述本公开的特定示例实施例,本公开的以上和/或其他方面、将会更加显而易见,在附图中:
[0033]图1是根据本公开的示例实施例的语音识别系统的框图;
[0034]图2是根据本公开的示例实施例的显示装置的框图;
[0035]图3是示出根据本公开的示例实施例的显示装置的详细框图;
[0036]图4是示出根据本公开的实施例的确定合适性的模块的视图;
[0037]图5是根据本公开的示例实施例的基于通过显示装置中的确定登记合适性的模块计算出的结果值来确定用户命令的登记合适性的示意性视图;
[0038]图6是根据本公开的示例实施例的提供显示装置中的用户命令的登记不合适性确定结果的第一示意性视图;
[0039]图7是根据本公开的示例实施例的提供显示装置中的用户命令的登记不合适性确定结果的第二示意性视图;
[0040]图8是根据本公开的示例实施例的提供显示装置中的用户命令的登记不合适性确定结果的第三示意性视图;
[0041]图9是根据本公开的示例实施例的用于确定显示装置中的用户命令的登记合适性的方法的流程图;以及
[0042]图10是根据本公开的示例实施例的显示装置中的登记用户命令的方法的流程图。
【具体实施方式】
[0043]现在将具体参照实施例,在附图中示出其示例,其中贯穿本文类似的参考符号指的是类似的元素。以下通过参照附图解释本公开来描述这些实施例。
[0044]可以不同地修改本公开的示例实施例。因此,在附图中示出并在详细说明中具体描述特定示例实施例。然而,应当理解的是本公开不限于特定示例实施例,还包括不离开本公开的范围和精神的全部修改、等价和替代。此外,不具体描述熟知的功能或结构,原因在于它们将用不必要的细节使本公开模糊。
[0045]术语“第一”、“第二”等可以用于描述各种组成部分,但是这些组成部分不受术语限制。这些术语仅用于将组成部分彼此区分开。
[0046]本申请中所使用的术语仅用于描述示例实施例,而不旨在限制本公开的范围。只要在上下文中单数表达不区别地表意,单数表达还包括复数含义。在本申请中,术语“包括”和“包含”指示存在说明书中所写的特征、数量、步骤、操作、组成部分、元素或其组合,但不排除添加一个或更多个特征、数量、步骤、操作、组成部分、元素或其组合的存在或可能性。
[0047]在本公开的示例实施例中,“模块”或“单元”执行至少一个功能或操作,并可以用硬件、软件或硬件和和软件的组合来实现。此外,除了必须用特定硬件来实现的“模块”或“单元”以外,可以将多个“模块”或者多个“单元”集成到至少一个模块中,并可以用至少一个处理器(未示出)来实现。
[0048]以下,将参照附图详细描述本公开。
[0049]图1是根据本公开的示例实施例的语音识别系统的框图。
[0050]如图1所示,语音识别系统包括显示装置100、输入装置200和网络服务器300。
[0051]可以用各种电子装置(智能电视、智能手机、平板电脑等)来实现显示装置100,显示装置100是识别用户所说语音以执行用户意在的操作的装置。
[0052]输入装置200可以是例如遥控器、键盘等,输入装置200是执行与显示装置100的数据通信以控制显示装置100的操作的装置。
[0053]具体地,在语音识别模式下第一用户可以说话来操作显示装置100。响应于向显示装置100输入上述的用户