具有语音辅助系统的视讯装置及其调整影像的方法

文档序号:2821538阅读:131来源:国知局
专利名称:具有语音辅助系统的视讯装置及其调整影像的方法
技术领域
本发明是涉及一种具有语音辅助系统的视讯装置及其调整影像的方法,且特别是涉及一种可经由语音输入调整影像的视讯装置及其调整影像的方法。
背景技术
在高度科技化的现今社会中,从居家生活上的家电用品、工作上使用的自动化机台,一直到提供娱乐的电子产品,在在显示人们在日常生活上对电子产品的依赖性日渐增加。其中,视讯类的电子产品更是为人们所广泛使用,无论是工作上的需求,或是为了生活上的娱乐,视讯装置皆是不可或缺的电子产品,而一般常见的视讯装置例如是电视、计算机、投影机等视讯装置。
一般视讯装置为了让使用者有较为舒适的视觉享受,通常都会设计有萤幕显示选单(On Screen Display,OSD)的功能而将影像的特性参数显示于萤幕上,以便于使用者依其所需来选择欲调整的参数。但随着科技的发展,视讯装置所附属的功能也愈来愈多,所以必须在萤幕显示选单中对该些功能以及影像的特性参数加以分门别类。
请参阅图1所示,是显示现有习知具有萤幕显示选单的视讯装置的影像调整方法。在该萤幕显示选单中,往往具有许多阶层的目录,而就算只是要对影像稍作调整,也必须以按键的方式点选过层层目录后,才能选到所欲调整的参数。例如经由第一层的主选单,经由按键选择,接着进入第二层,根据所需要进行的设定选择选单内的指令,并进行设定。而后进入第三层,根据所选择的指令(Command),进行对应的动作。举例来说,若欲调整影像的亮度,则使用者必须先由萤幕显示选单中的主选单点选“明亮度”的选项,而“明亮度”目录下是存有“亮度”与“对比”两个子目录。在点选“亮度”后,再在“亮度”此子目录下对影像的亮度作调整。而且,视讯装置的功能在萤幕显示选单上的分类依据又无统一的规则性,相同的影像特性参数在不同公司出产的视讯装置中,可能会被分类至不同的目录底下,因此对于不熟悉的使用者而言,必须搜寻过层层目录之后,才能找到欲调整的参数,在使用上相当不便。
为了解决上述的问题,若是利用语音来设定视讯装置的概念,的确有助于使用者更方便操作。然而,若是运用一般的语音命令控制流程,则是以语音的方式直接对视讯装置下指令,使视讯装置自动完成与指令相符的动作,毋须再藉由按键一一选取目录。然而,在现有习知的语音控制系统中,一个语音指令通常是对应至一个动作,也就是说,若使用者欲使视讯装置完成一连串的繁琐动作,则必须连续下达多个语音指令才可达成目的,在使用上仍稍嫌欠缺弹性。
由此可见,上述现有的视讯装置及其调整影像的方法仍存在有诸多的缺陷,而亟待加以进一步改进。为了解决现有的视讯装置及其调整影像的方法的缺陷,相关厂商莫不费尽心思来谋求解决之道,但长久以来一直未见适用的设计被发展完成,此显然是相关业者急欲解决的问题。
有鉴于上述现有的视讯装置及其调整影像的方法存在的缺陷,本发明人基于从事此类产品设计制造多年丰富的实务经验及专业知识,积极加以研究创新,以期创设一种新的具有语音辅助系统的视讯装置及其调整影像的方法,能够改进一般现有的视讯装置及其调整影像的方法,使其更具有实用性。经过不断的研究、设计,并经反复试作样品及改进后,终于创设出确具实用价值的本发明。

发明内容
本发明的目的在于,克服上述现有的视讯装置及其调整影像的方法存在的缺陷,而提供一种新的具有语音辅助系统的视讯装置及其调整影像的方法,所要解决的技术问题是使其可以藉由语音指令来完成影像的调整,从而更加适于实用。
本发明的另一目的在于,提供一种具有语音辅助系统的视讯装置及其调整影像的方法,所要解决的技术问题是使其可令使用者在调整视讯装置所显示的影像时较为便利,不需要连续下达多个语音指令才可达成目的,并且可以降低语音辨识错误的疑虑,从而更加适于实用。
本发明的目的及解决其技术问题是采用以下技术方案来实现的。依据本发明提出的一种调整影像的方法,适用于调整一具有语音辅助系统的视讯装置,且该视讯装置具有一萤幕显示选单的功能,该调整影像的方法包括以下步骤接收一语音指令;辨识该语音指令,并依据辨识的结果输出一语音讯号;以及根据该语音讯号决定该语音指令为一具体指令与一模糊指令两者之一。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。
前述的调整影像的方法,其中,当该语音指令为一具体指令时,执行对应于该语音指令的一调整动作以调整该影像。
前述的调整影像的方法,其中当该语音指令为一模糊指令时,执行对应于该语音指令的复数个调整动作。
前述的调整影像的方法,其中在根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一的步骤之前,更包括对该语音讯号进行一信心评估,并据以输出一评估等级,并将该评估等级与一预设的评估基准值作比较。
前述的调整影像的方法,其中在比较该评估等级与该评估基准值时,若是该评估等级高于该评估基准值时,直接进行根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一的步骤,若是该评估等级低于该评估基准值时,则根据该语音讯号显示复数个与该语音指令近似度高于一预定值的指令,并接着选择该些指令其中之一,而后进行根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一的步骤。
前述的调整影像的方法,其中在选择该语音指令近似度高于该预定值的该些指令时,是由一语音输入的方式选择。
前述的调整影像的方法,其中在选择该语音指令近似度高于该预定值的该些指令时,是由该视讯装置的按键输入的方式选择。
前述的调整影像的方法,其中若该语音指令为该模糊指令时,参照一指令资料库找出对应于该语音指令的该些调整动作。
前述的调整影像的方法,其中当该语音指令为该模糊指令时,更包括经由该视讯装置的萤幕显示选单的功能显示该些已经执行的对应于该语音指令的该些调整动作。
前述的调整影像的方法,其中当显示所有已经执行的对应于该语音指令的调整动作后,再进行一修正影像的程序。
前述的调整影像的方法,其中所述的修正影像的程序是由一语音输入的方式选择。
前述的调整影像的方法,其中所述的修正影像的程序是由一按键输入的方式选择。
本发明的目的及解决其技术问题还采用以下的技术方案来实现。依据本发明提出的一种具有语音辅助系统的视讯装置,其包括一语音辨识引擎,用以接收一语音指令,并据以输出一语音讯号;一萤幕显示选单(OSD)控制界面,连接至该语音辨识引擎,用以接收该语音讯号;一显示控制单元,连接至该萤幕显示选单控制界面;以及一显示单元,连接至该显示控制单元,其中该萤幕显示选单控制界面根据该语音讯号决定该语音指令为一具体指令与一模糊指令两者之一。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。
前述的具有语音辅助系统的视讯装置,其中当该语音指令为一具体指令时,经由该显示控制单元执行对应于该语音指令的一调整动作以调整由该显示单元所显示的一影像。
前述的具有语音辅助系统的视讯装置,其中当该语音指令为一模糊指令时,经由该显示控制单元执行对应于该语音指令的复数个调整动作,以调整由该显示单元所显示的该影像。
前述的具有语音辅助系统的视讯装置,其更包括一信心评估单元,用以对该语音讯号进行一信心评估,并据以输出一评估等级,并将该评估等级与一预设的评估基准值作比较。
前述的具有语音辅助系统的视讯装置,其中在该信心评估单元比较该评估等级与该评估基准值时,若是该评估等级高于该评估基准值时,则由该萤幕显示选单控制界面直接根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一,若是该评估等级低于该评估基准值时,则由该萤幕显示选单控制界面根据该语音讯号显示复数个与该语音指令近似度高于一预定值的指令,并接着选择该些指令其中之一,而后进行根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一。
前述的具有语音辅助系统的视讯装置,其中在选择该语音指令近似度高于该预定值的该些指令时,是由一语音输入的方式经由该语音辨识引擎选择。
前述的具有语音辅助系统的视讯装置,其中在选择该语音指令近似度高于该预定值的该些指令时,是由该视讯装置的按键输入的方式选择。
前述的具有语音辅助系统的视讯装置,其中所述的信心评估单元是设置于该萤幕显示选单控制界面。
前述的具有语音辅助系统的视讯装置,其中若该语音指令为该模糊指令时,参照一指令资料库找出对应于该语音指令的该些调整动作。
前述的具有语音辅助系统的视讯装置,其中当该语音指令为该模糊指令时,更包括经由该萤幕显示选单控制界面控制该显示控制单元,显示该些已经执行的对应于该语音指令的该些调整动作。
前述的具有语音辅助系统的视讯装置,其中当显示所有该些已经执行的对应于该语音指令的该些调整动作之后,再进行一修正影像的程序。
前述的具有语音辅助系统的视讯装置,其中所述的修正影像的程序是由一语音输入的方式经由该语音辨识引擎选择。
前述的具有语音辅助系统的视讯装置,其中所述的修正影像的程序是由该视讯装置的按键输入的方式选择。
本发明的目的及解决其技术问题还采用以下的技术方案来实现。依据本发明提出的一种具有语音辅助系统的视讯装置,其包括一语音辨识引擎,用以接收一语音指令,辨识后产生一辨识结果,该语音辨识引擎包括一信心评估单元,用以对该辨识结果进行一信心评估,并据以输出一评估等级,并将该评估等级与一预设的评估基准值作比较后,据以输出一语音讯号;一萤幕显示选单(OSD)控制界面,连接至该语音辨识引擎,用以接收该语音讯号;一显示控制单元,连接至该萤幕显示选单控制界面;以及一显示单元,连接至该显示控制单元,其中该萤幕显示选单控制界面根据该语音讯号决定该语音指令为一具体指令与一模糊指令两者之一,其中,当该语音指令为一具体指令时,经由该显示控制单元执行对应于该语音指令的一调整动作以调整由该显示单元所显示的一影像,当该语音指令为一模糊指令时,经由该显示控制单元执行对应于该语音指令的复数个调整动作,以调整由该显示单元所显示的影像。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。
前述的具有语音辅助系统的视讯装置,其中在该信心评估单元比较该评估等级与该评估基准值时,若是该评估等级高于该评估基准值时,则经由该语音讯号传送至该萤幕显示选单控制界面,直接根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一,若是该评估等级低于该评估基准值时,则经由该语音讯号传送至该萤幕显示选单控制界面,根据该语音讯号显示复数个与该语音指令近似度高于一预定值的指令,并接着选择该些指令其中之一,而后进行根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一。
前述的具有语音辅助系统的视讯装置,其中在选择该语音指令近似度高于该预定值的该些指令时,是由一语音输入的方式经由该语音辨识引擎选择。
前述的具有语音辅助系统的视讯装置,其中在选择该语音指令近似度高于该预定值的该些指令时,是由该视讯装置的按键输入的方式选择。
前述的具有语音辅助系统的视讯装置,其中若该语音指令为该模糊指令时,该语音辨识引擎参照一指令资料库找出对应于该语音指令的该些调整动作。
前述的具有语音辅助系统的视讯装置,其中当该语音指令为该模糊指令时,更包括经由该萤幕显示选单控制界面控制该显示控制单元,显示该些已经执行的对应于该语音指令的该些调整动作。
前述的具有语音辅助系统的视讯装置,其中当显示所有该些已经执行的对应于该语音指令的该些调整动作之后,再进行一修正影像的程序。
前述的具有语音辅助系统的视讯装置,其中所述的修正影像的程序是由一语音输入的方式经由该语音辨识引擎选择。
前述的具有语音辅助系统的视讯装置,其中所述的修正影像的程序是由该视讯装置的按键输入的方式选择。
本发明与现有技术相比具有明显的优点和有益效果。由以上技术方案可知,为了达到前述发明目的,本发明的主要技术内容如下
本发明提出一种调整影像的方法,适用于调整一具有语音辅助系统的视讯装置。该视讯装置具有一萤幕显示选单的功能。在该调整影像的方法中,包括接收一语音指令,并辨识语音指令,并依据辨识的结果输出一语音讯号。根据语音讯号决定语音指令为一具体指令与一模糊指令两者之一。
上述的调整影像的方法中,在一实施例中,当语音指令为一具体指令时,执行对应于语音指令的一调整动作以调整影像。
上述的调整影像的方法中,在一实施例中,当语音指令为一模糊指令时,执行对应于语音指令的复数个调整动作。
在上述的调整影像的方法中,在根据语音讯号决定语音指令为具体指令与模糊指令两者之一的步骤前,更包括对语音讯号进行一信心评估,并据以输出一评估等级,并将评估等级与一预设的评估基准值作比较。若是评估等级高于评估基准值时,直接进行根据语音讯号决定语音指令为具体指令与模糊指令两者之一的步骤。若是评估等级低于评估基准值时,则根据语音讯号显示复数个与语音指令近似度高于一预定值的指令,并接着选择这些指令其中之一,而后进行根据语音讯号决定语音指令为具体指令与模糊指令两者之一的步骤。
上述的选择语音指令近似度高于预定值的指令时,是由一语音输入或是按键输入方式选择。
在上述的调整影像的方法中,若语音指令为模糊指令时,在一选择实施例中,可参照一指令资料库找出对应于语音指令的调整动作。
在上述的调整影像的方法中,其中当语音指令为模糊指令时,更包括经由视讯装置的萤幕显示选单的功能显示已经执行的对应于语音指令的调整动作。当显示所有已经执行的对应于语音指令的调整动作后,可选择性地再进行一修正影像的程序。
为达到上述的发明目的,本发明还提出一种具有语音辅助系统的视讯装置,包括一语音辨识引擎、一萤幕显示选单(OSD)控制界面、一显示控制单元与一显示单元。该语音辨识引擎用以接收一语音指令,并据以输出一语音讯号。该萤幕显示选单控制界面,连接至语音辨识引擎,用以接收该语音讯号。而显示控制单元连接至萤幕显示选单控制界面,而显示单元,连接至显示控制单元。上述的萤幕显示选单控制界面根据语音讯号决定语音指令为一具体指令与一模糊指令两者之一。
上述的具有语音辅助系统的视讯装置,在一实施例中,当语音指令为一具体指令时,经由显示控制单元执行对应于语音指令的一调整动作以调整由显示单元所显示的一影像。
上述的具有语音辅助系统的视讯装置,在一实施例中,当语音指令为一模糊指令时,经由显示控制单元执行对应于语音指令的复数个调整动作,以调整由显示单元所显示的影像。
上述的具有语音辅助系统的视讯装置,其中更包括一信心评估单元,用以对语音讯号进行一信心评估,并据以输出一评估等级,并将评估等级与一预设的评估基准值作比较。若是评估等级高于评估基准值时,则由萤幕显示选单控制界面直接根据语音讯号决定语音指令为具体指令与模糊指令两者之一。若是评估等级低于评估基准值时,则由萤幕显示选单控制界面根据语音讯号显示复数个与语音指令近似度高于一预定值的指令,并接着选择这些指令其中之一,而后进行根据语音讯号决定语音指令为具体指令与模糊指令两者之一。
上述选择语音指令近似度高于预定值的指令时,是由一语音输入的方式经由语音辨识引擎选择,或由视讯装置的按键输入的方式选择。
上述的具有语音辅助系统的视讯装置,其中,若语音指令为模糊指令时,参照一指令资料库找出对应于语音指令的复数个调整动作。
上述的具有语音辅助系统的视讯装置,其中,当语音指令为模糊指令时,更包括经由萤幕显示选单控制界面控制显示控制单元,显示这些已经执行的对应于语音指令的调整动作。而后可选择性地再进行一修正影像的程序。
为达到上述的目的,本发明另还提出另一种具有语音辅助系统的视讯装置,包括一语音辨识引擎、一萤幕显示选单(OSD)控制界面、一显示控制单元与一显示单元。而该语音辨识引擎包括一信心评估单元,用以接收一语音指令,辨识后产生一辨识结果,而后对辨识结果进行一信心评估,并据以输出一评估等级,并将评估等级与一预设的评估基准值作比较后,据以输出一语音讯号。该萤幕显示选单(OSD)控制界面,连接至语音辨识引擎,用以接收该语音讯号。而显示控制单元连接至萤幕显示选单控制界面,而显示单元连接至显示控制单元。该萤幕显示选单控制界面根据语音讯号决定语音指令为一具体指令与一模糊指令两者之一。
上述的具有语音辅助系统的视讯装置,在一实施例中,当语音指令为一具体指令时,经由显示控制单元执行对应于语音指令的一调整动作以调整由显示单元所显示的一影像。
上述的具有语音辅助系统的视讯装置,在一实施例中,当语音指令为一模糊指令时,经由显示控制单元执行对应于语音指令的复数个调整动作,以调整由显示单元所显示的影像。
上述的信心评估单元比较评估等级与评估基准值时,若是评估等级高于评估基准值时,则经由语音讯号传送至萤幕显示选单控制界面,直接根据语音讯号决定语音指令为具体指令与模糊指令两者之一。若是评估等级低于评估基准值时,则经由语音讯号传送至萤幕显示选单控制界面,根据语音讯号显示复数个与语音指令近似度高于一预定值的指令,并接着选择这些指令其中之一,而后进行根据语音讯号决定语音指令为具体指令与模糊指令两者之一。
上述选择语音指令近似度高于预定值的指令时,是由一语音输入的方式经由语音辨识引擎选择,或由视讯装置的按键输入的方式选择。
上述的具有语音辅助系统的视讯装置,其中,若语音指令为模糊指令时,语音辨识引擎参照一指令资料库找出对应于语音指令的调整动作。
上述的具有语音辅助系统的视讯装置,其中,当语音指令为模糊指令时,更包括经由萤幕显示选单控制界面控制显示控制单元,显示已经执行的对应于语音指令的调整动作。在一选择实施例中,可再进行一修正影像的程序。
经由上述可知,本发明是关于一种具有语音辅助系统的视讯装置及其调整影像的方法。该具有语音辅助系统的视讯装置,可经由语音输入调整其所显示的影像。该语音辅助系统主要是由语音辨识引擎以及控制单元所构成。其中,语音辨识引擎是用以辨识所输入的语音指令,并依据辨识结果而输出对应的语音讯号至控制单元,而控制单元则依据该语音讯号来执行动作以调整影像。使用者仅需输入单一语音指令,语音辅助系统即可执行一连串的连续动作以调整视讯装置所显示的影像。所以该语音辅助系统有助于提高视讯装置的影像调整的便利性,进而可以降低操作上的困难度。
借由上述技术方案,本发明至少具有下列优点本发明具有语音辅助系统的视讯装置及其调整影像的方法,可以单一语音指令来使视讯装置完成影像调整,对使用者而言,在操作上较为简单方便。而且,当使用者所下达的语音指令未有明确与其对应的动作时,本发明仍可经由分析比对后,使视讯装置进行一连串的影像调整动作。在此些动作执行完毕后,更将该些已执行过动作显示于视讯装置的显示器上,以便于使用者针对该些动作来对影像作微调修正,以符合使用者的需求。因此,本发明的调整影像的方法较现有习知方法更具有弹性,所以可以有效的降低使用者在操作上的复杂度。
此外,由于本发明的语音辅助系统中更设计有信心评估装置,以对语音辨识引擎所输出的辨识结果作评估。因此,本发明可以避免因辨识率过低而产生误动作的问题产生,进而可以提高整体系统的可靠度。
综上所述,本发明特殊的具有语音辅助系统的视讯装置及其调整影像的方法,可以藉由语音指令来完成影像的调整,从而更加适于实用。本发明另可令使用者在调整视讯装置所显示的影像时较为便利,不需要连续下达多个语音指令才可达成目的,并且可以降低语音辨识错误的疑虑。其具有上述诸多的优点及实用价值,并在同类产品及方法中未见有类似的结构设计及方法公开发表或使用而确属创新,其不论在产品结构、方法或功能上皆有较大改进,在技术上有较大进步,并产生了好用及实用的效果,且较现有的视讯装置及其调整影像的方法具有增进的多项功效,从而更加适于实用,而具有产业的广泛利用价值,诚为一新颖、进步、实用的新设计。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。


图1是现有习知的具有萤幕显示选单的视讯装置的影像调整方法的方框示意图。
图2是本发明一较佳实施例的具有语音辅助系统的视讯装置的方框示意图。
图3是本发明一较佳实施例的调整影像的方法的步骤流程图。
图4是本发明另一较佳实施例的的具有语音辅助系统的视讯装置的方框示意图。
200具有语音辅助系统的视讯装置210语音辨识引擎220萤幕显示选单(OSD)控制界面 225信心评估单元230显示控制单元 240显示单元250指令资料(数据)库400具有语音辅助系统的视讯装置410语音辨识引擎420萤幕显示选单(OSD)控制界面 475信心评估单元430显示控制单元 440显示单元450指令资料(数据)库具体实施方式
以下结合附图及较佳实施例,对依据本发明提出的具有语音辅助系统的视讯装置及其调整影像的方法其具体的结构、方法、步骤、特征及其功效,详细说明如后。
本发明提供了一种具有语音辅助系统的视讯装置及其调整影像的方法,可以藉由语音指令来完成影像的调整。不同于现有习知技术,本发明的具有语音辅助系统的视讯装置及其调整影像的方法,可令使用者在调整视讯装置所显示的影像时较为便利,不需要连续下达多个语音指令才可达成目的,并且存在有降低语音辨识错误的疑虑。
本发明提出的具有语音辅助系统的视讯装置,至少包括一语音辨识引擎、一萤幕显示选单(On Screen Display,OSD)控制界面、一显示控制单元以及一显示单元。语音辨识引擎用以根据使用者所输入的语音讯号输出一语音讯号至萤幕显示选单控制界面。而萤幕显示选单控制界面则连接至该视讯装置的显示控制单元。显示控制单元则是用以控制显示单元的显示。
而本发明所提出具有语音辅助系统的视讯装置调整影像的方法,在接收到使用者所输入的语音指令时,经由辨识后,确认该语音指令若是为一具体指令(Specific Command)时,即执行与语音讯号相符的动作以调整影像。当语音讯号为一模糊指令(Fuzzy Command)时,执行与语音讯号相关的连续动作以调整影像,并显示出已执行的动作。此外,若调整后的影像与预期中的影像仍未相符,则可针对显示出的动作来修正影像。而修正影像的方法可以是以语音下达修正指令或是以按键输入修正指令。
在本发明所提出具有语音辅助系统的视讯装置调整影像的方法,所定义的具体指令,即为一明确的操作动作,该操作动作可调整影像的一具体调整类别,而这些具体调整类别可储存在例如语音辨识引擎中,亦可储存在萤幕显示选单控制界面,此视设计上的需要而定。而该具体指令,例如,若是使用者所输入的语音指令为“加强亮度”,则该具体指令将可直接调整亮度。在一选择实施例中,该具体指令亦可加入调整参数值的大小。例如,使用者所输入的语音指令为“亮度增加10%”,则该具体指令将可直接调整增加亮度百分之十。
在本发明所提出具有语音辅助系统的视讯装置调整影像的方法,所定义的模糊指令,是为复数个调整影像的命令,而这些命令对应着复数个操作上的动作完成。而这些模糊指令以及其所对应的复数个调整动作,可以储存在例如语音辨识引擎中,亦可储存在萤幕显示选单控制界面,亦或是独立储存在另外的一指令资料库中,此视设计上的需要而定。而该模糊指令,例如,若是使用者所输入的语音指令为“影像模糊”的模糊指令(FuzzyCommand)时,则该模糊指令将可参照储存在指令资料库的指令集,进行一连串的动作,例如调整“亮度”、“对比”、“颜色”等等的指定。在一选择实施例中,该指令资料库内的指令集所对应的一连串动作,可设定调整参数值的调整阶段大小(Adjust Step Value)。例如,对于“亮度”部分,若是要增加亮度,则每次调整增加亮度5%等,可视设计上的需要而定。
请参阅图2所示,是本发明一较佳实施例的具有语音辅助系统的视讯装置200的方框示意图。该视讯装置200,至少包括一语音辨识引擎210、一萤幕显示选单(On Screen Display,OSD)控制界面220、一显示控制单元230以及一显示单元240。语音辨识引擎210是连接至萤幕显示选单(OSD)控制界面220。而萤幕显示选单控制界面220则连接至该视讯装置200的显示控制单元230。显示控制单元230则是用以控制显示单元240的显示。
当一使用者经由语音说出一语音指令时,该语音辨识引擎210会辨识该使用者所输入的语音指令,经过辨识后据以产生一语音讯号212输出至萤幕显示选单控制界面220。当萤幕显示选单控制界面220接收到语音辨识引擎210所传送的语音讯号212时,依据该语音讯号212判断后下达命令至视讯装置200的显示控制单元230,以便根据使用者所欲输入的语音指令调整其显示状态。在一选择实施例中,该视讯装置200更包括一指令资料库250,连接到萤幕显示选单控制界面220。该萤幕显示选单控制界面220可在指令资料库250找出对应于该语音讯号212的指令。
本发明所提出具有语音辅助系统的视讯装置调整影像的方法,则可运用在如图2的视讯装置200架构中。举例来说,当语音讯号经过语音辨识引擎210判断为具体指令时,例如是“调高对比至60%”诸如此类的指令时,则萤幕显示选单控制界面220根据所接收到的语音讯号212,直接下达指令至视讯装置200的显示控制单元230,使其执行与此语音指令相符的动作来调整其显示的影像。也就是说,视讯装置200的显示控制单元230将根据语音指令而调整影像的对比至60%。
另一方面,当语音讯号经过语音辨识引擎210判断为模糊指令时,例如是“画面不清楚”之类的指令,则萤幕显示选单控制界面220根据所接收到的语音讯号212,比对分析后,参照储存在指令资料库250的指令集,产生复数个一系列的指令,而该视讯装置200的显示控制单元230则根据这些指令,执行与此语音讯号相关的多个调整动作,例如是调整对比、亮度、颜色以及影像大小等等。在一选择实施例中,并可将已经执行的连续动作显示在视讯装置200的显示单元240上,以供使用者作参考。在另外一选择实施例中,若调整后的影像仍未满足使用者所需的影像,则使用者可依据显示出的动作来修正影像。
值得注意的是,由于目前的语音辨识技术仍然未能达到100%的辨识率,因此在本发明图2的较佳实施例中,可选择性地增加一信心评估(Confidence Measure)单元225,用以评估辨识后的结果,以便于提高系统整体的可靠度。以下将进一步说明该信心评估单元225所具有的功能及用途。
请再参阅图2所示,在一实施例中,信心评估单元225可设计于萤幕显示选单控制界面220中。语音辨识引擎210将辨识结果(Score),经由语音讯号212输出至萤幕显示选单控制界面220。而该时信心评估单元225即可对语音辨识引擎210所输出的辨识结果进行评估,并输出该辨识结果的一评估等级。而该评估等级则与预设的一评估基准值(EstimationThreshold)作比较。其中,评估等级是表示辨识结果与资料库中相对应的语音讯号的相似度。
若辨识结果的评估等级高于预设的评估基准值,则接着判断是否为具体指令或是模糊指令,若是具体指令,则经由显示控制单元230继续执行对应于该指令的后续调整动作。
若辨识结果的评估等级低于评估基准值,则萤幕显示选单控制界面220经由显示控制单元230的控制,在视讯装置200的显示单元240上显示与使用者所输入的语音指令相似的前几项辨识结果,也就是显示前几项相似度较高的指令,以供使用者选择正确的指令。使用者可以是以语音下达选择命令来选择正确的辨识结果,也可以是以按键来选择正确的辨识结果,本发明并未对此选择方式加以限定。而后接着判断是否为具体指令或是模糊指令,若是具体指令,则经由显示控制单元230继续执行对应于此指令的后续调整动作。若是模糊指令,则萤幕显示选单控制界面220可参照指令资料库250找出对应的指令集,则经由显示控制单元230继续执行对应于此模糊指令的后续数个调整动作。
由上述可知,将本发明的具有语音辅助系统的视讯装置,可以简单的方式来调整视讯装置所输出的影像。以下将说明利用上述的语音辅助系统来调整影像的方法。
请参阅图3所示,是本发明的调整影像的方法的步骤流程图。如步骤S300所述,首先由使用者输入语音指令,接着再如步骤S302所述,对所输入的语音指令进行辨识,并经由一语音讯号输出一辨识结果。然后再进行步骤S304,对辨识结果进行信心评估,并输出一评估等级。接着,在步骤S306中,将步骤S304中所输出的评估等级与预设的评估基准值作比较。
若是语音指令的辨识结果的评估等级高于评估基准值,则可确认输入的指令,而直接进行步骤S308,判断此语音指令是否为一具体指令。而若是语音指令的辨识结果的评估等级低于评估基准值,则进行步骤S310,显示与此语音指令近似度较高的前几名指令,接着由使用者选择正确的指令,如步骤S312,而后再继续进行步骤S308。接着若是辨识的指令或是经由选择的指令为具体指令,则如步骤S314所示,直接执行与此具体指令相关的动作以调整影像。
而若步骤S308判断的结果为非具体指令,则进行步骤S316,将辨识的结果,也就是辨识的指令或是经由选择的指令,与资料库进行分析比对,以便找出对应的一指令集,该指令集对应着复数个不同的调整动作。接着如步骤S318,根据该指令集进行对应的调整动作,以调整影像。而后接着步骤S320,显示已经执行的动作,而后使用者接受此调整后的影像状态,亦可根据这些动作再进一步进行影像的调整。
值得一提的是,在步骤S312中,使用者可以是以语音下达选择命令来选择正确的辨识结果,也可以是以按键来选择正确的辨识结果,本发明并未对此选择方式加以限定。
在上述的步骤S308中,若判断的结果显示依据辨识结果所输出的语音讯号为具体指令时,例如是“将亮度调至30”之类的指令,则继续进行步骤S314,执行与语音讯号相符的动作以调整影像。另一方面,若在步骤S308中,判断的结果显示语音讯号为模糊指令,例如是“画面不清楚”之类的指令。则如步骤S316所述,将该语音讯号与资料库中的资料分析比对之后,再进行步骤S318,以执行多个连续动作来调整影像,例如是调整对比、亮度、颜色以及影像大小等动作。之后如步骤S320所述,显示已执行的连续动作,以供使用者作参考。此时,若调整后的影像仍未满足使用者所需的影像,则可进行步骤S320,依据显示出的已执行动作来修正影像,使显示出的影像符合使用者所需。
当然,步骤S322中的修正影像的方法可以是以语音的方式来下达修正的命令,也可以用按键来调整修正影像,可依使用者的方便性来决定,本发明亦未对步骤322中修正影像的方法加以限定。
请参阅图4所示,是本发明的另一较佳实施例的具有语音辅助系统的视讯装置400的方框示意图。该视讯装置400,至少包括一语音辨识引擎410、一萤幕显示选单(OSD)控制界面420、一显示控制单元430以及一显示单元440。其中,该语音辨识引擎410是连接至萤幕显示选单(OSD)控制界面420。而萤幕显示选单控制界面420则连接至该视讯装置400的显示控制单元430。显示控制单元430则是用以控制显示单元440的显示。
不同于图2中的实施例,在此实施例中,信心评估单元475是设计于语音辨识引擎410中。该语音辨识引擎410直接将辨识结果(Score)经由其信心评估单元475进行评估,并输出此辨识结果的一评估等级。而此评估等级则与预设的一评估基准值(Estimation Threshold)作比较。其中,评估等级是表示辨识结果与资料库中相对应的语音讯号的相似度。若辨识结果的评估等级高于预设的评估基准值,则接着判断是否为具体指令或是模糊指令,若是具体指令,则经由语音讯号412输出至萤幕显示选单控制界面420,对应此语音讯号412,经由显示控制单元430继续执行对应于此指令的后续调整动作。
若辨识结果的评估等级低于评估基准值,则语音辨识引擎410会经由萤幕显示选单控制界面420与显示控制单元430的控制,在视讯装置400的显示单元440上显示与使用者所输入的语音指令相似的前几项辨识结果,也就是显示前几项相似度较高的指令,以供使用者选择正确的指令。使用者可以是以语音下达选择命令来选择正确的辨识结果,也可以是以按键来选择正确的辨识结果,本发明并未对此选择方式加以限定。
接着,判断所选择的指令是否为具体指令或是模糊指令,若是模糊指令,则参照指令资料库450找出对应的指令集,则经由语音讯号412输出至萤幕显示选单控制界面420,对应该语音讯号412,经由显示控制单元430继续执行对应于此模糊指令的后续数个调整动作。
由上述可知,本发明的调整影像的方法,可以单一语音指令来使视讯装置完成影像调整,对使用者而言,在操作上较为简单方便。而且,当使用者所下达的语音指令未有明确与其对应的动作时,本发明仍可以经由分析比对后,使视讯装置进行一连串的影像调整动作。在某些动作执行完毕后,更将这些已执行过的动作显示于视讯装置的显示器上,以便于使用者针对该些动作来对影像作微调修正,以符合使用者的需求。因此,本发明的调整影像的方法较现有习知方法更具有弹性,所以可以有效的降低使用者在操作上的复杂度。
此外,由于本发明的语音辅助系统中更设计有信心评估装置,以对语音辨识引擎所输出的语音讯号作评估,换句话说,也就是对所输入的语音指令作二次确认。因此,本发明可避免因辨识率过低而产生误动作的问题产生,进而可以提高整体系统的可靠度。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的方法及技术内容作出些许的更动或修饰为等同变化的等效实施例,但是凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
权利要求
1.一种调整影像的方法,其适用于调整一具有语音辅助系统的视讯装置,且该视讯装置具有一萤幕显示选单的功能,其特征在于该调整影像的方法包括以下步骤接收一语音指令;辨识该语音指令,并依据辨识的结果输出一语音讯号;以及根据该语音讯号决定该语音指令为一具体指令与一模糊指令两者之一。
2.根据权利要求1所述的调整影像的方法,其特征在于其中,当该语音指令为一具体指令时,执行对应于该语音指令的一调整动作以调整该影像。
3.根据权利要求1所述的调整影像的方法,其特征在于其中当该语音指令为一模糊指令时,执行对应于该语音指令的复数个调整动作。
4.根据权利要求1所述的调整影像的方法,其特征在于其中在根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一的步骤之前,更包括对该语音讯号进行一信心评估,并据以输出一评估等级,并将该评估等级与一预设的评估基准值作比较。
5.根据权利要求4所述的调整影像的方法,其特征在于其中在比较该评估等级与该评估基准值时,若是该评估等级高于该评估基准值时,直接进行根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一的步骤,若是该评估等级低于该评估基准值时,则根据该语音讯号显示复数个与该语音指令近似度高于一预定值的指令,并接着选择该些指令其中之一,而后进行根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一的步骤。
6.根据权利要求5所述的调整影像的方法,其特征在于其中在选择该语音指令近似度高于该预定值的该些指令时,是由一语音输入的方式选择。
7.根据权利要求5所述的调整影像的方法,其特征在于其中在选择该语音指令近似度高于该预定值的该些指令时,是由该视讯装置的按键输入的方式选择。
8.根据权利要求1所述的调整影像的方法,其特征在于其中若该语音指令为该模糊指令时,参照一指令资料库找出对应于该语音指令的该些调整动作。
9.根据权利要求1所述的调整影像的方法,其特征在于其中当该语音指令为该模糊指令时,更包括经由该视讯装置的萤幕显示选单的功能显示该些已经执行的对应于该语音指令的该些调整动作。
10.根据权利要求9所述的调整影像的方法,其特征在于其中当显示所有已经执行的对应于该语音指令的调整动作后,再进行一修正影像的程序。
11.根据权利要求10所述的调整影像的方法,其特征在于其中所述的修正影像的程序是由一语音输入的方式选择。
12.根据权利要求10所述的调整影像的方法,其特征在于其中所述的修正影像的程序是由一按键输入的方式选择。
13.一种具有语音辅助系统的视讯装置,其特征在于其包括一语音辨识引擎,用以接收一语音指令,并据以输出一语音讯号;一萤幕显示选单(OSD)控制界面,连接至该语音辨识引擎,用以接收该语音讯号;一显示控制单元,连接至该萤幕显示选单控制界面;以及一显示单元,连接至该显示控制单元,其中该萤幕显示选单控制界面根据该语音讯号决定该语音指令为一具体指令与一模糊指令两者之一。
14.根据权利要求13所述的具有语音辅助系统的视讯装置,其特征在于其中当该语音指令为一具体指令时,经由该显示控制单元执行对应于该语音指令的一调整动作以调整由该显示单元所显示的一影像。
15.根据权利要求13所述的具有语音辅助系统的视讯装置,其特征在于其中当该语音指令为一模糊指令时,经由该显示控制单元执行对应于该语音指令的复数个调整动作,以调整由该显示单元所显示的该影像。
16.根据权利要求13所述的具有语音辅助系统的视讯装置,其特征在于其更包括一信心评估单元,用以对该语音讯号进行一信心评估,并据以输出一评估等级,并将该评估等级与一预设的评估基准值作比较。
17.根据权利要求16所述的具有语音辅助系统的视讯装置,其特征在于其中在该信心评估单元比较该评估等级与该评估基准值时,若是该评估等级高于该评估基准值时,则由该萤幕显示选单控制界面直接根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一,若是该评估等级低于该评估基准值时,则由该萤幕显示选单控制界面根据该语音讯号显示复数个与该语音指令近似度高于一预定值的指令,并接着选择该些指令其中之一,而后进行根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一。
18.根据权利要求17所述的具有语音辅助系统的视讯装置,其特征在于其中在选择该语音指令近似度高于该预定值的该些指令时,是由一语音输入的方式经由该语音辨识引擎选择。
19.根据权利要求17所述的具有语音辅助系统的视讯装置,其特征在于其中在选择该语音指令近似度高于该预定值的该些指令时,是由该视讯装置的按键输入的方式选择。
20.根据权利要求16所述的具有语音辅助系统的视讯装置,其特征在于其中所述的信心评估单元是设置于该萤幕显示选单控制界面。
21.根据权利要求13所述的具有语音辅助系统的视讯装置,其特征在于其中若该语音指令为该模糊指令时,参照一指令资料库找出对应于该语音指令的该些调整动作。
22.根据权利要求13所述的具有语音辅助系统的视讯装置,其特征在于其中当该语音指令为该模糊指令时,更包括经由该萤幕显示选单控制界面控制该显示控制单元,显示该些已经执行的对应于该语音指令的该些调整动作。
23.根据权利要求22所述的具有语音辅助系统的视讯装置,其特征在于其中当显示所有该些已经执行的对应于该语音指令的该些调整动作之后,再进行一修正影像的程序。
24.根据权利要求23所述的具有语音辅助系统的视讯装置,其特征在于其中所述的修正影像的程序是由一语音输入的方式经由该语音辨识引擎选择。
25.根据权利要求23所述的具有语音辅助系统的视讯装置,其特征在于其中所述的修正影像的程序是由该视讯装置的按键输入的方式选择。
26.一种具有语音辅助系统的视讯装置,其特征在于其包括一语音辨识引擎,用以接收一语音指令,辨识后产生一辨识结果,该语音辨识引擎包括一信心评估单元,用以对该辨识结果进行一信心评估,并据以输出一评估等级,并将该评估等级与一预设的评估基准值作比较后,据以输出一语音讯号;一萤幕显示选单(OSD)控制界面,连接至该语音辨识引擎,用以接收该语音讯号;一显示控制单元,连接至该萤幕显示选单控制界面;以及一显示单元,连接至该显示控制单元,其中该萤幕显示选单控制界面根据该语音讯号决定该语音指令为一具体指令与一模糊指令两者之一,其中,当该语音指令为一具体指令时,经由该显示控制单元执行对应于该语音指令的一调整动作以调整由该显示单元所显示的一影像,当该语音指令为一模糊指令时,经由该显示控制单元执行对应于该语音指令的复数个调整动作,以调整由该显示单元所显示的影像。
27.根据权利要求26所述的具有语音辅助系统的视讯装置,其特征在于其中在该信心评估单元比较该评估等级与该评估基准值时,若是该评估等级高于该评估基准值时,则经由该语音讯号传送至该萤幕显示选单控制界面,直接根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一,若是该评估等级低于该评估基准值时,则经由该语音讯号传送至该萤幕显示选单控制界面,根据该语音讯号显示复数个与该语音指令近似度高于一预定值的指令,并接着选择该些指令其中之一,而后进行根据该语音讯号决定该语音指令为该具体指令与该模糊指令两者之一。
28.根据权利要求27所述的具有语音辅助系统的视讯装置,其特征在于其中在选择该语音指令近似度高于该预定值的该些指令时,是由一语音输入的方式经由该语音辨识引擎选择。
29.根据权利要求27所述的具有语音辅助系统的视讯装置,其特征在于其中在选择该语音指令近似度高于该预定值的该些指令时,是由该视讯装置的按键输入的方式选择。
30.根据权利要求26所述的具有语音辅助系统的视讯装置,其特征在于其中若该语音指令为该模糊指令时,该语音辨识引擎参照一指令资料库找出对应于该语音指令的该些调整动作。
31.根据权利要求26所述的具有语音辅助系统的视讯装置,其特征在于其中当该语音指令为该模糊指令时,更包括经由该萤幕显示选单控制界面控制该显示控制单元,显示该些已经执行的对应于该语音指令的该些调整动作。
32.根据权利要求31所述的具有语音辅助系统的视讯装置,其特征在于其中当显示所有该些已经执行的对应于该语音指令的该些调整动作之后,再进行一修正影像的程序。
33.根据权利要求32所述的具有语音辅助系统的视讯装置,其特征在于其中所述的修正影像的程序是由一语音输入的方式经由该语音辨识引擎选择。
34.根据权利要求32所述的具有语音辅助系统的视讯装置,其特征在于其中所述的修正影像的程序是由该视讯装置的按键输入的方式选择。
全文摘要
本发明是关于一种具有语音辅助系统的视讯装置及其调整影像的方法。该具有语音辅助系统的视讯装置,可经由语音输入调整其所显示的影像。该语音辅助系统主要是由语音辨识引擎以及控制单元所构成。其中,语音辨识引擎是用以辨识所输入的语音指令,并依据辨识结果而输出对应的语音讯号至控制单元,而控制单元则依据该语音讯号来执行动作以调整影像。使用者仅需输入单一语音指令,语音辅助系统即可执行一连串的连续动作以调整视讯装置所显示的影像。所以,该语音辅助系统有助于提高视讯装置的影像调整的便利性,进而可以降低操作上的困难度。
文档编号G10L15/00GK1664925SQ200410006130
公开日2005年9月7日 申请日期2004年3月2日 优先权日2004年3月2日
发明者卢原嘉, 黄良声, 沈家麟 申请人:台达电子工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1