信息处理设备以及方法

文档序号:8395925阅读:1874来源:国知局
信息处理设备以及方法
【专利说明】信息处理设备以及方法
[0001]相关申请的交叉引用
[0002]本申请基于并要求于2013年12月13日提交的日本专利申请N0.2013-258077的优先权;其全部内容通过引用的方式并入本文中。
技术领域
[0003]本文所述的实施例总体上涉及一种信息处理设备以及方法。
【背景技术】
[0004]典型地,已知了能够使得将语音数据转换为文本的任务(下文中称为转录任务)简化的各种技术。例如,已知了一种技术,其中,当用户在转录任务过程中输入字符的同时,估计从用于转录的目标语音数据最终输入的短语,并呈现给用户。
[0005]此外,已知了诸如输入估计技术或者估计转换技术的字符输入技术,其中,除了显示已经输入的朗读字符串的假名-汉字转换候选以外,显示估计为跟随在朗读字符串之后的字符串,作为转换候选字符串(下文中称为估计候选)。
[0006]然而,每一次呈现输入候选时,都必须准备好朗读信息。因此,即使在用户选择(接受)呈现给他或她的输入候选的情况下,仍然必须准备好朗读信息,以便呈现下一个输入候选。因而,在选择了输入候选后,用户再次需要执行字符输入,从而导致工作效率降低。此外,对于语音识别精度低的语音数据,有可能连续呈现不正确的输入候选。结果,输入候选妨碍了用户,从而导致工作效率降低。
[0007]此外,在传统字符输入技术中,仅使用假名-汉字转换字典来产生输入候选,在字典中,将朗读字符串与假名-汉字转换后的字符相关联,并使用字符输入历史信息。这导致在转录任务过程中工作效率的降低。此外,在专门用于以用户所选估计候选开始的字符串的转换字典(估计转换字典)中检索会跟随在所选估计候选之后的候选(下文中称为后继候选)。为此,为了连续输入长字符串(例如,以句子为单位的),就必须在估计转换字典中还保存长字符串。结果,估计转换字典的大小不断增大,从而导致估计候选的检索效率降低。

【发明内容】

[0008]本文所述的实施例的目的是提供一种能够简化转录任务的信息处理设备和方法。
[0009]根据实施例,信息处理设备的包括:存储器控制器、检测器、获取器、检索器、确定器、显示控制器、历史更新器、选择器和阈值更新器。存储器控制器在存储器中存储:多个字符串,所述多个字符串包含在通过对语音数据执行语音识别而获取的语音文本中;节点索弓丨,所述节点索引指示所述语音文本中的所述字符串的中的每一个字符串的开始位置信息和结束位置信息;语音识别得分,所述语音识别得分通过执行所述语音识别果而获取;以及语音位置信息的语音索引,所述语音位置信息的语音索引指示所述语音数据中的所述字符串中的每一个字符串的位置。检测器检测再现区段信息,其指示语音数据中的再现区段。获取器获取朗读信息,所述朗读信息是表示依据再现的语音数据写下的文本中的短语的朗读的字符串的至少一部分,并且所述获取器获取插入位置信息,其指示在书写文本中的字符插入位置。检索器从储存在存储器中的多个字符串中指定字符串作为检索的目标字符串,其具有包括在再现区段信息中的相应的语音位置信息,并在指定字符串中检索包括由朗读信息所指示的朗读的字符串。当对应于由检索器获取的字符串的语音识别得分的值等于或大于显示阈值时,确定器进行确定以显示由检索器获取的字符串。显示控制器在显示单元上显示由确定器所确定的字符串。历史更新器执行储存控制,以在候选历史存储器中存储候选历史数据,在其中,将由检索器获取的字符串、语音识别得分与字符插入位置相关联,并按照文本的变化来更新候选历史数据。当由显示控制器显示的字符串受到选择操作时,选择器选择该字符串。阈值更新器使用候选历史数据的语音识别得分与由选择器选择的字符串的语音识别得分的至少其中之一来对显示阈值作出决定,所述显示阈值用于通过确定器来与语音识别得分相比较。
[0010]根据上述的信息处理设备,可以简化转录任务。
【附图说明】
[0011]图1是根据第一实施例的信息处理设备的功能方框图;
[0012]图2是示出语音识别结果的网格结构的示例的图示;
[0013]图3是示出作为对于语音数据执行语音识别的结果而获取的示例性网格结构的图示;
[0014]图4是示出候选历史数据的示例的图示;
[0015]图5是用于解释在根据第一实施例的信息处理设备中执行的操作的流程图;
[0016]图6是用于解释当获取朗读信息时阈值更新器更新显示阈值的操作的细节的流程图;
[0017]图7是用于解释当用户已选择候选时阈值更新器更新显示阈值的操作的流程图;
[0018]图8是示出用户操作和候选显示的示例的图示;
[0019]图9是根据第二实施例的信息处理设备的功能方框图;
[0020]图10是用于解释在根据第二实施例的信息处理设备中执行的操作的流程图;
[0021]图11是示出用户操作和多个候选显示的示例的图示;
[0022]图12是根据第三实施例的信息处理设备的功能方框图;
[0023]图13是用于解释将网格结构转换为特里结构而执行的操作的流程图;
[0024]图14是示出转换为特里结构的语音识别结果的列表的示例的图示;以及
[0025]图15是示出语音识别结果的特里结构的示例的图示。
【具体实施方式】
[0026]以下参考附图详细说明多个实施例。本文所述的实施例仅是示例性的,并非唯一可能的实施例。可以使用所谓的个人计算机设备来实施根据实施例的信息处理设备。在此,使用个人计算机设备实施的信息处理设备具有再现语音数据的功能,以及具有用于按照操作者(下文中称为用户)的操作产生文本的文本产生功能。在转录任务过程中,在再现已经记录的语音数据的同时,用户为了将语音数据转换为文本,操作键盘并执行文本输入。
[0027]概要
[0028]在根据实施例的信息处理设备中,作为与输入候选有关的信息附带了表示作为语音识别的结果而获取的语音识别得分和结束节点索引的信息。随后,将具有等于或大于特定阈值(下文中称为显示阈值)的语音识别得分的输入候选呈现给用户。如果用户选择呈现给他或她的输入候选,就获取与所选择的输入候选的结束节点索引有关的信息;取回以获取的结束节点索引开始的输入候选,并作为输入候选呈现给用户。
[0029]此外,在信息处理设备中,输入候选的字符串的语音识别得分与字符插入位置彼此相关联,将关联信息存储为候选历史数据。随后,使用(I)候选历史数据的语音识别得分和(2)输入候选的用户选择来决定显示阈值。因此,在语音识别的结果不令人满意的情况下,可以避免呈现多余的输入候选。此外,在选择输入候选的同时,可以使得用户可以选择跟随在所选择候选之后的输入候选。这能够实现转录任务进一步地简化。
[0030]第一实施例
[0031]图1是根据第一实施例的信息处理设备的功能方框图。如图1所示的,信息处理设备包括第一存储器1、第二存储器2、再现器3、再现指令接收器4、再现控制器5、检测器6、获取器7、检索器8、显示控制器9、选择器10、后继检索器11、阈值更新器12、确定器13、第三存储器14和历史更新器15。在此,再现器3到确定器13和历史更新器15可以全部使用软件或使用硬件来实施。可替换地,这些组成元件中的一些可以使用软件来实施,而剩余组成元件可以使用硬件来实施。
[0032]第一存储器I在其中存储语音数据。关于语音数据,可以使用WAV格式或mp3格式的语音文件。同时,可以通过实施任意的方法来获取语音数据。例如,可以经由诸如互联网的网络获取语音数据,或者可以使用话筒设备来获取语音数据。
[0033]第二存储器2在其中存储包含在语音文本中的多个字符串,所述语音文本通过对语音数据执行语音识别而获取,并且第二存储器2在其中存储语音位置的语音索引,所述语音位置的语音索引指示语音数据中的字符串中的每一个字符串的位置。此外,第二存储器2在其中存储可靠性的程度(下文中称为语音识别得分),它是在语音识别过程中计算的。检索器8代表存储器控制器的示例,存储器控制器在第二存储器2中存储语音索引等。
[0034]关于语音识别,可以使用各种已知的技术。示例性地,在语音识别中,以1ms到20ms的有规律的间隔处理语音数据。随后,可以在语音识别过程中通过获取用于处理的目标语音数据和相应的识别结果来实现与语音位置信息的关联。
[0035]在图2中示出了与汉字和假名的日文句子“maido arigatou gozaimasu.”相对应的语音数据的语音识别结果的示例(开始节点索引、语音索引、语音识别得分、结束节点索弓1、字符串和朗读)。在第一实施例中,使用时间信息来表示语音位置信息,时间信息指示再现从开始一直到相关位置的语音数据所需的时间(在此时间信息的单位例如是秒)。
[0036]例如,对于与图2中所示的假名的“arigatou”相对应的语音位置信息,开始点是“0.5s (500ms) ”,结束点是“1.0s(100ms) ”。其意味着当再现语音数据时,从自语音数据的再现开始时间经过0.5秒后的时间点开始到自再现开始时间经过1.0秒后的时间点结束的时间期间表示在其中再现语音声音“arigatou”的时间期间。
[0037]在图3中示出了作为执行对语音数据执行语音识别的结果而获取的示例性网格结构。参考图3,在圆圈中示出了意图分隔语素的节点,圆圈内部书写的数字表示用于标识各自节点的标识符。参考图3,将语素示出为连接节点的直线。在图3所示的示例中,从节点S开始到节点E的每一条路线的至少一些部分可以视为识别候选。例如,通过从节点S到节点E连接语素而获取的汉字和假名的“maido arigatou gozaimasu.”可以视为识别候选;或者从节点S开始到节点5的汉字和假名的短语“maido arigatou”可以视为识别候选;或者从节点S开始到节点3的汉字的词语“maido”可以视为识别候选。
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1