一种基于多词连续输入的字词识别方法、装置和系统的制作方法

文档序号:6373446阅读:222来源:国知局
专利名称:一种基于多词连续输入的字词识别方法、装置和系统的制作方法
技术领域
本发明涉及连续输入技术领域,更具体的说是涉及一种基于多词连续输入的字词识别方法、装置和系统。
背景技术
触摸屏作为一种简单、方便、快捷的人机交互方式,已经被应用于各个领域当中。基于触摸屏的连续滑动进行字词输入的技术也日益广泛。如美国专利7250938以及美国专利申请10/752,405,用户在触摸屏上的虚拟按键上连续划过多个字母,则电子设备可以根据用户的连续滑动操作可以检测到得到触点的连续输入轨迹,根据检测到连续输入轨迹划经的字符结合词库查询即可以识别出词语来。现有技术中,将用户输入的手势当做一个词库中存在的词语来进行识别,即识别结果字符串是在词库中存在的词语。当用户需要输入有多个字词或词语组成的短语时,如果该短语在词库中并不存在,此时,如果用户直接在虚拟按键上通过连续滑动输入该短语对应的各个字符串,电子设备则无法识别出用户所需输入的词语而导致没有识别结果或者识别出的词语与用户需要输入的词语不符。例如,以汉字输入为例,用户需要输入“就很好”,对应的拼音编码为“jiuhenhao”,而词库中仅存在“就(编码为jiu)”、“很好(编码为henhao)”等词语及其字符串编码,却不存在“就很好”这个词条以及这个词条的编码字符串“jiuhenhao”。而在实际运用中当用户在虚拟按键上连续划经“jiuhenhao”的拼音字符时,也会经过其他的无关的字母,从而得到一连串的字符序列,如用户的连续输入轨迹所划经的字符序列可能会包括“ j iuhgf erghnbhgf dsasdf gio ”,由于词库中不存在“ j iuhenhao (就很好)”这个编码字符串的词条,因此在对得到的一连串字符序列进行识别的过程中,就会将用户输入的字符作为无关字符处理,无法得到“就很好”这个词语,识别出的词语与用户实际需要输入的词语有较大的偏差,甚至没有匹配的识别结果。为了避免出现以上问题,在现有技术中,如果需要输入的多个连续的字词或词语组成的词条或短语在词库中并不存在时,用户只能在每次输入完一个词库中存在的字词之后,抬起手指或者是点触工具以中断连续输入,并移动手指或点触工具到一个新的位置后重新在虚拟按键上进行后续字词对应的字符的连续滑动输入操作。例如,仍以输入用户输入“就很好”为例,用户在虚拟按键上连续滑动以划经“jiu”(当然在滑动过程中可能需要经过其他无关的字符)之后,抬起手指,并移动手指到虚拟按键上“h”对应的按键位置,进而继续连续滑动划经“henhao”(在滑动过程中可能需要经过其他无关的字符),也就是说至少需要通过两次连续滑动输入才可以完成“就很好”的输入。这样的后果是,当用户不确定词库是否包含某个词组时,用户只能尽可能将该词组分拆出成多个词语来进行多次输入。可见,现有技术中基于连输入的词语识别方法,在进行输入的过程中,当需要连续输入多个字词组成的短语或句子且该短语或句子在词库中并无对应的单一词条时,则需要用户在头脑中进行分词判断,根据自己的分词判断逐个词语输入,反复不断的开始触摸,滑动,中断输入,并重新定位,再次触摸,滑动进行多次输入才可以完成该由多个字词组成的词语的输入,操作过程比较复杂,也严重影响输入速度。在预输入的一句话在词库中并无对应的单一词条时,如英文的“this is a very big crocodile”,中文的“这是一只很大的鳄鱼”通常在词库中都不会有对应的单一词条存储,现有技术无法通过一个连续单一手势进行输入,而只能按单词或字符分多次输入。

发明内容
有鉴于此,本发明提供一种基于多词连续输入的字词识别方法、装置和系统,该方法可以对用户输入的连续输入轨迹进行分词识别,得到该连续输入轨迹对应的词语组合,从而使得用户通过一个单一连续手势,便可以直接完成多个词语或一整句话的输入,而这种输入无需词库中存在与预输入内容对应的单一词条,显著提高了输入速率。为实现上述目的,本发明提供如下技术方案1、一种基于多词连续输入的字词识别方法,包括检测键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据,其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上的位置相关;从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。优选的,所述连续输入轨迹的轨迹特征数据包括所述连续输入轨迹的轨迹起点、划经的路径以及轨迹终点;所述从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,具体为依据所述键盘布局,从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。优选的,获取所述连续输入轨迹的轨迹特征数据,包括依据键盘布局,确定所述连续输入轨迹的轨迹特征数据,其中,所述轨迹特征数据包括所述连续输入轨迹的轨迹起点、划经的路径、划经的字符以及轨迹终点。优选的,所述从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,包括根据所述连续输入轨迹的轨迹特征数据,从词库中匹配出候选项时,确定轨迹特征数据与所述匹配出的候选项匹配的轨迹段,判断所述连续输入轨迹中,位于该轨迹段之后的连续输入轨迹是否已经识别完毕;如果该轨迹段之后的连续输入轨迹尚未识别完毕,则根据未识别的轨迹段的轨迹特征数据,执行从词库中匹配候选项的操作,直至连续输入轨迹识别结束,得到与连续输入轨迹中各个轨迹段的轨迹特征数据相匹配的候选项。优选的,从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项具体包括A、将所述连续输入轨迹的轨迹起点作为当前识别起点,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为当前轨迹段;B、根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项并执行步骤C ;C、判断所述当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行步骤D ;D、将所述连续输入轨迹中位于所述当前候选项匹配的轨迹段之后的轨迹段作为当前轨迹段,并将该当前轨迹段的起点作为新的当前识别起点,返回执行步骤B,以得到所述当前候选项的下一级候选项。优选的,所述轨迹特征数 据中还包括连续输入轨迹所划经的至少一个分词标识;所述步骤A之后还包括E1、判断所述当前识别起点之后的连续输入轨迹中是否包含分词标识,如果是,则进入步骤E2 ;如果否,则进入B2 ;E2、确定所述连续输入轨迹中位于所述当前识别起点之后,且距离所述当前识别起点最近的分词标识,并执行BI ;所述步骤B中包括BI、根据所述当前识别起点至所述分词标识之间的连续输入轨迹的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项,并进入步骤E3 ;B2、根据所述连续输入轨迹中位于当前识别起点之后的轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项作为当前候选项,并进入步骤C ;所述步骤BI之后还包括E3、判断所述当前识别起点到所述最近的分词标识之间的连续输入轨迹是否识别结束,如果是,则在所述最近的分词标识之后的连续输入轨迹中设置新的当前识别起点,并返回执行步骤El ;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并将所述连续输入轨迹中位于当前候选项所匹配的轨迹段的终点至所述最近分词标识之间的连续输入轨迹作为当前轨迹段,并将当前轨迹段的起点作为新的当前识别起点,返回执行步骤BI,以得到所述当前候选项的下一级候选项;所述步骤C中判断所述当前轨迹段是否识别结束,具体为判断连续输入轨迹中位于所述当前识别起点之后的轨迹段是否识别结束;所述步骤D中所述将当前轨迹段的起点作为新的当前识别起点,返回执行步骤B,具体包括将当前轨迹段的起点作为新的当前识别起点,返回执行步骤B2,以得到所述当前候选项的下一级候选项。优选的,根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,具体包括从词库中检索待定编码字符串候选项;确定待定编码字符串候选项在所述当前轨迹段上所对应的识别终点,将所述当前识别起点与所述识别终点之间的轨迹作为待匹配轨迹段;确定所述待定编码字符串候选项中的各个字符在键盘布局上的键位数据;
当确定出所述待定编码字符串候选项中的各个字符的键位数据与所述待匹配轨迹段的轨迹特征数据的匹配度满足预设条件时,将待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为以当前识别起点开始的轨迹段对应的候选项;所述确定出当前候选项所匹配的轨迹段,具体为将所述待匹配轨迹段作为轨迹特征数据与当前候选项匹配的轨迹段。优选的,从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,包括确定所述连续输入轨迹所划经的字符串序列;依据所述连续输入轨迹所划经的字符串序列,从词库中检索待定编码字符串候选项;依据所述待定编码字符串候选项中所包含的字符与连续输入轨迹所划经的字符
串序列中的对应关系,确定与该待定编码字符串候选项所对应的待匹配的轨迹段,当所述待定编码字符串候选项与该待匹配的轨迹段的轨迹特征数据的匹配程度达到预设值时,将该待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为与该待匹配轨迹段的轨迹特征数据相匹配的候选项,并将该候选项作为当前候选项,确定在连续输入轨迹所划经的字符串序列中,匹配出该当前候选项所对应的编码字符串时所需匹配到的字符;判断连续输入轨迹所划经的字符串序列中是否仍存在位于所述所需匹配到的字符之后的字符串序列,如果否,则得到不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果是,则继续执行根据连续输入轨迹所划经的字符串序列中,位于所述所需匹配到的字符之后的字符串序列,从词库中匹配待定编码字符串候选项的操作,直至识别到连续输入轨迹所划经的最后一个字符为止。优选的,利用如下任一种或几种参数来计算待定编码字符串候选项与所述待匹配轨迹段的轨迹特征数据的匹配度将当前识别起点、待定编码字符串中的各个字符在键盘布局中预设的标志点以及所述待匹配轨迹段的终点顺次连线得到标准键位连线,该标准键位连线的长度与所述待匹配轨迹段的长度的关系;所述待定编码字符串中的各个字符在键盘布局中预设的标志点与所述待匹配轨迹段的距离;所述待匹配轨迹段所划经的字符中不属于所述待定编码字符串候选项中的字符,距离所述待定编码字符串候选项中各个字符在所述键盘布局中顺次连线得到的标准键位连线轨迹的总距离;待定编码字符串候选项中的各个字符在所述键盘布局中的标准键位连线与所述待匹配轨迹段所组成的封闭区域面积。优选的,根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以所述当前识别起点开始的轨迹段对应候选项时,还包括接收调整匹配度阈值的指令;保存当前的匹配度阈值,将匹配度阈值调整为新的匹配度阈值;根据调整后的匹配度阈值,从词库中匹配出与当前轨迹特征数据的匹配度在所述调整后的阈值范围内的至少一个候选项;
将匹配度阈值恢复为之前保存的匹配度阈值。优选的,在执行所述步骤B时,如果以当前识别起点开始的预设长度内的轨迹段中无法匹配出候选项时,则将当前识别起点向后移动,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为新的当前轨迹段,继续执行从词库中匹配与该当前识别起点之后的轨迹段的轨迹特征数据相匹配的候选项的操作。优选的,还包括按照预设的评价规则,确定出候选项的评价分数;根据与各个候选项匹配的轨迹段之间的连接顺序关系,以及候选项的评价分数,展现候选项。优选的,该方法还包括依据用户对展现的候选项选择结果和/或确认操作执行字词输入。优选的,确定所述候选项的评价分数,包括根据预置的评价因数,计算所述候选项的评价分数;其中,所述评价因数包括以下任意一种或几种候选项的词频、候选项的词法规则匹配度、候选项与其相匹配的轨迹段的路径匹配度、该候选项对应的编码字符串中的字符个数、与候选项所匹配的轨迹段长度、与候选项所匹配的轨迹段所划经的字符个数和/或连续输入轨迹段所划经的字符个数。优选的,所述评价因数还包括以下任意一种或几种候选项是否存在与其对应的下一级候选项、该候选项的下一级候选项的评价分数,其中,候选项的下一级候选项为以该候选项所匹配的轨迹段的终点作为识别起点匹配出的候选项。优选的,利用所述路径匹配度计算候选项的评价分数,包括将与候选项所匹配的轨迹段的起点、该候选项对应的编码字符串中各个字符在键盘布局中的标志点、与候选项所匹配的轨迹段的终点依次相连组成标准键位连线;计算所述标准键位连线与该候选项匹配的轨迹段所构成的闭合区域的面积值;根据所述闭合区域的面积值确定路径匹配度。优选的,所述根据与各个候选项匹配的轨迹段之间的连接顺序关系,以及候选项的评价分数,展现候选项,具体为将所匹配的轨迹段具有连接关系的候选项作为待进行组合的待组合候选项,将所述待组合候选项进行组合,得到组合候选项;依据组合候选项的评价分数,确定组合候选项的展现顺序并进行展现;在展现所述组合候选项时,将所述组合候选项中包含的各个候选项进行区分显示,其中,所述区分显示包括采用颜色区分组合候选项中包含的各个候选项;或者,在组合候选项的各个候选项之间设置空格或标识符;依据用户对展现的候选项的选择结果执行字词输入,包括接收用户点击所展现的组合候选项中的候选项的操作,并展现与用户所点击的候选项处于同一级的候选项,以便用户从新展现的候选项中进行选择执行字词输入,并更新该组合候选项中位于用户所点击的候选项之后的候选项;其中,与用户所点击的候选项处于同一级的候选项所匹配的轨迹段的轨迹起点,与用户所点击的候选项所匹配的轨迹段的轨迹起点相同。
优选的,在展现所述候选项之后,还包括当检测到触点在候选项展现区域的滑动操作满足预设指令触发条件时,依据所述触点的滑动轨迹确定待处理的候选项,并在检测到触点抬起的操作时,执行所述预设指令;其中,所述预设指令包括将待处理的候选项组合成一个词组,将该词组添加到所述词库中;将待处理的候选项从候选项展现区域删除;将待处理的候选项从候选项展现区域删除,并接收用户在键盘区域上的连续滑动操作,获取当前时刻输入的连续输入轨迹,并利用与所述当前时刻的连续输入轨迹的轨迹特征数据相匹配的候选项替换所述待处理的候选项。另一方面,本发明还提供了一种基于多词连续输入的字词识别方法,包括电子设备检测键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据,其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上的位置相关;所述电子设备,将至少包含所述轨迹特征数据的信息发送至指定的服务器,其中,所述轨迹特征数据至少包括;所述服务器依据所述信息,从词库中匹配出与所述连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,并将匹配出的候选项返会给所述电子设备;所述电子设备接收所述服务器返回与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。另一方面,本发明还提供了一种基于多词连续输入的字词识别装置,包括词库;轨迹检索单元,用于检测键盘区域上的连续输入轨迹;轨迹数据信息获取单元,用于获取所述连续输入轨迹的轨迹特征数据,其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上位置相关;字词匹配单元,用于从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。优选的,所述轨迹数据信息获取单元具体为依据键盘布局,确定所述连续输入轨迹的轨迹特征数据,其中,所述轨迹特征数据包括所述连续输入轨迹的轨迹起点、划经的路径、划经的字符以及轨迹终点。优选的,其特征在于,字词匹配单元包括候选项检索单元,用于根据所述连续输入轨迹中未识别的轨迹段的轨迹特征数据,从词库中匹配出候选项时,确定轨迹特征数据与所述匹配出的候选项匹配的轨迹段;循环判断单元,用于在候选项检索单元匹配出候选项并确定出与该候选项匹配的轨迹段时,判断所述连续输入轨迹中,位于该轨迹段之后的连续输入轨迹是否已经识别完毕,并当确定出连续输入轨迹中位于该轨迹段之后仍存在未识别轨迹段时,则返回执行候选项检索单元的操作,直至连续输入轨迹中不存在未识别的轨迹段,得到与不同轨迹段的轨迹特征数据相匹配的候选项。优选的,所述候选项检索单元具体包括初始起点设定单元,用于将所述连续输入轨迹的轨迹起点作为当前识别起点,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为当前轨迹段,并执行候选项循环匹配单元的操作;候选项循环匹配单元,用于根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项并执行所述判断单元的操作;所述循环判断单元,包括循环判断子单元,用于判断所述 当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作;所述循环起点设定单元,用于将所述连续输入轨迹中位于所述当前候选项匹配的轨迹段之后的轨迹段作为当前轨迹段,并将该当前轨迹段的起点作为新的当前识别起点,并触发执行候选项循环匹配单元的操作,以得到所述当前候选项的下一级候选项。优选的,所述轨迹数据信息获取单元获取到的轨迹特征数据还包括所述连续输入轨迹所划经的至少一个分词标识;所述候选项检索单元还包括分词标识判断单元,用于在所述初始起点设定单元设定了所述当前识别起点之后,判断所述当前识别起点之后的连续输入轨迹中是否包含分词标识,如果是,则执行最近分词标识确定单元的操作;如果否,则执行第二候选项循环匹配单元的操作;所述最近分词标识确定单元,用于确定所述连续输入轨迹中位于所述当前识别起点之后,且距离所述当前识别起点最近的分词标识,并执行第一候选项循环匹配单元的操作;所述循环匹配单元包括第一循环匹配单元,用于根据所述当前识别起点至所述分词标识之间的连续输入轨迹的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项,并执行分词循环确定单元的操作;第二循环匹配单元,具体为用于根据所述连续输入轨迹中位于当前识别起点之后的轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项作为当前候选项,并执行循环判断子单元的操作;所述装置还包括分词循环确定单元,用于判断所述当前识别起点到所述最近的分词标识之间的连续输入轨迹是否识别结束,如果是,则在所述最近的分词标识之后的连续输入轨迹中设置新的当前识别起点,并返回执行所述分词标识判断单元的操作;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并将所述连续输入轨迹中位于当前候选项所匹配的轨迹段的终点至所述最近分词标识之间的连续输入轨迹作为当前轨迹段,并将当前轨迹段的起点作为新的当前识别起点,返回执行所述第一循环匹配单元,以得到所述当前候选项的下一级候选项;所述循环判断子单元,用于判断连续输入轨迹中位于所述当前识别起点之后的轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作;所述循环起点设定单元,具体为用于将当前轨迹段的起点作为新的当前识别起点,返回执行所述第二候选项循环匹配单元的操作,以得到所述当前候选项的下一级候选项。优选的,所述候选项循环匹配单元,具体包括第一检索单元,用于从词库中检索待定编码字符串候选项;待匹配轨迹段确定单元,用于确定待 定编码字符串候选项在所述当前轨迹段上所对应的识别终点,将所述当前识别起点与所述识别段终点之间的轨迹作为待匹配轨迹段;键位数据确定单元,用于确定所述待定编码字符串候选项中的各个字符在键盘布局上的键位数据;候选项确定单元,用于当确定出所述待定编码字符串候选项中的各个字符的键位数据与所述待匹配轨迹段的轨迹特征数据的匹配度满足预设条件时,将待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为以当前识别起点开始的轨迹段对应的候选项;所述循环判断子单元,具体为用于判断所述当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则将所述待匹配轨迹段作为轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作。优选的,字词匹配单元,包括划经字符串确定单元,用于确定所述连续输入轨迹所划经的字符串序列;第二检索单元,用于依据所述连续输入轨迹所划经的字符串序列,从词库中检索编码字符串候选项;候选项匹配单元,用于依据所述编码字符串候选项中所包含的字符与连续输入轨迹所划经的字符串序列中的对应关系,确定与该编码字符串候选项所对应的待匹配的轨迹段,当编码字符串候选项与该待匹配的轨迹段的轨迹特征数据的匹配程度达到预设值时,将该编码字符串候选项和/或该编码字符串候选项转换出的词条候选项作为与该待匹配轨迹段的轨迹特征数据相匹配的候选项,并将该候选项作为当前候选项;字符串识别判断单元,用于判断连续输入轨迹所划经的字符串序列中是否仍存在位于该当前候选项对应的编码字符串的尾字母之后的字符串序列,如果否,则得到不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果是,则继续执行根据连续输入轨迹所划经的字符串序列中,位于当前候选项对应的编码字符串的尾字母之后的字符串序列,从词库中匹配编码字符串候选项的操作,并执行候选项匹配单元的操作,直至识别到连续输入轨迹所划经的最后一个字符为止。优选的,还包括评分确定单元,用于按照预设的评价规则,确定出候选项的评价分数;展现单元,用于根据与各个候选项匹配的轨迹段之间的连接顺序关系,以及候选项的评价分数,展现候选项;字词输入单元,用于依据用户对展现的候选项选择结果和/或确认操作执行字词输入。优选的,所述评分确定单元,具体为用于根据预置的评价因数,计算所述候选项的评价评分;其中,所述评价因数包括以下任意一种或几种候选项的词频、候选项的词法规则匹配度、候选项与其相匹配的轨迹段的路径匹配度、该候选项对应的编码字符串中的字符个数、与候选项所匹配的轨迹段长度、与候选项所匹配的轨迹段所划经的字符个数和/或连续输入轨迹段所划经的字符个数。优选的,所述评分确定单元,根据预置的评价因数,计算候选项的评价分数时,其中所述评价因数还包括以下任意一种或几种候选项是否存在与其对应的下一级候选项、该候选项的下一级候选项的评价分数,其中,候选项的下一级候选项为以该候选项所匹配的轨迹段的终点作为识别起点匹配出的候选项。另一方面本发明还提供了一种基于 多词连续输入的字词识别系统,包括电子设备和服务器;所述电子设备,用于检测键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据,将至少包含所述轨迹特征数据的信息发送至指定的服务器,并接收所述服务器返回与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项;其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上的位置相关;所述服务器接收所述电子设备发送的至少包含所述轨迹特征数据的信息的数据;依据所述信息,从词库中匹配出与所述连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,并将匹配出的候选项返会给所述电子设备。经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于多词连续输入的字词识别方法、装置和系统,该方法当检测到键盘区域上的连续输入轨迹,并获取到连续输入轨迹的轨迹特征数据后,从预置的词库中匹配与连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的编码字符串候选项。在本发明中即使用户需要输入的字词组合并不是作为一个词条在词库中存储时,由于本发明中能分别从词库中匹配与一条连续输入轨迹的不同轨迹段的轨迹特征数据匹配的至少一个候选项,因此用户也可以通过一次操作来进行多个词组对应的编码字符串的连续输入,该电子设备对该一条连续输入轨迹数据进行处理,即可得到与不同轨迹段的轨迹特征数据匹配的至少一个候选项,进而通过一次连续滑动操作可以实现对多词的同时输入操作,提高了输入效率,也减少电子设备的数据处理量。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图I示出了本发明一种基于多词连续输入的字词识别方法的一个实施例的流程示意图;图2示出了本发明一个实例中进行词语输入时在键盘区域上检测到的连续输入轨迹的示意图;图3示出了一种基于多词连续输入的字词识别方法的另一个实施例的流程示意图;图4示出了本发明根据轨迹段的轨迹特征数据,从词库中匹配候选项的一种实现方式的流程示意图;图5示出了本发明一种基于多词连续输入的字词识别方法的另一个实施例的流程不意图;图6a示出了本发明中待定编码字符串候选项“wo”中各个字符在键盘布局中键位连线轨迹示意图;图6b示出了本发明中待定编码字符串候选项“en”中各个字符在键盘布局中键位连线轨迹示意图;图7a示出了本发明中输入字符串“jiuhenhao”时在键盘布局上对应的一种连续输入轨迹示意图;图7b示出了对图7a中的连续输入轨迹进行识别得到的各个字词候选项所构成的树形结构示意图;图8示出了本发明一种基于多词连续输入的字词识别方法的另一个实施例的流程不意图;图9示出了本发明一种包含有分词标识的位置信息的连续输入轨迹的示意图;图10示出了本发明中包含错误轨迹输入的连续输入轨迹的示意图;图11示出了本发明中在展现候选项的过程中根据用户的选择结果调整候选项的示意图;图12a和图12b示出了本发明中触发对展现的候选项生成预设指令的操作手势示意图;图13示出了一种基于多词连续输入的字词识别装置的一个实施例的结构示意图;图14示出了一种基于多词连续输入的字词识别装置的另一个实施例的结构示意图;图15示出了本发明的基于多词连续输入的字词识别装置的字词匹配单元的一种结构示意图;图16不出了本发明一种基于多词连续输入的字词识别系统的一个实施例的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例公开了一种基于多词连续输入的字词识别方法,该方法在检测到键盘区域上的连续输入轨迹时,从词库中匹配出连续输入轨迹的不同轨迹段相匹配的至少一个候选项,从而得到多个字词组成的短语或词条的候选项,进而为一次输入多个字词组成的词条或短语的提供了实现基础,从而无需用户在输入过程中进行分词判断,进而也简化了用户的操作过程,提高了输入速度。下面结合附图对本发明的基于多词连续输入的字词识别方法进行详细描述,参见图1,示出了本发明一种基于多词连续输入的字词识别方法一个实施例的流程示意图,本实施例的方法可以应用于任意具有输入法处理功能的电子设备中,本实施例的方法包括步骤101 :检测键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据,其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上位置相关。键盘区域为可检测到连续滑动操作布局的区域,键盘区域上只有包括有键盘布局,键盘区域不仅包括设置有按键的区域,也可以包括未设置有按键的区域。具体的,该键盘区域可以为触摸屏上显示的虚拟键盘,或者电子设备通过投影产生的虚拟键盘、也可以为实体感应键盘(包括接触式或非接触式感应)。在该键盘区域上显示有字母按键,还可以有其他的字符按键等。用户可以通过手指或者其他触摸笔等操作体在键盘区域上进行滑动,在用户滑动过程中触点会依次划经键盘区域上的多个按键,这样随着手指或者触摸笔等触点的滑动操作将形成一条连续滑动轨迹,当然,在键盘区域上可能并不需要显示出触点的滑动轨迹。当然,检测键盘区域上的连续输入轨迹并不一定是触点与键盘区域一定要有物理接触,也可能是通过电子设备的摄像头、电感应、热感应、光感应、指点设备等交互识别技术获取到用户在键盘区域上的连续滑动轨迹。该连续滑动轨迹包含了触点所依次划经的键盘区域上的各个字符序列以及触点的划经路径等内容。在触点在键盘区域上进行连续滑动时,获取键盘区域上触点的变化,得到一系列点的位置变化序列数据从而得到连续输入轨迹,获取到该连续输入轨迹的轨迹特征数据,由于该连续输入轨迹体现了不同时刻触点的变化位置信息等,因此该轨迹特征数据中应至少包括连续输入轨迹上各点的坐标位置,也即包括该连续输入轨迹的轨迹起点、划经的路径以及轨迹终点等信息。需要说明的是,该连续输入轨迹是与用户待输入的编码字符串在键盘布局上的相应按键序列位置相关的。换言之,当用户需要输入字词或字词组合所对应的编码字符串确定时,键盘区域的键盘布局不同,需要输入的连续输入轨迹也会有所差异。为了清楚理解以传统的“QWERTY”布局的键盘为例,并将用户输入的连续输入轨迹在该键盘布局上进行显示,参见图2,当用户需要输入词语“我们”对应的编码字符串“women”,需要在键盘区域上依次划经该编码字符串中的各个字符,在划经该编码字符串中的各个字符的过程中也会划经其他与该编码字符串中的字符无关的其他字符。该连续输入轨迹依次划经的字符包括“wertyuiokmjhgfedfbn”,连续输入轨迹中各点组成的路径如图2所示。但是对于其他形式的键盘布局,当需要输入“我们”的拼音字符串时,各点所划经的路径就可能不同,且依次划经的字符序列也有可能会发生改变。步骤102 :从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。当获取到连续输入轨迹以及轨迹特征数据时,执行从预置的词库中匹配与该连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的候选项。当然,在词库中与某一轨迹段的轨迹特征数据相匹配的候选项可能不止一个。通常,识别结果为与连续输入轨迹的不同段落匹配的先后顺序相连的多个候选项,而不需要这多个候选项顺序相连的整体词条在词库中存在。需要说明的是,本申请基于多词连续输入的字符串识别方法不仅可以应用于由字母组成的字词的输入中,如英文字词的输入,也可以应用于基于编码的字词输入。当本发明的方法应用在基于编码的字词输入,或者能够将编码字符串转换为字词的输入中,在识别出与连续输入轨迹的不同轨迹段相匹配的编码字符串候选项之后,还包括获取编码字符串候选项相对应的词条候选项。以拼音输入汉字为例,当识别出编码字符串候选项时,即得到了汉字对应的拼音编码,则根据拼音编码,可以得到相应的汉字或字词等词条。当然,由于一个编码字符串候选项可能会转换出多个可能的词条候选项,因此在将编码字符串转换成词条候选项时,可以 根据词条候选项的词频、词法匹配规则以及不同轨迹段对应的词条候选项之间的关联关系等词条候选项进行评分,依据所述评分来确定满足要求的词条候选项及其显示顺序。因此,根据本发明的方法所应用的场景不同匹配出的候选项的种类也不同,也可以说匹配出的候选项与预置的词库有关。当本发明的方法应用于英文或者其他以字母组成的字词输入装置中,匹配出的候选项是由一个或多个字符(字母)组成的编码字符串候选项。当本发明应用于中文输入时,一般需要匹配出编码字符串候选项即拼音编码,之后可以将匹配出的拼音编码转换后得到的由汉字组成的词条候选项,则得到与不同轨迹段的轨迹特征数据相匹配的候选项可以包括字符串编码候选项和/或由字符串编码转换出的词条候选项。通常组成候选项的字符或者候选项所对应的字符串序列在键盘布局中的顺序连线和所述轨迹段的线形相似性较高(如总体距离近,特征位置相似等),轨迹段划经的字符序列中组成编码字符串候选项的字符的排列顺序也与字符串候选项的字符的先后顺序一致性较高。与现有技术不同,本发明中并没有将一条连续输入轨迹仅作为与一个单词相匹配的轨迹段进行整体匹配,而是在对该整条连续输入轨迹进行字符串匹配的过程中,将所述连续输入轨迹进行分段识别,进而确定出与整个输入轨迹最匹配的分段识别结果的组合。对该连续输入轨迹进行分段识别时,该连续输入轨迹中的不同轨迹段可以理解为该连续输入轨迹的一部分轨迹段,即该连续输入轨迹的子轨迹段,也可以是该连续输入轨迹的完整的轨迹段。分段识别并不意味着需要将轨迹人为的分割成多个段落,而是指将整个轨迹识别成多个具有前后连接关系的识别结果(即候选项),而这多个具有前后连接关系的识别结果分别与轨迹的不同段落相对应。识别过程也不需要整个轨迹输入结束才开始,在用户连续输入过程中即可对已输入的轨迹进行识别,在后续继续滑动输入后,继续进行识别,继续识别虽可以完全重新识别,但基于之前的识别结果和新输入的轨迹数据进行识别可以提高识别效率。输入过程同步识别可以充分利用设备的计算能力,在用户输入动作终止后很快就可以给出识别结果。在词库中匹配某一轨迹段的轨迹特征数据对应的候选项过程,除了考虑组成候选项的字符顺序和轨迹划经的字符序列的顺序匹配,还可以综合考虑候选项的词频、词长以及组成候选项对应的编码字符串的字符在键盘布局中的键位与所述连续输入轨迹的路径匹配度等因素,来匹配某轨迹段的轨迹特征数据对应的候选项。在本实施例中检测到键盘区域上的连续输入轨迹,并获取到连续输入轨迹的轨迹特征数据后,从预置的词库中匹配与连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的候选项,虽然每条轨迹段的轨迹特征数据对应的候选项是词库中存储的,但是当与多个轨迹段的轨迹特征数据候选项组合之后得到的多个字词或词组所对应的词语或短句则可能不是词库预先存储的,因此,即使用户待输入的字词组合并不是作为一个词条在词库中存储时,由于本发明中能分别从词库中匹配不同轨迹段对应的候选项,用户也可以通过输入一条连续输入轨迹来进行多词组对应的编码字符串的轨迹输入,进而该电子设备对该连续输入轨迹数据进行处理,即可得到不同轨迹段对应的编码字符串候选项以及词条候选项,进而后续根据用户的选择进行输入,实现一次连续滑动操作可以同时输入多词的操作,提高了输入效率,也减少电子设备的数据处理量。在实际应用中,当检测到键盘区域上的连续输入轨迹数据时,可以获取到连续输入轨迹中各点的坐标位置,进而得到连续输入轨迹的部分特征数据,即当检测到键盘区域上输入的连续输入轨迹时,可以获取到至少包括该连续输入轨迹的轨迹起点、划经的路径、轨迹终点。其中划经的路径也体现出各点的坐标位置变化,划经的路径,该路径中可以具体包含各点的位置信息、该连续输入轨迹中的拐点,也可以包括轨迹进出相关按键区域的角
度等信息。另外,由于连续输入轨迹体现的是键盘区域上划经各按键的轨迹,因此,连续输入轨迹的轨迹特征数据中还可以包括该连续输入轨迹所划经的字符,因此,获取键盘区域上的连续输入轨迹具体可以为依据键盘布局,确定连续输入轨迹的轨迹特征数据,其中,该轨迹特征数据包括连续输入轨迹的轨迹起点、划经的路径、划经的字符以及轨迹终点。需要说明的是,依据键盘布局确定连续输入轨迹的轨迹特征数据可以是在获取到连续输入轨迹时,依据键盘布局来确定包含该连续输入轨迹所划经的字符序列的轨迹特征数据;也可以是在获取到连续输入轨迹时,仅获取该连续输入轨迹中未包含划经的字符序列的轨迹特征数据,之后再根据需要依据键盘布局来获取编码字符串来确定该连续输入轨迹所划经的字符序列。对应获取连续输入轨迹的轨迹特征数据的不同方式,从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项的方式也可能有多种。当依据键盘布局确定连续输入轨迹的轨迹特征数据时,在该轨迹特征数据中包含该连续输入轨迹所划经的字符串序列,则匹配不同轨迹段的轨迹特征数据对应的至少一个候选项的过程具体为根据所述连续输入轨迹的轨迹特征数据,从词库中匹配出候选项时,确定轨迹特征数据与所述匹配出的候选项匹配的轨迹段,判断所述连续输入轨迹中,位于该轨迹段之后的连续输入轨迹是否已经识别完毕;如果该轨迹段之后的连续输入轨迹尚未识别完毕,则根据未识别的轨迹段的轨迹特征数据,执行从词库中匹配候选项的操作,直至连续输入轨迹识别结束,得到与连续输入轨迹中各个轨迹段的轨迹特征数据相匹配的候选项。在本发明中根据连续输入轨迹是在设置有多个字符按键的键盘上获取到的,因此在根据连续输入轨迹的轨迹特征数据从词库中匹配候选项时,首先获取到的是编码字符串候选项,在得到编码字符串候选项时,即可根据编码字符串候选项中包含的各个字符与轨迹段所划经的各个字符的对应关系,确定出匹配出该编码字符串候选项时,需要识别到该连续输入轨迹上与该编码字符串候选项对应的终点位置点,进而将与该编码字符串候选项所对应的识别起点与该位置点之间的轨迹段作为轨迹特征数据与该编码字符串候选项相匹配的轨迹段。如果需要将该编码字符串候选项转换为词条候选候选项时,该词条候选项所匹配的轨迹段与该编码字符串候选项所匹配的轨迹段相同。判断连续输入轨迹中,位于识别出的候选项所匹配的轨迹段之后的轨迹段是否已经识别完毕,既可以是判断是否匹配到连续输入轨迹的终点,也可以是判断所述连续输入轨迹划经的字符是否已经匹配完毕。如果仍存在未识别的轨迹段,则根据未识别的轨迹段的轨迹特征数据,执行从词库中匹配编码字符串候选项的操作,直至连续输入轨迹识别结束,得到与连续输入轨迹中各个轨迹段对应的编码字符串候选项。如图7a所示的输入路径,首先识别出和自起点开始的路径段落对应的“就”
(“jiu”),然后继续识别出跟后续路径段落对应的“很好”(“henhao”)。当然,识别与各个轨迹段的轨迹特征数据相匹配的候选项时,可以只获取路径匹配度满足一定阈值的候选项,将符合条件的候选项作为与该轨迹段的轨迹特征数据相匹配的候选项。参见图3,示出了本发明一种基于多词连续输入的字词识别方法另一个实施例的流程示意图,本实施例为图I所示实施例的一种具体实现方式,本实施例的方法包括步骤301 :检测键盘区域上的连续输入轨迹,该连续输入轨迹与用户待输入的编码字符序列在键盘布局上的位置相关。步骤302 :依据键盘布局,确定该连续输入轨迹的轨迹特征数据,其中,轨迹特征数据包括连续输入轨迹的轨迹起点、划经的路径、划经的字符以及轨迹终点。其中,该步骤可以是检测到连续输入轨迹时,实时获取以上轨迹特征数据,也可以是在连续输入轨迹输入结束时获取各个轨迹特征数据。由于检测到键盘区域上的连续输入轨迹时,该连续数据轨迹中各点的坐标和键盘布局中的按键位置关系是确定的,因此结合键盘布局即可确定出该连续输入轨迹所依次划经的各个字符序列。如输入轨迹进入或靠近按键范围即可视为划经该按键。步骤303 :将该连续输入轨迹的轨迹起点作为当前识别起点,将当前识别起点之后的轨迹段作为当前轨迹段。从轨迹起点对连续输入轨迹进行字词匹配。在该步骤中首先将整条连续输入轨迹段作为当前轨迹段,并从当前轨迹段的识别起点开始,从词库中匹配候选项。在后续步骤中,则分重新确定新的当前轨迹段,以及当前轨迹段的识别起点等。步骤304:根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将识别出的候选项作为当前候选项。在确定出当前识别起点时,将连续输入轨迹中位于该当前识别起点之后的轨迹段作为当前待识别轨迹段,区别出连续输入轨迹中该当前识别起点之前的轨迹段和该当前识别起点之后的轨迹段。将当前识别起点之后的轨迹段作为当前待识别轨迹段,对当前待识别轨迹段进行识别,当以该识别起点开始向后的轨迹段中匹配出编码字符串候选项时,与该候选项项匹配的轨迹段也相应确定,即轨迹特征数据与该候选项相匹配的轨迹段也相应确定。在此之后,本发明中还需要进行步骤305的判断动作。在轨迹的识别过程中,从当前识别起点开始的识别结果通常有多个,每个候选项在当前轨迹段中所对应的识别终点也可能不同,即以同一识别起点开始可以识别出多个候选项,每个候选项对应的识别起点相同但是识别终点却可能不同,从而使得以同一识别起点识别出的多个候选项所匹配的轨迹段也不尽相同。步骤305 :判断当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项,结束;如果否,则确定出轨迹特征数据与当前候选项所匹配的轨迹段,并执行步骤306。实际上当以某识别起点匹配出候 选项时,该候选项所匹配的轨迹段也便相应确定下来。判断该当前轨迹段是否识别结束的方式有多种如判断轨迹划经的所有字符是否都已经匹配完成,即已经匹配到连续输入轨迹所划经的最后一个字母处,或者判断是否已经识别到该连续输入轨迹的终点。判断当前编码字符串候选项的最后一个字母是否对应连续输入轨迹的轨迹终点,当该当前编码字符串候选项的最后一个字母对应连续输入轨迹的轨迹终点时,则当前轨迹段识别结束。本发明的实施例虽以轨迹段作为循环识别主体来进行描述,事实上,依据连续输入轨迹所划经的字符串序列作为循环主体来进行识别,其步骤是类似的,即将划经的字符串序列分段识别为不同的词语,当然,识别过程也会用到路径特征数据对其候选项的匹配度进行计算而不仅限于字符串的组合,该种方式将在后面进行介绍。总之,所有将一个跟识别结果的编码字符序列在键盘布局中位置相关的连续手势识别为多个先后顺序相连的候选项的方法都是本发明核心思想的应用。进一步的,还可以判断当前编码字符串候选项的最后一个字母是否为该连续输入轨迹最后划经的字母,当该当前编码字符串候选项的最后一个字母为连续输入轨迹的轨迹终点时,则该当前轨迹段识别结束。例如,识别出的当前编码字符串为“henhao”,则其最后一个字母为“O”,如果连续输入轨迹划经该编码字符串中的“O”之后结束,则可以认为当前轨迹段识别结束;另外,由于连续输入轨迹的终点可能会落在非字母按键区,因此,如果该当前编码字符串的最后一个字母“O”在连续输入轨迹中的位置为连续输入轨迹最后划经的一个字母所对应的位置,则认为当前轨迹段识别结束。当然,判断当前轨迹段是否识别结束还隐含了判断是否仍能从当前轨迹段中匹配出其他的编码字符串候选项,如果仍能匹配出编码字符串候选项,则对于其他匹配出的编码字符串候选项而言,也要重新执行步骤306的操作。306:将所述连续输入轨迹中,位于当前编码候选项所匹配的轨迹段之后的轨迹段作为当前轨迹段,并将当前轨迹段的起点作为新的当前识别起点,返回执行步骤304,以得到所述当前候选项的下一级候选项。得到当前候选项时,确定与轨迹特征数据与该当前候选项相匹配的轨迹段也可以认为是识别该编码字符串时设定的识别起点以及下一新设定的识别起点之间的轨迹段。其中,确定当前轨迹段的识别起点可以根据需要设定,一般的可以将该当前轨迹段的起点作为该当前轨迹段的识别起点;或者,将当前轨迹段所划经的第一个字符作为该当前轨迹段的识别起点。当然,也可以设定以距离当前轨迹段起点的指定距离的点作为该当前轨迹段的识别起点。需要说明的是,在根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个候选项的过程中,可以将任意满足匹配条件的候选项均匹配出来,也可以是仅选择匹配度达到预设值的候选项。从性能和实用性角度考虑,通常只需要匹配出匹配度达到预设值的候选项。另外,在对当前轨迹段进行识别时,提高识别出的编码字符串候选项的准确度,以使得识别出的编码字符串与连续输入轨迹的轨迹特征数据的匹配度更高,更能准确反映用户的实际输入意图,本发明在现有对连续输入轨迹进行识别的基础上还提出了几种更可靠的识别方法。参见图4,示出了本发明根据轨迹段的轨迹特征数据,从词库中匹配候选项的一种实现方法,以对图3中的步骤304进行具体的描述,包括步骤401 :从词库中检索待定编码字符串候选项,确定待定编码字符串候选项在所述当前轨迹段上对应的识别终点位置,将该当前识别起点与识别终点之间的轨迹作为待匹配轨迹段。从词库中检索待定编码字符串候选项时,一种优选的方式根据所述连续输入轨迹划经的字符串序列结合词库进行检索,当然也可直接调取词库中存储的编码字符串候选项,然后依次执行后续步骤402和步骤403,以确定该调取出的编码字符串候选项是否为与该当前轨迹段的轨迹特征数据相匹配的编码字符串候选项。为了减少数据处理量,在从词库中检索待定编码字符串候选项时,还可以考虑待定编码字符串与当前轨迹段划经的字母序列以及各个字母的先后顺序的匹配度,具体的,可以依据当前轨迹段所划经的字符串序列进行组合,从词库中检索待定编码字符串候选项。路径的匹配识别顺序,可以依据轨迹划经的字符序列逐个字符向前匹配,此时每个字符对应轨迹上特定的位置,将其设为当前识别终点,也可以在当前识别轨迹段上逐次向后移动当前识别终点,所述当前识别起点与当前识别终点之间的轨迹设为当前匹配轨迹段。根据检索待定编码字符串的方式以及一些容错处理的情况,确定待定编码字符串候选项在当前轨迹段上对应的识别终点位置的方式可能会有多种。一般是在通过轨迹划经的字符串序列结合词库确定待定编码字符串候选项的过程中,依据确定出该待定编码字符串候选项中各个字符所需的轨迹段所在的终点位置作为识别终点位置。本领域技术人员可以理解连续输入轨迹所划经的字符和轨迹段的位置本身就有对应关系,因此,根据连续输入轨迹段所划经的字符串序列以及该待定编码字符串候选项中各个字符的对应关系,来确定从当前识别起点开始到匹配出该待定编码字符串最后一个字母所需利用到的轨迹段,进而得到识别终点。如,当该待定编码字符串候选项中的各个字符序列属于连续输入轨迹中依次划经的字符序列,且待定编码字符串中各个字符的顺序与该连续输入轨迹划经这各个字符的顺序相同时,则该待定编码字符串候选项中最后一个字母即尾字母在连续输入轨迹中的位置即为识别终点。如参见图2和图6a,对图2的连续输入轨迹进行识别的过程中,当匹配出编码字符串候选项、0”则至少需要从轨迹起点识别到该连续输入轨迹划经到“O”按键的轨迹段处,因此轨迹段划经到“O”键位的位置即可视为“W0”的识别终点。如果在进行连续输入轨迹的匹配过程中兼容容错处理时,检索出的编码字符串候选项所包含的各个字符的序列可能不会与连续输入轨迹中所划经的字符的划经顺序完全统一,或者是检索出的编码字符串候选项中包含连续输入轨迹未划经的字母,在该种情况下则确定从当前识别起点开始到匹配出该编码字符串候选项中各个字符所必须达到的点作为识别终点。如果并未依据连续输入轨迹所划经的字符串序列来检索编码字符串,而是直接从词库中调取编码字符串候选项时,则根据该编码字符串候选项中与连续输入轨迹所划经的字符序列中的公共字符来确定识别终点。 例如,用户输入的路径为jiuhge,词库里给出的待定编码为liuy,从第一个输入路径划经的字符开始,检索其在待定编码中的第一个共同键位,为i,然后继续,直到找到最后一个共同键位为U,用最后一个共同键位u的位置来确定当前轨迹段中与该待定编码字符串对应识别终点。步骤402 :确定所述待定编码字符串候选项中的各个字符在键盘布局上的键位数据。根据该待定编码字符串中所包含的各个字符,并结合键盘布局,可以确定出各个字符在键盘布局上的键位数据。其中,该键位数据可以包括该字符的按键在键盘区域上的坐标范围,按键总覆盖范围,以及该字母在键盘布局中预设的标志点的坐标,还可以包括在键盘布局上预设的该待定编码字符串中各个字符的标志点之间的连线轨迹。在按键上只包含一个字母时,通常标志点可以采用键位中心坐标,而当一个按键上包含多个字母时,如采用传统的类似9宫格的精简键盘时,多个字母可以共用一个标志点,其标志点坐标相同,也可以为字母分配不同的标志点坐标,对于触摸键盘,可不像实体键盘那样设置按键边框,即键盘布局中只有字母和符号而字符之间没有明确的分界线,对于没有按键边框的触摸键盘,字符标志点通常可以根据需要设置,如设在字符的中心附近。所述坐标范围通常用于显示按键边界和用户输入时的交互判断,该坐标范围可以包括显示边界坐标范围与逻辑坐标范围,前者用于确定按键的显示外观边界,后者用于相关运算处理,如判断按键是否被按下或轨迹是否划经按键,通常,按键的逻辑坐标范围设置为按键边界一致或相近,或者说显示边界坐标范围就是逻辑坐标范围,标志点通常可以用于键位位置相关的计算处理,如通过判断用户触点与标志点的距离来确定用户期望输入的是哪一个字母,模拟键位连线轨迹,用于计算键位与其它点或线的距离等。从容错角度考虑,可以将键位的逻辑坐标范围可以和显示的按键边界范围不一致,如现有的键盘按键纠错方法可以将按键的逻辑坐标范围设为显示边界坐标范围进行中心等比放大后的范围或进行其他类似的放大处理,用户无需精确点击到键盘的显示边界内即可被视为点击了相应按键,这样的方式虽然有利于纠错,但是由于每个按字符按键的逻辑坐标范围都放大了,对于同一个交互动作所需处理的候选项将大幅度增加,对设备的运算负担较重,尤其对移动设备而言,这意味着电能的消耗。为解决这一问题,本发明还提出了一种键盘容错方式为不同位置的字母设定不相同的逻辑坐标范围。更进一步的,将位于键盘边缘的字母设定更大的逻辑坐标范围。将特定按键的逻辑坐标范围扩大,则可以在轨迹划经按键附近后即被视为划经该按键,如将位于qwerty键盘边缘的Q、A、Z、P、M等键的逻辑坐标范围设得比普通按键的逻辑坐标范围更大以后,并不影响键盘显示的边界,但用户输入时的输入轨迹无需到达所述按键即可输入相应的字符,有利于减少输入所需移动的轨迹,便于单手操作,同时,也有利于提高容错率。当然,如果系统处理能力允许,可以为更多甚至所有的按键设置更大的逻辑坐标范围,这会增加系统的运算负担。相比传统的通过普遍扩大按键逻辑坐标范围(或者叫逻辑识别区)进行按键纠错的方法相比,本方法有利于容错而不至于大幅度增加识别运算量而降低识别效率。在前面的依据键盘布局确定所述连续输入轨迹划经的字符即可使用这种方法有效的提升容错能力。步骤403 :如果该待定编码字符串候选项中的各个字符的键位数据与待匹配轨迹段的轨迹特征数据的匹配度满足预设条件时,则将待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为以当前识别起点开始的轨迹段对应的候选项。在本实施例中确定出当前候选项所匹配的轨迹段具体为将所述待匹配轨迹段作为轨迹特征数据与当前候选项匹配的轨迹段。在检索出待定编码字符串候选项,并确定出该待定编码字符串中各个字符在键盘局部上的键位数据之后,还需要进一步的确定各个字符的键位数据与待匹配轨迹段的轨迹特征数据的匹配度是否满足预设条件即匹配度达到预设值,以最终确定该待定编码字符串是否为满足要求的编码字符串候选项。计算所述待定编码字符串键位数据与待匹配轨迹段的轨迹特征数据的匹配度的因素有多种。具体包括以下任意一种或者几种方式的组合I)、当前识别起点、所述待定编码字符串中的各个字符在键盘布局中的标志点及待匹配轨迹段终点的顺序连线总长度与所述当前匹配轨迹段的长度之间的关系,其中可以将该顺序连线称为标准键位连线,所述顺序连线总长度即为该标准键位连线轨迹的总长度。模拟出顺序连接当前识别起点、待定编码字符串中的各个字符在键盘布局中的键位标志点、待匹配轨迹段终点顺次连线得到的标准键位连线后,。计算该标准键位连线的长度与当前轨迹段的长度的差值或者是比例关系,进而得到与匹配度相关的数值,如计算2者的比值,所述比值大小反映了路径匹配程度,可将该长度的比值作为计算匹配度的计算参数,一般的,该连线轨迹的长度与当前轨迹段的长度的比值越接近1,则证明路径匹配度越高。此外,还可以用2者的差值,以及其差值和当前轨迹段长度或连线轨迹的长度的比值来计算匹配度。2)、待定编码字符串中的各个字符在键盘布局中的标志点与该待匹配轨迹段的距离。距离可包括该待定编码字符串中各个字符的键位与该当前匹配轨迹段的最近距离,以及各个字符的键位与该当前匹配轨迹段的最近距离的平均值与最大值,所述距离值越小,则路径匹配度越高。为适应不同按键尺寸的算法,一种用用距离反映匹配度的参数算法包括用相关距离除以按键尺寸(如按键的高度或宽度)得到反映路径匹配度的比值。一般的,该最近距离的平均值越小,以及该最近距离的最大值越小,则表明该待定编码字符串与当前匹配轨迹段的匹配程度越高。3)、待匹配轨迹段所划经的字符中不属于所述待定编码字符串候选项中字符,距离该待定编码字符串中各个字符在所述键盘布局中的标准键位连线的总距离。确定待匹配轨迹段所划经的字符中不属于所述待定编码字符串候选项中字符后,计算该不属于该待定编码字符串候选项中的字符的键位距离所述标准键位连线的最近距离,以及其均值与最大值,所述距离的均值与最大值用于计算匹配度,通常,所述距离均值和最大值越大,说明该待定编码字符串漏掉了关键位置的字符,匹配度应该被降低。4)、待定编码字符串候选项中的各个字符在所述键盘布局中的标准键位连线与该待匹配轨迹段所组成的封闭区域面积。可以计算该标准键位连线与待匹配轨迹段围成的闭合区域的面积值,并判断该面积值是否预设阈值内,当该计算出的面积值在预设阈值内时,则认为该标准键位连线与该待匹配轨迹段的路径匹配度达到预设值,满足预设条件。一般的如果标准键位连线与待匹配轨迹段的匹配程度越高,则该标准键位连线与待匹配轨迹段所构成的闭合区域的面积会越小,因此,在采用该种方式计算路径匹配度时,一般以闭合区域的面积越小,该待定编码字符串候选项的路径匹配度值越高为原则。需要说明的是,为了确定出该各个字符的标准键盘连线与待匹配轨迹段所围成的闭合区域,模拟出的该各个字符的标准键位连线轨迹是以当前识别起点、该待定编码字符串中包含的各个字符的键位(如可以是键位的中心位置)、该确定出的待定编码字符串候选
项在所述当前轨迹段上对应的识别终点位置所组成的连线轨迹,该连线轨迹与该当前轨迹段恰好围成闭合区域。为了避免重复计算多余的面积,计算闭合区域面积时,可考虑输入路径与标准键位连线轨迹上的键位对应关系,仅在对应键位之间计算封闭区域的面积,同时,沿输入轨迹起点顺序向后计算,已经参与过计算的输入轨迹和标准键位连线段落不重复参与计算。其中,该模拟的连线轨迹与待匹配轨迹段的组成的闭合区域可能不止一个,因此,计算闭合区域的面积时,应该是各个闭合区域的总面积之和。另外,当编码字符串与该待匹配轨迹段的轨迹特征数据匹配度较高时,该标准键位连线可能会与待匹配轨迹段重合,此时闭合区域的面积值为零。此外,还可以考虑其他一些要素,如轨迹在特定按键上的拐点,轨迹进出按键的角度,轨迹在按键内的形状等。需要说明的是,以上任意一种计算待定编码字符串与轨迹段的匹配度的因素均可以单独用于计算匹配度,也可以将任意几个组合起来一起使用,还可以依据各种要素进行加权计算,确定出该编码字符串与其对应的轨迹段的匹配度。在实际应用中从词库中匹配编码字符串时,还可以考虑检索出的待定编码字符串与某轨迹段所划经的各个字符串的匹配度,以进一步确定该待定编码字符串是否与该轨迹段相匹配。如,该待定编码字符串候选项中各个字符的先后顺序与该轨迹段所划经的各个字符的先后顺序的匹配度等。该种方式也可以作为根据连续输入轨迹的轨迹特征数据,从词库中匹配待定编码字符串候选项的一种实现方式。换言之,根据当前轨迹段所划经的字符串序列,从词库中检索与该当前轨迹段所划经的字符串序列的匹配度达到预设值的待定编码字符串,将该待定编码字符串候选项即作为检索出的编码字符串候选项。当然,这种方式检索出的编码字符串候选项可能会与用户实际待输入的编码字符串候选项存在一定的偏差,因此,实际应用中仍会结合路径匹配度,来确定该待定编码字符串候选项与连续输入轨迹的轨迹特征数据的匹配程度。当然,如果在步骤401中从词库中检索待定编码字符串候选项的过程依据该当前轨迹段所划经的字符序列,从词库中检索待定编码字符串候选项时,则在检索该待定编码字符串候选项的过程中一般会以当前轨迹段划经的字符以及划经的各个字符的先后顺序为依据,为了容错,也可以检索出那些和轨迹段划经字符顺序不一致的编码字符串候选项,在计算匹配度时,在编码字符串候选项中字符出现的先后顺序与轨迹划经的字符先后顺序不一致或有多余、漏掉的字符时,降低其匹配度。另外,在以上任意一种方式中,,还可以依据匹配出的候选项的词频(通常采用该待定编码字符串对应的候选词在一定语言材料范围内出现的频率)、该候选项与其他候选项词法规则匹配度、以及该候选项对应的编码字符串中字符的个数,该候选项所匹配的轨迹段中所包含的字符个数等因素,来进一步确定该候选项与待定轨迹段的匹配度。其中,该候选项与其他待定候选项的词法规则匹配度是指前后具有连接关系的轨迹段所对应的候选项是否具有符合组合成词组所需具备的语法匹配条件,如假设前一个候选项为形容词,而该当前编码候选项为名词的,符合汉 语的“形容词+名词”的词法规则,则该当前候选项的匹配度增加。类似的,也可以降低不符合词法匹配规则的候选项的匹配度,向前和后均可检测词法匹配度。通常词法规则匹配度更适用于词语的匹配度计算。由于从当前轨迹段的识别起点开始,可能会存在多个与该当前轨迹段的轨迹特征数据的匹配度满足要求的候选项,因此,在匹配候选项的过程中,还应对该进行评分。在对候选项进行评分的具体方式仍可以依据以上所描述的路径匹配度、候选项与其匹配的轨迹段所划经字符的匹配度、候选项的词频、词法规则匹配度、以及候选项对应的编码字符串中包含的字符个数、以及与候选项匹配的轨迹段所划经的字符个数等因素中的一个或几个来对编码字符串候选项进行评分。例如,以本发明中的路径匹配度来计算编码字符串候选项的评分,在从词库中检索出待定编码字符串候选项,并计算该待定编码字符串中各个字符在键盘区域上的连线轨迹与该当前轨迹段的路径匹配度,当该路径匹配度达到预设值时,则确定该待定编码字符串候选项为匹配出的编码字符串候选项,并将该待定编码字符串候选项的路径匹配度作为该编码字符串候选项的评分,路径匹配度越高该编码字符串候选项的评分也就越高。当然,在实际应用中,一般会综合依据路径匹配度,该编码字符串候选项的词频、待定编码字符串中包含的字符个数等因素来综合评价该编码字符串的评分。另外,由于从当前轨迹段的识别起点开始的轨迹段中,会匹配出多个匹配度满足要求的候选项,因此,在匹配候选项的过程可以将以同一识别起点开始的轨迹段中的多个候选项均匹配出来之后,再针对每一个候选项,来确定该当前轨迹段是否识别结束,即在连续输入轨迹中,轨迹特征数据与候选项匹配的轨迹段之后是否仍存在尚未识别的轨迹段,直至连续输入轨迹段识别结束。参见图5,示出了本申请一种基于多词连续输入的字词识别方法另一个实施例的流程示意图,本实施例为图3所示实施例的一种具体实现方式,本实施例包括步骤501 :检测键盘区域上的连续输入轨迹,其中该连续输入轨迹与用户待输入的编码字符串在键盘布局上的相应按键序列位置相关。步骤502 :依据键盘布局,确定该连续输入轨迹的轨迹特征数据,其中,轨迹特征数据包括连续输入轨迹的轨迹起点、划经的路径、划经的字符以及轨迹终点。步骤503 :将该连续输入轨迹的轨迹起点作为当前识别起点,将当前识别起点之后的轨迹段作为当前轨迹段。步骤504:根据当前轨迹段的轨迹特征数据,从词库中匹配出以该当前识别起点开始轨迹段对应至少一个候选项。该步骤的实现方式可以参照图3和图4所示的相应描述。为了便于理解,此处与图2所示的用户输入“我们”的编码字符串“women”所划经的连续输入轨迹为例来进行介绍,并以根据连续输入轨迹所划经的编码字符串来从词库中检索待定编码字符串候选项,以及根据路径匹配度来确定是否将该待定编码字符串候选项作为匹配出的编码字符串候选项为例。由图2可知,该连续输入轨迹所划经的字符串序列为“wertyuiokmjjhgfedfbn”,很显然,该字符序列中的每个字符也对应于于输入轨迹上的特定位置和范围。首先将整条连续输入轨迹作为当前轨迹段,则当前轨迹段的起点即为连续输入轨迹的轨迹起点,根据当前轨迹段的轨迹特征数据从词库中匹配待定编码字符串的过程与现有的方式类似。即根据该当前轨迹段的轨迹特征数据可以分析出该连续输入轨迹的轨迹起点位于字母按键“w”上,将该识别起点对应的“w”作为字符串匹配起点,判断字母“w”是否为词库中存在的编码字符串候选项,由于词库中不存在该编码字符串候选项,则将“w”与该轨迹段的下一字符进行组合,即“we”,由于词库中并不存在“we”这个编码字符串候选项,则沿着该当前轨迹段上各点依次后移,确定当前轨迹段下一划经的字符为“r”,则分别将“w”与“r”,以及“we”与“r”进行组合,并判断词库中是否存在这两个该编码字符串候选项,如果不存在则继续沿当前轨迹段向后移动。依据该过程则首先识别出的编码字符串为“wei”,且该编码字符串为词库中存在的待定编码字符串候选项。并继续将当前轨迹段上的点向后移,则还可以匹配出词库中存在的以字符串匹配起点“w”开始的待定编码字符串候选项,如“W0”、“Weihe(如,为何)” “weifen (如,微分)”、“women”、“wen” 等。在以字符串“w”开始的待定编码字符串候选项识别结束后,则将字符串匹配起点移至该连续输入轨迹下一划经的字符即“w”之后的“e”处,以“e”作为新的字符串匹配起点,并依次将“e”与该连续输入轨迹后续划经的“rtyuiokmj jhgfedfbn”进行组合,从词库中匹配待定编码字符串候选项,依次类推,直至符合当前轨迹段的轨迹特征数据的待定编码字符串候选项均被识别出来。假设识别出来的待定编码字符串包括“wo”、“er” “ti”、“women”、“wei ”、“wen”、“en”、“ri ”、“tui ”、“tu”、“tuo” “rumen (如,入门)”等。可以理解的是,依据连续输入轨迹,从词库中检索编码字符串候选项时,考虑到一定的容错率,在检索出的编码字符串候选项中各个字符的先后顺序并不一定与连续输入轨迹所划经的字符序列中各个字符的先后划经顺序完全一致。如,某连续输入轨迹所划经的字符串为“juikl”,则有可能是用户在输入“距离”的字符串时,发生了输入错误,因此在依据该连续输入轨迹所划经的字符串序列“juikl”时,在检索出“ ju”的同时,也会检索出字符序列与连续输入轨迹所划经的字符序列顺序有些偏差的编码字符串“juli”,在“juli”中“I”和“i”的先后顺序与连续输入轨迹所划经的先后顺序并不相同。同时,当划经的字符未包含某编码字符串候选项中的特定字符时,通过局部匹配和容错匹配也可以得到相应的待定编码字符串候选项。确定出以上待定编码字符串候选项之后,则需要根据该待定编码字符串与当前轨迹段的进行路径匹配,以确定“wo”和“en”为例,在介绍进行路径匹配的过程。参见图6a和图6b,分别为待定编码字符串候选项“wo”和“en”中各个字符在键盘布局中键位连线轨迹示意图,其中较粗的线条代表待定编码字符串中各个字符的键位连线轨迹。图中阴影部分的闭合区域为该连线轨迹与当前轨迹段(此时即为检测到的连续输入轨迹)组成的闭合区域。以图6a为例,组成该闭合区域的一种方式为将该当前轨迹段的轨迹起点,与候选项“wo”中第一个字符“w”的键位中心连接,之后将“w”的键位中心与下一字符“O”的键位中心相连,并将当前轨迹段划经“O”的键位的临界点与该字符“O”的键位中心连接(需要说明的是,一般以轨迹起点到该临界点之间的轨迹段即作为该编码字符串候选项所对应的轨迹段),从而得到图6所示阴影部分的闭合区域。当然,在组成闭合区域时也可以有其他方式,如当前轨迹段的轨迹起点、“w”的键位中心、“O”的键位中心以及当前轨迹段划经“O”之后与下一字符即“k”的键位的第一个交点依次相连,也可以得到闭合曲线。比较图6a中的“wo”中各个字符的键位连线与图6b中“en”中各个字符的键位连线,可以很明显的看出,“wo”与当前轨迹 段的匹配程度较高,当然在实际中,可以通过计算图6a和图6b中的闭合区域的面积来确定匹配度,可以看出图6a中闭合区域的面积较小,而图6b中闭合区域的面积较大,则面积较大的匹配度较低。根据闭合区域的面积计算出路径匹配度之后,则可以分别判断“wo”和“en”的路径匹配度是否达到预设值,假设“wo”的路径匹配度为85,“en”的路径匹配度为30,设符合要求的匹配度预设值要求为大于60,则“wo”的路径匹配度满足要求,“wo”可以作为匹配出的编码字符串候选项;“en”的路径匹配度低于60,没有达到预设值,则“en”不能作为匹配出的编码字符串候选项。其他待定编码字符串也通过如上路径匹配度的方式来确定是否作为匹配出的编码字符串候选项。其中在确定出编码字符串候选项时,与其对应的路径段落也确定了,即相应路径段落的识别起点与识别终点也相应的确定了,如与“wo”匹配的待匹配轨迹段为一次划经字母序列“wertyuio”的轨迹段,当“wo” (还可以包括词条候选项“我”)与该待匹配轨迹段的轨迹特征数据的匹配度满足要求时,则待匹配轨迹段为轨迹特征数据与“wo”(还可以包括候选词条“我”)相匹配的轨迹段。直接根据轨迹划经的字符串和词库一次性检索所有可能的候选项的计算量较大。当从一个识别起点开始检索编码字符串候选项时,路径匹配度计算时通常会将从识别起点开始至待检索的编码字符串最后一个字符对应的轨迹位置之前的路径和待检索的编码字符串进行匹配,当检索的编码字符串候选项与路径的匹配度降低预设的范围后,即可以中止以该识别起点的检索以提闻检索的效率。中止该识别起点的检索并不代表中止所有的检索工作,如果还有其他待检索的路径段落或待检索的编码字符串,检索会继续。如,当计算“wei”的匹配度满足要求时,继续向后组词进行检索,“weih”属于词库中“weihe”的一部分,但是“weih”的匹配度已经不满足要求,基于“weih”继续向后组词如“weihe”即可以不再继续进行了,当然“weihe”就不会有机会成为候选词,也不需要对其进行匹配度计算。在实际应用中,匹配出的候选项还可以包括编码字符串转换后的词条候选项,如匹配出编码字符串候选项“weihe”之后,还可以将“weihe”转换为由汉字组成的词条候选项如“为何”、“维和”等,具体将该字符串候选项转换为哪个词条候选项则需要结合该词条候选项的词频、与之前匹配出的词条候选项的词法匹配规则等因素来确定。以上实例仅是以从词库中匹配编码字符串候选项为例进行描述,但是对于匹配词条候选项也同样适用。同时其他实现匹配候选项的方式也同样适用,如参考待定编码字符串候选项中各个字符的键位与当前轨迹段的最近距离的平均值以及最近距离中的最大值来确定路径匹配度,或者是通过词库检索出的待定编码字符串与当前轨迹段所划经的字符序列的匹配度来确定待定编码字符串是否为符合条件的编码字符串候选项等。当然,还可以将待定字符串候选项的词频,待定编码字符串中包含的字符个数(如,“wo”中包含两个字符),当前轨迹段在划经待定编码字符串中各个字符的过程中所划经的无关字符的个数,当前轨迹段中划经该待定编码字符串时所需覆盖的字符个数等因素来综合评价该待定编码字符串候选项的匹配度即该候选项的匹配度,如以图6a为例,当该当前轨迹段划经“wo”时,则依次划经“wertyuio”,则其中的无关字符为“ertyui ”,无关字符的个数为6个。同时,根据划经当前轨迹段划经“wo”的路径,可知,划经“wo”的路径上覆盖的字符个数为8个即“wertyuio”。在计算待定编码字符串候选项或者 是词条候选项是否为匹配度满足要求的候选项的过程中,将计算评价分数和匹配度计算分开进行时,可以先将各个待定编码字符串候选项的匹配度进行记录,以便用于计算不同候选项匹配程度的评价分数。当然,进行多次连续识别结果进行组合优选时,也可以用一个评价分数来反映各种综合评价结果,这个评价分数反映了路径匹配度,词频,与其他选项词法规则匹配度,后续候选项的评分等因素。步骤505 :依次分别将识别出的各个候选项作为当前候选项,针对当前候选项,判断当前轨迹段是否识别结束,如果是,则执行步骤506 ;如果否,则执行步骤507。在现有技术中一般以连续输入轨迹的轨迹起点作为识别起点,从词库中匹配编码字符串候选项,则根据连续输入轨迹的轨迹特征,从词库中匹配编码字符串的过程结束。而本申请中则需要针对每一个候选项分别判断当前轨迹段是否识别结束。仍以图2所示的输入“women (我们)”为例,并以匹配出的候选项为编码字符串候选项为例,当经过步骤505之后,假设识别出的编码字符串候选项包括“WO”、“Wei”、“WOmen”、“er”、“tUi”、“yu”等。首先对于编码字符串候选项“wo”而言,当前轨迹段中位于“ο”键位之后仍然存在其他的轨迹段如图2或图6a所示(另一种判断当前轨迹段是否识别结束的方式也同样适用),则对于编码字符串“wo”而言,当前轨迹段并未识别结束,则仍需要将“O”之后的轨迹段作为新的轨迹段来执行后续操作,直至连续输入轨迹识别结束。而对于“women”(或者“rumen”)而言,当前轨迹段中位于“η”键位之后则不存在其他的轨迹段,则对于“women”而言,当前轨迹段识别结束。对于其他编码字符串候选项,判断当前轨迹段是否识别结束的过程类似。当然,如果匹配出的候选项为由汉字组成的词条候选项时,判断当前轨迹段是否识别结束的过程也与此类此,只不过是在匹配出将编码字符串后,将编码字符串候选项转换为了词条候选项而已。步骤506 :判断是否将识别出的每个候选项均已作为当前候选项进行了步骤505的处理,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的编码字符串候选项,其中每个轨迹段对应的至少一个编码字符串候选项,结束,如果否,则返回执行步骤505。在本实施例中,得到的和所述连续输入轨迹匹配的识别结果有多组,如“w0-men”、“wei-0-men”、“tui-0-men”、“yu-0-me”、“women”等等,每组中用分隔显示的候选编码都顺序对应于所述连续输入轨迹的不同轨迹段。步骤507 :将所述连续输入轨迹中与当前候选项对应的轨迹段之后的轨迹段作为当前轨迹段,并将当前轨迹段的起点作为新的当前识别起点,返回执行步骤504,以得到所述当前候选项的下一级候选项。如果对于当前候选项而言,当前轨迹段并未识别结束,则将连续输入轨迹中位于该当前候选项对应的编码字符串中的最后一个字母之后的轨迹段作为新的当前轨迹段,同时确定出该新的当前轨迹段的识别起点,并将该新的当前轨迹段的识别起点与该原来的当前轨迹段中的识别起点之间的轨迹段作为该当前编码字符串候选项所对应的轨迹段。仍以前面输入“women”为例进行介绍,参见图2,对于“women”而言,由于连续输入轨迹中位于“η”键位之后不存在轨迹段,则可以确定匹配出编码字符串候选项“women”的轨迹段为该整条连续输入轨迹。而对于“wo”而言,由于连续输入轨迹中位于“O”之后仍存在未识别的轨迹段,则将连续输入轨迹中位于“O”键位之后的轨迹段作为新的当前轨迹段,并确定出从“O”之后该新的当前轨迹段的识别起点,假设该新的当前轨迹段的起点作为识别起点,则编码字符串候选项“WO”所对应的轨迹段应该为从 连续输入轨迹起点到该连续输入轨迹划出字符按键“O”的点之间的轨迹段,即编码字符串候选项“WO”对应的轨迹段依次划经“wertyuio”。需要说明的是,当采用依据连续输入轨迹所划经的编码字符串候选项,从词库中检索编码字符串候选项的方法时,由于检索编码字符串候选项的过程依据了该连续输入轨迹的轨迹特征数据,因此在检索出编码字符串候选项时,该编码字符串候选项所对应的轨迹段也便可以确定,即将当前轨迹段的轨迹起点到该编码字符串候选项的最后一个字符在当前轨迹段上的点之间的轨迹段作为该编码字符串候选项所对应的轨迹段,如以上例子中检索出“WO”时,则可以确定从该连续输入轨迹的轨迹起点到该连续输入轨迹划经字符“O”的点之间的轨迹段作为匹配出编码字符串“WO”的轨迹段。这里的轨迹段主要用于描述和说明和识别结果和轨迹不同段落的对应关系,并不意味着识别过程中需要将轨迹进行显式的分段操作。确定了匹配出编码字符串候选项“wo”所对应的轨迹段,并将连续输入轨迹中位于“O”键位之后的轨迹段作为新的当前轨迹段后,以该新的当前轨迹段的识别起点,返回步骤504对该新的当前轨迹段进行编码字符串候选项的匹配。具体的确定该新的当前轨迹段第一个划经的字符为“k”,以“k”作为字符串匹配起点,从“k”开始与该当前轨迹段在“k”之后划经的字符串序列即“mj jhgfedfbn”依次进行匹配,如可以匹配出“ke”、“ken”,并将下一字符“m”作为字符串匹配起点,并以“m”开始依次进行匹配等直至该当前轨迹段中各个待定编码字符串候选项均匹配出来、如又得到“me”、“men”,匹配过程进行路径匹配度计算,确定出当前轨迹段中匹配度满足要求的编码字符串候选项。通常,组词过程即可同步计算出匹配度,当发现向后组词的匹配度不符合要求以后,即可结束以当前识别起点开始的组词及匹配度计算以减少运算量。假设匹配度符合要求的编码字符串候选项包括“ke”、“ken”、“me”、“men”,则对于编码字符串“ke”而言,当前轨迹段仍未识别结束,仍需将连续输入轨迹中位于编码字符串“ke”中的“e”的键位之后的轨迹段作为新的当前轨迹段,即位于字符“e”的键位之后且依次划经字符串“dfbn”的轨迹段,继续进行如上的字符串候选项匹配过程,直至当前轨迹段识别结束,对于“me ”也类似。当然,对于以同一识别起点,和编码字符串“wo” 一起匹配出的、“weiWomen”、“er”、“tui”等编码字符串候选项而言,判断当前轨迹段是否识别结束,以及分别针对每个编码字符串候选项,将当前轨迹段识别结束的过程也是类似的,在此不再一一描述。当以任意识别起点,匹配出的编码字符串候选项均已作为当前编码字符串候选项来执行步骤504和步骤506的操作时,则连续输入轨迹的匹配过程结束。
本申请中实现了从词库中匹配出与连续输入轨迹的不同轨迹段的轨迹特征数据匹配出的至少一个编码字符串候选项,这样即使用户待输入的多个词库并不能组合成词库中存在的词语时,利用本发明的方法可以对多个字词的连续输入轨迹进行匹配,从而得到不同轨迹段的编码字符串候选项。以上面输入“我们”为例,如果词库中恰好不存在“women”这个编码字符串候选项,而仅存在“wo”和“men”这两个单独的编码字符串候选项,则采用现有方式则无法得到用户需要输入的“我们”对应的编码字符串,如可能从连续输入轨迹中匹配出“wo”之后,则认为识别过程结束,或者是匹配出其他与 连续输入连续的匹配度较低的编码字符串候选项。而采用本申请的方法,即使词库中不存在“women”这个编码字符串候选项,由于匹配出“wo”(或者是转换后得到的词条候选项“我”)之后,本申请仍会继续进行“O”之后未识别的轨迹段的匹配操作,进而识别出“men”这个编码字符串候选项(或者是转换后得到的词条候选项“们”、“门”等),从而得到与一条连续输入轨迹的两个轨迹段的轨迹特征数据匹配的编码字符串候选项,进而通过后续的显示输出得到用户待输入的编码字符串候选项以及对应的字词候选项,进而实现了通过一次连续输入即可完成“我们”的输入过程。很显然,对于同一个连续输入的路径,本发明可以识别出和不同段落对应的多组识别结果,如“¥011611,,、“¥6;[-0-111611,,、“111;[-0-111611,,、“501-0-1116,,、“¥0111611,,等等,可以依据用户对这些识别结果的选择来确定最终的输入内容,也可以通过候选项与路径的匹配度排序来向用户推荐优选的输入结果并接受用户的修改。而另一种优化方法是对这些多组识别结果通过包括路径匹配度在内的综合评分后进行自动优选,以向用户推荐与轨迹的不同段落最匹配的识别结果。为了能够清楚的理解本实施例中对连续输入轨迹的匹配过程,以及向用户推荐与轨迹的不同段落最匹配的识别结果的过程,下面再以用户输入“就很好”为例进行描述,在词库中“就很好”并不是作为一个词组来存储的,而是单独存储有“就”、“很”、“好”以及“很好”等词组,当然对于字符串编码候选项而言,词库中并不存储整体的词语“就很好”及其编码“jiuhenhao”,而仅是存储有“就” (“ jiu,,)、“很,,(“hen”)、“好”(“hao”)以及“很好”(“henhao”)等词语及其编码字符串候选项。下面结合图7a和图7b,来描述从基于多个字词的连续输入轨迹的识别过程,其中,图7a为采用连续输入方法来用户在键盘区域上依次划经“jiuhenhao”这个字符串的过程中触点的连续滑动轨迹。另外,为了便于理解将对该连续输入轨迹的匹配过程以树形结构示意图来表示,参见图7b,为以树形结构图展示的对图7a的连续输入轨迹的匹配过程中得到候选项编码字符串。为便于描述,这里把一个轨迹段相邻的后续一段的识别结果称作当前编码字符串的下一级编码字符串,在如图所示的树形结构中,相邻轨迹段的识别结果以父子节点的关系进行展现,而对于识别出的同一识别起点的多个编码字符串(其对应的路径识别终点可能不同),则用同级兄弟节点的关系进行展现。由图7a的连续输入轨迹的轨迹起点开始,根据该连续输入轨迹的轨迹特征数据,从词库中匹配编码字符串候选项。以依据键盘布局确定出连续输入轨迹中的轨迹特征数据为例,该连续输入轨迹依次划经的字符串序列为“ jiuhgfderghnbhgfdsasdfgio”首先将整条连续输入轨迹作为当前轨迹段,将该连续输入轨迹的轨迹起点作为当前识别起点,利用前面描述的方法从词库中匹配出图7b所示的第一级编码字符串候选项,即和“jiuge”这三个编码字符串候选项,当然,匹配出的编码字符串候选项的个数与连续输入轨迹的轨迹特征有关,且与设定的匹配度阈值有关。该例仅是示意性的,实际匹配出的第一级编码字符串候选项的个数可能会有很多。匹配出以上第一级编码字符串候选项之后,依据本发明的方法仍需要针对每个第一级编码字符串来分别判断当前轨迹段是否识别结束,下面仅以“jiu”为例进行后续介绍。对于第一级编码字符串候选项“jiu”而言,在连续输入轨迹中匹配出“jiu”的轨迹段为从连续输入轨迹的轨迹起点到该连续输入轨迹划出“u”的键位的点之间的轨迹段,而在“U”之后仍然存在轨迹段,则将连 续输入轨迹中位于“U”之后的连续输入轨迹作为新的当前轨迹段,并以连续输入轨迹的滑动路径为依据,确定“U”之后划经的下一字符即“h”,以该新的当前轨迹段的轨迹起点作为当前识别起点(当然也可以是以“h”键位上的某点作为当前识别起点),以该当前识别起点开始对当前轨迹段进行编码字符串候选项的匹配,即首先以“h”作为字符串匹配起点,并与后续划经的字符进行组合,之后将字符串匹配起点由“h”移动到“h”之后划经的下一字符“g”,并继续进行字符串匹配,依此类推,进而得到以位于字符按键“u”之后的轨迹段作为当前轨迹段,匹配出第二级编码字符串候选项,SP得到“jiu”之后的下一级编码字符串候选项“henha0”、“hen”、“gen”、“he”。在匹配“jiu”的下一级编码字符串之后,或者是在匹配“jiu”的下一级编码字符串的同时,可以对执行与“jiu”处于同一级的“ji”以及“jiuge”的下一级编码字符串候选项的匹配过程。如图对于“jiuge”可以得到其对应的下一级编码字符串候选项即第二级编码字符串候选项“hao ”,而对应“ji”的下一级编码字符串候选项则在该图7b中未详细列出。对于与第一级编码字符串候选项“jiu”对应的第二级编码字符串候选项“henhao”、“hen”、“gen”、“he”而言,仍需要分别识别这些第二级编码字符串候选项的下一级编码字符串候选项,如图7b中以“hen”为例,连续输入轨迹划过了“jiuhgfderghn”之后,在连续输入轨迹在“η”键位之后仍存在轨迹段,连续输入轨迹中匹配出“hen”所对应的轨迹段为从划入键位“h”到划出键位“η”之间的轨迹段。同时,将“η”键位之后的轨迹段作为当前轨迹段,将当前轨迹段划经的“b”、“h”等依次作为字符串匹配起点,并根据当前轨迹段的轨迹特征数据,继续从词库中匹配“hen”的下一级编码字符串候选项,即图中与“hen”对应的位于第三级的编码字符串候选项“hao”和“ha”。依此类推,直至各级编码字符串均被匹配出来,如图7b所示,“ha”仍存在下一级编码字符串候选项“0”、“80”、“作”、“^’、“乜”,而“也”也存在其对应的下一级编码字符串候选项“O”,同时“Si”也存在其对应的下一级编码字符串候选项“O”。可见,本发明中的方法由于对连续输入轨迹的不同轨迹段分别进行编码字符串候选项的匹配,从而实现了对同时输入的多个字词的识别过程,这样即使用户连续输入多个字词或短语时,也不会出现无法识别,或者识别出的编码字符串错误率较高的问题。因此,词库中不存在“jiuhenhao”这个编码字符串候选项,由于本申请能从该连续输入轨迹中依次匹配出^11”、“化1^0”、“1^11”、“1^1^0”因此,根据匹配出的编码字符串候选项所对应的轨迹段之间的连接关系,也可以将处于上下级关系的编码字符串候选项进行组合,如“jiu”与“henhao”得到“jiu henhao,,,或者将“jiu”与其下一级词“hen”并将“hen”的下一级“hao”依次组合得到“jiu hen hao",同时展现的还有其他组合后的编码字符串候选项,根据用户对组合后的编码字符串的选择结果进行上屏输出操作。当然,在展现编码字符串候选项时,也可以不对各级编码字符串进行组合,则是按照各级编码字符串来逐次进行展现,具体的展现方式将在后面进行详细描述。另外,在进行候选项匹配的过程中,计算并保存各个候选项的匹配度,以便进行候选展现时,依据候选项匹配度的高低程度来展现各个串候选项,候选项与连续输入轨迹的轨迹特征数据的匹配度是以前面所述的路径匹配度、候选项对应的字符串匹配度、闭合区域面积、词频等等因素中的一种或几种作为计算出候选项的评分的依据,该候选项的评分的高低体现了该候选项与连续输入轨迹的轨迹特征数据的匹配度。如图7b中标示于各个编码字符串候选项上方的数字即为各个编码 字符串候选项的匹配度,如“jiu”的匹配度评分为92、而“jiuge”的匹配度评分为“95”,如果直接按路径匹配度进行最佳输入结果判定,则第一级应选择“ j iuge ”,显然,这和用户期望的输入结果是不一致的。考虑到实际应用中,检测到的连续输入轨迹是依次划经多个具有一定关联关系的编码字符串,在进行识别结果优选的过程中,如果仅参照个别轨迹段的轨迹特征数据所匹配的候选项的匹配度来优选识别结果,则可能得不到接近用户预期的输入结果,如,本实施例中,如果仅按每一级候选编码的独立评分进行选择,则,第一级的最优编码为“jiuge”,而“jiuge”的下一级为第二级的候选项“hao”,更有甚者,按这种原则进行优选的结果可能导致连续输入轨迹中前一部分轨迹段的匹配度很高,而后面的轨迹段则没有对应的识别结果,这样的综合识别结果显然不会是接近用户真实意图的。因此在考虑到编码字符串与其对应的轨迹段的轨迹特征数据的匹配度的同时,还需要综合考虑编码字符串候选项与整条连续输入轨迹的轨迹特征数据的识别结果的匹配度的关系,因此,本申请中计算候选项的评分时,还需要将该候选项是否存在其对应的下一级候选项及其下一级候选项的评分作为计算候选项评分的评价因素。换言之,对于某一个串候选项而言,为了便于区分,将该候选项称为当前候选项,依据连续输入轨迹中该当前候选项所匹配的轨迹段之后是否仍存在后续轨迹段,以及该后续轨迹段中是否匹配出新的候选项(即当前候选项的下一级候选项)作为对当前候选项的评分因素。如设定当该当前候选项中存在下一级候选项时,则降低该当前候选项的评分,并将当前候选项的下一级候选项中的最高评分也作为调整该当前候选项的评分的依据,一种优选的评分计算方式是把下一级候选项的评分按照特定的算法累加到上一级候选项的评分中,如根据下一级候选项所匹配的轨迹段所覆盖的路径长度、该路径划经的字符个数、该候选项对应的编码字符串中的字符个数、该候选项的词频系数等与该下一级候选项评分的乘积,当然,也可以采取能够达到类似效果其他算法。这样的设计原则有助于避免将整个路径被识别为众多单个字符或短词语,更贴近实际需求。例如,仍以图7a描述的输入“jiuhenhao”所对应的连续输入轨迹为例进行描述,为了便于理解结合图7b各级编码字符串候选项的树形结构示意图来进行描述。但需要说明的是,图7b显示了各个编码字符串候选项的层次及其路径匹配度。下面结合候选项是否存在下一级候选项以及几种常见的评分因素来对候选项进行评分的过程进行详细描述。为了方便仅以候选项为编码字符串候选项为例,在依据编码字符串候选项是否存在下一级编码字符串候选项,而对该编码字符串候选项的评分进行调整的过程一般是该编码字符串中对应的下层编码字符串候选项的最底层逐层向上来调整编码字符串候选项的评分的。
以图7b中位于第三级的编码字符串候选项“hao”和“ha”为例来介绍计算评分的过程,“hao”和“ha”均为第二级编码字符串候选项“hen”的下一级编码字符串候选项。设“hao”的评分为Ml,“ha”的评分为M2.首先,计算出路径匹配度A :设计算出的“hao”的路径匹配度Al=80分;“ha”的路径匹配度A2=90。此时,“hao”的评分 Ml = Al=80 分;“ha” 的评分 M2=A2=90。计算路径匹配度的过程可以参照 图3所示实施例中的任意一种或几种计算路径匹配度的计算方式。其次,根据路径匹配度以及其他评分因素对评分进行计算,以根据词频和词长进行加权计算为例设“hao”的词频系数为I. I ;“ha”的词频系数0. 9。词频调整“hao”的评分 Ml = Α*1· 1=88 ;“ha” 的评分 M2=90*0. 9=81 ;词长调整词长是指编码字符串中包含的字符个数,并以编码字符串包含的字符个数作为加分分数为例“hao”中包含的字符个数为3个,“ha”中包含的字符个数为2个,则“hao” 的评分 Ml=88+3=91 ;“ha” 的评分 M2=81+2=83 ;经过以上两步得到图7b所示的评分,下面将结合编码字符串对应的轨迹段所划经的字符个数、编码字符串候选项是否存在下一级编码字符串候选项以及该下一级编码字符串候选项的评分来调整该编码字符串候选项的评分。再次,依据编码字符串候选项所对应的轨迹段覆盖的字符个数、编码字符串候选项的下一级编码字符串候选项的评分以及下一级编码字符串候选项对应的轨迹段所划经的字符个数等因素来调整该编码字符串候选项的评分。设评分调整规则为评分=下级编码字符串候选项中的最高评分*该下级编码字符串候选项所对应的轨迹段划经的字符个数+经过词长调整后的评分*候选词覆盖的字符个数-设定的下级编码字符串候选项的罚分;并设当编码字符串候选项存在下一级编码字符串候选项时的罚分为160。结合图7a所示的连续输入轨迹、该连续输入轨迹所划经的字符序列即“jiuhgfderghnbhgfdsasdfgio”、“hao” 的匹配过程,可知 “hao” 作为 “hen” 的下一级候选词时,其为对应的轨迹段为图7a中从“b”到“ο”之间的轨迹段,该轨迹段划经的字符序列为“hgfdsasdfgio”,该轨迹段覆盖的字符个数即划经的字符个数为13个。同时由于“hao”不存在对应的下一级编码字符串候选项,则“hao”的评分Ml=91*13=1183。相应的,“ha”对应的轨迹段,划经的字符个数为7个。同时,参见图7b可知第三级编码字符串“ha”存在下一级编码字符串候选项,假设在“ha”的下一级编码字符串候选项中“O”的评分最高为90,且由于编码字符串候选项“O”所对应的轨迹段为连续输入轨迹中从“s”到“O”的轨迹段,该轨迹段所划经的字符串序列为“sdfgio”,则“ha”的下一级编码字符串候选项“O”对应的轨迹段所划经的字符个数为6个。则根据以上设定的计算规则“ha” 的评分 M2=90*6+83*7-160=961。由此可见,在第三级,M1>M2,8卩“他0”的综合评分高于“Ha”,成功选择除了更接近用户需求的候选项。
通过以上方式计算出“hao”和“ha”的评分后,则可以逐层向上计算与“hao”和“ha”的上一级编码字符串候选项“hen”处于同一级,且与“hen”具有相同识别起点的编码字符串候选项的评分,即对“化1^0”、“1^11”、1611”、“1^”和16”的评分进行计算。并逐级向上直至对“jiu”的评分进行调整。对于编码字符串候选项jiuge”以及其各自对应的下一级编码字符串候选项的评分调整过程类似,最终能够得到第二级中,“HenHao”的评分高于同一父节点下的其他候选项,第一级中,“jiu”评分高于同一父节点下其他同级选项,顺利得到了“Jiu HenHao”的和连续输入轨迹不同段落对应的候选项的最佳组合。这里列举了一种在候选项检索过程中自底向上计算评分的方法,在具体实施时也可以在所有候选项确定出来以后采用其他计算顺序 如自顶向下计算。所述评分可直接用于识别结果优选,同一级候选项中得分越高表示越匹配用户输入意图。评分的计算过程,既可以在进行编码字符串候选项匹配过程中直接计算出来,也可以在所有编码字符串候选项匹配出来以后再计算,具体实施顺序不做限定,甚至,也可以将匹配度和评分的计算过程融合在一个参数里面一次性计算出来。如果匹配出的候选项为由编码字符串转换出的词条候选项,则在计算候选项的匹配度评分的过程中,则在进行词频调整时还需要考虑各个编码字符串候选项转换出的词条候选项的词频,如对比编码字符串候选项“hao”,还需要考虑“hao”转换出的各个词条候选项如“好” “号”和“耗”等的词频,以及该词条候选项与上一级或下一级词条候选项之间的词法匹配度,从而确定转换出的词条候选项可以是“好” “号”和“耗”中的哪一个或哪几个,并确定出词条候选项的匹配度评分。 在本申请中,除了采用图5所示实施例以先将以同一识别起点的各个候选项均匹配出来之后,再进行逐次匹配各个候选项的下一级候选项的方式,即以“广度优先的方式”来匹配出不同轨迹段对应的候选项外,本申请还可以采用“以深度优先”算法来匹配不同轨迹段对应的候选项。该种以“以深度优先”来匹配候选项的方式与图5实施例中的“广度优先”的方式的不同之处在于广度优先是在当前轨迹段的识别起点开始,将以该识别起点的所有可能匹配的候选项均匹配出来之后,再分别针对每一个候选项来分别判断当前轨迹段是否识别结束,如果未识别结束,则确定连续输入轨迹中位于候选项所匹配的轨迹段之后的新的当前轨迹段,以从新的当前轨迹段中匹配出该候选项的下一级候选项,直至各个候选项的下一级候选项均匹配出来,然后分别将匹配出的各个下一级候选项作为当前候选项,然后再继续匹配当前候选项的下一级候选项,如此循环直至各个候选项所存在的下一级候选项均被匹配出来。而深度优先的方式,则是从当前轨迹段的识别起点开始,当匹配出一个候选项之后,则判断该轨迹特征数据与该候选项匹配的轨迹段之后是否仍存在轨迹段来确定当前轨迹段是否识别结束,如果当前轨迹段未识别结束,则将连续输入轨迹中位于轨迹特征数据与该候选项匹配的轨迹段之后的轨迹段作为当前轨迹段,并确定当前轨迹段的识别起点,并当从该识别起点开始匹配出该候选项的一个下一级候选项时,继续以该下一级候选项作为当前候选项,并继续执行匹配该当前候选项的一个下一级候选项的操作,如此循环。如果判断出当前轨迹段已识别结束,则返回当前轨迹段的识别起点,并从识别起点开始继续从词库中匹配是否存在其他的满足当前轨迹段的轨迹特征数据的编码字符串候选项的操作,如此循环,直至无法识别结束。为了便于理解,仍以图7a和图7b的实例来进行介绍。当采用图5所示实施例的“广度优先”算法时,对图7a所示的连续输入轨迹的不同轨迹段进行匹配,得到图7b所示的树形结构中的各个编码字符串候选项的顺序为首先将连续输入轨迹的轨迹起点作为识别起点,匹配出各个第一级编码字符串候选项“ jiu”、“ji”和“jiuge”,之后分别这三个第一级 编码字符串候选项作为当前编码字符串候选项,匹配出当前编码字符串候选项的下一级编码字符串候选项即第二级编码字符串候选项。如,当“jiu”为当前编码字符串时,则利用本发明的方法将候选项“jiu”所有可能的下一级编码字符串候选项均匹配出来,同时,将“ji”以及“jiuge”的下一级编码字符串候选项也全部匹配出来,进而得到各个第二级编码字符串候选项,然后再分别匹配出各个第二级编码字符串的下一级编码字符串候选项,得到各个处于第三级的编码字符串候选项,依此类推,直至识别到第五级,如“Si”的下一级编码字符串候选项为“O”,同时,“ο”对应的当前轨迹段为从“ i ”键位之后到连续输入轨迹终点之间的轨迹段,由于“ο”为连续输入轨迹划经的最后一个字符,则“ο”对应的当前轨迹段识别结束。对于“di”的下一级编码字符和串候选项的“ο”而言,其对应的当前轨迹段也识别结束,从而整个连续输入轨迹匹配过程结束。当采用“深度优先”的方式时,从图7a的连续输入轨迹中得到图7b所示的树形结构中的各个编码字符串候选项的顺序为首先将连续输入轨迹的轨迹起点作为识别起点,当匹配出一个编码字符串候选项时,假设第一个匹配出的编码字符串候选项为第一级编码字符串候选项“jiu”,则继续匹配“jiu”的下一级编码字符串候选项,假设首先匹配出“jiu”的下一级编码字符串候选项为第一级中的“hen”,则继续匹配“hen”的下一级编码字符串候选项,并假设第一个匹配出“hen”的下一级编码字符串候选项为“hao”,由于“hao”中的尾字母“ο”为连续输入轨迹最后一个划经的字母,则对于“hao”而言,位于“hen”中的“η”键位之后的当前轨迹段识别结束,则找出“hao”对应的该当前轨迹段的识别起点,从该识别起点开始,重新根据该当前轨迹段的轨迹特征数据,从词库中匹配除“hao”之外的其他与该当前轨迹段的轨迹特征数据相匹配的编码字符串候选项,如还可以匹配出“ha”。对于“ha”而言,该当前轨迹段并未识别结束,则将连续输入轨迹中在划经“a”之后轨迹段作为新的当前轨迹段,并继续匹配出“ha”的第一个下一级编码字符串候选项,假设为“so”,由于“O”为连续输入轨迹最后划经的一个字符,则当前轨迹段识别结束,返回“so”对应的当前轨迹段的识别起点,以该识别起点是否还能匹配出其他的编码字符串候选项,即是否仍存在“ha”的其他下一级编码字符串候选项,如此进行递归循环,直至该连续输入轨迹中各个轨迹段的轨迹特征数据所对应的编码字符串候选项均被匹配出来,匹配各级编码字符串候选项,结果用树形结构直观展示出来如图7b所示。在实际应用中,还可以预先在键盘区域上设置分词标识区,如图13,分词界线外围即为分词标识区,如果用户需要输入连续多个字词时,可以在每完成一个字词或词组对应的字符串的输入后,从字母键区划入分词标识区后再次划入字母键区,并继续进行后续多个字词的字符串的连续输入,从而得到包含至少划经一个分词标识位置的连续输入轨迹,进出分词标识区的位置信息中保存在该连续输入轨迹的轨迹信息中,并作为分词标识。当电子设备检测到键盘区域上连续输入轨迹时,根据键盘布局,获取连续输入轨迹的轨迹特征数据,在该轨迹特征数据中除了包括轨迹的起点、终点、划经路径、划经的字符,还包括该连续输入轨迹所划经的分词标识的数据信息。其中,在键盘区域上预设的分词标识区可以为一个或多个指定的按键,也可以为键盘区域中特定的区域。如果检测到的连续输入轨迹中包含了分词标识时,则将连续输入轨迹中划经的分词标识作为该连续输入轨迹的划分依据,将连续输入轨迹分割为多段由分词标识分割的多段连续输入轨迹段,也就是不允许跨越 分词标识形成候选项编码,如在划经字母h和a之间有分词标识,则不能这跨越分词符形成候选项编码,即由这两个字母组成的“ha”是不符合候选项形成规则的。对于分割后的每段连续输入轨迹段仍采用如上的匹配方式来从词库中匹配编码字符串候选项。参见图8,示出了本申请一种基于多词连续输入的字词识别方法另一个实施例的流程示意图,该实施例以连续输入轨迹中至少划经一个分词标识区为例来描述编码字符串候选项的匹配过程。本实施例包括步骤801 :检测键盘区域上的连续输入轨迹,其中该连续输入轨迹与用户待输入的编码字符串在键盘布局上的相应按键序列位置相关。步骤802 :依据键盘布局,确定该连续输入轨迹的轨迹特征数据,其中,轨迹特征数据包括连续输入轨迹的轨迹起点、划经的路径、划经的字符、轨迹终点以及连续输入轨迹所划经的分词标识。步骤803 :将该连续输入轨迹的轨迹起点作为当前识别起点。步骤804:判断所述当前识别起点之后的连续输入轨迹是否包含分词标识,如果是,则进入步骤805 ;如果否,则进入810。如果检测到的连续输入轨迹中包含了分词标识,则需要将各个分词标识之间的轨迹段,连续输入轨迹的轨迹起点与第一个划经的分词标识之间的轨迹段,以及连续输入轨迹最后一个划经的分词标识与轨迹终点之间的轨迹段分别作为单独的轨迹段进行候选项的匹配。步骤805 :确定连续输入轨迹中位于所述当前识别起点之后,且距离所述当前识别起点最近的分词标识,并进入步骤806。由于检测到的连续输入轨迹中可能包含划经的多个分词标识的数据,因此,在确定了当前起点之后,需要确定与该当前识别起点最近的一个分词标识点,将当前识别起点与该分词标识点之间的轨迹段来单独作为一条输入轨迹段进行候选项的匹配操作。步骤806 :根据该当前识别起点至所述分词标识之间的连续输入轨迹的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的作为当前候选项,进入步骤807。将当前识别起点与该最近的分词标识之间的轨迹段作为一条连续输入轨迹,进而采用图3、4或5所示的实施例中描述的从词库中匹配与连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个编码字符串候选项的任意一种方式,并结合当前识别起点与该最近的分词标识之间的轨迹段的轨迹特征数据,从词库中匹配候选项,具体过程可以参见上面实施例的描述,在此不再赘述。步骤807 :判断该当前识别起点到该最近的分词标识之间的连续输入轨迹是否识别结束,如果是则进入步骤808 ;如果否,则执行步骤809。
判断该当前识别起点与该最近的分词标识之间的连续输入轨迹段是否识别结束的方式与图3实施例中判断当前轨迹段的是否识别结束的方式类似,即对应当前编码字符串候选项来确定当前识别起点与该最近的分词标识之间的连续输入轨迹是否识别结束。步骤808 :在该最近的分词标识之后的连续输入轨迹中设置新的当前识别起点,并返回执行步骤804;如果识别结束,则在该最近的分词标识之后的连续输入轨迹中设置新的当前识别起点,一般可以将最近的分词标识作为新 当前识别起点,以便对连续输入轨迹中位于该最近的分词标识之后的连续输入轨迹进行识别,以匹配出当前时刻该最近的分词标识之后的连续输入轨迹的轨迹特征相匹配的候选项。步骤809 :确定出轨迹特征数据与该当前候选项匹配的轨迹段,将连续输入轨迹中位于当前候选项所匹配的轨迹段的终点至该最近分词标识之间的连续输入轨迹作为当前轨迹段,并将当前轨迹段的起点作为新的当前识别起点,,返回执行步骤806,以得到所述当前候选项的下一级候选项。如果步骤809中判断出当前识别起点到该最近的分词标识之间的轨迹段未识别结束,则需要在该段轨迹段中确定出新的当前轨迹段,以便进行后续的匹配过程,该过程与前面描述的未包含分词标识的实施例的实现过程类似。步骤810 :根据所述连续输入轨迹中位于当前识别起点之后的轨迹段的轨迹特征数据,从词库中匹配出至少一个以该当前识别起点开始的轨迹段对应候选项,以便匹配出的候选项作为当前候选项继续匹配其下一级候选项。如果当前识别起点之后的连续输入轨迹段中不存在分词标识,则可以采用图3所示实施例中的步骤303至步骤306的操作将当前识别起点之后的连续输入轨迹作为当前轨迹段,并从该当前识别起点开始,根据该当前轨迹段的轨迹特征数据,反复执行步骤304至306的操作,从词库中匹配当前识别起点之后的连续输入轨迹的不同轨迹段的轨迹特征数据。具体的,该步骤810可以包括以下子步骤Ml至M3 Ml、根据当前识别起点之后的连续输入轨迹段的轨迹特征数据,从词库中匹配出至少一个候选项;M2、判断连续输入轨迹中位于该当前识别起点之后的轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行步骤M3。M3、将所述连续输入轨迹中位于当前候选项所匹配的轨迹段之后的轨迹段作为当前轨迹段,将当前轨迹段的起点作为新的当前识别起点,返回执行步骤M1,以得到所述当前候选项的下一级候选项。其中,子步骤M2中判断连续输入轨迹中位于该当前识别起点之后的轨迹段是否识别结束的方式与图3所示的实施例的步骤305中判断当前轨迹段是否识别结束的方式相同。。为了便于理解,下面以一具体实现来介绍本实施例的实现过程,参见图9,示出了本申请中包含有分词标识的位置信息的连续输入轨迹示意图,假设在键盘区域中在字母按键区域之外的区域均为预设的分词标识键位区,如图中901即为字母按键区与分词标识区的分界线,当连续输入轨迹从字母按键区划过该界限901之后进入到其他键盘区域则视为进入分词标识区,在本实例中以用户输入“力矩特大”(相应的拼音编码为“lijuteda”),并假设在词库中存在“力矩”、“特大”的词条候选项以及相应的字符串编码“liju”、“teda”,但没有“力矩特大”及其字符串编码,则用户在进行连续输入的过程中连续划经“liju”的各个字母之后,划出字母按键区进入分词标识区域,并从分词标识区域再次划入到字母按键区以顺序划经“teda”的各个字母。如图,在该连续输入轨迹在划经“u”之后,划入到分词标识区,如图中虚线段为在分词标识区中划出的轨迹段,之后由分词标识区划入到字母按键“t”的键位上,以便继 续进行连续滑动划经相应的字母。系统检测到如图9所示的连续输入轨迹时,可以确定出该连续输入轨迹中包含有分词标识区(即虚线部分的轨迹段数据为分词标识数据信息),则系统将连续输入轨迹中位于分词标识区前后的轨迹段分别作为两段轨迹段进行识别,首先依据该连续输入轨迹的起点到虚线段的起点之间的轨迹段的轨迹特征数据进行候选项匹配,可以得到包含“力矩”(“liju”)在内的候选项,之后对依据该虚线段的终点到该连续输入轨迹的终点(“A”字母按键处)的轨迹段的轨迹特征数据进行候选项匹配,可以得到包含“特大”(“teda”)在内的候选项。可以理解的是,虽然依据分词标识将连续输入轨迹分为两段轨迹段进行识别,但是在确定与各轨迹段的轨迹特征数据匹配的候选项时,也可以综合考虑前后连续轨迹段所匹配的候选项之间的词法匹配规则等因素。在实际应用中,由于用户的输入操作,导致根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项的过程中,可能会出现在以当前识别起点开始之后很长的轨迹段中都无法匹配出候选项,因此反复以该识别起点开始识别则会带来较多无用数据的处理,增加了系统数据处理量,因此在本申请中如果以当前识别起点开始的预设长度内的轨迹段中无法匹配出候选项时,则将当前识别起点向后移动,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为新的当前轨迹段,继续执行从词库中匹配与该当前识别起点之后的轨迹段的轨迹特征数据相匹配的候选项的操作。具体的,在以当前识别起点进行了指定长度轨迹段的轨迹特征数据匹配后,从词库中找不到与当前轨迹段的轨迹特征数据相匹配的的编码字符串候选项,通常也包括从当前识别起点开始的所有候选项的轨迹匹配度都低于预设阈值时,判断所述当前轨迹段是否识别结束,如否,将当前识别起点向后移动,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为当前轨迹段,继续执行以后移之后的新识别起点开始匹配候选项的操作。通常,在移动识别起点时,可以将识别起点移到输入轨迹划经的下一个字符对应的位置,如图10,当用户需要输入“nikeyi”(“你可以”)时,正常的输入路径应该是依次划经n、i、k、e、y、i, 一种典型输入手势划经的字符序列包括“njikiuytrertyui”,而实际中用户却在划经i以后不小心划经f键然后划向k、e、y、i,划经的字符序列为“njihgfghjkiuytrertyui”,其中识别出“ni”及其它候选项(如果有的话)以后,新的路径识别起点设置到i之后对应的位置(路径匹配度的计算起点也为相应起点),发现h至k之间的一段路径划经的字符向后组合的任何候选项的匹配度都不满足要求,且假设识别到f对应位置后,轨迹段的匹配度已经下降到预设匹配度阈值以下,以该起点继续向后识别出的待定编码候选项的匹配度不可能符合要求,而整个路径并未识别完毕,则为了提高容错率,将当前识别起点向后移动至下一个字母对应的位置,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为当前轨迹段,继续以新的识别起点开始匹配候选项的操作,如果仍然没有符合要求的识别结果,继续后移识别起点进行识别,最终可以顺利得到自k开始的路径有相应的识别结果,如“keyi”(可以)、“ketui”(可退)、“ke rui” “ke ti”等。在实际应用中,如果路径匹配度阈值设定较高,如以100为最高匹配度的话,如设定80为合格匹配度阈值,则用户输入的路径如果不够准确导致所有预期输入的候选项的路径匹配度低于80,则可能得不到用户预期的识别结果。常规的匹配度设置通常为全局设置,修改后对以后的输入均起作用,而这可能并不是用户所需。为解决该问题,在本发明中还可以由用户激活的临时调整匹配度阈值对连续输入轨迹进行重新识别.具体的,在根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个编码字符串候选项时,本发明还可以包括接收调整匹配度阈值的指令;保存当前时刻系统的匹配度阈值,并将当前的匹配度阈值调整为新设定的匹配度阈值;根据调整后的匹配度阈值,从词库中匹配出与当前轨迹特征数据的匹配度在所述调整后的阈值范围内的至少一个候选项;在完成依据调整后的匹配度阈值匹配出候选项的操作中,将匹配度阈值恢复为之前保存的匹配度阈值,即该系统的原匹配度阈值。具体实现时,可以在键盘布局上设置一个触发调节匹配度阈值的按钮,例如,可以在该在键盘区域的原按键中指定某个按键为调节匹配度的按键,也可以在键盘布局上增设中“宽容识别”按钮,通过调节开“宽容识别”按钮或按键来对匹配度阈值进行调节,如用户的真实意图是需要输入“不急”(拼音编码“buji”),但是由于系统预设的匹配度阈值过高,自动识别的最佳分段优选识别结果为2个单字(分别对应不同的路径段落),而用户期望的“不急”(“buji”)既不是优选识别结果,也并不在可选的候选项中,在不能调整匹配度阈值进行重新识别的情况下,用户只能重新输入提高路径输入准确率。用户点击“宽容识别”按钮,进行匹配度阈值的调整以降低匹配度阈值,使得识别结果对于路径准确度的要求降低,贝U “不急”就将出现在可选的候选项中,甚至成为首选候选项。进行临时宽容识别,除了调降匹配度要求,还可以包括临时扩大按键的逻辑坐标范围,这也有利于提高识别过程的容韦昔倉泛力。需要说明的是,以上实施例都是以检测到键盘区域上的连续输入轨迹,并根据键盘布局来确定连续输入轨迹的轨迹特征数据,得到的该轨迹特征数据中包括了连续输入轨迹所划经的字符序列后,进行从词库中匹配编码字符串候选项的操作为例进行描述。但是在实际应用中,当检测到键盘区域上的连续输入轨迹时,可以仅依据连续输入轨迹上各点的坐标位置确定出连续输入轨迹的轨迹特征数据,此时获取到的连续输入轨迹的轨迹特征数据不包括该连续输入轨迹所划经的字符串序列。当执行从词库中匹配字词候选项时,则需要依据键盘布局,并结合获取到的连续输入轨迹的轨迹特征数据,从预置的词库中匹配与该连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。当然,从预置的词库中匹配与该连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项的过程与前面实施例中所描述的实现方式相同。如,可以在匹配候选项之前,根据键盘布局以及已经获取到的连续输入轨迹的轨迹特征数据,确定出该连续输入轨迹所划经的字符串序列,然后再依据前面各个实施例中描述的匹配编码字符串的方式,从词库中匹配出与连续输入轨迹的不同轨迹段相匹配的至少一个编码字符串候选项。又如,当进行从词库中匹配编码字符串候选项的过程中,如从连续输入轨迹中确定出当前轨迹段时,根据当前轨迹段的轨迹特征数据,结合键盘布局来确定当前轨迹段所划经的字符串序列,进而执行从词库中匹配候选项的操作。当然,在结合键盘布局以及已获取到的连续输入轨迹的轨迹特征数据,确定出连续输入轨迹所划经的字符串序列时,也可以将划经的字符串序列作为轨迹特征数据添加到确定出的连续输入轨迹的轨迹特征数据中。前面几个实施例在执行从词库中匹配与连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项时,均是在轨迹段中设定了识别起点后,从该识别起点逐次
向后进行匹配,但是在实际应用中还可以依据连续输入轨迹中所划经的字符串序列,从第一个划经的字符逐次向后进行匹配,并当匹配出候选项时,在依据连续输入轨迹的划经路径、轨迹起点、轨迹终点以及轨迹的拐点等轨迹特征数据来确定匹配出的候选项是否为匹配度满足要求的候选项。具体的,可以包括以下几个步骤首先,确定所述连续输入轨迹所划经的字符串序列。如果依据键盘布局确定出连续输入轨迹的轨迹特征数据时,则在轨迹特征数据中包含有连续输入轨迹所划经的字符串序列。如果获取到的轨迹特征数据中未包含该连续输入轨迹所划经的字符串序列,则可以依据键盘布局,并结合该连续输入轨迹的其他轨迹特征数据来确定其所划经的字符串序列。其次,依据该连续输入轨迹所划经的字符串序列,从词库中检索待定编码字符串候选项。该过程可参照前面所描述的从词库中检索编码字符串候选项的操作。再次,依据待定编码字符串候选项中所包含的字符与连续输入轨迹所划经的字符串序列中的对应关系,确定与该待定编码字符串候选项所对应的待匹配的轨迹段,当待定编码字符串候选项与该待匹配的轨迹段的轨迹特征数据的匹配程度达到预设值时,将该待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为与该待匹配轨迹段的轨迹特征数据相匹配的候选项,并将该候选项作为当前候选项,确定在连续输入轨迹所划经的字符串序列中,匹配出该当前候选项所对应的编码字符串时所需匹配到的字符。其中,确定在连续输入轨迹所划经的字符串序列中,匹配出该当前候选项所对应的编码字符串时所需匹配到的字符的过程与图4所示实施例中步骤401中确定识别终点的方式相同。如图2和图6b中,连续输入轨迹所划经的字符序列为“wertyuiokmjhgfedfbn”,在连续输入轨迹所划经的字符序列中,匹配出“wo”则必须从、”开始直至识别到“ο”字母才可以匹配出“wo”这个候选项,而对于“wei ”而言,则只需从“w”开始识别到字符串序列的“i”即可匹配出该候选项。依据编码字符串候选项中所包含的字符与连续输入轨迹所划经的字符串序列中的对应关系,确定与该编码字符串候选项所对应的待匹配的轨迹段的过程与前面图4所示实施例确定识别终点的方式类似,具体可以参照图4实施例的描述。当然确定该编码字符串候选项所对应的轨迹段也可以理解为将将识别起点到匹配出当前候选项所对应的编码字符串时所需匹配到的字符在连续输入轨迹中的位置点之间的轨迹段。在本实施例中,计算待定编码字符串候选项与该待匹配的轨迹段的轨迹特征数据的匹配程度是否达到预设值的方式与上面实施例中计算匹配度的方式相同,具体可以参照前面任意实施例中关于计算匹配度的描述。最后,判断连续输入轨迹所划经的字符串序列中是否仍存在位于所述所需匹配到的字符之后的字符串序列,如果否,则得到不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果是,则继续执行根据连续输入轨迹所划经的字符串序列中,位于所述所需匹配到的字符之后的字符串序列,从词库中匹配编码字符串候选项的操作,直至识别到连续输入轨迹所划经的最后一个字符为止。仍以图2和图6b为例,当匹配出“wo”之后,在“O”之后仍然有未识别的字符串序列“kmjhgfedfbn”则需要继续的这些字符串序列进行识别,直至字符串序列识别结束。在实际应用中,匹配出与连续输入轨迹中不同轨迹段的轨迹特征数据相匹配的至少一个候选项的过程中,需要按照预设的评价规则,确定出候选项的评价分数,以便后续进行候选项的展现。根据预设的评价规则,确定编码字符串候选项的评价分数的过程也就是依据各个评价因数来进行加权计算来确定各个候选项匹配度,在此不再赘述。在展现候选项之后还可以包括依据用户对展现的编码字符串候选项的选择结果和/或确认操作来执行字词输入。用户可以根据需要从候选项中进行选择并确认以进行字词输入,如果当前展现的候选项即为用户所需输入的候选项,则用户可以进行相应的确认操作以进行字词输入。展现各个候选项的过程具体为根据与各个候选项匹配的轨迹段之间的连接顺序关系,以及候选项的评价分数,展现候选项。需要说明的是,本发明的核心是识别出和整个轨迹的不同段落对应的多个词语,实施例中确定与候选项匹配的轨迹段,是为了便于表述候选项的连接顺序,当按照所述连续输入轨迹划经的字符串序列来进行循环识别时,其识别结果对应于划经的字符串序列中的不同段落,其本质也是对应于输入轨迹的不同段落。由前面匹配与连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的候选项的过程可以看出,从不同识别起点开始,匹配出的各个候选项所对应的轨迹段在连续输入轨迹中连接顺序关系是确定的,而各个轨迹段的连接关系也体现了各个编码字符串候选项与其上一级候选项或下一级候选项的关联关系。例如,以图7a和图7b所示的对输入“就很好”的字符串序列得到的连续输入轨迹,以及匹配编码字符串的过程为例,在以连续输入轨迹的轨迹起点为识别起点开始匹配出第一级编码字符串候选项“jiu”之后,将“u”键位之后的连续输入轨迹段作为新的当前轨迹段,并从该当前轨迹段中确定识别起点,则从该新的识别起点开始,匹配出“jiu”的下一级编码字符串候选项“henhao ”,其中,“ j iu ”对应的轨迹段从连续输入轨迹的起点到“u ”键位对应的位置,而“henhao”对应的轨迹段为“u”键位之后到该连续输入轨迹的终点。则“jiu”对应的轨迹段与“henhao”对应的轨迹段即为连续输入轨迹中具有前后连接关系的两个轨迹段,且在连续输入轨迹中划过“jiu”所对应的轨迹段的时刻要早于划过“很好”对应的轨迹段的时刻。换言之,也可以说在轨迹划经顺序上,连续输入轨迹中“jiu”对应的轨迹段的位于“henhao”对应的轨迹段之前,且“jiu”对应的轨迹段的尾端与“henhao”对应的轨迹段的首端相连。则进行候选项展现时,可以将“jiu”与“henhao”组合成组合编码字符串候选项进行展现。对于与“henhao”处于同一级的编码字符串候选项所对应的轨迹段,也是与“jiu”所对应的轨迹段的末端相连的轨迹段。但是与“henhao”对应的识别起点相同的其他编码字符串候选项所对应的轨迹段,与“henhao”对应的轨迹段之间则不存在前后顺次的连接关系。如“henhao”对应的轨迹段为从“u”键位之后到该条连续输入轨迹的终点之间的轨迹段,而“hen”对应的轨迹段为从“u”键位之后到“η”键位之间的轨迹段,可见“henhao”的起点和“hen ”对应的轨迹段的起点相同,但是“henhao ”对应的轨迹段的终点与“hen ”对应的轨迹段的终点并不相同,这两部分轨迹段有一部分区域是重合的,但是没有前后连接关系。相应的,由图7a和图7b可知,“hen”对应的轨迹段之后可以依次为“ha”和“so”对应的轨迹段,当然“hen”对应的轨迹段之后也可以完全是“hao”对应的轨迹段。因此,在进行编码字符串候选项的展现时,可以讲“jiu”与“hen”以及“hen”的下一级编码字符串候选项如“hao”进行组合展现,或者将“jiu”与“hen”、“hen”的下一级编码字符串“ha”、“ha”的下一级编码字符串候选项“so”依次进行组合,如“jiu hen ha so,,。对于匹配出的其他
编码字符串之间的组合以及展现过程与此类似,在此不一一列举。在实际应用中,展现候选项时,可以根据与各个候选项所匹配的轨迹段之间的连接顺序关系,将各个候选项进行组合,并根据候选项候选项的评价分数来确定组合后的编码字符串的评级分数,进而依据组合后的编码字符串的评价分数,展现组合编码字符串候选项。因此,其中一种展现方式为将对应的轨迹段具有连接关系的候选项作为待进行组合的待组合候选项,并将待组合候选项进行组合,得到组合候选项。依据待组合候选项的评价分数,确定组合候选项在候选栏中的展现顺序并进行展现。所述候选栏既可以显示在键盘布局上的独立的区域,也可以直接在位显示于输入的目标位置。为了便于用户对组合候选项中的各个单独的候选项进行选择,在展现所述组合候选项时,将组合候选项中包含的各个候选项进行区分显示。具体的区分显示包括采用颜色区分组合候选项中包含的各个候选项;或者,在组合候选项的各个候选项之间设置空格或标识符,如利用I ”、空格等,或不同的候选项采用不同的颜色和字体进行区分组合候选项中包含的各个候选项。相应的,依据用户对展现的候选项的选择结果执行字词输入,包括接收用户点击所展现的组合候选项中的候选项的操作,并展现与用户所点击的候选项处于同一级的候选项,以便用户从新展现的候选项中进行选择执行字词输入,并更新该组合候选项中位于用户所点击的候选项之后的候选项;其中,与用户所点击的候选项处于同一级的候选项所匹配的轨迹段的轨迹起点,与用户所点击的候选项所匹配的轨迹段的轨迹起点相同。如图7b所示,首先确定以轨迹起点作为识别起点匹配出的第一级编码字符串候选项中评价分数最高的候选项,即“jiu”,确定“jiu”的下一级编码字符串候选项中评价分数最高的候选项即“henhao”,将“jiu”与“henhao”组合,得到组合后的编码字符串候选项“jiu henhao”(一般会同时展现“就很好”)并进行展现。如图11示出了为对图7a中连续输入轨迹进行识别后,展现匹配出的候选项展现,并依据用户的选择结果对展现的候选项进行调整的示意图。以输入“jiuhenhao”为例,在图11中在候选栏将候选项“jiu”、“henha0”组合成一个组合候选项进行展现,但是这两个候选项之间用空格进行区分。当用户点击“henhao”候选项以后,弹出列表显示了与“henhao”处于同级的候选项(具体可以参见图7b ),包括“henhao ”、“hen ”、“ gen ”、“he ”、“ ge ”等,这些候选项中“henhao”对应一个路径段落,“gen”、“hen”对应一个路径段落,“he”、“ge”对应一个路径段落。假设用户选择了“hen”,参见图7b,则将显示出“hen”的后续首选候选项“hao”,点击“hao”,弹出选择列表列出了“hao”、“ha”,用户可以按需进行选择。对于词语较多的一个识别结果,如果更改前面的候选项,可能会导致后面所有的识别结果发生巨大的变化。当然,在展现时可以仅将各级候选项中评价分数最高的候选项组合后进行展现,也可以同时展现多个组合后的候选项,以便用户从中进行选择所需候选项。例如,在图7b中展现“jiu henhao”时,还可以展现组合候选项“ jiuhen hao”、“jiuge hao”等等,展现的顺序可以依据组合后的编码字符串候选项的评分高低进行展现。在实际应用中,如果将编码字符串转换为相应的词条后选项时,则可以将组合后
的词条后选项进行展现,如将“jiu “转换为汉字“就”(“就”是编码“jiu”对应的词条中频最高的),将“henhao “转化为汉字“很好”(“很好”是编码“henhao”对应的词条中词频最高的),并将”就“与“很好”组合成“就很好”来进行展现。词条的转换(或获取)过程,并不局限于显示阶段,在识别过程中,尤其是进行识别结果评分计算前,词条就可以完成获取以便于依据具体的词条进行评分计算,如同样对于编码“jiu”,其可选的词包括“就”、“酒”、“旧”等很多个,每个词条的词频,以及其和前后词条的词法匹配度可能都不一样,因此词条本身的词频、词性等属性用于识别过程是有利于提升识别结果的准确度的。展现过程中通常可以将编码和词条同时对照展现以方便用户进行编辑。另外,在实际应用中评分最高的编码字符串有可能不是用户最想要输入的字词对应的编码字符串候选项,因此,为了便于用户对展现的编码字符串进行选择,且用户能较快的选择出自己所需的编码字符串候选项,因此,在确定编码字符串候选项,在展现编码字符串候选项时,也可以是先展现出以轨迹起点作为识别起点匹配出的第一级编码字符串候选项,然后展现用户选择的编码字符串候选项的下一级编码字符串候选项,并继续根据用户的选择结果进行后续编码字符串候选项的展现。即,另外一种展现编码字符串候选项或者是词条候选项的方式为将各个编码字符串候选项所对应的轨迹段之间的前后连接关系作为各个编码字符串候选项的展现次序的依据,确定各个编码字符串候选项和/或编码字符串对应的词条的展现批次;依据所述展现批次,将处于同一展现批次的编码字符串候选项和/或词条候选项在候选栏中进行展现,并依据同一展现批次的编码字符串候选项和/或词条候选项的评分,确定候选栏中各个编码字符串候选项和/或词条候选项的展现顺序。相应的,依据用户对展现的编码字符串候选项的选择结果和/或确认操作来执行字词输入具体为根据用户对候选栏中展现的同一批次的编码字符串候选项和/或词条候选项的选择结果执行输入操作,并执行展现与位于所述选择结果之后的下一批次的编码字符串候选项和/或词条候选项的操作,以便用户进行选择输入直至结束。例如,图7b中,可以首先按照第一级编码字符串候选项的评分,在候选栏中依次展现出^11”、^”、^1^”等第一级编码字符串候选项,如果用户选择^1!”,则继续展现出“jiu”的下一级编码字符串候选项,即依次展现“henha0”、“hen”、“gen”、“he”等,如果用户选择的是“hen”,则继续展现“hen”的下一级编码字符串候选项,以供用户进行选择。当词库中缺乏用户所需的词语时,用户可以通过交互选择得到预期的输入结果,但效率较低,为了方便下次输入,还可以根据实际情况来对词库进行更新,本发明中在候选栏中展现所述候选项之后,还包括当检测到触点在所述候选栏中的滑动操作满足预设的处理指令条件时,依据所述滑动轨迹确定待处理的候选项,并在检测到触点抬起的操作时,执行预设的处理指令。所述预设的处理指令包括将待处理的候选项组合成一个词组,将该词组添加到所述词库中;将待处理的候选项从候选项展现区域中删除,如从指定候选项栏中删除该待处理的候选项;将待处理的候选项从候选项展现区域中删除,并接收用户在键盘区域上的连续滑动操作,获取当前时刻输入的连续输入轨迹,将与当前时刻的连续输入轨迹的轨迹特征数据相匹配的候选项替换该待处理候选项。这样设计的好处是将候选栏的编辑操作手势和选词手势结合在一起,操作更加方便。如预设的处理的指令对应的滑动操作为用户在划经候选栏的手势为顺时针画圈,或者从做向右划线,则,当检测到用户发出相应滑动操作时依据所述滑动轨迹确定待处理的候选项,将其组合成一个词组,将该词组添加到词库中。当用户采用画圈手势时,依据所述滑动轨迹确定待增加的新词的方式还可以是确定包含在所述手势轨迹内的候选项。类似的,假设从候选栏中删除候选项的指令对应的滑动操作为用户在划经候选栏的手势为逆时针画圈,或者从右向左划线,则,当检测到用户发出相应滑动操作时依据所述滑动轨迹确定待处理的候选项,从候选栏上删除候选项的指令。依据所述滑动轨迹确定待处理的候选项的方法包括获取根据轨迹划经的候选项,或者,当用户采用画圈手势时,确定包含在所述手势轨迹内的候选项。例如,假设用户的真实意图是为了输入“就很高”,而系统自动识别并展现的结果为“就很好”,通过交互选择后找到了自己所需要的目标候选词即“就很高”之后,如果用户需要将“很高”加入词库,则只需要用手势从左向右依次划过“很”和“高”参见图12a,或者顺时针画一个圈将“很”和“高”包住,参见图12b,词语“很高”及其对应的编码“hengao”即被存入词库,存入的词库可以是系统词库,也可以是用户词库。存入词库后,当用户再次输入相同手势的时候,即可得到包括词语“很高”在内的候选项了。删除操作的执行方式类似,如当用户从右向左划线或者用逆时针画圈的方式划经候选项“很好”时,则触发系统将候选项“很好”将从候选栏中删除。另一种指令是对候选栏上的候选项进行删除后用下一次的输入识别结果作为其替代内容,比如,用V型滑动手势划经需要替换的候选项,则相关候选项将被删除,同时继续接收用户在键盘区域的输入手势,将其识别结果插入到被删除候选项的位置。通常,当候选栏既显示字符串编码又显示词条时,确定待处理的候选项时,通常可以以其中一种如词条作为判断依据,而处理过程则往往进行同步处理,如将选中的词条与对应的编码同时加入词库,将选中的词条与编码同时删除,当然,这只是一种优选的方式而已。假设之前输入的路径识别结果为“我们别绘出系”,用户可以通过预设的“V”型手势划过候选项“别”,则“别”将被删除,且接收用户重新手势输入“不”对应的连续输入轨迹,将其插入之前与候选项“别”所匹配的轨迹段的位置,则重新识别出的结果为“我们不会出席”。本实施例中,插入新的识别结果后,整个识别结果执行了重新优化。对于一些语目的输入法而目,编码和词语本身是相同的,如直接利用qwerty键盘输入英语单词时,编码就是单词本身,而对另一些输入法而言,编码和词语本身并不相同,编码和实际的词语是对应关系,识别过程的大部分计算既可能与编码相关,如本发明的路径匹配度、编码的长度、词频,也可能与词语本身有关,如词频,词法规则匹配度等。以通过词频调整评分为例,如在编码与词语本身并不一一对应的情况下,计算候选项的匹配度时,除了可以使用编码的词频,还可以使用与编码对应的词语的词频,如相同编码中词频最高的词语的词频,或者前几位最高的词频的均值,甚至评分也可以基于词语进行计算,词法规则匹配度用于计算评分则对于词语更适用,为相同编码的不同词语计算出各自的分数。对于识别结果候选项的交互编辑,既可以针对编码,也可以针对词语,如前面实施例中的选词操作中,也可以直接点击候选词“很好”将其替换成“跟”,然后后续选择列表包括“好”和“哈”等,其思路是类似的,不再赘述。为便于描述,本发明的识别计算与交互过程主要以编
码进行描述,这些处理方法与交互过程一定程度上也适用于词语,具体实施时可灵活采用。在本发明中,从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项的执行过程还可以在服务器端进行,因此本发明还提供了另一种基于多词连续输入的字词识别方法,该方法应用于由电子设备和服务器组成的系统中。其中,电子设备检测到键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据后,将至少包含所述轨迹特征数据信息发送至指定的服务器中。该服务器依据接收到至少包含所述轨迹特征数据信息的信息,从其预置的词库中匹配出与该连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,并将匹配出的与该连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,返回给检测连续输入轨迹的电子设备。该电子设备接收该服务器返回与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。其中,发送到服务器中的信息中包含的轨迹特征数据具体可以包括该连续输入轨迹的起点、终点、该连续输入轨迹在该键盘布局上划经的字符序列以及划经的路径,以及键盘布局的相关信息,如该键盘上的键位布局信息,该连续输入轨迹在特定按键上的进入角度、离去角度,轨迹的拐点信息等等。另外,电子设备发送到服务器端的该至少包含轨迹特征数据的信息可以是直接进行发送,也可以将在电子设备侧该轨迹特征数据进行相应的转换生成识别条件后发送至服务器。电子设备上发送的信息还可以包含键盘布局信息,该键盘布局数据既可以是服务器上预置的多种键盘布局的选择设置,如可以在服务器上设置与不同常规客户端分辨率对应的键盘布局并分配相应标识,客户端发送键盘布局信息时可以只需要按约定的协议发送相关键盘布局标识即可,当然,所述键盘布局数据也可以是客户端设备使用的具体的键位布置数据。在该服务器端依据接收到的包含轨迹特征数据和键盘布局数据的信息,从词库中匹配出与该连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项的过程与在该电子设备本地所作的操作过程相同。需要说明的是,无论是从电子设备侧还是服务器侧执行从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项的过程都相同,因此,在服务器侧执行匹配与不同轨迹段的轨迹特征数据相匹配的候选项的操作过程可以参照前面任意一个实施例中相应的描述,在此不再赘述。对应本发明的方法,本发明还提供了一种基于多词连续输入的字词识别装置,参见图13,示出了本发明一种基于多词连续输入的字词识别装置的一个实施例的结构示意图,在本实施例中该装置包括词库1310、轨迹检索单元1320、轨迹数据信息获取单元1330和字词匹配单元1340。其中,词库1310,存储有若干字词候选项以及词频。该字词候选项可以包括编码字符串组成的字词,即编码字符串候选项,如 中文拼音编码,或者是英文字词等;还包括由一个或多个汉字组成的词条候选项。轨迹检索单元1320,用于检测键盘区域上的连续输入轨迹。轨迹数据信息获取单元1330,用于获取所述连续输入轨迹的轨迹特征数据,其中,所述连续输入轨迹与用户待输入的编码字符串在键盘布局上的相应按键序列位置相关。字词匹配单元1340,用于从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。其中,所述轨迹数据信息获取单元1330具体为依据键盘布局,确定所述连续输入轨迹的轨迹特征数据,其中,所述轨迹特征数据包括所述连续输入轨迹的轨迹起点、划经的路径、划经的字符以及轨迹终点。字词匹配单元匹配编码字符串候选项的过程有多种,参见图14,示出了本发明一种基于多词连续输入的字词识别装置另一个实施例的结构示意图,本实施例与图13所示实施例的不同之处在于,本实施例的字词匹配单元1340包括候选项检索单元1341,用于根据所述连续输入轨迹中未识别的轨迹段的轨迹特征数据,从词库中匹配出候选项时,确定轨迹特征数据与所述匹配出的候选项匹配的轨迹段;循环判断单元1342,用于在候选项检索单元匹配出候选项并确定出与该候选项匹配的轨迹段时,判断所述连续输入轨迹中,位于该轨迹段之后的连续输入轨迹是否已经识别完毕,并当确定出连续输入轨迹中位于该轨迹段之后仍存在未识别轨迹段时,则返回执行候选项检索单元的操作,直至连续输入轨迹中不存在未识别的轨迹段,得到与不同轨迹段的轨迹特征数据相匹配的候选项。进一步的,所述候选项检索单元具体1341可以包括初始起点设定单元和候选项循环匹配单元。其中,初始起点设定单元,用于将所述连续输入轨迹的轨迹起点作为当前识别起点,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为当前轨迹段,并执行候选项循环匹配单元的操作。候选项循环匹配单元,用于根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项并执行所述判断单元的操作。相应的,循环判断单元1342,包括循环判断子单元和循环起点设定单元。其中,循环判断子单元,用于判断所述当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作;所述循环起点设定单元,用于将所述连续输入轨迹中位于所述当前候选项匹配的轨迹段之后的轨迹段作为当前轨迹段,并将该当前轨迹段的起点作为新的当前识别起点,并触发执行候选项循环匹配单元的操作,以得到所述当前候选项的下一级候选项。进一步的,该轨迹数据信息获取单元1330获取到的轨迹特征数据还包括所述连续输入轨迹所划经的至少一个分词标识;相应的,候选项检索单元1341还包括分词标识判断单元,用于在所述初 始起点设定单元设定了所述当前识别起点之后,判断所述当前识别起点之后的连续输入轨迹中是否包含分词标识,如果是,则执行最近分词标识确定单元的操作;如果否,则执行第二候选项循环匹配单元的操作。最近分词标识确定单元,用于确定所述连续输入轨迹中位于所述当前识别起点之后,且距离所述当前识别起点最近的分词标识,并执行第一候选项循环匹配单元的操作;与此对应的,该循环匹配单元包括第一循环匹配单元,用于根据所述当前识别起点至所述分词标识之间的连续输入轨迹的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项,并执行分词循环确定单元的操作;第二循环匹配单元,具体为用于根据所述连续输入轨迹中位于当前识别起点之后的轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项作为当前候选项,并执行循环判断子单元的操作;该装置还包括分词循环确定单元,用于判断所述当前识别起点到所述最近的分词标识之间的连续输入轨迹是否识别结束,如果是,则在所述最近的分词标识之后的连续输入轨迹中设置新的当前识别起点,并返回执行所述分词标识判断单元的操作;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并将所述连续输入轨迹中位于当前候选项所匹配的轨迹段的终点至所述最近分词标识之间的连续输入轨迹作为当前轨迹段,并将当前轨迹段的起点作为新的当前识别起点,返回执行所述第一循环匹配单元,以得到所述当前候选项的下一级候选项。相应的,该循环判断子单元具体为,用于判断连续输入轨迹中位于所述当前识别起点之后的轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作;该循环起点设定单元,具体为用于将当前轨迹段的起点作为新的当前识别起点,返回执行所述第二候选项循环匹配单元的操作,以得到所述当前候选项的下一级候选项。对应候选项循环匹配单元匹配候选项的一种方式,该候选项循环匹配单元,具体包括第一检索单元,用于从词库中检索待定编码字符串候选项;待匹配轨迹段确定单元,用于确定待定编码字符串候选项在所述当前轨迹段上所对应的识别终点,将所述当前识别起点与所述识别段终点之间的轨迹作为待匹配轨迹段;键位数据确定单元,用于确定所述待定编码字符串候选项中的各个字符在键盘布局上的键位数据;候选项确定单元,用于当确定出所述待定编码字符串候选项中的各个字符的键位数据与所述待匹配轨迹段的轨迹特征数据的匹配度满足预设条件时,将待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为以当前识别起点开始的轨迹段对应的候选项;相应的,该循环判断子单元,具体为用于判断所述当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则将所述待匹配轨迹段作为轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作。对应本发明匹配候选项的另一种 方式,参见图15为本发明中该字词匹配单元的另一种结构示意图,在本实施例中该字词匹配单元1340,包括划经字符串确定单元1343、第二检索单元1344、候选项匹配单元1345和字符串识别判断单元1346。其中,划经字符串确定单元1343,用于确定所述连续输入轨迹所划经的字符串序列。第二检索单元1344,用于依据所述连续输入轨迹所划经的字符串序列,从词库中检索编码字符串候选项。候选项匹配单元1345,用于依据所述编码字符串候选项中所包含的字符与连续输入轨迹所划经的字符串序列中的对应关系,确定与该编码字符串候选项所对应的待匹配的轨迹段,当编码字符串候选项与该待匹配的轨迹段的轨迹特征数据的匹配程度达到预设值时,将该编码字符串候选项和/或该编码字符串候选项转换出的词条候选项作为与该待匹配轨迹段的轨迹特征数据相匹配的候选项,并将该候选项作为当前候选项。字符串识别判断单元1346,用于判断连续输入轨迹所划经的字符串序列中是否仍存在位于该当前候选项对应的编码字符串的尾字母之后的字符串序列,如果否,则得到不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果是,则继续执行根据连续输入轨迹所划经的字符串序列中,位于当前候选项对应的编码字符串的尾字母之后的字符串序列,从词库中匹配编码字符串候选项的操作,并执行候选项匹配单元的操作,直至识别到连续输入轨迹所划经的最后一个字符为止。在本发明以上任意一个实施例的装置中,还可以包括评分确定单元,用于按照预设的评价规则,确定出候选项的评价分数;展现单元,用于根据与各个候选项匹配的轨迹段之间的连接顺序关系,以及候选项的评价分数,展现候选项;字词输入单元,用于依据用户对展现的候选项选择结果和/或确认操作执行字词输入。具体的,该评分确定单元,具体为用于根据预置的评价因数,计算所述候选项的评价评分;其中,所述评价因数包括以下任意一种或几种候选项的词频、候选项的词法规则匹配度、候选项与其相匹配的轨迹段的路径匹配度、该候选项对应的编码字符串中的字符个数、与候选项所匹配的轨迹段长度、与候选项所匹配的轨迹段所划经的字符个数和/或连续输入轨迹段所划经的字符个数。进一步的,该评分确定单元,根据预置的评价因数,计算候选项的评价分数时,其中所述评价因数还包括以下任意一种或几种候选项是否存在与其对应的下一级候选项、该候选项的下一级候选项的评价分数,其中,候选项的下一级候选项为以该候选项所匹配的轨迹段的终点作为识别起点匹配出的候选项。另一方面,本发明还提供了一种基于多词连续输入的字词识别系统,参见图16,示出了本发明一种基于多词连续输入的字词识别系统,该系统包括电子设备I和服务器2 ;所述电子设备1,用于检测键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据,将至少包含所述轨迹特征数据的信息发送至指定的服务器,并接收所述服务器返回与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项;其中,所述连续输入轨迹与用 户待输入的编码字符序列在键盘布局上的位置相关;所述轨迹特征数据至少包括所述连续输入轨迹的轨迹起点、在所述键盘布局上划经的路径、划经的字符以及轨迹终点;所述服务器2,用于接收所述电子设备发送的至少包含所述轨迹特征数据的信息的数据;依据所述信息,从词库中匹配出与所述连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,并将匹配出的候选项返会给所述电子设备。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
权利要求
1.一种基于多词连续输入的字词识别方法,其特征在于,包括 检测键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据,其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上的位置相关; 从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。
2.根据权利要求I所述的方法,其特征在于,所述连续输入轨迹的轨迹特征数据包括所述连续输入轨迹的轨迹起点、划经的路径以及轨迹终点; 所述从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,具体为 依据所述键盘布局,从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。
3.根据权利要求I所述的方法,其特征在于,获取所述连续输入轨迹的轨迹特征数据,包括 依据键盘布局,确定所述连续输入轨迹的轨迹特征数据,其中,所述轨迹特征数据包括所述连续输入轨迹的轨迹起点、划经的路径、划经的字符以及轨迹终点。
4.根据权利要求2或3所述的方法,其特征在于,所述从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,包括 根据所述连续输入轨迹的轨迹特征数据,从词库中匹配出候选项时,确定轨迹特征数据与所述匹配出的候选项匹配的轨迹段,判断所述连续输入轨迹中,位于该轨迹段之后的连续输入轨迹是否已经识别完毕; 如果该轨迹段之后的连续输入轨迹尚未识别完毕,则根据未识别的轨迹段的轨迹特征数据,执行从词库中匹配候选项的操作,直至连续输入轨迹识别结束,得到与连续输入轨迹中各个轨迹段的轨迹特征数据相匹配的候选项。
5.根据权利要求I至4任一项所述的方法,其特征在于,从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项具体包括 A、将所述连续输入轨迹的轨迹起点作为当前识别起点,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为当前轨迹段; B、根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项并执行步骤C ; C、判断所述当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行步骤D ; D、将所述连续输入轨迹中位于所述当前候选项匹配的轨迹段之后的轨迹段作为当前轨迹段,并将该当前轨迹段的起点作为新的当前识别起点,返回执行步骤B,以得到所述当前候选项的下一级候选项。
6.根据权利要求5所述的方法,其特征在于,所述轨迹特征数据中还包括连续输入轨迹所划经的至少一个分词标识; 所述步骤A之后还包括 El、判断所述当前识别起点之后的连续输入轨迹中是否包含分词标识,如果是,则进入步骤E2 ;如果否,则进入B2 ; E2、确定所述连续输入轨迹中位于所述当前识别起点之后,且距离所述当前识别起点最近的分词标识,并执行BI ; 所述步骤B中包括 BI、根据所述当前识别起点至所述分词标识之间的连续输入轨迹的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项,并进入步骤E3 ; B2、根据所述连续输入轨迹中位于当前识别起点之后的轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项作为当前候选项,并进入步骤C ; 所述步骤BI之后还包括 E3、判断所述当前识别起点到所述最近的分词标识之间的连续输入轨迹是否识别结束,如果是,则在所述最近的分词标识之后的连续输入轨迹中设置新的当前识别起点,并返回执行步骤El ;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并将所述连续输入轨迹中位于当前候选项所匹配的轨迹段的终点至所述最近分词标识之间的连续输入轨迹作为当前轨迹段,并将当前轨迹段的起点作为新的当前识别起点,返回执行步骤BI,以得到所述当前候选项的下一级候选项; 所述步骤C中判断所述当前轨迹段是否识别结束,具体为判断连续输入轨迹中位于所述当前识别起点之后的轨迹段是否识别结束; 所述步骤D中所述将当前轨迹段的起点作为新的当前识别起点,返回执行步骤B,具体包括 将当前轨迹段的起点作为新的当前识别起点,返回执行步骤B2,以得到所述当前候选项的下一级候选项。
7.根据权利要求5所述的方法,其特征在于,根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,具体包括 从词库中检索待定编码字符串候选项; 确定待定编码字符串候选项在所述当前轨迹段上所对应的识别终点,将所述当前识别起点与所述识别终点之间的轨迹作为待匹配轨迹段; 确定所述待定编码字符串候选项中的各个字符在键盘布局上的键位数据; 当确定出所述待定编码字符串候选项中的各个字符的键位数据与所述待匹配轨迹段的轨迹特征数据的匹配度满足预设条件时,将待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为以当前识别起点开始的轨迹段对应的候选项; 所述确定出当前候选项所匹配的轨迹段,具体为将所述待匹配轨迹段作为轨迹特征数据与当前候选项匹配的轨迹段。
8.根据权利要求2或3所述的方法,其特征在于,从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,包括 确定所述连续输入轨迹所划经的字符串序列; 依据所述连续输入轨迹所划经的字符串序列,从词库中检索待定编码字符串候选项; 依据所述待定编码字符串候选项中所包含的字符与连续输入轨迹所划经的字符串序列中的对应关系,确定与该待定编码字符串候选项所对应的待匹配的轨迹段,当所述待定编码字符串候选项与该待匹配的轨迹段的轨迹特征数据的匹配程度达到预设值时,将该待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为与该待匹配轨迹段的轨迹特征数据相匹配的候选项,并将该候选项作为当前候选项,确定在连续输入轨迹所划经的字符串序列中,匹配出该当前候选项所对应的编码字符串时所需匹配到的字符; 判断连续输入轨迹所划经的字符串序列中是否仍存在位于所述所需匹配到的字符之后的字符串序列,如果否,则得到不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果是,则继续执行根据连续输入轨迹所划经的字符串序列中,位于所述所需匹配到的字符之后的字符串序列,从词库中匹配待定编码字符串候选项的操作,直至识别到连续输入轨迹所划经的最后一个字符为止。
9.根据权利要求7或8所述的方法,其特征在于,利用如下任一种或几种参数来计算待定编码字符串候选项与所述待匹配轨迹段的轨迹特征数据的匹配度 将当前识别起点、待定编码字符串中的各个字符在键盘布局中预设的标志点以及所述待匹配轨迹段的终点顺次连线得到标准键位连线,该标准键位连线的长度与所述待匹配轨迹段的长度的关系; 所述待定编码字符串中的各个字符在键盘布局中预设的标志点与所述待匹配轨迹段的距离; 所述待匹配轨迹段所划经的字符中不属于所述待定编码字符串候选项中的字符,距离所述待定编码字符串候选项中各个字符在所述键盘布局中顺次连线得到的标准键位连线轨迹的总距离; 待定编码字符串候选项中的各个字符在所述键盘布局中的标准键位连线与所述待匹配轨迹段所组成的封闭区域面积。
10.根据权利要求7所述的方法,其特征在于,根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以所述当前识别起点开始的轨迹段对应候选项时,还包括 接收调整匹配度阈值的指令;保存当前的匹配度阈值,将匹配度阈值调整为新的匹配度阈值;根据调整后的匹配度阈值,从词库中匹配出与当前轨迹特征数据的匹配度在所述调整后的阈值范围内的至少一个候选项; 将匹配度阈值恢复为之前保存的匹配度阈值。
11.根据权利要求5所述的方法,其特征在于,在执行所述步骤B时,如果以当前识别起点开始的预设长度内的轨迹段中无法匹配出候选项时,则将当前识别起点向后移动,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为新的当前轨迹段,继续执行从词库中匹配与该当前识别起点之后的轨迹段的轨迹特征数据相匹配的候选项的操作。
12.根据权利要求I所述的方法,其特征在于,还包括 按照预设的评价规则,确定出候选项的评价分数; 根据与各个候选项匹配的轨迹段之间的连接顺序关系,以及候选项的评价分数,展现候选项。
13.根据权利要求12所述的方法,其特征在于,还包括 依据用户对展现的候选项选择结果和/或确认操作执行字词输入。
14.根据权利要求12所述的方法,其特征在于,确定所述候选项的评价分数,包括 根据预置的评价因数,计算所述候选项的评价分数; 其中,所述评价因数包括以下任意一种或几种候选项的词频、候选项的词法规则匹配度、候选项与其相匹配的轨迹段的路径匹配度、该候选项对应的编码字符串中的字符个数、与候选项所匹配的轨迹段长度、与候选项所匹配的轨迹段所划经的字符个数和/或连续输入轨迹段所划经的字符个数。
15.根据权利要求14所述的方法,其特征在于,所述评价因数还包括以下任意一种或几种候选项是否存在与其对应的下一级候选项、该候选项的下一级候选项的评价分数,其中,候选项的下一级候选项为以该候选项所匹配的轨迹段的终点作为识别起点匹配出的候选项。
16.根据权利要求14所述的方法,其特征在于,利用所述路径匹配度计算候选项的评价分数,包括 将与候选项所匹配的轨迹段的起点、该候选项对应的编码字符串中各个字符在键盘布局中的标志点、与候选项所匹配的轨迹段的终点依次相连组成标准键位连线; 计算所述标准键位连线与该候选项匹配的轨迹段所构成的闭合区域的面积值; 根据所述闭合区域的面积值确定路径匹配度。
17.根据权利要求13所述的方法,其特征在于,所述根据与各个候选项匹配的轨迹段之间的连接顺序关系,以及候选项的评价分数,展现候选项,具体为 将所匹配的轨迹段具有连接关系的候选项作为待进行组合的待组合候选项,将所述待组合候选项进行组合,得到组合候选项; 依据组合候选项的评价分数,确定组合候选项的展现顺序并进行展现; 在展现所述组合候选项时,将所述组合候选项中包含的各个候选项进行区分显示,其中,所述区分显示包括采用颜色区分组合候选项中包含的各个候选项;或者,在组合候选项的各个候选项之间设置空格或标识符; 依据用户对展现的候选项的选择结果执行字词输入,包括 接收用户点击所展现的组合候选项中的候选项的操作,并展现与用户所点击的候选项处于同一级的候选项,以便用户从新展现的候选项中进行选择执行字词输入,并更新该组合候选项中位于用户所点击的候选项之后的候选项; 其中,与用户所点击的候选项处于同一级的候选项所匹配的轨迹段的轨迹起点,与用户所点击的候选项所匹配的轨迹段的轨迹起点相同。
18.根据权利要求12所述的方法,其特征在于,在展现所述候选项之后,还包括 当检测到触点在候选项展现区域的滑动操作满足预设指令触发条件时,依据所述触点的滑动轨迹确定待处理的候选项,并在检测到触点抬起的操作时,执行所述预设指令; 其中,所述预设指令包括 将待处理的候选项组合成一个词组,将该词组添加到所述词库中; 将待处理的候选项从候选项展现区域删除; 将待处理的候选项从候选项展现区域删除,并接收用户在键盘区域上的连续滑动操作,获取当前时刻输入的连续输入轨迹,并利用与所述当前时刻的连续输入轨迹的轨迹特征数据相匹配的候选项替换所述待处理的候选项。
19.一种基于多词连续输入的字词识别方法,其特征在于,包括 电子设备检测键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据,其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上的位置相关; 所述电子设备,将至少包含所述轨迹特征数据的信息发送至指定的服务器; 所述服务器依据所述信息,从词库中匹配出与所述连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,并将匹配出的候选项返会给所述电子设备; 所述电子设备接收所述服务器返回与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。
20.一种基于多词连续输入的字词识别装置,其特征在于,包括 词库; 轨迹检索单元,用于检测键盘区域上的连续输入轨迹; 轨迹数据信息获取单元,用于获取所述连续输入轨迹的轨迹特征数据,其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上位置相关; 字词匹配单元,用于从预置的词库中匹配出与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。
21.根据权利要求20所述的装置,其特征在于,所述轨迹数据信息获取单元具体为依据键盘布局,确定所述连续输入轨迹的轨迹特征数据,其中,所述轨迹特征数据包括所述连续输入轨迹的轨迹起点、划经的路径、划经的字符以及轨迹终点。
22.根据权利要求20或21所述的装置,其特征在于,字词匹配单元包括 候选项检索单元,用于根据所述连续输入轨迹中未识别的轨迹段的轨迹特征数据,从词库中匹配出候选项时,确定轨迹特征数据与所述匹配出的候选项匹配的轨迹段; 循环判断单元,用于在候选项检索单元匹配出候选项并确定出与该候选项匹配的轨迹段时,判断所述连续输入轨迹中,位于该轨迹段之后的连续输入轨迹是否已经识别完毕,并当确定出连续输入轨迹中位于该轨迹段之后仍存在未识别轨迹段时,则返回执行候选项检索单元的操作,直至连续输入轨迹中不存在未识别的轨迹段,得到与不同轨迹段的轨迹特征数据相匹配的候选项。
23.根据权利要求22所述的装置,其特征在于,所述候选项检索单元具体包括 初始起点设定单元,用于将所述连续输入轨迹的轨迹起点作为当前识别起点,并将所述连续输入轨迹中位于当前识别起点之后的轨迹段作为当前轨迹段,并执行候选项循环匹配单元的操作; 候选项循环匹配单元,用于根据当前轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项并执行所述判断单元的操作; 所述循环判断单元,包括 循环判断子单元,用于判断所述当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作; 所述循环起点设定单元,用于将所述连续输入轨迹中位于所述当前候选项匹配的轨迹段之后的轨迹段作为当前轨迹段,并将该当前轨迹段的起点作为新的当前识别起点,并触发执行候选项循环匹配单元的操作,以得到所述当前候选项的下一级候选项。
24.根据权利要求23所述的装置,其特征在于,所述轨迹数据信息获取单元获取到的轨迹特征数据还包括所述连续输入轨迹所划经的至少一个分词标识; 所述候选项检索单元还包括 分词标识判断单元,用于在所述初始起点设定单元设定了所述当前识别起点之后,判断所述当前识别起点之后的连续输入轨迹中是否包含分词标识,如果是,则执行最近分词标识确定单元的操作;如果否,则执行第二候选项循环匹配单元的操作; 所述最近分词标识确定单元,用于确定所述连续输入轨迹中位于所述当前识别起点之后,且距离所述当前识别起点最近的分词标识,并执行第一候选项循环匹配单元的操作; 所述循环匹配单元包括 第一循环匹配单元,用于根据所述当前识别起点至所述分词标识之间的连续输入轨迹的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项分别作为当前候选项,并执行分词循环确定单元的操作; 第二循环匹配单元,具体为用于根据所述连续输入轨迹中位于当前识别起点之后的轨迹段的轨迹特征数据,从词库中匹配出至少一个以当前识别起点开始的轨迹段对应的候选项,将匹配出的候选项作为当前候选项,并执行循环判断子单元的操作; 所述装置还包括 分词循环确定单元,用于判断所述当前识别起点到所述最近的分词标识之间的连续输入轨迹是否识别结束,如果是,则在所述最近的分词标识之后的连续输入轨迹中设置新的当前识别起点,并返回执行所述分词标识判断单元的操作;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并将所述连续输入轨迹中位于当前候选项所匹配的轨迹段的终点至所述最近分词标识之间的连续输入轨迹作为当前轨迹段,并将当前轨迹段的起点作为新的当前识别起点,返回执行所述第一循环匹配单元,以得到所述当前候选项的下一级候选项; 所述循环判断子单元,用于判断连续输入轨迹中位于所述当前识别起点之后的轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则确定出轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作; 所述循环起点设定单元,具体为用于将当前轨迹段的起点作为新的当前识别起点,返回执行所述第二候选项循环匹配单元的操作,以得到所述当前候选项的下一级候选项。
25.根据权利要求23所述的装置,其特征在于,所述候选项循环匹配单元,具体包括 第一检索单元,用于从词库中检索待定编码字符串候选项; 待匹配轨迹段确定单元,用于确定待定编码字符串候选项在所述当前轨迹段上所对应的识别终点,将所述当前识别起点与所述识别段终点之间的轨迹作为待匹配轨迹段; 键位数据确定单元,用于确定所述待定编码字符串候选项中的各个字符在键盘布局上的键位数据; 候选项确定单元,用于当确定出所述待定编码字符串候选项中的各个字符的键位数据与所述待匹配轨迹段的轨迹特征数据的匹配度满足预设条件时,将待定编码字符串候选项和/或该待定编码字符串候选项转换出的词条候选项作为以当前识别起点开始的轨迹段对应的候选项; 所述循环判断子单元,具体为用于判断所述当前轨迹段是否识别结束,如果是,则得到与不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果否,则将所述待匹配轨迹段作为轨迹特征数据与当前候选项匹配的轨迹段,并执行循环起点设定单元的操作。
26.根据权利要求20或21所述的装置,其特征在于,字词匹配单元,包括 划经字符串确定单元,用于确定所述连续输入轨迹所划经的字符串序列; 第二检索单元,用于依据所述连续输入轨迹所划经的字符串序列,从词库中检索编码字符串候选项; 候选项匹配单元,用于依据所述编码字符串候选项中所包含的字符与连续输入轨迹所划经的字符串序列中的对应关系,确定与该编码字符串候选项所对应的待匹配的轨迹段,当编码字符串候选项与该待匹配的轨迹段的轨迹特征数据的匹配程度达到预设值时,将该编码字符串候选项和/或该编码字符串候选项转换出的词条候选项作为与该待匹配轨迹段的轨迹特征数据相匹配的候选项,并将该候选项作为当前候选项; 字符串识别判断单元,用于判断连续输入轨迹所划经的字符串序列中是否仍存在位于该当前候选项对应的编码字符串的尾字母之后的字符串序列,如果否,则得到不同轨迹段的轨迹特征数据相匹配的至少一个候选项;如果是,则继续执行根据连续输入轨迹所划经的字符串序列中,位于当前候选项对应的编码字符串的尾字母之后的字符串序列,从词库中匹配编码字符串候选项的操作,并执行候选项匹配单元的操作,直至识别到连续输入轨迹所划经的最后一个字符为止。
27.根据权利要求20所述的装置,其特征在于,还包括 评分确定单元,用于按照预设的评价规则,确定出候选项的评价分数; 展现单元,用于根据与各个候选项匹配的轨迹段之间的连接顺序关系,以及候选项的评价分数,展现候选项; 字词输入单元,用于依据用户对展现的候选项选择结果和/或确认操作执行字词输入。
28.根据权利要求27所述的装置,其特征在于,所述评分确定单元,具体为用于根据预置的评价因数,计算所述候选项的评价评分; 其中,所述评价因数包括以下任意一种或几种候选项的词频、候选项的词法规则匹配度、候选项与其相匹配的轨迹段的路径匹配度、该候选项对应的编码字符串中的字符个数、与候选项所匹配的轨迹段长度、与候选项所匹配的轨迹段所划经的字符个数和/或连续输入轨迹段所划经的字符个数。
29.根据权利要求28所述的装置,其特征在于,所述评分确定单元,根据预置的评价因数,计算候选项的评价分数时,其中所述评价因数还包括以下任意一种或几种候选项是否存在与其对应的下一级候选项、该候选项的下一级候选项的评价分数,其中,候选项的下一级候选项为以该候选项所匹配的轨迹段的终点作为识别起点匹配出的候选项。
30.一种基于多词连续输入的字词识别系统,其特征在于,包括电子设备和服务器; 所述电子设备,用于检测键盘区域上的连续输入轨迹,获取所述连续输入轨迹的轨迹特征数据,将至少包含所述轨迹特征数据的信息发送至指定的服务器,并接收所述服务器返回与所述连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项;其中,所述连续输入轨迹与用户待输入的编码字符序列在键盘布局上的位置相关; 所述服务器,用于接收所述电子设备发送的至少包含所述轨迹特征数据的信息的数 据;依据所述信息,从词库中匹配出与所述连续输入轨迹的不同轨迹段的轨迹特征数据相匹配的至少一个候选项,并将匹配出的候选项返会给所述电子设备。
全文摘要
本发明公开了一种基于多词连续输入的字词识别方法、装置和系统,该方法包括检测键盘区域上的连续输入轨迹,获取连续输入轨迹的轨迹特征数据,其中,连续输入轨迹与用户待输入的编码字符序列在键盘布局上的位置相关;从预置的词库中匹配出与连续输入轨迹中的不同轨迹段的轨迹特征数据相匹配的至少一个候选项。该方法可以提高输入效率,并降低用户操作的复杂度。
文档编号G06F3/023GK102880302SQ201210248448
公开日2013年1月16日 申请日期2012年7月17日 优先权日2012年7月17日
发明者刘炳林, 王玲 申请人:重庆优腾信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1