改进的电子设备中字符输入的识别的制作方法

文档序号:6364672阅读:189来源:国知局
专利名称:改进的电子设备中字符输入的识别的制作方法
技术领域
本发明涉及改进的电子设备的字符输入的识别。本发明尤其适用于,但不限于,识别书写在触摸屏上的字符,特别诸如汉字、日文或韩文字符的复杂字符。
背景技术
屏幕设备的一个主要增长领域是小型便携设备,例如移动电话、个人数字助理(PDA)、全球定位系统(GPS)导航仪等。这些设备采用各种各样的方法输入符号或数据,例如采用真实或虚拟按钮、语音识别、字符识别等。在字符识别的情况下,字符被手写到显示器的书写区中,并且使用字符识别软件来确定手写输入的字符是什么。虽然虚拟键盘在进行字母字符(如罗马字母、希腊字母、西里尔字母等等)的输入时可能比手写更加快速,然而在输入更加复杂的字符,如汉字、日文或韩文字符时则不太适用,因为键盘对于所有字符而言显得过小,或者键过多,以致用户不易找到正确的按键。
人们已经发现,单纯的手写字符分析不足以提供精确的结果,至少不足以经常提供精确的结果。根据出现的其它内容的上下文修改可能结果的上下文分析技术也是必要的。
触摸屏的构造在本领域是众所周知的,并且触摸检测可以以许多众所周知的系统实现,例如电容或感应检测,接触开关等等。同样,字符识别软件是众所周知的,尽管通常不甚完美。
美国专利4,979,227公开了一种使用动态词典校正文档内字符串的识别结果的方法。词典是通过预扫描整个文档并且存储显然正确识别的词来产生的。在实际扫描期间,在读取的字符串和词典内的某些字符串之间进行比较。这个方法的计算复杂度较高。
美国专利4,654,875描述了一种用于文本识别/校正的算法。该方法读取所有词,并且根据基本字符识别、跟在前面的一些字母后顺序出现的的字母的出现概率以及可接受单词的词典内容进行分析。其计算复杂度较高。
在美国专利6,219,449中,当读取一个词时,针对该词中的各个组成字符产生候选字表。根据变化信息的期望可靠度从可能的组合中选择单词。此方法并不简单。
美国专利6,137,908描述了用于提高字符识别精度的分段和上下文处理方法。动态编程路径寻求估测字典中词的概率,并且导出总体最优(最大可能)的识别结果。此方法的计算复杂度较高。
美国专利6,442,295公开了一种根据预定代码使用存储器中的字典的方法。对应于接收的字符串的权重序列被提供给存储器。计算要识别的词和存储的词之间的距离,该距离是要识别的词的各个字符的权重,与存储的词的各个字符的权重之间的差值总和。具有最小距离的存储词是最终结果。

发明内容
在本说明书和权利要求书中,术语″包括″或类似术语被用来表示非排它性的包含,使得包括一组单元的方法或装置不仅包含那些单元,而且可以包含未列出的其它单元。
根据本发明的一个方面,提供一种在电子设备中将字符输入到字符行中当前字符位置的方法,其中所述字符是通过书写输入到电子设备中的。该方法包括接收一第一候选字符表,接收一第二候选字符表,比较所述第一和第二候选字符表的内容,并根据比较结果确定第一候选字符表中候选字符的显示顺序。第一候选字符表是可能对应于书写字符、通过字符识别产生的候选字符表,该第一表具有初始顺序。第二候选字符表是可能对应于书写字符、根据当前字符位置上下文产生的候选字符表。比较所述第一和第二表的内容以确定其间的重叠度。
根据本发明的另一个方面,提供一种在电子设备的显示器中将字符输入到字符行中当前字符位置的电路,其中所述字符是通过书写输入到电子设备中。该电路包括一个输入,一个存储器,一个输出和一个处理器。所述输入接收通过书写输入到电子设备中的字符。所述存储器存储第一字符集,当前字符行的内容,和预定字符排列的集合。所述输出以显示顺序输出第一候选字符表以便进行显示。所述处理器通过字符识别产生可能对应于书写字符、来自所述第一字符集的第一候选字符表,其中第一表具有初始顺序。处理器根据当前字符位置的上下文和预定字符排列集合产生可能对应于书写字符的第二候选字符表。处理器进一步比较第一和第二表的内容以确定其间的重叠度,并且至少根据确定的重叠度确定第一表中候选字符的显示顺序。
根据本发明的另一个方面,提供一种电子设备,包括具有显示区的屏幕,检测显示区中的书写字符的检测器,含有第一字符集的第一存储器,含有字符行的第二存储器,以及处理器,所述处理器将书写字符与所述第一字符集合内的字符进行比较,产生第一候选字符表,产生第二候选字符表,比较第一和第二表的内容,根据比较结果确定第一表中候选字符的显示顺序,并且按照所述要显示的显示顺序输出第一表。所述显示区具有一个显示输入字符的字符行的字符行区,一个用于书写字符以便将其输入显示在字符行的当前字符位置的书写区,和一个候选字符区,该候选字符区用于按照显示顺序显示输出的第一表,并且允许选择所述多个候选字符中的一个以便显示在字符行的当前字符位置上。按照初始顺序从所述第一字符集合内的字符中产生第一候选字符表。根据字符行内当前字符位置的上下文产生第二候选字符表。比较第一和第二表的内容以确定其间的重叠度。


为了方便理解和实施本发明,现在参照附图描述示例性的优选实施例,其中
图1示出了示例性实施例的一个PDA的前端;图2是示例性实施例的显示电路的示意图;图3是基于示例性实施例的操作的过程的流程图;而图4示出了具有初始顺序的示例性的第一表和第二表。
具体实施例方式
在所有附图中,相同的附图标记表示相同的单元。
简言之,在这个示例性实施例中,当向电子设备书写字符以便显示在当前字符位置时,字符识别包试图识别书写的字符并且产生第一候选字符表。根据书写字符和候选字符之间的相似度按照初始顺序放置第一表中的候选字符。另外,根据紧接当前字符位置前面的字符,查询可能字符对的词典,以确定第二候选字符表。独立产生和比较两个表,并按显示顺序显示第一表,显示顺序可能与初始顺序相同或不同,这取决于两个表之间的重叠度。于是,考虑到正确字符位置的上下文,本发明结合字符识别结果和字符正确的可能性。由于导致产生这两个表的信息之间不存在相关,改进了识别处理的精度。
参照图1,其中示出了应用本发明的一个PDA10。该PDA10具有屏幕12,屏幕12具有显示14。显示14被分割成以下各区域字符行区16,用于显示输入字符的字符行18;书写区20,用于书写字符22以将其输入显示在字符行18的当前字符位置24上;候选字符区26,用于显示候选字符28a-28f的候选字符表28,以期它们中的一个对应于在书写区20中书写的字符22;和指令区30,在需要进行其它操作时显示指令菜单。另外,选择字符区32是虚拟按钮,用于选择当前字符位置24中出现的当前字符,并且允许输入下一个字符。
虽然在这个实施例中,屏幕12只是对应于利用此特性的书写区20和候选字符区26的屏幕区域,屏幕12是触摸屏。尤其是,它被用来确定书写区20中正在书写的内容,在候选字符区26中的候选字符28a-28f(如果有的话)表28中选择哪个字符,或者已经选择了哪个其它指令。
在这个实施例中,通过使用书写区20书写期望的内容,用户正向字符行18输入汉字字符。
图2是触摸屏电路和显示驱动器电路40的示意图,显示驱动器电路40控制屏幕12的显示14上出现的内容。这里描述了它的功能,它是一个用于根据书写区20中的书写字符22,将字符输入到字符行18中的当前字符位置24上的电路。正如人们已知并已现有技术设备中那样,该电路还具有其它功能及与控制显示14有关的输入,在此不必描述。
水平和垂直传感器42和44被用来检测触摸屏12上的接触点。这一信息作为指示接触点的X和Y坐标信号Sx、Sy的信号提供给屏幕驱动器电路40,以便解释和相应作出响应。
显示驱动器电路40具有处理器46和存储器48。存储器48具有RAM和ROM型存储器。RAM在其中存储对应于书写区20当前内容,即当前书写字符22的数据,以及字符行18的内容,和候选字符区26中候选字符28a-28f的表28。ROM在其中存储用于尝试识别当前书写字符22的书写字符识别程序,存储可供识别程序选择的可能字符的第一数据库,和存储字符排列的第二数据库(例如词典),在这个实施例中,第二数据库由经常使用的字符串,尤其是字符对构成。
简言之,通过书写输入字符的过程如下。当在触摸屏12上检测到接触时,水平和垂直传感器42、44通过信号Sx、Sy向驱动器电路40传递接触位置。处理器46作出决定并且使得显示14通过更多的书写字符22更新书写区20,并且更新候选字符区26和当前字符位置24以包含候选字符的新表28;或更新字符行18中的当前字符位置24以包含选择的字符。
现在参照图3的流程图更详细地描述通过书写输入字符的过程。
在步骤S102,检测到触摸并且从水平和垂直传感器42、44向处理器46传递位置信号。处理器在步骤S104确定检测到的触摸的位置是否在选择字符区32内。如果是,则字符行18中当前字符位置24出现的字符保持在原处,并且在步骤S106沿着一个位置移动当前字符位置。否则,处理前进到步骤S108。
在步骤S108,处理器确定检测到的触摸是否在候选字符区26的候选字符28a-28f中的一个上。如果在步骤S108的答案为“是”,则意味着已经从候选字符28a-28f的表28中选择了候选字符。在步骤S110更新显示14,其中在字符行18的当前字符位置24上输入选择的候选字符。其后是步骤S112,其中字符行中的下一个位置被认为是当前字符位置24。随后,处理器返回到步骤S102以等待下一个检测到的触摸。
在步骤S114,处理器确定检测到的触摸是否在书写区20内。如果在步骤S114的答案为“否”,则意味着没有字符正被书写,并且候选字符区26内没有候选字符28a-28f正被选择,并且当前字符位置中没有字符正被选择。选择可以是例如来自指令区30的指令。于是,在步骤S116,处理器根据情况执行某些其它处理。否则,即如果在步骤S114的答案为“是”,则处理前进到步骤S118。
如果在步骤S114的回答为“是”,则在步骤S118,在检测到的触摸的位置上更新书写区20中的当前书写字符22。处理器接着根据当前书写字符22,在步骤S120尝试字符识别。这包括确定存储器48的第一数据库的字符集合中哪个字符(如果有)与当前书写字符22最相似。在作出这个确定之后,在步骤S122,处理器产生具有初始顺序的候选字符的第一表。初始顺序基于处理器在字符识别期间为各个候选字提供的分数,分数是可信度的度量,即表明处理器认为候选字符与书写字符的相似度。然而,由于存在过多具有相等可能性的情况,或者存在过少超过最小可能性的情况,有时产生不出第一表。
步骤S124确定字符识别是否已经完全成功,即是否已经产生第一表,如果没有产生第一表,则处理返回到步骤S102以等待下一个检测到的触摸。如果已经产生第一表,则下一个步骤S126确定第一表中第一候选字的可信度度量是否超过某个阈值,并且是否至少也超过对于第一表中第二候选字的可信度度量的一预定阈值。如果在步骤S126的回答为“是”,则认为第一表中的第一候选字将是正确的候选字,并且在步骤S128更新当前字符位置24以显示这个第一候选字来作为缺省候选字,并且更新候选字符区26以显示在步骤S122按照初始顺序产生的完整的第一候选字符表。
如果在步骤S126的回答为“否”,则步骤S130根据当前字符位置24的上下文产生第二表。这包括识别当前上下文并且将其与存储器48的第二数据库中的上下文集合相比较。存储器48的第二数据库中的上下文集合内的各上下文有一个与其相关的当前字符位置24上的字符。如果上下文集合中的一个上下文与当前上下文相同,则与存储器中该上下文相关的当前字符位置24上的字符被放入候选字符的第二表中。在这个优选实施例中,所使用的上下文被限制为字母串。有效地,这意味着第二表是在考虑到前面字符的情况下最大可能处于当前字符位置24的字符的表。在最佳实施例中,只基于字符行中紧接在前面的字符(是左还是是右则取决于输入顺序)。于是,以完全独立于第一表的内容的方式产生第二表的内容。
在接下来的步骤S132中,比较第一和第二表。如果根本没有重叠(即没有共同的字符),则在步骤S134产生与初始顺序相同的显示顺序。如果存在某种重叠(即至少有一个共同的字符),则在步骤S136,产生显示顺序,其中重叠字符被放在表的起始处,以相对于彼此相同的顺序,就像他们出现在初始顺序中那样。非重叠字符在表中下移,并且以相对于彼此相同的顺序,就像他们出现在初始顺序中那样。于是,如果存在100%重叠,则显示顺序与初始顺序相同。根据在步骤S134或S136中确定的显示顺序,步骤S138更新显示12,使当前字符位置24得以更新以显示第一表中的第一候选字(作为缺省候选字)。候选字符区26也被更新,从而按照在步骤S134或S136确定的显示顺序,显示在步骤S122产生的完整的第一候选字符表。处理接着返回到步骤S102以等待下一个触摸检测。
图4示出了两2个表50和52。一个表50是具有初始顺序的示例性第一表,而另一个表52是示例性第二表。这些表是例如通过图1中示出的字符22的书写产生的。通过比较这两个表可以发现,只有在第一表50的第二字符和第二表52的第一字符之间存在重叠。在上述步骤S136的处理下,这意味着对于第一表的显示顺序,公共的字符被移到表的头部,初始顺序的第一字符被移动到第二位置,而其余字符保持原样。于是,第一表的显示顺序与初始顺序相同,但是前2个字符被互换。该顺序是针对图1候选字符区26内的候选字符28a-28f的表28示出的。
如图4所示,第一和第二表不需要有相同数量的字符。有时第一表可以长于第二表,有时可以反过来,并且在其它时间它们可以相同。然而,如果需要,可以产生词典,使得产生的第二表具有固定数量的成员。同样,每次可以产生具有相同数量成员的第一表。候选字符区26中的候选字符28a-28f的数量不限于6个。此外,它不需要保持恒定,可以根据第一表的大小而改变。如果产生的第一表的字符多于候选字符区26内部的可用空间,则可以截去过量字符,或者如果用户希望看到它们,可以出现在一个第二屏幕上。
在上述实施例中,显示顺序的第一表的第一字符出现在当前字符位置24中,并且作为第一候选字符28a出现在候选字符区26中。可选地,第一字符可以只出现在当前字符位置24中,而候选字符28a-28f的表28只含有第一表的其余部分。
上述产生候选字符表的处理相当简单,然而改进了可用性和精度。这个方案的一个特别的优点是相对较低的计算水平和存储器尺寸要求。这使得它们适用于便携式电子设备,例如移动电话、个人数字助理(PDA)、全球定位系统(GPS)导航仪等。
特别是,由于这两个表的产生之间不存在相关,错误校正不太可能传播。即使上下文分析是错误的,用户仍然可以轻易恢复出结果,因为它只导致书写字符识别器输出的重新排序。
在优选实施例中,词典是字符双字(bi-gram)的数据库。
在词典中,相同起始字符的双字记录少于阈值数量。增加此限制的一个原因是有限的存储器尺寸。另一个原因是避免错误的自动校正。如果第二表的尺寸过大,则会根据相关规则错误地将具有极低可信度度量的候选字设置成第一候选字。于是,词典只由具有高出现频率的双字记录组成。也可以使用多个词典。系统或用户根据输入内容的类型选择词典。
处理器46可以是微处理器或其它根据所描述的操作连接工作的电路。然而,更可能的情况是将其体现在非易失存储器中存储的的软件中。于是,由于本发明覆盖了可以执行某些处理的设备,它包含执行那些处理的设备,无论是以硬连线电路的形式还是处理器运行的软件的形式。
处理器46被描述成执行所有用于提供第一表(包含字符识别)和提供第二表的操作。然而,某些处理可以由其它处理器并行完成。同样,只示出了单个存储器以存储所有必要信息。然而,可以根据需要使用若干个存储器。
如果在步骤S118没有产生第一表,则不同于返回到步骤S102并且显示候选字符区26中没有表的处理方式,处理器可以继续在步骤S126产生第二表,而步骤S130会导致在候选字符区26中显示第二表以作为候选字符表28a-28f。于是,在极少可能存在正确字符的情况下,用户可以立即选择此处理,而不是进一步书写字符。很可能有一可选“按钮”,允许用户直接根据先前输入的字符产生具有可能的下一个字符的第二表。
考虑到两个表之间的重叠度,用于确定显示顺序的规则可以不同于上述给定的规则。例如,第二表中的字符也可以具有与其相关的可信度度量分数,并且显示顺序可以考虑两个表中的字符的相对分数。
为了本说明书中描述的目的,术语“字符”包括任何识别的标记,而不仅仅是字母或词。
最好使用输入笔(未示出)来书写字符和选择触摸屏12上的位置,因为输入笔比手指具有更高的触摸或接触精度。
此外,字母表不一定是罗马字母表,也可以是希腊、西里尔、阿拉伯或任何其他可以被字符(例如汉字、日文或其它)替换的字母表。同样,数字符号可以是阿拉伯数字、汉字数字或其它数字。
前面的详细描述只提供了优选实施例,并不对本发明的范围、适用范围或构造产生任何限制。反之,前面对优选实施例的详细描述为了使本领域技术人员能够实现本发明的优选实施例。应当理解,在不偏离本发明所附权利要求书限定的宗旨和范围的前提下,可以在单元的功能和布局上进行各种改变。
权利要求
1.一种在电子设备中将字符输入到字符行中当前字符位置的方法,其中所述字符通过书写被输入到电子设备中,该方法包括接收可能对应于书写字符、通过字符识别产生的第一候选字符表,该第一表具有初始顺序;接收可能对应于书写字符、根据当前字符位置的上下文产生的第二候选字符表;以电子方式比较所述第一和第二表的内容以确定其间的重叠度;和至少根据所确定的重叠度确定所述第一表中候选字符的显示顺序。
2.根据权利要求1的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中彼此独立地产生第一和第二表。
3.根据权利要求1的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中如果在所述第一和第二表之间不存在重叠,则显示顺序与初始顺序之间没有改变。
4.根据权利要求1的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中如果在所述第一和第二表之间存在完全重叠,则显示顺序与初始顺序之间没有改变。
5.根据权利要求1的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中如果在所述第一和第二表之间存在部分重叠,则显示顺序以在两个表中均出现的字符开始,顺序与在初始顺序中的顺序相同,随后是仅出现在第一表中的字符,顺序与在初始顺序中的顺序相同。
6.根据权利要求1的用于在电子设备中向字符行中当前字符位置输入字符的方法,还包括检测通过书写输入电子设备的字符。
7.根据权利要求1的用于在电子设备中向字符行中当前字符位置输入字符的方法,还包括通过字符识别产生所述第一候选字符表。
8.根据权利要求7的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中产生所述第一候选字符表包括接收通过书写输入到电子设备中的字符;将接收到的字符与一第一数据库内的字符集相比较;和根据比较结果从所述第一数据库内的字符集中选择用于所述第一表的多个候选字符。
9.根据权利要求8的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中产生所述第一候选字符表还包括针对第一表的各个候选字符产生可能性分数,表示该候选字符被检测为写入字符的假定的可能性;和使各个可能性分数与其相应的候选字符相关。
10.根据权利要求9的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中所述初始顺序基于第一表的候选字符的可能性分数。
11.根据权利要求1的用于在电子设备中向字符行中当前字符位置输入字符的方法,还包括根据当前字符位置的上下文产生输入字符的所述第二候选字符表。
12.根据权利要求11的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中产生所述第二表还包括查询含有字符排列集合的一第二数据库;和在给定至少一部分当前字符行的情况下选择候选字符,其中所述选择候选字符如果输入到当前字符位置,则会从所述字符排列集合产生一字符排列。
13.根据权利要求12的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中所述字符排列集合包括字符组合集合。
14.根据权利要求13的用于在电子设备中向字符行中当前字符位置输入字符的方法,其中所述字符排列集合包括两字符字符组合的集合;并且选择第二表的候选字符包括确定哪个字符在字符行中当前字符位置的紧前面,如果有的话;确定所述两字符字符组合集合中哪一个是以字符行中当前字符位置的紧前面的字符为开始的;和从所述两字符字符组合中选择第二字符,作为所述第二表的候选字符,所述两字符字符组合被确定为以字符行中紧前面的字符开始。
15.根据权利要求1的用于在电子设备中向字符行中当前字符位置输入字符的方法,还包括按照显示顺序在电子设备的显示器上显示所述第一表;和检测用户从显示的第一表中对一个候选字符的选择;和将选择的候选字符输入字符行中当前字符位置。
全文摘要
当向电子设备(1)书写字符以便显示在当前字符位置(24)时,字符识别包试图识别书写字符(22)并产生第一候选字符表(50)。根据书写字符和候选字符之间的相似度按照初始顺序放置第一表(50)中的候选字符。另外,根据当前字符位置紧前面的字符查询具有可能字符对的词典,以确定第二候选字符表(52)。比较两个表,并按显示顺序显示第一表,其中显示顺序可能相同或不同于初始顺序,这取决于两个表之间的重叠度。本发明尤其适用于书写诸如汉字字符的复杂字符的情况,和/或具有有限存储器的诸如移动电话、PDA、GPS导航仪袖珍设备。
文档编号G06K9/68GK1567358SQ0313717
公开日2005年1月19日 申请日期2003年6月12日 优先权日2003年6月12日
发明者黄建成, 镇立新, 郭丰俊 申请人:摩托罗拉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1