确定设备、确定方法和确定装置的制造方法
【专利摘要】公开了确定设备、确定方法和确定装置。针对确定意音文字输入的同音字,代码可以根据用户绘制的书写意音文字或者键入的意音文字的至少一部分识别意音文字。另外,代码可以确定是否要使意音文字的同音字对用户可用。代码还可以在要使意音文字的同音字对用户可用的情况下确定具有与该意音文字的发音相匹配的发音的多个意音文字。代码可以提供包含多个意音文字的提示列表,以使得能够从提示列表中选择意音文字。代码还可以基于上下文对多个意音文字排序。
【专利说明】
确定设备、确定方法和确定装置
技术领域
[000?]本文中公开的主题涉及意音文字(logogram)输入,并且更特别地涉及确定意音文字输入的同音字。
【背景技术】
[0002]由于某些意音文字的复杂度以及意音文字的巨大数量,因此输入诸如汉字、某些日语文字(例如,日本汉字)、某些韩语文字(例如,韩语汉字)等的意音文字可能是困难的。
【发明内容】
[0003]公开了一种用于确定意音文字输入的同音字的设备。该设备包括处理器和存储器。存储器可以存储处理器能够执行的代码。代码根据用户绘制的书写的意音文字或者键入的意音文字的至少一部分识别意音文字。另外,代码确定是否要使意音文字的同音字对用户可用。在要使意音文字的同音字对用户可用的情况下,代码还确定具有与意音文字的发音相匹配的发音的多个意音文字。一种方法和计算机程序产品也执行设备的功能。
【附图说明】
[0004]将通过参考附图中图示的具体实施例来给出上面简要描述的实施例的更详细的描述。在理解这些附图仅描绘了一些实施例并且因此不应被视为对范围构成限制的情况下,将通过使用附图以附加的特性和细节来描述和说明实施例,在附图中:
[0005]图1是图示了电子装置的一个实施例的图;
[0006]图2A是图示了意音文字数据库的一个实施例的示意性框图;
[0007]图2B是图示了意音文字数据的一个实施例的示意性框图;
[0008]图3A是图示了确定意音文字输入的同音字的第一部分的一个实施例的图;
[0009]图3B是图示了确定意音文字输入的同音字的第二部分的一个实施例的图;
[0010]图3C是图示了确定意音文字输入的同音字的另一个实施例的图;
[0011 ]图4是图示了计算机的一个实施例的示意性框图;以及
[0012]图5是图示了用于确定意音文字输入的同音字的方法的一个实施例的示意性流程图。
【具体实施方式】
[0013]如本领域技术人员将意识到的,实施例的各方面可以被实施为系统、方法或者程序产品。因此,实施例可以采取在本文中可全部统称为“电路”、“模块”或者“系统”的完全硬件实施例、完全软件实施例(包括固件、常驻软件、微代码等)或者结合了软件和硬件方面的实施例的形式。此外,实施例可以采取程序产品的形式,该程序产品被实施为用于存储机器可读代码、计算机可读代码和/或程序代码(下文中称为代码)的一个或更多个计算机可读存储装置。存储装置可以是有形的、非暂态的和/或非传输的。存储装置可以不包含信号。在某些实施例中,存储装置仅采用用于访问代码的信号。
[0014]本说明书中描述的许多功能单元已经被标记为模块,以便更特别地强调它们的实现独立性。例如,模块可以实现为硬件电路,其包括定制的VLSI电路或门阵列、诸如逻辑芯片的现成的半导体、晶体管或者其它分立的组件。模块还可以以诸如现场可编程门阵列、可编程逻辑阵列、可编程逻辑装置等的可编程硬件装置的形式实现。
[0015]各模块还可以以供各种类型的处理器执行的代码和/或软件的形式实现。所标识的代码模块例如可以包括例如可以组织为对象、过程或者函数的一个或者更多个物理的或逻辑的可执行代码块。然而,所标识的模块的可执行代码不必在物理上定位在一起,而是可以包括存储于不同位置的不同的指令,这些指令在逻辑地结合在一起时包括模块并且达到针对模块的规定目的。
[0016]实际上,代码的模块可以是单个的指令,或者许多指令,并且甚至可以分布于不同程序中的若干不同的代码片段上,并且跨越若干存储装置。类似地,本文中可以在模块内识别和说明操作数据,并且可以以任何适当的形式来实施操作数据,以及在任何适当类型的数据结构中组织操作数据。操作数据可以作为单个数据集来进行收集,或者可以分布于不同位置上,包括分布于不同的计算机可读存储装置上。在模块或者模块的部分以软件实施的情况下,软件部分存储于一个或者更多个计算机可读存储装置上。
[0017]可以利用一个或者更多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读存储介质。计算机可读存储介质可以是用于存储代码的存储装置。例如,存储装置可以是例如但不限于电子的、磁的、光学的、电磁的、红外的、全息的、微机械的,或者是半导体系统、设备或装置,或者上述的任何适当的组合。
[0018]存储装置的更具体的示例(非穷举性列举)将包括以下:具有一个或更多个电线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(R0M)、可擦除可编程只读存储器(EPROM或闪存)、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或者上述的任何适当的组合。在本文的上下文中,计算机可读存储介质可以是能够包含或存储下述程序的任何有形介质:该程序用于由指令执行系统、设备或装置使用,或者与指令执行系统、设备或装置结合使用。
[0019]用于执行实施例的操作的代码可以用一种或多种编程语言的任何组合来编写,编程语言包括面向对象编程语言(例如Py thon、Ruby、Java、Small talk、C++等)和传统的过程编程语言(例如“C”编程语言等)和/或机器语言(例如汇编语言)。代码可以作为独立软件包完全地在用户的计算机上执行、部分地在用户的计算机上执行、部分地在用户的计算机上且部分地在远程计算机上执行、或者完全地在远程计算机或服务器上执行。在后者的场景中,远程计算机可以通过任意类型的网络(包括局域网(LAN)或广域网(WAN))连接到用户的计算机,或者可以连接至外部计算机(例如,通过使用因特网服务提供商的因特网)。
[0020]贯穿本说明书,对“一个实施例”、“实施例”或者类似的语言的引用意指结合实施例描述的具体的特征、结构或者特性被包括在至少一个实施例中。因此,贯穿本说明书,除非另有明确规定,否则短语“在一个实施例中”、“在一个实施例中”和类似语言的出现可以但不一定全部指代同样的实施例,而是意指“一个或更多个但非所有实施例”。除非另有明确规定,否则术语“包括”、“包含”、“具有”及其变型意指“包括但不限于”。除非另有明确规定,否则枚举的项目清单并不暗示项目中的任何项目或者所有项目是互相排斥的。除非另有明确规定,否则术语“一个”、“一种”和“该”还指代“一个或更多个”。
[0021]此外,所描述的实施例的特征、结构或者特性可以以任何适当的方式进行组合。在下面的描述中,提供了大量具体的细节,例如编程、软件模块、用户选择、网络事务处理、数据库查询、数据库结构、硬件模块、硬件电路、硬件芯片等的示例,以提供对实施例的透彻的理解。然而,有关领域的技术人员将认识到,可以在没有一个或更多个具体细节的情况下实施实施例,或者用其它方法、组件、材料等来实施实施例。在其它示例中,未详细地示出或描述公知的结构、材料或者操作,以避免使实施例的各方面模糊。
[0022]下面参考根据实施例的方法、设备、系统和程序产品的示意性流程图和/或示意性框图来对实施例的各方面进行描述。将要理解的是,示意性流程图和/或示意性框图的每个块以及在示意性流程图和/或示意性框图中的各个块的组合能够通过代码来实现。这些代码可以提供给通用计算机、专用计算机或其它可编程数据处理设备的处理器以产生机制,使得经由计算机或其它可编程数据处理设备的处理器执行的指令创建用于实现在示意性流程图和/或示意性框图的块中指定的功能/动作的装置。
[0023]代码还可以存储于能够将计算机、其它可编程数据处理设备或者其它装置引导为以特定方式工作的存储装置中,使得存储在存储装置中的指令产生制造品,其包括用于实现在示意性流程图和/或示意性框图的块中指定的功能/动作的指令。
[0024]还可以将代码加载到计算机、其它可编程数据处理设备或者其它装置上,以使得在计算机、其它可编程设备或者其它装置上执行一系列操作步骤以产生计算机实现的处理,使得在计算机或者其它可编程设备上执行的代码提供用于实现在流程图和/或框图的块中指定的功能/动作的处理。
[0025]图中的示意性流程图和/或示意性框图图示了根据各种实施例的设备、系统、方法和程序产品的可能的实现的架构、功能和操作。在这方面,示意性流程图和/或示意性框图中的每个块可以代表代码模块、代码段或者部分代码,其包括用于实现指定逻辑功能的代码的一个或更多个可执行指令。
[0026]还应该注意的是,在一些替代的实现中,块中标注的功能可以以不同于图中标注的顺序发生。例如,根据所涉及的功能,事实上,可能基本上同时执行顺序示出的两个块,或者有时可能以相反的顺序执行这些块。可以设想与图示的图的一个或更多个块或其一部分在功能、逻辑或者效果上等效的其它步骤和方法。
[0027]虽然在流程图和/或框图中可以使用各种箭头类型和线类型,但是它们应被理解为并非对相应实施例的范围进行限制。实际上,一些箭头或者其它连接器可能仅用于表示所描述的实施例的逻辑流程。例如,箭头可以表示在所描述的实施例的列举的步骤之间的、未指定持续时间的等待期或者监视期。还将注意的是,框图和/或流程图的每个块以及框图和/或流程图中的块的组合可以通过执行指定功能或动作的专用的基于硬件的系统来实现,或者通过专用硬件和代码的组合来实现。
[0028]各图中的元素的描述可以参考之前的图中的元素。在所有图中相似的标记表示相似的元素,包括相似元素的替代实施例。
[0029]图1是图示了电子装置100的一个实施例的图。在所描述的实施例中,电子装置100是平板计算机。替选地,电子装置100可以是移动电话、膝上型计算机、计算机工作站等。在一个实施例中,电子装置100包括图形输入105和显示器110。
[0030]图形输入105被描述为接受意音文字输入120。意音文字输入120可以是手写意音文字、或者由用户绘制的手写意音文字的一部分。在某些实施例中,意音文字输入120可以是用户键入的意音文字。在所描述的实施例中,意音文字输入120对于用户希望输入到电子装置100中的期望意音文字来说是不正确的。意音文字输入120是期望的中文意音文字“膻”的同音字。在一些实施例中,用户可能绘制或者键入用户记忆的与期望意音文字具有相同发音的意音文字(例如,同音字)。这可能是因为某些意音文字的复杂度、可能的意音文字的数量和/或用户的记忆。例如,用户可能记住了简单的意音文字(例如,“山”),这个简单的意音文字是期望意音文字(例如,“膻”)的同音字。因此,用户可能绘制或者键入简单的意音文字。
[0031 ]在过去,当用户不正确地输入了意音文字输入120时,用户可能最终找到期望意音文字。然而,用户通常仍不确定应当将什么意音文字输入120输入到电子装置100中以产生期望意音文字。本文中描述的实施例确定是否要使意音文字输入120的同音字对用户可用。如果要使意音文字输入120的同音字对用户可用,则确定具有与根据意音文字输入120识别的意音文字的发音相匹配的发音的多个意音文字。另外,实施例可以显示作为意音文字输入120的同音字的多个意音文字,以使得用户可以选择期望意音文字。结果,用户可以绘制意音文字输入120以找到作为意音文字输入120的同音字的期望意音文字。
[0032]图2A是图示了意音文字数据库200的一个实施例的示意性框图。意音文字数据库200可以被组织为存储器中的数据结构。意音文字数据库200可以存储多个意音文字的意音文字数据205。
[0033]图2B是图示了意音文字数据205的一个实施例的示意性框图。意音文字数据205可以被组织为存储器中的数据结构。意音文字数据205可以描述给定的意音文字。在所描述的实施例中,意音文字数据205包括意音文字标识符210、语音表达215、意音文字词根220、意音文字笔画225、意音文字发音230、上下文数据235和结构数据240。
[0034]意音文字标识符210可以唯一地标识意音文字。在一个实施例中,意音文字标识符210是意音文字的统一码值(Unicode value)。语音表达215可以包括书面的语音表达。例如,中文意音文字的书面语音表达可以是拼音。意音文字词根220可以标识意音文字的词根。意音文字词根220可以包括到词根数据库的索引。意音文字笔画225可以描述用于构成意音文字的一个或者更多个书写笔画。意音文字发音230可以是所记录的、意音文字的发音。上下文数据235可以包括可能围绕该意音文字的常见意音文字、该意音文字可能使用的常见句子结构和/或可能标识该意音文字频繁使用的上下文的其他数据。此外,结构数据240可以包括被用于书写该意音文字的结构。例如,结构数据240可以将意音文字标识为具有上下结构、上中下结构、左右结构等中的一个或更多个结构。
[0035]图3A是图示了确定意音文字输入120的同音字的第一部分的一个实施例的图。在所描述的实施例中,确定了不正确的意音文字输入120的语音表达215。可以通过利用意音文字数据库200寻找对应于意音文字输入120的意音文字数据205来确定意音文字输入120的语音表达215。如所图示的那样,意音文字输入120的拼音语音表达215是shan 300。
[0036]图3B是图示了确定意音文字输120入的同音字的第二部分的一个实施例的图。在所描述的实施例中,确定了 shan 300的同音字305。具体地,同音字305包括“山” 310(山峰),“衫”315(衣服)以及“膻”320(膻味)。可以通过任何适当的方式确定同音字305。例如,可以通过在意音文字数据库200中搜索包括shan300的语音表达215的所有意音文字数据205来确定同音字305。
[0037]在一些实施例中,可以组织意音文字数据库200,其中,基于意音文字的语音表达215而将意音文字分组到一起。因此,在这样的实施例中,意音文字输入120所属的一组意音文字可以是所确定的同音字305。例如,数据库可以基于中文国标(GB)编码,其中,意音文字基于其语音表达215而被分组到一起。另外,在一些实施例中,可以使用查找表来寻找同音字 305。
[0038]图3C是图示了确定意音文字输入120的同音字的另一个实施例的图。图示的实施例示出了可以选择的启用同音字325选项。启用同音字325选项被用于确定是否要使意音文字输入120的同音字对用户可用。在选择了启用同音字325选项的情况下,可以在识别意音文字输入120之后显示意音文字输入120的同音字305。启用同音字325选项可以是屏幕上的按钮、菜单项、模式、语音命令、可选选项等。在某些实施例中,可以在绘制或者键入意音文字输入120之前选择启用同音字325选项,而在其它实施例中,可以在绘制或者键入意音文字输入120之后选择启用同音字325选项。
[0039]图4是图示了计算机400的一个实施例的示意性框图。计算机400可以被包含在电子装置100中。替选地,计算机400可以被包含在与电子装置400通信的服务器中。在所描述的实施例中,计算机400包括处理器405、存储器410以及通信硬件415。存储器410可以是半导体存储装置、硬盘驱动器、光存储装置、微机械存储装置或者其组合。存储器410可以存储代码。处理器405可以执行代码。通信硬件415可以与其他装置通信。
[0040]图5是图示了用于确定意音文字输入120的同音字的方法500的一个实施例的示意性流程图。方法500可以由处理器405执行。替选地,方法500可以由诸如存储器410的计算机可读存储介质执行。计算机可读存储介质可以存储代码,该代码能够由处理器405执行以执行方法500的功能。
[0041]方法500开始,并且在一个实施例中,代码从用户绘制或者键入的书写意音文字的至少一部分接收505意音文字输入120。可以通过电子装置100的图形输入105接受意音文字输入120。代码还可以根据意音文字输入120产生意音文字数据205。此外,代码可以根据意音文字输入120产生意音文字笔画数据225。代码还可以根据意音文字输入120和/或意音文字数据205识别510意音文字。在某些实施例中,可以根据用户绘制的书写意音文字的仅一部分来识别510意音文字。
[0042]代码还可以确定515是否要使意音文字输入120的同音字对用户可用。在某些实施例中,可以基于是否选择了启用同音字325选项来做出确定515。如果确定515是不使意音文字输入120的同音字对用户可用,则方法500结束。
[0043]然而,如果确定515是要使意音文字输入120的同音字对用户可用,则代码还可以确定520具有与意音文字输入120的发音相匹配的发音的多个意音文字(意音文字输入120的同音字)。在一些实施例中,用于确定520具有与意音文字输入120的发音相匹配的发音的多个意音文字的代码可以包括用于从意音文字数据库200中选择多个意音文字的代码,在数据库200中,基于发音将意音文字以子集分组在一起(例如,中文国标编码)。这样的实施例可以包括用于将意音文字输入120与这些子集中的一个子集内的基本上相同的意音文字进行匹配、并将该一个子集内的所有意音文字选择为上述多个意音文字的代码。应注意,基本上相同的意音文字可以是与意音文字输入120具有相同发音的意音文字,其中发音包括声调。替选地,基本上相同的意音文字可以是与意音文字输入120具有相同发音但不具有相同声调的意音文字。
[0044]代码还可以基于匹配于用户要使用的预期意音文字的可能性来对多个意音文字(例如,同音字)排序525。排序525可以将多个意音文字从最可能到最不可能是预期意音文字排序、从最不可能到最可能是预期意音文字排序、或者使用任何其它适当的排序。在某些实施例中,排序525可以包括基于要使用每个意音文字的上下文、每个意音文字的结构以及每个意音文字的笔画的数量中的一个或者更多个对多个意音文字排序525。例如,可以基于每个意音文字对围绕意音文字输入120的意音文字的句子结构的适合程度的上下文数据235对多个意音文字进行排序525。在另一个实施例中,可以基于与每个意音文字对应的结构数据240的复杂度对多个意音文字进行排序525。在一些实施例中,诸如上中下结构的较复杂的结构可以排序为高于诸如左右和/或上下结构的较不复杂的结构。然而,在其它实施例中,较复杂的结构可以排序为低于较不复杂的结构。
[0045]代码可以显示530与意音文字输入120具有相同发音的多个意音文字。例如,代码可以向显示器110(例如,显示装置)传送多个意音文字,以使用户能够选择多个意音文字之一。代码还可以将用户选择的意音文字插入535到书写中,并且方法500结束。
[0046]可以以其它具体形式来实践实施例。所描述的实施例应在各个方面都被视为仅是说明性的而并非限制性的。因此,由所附权利要求而非由之前的描述来表示本发明的范围。落入权利要求的等同的含意和范围内的所有变化都应被包含在权利要求的范围内。
【主权项】
1.一种确定设备,包括: 处理器; 存储器,所述存储器存储所述处理器能够执行的代码,所述代码包括: 用于根据用户所绘制的书写的意音文字或者键入的意音文字的至少一部分来识别意音文字的代码; 用于确定是否要使所识别的意音文字的同音字对所述用户可用的代码;以及 用于在要使所识别的意音文字的同音字对所述用户可用的情况下确定具有与所识别的意音文字的发音相匹配的发音的多个意音文字的代码。2.根据权利要求1所述的确定设备,其中,所述代码还包括:用于向显示装置传送所述多个意音文字以使所述用户能够选择所述多个意音文字之一的代码。3.根据权利要求2所述的确定设备,其中,所述代码还包括:用于将所述用户所选择的所述多个意音文字之一插入到书写中的代码。4.根据权利要求1所述的确定设备,其中,所述代码还包括:用于基于匹配于所述用户要使用的预期意音文字的可能性来对所述多个意音文字排序的代码。5.根据权利要求4所述的确定设备,其中,用于对所述多个意音文字排序的代码还包括用于基于下述中的一个或更多个来对所述多个意音文字排序的代码:要使用所述多个意音文字中的每个意音文字的上下文,所述多个意音文字中的每个意音文字的结构,以及所述多个意音文字中的每个意音文字的笔画的数量。6.根据权利要求1所述的确定设备,其中,用于确定具有与所识别的意音文字的发音相匹配的发音的多个意音文字的代码还包括用于从数据集中选择所述多个意音文字的代码,在所述数据集中,基于发音以子集将意音文字分组在一起。7.根据权利要求6所述的确定设备,其中,用于从数据集中选择所述多个意音文字的代码还包括:用于将所识别的意音文字与所述子集中的一个子集内的基本上相同的意音文字进行匹配、并将所述子集中的所述一个子集内的所有意音文字选择为所述多个意音文字的代码。8.—种确定方法,包括 通过使用处理器,根据用户所绘制的书写的意音文字或者键入的意音文字的至少一部分来识别意音文字; 确定是否要使所识别的意音文字的同音字对所述用户可用;以及 在要使所识别的意音文字的同音字对所述用户可用的情况下,确定具有与所识别的意音文字的发音相匹配的发音的多个意音文字。9.根据权利要求8所述的确定方法,还包括:向显示装置传送所述多个意音文字,以使所述用户能够选择所述多个意音文字之一。10.根据权利要求9所述的确定方法,还包括:将所述用户所选择的所述多个意音文字之一插入到书写中。11.根据权利要求8所述的确定方法,还包括:基于匹配于所述用户要使用的期望意音文字的可能性,对所述多个意音文字排序。12.根据权利要求11所述的确定方法,其中,对所述多个意音文字排序还包括基于下述中的一个或者更多个对所述多个意音文字排序:要使用所述多个意音文字中的每个意音文字的上下文,所述多个意音文字中的每个意音文字的结构,以及所述多个意音文字中的每个意音文字的笔画的数量。13.根据权利要求12所述的确定方法,其中,所述结构包括上下结构、上中下结构以及左右结构中的一个或者更多个。14.根据权利要求8所述的确定方法,其中,确定具有与所识别的意音文字的发音相匹配的发音的所述多个意音文字还包括从数据集中选择所述多个意音文字,在所述数据集中,基于发音以子集将意音文字分组在一起。15.根据权利要求14所述的确定方法,其中,从所述数据集中选择所述多个意音文字还包括:将所识别的意音文字与所述子集中的一个子集内的基本上相同的意音文字相匹配,并将所述子集中的所述一个子集内的所有意音文字选择为所述多个意音文字。16.一种确定装置,包括: 用于根据用户所绘制的书写的意音文字或者键入的意音文字的至少一部分来识别意音文字的装置; 用于确定是否要使所识别的意音文字的同音字对所述用户可用的装置;以及 用于在要使所识别的意音文字的同音字对所述用户可用的情况下,确定具有与所识别的意音文字的发音相匹配的发音的多个意音文字的装置。17.根据权利要求16所述的确定装置,其中,还包括:用于向显示装置传送所述多个意音文字,以使所述用户能够选择所述多个意音文字之一的装置。18.根据权利要求16所述的确定装置,其中,还包括:用于基于要使用所述多个意音文字中的每个意音文字的上下文、所述多个意音文字中的每个意音文字的结构、以及所述多个意音文字中的每个意音文字的笔画的数量中的一个或者更多个对所述多个意音文字排序的装置。19.根据权利要求16所述的确定装置,其中,用于确定具有与所识别的意音文字的发音相匹配的发音的多个意音文字的装置还包括用于从数据集中选择所述多个意音文字的装置,在所述数据集中,基于发音以子集将意音文字分组在一起。20.根据权利要求19所述的确定装置,其中,用于从所述数据集中选择所述多个意音文字的装置还包括用于将所识别的意音文字与所述子集中的一个子集内的基本上相同的意音文字进行匹配,并将所述子集中的所述一个子集内的所有意音文字选择为所述多个意音文字的装置。
【文档编号】G06F3/023GK105892712SQ201510884175
【公开日】2016年8月24日
【申请日】2015年12月4日
【发明人】钱明, 王启刚, 王松, 张健邦
【申请人】联想(新加坡)私人有限公司