拼写检查系统及其方法

文档序号:6465659阅读:217来源:国知局
专利名称:拼写检查系统及其方法
技术领域
本发明涉及一种拼写检查系统及其方法,尤其涉及一种依据权重值对字词排序的拼写检查系统及其方法。
背景技术
在一些文字处理软件中,为了解决使用者在撰写过程中所产生的错别字问题,通常都具有拼写检查的功能,以提供用户在撰写时候的错别字检查。
一般的拼写检查分为语音匹配算法以及字符串相似性算法,所谓的语音匹配算法即为将用户所输入的错别字依照读音转换为代码,再依据该代码找
出相似的字词,提供使用者选择;字符串相似性算法即为检查字库中的字词转换成目标单词(即为使用者所输入的错别字),对其中的字母进行对比的方法,从而找到字母差异最小的方法,基本上属于一种穷举法。
不论采用语音匹配算法或是字符串相似性算法,提供给用户所选择的待选择字词,通常都是通过字母的顺序加以排序,再显示给用户进行选择,而这种对于待选择字词的排列顺序,并无法将最适合的待选择字词放置于列表中的第一位置,提供给用户选择,使用者必须再次浏览待选择字词列表,才能找到所要的检查字词。
综上所述,可知现有技术中长期以来一直存在拼写检查无法提供较为合适的拼写检查字词顺序的问题,因此有必要提出改进的技术手段,来解决该问题。

发明内容
鉴于先前技术存在的问题,本发明提出一种拼写检查系统及其方法。本发明所提出的4并写检查系统包含输入模块、字词查找才莫块、字母对比模块、检查字库、字母关联模块、相邻字母对比模块、首字母对比模块、排序模块以及显示模块。
其中,输入模块,用于接收英语字词;字词查找模块,依据英语字词的字母个数从检查字库中取出与所述英语字词的字母个数相同的至少一个检查
字词;字母对比才莫块,用于对比英语字词与检查字词相对应位置的英文字母
是否相同,当对比结果相同则分别累计至少一次权重值;字母关联^^莫块,当对比英语字词与检查字词相对应位置的英文字母不相同时,判断英语字词与检查字词相对应位置的英文字母是否具有操作上的关联,当判断具有操作上的关联则分别累计权重值;相邻字母对比模块,用于对比英语字词与检查字词相对应相邻位置的英文字母是否相同,当对比结果相同则分别累计权重值;首字母对比模块,用于对比英语字词的首字母与检查字词的首字母的英文字母是否相同,当对比结杲相同则分别累计权重值;排序模块,依据权重值的大小顺序对检查字词进行排序;显示模块,依照排序后的检查字词顺序显示检查字词。
本发明所提出的拼写检查方法包含下列步骤
首先,接收英语字词;接着,依据英语字词的字母个数从检查字库中取出与所述英语字词的字母个数相同的至少一个检查字词;接着,对比英语字词与检查字词相对应位置的英文字母是否相同,当对比结果相同则分别累计至少一次权重值;接着,当对比英语字词与检查字词相对应位置的英文字母不相同时,判断英语字词与检查字词相对应位置的英文字母是否具有操作上的关联,当判断具有操作上的关联则分别累计权重值;接着,对比英语字词与检查字词相对应相邻位置的英文字母是否相同,当对比结果相同则分别累计权重值;接着,对比英语字词的首字母与检查字词的首字母的英文字母是否相同,当对比结果相同则分别累计权重值;接着,依据权重值的大小顺序对检查字词进行排序;最后,依照排序后的检查字词顺序显示检查字词。
本发明所提出的系统与方法如上,与现有技术之间的差异在于本发明通过对比英语字词以及检查字词的字母、相邻字母以及首字母是否相同,并且判断英语字词以及检查字词不相同的字母操作上的关联性,进行权重值累计,依照权重值的大小顺序对查询字词重新排序,权重值较高的检查字词即为较适合的拼写检查结果,可以优先显示给用户进行选择。
通过上述的技术手段,本发明可以对检查字词重新排序从而提供使用者较合适的拼写检查结果。


图1为本发明拼写检查系统方块图。
图2为本发明拼写检查方法流程图。图3为本发明输入英语字词接口示意图。图4A至图4E为本发明拼写检查过程示意图。图5为本发明显示排序检查字词4妄口示意图。
具体实施例方式
以下将配合图示及实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
以下将说明本发明拼写检查系统,并请同时参考图l所示,图l是为本发明拼写检查系统方块图。
如图1所示,本发明所提出的拼写检查系统包含输入模块IO、字词查找^^莫块20、检查字库21、字母对比模块30、字母关联模块40、相邻字母对比模块50、首字母对比模块60、排序模块70以及显示模块80。
其中,输入模块10用于输入英语字词,并将使用者输入的英语字词发送给字词查找模块20。
字词查找模块20接收输入模块10所传送的英语字词,并依据英语字词的字母个数从检查字库21中取出与英语字词的字母个数相同的至少一个检查字词,字词查找才莫块20取出至少一个检查字词后,会将英语字词以及检查字词发送给字母对比模块30。
具体来说,假设字词查找才莫块20所接收到的输入模块10所传送的英语字词的字母个数为6个,则字词查找模块20会从检查字库21中,取出字母个数为6个的字词,作为与英语字词对比的检查字词,并将取出的检查字词发送给字母对比模块30。
字母对比模块30用于对比英语字词与检查字词相对应位置的英文字母是否相同当对比结果不相同时,字词查找;溪块20会记录该位置的英文字母对比不相同;当对比结果相同则分别累计至少一次权重值,每一个检查字词会具有相对应的权重值。对比英语字词及检查字词时,可以将英语字词同时与每一个检查字词进行对比,或是对比单一检查字词完成后,再取出下一个检查字词进行对比,所累计的权重值是分开的。
具体来说,字母对比模块30会分别依次将英语字词与检查字词中的每一个位置的英文字母一一对比是否相同,假设6个英文字母当中,对比的结果为5个位置的英文字母是相同的,则字母对比模块30将会累计5次与检查字词相对应的权重值。
字母对比模块30对英语字词以及检查字词每一个位置的英文字母对比完成后,会将英语字词、检查字词以及所分别累计的权重值发送给字母关联模块40。
字母关联模块40用于接收字母对比模块30所发送来的英语字词、检查字词以及所分别累计的权重值。由于字母对比模块30记录了英文字母对比不相同的位置,因此,字母关联模块40可以通过字母对比模块30得知英语字词与检查字词中英文字母不相同的位置,并由此判断英语字词与检查字词相对应位置的英文字母是否具有操作上的关联,当判断具有操作上的关联则分别累计权重值。 <
具体来说,由于字母对比模块30会记录英文字母对比不相同的位置,因此,假设字母关联模块40通过字母对比模块30得知英语字词以及检查字词在第三个位置对比英文字母的结果是不相同的,字母关联模块40会判断英语字词以及检查字词在第三个位置的英文字母是否具有操作上的关联,当具有操作上的关联时,字母关联模块40将累计与检查字词相对应的权重值。
英文字母间操作上的关联定义为标准键盘上每一个英文字母上下左右的英文字母即为具有操作上的关联,举例来说,英文字母"d"操作上的关联英文字母为"e" 、 "c" 、 "s,,以及"f,;英文字母"p,,操作上的关联英文字母为"o";英文字母"1"操作上的关联英文字母为"o"以及"k";英文字母"z"操作上的关联英文字母为"a"以及"x,,,其佘英文字母可以依此类推,这里不再进行举例说明。
当字母关联^t块40对英语字词以及4企查字词不同英文字母的位置判断操作上的关联完成后,则将英语字词、检查字词以及所分别累计的权重值发送给相邻字母对比模块50。
相邻字母对比模块50接收到字母关联模块40所发送来的英语字词、检查字词以及所分别累计的权重值后,将对比英语字词相邻位置的英文字母与检查字词相邻位置的英文字母是否相同,若对比结果相同则分别累计权重值。
具体来说,假设英语字词为"abc"以及检查字词为"abd",首先,相邻字母对比才莫块50会对比英语字词第一位置、第二位置的英文字母"ab",以及检查字词第一位置、第二位置的英文字母"ab",相邻字母对比模块50所对比的结果为相同,因此,相邻字母对比模块50将会累计与检查字词相对应的权重值;接着,相邻字母对比模块50会对比英语字词第二位置、第三位置的英文字母"be",以及检查字词第二位置、第三位置的英文字母"bd",相邻字母对比模块50所对比的结果为不相同,则相邻字母对比模块50不会累计与检查字词相对应的权重值。
当相邻字母对比模块50对英语字词以及检查字词每一个相邻位置的英文字母对比完成后,会将英语字词、检查字词以及所分别累计的权重值发送给首字母对比模块60。
首字母对比模块60接收到相邻字母对比模块50所发送来的英语字词、检查字词以及所分别累计的权重值后,接着会对比英语字词的首字母与检查字词的首字母的英文字母是否相同,当对比结果相同则分别累计权重值。
经过字母对比模块30、字母关联模块40、相邻字母对比模块50以及首字母对比模块60所分别累计的权重值后,检查字词以及所分别累计的权重值将被发送给排序模块70。
排序模块70接收到首字母对比模块60所发送来的检查字词以及所分别累计的权重值,接着,排序模块70会依据权重值的大小顺序对检查字词进行排序,并将排序后的检查字词发送给显示模块80。显示模块80依照排序后的检查字词的顺序显示检查字词,以提供给使用者选择拼写检查后的结果,其中权重值较大的即为与使用者输入的英语字词相关程度较高的检查字词。
接着,以一个实施例来说明本发明的运作方式及流程,并请参照图2、图3、图4A至图4E以及图5所示。
图2是本发明拼写检查方法流程图;图3是本发明输入英语字词接口示意图;图4A至图4E是本发明拼写检查过程示意图;图5是本发明显示排序检查字词接口示意图。
如图3所示,用户在输入区域81中输入一个英语字词91为"reseatchavle",输入模块10接收到用户输入的英语字词91 "reseatchavle"(步骤100),并将英语字词91 "reseatchavle"发送给字词查找才莫块20。
字词查找才莫块20接收到英语字词91 "reseatchavle",由于英语字词91"reseatchavle"具有12个英文字母,因此,字词查找模块20会依据英语字词91 "reseatchavle,,的字母个数"12",自检查字库21中取出与英语字词
91 "reseatchavle"的字母个数"12"相同的第一检查字词92为"researchable"、第二检查字词93为"unsearchable"以及第三检查字词94为"reproachable"
(步骤200)。
请参考图4A所示,接着,字词查找模块20会将英语字词91"reseatchavle"、第一检查字词92 "researchable"、第二检查字词93"unsearchable"以及第三检查字词94 "reproachable"发送给字母对比模块30。
字母对比模块30在接收到英语字词91 "reseatchavle"、第一检查字词
92 "researchable,,、第二检查字词93 "unsearchable"以及第三检查字词94"reproachable,,后,可以将英语字词91同时与第一检查字词92、第二检查
字词93以及第三检查字词94进行对比,或是先对比英语字词91与第一检查字词92,再依序对比英语字词91与第二检查字词93、英语字词91与第三检查字词94。以实施例而言,釆用同时对比的方法对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94,因此字母对比模块30首先会分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94的第一个英文字母,分别为"r" 、 "r,, 、 "u"以及"r",对比结果为第一检查字词92以及第三检查字词94的第一个英文字母与英语字词91的第一个英文字母相同,第二4企查字词与英语字词91的第一个英文字母不相同。
对于对比相同的第一检查字词92以及第三检查字词94,则会分别累计与第一检查字词92以及第三检查字词94相对应的第一权重值95以及第三权重值97,第一权重值95以及第三权重值97分别累计"0.5"的权重值,而第二检查字词93与英语字词91的第一个英文字母不相同,则与第二检查字词93相对应的第二4又重值96不进行累计。
接着,再次依照顺序分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94每一个位置的英文字母,每一个位置对比相同的英文字母则累计"0.5"的权重值,对比不相同的英文字母则不累计权重值,结果如图4A所示,第一检查字词92 "researchable,,对比的结果具有10个位置的英文字母与英语字词91 "reseatchavle"相同,则会累计第一权重值95为"5";第二4企查字词93 "unsearchable"对比的结果具有8个位置的英文字母与英语字词91 "reseatchavle"相同,则会累计第二权重值96为"4";第三检查字词94"r印roachable,,对比的结果具有7个位置的英文字母与英语字词91 "reseatchavle"相同,则会累计第三权重值97为"3.5"(步骤300 )。
请参照图4B所示,接着,字母对比模块30会将英语字词91 "reseatchavle"、第一检查字词92 "researchable"、第二检查字词93 "unsearchable"、第三检查字词94 "reproachable"、第一权重值95 "5"、第二权重值96 "4"、第三权重值97 "3.5"发送给字母关联才莫块40。
字母关联模块40依然采用同时对比的方法对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94,首先,字母关联模块40会通过字母对比模块30得知英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94中,英文字母不相同的相对应位置,第一检查字词92"researchable"在"6" 、 "10"两个位置的英文字母与英语字词91 "reseatchavle,,不同;第二检查字词93 "unsearchable"在T 、 "2" 、 "6" 、 "10"四个位置的英文字母与英语字词91 "reseatchavle"不同;第三检查字词94
"reproachable"在"3" 、 "4" 、 "5" 、 "6" 、 "10"五个位置的英文字母与英语字词91 "reseatchavle"不同。
接着,第一检查字词92 "researchable"在"6" 、 "10"两个位置的英文字母分别为"r"以及"b,,,英语字词91 "reseatchavle,,在"6" 、 "10"两个位置的英文字母分别为"t"以及"v",由于英文字母"t"操作上的关联英文字母为"g" 、 "r,,以及"y",以及英文字母"v,,操作上的关联英文字母为T 、 "c"以及"b",因此,"r"以及"b"分别与"t"以及"v"具有操作上的关联,字母关联模块40则会分别累计"0.01"的权重值,第一权重值95则累计为"5.02"。
第二检查字词93 "unsearchable"在T 、 "2" 、 "6" 、 "10"四个位置的英文字母与英语字词91 "reseatchavle"在"1" 、 "2" 、 "6" 、 "10"四个位置的英文字母不同,判断结果为两个位置的英文字母具有操作上的关联,字母关联模块40则会分别累计"0.01"的权重值,第二权重值96则会累计为"4.02";第三检查字词94 "r邻roachable"在"3" 、 "4" 、 "5"、"6" 、 "10"五个位置的英文字母与英语字词91 "reseatchavle" 在"3"、"4" 、 "5" 、 "6" 、 "10"五个位置的英文字母不同,判断结果为两个位置的英文字母具有操作上的关联,字母关联模块40则会分别累计"0.01"的权重值,第二权重值96则累计为"3.52"(步骤400)。
请参照图4C所示,接着,字母关联模块40会将英语字词91"reseatchavle"、第一检查字词92 "researchable"、第二检查字词93"unsearchable"、第三检查字词94 "reproachable"、第一权重值95 "5.02"、第二权重值96 "4.02"、第三权重值97 "3.52"发送给相邻字母对比模块50。
相邻字母对比模块50依然采用同时对比的方法对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94,首先,相邻字母对比模块50会分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94的第一以及第二个英文字母分别为"re,, 、 "re,, 、 "un,,以及"re",对比结果为第一检查字词92以及第三检查字词94的第一以及第二个英文字母与英语字词91的第一及第二个英文字母相同,第二检查字词与英语字词91的第一以及第二个英文字母不相同。
对于对比相同的第一检查字词92以及第三检查字词94,则会分别累计与第 一检查字词92以及第三检查字词94相对应的第 一权重值95以及第三权重值97,第一权重值95以及第三权重值97分别累计"0.5"的权重值,而第二检查字词与英语字词91的第一个英文字母不相同,则与第二检查字词93相对应的第二权重值96不进行累计。
接着,再次依照顺序分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94每两个相邻位置(例如第一及第二位置、第二及第三位置...等)的英文字母,每两个相邻位置对比相同的英文字母则累计"0.5"的权重值,对比不相同的英文字母则不累计斥又重值,结果如图4C所示,第一检查字词92 "researchable"对比的结果具有7个相邻位置的英文字母与英语字词91 "reseatchavle"相同,则会累计第一权重值95为"8.52";第二检查字词93 "unsearchable"对比的结果具有5个相邻位置的英文字母与英语字词91 "reseatchavle"相同,则会累计第二权重值96为"6.52";第三检查字词94 "reproachable"对比的结果具有4个相邻位置的英文字母与英语字词91 "reseatchavle"相同,则会累计第三权重值97为"5.52"(步骤500 )。
请参照图4D所示,接着,相邻字母对比模块50会将英语字词91"reseatchavle"、第一检查字词92 "researchable"、第二4企查字词93"unsearchable"、第三检查字词94 "reproachable,,、第一权重值95 "8.52"、第二权重值96 "6.52"、第三权重值97 "5.52"发送给首字母对比模块60。
首字母对比模块60依然采用同时对比的方法对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94,首先,首字母对比模块60会分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94的首个英文字母分别为"r" 、 "r" 、 "u"以及"r",对比结果为第一检查字词92以及第三检查字词94的第一个英文字母与英语字词91的第一个英文字母相同,第二检查字词与英语字词91的第一个英文字母不相同。
对于对比相同的第一检查字词92以及第三检查字词94,则会分别累计与第一检查字词92以及第三检查字词94相对应的第一权重值95以及第三权重值97,第一权重值95以及第三权重值97分别累计"0.6"的权重值,而第二检查字词与英语字词91的第一个英文字母不相同,则与第二检查字词93相对应的第二权重值96不进行累计,结果如图4E所示,第一检查字词92"researchable"对比的结果与英语字词91 "reseatchavle"首字母相同,则会累计第一权重值95为"9.12";第二检查字词93 "unsearchable"对比的结果与英语字词91 "reseatchavle"首字母不相同,则第二权重值96为"6.52";第三检查字词94 "reproachable"对比的结果与英语字词91 "reseatchavle,,首字母相同,则会累计第三权重值97为"6.12"(步骤600)。
经过字母对比模块30、字母关联模块40、相邻字母对比模块50以及首字母对比模块60所分别累计的第一权重值95 "9.12"、第二权重值96 "6.52"以及第三权重值97 "6.12"累计完成后,接着,会将第一检查字词92"researchable"、第二检查字词93 "unsearchable"、第三检查字词94"reproachable"、第一权重值95 "9.12"、第二权重值96 "6.52"、第三权重值97 "6.12"发送给排序模块70。
排序模块70依据第一权重值95 "9.12"、第二权重值96 "6.52"、第三权重值97 "6.12"进行第一检查字词92 "researchable,,、第二检查字词93
"unsearchable"、第三检查字词94 "reproachable,,的排序,结果为与第一权重值95 "9.12"相对应的第一4企查字词92 "researchable"优先排列,接着,与第二权重值96 "6.52"相对应的第二检查字词93 "unsearchable"排列第二,最后,与第三权重值97 "6.12"相对应的第三检查字词94 "reproachable"排列为最后,并将排序后的第一检查字词92 "researchable"、第二检查字词93
"unsearchable"、第三检查字词94 "reproachable"发送给显示模块80 (步骤700)。
显示模块80依照排序后的第一检查字词92 "researchable"、第二检查字词93 "unsearchable"、第三检查字词94 "reproachable"的顺序将各检查字词显示于显示区域82 (步骤800)中,结果如图5所示,以提供使用者选择拼写检查后的结果,其中权重值较大的即为与使用者输入的英语字词相关程度较高的检查字词。综上所述,可知本发明与现有技术之间的差异在于本发明通过对比英语 字词以及检查字词的字母、相邻字母以及首字母是否相同,并且判断英语字 词以及检查字词不相同的字母操作上的关联性,进行权重值累计,依照权重 值的大小顺序对检查字词重新排序,权重值较高的检查字词即为较适合的拼 写检查结果,从而可以将较合适的拼写检查结杲优先显示给用户。
虽然本发明所提出的实施方式如上,但是所述的内容并非用来直接限定 本发明的专利保护范围。任何本发明所属技术领域中具有通常技术知识的人 员,在不脱离本发明所提出的精神和范围的前提下,可以在实施的形式上及 细节上作一些更改。本发明的专利保护范围,仍须以所附的权利要求书范围 所界定为准。
权利要求
1、一种拼写检查系统,其特征在于,包含一输入模块,用来输入一英语字词;一字词查找模块,依据该英语字词的字母个数从一检查字库中取出与该英语字词的字母个数相同的至少一检查字词;一字母对比模块,用于对比该英语字词与该些检查字词相对应位置的英文字母是否相同,当对比结果相同则分别累计至少一权重值;一字母关联模块,当对比该英语字词与该些检查字词相对应位置的英文字母不相同时,判断该英语字词与该些检查字词相对应位置的英文字母是否具有操作上的关联,当判断具有操作上的关联则分别累计该些权重值;一相邻字母对比模块,用于对比该英语字词相邻位置的英文字母与该些检查字词相邻位置的英文字母是否相同,当对比结果相同则分别累计该些权重值;一首字母对比模块,用于对比该英语字词的首字母与该些检查字词的首字母的英文字母是否相同,当对比结果相同则分别累计该些权重值;一排序模块,依据该些权重值的大小顺序对该些检查字词进行排序;及一显示模块,依照排序后的该些检查字词顺序显示该些检查字词。
2、 如权利要求l所述的系统,其特征在于所述英文字母之间操作上的关联是指标准键盘上每一个英文字母上下左 右的英文字母即为具有操作上的关联。
3、 一种拼写检查方法,其特征在于,包含 接收一英语字词;依据该英语字词的字母个数从一检查字库中取出与该英语字词的字母个 数相同的至少 一检查字词;对比该英语字词与该些检查字词相对应位置的英文字母是否相同,当对 比结果相同则分别累计至少 一权重值;当对比该英语字词与该些检查字词相对应位置的英文字母不相同时,判 断该英语字词与该些检查字词相对应位置的英文字母是否具有操作上的关联,当判断具有操作上的关联则分别累计该些权重值;对比该英语字词相邻位置的英文字母与该些检查字词相邻位置的英文字 母是否相同,当对比结果相同则分别累计该些4又重值;对比该英语字词的首字母与该些检查字词的首字母的英文字母是否相 同,当对比结果相同则分别累计该些权重值;依据该些权重值的大小顺序对该些检查字词进行排序;及依照排序后的该些检查字词顺序显示该些检查字词。
4、如权利要求3所述的方法,其特征在于所述英文字母之间操作上的关联是指标准键盘上每一个英文字母上下左 右的英文字母即为具有操作上的关联。
全文摘要
一种拼写检查系统及其方法,通过对比使用者输入的字词与拼写检查字词的字母、相邻字母以及首字母是否相同,并且判断使用者输入的字词与拼写检查字词不相同的字母操作上的关联性,进行权重值累计,依照权重值的大小顺序对拼写检查字词重新排序。该系统及其方法解决了现有技术中拼写检查无法提供较为合适的拼写检查字词顺序的问题,对拼写检查字词重新排序,从而提供使用者较合适的拼写检查结果。
文档编号G06F17/27GK101625678SQ20081013232
公开日2010年1月13日 申请日期2008年7月11日 优先权日2008年7月11日
发明者辉 王, 邱全成 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1