易通汉字字词新查法

文档序号:8223601阅读:683来源:国知局
易通汉字字词新查法
【技术领域】
[0001] 本发明涉及计算机中文信息处理技术,具体来说是一种易通汉字字词新查法。
【背景技术】
[0002] 目前网络汉语字词典能查到操作系统汉字库所含每一汉字的释义,除给出部首、 拼音、笔画等检索办法外,还给出直接输入汉字检索的办法。因所给汉字检索办法不够好, 许多陌生字没法较顺利的查出输出,没法让其作用很好发辉。
[0003] 把汉字输入计算机的方法很多,不管是谁用什么汉字输入法输字,都可能会遇到 不会输的汉字,不会输的汉字可能属于操作系统汉字库中的汉字,也可能不属于操作系统 汉字库中的汉字。现在投稿件、上报材料、填写报表都要求使用电子文档或计算机打印,面 对此情况,对每个用计算机办公写文章的人员而言,能圆满完成输字工作任务的标准应当 是:输相关文件、填相关报表与写相关文章时,凡用到属于操作系统汉字库中的汉字,都能 用计算机输出,对操作系统汉字库中没有的汉字,能用操作系统提供的造字工具造出。
[0004] 上述情况表明,获取用国家语委制定的标准化汉字字形信息和字音信息将含于操 作系统汉字库中的不会输汉字字词顺利查出输出的办法,除能帮助用计算机输汉字的人员 圆满完成输字工作外,还能帮助用户通过网络中的汉语字词典给用户提供的直接输入汉字 字词检索功能,方便的查到操作系统汉字库中任意一个汉字字词的拼音与释义等信息。既 有利用计算机输汉字的人员圆满完成输字工作,也有利人们对汉字字词信息的了解,有利 写文章能正确用字用词,看文章能正确理解文章含意,有利电脑字词典效果的发挥,有利语 言文字规范化,有利汉字所具优越性的展示,有利汉字文化传承。
[0005] 申请人于2011年6月1日获国家知识产权局发明专利证书的"计算机输字易通 汉字编码输入法"(专利号:ZL200610010783. 7)的权利要求4给出了解决此问题的一个办 法。提交该专利申请时,还没有完成GB13000. 1字符集的20902个汉字的拆字工作,所以专 利号为ZL200610010783. 7的"计算机输字易通汉字编码输入法"的权利要求4所述办法存 在对问题考虑不周,所述办法有缺点,必须在其基础上获取改进办法。

【发明内容】

[0006] 本发明的目的在于针对上述现有技术中存在的不足,提供一种易通汉字字词新查 法,通过给当前操作系统汉字库所含GB13000. 1字符集的20902个汉字,建立包含"汉字、部 件、汉字笔顺码、笔画数、拼音、字级……"等信息的Access数据表,根据数据表中可用于解 决汉字查询的数据信息、Access提供的排序、筛选、查询和查找重复项等功能及科学精准的 获取优质汉字字词新查法的实际需要,开发专用的汉字拆字查字研究工具,找出能用汉字 的部件信息、汉字笔顺码信息、笔画数信息和拼音信息等四种查字信息组合而成的综合查 询信息的子信息,将计算机操作系统汉字库所含GB13000. 1字符集的20902个汉字的查字 问题解决好的汉字部件选取办法、汉字部件查询办法、汉字查字办法和汉字词语查询法。
[0007] 本发明通过如下技术方案予以实现:
[0008] 易通汉字字词新查法,将查询汉字的字形信息取为部件,对计算机操作系统汉字 库所含GB13000. 1字符集的20902个汉字,建立包含"汉字、部件、汉字笔顺码、笔画数、拼 音、字级"等6信息的Access数据表,对数据表中用于解决汉字查询的"部件、汉字笔顺 码、笔画数、拼音"四信息,用Access的排序、筛选、查询和查找重复项功能,获取用每一汉 字所含"部件、汉字笔顺码、笔画数、拼音"四种查字信息组合而成的综合查字信息的子信 息,解决GB13000. 1字符集中的汉字查字办法,其中"汉字、汉字笔顺码、笔画数、拼音、字 级" 5信息取国家语委标准化工作委员会颁布的标准化信息,部件选取遵循的主要原则是: 对GB13000. 1字符集的全部汉字,每个汉字的每个部件的选取都在含相交笔画的组字笔画 结构一律不拆、不能按被拆汉字的笔顺码顺序选取得到的部件一律不取的前提下,根据被 拆汉字的规范字形体结构,按照被拆汉字的笔顺码顺序依次选取被拆汉字所含的组字笔画 结构为被拆汉字的查字部件,简称部件,只与其它汉字有相同组字笔画结构的被拆汉字,取 其它汉字也含的相同组字笔画结构为被拆汉字的部件;既含其它汉字含有的相同组字笔画 结构,也含其它汉字没有的组字笔画结构的汉字,除被拆汉字所含其它汉字也含的相同组 字笔画结构取为被拆汉字的部件外,被拆汉字所含其它汉字没有的组字笔画结构,也取为 被拆汉字的部件;与其它汉字没有相同组字笔画结构的汉字,取自身为部件;全包围结构 的汉字和含全包围结构的汉字所含全包围部件一律不拆,其中每个全包围结构的汉字都取 自身为部件,每个含全包围结构的汉字,都将所含全包围结构取为一个部件;特殊半包围结 构的汉字和含特殊半包围结构的汉字所含特殊半包围部件一律不拆,其中每个特殊半包围 结构的汉字都取自身为部件,每个含特殊半包围结构的汉字,都将所含特殊半包围结构取 为一个部件;能拆复合部件的汉字,不拆复合部件所含的子部件;每一汉字所含各个部件 的部件笔顺码都用该汉字的汉字笔顺码依次获得,每一汉字的汉字笔顺码都等于自身依次 拆得的各个部件的部件笔顺码之和。
[0009] 在限定每字最多只拆四个部件的前提下,用汉字部件信息解决操作系统汉字库所 含GB13000. 1字符集20902个汉字的查字问题时,使用的部件有1105个,其中成字部件有 780个,非成字部件有325个,
[0010] 780个成字部件是:一二T十丁厂T匚匚七5三干亍于亏亏工土士子#卄才下寸 不升大丈兀尤万弋矢丰王开井天夫元无韦弍云专^丐廿木木五帀市支丐卅不犬太区歹友 尤匹车巨牙屯戈比无先互瓦弍玉匡未末示戋正甘世世册古本术可叵匝丙左石卒戊龙医平 东腫成弍匡耒式戎圭吉耳共亚亘臣吏再^而朿西亙戌百而页匠戍囫死成E夹夷至匡戒走 贡赤声巫求車甫匣更亜束豆成两酉丽医辰#夾豕尨来亊忒匼里武青甙匦者茭幸亞其昔若 直林來東或事雨匼豕贰医垚直哉革匮畐柬咸威頁匪謹珎敖匿匪髟栽馬载貢栽盍莫莧専或 鬲烕原匱彗匦貳埶黄萑或匮區戚帶匬爽匾貳裁裁裁裁壹黃楙麻寮雲載戴畺匯雷匿截匱匮 監爾臧奭裁匮噩匱匱戴匱匱丨J丄U卜门上小口口山巾止卄支少曰日吞中円贝 w内内水 见内北凸夕业氺旦目且曱甲申电田由史央兄叹甴冉^皿冊凹冋囚四回0/卡产光早吋曳虫 曲团団昍吕同因回网肉囝囡貝見囯里呆囲园围园足男困串囷邑囤囬困圃冏冏囵囫园図非 齿虎果国門囯固弗囷囹囹图圆囵韭昜禺品囿園骨幽鬥幸畢圃圄图圆固鹵堂圊曼圉國圇圈 跬畎晶單買圖圄圏黑圍圓黽園圔圑景蜀圓圚團圖圇圖齒晶喜圚圍圜豳_画j 4八人入乂 勹儿匕几九千乇乞川4彡亇3夕久夂夂么勺凡丸及t午牛手气毛壬4升夭夂长片化币斤 爪#戶父从炎爻-令今凶分月f?氏勿欠匁风丹乌殳韦生矢失乍禾丘白斥瓜乎令用甩尔乐 句匆匂册处鸟刍年朱缶先舌白豕自血向_舟合兆旨各多色我呑每身囱佥釆谷豸角条系垂 并秉臾隹卑金I侖t周鱼兔卸乗香重复泉鬼禹盾俞兪爰食風垂乘惟奚替倉眞鳥魚鼠僉會 鼻龜龠、彳广亡门丫?个之六文方火为斗;、、、户才、尤心主广立玄半头 穴年必永亦衣产吉亥羊米尹农言窗辛羌弟良京育单炊炎凿官音前酋高剡笟麻鹿章産寅戠 盥蕊薦裹龍羸贏iL乙了UHPP刀力乃又厶丨I《乜彐H尸己已已弓子孑屮孓P也女 久刃刃I飞叉马互乡乡么〈〈〈肀尹田尺夬弔丑卍月巴刃、办以予毋书毋司民弗疋出承卯召皮发 %矛母聿肃艮荔羽最总糸$卯矣肃录帚承叕韋弄飛弱能粛敢尋發肅辟澀維;325个非成字 部件是:
【主权项】
1. 易通汉字字词新查法,其特征在于,将查询汉字的字形信息取为部件,对计算机操作 系统汉字库所含GB13000. 1字符集的20902个汉字,建立包含"汉字、部件、汉字笔顺码、笔 画数、拼音、字级"等6信息的Access数据表,对数据表中用于解决汉字查询的"部件、汉字 笔顺码、笔画数、拼音"四信息,用Access的排序、筛选、查询和查找重复项功能,获取用每 一汉字所含"部件、汉字笔顺码、笔画数、拼音"四种查字信息组合而成的综合查字信息的子 信息,解决GB13000. 1字符集中的汉字查字办法,其中"汉字、汉字笔顺码、笔画数、拼音、字 级" 5信息取国家语委标准化工作委员会颁布的标准化信息,部件
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1