四种电脑汉字处理方法和一种中英文文字处理装置的制作方法

文档序号:100391阅读:834来源:国知局
专利名称:四种电脑汉字处理方法和一种中英文文字处理装置的制作方法
本发明的方法是电脑汉字处理方法和一种中英文文字处理装置,均可应用在中英文文字处理系统中。
在计算机技术的推广应用中,汉字输入法中的拼音输入法容易被人们普遍掌握,但有时要按四下键以上,才能输入一个字,同声字按四声顺序排列,规律性强,但往往有的常用字出现的很晚,影响汉字的输入速度,在使用小屏幕(如液晶屏幕)显示的文字处理系统中,往往由于屏幕小,而很难在有限的屏幕面积上进行全局编辑工作,给用户的操作带来不便。在编辑中,可以删字,找字或替换字,但有时会由于删掉汉字机内码的一个字节而出现误码,造成混乱。
本发明的目的就是为了解决汉字处理中的这些问题,提高汉字输入速度,在小屏幕显示时,如何可以保持用大屏幕显示的优点,删字,找字或替换字时,准确无误,从而提高了中英文文字处理系统的性能。
本发明的具体方法和一种中英文文字处理装置的技术方案是1.高频先见汉语拼音输入方法,本发明的特征是在键盘输入时,按了汉语拼音的声母和韵母后,在屏幕上显示出来的同音字的排列顺序是按这些字的常用程度(即根据统计资料,这些字出现的频度)来排列,频度越高的字越早出现。具体实现方法是(1)在系统的存储区中,按汉字国标码的顺序,事先存放每字频率。(2)在键入汉语拼音时,根据汉字拼音将全部同音字的频率取出来放入缓存区当中,并计算出这些字的国标码。(3)对这些字按频率重新排列。(4)显示在屏幕上供挑选。具体实施方案之一①数据表的构成,ROM中设立两个数据表。第一表为国标码一级字的出现频度表,按国标码顺序排列,即“啊”,“阿”,“埃”……“座”字的频度为第一表。第二表为二级字的国标码,按二级字的拼音顺序排列。
即a音 6325,7925,7571……(OY 锕,腌……)ai音 6263,7945,8616……(捱,锿,霭……)
zuo音 6460,8348,8501……(嘬,笮,酢……)②另设两个索引表,分别对应上述两个表,内有三项数据,即拼音码,在表中位置,同音字个数。③凡一字有多个读音的字的国标码,放在第二表中。④在键入汉语拼音后,根据第一索引表,可以查到第一表中该音的同音字的位置和个数,根据这一索引,从表中取出全部同音字,按第一表中所存的频率,自大到小重新排列,并在屏幕上显示。⑤如果程序找不到要找的字,可再根据第二索引表查第二表,由于第二表全部是非常用字,频度已无实际意义。因此不再重新排序,仅按原表的同音字顺序地在屏幕上显示供选择。⑥上述第一表的数据来源于对汉字出现频度的统计资料。第二表的数据,在汉字国标码本中,可以查到。这种方法的突出优点就是可以提高汉字的输入速度。
2.小屏幕显示的文字处理设备的全局显示方法,其特征是在小屏幕显示的文字处理设备中,可以使有限的屏幕显示更多的内容。全局显示时,保留各种编辑功能。这样使文字处理的显示编辑等工作更加直观方便。
实现方法是(1)编制压缩汉字点阵的程序,使得屏幕上可以显示点阵为24×24,16×16,8×8,4×4,2×2,2×1等各种大小的汉字。(2)在文字编辑处理程序中,按图1进行程序设计,使得在操作时,用户可随时切换全局显示方式和局部显示方式,在全局显示下,还可以由用户随时指显示汉字的大小。(3)在全局显示方式下,按图3进行程序设计,使文章内容在屏幕上得到显示。从光标现在位置起,先向右向下显示,显示完后再从光标位置起向左向上显示,直到显示到屏幕左上角为止。框图3是全局显示原理框图。(4)如上述,在全局显示时如果每个字符是4×4或更小,则已不能分辨该字的特征,为了操作员知道现在光标位置的字,可以在全局显示的同时,将光标所在的字(或与该相邻的字一起)在屏幕的一角开窗显示,这就弥补了看不清的缺点。
采用全局显示技术,使一个小小的屏幕具有计算机大显示器的主要功能,是小屏幕显示技术中一个大的突破。
3.整汉字处理方法。其特征是保证汉字代码识别的唯一性,而不至于产生二义性。
其技术方案是汉字机内代码采用两字节代码,第一字节代码最高位置1,第二字节代码最高位置零。使在编辑过程删字,找字或替换字时,准确无误。
具体处理过程从左到右扫描文章的汉字机内码,凡遇到最高位置1的代码,就连续取两字节,并按汉字处理。遇到最高位置零的按ASCII字符处理。如从右到左扫描,遇到最高位置零的码,要先看一下其左面的代码最高位是否是1,如是,则表明这是汉字码,这样使汉字在编辑中准确无误。
4.键盘的新颖设计方法。其特征是键盘的组成包括(1)常用字输入键,方法在键盘上设置一个以上的换档键,在每个字符键上印上常用字(如“的”,“是”等),在输入汉字时,将常用字键与该字符键同时按,则意味着输入该字。(2)双拼键盘排列。汉语拼音输入时,每字分为声母和韵母,汉语拼音用的全部声母和韵母均有相应的键位。(3)最常用的汉语标点符号键(与英文共用的除外。如。、“”《》)。对于书名号和左右括号合用一个键按下奇数次按键时,代表左括号;偶数次时,代表右括号。(4)标点、符号选择键,可以选标点如[()?!等],选数学符号[∧∨∑∏∪∩等]及特殊印刷符号[§№☆★○●]等共120种符号如表4供选用。(5)键上字共用四种颜色表示。其中黑色代表基本档(下档)时的输入。绿色上档代表上档时的输入。红色常用字档代表常用字输入。兰色控制档代表各控制功能。
本发明的中英文文字处理装置的设计方案为将上面讲过的四种电脑汉字处理方法首先在该中英文文字处理装置中采用,其结构如图2所示,主要六大部分组成。
其工作原理是要输入的文字符号由操作员通过键盘输入,采用本发明的高频先见汉语拼音输入法及键盘的设计,可以比较容易地输入汉字标点及各种符号;输入的文章存放在存储器中,由中央处理装置控制有关处理程序,使操作员可以对文章进行编辑修改,在编辑修改时采用本发明所述的整汉字处理方法,可以保证编辑处理的准确性;整个编辑处理过程在屏幕上可以进行显示,采用本发明所述的全局显示方法,可以在有限的屏幕面积上显示较多的文章内容,并且还可以在全局显示状态下实现一切编辑功能;在文章经过编辑修改之后,可以在打印机上打印出来;屏幕上显示的及打印机打印的汉字的字形是从汉字字库中取出来的。总之,采用了本发明的诸方法,可以使得中英文文字处理装置的工作效率得到提高。
本发明有如下附图图1全局与局部显示程序图图2装置结构图图3程序图图4键帽印字图图5键位编号图图6键位代码图,图中1表示键位代码位置图7键矩阵图,图中2表示键号。
本发明的具体实施例是四通MS-2400中英文打字机。主要技术指标为(1)显示屏幕240×64点图形液晶显示器,可以进行全局与局部显示切换,光标指示的字可以在小屏幕右上角显示。全局显示和局部显示都具有移段,删段,抄段,增字,减字,改字,删字等编辑功能;由于采取了整汉字处理方法,使得字处理不会产生二义性。(2)字库具有中国国家标准一、二级字库24×24点阵宋体及各国字母共7455个全角字,英文数字及符号共126个半角字(12×24点阵),英文、数字及符号上、下角标字共127个(8×8点阵),高质量的英文字符94个。(3)机内存储容量为25000个汉字。用户可以用点阵造字或用已有的字模来改成新造的字,可自造汉字或符号94个。可以自定义常用词组200条,输出打印系统,采用24针点阵式打印系统。(4)输入采用高频先见汉语拼音输入法,常用字输入法,还可选用汉字拼形输入法,其它代码输入法。(5)输入键盘上有字母键,数字键,功能键及光标控制键共69个。
键盘的详细设计为(一)硬件部分规格采用软扫描键矩阵系统检测键入。
①矩阵(9×8)(参看图7)。②行程3.0mm③作用力80g④接触电阻500Ω(最大)⑤颤动10ms(最大)⑥寿命5×106次⑦扫描方式两键轮流。
(二)键帽字符①键帽印字如图4所示②键位编号如图5所示③键帽底色1,14,15,16,29,30,43,44,45,57,58,59,60,62,63,64,65,66,67,68,69为ALPS标准ABS-GR62色,其余各键底色为ALPS标准ABS-LG43色。
(三)键位代码。由于有些键位功能完全相同(如44号键和57号键),因此在软件上按功能进行编码,功能相同者键的代码相同。图6是各键的代码。
(四)印字颜色键帽上的颜色共有4种黑色代表基本档,绿色代表上档,红色代表常用字档,兰色代表控制键档。具体指定如表1键盘印字说明所示。
按图5排列的键位置号,其文字定义为2号-13号,17号-28号,31号-42号,46号-56号,共计有47个字键符,键数字分为“左上”、“右上”、“左下”、“右下”四部分,见图1所示,其定义为左上符号(非字母键)或声母(字母键);右上高频字,这些字在文章中出现频度很高,本键盘上的47个高频字出现的频度之和为26%,即平均每四个字中就在一个字是本键盘上的高频字;左下ASCII字母声母或符号;右下韵母或符号。印字颜色对于47个字符键建议印字颜色为左上黑色(声母)或绿色(符号);右上红色;左下黑色;右下黑色。在第一排键上方的小字(“文始”,“文末”等)为兰色,65,69号键上方的“画线”与“文件存取”为兰色,第30号键上的字为兰色,第58号键和第64号键和第57号键上的字为绿色,第1,14,15,16,60,62,63号键为双色键,上半部为绿色,下半部为黑色。第69号键也为双色,其键帽上“印刷”二字为黑色,“通信”二字为红色。其余各键为黑色。具体指定如表1所示。
(五)字符代码在“四通MS-2400”中英文打字机中,键盘输入例行程序将键入转换为字符代码传递给调用程序,该代码为16位,其中低8位为ASCII代码,高8位为功能键码。代码表如表2所示,表中有*项的低8位为0,其高8位代码在表3中列出,无*者为ASCII字符,其高8位码为0,表中的-1代表这种组合无定义。
(六)功能代码在表2中有*项的按键输入,意味着功能键请求,用功能码来区分,如表3所示。
(七)键盘输入例行程序的调用方法下面是“四通MS-2400”中英文打字机的键盘输入程序接口约定(CPU为Intel 8088,使用汇编语言)。
调用方法INT 52H调用前(AH=0)读键盘输入返回值AL≠0时,AL为ASCII码AL=0时,AH为功能码(AH=1)读键盘状态返回值(ZF)=1时,无键入,CH为换档键状态(此时只有大写锁定状态有意义)(ZF)=0时,有键入,此时AX的返回值与读键盘输入相同CH为换档键状态CH各位的意义bit1=1 大写锁定bit4=1 上档bit5=1 常用字bit6=1 控制调用后返回值如上述,除AX外其余寄存器的内容均保留。
(八)汉字输入程序的设计例(1)程序关连如图8图所示。
其中KD-键盘输入程序(INT 52H)
CIP1~n-汉字输入程序(INT 53H~59H)TE-编辑程序DD-显示驱动程序(INT 50H,INT 6D)NCP-非汉字处理程序(2)程序功能NCP程序处理ASCII字符中小于20H的控制码及表3中的全部功能码,其中与键盘设计有关的功能为①常用字输入。当功能码为常用字时(参看表3),NCP程序将有关的汉字代码取出并返回。②常用标点符号输入。在汉字输入状态时,当按了标点符号键时,NCP程序将该标点符号的国标码取出并返回,③非常用标点符号的输入。当按了键(键号为62)后,在屏幕上显示各种标点符号供操作员选择,可供选择的120种符号参看表4。
(3)汉字输入程序的调用方法调用方法INT 53H(~59H,视输入方法而定)调用前(AH=0)读键盘返回值①若CL=0,说明为单个汉字输入AX中放输入的字符,约定如下如果AH的最高位为1,说明是汉字代码,此时AH为国标码的第一字节,AH为第二字节。
如果AH的最高位为0,则AL中放ASCII码;若AL=0,则AH中放的是功能码(参看表3)。
②若CL≠0,说明是词组输入。CL为词组的字节数,(一个汉字为两字节,且第一字节最高位为1;ACSII字符为一个字节,最高位为0)。
DS∶DX是词组的首地址。
表2.键位与字符代码对照表(有*号者为功能码)键号 键码 基本档 上档 控制 常用字1 1 全角* 半角* 印刷格式* -12 2 1 ! 文始* 下*3 3 2 @ 文末* 也*4 4 3 # 字号* 年*5 5 4 $¥ 修饰* 发*6 6 5 % 段操作* 可*7 7 6 ^造字* 会*8 8 7 & 找字* 主*9 9 8 * 换字* 动*10 10 9 ( 词组头* 工*11 11 0 ) 词组尾* 能*12 12 - _ 词组登记* 产*13 13 = + 排版格式* 而*14 14 后退 辅助* 全局/局部* -115 15 删字(del) 删行* 全文删除* -116 16 制表(009) |←* 查版本号* -117 17 q Q DC1 就*18 18 w W ETB 他*19 19 e E ENQ 要*20 20 r R DC2 大*21 21 t T DC4 这*22 22 y Y EM 人*23 23 u U NAK 中*24 24 i I HT 国*25 25 o O SI 时*26 26 p P DLE 出*27 27 [ { ESC 说*28 28 ] } GS 种*
表2.(续)键号 键码 基本档 上档 控制 常用字29 29 LF FF 出纸* 打印当前页*30 - -1 -1 -1 -1(控制)31 30 、 ~ -1 子*32 31 a A SOH 于*33 32 s S DC3 和*34 33 d D EOT 了*35 34 f F ACK 在*36 35 g G BEL -*37 36 h H BS 的*38 37 j J LF 是*39 38 k K VT 不*40 39 l L FF 有*41 40 , -1 地*42 41 ; ″ -1 过*43 42 CR CR LF -144 - -1 -1 -1 -1(上档)45 - -1 -1 -1 -1(大写)46 43 z Z SUB 对*47 44 x X CAN 作*48 45 c C ETX 生*49 46 v V SYN 个*50 47 b B STX 上*51 48 n N SO 为*52 49 m M CR 以*53 50 , < -1 来*54 51 . > -1 到*55 52 / ? -1 分*
表2.(续)键号 键码 基本档 上档 控制 常用字56 53 \ | FS 面*57 - -1 -1 -1 -1(上档)58 - -1 -1 -1 -1(常用字)59 54 取消命令(ESC) ESC ESC ESC60 55 电报* 区位* 国标* 查电报码*61 56 空格 空格 空格 空格62 63 标点* 英数* 纯英文* -163 57 拼音* 编码1* 编码3* 编码2*64 - -1 -1 -1 -1(常用字)65 58 ↑ ↑(粗线)* ↑(细线)* -166 59 ← ←(粗线)* ←(细线)* -167 60 → →(粗线)* →(细线)* -168 61 ↓ ↓(粗线)* ↓(细线)* -169 62 印刷* 逐行印刷* 文件存取* 通信*注有*号者为功能码(参看表3),-1表示无此组合。
表3.功能码表功能码 说明 功能码 说明1 印刷格式 13 排版格式2 文始 14 全局/局部3 文末 15 全文删除表3.(续)功能码 说明 功能码 说明4 字号 16 |←5 修饰 17 初始化6 段操作 18 ↑(粗线)7 造字 19 ←(粗线)8 找字 20 →(粗线)9 换字 21 ↓(粗线)10 词组头 22 打印当前页11 词组尾 29 印刷12 词组登记 30 出纸23 查版本号 78 删行42 电报 80-91 “就”-“种”43 查电报码 93-104 “子”-“过”54 编码2 105 半角55 区位 106-116 “对”-“面”56 拼音 117 英数57 编码1 118 国标58-61 ↑←→↓ 119 编码262 文件存取 120 逐行印刷63 标点 121-124 细线↑←→↓64 全角 125 通信65-76 “下”-“而” 126 纯英文77 辅助 127 无效码表4按标点符号键可以选择的120种符号( ) ? ! % ‘ ’ - ″# ¥ + - . / = [ ] ·⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽㈠ ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩〈 〉 「 」 『 』 〖 〗

〔 〕 ˇ 〃 々 ~ ‖ ± × ÷∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √⊥ ∥ ∠ ⌒ ⊙ ∫ ∮ ≡ ≌ ≈∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵ ∴♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £‰ § № ☆ ★ ○ ● ◎ ◇ ◆□ ■ △ ▲ ※ → ← ↑ ↓ 〓
权利要求
1.四种电脑汉字处理方法之一是高频先见汉语拼音输入法,本发明的特征是在键盘输入时,按了汉语拼音的声母和韵母键后,在屏幕上显示同音字,同音字的排列,按这些字的常用程度(即根据统计资料,这些字的出现频度)来排列,频度高的先出现。
2.四种电脑汉字处理方法之二是在小屏幕显示的文字处理设备中的全局显示方法,本发明的特征是可以使有限的屏幕显示更多的内容,使文字处理的编辑等工作更加直观方便,且保持各种编辑功能。
3.根据权利要求
2所述的处理,其特征是全局显示时,可以移动光标指示,光标指示的字,可以在小屏幕的一角上开窗口放大显示。
4.四种电脑汉字处理方法之三是整汉字处理方法,本发明的特征是保证汉字代码识别的唯一性,而不至于产生二义性。
5.四种电脑汉字处理方法之四是键盘的新颖设计方法,其特征是包括(1)常用字键,即在每个字符键上印上常用字(从汉字使用频度最高开始取的高频字)五十个左右,(2)汉语拼音的全部声母和韵母键,(3)最常用的汉语标点符号键(英文用的除外),(4)标点,符号选择键(可以选标点[()?!等],数学符号[∧∨∑∏∪∩等],特殊印刷符号[§№☆★○●]等120种符号供选用),(5)键上的字共用四种颜色表示。
6.采用权利要求
1或2或4或5所述的方法设计的产品是一种中英文文字处理装置,其特征是(1)具有常用字,高频先见汉语拼音输入法,(2)具有小屏幕全局显示方法,(3)具有整汉字处理方法,(4)具有新的四色键盘设计方法。
专利摘要
本发明是四种电脑汉字处理方法和一种中英文文字处理装置,属中英文文字处理系统的技术领域
。高频先见汉语拼音输入法及带常用字的新颖键盘设计,可以提高拼音法输入汉字的速度。全局显示方法使在小屏幕显示的情况下,具有大屏幕显示时的编辑功能。整汉字处理方法为当汉字机内代码为双字节时保证汉字代码识别的唯一性,及具有上面基本特征的一种中英文文字处理装置,它是一种便于掌握,可以代替铅字打字机的电脑装置。
文档编号G06F3/023GK86104621SQ86104621
公开日1987年6月24日 申请日期1986年7月3日
发明者王辑志 申请人:北京四通总公司导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1