汉字数字切变模型及编码技术的制作方法

文档序号:6340557阅读:239来源:国知局
专利名称:汉字数字切变模型及编码技术的制作方法
技术领域
本发明涉及数字化信息技术,它直接用数字切变模型编码汉字,应用于微电子产品数码处理器的设计、制造。
目前所有的汉字编码大致可归纳为三类(1)形码。根据汉字笔画特点编码,如五笔字编码技术。其局限性一是学会了汉语文字的人;二是能熟练掌握汉字拆拼规律;三是记忆力好,能记住125个以上的字根所对应的键位。近日报载,王氏在五笔字的基础上又进一步研制出了五笔数码技术,以6码或9码输入,核心是将合体汉字分为首部和余部分别取码,依然没有摆脱原来的局限性。
(2)音码。根据汉语拼音规则编码技术,其基础一是学会了汉语文字并熟练掌握了普通话的拼音规则;二是能熟练区别同音字的编码方法;三是摒弃了方言俚语的干扰。
(3)音、形结合码。根据汉语拼音和汉字笔画特点相结合的编码技术,如音形两笔码,击键少,学习快。但局限性仍然是要学会了汉语文字,熟练掌握了汉语拼音和笔画特点。
这三类编码技术最大的缺陷一是抛弃了汉字思维和书写的传统,仅仅是根据汉字某一方面的特点而归纳出的方法。二是没有理论覆盖的普遍性。这些技术都不是建立在一个理论的支柱上,仅仅局限在汉语文字中,没有跳出汉语文字的圈子寻找一种普遍适用的编码技术,因此,使用没有普遍性。
发明汉字数字切变模型及编码技术的目的主要是克服现有编码技术中的不足之处。
a.经济全球化对汉字信息提出了全球共享的时代要求中国经济高速发展在全球化格局中具有举足轻重的地位。为了进一步加强中外经济、文化、科技等方面的交流,实现汉字信息全球共享,必须为汉语文字寻找一种普遍接受的理性编码技术。
b.英语在电脑、因特网上具有霸权地位,全世界有84%的信息都使用英语。中国人口众多,历史悠久,文字古老,在电脑、因特网上汉语文字为什么不能占有一席之地呢?为了反对这种文化霸权,改变这一局面,必须研究出一种比英语输入技术更直观、更简单、更便捷的理性化技术。
c.汉字是我们民族传统思维与书写的信息符号。这种传统文化不是用26个英文键位与少数偏旁部首简单结合所能表达和传承的。把民族传统文化与现代高科技融为一体,直观地实现汉字结构数字化。为中小学的语文教学和汉字思维、书写训练,以及国外初学者提供一种先进的技术帮助。
d.非数字信息输入电脑后,电脑必须依据程序首先进行二进制数字化,然后才能储存、传送和运算,汉字若能直接数字化输入电脑,为软件与硬件的制造将节省一道技术工序,从而降低成本。
e.解除原有的编码技术带来的记忆烦恼,用最直观、最简单、最便捷的理性方法,实现汉字编码。
为了实现上述目的,从以下四点阐述汉字数字切变模型及编码技术的方案。
(1)汉字结构的几何特征a.每个整体的汉字都是平面的方块形。
b.几何的点、线是汉字结构的基本元素。汉字笔画可概括为横、竖、撇、捺(点)、折五笔,具有几何的点、线特点,且方位的相对性十分显著。
横左右走向位上下 竖上下走向位左右撇右上至左下,对角走向 捺左上至右下,对角走向折笔左折、右折、横折、竖折直观地沿四角转折。
折笔左折、右折、横折、竖折直观地沿四角转折。
可以说撇捺是对角走向位四角,折笔走向最四角,点是捺笔的变形。
c.几何点线的相邻关系交、接、离。列表如下
此表可归纳为同形笔画相平行(相离),交、接关系费思量。捺点笔画多相接,竖笔、折笔相交、接。撇与横、捺、折,横与竖、撇、折。
横折与竖折,笔笔相交、接。
d.汉字结构与功能(音、义)的统一性。汉字以点、线形式的几何结构,表达汉语语音、语义,汉语语音、语义以汉字结构为基础,有结构便有功能(音、义),无结构便无从谈起语音、语义的功能。
e.汉字书写过程的连续性与结构元素的非连续性联结的切变,即时空联结的非连续性切变,是汉字结构的特质。所谓汉字结构是指笔画、方位及相邻关系三要素。汉字在书写过程中,其结构元素的变化与顺序的关系,以王字为例说明第1笔一横 方位在上,与下一笔可交、可接、亦可离。
第2笔一横 方位处中,前离后交。
第3笔丨竖 方位处中线,与第1笔相接与第2笔相交。
第4笔一横 方位处下,与第3笔相接,收笔。
通过上述分析,发现从起笔到收笔书写顺序的时空联结是一列等差数列1234。而这列等差数列中每一个数序把其相应的结构元素各种不同变化都蕴含于其中了,结构元素中不同笔画、不同方位、不同的相邻关系都以顺序相应的数字完整地代替了。我们把汉字结构这种有显著差异的不同联结,叫做非连续性切变的时空联结。因此,汉字结构从起笔到收笔的非连续性切变过程可概括为一个经验式子,借用流行的术语,即非线性耦合式若设f(N)(N=0,1,2……n)为汉字结构的建构过程;则非连续性切变的笔画为X0,X1,X2…Xn,方位为y0,y1,y2…yn,相邻关系为Z0,Z1,Z2…Zn,结构元素是一个整体,可看成为非连续性切变的无量纲矩阵。那么(N=0,1,2...n)f(N)=X0X1...Xny0y1...ynZ0Z1...Zn]]>汉字结构非连续性切变经验式的意义①数字有两层意义,一是数学计量意义,一是秩序的序位意义。这个经验式,不是数学意义上的计算式,不需要计量思维。式中的数字仅仅是表达了数序的意义。
②这个经验式是一个整体性的对汉字结构的描述,它有4项顺序、笔画、方位和相邻关系。
③经验式描述的内容都是视觉的、直观的。
④经验式中的核心是笔画,有笔画便有顺序、方位和相邻关系,否则一切都不成立。因此,这个经验式可以从笔画的几何特点来思考建立数字模型的问题。如果笔画是汉字结构的核心说法不谬的话,那么其笔画要有数序、方位、相邻关系来表示。为叙述简单仍以王字为例笔画 序位 方位 相邻关系横 一 1 上 起笔横 一 2 中 平行竖 丨 3 中 前接后交横 一 4 下 相接,收笔设笔画为f(x),x=横(X1)、竖(X2)、撇(X3)、点(捺)(X4)、折(X5)、、、、、。(X=X1,X2...Xn)f(x)=N1N2...Nny1y2...ynZ1Z2...Zn]]>这个直观的式子告诉我们汉字结构的笔画必须蕴含三个元素序位、方位、相邻关系。从起笔到收笔,汉字结构点、线的几何形式,如果能在一个数字模型中表示的话,那么这个数字模型应该具备下列条件①笔画(即点、线)必须是数字化的直观形式。
②笔画(即点、线)必须整体地蕴含(不是分割地)序位、方位和相邻关系,三者缺一不可。
③必须符合汉字结构平面方块形和笔画点、线走向的几何特点。
④必须实现一对一的点、线与数字化的视觉切换过程。
(2)建立汉字数字切变模型从中国传统文化中以数字表示空间方位,以点、线的非连续性切变实现计量的方法中得到启发,并综合了二者的思想,建立汉字数字切变模型。如图
(数字模型)数字切变模型能否担当起汉字结构数字化形式的切换呢?分析汉字结构与数字切变模型的同一性,就会一清二楚了。
汉字结构与数字切变模型的同一性,列表如下
(a)汉字数字切变模型实现汉字结构数字化的原理
①模型中凡相邻的一串数字(最少2个,最多4个,一般3个数字组成)都是同一平面内的几何点、线的数字形式。这种直观的几何数字形式是汉字结构实现数字切换的蓝图。
②数字切变模型与汉字结构都属于二维点、线的几何结构,能一对一地实现非连续性切变过程。这种切变不计面的大小和点、线的长短,以实现相同的顺序、方位和相邻关系的切变为目的。
③汉字数字切变模型与汉字结构在同一平面内的同一方位进行一对一的视觉切换,实现汉字结构数字化。
总之,在固定的数字切变模型中汉字结构以点、线切变的几何形式直观地实现数字化切换。这是汉字数字切变模型的基本原理。
(b)汉字结构数字化切换的过程①在数字切变模型中,利用视觉将汉字结构的点、线切换成数字。
②根据直观切换的数字击键。
③让电脑依事先编制的程序把上述输入的数字再还原成点、线的几何结构。
(c)汉字数字切变模型中几何点、线切变的数字化形式。列表如后 根据汉字数字切变模型和其中点、线切变的数字化形式,我们可以发现汉字数字切变模型中一个最大的特点,就是在不同序位和方位,以数字形式表示相同的横、竖、撇、捺(点)、折却有不同的数字形式,这些相同的笔画,不相同的数字形式告诉我们在什么序位,什么方位以何种相邻关系实现数字化的横、竖、撇、捺(点)、折是数字切变模型中的基本原理,即非连续性联结的72列数字切变形式。
经过上述分析,汉字数字切变模型中的点、线数字化形式,完全适合汉字笔画的结构元素特点即所有数字化的点、线形式都蕴含了笔画的序位、方位和相邻关系。
至此,我们可以对汉字结构非连续性切变理论小结一下,其要点是①时空联结的非连续性切变过程可概括为一个经验式;②汉字结构非连续性联结的切变可建立一个数字切变模型;③数字切变模型的点、线非连续性切变的数字化形式共有72列;④时空联结的非连续性切变具有普遍性。
(3)数码压缩汉字结构点、线几何形式的切变一般以相邻的3个数字串成一个数码表达,多至4个数字串成一列数码表达。汉字复杂,笔画繁多,数字化形式切变后又有如此多的数码表达,在操作上击键次数就会繁多,成为一个技术难关。为了减少击键次数,必须进行数码压缩。
数码压缩的原理和方法
①利用汉字结构相对性原理的压缩方法。切变的每列数码同时蕴含了笔画走势的方位,上下、左右、内外、四角等方位又都具有相对性,如横是左右走向,竖是上下走向,撇捺为对角走向等。根据相对性原理,以每笔起点的数序确立笔画的走势方向。如横123,从1必须走向3,1是相对于3的,确立1为123数列的击键数码就在情理之中了。同理,258,就确立2为该列数码的键位击键,余类推。
②利用汉字结构相邻关系的原理限定压缩方法。根据相对性原理,从数序1切变的数字形式不止一列数码。因此,从汉字结构相邻关系上可以发现,不管同一个数序切变形式的切变量有多少,总是限定在相交、相接、相离三个笔画相邻关系之中的。而事实上相离关系是用十分明显的平行(相同数码相平行)或以0开头的数码表示了,实质上是在相交、相接两种关系中选择。因此,“二中择一”对电脑来说,是一个毫不费力的事情了。
③切变量分类限定原理及方法。数字切变模型可以发生72列点、线切变形式,72列点、线切变形式中,横有8列,竖有10列,撇有9列,捺有8列,点有8列,折笔多共29列。上述分类后,又可以按数序再行分类,范围又缩小了一些,第三次还可以按模型内奇偶数相接的特点分类,范围就更小了。
④根据程序选择原理确认压缩后的数字形式。程序设计中有if....then....(如果....就....)这一条程序可以在数码压缩后确认数字形式,实现点、线结构还原。因为在同一个数序上切变,只几个或十几个数码形式,应用这条程序,就会立即确立该数码切变的几何点、线形式。
由于上述四条原理和方法,可以准确无误、万无一失地实现数码压缩后击键的点、线切变形式。
⑤数码压缩是建立在汉字结构完全编码的基础上,只有在完全编码基础上,才能以相邻关系,笔画相对性等原理确认压缩码的真正的几何点、线形式。
(4)数字切变模型编码汉字的具体规则①汉字编码的三个层次a.汉字结构完全编码,所谓完全编码,对象是初学者,对汉字结构的每笔每画都实行数字化切换,以传承汉字思维与书写的传统。但由于简单的汉字不多,而复杂的汉字所占的数量最大。复杂汉字都是由上下、左右、内外结构组合而成。为了加强初学者对汉字结构数字形式视觉切换的直观性,要进行完全编码,必须设计出上下、左右、内外相联结的数字切变模型。如图 实施上下、左右、内外相联结的数字模型编码汉字,注意上下、左右、内外的合成。上下结构编码汉字时,注意竖笔在4、5、6序位分上下而断取码,然后整体合成。而上部的横笔为789时,应合成为下部的起笔123。左右结构编码时,注意横笔在2、5、8序位中断取码,然后合成。内外结构编码汉字,主要是放大内部5的序位为一个编码的直观模型,外部以1379序位编码,然后整体合成。汉字独体结构完全编码,每笔每画都实行数字化切换。完全编码是整个技术应用的基础,在完全编码的基础上才有以后的两个层次。
b.学习汉语文字达到初中水平时,可对汉字实施轮廓编码。所谓轮廓编码是指在汉字的四角上即1、3、7、9方位上,找出其有代表性的笔画切换成几何点、线的数字化形式。
在1、3、7、9角上的笔画主要是以复笔形式出现的,怎样处理这四角上的复笔形式呢?以横、竖、撇、点(捺)、折为先后顺序取舍复笔实施编码。轮廓编码技术上的可靠性,以《四角号码字典》为佐证。内外结构可划分为完全的和不完全的两种,完全的内外结构外部取1379,内部取1、9位或3、7位编码。不完全的内外结构依内外各取前2笔编码。
c.词组与轮廓结合编码。
在日常工作中,需要简单,迅速、便捷地实施汉字编码输入。把每一个词组看成汉字结构的一个单位集合,在四角的1、9位或3、7位上取码,仍然按照横、竖、撇、点(捺)、折的先后顺序对复笔取舍编码。一是避免了重码,二是更省、更快的实现编码。
②定位合成规则。一是上下、左右、内外结构的定位合成规则。为了增强初学者视觉的直观性,以上下、左右、内外相联结的数字切变模型实行编码,以上下、左右、内外的原方位定位合成,二是轮廓合成规则。凡在1、3、7、9方位上取码,依照汉字整体规则定位合成。
③编码的几个具体问题依据原理,灵活编码。凡平行笔画一律取一个相同的数字形式,以减少数字切变模型内点、线形式切变量的不足。
相离的笔画除采用相同数字编码外,还得借用0编码如“八”—取码为570、059表示撇、捺相离。
凡一列只取2个数字的尾位补一个0。
凡折笔依同形同势编码,每一次转折只取3个数码,若一笔转折2次的,就得编2列数码。如“乙”字—取235、5789两列数码。
凡左边的撇,都取147码,如厂、广等;凡左边的“之”和“足”下的捺都取489码;凡大口取1379码,凡小口取5550码,若小口在1的序位上,则取5551码,若在2的序位则取5552码,余类推。
④汉字数字切变模型编码技术小结a.汉字结构与数字切变模型以几何点、线在同一方位实行一对一的直观的数字化切换,这种数字化切换有三个层次完全编码、轮廓编码,词组与轮廓结合编码。
b.依据数字切变模型几何点、线的72列数字化形式编码汉字,然后进行数字压缩,以压缩码击键,减少击键次数。
c.数字切变模型编码汉字对应的笔画顺序、笔画形状、方位、相邻关系是完全编码以笔画书写的先后秩序为编码顺序;轮廓编码以1、3、7、9位的对应顺序为编码顺序;词组与轮廓结合编码以1、9位或3、7位所对应的顺序为编码顺序。
笔画横、竖、撇、点(捺)、折,以所在方位对应的点、线数字形式为笔画。
方位以互相对应的上下、左右、内外、四角的方位为方位。
相邻关系相交有10组20列数字。
相接,凡模型内奇偶相接,所有数字之间都可相接;相离,同形笔画相离;笔画相离必平行,但平行笔画可被第三笔相交、接。另借用“0”表示撇、捺相离。
应用汉字数字切变模型编码技术有以下8点优越性。
(1)融合了传统文化的汉字思维、书写和现代高科技为一体,为传承传统文化找到了一个行之有效的好方法。非连续性联结的切变不仅是汉字结构的特质,也是我们民族的思维特点。汉字思维与书写是民族传统文化的代表之一。因此,建立汉字数字切变模型编码汉字对传承传统文化具有重要意义。
(2)汉字数字切变模型领取了全球的通行证几何原理具有世界通用性;1-9的阿拉伯数字全球通行。因此,汉字数字切变模型为汉字信息实现全球共享打开了一条通道。
(3)符号信息直接地实现数字化,将减少芯片设计、制造的难度,降低硬件成本。凡非数字的符号信息输入电脑后,由电脑依据二进制原理数字化处理后再进入储存、运算等工作状态,而应用汉字数字切变模型,将节省这一道技术工序,直接进入储存、运算等工作状态,从而降低了硬件成本。
(4)不须记忆字根,不须记忆拼音字母,不受语种和方言俚语的干扰,依照数字切变模型,可在电脑上供初学者自学具有普遍性、通用性。
(5)经济价值巨大,可依据数字切变模型的原理制成软件供中外的初学者应用。更重要的是可应用于因特网、电脑、电视、机顶盒、手机等微电子产品的制造,有巨大的价值。
(6)汉字数字切变模型是以非连续性切变理论为基础而建立的,汉字结构数字化技术是建立在理论基础上的,以理论烛照、支撑技术。因此,该技术是十分简单可靠的。
(7)汉字数字切变模型非常直观、原理简单,一个数模模尽天下汉字,九个数字数尽汉字特征。且灵活多变,十分便捷,视觉实现数字化,技术最为先进。
(8)根据结构与功能统一性原理,汉字结构的数字化为汉字音、义功能的表达也奠定了数字化的基础。汉字是形、音、义三位一体的信息符号,以汉字数字切变模型实现汉字整体结构的数字化,与五笔数码以指称笔画的数字化形式其意义是完全不同的。因而,汉字数字切变模型为汉语文字的语音、语义数字化揭开了神秘的面纱。当然,话音、语义都是很复杂的。如语音还有音频、音调、音质、音色、四声等诸多话音元素组合问题。但根据汉字整体结构确立的拼音字母即普通话标准已伴随着汉字结构数字化而奠基。
以完全编码为基础的轮廓编码、词组与轮廓结合编码汉字180例。
(1)独体结构、上下结构、左右结构、内外结构的完全编码;
(2)轮廓编码
(3)词组与轮廓结合编码
权利要求
1.一种汉字数字切变模型及编码技术,其特征在于以72列数字形式建立几何点,线的非连续性切变模型,对汉字结构点、线实现一对一的数字切换。
2.按照权利要求1所说的数码技术,其特征在于汉字结构点、线数字形式全部蕴含了笔画、方位和相邻关系三要素,其点、线数字形式的先后顺序,必须同时与三要素完整地一一对应发生非线性耦合。
3.按照权利要求1、2所说的数码技术,其特征在于汉字结构点、线数字形式直接进入电子产品的运算器,无须为非数字符号信息进行专门的数字处理,为电子产品设计、制造节省一道技术工序。
4.按照权利要求1、2所说的数码技术,其特征在于,以同一平面的汉字结构点、线的相对性原理,以每笔起点的数字序位为该点、线数字形式的压缩码,72列点、线数字形式以9个数序完全实现压缩。
5.按照权利要求1、2所说的数码技术,其特征在于应用数字切变模型编码汉字,依据汉字结构,可分别实施独体结构的完全编码和以上下、左右、内外相联结的数码模型合成结构的完全编码。
6.按照权利要求1、5所说的数码技术,其特征在于,在完全编码的基础上以数字切变模型与汉字结构对应的1、3、7、9序位上的轮廓编码。
7.按照权利要求1、5所说的数码技术,其特征在于,在完全编码的基础上,以数字切变模型与词组每个汉字对应的1、9序位或3、7序位实施词组与轮廓结合编码。
8.按照权利要求1、2所说的数码技术,其特征在于以视觉直观的几何点、线的数字形式,对汉字结构实施整体结构编码,不是分割拆拼的点、线数字形式编码。
全文摘要
主要是解决汉字结构直观地实现数字化,为初学者在电脑、因特网上学习汉语文字不须记忆字根和拼音字母。其主要技术特征是:根据汉字结构从起笔到收笔的非连续性切变的性质,从而建立一个符合汉字结构特质的数字切变模型,使汉字结构在这个数字切变模型中实现一对一的点、线切换,并依据汉字结构相对性原理进行数字压缩。其主要用途是根据数字切变模型原理制造相应的数字化微电子产品。如电脑、机顶盒、手机等,以及开发相应的应用软件。
文档编号G06F3/023GK1360245SQ0012675
公开日2002年7月24日 申请日期2000年12月20日 优先权日2000年12月20日
发明者姜道友 申请人:姜道友
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1