专利名称:遵循通用网论的Petri网模型与语用语言的解析方法
技术领域:
本发明涉及一种解析方法,特别涉及一种遵循Petri网通用网论的Petri网模型与语用语言的解析方法。
背景技术:
在赵维创造的旨在解决网格计算问题的遵循Petri网原理的语用计算机中,计算机应用逻辑是用汉语语用语言表达的,即用汉语语用语言来描述应用逻辑。而语用计算机的计算模型是Petri网,这样就需要实现汉语语用语言与Petri网模型的相互转换。在语用计算机里,称这一过程为解析,由解析器(Parser)来实现。
在语用计算机里,称语用语言到Petri网模型的转换为理解;称Petri网模型到语用语言的转换为表达。而语用语言是汉语言的一个真子集,因此遵循Petri网通用网论的Petri网模型与语用语言的解析方法实际上实现了汉语言的理解与表达。
在Petri网原理中,遵循Petri网通用网论的Petri网模型与语用语言的解析方法被称为形式语用学。形式语用学目前尚处于酝酿当中。
发明内容
因此,本发明的目的是要设计这个语用语言到Petri网模型之间的可逆转换方法,以发展形式语用学,实现汉语语用语言的理解与表达。包括1定义语用单位及其Petri网结构。
2定义原子语用单位。
3语用单位的组词方法。
4语用单位的造句方法。
5理解,语用语言转换为Petri网系统的过程。
6表达,Petri网系统转换为语用语言的过程。称由语用单位组成的语用单位串为语用语言。
图1是当(As∪Ah)T时的情形,语用单位(PU)表现为S_元(或S_性)。
图2是当(As∪Ah)S时的情形,PU义表现为T_元(或T_性)。
图3是当(AsT)∩(AhS)时的情形,PU表现为ST_元(或ST_性)。
图4是当(AsS)∩(AhT)时的情形,PU又表现为TS_元(或TS_性)。
具体实施例方式
1语用单位软件的支撑环境为操作系统,Petri网计算机的存在环境叫语用网(pragmatic Web)。语用网里的唯一元素叫语用单位(pragmatic unit,简称PU),语用单位之间的信息流关系联系构成了语用网。语用学研究语用网里语用单位及其联系,以及如何用已有语用单位构造新语用单位。
C.A.Petri定义语用单位为抽象即对属于同一目标的一切活动的抽象,例如同属于某个软件系统的程序步骤或同属于某个商务系统的交易步骤等。这个系统是一个大的分布式的实际进程,一个不能忽略其中任何具体成分、否则就会破坏事物完整性或事物平衡的整体。语用单位就是对这个整体、即这些系统中所有活动步骤的抽象概念。
语用单位除了具有上述的“抽象性”以外,还具有“内射性”。即语用单位是对某一具体语用系统的抽象,这个系统不是一个“封闭世界”,其与语用环境存在着物质流、能量流及信息流的交换。
定义1十元组PU=(S,T;F,K,W,M0;As,Ah,Fin,Fout)构成语用单位的条件是(1)∑=(S,T;F,K,W,M0)构成Petri网系统,称为PU的内涵。
(2)AsS∪T,称为PU的源集合(source set);AhS∪T,称为PU的洞集合(hole set);FinF,称为PU的源关系,或者输入关系、条件关系;FoutF,称为PU的洞关系,或者输出关系、结果关系。(As,Ah,Fin,Fout)统称为PU的外延。
语用网中,语用单位PU的源As又被称为语用条件,即语用系统引入该语用单位前必须为其提供相应的基础条件;语用单位PU的洞Ah又被称为语用结果,即语用系统引入该语用单位前就已经知道其可以产生系统想要的结果。
定义1的十元组形式书写起来比较麻烦,有时候可以简化成如下形式。
定义2五元组PU=(∑;As,Ah,Fin,Fout)构成语用单位的条件是(1)∑是Petri网系统,称为PU的内涵。
(2)As∑,称为PU的源(source set)集;Ah∑,称为PU的洞(hole)集;Fin∑,称为PU的源关系,或者输入关系、条件关系;Fout∑,称为PU的洞关系,或者输出关系、结果关系。(As,Ah,Fin,Fout)统称为PU的外延。
语用单位由其内涵和外延唯一确定,内涵是其网模型的实现,外延定义其与环境的信息交互。因此语用单位是一个概念,一个对软件构件等执行系统抽象而来的概念,而不是一个具体实现。
通常PU所代表的系统包含有多个S_元和T_元,每一个元素都可能与环境中的观察者交互信息。
在Petri网语用学中,与观察者交互信息的总是语用系统中的某一元素(或元素集合)。称直接与观察者交互信息的元素(集)为系统的参照系。参照系不同,系统的外延可能不同,即表现出不同的性质。
我们也可以说语用单位的内涵是由外延决定的,即如果语用单位的源集与洞集都为T性的话,则语用单位表现为S元;如果语用单位的源集与洞集都为S性的话,则语用单位表现为T元;如果语用单位的源集为T性,而洞集为S性的话,则语用单位表现为ST元;如果语用单位的源集为S性,而洞集为T性的话,则语用单位表现为TS元。
因此语用单位最主要的特征是其多变性,并且该多变性是通过观察得到的。Petri网语用学正是利用语用单位的多变性来刻画和模拟客观事物的多样性的。
2原子语用单位图灵机是软件系统的理论基础,Petri网是语用系统的理论基础。语用计算机是基于软件构件系统之上的,语用学的第一级抽象就是体现软件构件间并发关系的“造字”。
语用网里所有的字都是由软构件系统通过元数据概念抽象而来,称这一抽象过程为造字。造字是原子语用单位(简称原子语用),包括T_字和S_字两类。原子语用只有外延,没有内涵,因而不可分解。原子语用的内涵是由语用学以外的软硬件计算机系统实现的。
当软件构件被封装为微软.Net技术的公共语言运行库时,就可以通过其元数据概念被提取或转化为语用网的原子语用。
定义3由软件构件封装抽象而来的原子语用为T_字,T_字定义为四元组TW=(Ss,Sh,Fin,Fout)构成Petri网里的T_元。Ss称为TW的S_源集(source state set),Sh称为TW的S_洞集(hole state set),Fin称为TW的源关系,Fout称为TW的洞关系。(Ss,Sh,Fin, Fout)统称为TW的外延。
当数据资源被封装为微软WSRF.Net技术的公共资源库时,也可以通过其元数据概念被提取或转化为语用网的原子语用。
定义4由数据资源封装抽象而来的原子语用为S_字,S_字定义为四元组SW=(Ts,Th,Fin,Fout)构成Petri网里的S_元。Ts称为SW的T_源集(source transition set),Sh称为SW的T_洞集(hole transition set),Fin称为SW的源关系,Fout称为SW的洞关系。(Ts,Th,Fin,Fout)统称为SW的外延。
原子语用是最简单的语用单位,一般来说没有什么复杂的性质变化,即S_字通常就是S_元、T_字就是T_元。
原子语用直接由软件构件和数据资源封装抽象而来,语用学中认为原子语用是完全“异步并发”的,Petri网模型一般不理会这些软件构件和数据资源是如何实现和保存的,Petri网模型研究和定义这些软件构件和数据资源是如何实现“共享与协作”的。
3组词通用网论中,“出现结构”是比“并发关系”高一级的抽象概念;相对应,语用学里组词是比造字高一级的概念抽象。在Petri网语用学里,组词是最低级的语法现象。一个T字(或T元、T性)通常只能加工某些S字(或S元、S性),称为T选择性,即T字的S_源集和S_洞集;一个S字(或S元、S性)通常只能被某些T字(或T元、T性)所加工,称为S限定性,即S字的T_源集和T_洞集。
定义5当两个分别为A1、A2的语用单位满足(A1∈A2.As)∩(A2∈A1.Ah)条件时可以组词词A1A2=(∑A1∪∑A2,A1.As,A2.Ah,A1.Fin,A2.Fout)。并称A1为前语用,A2为后语用。词A1A2的内涵为前语用与后语用的内涵和,词的源集和源关系为前语用的源集和源关系,词的洞集和洞关系为后语用的洞集和洞关系。
当前语用属于后语用的源集,而后语用属于前语用的后集时,可以发生组词。由定义可知,词是语用单位。在语用学里,组词是获得高一级语用单位的有效过程。
4语句在通用网论中,“出现结构”上一级的抽象是“C/E系统”;相对应的,语用学里比组词更高一级的语法抽象是造句。
语用学里,仅仅通过组词过程复合高级语用单位,往往收敛较慢。因而需要更为有效的获取高级语用单位的方法,造句便是这一获取复杂复合语用单位的快速方法。
语用学里组词是对语用网里“出现结构”的抽象概括;造句则是对语用网里“C/E系统”的抽象概括。在Petri网语用学里,造句是比组词更高一级的语法现象,Petri网语用学用C/E系统理论来支持造句过程。
由并发个体的时间线,交互产生了“出现结构”,若将出现结构中同一状态的不同出现重叠,同一事件的不同出现也重叠起来,就能得到由条件(状态是否成立)和事件组成的最基本的网系统,即条件/事件系统(condition event system),简称C/E系统。
定义6语用单位串Sp(TS)qTr,其中p+r=1,q>1为语用网的语句的充分必要条件是语用单位串Sp(TS)qTr为C/E_系统中的一条路径。
语句的外延(源和洞)分别取决于语句的首元素和尾元素,头元素的源集及源关系就是语句的源集及源关系,尾元素的洞集及洞关系就是语句的洞集及洞关系。
语用学里称获取语句的过程为造句。
当定义6中的q=1时,造句过程就弱化为组词过程。
特别地,我们可以定义语句为成语idiom=(Sp(TS)qTr,h.As,t.Ah,h.Fin,t.Fout),其中h为语句头元素,t为语句尾元素。
由定义可知,字、词、语句和成语都是语用单位。
前面4项内容是语用单位的定义与生成,属于语用学语法规则,后面2项是规则的应用。理解是由一篇语用文章解析出相应Petri网系统(或网结构)的过程,而表达则是把一个网系统(或网结构)转化为一篇相应语用文章。
5理解为简单起见,定义语用文章是语用单位串的集合,没有分词用的助词及分句用的符号。即文章中所有的语用单位串没有先后的理解次序,语句中的组词过程也是从左到右,不需要堆栈。
语用系统的解析器在理解文章之前,必须拥有完善的字词句和成语等语用单位,解析器只能识别已经掌握的语用单位,并且只能理解出已有语用单位按语用语法规则的生成空间以内的文章。语用学称该生成空间为理解域。
文章理解过程包括分字、组词和构造C/E网系统。
分字就是提取文章中的所有语用单位,文章如果出现了系统中没有的语用单位,则解析器应该报分字错;否则分字过程结束,并不需重复地记录下文章中的所有语用单位。
接着组词,按组词规则逐句地分析文章,如果出现不是组词的前后两个语用单位,则解析器报组词错,否则记录下一条从前语用到后语用的边。此过程遍历文章中所有语句。
理解过程结束,如果语用文章表达完整的话,此时应当出现一个完整的Petri网模型,可以按照Petri网原理对系统作分析了。
利用组词方法理解文章速度太慢,我们可以首先构件语用系统的C/E网。当文章分字结束后,我们得到了系统所涉及到的所有语用单位的一个列表,逐个遍历,对每一个语用单位A,先处理洞集,如果语用单位A的洞集中包含的语用单位B出现在系统语用单位列表中的话,则添加一个从A到B的流关系;再处理源集,如果语用单位A的源集中包含的语用单位C现在系统语用单位列表中的话,则添加一个从C到A的流关系。遍历完成后,我们就得到了该语用系统的C/E网。我们可以基于此网快速对文章做出解析遍历文章语句集合,如果文章语句出现在C/E网中,则称所匹配的C/E路径被语句所覆盖。有覆盖的语句为有效,否则为系统不可识别,并且可以指出匹配失败的语用单位处。最后删除C/E系统中所有没有被文章语句所覆盖的边,就得到了文章所描述的语用系统。
6表达表达是理解的反过程,有时候称表达为网的串行化,理解为反串行化,也合称表达与理解为语用系统(反)串行化。
表达总是针对某一个确定的语用系统。当网系统给出后,我们可以用语用语法规则实现对网系统的表达,过程如下
首先定义未表达边集合为网系统所有的边集合。
接着遍历未表达边集合,对于每一个未表达边,从其始语用单位出发,走一条任意路径,要求路径上的所有边皆为未表达边,称此路径为表达路径。依次输出该路径上的全部语用单位,则为语用文章的一条语句,称这一个输出过程为表达。同时从未表达边集合里删除掉已经表达的边。
此过程直到未表达边集合为空,此时输出了全部网系统的表达语句。
由于表达路径的任意性,同一个语用系统就存在多种表达方式。这些表现为不同语用文章的语用系统拥有同一个Petri网系统模型,因而是同一个语用系统。
因此理解的过程是一个由表及里的认识过程,而表达则是一个由里及表的阐述过程。
因此语用计算机的解析器实现了语用语言的理解与表达。
而由具体实施方式
1-4可知,语用语法规则恰是汉语语法规则,因此语用语言是汉语言(的一个真子集)。因此语用计算机实现了汉语语言的理解与表达。
因为在不脱离本发明的精神和基本特性的情况下,本发明可能具有多种表现形式,所以应该理解除非特定说明,上述的理解与表达实施方式不被前面描述的任何细节所限制,而是应该理解为权利要求所定义的那样的精神和范围之内广泛的解释,即本发明可以采用多种实现和优化形式,不应局限于从WSRF.net上抽象,而可以基于任何软件封装技术与元数据概念抽象之上。因此在权利要求范围之内的更正和修改,以及这个范围之内的其它等价变换,也包括在权利要求之中。
权利要求
1.遵循通用网论的Petri网模型与语用语言的解析方法,包括语用单位的定义方法。
2.遵循通用网论的Petri网模型与语用语言的解析方法,包括原子语用单位的定义。
3.遵循通用网论的Petri网模型与语用语言的解析方法,包括语用单位的组词方法。
4.遵循通用网论的Petri网模型与语用语言的解析方法,包括语用单位的造句方法。
5.遵循通用网论的Petri网模型与语用语言的解析方法,包括理解,即从语用文章转换为Petri网系统的过程。
6.遵循通用网论的Petri网模型与语用语言的解析方法,包括表达,即从Petri网系统转换为语用语言的过程。
全文摘要
公开了一种遵循通用网论的Petri网模型与语用语言的解析方法。语用计算机的解析器实现语用语言与Petri网模型的相互转换,其解析方法就是由Petri网通用网论(general net theory)导出的Petri网语用学(Pragmatics)。语用学在Petri网原理中尚未能得到完整阐述与归纳。本发明就是导出该解析方法,即语用语法规则。通用网论包括并发关系、出现结构、C/E系统和信息流网,相应的语用规则是造字、组词、造句和谋篇。语用语法规则恰是汉语语法,因此语用语言是汉语言。因为本发明的解析方法实现了语用语言的理解(从语用语言解析出Petri网模型)和表达(从Petri网模型解析出语用语言),所以遵循通用网论的Petri网模型与语用语言的解析方法实现了汉语言的理解与表达。
文档编号G06F9/45GK1713148SQ20051004072
公开日2005年12月28日 申请日期2005年6月23日 优先权日2005年6月23日
发明者赵维 申请人:赵维