一种将加工过程描述语句转换为三元组结构的方法及系统与流程

文档序号:20278283发布日期:2020-04-07 14:49阅读:140来源:国知局
一种将加工过程描述语句转换为三元组结构的方法及系统与流程

本发明涉及机器学习领域和信息处理领域,特别是涉及一种将加工过程描述语句转换为三元组结构的方法及系统。



背景技术:

制造流程是指被加工对象不间断地通过生产设备和一系列的加工装置使原材料进行化学或物理变化、最终得到产品的过程,制造流程是制造领域的专业范畴,其中包含了大量的专有性工业加工术语,例如粗车、车削、磨削和精车等。

制造领域知识数据涉及多组织、多流程和多产品,具有多源、互联等特点,制造业的加工流程每个细分领域都会有自己的术语与习惯的表达用法,使用自然语言描述的加工操作记录由于人员的差异性、自然语言的丰富性,导致表达这种加工方法具有复杂的多样性,如同一加工方法可能会有很多种显著不同的表达方式,另外,数据的多源性导致数据的描述差异大及语义跨度大,难以统一理解和交流,引发了制造知识数据处理的诸多问题。例如,1、传统基于关键词的输入方法会导致很多同义语句的内容重复存储,让使用者或者参考者无法快速准确地得到他想要获取的相关知识;2、缺少制造业领域专业知识的深入。

基于此,特提出本发明。



技术实现要素:

为了解决现有技术中存在的上述问题,本发明的目的在于提供一种将加工过程描述语句转换为三元组结构的方法,根据已有加工方法转化为一个或多个最小化的结构,方便更为精准地了解或找出加工方法处理的优化方案。

本发明的技术方案为:一种将加工过程描述语句转换为三元组结构的方法,包括如下步骤:

s100:获取加工过程描述语句;

s200:基于预先建立的知识词典对所述加工过程描述语句进行语句拆分和语义分析,提取出相应的词语,并根据知识词典进行自动匹配,将所述词语分类为元件类、状态类或关系类;

s300:查询知识词典,将所述分类后的词语进行同义置换,置换为知识词典中的标准词;

s400:根据所述标准词生成三元组关系结构并输出。

进一步地,所述加工过程描述语句包括元件、元件属性、加工过程和最终产品中的一项或多项。

进一步地,所述知识词典包括元件词库、状态词库、同义词词库和关系词库。

可选地,所述知识词典还包括临时词库,用于存储在元件词库、同义词词库、关系词库和状态词库中均无法查到的临时用词。

进一步地,步骤s300还包括,将所述提取的词语与同义词词库中的子节点进行匹配,并根据匹配结果将所述提取的词语置换为匹配到的子节点对应的主节点标准词。

进一步地,步骤s200还包括,利用元件词库、状态词库和关系词库,对该加工过程描述语句进行匹配,以提取出与元件、元件状态和关系相关的词语。

进一步地,步骤s400包括:利用三元组建立相应的关系神经网络,将分类为元件类的词语作为实体以形成节点,将分类为状态类的词语作为状态以形成分节点,将分类为关系类的词语作为关系以形成传递线。

进一步地,所述三元组结构包括图形数据结构和表数据结构。

本发明还提供了一种将加工过程描述语句转换为三元组结构的系统,包括:

语句获取模块,用于获取加工过程描述语句;

语句拆分和语义分析模块,用于对所述加工过程描述语句进行语句拆分和语义分析;

同义置换模块,用于将分类后的所述词语进行同义置换,置换为知识词典中的标准词;

三元组构建模块,用于根据标准词构建出三元组关系结构。

本发明的优点:1、可以根据已有加工程序转化为一个或多个最小化的结构,方便更为精准的了解和获得工艺加工处理的优化方案。2、减少由于工人经验不足导致的加工方法的低效,尽可能降低工艺加工对于员工经验的要求度。3、为后续构建制造业加工方法知识图谱提供了方法。

附图说明

图1是本发明一种将加工过程描述语句转换为三元组结构的方法的流程图。

图2是本发明一种将加工过程描述语句转换为三元组结构的方法的语句拆分示意图。

图3是本发明一种将加工过程描述语句转换为三元组结构的方法的同义词词库结构示意图。

图4是本发明一种将加工过程描述语句转换为三元组结构的方法的最小化三元组结构图。

图5是本发明一种将加工过程描述语句转换为三元组结构的系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下根据附图1-5,对本发明的一种将加工过程描述语句转换为三元组结构的方法及系统作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,一种将加工过程描述语句转换为三元组结构的方法,包括如下的步骤:

s100:获取加工过程描述语句;

s200:基于预先建立的知识词典对所述加工过程描述语句进行语句拆分和语义分析,提取出相应的词语,并根据知识词典进行自动匹配,将所述词语分类为元件类、状态类或关系类;

s300:查询知识词典,将所述分类后的词语进行同义置换,置换为知识词典中的标准词;

s400:根据所述标准词生成三元组关系结构并输出。

在步骤s100中,加工过程描述语句是对加工流程过程的一个语境较为简单的描述,一般是运用某个元件或者某些元件通过某种方法形成一个新的元件或者是不同属性的元件的过程,这种描述能清楚表达出该元件或者某些元件的属性和属性值。一条加工过程描述语句通常包括四部分内容,分别为元件、元件属性、加工过程和最终产品。一个简单的加工过程描述语句实例为“圆钢公差等级为it12,表面粗糙度为30ra/um通过粗车加工方式进行加工得到外圆表面加工制品”,其中,圆钢和外圆表面加工制品是元件,公差等级、表面粗糙度是元件属性,it12、30ra/um是元件的属性值,粗车是加工过程,外圆表面加工制品是最终产品。

步骤s100中的知识词典包括元件词库、状态词库、同义词词库和关系词库。

元件词库来源于制造业产品配置知识库、制造流程库和其他知识库等制造业数据库。通常意义上元件是指在常用电器中可以互换使用的零件,比如说是电器﹑无线电﹑仪表等工业的某些零件,如电容﹑晶体管﹑游丝﹑发条等。但是本发明中,元件词库有更加宽广的解释,它是基于制造领域知识库,不仅仅限于工业上的零配件知识,也包括其他制造业的信息、资源和数据等元数据,甚至是没有实体形态的数据也可以作为元件在知识词典中存在。

元件词库里面的内容就是例如圆钢、淬火钢等工业加工过程中需要用到的元件的专有名词,并且通过了解得知这种类型的专有名词在本领域技术人员之间都是统一的,所以便于分类和识别。由于制造领域包含的产业领域方向繁多,所以在元件词库的更新时,需要同步更新同义词词库。

需要说明的是元件词库中包含的不仅限制与零件类的实体,也包括信息、资源、矿产、食品原材料或半成品。这里元件指的是可以通过加工等技术手段从而生产为一个新的产品的代名词。元件词库在使用过程中,可以不断更新升级。

状态词库用来记录描述元件的当时的状态属性特征的属性值,是存储元件词库的属性及属性值的词库,例如加工过程描述语句“圆钢公差等级为it12,表面粗糙度为30ra/um通过粗车加工方式进行加工得到外圆表面加工制品”中,圆钢和外圆表面加工制品是元件,公差等级、表面粗糙度是元件的属性,it12、30ra/um是元件的属性值。

同义词词库用于存储普遍通用的元件,初始的同义词词库可以参考别名词库创建而成(这种别名数据库网上可以轻松搜索到)。在同义词词库中,例如px是二甲苯的一种表达方式,实际上二者是同一个词,表达了相同的内容。需要注意的是,如果有些元件名词进行了更新换代,那么主节点词语发生变化时,需要人工修改主节点名词,并把原主节点名词加入子节点中。同义词词库需要不断地进行人工更新,对于首次遇见加工、操作这类词语,这些词语想要表达的都是同一个意思,但是首次电脑无法自动识别,需要通过人工干预的方法,将无法识别的词语与同义词词库的词汇相匹配,也就是完成了一次同义词词库的更新。

关系词库是用于存储元件与元件之间的关系的词库,包含同一个元件不同属性之间的关系,以及不同的元件之间的关系。

通常情况下,知识词典中还包括其他词库,也可以称作临时词库,用于存储临时用词,是为了给在元件词库、同义词词库、关系词库和状态词库中均无法查到的词语临时设置一个放置地带。

加工过程描述语句是对加工流程过程的描述,通常是一个语境较为简单的陈述句,描述的内容一般是运用某个元件或者某些元件通过某种方法形成一个新的元件或者是不同属性的元件的过程。

在本发明提供的将加工过程描述语句转换为三元组结构的方法中,对于获取的某一个确定的加工过程描述语句,首先根据知识词典对该加工过程描述语句进行语句的拆分与解析,利用元件词库、状态词库和关系词库,对该加工过程描述语句进行匹配,提取出与元件、元件属性和属性值以及关系等相关的词语,然后对这些词语进行大体分类,例如把这些提取出来的词语,分入元件类、状态类或关系类。

步骤s200还包括,对加工过程描述语句进行语句拆分的时候也进行语句的标识,拆分后的词语自动匹配相应归属的知识词典里面的数据表,并被标示为所对应的数据表的属性,即被标示为元件类、状态类或关系类。例如汽车发动机的数据表属性为汽车,汽车数据表属于元件数据库,那么汽车发动机这个语句标识为元件和汽车。

举例来说,对于“氢气h2和氧气02点燃生成h20”这一加工过程描述语句,首先根据元件词库进行匹配,提取出“h2”、“o2”和“h2o”这三个元件,通过关系词库可以提取出“点燃”这个关系动作词,根据状态词库进行匹配,没有匹配到相应的状态,这里就不需要输出状态,采用系统的默认值即可。该加工过程描述语句拆分后,将“h2”、“o2”和“h2o”标记为元件类,将“点燃”标记为状态类;该加工过程描述语句拆分后,有两种关系,如图2所示,把该加工过程描述语句拆分为两个元件之间的关系,即h2与h20之间的关系和02与h2o之间的关系。

在步骤s300中,将提取的词语与同义词词库中的子节点进行匹配,并根据匹配结果将所述提取的词语置换为匹配到的子节点对应的主节点标准词。

根据加工描述语句中语义在同义词词库中进行筛查并替换。由于很多语句的描述都不是标准的句式,尽管多数情况下技术人员输入了较为标准的操作流程语句,而且很多元件名词为有固定意义的名词,但是在描述过程中不免会有口语化的名词出现,或者同一个元件可能会有很多个名称,这多个名称中只有一个是国际通用的标准名称(以下简称为标准词)。为了更为准确的进行信息的匹配,本发明中将加工过程描述语句在同义词词库中进行同义词的置换,一般同义词词库里面多个同义词仅能匹配唯一的标准词。例如加热、加温等都是增加元件温度的一种说法,在此时就会通过同义词词库进行转换。例如六角螺母,防松螺母,开槽螺母等其实都属于六角螺母,通过同义词词库转换后,这些词均转化为六角螺母。

如图3所示,为同义词词库的一个实例,在很多对金属的加工工艺操作中可能都会用到氢氧化钠这个化学品,但是这个化学品在不同行业或者不同的加工步骤中有很多不同的名称,比如烧碱、火碱、苛性钠等,但实际上它们是同一个东西。在步骤s300中,遇到这种多个同义词的情况,就需要进行同义词的置换,同义词词库中为该组名词定义的标准词是“氢氧化钠”,所以如果加工过程描述语句中有烧碱、火碱等用语的词语,都会被转换为“氢氧化钠”这个标准词来表达。

在步骤s400中,基于三元组构建关系结构的方法是:利用三元组建立相应的关系神经网络,元件词库里面的词语作为实体entity,状态词库里面的词语作为状态state,关系词库里面的词语作为关系relation,其中,实体作为节点node,属性作为分节点,关系relation作为传递线。

在数据库中建立相应的标准,进行字段的标注,元件为element,其中分别单设子表,例如六角螺母不但为element这个大类列表,同时它还属于该大类列表中的子分类:螺母。element中包含字段element_id、element_value、element_features。其他分别设立属性nature表和加工方法关系method表。

构建的三元组结构主要通过图形数据库进行存储,同时建立relation关系表,用于存储这些元件之间的关系,包含字段relation_id、relation_star和relation_end。把每一个加工过程描述语句转换构成的三元组结构关系存储到备用relation关系表中。一般地,默认将关系前的节点存储于relation_star字段中,关系后的节点存储于relation_end字段中,关系字段存储于relation_id字段中。

以下列举两个例子,说明如何实现将加工方法转换为知识表示。

实施例1,加工过程描述语句:圆钢公差等级为it12,表面粗糙度为30ra/um通过粗车加工方式进行加工得到外圆表面加工制品。把它转化为三元组结构的方法的最小化三元组结构图,如图4所示,其中,把标识为元件的语句“圆钢”和“外圆表面加工制品”当做节点,“公差等级为it12,表面粗糙度为30ra/um”作为该“圆钢”节点的属性,“粗车”作为“圆钢”和“外圆表面加工制品”这两节点之间的关系连接。将该三元组结构存储于图数据库中,为后续生成知识图谱做准备。同时存储后备数据关系表,relation_star=圆钢,圆钢来自于元件element表;relation_end=外圆表面加工制品,“外圆表面加工制品”也可以来源于元件element表,如果此名词没有在element里进行匹配,那就直接标记属性加入元件词库里面。“公差等级为it12,表面粗糙度为30ra/um”都是圆钢的属性,来源于状态词库里面,标记于该元件相应的属性字段中,同时该属性添加在关于圆钢的三元组结构的属性位置上。这相当于同时生成一个图数据形式和表数据形式的结构。其中,图形数据用于为后续的知识图谱的生成作准备,关系型数据表用于为后续数据库的扩充做准备。

实施例2,加工过程描述语句:圆钢公差等级为it7,表面粗糙度为1ra/um通过精车加工方式进行加工得到外圆表面加工制品。拆分语句后可以得知,“圆钢”和“外圆”加工成品都属于元件,“公差”和“表面粗糙度”都属于状态词库里面的特征词,“it7”和“1ra/um”属于状态词库里面的状态词属性值。精车加工属于关系词库。跟前面的实施例一样,最终生成一个关于圆钢的三元组图数据,同时把数据关系加入到关系数据表中。

本发明还提供了一种实施上述将加工过程描述语句转换为三元组结构的方法的系统,如图5所示。

上述实施方式用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1