一种基于知识图谱的智能渔业问答机器人的构建方法与流程

文档序号:23003814发布日期:2020-11-20 11:52阅读:225来源:国知局
一种基于知识图谱的智能渔业问答机器人的构建方法与流程

本发明适用于智慧渔业技术领域,尤其涉及一种基于知识图谱的智能渔业问答机器人的构建方法。



背景技术:

传统的水产养殖行业对于环境因素的依赖十分高,其养殖过程中出现的问题,存在过多地依靠口口相传的经验,其效果难以保证。科学地解决水产养殖过程中出现的问题才是最终提高产量、减少不必要的损失的关键因素。

传统的养殖技术获取的渠道一是通过高校科研团队下乡考察指导,或建立养殖合作试验地,二是通过农户自行在互联网上查找相关资料,如中国水产养殖网等。对于农户来说,高校科研团队下乡考察指导不具备时效性,有些时效性较高的问题,等不到调研团队到来的那一刻;自行上网搜索资料,难以辨别哪个说的真实可靠,对从海量的信息中筛选出其所需要的,并不是一件容易的事情。

往往从事水产养殖行业的人数相对与其他的行业较为偏少,因此除了政府主导的传统信息网站之外,很少或者几乎没有其他类似的水产养殖相关的信息平台,更不要说专攻于水产养殖行业的智能信息交流平台。所以,对于我国水产养殖行业目前的现状来说,其行业相关的技术信息较为难以从互联网上获取。

知识图谱是近年来人工智能发展的基础。目前,知识图谱的应用的研发也在各行各业开展得如火如荼,但唯独在水产养殖领域缺少相应的实际应用。与此同时,水产养殖行业知识图谱语义的建设,目前仍然处于空白的状态。

随着经济的发展,我国人口数量越来越多,那么首先要解决的问题是吃饭问题。所以,为了解决全国14亿人口的温饱问题,要将先进的技术引入到传统渔业中,以提高水产养殖产量和生产效率。



技术实现要素:

根据上述行业问题,本发明的目的是提供一种基于知识图谱的智能渔业问答机器人的构建方法,本发明通过参照当前现有的其他领域的语义划分、研究渔业领域非结构化数据、还原渔业生产过程中的业务模式,以及再通过爬取结构化、半结构化的数据,建立一套渔业养殖领域的知识图谱;再辅以智能渔业问答机器人,得到一个完整的基于知识图谱的智能渔业问答机器人的构建方法。本发明可以为渔业工作者快速地获取其所想要的信息,同时可以为其他农牧行业相关领域知识图谱的建设提供参考,也可为养殖户养殖方法的改进提供咨询。

本发明是通过以下技术方案实现的:

一种基于知识图谱的智能渔业问答机器人的构建方法,包含以下几步:

s01:参照当前现有的其他领域的语义划分,进行知识建模的上层结构的建立;

s02:通过研究渔业领域半结构化及非结构化数据,还原渔业生产过程中的业务模式,并剥离出渔业知识的语义类型、语义关系以及提取出对象本体;

s03:通过爬取结构化的数据,从中提取出相应对象本体的本体属性及实例;

s04:将s03阶段爬取的结构化数据和来自第三方知识库的数据进行知识融合,通过实体消歧、指代消解,减少实体种类,降低图谱稀疏性,并与对象本体进行知识合并,得到知识图谱;

s05:通过在web页面中嵌入使用aiml技术的智能渔业问答机器人,并设定特定的语句类型将其链接到知识图谱,最终得到一个完整的基于知识图谱的智能渔业问答机器人的构建方法。

优选的技术方案中,所述步骤s01中,将以参照目前现有的语义资料,搭建顶层语义类型划分为主;在s02阶段,将在s01阶段的基础之上,通过研究水产养殖领域业务模式,使用归纳法将水产养殖的工作流抽象出来进行对象梳理(比如说将和人相关的抽象出来,作为人;和事件相关的抽象出来,作为事件,不考虑细节),最终得到建立本知识图谱过程中所需要用到的知识建模(包括但不限于语义类型、语义关系、对象本体及其属性和实例)。

优选的技术方案中,所述步骤s02中,所述渔业领域知识实体的构建方法:

根据半结构化和非结构化数据人工建立的工作流有助于提取出渔业领域的对象本体的概念,又称为类别(type)或类(class或category)等,有助于步骤s04结构化数据的处理,以及步骤s03的对象本体实体及其属性的获取;与此同时,通过提取出类及其之间的关系之后,可以用于建立知识图谱的模式层,如“实体-关系-实体”、“实体-属性-属性值”,使用三元组的方式存储,用于对数据层的约束。

优选的技术方案中,所述步骤s02中,构建渔业领域对象本体的过程中,将渔业领域知识实体对象本体信息划分为八个基本类,所述基本类包括:养殖场所、水体环境、养殖品种、技术特点、潜在疾病、污染水平、投资成本、资料来源;

于此同时,将每一个基本类划分为若干个子类概念,将养殖技术分为:技术普及度、技术覆盖率、技术可靠性;将养殖品种划分为鱼类、虾类、贝类、蟹类;将污染水平划分为污染物排放类型、污染物排放量;将养殖场所划分为塘基养殖、浮排养殖、人造养殖池养殖;人造养殖池养殖又划分为静水养殖、活水养殖;将投资成本划分为投资估算、运行费用、投资回收期;将资料来源划分为网页、国家标准、行业标准、论文文献、国家政策、百科类资料。

优选的技术方案中,类之间的关系,按照以下依据建立类之间的关系,包括建立渔业领域概念在语义上的上下位关系part-of,渔业领域概念的层级关系kind-of,渔业领域对象与类的关系instance-of,渔业领域某一概念是另一概念的属性attribute-of。

优选的技术方案中,所述步骤s03中,建立的模式层,该模式层并非一成不变,而是会在后期随着实例化的进行,与数据层一并螺旋迭代。

优选的技术方案中,所述步骤s03中,通过爬取结构化数据,按照字段直接抽取对应字段的名称,及其对应字段中包含的知识单元,获取对象本体知识,获取对象本体实例及其属性,建立知识图谱,存储在图数据库中。

优选的技术方案中,所述步骤s03中,爬取结构化数据抽取字段建立知识图谱的方法,其实体链接过程需根据实体、关系、实体模式进行语义相似度计算,筛选出语义最为相近的实体、关系、实体组合,并在所述步骤s04进行知识融合,所述步骤s04包括以下步骤:

s41:包括实体消歧和指代消解过程;

s42:将筛选出来的概念集合添加到现有的知识图谱中,实现知识合并。

优选的技术方案中,所述步骤s04中,进行的知识融合,所述步骤s42中,将通过步骤s03和步骤s04中的步骤s42对概念集合的语义划分和筛选得出的概念集合作为新的链接,更新到已有的知识图谱网络中;

优选的技术方案中,所述步骤s05中,在web中嵌入基于aiml技术的智能对话机器人:

aiml语料库被分为普通对话使用和细分领域对话使用;涉及到细分领域的对话,回答的内容将源自于s04阶段产生的知识图谱;在对话的过程中,系统将记录提问者提到的相应字段,并通过图数据库的存储的知识图谱,挖掘出提问者可能关心的其他问题,并向其询问是否需要了解该内容。

优选的技术方案中,挖掘出提问者可能关心的其他问题,包括以下几个步骤:

s51、根据记录下的被提到的结点,在该实例对应的类中,搜寻最相似的实例,推荐给用户;

s52、根据回答所涉及到的实例,在该实例对应的类中,搜寻和该实例有关系(relationship)且二者所属的类为同一类或其父类的父类为同一类,在回答时,将该信息推荐给用户;

s53、根据用户所提问题的字段,涉及到养殖方法的时候,自动为用户联想到该养殖方法可能会存在的某些问题,以及预防办法。

与现有技术相比,本发明的有益效果是:

1、解决了渔业行业信息获取难度大的问题,颠覆了传统的渔业信息的获取途径,提高了领域的知识概念体系的建设完整率,并为养殖户获取其所需的信息提供了更加方便的途径,大大提高了生产效率。

2、通过爬取互联网上大量的该行业相关信息,将网络上零星的渔业养殖信息聚合到一起,提高了信息获取的效率。

3、利用结构化、半结构化、非结构化三种不同类型的原始资料,通过使用先后的不同构建出知识图谱,提高了概念模型构建的准确度,对其他类似行业知识图谱的构建方法具有参考价值。

4、带有联想功能的ai对话机器人,解决了目前渔业方面相关信息无处咨询、咨询价格高昂以及时效性难以保证的难题。与此同时,在该ai机器人的参与下,本发明可通过提前预警等方式精确地辅助农户提高最终产品的产出率。

附图说明

图1为本智能渔业问答机器人的构建方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。这些描述只是示例性的,而并非要限制本发明的范围。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施案例。

实施例:

步骤一:参照当前现有的其他领域的语义划分,进行知识建模的上层结构的建立;

步骤二:通过研究渔业领域半结构化及非结构化数据,还原渔业生产过程中的业务模式,并剥离出渔业知识的语义类型、语义关系以及提取出对象本体;

步骤三:通过爬取结构化的数据,从中提取出相应对象本体的本体属性及实例;

步骤四:将s03阶段爬取的结构化数据和来自第三方知识库的数据进行知识融合,通过实体消歧、指代消解,减少实体种类,降低图谱稀疏性,并与对象本体进行知识合并,得到知识图谱;

步骤五:通过在web页面中嵌入使用aiml技术的智能渔业问答机器人,并设定特定的语句类型将其链接到知识图谱,最终得到一个完整的基于知识图谱的智能渔业问答机器人的构建方法。

步骤一中,将以参照目前现有的语义资料,搭建顶层语义类型划分为主;比如说,参照umls,将实体划分为“概念实体”和“物理实体”,将事件划分为“现象和过程”以及“活动”。

步骤二中,将在步骤一的基础之上,通过研究渔业养殖领域业务模式,使用归纳法将渔业养殖的工作流抽象出来进行对象梳理(比如说将和人相关的抽象出来,作为人;和事件相关的抽象出来,作为事件,不考虑细节),最终得到建立本知识图谱过程中所需要用到的知识建模(包括但不限于语义类型、语义关系、对象本体及其属性和实例);比如说,在养殖过程中,农户、消费者、运输司机,都是属于物理实体下面的“人”这一类。

步骤二中,所述渔业领域知识实体的构建方法有以下特点:

根据非结构化数据人工建立的工作流有助于提取出渔业领域的对象本体的概念,又称为类别(type)或类(class或category)等,有助于步骤四进行实体链接,以及步骤三的对象本体实体及其属性的获取;与此同时,通过提取出类及其之间的关系之后,可以用于建立知识图谱的模式层,可以表示为:“实体-关系-实体”、“实体-属性-属性值”,例如:<基围虾,属于,南美白对虾>、<南美白对虾,成熟期,90天>,使用三元组的方式存储,用于对数据层的约束。

步骤二中,通过对对渔业领域非结构化数据的研究以及还原渔业生产过程中的业务模式,对水产养殖领域对概念进行明确,最终将渔业领域知识实体对象本体信息划分为八个基本类,所述基本类包括:养殖场所、水体环境、养殖品种、技术特点、潜在疾病、污染水平、投资成本、资料来源;

(1)将每一个基本类划分为若干个子类概念,将养殖技术分为:技术普及度、技术覆盖率、技术可靠性;将养殖品种划分为鱼类、虾类、贝类、蟹类;将污染水平划分为污染物排放类型、污染物排放量;将养殖场所划分为塘基养殖、浮排养殖、人造养殖池养殖;人造养殖池养殖又划分为静水养殖、活水养殖;将投资成本划分为投资估算、运行费用、投资回收期;将资料来源划分为网页、国家标准、行业标准、论文文献、国家政策、百科类资料等。

(2)类之间的关系,按照以下依据建立类之间的关系,包括建立渔业领域概念在语义上的上下位关系part-of,渔业领域概念的层级关系kind-of,渔业领域对象与类的关系instance-of,渔业领域某一概念是另一概念的属性attribute-of。

步骤三中,建立的模式层,该模式层并非一成不变,而是会在后期随着实例化的进行,与数据层一并螺旋迭代。一开始可以先通过步骤二定义一些模式层及其属性,随着实例化的进行,在建模这些数据的时候发现有一些未考虑到的模式,当发现有一定共性时,即可以进一步修改模式层,并用新的模式层来约束、更新数据层,就这样周而复始地轮回,达到逐步完善模式层的目的。

步骤三中,通过爬取结构化数据,按照字段直接抽取对应字段的名称,及其对应字段中包含的知识单元,获取对象本体知识,建立知识图谱,存储在图数据库中。爬取结构化数据抽取字段建立知识图谱的方法,其实体链接过程需根据实体、关系、实体模式进行语义相似度计算,筛选出语义最为相近的实体、关系、实体组合,并在步骤四进行知识合并前,需要包括以下两个特点:

(1)包括实体消歧和指代消解过程;

(2)将筛选出来的概念集合添加到现有的知识图谱中,实现知识合并。

步骤四中,进行的知识融合,其特点在于,只将语义划分和筛选后得出的概念集合作为新的链接,更新到已有的知识图谱网络中。比如,<南美白对虾,易患,软壳病>、<基围虾,易患,软壳病>;在这个例子中,南美白对虾和基围虾属于同一品种,所以需要剔掉其中的一个概念集合,防止数据的冗余,即多余结点的出现。

步骤五中,在web中嵌入基于aiml技术的智能对话机器人:

aiml语料库被分为普通对话使用和细分领域对话使用;涉及到细分领域的对话,回答的内容将源自于步骤四产生的知识图谱;在对话的过程中,系统将记录提问者提到的相应字段,并通过图数据库的存储的知识图谱,挖掘出提问者可能关心的其他问题,并向其询问是否需要了解该内容。

步骤五中,挖掘出提问者可能关心的其他问题,分为以下几个方面:

(1)根据记录下的被提到的结点,在该实例对应的类中,搜寻最相似的实例,推荐给用户;

(2)根据回答所涉及到的实例,在该实例对应的类中,搜寻和该实例有关系(relationship)且二者所属的类为同一类或其父类的父类为同一类,在回答时,将该信息推荐给用户;

(3)根据用户所提问题的字段,涉及到养殖方法的时候,自动为用户联想到该养殖方法可能会存在的某些问题,以及预防办法。

主要实现:通过研究非结构化资料,完成针对模式层的知识推理,从而实现模式层的更新;在步骤三随着数据层的完善,模式层也在不断地随着数据层的完善而迭代完善;基于知识图谱的智能对话机器人,通过获取用户提问的几种句式,自动切到链接到图数据库去查找对应数据。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1