一种知识图谱的构建方法、装置、终端及存储介质与流程

文档序号:20187257发布日期:2020-03-27 19:15阅读:230来源:国知局
一种知识图谱的构建方法、装置、终端及存储介质与流程
本申请涉及信息处理
技术领域
,尤其涉及一种知识图谱的构建方法、装置、终端及存储介质。
背景技术
:知识图谱,也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及知识之间的相互关系。时下,很多应用领域都可以用到知识图谱。例如,利用知识图谱展示一个人的成就、利用知识图谱展示多个人物之间的关系、利用知识图谱展示事物属性等等。相关技术中,知识图谱中节点之间的链路属于单向链路,导致用户查询知识图谱中数据时效率低下,降低了用户体验。技术实现要素:为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种知识图谱的构建方法、装置、终端及存储介质。第一方面,本申请实施例提供了一种知识图谱的构建方法,所述方法包括:获取文本数据;根据预设的筛选规则对所述文本数据进行筛选,生成目标数据;确定所述目标数据之间的双向指向关系;基于所述目标数据以及所述目标数据之间的双向指向关系,构建知识图谱,其中,所述知识图谱节点之间的链路为双向链路。优选的,所述根据预设的筛选规则对所述文本数据进行筛选,包括:对所述文本数据进行分词;从经过分词的所述文本数据中剔除停用词。优选的,所述对所述文本数据进行分词,包括:利用预设的分词工具对所述文本数据进行分词;所述从经过分词的所述文本数据中剔除停用词,包括:根据停用词表项从经过分词的所述文本数据中剔除停用词。优选的,所述方法还包括:接收查询请求;从所述查询请求中提取查询语义;根据预设的筛选规则对所述查询语义进行筛选,生成目标查询语义;基于所述目标查询语义,从所述知识图谱中双向查询满足预设要求的数据,并进行展示。优选的,所述根据预设的筛选规则对所述查询语义进行筛选,包括:对所述查询语义进行分词;从经过分词的所述查询语义中剔除停用词。优选的,所述对所述查询语义进行分词,包括:利用预设的分词工具对所述查询语义进行分词;所述从经过分词的所述查询语义中剔除停用词,包括:根据停用词表项剔除从经过分词的所述查询语义中剔除停用词。优选的,所述基于所述目标查询语义,从所述知识图谱中双向查询满足预设要求的数据,包括:从所述知识图谱中确定与所述目标查询语义相匹配的节点;以所述节点作为初始节点,从所述知识图谱中所述节点所在的路径双向查询满足预设要求的数据。第二方面,本申请实施例提供了一种知识图谱的构建装置,所述装置包括:数据获取模块,用于获取文本数据;数据筛选模块,用于根据预设的筛选规则对所述文本数据进行筛选,生成目标数据;关系确定模块,用于确定所述目标数据之间的双向指向关系;图谱构建模块,用于基于所述目标数据以及所述目标数据之间的双向指向关系,构建知识图谱,其中,所述知识图谱节点之间的链路为双向链路。第三方面,本申请实施例提供了一种终端,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述所述的知识图谱的构建方法。第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所述的知识图谱的构建方法。本申请实施例提供的技术方案,对文本数据进行筛选,生成目标数据,确定目标数据之间的双向指向关系,基于目标数据以及目标数据之间的双向指向关系,可以构建知识图谱节点之间的链路为双向链路的知识图谱,如此知识图谱节点之间的链路为双向链路,可以加快用户查询知识图谱中数据的速度,提高查询效率,提高了用户体验。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种知识图谱的构建方法的实施流程示意图;图2为本申请实施例提供的一种目标数据之间具有双向指向关系的示意图;图3为本申请实施例提供的一种知识图谱示意图;图4为本申请实施例提供的另一种知识图谱的构建方法的实施流程示意图;图5为本申请实施例提供的另一种知识图谱示意图;图6为本申请实施例提供的一种知识图谱的构建装置的结构示意图;图7为本申请实施例提供的一种终端的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。在本申请实施例中,为了加快用户查询知识图谱中数据的速度,提高查询效率,以及提高用户体验,将一般知识图谱中节点之间的链路改进为双向链路,具体实现方式为:对文本数据进行筛选,生成目标数据,确定目标数据之间的双向指向关系,基于目标数据以及目标数据之间的双向指向关系,可以构建知识图谱节点之间的链路为双向链路的知识图谱。为了对本申请实施例提供的技术方案进一步说明,如图1所示,为本申请实施例提供的一种知识图谱的构建方法的实施流程示意图,该方法具体可以包括以下步骤:s101,获取文本数据;在本申请实施例中,知识图谱,也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及知识之间的相互关系。构建知识图谱是目前实现人工智能技术在具体行业领域中应用的核心。目前,在很多应用领域都可以用到知识图谱,需要构建相应的知识图谱。例如,利用知识图谱可以展示一个人的成就,则可以相应的构建用于展示一个人的成就的知识图谱,利用知识图谱可以展示多个人物之间的关系,则可以相应的构建用于展示多个人物之间的关系的知识图谱,利用知识图谱可以展示事物属性,则相应的可以构建用于展示事物属性的知识图谱。而构建相应的知识图谱需要一定数据,在本申请实施例中可以获取文本数据。其中,该文本数据可以是当前任意领域中的数据。例如,在智能家居领域中,用户和智能家居产生交互,需要构建相应的知识图谱,本申请实施例可以获取文本数据,后续可以基于该文本数据构建与智能家居领域相对应的知识图谱。其中,该文本数据可以是智能家居的语义控制指令:“请帮我打开卧室空调”、“请帮我打开客厅电视”等等。s102,根据预设的筛选规则对所述文本数据进行筛选,生成目标数据;在本申请实施例中,对于上述步骤获取的文本数据,需要进行清洗,即根据预设的筛选规则对文本数据进行筛选,生成目标数据。例如,针对文本数据“请帮我打开卧室空调”,根据预设的筛选规则进行筛选,生成目标数据“打开”、“卧室”、“空调”等。s103,确定所述目标数据之间的双向指向关系;针对上述步骤中的目标数据,可以确定目标数据之间的双向指向关系。例如,如图2所示,对于目标数据“打开”、“卧室”、“空调”,确定目标数据“打开”、“卧室”、“空调”之间的双向指向关系。其中,对于目标数据之间的双向指向关系,可以由用户指定,即由用户确定具有双向指向关系的目标数据,进而输入具有双向指向关系的目标数据。例如,对于目标数据“打开”、“卧室”、“客厅”、“空调”,向用户展示该目标数据“打开”、“卧室”、“客厅”、“空调”,由用户确定目标数据“打开”、“卧室”、“空调”之间的双向指向关系,由用户确定目标数据“打开”、“客厅”、“空调”之间的双向指向关系,进而具有双向指向关系的目标数据,本申请实施例可以确定目标数据之间的双向指向关系。s104,基于所述目标数据以及所述目标数据之间的双向指向关系,构建知识图谱,其中,所述知识图谱节点之间的链路为双向链路。针对上述步骤中的目标数据以及目标数据之间的双向指向关系,以任一目标数据为知识图谱中节点,基于目标数据以及目标数据之间的双向指向关系构建知识图谱。其中,所构建的知识图谱中节点之间的链路为双向链路。例如,对于目标数据“打开”、“卧室”、“客厅”、“空调”,目标数据“打开”、“卧室”、“空调”之间具有双向指向关系,目标数据“打开”、“客厅”、“空调”之间具有双向指向关系,以目标数据“打开”、“卧室”、“客厅”、“空调”作为知识图谱中节点,基于目标数据以及目标数据之间的双向指向关系构建知识图谱,如图3所示。通过上述对本申请实施例提供的技术方案的描述,对文本数据进行筛选,生成目标数据,确定目标数据之间的双向指向关系,基于目标数据以及目标数据之间的双向指向关系,可以构建知识图谱节点之间的链路为双向链路的知识图谱,如此知识图谱节点之间的链路为双向链路,可以加快用户查询知识图谱中数据的速度,提高查询效率,提高了用户体验。如图4所示,为本申请实施例提供的另一种知识图谱的构建方法的实施流程示意图,该方法具体可以包括以下步骤:s401,获取文本数据;在本申请实施例中,本步骤与上述步骤s101类似,本申请实施例在此不再一一赘述。s402,根据预设的筛选规则对所述文本数据进行筛选,生成目标数据;在本申请实施例中,根据预设的筛选规则对文本数据进行筛选,生成目标数据,具体可选实施方式如下:对所述文本数据进行分词;从经过分词的所述文本数据中剔除停用词,生成目标数据。其中,在本申请实施例中可以利用预设的分词工具对所述文本数据进行分词。在这里分词工具可以是snownlp、jieba等,本申请实施例对此不作限定。例如,对于文本数据“请帮我打开卧室空调”,利用snownlp分词工具进行分词:“请”、“帮我”、“打开”、“卧室”、“空调”。另外,在本申请实施例中可以根据停用词表项从经过分词的所述文本数据中剔除停用词。其中,在停用词表项中预先根据不同的需求设置停用词。例如,停用词表项如下表1所示:停用词表项停用词a“请”、“帮我”表1如上述经过分词的文本数据:“请”、“帮我”、“打开”、“卧室”、“空调”,根据上述表1所示的停用词表项,剔除停用词:“请”、“帮我”,得到目标数据:“打开”、“卧室”、“空调”。s403,确定所述目标数据之间的双向指向关系;在本申请实施例中,本步骤与上述步骤s103类似,本申请实施例在此不再一一赘述。s404,基于所述目标数据以及所述目标数据之间的双向指向关系,构建知识图谱,其中,所述知识图谱节点之间的链路为双向链路;在本申请实施例中,本步骤与上述步骤s104类似,本申请实施例在此不再一一赘述。s405,接收查询请求,从所述查询请求中提取查询语义;在本申请实施例中,当用户需要查询知识图谱中数据时,用户可以发出查询请求,本申请实施例接收用户查询请求。针对上述用户查询请求,本申请实施例从用户查询请求中提取用户查询语义。例如,从用户查询请求中提取用户查询语义“请帮我打开卧室空调”。s406,根据预设的筛选规则对所述查询语义进行筛选,生成目标查询语义;针对上述用户查询语义,根据预设的筛选规则进行筛选,生成目标查询语义,具体可选实施方式如下:对所述用户查询语义进行分词,从经过分词的所述用户查询语义中剔除停用词,生成目标查询语义。其中,在本申请实施例中可以利用预设的分词工具对用户查询语义进行分词。在这里分词工具可以是snownlp、jieba等,本申请实施例对此不作限定。例如,对于用户查询语义“请帮我打开卧室空调”,利用snownlp分词工具进行分词:“请”、“帮我”、“打开”、“卧室”、“空调”。另外,在本申请实施例中可以根据停用词表项从经过分词的用户查询语义中剔除停用词。其中,如果经过分词的用户查询语义中包含停用词表项中的停用词,可以直接进行剔除。例如,对于经过分词的用户查询语义:“请”、“帮我”、“打开”、“卧室”、“空调”,根据上述表1所示的停用词表项,剔除停用词:“请”、“帮我”,得到目标查询语义:“打开”、“卧室”、“空调”。s407,基于所述目标查询语义,从所述知识图谱中双向查询满足预设要求的数据,并进行展示。在本申请实施例中,基于所述目标查询语义,从所述知识图谱中双向查询满足预设要求的数据,并进行展示。其中,可以从知识图谱中确定与所述目标查询语义相匹配的节点;以所述节点作为初始节点,从所述知识图谱中所述节点所在的路径双向查询满足预设要求的数据。例如,对于目标查询语义:“打开”、“卧室”、“空调”,从知识图谱中确定与目标查询语义:“打开”、“卧室”、“空调”相匹配的节点1(打开)、节点2(卧室)、节点3(空调),以上述节点作为初始节点,从所述知识图谱中所述节点所在的路径双向查询满足预设要求的数据。如图5所示,知识图谱中包括如下表2所示的路径。路径编号路径节点1“打开”、“客厅”、“电视”2“打开”、“客厅”、“空调”3“打开”、“卧室”、“空调”4“打开”、“厨房”、“空调”5“打开”、“厨房”、“油烟机”表2由上述表2可知,节点1(打开)、节点2(卧室)、节点3(空调)所在的路径包括:路径1、路径2、路径3、路径4、路径5,以节点1(打开)、节点2(卧室)、节点3(空调)作为初始节点,从路径1、路径2、路径3、路径4、路径5双向查询满足预设要求的数据,可以查找到路径1、路径2、路径3、路径4、路径5各自包括的节点,并向用户进行展示。与上述方法实施例相对应,本申请实施例还提供一种知识图谱的构建装置,如图6所示,该装置可以包括:数据获取模块610、数据筛选模块620、关系确定模块630、图谱构建模块640。数据获取模块610,用于获取文本数据;数据筛选模块620,用于根据预设的筛选规则对所述文本数据进行筛选,生成目标数据;关系确定模块630,用于确定所述目标数据之间的双向指向关系;图谱构建模块640,用于基于所述目标数据以及所述目标数据之间的双向指向关系,构建知识图谱,其中,所述知识图谱节点之间的链路为双向链路。本申请实施例还提供了一种终端,如图7所示,包括处理器71、通信接口72、存储器73和通信总线74,其中,处理器71,通信接口72,存储器73通过通信总线74完成相互间的通信,存储器73,用于存放计算机程序;处理器71,用于执行存储器73上所存放的程序时,实现如下步骤:数据获取模块,用于获取文本数据;数据筛选模块,用于根据预设的筛选规则对所述文本数据进行筛选,生成目标数据;关系确定模块,用于确定所述目标数据之间的双向指向关系;图谱构建模块,用于基于所述目标数据以及所述目标数据之间的双向指向关系,构建知识图谱,其中,所述知识图谱节点之间的链路为双向链路。上述终端提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述终端与其他设备之间的通信。存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。本申请实施例还提供了一种存储介质,该存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中知识图谱的构建设备侧执行的知识图谱的构建方法。在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在存储介质中,或者从一个存储介质向另一个存储介质发送,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行发送。所述存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1