本发明涉及大数据互联,特别是一种基于图论的电力设备标准规范知识图谱构建方法。
背景技术:
1、电力系统涉及海量的专业设备和错综复杂的关系网络,每天产生tb级以上的各类数据。随着电力系统的数字化转型升级以及各种创新管理模式的推广应用,数据增长速率还在日益增大。
2、主要体现在以下几个方面:1)电力系统的规模增大,动态特性日趋复杂,调度控制方法也越发复杂;2)电力系统中的测控和通信装置不断升级,同步相量测量装置大量接入,数据的分辨率、精度和传输带宽增加;3)光伏、海上风电等新装置接入电网,在改变电网特性的同是也增加了新的知识;4)电力市场化改革不断推进,电力系统的业务链条逐步细化,新的业务不断扩展。
技术实现思路
1、本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
2、鉴于上述和/或现有的一种基于图论的电力设备标准规范知识图谱构建方法中存在的问题,提出了本发明。
3、因此,本发明所要解决的问题在于如何提供一种对于电力设备的有效知识图谱建设,实现快速寻找电力设备资源、快速寻找电力设备位置的页面设计。
4、为解决上述技术问题,本发明提供如下技术方案:一种基于图论的电力设备标准规范知识图谱构建方法,其包括:
5、利用结构化、非结构化与半结构化数据上传到预定图谱区域;
6、通过完善的数据描述规范进行图谱定义;
7、配置行业词典,预置数百个专家标注的电力设备专有名词;
8、基于schema即开始进行文本的知识抽取;
9、将抽取的文本知识形成图谱,可以进行图谱可视化浏览与编辑。
10、作为本发明所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:所述非结构化与半结构化数据来源包括word、pdf、excel、数据库与api,支持更新、手动导入;
11、所述结构化数据来源包括使用w3c rdf协议定义作为基础协议,采用json-ld标准组织描述语言,核心概念包括类目与属性,类目可以继承父类属性;
12、文档类数据以知识树进行划分,方便查找和管理。
13、作为本发明所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:所述图谱定义是平台预置了类目及其对应的属性信息。也可自定义添加各类目对应的字段属性信息,或从生产源数据库直连中选入数据快速生成schema;
14、所述schema是数据描述规范,用于描述、规范化数据的结构。
15、作为本发明所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:中文分词的排序利用crf应用进行序列词位排布;
16、先将句子进行原子切分,之后将字与词进行实体标注;
17、接着将特征模板进行确定,一般选择为当前位置前后n个位置的词,即:
18、f(ysnxsn)=1or 0
19、接着进行crf模型参数的训练。
20、作为本发明所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:特征子空间使用图拉普斯拉约束,对于训练数据集集中的任意两个示例xi和xj的相似性通过k近邻的方式计算,
21、
22、其中σ为示例样本欧拉几得距离均值。
23、作为本发明所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:所述高斯伽玛分布中rx,u是满足高斯分布的随机变量,p(μx,u)概率为高斯伽玛分布,p(μ,τ)~ng(μ0,λ,α,β),可表示为
24、
25、其中μx,u被近似认为是q(x,u)值,τ表示高斯分布方差的倒数,
26、作为本发明所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:在知识图谱查询过程中,识别相关词语为专业词汇并有别名的体现,进行相应查询,并按照语义相关进行排序。
27、作为本发明所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:在知识图谱查询过程中对于query中包含的数字、时间类型,如果仅用传统的全文检索只能完全匹配;通过query归一可以识别出query中的数字、时间并进行归一,使理想结果召回;
28、所述query指的是自动分词并支持调整的能力。
29、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
30、一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述方法的步骤。
31、本发明有益效果为:基于业界领先成熟的人工智能产品和技术,结合专家资源,以点带面,对主网设备标准文档进行数字化加工处理,形成数字化标准,支撑设备标准相关业务的高效开展;
32、多渠道收集电力行业标准,应用数字标准治理工具,将标准数字化,构建数字标准知识库,实现标准数据结构化、碎片化、指标化、知识元化;通过统一的服务中台及智能服务平台,实现标准管理科学化、应需化;按照标准全生命周期管理要求及资产全生命周期管理要求,实现标准应用智能化、场景化,服务于电网实际业务管理需求。
1.一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:包括
2.如权利要求1所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:所述非结构化与半结构化数据来源包括word、pdf、excel、数据库与api,支持更新、手动导入;
3.如权利要求1或2所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:所述图谱定义是平台预置了类目及其对应的属性信息。也可自定义添加各类目对应的字段属性信息,或从生产源数据库直连中选入数据快速生成schema;
4.如权利要求3所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:中文分词的排序利用crf应用进行序列词位排布;
5.如权利要求1、2和4任一所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:特征子空间使用图拉普斯拉约束,对于训练数据集集中的任意两个示例xi和xj的相似性通过k近邻的方式计算,
6.如权利要求5所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:所述高斯伽玛分布中rx,u是满足高斯分布的随机变量,p(μx,u)概率为高斯伽玛分布,p(μ,τ)~ng(μ0,λ,α,β),可表示为
7.如权利要求6所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:在知识图谱查询过程中,识别相关词语为专业词汇并有别名的体现,进行相应查询,并按照语义相关进行排序。
8.如权利要求6或7所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:在知识图谱查询过程中对于query中包含的数字、时间类型,如果仅用传统的全文检索只能完全匹配;通过query归一可以识别出query中的数字、时间并进行归一,使理想结果召回;
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。