一种电网信息检索方法及系统与流程

文档序号:32441640发布日期:2022-12-06 22:06阅读:81来源:国知局
一种电网信息检索方法及系统与流程

1.本发明属于电力数据检索技术领域,具体涉及一种电网信息检索方法及系统。


背景技术:

2.随着电网特性日益复杂,电网运行一体化的特征明显,省级以上调度协同管理主网的需求强烈,客观上需要进一步提升调度控制支撑手段,支持电网调度实时业务协同、电网安排业务统筹、调度管理规范统一。当今互联网数据越来越繁杂,传统的检索引擎已经难以满足电网工作者的定制化需求。
3.现有的信息检索系统获取到的结果过多,用户需要自行浏览过滤,获取有用信息,而且经常出现检索结果不准确的问题。而且在面对专业知识检索时,传统检索数据范围被限制,用户无法自由检索专业存储空间的存储数据,检索系统也不能根据用户输入偏好理解用户意图,用户需要理解检索规则后不断修正检索内容来获取所需答案,这些都对电力企业用户的日常生产工作造成了一定影响。
4.因此,针对上述检索系统中存在的问题,有必要提出一种新的电网信息智能检索系统,精细化用户需求,为用户提供更加精准的检索结果。


技术实现要素:

5.为解决现有技术中的不足,本发明提供一种电网信息检索方法及系统,能根据用户提问识别用户检索意图,提高信息检索的效率,帮助用户在海量电网数据中快速获取所需数据。
6.为达到上述目的,本发明所采用的技术方案是:
7.第一方面,提供一种电网信息检索方法,包括:接收用户提问;根据电网调度数据预配置的场景进行意图识别,获得与所述用户提问相对应的检索语句;根据所述检索语句进行电网信息检索,得到检索内容。
8.进一步地,所述电网调度数据包括下述中的至少一种:电网调度模型数据;运行数据;实时数据;电网模型;参数;流程数据。
9.进一步地,所述根据电网调度数据预配置的场景,包括:数据视图,包括厂站和/或设备视图;分词词库,包含:概念类词汇词库,所述概念类词汇词库中包含电力系统中的专业词汇;实体类词汇词库,包括下述中的至少一种:厂站名称;母线名称;断路器名称;条件类词语,包括下述中的至少一种:最大;较大;最小;较小;同义词词库,包括习惯性输入,如输入厂站时只输入厂站名称或者厂站拼音。
10.进一步地,将用户提问输入根据电网调度数据预配置的场景中进行意图识别,获得与用户提问相对应的检索语句,包括:将用户提问与根据电网调度数据预配置的场景进行匹配,筛选出与用户提问存在关联的若干第一检索信息;接收用户在第一检索信息中选择的第二检索信息,进行信息抽取,获得信息抽取结果;使用模板匹配技术将信息抽取结果与模板进行匹配,获得与用户提问相对应的检索语句。
11.进一步地,使用模板匹配技术将信息抽取结果与模板进行匹配,获得与用户提问相对应的检索语句,包括:使用深度学习算法对意图进行分类,利用卷积神经网络将具有相似意图但描述不同的用户提问指向已知描述,将用户提问转化为分类问题。
12.进一步地,根据检索语句进行电网信息检索,得到检索内容,包括:根据检索语句按顺序分别执行“精准检索”、“总览检索”、“文档检索”,并将检索结果按业务规则返回给用户;当检索语句包括告警类数据内容时,对告警类数据内容检索使用elasticsearch引擎,针对历史语料对不同的告警类型做分类建模,接收用户提问后,首先做意图识别确认告警类型,执行es检索,找出与用户检索匹配的原始告警数据,根据语义相似度进行结果排序,再通过sql检索返回用户可选的告警卡片信息,将结果返回给用户。
13.进一步地,根据电网调度数据预配置场景,包括:对现有数据库进行生成视图操作,得到标准视图库,再使用词库生成单元和同义词生成进行词库和同义词词库的生成。
14.进一步地,根据电网调度数据预配置场景,包括:采用基于机器学习算法的新词发现和基于隐马尔可夫模型的分词方法进行关键词提取。
15.进一步地,根据所述检索语句进行电网信息检索,包括:采用模板匹配方法根据模板定义的字段和表之间的关联关系拼接出sql检索语句进行检索动作;模板匹配利用卷积神经网络将意图识别转化为分类问题,再使用分类的方法将用户输入文本对应到相应的意图,再进行检索。
16.第二方面,提供一种电网信息检索系统,包括:输入模块,用于接收用户提问;意图识别模块,用于根据电网调度数据预配置的场景进行意图识别,获得与所述用户提问相对应的检索语句;检索模块,用于根据所述检索语句进行电网信息检索,得到检索内容。
17.进一步地,意图识别模块包括配置单元,用于对现有数据库进行生成视图操作,得到标准视图库,再使用词库生成单元和同义词生成进行词库和同义词词库的生成。
18.进一步地,意图识别模块采用基于机器学习算法的新词发现和基于隐马尔可夫模型的分词方法进行关键词提取。
19.进一步地,检索模块采用模板匹配方法根据模板定义的字段和表之间的关联关系拼接出sql检索语句进行检索动作;模板匹配利用卷积神经网络将意图识别转化为分类问题,再使用分类的方法将用户输入文本对应到相应的意图,再进行检索。
20.与现有技术相比,本发明所达到的有益效果:本发明通过将用户提问输入根据电网调度数据预配置的场景中进行意图识别,获得与用户提问相对应的检索语句;根据检索语句进行电网信息检索,得到检索内容;对检索内容进行排序,并展示给用户,能根据用户提问识别用户检索意图,提高信息检索的效率,帮助用户在海量电网数据中快速获取所需数据。
附图说明
21.图1是本发明实施例提供的一种电网信息检索方法的过程示意图。
具体实施方式
22.下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
23.实施例一:
24.如图1所示,一种电网信息检索方法,包括:接收用户提问;根据电网调度数据预配置的场景进行意图识别,获得与所述用户提问相对应的检索语句;根据所述检索语句进行电网信息检索,得到检索内容;对检索内容进行排序,并展示给用户。
25.本实施例中,用户提问即用户输入的检索词或检索语句。电网调度数据包括电网调度模型数据、运行数据、实时数据、电网模型、参数和流程数据。数据视图包括:发电厂、变电站、交流站、母线、交流线路、发电机、变压器、开关、负荷等厂站和设备视图。
26.根据电网调度数据预配置的场景,包括:数据视图,包括厂站和设备视图。分词词库,包含:概念类词汇词库,包含电力系统中的专业词汇。实体类词汇词库,包括厂站名称、母线名称、断路器名称。条件类词语,如最大、较大、最小和较小。同义词词库,包括习惯性输入,如输入厂站时只输入厂站名称或者厂站拼音。
27.将用户提问输入根据电网调度数据预配置的场景中进行意图识别,获得与用户提问相对应的检索语句,包括:将用户提问与根据电网调度数据预配置的场景进行匹配,筛选出与用户提问存在关联的若干第一检索信息,供用户选择。对用户选择的第一检索信息,进行信息抽取,获得信息抽取结果。使用模板匹配技术将信息抽取结果与模板进行匹配,获得与用户提问相对应的检索语句。
28.使用深度学习算法对意图进行分类,利用卷积神经网络将具有相似意图但描述不同的用户提问指向已知描述,将用户提问转化为分类问题,与传统意图识别方法相比,基于深度学习的方法降低了特征工程的复杂度,同时提高了意图识别模型的泛化能力。
29.根据检索语句进行电网信息检索,得到检索内容,包括:根据检索语句按顺序分别执行“精准检索”、“总览检索”、“文档检索”,并将检索结果按业务规则返回给用户;告警类数据内容检索使用elasticsearch引擎,针对历史语料对不同的告警类型做分类建模,接收用户提问后,首先做意图识别确认告警类型,执行es检索,找出与用户检索匹配的原始告警数据,根据语义相似度进行结果排序,再通过sql检索返回用户可选的告警卡片信息,将结果返回给用户。
30.本实施例中,根据电网调度数据预配置场景,包括:对现有数据库进行生成视图操作,得到标准视图库,再使用词库生成单元和同义词生成进行词库和同义词词库的生成。采用基于机器学习算法的新词发现和基于隐马尔可夫模型的分词方法进行关键词提取。
31.本实施例中,根据所述检索语句进行电网信息检索,包括:采用模板匹配方法根据模板定义的字段和表之间的关联关系拼接出sql检索语句进行检索动作;模板匹配利用卷积神经网络将意图识别转化为分类问题,再使用分类的方法将用户输入文本对应到相应的意图,再进行检索。
32.实施例二:
33.基于实施例一所述的一种电网信息检索方法,本实施例提供一种电网信息检索系统,包括:输入模块,用于接收用户提问;意图识别模块,用于根据电网调度数据预配置的场景进行意图识别,获得与所述用户提问相对应的检索语句;检索模块,用于根据所述检索语句进行电网信息检索,得到检索内容;展示模块,用于对检索内容进行排序,并展示给用户。
34.意图识别模块包括配置单元,用于对现有数据库进行生成视图操作,得到标准视图库,再使用词库生成单元和同义词生成进行词库和同义词词库的生成。输入提示单元,分
析用户输入的检索信息,提示用户可能输入的信息供其选择,减少用户输入,提高检索输入效率,提升用户体验。关键词提取单元,将关键词从待检信息中提取出来,基于提取到的关键词进行检索。
35.检索模块包括检索单元,用于在得到关键词后进行模板匹配,得到第一检索结果,再根据es检索到告警信息,获得告警检索结果,对检索结果进行排序。
36.本实施例的主要流程如下。
37.步骤1)、构造数据视图。
38.由于电网数据库中表类型多,关联性高,不利于单表检索数据,而且不同调控系统的数据表之间也有差别,为了规范化处理数据,需要先对数据表进行建视图操作。具体操作过程包括:构造发电厂,变电站,交流站三个厂站表以及常用设备母线、交流线路、开关、断路器等设备表的视图。两种类型的视图内容完备,包含基本检索信息,便于后续检索过程中组成便于理解的sql检索语句。
39.构建概念类、实体类、比较类、同义词词库,其具体类别下包含的内容如表1所示。
40.表1词库模型
41.类型内容概念类词汇电力系统中的专业词汇实体类词汇具体厂站名称、具体设备名称比较类词汇最大、最小、极大、极小、比较、较大、较小同义词包含拼音,缩写,以及首字母
42.步骤2)、构造分词词库。
43.步骤2.1)构建概念类词汇词库,主要包含电力系统中的专业词汇,例如发电厂,变电站,交流站,母线,断路器,变压器等。
44.步骤2.2)构建实体类词汇词库,主要包括厂站具体名称,母线名称,断路器名称等。
45.步骤2.3)将条件类词语加入词库,如最大,较大,最小,较小等常用的检索词汇等。
46.步骤2.4)构建同义词词库,由于电网工作者可能由于工作原因,习惯性输入厂站时只输入厂站名称或者厂站拼音,为使检索范围更加完备,构建同义词词库完善词库。
47.步骤3)、用户输入及输入提示。具体操作包括:对用户输入的部分词汇解析,对用户输入进行分析,给出用户可能输入供其选择。
48.步骤3.1)
49.在用户输入过程中能够对用户进行输入提示,例如当用户输入厂站缩写时提供厂站名称供用户选择,当用户输入厂站时,提供检索内容如:厂站的母线、发电机等设备供用户选择,并且从用户输入的非结构化文本中抽取机器能够识别的结构化信息。
50.具体操作过程包括:将检索框中的用户输入的数据首先在历史输入表中检索,提供出历史输入检索词条,其次在步骤3)中生成的实体类词典中进行查找,查看用户输入类型,根据输入类型提供相应的提示检索词,例如,当用户输入某一厂站时,提示词为某某厂站的母线/变压器/开关/发电机/交流线路/负荷等。当用户输入回车或点击检索按钮时,执行下一步操作。
51.步骤4)、信息抽取。采用了基于机器学习算法的新词发现和分词方法进行关键词
提取,取得更精准的分词效果。系统提供了基础的实体抽取以及可配置的实体抽取。
52.步骤4.1)采用基于隐马尔可夫模型(hmm)的分词方法根据人工标注好分词结果的语料,对电力调度数据进行建模,对用户输入的检索信息进行分词处理,在分词阶段通过模型计算各种分词结果出现的概率,将概率最大的分词结果作为最终结果。
53.步骤5)、意图识别。本系统中所使用的意图识别方式是通过综合语义匹配和意图分类进行,首先采用模板匹配方法,其次采用文本分类方法。
54.步骤5.1)使用模板匹配技术将用户所有可能提问到的问题构造成问题模板,当用户进行提问时,将用户问题与模板进行匹配,得到相应的检索语句进行数据检索。
55.步骤5.2)使用深度学习算法对意图进行分类,利用卷积神经网络将具有相似意图但描述不同的问题指向已知描述,将问题转化为分类问题,与传统意图识别方法相比,基于深度学习的方法降低了特征工程的复杂度,同时提高了意图识别模型的泛化能力。
56.使用模板匹配技术进行检索,将意图识别得到的分词结果输入检索模块,对用户问题与模板进行匹配,得到相应的检索语句进行数据检索。
57.使用深度学习算法对意图进行分类,利用卷积神经网络将用户输入的检索问题指向已知描述,将问题转化为分类问题,得到检索结果
58.步骤6)、智能检索。智能检索的模板匹配方法根据模板定义的字段和表之间的关联关系拼接出sql检索语句进行检索动作。智能检索的文本匹配方法是利用卷积神经网络(cnn)将意图识别转化为分类问题,再使用分类的方法将用户输入文本对应到相应的意图再进行检索。
59.步骤6.1)基于模型类数据的检索,当用户输入检索内容时,智能检索引擎按顺序分别执行“精准检索”、“总览检索”、“文档检索”,并将检索结果按业务规则返回给用户。
60.步骤6.2)告警类数据内容检索适合使用elasticsearch引擎,需要针对历史语料对不同的告警类型做分类建模,用户提问后首先做意图识别确认告警类型,执行es检索,找出与用户检索匹配的原始告警数据,根据语义相似度进行结果排序,再通过sql检索返回用户可选的告警卡片信息,将结果返回给用户。
61.步骤7)结果展示。对检索结果按照与检索语句的匹配度进行排序,得到最终检索结果,并返回给前端,对用户进行结果展示。
62.本发明为用户提供个性化、智能化的检索服务。通过智能检索系统,可以有效提高电力信息检索的准确率、覆盖率和查找速率等3项重大指标。本发明基于目前互联网检索领域的关键技术,通过文本提取、倒排索引、元数据解析等技术建立索引库,立足于电网调度业务,研究人工智能领域的本体知识库构建技术,通过分析电网调度数据的特点,建立电网调度领域本体知识库,包括电网调度模型数据、运行数据、实时数据、电网模型、参数、流程数据,以及描述电网本体间的关系等的数据,研究智能化的检索技术,满足电网数据信息的及时查找,提高智能电网调度的精确度及高效度,从而大幅度提升电网信息检索的智能化水平,以便于用户查找数据,对电网运行以及分析决策领域起重要指导作用。
63.实施例三:
64.基于实施例一所述的一种电网信息检索方法,实施例二所述的一种电网信息检索系统,本实施例提供一种电网信息检索装置,包括:输入模块,用于接收用户提问;意图识别模块,用于根据电网调度数据预配置的场景进行意图识别,获得与所述用户提问相对应的
检索语句;检索模块,用于根据所述检索语句进行电网信息检索,得到检索内容;展示模块,用于对检索内容进行排序,并展示给用户。
65.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言java和直译式脚本语言javascript等。
66.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
67.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
68.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
69.尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
70.显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1