能源电力文本结构化数据一致性确定方法及装置与流程

文档序号:41581148发布日期:2025-04-11 17:31阅读:8来源:国知局
能源电力文本结构化数据一致性确定方法及装置与流程

本发明涉及文本处理领域,具体而言,涉及一种能源电力文本结构化数据一致性确定方法及装置。


背景技术:

1、随着时代发展,关于能源电力文本结构化数据的长篇文本层出不穷,响应于不同主旨所做的文本也倾盆而出,有时,由于文本过于长,可能会将文本派发给不同部门进行撰写,部分部门存在缺乏统筹甚至相互冲突的问题。如以煤电发展主旨进行文本创作时,主旨为“合理建设煤电”,以该主旨进行了文本的创作,后来更正主旨为“严控煤电项目”,因此将原文本进行了修订,得到了新文本,或者直接重新撰写得到了新文本,此时,由于文本过长,很难确定文本是否符合主旨,文中是否存在冲突的地方。

2、可知,相关技术中,在文本过长时,通常难以确定出文本所描述的主旨,更难以检查出文本的整体描述与欲描述的主旨是否一致,也难以判断文本上下描述是否一致的技术问题。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本发明实施例提供了一种能源电力文本结构化数据一致性确定方法及装置,以至少解决相关技术中,在文本过长时,通常难以确定出文本所描述的主旨,更难以检查出文本的整体描述与欲描述的主旨是否一致,也难以判断文本上下描述是否一致的技术问题。

2、根据本发明实施例的一个方面,提供了一种能源电力文本结构化数据一致性确定方法,包括:获取目标文本,其中,所述目标文本为文本长度超过预定阈值的能源电力结构化数据文本;确定所述目标文本所属的文本类型,以及所述目标文本对应的文本主旨;确定与所述文本类型对应的节点项,其中,所述节点项包括多个一级节点,以及与所述多个一级节点分别对应的多个二级节点;依据所述目标文本,确定与所述节点项对应的节点数据;依据所述节点项对应的节点数据,确定所述目标文本的描述与所述文本主旨的描述是否一致的第一结果,并确定所述目标文本所包括的描述之间是否一致的第二结果;依据所述第一结果与所述第二结果,确定所述目标文本对应的一致性结果。

3、可选地,在所述二级节点的类型为选择类型的情况下,依据所述目标文本,确定与所述节点项对应的节点数据,包括:从所述目标文本中,提取与所述多个一级节点分别对应的命中文本;基于所述分别对应的命中文本,对分别对应的多个二级节点进行选择操作,得到分别对应的至少一个选中二级节点;基于与所述多个一级节点分别对应的至少一个选中二级节点,确定与所述节点项对应的拓扑图,其中,所述拓扑图中,具备关联性的一级节点相连接,所述多个一级节点,分别与对应的至少一个选中二级节点相连接;依据与所述节点项对应的拓扑图,确定与所述节点项对应的节点数据。

4、可选地,在所述二级节点的类型还包括录入类型的情况下,依据与所述节点项对应的拓扑图,确定与所述节点项对应的节点数据,包括:基于所述分别对应的命中文本,确定与录入类型的二级节点对应的录入文本;确定录入文本与其他二级节点项所表示的文本的相似指数,其中,所述其他二级节点项包括对应一级节点下,类型为选择类型的二级节点;依据所述相似指数,确定录入拓扑图,其中,所述录入拓扑图为携带有关联权重的二级节点相连接形成的拓扑图,所述关联权重依据对应的相似指数确定;将所述录入拓扑图补充到所述拓扑图中,得到第一补充拓扑图;依据所述第一补充拓扑图,确定与所述节点项对应的节点数据。

5、可选地,依据与所述节点项对应的拓扑图,确定与所述节点项对应的节点数据,包括:确定拓扑图中,仅具备一条连接线的待补充节点;依据所述目标文本,在所述拓扑图中补充所述待补充节点的拓扑关系,得到第二补充拓扑图;依据所述第二补充拓扑图,确定与所述节点项对应的节点数据。

6、可选地,基于所述分别对应的命中文本,对分别对应的多个二级节点进行选择操作,得到分别对应的至少一个选中二级节点,包括:确定所述多个一级节点分别对应的文本描述量,以及多个选中二级节点分别对应的文本描述量;依据一级节点对应的文本描述量与对应的基准描述量,确定与所述多个一级节点分别对应的一级节点权重,并依据多个选中二级节点分别对应的文本描述量与对应的基准描述量,确定与所述多个选中二级节点分别对应的二级节点权重;为所述多个一级节点分别赋予对应的一级节点权重,并为所述多个二级节点分别赋予对应的二级节点权重。

7、可选地,依据所述节点项对应的节点数据,确定所述目标文本的描述与所述文本主旨的描述是否一致的第一结果,包括:确定与所述文本主旨对应的主旨节点;确定所述节点数据中,选中二级节点与所述主旨节点的匹配指数;依据所述匹配指数,确定所述目标文本的描述与所述文本主旨的描述是否一致的所述第一结果。

8、可选地,依据所述节点项对应的节点数据,确定所述目标文本所包括的描述之间是否一致的第二结果,包括:确定所述节点数据所包括的拓扑图中,同时与多项二级节点连接的多分支节点;依据所述多分支节点,确定所述目标文本所包括的描述之间是否一致的所述第二结果。

9、根据本发明实施例的一个方面,提供了一种能源电力文本结构化数据一致性确定装置,包括:获取模块,用于获取目标文本,其中,所述目标文本为文本长度超过预定阈值的能源电力结构化数据文本;第一确定模块,用于确定所述目标文本所属的文本类型,以及所述目标文本对应的文本主旨;第二确定模块,用于确定与所述文本类型对应的节点项,其中,所述节点项包括多个一级节点,以及与所述多个一级节点分别对应的多个二级节点;第三确定模块,用于依据所述目标文本,确定与所述节点项对应的节点数据;第四确定模块,用于依据所述节点项对应的节点数据,确定所述目标文本的描述与所述文本主旨的描述是否一致的第一结果,并确定所述目标文本所包括的描述之间是否一致的第二结果;第五确定模块,用于依据所述第一结果与所述第二结果,确定所述目标文本对应的一致性结果。

10、根据本发明实施例的一个方面,提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述任一项能源电力文本结构化数据一致性确定方法。

11、根据本发明实施例的一个方面,提供了一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项能源电力文本结构化数据一致性确定方法。

12、在本发明实施例中,获取目标文本,其中,目标文本为文本长度超过预定阈值的能源电力结构化数据文本。确定目标文本所属的文本类型,以及目标文本对应的文本主旨。确定与文本类型对应的节点项,其中,节点项包括多个一级节点,以及与多个一级节点分别对应的多个二级节点。依据目标文本,确定与节点项对应的节点数据。依据节点项对应的节点数据,确定目标文本的描述与文本主旨的描述是否一致的第一结果,并确定目标文本所包括的描述之间是否一致的第二结果。依据第一结果与第二结果,确定目标文本对应的一致性结果。其中,确定了节点项,节点项包括一级节点和二级节点。这些节点项可以辅助进行文本结构化和内容分析,能够帮助将复杂的文本内容分解为更易于理解的单元。依据目标文本的内容,为定义好的节点项填充节点数据。以对文本内容的深入解析和结构化表示,使得文本中的信息以逻辑清晰、结构化的方式呈现。之后确定了第一结果与第二结果,第一结果通过比较目标文本的描述与文本主旨的描述,检查两者是否一致。这有助于发现文本内容是否偏离了其主要论点或核心信息。第二结果可以分析目标文本所包括的各个描述之间是否一致,即检查文本内部的逻辑连贯性和信息一致性。这一步骤有助于识别文本中的自相矛盾或逻辑跳跃等问题。综合第一结果和第二结果,对目标文本的整体一致性进行评估。即,如果文本描述与主旨一致,且文本内部描述也一致,则认为文本具有较好的一致性,进而解决了相关技术中,在文本过长时,通常难以确定出文本所描述的主旨,更难以检查出文本的整体描述与欲描述的主旨是否一致,也难以判断文本上下描述是否一致的技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1