基于AI和RPA的电力数据智慧稽查方法及装置与流程

文档序号:30662674发布日期:2022-07-06 02:04阅读:269来源:国知局
基于AI和RPA的电力数据智慧稽查方法及装置与流程
基于ai和rpa的电力数据智慧稽查方法及装置
技术领域
1.本发明涉及人工智能技术领域,尤其涉及一种基于ai和rpa的电力数据智慧稽查方法及装置。


背景技术:

2.整合ocr、nlp、机器学习等ai技术的rpa机器人能够以弱耦合(不改变现有软件系统部署)形式实现跨软件执行。在技术上,rpa已经成长为融合ai技术、系统级的跨软硬件的服务。
3.rpa是roboticprocessautomation(机器人流程自动化)的简称。我们可以把它理解为:“虚拟机器人”替代人工的一种方式。rpa不仅可以模拟人类,而且可以利用和融合现有各项技术,实现其流程自动化的目标。或者可以理解为:软件自动化=人工+电脑。
4.由于它可在无需改造原有业务系统的条件下即可为企业实现业务流程自动化,所以这种非侵入式技术部署受到了许多企业的青睐。通过ai+rpa融合技术,加强了ai在机器人流程中发挥决策功能。不仅从ai组件层面进一步完善和丰富了机器人功能,可以适应更多应用环境,完成更多复杂任务。
5.在现有的电力数据稽查过程中,还无法融合ai技术,实现rpa的电力数据智慧稽查。


技术实现要素:

6.本发明实施例提供一种基于ai和rpa的电力数据智慧稽查方法及装置,能够基于ai技术实现rpa的电力数据智慧稽查,使得图像类型的电力数据能够实现自动化的稽查,提高电力数据的稽查速度、效率,保障稽查的准确性。
7.本发明实施例的第一方面,提供一种基于ai和rpa的电力数据智慧稽查方法,rpa设备基于预先配置的ai模块进行电力数据智慧稽查,所述ai模块包括nlp模型和ocr模型,具体流程包括:基于nlp模型对接收到的稽查指令进行处理得到第一文档信息、第一目标信息以及第一标准信息,确定与所述第一文档信息相对应的稽查图像数据;nlp模型对所述稽查指令进行分词处理得到多个第一名词,对所述第一名词进行语义分析得到多个第二名词;选取与所述第二名词相对应的第一文档信息,确定与所述第一文档信息相对应的预存储图像数据作为稽查图像数据;若判断稽查图像数据中存在文本备注信息,根据所述第一目标信息确定文本备注信息中相对应的图像页码和虚拟图层,基于所述图像页码和虚拟图层在所述稽查图像数据中确定至少一个图像目标区域;基于ocr模型提取所述图像目标区域内的图像得到第一稽查信息,若所述第一稽查信息与所述第一标准信息不对应,则输出第一稽查结果。
8.可选地,在第一方面的一种可能实现方式中,所述选取与所述第二名词相对应的第一文档信息,确定与所述第一文档信息相对应的预存储图像数据作为稽查图像数据,包括:选取与所述第二名词相对应的第一文档信息、第一目标信息以及第一标准信息;依次遍历数据存储单元内每个预存储图像数据的图像名称,确定与所述第一文档信息相对应的预存储图像数据作为稽查图像数据。
9.可选地,在第一方面的一种可能实现方式中,所述若判断稽查图像数据中存在文本备注信息,根据所述第一目标信息确定文本备注信息中相对应的图像页码和虚拟图层,基于所述图像页码和虚拟图层在所述稽查图像数据中确定至少一个图像目标区域,包括:对所述文本备注信息进行分解得到多个备注子信息,每个备注子信息具有与其对应的图像页码和虚拟图层;选中与第一目标信息相对应的备注子信息的图像页码和虚拟图层;确定稽查图像数据中与所述图像页码对应的目标图像,将所述虚拟图层与所述目标图像重合设置,基于所述虚拟图层确定目标图像中相应的区域作为图像目标区域。
10.可选地,在第一方面的一种可能实现方式中,所述确定稽查图像数据中与所述图像页码对应的目标图像,将所述虚拟图层与所述目标图像重合设置,基于所述虚拟图层确定目标图像中相应的区域作为图像目标区域,包括:确定所述虚拟图层的虚拟基准点、目标图像的目标基准点,基于所述虚拟基准点和目标基准点对所述虚拟图层与所述目标图像重合设置;确定虚拟图层中的感兴趣区域边界,在所述目标图像中确定与所述感兴趣区域边界相对应的目标边界,提取所述目标边界内的所有像素点得到图像目标区域。
11.可选地,在第一方面的一种可能实现方式中,所述确定虚拟图层中的感兴趣区域边界,在所述目标图像中确定与所述感兴趣区域边界相对应的目标边界,提取所述目标边界内的所有像素点得到图像目标区域,包括:基于所述虚拟基准点和目标基准点分别对所述虚拟图层和目标图像进行坐标化处理,得到虚拟图层和目标图像中每个像素点的坐标;确定虚拟图层中感兴趣区域边界的所有像素点的坐标得到感兴趣像素集;基于所述感兴趣像素集中所有感兴趣像素点的坐标,确定目标图像中相对应的第一目标像素集,根据所述第一目标像素集得到目标图像的目标边界;基于第一目标像素集内所有相对应的第一目标像素点,确定目标边界内所有第二目标像素点得到图像目标区域。
12.可选地,在第一方面的一种可能实现方式中,所述基于第一目标像素集内所有相对应的目标像素点,确定目标边界内的所有像素点得到图像目标区域,包括;将第一目标像素集中具有相同横坐标的第一目标像素点作为相对应的第一目标像素点;提取相对应的第一目标像素点的所有纵坐标,将最大值的纵坐标作为第一纵坐标,将最小值的纵坐标作为第二纵坐标;选取第一纵坐标和第二纵坐标所间隔的所有纵坐标得到多个第三纵坐标,基于相同的横坐标、第三纵坐标得到多个第二目标像素点;
获取所有相同横坐标所对应的所有第二目标像素点生成第二目标像素集,统计第二目标像素集所对应的所有像素点得到图像目标区域。
13.可选地,在第一方面的一种可能实现方式中,通过以下步骤生成每个预存储图像数据的文本备注信息,包括:对接收的预存储图像数据中每个预存图像进行分页标记,得到每个预存图像的图像页码;基于ocr模型依次提取每个预存图像中的第一文字信息,若判断第一文字信息中具有与感兴趣文字信息相对应的第二文字信息,则生成与所述预存图像相对应的虚拟图层;确定虚拟图层中与所述第二文字信息相对应的区域作为感兴趣区域边界,基于具有感兴趣区域边界的虚拟图层、图像页码生成与所述感兴趣文字信息相对应的文本备注信息。
14.可选地,在第一方面的一种可能实现方式中,所述确定虚拟图层中与所述第二文字信息相对应的区域作为感兴趣区域边界,基于具有感兴趣区域边界的虚拟图层、图像页码生成与所述感兴趣文字信息相对应的文本备注信息,包括:对所述虚拟图层和预存图像进行坐标化处理,确定第二文字信息在所述预存图像中所对应的预存像素坐标,确定虚拟图层中与所述预存像素坐标相对应的区域中心坐标;根据所述第二文字信息的文本确定相对应的基准形状区域;将所述第二文字信息与基准文字信息比对得到放大系数,根据所述放大系数对所述基准形状区域进行调整得到感兴趣区域边界,基于所述区域中心坐标将所述感兴趣区域边界与虚拟图层融合。
15.可选地,在第一方面的一种可能实现方式中,所述对所述虚拟图层和预存图像进行坐标化处理,确定第二文字信息在所述预存图像中所对应的预存像素坐标,确定虚拟图层中与所述预存像素坐标相对应的区域中心坐标,包括:确定虚拟图层中与所述预存像素坐标相对应的所有图层区域坐标,将图层区域坐标的中心处坐标作为区域中心坐标。可选地,在第一方面的一种可能实现方式中,所述将所述第二文字信息与基准文字信息比对得到放大系数,根据所述放大系数对所述基准形状区域进行调整得到感兴趣区域边界,基于所述区域中心坐标将所述感兴趣区域边界与虚拟图层融合,包括:获取所述第二文字信息所占用的像素点的数量得到实际像素数量,获取所述基准文字信息所占用的像素点的数量得到基准像素数量;将所述实际像素数量与所述基准像素数量比对得到放大系数,基于所述放大系数对基准形状区域进行放大调整得到感兴趣区域边界;确定感兴趣区域边界的感兴趣中心点,将所述感兴趣中心点和所述区域中心坐标对应固定,将感兴趣区域边界与虚拟图层进行融合处理。
16.本发明实施例的第二方面,提供一种基于ai和rpa的电力数据智慧稽查装置,rpa设备基于预先配置的ai模块进行电力数据智慧稽查,所述ai模块包括nlp模型和ocr模型,智慧稽查装置具体包括:处理模块,用于基于nlp模型对接收到的稽查指令进行处理得到第一文档信息、第
一目标信息以及第一标准信息,确定与所述第一文档信息相对应的稽查图像数据;分词模块,用于使nlp模型对所述稽查指令进行分词处理得到多个第一名词,对所述第一名词进行语义分析得到多个第二名词;选取模块,用于选取与所述第二名词相对应的第一文档信息,确定与所述第一文档信息相对应的预存储图像数据作为稽查图像数据;确定模块,用于若判断稽查图像数据中存在文本备注信息,根据所述第一目标信息、文本备注信息在所述稽查图像数据中确定至少一个图像目标区域;输出模块,用于基于ocr模型提取所述图像目标区域内的图像得到第一稽查信息,若所述第一稽查信息与所述第一标准信息不对应,则输出第一稽查结果。
17.本发明实施例的第三方面,提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本发明第一方面及第一方面各种可能设计的所述方法。
18.本发明提供的基于ai和rpa的电力数据智慧稽查方法及装置,能够基于nlp模型和ocr模型分别进行自然语言处理和图像识别处理,根据nlp模型和ocr模型的组合处理实现对图像类型的电力数据进行智慧稽查,实现自动化的稽查,降低人力稽查成本,提高稽查效率。本发明首先通过nlp模型对稽查指令进行处理,确定被稽查的稽查图像数据,并且结合文本备注信息、第一目标信息快速的在较大幅度区域中确定被需要稽查的图像目标区域,并且根据ocr模型得到第一稽查信息,判断该第一稽查信息是否满足稽查要求。通过以上方式,能够快速的确定稽查的稽查图像数据,以及快速的定位到稽查图像数据所被稽查的图像目标区域,提高第一稽查信息的确定效率和整体的稽查效率。
19.本发明会根据目标图像所对应的虚拟图层,快速定位到目标图像中的图像目标区域,使得本发明在对不同的第一目标信息进行稽查时,能够结合图像页码和虚拟图层快速锁定相应的图像目标区域,实现快速的图像区域的定位。并且本发明会对虚拟图层和目标图像进行坐标化处理,使得本发明能够精准的确定虚拟图层和目标图像相对应的像素点,使得基于虚拟图层所确定的图像目标区域更加的准确。
20.本发明提供的技术方案,在生成每个预存图像所对应的虚拟图层时,会根据预存图像的第二文字信息的语义、对应像素点的数量,确定感兴趣区域边界的形状、大小,进而使得第二文字信息及预存图像中相对应的其他文字信息被感兴趣区域边界所包括,避免在对感兴趣区域边界所对应的文字进行采集时出现信息遗漏的情况,保障信息提取的精准度。
附图说明
21.图1为基于ai和rpa的电力数据智慧稽查方法的第一种实施方式的流程图;图2为基于ai和rpa的电力数据智慧稽查方法的第二种实施方式的流程图;图3为基于ai和rpa的电力数据智慧稽查装置的第一种实施方式的结构图。
具体实施方式
22.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅
仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
23.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
24.应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
25.应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
26.应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含a、b和c”、“包含a、b、c”是指a、b、c三者都包含,“包含a、b或c”是指包含a、b、c三者之一,“包含a、b和/或c”是指包含a、b、c三者中任1个或任2个或3个。
27.应当理解,在本发明中,“与a对应的b”、“与a相对应的b”、“a与b相对应”或者“b与a相对应”,表示b与a相关联,根据a可以确定b。根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其他信息确定b。a与b的匹配,是a与b的相似度大于或等于预设的阈值。
28.取决于语境,如在此所使用的“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。
29.下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
30.本发明提供一种基于ai和rpa的电力数据智慧稽查方法,rpa设备基于预先配置的ai模块进行电力数据智慧稽查,所述ai模块包括nlp模型和ocr模型。rpa设备可以是集成有计算功能的设备。nlp模型可以理解为是自言语言处理模型,本发明中的nlp模型和ocr模型可以是现有技术中的模型,通过nlp模型可以进行分词、语义分析。通过ocr模型可以对图像中的文字进行识别,得到相对应的文字信息。本发明结合nlp模型和ocr模型进行相应的自然语言处理和图像处理实现对电力数据的智慧稽查。
31.如图1所示,为本发明所提供的电力数据智慧稽查方法流程图,具体流程包括:步骤s110、基于nlp模型对接收到的稽查指令进行处理得到第一文档信息、第一目标信息以及第一标准信息,确定与所述第一文档信息相对应的稽查图像数据。稽查指令可以是通过输入设备采集得到的,例如rpa设备连接有拾音设备输入、键盘鼠标输入设备等等,稽查指令可以是语音信息,也可以是文字信息。
32.通过nlp模型可以对输入的稽查指令进行处理得到第一文档信息、第一目标信息以及第一标准信息。稽查指令例如说是一句话,例如“稽查a公司变压器合同中合同总价大于100万的合同”,此时的第一文档信息即可以是a公司变压器合同,第一目标信息即可以是
总价,第一标准信息可以是100万。
33.步骤s120、nlp模型对所述稽查指令进行分词处理得到多个第一名词,对所述第一名词进行语义分析得到多个第二名词。对于nlp模型的分词方案本发明不再进行赘述,可以是现有技术,例如“稽查a公司变压器合同中合同总价大于100万的合同”既可以分词为稽查、a公司、变压器、合同、总价金额、大于、100万、的、合同等等,此时本发明会根据第一名词进行语义分析得到多个第二名词,例如 第一名词为变压器,此时可以相对应的第二名词为变电设备等等。
34.步骤s130、选取与所述第二名词相对应的第一文档信息,确定与所述第一文档信息相对应的预存储图像数据作为稽查图像数据。
35.本发明提供的技术方案,在一个可能的实施方式中,如图2所示,步骤s130包括:步骤s1301、选取与所述第二名词相对应的第一文档信息、第一目标信息以及第一标准信息。本发明会预先设置文档名词表、目标名词表以及标准名词表,文档名词表、目标名词表以及标准名词表内分别设置具有可以作为第一文档信息、第一目标信息以及第一标准信息的名词。例如a公司、变压器、合同为文档名词表内的名词,则此时所统计的第一文档信息即为a公司、变压器、合同等名词。例如目标名词表中具有总价金额、总额等名词,则此时第一目标信息即为总价金额、总额等名词。例如标准名词表中具有大于、100万等名词,则此时的第一标准信息即可以是大于、100万等名词。
36.步骤s1302、依次遍历数据存储单元内每个预存储图像数据的图像名称,确定与所述第一文档信息相对应的预存储图像数据作为稽查图像数据。本发明首先会依次遍历数据存储单元内每个预存储图像数据的图像名称,数据存储单元内会预先存储有多个预存储图像数据,每个预存储图像数据会具有工作人员预先配置的图像名称,图像名称例如a公司变压器购买合同等等。本发明会确定与第一文档信息对应的图像名称的预存储图像数据,并将该预存储图像数据作为稽查图像数据。预存储图像可以是jpg、pdf、png等类型的图像。稽查图像数据即为需要被稽查的图像。
37.步骤s140、若判断稽查图像数据中存在文本备注信息,根据所述第一目标信息确定文本备注信息中相对应的图像页码和虚拟图层,基于所述图像页码和虚拟图层在所述稽查图像数据中确定至少一个图像目标区域。本发明在确定稽查图像数据后,首先判断稽查图像数据中是否存在文本备注信息,如果存在,则结合第一目标信息、文本备注信息在所述稽查图像数据中确定至少一个图像目标区域,图像目标区域既可以看作是与第一目标信息相对应的区域。
38.本发明提供的技术方案,在一个可能的实施方式中,步骤s140包括:对所述文本备注信息进行分解得到多个备注子信息,每个备注子信息具有与其对应的图像页码和虚拟图层。一个文本备注信息可能会具有多个备注子信息,不同的备注子信息可能会具有不同的图像页码、虚拟图层,每个备注子信息可以是对应一个第一目标信息。
39.选中与第一目标信息相对应的备注子信息的图像页码和虚拟图层。本发明会得到与第一目标信息相对应的图像页码和虚拟图层。图像页码例如页码1、页码2等等。一个稽查图像数据可能会具有多个稽查图像,不同的稽查图像可能会具有不同的图像页码、虚拟图层。
40.确定稽查图像数据中与所述图像页码对应的目标图像,将所述虚拟图层与所述目标图像重合设置,基于所述虚拟图层确定目标图像中相应的区域作为图像目标区域。本发明会将稽查图像数据中与图像页码对应的稽查图像作为目标图像,每个目标图像会具有预先设置的、匹配的虚拟图层。本发明会将虚拟图层与相应的目标图像重合设置,使得能够根据虚拟图层确定目标图像中相应的区域作为图像目标区域。目标区域可以是一个长方形区域。
41.本发明提供的技术方案,在一个可能的实施方式中,所述确定稽查图像数据中与所述图像页码对应的目标图像,将所述虚拟图层与所述目标图像重合设置,基于所述虚拟图层确定目标图像中相应的区域作为图像目标区域,包括:确定所述虚拟图层的虚拟基准点、目标图像的目标基准点,基于所述虚拟基准点和目标基准点对所述虚拟图层与所述目标图像重合设置。其中,虚拟基准点可以是虚拟图层的中心点,目标基准点可以是目标图像的中心点,本发明可以将虚拟基准点和目标基准点进行重合设置,进而使得整个虚拟图层与整个目标图像重合对应。
42.确定虚拟图层中的感兴趣区域边界,在所述目标图像中确定与所述感兴趣区域边界相对应的目标边界,提取所述目标边界内的所有像素点得到图像目标区域。本发明会得到虚拟图层中的感兴趣区域边界,感兴趣区域边界即为与第一目标信息所对应的信息的边界。本发明会在目标图像中确定与感兴趣区域边界相对应的目标边界,此时的目标边界可以看作是目标图像中与第一目标信息所对应的信息的边界。本发明会提取目标边界内的所有像素点得到图像目标区域,此时的图像目标区域内即具有第一目标信息所对应、需要的目标信息。
43.通过以上的方式,可以基于虚拟图层对目标图像进行区域的无痕标记,在保障目标图像的完整性、没有被篡改的前提下,能够通过虚拟图层进行快速的感兴趣信息的位置定位,进而在不破坏先前图像完整性的前提下,快速对相应的图像进行目标信息的锁定。
44.本发明提供的技术方案,在一个可能的实施方式中,所述确定虚拟图层中的感兴趣区域边界,在所述目标图像中确定与所述感兴趣区域边界相对应的目标边界,提取所述目标边界内的所有像素点得到图像目标区域,包括:基于所述虚拟基准点和目标基准点分别对所述虚拟图层和目标图像进行坐标化处理,得到虚拟图层和目标图像中每个像素点的坐标。坐标化处理时,可以是以虚拟基准点、目标基准点为原点进行坐标化处理。
45.确定虚拟图层中感兴趣区域边界的所有像素点的坐标得到感兴趣像素集,本发明会得到感兴趣像素集,此时感兴趣像素集所形成的图形可能是长方形框体。
46.基于所述感兴趣像素集中所有感兴趣像素点的坐标,确定目标图像中相对应的第一目标像素集,根据所述第一目标像素集得到目标图像的目标边界。本发明会根据感兴趣像素点的坐标确定目标图像中相对应的第一目标像素集,此时第一目标像素集的像素点的坐标与感兴趣像素集中感兴趣像素点的坐标是一一对应的。此时可以得到目标图像的目标边界,可以这样理解,目标边界与感兴趣区域边界的尺寸、像素点的数量都是相同的,只不过目标边界是在目标图像内所对应的。
47.基于第一目标像素集内所有相对应的第一目标像素点,确定目标边界内所有第二目标像素点得到图像目标区域。本发明会根据目标边界的第一目标像素点确定目标边界内
的所有第二目标像素点,进而得到图像目标区域,实现对第一目标信息所对应的区域进行锁定的目的。
48.本发明提供的技术方案,在一个可能的实施方式中,所述基于第一目标像素集内所有相对应的目标像素点,确定目标边界内的所有像素点得到图像目标区域,包括;将第一目标像素集中具有相同横坐标的第一目标像素点作为相对应的第一目标像素点。本发明会对具有相同横坐标的第一目标像素点进行统计,得到相对应的第一目标像素点。例如存在两个像素点,像素点和像素点,此时具有相同横坐标的第一目标像素点即包括像素点和像素点。
49.提取相对应的第一目标像素点的所有纵坐标,将最大值的纵坐标作为第一纵坐标,将最小值的纵坐标作为第二纵坐标。本发明会提取相对应的第一目标像素点的所有纵坐标,即提取和,如果大于,则此时第一纵坐标即为,第二纵坐标即为。
50.选取第一纵坐标和第二纵坐标所间隔的所有纵坐标得到多个第三纵坐标,基于相同的横坐标、第三纵坐标得到多个第二目标像素点。此时的第三纵坐标可能是多个,例如,所得到的第二目标像素点可能是、、。通过该方式,可以统计图像目标区域处具有相同的横坐标的所有第二目标像素点。
51.获取所有相同横坐标所对应的所有第二目标像素点生成第二目标像素集,统计第二目标像素集所对应的所有像素点得到图像目标区域。本发明会统计所有相同横坐标所对应的所有第二目标像素点,此时的相同横坐标可以是等等。本发明在统计完所有相同横坐标所对应的第二目标像素点后,即生成相对应的第二目标像素集、图像目标区域。
52.步骤s150、基于ocr模型提取所述图像目标区域内的图像得到第一稽查信息,若所述第一稽查信息与所述第一标准信息不对应,则输出第一稽查结果。本发明会根据ocr模型提取图像目标区域内所有像素点所形成的图像,得到第一稽查信息,可以使得第一稽查信息可以包括与总价金额所对应的数字,例如90万、110万等等。在第一稽查信息是110万时,则此时变压器的总价金额已经大于100万,所以此时可以认为第一稽查信息与第一标准信息不对应,此时可以输出第一稽查结果,通过第一稽查结果可以进行相应的稽查提醒。通过以上的技术方案,实现对图像类型的电力数据进行自动稽查的效果,提高稽查效率,降低人工手动稽查的样本数量。
53.本发明在实际的操作过程中,会具有对预存储图像数据的录入步骤。例如在工作人员完成某个项目的合同流程后,其会对合同进行扫描处理得到相对应的预存储图像数据,预存储图像数据可能会具有多个预存图像。此时合同中会具有相应的标的信息、标的额信息以及签章信息,在某些场景下,合同中还可能具有履行地信息、仲裁条款等等。可以基于扫描设备进行合同的扫描,得到相对应的预存储图像数据。
54.本发明提供的技术方案,在一个可能的实施方式中,通过以下步骤生成每个预存储图像数据的文本备注信息,包括:
对接收的预存储图像数据中每个预存图像进行分页标记,得到每个预存图像的图像页码。本发明会对预存储图像数据中每个预存图像进行分页标记,例如预存储图像数据中共存在3个预存图像,此时本发明可以对3个预存图像进行顺序标记为1、2和3,即图像页码1、图像页码2和图像页码3。
55.基于ocr模型依次提取每个预存图像中的第一文字信息,若判断第一文字信息中具有与感兴趣文字信息相对应的第二文字信息,则生成与所述预存图像相对应的虚拟图层。本发明会根据ocr模型依次提取每个预存图像中的第一文字信息,此时可以理解为是全方位的文字提取、扫描,如果判断第一文字信息中具有与感兴趣文字信息相对应的第二文字信息,此时则得到与预存图像规格、尺寸相同、相对应的虚拟图层。感兴趣文字信息可以为签字、盖章、总计金额、变压器、电流互感器等名字,通过相应的名词可以确定到合同中与相应名词所对应的图像的位置,进而提取到类似于金额、签字等信息。感兴趣文字信息可以是与第一目标信息相对应的。
56.确定虚拟图层中与所述第二文字信息相对应的区域作为感兴趣区域边界,基于具有感兴趣区域边界的虚拟图层、图像页码生成与所述感兴趣文字信息相对应的文本备注信息。本发明会得到第二文字信息相对应的区域作为感兴趣区域边界,感兴趣区域边界既可以看作是与预设图像中相对应第二文字信息所对应的边界,即根据该感兴趣区域边界可以提取相应的第二文字信息。本发明会将感兴趣区域边界与虚拟图层进行融合,并且根据具有感兴趣区域边界的虚拟图层、图像页码生成与所述感兴趣文字信息,通过第一目标信息可以确定相对应的感兴趣文字信息,进而得到相对应的文本备注信息。
57.本发明提供的技术方案,在一个可能的实施方式中,所述确定虚拟图层中与所述第二文字信息相对应的区域作为感兴趣区域边界,基于具有感兴趣区域边界的虚拟图层、图像页码生成与所述感兴趣文字信息相对应的文本备注信息,包括:对所述虚拟图层和预存图像进行坐标化处理,确定第二文字信息在所述预存图像中所对应的预存像素坐标,确定虚拟图层中与所述预存像素坐标相对应的区域中心坐标。本发明会对虚拟图层和预存图像进行坐标化处理,坐标化处理的方式可以是以各自的中心原点进行坐标化处理,使得虚拟图层和预存图像的像素点能够相对应。本发明会得到第二文字信息在预存图像中所对应的预存像素坐标,此时的预存像素坐标可以是多个,此时本发明会确定虚拟图层中与所述预存像素坐标相对应的所有像素点,并且得到中心的像素点的坐标作为区域中心坐标,此时的区域中心坐标可以看作是第二文字信息在虚拟图层中相对应的中心点的坐标,此时的区域中心坐标是相较于第二文字信息所占用的区域所得到的,并不是整个虚拟图层的区域中心坐标。
58.例如预存像素坐标如下所示,此时的预存像素坐标分别包括至,此时的虚拟图层的区域中心坐标即为。
59.根据所述第二文字信息的文本确定相对应的基准形状区域。本发明会根据第二文字信息的文本的不同确定不同的基准形状区域,例如第二文字信息的文本为签章,则此时
的基准形状区域可能是正方形,因为签章的字数一般不会较多。例如第二文字信息的文本为总价金额,则此时的基准形状区域可能是长方形,因为总价金额中的数字、文字可能会较多。基准形状区域的尺寸都是相对固定的。
60.将所述第二文字信息与基准文字信息比对得到放大系数,根据所述放大系数对所述基准形状区域进行调整得到感兴趣区域边界,基于所述区域中心坐标将所述感兴趣区域边界与虚拟图层融合。本发明会将第二文字信息与基准文字信息比对得到放大系数,在实际的工作场景下,不同的预设图像的采集方式可能是不同的,例如扫描采集、拍照采集等等,此时预设图像中文字的大小也都是不同的,所以本发明会将第二文字信息与基准文字信息比对得到放大系数,通过放大系数对基准形状区域进行调整得到感兴趣区域边界,使得感兴趣区域边界不会过大、也不会过小,与字体的大小是相对应的,本发明在对基准形状区域进行调整得到感兴趣区域边界后,会根据区域中心坐标将感兴趣区域边界与虚拟图层融合。此时可以是将感兴趣区域边界的中心与区域中心坐标的像素点重合设置,使得感兴趣区域边界与虚拟图层融合。
61.本发明提供的技术方案,在一个可能的实施方式中,所述对所述虚拟图层和预存图像进行坐标化处理,确定第二文字信息在所述预存图像中所对应的预存像素坐标,确定虚拟图层中与所述预存像素坐标相对应的区域中心坐标,包括:确定虚拟图层中与所述预存像素坐标相对应的所有图层区域坐标,将图层区域坐标的中心处坐标作为区域中心坐标。通过该种方式,使得感兴趣区域边界的中心也是与第二文字信息相对应的区域中心坐标对应。进而使得在通过感兴趣区域边界提取第二文字信息时,第二文字信息位于感兴趣区域边界的相对中部。
62.本发明提供的技术方案,在一个可能的实施方式中,所述将所述第二文字信息与基准文字信息比对得到放大系数,根据所述放大系数对所述基准形状区域进行调整得到感兴趣区域边界,基于所述区域中心坐标将所述感兴趣区域边界与虚拟图层融合,包括:获取所述第二文字信息所占用的像素点的数量得到实际像素数量,获取所述基准文字信息所占用的像素点的数量得到基准像素数量。可以这样理解,实际像素数量越多,则证明第二文字信息、预设图像中的文字相对越大。本发明会调取基准文字信息所占用的像素点的数量得到基准像素数量,基准像素数量可以是预先设置的。
63.本发明可以对实际像素数量进行处理,即将第二文字信息所占用的像素点之和除以文字总数量,记得到每个文字的实际像素数量。此时的基准像素数量也可以看作是每个文字的基准像素数量。
64.将所述实际像素数量与所述基准像素数量比对得到放大系数,基于所述放大系数对基准形状区域进行放大调整得到感兴趣区域边界。如果实际像素数量大于基准像素数量,则此时会对基准形状区域进行放大调整,如果实际像素数量小于基准像素数量,则此时会对基准形状区域进行缩小调整。可以根据实际像素数量与所述基准像素数量之间的差值得到放大系数,该放大系数可以看作是对基准形状区域进行放大的倍数,得到相对应的感兴趣区域边界。放大系数也可以是小于0的数。
65.放大系数可以是实际像素数量减基准像素数量得到数量差值,将所述数量差值除以基准像素数量得到倍数差值,将所述倍数差值与1相加即得到放大系数。通过以上方式,使得本发明能够根据预设图像的不同合理的确定相对应的感兴趣区域边界,使得感兴趣区
域边界所对应的图像、信息都是相适应的,降低图像、信息提取量的同时,保障图像、信息的完整性。
66.确定感兴趣区域边界的感兴趣中心点,将所述感兴趣中心点和所述区域中心坐标对应固定,将感兴趣区域边界与虚拟图层进行融合处理。本发明会得到感兴趣中心点,通过该种方式,能够使得融合后的感兴趣区域边界的中心与第二文字信息的中心相对应。
67.为了实现本发明提供的一种基于ai和rpa的电力数据智慧稽查方法,本发明还提供一种基于ai和rpa的电力数据智慧稽查装置,rpa设备基于预先配置的ai模块进行电力数据智慧稽查,所述ai模块包括nlp模型和ocr模型,如图3所示,智慧稽查装置具体包括:处理模块,用于基于nlp模型对接收到的稽查指令进行处理得到第一文档信息、第一目标信息以及第一标准信息,确定与所述第一文档信息相对应的稽查图像数据;分词模块,用于使nlp模型对所述稽查指令进行分词处理得到多个第一名词,对所述第一名词进行语义分析得到多个第二名词;选取模块,用于选取与所述第二名词相对应的第一文档信息,确定与所述第一文档信息相对应的预存储图像数据作为稽查图像数据;确定模块,用于若判断稽查图像数据中存在文本备注信息,根据所述第一目标信息、文本备注信息在所述稽查图像数据中确定至少一个图像目标区域;输出模块,用于基于ocr模型提取所述图像目标区域内的图像得到第一稽查信息,若所述第一稽查信息与所述第一标准信息不对应,则输出第一稽查结果。
68.本发明还提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
69.其中,存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(application specific integrated circuits,简称:asic)中。另外,该asic可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。存储介质可以是只读存储器(rom)、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
70.本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在存储介质中。设备的至少一个处理器可以从存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
71.在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单元(英文:central processing unit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digital signal processor,简称:dsp)、专用集成电路(英文:application specific integrated circuit,简称:asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
72.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依
然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1