一种核电厂图纸信息溯源方法和系统与流程

文档序号:32815531发布日期:2023-01-04 03:19阅读:26来源:国知局
一种核电厂图纸信息溯源方法和系统与流程

1.本发明涉及核电厂图纸信息数字化重建技术领域,尤其涉及一种核电厂图纸信息溯源方法和系统。


背景技术:

2.在核电领域中,设备基础数据、属性信息、部件信息,备品备件等文字或图纸等非结构化暗数据形式存在于系统设计手册和中设备运行和维修手册。在数字化过程需要通过光学字符识别结合机器人流程自动化提取大量的基础数据,由于图纸每个版面都不一样,表格、文件区域位置并不固定和规范,在实际提取过程中可能需要核对不确定性的数据,需要人眼确认数据的时候就耗时较长。
3.如某柴油机装配图共有2121页,搜索时无法快速定位到页码和位置和标准当时提取的内容。在实际做数据统计和分析的时候,需要溯源某一个数据标准的时候,有可能只知道或不知道来自那个张图纸,即使知道也需要查找到对应图纸再人眼搜索,需要花费大量时间。


技术实现要素:

4.本发明要解决的技术问题在于,针对现上述背景技术中提及的相关技术存在的至少一个缺陷:如何快速溯源核电厂的设备在图纸中的位置,提供一种核电厂图纸信息溯源方法和系统。
5.本发明解决其技术问题所采用的技术方案是:提供一种核电厂图纸信息溯源方法,包括以下步骤:
6.s10:加载图纸文件;获取待提取文件的属性信息,并根据所述属性信息生成文件主键编码;
7.s20:对所述图纸文件的页面信息进行提取,生成若干可溯源信息和与所述可溯源信息分别对应的唯一编码,将所述唯一编码与所述文件主键编码建立对应关系;
8.s30:进行信息溯源时,根据输入的所述唯一编码,调用与所述唯一编码对应的所述文件主键编码,并调用与所述文件主键编码对应的所述属性信息,根据调用的所述属性信息加载对应的所述图纸文件;
9.s40:根据输入的所述唯一编码,调用对应的所述可溯源信息,并根据所述可溯源信息在加载的所述图纸文件中进行展示。
10.优选地,在本发明所述的核电厂图纸信息溯源方法中,步骤s20还包括:
11.s201:利用图像分割模型对所述图纸文件的内容进行版面分析,分割出多个区域,所述区域包括:主题区、表格区、图片区和文字区域;
12.s202:对所述区域分别进行页面信息提取;所述页面信息包括所述图纸文件中的文本信息、图形信息;
13.s203:根据所提取的所述页面信息,生成所述可溯源信息和对应的所述唯一编码;
其中,所述可溯源信息包括与所述文本信息、图形信息对应的文本数据信息、数据坐标信息、图纸编号、图纸版本、图纸页码和对应的系统或设备的信息。
14.优选地,在本发明所述的核电厂图纸信息溯源方法中,在步骤s22中,对所述页面信息进行提取识别时,进行人工校核和对识别模型重新训练,将错误的字符进行标注,进行修改后提供正确的样本数据。
15.优选地,在本发明所述的核电厂图纸信息溯源方法中,在步骤s23中,根据一个或多个所述页面信息生成一个所述可溯源信息和对应的所述唯一编码。
16.优选地,在本发明所述的核电厂图纸信息溯源方法中,所述根据所述可溯源信息在加载的所述图纸文件中进行展示,包括:
17.根据所述唯一编码读取到对应的所述可溯源信息,判断所述可溯源信息中的坐标信息,根据所述坐标信息在图纸文件中进行标注展示。
18.优选地,在本发明所述的核电厂图纸信息溯源方法中,步骤s30包括:
19.s301:根据调用的所述属性信息,判断与其对应的所述图纸文件是否存在多个版本;当存在多个版本时,显示出所有历史版本,进行选择后再加载对应的所述图纸文件。
20.优选地,在本发明所述的核电厂图纸信息溯源方法中,步骤s40包括:
21.判断调用的所述可溯源信息中是否有多个相同的所述页面信息,则同时进行在所述图纸文件中进行标注展示。
22.本发明还构造了一种核电厂图纸信息溯源系统,包括:
23.加载模块,用于加载图纸文件;获取待提取文件的属性信息,并根据所述属性信息生成文件主键编码;
24.信息提取模块,用于对所述图纸文件的页面信息进行提取,生成若干可溯源信息和与所述可溯源信息分别对应的唯一编码,将所述唯一编码与所述文件主键编码建立对应关系;
25.信息溯源模块,用于进行信息溯源时,根据输入的所述唯一编码,调用与所述唯一编码对应的所述文件主键编码,并调用与所述文件主键编码对应的所述属性信息,根据调用的所述属性信息加载对应的所述图纸文件;
26.展示模块,用于根据输入的所述唯一编码,调用对应的所述可溯源信息,并根据所述可溯源信息在加载的所述图纸文件中进行展示。
27.优选地,在本发明所述的核电厂图纸信息溯源系统中,所述信息提取模块包括:
28.分割单元,用于利用图像分割模型对所述图纸文件的内容进行版面分析,分割出多个区域,所述区域包括:主题区、表格区、图片区和文字区域;
29.信息提取单元,用于对所述区域分别进行页面信息提取;所述页面信息包括所述图纸文件中的文本信息、图形信息;
30.信息生成单元,用于根据所提取的所述页面信息,生成所述可溯源信息和对应的所述唯一编码;其中,所述可溯源信息包括与所述文本信息、图形信息对应的文本数据信息、数据坐标信息、图纸编号、图纸版本、图纸页码和对应的系统或设备的信息。
31.优选地,在本发明所述的核电厂图纸信息溯源系统中,所述信息溯源模块包括:
32.判断单元,用于根据调用的所述属性信息,判断与其对应的所述图纸文件是否存在多个版本;当存在多个版本时,显示出所有历史版本,进行选择后再加载对应的所述图纸
文件。
33.通过实施本发明,具有以下有益效果:
34.本发明公开了核电厂图纸信息溯源方法和系统,通过上传需提取内容的图纸文件,记载其文件的属性信息,根据属性信息生成文件主键编码,对图纸文件的页面信息进行提取,生成可溯源信息和与可溯源信息对应的唯一编码,并将唯一编码与文件主键编码相对应;进行信息溯源时,根据输入唯一编码调用文件主键编码,获得文件主键编码对应的属性信息,加载对应的图纸文件,再根据输入的唯一编码调用对应的可溯源信息,根据可溯源信息在加载的图纸文件中进行展示。通过提前对核电厂图纸相关信息进行设定,自动关联文件相关信息,提取文件信息时自动跳转到对应章节和位置,无需手动查找文件,达到信息一键溯源。
附图说明
35.下面将结合附图及实施例对本发明作进一步说明,附图中:
36.图1是本发明核电厂图纸信息溯源方法的流程示意图;
37.图2是本发明核电厂图纸信息溯源系统的模块框图。
具体实施方式
38.为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
39.需要说明的是,附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
40.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
41.在本实施例中,如图1所示,本发明提供了一种核电厂图纸信息溯源方法,包括以下步骤:
42.s10:加载图纸文件;获取待提取文件的属性信息,并根据属性信息生成文件主键编码;
43.s20:对图纸文件的页面信息进行提取,生成若干可溯源信息和与可溯源信息分别对应的唯一编码,将唯一编码与文件主键编码建立对应关系;
44.s30:进行信息溯源时,根据输入的唯一编码,调用与唯一编码对应的文件主键编码,并调用与文件主键编码对应的属性信息,根据调用的属性信息加载对应的图纸文件;
45.s40:根据输入的唯一编码,调用对应的可溯源信息,并根据可溯源信息在加载的图纸文件中进行展示。
46.上传要提取核电厂图纸的文件,系统存储包括文件信息、版本和文件统一资源定位符地址,并且以当前日期+三位系列码生成文件主键编码。并且核电厂文件根据规范进行命名,文件命名方式为电站+机组+系统+文件流水号+版本。
47.具体地:
48.其中,步骤s20还包括:
49.s201:利用图像分割模型对图纸文件的内容进行版面分析,分割出多个区域,区域包括:主题区、表格区、图片区和文字区域;
50.s202:对区域分别进行页面信息提取;页面信息包括图纸文件中的文本信息、图形信息;
51.s203:根据所提取的页面信息,生成可溯源信息和对应的唯一编码;其中,可溯源信息包括与文本信息、图形信息对应的文本数据信息、数据坐标信息、图纸编号、图纸版本、图纸页码和对应的系统或设备的信息。
52.对需要提取数据图纸文件要做版面分析,不做版面分析整体光学字符识别并不理想,每张图纸文件的每个页面可能都不同,可以利用图像分割模型unet对文档版面进行学习,分割出标题/主题区、表格区、图片区、文字区域辅助定位和提高光学字符识别效果。通过光学字符识别将图纸信息进行识别后,自动将数据信息保存到数据库中。
53.经过使用图像分割模型unet后的各个区域,针对不同区域调用不同的深度学习光学字符识别算法,提取数据通过数据库脚本写入数据库系统。同时记录图纸文件的文件主键编码、图纸页码信息,数据坐标信息为数据在图纸上的xy坐标信息,其唯一编码由设备+基于时间的通用唯一识别码构成。
54.进一步地,在步骤s22中,对页面信息进行提取识别时,进行人工校核和对识别模型重新训练,将错误的字符进行标注,进行修改后提供正确的样本数据。
55.系统提供数据微调用服务,为业务系统调用数据,业务系统并同时记录数据信息唯一编码,且提供数据溯源服务,传入业务系统提供的系统数据信息唯一编码。溯源微服务通过数据信息唯一编码查询到文件主键编码,通过文件主键编码查询到其图纸文件名和文件存放的统一资源定位符地址信息。
56.进一步地,在步骤s23中,根据一个或多个页面信息生成一个可溯源信息和对应的唯一编码。
57.进一步地,根据可溯源信息在加载的图纸文件中进行展示,包括:
58.根据唯一编码读取到对应的可溯源信息,判断可溯源信息中的坐标信息,根据坐标信息在图纸文件中进行标注展示。
59.并且,该实施例中,步骤s30包括:
60.s301:根据调用的属性信息,判断与其对应的图纸文件是否存在多个版本;当存在多个版本时,显示出所有历史版本,进行选择后再加载对应的图纸文件。当设备进行升级时对应的图纸也会进行对应升级,从而使得同一设备存在多个文件版本内。
61.根据输入的唯一编码,系统识别对应的可溯源信息,浏览器打开文件自动跳转到对应的页码,提取其信息在图纸上的xy坐标,进行颜色标注,颜色标注的范围根据坐标位置的大小进行限定。
62.另外,该实施例中,步骤s40包括:
63.判断调用的可溯源信息中是否有多个相同的页面信息,则同时进行在图纸文件中进行标注展示。
64.当进行信息溯源时发现数据存疑,可将数据信息的唯一编码和xy坐标信息反馈给数据质量管理员进行核对。通过核对完成后反馈关闭数据质量反馈单。
65.在本实施例中,如图2所示,本发明还构造了一种核电厂图纸信息溯源系统,包括:
66.加载模块,用于加载图纸文件;获取待提取文件的属性信息,并根据属性信息生成文件主键编码;
67.信息提取模块,用于对图纸文件的页面信息进行提取,生成若干可溯源信息和与可溯源信息分别对应的唯一编码,将唯一编码与文件主键编码建立对应关系;
68.信息溯源模块,用于进行信息溯源时,根据输入的唯一编码,调用与唯一编码对应的文件主键编码,并调用与文件主键编码对应的属性信息,根据调用的属性信息加载对应的图纸文件;
69.展示模块,用于根据输入的唯一编码,调用对应的可溯源信息,并根据可溯源信息在加载的图纸文件中进行展示。
70.上传要提取核电厂图纸的文件,系统存储包括文件信息、版本和文件统一资源定位符地址,并且以当前日期+三位系列码生成文件主键编码。并且核电厂文件根据规范进行命名,文件命名方式为电站+机组+系统+文件流水号+版本。
71.具体地:
72.其中,信息提取模块包括:
73.分割单元,用于利用图像分割模型对图纸文件的内容进行版面分析,分割出多个区域,区域包括:主题区、表格区、图片区和文字区域;
74.信息提取单元,用于对区域分别进行页面信息提取;页面信息包括图纸文件中的文本信息、图形信息;
75.信息生成单元,用于根据所提取的页面信息,生成可溯源信息和对应的唯一编码;其中,可溯源信息包括与文本信息、图形信息对应的文本数据信息、数据坐标信息、图纸编号、图纸版本、图纸页码和对应的系统或设备的信息。
76.对需要提取数据图纸文件要做版面分析,不做版面分析整体光学字符识别并不理想,每张图纸文件的每个页面可能都不同,可以利用图像分割模型unet对文档版面进行学习,分割出标题/主题区、表格区、图片区、文字区域辅助定位和提高光学字符识别效果。通过光学字符识别将图纸信息进行识别后,自动将数据信息保存到数据库中。
77.经过使用图像分割模型unet后的各个区域,针对不同区域调用不同的深度学习光学字符识别算法,提取数据通过数据库脚本写入数据库系统。同时记录图纸文件的文件主键编码、图纸页码信息,数据坐标信息为数据在图纸上的xy坐标信息,其唯一编码由设备+基于时间的通用唯一识别码构成。
78.进一步地,在信息提取单元中,对页面信息进行提取识别时,进行人工校核和对识别模型重新训练,将错误的字符进行标注,进行修改后提供正确的样本数据。
79.系统提供数据微调用服务,为业务系统调用数据,业务系统并同时记录数据信息唯一编码,且提供数据溯源服务,传入业务系统提供的系统数据信息唯一编码。溯源微服务通过数据信息唯一编码查询到文件主键编码,通过文件主键编码查询到其图纸文件名和文件存放的统一资源定位符地址信息。
80.进一步地,在信息生成单元中,根据一个或多个页面信息生成一个可溯源信息和对应的唯一编码。
81.进一步地,在展示模块中,根据可溯源信息在加载的图纸文件中进行展示,包括:
82.根据唯一编码读取到对应的可溯源信息,判断可溯源信息中的坐标信息,根据坐标信息在图纸文件中进行标注展示。
83.并且,该实施例中,信息溯源模块包括:
84.判断单元,用于根据调用的属性信息,判断与其对应的图纸文件是否存在多个版本;当存在多个版本时,显示出所有历史版本,进行选择后再加载对应的图纸文件。当设备进行升级时对应的图纸也会进行对应升级,从而使得同一设备存在多个文件版本内。
85.根据输入的唯一编码,系统识别对应的可溯源信息,浏览器打开文件自动跳转到对应的页码,提取其信息在图纸上的xy坐标,进行颜色标注,颜色标注的范围根据坐标位置的大小进行限定。
86.并且,该实施例中,展示模块进一步用于:
87.判断调用的可溯源信息中是否有多个相同的页面信息,则同时进行在图纸文件中进行标注展示。
88.当进行信息溯源时发现数据存疑,可将数据信息的唯一编码和xy坐标信息反馈给数据质量管理员进行核对。通过核对完成后反馈关闭数据质量反馈单。
89.通过实施本发明,具有以下有益效果:
90.本发明公开了一种核电厂图纸信息溯源方法和系统,通过上传需提取内容的图纸文件,记载其文件的属性信息,根据属性信息生成文件主键编码,对图纸文件的页面信息进行提取,生成可溯源信息和与可溯源信息对应的唯一编码,并将唯一编码与文件主键编码相对应;进行信息溯源时,根据输入唯一编码调用文件主键编码,获得文件主键编码对应的属性信息,加载对应的图纸文件,再根据输入的唯一编码调用对应的可溯源信息,根据可溯源信息在加载的图纸文件中进行展示。通过提前对图纸相关信息进行设定,自动关联文件相关信息,提取文件信息时自动跳转到对应章节和位置,无需手动查找文件,达到信息一键溯源。可以理解的,以上实施例仅表达了本发明的优选实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,可以对上述技术特点进行自由组合,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,凡跟本发明权利要求范围所做的等同变换与修饰,均应属于本发明权利要求的涵盖范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1