1.本技术涉及电气领域,特别是指一种生成工作票的方法及装置。
背景技术:2.工作票是准许工作人员在电气设备或是线路上工作的书面命令,也是执行保证安全的技术措施的书面依据。因此对于工作票的准确留档与存证对于电力安全生产与违规追查十分重要。
3.在现有技术中,通过将纸质工作票进行留档,或将纸质工作票手工录入信息系统中以保存工作票上的信息。使用现有技术对工作票进行留档与存证,存在工作票上的信息被篡改的风险。
技术实现要素:4.有鉴于此,本技术提供了一种生成工作票的方法及装置,从而达到降低工作票上的信息被篡改的风险的目的。
5.本技术提供的一种生成工作票的方法是这样实现的:
6.扫描纸质票据,得到票据图片;
7.获取票据图片中的文字,得到多个字段信息;
8.对多个字段信息进行语义识别并添加标识,标识指示多个字段信息在表单模板上的位置;
9.根据标识和表单模板,生成电子工作票。
10.可选地,扫描纸质票据,得到票据图片后,还包括:
11.在区块链上保存票据图片,得到第一留存信息。
12.可选地,在区块链上保存票据图片,得到第一留存信息后,还包括:
13.从区块链中读取第一图片;
14.将第一图片和第一留存信息进行对比;
15.若第一图片和第一留存信息一致,则利用区块链的第一智能合约,将第一图片进行锐化处理;
16.若第一图片和第一留存信息不一致,则输出错误提示信息;
17.则获取票据图片中的文字,得到多个字段信息,包括:获取锐化处理后的第一图片中的文字,得到多个字段信息。
18.可选地,获取票据图片中的文字,得到多个字段信息前,还包括:
19.利用区块链的第二智能合约,根据票据图片中票据的表格边框,分割票据图片,得到票据图片的多个子图片;
20.在区块链上保存票据图片的多个子图片,得到第二留存信息。
21.可选地,在区块链上保存票据图片的多个子图片,得到第二留存信息后,还包括:
22.从区块链中读取第二图片;
23.将第二图片和第二留存信息进行对比;
24.确定第二图片和第二留存信息一致;
25.则获取票据图片中的文字,得到多个字段信息,包括:利用区块链的第三智能合约,获取第二图片中的文字,得到多个字段信息。
26.可选地,方法还包括:若第二图片和第二留存信息不一致,则输出错误提示信息。
27.可选地,获取票据图片中的文字,得到多个字段信息后,还包括:在区块链上保存多个字段信息,得到第三留存信息;
28.则对多个字段信息进行语义识别并添加标识前,还包括:
29.从区块链中读取第一信息;
30.将第一信息和第三留存信息进行对比;
31.确定第一信息和第三留存信息一致。
32.可选地,对多个字段信息进行语义识别并添加标识,包括:对第一信息进行语义识别并添加标识;
33.则方法还包括:若第一信息和第三留存信息不一致,则输出错误提示信息。
34.可选地,根据标识和表单模板,生成电子工作票后,还包括:在区块链上保存电子工作票。
35.本技术还提供了一种生成工作票的装置,装置包括:扫描单元、获取单元、识别单元和生成单元;
36.扫描单元,用于扫描纸质票据,得到票据图片;
37.获取单元,用于获取票据图片中的文字,得到字段信息;
38.识别单元,用于对字段信息进行语义识别并添加标识,标识指示字段信息在表单模板上的位置;
39.生成单元,用于根据标识和表单模板,生成电子工作票。
40.本技术还提供了一种计算机设备,计算机设备包括:处理器,处理器与存储器耦合,存储器中存储有至少一条计算机程序指令,至少一条计算机程序指令由处理器加载并执行,以使计算机设备实现生成工作票的方法。
41.因此,本技术的有益效果是:提供了一种生成工作票的方法及装置,采用扫描纸质票据,得到票据图片,获取票据图片中的文字,得到多个字段信息,对多个字段信息进行语义识别并添加标识,标识指示多个字段信息在表单模板上的位置,根据标识和表单模板,生成电子工作票的方法,通过自动识别纸质票据信息,利用表单模板将纸质票据转化为电子票据凭证,以达到数字化地将纸质工作票信息进行提取和留存,降低工作票上的信息被篡改的风险的效果。
附图说明
42.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
43.图1为本技术第一实施例的流程图;
44.图2为本技术第二实施例中s201-s210的流程图;
45.图3为本技术第二实施例中s211-s220的流程图;
46.图4为本技术的一种装置示意图;
47.图5为本技术的一种计算机设备示意图。
具体实施方式
48.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
49.由于纸质工作票容易被涂改,且人工录入信息容易导致信息录入时有误差,使得工作票上的信息存在被篡改的风险。因此本技术自动识别纸质票据信息,利用表单模板将纸质票据转化为电子票据凭证,通过数字化的方法将纸质工作票信息进行提取和留存。
50.在本技术实施例中,生成工作票的设备可以包括但不限于计算机设备。
51.计算机设备可以包括:处理器,处理器与存储器耦合,存储器中存储有至少一条计算机程序指令,至少一条计算机程序指令由处理器加载并执行,以使计算机设备实现生成工作票的方法。
52.请参阅图1,本技术的第一实施例具体步骤如下:
53.s101:计算机扫描纸质票据,得到票据图片。
54.纸质票据为纸质的工作票。
55.在一些实现方式中,扫描纸质票据,获取票据图片中的文字,对多个字段信息进行语义识别并添加标识,以及生成电子工作票的过程都在区块链上进行。区块链技术是一种去中心化的分布式账本,具备链上信息难以篡改、可追溯的特点。
56.在另一些实现方式中,计算机扫描纸质票据,得到票据图片前,先读入纸质票据。读入纸质票据可以批量读入,也可以读入单张纸质票据。
57.在另一些实现方式中,计算机扫描纸质票据,得到票据图片后,在区块链上保存票据图片。
58.s102:计算机获取票据图片中的文字,得到多个字段信息。
59.字段信息为表单模板所需的格式,可以根据需求将获取到的票据图片中的文字转换为相应的数据类型。
60.在一些实现方式中,计算机利用区块链的第三智能合约,获取票据图片中的文字,得到多个字段信息。
61.在另一些实现方式中,计算机获取票据图片中的文字,得到多个字段信息前,先利用区块链的第一智能合约,将票据图片进行锐化处理。
62.在另一些实现方式中,计算机获取票据图片中的文字,得到多个字段信息前,先利用区块链的第二智能合约,根据票据图片中票据的表格边框,分割票据图片,得到票据图片的多个子图片,并在区块链上保存票据图片的多个子图片。
63.在另一些实现方式中,计算机获取票据图片中的文字,得到多个字段信息后,在区块链上保存多个字段信息。
64.s103:计算机对多个字段信息进行语义识别并添加标识,标识指示多个字段信息在表单模板上的位置。
65.语义识别是对于识别出的文字进行理解。由于工作票中每项表格填写的内容相对固定,且多由行业术语组成,可以将从工作票中获取到的字段信息与表单模板上的位置进行匹配。
66.s104:计算机根据标识和表单模板,生成电子工作票。
67.在一些实现方式中,计算机根据标识和表单模板,生成电子工作票后,在区块链上保存电子工作票。
68.在本技术第一实施例中,通过自动识别纸质票据信息,利用表单模板将纸质票据转化为电子票据凭证,数字化地将纸质工作票信息进行提取和留存,提高了工作票信息留存的效率,降低工作票上的信息被篡改的风险。
69.以下结合区块链技术对本技术的具体实现进行描述,请参阅图2和图3,本技术的第二实施例具体步骤如下:
70.s201:计算机批量化读入纸质票据。
71.在一些实现方式中,由票据读入模块执行批量化读入纸质票据的步骤。
72.在另一些实现方式中,票据读入模块在批量化读入纸质票据后,将纸质票据传送给票据扫描模块。
73.s202:计算机扫描纸质票据,得到票据图片。
74.在一些实现方式中,由票据扫描模块执行s202的步骤。
75.在另一些实现方式中,票据扫描模块依次扫描票据读入模块传送的多张纸质票据。
76.s203:计算机在区块链上保存票据图片,得到第一留存信息。
77.第一留存信息为原始信息,即扫描纸质票据得到的票据图片。
78.在一些实现方式中,票据扫描模块在扫描纸质票据,得到票据图片后,将票据传送给缓存区,同时在区块链上保存票据图片。缓存区可以保存单张或多张纸质票据对应的票据图片。缓存区可以为高速存储器,缓存区也可以根据实际需求设为其他存储器。
79.在另一些实现方式中,票据读入模块、票据扫描模块和缓存区构成票据预处理单元。
80.s204:计算机从区块链中读取第一图片。
81.第一图片为从区块链中读取到的图片,第一图片的读取可以根据票据图片在区块链中保存的区块位置进行读取,也可以通过其他能够读取到票据图片的方式进行读取。由于区块链可能保存多个图片数据,需要执行s205以保证读取到的图片与需要进行转化的纸质票据一致。
82.在一些实现方式中,信息识别单元从缓存区中读取第一图片。
83.在另一些实现方式中,信息识别单元由图像增强模块、图像分割模块、文字识别模块和文字整合模块组成。
84.s205:计算机将第一图片和第一留存信息进行对比,判断第一图片和第一留存信息是否一致。
85.若第一图片和第一留存信息一致,则执行s206;若第一图片和第一留存信息不一
致,则执行s207。
86.在一些实现方式中,由信息识别单元将第一图片和第一留存信息进行对比。
87.s206:计算机利用区块链的第一智能合约,将第一图片进行锐化处理。
88.第一智能合约为融合了高通滤波技术的智能合约。一个智能合约是一套以数字形式定义的承诺,包括合约参与方可以在上面执行承诺的协议。智能合约允许在没有第三方的情况下进行可信交易,交易可追踪且不可逆转,利用计算机代码即可实现。
89.由于纸质票据的文字颜色与背景颜色对比明显,因此锐化处理能够加强文字与背景的对比度,增强文字视觉效果。
90.在一些实现方式中,由图像增强模块将第一图片进行锐化处理。
91.s207:计算机输出错误提示信息。
92.在一些实现方式中,由信息识别单元输出错误提示信息。
93.在另一些实现方式中,计算机输出错误提示信息后,不执行针对本纸质票据的后续步骤,直接对下一纸质票据进行转化。
94.s208:计算机利用区块链的第二智能合约,根据锐化处理后的第一图片中票据的表格边框,分割锐化处理后的第一图片,得到锐化处理后的第一图片的多个子图片。
95.第二智能合约为融合了基于边缘分割的图像分割技术的智能合约。图像分割技术先确定图像中的边缘像素,再把图像中的边缘像素连接在一起构成所需的区域边界,以进行图像的分割。
96.由于纸质票据主要以表格的形式出现,因此采用基于边缘的分割技术,可以有效按照表格边框将图片进行分割。边缘分割可以采用sobel算子进行,sobel算子在水平方向和垂直方向均有良好的分割效果,结构简单,噪声抑制效果明显,边缘分割也可以采用梯度算法,roberts算子,prewitt算子,kirsch算子,laplacian算子或其他算法实现。
97.计算机将锐化处理后的第一图片分割为多个子图片,便于对纸质票据中表格的不同区域内的文字进行获取。
98.在一些实现方式中,由图像分割模块对锐化处理后的第一图片进行分割。
99.s209:计算机在区块链上保存锐化处理后的第一图片的多个子图片,得到第二留存信息。
100.第二留存信息为锐化处理后的第一图片的多个子图片。
101.在一些实现方式中,由图像分割模块在区块链上保存锐化处理后的第一图片的多个子图片。
102.在另一些实现方式中,图像分割模块还将锐化处理后的第一图片的多个子图片传送至文字识别模块。
103.s210:计算机从区块链中读取第二图片。
104.第二图片为从区块链中读取到的图片,第二图片的读取可以根据锐化处理后的第一图片的多个子图片在区块链中保存的区块位置进行读取,也可以通过其他能够读取到锐化处理后的第一图片的多个子图片的方式进行读取。由于区块链可能保存多个图片数据,需要执行s211以保证读取到的图片与锐化处理后的第一图片的多个子图片一致。
105.在一些实现方式中,第二图片为文字识别模块接收到的图像分割模块发送的图片。
106.s211:计算机将第二图片和第二留存信息进行对比,判断第二图片和第二留存信息是否一致。
107.若第二图片和第二留存信息一致,则执行s212;若第二图片和第二留存信息不一致,则执行s213。
108.在一些实现方式中,由文字识别模块将第二图片和第二留存信息进行对比。
109.s212:计算机利用区块链的第三智能合约,获取第二图片中的文字,得到多个字段信息。
110.第三智能合约为融合了ctpn算法的智能合约。由于纸质票据填写时均位于水平位置,因此可以使用ctpn算法对文字进行获取。文字获取也可以利用crnn算法,seq2seq算法或其他算法实现。
111.在一些实现方式中,由文字识别模块对第二图片中的文字进行识别,并转换为数字化字符,再由文字整合模块将识别出的文字整理成固定格式的字段。
112.s213:计算机输出错误提示信息。
113.在一些实现方式中,由文字识别模块输出错误提示信息。
114.在另一些实现方式中,计算机输出错误提示信息后,不执行针对本纸质票据的后续步骤,直接对下一纸质票据进行转化。
115.s214:计算机在区块链上保存多个字段信息,得到第三留存信息。
116.第三留存信息为通过获取第二图片中的文字得到的多个字段信息。
117.在一些实现方式中,由文字整合模块在区块链上保存多个字段信息。
118.在另一些实现方式中,文字整合模块还将多个字段信息发送给信息存储单元。
119.s215:计算机从区块链中读取第一信息。
120.第一信息为从区块链中读取到的信息,第一信息的读取可以根据多个字段信息在区块链中保存的区块位置进行读取,也可以通过其他能够读取到多个字段信息的方式进行读取。由于区块链可能同时保存不同纸质票据的字段信息,需要执行s216以保证读取到的信息与多个字段信息一致。
121.在一些实现方式中,第一信息为信息存储单元接收到的文字整合模块发送的信息。
122.在另一些实现方式中,由信息存储单元从区块链中读取第一信息。
123.s216:计算机将第一信息和第三留存信息进行对比,判断第一信息和第三留存信息是否一致。
124.若第一信息和第三留存信息一致,则执行s217;若第一信息和第三留存信息不一致,则执行s218。
125.s217:计算机对第一信息进行语义识别并添加标识。
126.标识指示第一信息在表单模板上的位置。
127.对第一信息进行语义识别可以通过基于bm25算法的文本匹配技术实现,也可以通过vsm算法,jaccard算法,simhash算法,levenshtein算法、match_pyramid算法,textmatching算法或其他算法实现。
128.s218:计算机输出错误提示信息。
129.在一些实现方式中,由信息存储单元输出错误提示信息。
130.在另一些实现方式中,计算机输出错误提示信息后,不执行针对本纸质票据的后续步骤,直接对下一纸质票据进行转化。
131.s219:计算机根据标识和表单模板,生成电子工作票。
132.电子工作票为电子版工作票凭证。
133.在一些实现方式中,表单模板为表单生成模块的内置表单模板,表单生产模块根据第一信息中不同字段信息的标记和内置的表单模板,生成基于区块链的电子版工作票凭证。
134.在另一些实现方式中,表单生成模块为信息存储单元中的模块。
135.s220:计算机在区块链上保存电子工作票。
136.在一些实现方式中,由表单生成模块在区块链上保存电子工作票。
137.在本技术第二实施例中,通过在区块链上将纸质票据转换为电子工作票,能起到纸质票据信息在转化过程中不被篡改,保证纸质票据信息真实性的作用。
138.请参阅图4,本技术提供了一种生成工作票的装置400,包括:扫描单元401、获取单元402、识别单元403和生成单元404。
139.扫描单元401:用于扫描纸质票据,得到票据图片。
140.获取单元402:用于获取票据图片中的文字,得到字段信息。
141.识别单元403:用于对字段信息进行语义识别并添加标识,标识指示字段信息在表单模板上的位置。
142.生成单元404:用于根据标识和表单模板,生成电子工作票。
143.可选地,一种生成工作票的装置还包括:读取单元405、保存单元406、对比单元407、处理单元408、输出单元409或分割单元410。
144.读取单元405:用于从区块链中读取第一图片、第二图片或第一信息。
145.保存单元406:用于保存票据图片,保存票据图片的多个子图片,多个字段信息,或电子工作票。
146.对比单元407:用于将第一图片和第一留存信息进行对比,将第二图片和第二留存信息进行对比,或将第一信息和第三留存信息进行对比。
147.处理单元408:用于将第一图片进行锐化处理。
148.输出单元409:用于输出错误提示信息。
149.分割单元410:用于对票据图片进行分割。
150.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
151.需要说明的是:上述实施例提供的一种生成工作票的装置在实现生成工作票的功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将一种生成工作票的装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种生成工作票的装置与一种生成工作票的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
152.图5是本技术实施例提供的一种计算机设备500的结构示意图。
153.计算机设备500包括至少一个处理器501、存储器502以及至少一个网络接口503。
154.处理器501例如是通用中央处理器(central processing unit,cpu)、网络处理器(network processer,np)、图形处理器(graphics processing unit,gpu)、神经网络处理器(neural-network processing units,npu)、数据处理单元(data processing unit,dpu)、微处理器或者一个或多个用于实现本技术方案的集成电路。例如,处理器501包括专用集成电路(application-specific integrated circuit,asic),可编程逻辑器件(programmable logic device,pld)或其组合。pld例如是复杂可编程逻辑器件(complex programmable logic device,cpld)、现场可编程逻辑门阵列(field-programmable gate array,fpga)、通用阵列逻辑(generic array logic,gal)或其任意组合。
155.存储器502例如是只读存储器(read-only memory,rom)或可存储静态信息和指令的其它类型的静态存储设备,又如是随机存取存储器(random access memory,ram)或者可存储信息和指令的其它类型的动态存储设备,又如是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备,或者是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质,但不限于此。可选地,存储器502独立存在,并通过内部连接504与处理器501相连接。或者,可选地存储器502和处理器501集成在一起。
156.网络接口503使用任何收发器一类的装置,用于与其它设备或通信网络通信。网络接口503例如包括有线网络接口或者无线网络接口中的至少一项。其中,有线网络接口例如为以太网接口。以太网接口例如是光接口,电接口或其组合。无线网络接口例如为无线局域网(wireless local area networks,wlan)接口,蜂窝网络网络接口或其组合等。
157.在一些实施例中,处理器501包括一个或多个cpu,如图5中所示的cpu0和cpu1。
158.在一些实施例中,计算机设备500可选地包括多个处理器,如图5中所示的处理器501和处理器505。这些处理器中的每一个例如是一个单核处理器(single-cpu),又如是一个多核处理器(multi-cpu)。这里的处理器可选地指一个或多个设备、电路、和/或用于处理数据(如计算机程序指令)的处理核。
159.在一些实施例中,计算机设备500还包括内部连接504。处理器501、存储器502以及至少一个网络接口503通过内部连接504连接。内部连接504包括通路,在上述组件之间传送信息。可选地,内部连接504是单板或总线。可选地,内部连接504分为地址总线、数据总线、控制总线等。
160.在一些实施例中,计算机设备500还包括输入输出接口506。输入输出接口506连接到内部连接504上。
161.在一些实施例中,输入输出接口506用于与输入设备连接,接收用户通过输入设备输入的上述实施例涉及的命令或数据。输入设备包括但不限于键盘、触摸屏、麦克风、鼠标或传感设备等等。
162.在一些实施例中,输入输出接口506还用于与输出设备连接。输入输出接口506通过输出设备输出处理器501执行上述方法实施例产生的中间结果和/或最终结果。输出设备包括但不限于显示器、打印机、投影仪等等。
163.可选地,处理器501通过读取存储器502中保存的程序代码实现上述实施例中的方
法,或者,处理器501通过内部存储的程序代码实现上述实施例中的方法。在处理器501通过读取存储器502中保存的程序代码实现上述实施例中的方法的情况下,存储器502中保存实现本技术实施例提供的方法的程序代码510。
164.处理器501实现上述功能的更多细节请参考前面各个方法实施例中的描述,在这里不再重复。
165.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
166.对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。