一种离线信息采集方法与流程

文档序号:35868273发布日期:2023-10-27 22:42阅读:23来源:国知局
一种离线信息采集方法与流程

本发明涉及信息安全,更具体地,涉及一种离线信息采集方法。


背景技术:

1、在当前国产化的大趋势下,实际的it环境是国产-非国产系统共存的异构环境。在信息填报的环境和信息汇总管理的环境密级不对称的情况下,由于网络隔离等原因,不能采用“在高安全级别环境中部署服务器,直接通过网络从低安全级别的终端采集填报信息”的解决方案;在实际应用中,信息采集涉及多个用户的信息填报,为方便用户使用,例如重要项目信息的申报,创新创业中被投资企业向投资方发送财务报告,专家库建设过程中专家信息的填报采集等,在这类场景中,服务端由于信息富集(有多个项目信息、多份财务报告、多位专家信息等),一般部署在高安全级别的环境中,高安全级别的环境相对填报端具有相对高的密级,实现信息进行密级不对称采集和应用的场景。

2、当前,在类似应用场景中,相关的可用于信息采集汇总的技术有wps,word,excel,pdf,txt等,主要的技术缺陷有如下几点:

3、(1)近零部署问题:采用wps,word,excel,pdf技术填报和汇总信息,需要在非国产环境和国产环境安装不同的版本,以适用不同cpu、操作系统的软件,有繁琐的版本选择和安装工作,无法实现“几乎不用额外安装软件”的近零部署效果;

4、(2)无差别运行于国产环境和非国产环境问题:采用wps,word,excel,pdf,等技术时,由于在非国产环境和国产环境安装的为不同版本,在非国产环境中编辑的文件,进入国产环境中进行编辑时,或多或少存在版本兼容问题,例如采用pdf技术编辑填报信息的文件时,在国产环境中只能查看,不能继续编辑,无法实现无差别运行于国产环境和非国产环境中,在需要一个文件在非国产环境填写部分信息,然后再进入国产环境填写另一部分信息,再导入部署在国产环境的高安全级别的信息管理系统这类需求场景时,存在一定的困难;

5、(3)信息结构化存储和提取方面的缺陷问题:采用word,wpsword等技术时,所填报的信息很多时候是非结构化的,需要做很多额外工作才能实现信息的结构化分析和利用;

6、(4)填报文件传输过程中的信息泄露问题:如txt文件解决了“近零部署问题”和“无差别运行于国产环境和非国产环境问题”,但没有文件加密功能,无法保障文件传输过程中的信息安全。

7、(5)不具备信息增量采集功能:以专家库建设过程中,专家信息填报采集的场景为例,对于已在专家库中的专家,在采集更新专家的最新信息时,把专家以前填报的信息加密,放在离线填报文件派发给专家;专家拿到文件后,仅修改更新信息即可完成填报,节省填报时间;这一功能要求所用的信息采集技术能在派发给填报人的离线填报文件中存储历史信息、有加解密功能、有相对好的信息安全保护功能,以及对所填报信息进行结构化存储和读取;

8、(6)不具备数据校验逻辑可编程特性,无法按业务需要,通过编程对填报人所填报信息进行校验,发现有不符合数据采集要求的,及时提醒用户修改,使得填报人所填报的信息校验全通过才能提交数据,从而保障所采集数据的质量,如txt文件解决了“近零部署问题”和“无差别运行于国产环境和非国产环境问题”,但不具备“数据校验逻辑可编程”特性。


技术实现思路

1、本发明旨在克服上述现有技术的至少一种缺陷(不足),提供一种离线信息采集方法,用于保障信息采集和传输过程中的安全性和方便性。

2、本发明采取的技术方案是提供一种离线信息采集方法,包括:

3、管理终端向服务器发送离线信息采集文件的生成请求,所述生成请求包括采集端信息和第一密码;

4、服务器接收管理终端发送的生成请求,根据生成请求生成离线信息采集文件,将所述离线信息采集文件通过第一密码进行加密,并将加密后的离线信息采集文件下发至管理终端;

5、管理终端将加密后的离线信息采集文件通过离线方式发送给采集端,将第一密码通过第一保密方式发送给所述采集端;

6、采集端接收离线信息采集文件和第一密码,并根据第一密码解密所述离线信息采集文件;

7、采集端基于解密后的离线信息采集文件进行信息采集,并对进行了信息采集的离线信息采集文件进行加密,生成包含有加密后采集信息的离线信息加密文件并通过第二保密方式提交给管理终端;

8、管理终端接收离线信息加密文件后将其传输至服务器;

9、服务器接收管理终端发送的离线信息加密文件,完成离线信息采集。

10、本发明的第一密码可以为管理终端按业务策略预设或随机生成,管理终端在生成离线信息采集文件的生成请求之前先按业务策略预设的第一密码或者先随机生成第一密码,第一密码在发送给采集端时使用与离线信息采集文件不同的方式分别发送,采集端需要同时获取两种信息才能获取完整的信息,有效保障发送离线信息采集文件过程的安全性;对还未进行信息采集的离线信息采集文件和信息采集完成后的采集信息使用不同的加密方法进行加密,双重保障数据传输过程中的安全性;采集信息在进行加密后,先由采集端通过第二保密方式提交给管理终端,再由管理终端传输给服务器,所述第二保密方式也可以为离线方式,使本发明可以实现用户离线采集信息,然后将离线信息采集文件安全导入至部署在高安全级别网络环境的服务器。本发明的信息采集过程经过多重保护,可以有效保障信息采集和上报过程中的安全性和方便性。

11、进一步的,还包括:

12、服务器随机生成若干个长度不同的rsa算法公钥和对应的私钥,每个公钥对应一个公钥id;

13、服务器根据若干个公钥id生成公钥id随机序列;

14、服务器将对应的私钥进行存储,同时将公钥id随机序列和对应的公钥存储在离线信息采集文件中。

15、在生成离线信息采集文件的时候,可以准备多个长度不同的rsa算法公钥,例如可取公钥长度为500-1024位范围中的多个自然数,在加密算法版本足够高时候,可取公钥长度为1024-2048位范围中的多个自然数等,每个公钥对应一个公钥id;把准备的公钥组合{(公钥id1,公钥1),(公钥id2,公钥2),(公钥id3,公钥3),(公钥id4,公钥4),(公钥id5,公钥5),...,(公钥idk,公钥k)},和一个由各公钥id组成的随机序列,例如“公钥id3,公钥id5,公钥id4,公钥id3,公钥id1,公钥id2,公钥id3,公钥id4,公钥idk,公钥id5...”存储在离线信息采集文件中,不同的离线信息采集文件的随机序列不同,公钥id随机序列越长,对提高信息采集的安全性越有利。

16、进一步的,所述采集端对进行了信息采集的离线信息采集文件进行加密,具体包括采集端执行如下步骤:

17、采用脚本技术对采集信息进行校验;

18、将校验通过后的采集信息转化为json格式,经序列化转换后得到采集信息的json字符串;

19、获取离线信息采集文件中存储的公钥id随机序列和对应的公钥;

20、按照随机序列公钥id的顺序,根据对应的公钥的长度对采集信息的json字符串进行分段,得到若干长度不同的分段信息;

21、使用对应的公钥分别对每段分段信息进行加密,得到若干长度不同的分段加密字符串;

22、将分段加密字符串结尾均加上分隔符串,合并为整段的rsa加密字符串。

23、当使用word等软件进行信息采集时,需要在计算机上先安装office软件,在不同类型的计算机上运行时需要安装不同版本,无法实现近零部署和无差别运行于信创和非信创不同环境的特性。而本发明的程序逻辑和采集端采集信息的校验逻辑均采用脚本技术实现,数据存储采用json格式,由于无论信创还是非信创计算机,预装的浏览器都能识别和运行脚本程序和识别json格式的数据,从而使本发明可以实现近零部署和无差别运行于信创和非信创不同环境的特性。

24、由于使用了脚本技术对采集信息进行校验,使本发明的采集方法具有对所采集的数据校验逻辑可编程的特性;由于json格式的数据为结构化数据,将校验通过后的采集信息转化为json格式,使本发明的采集方法具有数据结构化存储和提取的特性。

25、现有技术中的rsa加密算法存在加密数据长度限制问题,通常一次加密的数据长度是(密钥长度/8-11),当原始数据大于该长度时,就无法使用rsa加密算法,因此rsa加密算法一般用于对用户密码这种长度较短的数据进行加密。本发明通过对采集信息进行分段,再对分段后的采集信息分别进行加密,使rsa加密算法可以用于对长度较长的全文进行加密,保障信息提交的完整性、可靠性及安全性。其中,由于分段的长度为动态随机,不预设固定长度,当信息被窃取时,不仅需要破译密码,还需要获取分段的长度才能完整进行解密,可以进一步保障本发明的加密方法的安全性。

26、进一步的,所述得到若干长度不同的分段加密字符串后,还包括:对长度不同的分段加密字符串结尾加上随机填充字符串,使所述若干加密字符串的长度差异伪装为0-6个字节。

27、得到若干长度不同的分段加密字符串后,可以在所获得的若干长度不同的分段加密字符串结尾,按照其和长度最长分段加密字符串的长度差异,添加相应长度的随机字符串,长度差异按所加密内容随机波动,波动范围控制在0-6个字节以内,使待加密的采集信息分段后的加密结果看起来像采用同个公钥加密所获得的一系列长度基本相同的密文,可以有效迷惑想要窃取信息的攻击者,进一步保障加密方法的安全性。

28、进一步的,服务器接收管理终端发送的离线信息加密文件后,还执行如下步骤:

29、所述接收到的离线信息加密文件为rsa加密字符串,根据分隔符串对rsa加密字符串进行分段,得到若干长度基本相同的分段加密字符串;

30、获取该离线信息加密文件对应的离线信息采集文件中存储的公钥id随机序列和对应的公钥;

31、按照公钥id随机序列的顺序,根据对应的公钥的长度对若干长度相同的分段加密字符串进行删减,去除分段加密字符串结尾加上的随机填充字符串,得到若干长度不同的分段加密字符串;

32、通过公钥对应的私钥对若干长度不同的分段加密字符串进行解密,得到分段信息;

33、将分段信息合并为完整的采集信息并进行存储。

34、在对接收到的离线信息加密文件进行解密进行分段解密时,由于服务器存储有该加密文件对应的公钥id随机序列,因此能准确地将rsa加密字符串进行分段,得到若干长度基本相同的分段加密字符串,所述加密字符串的随机长度差异为0-6个字节;去掉各段分段加密字符串中的随机填充字符串,获得真正的分段加密字符串,然后用对应的私钥进行解密,得到分段信息,完成后将分段信息拼接恢复成完整的采集信息,存储在数据库中。本发明的加密方法大大提高了破解暴力的试错成本,提高了信息采集的安全性。并且,由于用于解密rsa加密字符串的私钥仅存储在服务器中,只有服务器有权限对离线信息加密文件进行解密,进一步保障了离线信息的安全性。

35、如果需要进一步提高本发明的加密方法的安全性,可以对转化为json字符串的采集信息先进行一次aes加密,再使用分段rsa加密算法进行二次加密,使攻击者即使破译部分分段加密字符串也无法获得有用的信息。

36、进一步的,还包括:采集端对最新的采集信息进行缓存。

37、采集端对最新的采集信息进行缓存时,包括:

38、将最新的采集信息转化为json格式,经过序列化转换后得到最新的采集信息的json字符串;

39、使用aes加密算法通过第一密码对最新的采集信息的json字符串进行加密,得到最新的采集信息对应的aes加密字符串;

40、将最新的采集信息对应的aes加密字符串进行存储,以使采集端继续进行信息采集时,根据第一密码解密得到最新的采集信息。

41、在进行信息采集的过程中,采集端无需一次性将所有信息采集完成,可以先采集一部分,然后以缓存机制对未完成的采集信息进行加密后进行存储,使采集端需要继续进行采集时可以直接获取上次未完成的采集信息,无需重复采集相同信息。这一过程可以在国产机器上操作,也可以在非国产机器上操作,也可以在国产机器上填报一部分信息,再将未完成的采集信息加密文件拷贝到非国产机器上继续填报另一部分信息,体现了本发明的采集方法可以无差别运行于信创和非信创不同环境的特点。当采集端需要继续采集信息时,可以直接获取上次未完成的采集信息的加密文件,并使用第一密码进行解密后继续进行采集,可以有效保障信息采集过程中的安全性和方便性,也使本发明的采集方法具备信息增量采集功能。

42、进一步的,采集端对最新的采集信息进行缓存时,还包括:

43、将最新的采集信息转化为json格式,经过序列化转换后得到最新的采集信息的json字符串;

44、获取离线信息采集文件中存储的公钥id随机序列和对应的公钥;

45、按照随机序列公钥id的顺序,根据对应的公钥的长度对最新的采集信息的json字符串进行分段,得到若干长度不同的分段信息;

46、使用对应的公钥分别对每段分段信息进行加密,得到若干长度不同的分段加密字符串;

47、将分段加密字符串结尾均加上分隔符串,合并为整段的rsa加密字符串;

48、将整段的rsa加密字符串作为最新的离线信息加密文件。

49、本发明对未完成的采集信息采用双重加密方法,现有技术中通常的aes和rsa的双重加密方法为“先使用aes加密算法对全文进行加密,再使用rsa加密算法对aes加密算法的密钥进行加密,使用rsa加密算法获得的密文仅包含有加密后的aes密钥信息”,而本发明通过对rsa加密算法进行改进,使其可以对长度较长的全文信息进行加密,因此本发明的双重加密为“使用rsa加密算法和aes加密算法分别对未完成的采集信息全文进行加密,从而获得两份包含不同的但均各自含有加密后全文信息的密文,以分别实现不同的功能,同时可以用作双重保护”。

50、进一步的,还包括:采集端对最新的离线信息加密文件进行存储。采集端对最新的离线信息进行加密后,将获得的加密文件进行存储。

51、进一步的,当采集端需要重置密码时,进行以下步骤:

52、采集端接收用户是否记得旧密码的确认信息;

53、采集端根据确认信息接收旧密码信息或者用户身份标记信息;

54、当采集端接收到旧密码信息时,采集端判断旧密码是否正确,若正确则重置新密码,若不正确则提示输入身份标记信息;

55、当采集端接收到身份标记信息时,采集端判断是否验证通过;

56、若验证通过,则采集端获取存储的最新的离线信息加密文件,提交给管理终端;

57、管理终端将最新的离线信息加密文件上传至服务器;

58、服务器获取对应的私钥对上传的最新的离线信息加密文件进行解密,得到最新的采集信息,重新生成包括最新采集信息的离线信息采集文件并下发给管理终端,所述离线信息采集文件包括旧密码;

59、管理终端将重新生成的离线信息采集文件发送给对应的采集端。

60、由于第一密码可以为管理终端按业务策略预设或随机生成,可能会存在采集端的用户忘记密码或者采集端的用户需要重新设置密码的情况。此时分为两种情况,当采集端的用户记得旧密码时,则直接输入旧密码进行常规的密码修改;当采集端的用户不记得旧密码时,为了保障密码的安全性,需要通过身份校验;采集端获取存储的最新的离线信息加密文件,可以通过离线方式提交给管理终端;管理终端重新生成的离线信息采集文件发送给对应的采集端,离线信息采集文件内包括旧密码,再由采集端决定继续使用旧密码还是继续修改,如果需要继续修改则进行采集端记得旧密码的修改密码操作。通过以上方式进行重置密码,可以有效保障密码的安全性。

61、由此可见,双重加密后得到的第一份密文,即aes加密字符串,用于缓存在本地,当采集端需要继续采集未完成的采集信息时,可以直接获取,并通过第一密码解密继续进行信息采集;双重加密后得到的第二份密文,即rsa加密字符串,用于当采集端不记得密码并且需要重置密码时,获取rsa加密字符串发送给管理终端重新生成离线信息采集文件,或者用于提交所填报的信息。

62、与现有技术相比,本发明的有益效果为:

63、(1)本发明的程序逻辑和采集端采集信息的校验逻辑均采用脚本技术实现,数据存储采用json格式,由于无论信创还是非信创计算机,预装的浏览器都能识别和运行脚本程序和识别json格式的数据,从而使本发明可以实现近零部署和无差别运行于信创和非信创不同环境的特性;

64、(2)由于使用了脚本技术对采集信息进行校验,使本发明的采集方法具有对所采集的数据校验逻辑可编程的特性;

65、(3)由于json格式的数据为结构化数据,将校验通过后的采集信息转化为json格式,使本发明的采集方法具有数据结构化存储和提取的特性;

66、(4)本发明通过对采集信息进行分段,再对分段后的采集信息分别进行加密,使rsa加密算法可以用于对长度较长的全文进行加密,保障信息提交的完整性、可靠性及安全性。其中,由于分段的长度为动态随机,不预设固定长度,当信息被窃取时,不仅需要破译密码,还需要获取分段的长度才能完整进行解密,可以进一步保障本发明的加密方法的安全性;

67、(5)当采集端需要继续采集信息时,可以直接获取上次未完成的采集信息的加密文件,并使用第一密码进行解密后继续进行采集,可以有效保障信息采集过程中的安全性,使本发明的采集方法具备信息增量采集功能;

68、(6)本发明可以同时解决背景技术中介绍的现有技术存在的6个技术缺陷。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1