可溯源的文本隐写方法及文本文件信息泄露后的溯源方法与流程

文档序号:35531274发布日期:2023-09-21 11:47阅读:56来源:国知局
可溯源的文本隐写方法及文本文件信息泄露后的溯源方法与流程

本申请涉及信息安全技术,更为具体地,涉及文本信息隐写技术。


背景技术:

1、信息隐写是关于信息隐藏,即不让计划的接收者之外的任何人知道信息的传递事件(而不只是信息的内容)的一门技巧与科学。文本类信息隐写技术通常依赖介质,这其中水印技术的应用相对广泛。

2、总得来说,现有的信息隐写技术存在以下问题:对于word、txt等纯文本内容而言,效果不好,所以使用场景有限;依赖介质,一旦介质丢失,隐写信息即丢失;容易被察觉;隐写信息易破解,基于图片识别技术等可去除隐写信息,容易破解隐写信息。


技术实现思路

1、根据本申请的一些方面,提供可溯源的文本隐写方法,以至少解决现有隐写技术中的一个问题。

2、根据本申请示例的可溯源的文本隐写方法,包括:对原始文本进行语句划分,从而形成多个划分语句;基于语义数据库,为所述多个划分语句中的每一句或部分划分语句创建能表达原语义的新语句;以所创建的新语句结合所述原始文本创建多个与原始文本对应的隐写文本,各所述隐写文本彼此不同;将各所述隐写文本与所述原始文本的差别记录到隐写记录中。

3、所示例的可溯源的文本隐写方法,示例地,所述对原始文本进行语句划分,包括:将所述原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的各划分位置。所示例的可溯源的文本隐写方法,示例地,所述对原始文本进行语句划分还包括:对所述多个划分语句中的至少一个划分语句,以第二分隔方式将其划分成多个分词,并记录第二分隔方式下的各划分位置。

4、所示例的可溯源的文本隐写方法,示例地,所述基于语义数据库,为所述多个划分语句中的每一句或部分语句创建能表达原语义的新语句,包括从语义数据库为所述多个分词中的每一个或部分分词索引一个或多个新词;以所述新词并基于所述第二分隔方式下的各划分位置,创建所述多个划分语句的新语句;以及所述以所创建的新语句结合所述原始文本创建与原始文本对应的隐写文本,包括基于所述第一分隔方式下的各划分位置,以所述新语句结合所述原始文本创建多个与原始文本对应的隐写文本。

5、所示例的可溯源的文本隐写方法,示例地,所述方法还包括在语义数据库为所述多个分词中的每一个索引一个或多个新词后,将所索引的新词以与相应分词关联的方式存储到新词记录中。

6、所示例的可溯源的文本隐写方法,示例地,所述方法还包括:验证所索引的新词是否能表达所述相应分词的语义,且仅在通过验证的情况下,将所索引的新词存储到所述新词记录中。

7、所示例的可溯源的文本隐写方法,示例地,所述第一分隔方式包括以下方式中的一种或多种:按照标点分隔的方式;按照谓语分隔的方式;按照表达意思完整度分隔的方式。所示例的可溯源的文本隐写方法,示例地,所述第二分隔方式是按照词性分隔。

8、根据本申请的又一方面,还提供文本文件信息泄露后的溯源方法,所述方法包括:将泄露的隐写文本与原始文本比较以确定两者的差别;根据所确定的差别,从隐写记录中查找与该差别对应的隐写文本使用方的信息;其中,所述隐写文本根据上文所述的任意一种方法创建;其中,所述隐写记录还包括各隐写文本的使用方信息。

9、还提供一种文本文件管理方法,所述方法包括:根据对文本文件的请求,按照上文所述的任意一种方法创建针对所请求的文本文件的隐写文本;将所述隐写文件作为所请求的文件,发送给文件请求方,并在所述隐写记录中记录与请求方有关的信息。

10、根据本申请的再一示例,还提供一种可溯源的文本隐写系统,所述系统包括:第一单元,用于对原始文本进行语句划分,从而形成多个划分语句;第二单元,用于基于语义数据库,为所述多个划分语句中的每一个或部分创建能表达原语义的新语句;第三单元,用于以所创建的新语句结合所述原始文本创建多个与原始文本对应的隐写文本,其中,各所述隐写文本彼此不同;存储单元,用于存储隐写记录,所述隐写记录包括所记录的各所述隐写文本与所述原始文本的差别。

11、所述的可溯源的文本隐写系统,示例地,所述第一单元设置为将所述原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的各划分位置;对所述多个划分语句中的至少一个划分语句,以第二分隔方式将其划分成多个分词,并记录第二分隔方式下的各划分位置。

12、所述的可溯源的文本隐写系统,示例地,所述第二单元设置为从语义数据库为所述多个分词中的每一个索引一个或多个新词;以索引的新词和所述第二分隔方式下的各划分位置为所述多个划分语句创建新语句;以及所述第三单元设置为基于所述第一分隔方式下的各划分位置,以所述新语句结合所述原始文本创建多个与原始文本对应的隐写文本。

13、根据本申请的另外一方面,还提供一种文本文件信息泄露后的溯源系统,所述系统包括:比较单元,用于泄露的隐写文本与原始文本比较以确定两者的差别;使用方确定单元,用于根据所确定的差别,从隐写记录中查找与该差别对应的隐写文本使用方的信息;其中,所述隐写文本根据上文所述的任意一种方法创建或由上文所述的可溯源的文本隐写系统中的任意一种创建。

14、还提供一种电子设备,其包括处理器和存储器,所述存储器存储指令,所述处理器配置能处理所述指令且在执行所述指令时能实现根据上文所述的任意一种方法。

15、还提供一种计算机可读存储介质,所述存储介质用于存储指令,所述存储指令在被执行时,能实现根据上文所述的任意一种方法。该存储介质为非暂存性存储介质。



技术特征:

1.一种可溯源的文本隐写方法,其特征在于,所述方法包括:

2.根据权利要求1所述的文本隐写方法,其特征在于,所述对原始文本进行语句划分,包括:

3.根据权利要求2所述的文本隐写方法,其特征在于,所述对原始文本进行语句划分,还包括:

4.根据权利要求3所述的文本隐写方法,其特征在于,所述基于语义数据库,为所述多个划分语句中的每一句或部分语句创建能表达原语义的新语句,包括:

5.根据权利要求4所述的文本隐写方法,其特征在于,所述方法还包括:在语义数据库为所述多个分词中的每一个索引一个或多个新词后,将所索引的新词以与相应分词关联的方式存储到新词记录中。

6.根据权利要求4或5所述的文本隐写方法,其特征在于,所述方法还包括:验证所索引的新词是否能表达所述相应分词的语义,且仅在通过验证的情况下,将所索引的新词存储到所述新词记录中。

7.根据权利要求2或3所述的文本隐写方法,其特征在于,所述第一分隔方式包括以下方式中的一种或多种:

8.根据权利要求7所述的文本隐写方法,其特征在于,所述第二分隔方式是按照词性分隔。

9.一种文本文件信息泄露后的溯源方法,其特征在于,所述方法包括:

10.一种文本文件管理方法,其特征在于,所述方法包括:

11.一种可溯源的文本隐写系统,其特征在于,所述系统包括:

12.根据权利要求11所述的文本隐写系统,其特征在于,所述第一单元设置为:

13.根据权利要求12所述的文本隐写系统,其特征在于,所述第二单元设置为:

14.根据权利要求13所述的文本隐写系统,其特征在于,所述第二单元还设置为将将所索引的新词以与相应分词关联的方式存储到新词记录中。

15.一种文本文件信息泄露后的溯源系统,其特征在于,所述系统包括:

16.一种电子设备,其包括处理器和存储器,所述存储器存储指令,所述处理器配置能处理所述指令且在执行所述指令时能实现根据权利要求1到权利要求8中任意一项所述的方法。

17.一种计算机可读存储介质,所述存储介质用于存储指令,所述存储指令在被执行时,能实现根据权利要求1到权利要求8中任意一项所述的方法。


技术总结
本申请提供可溯源的文本隐写方法,包括对原始文本进行语句划分,从而形成多个划分语句;基于语义数据库,为所述多个划分语句中的每一个或部分创建能表达原语义的新语句;以所创建的新语句结合所述原始文本创建多个与原始文本对应的隐写文本,各所述隐写文本彼此不同;将各所述隐写文本与所述原始文本的差别记录到隐写记录中。还提供文本文件信息泄露后的溯源方法及相应的系统。

技术研发人员:车堃,张辉
受保护的技术使用者:证通股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1