一种基于HashMap的下载文件溯源方法及其系统与流程

文档序号:20702398发布日期:2020-05-12 15:54阅读:268来源:国知局
一种基于HashMap的下载文件溯源方法及其系统与流程

本发明涉及计算机通讯技术领域,特别是一种基于hashmap的下载文件溯源方法及其系统。



背景技术:

目前,文件溯源基本基于日志的形式对下载文件来源以及文件本身进行关联并记录存储。当需要得知下载来源时,通过文件信息与日志信息进行遍历并匹配,最后得到文件来源。现有的方法获取来源完全依赖于日志文件,如果日志文件丢失,文件溯源无疑就会失败;而且通过循环遍历日志内容匹配文件特征信息,效率极低。



技术实现要素:

为克服上述问题,本发明的目的是提供一种基于hashmap的下载文件溯源方法,基于hashmap存储,存储和查询时间快,提高了文件溯源效率。

本发明采用以下方案实现:一种基于hashmap的下载文件溯源方法,所述方法包括如下步骤:步骤s1、建立一个哈希表hashmap对象,程序运行中,构建三种键值对,所述键值对由键和值两个变量组成,所述三种键值对分别为:变量临时链接:变量初始链接,变量新临时链接:变量临时链接,变量文件名:变量新临时链接;

步骤s2、在访问网站的页面时,获取初始链接、临时链接、新临时链接、文件名,并对应存储到三种键值对中的变量初始链接、变量临时链接值、变量新临时链接、变量文件名中;将这些键值对存储到hashmap对象中;

步骤s3、在溯源阶段时,指定欲溯源文件,通过欲溯源文件的文件名寻找hashmap对象,通过所述三种键值对来找到欲溯源文件对应的初始链接。

进一步的,所述步骤s2进一步具体为:步骤s21、创建并初始化哈希表hashmap空对象;

步骤s22、程序运行期间,根据初始链接获得页面上的临时链接,组成变量临时链接:变量初始链接的键值对存入hashmap对象中;

步骤s23、再以临时链接获得新临时链接,层层往复搜寻,直到没有新临时链接,并组成多个的变量新临时链接:变量临时链接的键值对,将键值对存入hashmap对象中;

步骤s24、当发现新临时链接为下载链接时,即可下载文件,获得下载文件的文件名,并组成变量文件名:变量新临时链接的键值对,将键值对存入hashmap对象中。

进一步的,所述步骤s3进一步具体为:步骤s31、在溯源阶段时,指定欲溯源的文件,并以欲溯源文件的文件名为键;

步骤s32、到hashmap对象中查找这个键所对应的值,即从变量文件名:变量新临时链接的键值对中得到变量新临时链接,

步骤s33、再以变量新临时链接的值为键到变量新临时链接:变量临时链接的键值对中查找新的值,往复查找直到找到初始链接,至此,溯源完成。

进一步的,所述再以临时链接获得新临时链接实现方式为:得到临时链接后,点击临时链接会搜寻临时链接页面上的超链接记录为新临时链接,超链接包括可点击标签、图片、动态frame。

本发明还提供了一种基于hashmap的下载文件溯源系统,所述系统包括键值对设置模块、获取模块、文件溯源模块;

所述键值对设置模块,用于建立一个哈希表hashmap对象,程序运行中,构建三种键值对,所述键值对由键和值两个变量组成,所述三种键值对分别为:变量临时链接:变量初始链接,变量新临时链接:变量临时链接,变量文件名:变量新临时链接;

所述获取模块,用于在访问网站的页面时,获取初始链接、临时链接、新临时链接、文件名,并对应存储到三种键值对中的变量初始链接、变量临时链接值、变量新临时链接、变量文件名中;将这些键值对存储到hashmap对象中;

所述文件溯源模块,用于在溯源阶段时,指定欲溯源文件,通过欲溯源文件的文件名寻找hashmap对象,通过所述三种键值对来找到欲溯源文件对应的初始链接。

进一步的,所述获取模块进一步具体为:创建并初始化哈希表hashmap空对象;程序运行期间,根据初始链接获得页面上的临时链接,组成变量临时链接:变量初始链接的键值对存入hashmap对象中;再以临时链接获得新临时链接,层层往复搜寻,直到没有新临时链接,并组成多个的变量新临时链接:变量临时链接的键值对,将键值对存入hashmap对象中;当发现新临时链接为下载链接时,即可下载文件,获得下载文件的文件名,并组成变量文件名:变量新临时链接的键值对,将键值对存入hashmap对象中。

进一步的,所述文件溯源模块进一步具体为:在溯源阶段时,指定欲溯源的文件,并以欲溯源文件的文件名为键;到hashmap对象中查找这个键所对应的值,即从变量文件名:变量新临时链接的键值对中得到变量新临时链接,再以变量新临时链接的值为键到变量新临时链接:变量临时链接的键值对中查找新的值,往复查找直到找到初始链接,至此,溯源完成。

进一步的,所述再以临时链接获得新临时链接实现方式为:得到临时链接后,点击临时链接会搜寻临时链接页面上的超链接记录为新临时链接,超链接包括可点击标签、图片、动态frame。

本发明的有益效果在于:1、此溯源方面目前使用于追踪盗版游戏,帮助公司收集盗版游戏信息,获得证据。2、可以追踪热门文件转存的站点,如热门盗版游戏可能通过多个站点发布,均可收集。3、有版权文件被移值盗取到其他门户网站的收集与追踪,从而保障了公司的利益。4、基于hashmap存储,存储和查询时间快,文件溯源效率高。

附图说明

图1是本发明的方法流程示意图。

图2是本发明的系统结构框图。

具体实施方式

下面结合附图对本发明做进一步说明。

请参阅图1所示,本发明的一种基于hashmap的下载文件溯源方法,所述方法包括如下步骤:步骤s1、建立一个哈希表hashmap对象,程序运行中,构建三种键值对,所述键值对由键和值两个变量组成,所述三种键值对分别为:(变量临时链接:变量初始链接),(变量新临时链接:变量临时链接),(变量文件名:变量新临时链接);三种键值对中,前者为键、后者为值;

步骤s2、在访问网站的页面时,获取初始链接、临时链接、新临时链接、文件名,并对应存储到三种键值对中的变量初始链接、变量临时链接值、变量新临时链接、变量文件名中;将这些键值对存储到hashmap对象中;程序运行前,会指定初始链接,运行时候,通过初始链接的网页会获得临时链接,当临时链接,在获取新临时链接时,判断新临时链接是否为下载链接,即下载链接是能够再下载得到文件。

步骤s3、在溯源阶段时,指定欲溯源文件,通过欲溯源文件的文件名寻找hashmap对象,通过所述三种键值对来找到欲溯源文件对应的初始链接。

所述步骤s2进一步具体为:步骤s21、创建并初始化哈希表hashmap空对象;

步骤s22、程序运行期间,根据初始链接获得页面上的临时链接,组成变量临时链接:变量初始链接的键值对存入hashmap对象中;

步骤s23、再以临时链接获得新临时链接,层层往复搜寻,直到没有新临时链接,并组成多个的变量新临时链接:变量临时链接的键值对,将键值对存入hashmap对象中;所述再以临时链接获得新临时链接实现方式为:得到临时链接后,点击临时链接会搜寻临时链接页面上的超链接记录为新临时链接,超链接包括可点击标签、图片、动态frame。层层指的是如果由临时链接搜寻到新临时链接,发现新临时链接并不是可下载链接或者人为设定的终点,它还能接着作为临时链接再搜寻新临时链接,直到遇到达到终点为止,因此,能组成多个的(变量新临时链接:变量临时链接)的键值对。

步骤s24、当发现新临时链接为下载链接时,即可下载文件,获得下载文件的文件名,并组成变量文件名:变量新临时链接的键值对,将键值对存入hashmap对象中。

所述步骤s3进一步具体为:步骤s31、在溯源阶段时,指定欲溯源的文件,并以欲溯源文件的文件名为键;

步骤s32、到hashmap对象中查找这个键所对应的值,即从变量文件名:变量新临时链接的键值对中得到变量新临时链接,

步骤s33、再以变量新临时链接的值为键到变量新临时链接:变量临时链接的键值对中查找新的值,往复查找直到找到初始链接,至此,溯源完成。

下面结合一具体实施例对本发明作进一步说明:

a:记录阶段:

1、指定多个私服初始链接如http://www.1132my.com/30/,http://www.27my.com.cn:90等等;

2、自动化打开初始链接并根据链接页面上的超链接(临时链接),则键值对(变量临时链接:变量初始链接)记为((“https://www.lanzous.com/i82hsyj”:“http://www.1132my.com/30/”),

(“http://www.27my.com.cn:90/index.htm”:“http://www.27my.com.cn:90”),

(“http://top.shoukabao.com:66/ch/a.html?sid=74458”:“http://www.27my.com.cn:90”)等等)

并存入hashmap对象中;

3、类似第二步以自动化打开临时链接并获得新临时链接,则键值对(变量新临时链接:变量临时链接)如:

((”http://www.27my.com.cn:90/狂战魔域.rar”:

“http://www.27my.com.cn:90/index.htm”),

(“http://www.27my.com.cn:90/xx.htm”:”http://www.27my.com.cn:90/index.htm”)

(“https://www.lanzous.com/i82hsyj/龙腾魔域.zip”:“https://www.lanzous.com/i82hsyj”)等等)并存入hashmap对象中;

4、判断新临时链接是不是终点,即使可下载链接或者是达到人为规定的终点(人为规定就是当发现新链接不在我们想要集合内,就抛弃它)。若不是,以临时链接身份重复进入第3步,否则构建键值对(变量文件名:变量新临时链接):

((“狂战魔域.rar”:“http://www.27my.com.cn:90/狂战魔域.rar”)

,(“龙腾魔域.rar”:“https://www.lanzous.com/i82hsyj/龙腾魔域.zip”)等等键值对)并存入hashmap对象中;

b:溯源阶段:

当做完这个私服程序的分析工作时,需要溯源它时:

1、指定文件名:“龙腾魔域.rar”为键

2、到hashmap对象(变量文件名:变量新临时链接)中寻找,得到(“龙腾魔域.rar”:“https://www.lanzous.com/i82hsyj/龙腾魔域.zip”)

3、发现“https://www.lanzous.com/i82hsyj/龙腾魔域.zip”并不是初始链接。于是以“https://www.lanzous.com/i82hsyj/龙腾魔域.zip”为键到hashmap对象(变量新临时链接:变量临时链接)中寻找,得到(“https://www.lanzous.com/i82hsyj/龙腾魔域.zip”:“https://www.lanzous.com/i82hsyj”);

发现“https://www.lanzous.com/i82hsyj”并不是初始链接。于是以“https://www.lanzous.com/i82hsyj”为键到hashmap对象(变量临时链接:变量初始链接)中寻找,得到(“https://www.lanzous.com/i82hsyj”:“http://www.1132my.com/30/”),后面如此重复,最后发现“http://www.1132my.com/30/”为初始链接。

如图2所示,本发明还提供了一种基于hashmap的下载文件溯源系统,所述系统包括键值对设置模块、获取模块、文件溯源模块;

所述键值对设置模块,用于建立一个哈希表hashmap对象,程序运行中,构建三种键值对,所述键值对由键和值两个变量组成,所述三种键值对分别为:变量临时链接:变量初始链接,变量新临时链接:变量临时链接,变量文件名:变量新临时链接;

所述获取模块,用于在访问网站的页面时,获取初始链接、临时链接、新临时链接、文件名,并对应存储到三种键值对中的变量初始链接、变量临时链接值、变量新临时链接、变量文件名中;将这些键值对存储到hashmap对象中;

所述文件溯源模块,用于在溯源阶段时,指定欲溯源文件,通过欲溯源文件的文件名寻找hashmap对象,通过所述三种键值对来找到欲溯源文件对应的初始链接。

所述获取模块进一步具体为:创建并初始化哈希表hashmap空对象;程序运行期间,根据初始链接获得页面上的临时链接,组成变量临时链接:变量初始链接的键值对存入hashmap对象中;再以临时链接获得新临时链接,层层往复搜寻,直到没有新临时链接,并组成多个的变量新临时链接:变量临时链接的键值对,将键值对存入hashmap对象中;当发现新临时链接为下载链接时,即可下载文件,获得下载文件的文件名,并组成变量文件名:变量新临时链接的键值对,将键值对存入hashmap对象中。所述再以临时链接获得新临时链接实现方式为:得到临时链接后,点击临时链接会搜寻临时链接页面上的超链接记录为新临时链接,超链接包括可点击标签、图片、动态frame。层层指的是如果由临时链接搜寻到新临时链接,发现新临时链接并不是可下载链接或者人为设定的终点,它还能接着作为临时链接再搜寻新临时链接,直到遇到达到终点为止,因此,能组成多个的(变量新临时链接:变量临时链接)的键值对。

所述文件溯源模块进一步具体为:在溯源阶段时,指定欲溯源的文件,并以欲溯源文件的文件名为键;到hashmap对象中查找这个键所对应的值,即从变量文件名:变量新临时链接的键值对中得到变量新临时链接,再以变量新临时链接的值为键到变量新临时链接:变量临时链接的键值对中查找新的值,往复查找直到找到初始链接,至此,溯源完成。

总之,本发明在记录阶段,先建立一个哈希表hashmap对象;程序运行中,构建三种键值对,分别为(变量临时链接:变量初始链接),(变量新临时链接:变量临时链接),(变量文件名:变量新临时链接)。并将这些键值对存储到hashmap对象中,溯源阶段,指定欲溯源文件,通过文件名寻找hashmap对象便能高效方便找到指定的初始链接。

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1