专利名称:用于减少对等网络上的垃圾信息的方法和装置的制作方法
技术领域:
本发明总体上涉及计算网络,并尤其涉及在对等数据传送网络上 的垃圾信息(例如,未被请求的或欺骗数据)的传播。
背景技术:
图l是以对等(P2P)方式相互作用的节点(例如,计算设备) 的网络100的示意图。通常,请求节点101向经由对等连接与该请求 节点101通信的至少一个中间节点111发送搜索消息105 (例如,包 含与请求节点101希望定位的数据有关的关键词)。中间节点lll接 收到该搜索消息105,并将该搜索消息105转发给至少一个另外的节 点111。最终,搜索消息105到达具有被请求的数据的至少一个响应 节点103(在一些情况下,搜索消息105被转发到的第一中间节点111 也将是响应节点103)。至少一个响应节点103例如经由中间节点111 向请求节点101发送回响应消息107。请求节点101然后通过例如经 由直接连接109直接连接到响应节点103,从响应节点103请求相关 数据。
在传统P2P系统中, 一些响应节点103通常在被传送的文件内 隐藏"垃圾消息,,内容(例如,未被请求的或欺骗数据,例如广告)。 一些响应节点甚至基本上响应于接收到的任何搜索信息,不管发送消 息内包含的关键词是什么都发送垃圾信息内容。例如,响应于包含搜 索项"Joe,spoetry"的搜索请求消息105,响应节点103可指示其具有 ,皮标i己为"JoeS-poetry.mp3,,或"JoysPoetry.wmv,,的文件。但是,该文 件实际上包含完全与Joe或诗歌无关的产品的广告而不是包含于 Joe's poetry有关的内容。如果在请求节点的用户不能马上检查出被 传送文件的内容,则他或她可能不知道被传送的文件包含垃圾信息,
并且会不知不觉地将该垃圾信息与P2P网络上的其他用户共享。
因此,本领域内需要一种用于减少P2P网络上的垃圾信息的方 法和装置。
发明内容
本发明的用于减少对等网络内的垃圾信息的方法和装置的一个 实施例包括形成包含至少一个诱斜词的搜索消息,并将包含该诱辨词 的搜索请求消息发送给网络内的一个或多个节点。本发明的实施例使 得可清除网络内的响应于每个搜索消息(例如,不管搜索消息的内容 如何)发送垃圾信息的节点。
从而,参照本发明的实施例可详细理解实现本发明的上述实施例 的方式,并且可获得在上文被简单总结的本发明的更具体的说明。但 是,应注意,附图仅示出本发明的典型实施例,因此不应为认为是限 制本发明的范围,因为本发明可能存在其他等效实施例。
图l是以对等方式相互作用的节点的网络的示意图2是示出根据本发明的用于减少P2P网络上的垃圾信息的方
法的 一个实施例的流程图3是示出根据本发明的用于减少P2P网络上的垃圾信息的方 法的第二实施例的流程图;以及
图4是使用通用计算设备实现的垃圾信息减少方法的高层框图。 为了有助于理解,在可能时使用相同的标号指示附图中公共的相 同的元件。
具体实施例方式
在一个实施例中,本发明是一种用于减少P2P网络内的垃圾信 息的方法和装置。本发明的实施例使得用户可在下载相关联的数据之 前识别响应于搜索消息被发送的隐蔽的垃圾信息,从而用户不会下载
垃圾信息以及随后可能与其他用户共享该垃圾信息。本发明的实施例 尤其有效地识别这样的节点,即该节点基本上响应于它们接收到的任 何搜索消息,不管搜索消息的内容如何都发送垃圾信息。
对于本发明,术语"节点"是指连接到P2P网络的计算设备例如 个人计算设备(例如桌上计算机,膝上型计算机,移动电话,个人数 字助理等),服务器,路由器等。
图2示出根据本发明的用于减少P2P网络上的垃圾信息的方法 200的一个实施例的流程图。尽管在P2P网络的上下文内说明了本发 明,但是本领域的那些技术人员应理解,本发明基本上可用于其中用 户与未知的用户共享数据的任何数据传送网络。方法200可例如在 P2P网络内的节点处实现。
方法200在步骤202 #皮初始化并前进到步骤204,在该处方法200 例如从作为搜索消息的源的节点接收到搜索消息。搜索消息包括例如 与用户希望在网络内搜索到的数据有关的一个或多个搜索关鍵词。例 如,搜索消息可包括词"Joe Smith,,和"Happy Birthday,,以指示用户希 望搜索与Joe Smith的"Happy Birthday,,唱片或单曲有关的媒体文 件。
在步骤206,方法200向在步骤204内接收到的搜索消息添加至 少一个诱斜词。在一个实施例中,诱辨词是与搜索消息内的关键词无 关的自然词。在一个实施例中,诱饰词被从字典任意选择以便插入搜 索消息。在另一个实施例中,诱饵词是想象的或者组合的词。例如, 在上述示例中,方法200可向词"Joe Smith,,和"Happy Birthday"的搜 索消息中加入词"elephant"、 "giraffe"和"dinosaur,,。
在一个实施例中,被加入搜索消息的诱何词被预先定义。例如, 用户可指定向每个搜索消息自动添加固定数量的诱饵词,或者被添加 到诱饰词包含原始搜索消息内的词或字符的总数的固定百分比。在另 一个实施例中,被加入搜索消息的诱倂词的数量可基于用户以前发送 到搜索消息的长度(例如,可加入多个诱斜词,以便包含该诱斜词的 搜索消息的长度基本与以前的搜索消息的平均长度相当)。
在步骤208,方法200例如根据典型的P2P协议发送包含诱饰词 的搜索消息。方法200然后在步骤210内接收到响应于该搜索消息的 至少一个响应消息。在一个实施例中,方法200可指定在经过特定的
一段时间之后或者在已经接收到特定数量的响应消息之后停止接受 响应消息,以便防止响应消息被无限制地接收。
一旦方法200开始接收响应消息,则方法200前进到步骤212 并检查接收到的响应消息。特别地,方法200检查响应消息的内容。 在步骤214,方法200确定响应消息是否包含在步骤206内4皮加入搜 索消息的任何诱辨词。
如果响应消息包含足够的诱饰词(例如,如被预定准则指定的), 则方法200前进到步骤216并将该响应消息归类为垃圾消息。可选择 地,如果响应消息不包含足够的诱饼词,则方法200前进到步骤218 并将该响应消息归类为正常响应。在一个实施例中,如果响应消息至 少包括预定阈值个诱斜词或者如果诱饰词至少包含响应消息内的词 或字符的总数的预定阁值百分比数量的诱铒词,则响应消息包含"足 够多,,的诱铒词以使其被归类为垃圾信息。在一个实施例中,被归类 为垃圾信息的响应,皮丢弃。
本领域的技术人员应理解,响应消息被归类为垃圾信息或正常响 应并不是绝对的。即,基于预定准则被识别为是垃圾信息的偶然响应 消息实际上可能是正常响应。同样,偶然垃圾消息包含的诱饵词可能 不足以使其被基于预定准则识别为垃圾信息。因此,用户可调节预定 准则以调整方法200的灵敏度。此外,在一个实施例中,方法200可 将归类结果(例如,从步骤216到218)作为视觉显示呈现为用户, 其中视觉显示代表方法200对接收到的响应消息的初次过滤,并且用 户可检测初次过滤结果以便验证被接收到的响应消息的正确归类(例 如,以与许多商业电子邮件供应商对电子邮件进行过滤的方式类似的 方式)。例如,方法200可在用户的显示器上在单独窗口或窗格内显 示"垃圾信息"和"非垃圾信息,,响应消息,或者可将响应消息标记为 "垃圾消息"或"非垃圾消息"(例如,使用一个或多个图标)。
一旦方法200已经将接收到的响应消息归类为垃圾信息或正常 响应(例如,在步骤216或218内),则方法200转到步骤220并确 定是否还存在任何未被检查的响应消息。如果方法200确定存在至少 一个未4皮检查的响应消息,则方法200返回步骤212,并且如上所述 地检查和归类下一个响应消息。可选择地,如果方法200确定不存在 未^皮检查的响应消息,则方法200在步骤222结束。
因此,方法200使P2P网络上的用户能够迅速识别网络上的垃 圾信息发送者。通过在用户的搜索消息内插入任意的诱斜词,方法200 能够清除来自基本上响应于它们接收到任何消息的节点——这是垃 圾信息发送者采取的典型方法——的响应消息。此外,通过在下载数 据之前识别垃圾信息发送者,用户不仅可避免下载垃圾信息,而且还 可避免将该垃圾信息与随后从该用户下载数据的其他用户共享。另 外,如果用户直接连接到垃圾信息发送者,则用户可基于经由方法200 的应用收集的信息管理与垃圾信息发送者的连接,从而可隔离垃圾信 息发送者并防止他或她分配任何垃圾信息。类似的,用户可仅确定在 预定的一段时间内忽略垃圾信息发送者发送的任何消息。例如,在一 个实施例中,方法200可将垃圾信息发送者的网络标识符(例如,IP 地址)加入已知垃圾信息发送者节点的列表内,从该列表上的节点接 收的所有消息都将被忽略预定的一段时间。
图3是示出才艮据本发明的用于减少P2P网络上的垃圾信息的方 法300的第二实施例的流程图。即,方法300适合于其中搜索消息被 认为是逻辑"与,,(例如,只有匹配搜索消息内的所有关键词的数据才 会生成搜索响应)的数据传送网络。方法300将例如在P2P网络中的 节点处实现。
方法300在步骤302初始化并前进到步骤304,在该处方法300 仅使用诱饰词构建搜索消息。类似于方法200内使用的诱饵词,步骤 304内的用于构建搜索消息的诱斜词包括例如选自词典的任意的、互 不相关的自然词。因此,例如,步骤304内构建的搜索消息可包含 "elephant" , "orange,,和"hockey,,。
在步骤306中,方法300例如根据典型的P2P协议发送搜索消 息。方法300然后在步骤308接收响应于该搜索消息的至少一个响应 消息。在一个实施例中,方法300可指定在经过特定的一段时间之后 或者在已经接收到特定数量的响应消息之后停止接受响应消息,以便 防止响应消息被无限制地接收。
一旦方法300开始接收响应消息,则方法300前进到步骤312 并检查接收到的响应消息。特别地,方法300检查响应消息的内容以 确定响应消息的发送者(例如,如用与该响应消息相关联的IP.地址 识别的)。
在步骤312中,方法300将响应消息的发送者归类为垃圾信息发 送者(即,被认为发送垃圾消息的节点)。方法300然后决定在预定 的一段时间内忽略从该发送者发出的所有消息。在一个实施例中,方 法300将发送者的网络标识符(例如,IP地址)加入已知垃圾信息发 送者节点的列表内,从该列表上的节点接收的所有消息都将被忽略预 定的一段时间。
如果方法300已经将接收到的响应消息的发送者归类为垃圾信 息发送者,方法300前进到步骤314确定是否还存在任何未被检查的 响应消息。如果方法300确定存在至少一个未被检查的响应消息,则 方法300返回步骤310,并且如上所述地检查和归类下一个响应消息 的发送者。可选择地,如果方法300确定不存在未被检查的响应消息, 则方法300在步骤316结束。
图4是使用通用计算设备400实现的垃圾信息减少方法的高层框 图。在一个实施例中,通用计算设备400包括处理器402,存储器404, 垃圾信息减少模块405,和各种输入/输出(I/O)设备406例如显示 器、键盘、鼠标、调制解调器等。在一个实施例中,该至少一个I/O 设备是存储设备(例如磁盘驱动器,光盘驱动器,软盘驱动器)。应 理解,垃圾信息减少模块405可被实现为通过通信信道耦合到处理器 的物理设备或子系统。
可选择地,垃圾信息减少模块405可用一个或多个软件应用(或
者软件和硬件的组合,例如使用专用集成电路)表示,其中该软件被
从存储介质(例如,I/O设备406)装载在通用计算设备400的存储 器404内,并且被处理402操作。因此,在一个实施例中,文中参照 前面的
的用于减少P2P网络的垃圾信息减少模块405可被存 储在计算机可读介质或载体(例如RAM,磁或光驱动器或磁盘等) 上。
因此,本发明表现了数据传送网络领域内的重大改进。提供了一 种这样的方法和系统,即其使用户能够在下载相关数据之前识别响应 于搜索消息被发送的隐蔽垃圾信息,从而用户不会下载该垃圾信息且 不会随后与其他用户共享该垃圾信息。因此,可大大减少垃圾信息通 过网络扩散。
尽管前文涉及本发明的优选实施例,但是可想到本发明的其它以 及另外的实施例而不会背离本发明的基本范围,并且本发明的范围由 下文的权利要求确定。
权利要求
1.一种用于减少网络内的垃圾信息的方法,所述方法包括形成包含至少一个诱饵词的搜索消息;并且将所述搜索请求消息发送给所述网络内的一个或多个节点。
2. 根据权利要求1的方法,其中所述至少一个诱饰词是任意选 择的自然词。
3. 根据权利要求l的方法,其中所述至少一个诱斜词是组合词。
4. 根据权利要求l的方法,其中所迷至少一个诱何词与所述搜 索消息内包含的至少一个搜索关键词无关。
5. 根据权利要求1的方法,其中所述形成步骤包括 从用户接收搜索消息;以及将所述至少 一 个诱铒词加入所述搜索消息。
6. 根据权利要求5的方法,其中所述至少一个诱饵词包括所述 被接收到的搜索消息内包含的词或字符的总数的预定义百分比数量 的i秀铒词。
7. 根据权利要求1的方法,其中所述至少一个诱饵词包含预定 义的固定数量的诱饼词。
8. 根据权利要求l的方法,其中所述至少一个诱铒词包括某个 数量的诱饵词,所述数量基于用户发送的一个或多个先前的搜索消 息。
9. 根据权利要求l的方法,其中该方法还包括 接收响应于所述搜索消息的至少一个响应消息;以及 确定所述至少一个响应消息是否包含足够的诱铒词以使其被归类为垃圾信息。
10. 根据权利要求9的方法,其中如果所述至少一个响应消息内 的匹配于所述至少一个诱饼词的词的数量等于或超过预定义阈值,则 所述至少 一个响应消息包含足够多的诱饵词以使其被归类为垃圾信
11. 根据权利要求9的方法,其中如果所述响应消息内的词或字 符的总数的至少预定义阈值百分比匹配于所述至少一个诱斜词,则所 述至少一个响应消息包含足够多的诱饰词以使其被归类为垃圾信息。
12. 根据权利要求9的方法,其中该方法还包括 向用户标识出^皮归类为垃圾信息的响应消息和^皮归类为正常响应的响应消息。
13. 根据权利要求12的方法,其中所述标识是通过在所述用户 显示器上的单独窗口内显示所述垃圾信息消息和所述正常响应实现 的。
14. 根据权利要求12的方法,其中所述标识是通过用不同图标 标记所述垃圾信息消息和所述正常响应实现的。
15. 根据权利要求9的方法,其中如果所述至少一个响应消息被 归类为垃圾信息,则所述至少一个响应消息被丢弃。
16. 根据权利要求1的方法,其中所述形成步骤包括 仅用所述至少 一个诱斜词构建所述搜索消息。
17. 根据权利要求1的方法,其中该方法还包括 接收响应于所述搜索消息的至少一个响应消息;以及 将所述至少 一个响应消息的发送者归类为垃圾信息发送者。
18. 根据权利要求17的方法,其中所述归类步骤包括 将所述发送者加入已知垃圾信息发送者的列表。
19. 根据权利要求17的方法,其中所述归类步骤包括 将所述发送者随后发送的消息忽略预定义的一段时间。
20. —种包含用于减少网络内的垃圾信息的可执行程序的计算 机可读介质,其中该程序执行以下步骤形成包含至少一个诱斜词的搜索消息;并且 将所述搜索请求消息发送给所述网络内的一个或多个节点。
21. 根据权利要求20的计算机可读介质,其中所述至少一个诱 饰词是任意选择的自然词。
22. 根据权利要求20的计算机可读介质,其中所述至少一个诱斜词是组合词。
23. 根据权利要求20的计算机可读介质,其中所述至少一个诱 饰词与所述搜索消息内包含的搜索关键词无关。
24. 根据权利要求20的计算机可读介质,其中所述形成步骤包括从用户接收搜索消息;以及 将所述至少一个诱辨词加入所述搜索消息。
25. 根据权利要求24的计算机可读介质,其中所述至少一个诱 斜词包括所述被接收到的搜索消息内包含的词或字符的总数的预定 百分比数量的诱铒词。
26. 根据权利要求20的计算机可读介质,其中所述至少一个诱 铒词包含预定义的固定数量的诱饼词。
27. 根据权利要求20的计算机可读介质,其中所述至少一个诱 倂词包括某个数量的诱饵词,所述数量基于用户发送的一个或多个先 前的搜索消息。
28. 根据权利要求20的计算机可读介质,该程序执行的步骤还包括接收响应于所述搜索消息的至少一个响应消息;以及 确定所述至少 一个响应消息是否包含足够多的诱饵词以使其被 归类为垃圾信息。
29. 根据权利要求28的计算机可读介质,其中如果所述至少一 个响应消息内的匹配于所述至少一个诱饰词的词的数量等于或超过 预定义阈值,则所述至少一个响应消息包含足够多的诱饰词以使其被 归类为垃圾信息。
30. 根据权利要求28的计算机可读介质,其中如果所述响应消 息内的词或字符的总数的至少预定义阁值百分比匹配于所述至少一 个诱伴词,则所述至少一个响应消息包含足够多的诱仵词以使其被归 类为垃圾信息。
31. 根据权利要求28的计算机可读介质,该程序执行的步骤还包括向用户标识出#皮归类为垃圾信息的响应消息和#皮归类为正常响 应的响应消息。
32. 根据权利要求20的计算机可读介质,其中所述形成步骤包括仅用所述至少 一个诱辨词构建所述搜索消息。
33. 根据权利要求20的计算机可读介质,其中该程序执行的步 骤还包括接收响应于所述搜索消息的至少一个响应消息;以及 将所述至少一个响应消息的发送者归类为垃圾信息发送者。
34. 根据权利要求33的计算机可读介质,其中所述归类步骤包括将所述发送者加入已知垃圾信息发送者的列表。
35. —种用于减少网络内的垃圾信息的装置,所述装置包括 用于形成包含至少一个诱饵词的搜索消息的部件;以及 用于将所述搜索请求消息发送到所述网络内的一个或多个节点的部件。
全文摘要
本发明的用于减少对等网络内的垃圾信息的方法和装置的一个实施例包括形成包含至少一个诱饵词的搜索消息,并将包含该诱饵词的搜索请求消息发送给网络内的一个或多个节点。本发明的实施例使得可清除网络内的响应于每个搜索消息(例如,不管搜索消息的内容如何)发送垃圾信息的节点。
文档编号G06F15/163GK101341477SQ200680016799
公开日2009年1月7日 申请日期2006年6月15日 优先权日2005年6月15日
发明者戴维·乔治, 杰森·D.·拉沃伊, 雷蒙德·B.·詹宁斯三世 申请人:国际商业机器公司