电子邮件过滤方法和系统的制作方法
【专利摘要】本发明公开了一种电子邮件过滤方法和系统,所述方法包括:电子邮件过滤系统接收到电子邮件后,若根据其中解析出的发送者和接收者的邮件地址,判定发送者和接收者之间存在邮件往来关系,则查找与接收者的邮件地址相对应的、记录有接收者的密切通信人的邮件地址的密切通信人表,若其中记录有发送者的邮件地址,则将电子邮件直接投递到接收者的收件箱中;其中,接收者的密切通信人是根据预先统计的与接收者存在邮件往来关系的各用户与接收者间通信的密切程度数据确定出来的。由于电子邮件的发送者为接收者的密切通信人时,将电子邮件直接投递到接收者的收件箱中,不进行其他过滤处理,从而降低了资源开销,降低了电子邮件被误判为垃圾邮件的可能性。
【专利说明】电子邮件过滤方法和系统
【技术领域】
[0001]本发明涉及互联网领域,尤其涉及一种电子邮件过滤方法和系统。
【背景技术】
[0002]垃圾邮件是指由“垃圾邮件发送者”未经接收者许可就强行发送到接收者邮箱中的电子邮件。接收者通常需要花费大量的时间来删除这些不需要的垃圾邮件,而且电子邮件服务提供商需要提供资源来分发和/或存储这些垃圾邮件。甚至,有些垃圾邮件还携带有恶意文件,这些恶意文件在激活后可破坏计算机系统或者盗取重要信息。因此,通常需要对发送者发送的电子邮件进行过滤处理,在确定电子邮件为垃圾邮件后,对垃圾邮件进行拦截或移到垃圾文件夹。然而,对电子邮件进行过滤处理的算法运行越多,电子邮件被误判为垃圾邮件的可能性就越大,而且会占用大量的CPU资源。
[0003]为减少资源开销同时降低电子邮件被误判的可能性,现有的一种方法是利用发送者和接收者先前的邮件往来关系和发送者的名誉数据相结合,对电子邮件进行过滤处理。其中,发送者和接收者之间的邮件往来关系可以是直接邮件往来关系,例如图1所示的邮件关系网络中B与C的关系(B向C发送过电子邮件,C也向B发送过电子邮件),也可以是间接邮件往来关系,例如图1所示的B与E的关系(B和E经由共同第三方C而产生的邮件往来关系)。具体地,现有技术的电子邮件过滤方法的流程如图2所示,包括如下步骤:
[0004]S201:电子邮件过滤系统接收到电子邮件后,提取发送者的IP和邮件地址、以及接收者的邮件地址,并确定发送者的IP与电子邮件域是否有对应关系。若是,则执行步骤S202 ;否则,跳转到步骤S210。
[0005]通常,电子邮件系统可以预先记录可信任发送者的IP地址与电子邮件域的对应关系。基于此,可确定出发送者的IP与电子邮件域是否有对应关系。
[0006]S202:电子邮件过滤系统检查发送者与接收者之间是否存在直接邮件往来关系。若是,则执行步骤S204 ;否则,执行步骤S203。
[0007]具体地,若确定发送者的IP与电子邮件域有对应关系,则检查发送者与接收者之间是否存在邮件往来关系。首先,在本步骤S202中检查发送者与接收者之间是否存在直接邮件往来关系;若不存在,则进一步在步骤S203中检查发送者与接收者之间是否存在间接邮件往来关系。
[0008]S203:检测发送者与接收者之间是否存在间接邮件往来关系。若是,则执行步骤S204 ;否则,执行步骤S210。
[0009]S204:基于邮件往来关系和发送者的名誉数据设置过滤级别。
[0010]其中,邮件往来关系表示发送者和接收者之前进行过相互通信,也就是互相发送过电子邮件。名誉数据可以是名誉分数,用于表示用户发送的电子邮件是垃圾邮件的可能性;例如,用户的名誉分数越低,则名誉越差,其发送的电子邮件是垃圾邮件的可能性就越大。
[0011]S210:将过滤级别设置为较高的过滤级别。[0012]电子邮件过滤系统在设置电子邮件的过滤级别后,使用基于过滤级别选择的过滤器来处理电子邮件。
[0013]例如,如图1所示的邮件关系网络中,有A、B、C、D、E、F、G七个用户。当G向C发送邮件时,由于G和C之间不存在邮件往来关系,因此G向C发送的邮件会进入较高级别的过滤器进行过滤处理。当B向C发送邮件时,虽然B和C之间存在邮件往来关系,但是由于B的名誉不好,因此B向C发送的邮件也会进入较高级别的过滤器进行过滤处理。当E向C发送电子邮件时,由于E和C之间存在邮件往来关系,且E的名誉较好,因此E向C发送的邮件会进入较低级别的过滤器进行过滤处理。
[0014]上述的电子邮件过滤方法基于邮件关系网络和发送者的名誉数据进行过滤级别的设置,且由其中的逻辑顺序可以看出,用户的邮件关系网络为第一级判定层,用户的名誉数据为第二级判定层。然而,目前大多数邮件服务提供商都提供了电子邮件的自动回复功能。大部分的用户在接收到垃圾邮件后都会与垃圾邮件发送者建立邮件往来关系。这样,现有的电子邮件过滤方法中,用户的邮件关系网络在进行电子邮件过滤时不具有决定性作用,只能作为辅助判定层,而名誉数据便成为关键判定层。这在很多应用场景下会造成电子邮件的误判。
[0015]例如,用户H从事LED电子灯制造业务,用户H采用电子邮件营销方式扩展业务,发送了大量携带有电子灯信息的电子邮件。对于不需要电子灯的接收者来说这就是垃圾邮件,并可能导致用户H的名誉不好。对于那些需要电子灯的接收者来说,用户H发送的电子邮件就是有用信息。若用户H和接收者I之间就购买LED电子灯的订单已有过多次邮件往来。但是,若H的名誉不好,则会导致H向I发送的邮件仍然会进入过滤级别较高的过滤器进行判定,甚至会将H向I发送的邮件判定为垃圾邮件,从而导致电子邮件被误判为垃圾邮件的可能性仍然较高,也造成了 H和I之间正常通信的障碍,有可能会遭到I的投诉。
[0016]因此,有必要提供一种资源开销不高,且可以降低电子邮件被误判为垃圾邮件的可能性的电子邮件过滤方法。
【发明内容】
[0017]针对上述现有技术存在的缺陷,本发明提供了一种电子邮件过滤方法和系统,用以降低过滤垃圾邮件的资源开销,降低电子邮件被误判为垃圾邮件的可能性。
[0018]根据本发明的一个方面,提供了一种电子邮件过滤方法,包括:
[0019]电子邮件过滤系统接收到电子邮件后,若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间存在邮件往来关系,则:
[0020]查找与所述接收者的邮件地址相对应的、记录有所述接收者的密切通信人的邮件地址的密切通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件直接投递到所述接收者的收件箱中;
[0021]其中,所述接收者的密切通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的密切程度数据确定出来的,所述密切程度数据包括如下数据中的至少一种:邮件会话次数、通信频率、通信间隔以及各次独立会话内容主题离散度。
[0022]较佳地,在所述判定所述发送者和所述接收者之间存在邮件往来关系后,还包括:
[0023]查找与所述接收者的邮箱地址相对应的、记录有所述接收者的疑似垃圾通信人的邮件地址的疑似垃圾通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件投递到所述接收者的垃圾邮件箱中;
[0024]若所述密切通信人表和所述疑似垃圾通信人表中均未记录有所述发送者的邮件地址,则对所述电子邮件进行第一过滤级别的过滤处理;
[0025]其中,所述接收者的疑似垃圾通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的离散程度数据确定出来的,所述离散程度数据包括如下数据中的至少一种:邮件被举报的次数、未阅读直接被删除的次数、未被回复的次数。
[0026]较佳地,在所述接收到电子邮件后,还包括:
[0027]若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间不存在邮件往来关系,则对所述电子邮件进行第二过滤级别的过滤处理,所述第二过滤级别高于第一过滤级别。
[0028]其中,所述密切通信人表中的所述接收者的密切通信人是周期性更新的:
[0029]在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的密切程度数据,对该用户与所述接收者之间的密切程度进行评定,得到该用户的密切程度评分;
[0030]将评定得到的各用户的密切程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的各用户中选取m个用户作为所述接收者的密切通信人后,根据此次确定的密切通信人更新与所述接收者的邮箱地址相对应的密切通信人表;其中,m为正整数。
[0031]其中,所述疑似垃圾通信人表中的所述接收者的疑似垃圾通信人是周期性更新的:
[0032]在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的离散程度数据,对该用户与所述接收者之间的离散程度进行评定,得到该用户的离散程度评分;
[0033]将评定得到的各用户的离散程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的各用户中选取η个用户作为所述接收者的疑似垃圾通信人后,根据此次确定的疑似垃圾通信人更新与所述接收者相对应的疑似垃圾通信人表;其中,η为正整数。
[0034]较佳地,所述根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间存在邮件往来关系,具体包括:
[0035]查找邮件往来关系表,若其中记录有所述发送者的邮件地址和所述接收者的邮件地址的对应关系,则判定所述发送者和所述接收者之间存在邮件往来关系。
[0036]较佳地,所述对所述电子邮件进行第一过滤级别的过滤处理具体为:采用对邮件标题进行过滤处理的过滤算法对所述电子邮件进行过滤处理;以及
[0037]所述对所述电子邮件进行第二过滤级别的过滤处理具体为:
[0038]采用对邮件标题和邮件内容进行过滤处理的过滤算法对所述电子邮件进行过滤处理。
[0039]根据本发明的另一个方面,还提供了一种电子邮件过滤系统,包括:
[0040]邮件往来关系确定模块,用于接收到电子邮件后,若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间存在邮件往来关系,则发送存在邮件往来关系通知;
[0041]邮件处理模块,用于接收到所述存在邮件往来关系通知后,查找与所述接收者的邮件地址相对应的、记录有所述接收者的密切通信人的邮件地址的密切通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件直接投递到所述接收者的收件箱中;
[0042]其中,所述接收者的密切通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的密切程度数据确定出来的,所述密切程度数据包括如下数据中的至少一种:邮件会话次数、通信频率、通信间隔以及各次独立会话内容主题离散度。
[0043]进一步,所述邮件往来关系确定模块还用于若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间不存在邮件往来关系,则发送不存在邮件往来关系通知;以及
[0044]所述邮件处理模块还用于接收到所述存在邮件往来关系通知后,查找与所述接收者的邮箱地址相对应的、记录有所述接收者的疑似垃圾通信人的邮件地址的疑似垃圾通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件投递到所述接收者的垃圾邮件箱中;若所述密切通信人表和所述疑似垃圾通信人表中均未记录有所述发送者的邮件地址,则对所述电子邮件进行第一过滤级别的过滤处理;以及接收到所述不存在邮件往来关系通知后,对所述电子邮件进行第二过滤级别的过滤处理,所述第二过滤级别高于第一过滤级别;
[0045]其中,所述接收者的疑似垃圾通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的离散程度数据确定出来的,所述离散程度数据包括如下数据中的至少一种:邮件被举报的次数、未阅读直接被删除的次数、未被回复的次数。
[0046]进一步,所述电子邮件过滤系统,还包括:
[0047]通信关系评定模块,用于周期性更新所述密切通信人表中的所述接收者的密切通信人:在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的密切程度数据,对该用户与所述接收者之间的密切程度进行评定,得到该用户的密切程度评分;之后,将评定得到的各用户的密切程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的每个用户中选取m个用户作为所述接收者的密切通信人后,根据此次确定的密切通信人更新与所述接收者的邮箱地址相对应的密切通信人表;以及所述通信关系评定模块还周期性更新所述疑似垃圾通信人表中的所述接收者的疑似垃圾通信人:在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的离散程度数据,对该用户与所述接收者之间的离散程度进行评定,得到该用户的离散程度评分;之后,将评定得到的各用户的离散程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的每个用户中选取η个用户作为所述接收者的疑似垃圾通信人后,根据此次确定的疑似垃圾通信人更新与所述接收者相对应的疑似垃圾通信人表;其中,m为正整数;n为正整数。
[0048]本发明的技术方案中,电子邮件过滤系统接收到电子邮件后,根据该电子邮件的发送者的邮件地址和该电子邮件的接收者的邮件地址,判定出该电子邮件的发送者和该电子邮件的接收者之间存在邮件往来关系后,若进一步确定出与该电子邮件的接收者的邮件地址相对应的密切通信人表中记录有该电子邮件的发送者的邮件地址,则直接将该电子邮件投递到该电子邮件的接收者的收件箱中。这样,针对任一用户,电子邮件过滤系统对该用户的密切通信人向该用户发送的电子邮件不采用任何过滤算法进行过滤处理,而直接将该电子邮件投递到该用户的收件箱中,这种方式降低了系统进行垃圾邮件过滤的资源开销,提高了处理效率,并降低了电子邮件被误判为垃圾邮件的可能性。
[0049]而且,本发明在判定出该电子邮件的发送者和该电子邮件的接收者之间存在邮件往来关系后,若进一步确定出与该电子邮件的接收者的邮件地址相对应的疑似垃圾通信人表中记录有该电子邮件的发送者的邮件地址,则直接将该电子邮件投递到该电子邮件的接收者的垃圾邮件箱中,也没有采用任何过滤算法,进一步降低了进行垃圾邮件过滤的资源开销。
【专利附图】
【附图说明】
[0050]图1为用户的邮件关系网络的示意图;
[0051]图2为现有技术的电子邮件过滤方法的流程图;
[0052]图3为本发明实施例的更新用户的密切通信人表和疑似垃圾通信人表的方法的流程图;
[0053]图4为本发明实施例的电子邮件过滤方法的流程图;
[0054]图5为本发明实施例的电子邮件过滤系统的内部结构框图。
【具体实施方式】
[0055]以下将结合附图对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
[0056]本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内,一个模块也可以位于一台计算机上和/或分布于两台或更多台计算机之间。
[0057]本发明的发明人发现,现有技术对使用电子邮件的用户进行名誉打分时,采用统一的标准,也就是说同一个发送者对不同的接收者的名誉数据是相同的。这样,同一个发送者向与其存在邮件往来关系的不同的接收者发送电子邮件时,电子邮件系统均采用相同的过滤级别进行处理。若发送者的名誉较好,则其向与其存在邮件往来关系的接收者发送的电子邮件都可以采用较低的过滤级别;相反,若发送者的名誉不好,则其向与其存在邮件往来关系的接收者发送的电子邮件都需要采用较高的过滤级别。
[0058]基于上述分析,本发明的技术方案中,根据预先统计的邮件关系网络中各用户之间互相通信的密切程度数据,确定每个用户的密切通信人并记录到密切通信人表中。电子邮件过滤系统接收到电子邮件后,从中解析出发送者和接收者的邮件地址,若判定解析出的发送者和接收者之间存在邮件往来关系,则进一步判断与解析出的接收者的邮件地址相对应的、记录有该接收者的密切通信人的邮件地址的密切通信人表中是否记录有解析出的发送者的邮件地址;若是,则将接收的电子邮件直接投递到解析出的接收者的收件箱中。因此,针对每个用户分别建立密切通信人表,采用用户间的密切程度作为判定依据,可以避免对同一个发送者发送的电子邮件均采用相同的过滤级别,从而,降低了垃圾邮件过滤的资源开销,降低电子邮件被误判为垃圾邮件的可能性。
[0059]下面结合附图详细说明本发明的技术方案。
[0060]本发明实施例中,可以根据预先统计的邮件关系网络中各用户间通信的密切程度数据和离散程度数据,周期性更新每个用户的密切通信人表和疑似垃圾通信人表。具体地,对于邮件关系网络中的任一个用户UserX,周期性更新用户UserX的密切通信人表和疑似垃圾通信人表的方法的流程,如图3所示,包括如下步骤:
[0061]S301:在每个评定周期到达时,针对与用户UserX存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与用户UserX间通信的关系疏密数据,得到该用户与用户UserX的密切程度评分和离散程度评分。
[0062]具体地,关系疏密数据可以包括密切程度数据和离散程度数据。密切程度数据可以包括如下数据中的至少一种:用户间通信的邮件会话次数、通信频率、通信间隔以及各次独立会话内容主题离散度等指标数据。离散程度数据可以包括如下数据中的至少一种:用户间通信的邮件被举报的次数、未阅读直接被删除的次数、未被回复的次数等指标数据。
[0063]在本步骤中,针对与用户UserX存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与UserX间通信的密切程度数据,对该用户与UserX的密切程度进行评定,得到该用户的密切程度评分,具体可以为:
[0064]分别 将本次评定周期内统计的该用户与UserX间通信的邮件会话次数、通信频率、通信间隔以及各次独立会话内容主题离散度作为参数,传入如公式I所示的密切程度评定函数中,密切程度评定函数根据传入的参数进行计算,计算得到的结果即为该用户与UserX的密切程度评分。
[0065]f (X,y, z, k) =w0x+w1y+w2z+w3k (公式 I)
[0066]其中,X为邮件会话次数,y为通信频率,z为通信间隔,k为各次独立会话内容主题离散度;》(!、W1, W2> W3分别为邮件会话次数、通信频率、通信间隔、各次独立会话内容主题离散度的权重,具体由本领域技术人员根据需要进行设定。
[0067]在每个评定周期内统计的该用户与用户UserX间通信的密切程度数据,反映了在本次评定周期内该用户与用户UserX间通信的密切程度。例如,本次评定周期内统计的用户Y与UserX的邮件会话次数较多、通信频率较高、通信间隔较小以及各次独立会话内容主题离散度较小,则用户Y与用户UserX的密切程度较高,用户Y与用户UserX的密切程度评分较高。密切程度评分越高,说明两者之间通信的密切程度越高。
[0068]在本步骤中,还针对与用户UserX存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与UserX间通信的离散程度数据,对该用户与UserX的离散程度进行评定,得到该用户的 离散程度评分,具体可以为:
[0069]分别将本次评定周期内统计的该用户向用户UserX发送的邮件被举报的次数、未阅读直接被删除的次数、未被回复的次数作为参数,传入如公式2所示的离散程度评定函数中,离散程度评定函数根据传入的参数进行计算,计算得到的结果即为该用户与UserX的离散程度评分。
[0070]f (r, S,O=UtlHU1S+!^ (公式 2)
[0071]其中,r为邮件被举报的次数,s为未阅读直接被删除的次数,t为未被回复的次数;Utl、U1、U2分别为邮件被举报的次数、未阅读直接被删除的次数、未被回复的次数的权重,具体由本领域技术人员根据需要进行设定。
[0072]在每个评定周期内统计的该用户与用户UserX间通信的离散程度数据,反映了在本次评定周期内该用户与用户UserX间通信的离散程度。例如,本次评定周期内统计的用户Y向用户UserX发送的邮件被举报的次数较多、未阅读直接被删除的次数较多、未被回复的次数较多,则用户Y与用户UserX的离散程度较高,用户Y与用户UserX的离散程度评分较高。离散程度评分越高,说明两者之间通信的离散程度越高。
[0073]这样,基于用户间通信的关系疏密数据,可以得到与用户UserX存在邮件往来关系的各用户的密切程度评分和离散程度评分。
[0074]S302:根据得到的与用户UserX存在邮件往来关系的各用户的密切程度评分和离散程度评分,确定用户UserX的密切通信人和疑似垃圾通信人。
[0075]具体地,将评定得到的与用户UserX存在邮件往来关系的各用户的密切程度评分进行排序,根据排序结果从与用户UserX存在邮件往来关系的各用户中选取m个用户作为用户UserX的密切通信人后,根据此次确定的密切通信人更新与用户UserX的邮箱地址相对应的密切通信人表。例如,可将评分由大到小排序,将排序靠前的m个用户作为用户UserX的密切通信人。或者,选取与用户UserX存在邮件往来关系的各用户中密切程度评分大于第一设定阈值的用户作为用·户UserX的密切通信人。
[0076]而且,将评定得到的与用户UserX存在邮件往来关系的各用户的离散程度评分进行排序,根据排序结果从与用户UserX存在邮件往来关系的每个用户中选取η个用户作为用户UserX的疑似垃圾通信人后,根据此次确定的疑似垃圾通信人更新与用户UserX相对应的疑似垃圾通信人表。例如,将评分由大到小排序,将排序靠前的η个用户作为用户UserX的疑似垃圾通信人。或者,选取与用户UserX存在邮件往来关系的各用户中离散程度评分大于第二设定阈值的用户作为用户UserX的疑似垃圾通信人。
[0077]其中,m、η为正整数,且m与η可以相同也可以不同;m、η、第一设定阈值和第二设定阈值均由本领域技术人员根据实际情况进行设定。
[0078]这样,基于上述的方法,电子邮件过滤系统接收到的电子邮件后,可根据预先确定的该电子邮件的接收者的密切通信人和疑似垃圾通信人,对接收的电子邮件进行过滤处理。具体地,本发明实施例提供的电子邮件过滤方法的流程,如图4所示,具体包括如下步骤:
[0079]S401:电子邮件过滤系统接收到电子邮件后,从中解析出发送者的IP地址和邮件地址、以及接收者的邮件地址。
[0080]具体地,电子邮件过滤系统接收到电子邮件后,可从接收的电子邮件中解析出该电子邮件的发送者的IP地址和邮件地址,以及该电子邮件的发送者的邮件地址。
[0081]S402:电子邮件过滤系统查找IP黑名单、IP白名单中是否记录有接收的电子邮件的发送者的IP地址;若是,则不对该电子邮件进行其他判定,直接对该电子邮件进行处理;否则,执行步骤S403。
[0082]具体地,电子邮件过滤系统查找IP黑名单、IP白名单中是否记录有解析出的电子邮件的发送者的IP地址。若IP黑名单中记录有该IP地址,则表明需要拦截该电子邮件,不再对该电子邮件进行其他判定,直接将该电子邮件删除。若IP地址白名单中记录有该IP地址,则表明该IP地址发送的电子邮件为可信任的电子邮件,不对电子邮件进行其他判定,直接将该电子邮件投递到接收者的收件箱中。其中,IP黑名单中的IP地址可以是之前判定出的垃圾邮件发送者的IP地址;IP白名单中的IP地址可以是之前已确定出的可信任发送者的IP地址。
[0083]S403:电子邮件过滤系统根据解析出的发送者和接收者的邮件地址,判断解析出的发送者和接收者之间是否存在邮件往来关系;若是,则执行步骤S404 ;否则,跳转到步骤S410。
[0084]具体地,电子邮件过滤系统可以预先根据用户关系网络中各用户间通信的关系,将互相发送过电子邮件的用户的邮件地址的对应关系存储到邮件往来关系表中。在本步骤中,电子邮件过滤系统查找邮件往来关系表中是否记录有解析出的电子邮件的发送者的邮件地址和该电子邮件的接收者的邮件地址的对应关系,若是,则判定该电子邮件的发送者和该电子邮件的接收者之间存在邮件往来关系,否则,判定该电子邮件的发送者和该电子邮件的接收者之间不存在邮件往来关系。
[0085]S404:电子邮件过滤系统根据解析出的发送者和接收者的邮件地址,判断解析出的发送者与接收者之间的通信关系;若解析出的发送者为接收者的密切通信人,则执行步骤S420 ;若解析出的发送者为接收者的疑似垃圾通信人,则执行步骤S430 ;若解析出的发送者既不是接收者的密切通信人也不是接收者的疑似垃圾通信人,则执行步骤S440。
[0086]具体地,电子邮件过滤系统对于接收的电子邮件,查找与该电子邮件的接收者的邮件地址相对应的、记录有该电子邮件的接收者的密切通信人的邮件地址的密切通信人表,若其中记录有该电子邮件的发送者的邮件地址,则判定该电子邮件的发送者为该电子邮件的接收者的密切通信人。其中,该电子邮件的接收者的密切通信人是根据预先统计的与该电子邮件的接收者存在邮件往来关系的各用户与该电子邮件的接收者间通信的密切程度数据确定出来的,具体确定方法如图3所示。
[0087]而且,电子邮件过滤系统还查找与该电子邮件的接收者的邮件地址相对应的、记录有该电子邮件的接收者的疑似垃圾通信人的邮件地址的疑似垃圾通信人表,若其中记录有该电子邮件的发送者的邮件地址,则判定该电子邮件的发送者为该电子邮件的接收者的疑似垃圾通信人。其中,该电子邮件的接收者的疑似垃圾通信人是根据预先统计的与该电子邮件的接收者存在邮件往来关系的各用户与该电子邮件的接收者间通信的离散程度数据确定出来的,具体确定方法如图3所示。
[0088]此外,若与该电子邮件的接收者的邮件地址相对应的密切通信人表和疑似垃圾通信人表中均未记录有该电子邮件的发送者的邮件地址,则判定该电子邮件的发送者既不是该电子邮件的接收者的密切通信人也不是该电子邮件的接收者的疑似垃圾通信人。
[0089]S410:电子邮件过滤系统对接收的电子邮件进行第二过滤级别的过滤处理。
[0090]电子邮件过滤系统对于接收的电子邮件,若判定该电子邮件的发送者和该电子邮件的接收者之间不存在邮件往来关系,则对接收的电子邮件进行第二过滤级别的过滤处理,具体可以是采用对邮件标题和邮件内容进行过滤的过滤算法对电子邮件进行过滤处理,或者,还可以是使用电子邮件过滤系统所提供的所有垃圾邮件过滤算法对电子邮件进行过滤处理。
[0091]S420:电子邮件过滤系统将接收的电子邮件直接投递到该电子邮件的接收者的收件箱中。
[0092]若电子邮件过滤系统判定该电子邮件的发送者为该电子邮件的接收者的密切通信人,则不再对该电子邮件进行其他包含有垃圾邮件过滤算法的过滤处理,而直接将该电子邮件投递到该电子邮件的接收者的收件箱中。这样,针对任一用户,电子邮件系统对于该用户的密切通信人向该用户发送的电子邮件,均不采用任何过滤算法而直接投递到该用户的收件箱中,提高了处理效率,降低了过滤这些电子邮件的资源开销,并更好地避免这些电子邮件被误判为垃圾邮件,从而降低了这些电子邮件被误判为垃圾邮件的可能性。
[0093]S430:电子邮件过滤系统将接收的电子邮件投递到该电子邮件的接收者的垃圾邮件箱中。
[0094]若电子邮件过滤系统判定该电子邮件的发送者为该电子邮件的接收者的疑似垃圾通信人,则不再对该电子邮件进行其他包含有垃圾邮件过滤算法的过滤处理,而直接将该电子邮件投递到该电子邮件的接收者的垃圾邮件箱中。这样,针对任一用户,电子邮件系统对于该用户的疑似垃圾通信人向该用户发送的电子邮件,均不采用任何过滤算法而直接投递到该用户的垃圾邮件箱中,节省了对这些电子邮件进行过滤处理所产生的资源开销,也提高了处理效率。
[0095]S440 ;电子邮件过滤系统对接收的电子邮件进行第一过滤级别的过滤处理。
[0096]若电子邮件过滤系统判定该电子邮件的发送者既不是该电子邮件的接收者的密切通信人,也不是该电子邮件的接收者的疑似垃圾通信人,则对接收的电子邮件进行第一过滤级别的过滤处理,具体可以是采用对邮件标题进行过滤处理的过滤算法对接收的电子邮件进行过滤处理。其中,第二过滤级别高于第一过滤级别;也就是说,第一过滤级别涉及的过滤算法较少且较为简单,对电子邮件的较少方面(如邮件标题)进行过滤处理;而第二过滤级别涉及的过滤算法较多且较为复杂,对电子邮件的更多方面(如邮件标题、邮件内容等)进行过滤处理。
[0097]这样,若从事LED电子灯制造业务的用户H采用电子邮件营销方式扩展业务,发送大量携带有电子灯信息的电子邮件。此时,若用户H和接收者I之间就购买LED电子灯的订单已有过多次邮件往来,用户H和接收者I的密切程度较高,用户H存在于接收者I的密切通信人表中,则电子邮件过滤系统将用户H向接收者I发送的邮件直接投递到接收者I的收件箱中,即便是用户H的名誉不好,也不对用户H向接收者I发送的邮件使用较高的过滤级别,从而可以降低用户H向接收者I发送的电子邮件被误判为垃圾邮件的可能性,使得用户H和接收者I之间可以进行正常通信。
[0098]基于上述的电子邮件过滤方法,本发明实施例提供的电子邮件过滤系统的内部结构框图,如图5所示,具体包括:邮件往来关系确定模块501和邮件处理模块502。
[0099]邮件往来关系确定模块501用于接收到电子邮件后,若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间存在邮件往来关系,则向邮件处理模块502发送存在邮件往来关系通知。进一步,邮件往来关系确定模块501还用于接收到电子邮件后,若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间不存在邮件往来关系,则向邮件处理模块502发送不存在邮件往来关系通知。
[0100]邮件处理模块502用于接收到邮件往来关系确定模块501发送的存在邮件往来关系通知后,查找与所述接收者的邮件地址相对应的、记录有所述接收者的密切通信人的邮件地址的密切通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件直接投递到所述接收者的收件箱中。其中,所述接收者的密切通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的密切程度数据确定出来的,所述密切程度数据包括如下数据中的至少一种:邮件会话次数、通信频率、通信间隔以及各次独立会话内容主题离散度。
[0101]进一步,邮件处理模块502还用于接收到邮件往来关系确定模块501发送的存在邮件往来关系通知后,查找与所述接收者的邮箱地址相对应的、记录有所述接收者的疑似垃圾通信人的邮件地址的疑似垃圾通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件投递到所述接收者的垃圾邮件箱中;若所述密切通信人表和所述疑似垃圾通信人表中均未记录有所述发送者的邮件地址,则对所述电子邮件进行第一过滤级别的过滤处理。以及邮件处理模块502还用于接收到邮件往来关系确定模块501发送的不存在邮件往来关系通知后,对所述电子邮件进行第二过滤级别的过滤处理。其中,所述接收者的疑似垃圾通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的离散程度数据确定出来的,所述离散程度数据包括如下数据中的至少一种:邮件被举报的次数、未阅读直接被删除的次数、未被回复的次数。
[0102]上述的电子邮件过滤系统还可包括:通信关系评定模块503。
[0103]通信关系评定模块503用于周期性更新密切通信人表中的所述接收者的密切通信人:在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的密切程度数据,对该用户与所述接收者之间的密切程度进行评定,得到该用户的密切程度评分;之后,将评定得到的各用户的密切程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的每个用户中选取m个用户作为所述接收者的密切通信人后,根据此次确定的密切通信人更新与所述接收者的邮箱地址相对应的密切通信人表;其中,m为正整数。
[0104]进一步,通信关系评定模块503还用于周期性更新所述疑似垃圾通信人表中的所述接收者的疑似垃圾通信人:在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的离散程度数据,对该用户与所述接收者之间的离散程度进行评定,得到该用户的离散程度评分;之后,将评定得到的各用户的离散程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的每个用户中选取η个用户作为所述接收者的疑似垃圾通信人后,根据此次确定的疑似垃圾通信人更新与所述接收者相对应的疑似垃圾通信人表;其中,η为正整数。
[0105]综上所述,本发明的技术方案中,电子邮件过滤系统接收到电子邮件后,根据该电子邮件的发送者的邮件地址和该电子邮件的接收者的邮件地址,判定该电子邮件的发送者和该电子邮件的接收者之间存在邮件往来关系后,若进一步确定出与该电子邮件的接收者的邮件地址相对应的密切通信人表中记录有该电子邮件的发送者的邮件地址,则直接将该电子邮件投递到该电子邮件的接收者的收件箱中。这样,针对任一用户,电子邮件过滤系统对该用户的密切通信人向该用户发送的电子邮件不采用任何过滤算法进行过滤处理,而直接将该电子邮件投递到该用户的收件箱中,这种方式降低了系统进行垃圾邮件过滤的资源开销,提高了处理效率,并降低了电子邮件被误判为垃圾邮件的可能性。
[0106]而且,本发明在判定该电子邮件的发送者和该电子邮件的接收者之间存在邮件往来关系后,若进一步确定出与该电子邮件的接收者的邮件地址相对应的疑似垃圾通信人表中记录有该电子邮件的发送者的邮件地址,则直接将该电子邮件投递到该电子邮件的接收者的垃圾邮件箱中,也没有采用任何过滤算法,进一步降低了进行垃圾邮件过滤的资源开销。
[0107]以上所述仅是本发明的优选实施方式,应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【权利要求】
1.一种电子邮件过滤方法,其特征在于,包括: 接收到电子邮件后,若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间存在邮件往来关系,则: 查找与所述接收者的邮件地址相对应的、记录有所述接收者的密切通信人的邮件地址的密切通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件直接投递到所述接收者的收件箱中; 其中,所述接收者的密切通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的密切程度数据确定出来的,所述密切程度数据包括如下数据中的至少一种:邮件会话次数、通信频率、通信间隔以及各次独立会话内容主题离散度。
2.如权利要求1所述的方法,其特征在于,在所述判定所述发送者和所述接收者之间存在邮件往来关系后,还包括: 查找与所述接收者的邮箱地址相对应的、记录有所述接收者的疑似垃圾通信人的邮件地址的疑似垃圾通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件投递到所述接收者的垃圾邮件箱中; 若所述密切通信人表和所述疑似垃圾通信人表中均未记录有所述发送者的邮件地址,则对所述电子邮件进行第一过滤级别的过滤处理; 其中,所述接收者的疑似垃圾通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的离散程度数据确定出来的,所述离散程度数据包括如下数据中的至少一种:邮件被举报的次数、未阅读直接被删除的次数、未被回复的次数。
3.如权利要求2所述的方法,其特征在于,在所述接收到电子邮件后,还包括:` 若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间不存在邮件往来关系,则对所述电子邮件进行第二过滤级别的过滤处理,所述第二过滤级别高于第一过滤级别。
4.如权利要求1-3任一所述的方法,其特征在于,所述密切通信人表中的所述接收者的密切通信人是周期性更新的: 在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的密切程度数据,对该用户与所述接收者之间的密切程度进行评定,得到该用户的密切程度评分; 将评定得到的各用户的密切程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的各用户中选取m个用户作为所述接收者的密切通信人后,根据此次确定的密切通信人更新与所述接收者的邮箱地址相对应的密切通信人表;其中,m为正整数。
5.如权利要求2或3所述的方法,其特征在于,所述疑似垃圾通信人表中的所述接收者的疑似垃圾通信人是周期性更新的: 在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的离散程度数据,对该用户与所述接收者之间的离散程度进行评定,得到该用户的离散程度评分; 将评定得到的各用户的离散程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的各用户中选取η个用户作为所述接收者的疑似垃圾通信人后,根据此次确定的疑似垃圾通信人更新与所述接收者相对应的疑似垃圾通信人表;其中,η为正整数。
6.如权利要求1-3任一所述的方法,其特征在于,所述根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间存在邮件往来关系,具体包括: 查找邮件往来关系表,若其中记录有所述发送者的邮件地址和所述接收者的邮件地址的对应关系,则判定所述发送者和所述接收者之间存在邮件往来关系。
7.如权利要求3所述的方法,其特征在于,所述对所述电子邮件进行第一过滤级别的过滤处理具体为:采用对邮件标题进行过滤处理的过滤算法对所述电子邮件进行过滤处理;以及 所述对所述电子邮件进行第二过滤级别的过滤处理具体为: 采用对邮件标题和邮件内容进行过滤处理的过滤算法对所述电子邮件进行过滤处理。
8.一种电子邮件过滤系统,其特征在于,包括: 邮件往来关系确定模块,用于接收到电子邮件后,若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间存在邮件往来关系,则发送存在邮件往来关系通知; 邮件处理模块,用于接收到所述存在邮件往来关系通知后,查找与所述接收者的邮件地址相对应的、记录有所述接收者的密切通信人的邮件地址的密切通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件直接投递到所述接收者的收件箱中; 其中,所述接收者的密切通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的密切程度数据确定出来的,所述密切程度数据包括如下数据中的至少一种:邮件会话次数、通信频率、通信间隔以及各次独立会话内容主题离散度。
9.如权利要求8所述的系统,其特征在于,` 所述邮件往来关系确定模块还用于若根据其中解析出的发送者和接收者的邮件地址,判定所述发送者和所述接收者之间不存在邮件往来关系,则发送不存在邮件往来关系通知;以及 所述邮件处理模块还用于接收到所述存在邮件往来关系通知后,查找与所述接收者的邮箱地址相对应的、记录有所述接收者的疑似垃圾通信人的邮件地址的疑似垃圾通信人表,若其中记录有所述发送者的邮件地址,则将所述电子邮件投递到所述接收者的垃圾邮件箱中;若所述密切通信人表和所述疑似垃圾通信人表中均未记录有所述发送者的邮件地址,则对所述电子邮件进行第一过滤级别的过滤处理;以及接收到所述不存在邮件往来关系通知后,对所述电子邮件进行第二过滤级别的过滤处理,所述第二过滤级别高于第一过滤级别; 其中,所述接收者的疑似垃圾通信人是根据预先统计的与所述接收者存在邮件往来关系的各用户与所述接收者间通信的离散程度数据确定出来的,所述离散程度数据包括如下数据中的至少一种:邮件被举报的次数、未阅读直接被删除的次数、未被回复的次数。
10.如权利要求9所述的系统,其特征在于,还包括: 通信关系评定模块,用于周期性更新所述密切通信人表中的所述接收者的密切通信人:在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的密切程度数据,对该用户与所述接收者之间的密切程度进行评定,得到该用户的密切程度评分;之后,将评定得到的各用户的密切程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的每个用户中选取m个用户作为所述接收者的密切通信人后,根据此次确定的密切通信人更新与所述接收者的邮箱地址相对应的密切通信人表;以及所述通信关系评定模块还周期性更新所述疑似垃圾通信人表中的所述接收者的疑似垃圾通信人:在每个评定周期到达后,针对与所述接收者存在邮件往来关系的每个用户,根据本次评定周期内统计的该用户与所述接收者间通信的离散程度数据,对该用户与所述接收者之间的离散程度进行评定,得到该用户的离散程度评分;之后,将评定得到的各用户的离散程度评分进行排序,根据排序结果从与所述接收者存在邮件往来关系的每个用户中选取η个用户作为所述接收者的疑似垃圾通信人后,根据此次确定的疑似垃圾通信人更新与所述接收者相对应的疑似垃圾通信人表;其中,m为正整数;η为正整 数。
【文档编号】H04L12/58GK103873348SQ201410052444
【公开日】2014年6月18日 申请日期:2014年2月14日 优先权日:2014年2月14日
【发明者】郝双 申请人:新浪网技术(中国)有限公司