一种信息过滤方法及装置的制造方法
【技术领域】
[0001] 本申请涉及计算机技术领域,尤其涉及一种信息过滤方法及装置。
【背景技术】
[0002] 随着信息技术的发展,网站已经可以为用户提供非常丰富的网络服务,用户通常 需要在网站上注册自己的账户信息,以便获得更全面的服务。
[0003] 目前,存在由机器自动生成大量垃圾账户的情况,这些垃圾账户并不会被正常使 用,通常是被恶意利用以获得更多的网络服务的资源。大量垃圾账户的存在不仅占用网络 服务商的资源,而且过多的垃圾账户被恶意利用后,严重影响其他用户所获取的网络服务, 导致网络服务资源的分配不均。
[0004] 现有技术中,对于垃圾账户的过滤通常采用地址信息过滤和网络行为过滤两 种方式,其中,地址信息过滤的主要方法为:当监测到同一介质访问控制(Media Access Control, MAC)地址或互联网协议(Internet Protocol, IP)地址短时间内注册大量账户 时,则判定这些账户为自动生成的垃圾账户,从而对这些垃圾账户进行过滤。而网络行为过 滤的主要实现方式为:在已注册的账户进行登录后,针对该账户的网络行为进行监测,根据 监测到的该账户的网络行为判断该账户是否为垃圾账户,并进行相应过滤。
[0005] 但是,一旦修改了注册账户信息的设备的MAC地址或IP地址,地址信息过滤的方 法就将失效,因此,地址信息过滤的方法漏检率较高。而网络行为过滤的方法在执行时,由 于垃圾账户的注册毕竟已经完成,而且对账号的网络行为进行监测也需要消耗较多的资源 来完成,因此网络行为过滤的方法的效率较低。
【发明内容】
[0006] 本申请实施例提供一种信息过滤方法及装置,用以解决对账户信息的过滤准确性 较差且效率较低的问题。
[0007] 本申请实施例提供的一种信息过滤方法,包括:
[0008] 接收待注册账户信息;
[0009] 根据所述待注册账户信息中包含的字符,确定所述待注册账户信息为垃圾账户的 可能性表征值;
[0010] 当所述可能性表征值大于预设阀值时,拒绝注册所述待注册账户信息。
[0011] 本申请实施例提供的一种信息过滤装置,包括:接收模块、表征值模块以及过滤处 理模块,其中,
[0012] 所述接收模块,用于接收待注册账户信息;
[0013] 所述表征值模块,用于根据所述待注册账户信息中包含的字符,确定所述待注册 账户信息为垃圾账户的可能性表征值;
[0014] 所述过滤处理模块,用于当所述可能性表征值大于预设阀值时,拒绝注册所述待 注册账户信息。
[0015] 本申请实施例提供一种信息过滤方法及装置,接收待注册账户信息,根据所述待 注册账户信息中包含的字符,确定所述待注册账户信息为垃圾账户的可能性表征值,当所 述可能性表征值大于预设阀值时,拒绝注册所述待注册账户信息。通过上述方法,由于可能 性表征值直观反映了待注册账户信息是垃圾账户的可能性,从而,使用可能性表征值和预 先设定的阀值相比较,可准确判断出该账户信息是垃圾账户还是正常账户,采用上述方法 不仅在新的账户信息在注册的过程中,就可对账户信息进行及时过滤,有效提升了对账户 信息的过滤效率,而且,对新注册的账户信息的过滤过程不依赖于注册设备的地址信息,避 免出现漏检的情况。
【附图说明】
[0016] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0017] 图1为本申请实施例提供的信息过滤过程示意图;
[0018] 图2为申请实施例提供的信息过滤过程在具体应用中的流程图;
[0019] 图3本申请实施例提供的信息过滤装置结构示意图。
【具体实施方式】
[0020] 为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及 相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一 部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0021] 图1为本申请实施例提供的信息过滤过程,该过程具体包括以下步骤:
[0022] S101 :接收待注册账户信息。
[0023] 本申请实施例中所述的待注册账户信息,包括但不限于:包含有英文字母的用户 名,如,Email地址信息。
[0024] 现有技术中,对账户信息的过滤通常需等待账户信息注册完成后,才能对账户信 息进行相应的判断,即使服务器采用地址信息过滤的方法,也不能及时过滤垃圾账户,当注 册账户信息的设备使用的新的MAC地址或IP地址时,也仍会有一定数量的垃圾账户完成注 册,直到服务器监测到大量注册成功后的账户信息均来自于同一 MAC地址或IP地址,服务 器才会禁止该MAC地址或IP地址再次进行注册,在这个过程中,一定数量的垃圾账户的已 经注册成功。
[0025] 因此,本申请实施例中的上述步骤S101,为了避免出现垃圾账户注册成功的情况, 服务器在注册过程中就对待注册账户信息进行过滤。服务器在接收到待注册账户信息之 后,便会立即确定该待注册账户信息为垃圾账户的可能性,即步骤S102。
[0026] S102,根据所述待注册账户信息中包含的字符,确定所述待注册账户信息为垃圾 账户的可能性表征值。
[0027] 对于正常的待注册账户信息而言,待注册账户信息作为一种具有唯一性的用户标 识,其中包含的字符存在大量的组合方式(如:大小写字母、数字、符号等各种字符的组合 等等),该待注册账户信息中所包含的字符通过这些组合方式形成相应的字符串,且各待注 册账户信息的字符串长度也各不相同,有些待注册账户信息对应的字符串的组合虽然没有 规律,但仍可能是用户为了避免出现账户名称重复而设计的独特组合方式。例如:字符串为 "LXF1989"的账户信息中,三个英文字母"LXF"很可能对应于该用户姓名的拼音缩写,数字 "1989"是该用户的出生年份;字符串为"Sylviall"的账户信息中,英文单词"Sylvia"很 可能对应于该用户的英文名,数字"11"可能是该用户为了避免与其他名为Sylvia的用户 的账户信息发生冲突而添加的数字。可见,对于正常的待注册账户信息而言,其中的字符串 均有相应的意义。
[0028] 但是,对于设备自动注册的待注册账户信息(垃圾账户),该设备为了保证顺利的 完成注册(即保证待注册账户信息的唯一性),通常将待注册账户信息设置为较长且随机 组合的字符串,例如:">11>1 113"、"幻1^允"等。可见,这些垃圾账户对应的字符串并不是用 户的姓名的拼音缩写,也不是英文单词,也就是说,这些字符串是无意义的。这样一来,就表 明上述待注册账户信息是垃圾账户的可能性较高,那么,为了直观表示这种可能性,在本申 请实施例中,采用可能性表征值的方式,量化待注册账户信息为垃圾账户的可能性,也即, 本申请中所述的可能性表征值是该待注册账户信息是垃圾账户的可能性的量化值,该可能 性表征值越高,表