用户信息挖掘方法及装置的制造方法
【技术领域】
[0001]本公开涉及计算机技术领域,特别是涉及一种用户信息挖掘方法及装置。
【背景技术】
[0002]随着互联网技术飞速发展,互联网公司希望通过分析大量的用户网络行为数据获得用户的相关信息。例如,用户的征信。个人征信用于记录用户个人的信用行为,即信用记录。在分析用户信用时,用户的职业或所在公司是一个重要的因素。
[0003]相关技术中,通过用户使用社交软件所产生的信息,例如,用户的注册信息或用户的好友信息,分析用户职业所属行业及用户所在的公司。但是,社交软件中的数据稀疏,搜集用户信息的难度大。
【发明内容】
[0004]为克服相关技术中存在的问题,本公开提供一种用户信息挖掘方法及装置。
[0005]为了解决上述技术问题,本公开实施例公开了如下技术方案:
[0006]根据本公开实施例的第一方面,提供一种用户信息挖掘方法,包括:
[0007]根据终端发送的网络访问请求,获取所述网络访问请求所对应的IP地址;
[0008]统计各个IP地址对应的用户上网信息,所述用户上网信息包括以下至少一项:用户数量、用户上网时间分布及IP地址对应的地理位置;
[0009]根据所述IP地址对应的用户上网信息判断所述IP地址是否是公司IP地址;
[0010]当根据所述用户上网信息确定所述IP地址是公司IP地址时,获取所述公司IP地址对应的公司信息;
[0011]将所述公司信息同步到在工作时间使用所述公司IP地址的全部用户的用户信息中。
[0012]第一方面提供的用户信息挖掘方法,获取终端发送的网络访问请求对应的IP地址,然后,统计各个IP地址对应的用户上网信息;如果根据用户上网信息确定该IP地址是公司IP地址,则获取该IP地址对应的公司信息。最后,将该IP地址对应的公司信息同步到使用该IP地址的其它用户的用户信息中。通常同一公司所使用的IP地址相同,而且,同一公司的人数通常比较多,因此,基于IP地址的网络数据的覆盖量更大、可靠性更高,更容易获得用户信息。
[0013]可选地,所述根据终端发送的网络访问请求,获取所述网络访问请求所对应的IP地址,包括:
[0014]从终端发送的网络访问请求中,获取所述网络访问请求所携带的IP地址;
[0015]获取所述IP地址的联网参数,所述联网参数包括以下至少一项:连接时间、上报次数;
[0016]删除所述联网参数满足第一预设条件的IP地址,所述第一预设条件包括以下至少一项:连接时间低于预设时长、上报次数低于预设次数。
[0017]本实施例提供的用户信息挖掘方法,在获取终端发送的网络请求所携带的IP地址时,结合终端的联网参数,过滤掉可能是噪声的IP地址,从而提高了获得的IP地址的准确率。
[0018]可选地,所述根据所述IP地址对应的用户上网信息判断所述IP地址是否是公司IP地址,包括:
[0019]判断所述用户上网信息是否满足第二预设条件,所述第二预设条件包括以下至少一项:使用所述IP地址用户数量高于预设数量、用户上网时间处于工作时间、IP地址对应的地理位置是公司地址;
[0020]当所述用户上网信息满足第二预设条件时,确定所述用户上网信息对应的IP地址是公司IP地址;
[0021]当所述用户上网信息不满足第二预设条件时,确定所述用户上网信息对应的IP地址不是公司IP地址。
[0022]本实施例提供的用户信息挖掘方法,可以根据使用IP地址的用户数量、上网时间和该IP地址对应的地理位置中的至少一项,来判断该IP地址是否是公司IP地址,判断方式灵活,而且,可以利用多种方式综合判断IP地址是否是公司使用的IP地址,从而提高了判断结果的准确率。
[0023]可选地,所述获取所述公司IP地址对应的公司信息,包括:
[0024]获取使用所述公司IP地址的用户所标注的公司信息,并将所述公司信息确定为所述公司IP地址对应的公司信息。
[0025]可选地,若获得多个公司信息,则所述获取使用所述公司IP地址的用户所标注的公司信息,并将所述公司信息确定为所述公司IP地址对应的公司信息,包括:
[0026]获取使用所述公司IP地址的多个公司信息;
[0027]获取所述公司信息中的关键字信息;
[0028]根据所述关键字信息统计各个所述公司信息的数量,确定数量最多的公司信息作为所述公司IP地址对应的公司信息。
[0029]可选地,所述方法还包括:存储IP地址与公司信息之间的对应关系。
[0030]本实施例提供的用户信息挖掘方法,在确定IP地址对应的公司信息后,存储IP地址与公司信息之间的对应关系,这样,后续再检测到使用该IP地址的新用户后,查找IP地址与公司信息之间的对应关系,即可获得该用户的公司信息。不需要重新判断,节省了资源及时间。
[0031]根据本公开实施例的第二方面,提供一种用户信息挖掘装置,包括:
[0032]第一获取模块,用于根据终端发送的网络访问请求,获取所述网络访问请求所对应的IP地址;
[0033]统计模块,用于统计所述第一获取模块获得的各个IP地址对应的用户上网信息,所述用户上网信息包括以下至少一项:用户数量、用户上网时间分布及IP地址对应的地理位置;
[0034]判断模块,用于根据所述IP地址对应的用户上网信息判断所述IP地址是否是公司IP地址;
[0035]第二获取模块,用于当所述判断模块确定所述IP地址是公司IP地址时,获取所述公司IP地址对应的公司信息;
[0036]同步模块,用于将所述第二获取模块获得的公司信息同步到在工作时间使用所述公司IP地址的全部用户的用户信息中。
[0037]可选地,所述第一获取模块包括:
[0038]第一获取子模块,用于从终端发送的网络访问请求中,获取所述网络访问请求所携带的IP地址;
[0039]第二获取子模块,用于获取所述第一获取子模块获得的IP地址的联网参数,所述联网参数包括以下至少一项:连接时间、上报次数;
[0040]删除子模块,用于删除所述第二获取子模块获得的联网参数满足第一预设条件的IP地址,所述第一预设条件包括以下至少一项:连接时间低于预设时长、上报次数低于预设次数。
[0041 ]可选地,所述判断模块包括:
[0042]判断子模块,用于判断所述用户上网信息是否满足第二预设条件,所述第二预设条件包括以下至少一项:使用所述IP地址用户数量高于预设数量、用户上网时间处于工作时间、IP地址对应的地理位置是公司地址;
[0043]第一确定子模块,用于当所述判断子模块判断出用户上网信息满足第二预设条件时,确定所述用户上网信息对应的IP地址是公司IP地址;
[0044]第二确定子模块,用于当所述判断子模块判断出用户上网信息不满足第二预设条件时,确定所述用户上网信息对应的IP地址不是公司IP地址。
[0045]可选地,所述第二获取模块用于:
[0046]获取使用所述公司IP地址的用户所标注的公司信息,并将所述公司信息确定为所述公司IP地址对应的公司信息。
[0047]可选地,若获得多个公司信息,则所述第二获取模块获取使用所述公司IP地址的用户所标注的公司信息,并将所述公司信息确定为所述公司IP地址对应的公司信息,包括:
[0048]第三获取子模块,用于获取使用所述公司IP地址的多个公司信息;
[0049]第四获取子模块,用于获取所述第三获取子模块获得的公司信息中的关键字信息;
[0050]第三确定子模块,用于根据所述第四获取子模块获得的关键字信息统计各个所述公司信息的数量,确定数量最多的公司信息作为所述公司IP地址对应的公司信息。
[0051 ] 可选地,所述装置还包括:
[0052]存储模块,用于存储IP地址与公司信息之间的对应关系。
[0053]根据本公开实施例的第三方面,提供一种服务器,包括:
[0054]处理器;
[0055]用于存储处理器可执行指令的存储器;
[0056]其中,所述处理器被配置为:
[0057]根据终端发送的网络访问请求,获取所述网络访问请求所对应的IP地址;
[0058]统计各个IP地址对应的用户上网信息,所述用户上网信息包括以下至少一项:用户数量、用户上网时间分布及IP地址对应的地理位置;
[0059]根据所述IP地址对应的用户上网信息判断所述IP地址是否是公司IP地址;
[0060]当根据所述用户上网信息确定所述IP地址是公司IP地址时,获取所述公司IP地址对应的公司信息;
[0061]将所述公司信息同步到在工作时间使用所述公司IP地址的全部用户的用户信息中。
[0062]本公开的实施例提供的技术方案可以包括以下有益效果:服务器根据接收到的网络访问请求,获取该网络访问请求对应的IP地址。然后,统计各个IP地址对应的用户上网信息,在根据用户上网信息确定IP地址是公司IP地址时,获取公司IP地址对应的公司信息。并确定该公司信息是在工作时间使用该公司IP地址的全部用户对应的公司信息。从而实现根据用户的IP地址确定用户的公司信息,并进一步方便根据用户的公司信息分析用户的信用情况。通常同一公司所使用的IP地址相同,而且,同一公司的人数通常比较多,因此,基于IP地址的网络数据的覆盖量更大、可靠性更高,更容易获得用户信