一种用户分类方法及服务器的制造方法
【技术领域】
[0001]本发明涉及通信领域中的用户信息处理技术,尤其涉及一种用户分类方法及服务器。
【背景技术】
[0002]当前社交网络以及媒体信息发送系统中,直接使用用户在社交网络上注册填写的属性内容,比如感情/婚恋状态,来进行媒体信息的分类发送。但是,用户填写属性的内容存在如下两个问题:一、覆盖用户不全:用户有可能不会主动进行属性的填写;二、内容不准确:因为存在过期未及时更新的问题,导致属性缺乏时效性的问题。可见,当前社交网络中基于用户填写的属性可能会出现分类不准确的问题。
【发明内容】
[0003]有鉴于此,本发明的目的在于提供一种用户分类方法及服务器,能至少解决现有技术中存在的上述问题。
[0004]为达到上述目的,本发明的技术方案是这样实现的:
[0005]本发明实施例提供了一种用户分类方法,所述方法包括:
[0006]基于社交网络用户的历史服务数据,获取到具备第一属性的至少一个标注用户;其中,所述第一属性用于表征所述社交网络用户的婚恋状态;
[0007]从至少一个维度获取到所述标注用户对应的至少一种特征参数,基于所述标注用户的特征参数、以及所述标注用户对应的第一属性,确定针对用户的第一属性的分类模型;
[0008]基于所述针对用户的第一属性的分类模型,为社交网络中的至少一个目标用户划分其对应的第一属性的类别。
[0009 ]本发明实施例提供了一种服务器,包括:
[0010]用户获取单元,用于基于社交网络用户的历史服务数据,获取到具备第一属性的至少一个标注用户;其中,所述第一属性用于表征所述社交网络用户的婚恋状态;
[0011]模型建立单元,用于从至少一个维度获取到所述标注用户对应的至少一种特征参数,基于所述标注用户的特征参数、以及所述标注用户对应的第一属性,确定针对用户的第一属性的分类模型;
[0012]分类单元,用于基于所述针对用户的第一属性的分类模型,为社交网络中的至少一个目标用户划分其对应的第一属性的类别。
[0013]本发明实施例提供了用户分类方法及服务器,基于历史服务数据获取到具备第一属性的至少一个标注用户,再基于至少一个维度的至少一种特征参数、以及标注用户的第一属性确定针对用户的第一属性的分类模型,根据所述分类模型为至少一个目标用户划分类别。如此,能够避免由于用户未填写的第一属性、或者填写第一属性过时,而导致的无法准确的为目标用户划分类别的问题。
【附图说明】
[0014]图1为本发明实施例用户分类方法流程示意图;
[0015]图2为本发明实施例选取标注用户场景示意图一;
[0016]图3为本发明实施例选取标注用户场景示意图一;
[0017]图4为本发明实施例选取标注用户场景示意图一;
[0018]图5为本发明实施例用户特征提取场景示意图;
[0019]图6为本发明实施例特征提取内容示意图;
[0020]图7为本发明实施例建立分类模型逻辑示意图;
[0021 ]图8为本发明实施例服务器组成结构示意图;
[0022]图9为本发明实施例服务器硬件组成结构示意图。
【具体实施方式】
[0023]下面结合附图及具体实施例对本发明再作进一步详细的说明。
[0024]实施例一、
[0025]本发明实施例提供了一种用户分类方法,如图1所示,所述方法包括:
[0026]步骤101:基于社交网络用户的历史服务数据,获取到具备第一属性的至少一个标注用户;其中,所述第一属性用于表征所述社交网络用户的婚恋状态;
[0027]步骤102:从至少一个维度获取到所述标注用户对应的至少一种特征参数,基于所述标注用户的特征参数、以及所述标注用户对应的第一属性,确定针对用户的第一属性的分类模型;
[0028]步骤103:基于所述针对用户的第一属性的分类模型,为社交网络中的至少一个目标用户划分其对应的第一属性的类别。
[0029]这里,本实施例提供的方案可以应用于服务器侧。
[0030]其中,所述针对用户的第一属性的分类模型中以用户的特征参数作为输入参数、以用户对应的第一属性的类别作为输出参数。
[0031]执行上述步骤101获取到具备第一属性的至少一个标注用户之前,所述方法还包括:
[0032]基于社交网络用户的历史服务数据,选取第一属性为第一类别的至少一个第一类初始用户;其中,所述第一属性中包括有第一类别以及第二类别,所述第一类别与所述第二类别不同;所述第一属性可以为用户的婚姻状态;相应的,所述第一属性对应的类别可以为两种,第一类别可以为已婚,第二类别可以为未婚;
[0033]基于所述第一类初始用户的历史服务数据,确定所述第一类初始用户对应的共有特征;
[0034]基于所述第一类初始用户对应的共有特征,从所述社交网络中选取与所述第一类初始用户的共有特征差异值超过预设门限值的至少一个第二类初始用户,设置所述第二类初始用户的第一属性为第二类别;
[0035]基于所述第一类初始用户以及第二类初始用户的历史服务数据,建立针对用户的第一属性的分类模型。
[0036]其中,所述选取第一属性为第一类别的至少一个第一类初始用户的方法可以包括:根据用户的历史服务数据,选取设置第一属性为第一类别的用户作为第一类初始用户。所述第一类别为已婚,相应的,第一类初始用户为已婚用户。这里,首先选取第一类初始用户是由于假设社交网络用户注册时填写的婚恋状态是准确的,只是存在一些长期未及时更新的问题,但是,对于“已婚”状态,一旦用户步入该状态,现实中基本不会改变,所以,我们可以认为是这个状态的下的数据非常准确。
[0037]从除去所述至少一个第一类初始用户的全部用户中,选取至少一个第二类初始用户,可以参见图2,也就是说,将至少一个第一类初始用户看作正例(Positive data),从刨除第一类初始用户后剩余的全部用户中随机选择预设比例第二类初始用户作为负例(Negative data),即未标注数据(Unlabeled data),基于第一类初始用户以及第二类初始用户作为训练数据建立并训练针对用户的第一属性的分类模型。
[0038]其中,预设比例可以为根据实际情况进行设置,比如可以从剩余的用户中选取30%的用户作为第二类初始用户;或者,可以选取50%的用户作为第二类初始用户。
[0039]所述针对用户的第一属性的分类模型可以为一种二元分类器,用于判断是否“已婚”,采用Logisitic Regress1n(LR)机器学习算法,训练得到模型,即LR Model。
[0040]进一步地,所述获取到具备第一属性的至少一个标注用户,可以包括:
[0041]基于社交网络用户的历史服务数据,选取设置有第一属性的至少一个用户作为待处理用户;
[0042]基于所述针对用户的第一属性的分类模型对所述待处理用户进行分类得到针对所述待处理用户的分类结果;
[0043]确定所述待处理用户的第一属性与其对应的分类结果相同的概率,选取概率高于预设概率门限值的待处理用户作为标注用户。
[0044]所述第一属性中设置的内容可以基于用户的标签获得。所述设置有第一属性的至少一个用户中,用户针对第一属性进行设置时,可以存在多种设置内容,可能包含有:已婚、未婚、单身、有子女、新婚、恋爱中、订婚、分手、离异等多种内容;
[0045]相应的,在确定所述待处理用户的第一属性与其对应的分类结果相同的概率时,首先可以根据待处理用户的第一属性中设置的内容,为待处理用户选取对应的类别,比如,已婚的类别可以对应的第一属性中设置的内容有:已婚、新婚、有子女;未婚的类别对应的第一属性中设置的内容有:单身、未婚、恋爱中、订婚、分手以及离异等等。
[0046]在图2的基础上,参见图3用于描述上述数据获取(Data Acquisit1n)的处理,具体为:对社交网络有婚恋填写状态的所有用户做分类预估,判断是否为“已婚”人群,概率为p(c I instance),保留满足如下条件的数据作为多分类候选训练数据集:
[0047]p(c = 0 instance,label = 0)>thresholdl
[0048]p(c = I I instance,label = I)>threshold2
[0049]其中,c是针对用户的第一属性的分类模型的预估类别,即基于用户的至少一种第二属性以及分类模型判断用户是否已婚;instance是待处理用户,label是instance标注的类别,即是否“已婚”。Threshold代表截断阈值,thresholdl用来保留预估为未婚的高概率人群,threshold〗用来保留预估为已婚的高概率人群。
[0050]可见,通过采用上述方案,就能够基于历史服务数据获取到具备第一属性的至少一个标注用户,再基于至少一个维度的至少一种特征参数、以及标注用户的第一属性确定针对用户的第一属性的分类模型,根据所述分类模型为至少一个目标用户划分类别。如此,能够避免由于用户未填写的第一属性、或者填写第一属性过时,而导致的无法准确的为目标用户划分类别的问题。
[0051]实施例二、
[0052]本发明实施例提供了一种用户分类方法,如图1所示,所述方法包括:
[0053]步骤101:基于社交网络用户的历史服务数据,获取到具备第一属性的至少一个标注用户;其中,所述第一属性用于表征所述社交网络用户的婚恋状态;
[0054]步骤102:从至少一个维度获取到所述标注用户对应的至少一种特征参数,基于所述标注用户的特征参数、以及所述标注用户对应的第一属性,确定针对用户的第一属性的分类模型;
[0055]步骤103:基于所述针对用户的第一属性的分类模型,为社交网络中的至少一个目标用户划分其对应的第一属性的类别。
[0056]这里,本实