个体用户画像方法和系统的制作方法
【专利摘要】本发明实施例提供一种个体用户画像方法,包括:基于包括标签、属性、标签和属性之间的推导规则以及所述推导规则的逻辑强度值的标签规则库,检测用户行为,为所述用户打上各种标签;根据一段时间内为用户打上的每一种标签的数量和/或时效性、利用推导规则从标签推导出的属性、推导规则的逻辑强度值,确定每一种标签推导出的各种属性的参考值;将其中一种标签推导出的其中一种属性的参考值与预定阈值进行对比,判断是否能够确定用户属性包含其中一种属性,若否,则连同对应于其中一种属性的其他标签共同判断是否能够确定其中一种属性;根据所确定的用户属性,完成用户画像。本发明还提出了一种个体用户画像系统。能有效提高用户画像的精准度。
【专利说明】
个体用户画像方法和系统
技术领域
[0001]本发明实施例涉及用户画像的领域,尤其涉及一种个体用户画像方法和系统。
【背景技术】
[0002]在互联网逐渐步入大数据时代后,消费者的一切行为在企业面前似乎都将是“可视化”的。企业的专注点日也开始益聚焦于怎样利用大数据来为精准地向用户提供服务。于是,“用户画像”也就应运而生了。
[0003]用户画像,即用户信息标签化,就是通过收集与分析用户社会属性、生活习惯、行为等主要信息的数据之后,完美地抽象出一个用户的全貌。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。其中,属性是进行用户画像所需要统计的维度,如性别下的男和女,年龄下的少年、青年、中年、老年,收入等级下的贫困,中低,中等,富裕等。
[0004]现有技术中用户画像方法主要有两种:通过用户的注册信息直接画出用户画像的方法;对用户的行为进行监测,而后为用户打上各种标签,后台工作人员利用个人经验对所有标签进行分析推导得出用户画像的方法。
[0005]关于前一种方法,存在以下缺点:目前很多的网站/媒体的访问并不需要提前注册,故这些网站/媒体也并不清楚当前用户的属性;另外,有些用户也不愿意注册用户信息,即使用户注册了信息,也很难保证注册信息的准确性(比如,涉及用户的个人隐私、时间因素等),这样就很难得到准确的用户画像。
[0006]对于后一种方法,存在以下缺点:过于依赖后台工作人员个人因素会导致得到的用户画像结果的差异性很大,同时也很难避免噪音标签对用户画像的干扰,而且也没有考虑到标签的时效性,导致最终得到的用户画像不够精确。
【发明内容】
[0007]本发明实施例提供一种个体用户画像方法,用以解决现有技术中用户画像不够精确的技术问题。
[0008]本发明一方面提出了一种个体用户画像方法,包括:
[0009]基于包括标签、属性、标签和属性之间的推导规则以及所述推导规则的逻辑强度值的标签规则库,检测用户行为以确定用户属性,包括:
[0010]-检测用户行为,为所述用户打上各种标签;
[0011]-根据一段时间内为用户打上的每一种标签的数量和/或时效性、利用推导规则从标签推导出的属性、推导规则的逻辑强度值,确定每一种标签推导出的各种属性的参考值;
[0012]-将其中一种标签推导出的其中一种属性的参考值与预定阈值进行对比,判断是否能够确定用户属性包含所述其中一种属性,若否,则利用所述参考值连同其他标签下的对应于所述其中一种属性的参考值共同判断是否能够确定用户属性包含所述其中一种属性;
[0013]根据所确定的用户属性,完成用户画像。
[0014]本发明一实施例提供一种个体用户画像系统,包括:
[0015]行为检测单元,配置以:基于包括标签、属性、标签和属性之间的推导规则以及所述推导规则的逻辑强度值的标签规则库,检测用户行为,为所述用户打上各种标签;
[0016]属性预估单元,配置以:根据一段时间内为用户打上的每一种标签的数量和/或时效性、利用推导规则从标签推导出的属性、推导规则的逻辑强度值,确定每一种标签推导出的各种属性的参考值;
[0017]属性确定单元,配置以:将其中一种标签推导出的其中一种属性的参考值与预定阈值进行对比,判断是否能够确定用户属性包含所述其中一种属性,若否,则利用所述参考值连同其他标签下的对应于所述其中一种属性的参考值共同判断是否能够确定用户属性包含所述其中一种属性;
[0018]用户画像生成单元,配置以:根据所确定的用户属性,完成用户画像。
[0019]本发明实施例提出了一套通过为用户打标签进而确定属性的方法及系统,避免了因个人差异为用户画像而造成的差异;既保证了所有标签共同作用,又避免了因噪音标签对个体用户画像产生的误差,提高了个体用户画像的精确性。
【附图说明】
[0020]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1示出了本发明一实施例的个体用户画像方法的流程图;
[0022]图2示出了图1中方法中的步骤S103的一种【具体实施方式】的详细执行图;
[0023]图3示出了本发明一实施例的个体用户画像系统的示意图;
【具体实施方式】
[0024]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0025]参见图1,示出的是本发明一具体实施例的个体用户画像方法的流程图,所述方法包括:
[0026]基于标签规则库,检测用户行为以确定用户属性,包括:
[0027]SlOl:基于包括标签、属性、标签和属性之间的推导规则以及所述推导规则的逻辑强度值的标签规则库,检测用户行为,为所述用户打上各种标签;
[0028]S102:根据一段时间内为用户打上的每一种标签的数量和/或时效性、利用推导规则从标签推导出的属性、推导规则的逻辑强度值,确定每一种标签推导出的各种属性的参考值;
[0029]S103:将其中一种标签推导出的其中一种属性的参考值与预定阈值进行对比,判断是否能够确定用户属性包含所述其中一种属性,若否,则利用所述参考值连同其他标签下的对应于所述其中一种属性的参考值共同判断是否能够确定用户属性包含所述其中一种属性;
[0030]S104:根据所确定的用户属性,完成用户画像。
[0031]关于标签的时效性的确定具体包括:统计一段时间内为用户打上的其中一种标签的各个标签的生成时间,并以此来判断所述其中一种标签的各个标签的时效性。
[0032]将标签的时效性也作为用户属性的参考值的一个参考条件,使得所得的属性的参考值更加的精确,进一步地在利用属性参考值与阈值进行对比而确定用户属性时,使得所确定的用户属性更加精确。
[0033]作为图1所示实施例方法的进一步优化,图1所示的实施例方法的S104步骤之后还包括:
[0034]在完成用户画像后,根据用户画像为用户进行个性化信息推送,并基于标签规则库,继续检测用户在收到所述个性化信息推送后的行为以重新确定用户属性。
[0035]基于用户画像为用户进行个性化信息推送,根据用户对个性化信息推送反馈的用户行为,重新确定用户属性,实现了对用户属性和用户画像的校准,同时也避免了对用户信息推送的一成不变。
[0036]继续参照图2,作为图1所示实施例方法的进一步优化,关于图1中的步骤S103的执行,可以包括如下子步骤:
[0037]S1031:将第一标签推导出的其中一种属性的第一参考值与预定阈值进行对比,当第一参考值大于阈值时,则确定用户属性包含所述其中一种属性,当第一参考值不大于阈值时,则不确定用户属性包含所述其中一种属性;
[0038]S1032:将所述第一参考值与第二标签下的对应于所述其中一种属性的第二参考值加权求和,将所述加权求和所得的值与预定阈值进行对比,当所述加权求和所得的值大于阈值时,则确定用户属性包含所述其中一种属性,当所述加权求和所得的值不大于阈值时,则不确定用户属性包含所述其中一种属性;
[0039]S1033:依次类推,直到能够确定用户属性包含所述其中一种属性。
[0040]当对用户的其中一种标签进行推导就可以确定用户属性时,则无需再对其他标签进行推导计算,降低了用户画像对服务器资源的消耗;当对用户的其中一个标签进行推导无法确定用户属性时,可以结合其他标签共同对用户属性进行推导,提高了所确定的用户属性的精确度。
[0041]在本发明方法的一种实施方式中,每一种标签推导出的各种属性的参考值以逻辑值为基准,并与一段时间内标签的数量和标签的时效性成正比。
[0042]在本发明方法的一种实施方式中,关于S103步骤的具体实现过程还可以包括:
[0043]将第一标签推导出的其中一种属性的第一参考值与预定阈值进行对比,当第一参考值大于阈值时,则确定用户属性包含所述其中一种属性,当第一参考值不大于阈值时,则不确定用户属性包含所述其中一种属性;例如:第一标签为“化妆品”,由标签“化妆品”所推导的其中一种属性为女性,若用户的标签“化妆品”的参考值大于预定阈值,则确定用户为女性。
[0044]当对应于其中一种属性的第一标签的参考值小于或等于阈值时,则将所有对应于所述其中一种属性的标签对应于所述其中一种属性的各个参考值依次加权迭代相加,直至所述各个参考值加权迭代相加所得的参考迭代值超过预定阈值时,则确定用户包含的所述其中一种属性,示例性地,当对应于用户性别下的女性的标签“化妆品”的参考值小于或等于阈值时,则引入用户的同样对应于女性的标签“裙子”作为第二标签,对“裙子”相对应于女性的参考值进行加权,例如对属性的第二标签设置权重为0.5,将第二标签“裙子”相对应于女性的参考值乘以第二标签所对应的权重0.5,并将所得的值与“化妆品”进行求和相加,得到用户相对应于用户性别下女性的属性参考叠加值,再将所得的属性参考叠加值与预定阈值进行对比,当属性参考叠加值大于预定阈值时,则由第一标签“化妆品”和第二标签“裙子”共同确定该项属性女性;当属性参考叠加值仍小于预定阈值时,则再引入用户的与女性相对应的一个新的标签“青春偶像剧”作为第三标签,并将第三标签“青春偶像剧”对应于女性的参考值加权并累加至属性参考叠加值中,例如对属性的第三标签设置权重为0.25,贝1J“青春偶像剧”作为用户性别下的女性的第三标签,相对应于女性的参考值乘以第三标签所对应的权重0.25,并将所得的值与属性参考叠加值进行求和相加,由此更新了属性参考叠加值,进一步地将所得的属性可参考叠加值与预定阈值进行对比,若此时的属性参考叠加值大于预定阈值,则由第一标签“化妆品”、第二标签“裙子”和第三标签“青春偶像剧”共同确定属性,且确定用户为女性;若属性参考叠加值仍小于预定阈值,则依次类推,引入用户的对应于女性的新的标签作为第四标签、第五标签…,直到所述各标签的参照值加权求和所得的值大于阈值,则确定用户为女性,同时用户的属性由上述第一、第二、第三、第四标签…多个标签共同推理得出;在本发明方法的另一种实施方式中,相对应于属性的第一、第二、第三、第四标签…等各个标签的权重也可以均为1,关于属性的具体推导过程可参照上述属性为女性的推导过程,故在此不再赘述。
[0045]在本发明方法的一种实施方式中,在SlOl步骤之前,还包括建立标签规则库:提供标签、属性、以及标签和属性之间的推导规则;根据所述标签和属性之间的推导规则的强弱设置相应的逻辑强度值;具体可以包括如下子步骤:
[0046]建立标签群;
[0047]在本发明一种实施例中,标签群还可以是由多个子标签群构成,不同的子标签群与不同维度的属性相对应,例如:用户年龄子标签群与用户年龄维度属性相对应、用户收入等级子标签群与用户收入等级维度属性相对应、用户消费等级子标签群与用户消费等级维度属性相对应、用户消费喜好子标签群与用户消费喜好维度属性相对应等,由用户各个不同维度的属性共同构成了用户画像。
[0048]所述推导规则群包括推导规则、利用推导规则从标签推导出的属性、推导规则的逻辑强度值;
[0049]建立推导规则群,包括:
[0050]释义所述标签群中的各个标签,获得与各个标签的逻辑释义相接近的匹配属性;
[0051]分析各个标签和匹配属性之间的逻辑强度,并为各个标签与匹配属性之间的逻辑强度赋予与所述逻辑强度相对应的逻辑强度值;
[0052]将各个逻辑强度值以各个相应的标签和所述匹配属性为key作为推导规则存储于推导规则群中。
[0053]通过分析标签与匹配属性之间的逻辑强度,将匹配属性与标签之间的逻辑强度做量化处理,并得到能反映逻辑强度的量化值,将此量化值作为逻辑强度值并相对应于标签和匹配属性存储于推导规则群中;由此建立的标签规则库应用于用户画像中,避免了因个人差异为用户画像而造成的差异。
[0054]在本发明的一种实施方式中,标签对应着用户行为,由于用户在各个数据源对应的网页上执行诸如浏览产品操作、购买产品操作、关注产品操作或收藏产品操作时,均可触发日志信息的生成,相应地日志信息的生成时间用于说明用户执行上述诸如浏览产品操作、购买产品操作、关注产品操作或收藏产品操作所对应的时间;针对上述用户行为的情形,可以选择将产品信息或产品的分类信息作为用户行为相匹配的标签,例如当用户经常浏览数码产品类网站,则可以为用户打上“数码”这一标签。
[0055]作为图1所示实施例方法的进一步优化,关于图1中的步骤S102的执行,可以包括如下子步骤:
[0056]统计一段时间内为用户打上的其中一种标签的数量;
[0057]以所述其中一种标签为key遍历标签规则库,获取包含所述标签的各个推导规贝1J,利用推导规则从标签推导出的属性以及推导规则的逻辑强度值;从所述为用户打上的一种标签推导得出的属性的参考值。
[0058]依次类推,获取从所述为用户打上的每一种标签推导得出的属性的参考值。
[0059]将一段时间内为用户打上的标签数量作为考虑标签参考值的一个参考条件,避免了因噪音标签对个体用户画像产生的误差,即避免了因为用户失误操作所生成的标签对用户画像的干扰,提高了个体用户画像的精确性。
[0060]在本发明方法的一种实施方式中,关于参考值的确定可以是:
[0061]现在对个体用户的性别进行推导,需要确定个体用户相对应于性别属性的参考值;查询标签规则库,根据标签规则库中与性别属性相对应的各种推导规则,确定在一段时间内为用户打上的标签中与性别属性相对应的各种标签,例如:查询标签规则库与用户缓存信息,确定用户在30天内生成的标签包含“化妆品”、“裙子”等与性别属性相对应标签;统计各种标签的数量、生成时间及标签相对应于性别的逻辑强度值,例如:根据标签查询标签规则库,获取标签所对应于性别属性的逻辑强度值,若标签规则库中包含推导规则及推导规则的逻辑强度值为“化妆品-女性_7”、“裙子-女性_8”,则确定一种标签“裙子”相对应于女性的逻辑强度值为8,确定另一种标签“化妆品”相对应于女性的逻辑强度值为7,以此类推,确定用户生成的标签中对应于性别的各种标签的逻辑强度值;根据与性别属性相对应的各种标签的生成时间,为用户生成的各种标签赋予与时效性强弱相对应的时效权重,例如:为在10天内的标签赋予最高的时效权重1,为在10-20天内生成的标签赋予一般的时效权重1/2,为20-30天内生成的标签赋予最低的时效权重1/4 ;然后基于用户标签的数量为各种标签赋予相应的数量权重,例如:为标签数量为1-2的标签赋予最弱的数量权重1/4,为标签数量为3-10的各个标签赋予一般的数量权重1/2,为标签数量为10以上的各种标签赋予最高的数量权重I ;基于各种标签的数量权重、时效权重和逻辑强度值,确定各种标签的参考值,例如:将各种标签的数量权重、时效权重和逻辑强度值相乘,由此确定“化妆品”、“裙子”等各种标签相对应于性别的参考值。
[0062]本实施例方法的更具体的表现方式包括但不限于:
[0063]检测用户行为,为所述用户打上各种标签;
[0064]统计一段时间为10天内为用户打上的标签“数码”的次数为5次,查询5次标签“数码”每一次标签的生成时间,基于生成时间与当前时间的时间差分别确定5次标签“数码”每一次标签的时效权重,其中标签时效权重的大小与标签的时效性相对应;例如,当标签“数码”的生成时间与当前时间的时间差小于或等于2天,则为所述标签“数码”赋予时效权重1,当标签“数码”的生成时间与当前时间的时间差大于2天,小于或等于4天时,则为所述标签赋予时效权重1/2,当标签“数码”的生成时间与当前时间的时间差大于4天,小于或等于6天时,则为此次标签赋予时效权重1/4,依次类推,获得5次标签“数码”每一次标签的时效权重;
[0065]以标签“数码”为key遍历标签规则库,获取包含标签的各个推导规则,利用推导规则从标签推导出的属性以及推导规则的逻辑强度值;由此得到了关于标签“数码”的各个推导规则,包含:“数码-男性_7”、“数码-青年-8”…
[0066]其中标签“数码”的参考值与每次标签“数码”的时效权重、标签“数码”在不同时间段的数量和标签“数码”的逻辑强度值有关,例如:标签“数码”的参考值与每次标签“数码”的时效权重、标签“数码”在不同时间段的频次成正比,标签“数码”所对应的逻辑强度值参考于标签规则库,标签“数码”所对应的逻辑强度值为一确定的值;由此,依次类推,获得10天内用户所有的标签所对应的属性的参考值;
[0067]获取对应于用户性别属性的所有标签及标签所对应的参考值,例如获取对应于用户性别男性的还有“军事” “科技论坛”等标签,相应地获取“军事” “科技论坛”等标签的参考值;比较“数码”所推导出的用户性别男性的参考值与预定阈值的大小;当“数码”所对应的参考值大于预定阈值时,则确定用户性别为男性,当“数码”所对应的参考值小于预定阈值时,则可借鉴“军事”“科技论坛”等标签的参考值与预定阈值的比较来确定用户性别为男性;
[0068]当对应于用户性别下的男性的标签“数码”的参考值小于或等于阈值时,则引入用户的同样对应于男性的标签“军事”作为第二标签,对“军事”相对应于男性的参考值进行加权,例如对属性的第二标签设置权重为0.5,则将第二标签“军事”相对应于男性的参考值乘以第二标签所对应的权重0.5,并将所得的值与“数码”进行求和相加,得到用户相对应与用户性别下男性的属性参考叠加值,再将所得的属性参考叠加值与预定阈值进行对比,当属性参考叠加值大于预定阈值时,则由第一标签“数码”和第二标签“军事”共同确定该项属性男性;当属性参考叠加值仍小于预定阈值时,则再引入用户的与男性相对应的一个新的标签“科技论坛”作为第三标签,并将第三标签“科技论坛”对应于男性的参考值加权并累加至属性参考叠加值中,例如对属性的第三标签设置权重为0.25,则“科技论坛”作为用户性别下的男性的第三标签,相对应于男性的参考值乘以第三标签所对应的权重0.25,并将所得的值与属性参考叠加值进行求和相加,由此更新了属性参考叠加值,进一步地将所得的属性可参考叠加值与预定阈值进行对比,若此时的属性参考叠加值大于预定阈值,则由第一标签“数码”、第二标签“军事”和第三标签“科技论坛”共同确定属性,且确定用户为男性;若属性参考叠加值仍小于预定阈值,则依次类推,引入用户的对应于男性的新的标签作为第四标签、第五标签…,直到所述各标签的参照值加权求和所得的值大于阈值,则确定用户为男性,同时用户的属性由上述第一、第二、第三、第四标签…多个标签共同推理得出。
[0069]以此类推,统计用户的各个维度的用户属性,例如,用户的消费水平的高低,用户学历等级的本科或本科以上学历或本科以下学历,进一步地由用户的各个维度的用户属性构建成用户的用户画像。
[0070]在一种情况下,当对应于同一属性的所有标签对应于该项属性的参考值之和仍小于预定阈值时,则通过用户属性挖掘模型对对应于属性的所有标签进行计算推导,最终得到属性;常用的用户属性挖掘模型有svm、贝叶斯、聚类、加权平均等各种算法模型。
[0071]—种实施方式下预定阈值的确定过程可以是根据实验或经验推导获取的,例如:经过多次实验推导可知,当标签“数码”的参考值大于实验值时,便可确定出用户的性别属性为男性;当标签“数码”的参考值小于或等于实验值时,则无法确定用户的性别属性为男性,由此设置此实验值为阈值;
[0072]本发明提供一种解决思路,主要在于:首先建立一个标签规则库,标签规则库里存储有用户行为与用户标签相对应的规则(例如:当用户行为经常浏览化妆品类网站,则可为用户打一标签为“化妆品”,可推导出用户性别为女性;当用户行为为各种奶粉品牌时,则可为用户打另一标签为“奶粉”时,可推导用户年龄为中年);推导规则不一定完全准确,但要符合逻辑,并根据推导规则逻辑性的强弱为推导规则设定相对应于用户标签的逻辑强度值;之后根据每个用户的行为为其打上相应的标签,标签是可以重复打,同时标签越新其时效性越好;可以基于用户缓存,统计用户身上每种标签的个数,时效性和逻辑强度值并推导计算出标签相对于属性的属性的参考值;当属性的参考值大于预定阈值时,则确定该项属性。当属性的参考值小于或等于预定阈值时,则该项属性则由多个标签共同确定。
[0073]本发明实施例提出了一套通过打标签推导属性的方法,避免了因个人差异为用户画像而造成的差异;既保证了所有标签共同作用,又避免了因噪音标签对画像产生的误差;通过定期针对用户标签重新确定属性值,由此确保了用户画像的精确性,进一步避免了个性化信息推送的一成不变。
[0074]其中上述图1的方法,可以根据本发明的下述系统(参照图3)予以操作来实现。
[0075]行为检测单元,配置以:基于包括标签、属性、标签和属性之间的推导规则以及所述推导规则的逻辑强度值的标签规则库,检测用户行为,为所述用户打上各种标签;
[0076]属性预估单元,配置以:根据一段时间内为用户打上的每一种标签的数量、利用推导规则从标签推导出的属性、推导规则的逻辑强度值,确定每一种标签推导出的各种属性的参考值;
[0077]属性确定单元,配置以:将其中一种标签推导出的其中一种属性的参考值与预定阈值进行对比,判断是否能够确定用户属性包含所述其中一种属性,若否,则利用所述参考值连同其他标签下的对应于所述其中一种属性的参考值共同判断是否能够确定用户属性包含所述其中一种属性;
[0078]用户画像生成单元,配置以:根据所确定的用户属性,完成用户画像。
[0079]作为图3所示实施例系统的进一步优化,属性确定单元,其具体的工作方式可以是配置以:
[0080]将第一标签推导出的其中一种属性的第一参考值与预定阈值进行对比,当第一参考值大于阈值时,则确定用户属性包含所述其中一种属性,当第一参考值不大于阈值时,则不确定用户属性包含所述其中一种属性;将所述第一参考值与第二标签下的对应于所述其中一种属性的第二参考值加权求和,将所述加权求和所得的值与预定阈值进行对比,当所述加权求和所得的值大于阈值时,则确定用户属性包含所述其中一种属性,当所述加权求和所得的值不大于阈值时,则不确定用户属性包含所述其中一种属性;依次类推,直到能够确定用户属性包含所述其中一种属性。
[0081]当对用户的其中一种标签进行推导就可以确定用户属性时,则无需再对其他标签进行推导计算,降低了用户画像对服务器资源的消耗;当对用户的其中一个标签进行推导无法确定用户属性时,可以结合其他标签共同对用户属性进行推导,提高了所确定的用户属性的精确度。
[0082]作为图3所示实施例系统的进一步优化,所述系统还包括标签规则库建立单元,所述标签规则库建立单元配置以:提供标签、属性、以及标签和属性之间的推导规则;根据所述标签和属性之间的推导规则的强弱设置相应的逻辑强度值;
[0083]所述标签规则库建立单元包括:
[0084]标签群建立模块,所述标签群建立模块配置以:
[0085]建立标签群;
[0086]推导规则群建立模块,所述推导规则群建立模块配置以:
[0087]建立推导规则群,所述推导规则群包括推导规则、利用推导规则从标签推导出的属性、推导规则的逻辑强度值,包括:
[0088]释义所述标签群中的各个标签,获得与各个标签的逻辑释义相接近的匹配属性,分析各个标签和匹配属性之间的逻辑强度,并为各个标签与匹配属性之间的逻辑强度赋予与所述逻辑强度相对应的逻辑强度值,将各个逻辑强度值以各个相应的标签和所述匹配属性为key作为推导规则存储于推导规则群中。
[0089]通过分析标签与匹配属性之间的逻辑强度,将匹配属性与标签之间的逻辑强度做量化处理,并得到能反映逻辑强度的量化值,将此量化值作为逻辑强度值并相对应于标签和匹配属性存储于推导规则群中;由此建立的标签规则库应用于用户画像中,避免了因个人差异为用户画像而造成的差异。
[0090]作为图3所示实施例系统的进一步优化,在所述用户画像生成单元后还包括信息推送单元,配置以:在完成用户画像后,根据用户画像为用户进行个性化信息推送,并基于标签规则库,继续检测用户在收到所述个性化信息推送后的行为以重新确定用户属性。
[0091]基于用户画像为用户进行个性化信息推送,根据用户对个性化信息推送反馈的用户行为,重新确定用户属性,实现了对用户属性和用户画像的校准,同时也避免了对用户信息推送的一成不变。
[0092]在本发明一方面的应用上,本发明实施例中的个体用户画像系统可以是作为功能元件的形式内嵌于网站服务器中;作为本发明的另一方面的应用,本发明实施例中的个体用户画像系统还可以内嵌于云计算服务器中,此云计算服务器连接于网站服务器和用户终端之间。
[0093]以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0094]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0095]最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1.一种个体用户画像方法,包括: 基于包括标签、属性、标签和属性之间的推导规则以及所述推导规则的逻辑强度值的标签规则库,检测用户行为以确定用户属性,包括: -检测用户行为,为所述用户打上各种标签; -根据一段时间内为用户打上的每一种标签的数量和/或时效性、利用推导规则从标签推导出的属性、推导规则的逻辑强度值,确定每一种标签推导出的各种属性的参考值; -将其中一种标签推导出的其中一种属性的参考值与预定阈值进行对比,判断是否能够确定用户属性包含所述其中一种属性,若否,则利用所述参考值连同其他标签下的对应于所述其中一种属性的参考值共同判断是否能够确定用户属性包含所述其中一种属性; 根据所确定的用户属性,完成用户画像。2.根据权利要求1所述的方法,其特征在于,所述将其中一种标签推导出的其中一种属性的参考值与预定阈值进行对比,判断是否能够确定用户属性包含所述其中一种属性,若否,则利用所述参考值连同其他标签下的对应于所述其中一种属性的参考值共同判断是否能够确定用户属性包含所述其中一种属性包括: 将第一标签推导出的其中一种属性的第一参考值与预定阈值进行对比,当第一参考值大于阈值时,则确定用户属性包含所述其中一种属性,当第一参考值不大于阈值时,则不确定用户属性包含所述其中一种属性; 当基于所述第一参考值不确定用户属性包含所述其中一种属性时,利用所述第一参考值连同第二标签下的对应于所述其中一种属性的第二参考值加权求和所得的值与预定阈值进行对比,当第一参考值和第二参考值加权求和所得的值大于阈值时,则确定用户属性包含所述其中一种属性,当第一参考值和第二参考值加权求和所得的值不大于阈值时,则不确定用户属性包含所述其中一种属性; 依次类推,直到能够确定用户属性包含所述其中一种属性。3.根据权利要求1所述的方法,其特征在于,在完成用户画像后,根据用户画像为用户进行个性化信息推送,并基于标签规则库,继续检测用户在收到所述个性化信息推送后的行为以重新确定用户属性。4.根据权利要求1-3中任一项所述的方法,其特征在于,在所述基于包括标签、推导规贝1J、利用推导规则从标签推导出的属性、推导规则的逻辑强度值的标签规则库,检测用户行为以确定用户属性之前,还包括建立标签规则库: 提供标签、属性、以及标签和属性之间的推导规则; 根据所述标签和属性之间的推导规则的强弱设置相应的逻辑强度值。5.一种个体用户画像系统,包括: 行为检测单元,配置以:基于包括标签、属性、标签和属性之间的推导规则以及所述推导规则的逻辑强度值的标签规则库,检测用户行为,为所述用户打上各种标签; 属性预估单元,配置以:根据一段时间内为用户打上的每一种标签数量和/或时效性、利用推导规则从标签推导出的属性、推导规则的逻辑强度值,确定每一种标签推导出的各种属性的参考值; 属性确定单元,配置以:将其中一种标签推导出的其中一种属性的参考值与预定阈值进行对比,判断是否能够确定用户属性包含所述其中一种属性,若否,则利用所述参考值连同其他标签下的对应于所述其中一种属性的参考值共同判断是否能够确定用户属性包含所述其中一种属性; 用户画像生成单元,配置以:根据所确定的用户属性,完成用户画像。6.根据权利要求5所述的系统,其特征在于,所述属性确定单元,配置以: 将第一标签推导出的其中一种属性的第一参考值与预定阈值进行对比,当第一参考值大于阈值时,则确定用户属性包含所述其中一种属性,当第一参考值不大于阈值时,则不确定用户属性包含所述其中一种属性; 当基于所述第一参考值不确定用户属性包含所述其中一种属性时,利用所述第一参考值连同第二标签下的对应于所述其中一种属性的第二参考值加权求和所得的值与预定阈值进行对比,当第一参考值和第二参考值加权求和所得的值大于阈值时,则确定用户属性包含所述其中一种属性,当第一参考值和第二参考值加权求和所得的值不大于阈值时,则不确定用户属性包含所述其中一种属性; 依次类推,直到能够确定用户属性包含所述其中一种属性。7.根据权利要求5所述的系统,其特征在于,还包括信息推送单元,所述信息推送单元,配置以:在完成用户画像后,根据用户画像为用户进行个性化信息推送,所述行为检测单元、所述属性预估单元、所述属性确定单元、所述用户画像生成单元配置以基于所述标签规则库,继续检测用户在收到所述个性化信息推送后的行为以重新确定用户属性。8.根据权利要求5-7任一项所述的系统,其特征在于,所述标签规则库包括: 标签规则库建立单元,配置以: 提供标签、属性、以及标签和属性之间的推导规则; 根据所述标签和属性之间的推导规则的强弱设置相应的逻辑强度值。
【文档编号】G06F17/30GK105893407SQ201510777008
【公开日】2016年8月24日
【申请日】2015年11月12日
【发明人】张幼明
【申请人】乐视云计算有限公司