[0045]步骤102,每当用户接入一次上述网络服务,则针对该用户建立一个临时用户画像;或者,可以按照一定的时间周期,定期为用户建立临时用户画像。每当建立临时用户画像时,该临时用户画像从步骤101的所述用户画像中继承根据自然分类生成的描述性标签属性,以便反映用户的性别、年龄等固有属性;而临时用户画像中反映用户行为和/或内容的描述性标签属性则将通过以下步骤获得。
[0046]步骤103,获得有效时间期限内的用户的行为数据和/或内容数据。有效时间期限是预设的固定值,例如将用户每次重新接入网络服务起所经历的时间作为有效时间期限;或者,可以按照一定的时间周期,将固定的时间段(如48小时)作为有效时间期限。按照与步骤101相同的方法,获得在有效时间期限内的用户的行为数据和/或内容数据。
[0047]步骤104,判断有效时间期限内的用户行为和/或内容与用户画像中根据行为分类和/或内容分类生成的描述性标签属性的匹配度。计算有效时间期限内的用户行为和/或内容与用户画像中根据行为分类和/或内容分类生成的描述性标签属性的匹配度的步骤具体包括:将有效时间期限内的用户行为和/或内容归入对应的行为分类和/或内容分类的最底层类目;比较该最底层类目是否属于与描述性标签属性相对应的行为分类和/或内容分类的最底层类目,若属于则计入最大分值;若该最底层类目不属于与描述性标签属性相对应的行为分类和/或内容分类的最底层类目,则进一步判断该最底层类目是否与描述性标签属性相对应的行为分类和/或内容分类的最底层类目从属于同一个上级类目,若从属于同一个上级类目则计入中间分值;若该最底层类目不与描述性标签属性相对应的行为分类和/或内容分类的共同从属于任何一级类目,则计入零分值;将所有分值求和作为所述匹配度。举例来说,有效时间期限内的用户查询了关于建筑用起重机悬臂的网页,访问停留时间50分钟;则有效时间期限内产生的内容数据可归入“工程与设备-建筑机械-起重机-起重机零部件”的类目,访问停留时间的行为数据可归入“普通停留-半小时至I小时”的类目;而用户画像中该用户根据行为分类和/或内容分类生成的描述性标签属性是“汽车”,“零部件”以及“深度使用用户”,对于描述性标签属性是“汽车”,“零部件”,其对应的分类类目是“工程与设备-交通-汽车-汽车零部件”,由于有效时间期限内产生的内容数据归入的最底层类目与描述性标签属性的最底层类目不同,因此不能计入最大分值,但二者从属于同一个上级类目“工程与设备”,故可以计入一个中间分值;而对于访问停留时间的行为数据,由于与描述性标签属性“深度使用用户”不共同从属于任何一级类目,则计入零分值。将所有分值求和,作为所述匹配度。
[0048]步骤105,当所述匹配度大于阈值的情况下,说明用户当前的行为与内容与用户画像具有较高的一致性,故而可以参照原有的用户画像为用户提供服务,因此,使所述临时用户画像继承用户画像中匹配度大于阈值的描述性标签属性。这种情况下,首先统计有效时间期限内的用户行为和/或内容在行为分类和/或内容分类中的分布,进而根据统计结果更新用户画像中根据行为分类和/或内容分类生成的描述性标签属性,再使所述临时用户画像继承用户画像中根据行为分类和/或内容分类生成的描述性标签属性。
[0049]当匹配度小于阈值的情况下,相反,说明用户在有效时间内的行为和内容已经偏离了用户画像,则不再继承用户画像中的描述性标签属性;若用户画像中没有与当前有效时间期限内的行为和内容匹配的描述性标签属性,则统计有效时间期限内的用户行为和/或内容在行为分类和/或内容分类中的分布,在临时用户画像中生成与行为分类和/或内容分类对应的描述性标签属性。
[0050]步骤106,评估临时用户画像的成熟度,当达到成熟时采用临时用户画像替代原来的用户画像。评估临时用户画像的成熟度的具体步骤包括:提取最近若干个临时用户画像,比较其中最新的临时用户画像与其它临时用户画像中非从用户画像继承的描述性标签属性的重合率,当平均重合率大于重合阈值时则认为最新的临时用户画像达到成熟。
[0051]作为临时用户画像的作用,可以应用所述临时用户画像进行用户偏好分析以及信息和/或服务提供。
[0052]如图2所示,本发明进而提供了一种基于大数据的用户画像管理系统,其特征在于,包括:
[0053]用户画像提供模块201,用于根据在先积累的用户数据建立包括描述性标签属性的用户画像;
[0054]临时用户画像建立模块202,用于建立临时用户画像;所述临时用户画像从所述用户画像中继承根据自然分类生成的描述性标签属性;
[0055]用户数据接口203,获得有效时间期限内的用户行为和/或内容;
[0056]匹配度判断模块204,用于判断有效时间期限内的用户行为和/或内容与用户画像中根据行为分类和/或内容分类生成的描述性标签属性的匹配度;
[0057]临时用户画像更新模块205,当所述匹配度大于阈值的情况下,所述临时用户画像更新模块使所述临时用户画像继承用户画像中根据行为分类和/或内容分类生成的描述性标签属性;当匹配度小于阈值的情况下,临时用户画像更新模块统计有效时间期限内的用户行为和/或内容在行为分类和/或内容分类中的分布,在临时用户画像中生成与行为分类和/或内容分类对应的描述性标签属性;其中,当所述匹配度大于阈值的情况下,用户画像更新模块206首先统计有效时间期限内的用户行为和/或内容在行为分类和/或内容分类中的分布,进而根据统计结果更新用户画像中根据行为分类和/或内容分类生成的描述性标签属性,临时用户画像更新模块205再使所述临时用户画像继承用户画像中根据行为分类和/或内容分类生成的描述性标签属性;
[0058]用户画像更新模块206,用于评估临时用户画像的成熟度,当达到成熟时采用临时用户画像替代原来的用户画像。
[0059]其中,所述匹配度判断模块204计算有效时间期限内的用户行为和/或内容与用户画像中根据行为分类和/或内容分类生成的描述性标签属性的匹配度具体包括:将有效时间期限内的用户行为和/或内容归入对应的行为分类和/或内容分类的最底层类目;比较该最底层类目是否属于与描述性标签属性相对应的行为分类和/或内容分类的最底层类目,若属于则计入最大分值;若该最底层类目不属于与描述性标签属性相对应的行为分类和/或内容分类的最底层类目,则进一步判断该最底层类目是否与描述性标签属性相对应的行为分类和/或内容分类的最底层类目从属于同一个上级类目,若从属于同一个上级类目则计入中间分值;若该最底层类目不属于与描述性标签属性相对应的行为分类和/或内容分类的任何一级类目,则计入零分值;将所有分值求和作为所述匹配度。
[0060]用户画像更新模块206评估临时用户画像的成熟度的具体包括:提取最近若干个临时用户画像,比较其中最新的临时用户画像与其它临时用户画像中非从用户画像继承的描述性标签属性的重合率,当平均重合率大于重合阈值时则认为最新的临时用户画像达到成熟。
[0061]所述用户画像管理系统还包括画像应用模块207,用于应用所述临时用户画像进行用户偏好分析以及信息和/或服务提供。
[0062]通过本