1.本说明书一个或多个实施例涉及数据分析技术领域,尤其涉及一种基于大数据的用户管理方法及系统。
背景技术:2.随着互联网技术的发展,人们对互联网平台的使用越来越普遍,如何提高用户黏性,提供用户感兴趣的内容一直是各大内容平台研究的课题,但目前的内容推送算法,多是根据用户的历史行为提取特征,再根据特征进行内容匹配推送,容易导致用户接触的内容覆盖面狭窄,也就是陷入信息茧房的困扰。
技术实现要素:3.有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于大数据的用户管理方法及系统,以解决目前的推荐算法容易造成信息茧房的问题。
4.基于上述目的,本说明书一个或多个实施例提供了一种基于大数据的用户管理方法,包括以下步骤:
5.基于大数据得出多个用户行为模板;
6.预先定义用户的行为对应的行为标签和各行为标签对应的分值;
7.获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;
8.对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签;
9.从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板;
10.对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签;
11.基于扩展行为标签,为用户添加标记,并推荐相关内容。
12.优选地,本方法还包括:
13.对于扩展行为标签,记录推送相关内容后设定时间内用户在该扩展行为标签上的计分情况,若计分低于设定值,停止对扩展行为标签相关内容的推送。
14.优选地,基于大数据得出多个用户行为模板包括:
15.使任意两个用户行为模板中重复的行为标签数量不超过设定个数。
16.优选地,用户的行为包括但不限于头像的设置、个人信息的填写、使用平台的时间段、所处的地区、点击行为、观看行为、停留时长。
17.优选地,为用户行为涉及的各行为标签进行分别计分包括:
18.若某一行为标签的计分值超过设定值,则降低对应的用户行为中该行为标签的权重。
19.优选地,本方法还包括:获取用户的行为特征,并将用户的行为特征进行特征变
换,得到行为标签。
20.优选地,本方法还包括:获取用户的行为特征,并将用户的行为特征进行特征交叉,得到行为标签。
21.本说明书还提供一种基于大数据的用户管理系统,包括:
22.行为模板模块:用于基于大数据得出多个用户行为模板;
23.预设模块,用于预先定义用户的行为对应的行为标签和各行为标签对应的分值;
24.计分模块,用于获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;
25.排名模块,用于对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签;
26.匹配模块,用于从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板;
27.扩展模块,用于对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签;
28.内容推荐模块,用于基于所述扩展行为标签,为用户添加标记,并推荐相关内容。
29.从上面所述可以看出,本说明书一个或多个实施例提供的基于大数据的用户管理方法及系统,通过基于大数据得出多个用户行为模板,获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;并得出核心行为标签,进一步选取对照行为标签,进行大数据匹配,得出在对照行为标签上相似度最高的用户行为模板;进而得出扩展行为标签,并基于扩展行为标签为用户推荐相关内容,可以扩展用户接触到的内容的类型,起到打破信息茧房的效果。
附图说明
30.为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
31.图1为本说明书一个或多个实施例的用户管理方法流程示意图。
具体实施方式
32.为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本公开进一步详细说明。
33.需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关
系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
34.本说明书实施例提供一种基于大数据的用户管理方法,包括以下步骤:
35.s01.基于大数据得出多个用户行为模板。
36.举例来说,在得出多个用户行为模板时,应当使任意两个用户行为模板中重复的行为标签数量不超过设定个数,以保证各用户行为模板的差异性,以及使其具有代表性。
37.s02.预先定义用户的行为对应的行为标签和各行为标签对应的分值。
38.举例来说,上述用户的行为包括但不限于头像的设置、个人信息的填写、使用平台的时间段、所处的地区、点击行为、观看行为、停留时长等。
39.举例来说,用户头像的设置也能反映用户一部分的偏好,如当用户设置头像后,可以对用户的图像通过图像搜索引擎进行检索,即以图搜图,若能检索到匹配的图像,即可以通过匹配到的图像的信息得出用户头像的信息,如用户设置的头像为游戏相关人物的头像,则可以在与游戏相关的行为标签上为用户计分。
40.上述个人信息可包括用户的年龄段、性别等,点击行为、观看行为、停留时长即为用户在某一类别的内容上作出的操作,如某一视频包含的行为标签为美食和旅游,则用户通过点击和观看该视频,即会在对应的行为标签上计分。
41.s03.获取用户的行为、根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分。
42.举例来说,若某一行为标签的计分值超过设定值,则降低对应的用户行为中该行为标签的权重,如用户观看美食类视频较多,则在美食相关的行为标签上的计分值较高,为了不使各行为标签计分值产生过大的差异,以及考虑到边际效应,则包含有美食类行为标签的内容,在该行为标签上的权重应当降低。
43.s04.对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签。
44.s05.从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板。
45.s06.对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签。
46.s07.基于所述扩展行为标签,为用户添加标记,并推荐相关内容。
47.举例来说,为了避免用户在推荐算法中进入信息茧房,但又尽量能够向用户推荐用户感兴趣的内容,本实施例提供的方式就是找到与用户的行为特征存在部分相近的用户行为模板,再从该用户行为模板中提取出与用户不同的扩展行为标签,基于该扩展行为标签,为用户推荐相关内容,如用户在一段时间内观看了大量的美食视频,现有的推荐算法会根据用户的喜好一直推荐美食相关内容,就可能造成信息茧房的情况,而本实施例提供的方法,会进一步分析用户的行为标签,如用户使用平台的时间多为深夜,所处地区为北京,头像使用的是自拍,根据这些行为标签找到匹配的用户行为模板,再从该用户行为模板中找到排名靠前但不与用户重复的扩展行为标签,该一个或多个扩展行为标签即为用户可能有兴趣的,但按传统推荐算法不会推荐给用户的内容,以此能够扩展用户接触到的内容的类型,起到打破信息茧房的效果。
48.作为一种实施方式,本方法还包括:对于扩展行为标签,记录推送相关内容后设定
时间内用户在该扩展行为标签上的计分情况,若计分低于设定值,停止对扩展行为标签相关内容的推送,举例来说,本实施例虽然通过匹配用户行为模板的方式,得出用户可能感兴趣的行为标签,但也可能会遇到判断错误,用户并不感兴趣的情况,因此通过上述设置,如在10小时的使用时间内获取用户在该行为标签上的计分值,若计分值较低,则不再进行推送,提高用户的使用体验。
49.作为一种实施方式,本方法还包括,获取用户的行为特征,并将用户的行为特征进行特征变换,得到行为标签,举例来说,若用户头像设置为动漫人物,则可以将该行为特征变换为对应“动漫”的行为标签,若用户输入个人信息的年龄为35岁,则可以将该行为特征变换为对应“中年人”的行为标签。
50.作为一种实施方式,本方法还包括,获取用户的行为特征,并将用户的行为特征进行特征交叉,得到行为标签,举例来说,用户填写的年龄为40岁,性别为女性,则可以将两个行为特征交叉,得到行为标签为中年女性。
51.本说明书实施例还提供一种基于大数据的用户管理系统,包括:
52.行为模板模块:用于基于大数据得出多个用户行为模板;
53.预设模块,用于预先定义用户的行为对应的行为标签和各行为标签对应的分值;
54.计分模块,用于获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;
55.排名模块,用于对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签;
56.匹配模块,用于从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板;
57.扩展模块,用于对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签;
58.内容推荐模块,用于基于所述扩展行为标签,为用户添加标记,并推荐相关内容。
59.本说明书实施例提供的基于大数据的用户管理方法及系统,通过基于大数据得出多个用户行为模板;获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;并得出核心行为标签,进一步选取对照行为标签,进行大数据匹配,得出在对照行为标签上相似度最高的用户行为模板;进而得出扩展行为标签,并基于扩展行为标签为用户推荐相关内容,可以扩展用户接触到的内容的类型,起到打破信息茧房的效果。
60.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
61.本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。