一种确定用户特征标签的方法及装置与流程

文档序号:15984138发布日期:2018-11-17 00:41阅读:280来源:国知局

本申请涉及计算机技术领域,尤其涉及一种确定用户特征标签的方法及装置。

背景技术

随着终端和互联网的发展,用户能够获取到各种各样的互联网信息,且在对互联网信息分类逐步细化的情况下,用户群体的个性化体现愈发突出,而确定出用户的特征标签,对于了解用户的需求尤为重要。

通常情况下,可以根据用户的自主设置确定用户特征标签、了解用户的需求,比如可以获取用户在应用程序中自主添加的特征标签,然而,并非所有用户均会愿意自主添加特征标签,所以通过这种方式确定用户的特征标签准确性较低、也不够全面,也不利于准确、全面地了解用户的需求。



技术实现要素:

本申请实施例提供一种确定用户特征标签的方法和装置,用于提高确定用户特征标签的准确性和全面性、有利于准确、全面地了解用户的需求。

为解决上述技术问题,本申请实施例是这样实现的:

本申请实施例采用下述技术方案:

一种确定用户特征标签的方法,包括:

根据用户的位置信息,以及所述用户终端安装的应用,确定出所述用户所处的区域,以及各区域对应的应用榜单;所述区域根据地理信息预先划分,所述应用榜单根据应用的安装次数确定;

根据所述用户终端安装的应用,以及所述各区域对应的应用榜单,确定出所述用户所属的区域;

基于所述各区域、对应的区域属性,以及所述用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群;

对所述多个区域用户群中用户终端安装应用的应用标签进行聚类,确定出所述多个区域用户群的特征标签;所述应用标签根据所述用户终端安装的应用确定。

优选地,确定所述多个区域用户群的特征标签,包括:

将各区域用户群中,聚类簇由大至小的前第一预定个数对应的特征标签,确定为各区域用户群的特征标签。

优选地,确定所述多个区域用户群的特征标签,包括:

将所述多个区域用户群对应的聚类簇进行由大至小排序;

确定特定聚类簇在所述多个区域用户群中的多个排位;

在所述多个排位中,确定出目标排位,其中排位低于所述目标排位的其他排位的占比超过预定比例;

将所述目标排位对应的特定聚类簇,作为所述目标排位对应的区域用户群的特征标签。

将出现次数超过预设次数的候选特征标签删除,并将剩余的候选特征标签作为所述多个区域用户群的特征标签。

优选地,确定所述多个区域用户群的特征标签,包括:

确定出所述多个区域用户群的候选特征标签;

将仅对应于目标区域用户群中的候选特征标签,确定为所述目标区域用户群的特征标签。

优选地,将仅对应于目标区域用户群中的候选特征标签,确定为所述目标区域用户群的特征标签,包括:

将仅对应于目标区域用户群中、且聚类簇由大至小的前第二预定个数对应的候选特征标签,确定为所述目标区域用户群的特征标签。

一种确定用户特征标签的装置,包括:第一确定模块、第二确定模块、第一聚类模块以及第二聚类模块,其中,

所述第一确定模块,用于根据用户的位置信息,以及所述用户终端安装的应用,确定出所述用户所处的区域,以及各区域对应的应用榜单;所述区域根据地理信息预先划分,所述应用榜单根据应用的安装次数确定;

所述第二确定模块,用于根据所述用户终端安装的应用,以及所述各区域对应的应用榜单,确定出所述用户所属的区域;

所述第一聚类模块,用于基于所述各区域、对应的区域属性,以及所述用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群;

所述第二聚类模块,用于对所述多个区域用户群中用户终端安装应用的应用标签进行聚类,确定出所述多个区域用户群的特征标签;所述应用标签根据所述用户终端安装的应用确定。

优选地,所述第二聚类模块,用于:

将各区域用户群中,聚类簇由大至小的前第一预定个数对应的特征标签,确定为各区域用户群的特征标签。

优选地,所述第二聚类模块,用于:

将所述多个区域用户群对应的聚类簇进行由大至小排序;

确定特定聚类簇在所述多个区域用户群中的多个排位;

在所述多个排位中,确定出目标排位,其中排位低于所述目标排位的其他排位的占比超过预定比例;

将所述目标排位对应的特定聚类簇,作为所述目标排位对应的区域用户群的特征标签。

优选地,所述第二聚类模块,用于:

确定出所述多个区域用户群的候选特征标签;

将仅对应于目标区域用户群中的候选特征标签,确定为所述目标区域用户群的特征标签。

优选地,所述第二聚类模块,用于:

将仅对应于目标区域用户群中、且聚类簇由大至小的前第二预定个数对应的候选特征标签,确定为所述目标区域用户群的特征标签。

由以上实施例提供的技术方案可见,可以根据用户的位置,以及用户终端安装的应用,确定出用户的所处区域和各区域应用榜单,根据用户安装的应用与各应用榜单的匹配程度,确定用户所属区域,此后可以基于各区域以及对应的区域属性,各用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群,最后可以基于各区域用户群中用户安装的应用的标签进行聚类,确定出各区域用户群的特征标签。相比于根据用户自主设置确定用户特征标签而言,本申请实施例可以结合区域因素以及用户真实安装应用的因素,通过聚类方式生成区域用户群,并再根据用户安装应用的标签,确定区域用户群的特征。提高确定用户特征标签的准确性和全面性、有利于准确、全面地了解用户的需求。

附图说明

为了更清楚地说明本申请实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的确定用户特征标签的方法的流程示意图;

图2为本申请实施例提供的确定用户特征标签的方法的流程示意图;

图3为本申请实施例提供的确定用户特征标签的装置的结构示意图;

图4为本申请实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本申请的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

以下结合附图,详细说明本申请中各实施例提供的技术方案。

实施例1

本申请实施例提供一种确定用户特征标签的方法,用于在确定用户的特征标签时,提高准确性和全面性,从而利于准确、全面地了解用户的需求。该方法的流程示意图如图1所示,假设执行主体可以是服务端,包括:

步骤11:根据用户的位置信息,以及用户终端安装的应用,确定出用户所处的区域,以及各区域对应的应用榜单。

用户的位置信息可以是指用户在使用终端时所在的位置,比如对于移动终端而言,用户在使用过程中可以由移动终端内的硬件生成位置信息,从而执行本方法的服务端可以被动接收终端上传的位置信息,或主动向终端发送请求,以便获取到终端的位置信息。

终端安装的应用可以是指用户在使用终端过程中,为了满足各种需求安装的应用程序(application,app)。在本步骤中,可以获取到全网用户的位置信息,以及该全网用户终端中安装的应用。而对于全网用户的选择,可以根据实际需求而定,比如可以是全世界、全国或全省市等。

在实际应用中,出于各种原因,可能会按照不同地理信息维度划分区域,比如可以按照洲、国家、省市、宗教、人文等维度划分区域,所以本步骤中可以预先根据地理信息划分出多个区域,也即本步骤中的区域可以是根据地理信息进行预先划分,比如就可以根据全世界国家的个数,划分出该个数的区域。而每个区域均可以是由位置信息表征的范围,比如该位置信息可以是经纬度信息,则每个区域均可以是由多个经纬度信息组成的区域。

在得到用户的位置信息,以及预先划分出的各区域后,就可以确定出用户所处的区域,比如中国可以是由多个经纬度信息组成的区域,当用户的经纬度信息落在在该区域内时,则可以认为该用户的所处区域为中国。

各区域对应的应用榜单可以是指,各区域内的用户在终端中安装的应用次数的排行榜,比如在某个区域内,用户在终端中安装app1的次数最多,则该app1在该区域的应用榜单中可以排行第一,也即应用榜单可以根据应用的安装次数确定。其实际意义在于,不同的区域由于发展程度、生活节奏、文化等差异,对app的需求可能存在差异,而对于生活在同一区域的用户而言,其对于app的需求一般是符合这一区域的共同需求。比如对于一线城市而言,生活节凑较快、空闲时间较少,故网购app和交通app可能非常流行,但对于三线城市而言,生活节凑较慢,空闲时间较多,网购app和交通app可能需求不大。所以可以根据用户终端安装app的情况,为各区域分别确定出一个app榜单,该榜单中可以包含预定个数的、在对应区域内app安装次数由大至小的app名单。而app榜单也在一定程度上体现了对应区域的特征。

在实际应用中,也可以根据用户在终端中对于互联网信息的行为记录,确定所处的区域,以及各区域对应的互联网信息榜单,比如可以根据音频播放记录,视频播放记录,新闻阅读记录等,确定音频榜单、视频榜单、新闻榜单等。但这些互联网信息的行为记录,受流行因素的影响较大,反映需求的准确性较低,而app通常在日常生活中使用率较高,能够较为准确地反映出用户的特征。

步骤12:根据用户终端安装的应用,以及各区域对应的应用榜单,确定出用户所属的区域。

在当前社会,随着交通工具的发展以及多领域的频繁交流,用户可以频繁出入不同区域,比如大量的外国人、外地人等,就是用户频繁出入不同区域的体现。所以用户的所处区域,并不一定能代表用户的所属区域,也即用户所在的区域,并不一定说明用户是属于这个区域的。

但上文已经介绍,用户终端中安装的app可以较为准确地反映出用户的特征,比如一个临时旅游的外国人,终端中安装的app依旧符合原国籍的需求特征,而对于定居外国的外国人,终端中的app有极高可能性已经与居住地的特征类似。具体比如,美国人来中国旅游,但其终端中的app依旧会符合大多数美国人的需求,但美国人来中国定居,其终端中安装的app基本符合中国人的需求。所以,本步骤可以根据用户终端安装的app以及各区域的应用榜单,确定出用户所属的区域。具体地,可以将用户终端安装的app与app榜单进行匹配,选出匹配度最高的一组,从而确定出用户所属的区域,该用户所属的区域,也可以称为行为区域,比如对于区域是国家而言,可以确定出用户的行为国家。

步骤13:基于各区域、对应的区域属性,以及用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群。

在实际应用中,由于是预先划分出的区域,比如针对区域是国家的情况,但不同的国家并不意味着特性不同,且在前文已经介绍,用户所处区域和所属区域可能不一致,所以本步骤可以基于各区域、以及用户的所处、所属区域进行聚类,得到区域用户群。

在前文已经介绍,划分各区域时,可以出于不同维度进行划分具体地,不同区域可以有不同的区域属性,比如位置、宗教、信仰、文化等、区域的收支水平、平均年龄等,这些属性均可以在一定程度上表征不同的特性。

而对于用户本身,也有可能存在不同的用户属性,具体地,可以在使用终端时设置不同的语言、购买不同的品牌、设置不同的时区、设置不同的解锁方式等。

所以,本步骤可以基于上述参数进行聚类,具体地可以基于各区域的标识、各区域对应的区域属性、全网中每个用户的所处区域的标识、所属区域的标识、以及用户各自对应的用户属性进行聚类,生成多个区域用户群。具体地,可以选用k-means算法进行聚类,k-means算法是一种比较典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇(或称聚类中心)作为最终目标。具体比如,在各区域是国家的情况下,通过反复测试,确定出10~20个区域用户群。

步骤14:对多个区域用户群中用户终端安装应用的应用标签进行聚类,确定出多个区域用户群的特征标签。

在前述步骤中,已经确定出了多个区域用户群,而在前文已经提到,用户终端安装的app可以较为真实的反映出用户的需求,所以本步骤可以根据区域用户群中,用户终端安装的应用,确定区域用户群的特征。

具体地,可以先对全网用户在终端安装的app确定出app标签,也即app标签可以根据用户终端安装的app确定。进一步地,可以通过开发者对app的描述,从中确定出app的标签。其中,可以在app商店中获取到开发者的app描述,具体比如,可以在googleplay应用商店中,获取到对应用的描述,从而对描述进行提取,确定出app标签。在一种实施方式中,可以通过textrank、tfidf、rake等算法进行语义标签提取,还可以进行ner命名实体识别,对描述中的产品名等命名实体进行提取,并将二者结合生成app的标签。而在实际应用中,可以根据实际需求任选其一,或两者均选取。

在确定出app标签后,便可以对多个区域用户群中,用户终端安装app的app标签进行聚类,确定出多个区域用户群的特征标签,具体地,可以先对app标签通过glove算法进行向量化表示,从而根据向量化表示的app标签使用dbscan算法进行聚类,生成不同的簇,并以不同的簇作为特征标签,从而确定出多个区域用户群的特征标签。比如,对于某个区域用户群,可以获取到用户群的用户在终端中安装的所有app的app标签,并对app标签进行向量化表示,并通过dbscan算法,确定出n个聚类簇,从而确定出该区域用户群的n个特征标签。

在实际应用中,通常可以为区域用户群确定出很多个特征标签,但在聚类结果中,每个聚类簇的大小均不同,而聚类结果中的聚类簇大小不一,通常情况下,聚类簇越大则表明特征越强烈,据此可以对聚类簇由大至小进行排序,排位靠前的会比排位靠后的更好地体现特征,所以,在一种实施方式中,确定出多个区域用户群的特征标签,可以包括:将各区域用户群中,聚类簇由大至小的前第一预定个数对应的特征标签,确定为各区域用户群的特征标签。具体地,聚类簇由大至小的前第一预设个数对应的特征标签,就可以是最好体现特征的特征标签,比如第一预设个数可以是6个,则可以将聚类簇最大的6个对应的特征标签,确定为各区域用户群的特征标签。

在实际应用中,有可能出现多个区域用户群具有相同的特征标签的情况,比如一共有10个区域用户群,在6个区域用户群中出现了体育特征标签,即在6个区域用户群中出现了体育这个聚类簇,但上文已经介绍,聚类簇越大则表明特征越强烈,据此可以对聚类簇由大至小进行排序,所以可以理解,对于相同的聚类簇,在区域用户群中排位较高,则在一定程度上相比于其他区域用户群而言,可以代表这个区域用户群的特征,若在区域用户群中排位较低,则在一定程度上相比于其他区域用户群而言,无法代表这个区域用户群的特征。所以在一种实施方式中,确定出多个区域用户群的特征标签,可以包括:将多个区域用户群对应的聚类簇进行由大至小排序;确定特定聚类簇在多个区域用户群中的多个排位;在多个排位中,确定出目标排位,其中排位低于目标排位的其他排位的占比超过预定比例;将目标排位对应的特定聚类簇,作为目标排位对应的区域用户群的特征标签。具体地,在对各区域用户群中用户终端安装应用的应用标签进行聚类后,可以得到针对各区域用户群的多个聚类簇,据此可以将多个聚类簇由大至小排序,排位越高的聚类簇,则代表该区域用户群对应的特征表现越强烈,此后可以从多个区域用户群的多个聚类簇中,选出至少一个特定聚类簇,比如体育这个聚类簇,从而确定出该特定聚类簇在多个区域用户群中的多个排位,具体比如在区域用户群1中,体育聚类簇的排位是第2、在区域用户群2中,体育聚类簇的排位是第3、在区域用户群3中,体育聚类簇的排位是第8等,如果体育聚类簇出现在6个区域用户群中,则可以得到6个排位。进一步,可以在这6个排位中,确定出目标排位,对于目标排位的选择,可以是排位低于目标排位的其他排位的占比超过预定比例,比如可以先假设候选目标排位为第2位(区域用户群1中),预定比例可以是30%,如果低于第2位的其他排位的占比超过30%,则可以将候选目标排位确定为目标排位。具体比如对于该例,有5个排位均低于第2排位,则低于第2排位的其他排位的占比为83.3%,超过预定比例30%,则可以确定为目标排位。最后,可以将该目标排位对应的特定聚类簇,作为目标排位对应的区域用户群的特征标签,比如,该第2排位对应的特定聚类簇为体育,该第2排位对应的区域用户群是区域用户群1,则可以将体育作为区域用户群1的特征标签。类似地,还可以继续假设候选目标排位为第3位(区域用户群2中),有4个排位均低于第3排位,则低于第3排位的其他排位的占比为66.7%,也超过预定比例30%。则也可以将体育将体育作为区域用户群2的特征标签.

在实际应用中,有可能不同区域用户群确定出的特征标签存在相同的情况,比如,对足球这一特征标签,可能存在于多个区域用户群,又如对于中国而言,由于基础建设丰富且更新维护频繁、导航这一特征标签,存在于多个省市。而存在于多个区域用户群中的特征标签,在一定程度上属于特殊性较弱的特征,就如同由于绝大多数省市的道路网较为复杂,导航标签存在于80%的省市中,则导航标签就具备较弱的特殊性,所以,在一种实施方式中,为了突出区域用户群的特征标签的特殊性,使特征标签能够更突出体现用户群的特征,确定多个区域用户群的特征标签,可以包括:确定出多个区域用户群的候选特征标签;将出现次数超过预设次数的候选特征标签删除,并将剩余的候选特征标签作为多个区域用户群的特征标签。具体地,可以根据(对多个区域用户群中用户终端安装应用的应用标签进行聚类)得到的聚类结果,确定出多个区域用户群的候选特征标签,比如区域用户群1可以确定出n个候选特征标签,区域用户群2可以确定出m个候选特征标签,区域用户群3可以确定出p个候选特征标签,等。再从各区域的候选特征标签中,查找出现次数超过预设次数的候选特征标签,比如预设次数可以是4次,则可以从各区域的候选特征标签中,查找出现5次的候选特征标签,也即在至少5个区域用户群中出现的候选特征标签。这些候选标签对体现区域用户群的特征效果不明显,则可以将这些候选特征标签删除,将剩余的候选特征标签作为所述多个区域用户群的特征标签。

在一种实施方式中,为了更进一步突出区域用户群的特征标签的特殊性,使特征标签能够更突出的体现用户群的特征,将出现次数超过预设次数的候选特征标签删除,并将剩余的候选特征标签作为多个区域用户群的特征标签,可以包括:将仅对应于目标区域用户群中的候选特征标签,确定为该目标区域用户群的特征标签。具体地,为达到尽可能突出区域用户群的特征的目的,可以将仅对应于目标区域用户群中的候选特征标签,确定为该目标区域用户群的特征标签。比如,某个候选特征标签,仅在区域用户群1中出现,则可以将该候选特征标签确定为区域用户群1的特征标签。

在前文已经介绍,聚类结果中的聚类簇大小不一,排位靠前的会比排位靠后的更好地体现特征。所以,在一种实施方式中,将仅对应于目标区域用户群中的候选特征标签,确定为该目标区域用户群的特征标签,可以包括:将仅对应于目标区域用户群中、且聚类簇由大至小的前第二预定个数对应的候选特征标签,确定为目标区域用户群的特征标签。具体地,可以类似于上文的介绍,先选取出仅对应于目标区域用户群中的候选特征标签,再从这些候选特征标签中,选取聚类簇由大至小的前第二预定个数对应的候选特征标签。比如第二预定个数也可以是6个,则可以选取出仅在区域用户群1中出现过,且聚类簇最大的6个对应的候选特征标签,作为区域用户群1的特征标签。

由以上实施例提供的技术方案可见,在本实施例中,可以根据用户的位置,以及用户终端安装的应用,确定出用户的所处区域和各区域应用榜单,根据用户安装的应用与各应用榜单的匹配程度,确定用户所属区域,此后可以基于各区域以及对应的区域属性,各用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群,最后可以基于各区域用户群中用户安装的应用的标签进行聚类,确定出各区域用户群的特征标签。相比于根据用户自主设置确定用户特征标签而言,本申请实施例可以结合区域因素以及用户真实安装应用的因素,通过聚类方式生成区域用户群,并再根据用户安装应用的标签,确定区域用户群的特征。提高确定用户特征标签的准确性和全面性、有利于准确、全面地了解用户的需求。

实施例2

基于相同的发明构思,以全世界的各个国家为单位区域,提供一种确定用户特征标签的方法,用于在确定用户的特征标签时,提高准确性和全面性,从而利于准确、全面地了解用户的需求。该方法的流程示意图如图2所示,假设执行主体可以是服务端,包括:

步骤21:根据用户的位置信息,以及用户终端安装的应用,确定出用户所处国家,以及各国应用热榜。

每个国家均可以有一组由经纬度信息确定出的范围,可以根据用户终端的位置信息,确定出所处国家,而通过终端安装的应用,可以确定出各国对于app的安装热榜,即根据app安装次数,确定出的app热门榜单。

步骤22:根据用户终端安装的应用,以及各国应用热榜,确定出用户的行为国家。

行为国家可以是指用户所属国家,可以通过用户在终端中安装的app与各国app热榜进行匹配而确定。

步骤23:基于各国家、国家属性,用户的所处国家、所属国家、用户属性进行聚类,生成多个区域用户群。

可以基于国家名称、国家的宗教、信仰、文化、收支水平、用户的所处国家名称、所属国家名称、用户的终端设备、语言、时区、解锁方式等,进行聚类,生成多个区域用户。具体地,可以通过k-means算法,确定出10~20个区域用户群,比如,体现在实际的地理位置中,可以包含东亚、南亚、欧亚、北欧、中欧、北美等多个区域用户群。

步骤24:对多个区域用户群中用户终端安装应用的应用标签进行聚类,确定出多个区域用户群的特征标签。

本步骤可以先通过提取全网应用的描述,确定出各app的app标签,在确定目标区域用户群的特征标签时,可以基于该目标区域用户群中用户安装的所有app的标签进行聚类,生成若干个聚类中心(聚类簇),再通过实施例1中的其中一种方式,确定各区域用户群的特征标签。

由以上实施例提供的技术方案可见,在本实施例中,可以根据用户的位置,以及用户终端安装的应用,确定出用户的所处国家和各国应用热榜,根据用户安装的应用与各应用热榜单的匹配程度,确定用户行为国家,此后可以基于各国以及对应的国家属性,各用户的所处国家、所属国家、对应的用户属性进行聚类,生成多个区域用户群,最后可以基于各区域用户群中用户安装的应用的标签进行聚类,确定出各区域用户群的特征标签。相比于根据用户自主设置确定用户特征标签而言,本申请实施例可以结合区域因素以及用户真实安装应用的因素,通过聚类方式生成区域用户群,并再根据用户安装应用的标签,确定区域用户群的特征。提高确定用户特征标签的准确性和全面性、有利于准确、全面地了解用户的需求。

实施例3

基于相同的发明构思,本申请实施例3提供了一种确定用户特征标签的装置,用于实现实施例1和2所述的方法。该装置的结构示意图如图3所示,包括:第一确定模块31、第二确定模块32、第一聚类模块33以及第二聚类模块34,其中,

所述第一确定模块31,可以用于根据用户的位置信息,以及所述用户终端安装的应用,确定出所述用户所处的区域,以及各区域对应的应用榜单;所述区域根据地理信息预先划分,所述应用榜单根据应用的安装次数确定;

所述第二确定模块32,可以用于根据所述用户终端安装的应用,以及所述各区域对应的应用榜单,确定出所述用户所属的区域;

所述第一聚类模块33,可以用于基于所述各区域、对应的区域属性,以及所述用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群;

所述第二聚类模块34,可以用于对所述多个区域用户群中用户终端安装应用的应用标签进行聚类,确定出所述多个区域用户群的特征标签;所述应用标签根据所述用户终端安装的应用确定。

在一种实施方式中,所述第二聚类模块34,可以用于:

将各区域用户群中,聚类簇由大至小的前第一预定个数对应的特征标签,确定为各区域用户群的特征标签。

在一种实施方式中,所述第二聚类模块34,可以用于:

将所述多个区域用户群对应的聚类簇进行由大至小排序;

确定特定聚类簇在所述多个区域用户群中的多个排位;

在所述多个排位中,确定出目标排位,其中排位低于所述目标排位的其他排位的占比超过预定比例;

将所述目标排位对应的特定聚类簇,作为所述目标排位对应的区域用户群的特征标签。

在一种实施方式中,所述第二聚类模块34,可以用于:

确定出所述多个区域用户群的候选特征标签;

将仅对应于目标区域用户群中的候选特征标签,确定为所述目标区域用户群的特征标签。

在一种实施方式中,所述第二聚类模块34,可以用于:

将仅对应于目标区域用户群中、且聚类簇由大至小的前第二预定个数对应的候选特征标签,确定为所述目标区域用户群的特征标签。

由以上实施例提供的装置可见,在本实施例中,可以根据用户的位置,以及用户终端安装的应用,确定出用户的所处区域和各区域应用榜单,根据用户安装的应用与各应用榜单的匹配程度,确定用户所属区域,此后可以基于各区域以及对应的区域属性,各用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群,最后可以基于各区域用户群中用户安装的应用的标签进行聚类,确定出各区域用户群的特征标签。相比于根据用户自主设置确定用户特征标签而言,本申请实施例可以结合区域因素以及用户真实安装应用的因素,通过聚类方式生成区域用户群,并再根据用户安装应用的标签,确定区域用户群的特征。提高确定用户特征标签的准确性和全面性、有利于准确、全面地了解用户的需求。

图4是本申请的一个实施例电子设备的结构示意图。在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-accessmemory,ram),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industrystandardarchitecture,工业标准体系结构)总线、pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成确定用户特征标签的装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:

根据用户的位置信息,以及所述用户终端安装的应用,确定出所述用户所处的区域,以及各区域对应的应用榜单;所述区域根据地理信息预先划分,所述应用榜单根据应用的安装次数确定;

根据所述用户终端安装的应用,以及所述各区域对应的应用榜单,确定出所述用户所属的区域;

基于所述各区域、对应的区域属性,以及所述用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群;

对所述多个区域用户群中用户终端安装应用的应用标签进行聚类,确定出所述多个区域用户群的特征标签;所述应用标签根据所述用户终端安装的应用确定。

上述如本申请图4所示实施例提供的确定用户特征标签的装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。

该电子设备还可执行图3所示实施例提供的确定用户特征标签的装置在图4所示实施例的功能,本申请实施例在此不再赘述。

本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图3所示实施例中确定用户特征标签的装置执行的方法,并具体用于执行:

根据用户的位置信息,以及所述用户终端安装的应用,确定出所述用户所处的区域,以及各区域对应的应用榜单;所述区域根据地理信息预先划分,所述应用榜单根据应用的安装次数确定;

根据所述用户终端安装的应用,以及所述各区域对应的应用榜单,确定出所述用户所属的区域;

基于所述各区域、对应的区域属性,以及所述用户的所处区域、所属区域、对应的用户属性进行聚类,生成多个区域用户群;

对所述多个区域用户群中用户终端安装应用的应用标签进行聚类,确定出所述多个区域用户群的特征标签;所述应用标签根据所述用户终端安装的应用确定。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1