一种内容发送方法和装置与流程

文档序号:19830616发布日期:2020-02-04 12:23阅读:167来源:国知局
一种内容发送方法和装置与流程

本申请涉及信息处理领域,尤其涉及一种内容发送方法和装置。



背景技术:

通常,用户在通过互联网与服务器进行信息交互的过程中,可以主动请求从服务器(例如云服务器)中获取图片、文本、视频等内容。具体地,用户在想要获取内容时,可以向服务器发送内容请求,服务器在接收到用户的请求后,可以确定相关内容,并将相关内容发送给用户。

目前,服务器在确定相关内容时,可以根据用户信息,预估用户对服务器中不同内容的点击率,并将点击率较高的内容发送给用户。然而,在实际应用中,基于上述方法发送给用户的内容不一定是用户感兴趣的内容,导致向用户发送的内容的准确度较低。



技术实现要素:

本申请实施例提供一种内容发送方法和装置,用于解决现有技术中服务器在根据用户请求向用户发送内容时,发送的内容准确度较低的问题。

为了解决上述技术问题,本申请是这样实现的:

本申请实施例提供一种内容发送方法,包括:

接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息;

根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到;

根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到;

将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

本申请实施例提供一种内容发送装置,包括:

接收单元,接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息;

确定单元,根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到;

获取单元,根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到;

发送单元,将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

本申请实施例提供一种电子设备,包括:

处理器;以及

被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:

接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息;

根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到;

根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到;

将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:

接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息;

根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到;

根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到;

将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

本申请实施例采用的上述至少一个技术方案能够达到以下技术效果:

本申请实施例提供的技术方案,服务器可以预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练,得到多个用户群,并根据每个用户群中的多个用户的行为数据,确定每个用户群重点关注的内容,这样,在接收到来自用户终端的内容请求时,可以根据内容请求中包括的目标用户的用户信息,确定目标用户所属的目标用户群,并将该目标用户群重点关注的目标内容发送给目标用户。这样,由于服务器在接收到用户的内容请求后向用户发送的内容是用户所属的用户群重点关注的内容,因此,更加符合用户的兴趣爱好,从而提升向用户发送内容的准确度。

此外,由于本申请实施例采用的机器学习算法为无监督的机器学习聚类算法,无需大量的用户样本,因此,通用性较好。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请的一个实施例内容发送方法的流程示意图;

图2是本申请的一个实施例内容发送方法的流程示意图;

图3为本申请的一个实施例内容发送方法的场景示意图;

图4为本申请实施例提供的一种电子设备的结构示意图;

图5为本申请实施例提供的一种内容发送装置的结构示意图。

具体实施方式

目前,用户在主动请求从服务器中获取内容时,服务器通常根据用户的用户信息,预估用户对服务器中不同内容的点击率,并将点击率高的内容发送给用户。

然而,服务器在预估点击率时,通常是基于预先训练的模型实现,该模型是基于大量用户对不同内容的点击和浏览等情况进行训练得到的,这样,基于该模型对某个内容的点击率进行预估时,预估得到的点击率能够反映所有用户对该内容的整体点击率,而在实际应用中,不同用户的兴趣爱好各不相同,当对某个内容预估得到的点击率较高时,针对某个用户而言,不一定是该用户感兴趣的内容,这样,在基于预估的点击率向用户发送内容时,就会影响发送的内容的准确度。

为了解决上述技术问题,本申请实施例提供一种内容发送方法和装置,该方法包括:接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息;根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到;根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到;将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

这样,由于服务器在接收到用户的内容请求后向用户发送的内容是用户所属的用户群重点关注的内容,因此,更加符合用户的兴趣爱好,从而提升向用户发送内容的准确度。

此外,由于本申请实施例采用的机器学习算法为无监督的机器学习聚类算法,无需大量的用户样本,因此,通用性较好。

下面结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例的应用场景,可以是用户在进行内容搜索时,向服务器发送内容请求,也可以是用户在请求服务器进行内容推荐时,向服务器发送内容请求,这里不做具体限定。

以下结合附图,详细说明本申请各实施例提供的技术方案。

图1为本申请实施例提供的一种内容发送方法的流程示意图。所述方法的执行主体可以是服务器,所述方法如下所述。

s102:接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息。

在s102中,当目标用户想要主动从服务器中获取内容时,可以使用用户终端向服务器发送内容请求。

本实施例中,目标用户请求从服务器中获取的内容包括但不限于图片、文本、链接、视频等内容。内容请求中可以包括目标用户的用户信息,该用户信息中可以包括目标用户的用户标识,目标用户的属性信息以及目标用户的行为数据等。

其中,目标用户的属性信息可以包括目标用户的年龄、性别、身高、体重、工作地、居住地、职业、人种等属性信息,目标用户的行为数据可以包括目标用户在历史时间段内点击和浏览的多个内容,以及对多个内容的点击量和浏览量等,所述历史时间段可以根据实际需要确定,这里不做具体限定。

上述用户信息可以由目标用户使用的用户终端预先收集得到。具体地,在目标用户使用用户终端的过程中,用户终端可以收集内部存储的目标用户的个人信息以及目标用户对用户终端的操作记录(包括但不限于目标用户在用户终端中点击和浏览的内容,该内容可以是图片、文本、链接和视频等)。在收集到目标用户的个人信息和对用户终端的操作记录后,可以根据目标用户的个人信息确定目标用户的用户标识和属性信息,根据目标用户对用户终端的操作记录,确定目标用户的行为数据。

这样,在用户终端收集得到目标用户的用户信息后,当目标用户想要从服务器中获取内容时,用户终端可以将收集得到的用户信息携带在内容请求中,并向服务器发送内容请求。

在用户终端向服务器发送携带有用户信息的内容请求后,服务器可以接收到来自用户终端的内容请求。

s104:根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到。

在s104中,服务器在接收到内容请求后,可以根据内容请求中携带的目标用户的用户信息,从多个用户群中确定目标用户所属的用户群,其中,为了便于区分,可以由目标用户群表示目标用户所属的用户群。

本实施例中,多个用户群可以预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到,具体实现方式如下:

首先,获取多个样本用户的样本信息。

多个样本用户的样本信息中可以包括多个样本用户的用户标识、属性信息和行为数据,其中,属性信息可以包括样本用户的年龄、性别、身高、体重、工作地、居住地、职业、人种等属性信息,行为数据可以包括样本用户在设定时间段内点击和浏览的多个内容,以及对多个内容的点击量和浏览量等,设定时间段可以根据实际情况确定。

本实施例中,多个样本用户的样本信息可以由服务器主动从多个用户终端中获取得到,其中,多个样本用户的样本信息可以由多个用户终端收集得到。此外,服务器也可以接收由不同用户终端主动发送的不同用户的用户信息,并在接收到不同用户的用户信息后,将这些不同的用户视为样本用户,相应的用户信息视为样本信息。

需要说明的是,由于本申请实施例中服务器是基于无监督的机器学习聚类算法进行学习训练的,因此样本用户的数量不需要太多,即不需要获取大量的样本用户的样本信息。

其次,对样本用户的样本信息进行量化处理,得到多个样本数据。

这里的对样本信息进行量化,是为了将样本信息转化为可以便于后续进行机器学习的样本数据,具体的量化规则可以根据实际的机器学习所需的样本数据格式而定,这里不做具体限定。

例如,在对样本信息进行量化时,可以按照以下量化规则进行量化:

规则1:年龄在1-10岁之间为0,10-20岁之间为1,20-30岁之间为,2,30-40岁之间为3,40岁-50岁之间为4,50-60岁之间为5,……;

规则2:男为0,女为1;

规则3:北京为0,上海为1,……;

规则4:服务员为0,白领为1,……;

规则5:白色人种为0,黄色人种为1,……

基于上述量化规则,若样本用户的样本信息如表1所示:

表1

则,可以得到如下样本数据:

x1=(2,0,0,0,0,0,)、x2=(4,1,1,1,1,1,)、x3=(3,0,1,1,0,0,)、x4=(4,1,0,0,1,1,)、x5=(3,0,0,0,0,0,)、x6=(2,1,1,1,1,1,)、……。

最后,基于无监督的机器学习聚类算法对多个样本数据进行学习训练,得到多类用户,一类用户可以对应一个用户群。

本实施例中,无监督的机器学习聚类算法可以包括k-means算法、k-modes算法、fcmc算法和k-medoids算法等。其中,由于k-means算法能够有效地从小规模的数据集中发现球状类别,因此,本实施例中可以优选采用k-means算法对样本数据进行学习训练。

k-means算法(又可以称为k均值算法)是一种迭代算法,在使用k-means算法对样本进行学习训练时,可以随机定义初始的k个簇,每个簇有一个中心,称为“质心”,k个簇就有k个质心。在进行学习训练时,需要根据样本与质心之间的“相异度”(衡量相异度的指标是“距离”(distance))将样本划分到k个簇中,划分的过程是迭代的过程,在迭代过程中,k个簇将被不断的更新,并在更新中被优化。当k个簇无法进一步被优化,或者达到一定的迭代次数时,训练过程停止,得到训练结果。

本申请实施例中,服务器在基于k-means算法对多个样本数据进行学习训练时,具体可以包括以下步骤:

(1)将多个样本数据中的多个第一样本数据预定义为多个质心。

第一样本数据可以是从多个样本数据中随机选择的两个或更多个(小于样本数据的总个数,具体个数可以根据实际情况确定,这里不做具体限定)样本数据。

(2)计算多个样本数据中其他样本数据与多个质心之间的距离。

在计算其他样本数据与多个质心之间的距离时,可以将其他样本数据和多个质心视为向量,通过向量之间的距离计算方法,计算其他样本数据与多个质心之间的距离。

(3)根据计算得到的距离,将其他样本数据与距离最近的质心划分为一组,得到与多个质心对应的多个簇。

具体地,以其他样本数据中的一个样本数据为例,在得到样本数据与每个质心之间的距离后,可以这些距离进行比较,确定样本数据距离哪个质心最近,并将该样本数据与距离最近的质心划分为一组。

这样,基于相同的方法,可以将其他样本数据中每个样本数据分被与距离最近的质心划分到一组,最终可以得到与多个质心对应的多个簇。其中,一个簇中包括多个样本数据。

(4)根据多个簇中包括的多个样本数据之间的距离,重新确定与多个簇对应的多个质心。

在重新确定与多个簇对应的多个质心时,可以基于以下公式实现:

其中,μj为簇cj的新的质心,j=1,2,3,……k,c1至ck为当前确定得到的多个簇,x为样本数据。

(5)在重新确定多个簇对应的多个质心后,可以基于新的多个质心,循环执行以上步骤(2)至(4),直至重新确定的多个质心不变或迭代次数达到预设次数(可以根据实际情况确定)为止,此时的多个簇(多个簇中包括的样本数据在迭代过程中不断更新和变化)即为最终需要得到的多类用户,该多类用户即为多个用户群。

其中,一个用户群中可以包括多个样本用户,且该多个样本用户关注的内容的类型相同,即具有相同的兴趣标签。此外,一个用户群中可以包括多个用户标识,该多个用户标识所标识的用户属于该用户群。

可选地,在训练得到多个用户群后,可以将多个用户群以及多个用户群各自包括的多个用户的用户标识存储在服务器中。这样,在接收到用户终端的内容请求时,可以根据内容请求中携带的目标用户的用户信息,从预先存储的多个用户群中确定目标用户所属的目标用户群。

本实施例中,由于一个用户群中可以包括多个用户标识,因此,在确定目标用户所属的目标用户群时,优选地,可以根据目标用户的用户信息中包括的用户标识,在多个用户群中查找包括目标用户的用户标识的用户群,若存在这样的用户群,则可以将该用户群作为目标用户所属的目标用户群。

可选地,若多个用户群中不存在包括目标用户的用户标识的用户群(例如,服务器在基于上述方法划分多个用户群时,并未将该目标用户作为样本用户),那么,为了便于确定目标用户所属的目标用户群,本申请实施例可以根据目标用户的用户信息中包括的属性信息和行为数据,基于无监督的机器学习聚类算法确定目标用户所属的目标用户群,其中,该目标用户群可以是预先确定的多个用户群中的一个用户群。具体实现方式可以参见上述记载的相应内容,这里不再重复描述。

s106:根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到。

在s106中,服务器在确定目标用户所属的目标用户群后,可以获取目标用户群重点关注的目标内容。

本实施例中,目标用户群重点关注的目标内容可以基于目标用户群中的多个用户的行为数据预先确定得到,具体实现方式如下:

首先,获取目标用户群中的多个用户的行为数据。

目标用户群中多个用户的行为数据可以由该多个用户所使用的用户终端主动发送给服务器,也可以由服务器主动从该多个用户所使用的用户终端中获取得到,这里不做具体限定。

目标用户群中的多个用户的行为数据可以由用户所使用的用户终端收集得到,具体可以包括多个用户在历史时间段内点击和浏览的多个内容,以及对多个内容的点击量和浏览量等,该历史时间段可以根据实际需要确定,这里不做具体限定。

其次,根据行为数据,确定多个用户对多个内容的行为量。

多个内容可以是服务器中的多个内容,具体可以包括图片、文本、链接和视频等,行为量可以包括点击量和浏览量中的至少一种。

再次,根据多个用户对多个内容的行为量,确定多个内容各自的热度值,其中,一个内容对应的行为量越多,热度值越高。

在确定多个内容各自的热度值时,以其中一个内容为例,可以统计目标用户群中多个用户对该内容的点击量和浏览量,并将点击量和浏览量的比值作为该内容的热度值。

或者,也可以通过其他方法计算内容的热度值。比如,可以将内容的点击量和浏览量的方均根值或加权平均值作为热度值,也可以结合内容在服务器中的总点击量和总浏览量确定内容的热度值。例如,可以根据目标用户群内多个用户对内容的点击量和浏览量得到一个热度值,根据内容在服务器中的总点击量和总浏览量确定一个热度值,两个热值度的加权和作为该内容最终的热度值,等,这里不再一一举例说明。

最后,根据多个内容各自的热度值,从多个内容中确定目标内容,其中,该目标内容的热度值高于多个内容中其他内容的热度值,该目标内容的个数可以是一个,也可以是多个,这里不做具体限定。

可选地,在通过上述方法确定目标用户群重点关注的目标内容后,可以将目标用户群重点关注的目标内容存储在服务器中。这样,在确定得到目标用户属于目标用户群时,可以根据目标用户群,获取预先存储的目标用户群重点关注的目标内容。

s108:将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

在s108中,服务器在确定目标用户群重点关注的目标内容后,可以将目标内容发送给用户终端,用户终端在接收到目标内容后,可以将目标内容展示给目标用户,以实现向目标用户发送内容的目的。

本实施例中,由于服务器向目标用户发送的内容,是目标用户所属的用户群重点关注的内容,因此,发送的内容更加符合用户的兴趣爱好,从而能够提升发送的内容的准确度。

可选地,服务器在将目标内容发送给用户终端,并由用户终端展示给目标用户后,用户终端还可以收集目标用户对目标内容的目标行为数据,例如,目标用户是否点击或浏览了该目标内容。在收集得到目标行为数据后,用户终端可以将目标行为数据发送给服务器,服务器在接收到目标行为数据后,可以根据目标行为数据,更新目标用户所属的目标用户群。

具体地,服务器可以将目标用户的属性信息和目标行为数据作为样本信息,基于无监督的机器学习聚类算法以及其他样本用户的样本信息,重新确定目标用户所属的目标用户群,具体实现方式可以参见上述记载的相应内容,这里不再重复描述。

需要说明的是,服务器还可以定时对多个用户群进行更新,以更新不同用户所属的用户群。具体地,服务器可以定时地获取多个用户群中的用户更新后的用户信息(例如最近一段时间内的用户信息),并将更新后的用户信息作为样本信息,利用无监督的机器学习聚类算法对这些样本信息进行学习训练,以对多个用户群中的用户进行重新分群。

这样,由于服务器可以定时地更新多个用户群,因此,在确定目标用户所属的用户群时,确定得到的目标用户群更能准确反映目标用户的类别,进一步地,在向目标用户发送内容时,发送的内容更加符合用户的兴趣爱好,从而有效提高内容发送的准确度。

此外,服务器在更新多个用户群后,还可以对多个用户群重点关注的内容进行更新。具体地,服务器可以获取更新后的多个用户群中多个用户在最近一段时间内的行为数据,根据这些行为数据,可以基于上述记载的方法重新确定多个用户群重点关注的内容。这样,在向用户群中的用户发送内容时,推送的内容都是用户群中的用户当前重点关注的内容,因此,更加符合用户当前的需求,从而提升发送的内容的准确度。

为了便于理解本申请实施例提供的技术方案,可以参见图2和图3。图2为本申请的一个实施例内容发送方法的流程示意图,图3为本申请的一个实施例内容发送方法的场景示意图。

图2所示的内容发送方法可以包括以下步骤:

s201:获取多个用户的用户信息,用户信息中包括多个用户的用户标识、属性信息和行为数据。

多个用户的用户信息可以由多个用户各自使用的用户终端收集得到,其中,多个用户的属性信息可以包括多个用户的年龄、性别、身高、体重、工作地、居住地、职业、人种等属性信息,行为数据可以包括多个用户在设定时间段内点击和浏览的多个内容(例如图片、文本、链接和视频等),以及对多个内容的点击量和浏览量等,设定时间段可以根据实际情况确定。

在获取多个用户的用户信息时,可以由服务器主动从多个用户终端获取得到,也可以由多个用户终端主动发送给服务器。

s202:对多个用户的用户信息进行量化处理,得到多个样本数据。

服务器在获取到多个用户的用户信息后,可以将多个用户作为样本用户,将多个用户的用户信息作为样本信息,并对多个用户的用户信息进行量化处理,得到多个样本数据。

s203:基于无监督的机器学习聚类算法对多个样本数据进行学习训练,得到多个用户群。

在对多个样本数据进行学习训练时,使用到的无监督的机器学习聚类算法优选为k-means算法。在基于k-means算法对多个样本数据进行学习训练时,具体实现方式可以参见上述图1所示实施例中记载的相应内容,这里不再重复描述。

本实施例中训练得到的每个用户群中可以包括多个用户的用户标识,一个用户群中的用户重点关注的内容的类型相同,即一个用户群中的用户的兴趣标签相同。

可选地,在得到多个用户群后,可以将多个用户群以及多个用户群各自包括的用户标识存储在服务器中。

s204:根据多个用户群中包括的用户的行为数据,确定多个用户群各自重点关注的内容。

以其中一个用户群为例,在确定用户群重点关注的内容时,可以根据用户群中包括的多个用户的行为数据,确定多个用户对多个内容的行为量,多个内容包括但不限于图片、文本、视频和链接等,行为量包括点击量和浏览量中的至少一种。

在得到多个内容的行为量后,可以基于行为量,确定多个内容各自的热度值,其中,一个内容对应的行为量越多,热度值越高。在得到多个内容各自的热度值后,可以选择其中热度值较高的一个或多个内容作为用户群重点关注的内容。具体实现方式可以参见图1所示实施例中记载的相应内容,这里不再重复描述。

可选地,在得到多个用户群各自重点关注的内容后,可以将多个用户群各自重点关注的内容存储在服务器中。

s205:接收来自用户终端的内容请求,内容请求中包括由用户终端收集得到的目标用户的用户信息。

在s205中,当目标用户想要主动从服务器中获取内容时,可以使用用户终端向服务器发送内容请求。内容请求中携带的用户信息可以包括目标用户的用户标识,属性信息以及行为数据等,具体可以参见图1所示的s102中记载的目标用户的用户信息。

s206:根据目标用户的用户标识,在多个用户群中查找是否存在目标用户群。

目标用户群为s203中的一个用户群,且目标用户群中包括目标用户的用户标识。若存在目标用户群,则可以执行s208;若不存在,则可以执行s207。

s207:根据目标用户的属性信息和行为数据,确定目标用户所属的目标用户群。

这里可以基于无监督的机器学习聚类算法,通过对目标用户的属性信息和行为数据进行学习训练,确定目标用户所属的目标用户群,该目标用户群可以是预先确定的多个用户群中的一个用户群。

s208:根据目标用户所属的目标用户群,获取目标用户群重点关注的目标内容。

目标用户群重点关注的目标内容已预先确定得到,这里只需要将预先确定得到的目标内容获取即可。

s209:将目标内容发送给用户终端,以便用户终端将目标用户展示给目标用户。

可选地,用户终端在展示目标内容后,还可以收集目标用户对目标内容的目标行为数据,并将目标行为数据发送给服务器,以便服务器根据目标行为数据更新目标用户所属的目标用户群。

图3所示的场景中包括一个服务器和n个用户终端,其中,服务端可以是由至少一台计算机组成的计算/存储系统,每个终端设备可以通过无线接入点或者因特网与服务器通信,以获取所需的服务或内容。

图3中,n个用户终端收集多个用户的用户信息,并将多个用户的用户信息发送给服务器。

具体地,用户终端1可以收集用户1(用户1为使用用户终端的用户)的用户信息1,并将用户信息1发送给服务器,用户终端2可以收集用户2的用户信息2,并将用户信息2发送给服务器,……,用户终端n可以收集用户n的用户信息n,并将用户信息n发送给服务器。其中,用户信息i(i=1,2,……,n)中可以包括用户i的用户标识、属性信息和行为数据等。

服务器在接收到用户信息1,用户信息2,……,用户信息n后,可以基于无监督的机器学习聚类算法对这些用户信息进行学习训练,以将用户1,用户2,……,用户n这n个用户进行分群,并根据训练结果,得到m个用户群(m小于n),在得到m个用户群后,基于每个用户群中的用户的行为数据,确定m个用户群各自重点关注的内容。

之后,当用户1通过用户终端1向服务器发送内容请求时,服务器可以根据内容请求中携带的用户1的用户标识确定用户1所属的用户群,假设用户1属于用户群a,用户群a重点关注的内容为a,则,服务器可以将内容a发送给用户终端1,以便用户1可以从服务器中获取到内容a。由于向用户1发送的内容a是用户1所属用户群a重点关注的内容,因此,发送的内容a更加符合用户1的兴趣爱好。

图3中,用户x(不属于上述n个用户)想要从服务器中获取内容时,可以通过用户终端x向服务器发送携带用户x的用户信息x的内容请求。服务器在接收到用户信息x后,需要确定用户x所属的用户群。由于服务器在进行用户分群时,未将用户x作为样本用户进行学习训练,因此,服务器无法在已划分的m个用户群中确定用户x所属的用户群,此时,服务器可以基于无监督的机器学习算法对用户x的用户信息x进行学习训练,确定用户x属于上述m个用户群中的哪一个用户群。

假设用户x属于m个用户群中的用户群b,则服务器可以将用户群b重点关注的内容b发送给用户终端x,以便用户x可以从服务器中获取到内容b。

本申请实施例提供的技术方案,服务器可以预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练,得到多个用户群,并根据每个用户群中的多个用户的行为数据,确定每个用户群重点关注的内容,这样,在接收到来自用户终端的内容请求时,可以根据内容请求中包括的目标用户的用户信息,确定目标用户所属的目标用户群,并将该目标用户群重点关注的目标内容发送给目标用户。这样,由于服务器在接收到用户的内容请求后向用户发送的内容是用户所属的用户群重点关注的内容,因此,更加符合用户的兴趣爱好,从而提升向用户发送内容的准确度。

此外,由于本申请实施例采用的机器学习算法为无监督的机器学习聚类算法,无需大量的用户样本,因此,通用性较好。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

图4是本申请的一个实施例电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-accessmemory,ram),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industrystandardarchitecture,工业标准体系结构)总线、pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成内容发送装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:

接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息;

根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到;

根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到;

将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

上述如本申请图4所示实施例揭示的内容发送装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。

该电子设备还可执行图1和图2的方法,并实现内容发送装置在图1和图2所示实施例的功能,本申请实施例在此不再赘述。

当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。

本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1和图2所示实施例的方法,并具体用于执行以下操作:

接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息;

根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到;

根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到;

将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

图5为本申请实施例提供的一种内容发送装置的结构示意图。所述装置可以应用于服务器,具体可以包括:接收单元51、确定单元52、获取单元53以及发送单元54,其中:

接收单元51,接收来自用户终端的内容请求,所述内容请求中包括由所述用户终端收集得到的目标用户的用户信息;

确定单元52,根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,所述多个用户群预先基于无监督的机器学习聚类算法对多个样本用户的样本信息进行学习训练得到;

获取单元53,根据所述目标用户群,获取所述目标用户群重点关注的目标内容,所述目标内容预先基于所述目标用户群中多个用户的行为数据确定得到;

发送单元54,将所述目标内容发送给所述用户终端,以便所述用户终端向所述目标用户展示所述目标内容。

可选地,所述确定单元52,通过以下方式确定得到所述多个用户群:

获取多个样本用户的样本信息,所述样本信息中包括所述多个样本用户的用户标识、属性信息和行为数据;

对所述样本信息进行量化处理,得到多个样本数据;

基于无监督的机器学习聚类算法对所述多个样本数据进行学习训练,得到多类用户,一类用户对应一个用户群。

可选地,所述无监督的机器学习聚类算法包括k-means算法;

其中,所述确定单元52,基于无监督的机器学习聚类算法对所述多个样本数据进行学习训练,得到多类用户,包括:

将所述多个样本数据中的多个第一样本数据预定义为多个质心;

计算所述多个样本数据中其他样本数据与所述多个质心之间的距离;

根据所述距离,将其他样本数据与距离最近的质心划分为一组,得到与多个质心对应的多个簇;

根据所述多个簇中包括的多个样本数据之间的距离,重新确定与所述多个簇对应的多个质心;

循环执行上述步骤,直至重新确定的多个质心不变或迭代次数达到预设次数时,得到多类用户,一个簇对应一类用户。

可选地,所述目标用户的用户信息中包括所述目标用户的用户标识;

其中,所述确定单元52,根据所述目标用户的用户信息,从多个用户群中确定所述目标用户所属的目标用户群,包括:

根据所述目标用户的用户标识,从所述多个用户群中查找包括所述用户标识的用户群,一个用户群中包括属于所述一个用户群的多个用户的用户标识;

将查找到的用户群确定为所述目标用户所属的目标用户群。

可选地,所述目标用户的用户信息中还包括所述目标用户的属性信息和行为数据;

其中,所述确定单元52,在从所述多个用户群中查找包括所述目标用户标识的用户群后,若未查找到包括所述目标用户标识的用户群,则根据所述目标用户的属性信息和行为数据,基于无监督的机器学习聚类算法确定所述目标用户所属的目标用户群。

可选地,所述获取单元53,通过以下方式确定得到所述目标内容:

获取所述目标用户群中的多个用户的行为数据;

根据所述行为数据,确定所述多个用户对多个内容的行为量,所述行为量包括点击量和浏览量中的至少一种;

根据所述行为量,确定所述多个内容各自的热度值,一个内容对应的行为量越多,热度值越高;

根据所述多个内容各自的热度值,从所述多个内容中确定所述目标内容,所述目标内容的热度值高于所述多个内容中其他内容的热度值。

可选地,所述内容发送装置还包括更新单元55,其中:

所述更新单元55,在所述发送单元54将所述目标内容发送给所述用户终端后,接收所述目标用户对所述目标内容的目标行为数据,所述目标行为数据由所述用户终端在显示所述目标内容后收集得到;

根据所述目标行为数据,更新所述目标用户所属的目标用户群。

本申请实施例提供的内容发送装置还可执行图1和图2的方法,并实现内容发送装置在图1和图2所示实施例的功能,本申请实施例在此不再赘述。

总之,以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1