
1.本公开涉及计算机技术领域,尤其涉及一种推广内容处理方法、装置、设备、计算机可读存储介质以及计算机程序产品。
背景技术:2.随着计算机技术尤其是移动互联网技术的不断发展,商户通常会发布推广内容(例如广告),以对相关产品或服务进行推广,推广内容通常以多媒体数据的形式存在,多媒体数据的形式包括但不限于视频、语音和图像。
3.由于推广内容的制作难度较大,并且推广内容给商户所带来的收益具有不确定性,会导致商户制作推广内容的动机较弱,进而导致商户仅仅制作一条推广内容,然后将该同一条推广内容投放给不同的用户。
4.然而,不同的用户对推广内容的兴趣不同,利用同一个推广内容向不同的用户进行投放,难以满足不同的用户的个性化需求。
技术实现要素:5.本公开的目的在于:提供了一种推广内容处理方法、装置、设备、计算机可读存储介质以及计算机程序产品,对推广内容进行个性化处理,能够满足不同的用户的个性化需求。
6.第一方面,本公开提供了一种推广内容处理方法,所述方法包括:
7.获取待处理的推广内容;
8.对所述推广内容进行分割处理,得到多个内容片段;
9.将所述多个内容片段进行组合,得到多个候选内容;
10.根据所述多个候选内容和用户的兴趣特征,评估所述多个候选内容的评分;
11.将所述多个候选内容中评分最高的目标内容,投放给所述用户。
12.第二方面,本公开提供了一种推广内容处理装置,包括:
13.获取模块,用于获取待处理的推广内容;
14.分割模块,用于对所述推广内容进行分割处理,得到多个内容片段;
15.组合模块,用于将所述多个内容片段进行组合,得到多个候选内容;
16.评价模块,用于根据所述多个候选内容和用户的兴趣特征,评估所述多个候选内容的评分;
17.处理模块,用于将所述多个候选内容中评分最高的目标内容,投放给所述用户。
18.第三方面,本公开提供了一种电子设备,包括:
19.存储装置,其上存储有计算机程序;
20.处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面中任一项所述方法的步骤。
21.第四方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处
理装置执行时实现本公开第一方面中任一项所述方法的步骤。
22.第五方面,本公开提供了一种包含指令的计算机程序产品,当其在设备上运行时,使得设备执行上述第一方面中的任一种实现方式所述的方法。
23.从以上技术方案可以看出,本公开具有如下优点:
24.一方面,该方法对推广内容进行处理得到多个候选内容后,基于用户的兴趣特征对从多个候选内容件评分,进而得到多个候选内容的评分,将评分最高的目标内容投放给用户,进而能够满足不同的用户的个性化需求;另一方面,该方法仅需要少量的推广内容,通过对少量的推广内容进行分割后组合的方式,能够得到大量的候选内容,如此丰富了推广内容的数量,更容易满足不同的用户的个性化需求。
25.本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
26.为了更清楚地说明本公开实施例的技术方法,下面将对实施例中所需使用的附图作以简单地介绍。
27.图1为本公开实施例提供的一种推广内容处理系统的示意图;
28.图2为本公开实施例提供的一种推广内容上传界面的示意图;
29.图3为本公开实施例提供的一种推广内容处理方法的流程图;
30.图4为本公开实施例提供的一种双塔模型的示意图;
31.图5为本公开实施例提供的一种推广内容处理装置的示意图;
32.图6为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
33.本公开实施例中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
34.首先对本公开实施例中所涉及到的一些技术术语进行介绍。
35.推广内容是指用于对目标对象进行推广或宣传的内容。例如推广内容可以是广告,通过发布广告,可以提高用户对广告中所推广或宣传的目标对象的关注度。在一些示例中,可以通过广告呼吁用户节约水资源,也可以通过广告,引导用户对广告中的数码产品等进行消费。
36.推广内容通常以多媒体数据的形式存在,多媒体数据的形式包括但不限于视频、语音和图像。推广内容的制作难度较大,商户通常仅仅会制作并发布少量的推广内容;并且,推广内容给商户带来的收益往往不具有确定性,如推广内容的转化率不稳定,进而会打消商户创作新的推广内容的积极性。如此会出现商户仅仅利用少量甚至是同一条推广内容投放给不同的用户的情况。
37.而实际场景中,不同的用户对推广内容的兴趣不同,利用同一个推广内容向不同的用户进行投放,难以满足不同的用户的个性化需求,难以转化用户。
38.有鉴于此,本公开实施例提供了一种推广内容处理方法,该方法包括:获取待处理的推广内容,对该推广内容进行分割处理,得到多个内容片段,然后在对多个内容片段进行
组合,进而得到多个候选内容,如此丰富了推广内容的数量,更容易满足不同的用户的个性化需求;接着,该方法根据多个候选内容和用户的兴趣特征,评估多个候选内容的评分,然后从多个候选内容中选择评分最高的目标内容投放给用户,进而实现向用户的用户投放不同的目标内容,如此满足不同的用户的个性化需求。
39.该方法可以应用于推广内容处理系统。该方法应用于推广内容处理系统时,具体是以计算机程序的形式实现。在一些实施例中,该计算机程序可以是独立的,例如可以是具有相应功能的独立应用。在另一些实施例中,该计算机程序可以是功能模块或插件等,附着于已有的应用中运行。
40.举例说明,以推广内容处理系统附着于购物类应用为例,推广内容处理系统可以获取目标对象(如商品)的推广内容,然后对该推广内容进行处理,得到多个候选内容,对于不同的用户,投放不同的候选内容(该候选内容为针对该用户评分最高的目标内容),如此满足不同的用户的个性化需求。
41.本公开实施例提供的推广内容处理方法可以由客户端单独执行,也可以由服务器单独执行,也可以由客户端和服务器协同执行,当该推广内容处理方法由客户端单独执行时,表明该推广内容处理系统可以是离线运行。为了便于理解,下面以推广内容处理方法由客户端和服务器协同执行为例,进行示例说明。
42.为了使得本公开的技术方案更加清楚、易于理解,下面结合附图对本公开实施例提供的推广内容处理系统的架构进行介绍。
43.参见图1所示的推广内容处理系统100的系统架构图,推广内容处理系统100包括终端110、终端120和服务器130。终端110、终端120和服务器130通过网络连接。其中,终端110可以为商户的终端,终端120可以为用户的终端,终端包括但不限于智能手机、平板电脑、笔记本电脑、个人数字助理(personal digital assistant,pda)或者智能穿戴设备等。服务器130可以是云服务器,例如是中心云计算集群中的中心服务器,或者是边缘云计算集群中的边缘服务器。当然,服务器130也可以是本地数据中心中的服务器。本地数据中心是指用户直接控制的数据中心。
44.在一些示例中,终端110可以向商户呈现人机交互界面,以便商户上传推广内容以对目标对象进行推广。如图2所示,该图为本公开实施例提供的一种推广内容上传界面的示意图,该推广内容上传界面包括:待上传的推广内容201和上传控件202。商户可以通过点击推广内容201以进行选中,然后点击上传控件202,终端110可以基于商户对上传控件202的点击操作,将商户所选中的推广内容201发送给服务器130。如此,服务器可以 130获取商户所选中的推广内容。
45.服务器130可以对该推广内容进行分割以及组合等处理,进而得到多个候选内容,然后在向用户投放之前,先基于用户的兴趣特征以及多个候选内容,评估多个候选内容的评分,从多个候选内容中选择评分最高的目标内容投放给该用户。具体地,服务器130可以将目标内容发送给用户的终端120,终端120可以向用户呈现该推广内容。对于兴趣特征不同的用户,服务器130可以向兴趣特征不同的用户投放不同的目标内容。该目标内容是基于用户的兴趣特征得到,因此,目标内容能够满足用户的个性化需求。
46.可见,通过该推广内容处理系统对推广内容进行处理,仅仅需要少量的推广内容,即可满足不同的用户的个性化需求。
47.为了使得本公开的技术方案更加清楚、易于理解,下面从终端110、终端120和服务器130的角度,对本公开实施例提供的推广内容处理方法进行介绍。
48.如图3所示,该图为本公开实施例提供的一种推广内容处理方法,该方法包括:
49.s301:终端110获取商户选择的推广内容。
50.推广内容的行驶多种多样,例如,推广内容可以是语音、视频或图像。为了便于理解,本实施例中以推广内容为视频为例,进行介绍。
51.如图2所示的推广内容上传界面的示意图,商户可以在推广内容上传界面,选择需要投放的推广内容,终端110可以基于用户对上传控件的点击操作,获取商户选择的推广内容。
52.需要说明的是,本公开实施例中以推广内容的创作者为商户为例进行介绍,当然在另一些实施例中,推广内容的创作者也可以是博主等。
53.s302:终端110将商户选择的推广内容发送给服务器130。
54.终端110在获取到商户选择的推广内容后,可以将该推广内容发送给服务器130,以使服务器130获取用户选择的推广内容,并对该推广内容进行后续处理。
55.s303:服务器130对推广内容进行分割处理,得到多个内容片段。
56.在一些示例中,服务器130可以基于推广内容的形式,确定对推广内容进行分割处理的方式。推广内容为文本时,服务器130可以以句子为单位对推广内容进行分割,进而得到多个句子;推广内容为语音时,服务器130可以以语音识别后得到的句子为单位对推广内容进行分割,进而得到多个语音片段;推广内容为图像时,服务器130可以以图像识别后得到的子图像为单位,对推广内容进行分割,进而得到多个图像片段。
57.推广内容为视频时,服务器130可以采用至少两种方式对推广内容进行分割。在一些示例中,服务器130可以对推广内容进行语音识别,得到语音识别结果,该语音识别结果包括至少一个分割点,然后服务器130利用该分割点对推广内容进行分割。服务器130在对推广内容进行语音识别后,能够获取到推广内容对应的文本,该文本包括多个句子以及句子之间的标点(例如:逗号、句号、分号等),该标点在视频上对应的时间戳可以作为分割点。服务器130确定分割点后,即确定了时间戳,然后基于时间戳对视频进行分割处理,进而得到多个视频片段。
58.在另一些示例中,服务器130还可以对推广内容进行图像识别,得到图像识别结果,该图像识别结果包括至少一个分割点,然后服务器130利用该分割点对推广内容进行分割。服务器130在对推广内容进行图像识别后,能够确定视频中距离较远的相邻两帧图像,距离较远的相邻两帧图像可以是相似度低于预设相似度的相邻两帧图像,然后从该相邻两帧图像中选择一帧图像所对应的时间戳,作为分割点。服务器130在确定分割点后,即确定了时间戳,然后基于时间戳对视频进行分割处理,进而得到多个视频片段。
59.需要说明的是,本公开实施例不具体限定服务器130对推广内容进行分割处理的方式,以上仅仅示例性介绍,本领域技术人员可以基于实际需要选择其他的分割方式。
60.s304:服务器130将多个内容片段进行组合,得到多个候选内容。
61.在一些实施例中,服务器130可以为每个内容片段进行编号,然后对编号进行全排列,进而得到内容片段的全部组合方式所对应的候选内容,也可以对编号进行随机排列,进而得到内容片段的部分组合方式所对应的候选内容。
62.在另一些实施例中,服务器130可以提取多个内容片段中每个内容片段的片段特征,然后根据片段特征与聚类中心的标识的映射关系,获取每个内容片段的片段特征对应的聚类中心的标识,然后根据聚类中心的标识,确定多个候选内容的多个候选序列。
63.上述片段特征与聚类中心的标识的映射关系可以基于历史推广内容得到。该历史推广内容可以是指全行业、全类型的全部推广内容。具体地,服务器130可以基于上述所介绍分割处理的方式,预先对历史推广内容进行分割处理,进而得到历史推广内容的历史内容片段。服务器130提取该历史内容片段的片段特征,然后对历史内容片段的片段特征进行聚类,进而得到聚类中心,不同的聚类中心可以通过聚类中心的标识表征。
64.上述片段特征可以是文本特征、也可以是图像特征、还可以是文本特征和图像特征融合后的融合特征。在一些示例中,文本特征可以是bert(bidirectional encoderrepresentations from transformers)特征,图像特征可以是计算机视觉(computer vision, cv)特征。上述片段特征可以通过embedding表示。
65.需要说明的是,服务器130在预先建立片段特征与聚类中心的标识的映射关系时所采用的片段特征,与服务器130在提取多个内容片段中每个内容片段的片段特征一致,例如均为文本特征、均为图像特征或均为融合特征。
66.在一些示例中,服务器可以先对内容片段进行语音识别,得到内容片段对应的文本后,在基于该文本得到文本特征;服务器可以对内容片段进行图像识别,进而得到图像特征。本公开实施例不具体限定提取文本特征或图像特征的方式,本领域技术人员可以基于实际需要选择合适的方式,提取文本特征或图像特征。
67.为了便于理解,下面以片段特征为文本特征为例进行介绍。
68.以多个内容片段包括内容片段1、内容片段2、内容片段3、内容片段4、内容片段5 为例,服务器130可以分别提取上述内容片段1的文本特征1、内容片段2的文本特征2、内容片段3的文本特征3、内容片段4的文本特征4、内容片段5的文本特征5,然后分别得到文本特征1对应的聚类中心的标识1、文本特征2对应的聚类中心的标识2、文本特征3对应的聚类中心的标识3、文本特征4对应的聚类中心的标识4、文本特征5对应的聚类中心的标识5。基于此,服务器130可以基于聚类中心的标识,商户上传的推广内容可以通过原始序列[标识1、标识2、标识3、标识4、标识5]表征。
[0069]
然后服务器130可以根据聚类中心的标识,确定多个候选内容的多个候选序列。在一些示例中,服务器130可以对上述标识1-标识5进行全排列,进而得到标识1-标识5的全部组合方式对应的候选序列,服务器130也可以采用随机的排列方式,进而得到标识1-标识5的部分组合方式对应的候选序列。
[0070]
在另一些示例中,为了保证候选序列对应的候选内容的语义连贯,服务器130可以将推广内容的原始序列中排序第一的标识调至最后,得到第一候选序列,然后将第一候选序列中排序第一的标识调至最后,得到第二候选序列,直至得到的候选序列中排序第一标识为原始序列中排序最后的标识为止。
[0071]
以上述原始序列[标识1、标识2、标识3、标识4、标识5]为例,服务器通过上述方式可以得到4个候选序列,如下表1所示:
[0072]
表1
[0073]
原始序列标识1标识2标识3标识4标识5
第一候选序列标识2标识3标识4标识5标识1第二候选序列标识3标识4标识5标识1标识2第三候选序列标识4标识5标识1标识2标识3第四候选序列标识5标识1标识2标识3标识4
[0074]
在表1所示的多个候选序列中,每个候选序列中均存在相邻的标识之间的顺序与原始序列中相邻的标识之间的顺序一致,如第一候选序列中的前四个标识与原始候选序列中后四个标识的顺序一致,再例如,第四候选序列中后四个标识与原始序列中前四个标识的顺序一致。如此,能够在一定程度上,使多个候选序列对应的候选内容保持语义连贯。
[0075]
s305:服务器130根据多个候选内容和用户的兴趣特征,评估多个候选内容的评分。
[0076]
在一些实施例中,服务器130可以通过模型,根据多个候选内容和用户的兴趣特征,评估多个候选内容的评分。其中,用户的兴趣特征可以通过embedding表示,用户的兴趣特征可以基于用户对历史推广内容的反馈信息得到,该反馈信息可以是用户对历史推广内容的行为数据,例如用户点击历史推广内容、用户观看推广内容超过预设时长等。本领域技术人员可以根据实际需要选择需要使用的用户的行为数据。
[0077]
需要说明的是,本公开实施例中所涉及用户的信息(如上述用户的反馈信息)都需要提前获取用户的授权,在获取到用户对相应数据的授权使用后,服务器130、终端110或终端120才能获取到用户的信息。
[0078]
在一些示例中,服务器130可以基于用户的兴趣特征以及历史推广内容进行模型训练,其中,历史推广内容包括多个历史内容片段,基于此,历史推广内容可以基于历史内容片段对应的聚类中心的标识特征和/或历史推广内容对应的历史序列中标识的位置特征表征。
[0079]
在一些示例中,用于评估多个候选内容的评分的模型可以是双塔模型,也可以是其他混合模型。如图4所示,该图为本公开实施例提供的一种双塔模型的示意图。在完成对该双塔模型的训练后,服务器130可以通过该双塔模型,根据用户的兴趣特征以及多个候选内容,给出多个候选内容的评分。
[0080]
以对一个候选内容进行评分为例,如第一候选序列对应的第一候选内容,服务器可以获取该第一候选内容的第一候选序列中每个标识的标识特征;也可以获取该第一候选内容的第一候选序列中每个标识的位置特征;也可以获取每个标识的标识特征和每个标识的位置特征,将每个标识的标识特征和每个标识的位置特征进行融合后,得到每个标识的融合特征。在一些示例中,可以基于注意力机制attention,确定候选内容的评分。具体地,服务器130可以基于如下公式计算候选内容的评分:
[0081][0082][0083]
公式(1)中,wij为候选内容中每个内容片段的权重,ui为用户的兴趣特征,vj可以为第j个内容片段的标识特征,也可以为第j个内容片段的位置特征,也可以为第j个内容片
段的标识特征和第j个内容片段的位置特征融合后得到的第j个内容片段的融合特征。公式(2)中,v为候选内容的评分。
[0084]
类似的,对每个候选内容均作类似的处理,进而可以得到每个候选内容的评分。
[0085]
在一些示例中,评分可以通过点击通过率(click-through-rate,ctr)表征,本公开实施例不具体限定评分的表征方式,本领域技术人员可以基于实际需要确定评分的表征方式,例如评分还可以通过转化率表征。
[0086]
s306:服务器130将多个候选内容中评分最高的目标内容发送给终端120。
[0087]
在一些实施例中,服务器130可以将多个候选内容中评分最高的目标内容发送给终端 120,以通过终端120将目标内容投放给用户。
[0088]
s307:终端120获取用户针对目标内容的反馈信息。
[0089]
在一些实施例中,终端120向用户呈现目标内容后,终端120可以获取用户针对该目标内容的反馈信息,反馈信息可以通过用户的行为数据表征。例如,终端120可以获取到用户点击历史推广内容、用户观看推广内容超过预设时长等行为数据。
[0090]
s308:终端120将反馈信息发送给服务器130。
[0091]
s309:服务器130根据反馈信息对用户的兴趣特征进行更新。
[0092]
终端120在获取到反馈信息后,可以将反馈信息发送给服务器130,以便服务器130 根据该反馈信息对用户的兴趣特征进行更新,例如可以是在线更新,以便于后续模型的优化,提高模型预测的准确度。
[0093]
s310:服务器130利用目标内容和更新后的兴趣特征,调整模型的参数。
[0094]
在一些示例中,服务器可以在线对模型进行更新,以对模型的参数进行调整,从而提高模型预测结果的准确度。
[0095]
需要说明的是,上述s306至s310为可选的步骤,在一些实施例中,也可以不执行上述s306至s310。
[0096]
基于上述内容描述,本公开实施例提供了一种推广内容处理方法。一方面,该方法对推广内容进行处理得到多个候选内容后,基于用户的兴趣特征对从多个候选内容件评分,进而得到多个候选内容的评分,将评分最高的目标内容投放给用户,进而能够满足不同的用户的个性化需求;另一方面,该方法仅需要少量的推广内容,通过对少量的推广内容进行分割后组合的方式,能够得到大量的候选内容,如此丰富了推广内容的数量,更容易满足不同的用户的个性化需求。
[0097]
图5是根据一示例性公开实施例示出的一种推广内容处理装置的示意图,如图5所示,所述推广内容处理装置500包括:
[0098]
获取模块501,用于获取待处理的推广内容;
[0099]
分割模块502,用于对所述推广内容进行分割处理,得到多个内容片段;
[0100]
组合模块503,用于将所述多个内容片段进行组合,得到多个候选内容;
[0101]
评价模块504,用于根据所述多个候选内容和用户的兴趣特征,评估所述多个候选内容的评分;
[0102]
处理模块505,用于将所述多个候选内容中评分最高的目标内容,投放给所述用户。
[0103]
可选的,分割模块502,用于对所述推广内容进行语音识别,得到语音识别结果,所
述语音识别结果包括至少一个分割点;利用所述至少一个分割点,对所述推广内容进行分割处理。
[0104]
可选的,分割模块502,用于对所述推广内容进行图像识别,得到图像识别结果,所述图像识别结果包括至少一个分割点;利用所述至少一个分割点,对所述推广内容进行分割处理。
[0105]
可选的,组合模块503,用于提取所述多个内容片段中每个内容片段的片段特征;根据片段特征与聚类中心的标识的映射关系,获取每个内容片段的片段特征对应的聚类中心的标识;根据所述聚类中心的标识,确定多个候选内容的多个候选序列。
[0106]
可选的,所述多个候选序列至少包括第一候选序列和第二候选序列;组合模块503,用于根据所述聚类中心的标识,确定所述推广内容的原始序列;将所述原始序列中排序第一的标识调至最后,得到所述第一候选序列;将所述第一候选序列中排序第一的标识调至最后,得到所述第二候选序列。
[0107]
可选的,所述片段特征包括文本特征和/或图像特征。
[0108]
可选的,获取模块501,用于获取所述用户针对所述目标内容的反馈信息;处理模块 505,用于根据所述反馈信息,对所述用户的兴趣特征进行更新;利用所述目标内容和更新后的兴趣特征,调整模型的参数,所述模型用于评估所述多个候选内容的评分。
[0109]
上述各模块的功能在上一实施例中的方法步骤中已详细阐述,在此不做赘述。
[0110]
下面参考图6,其示出了适于用来实现本公开实施例的电子设备600的结构示意图,该电子设备可以是服务器130,该服务器130用于实现如图5所示的推广内容处理装置500 对应的功能。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0111]
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储装置608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
[0112]
通常,以下装置可以连接至i/o接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置 609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
[0113]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从rom 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
[0114]
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计
算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
[0115]
在一些实施方式中,客户端、服务器可以利用诸如http(hypertext transfer protocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“lan”),广域网(“wan”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
[0116]
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
[0117]
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取待处理的推广内容;对所述推广内容进行分割处理,得到多个内容片段;将所述多个内容片段进行组合,得到多个候选内容;根据所述多个候选内容和用户的兴趣特征,评估所述多个候选内容的评分;将所述多个候选内容中评分最高的目标内容,投放给所述用户。
[0118]
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如java、smalltalk、 c++,还包括常规的过程式程序设计语言——诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网 (lan)或广域网(wan)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0119]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上
可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0120]
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,第一获取模块还可以被描述为“获取至少两个网际协议地址的模块”。
[0121]
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld) 等等。
[0122]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0123]
根据本公开的一个或多个实施例,示例1提供了一种推广内容处理方法,该方法包括:
[0124]
获取待处理的推广内容;
[0125]
对所述推广内容进行分割处理,得到多个内容片段;
[0126]
将所述多个内容片段进行组合,得到多个候选内容;
[0127]
根据所述多个候选内容和用户的兴趣特征,评估所述多个候选内容的评分;
[0128]
将所述多个候选内容中评分最高的目标内容,投放给所述用户。
[0129]
根据本公开的一个或多个实施例,示例2提供了示例1的方法,所述对所述推广内容进行分割处理,包括:
[0130]
对所述推广内容进行语音识别,得到语音识别结果,所述语音识别结果包括至少一个分割点;
[0131]
利用所述至少一个分割点,对所述推广内容进行分割处理。
[0132]
根据本公开的一个或多个实施例,示例3提供了示例1的方法,所述对所述推广内容进行分割处理,包括:
[0133]
对所述推广内容进行图像识别,得到图像识别结果,所述图像识别结果包括至少一个分割点;
[0134]
利用所述至少一个分割点,对所述推广内容进行分割处理。
[0135]
根据本公开的一个或多个实施例,示例4提供了示例1至3的方法,所述将所述多个内容片段进行组合,包括:
[0136]
提取所述多个内容片段中每个内容片段的片段特征;
[0137]
根据片段特征与聚类中心的标识的映射关系,获取每个内容片段的片段特征对应的聚类中心的标识;
[0138]
根据所述聚类中心的标识,确定多个候选内容的多个候选序列。
[0139]
根据本公开的一个或多个实施例,示例5提供了示例4的方法,所述多个候选序列至少包括第一候选序列和第二候选序列;所述根据所述聚类中心的标识,确定多个候选内容的多个候选序列,包括:
[0140]
根据所述聚类中心的标识,确定所述推广内容的原始序列;
[0141]
将所述原始序列中排序第一的标识调至最后,得到所述第一候选序列;
[0142]
将所述第一候选序列中排序第一的标识调至最后,得到所述第二候选序列。
[0143]
根据本公开的一个或多个实施例,示例6提供了示例4或5的方法,所述片段特征包括文本特征和/或图像特征。
[0144]
根据本公开的一个或多个实施例,示例7提供了示例1至6的方法,所述方法还包括:
[0145]
获取所述用户针对所述目标内容的反馈信息;
[0146]
根据所述反馈信息,对所述用户的兴趣特征进行更新;
[0147]
利用所述目标内容和更新后的兴趣特征,调整模型的参数,所述模型用于评估所述多个候选内容的评分。
[0148]
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
[0149]
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
[0150]
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。