图片分析模型训练方法、广告图片选择方法及电子设备与流程

文档序号:28280285发布日期:2021-12-31 21:26阅读:81来源:国知局
图片分析模型训练方法、广告图片选择方法及电子设备与流程

1.本技术涉及图像处理技术领域,尤其涉及一种图片分析模型训练方法、广告图片选择方法及电子设备。


背景技术:

2.互联网广告大多由文本和图片构成。相关技术中,通过图片的分辨率、纹理、空白量、边缘渐变等特征来评价图片的视觉感官效果,从而将视觉感官效果最佳的图片用于投放广告,然而,这可能出现广告图片的内容与对应的文本不匹配的情况,从而导致广告的点击率较低。


技术实现要素:

3.有鉴于此,本技术实施例提供一种图片分析模型训练方法、广告图片选择方法及电子设备,以解决相关技术中因选择的广告图片的内容与对应的文本不匹配,导致广告的点击率较低的技术问题。
4.为达到上述目的,本技术的技术方案是这样实现的:
5.本技术实施例提供一种图片分析模型训练方法,包括:
6.将至少一组样本向量输入至图片分析模型,得到每组样本向量对应的第一概率;其中,每组样本向量基于同一广告位上广告语相同的第一广告和第二广告生成,包括广告语、第一广告使用的第一图片、第一图片使用的第一文本、第二广告使用的第二图片和第二图片使用的第二文本;所述第一概率表征对应的样本向量中第一图片优于第二图片的概率;所述第一广告的点击率高于所述第二广告的点击率;
7.基于所述至少一组样本向量中每组样本向量对应的第一概率,计算出所述至少一组样本向量中每组样本向量对应的损失值;
8.根据计算出的损失值更新所述图片分析模型的权重参数。
9.上述方案中,所述图片分析模型包括文本处理网络、图像处理网络、注意力网络和二分类网络;所述将至少一组样本向量输入至图片分析模型,得到每组样本向量对应的第一概率时,所述方法包括:
10.将广告语、第一文本和第二文本输入至文本处理网络,得到第一全局特征向量、第二全局特征向量、第一文本特征向量和第二文本特征向量;其中,第一全局特征向量表征广告语和第一文本的全局特征,第二全局特征向量表征广告语和第二文本的全局特征,第一文本特征向量基于第一全局特征向量得到,第二文本特征向量基于第二全局特征向量得到;
11.将第一图片和第一全局特征向量输入至图像处理网络,得到第一图像特征向量,以及将第二图片和第二全局特征向量输入至图像处理网络,得到第二图像特征向量;
12.将第一文本特征向量和第一图像特征向量输入至注意力网络,得到第一图片向量,以及将第二文本特征向量和第二图像特征向量输入至注意力网络,得到第二图片向量;
13.将第一图片向量和第二图片向量输入至二分类网络,得到对应的第一概率。
14.上述方案中,所述文本处理网络包括文本编码器和前馈神经网络;所述将广告语、第一文本和第二文本输入至文本处理网络,得到第一全局特征向量、第二全局特征向量、第一文本特征向量和第二文本特征向量,包括:
15.将广告语和第一文本拼接,得到第一语句,以及将广告语和第二文本拼接,得到第二语句;
16.将第一语句和第二语句输入至文本编码器,得到第一全局特征向量和第二全局特征向量;
17.将第一全局特征向量和第二全局特征向量输入至前馈神经网络,得到第一文本特征向量和第二文本特征向量。
18.上述方案中,所述图像处理网络包括卷积层、残差网络和全连接层;所述将第一图片和第一全局特征向量输入至图像处理网络,得到第一图像特征向量,以及将第二图片和第二全局特征向量输入至图像处理网络,得到第二图像特征向量时,所述方法包括:
19.将第一图片集合输入至卷积层,得到第一图像张量;所述第一图片集合由所述至少一组样本向量中的所有第一图片或所有第二图片构成;
20.将第一图像张量和第一文本张量输入至残差网络,得到第二图像张量;所述第一文本张量由所有第一全局特征向量或所有第二全局特征向量生成;
21.将第二图像张量输入至全连接层,得到第一图片集合中每张图片对应的图像特征向量;其中,所述图像特征向量为第一图像特征向量或第二图像特征向量。
22.上述方案中,所述残差网络包括至少一个残差块,每个残差块包括至少一个残差单元,每个残差单元包括卷积网络、第一卷积层、第一全连接层、第二全连接层和归一化层;所述将第一图像张量和第一文本张量输入至所述残差单元,得到第二图像张量时,所述方法包括:
23.将第一图像张量输入至卷积网络,得到第三图像张量;
24.将第一图像张量输入至第一卷积层,得到第四图像张量;
25.将第三图像张量与第四图像张量相加,得到第五图像张量;
26.将第一文本张量输入至第一全连接层,得到第一参数张量;所述第一参数张量表征第一图片集合中每张图片与对应的文本之间的第一关联强度;
27.将第一文本张量输入至第二全连接层,得到第二参数张量;所述第二参数张量表征第一图片集合中每张图片与对应的文本之间的第二关联强度;
28.将第五图像张量、第一参数张量和第二参数张量输入至归一化层,得到第二图像张量。
29.上述方案中,所述将第一图片向量和第二图片向量输入至二分类网络,得到对应的第一概率时,所述方法包括:
30.将第一图片向量和第二图片向量输入至二分类网络,利用设定的激活函数对第一乘积与第二乘积之间的差值进行归一化处理,得到对应的第一概率;其中,所述第一乘积表征第一权重参数与第一图片向量之间的乘积;所述第二乘积表征第二权重参数与第二图片向量之间的乘积。
31.上述方案中,所述将至少一组样本向量输入至图片分析模型,得到每组样本向量
对应的第一概率之前,所述方法还包括:
32.获取广告的广告数据;所述广告数据包括广告位标识、广告语、图片和点击率;
33.从获取到的广告对应的图片中,确定出广告位标识和广告语均相同的至少一个第二图片集合;每个所述第二图片集合包括对应广告的一张图片;
34.基于图片对应的点击率,对每个所述第二图片集合中的图片进行排序,得到对应的第三图片集合;
35.基于每个所述第三图片集合中图片的排列顺序和对应的广告语,生成第一样本集合;其中,所述第一样本集合包括所述至少一组样本向量。
36.本技术实施例还提供了一种广告图片选择方法,包括:
37.基于第一广告语、每两张候选图片和对应的文本信息,生成多张候选图片对应的至少一组第一向量;
38.将生成的每组第一向量输入至第一模型,得到每组第一向量对应的第二概率;
39.基于每组第一向量对应的图片排列顺序,以及每组第一向量对应的第二概率,从所述多张候选图片中确定出广告图片;其中,
40.所述第一模型为采用上述任一种所述的图片分析模型训练方法训练得到的图片分析模型;所述第二概率表征第一候选图片优于第二候选图片的概率;所述第一候选图片在所述第二候选图片之前。
41.本技术实施例还提供了一种电子设备,包括:
42.训练单元,用于将至少一组样本向量输入至图片分析模型,得到每组样本向量对应的第一概率;其中,每组样本向量基于同一广告位上广告语相同的第一广告和第二广告生成,包括广告语、第一广告使用的第一图片、第一图片使用的第一文本、第二广告使用的第二图片和第二图片使用的第二文本;所述第一概率表征对应的样本向量中第一图片优于第二图片的概率;所述第一广告的点击率高于所述第二广告的点击率;
43.计算单元,用于基于所述至少一组样本向量中每组样本向量对应的第一概率,计算出所述至少一组样本向量中每组样本向量对应的损失值;
44.更新单元,用于根据计算出的损失值更新所述图片分析模型的权重参数。
45.本技术实施例还提供了一种电子设备,包括:
46.生成单元,用于基于第一广告语、每两张候选图片和对应的文本信息,生成多张候选图片对应的至少一组第一向量;
47.处理单元,用于将生成的每组第一向量输入至第一模型,得到每组第一向量对应的第二概率;
48.确定单元,用于基于每组第一向量对应的图片排列顺序,以及每组第一向量对应的第二概率,从所述多张候选图片中确定出广告图片;其中,
49.所述第一模型为采用上述任一种所述的图片分析模型训练方法训练得到的图片分析模型;所述第二概率表征第一候选图片优于第二候选图片的概率;所述第一候选图片在所述第二候选图片之前。
50.本技术实施例还提供了一种电子设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
51.其中,所述处理器用于运行所述计算机程序时,执行以下至少之一:
52.上述任一种图片分析模型方法的步骤;
53.上述广告图片选择方法的步骤。
54.本技术实施例还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下至少之一:
55.上述任一种图片分析模型训练方法的步骤;
56.上述广告图片选择方法的步骤。
57.本技术实施例中,通过至少一组样本向量训练图片分析模型,在训练的过程中,基于至少一组样本向量中每组样本向量对应的第一概率,计算出至少一组样本向量中每组样本向量对应的损失值;根据计算出的损失值更新图片分析模型的权重参数。由于在训练的过程中,每组训练样本基于同一广告位上广告语相同的第一广告和第二广告生成,包括广告语、第一广告使用的第一图片、第一图片使用的第一文本、第二广告使用的第二图片和第二图片使用的第二文本;第一概率表征对应的样本向量中第一图片优于第二图片的概率,第一广告的点击率高于第二广告的点击率,也就是说,每组样本向量对应的广告位和广告语均相同,每组样本向量中不同图片对应的点击率的差异源自图片内容的不同,因此,基于训练后的图片分析模型输出的概率,可以准确地预测出每两张图片中,与广告与匹配,且点击率较高的图片,进而从多张图片中选出广告效果最好的图片投放广告。
附图说明
58.图1为本技术实施例提供的图片分析模型训练方法的实现流程示意图;
59.图2为本技术实施例提供的一种广告的示意图;
60.图3为本技术实施例提供的图片分析模型处理每组样本向量的示意图;
61.图4为本技术实施例提供的图片分析模型中文本处理网络对文本进行处理的示意图;
62.图5为本技术实施例提供的图片分析模型中图像处理网络的结构示意图;
63.图6为本技术实施例提供的生成样本集的实现流程示意图;
64.图7为本技术实施例提供的广告图片的示意图;
65.图8为本技术实施例提供的广告图片选择方法的实现流程示意图;
66.图9为本技术实施例提供的广告图片选择方法的示意图;
67.图10为本技术实施例提供的广告图片选择方法的实现流程示意图;
68.图11为本技术实施例提供的电子设备的结构示意图;
69.图12为本技术另一实施例提供的电子设备的结构示意图;
70.图13为本技术实施例提供的电子设备的硬件组成结构示意图。
具体实施方式
71.近年来,互联网广告已经成为最为普遍的广告形式之一。不论是搜索引擎广告、展示包断广告、还是实时竞价广告,普遍由文本与图片搭配。其中,文本为广告的主题。为了提高广告的点击率,需要为广告选择广告图片,合适的广告图片具有以下特点:
72.1、较高的图片质量,例如,能让用户辨别细节的分辨率、合适的图片尺寸;
73.2、合适的图片内容,例如,广告语是某品牌某型号的手机,图片为同品牌同型号的
手机的图片;
74.3、图片中存在具有吸引力的内容要素,例如,带有文字说明、图片色彩、图片展示的产品细节等。
75.基于此,在本技术的各实施例中,电子设备基于同一广告位上广告语相同的每两个广告,确定出一组样本向量,基于至少一组样本向量对图片分析模型进行训练,得到训练后的图片分析模型。由于每组样本向量基于同一广告位上广告语相同的第一广告和第二广告生成,包括广告语、第一广告使用的第一图片、第一图片使用的第一文本、第二广告使用的第二图片和第二图片使用的第二文本;第一广告的点击率高于第二广告的点击率,也就是说,每组样本向量对应的广告位和广告语均相同,每组样本向量中不同图片对应的点击率的差异源自图片内容的不同,因此,基于训练后的图片分析模型输出的概率,可以准确地预测出每两张图片中,与广告与匹配,且点击率较高的图片,进而从多张图片中选出广告效果最好的图片投放广告。
76.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
77.图1为本技术实施例提供的图片分析模型训练方法的实现流程示意图,其中,流程的执行主体为终端、服务器等电子设备。如图1示出的,图片分析模型训练方法包括:
78.步骤101:将至少一组样本向量输入至图片分析模型,得到每组样本向量对应的第一概率;其中,每组样本向量基于同一广告位上广告语相同的第一广告和第二广告生成,包括广告语、第一广告使用的第一图片、第一图片使用的第一文本、第二广告使用的第二图片和第二图片使用的第二文本;所述第一概率表征对应的样本向量中第一图片优于第二图片的概率;所述第一广告的点击率高于所述第二广告的点击率。
79.这里,电子设备确定出至少一组样本向量,将至少一组样本向量输入至图片分析模型,通过图片分析模型对每组样本向量进行处理,得到每组样本向量对应的第一概率。其中,至少一组样本向量中的每组样本向量可以均基于同一广告位上广告语相同的每两个广告生成,当然,不同组的样本向量对应的广告语和广告位也可以不同。电子设备可以按照以下任一方法得到每组样本向量:
80.电子设备可以基于同一广告位上广告语相同的第一广告和第二广告,生成一组样本向量。广告语以及广告位的示意图如图2所示。
81.电子设备可以基于广告位和广告语均相同的广告对应的图片集合中的每两张图片,生成一组样本向量。其中,图片集合中包括每个广告的一张图片。
82.电子设备也可以从广告位和广告语均相同的广告对应的样本集合中,确定出一组样本,并确定出每组样本中每个样本对应的向量,得到至少一组样本向量。其中,每个样本集合中包括多组样本,每组样本中至少包括第一广告使用的第一图片、第一图片使用的第一文本、第二广告使用的第二图片和第二文本。
83.其中,图片集合或样本集合可以存在于电子设备的本地数据库,也可以存在于远程数据库。第一文本和第二文本由电子设备利用字符识别(ocr,optical character recognition)技术,从对应的图片中识别出。
84.考虑到第一文本或第二文本中包括的字符越多,图片分析模型的训练时长会越
长,为了降低图片分析模型的训练时长,在从对应的图片中识别出的文本对应的字符总长度大于第一设定阈值的情况下,按照字符从小到大的顺序进行裁剪,得到对应的第一文本或第二文本。
85.实际应用时,在对应的图片中包括多条文本的情况下,对识别出的多条文本按照字体从大到小的顺序进行排序;在识别出的文本对应的字符总长度大于第一设定阈值的情况下,基于第一设定阈值,对排序后的多条文本,按照由后向前的顺序进行裁剪,得到对应的第一文本或第二文本。
86.下面详细说明通过图片分析模型对每组样本向量进行处理的实现过程:
87.请一并参阅图3,图3为本技术实施例提供的图片分析模型处理每组样本向量的示意图。如图3所示,图片分析模型包括文本处理网络、图像处理网络、注意力网络和二分类网络。
88.为了提高预测出的第一概率的准确度,在一些实施例中,所述将至少一组样本向量输入至图片分析模型,得到每组样本向量对应的第一概率时,所述方法包括:
89.将广告语、第一文本和第二文本输入至文本处理网络,得到第一全局特征向量、第二全局特征向量、第一文本特征向量和第二文本特征向量;其中,第一全局特征向量表征广告语和第一文本的全局特征,第二全局特征向量表征广告语和第二文本的全局特征,第一文本特征向量基于第一全局特征向量得到,第二文本特征向量基于第二全局特征向量得到;
90.将第一图片和第一全局特征向量输入至图像处理网络,得到第一图像特征向量,以及将第二图片和第二全局特征向量输入至图像处理网络,得到第二图像特征向量;
91.将第一文本特征向量和第一图像特征向量输入至注意力网络,得到第一图片向量,以及将第二文本特征向量和第二图像特征向量输入至注意力网络,得到第二图片向量;
92.将第一图片向量和第二图片向量输入至二分类网络,得到对应的第一概率。
93.这里,电子设备通过图片分析模型对每组样本向量进行以下处理:
94.将第一组样本向量中的广告语、第一文本和第二文本输入至文本处理网络,获取文本处理网络基于广告语和第一文本输出的第一全局特征向量,基于第一全局特征向量输出的第一文本特征向量,以及获取文本处理网络基于广告语和第二文本输出的第二全局特征向量,基于第二全局特征向量输出的第二文本特征向量。其中,第一组样本向量为输入至图片分析模型中的任一组样本向量。第一全局特征向量、第二全局特征向量、第一文本特征向量和第二文本特征向量均为列向量。在图3中,表征广告语,表征第一文本;表征第二文本,表征第一全局特征向量,表征第二全局特征向量,表征第一文本特征向量,表征第二文本特征向量。和均为列向量,列向量的维数均为d
t

95.为了增强全局特征向量的非线性特征,在一些实施例中,所述文本处理网络包括文本编码器和前馈神经网络;所述将广告语、第一文本和第二文本输入至文本处理网络,得到第一全局特征向量、第二全局特征向量、第一文本特征向量和第二文本特征向量,包括:
96.将广告语和第一文本拼接,得到第一语句,以及将广告语和第二文本拼接,得到第二语句;
97.将第一语句和第二语句输入至文本编码器,得到第一全局特征向量和第二全局特征向量;
98.将第一全局特征向量和第二全局特征向量输入至前馈神经网络,得到第一文本特征向量和第二文本特征向量。
99.这里,如图4所示,文本处理网络包括文本编码器和前馈神经网络,文本编码器为基于转换器的双向编码表征(bert,bidirectional encoder representations from transformers)模型,bert模型的隐藏层宽度为d
t
。前馈神经网络由两个级联的全连接层构成,两个全连接层均采用relu函数作为激活函数。其中,与bert模型连接的全连接层1的宽度为2048,用于对全局特征向量进行放大处理(或称上采样);全连接层2的宽度为d
t
,用于对全连接层1输出的特征向量进行缩小处理(或称下采样)。前馈神经网络用于加强全局特征向量的非线性特征,即,增强文本特征向量的表达能力,以实现在不同场景下,表达出特征的差异性。
100.将广告语和第一文本按元素进行拼接,得到第一语句,将广告语和第二文本按元素进行拼接,得到第二语句;将第一语句和第二语句输入至文本编码器,得到第一语句对应的第一全局特征向量和第二语句对应的第二全局特征向量;将第一全局特征向量和第二全局特征向量输入至前馈神经网络,得到第一全局特征向量对应的第一文本特征向量,以及第二全局特征向量对应的第二文本特征向量。
101.示例性地,在广告语第一文本第一文本的情况下,将和按元素进行拼接得到按元素进行拼接得到按元素进行拼接得到其中,sep表征bert模型的分隔符,用于区分两个句子。
102.实际应用时,在将至少一组特征向量中每组特征向量的广告语、第一文本和第二文本输入至文本处理网络时,文本处理网络输出所有第一全局特征向量或所有第二全局特征向量对应的第一文本张量以及基于第一文本张量输出对应的其中,其中,其中,表征所有的第一文本特征向量或所有第二文本特征向量。b表征至少一组样本向量的组数,表征实数。
103.在得到第一全局特征向量和第二全局特征向量的情况下,将第一图片和第一全局特征向量输入至图像处理网络,得到第一图像特征向量,以及将第二图片和第二全局特征向量输入至图像处理网络,得到第二图像特征向量。其中,在图3中,表征第一图片,表征第二图片,表征第一图像特征向量,表征第二图像特征向量。
104.为了提取图片中图像特征与对应的文本的文本特征之间的关联强度,以提高预测出的第一概率的准确度,在一些实施例中,所述图像处理网络包括级联的卷积层、残差网络和全连接层;所述将第一图片和第一全局特征向量输入至图像处理网络,得到第一图像特征向量,以及将第二图片和第二全局特征向量输入至图像处理网络,得到第二图像特征向量时,所述方法包括:将第一图片集合输入至卷积层,得到第一图像张量;所述第一图片集合由所述至少一组样本向量中的所有第一图片或所有第二图片构成;
105.将第一图像张量和第一文本张量输入至残差网络,得到第二图像张量;所述第一文本张量由所有第一全局特征向量或所有第二全局特征向量生成;
106.将第二图像张量输入至全连接层,得到第一图片集合中每张图片对应的图像特征向量;其中,所述图像特征向量为第一图像特征向量或第二图像特征向量。
107.这里,电子设备通过图片处理网络对每组样本向量进行以下处理:将第一图片集合输入至卷积层进行卷积处理,得到第一图像张量;将第一图像张量和第一文本张量输入至残差网络进行处理,得到第二图像张量;将第二图像张量输入至全连接层进行处理,得到第一图片集合中每张图片对应的图像特征向量。全连接层的宽度为d
t

108.其中,残差网络包括至少一个残差块。需要说明的是,当图像处理网络包括多个级联的残差块时,首个残差块的输入为第一图像张量,非首个残差块的输入为相连的上一个残差块输出的图像张量,最后一个残差块输出第二图像张量。多个级联的残差块中每个残差块的层数可以部分相同,也可以完全不同,具体根据实际情况进行设置。
109.在一些实施例中,每个残差块包括至少一个残差单元,每个残差单元包括卷积网络、第一卷积层、第一全连接层、第二全连接层和归一化层;其中,卷积网络中由多个级联的卷积层构成,第一卷积层与卷积网络中的最后一个卷积层的卷积核的参数相同,卷积核的参数包括卷积核尺寸和总数,卷积核的总数表征卷积层的宽度;第一全连接层和第二全连接层的宽度与第一卷积层的宽度相同。实际应用时,图像处理网络为resnet网络。如图5所示,图像处理网络中的残差网络包括4个残差块,残差块1和残差块4中的层数相同。每个残差块中包括9个级联的残差单元,每个残差单元包括卷积网络、第一卷积层、第一全连接层、第二全连接层和归一化层。
110.为了增强图片中与文本特征相关的图像特征,以提高预测出的第一概率的准确度,所述将第一图像张量和第一文本张量输入至所述残差单元,得到第二图像张量时,所述方法包括:
111.将第一图像张量输入至卷积网络,得到第三图像张量;
112.将第一图像张量输入至第一卷积层,得到第四图像张量;
113.将第三图像张量与第四图像张量相加,得到第五图像张量;
114.将第一文本张量输入至第一全连接层,得到第一参数张量;所述第一参数张量表征第一图片集合中每张图片与对应的文本之间的第一关联强度;
115.将第一文本张量输入至第二全连接层,得到第二参数张量;所述第二参数张量表征第一图片集合中每张图片与对应的文本之间的第二关联强度;
116.将第五图像张量、第一参数张量和第二参数张量输入至归一化层,得到第二图像张量。
117.这里,以残差网络包括一个残差块,残差块包括1个残差单元为例进行说明:将第一图像张量输入至卷积网络进行卷积处理,得到第三图像张量;将第一图像张量输入至卷积网络进行卷积处理,得到第四图像张量;将第三图像张量与第四图像张量相加,得到第五图像张量;将第一文本张量输入至第一全连接层,得到第一参数张量将第一文本张量输入至第二全连接层,得到第二参数张量将第五图像张量、第一参数张量和第二参数张量输入至归一化层进行批量正则化处理,得到第二图像张量。第二图像张量为归一化后的向量。
118.需要说明的是,在残差块包括至少两个残差单元的情况下,残差块中首个残差单元的输入为对应的残差块的输入,非首个残差单元的输入为相连的上一个残差单元中归一化层的输出,最后一个残差块中归一化层的输出作为该残差块的输出。
119.需要说明的是,在残差网络包括一个残差块,且残差块包括1个残差单元的情况下,第二图像向量为残差网络的输出;在残差网络包括至少两个残差块,且残差块包括至少两个残差单元的情况下,第一残差块中最后一个残差单元的输出作为第一残差块的输出,且第一残差块的输出作为相连的第二残差块的输入,最后一个残差块中的最后一个残差单元的输出作为残差网络的输出,即,最后一个残差块中最后一个残差单元输出的图像张量为第二图像张量。
120.实际应用时,采用以下公式进行批量正则化处理:
[0121][0122]
其中,表征第五图像张量,c表征第一卷积层的宽度,h表征图片的高,w表征图片的宽;表征第五图像张量表征的向量的数学期望;表征第五图像张量表征的向量的方差;ε表征极小常数,例如,ε=10
‑6,用于避免分母为零的情况出现;*表征按元素相乘,又称,哈达玛积(hadamard product),即,tensorflow框架中的tf.math.multiply函数;α
i
和β
i
均表征残差单元对应的待训练的权重参数,均表征残差单元对应的待训练的权重参数,表征第一参数张量,表征第一参数张量,表征第一文本张量,ω
α
和b
α
均为第一全连接层对应的待训练的权重参数;表征第二参数张量,ω
β
和b
β
均为第二全连接层对应的待训练的权重参数。
[0123]
和分别影响着各残差单元的输入的方差与期望,它们的值可加强图片中与文本相关的特征。例如,bert模型接收了文本“手机屏幕”,得到与“手机屏幕”相关的和参数,这两个参数会加强残差单元中的卷积网络中有关“手机屏幕”的通道的参数,从而最终使resnet提取出了与文本相关的部分特征。
[0124]
需要说明的是,为b
×
c
×
h
×
w的张量,和均为b
×
c的张量,因此,它们之间的张量乘法、加法均为广播机制(例如numpy、tensorflow中的broadcast机制)。即,使用相同的值填充和使得和均为b
×
c
×
h
×
w的张量,再进行按元素相乘及矩阵加法运算。
[0125]
在得到第一图像特征向量和第二图像特征向量的情况下,将第一文本特征向量和第一图像特征向量输入至注意力网络,得到第一图片向量,以及将第二文本特征向量和第二图像特征向量输入至注意力网络,得到第二图片向量。其中,在图3中,表征第一图片
向量,表征第二图片向量。下面以第一文本特征向量和第一图像特征向量为例,详细说明注意力网络对第一文本特征向量和第一图像特征向量进行处理的具体实现过程:
[0126]
电子设备将第一文本特征向量和第一图像特征向量进行拼接,得到其中,d
t
表征第一文本特征向量的维数。
[0127]
将输入至注意力网络中的softmax层进行处理,得到第一注意力矩阵att1,其中,第一注意力矩阵表征第一文本与第一图片之间的相互注意力,w1、w2和c均为注意力网络中待训练的权重参数。
[0128]
按照求和的方式对第一注意力矩阵和第一图像特征向量进行降维,得到附加了文本注意力的第一图片向量其中,
[0129]
利用注意力网络按照上述方法对第二文本特征向量和第二图像特征向量进行处理,得到附加了文本注意力的第二图片向量其中,
[0130]
在得到第一图片向量和第二图片向量的情况下,将第一图片向量和第二图片向量输入至二分类网络,利用二分类网络比较第一图片向量和第二图片向量,得到对应的第一概率。
[0131]
在一些实施例中,所述将第一图片向量和第二图片向量输入至二分类网络,得到对应的第一概率时,所述方法包括:
[0132]
将第一图片向量和第二图片向量输入至二分类网络,利用设定的激活函数对第一乘积与第二乘积之间的差值进行归一化处理,得到对应的第一概率;其中,所述第一乘积表征第一权重参数与第一图片向量之间的乘积;所述第二乘积表征第二权重参数与第二图片向量之间的乘积。
[0133]
这里,电子设备将第一图片向量和第二图片向量输入至二分类网络,通过二分类网络计算出第一乘积与第二乘积之间的差值,并利用设定的激活函数对该差值进行归一化处理,得到对应的第一概率。
[0134]
实际应用时,在每组样本向量中第一图片排在第二图片之前的情况下,利用公式计算出第一概率,其中,p表征第一概率;w
a
和w
b
均为待训练的权重参数;w
a
表征第一权重参数;w
b
表征第二权重参数;δ表征sigmoid函数。
[0135]
需要说明的是,在一些实施例中,在每组样本向量中第二图片排在第一图片之前的情况下,利用公式计算出对应的第一概率。
[0136]
步骤102:基于所述至少一组样本向量中每组样本向量对应的第一概率,计算出所述至少一组样本向量中每组样本向量对应的损失值。
[0137]
这里,电子设备采用设定的损失函数,基于至少一组样本向量中每组样本向量对应的第一概率,计算出至少一组样本向量中每组样本向量对应的损失值。
[0138]
实际应用时,设定的损失函数为:l
i
=relu[1

p
i
]。l
i
表征第i组样本向量对应的损失值,p
i
表征第i组样本向量对应的第一概率。relu函数为线型函数。
[0139]
步骤103:根据计算出的损失值更新所述图片分析模型的权重参数。
[0140]
这里,电子设备可以基于至少一组样本向量中每组样本向量对应的损失值,计算出平均损失值,得到图片分析模型的损失值;根据图片分析模型的损失值更新图片分析模型的权重参数,以提升图片分析模型输出的第一概率的准确度。
[0141]
其中,电子设备将图片分析模型的损失值在图片分析模型中进行反向传播,在将损失值反向传播至图片分析模型的各个层的过程中,根据损失值计算出损失函数的梯度,并沿梯度的下降方向更新反向传播到当前层的权重参数。
[0142]
电子设备将更新后得到的权重参数,作为训练完毕的图片分析模型所使用的权重参数。
[0143]
这里,可设定更新停止条件,在满足更新停止条件时,将最后一次更新得到的权重参数,确定为训练完毕的图片分析模型所使用的权重参数。更新停止条件如设定的训练轮次(epoch),一个训练轮次即为根据至少一组样本向量对图片分析模型训练一次的过程。当然,更新停止条件并不限于此,例如还可为设定的平均准确率(map,mean average precision)等。
[0144]
需要说明的是,在实际应用中,通过最小化损失函数来实现模型训练。
[0145]
反向传播是相对于前向传播而言的,前向传播是指模型的前馈处理过程,而反向传播的方向与前向传播的方向相反。反向传播指根据模型输出的结果对模型各个层的权重参数进行更新。例如,图片分析模型包括文本处理网络、图像处理网络、注意力网络和二分类网络,则前向传播是指按照文本处理网络和图像处理网络

注意力网络

二分类网络的顺序进行处理,反向传播是指按照二分类网络

注意力网络

图像处理网络和文本处理网络的顺序,依次更新各个层的权重参数。
[0146]
本实施例提供的方案中,通过至少一组样本向量训练图片分析模型,在训练的过程中,基于至少一组样本向量中每组样本向量对应的第一概率,计算出至少一组样本向量中每组样本向量对应的损失值;根据计算出的损失值更新图片分析模型的权重参数。由于在训练的过程中,每组训练样本基于同一广告位上广告语相同的第一广告和第二广告生成,包括广告语、第一广告使用的第一图片、第一图片使用的第一文本、第二广告使用的第二图片和第二图片使用的第二文本;第一概率表征对应的样本向量中第一图片优于第二图片的概率,第一广告的点击率高于第二广告的点击率,也就是说,每组样本向量对应的广告位和广告语均相同,每组样本向量中不同图片对应的点击率的差异源自图片内容的不同,因此,基于训练后的图片分析模型输出的概率,可以准确地预测出每两张图片中,与广告与匹配,且点击率较高的图片,进而从多张图片中选出广告效果最好的图片投放广告。
[0147]
如图6所示,在一些实施例中,在训练图片分析模型之前,还需要基于在投广告的广告数据生成样本集。在步骤101之前,所述方法还包括:
[0148]
步骤001:获取广告的广告数据;所述广告数据包括广告位标识、广告语、图片和点击率。
[0149]
这里,电子设备从在投的广告中获取每个广告对应的广告位标识、广告语、图片和点击率。
[0150]
步骤002:从获取到的广告对应的图片中,确定出广告位标识和广告语均相同的至少一个第二图片集合;每个所述第二图片集合包括对应广告的一张图片。
[0151]
考虑到本技术实施例主要关注图片的广告效果,因此,需要收集同一广告位上广告语相同的不同广告的图片。这里,电子设备基于广告数据中的广告位标识和广告语,对获取到的广告对应的图片进行分类,得到至少一个第二图片集合,每个第二图片集合中的每张图片对应的广告位标识和广告语均相同。
[0152]
考虑到在训练图片分析模型时,每组样本向量中包括的两张图片对应不同的广告,因此,为了便于生成样本向量,在确定第二图片集合时,第二图片集合中包括对应广告的一张图片。
[0153]
步骤003:基于图片对应的点击率,对每个所述第二图片集合中的图片进行排序,得到对应的第三图片集合。
[0154]
实际应用时,将广告位和广告语均相同,且图片不同的广告,作为一个单元组。第j个单元组对应的广告数据可以表示为(t
j
,i
j
,v
j
,p
j
),t
j
表征广告语,广告语可以为一个字符串;p
j
表征广告位标识,i
j
表征第j个单元组图片集合,v
j
表征i
j
中每张图片对应的点击率。i
j
和v
j
均为长度相同的向量。由于广告为标识和广告语在该单元组内均是唯一的,因此,t
j
和p
j
可以为均对应长度的向量,也可以均为标量。
[0155]
这里,可以先对v
j
中每张图片对应的点击率,按照点击率从大到小的顺序排列,由于i
j
和v
j
中每个元素的下标均表征图片的标识,因此,基于排序后的v
j
中每张图片的下标,可以确定出i
j
中图片的排列顺序,从而保证同一个单元组的图片,都按照点击率从大到小的顺序排列。
[0156]
当然,在一些实施例中,也可以按照同样的方法对i
j
和v
j
按照点击率从小到大的顺序排列,从而保证同一个单元组的图片都按照点击率从小到大的顺序排列。
[0157]
在的情况下,由于同一个单元组内,广告语和广告位均相同,由此可知,导致和之间的点击率差异的原因在于图片质量和图片内容,因此,可以得到的广告效果优于即优于
[0158]
步骤004:基于每个所述第三图片集合中图片的排列顺序和对应的广告语,生成第一样本集合;其中,所述第一样本集合包括所述至少一组样本向量。
[0159]
这里,电子设备基于第三图片集合中图片的排列顺序和对应的广告语,确定出多组图片样本,基于每组图片样本确定出一组样本向量,从而得到第一样本集合。其中,每组图片样本包括广告语和已知相对优劣的两张图片。每组图片样本向量中的两张图片可以按照点击率从大到小的顺序排列,也可以按照点击率从小到大的顺序排列。每组图片样本可以表示为在第三图片集合中包括z张图片的情况下,可以确定出组图片样本。
[0160]
基于每组图片样本确定出一组样本向量的方法为:分别从每组图片样本中的每张图片中识别出对应的文本,基于每组图片样本和每组图片样本中每张图片对应的文本,确
定出一组样本向量。其中,每组样本向量可以表示为定出一组样本向量。其中,每组样本向量可以表示为表征第一图片,表征第二图片,从中识别出,表征使用的第一文本;从中识别出,表征使用的第二文本。
[0161]
考虑到带有文字说明的图片相对于没有文字说明的图片更能吸引用户的注意力,用于投放广告的图片通常带有文字说明,因此,本实施例中,采用带有文字说明的图片对图片分析模型进行训练。但是,如图7所示,并非所有图片中的文本都有助于图片的广告效果,因此,图片中的文本内容对于理解图片的内容相当重要,基于此,本实施例中,利用图文识别技术从每组图片样本中的每张图片中识别出对应的文本,例如,ocr技术。
[0162]
在识别图片对应的文本的过程中,将不同位置的文本作为一句话,将识别出的所有语句拼接为一条文本。不同的语句可以用句号分隔。考虑到字体更大的文字更显眼也更重要,而且识别出的文字的准确率也更高,因此,在拼接不同语句时,按照字体从大到小的顺序进行拼接。例如,不同位置的文字分别为“redmi k40”(大字体)和“以旧换新至高补贴3000元e卡”(小字体),拼接后的文本为:“redmi k40。以旧换新至高补贴3000元e卡”。
[0163]
实际应用时可以针对文本长度设置最大阈值,在从图片中识别出的文本长度大于最大阈值d的情况下,在生成每组样本向量之前,需要对识别出的文本进行裁剪。其中,考虑到图片中字体较大的文本相对比较重要,因此,为了避免重要信息被裁减调,可以按照字符从小到大的顺序,对识别出的文本进行裁剪。在对应的图片中包括多条文本的情况下,对识别出的多条文本按照字体从大到小的顺序进行排序;在识别出的文本对应的字符总长度大于d的情况下,基于设定字符长度,对排序后的多条文本,按照由后向前的顺序进行裁剪。
[0164]
需要说明的是,考虑到可能相同的图片出现在不同的单元组中。例如,一张运动鞋图片(图片1)、一张高跟鞋图片(图片2),如果广告语是“减震透气,清爽一夏”那么显然图片1更适合;而如果广告语是“最新款式,衬托腿形”则是图片2更适合。因此,为了获得与广告语匹配的图片,确定出的每组图片样本不仅包含图片,还包含广告语。
[0165]
实际应用时,本实施例中,所有图片的宽均为w,高均为h。其中,w和h可以根据广告位允许的图片尺寸的最大值进行设置。在图片的宽不等于w和/或高不等于h的情况下,基于双线性插值算法对图片进行拉伸或缩减,从而使得处理后的图片的宽为w,高为h。
[0166]
需要说明的是,w、h和d的值越大,基于至少一组样本向量训练得到的图片分析模型的效果越好,但是,相应地训练时长也越长,因此,需要兼顾图片分析模型的效果和训练时长,选择合适的w、h和d。实际应用时,w和h可以均为546,d可以为64。
[0167]
需要说明的是,在实际应用中,执行步骤001至步骤004的电子设备,与执行步骤101至步骤103的电子设备可以相同,也可以不同。
[0168]
作为本技术的另一实施例,在图片分析模型训练完毕后,即可将图片分析模型投入使用。例如,在选择广告图片的场景中,电子设备可以采用通过上述实施例训练得到的图片分析模型对待投放广告对应的候选图片进行分析,以选出广告效果最好的图片。需要说明的是,训练图片分析模型对应的实施例中的电子设备,与本实施例中采用图片分析模型选择广告图片的电子设备可以不同。
[0169]
参照图8,电子设备采用训练完毕后的图片分析模型选择广告图片的实现过程如下:
[0170]
步骤801:基于第一广告语、每两张候选图片和对应的文本信息,生成多张候选图片对应的至少一组第一向量。
[0171]
这里,电子设备获取待投放的广告的第一广告语和多张候选图片,利用ocr技术从候选图片中识别出对应的文本信息,基于第一广告语、每两张候选图片和对应的文本信息,生成多张候选图片对应的至少一组第一向量。
[0172]
示例性地,当前待投放的广告的第一广告语为τ,有n张候选图片为依次为:v0,v1,v2…
v
n
‑1;利用ocr技术对每张候选图片进行处理,提取出对应的文本信息为t0,t1,t2…
t
n
‑1;基于τ、每两张候选图片和对应的文本信息,生成n张候选图片对应的多组第一向量,每组第一向量可以表示为(τ,v
i
,t
i
,v
g
,t
g
)。其中,i和g均为小于n的正整数。
[0173]
需要说明的是,在从候选图片中识别出的文本信息的长度大于设定的最大文本长度的情况下,基于设定的最大文本长度,对识别出的文本信息进行裁剪,裁剪方法请参照上文中的相关描述,此处不赘述。
[0174]
每组第一向量包括第一广告语、第一候选图片、第一候选图片使用的第一文本信息、第二候选图片、第二候选图片使用的第二文本信息。
[0175]
步骤802:将生成的每组第一向量输入至第一模型,得到每组第一向量对应的第二概率;其中,所述第一模型为采用上述任一种图片分析模型训练方法训练得到的图片分析模型;所述第二概率表征第一候选图片优于第二候选图片的概率;所述第一候选图片在所述第二候选图片之前。
[0176]
这里,第一模型对每组第一向量的处理过程与上文图片分析模型对每组样本向量进行处理的方法类似,此处不赘述。
[0177]
步骤803:基于每组第一向量对应的图片排列顺序,以及每组第一向量对应的第二概率,从所述多张候选图片中确定出广告图片。
[0178]
这里,电子设备基于每组第一向量对应的图片排列顺序,以及每组第一向量对应的第二概率,从多张候选图片中确定出最优的候选图片,得到广告图片。
[0179]
其中,在多张候选图片的数量为n的情况下,需要进行n

1轮比较,才能从多张候选图片中确定出最优的候选图片。
[0180]
实际应用时,在第一向量(τ,v
i
,t
i
,v
g
,t
g
)对应的第二概率为1的情况下,表征v
i
优于v
g

[0181]
在实施例中,电子设备基于第一广告语、每两张候选图片和对应的文本信息,生成多张候选图片对应的至少一组第一向量;将生成的每组第一向量输入至第一模型,得到每组第一向量对应的第二概率;基于每组第一向量对应的第二概率,从所述多张候选图片中确定出广告图片。由于,第二概率表征第一候选图片优于第二候选图片的概率;所述第一候选图片在所述第二候选图片之前,因此,电子设备可以基于每组第一向量对应的图片排列顺序,以及每组第一向量对应的第二概率,从多张候选图片中确定出最优的候选图片,从而将最优的候选图片投放广告。
[0182]
图9为本技术实施例提供的广告图片选择方法的示意图,图10为本技术实施例提供的广告图片选择方法的实现流程示意图,如图10所示,广告图片选择方法包括:
[0183]
步骤901:获取广告的广告数据;所述广告数据包括广告位标识、广告语、图片和点击率。
[0184]
步骤902:从获取到的广告对应的图片中,确定出广告位标识和广告语均相同的至少一个第二图片集合;每个所述第二图片集合包括对应广告的一张图片。
[0185]
其中,图9中的采样器用于确定出同一广告位上广告语相同的不同广告的广告数据。
[0186]
步骤903:基于图片对应的点击率,对每个所述第二图片集合中的图片进行排序,得到对应的第三图片集合。
[0187]
步骤904:基于每个所述第三图片集合中图片的排列顺序和对应的广告语,生成第一样本集合;其中,所述第一样本集合包括所述至少一组样本向量。
[0188]
步骤905:对第一样本集合中的样本进行随机混排,从第一样本集合中取出至少一组样本向量。
[0189]
这里,电子设备从第一样本集中按顺序取出至少一组第一样本向量。
[0190]
为了避免图片分析模型过拟合,在每次训练前,对第一样本集中的每组样本进行随机混排,从混排后的样本集中取出至少一组样本向量。
[0191]
其中,可以利用tensorflow的tensorflow.random.shuffle函数,对样本进行混排,从而实现数据随机化,从而避免过拟合。
[0192]
步骤906:将至少一组样本向量输入至图片分析模型,得到每组样本向量对应的第一概率。
[0193]
步骤907:基于所述至少一组样本向量中每组样本向量对应的第一概率,计算出所述至少一组样本向量中每组样本向量对应的损失值。
[0194]
步骤908:根据计算出的损失值更新所述图片分析模型的权重参数。
[0195]
步骤909:输出训练后的图片分析模型,得到第一模型。
[0196]
步骤910:获取待投放广告对应的第一广告语和多张候选图片。
[0197]
步骤911:识别出多张候选图片中每张候选图片使用的文本信息。
[0198]
步骤912:基于第一广告语、每两张候选图片和对应的文本信息,生成多张候选图片对应的至少一组第一向量。
[0199]
步骤913:将生成的每组第一向量输入至第一模型,得到每组第一向量对应的第二概率;所述第二概率表征第一候选图片优于第二候选图片的概率;所述第一候选图片在所述第二候选图片之前。
[0200]
步骤914:基于每组第一向量对应的图片排列顺序,以及每组第一向量对应的第二概率,从所述多张候选图片中确定出广告图片。
[0201]
步骤915:基于第一广告语和确定出的广告图片,生成图文广告。
[0202]
为实现本技术实施例的图片分析模型训练方法,本技术实施例还提供了一种电子设备,如图11所示,该电子设备包括:
[0203]
训练单元1101,用于将至少一组样本向量输入至图片分析模型,得到每组样本向量对应的第一概率;其中,每组样本向量基于同一广告位上广告语相同的第一广告和第二广告生成,包括广告语、第一广告使用的第一图片、第一图片使用的第一文本、第二广告使用的第二图片和第二图片使用的第二文本;所述第一概率表征对应的样本向量中第一图片优于第二图片的概率;所述第一广告的点击率高于所述第二广告的点击率;
[0204]
计算单元1102,用于基于所述至少一组样本向量中每组样本向量对应的第一概
率,计算出所述至少一组样本向量中每组样本向量对应的损失值;
[0205]
更新单元1103,用于根据计算出的损失值更新所述图片分析模型的权重参数。
[0206]
在一些实施例中,所述图片分析模型包括文本处理网络、图像处理网络、注意力网络和二分类网络;训练单元1101具体用于:
[0207]
将广告语、第一文本和第二文本输入至文本处理网络,得到第一全局特征向量、第二全局特征向量、第一文本特征向量和第二文本特征向量;其中,第一全局特征向量表征广告语和第一文本的全局特征,第二全局特征向量表征广告语和第二文本的全局特征,第一文本特征向量基于第一全局特征向量得到,第二文本特征向量基于第二全局特征向量得到;
[0208]
将第一图片和第一全局特征向量输入至图像处理网络,得到第一图像特征向量,以及将第二图片和第二全局特征向量输入至图像处理网络,得到第二图像特征向量;
[0209]
将第一文本特征向量和第一图像特征向量输入至注意力网络,得到第一图片向量,以及将第二文本特征向量和第二图像特征向量输入至注意力网络,得到第二图片向量;
[0210]
将第一图片向量和第二图片向量输入至二分类网络,得到对应的第一概率。
[0211]
在一些实施例中,所述文本处理网络包括文本编码器和前馈神经网络;训练单元1101具体用于:
[0212]
将广告语和第一文本拼接,得到第一语句,以及将广告语和第二文本拼接,得到第二语句;
[0213]
将第一语句和第二语句输入至文本编码器,得到第一全局特征向量和第二全局特征向量;
[0214]
将第一全局特征向量和第二全局特征向量输入至前馈神经网络,得到第一文本特征向量和第二文本特征向量。
[0215]
在一些实施例中,所述图像处理网络包括卷积层、残差网络和全连接层;训练单元1101具体用于:
[0216]
将第一图片集合输入至卷积层,得到第一图像张量;所述第一图片集合由所述至少一组样本向量中的所有第一图片或所有第二图片构成;
[0217]
将第一图像张量和第一文本张量输入至残差网络,得到第二图像张量;所述第一文本张量由所有第一全局特征向量或所有第二全局特征向量生成;
[0218]
将第二图像张量输入至全连接层,得到第一图片集合中每张图片对应的图像特征向量;其中,所述图像特征向量为第一图像特征向量或第二图像特征向量。
[0219]
在一些实施例中,所述残差网络包括至少一个残差块,每个残差块包括至少一个残差单元,每个残差单元包括卷积网络、第一卷积层、第一全连接层、第二全连接层和归一化层;训练单元1101具体用于:
[0220]
将第一图像张量输入至卷积网络,得到第三图像张量;
[0221]
将第一图像张量输入至第一卷积层,得到第四图像张量;
[0222]
将第三图像张量与第四图像张量相加,得到第五图像张量;
[0223]
将第一文本张量输入至第一全连接层,得到第一参数张量;所述第一参数张量表征第一图片集合中每张图片与对应的文本之间的第一关联强度;
[0224]
将第一文本张量输入至第二全连接层,得到第二参数张量;所述第二参数张量表
征第一图片集合中每张图片与对应的文本之间的第二关联强度;
[0225]
将第五图像张量、第一参数张量和第二参数张量输入至归一化层,得到第二图像张量。
[0226]
在一些实施例中,训练单元1101具体用于:
[0227]
将第一图片向量和第二图片向量输入至二分类网络,利用设定的激活函数对第一乘积与第二乘积之间的差值进行归一化处理,得到对应的第一概率;其中,所述第一乘积表征第一权重参数与第一图片向量之间的乘积;所述第二乘积表征第二权重参数与第二图片向量之间的乘积。
[0228]
在一些实施例中,该电子设备还包括:
[0229]
获取单元,用于获取广告的广告数据;所述广告数据包括广告位标识、广告语、图片和点击率;
[0230]
确定单元,用于从获取到的广告对应的图片中,确定出广告位标识和广告语均相同的至少一个第二图片集合;每个所述第二图片集合包括对应广告的一张图片;
[0231]
排序单元,用于基于图片对应的点击率,对每个所述第二图片集合中的图片进行排序,得到对应的第三图片集合;
[0232]
生成单元,用于基于每个所述第三图片集合中图片的排列顺序和对应的广告语,生成第一样本集合;其中,所述第一样本集合包括所述至少一组样本向量。
[0233]
实际应用时,电子设备包括的各单元,可由电子设备中的处理器来实现。当然,处理器需要运行存储器中存储的程序来实现上述各程序模块的功能。
[0234]
需要说明的是:上述实施例提供的电子设备在训练图片分析模型时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将电子设备的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的电子设备与图片分析模型训练方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0235]
为实现本技术实施例的广告图片选择方法,本技术实施例还提供了一种电子设备,如图12所示,该电子设备包括:
[0236]
生成单元1201,用于基于第一广告语、每两张候选图片和对应的文本信息,生成多张候选图片对应的至少一组第一向量;
[0237]
处理单元1202,用于将生成的每组第一向量输入至第一模型,得到每组第一向量对应的第二概率;
[0238]
确定单元1203,用于基于每组第一向量对应的图片排列顺序,以及每组第一向量对应的第二概率,从所述多张候选图片中确定出广告图片;其中,
[0239]
所述第一模型为采用如权利要求1至7任一项所述的图片分析模型训练方法训练得到的图片分析模型;所述第二概率表征第一候选图片优于第二候选图片的概率;所述第一候选图片在所述第二候选图片之前。
[0240]
实际应用时,电子设备包括的各单元,可由电子设备中的处理器来实现。当然,处理器需要运行存储器中存储的程序来实现上述各程序模块的功能。
[0241]
需要说明的是:上述实施例提供的电子设备在选择广告图片时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模
块完成,即将电子设备的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的电子设备与广告图片选择方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0242]
基于上述程序模块的硬件实现,且为了实现本技术实施例的方法,本技术实施例还提供了一种电子设备。图13为本技术实施例电子设备的硬件组成结构示意图,如图13所示,电子设备包括:
[0243]
通信接口110,能够与其它设备比如网络设备等进行信息交互;
[0244]
处理器120,与通信接口110连接,以实现与其它设备进行信息交互,用于运行计算机程序时,执行上述一个或多个技术方案提供的图片分析模型训练方法,和/或,广告图片选择方法。而所述计算机程序存储在存储器130上。
[0245]
当然,实际应用时,电子设备中的各个组件通过总线系统140耦合在一起。可理解,总线系统140用于实现这些组件之间的连接通信。总线系统140除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图13中将各种总线都标为总线系统140。
[0246]
本技术实施例中的存储器130用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括:用于在电子设备上操作的任何计算机程序。
[0247]
可以理解,存储器130可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,read only memory)、可编程只读存储器(prom,programmable read

only memory)、可擦除可编程只读存储器(eprom,erasable programmable read

only memory)、电可擦除可编程只读存储器(eeprom,electrically erasable programmable read

only memory)、磁性随机存取存储器(fram,ferromagnetic random access memory)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(cd

rom,compact disc read

only memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(ram,random access memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(sram,static random access memory)、同步静态随机存取存储器(ssram,synchronous static random access memory)、动态随机存取存储器(dram,dynamic random access memory)、同步动态随机存取存储器(sdram,synchronous dynamic random access memory)、双倍数据速率同步动态随机存取存储器(ddrsdram,double data rate synchronous dynamic random access memory)、增强型同步动态随机存取存储器(esdram,enhanced synchronous dynamic random access memory)、同步连接动态随机存取存储器(sldram,sync link dynamic random access memory)、直接内存总线随机存取存储器(drram,direct rambus random access memory)。本技术实施例描述的存储器130旨在包括但不限于这些和任意其它适合类型的存储器。
[0248]
上述本技术实施例揭示的方法可以应用于处理器120中,或者由处理器120实现。处理器120可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器120中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器120可以是通用处理器、dsp,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器120可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑
框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本技术实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器130,处理器120读取存储器130中的程序,结合其硬件完成前述方法的步骤。
[0249]
处理器120执行所述程序时实现本技术实施例的各个方法中的相应流程,为了简洁,在此不再赘述。
[0250]
在示例性实施例中,本技术实施例还提供了一种存储介质,即计算机存储介质,具体为计算机可读存储介质,例如包括存储计算机程序的存储器130,上述计算机程序可由处理器120执行,以完成前述方法所述步骤。计算机可读存储介质可以是fram、rom、prom、eprom、eeprom、flash memory、磁表面存储器、光盘、或cd

rom等存储器。
[0251]
在本技术所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
[0252]
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0253]
另外,在本技术各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0254]
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0255]
需要说明的是,本技术实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
[0256]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1