一种控制广告投放频次的方法及系统与流程

文档序号:25911290发布日期:2021-07-16 21:46阅读:271来源:国知局
一种控制广告投放频次的方法及系统与流程

1.本发明涉及互联网广告领域,具体涉及一种控制广告投放频次的方法及系统。


背景技术:

2.目前互联网app广告的投放方式中,为提升用户体验,一般会对相同博文的投放频次进行控制,广告投放的频次策略如:同一用户1天内不能看到同一条的博文广告。
3.某些广告虽然与用户已曝光的广告不是同一博文,但是内容相似,如果不在频次控制时加入相似度判断,就会让用户误以为短时间内看到同一广告,从而影响用户体验,并且影响广告的投放效果。
4.同时在投放时需要判断用户已曝光博文与候选广告博文的相似度,如果采用在投放时实时对博文内容分词再分析比较的传统方法,处理性能较差,无法适应大量候选广告博文参与计算的情况。


技术实现要素:

5.本发明实施例提供一种控制广告投放频次的方法及装置,通过博文签名进行相似度的计算,在广告投放时进行相似度的计算,从而控制相似候选广告的投放频次,既提高了处理性能,又提升了用户体验和广告投放效果。
6.为达到上述目的,一方面,本发明实施例提供了一种控制广告投放频次的方法,所述方法包括:
7.当用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;
8.获取向该用户待曝光的广告博文的博文签名;
9.根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;
10.根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
11.另一方面,本发明实施例提供了一种控制广告投放频次的系统,所述装置包括:
12.信息获取单元,用于在用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;以及获取向该用户待曝光的广告博文的博文签名;
13.相似度单元,用于根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;
14.投放单元,用于根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
15.上述技术方案具有如下有益效果:
16.本发明的技术方案由于使用了控制广告投放频次的方法,本申请通过引入博文签名计算相似度的方法,计算并保存候选广告博文和用户已曝光博文的博文签名,并在投放时判断已曝光博文与候选广告博文的相似度,从而控制相似候选广告的投放频次,既提高了处理性能,又提升了用户体验和广告投放效果。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1是本发明实施例一种控制广告投放频次的方法的流程图;
19.图2是本发明实施例一种控制广告投放频次的系统的结构示意图;
20.图3是本发明实施例中一种simhash算法流程图。
具体实施方式
21.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
22.如图1所示,是本发明实施例一种控制广告投放频次的方法的流程图,所述方法包括:
23.s101:当用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名。
24.s102:获取向该用户待曝光的广告博文的博文签名。
25.优选地,所述广告博文的博文签名为通过simhash算法计算获得的simhash签名。
26.进一步优选地,所述simhash签名的计算方法,包括:将广告博文的语句进行分词,得到特征向量,为每一个特征向量设置权重;
27.通过哈希hash函数计算每个特征向量的hash值;
28.根据所述权重和hash值,给每一个特征向量进行加权;
29.将各个特征向量的加权结果累加,获得对应于广告博文的序列串;
30.对所述序列串进行降维获得广告博文的simhash签名。
31.具体地,当广告订单上线时,会给定博文标识,记为mid,并计算该广告博文的博文签名即simhash签名,记为sim_code。
32.当用户访问请求到来时,投放模块从数据库中获取该用户曝光过的博文mid及博文的sim_code,与各候选订单博文的sim_code计算相似度;可使用比较sim_code的海明距离来衡量相似度。如64位sim_code的海明距离小于3的标记为相似博文。例如:已曝光的博文a的sim_code与候选博文b的sim_code的海明距离小于3,则a与b为相似博文。
33.s103:根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度。
34.优选地,所述根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度,包括:通过计算待曝光的广告博文与已曝光的广告博文的simhash签名的海明距离确定待曝光的广告博文与已曝光的广告博文之间的相似度。
35.s104:根据所述相似度,如果判定待曝光的广告博文未命中预先设定的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
36.优选地,命中频次控制策略是指:待曝光的广告博文与已曝光的广告博文之间的相似度高于设定的相似度阈值,且已曝光的广告博文向所述用户曝光的时间在24小时以
内。判断相似博文是否命中频次控制策略,则该相似博文的广告将过滤掉,而不被曝光;例如:a与b为相似博文,且a的曝光时间在一天以内,则候选博文b将被过滤掉,不会曝光给该用户。
37.当最后有广告博文曝光给用户后,将这些博文的博文标识mid、曝光时间,以及博文的sim_code,保存至数据库,一般使用redis。
38.如图3所示,simhash算法的流程分为5个步骤:分词、hash、加权、合并、降维,具体过程如下所述:
39.(1)分词
40.对广告博文中的语句,进行分词,得到有效的特征向量,然后为每一个特征向量设置1

5等5个级别的权重,对于给定的广告博文,那么特征向量可以是博文文本中的词,其权重可以是这个词出现的次数。例如给定一段语句:“csdn博客结构之法算法之道的作者july”,分词后为:“csdn博客结构之法算法之道的作者july”,然后为每个特征向量赋予权值:csdn(4)博客(5)结构(3)之(1)法(2)算法(3)之(1)道(2)的(1)作者(5)july(5),其中括号里的数字代表这个单词在整条语句中的重要程度,数字越大代表越重要。
41.(2)hash
42.通过hash函数计算各个特征向量的hash值,hash值为二进制数01组成的n

bit签名。比如“csdn”的hash值hash(csdn)为100101,“博客”的hash值hash(博客)为“101011”。就这样,字符串就变成了一系列数字。
43.(3)加权
44.在hash值的基础上,给所有特征向量进行加权,即w=hash*weight,且遇到1则hash值和权值正相乘,遇到0则hash值和权值负相乘。例如给“csdn”的hash值“100101”加权得到:w(csdn)=100101 4=4
ꢀ‑4ꢀ‑
4 4
ꢀ‑
4 4,给“博客”的hash值“101011”加权得到:w(博客)=101011 5=5
ꢀ‑
5 5
ꢀ‑
5 5 5,其余特征向量类似此般操作。
45.(4)合并
46.将上述各个特征向量的加权结果累加,变成只有一个序列串。拿前两个特征向量举例,例如“csdn”的“4
ꢀ‑4ꢀ‑
4 4
ꢀ‑
4 4”和“博客”的“5
ꢀ‑
5 5
ꢀ‑
5 5 5”进行累加,得到“4+5
ꢀ‑
4+
‑5ꢀ‑
4+5 4+
‑5ꢀ‑
4+5 4+5”,得到“9
ꢀ‑
9 1
ꢀ‑
1 1”。
47.(5)降维
48.对于n

bit签名的累加结果,如果大于0则置1,否则置0,从而得到该语句的simhash值,最后我们便可以根据不同语句simhash的海明距离来判断它们的相似度。例如把上面计算出来的“9
ꢀ‑
9 1
ꢀ‑
1 1 9”降维,某位大于0记为1,小于0记为0,得到的01串为:“1 0 1 0 1 1”,从而形成它们的simhash签名。
49.对应于上述方法,如图2所示,是本发明实施例一种控制广告投放频次的系统的结构示意图,所述装置包括:
50.信息获取单元21,用于在用户提交访问请求时,获取向该用户已曝光的广告博文的博文签名;以及获取向该用户待曝光的广告博文的博文签名;
51.相似度单元22,用于根据博文签名,确定待曝光的广告博文与已曝光的广告博文之间的相似度;
52.投放单元23,用于根据所述相似度,如果判定待曝光的广告博文未命中预先设定
的频次控制策略,则将该待曝光的广告博文曝光给所述用户。
53.优选地,还包括:博文签名计算单元,用于通过simhash算法计算获得的广告博文的simhash签名,将计算得到的simhash签名作为所述博文签名。
54.优选地,所述博文签名计算单元,具体用于:
55.将广告博文的语句进行分词,得到特征向量,为每一个特征向量设置权重;
56.通过hash函数计算每个特征向量的hash值;
57.根据所述权重和hash值,给每一个特征向量进行加权;
58.将各个特征向量的加权结果累加,获得对应于广告博文的序列串;
59.对所述序列串进行降维获得广告博文的simhash签名。
60.优选地,所述相似度单元,具体用于通过计算待曝光的广告博文与已曝光的广告博文的simhash签名的海明距离确定待曝光的广告博文与已曝光的广告博文之间的相似度。
61.优选地,命中频次控制策略是指:待曝光的广告博文与已曝光的广告博文之间的相似度高于设定的相似度阈值,且已曝光的广告博文向所述用户曝光的时间在24小时以内。
62.本发明主要通过零代码侵入的方式隔离api网关中单一业务变动影响、容量变动影响,以及api网关本身变动对全范围的影响。通过配置的方式解决多协议适配的问题,支持http、dubbo等多种协议。
63.根据本发明的技术方案,第一,实现单一业务服务api与其他业务的物理隔离。第二,使得业务服务api的变动修改的影响控制在本业务范围内。第三,对业务服务api的容量需求只需进行当前服务的扩缩容即可实现。
64.应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
65.在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
66.为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
67.上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语

包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
68.以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1