1.本发明涉及互联网技术领域,特别是一种提升数字商城广告转化效果的实时竞价排序方法、系统、存储介质和电子设备。
背景技术:2.数字商城平台建设时,会提供给卖家(店铺)一套引流系统,通过竞价服务购买商城内的网站流量(广告资源),引流到店铺首页或商品详情页,进而带来转化时使用。目前,大部分数字商城平台大数据与算法技术薄弱,无法结合业务数据(如用户行为,用户特征,商品特征等)有效引流。
3.因鉴于此,特提出本发明。
技术实现要素:4.本发明的目的在于提供一种提升数字商城广告转化效果的实时竞价排序方法、系统、存储介质和电子设备,解决目前的数字商城不能很好的引入数字广告的实时竞价技术,最大化流量价值的问题。
5.为解决上述问题,第一方面,本发明实施例提供一种提升数字商城广告转化效果的实时竞价排序方法,包括:
6.判断是否为翻页请求,若不是翻页请求,则进入广告排序流程;所述广告排序流程包括:获取流量基本信息;根据流量基本信息中的搜索关键词与过滤条件过滤相关产品,生成初始广告队列;根据定向条件进一步过滤广告队列;计算队列中的广告基础出价;将广告队列推送进实时推理服务,通过模型对广告的点击率和/或转化率实时计算;读取流量分配系数,计算队列中的广告出现机会,形成最终排序,输出广告队列;输出排序首位广告并从队列中弹出该广告。
7.可选的,在所述广告排序流程中所调用的实时竞价计算引擎,通过以下方式整合得到:构建初始数据库;所述初始数据库包括关键词矢量库、产品矢量库和人群矢量库;构建非监督分类模型;所述非监督分类模型包括关键词分类模型、产品分类模型、人群分类模型;配置关键算法;所述关键算法包括关键词推荐和/或匹配算法、点击率和/或转化率预估算法、流量分配算法、价格区间推荐算法。
8.可选的,在配置所述关键算法中,还包括配置反作弊算法,所述反作弊算法包括根据通用黑名单清理极端数据,根据点击行为黑名单标记异常点击行为。
9.可选的,还采用ab测试对所构建的模型或者算法策略的实际效果进行验证。
10.可选的,所述构建初始数据库和所述构建非监督分类模型包括:先构建关键词矢量库,根据关键词矢量库生成推荐关键字和构建非监督关键词分类模型;根据人群标签构建人群矢量库;根据人群矢量库,分别构建非监督学习人群分类模型,人群属性模型;基于非监督学习人群分类模型和人群属性模型,构建产品矢量库;根据产品矢量库,构建非监督
学习产品分类模型;最后,根据非监督关键词分类模型、非监督学习人群分类模型、非监督学习产品分类模型、人群属性模型进行融合,从而构建竞价点击率和/或转化率预测模型,用于返回多个广告活动预测用户产生概率。
11.可选的,所述价格区间推荐算法的配置方法包括:获取用户输入的产品、类别、关键字中的至少一个数据;选择对应定向范围的产品或关键字;获取相应条件内产品价格区间,有数据则返回结果,没有数据,则:获取用户产品关键字价格区间,有数据则返回结果,没有数据,则:获取产品分类价格区间,有数据则返回结果,没有数据,则返回默认价格区间。
12.可选的,所述流量分配算法的配置包括:获取当前广告位的原始数据;根据评分标准计算当前评分;构建遗传算法染色体;设置遗传算法评分标准;遗传算法进化n代后设置获取最优染色体,根据获取的最优染色体计算评分,并与原始评分对比,使用评分高的比例作为最终分配比例;将最终分配比例提供给广告服务器使用。
13.第二方面,本发明实施例提供一种提升数字商城广告转化效果的实时竞价排序系统,包括:判断模块,用于判断是否为翻页请求,若不是翻页请求,则进入广告排序流程;广告排序流程模块,用于执行所述广告排序流程,所述广告排序流程包括:获取流量基本信息;根据流量基本信息中的搜索关键词与过滤条件过滤相关产品,生成初始广告队列;根据定向条件进一步过滤广告队列;计算队列中的广告基础出价;将广告队列推送进实时推理服务,通过模型对广告的点击率和/或转化率实时计算;读取流量分配系数,计算队列中的广告出现机会,形成最终排序,输出广告队列;输出模块,用于输出排序首位广告并从队列中弹出该广告。
14.第三方面,本发明实施例提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的方法。
15.第四方面,本发明实施例提供一种电子设备,所述电子设备包括:一个或多个处理器;以及存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的方法。
16.本发明实施例提供的一种提升数字商城广告转化效果的实时竞价排序方法、装置、存储介质和电子设备,科学有序的组织算法与大数据技术,提炼电子商城的数据资源,可以大幅提升站内广告资源的转化引流效果,即建立了科学、有效的广告竞价实时计算技术,有利于提升站内转化效率、有效提升数字商城卖家店铺的交易量、有效提升数字商城的流量收益(收取更多的广告费用)、有效提升数字商城用户的广告体验(看到更多感兴趣的广告)。
附图说明
17.图1示出了根据本发明的实施例一种提升数字商城广告转化效果的实时竞价排序方法的流程图;
18.图2示出了根据本发明的实施例的一种提升数字商城广告转化效果的实时竞价排序方法详细过程的流程图;
19.图3示出了根据本发明实施例的各个矢量库和分类模型的构建的流程图;
20.图4示出了根据本发明实施例的推荐价格区间算法流程图;
21.图5示出了根据本发明实施例的推荐价格区间算法中价格的平均值和标准差计算流程图;
22.图6示出了根据本发明实施例的投放页面推荐关键字匹配算法中关键词矢量库的构建流程图;
23.图7示出了根据本发明实施例的ocpm流量分配算法流程图;
24.图8示出了根据本发明实施例的构建非监督学习人群库与分类模型流程图;
25.图9示出了根据本发明实施例的建立非监督学习产品库与分类模型流程图;
26.图10示出了根据本发明实施例的建立非监督学习关键字分类模型流程图;
27.图11示出了根据本发明实施例的竞价流程点击率/转化预估模型优化流程图;
28.图12示出了根据本发明实施例的人群标签计算流程图;
29.图13示出了根据本发明实施例的反作弊算法流程图;
30.图14示出了根据本发明实施例的反作弊算法中通用黑名单库配置流程图;
31.图15示出了根据本发明实施例的反作弊算法中点击行为黑名单库配置流程图;
32.图16示出了根据本发明实施例的ab测试流程图;
33.图17示出了能够实施本发明的多个实施例的计算设备的框图。
具体实施方式
34.下面将参考附图中示出的若干示例性实施方式来描述本发明的原理和精神。应当理解,描述这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
35.请参考图1并结合图2,为了解决上述问题,本发明实施例提供一种提升数字商城广告转化效果的实时竞价排序方法,包括:当广告展示机会产生时,计算流程如下:
36.步骤10,判断是否为翻页请求,若不是翻页请求,则进入广告排序流程。
37.在步骤10中,服务器在接收到来自用户发送的请求时,首先判断是否为翻页请求,以此决定是重新计算还是直接读取缓存,如果是翻页请求,直接读取缓存队列并跳到步骤30,如果不是翻页请求,进入步骤20的广告排序流程。
38.步骤20,广告排序流程
39.如前文叙述,如果来自用户的请求不是翻页请求,而且其他请求,则进入到步骤20的广告排序流程,以便用户在翻页时,能够在缓存中读取到最新的广告排序序列,从而在翻页后依据排序结果向用户展示商品或服务的广告。具体的,在一个实施例中,步骤20包括如下子步骤:
40.步骤201,获取流量基本信息。
41.可选的,流量基本信息包括用户信息,流量信息,浏览器ua信息(useragent),用户特征/标签,位置信息,搜索关键字等,用户特征和标签可以从大数据分析服务中调用。大数据分析服务被配置为数字商城服务器的进程,其中包括用户特征和标签数据,当其在步骤201中被调用时,就可以获取到用户特征和标签数据。
42.步骤202,根据流量基本信息中的搜索关键词与过滤条件过滤相关产品,生成初始广告队列。
43.通过步骤202,保证广告与用户行为相关。在步骤202中,可以调用数字商城服务器
中的相关性计算服务,相关性计算服务的核心模块可以配置为相关性计算引擎,该引擎可以配置为基于搜索引擎技术,按照关键字等过滤条件,从服务器的广告数据中过滤出于过滤条件相匹配的产品,将产品装载到广告队列。
44.步骤203,根据定向条件进一步过滤广告队列。
45.可选的,定向条件包括关键词,分类,产品,人群等。例如,当用户在步骤202进行关键词搜索或者使用了过滤条件,可以在系统中配置二次筛选、二次过滤的搜索控件或选择控件,供用户进一步过滤。
46.步骤204,计算队列中的广告基础出价。
47.作为一个示例,在计算队列中广告基础出价时,可以读取成本系数,结合成本系数来计算,以提升计算的准确性。成本控制系数由pid服务提供,计算时遵守广告活动的价格浮动上下限限制。
48.步骤205,将广告队列推送进实时推理服务,通过模型对广告的点击率(ctr)和/或转化率(cvr)实时计算。根据计算结果修正广告出价,根据价格从高到低排序。例如,点击率、转化率可能会被作为广告排序修正的计算参数,点击率、转化率越高,更有利于提升广告排序。在一个实施例中,实时推理服务的核心模块被配置为竞价点击率/转化率预测模型(对应图2中的“行为预估建模”)。竞价点击率/转化率预测模型的构建方式在下文中将会叙述。
49.步骤206,读取流量分配系数,计算队列中的广告出现机会,形成最终排序,输出广告队列。
50.步骤30,输出排序首位广告并从队列中弹出该广告。记录日志。
51.综上,竞价服务综合评估了广告自身的数据表现,流量特征,产品特征,用户的行为特征等综合预估广告效果,是专为数字商城站内流量场景设计的服务流程。可以自动化无需人工干预的为商城广告客户提供营销效果的可见提升。
52.在上述步骤20中,至少部分子步骤需要调用相关的算法或模型进行计算。下面,根据本发明的一些实施例,对步骤20的各个子步骤中可能采用的算法和/或模型进行介绍。
53.在一个实施例中,需要构建初始数据库、非监督分类模型、配置关键算法,经过整合后形成实时竞价计算引擎,服务器在执行步骤20时,调用该实时竞价计算引擎就可以实现广告排序。下面,先对构建初始数据库、非监督分类模型、配置关键算法进行简单的介绍。
54.《构建初始数据库》
55.在一个实施例中,初始数据库包括关键词矢量库、产品矢量库、人群矢量库。
56.《构建非监督分类模型》
57.在一个实施例中,非监督分类模型包括关键词分类模型、产品分类模型、人群分类模型。
58.《配置关键算法》
59.在一个实施例中,关键算法包括关键词推荐/匹配算法、pctr/pcvr预估算法(即点击率/转化率预估算法)、ocpm/ocpc/ocpa流量分配算法、价格区间推荐算法、关联产品推荐算法、反作弊算法。
60.相关术语:ocpm:optimized cost per mille的缩写,即优化千次展现出价,本质还是按照cpm付费。采用更精准的点击率和转化率预估机制,将广告展现给最容易产生转化
的用户,在获取流量的同时,提高转化率、降低转化成本,跑量提速更快。ocpc:optimized cost per click的缩写,即优化点击付费,本质还是按照cpc付费。采用更科学的转化率预估机制的准确性,可帮助广告主在获取更多优质流量的同时提高转化完成率。系统会在广告主出价基础上,基于多维度、实时反馈及历史积累的海量数据,并根据预估的转化率以及竞争环境智能化的动态调整出价,进而优化广告排序,帮助广告主竞得最适合的流量,并降低转化成本。ocpa:optimized cost per action的缩写,即优化行为出价,本质还是按照cpa付费。当广告主在广告投放流程中选定特定的优化目标(例如:移动应用的激活,网站的下单),提供愿意为此投放目标而支付的平均价格,并及时、准确回传效果数据,借助转化预估模型,实时预估每一次点击对广告主的转化价值,自动出价,最终按照点击扣费;同时,转化预估模型会根据广告主的广告转化数据不断自动优化。
61.《实现效果验证》:
62.如前文叙述,需要将初始数据库、非监督分类模型和关键算法整合在一起,形成实时竞价计算引擎,为了在上线前验证计算效果,在一个实施例中,可以采用abtest进行实时竞价计算引擎的效果验证。
63.《初始数据库之关键词矢量库》
64.如前文叙述,在初始数据库包括关键词矢量库。在数字商城系统中,为了给商城商家用户引流,需要根据目标产品id,为商家用户匹配并提供适合购买或点击的关键字。为此,需要配置投放页面推荐关键词匹配算法,本实施例中,该算法的实现包括构建关键词矢量库(即向量库),然后根据产品关键字矢量库计算使用相关系数公式计算每个产品与其他产品的相关系数,并将结果按相关性排序后保存。保存后返回的输出结果可以是查询对应产品关键字相关性系数,相关性系数可以按照一定规则排序,例如,在一些实施例中1为最相关的。
65.作为一个实施例,结合图6,关键词矢量库可以通过如下流程构建。
66.步骤1,将所有产品的不同来源的关键字制作热编码(one-hot)作为特征。
67.在该步骤1中,制作的特征可能有百万级别,因此作为一个优选的方式,可以针对每个来源保留前n(n为正整数)位的关键字。另外,还可以制作一个pad作为补位特征。如果无法找到或者未建立的关键字可以使用pad代替。在步骤1中,也可以采用fm(因子分解机)、deepfm算法作为构建特征的备用算法。此外,在步骤1中,还可以根据实际需求增加或减少来源。作为一些示例,关键字来源可以包括:i.效果类关键字:产品来源高频关键字;ii.长尾关键字(为了更好的给用户引流需要长尾关键字,这样可以更好的促进用户效果):1.产品来源低频关键字;2.产品主题,内容高频词;3.产品来源页高频词;4.用户搜索来源关键字;5.广告投放用户自选关键字;6.搜索页产品来源关键字;iii.补充:统计词频需要根据stopword词库进行过滤。
68.步骤2,统计每个产品的每个来源及关键字使用数量,将本产品的不同关键字数量的占比作为原始特征值。在步骤2中,可以使用标准归一化算法,进行数据分布优化,此外,还可以采用极差归一化,去均值归一化算法。
69.步骤3,将不同来源原始特征值乘以来源权重作为最终特征值。在初期,来源权重可以人为设置,后期可以根据用户使用的效果作为神经网络模型,再次进行训练以优化权重。
70.步骤4,将经过上述步骤1-3形成的整个矩阵作为原始关键字矢量库。
71.至此,建立了基础的关键字矢量库,后续可以根据实际进行优化,使用的算法为协同过滤算法,此外还可以根据实际数据与效果进行选择。
72.《初始数据库之人群矢量库,非监督分类模型之人群分类模型》
73.如前文叙述,初始数据库还包括人群矢量库,非监督分类模型中包括人群分类模型。根据本发明的一个实施例,结合图8,人群矢量库和人群分类模型可以通过如下步骤构建。
74.步骤1,将所有产品与产品分类等数据源制作热编码(one-hot)作为特征。在步骤1中,特征可以保留top n的关键字压缩纬度。另外制作一个pad做补位特征。如果无法找到或者未建立的特征使用pad代替。备选算法:fm,deepfm。
75.作为一个示例,数据源的纬度可以包括:i.最近时段(时段可以定义,一般使用7-14天内数据)用户访问n个产品;ii.最近时段(时段可以定义,一般使用7-14天内数据)用户访问n个产品的分类(一般低权重);iii.ip地域;iv.产品收货地域;v.手机型号;vi.品牌;vii.月均消费金额;viii.购物购物时间段;ix.购买力:l1-l5;x.经常访问时段:最近180天最常购物时间段,判断用户最常用的浏览和购买时间段,标签按照一天24小时展示;xi.是否登录;xii.上次访问间隔时间;xiii.上传购买间隔时间;xiv.特定人群标签。
76.步骤2,统计每个用户访问产品与产品分类次数,将用户访问产品的总数量与单个产品的的占比作为原始特征值。在步骤2中,优先使用的算法为标准归一化,进行数据分布优化。备选算法包括极差归一化,去均值归一化。
77.步骤3,将不同来源原始特征值乘以来源权重作为最终特征值。在步骤3中,在初期,来源权重可以人为设置,后期可以根据用户使用的效果作为神经网络模型,再次进行训练以优化权重。
78.步骤4,将以上数据源作为人群矢量库,并保存。步骤5,使用k-means与上述数据源作为输入生成用户分组,即人群分类模型。步骤6,保存模型提供人群更新程序调用。
79.《人群属性模型》
80.在一些实施例中,还可以利用人群矢量库构建人群属性模型。例如可以通过如下步骤构建(结合图12):
81.步骤1,载入训练样本。步骤2,调整样本分布,保证不同样本量数量。
82.在步骤2中,训练样本比较少时可以通过直接随机复制比较少的分类样本内容以增加内容。如果样本整理数量比较多时,可以减少多的分类样本,这样可以让多分类样本与小分类的样本数据保持一致。
83.步骤3,载入人群矢量库作为特征,通过深度学习进修分类,并验证模型。
84.在步骤3中,可以使用神经网络算法,此外还可以使用决策树,梯度提升决策树,随机森林,logistic回归,支持向量机等算法。
85.步骤4,保存模型,即得到人群属性模型。人群属性模型用于人群基本属性预测,此标签为人群通用属性。如:年龄,性别,职业等等。此类标签采用监督学习进行学习预测。
86.除了上述的人群通用属性外,还可以设计特定人群标签:此标签根据现有业务进行定义。针对数据有明确定义与算法,根据最终用户访问行为与购买记录生成。如:购买力标签定义:l1-l5是消费力从低到高的一个指数,不能直接对到消费金额。此标签是用算法
综合多种消费行为给用户打分,然后对分数从低到高排队,按照成交金额总量5等份,第一个贡献20%成交金额的用户是l1,20%-40%的的用户是l2,以此类推。
87.《初始数据库之产品矢量库,非监督分类模型之产品分类模型》
88.如前文叙述,初始数据库还包括产品矢量库,非监督分类模型中包括产品分类模型。根据本发明的一个实施例,结合图9,产品矢量库和产品分类模型可以通过如下步骤构建。
89.步骤1,将所有非监督学习人群与标签人群分类等数据源制作热编码(one-hot)作为特征。
90.其中,非监督学习人群和标签人群分类可以从人群分类模型和人群属性模型中获得。
91.在步骤1中,特征可以保留top n的关键字压缩纬度。另外制作一个pad做补位特征。如果无法找到或者未建立的特征使用pad代替。备选算法:fm,deepfm。
92.作为一个示例,数据源可以包括如下纬度:
93.i.最近时段(时段可以定义,一般使用7-14天内数据)非监督学习人群标签访问量,购买量。
94.ii.最近时段(时段可以定义,一般使用7-14天内数据)人群标签访问量,购买量。
95.iii.同时购买产品(可以定义为24小时内采购产品)。
96.步骤2,统计每个标签在总标签中的数据分布,将用户访问的总数量购买量与单个标签的占比作为原始特征值。
97.在步骤2中,优先使用的算法为标准归一化,进行数据分布优化。备选算法包括极差归一化,去均值归一化。
98.步骤3,将不同来源原始特征值乘以来源权重作为最终特征值。
99.在步骤3中,在初期,来源权重可以人为设置,后期可以根据用户使用的效果作为神经网络模型,再次进行训练以优化权重。
100.步骤4,将以上形成的整个矩阵作为产品矢量库,并保存。
101.步骤5,使用k-means与上述产品矢量库作为输入生成产品分组,即产品分类模型。
102.步骤6,保存模型提供人群更新程序调用。
103.《非监督分类模型之关键字分类模型》
104.如前文叙述,非监督分类模型中包括关键字分类模型。根据本发明的一个实施例,结合图10,关键字分类模型可以通过如下步骤构建。
105.步骤1,读取关键字矢量库。
106.步骤2,使用k-means与关键字矢量库作为输入建立分组模型,即关键字分类模型。
107.步骤3,保存模型提供其他程序调用。
108.至此,本发明实施例已经进行了各个矢量库和分类模型的构建。总体来讲,在一个实施例中,结合图3,完整的构建包括:
109.先构建关键字矢量库,根据关键字矢量库生成推荐关键字和构建非监督关键字分类模型。根据人群标签构建人群矢量库。
110.根据人群矢量库,分别构建非监督学习人群分类模型,人群属性模型。在一些优选的实施例中,还可以结合关键字构建关键字非监督人群分类模型,以提升最终模型的准确
性。
111.基于非监督学习人群分类模型和人群属性模型,构建产品矢量库。
112.根据产品矢量库,构建非监督学习产品分类模型,生成替代产品和关联产品。以关联产品为例,可以根据产品矢量库计算相关系数高产品。其中可以根据浏览产品与购买产品设置不同权重进行优化。
113.最后,根据非监督关键字分类模型、关键字非监督人群分类模型、非监督学习人群分类模型,非监督学习产品分类模型、人群属性模型进行融合,从而构建竞价点击率/转化率预测模型,用于返回多个广告活动预测用户产生概率。作为一个示例,可以模型可以载入到实时推理服务中,在上述步骤205中被调用。
114.在构件竞价点击率/转化率预测模型时,结合图11,还可以采用以下的步骤进行模型的优化:
115.步骤1,采集与整理原始特征数据。
116.作为一个示例,原始特征数据可以包括如下纬度:i.特征:广告产品id,关键字非监督学习标签,广告产品非监督学习标签,广告产品分类,广告产品标签,广告位,非监督学习人群标签,监督学习人群标签,平台,地域,时段,星期;ii.标签:是否点击;
117.步骤2,建立训练数据集。
118.在步骤2中,将步骤1得到的原始特征数据作为训练数据集,作为模型的输入,此外,在步骤2中可以注意的是,需要保证不同特征的点击用户与非点击用户比例各占50%。
119.步骤3,建立模型。
120.在步骤3中,可以使用朴素贝叶斯算法和神经网络算法,备选算法包括决策树,梯度提升决策树,随机森林,logistic回归,支持向量机、fm,deepfm,gbdt等算法。具体可以根据实际数据与效果,结合算力进行选择。
121.步骤4,保持模型并在实时竞价时使用。
122.《产品标签》
123.如前文叙述,在以上实施例中,构建各个矢量库和分类模型时,可能需要用到产品标签,作为一个示例,产品标签可以按照如下设计:本次事件sku_number;提取于name的sku关键词;提取于描述信息的sku关键词;商品分类信息;商品分类信息(父分类);商品评分星数;商品评分总数;商品评分赞数;商品评分踩数;商品1星总数;商品2星总数;商品3星总数;商品4星总数;商品5星总数;商品评论关键词;商品最近10次的评价成交价格。
124.《用户标签》
125.如前文叙述,在以上实施例中,构建各个矢量库和分类模型时,可能需要用到用户标签,作为一个示例,用户标签可以按照如下设计:id(锁定样本唯一即可,并且通过这个id可回溯数据来源);用户id;是否点击;年龄;性别;婚姻:默认,0已婚,1未婚,2离异,3;是否有孩子:默认,0没有,1有,2;收入水平/年;事件发生的时间,小时/天;天/月;周/月;星期一为1,星期日为7;最近一次交易,距离现在多少天;上个自然月的交易频次;当年的交易频次;最近30天的交易频次;最近365天的交易频次;最近一次的交易金额;最近10次交易的平均金额;用户所在城市(交易用户地址
‑‑
》订单地址
‑‑
》账单地址);所属国家;设备类型;网络类型;交易渠道;最近浏览商品sku_number;用户加购数(从上次清空购物车起算);用户最近加购的sku_number;用户上次登录时间,天;用户上次登录的停留时长,秒;用户最近搜
索关键词;用户的ipv,最近1天、3天、7天、14天、30天;用户的pv,最近1天、3天、7天、14天、30天;用户对于这个sku的ipv,最近1天、3天、7天、14天、30天;用户对于这个sku的pv,最近1天、3天、7天、14天、30天;aipl分类:默认,0a,1i,2p,3l,4;rfm分类:默认,0重要价值客户,1一般价值客户,2重要发展客户,3一般发展客户,4重要保持客户,5一般保持客户,6重要挽留客户,7一般挽留客户,8;优惠券用户,默认,0否,0是,1。
126.《推荐价格区间算法》(最大最小值采用离线计算完成)
127.推荐价格区间算法用于根据用户选择产品/类别/关键字,返回投放需要的价格区间。
128.在一个实施例中,推荐价格区间算法包括界面接口返回流程和计算最大最小通用流程。
129.可选的,结合图4,界面接口返回流程包括:
130.步骤1,获取用户输入的产品、类别、关键字中的至少一个数据。在一些实施例中,获取以上全部数据。
131.步骤2,选择对应定向范围产品或关键字。
132.由于服务器系统中已经具备了相关产品、品类和位置以及它们在最近n天的历史数据(n可以使用参数配置在一个合理的数值)。所以可以根据用户输入的产品、类别和关键字进行定向。
133.步骤3,获取相应条件内产品价格区间,有数据则返回结果,没有数据,则进入步骤4。
134.步骤4,获取用户产品关键字价格区间,有数据则返回结果,没有数据,则进入步骤5。
135.步骤5,获取产品分类价格区间,有数据则返回结果,没有数据,则返回默认价格区间。
136.返回结果包括建议价格最小值和建议价格最大值。此外,系统还可以验证最小价格,如果最小价格低于目前设置低价以系统低价为准。
137.可选的,返回结果还可以包括价格的平均值和标准差,这样的计算逻辑在界面接口层更加灵活。结合图5,价格的平均值和标准差可以通过如下方式计算:
138.步骤1,输入最近n天log数(即成交价)。
139.步骤1中,如果log太大可以将数据压缩,如缩减成时段的平均成交价。
140.步骤2,计算输入成交价平均数与标准差。步骤3,采用3西格玛法则过滤异常数据。步骤4,计算过滤后log的平均值与标准差。在步骤4中,可以使用神经网络算法,此外还可以采用决策树,梯度提升决策树,随机森林,logistic回归,支持向量机等算法。
141.步骤5,保存结果存入平均值与标准差。在步骤5中,可选的,一般采用平均值加减2个标准差作为价格区间,其中2个标准差可以配置。也可以根据倾向性调整,如希望用户有更高价格可以减一个标准差,加2个标准差作为推荐范围。
142.《配置ocpm流量分配算法》
143.在一个实施例中,结合图7,流量分配算法通过以下步骤配置。
144.步骤1,针对广告位构建原始数据。步骤2,获取当前广告位的分广告的原始数据。
145.在步骤2中,可选的,原始数据包括展示率,ctr,cpc(cost per click,点击付费),
cpm,转化率,转化价值,当前分配比例等。转化价值可以用户设置,也可以只用转化次数,或成交价。获取数据时间范围根据数据量控制。一般数据比较少时可以采用10,30,60,120分钟数据获取。例如10分钟数据不足采用30分钟数据补充,以此类推。
146.步骤3,根据评分标准计算当前评分,此处评分与遗传算法评分一样。
147.需要说明的是,在步骤2中,如果没有原始数据,则使用广告位的当前数据补充数据,然后进入步骤3。如果也没有广告位的当前数据,则使用系统默认数据补充,进入到步骤3。
148.步骤4,构建遗传算法染色体。在步骤4中,可以使用广告素材作为基因,使用0-100作为基因取值范围。步骤5,设置遗传算法评分标准。在步骤5中,根据染色体分配的流量比例计算最终转化价值,价值约大的评分越高。如果所有基因值大于100评分为0。防止百分比溢出。
149.步骤6,遗传算法进化n代后设置获取最优染色体,如果最终百分比不是100,按目标是100进行缩放比例。步骤7,将缩放后的比例进行计算评分,并与原始评分对比。使用评分高的比例作为最终分配比例。步骤8,将结果保存提供给广告服务器使用。
150.至此,通过上述遗传算法,完成广告位中流量占比最优效果计算,经abtest测试,相对于普通的流量分配算法,优化ctr提升20%。作为一个示例,流量分配算法计算后的评分可以作为流量分配系数存储到流量分配缓存中,在上述步骤206中供服务器调用,根据该系数确定步骤205中得到的广告队列中各个广告的流量权重(即流量权重分配),从而进一步精确修正广告队列的排序。
151.《配置反作弊算法》
152.在一些实施例中,反作弊算法通过以下流程配置(结合图13)。步骤1,载入通用黑名单库。步骤2,校验流量是否属于黑名单,若属于黑名单,则log加入通用流量可疑标识,同时进入下一个流程。如果不属于黑名单,则进入步骤3。步骤3,校验是否为点击行为黑名单,当然该步骤3也可以额通过载入点击行为黑名单库启动。若属于点击行为黑名单,则则log加入通用流量可疑标识,同时进入下一个流程。
153.在上述流程中,通用黑名单库可以通过如下流程配置(结合图14):步骤1,获取原始日志。步骤2,将日志按时间拆分,拆分规则以数据量与业务需求为准。在步骤2中,数据量大可以按照时段拆分日志即可。数据量过大时可以再针对页面类型进行拆分。步骤3,统计每个分组需要的统计值,如ua,ip,设备id等访问次数。步骤4,使用3西格玛法则过滤出异常值。步骤5,将异常值存入黑名单,即得到通用黑名单库。步骤6,清理自动维护的黑名单,例如黑名单有效期为1-14天,到期自动更新。
154.在上述流程中,点击行为黑名单库可以通过如下流程配置(结合图15):
155.步骤1,获取用户点击行为数据。步骤2,将日志按时间拆分统计数据,拆分规则以数据量与业务需求为准。在步骤2中,数据量大可以按照时段拆分日志即可。数据量过大时可以再针对页面类型进行拆分。步骤3,根据ua,ip,设备ip进行分组,统计用户点击后的平均访问深度与平均停留时间。步骤4,使用3西格玛法则过滤出异常值。步骤5,将异常值存入黑名单,即得到点击行为黑名单库。步骤6,清理自动维护的黑名单,例如黑名单有效期为1-14天,到期自动更新。
156.反作弊流量过滤主要分为通用黑名单与点击行为和黑名单两种黑名单。当发现是
黑名单的用户时在log加入对应可疑流量标识。通用黑名单用来清理极端数据保证数据来源可靠性从而更好的建立各个模型。其中包括过滤超高访问用户,爬虫等非正常用户。点击行为黑名单:用来标记异常点击行为。如密集点击,恶意点击。
157.《ab测试配置》
158.对于所构建模型或者算法策略的实际效果,除了本身在离线阶段针对算法本身的评估外,还应当对生产环境(在线环境)进行ab实验。以确保设计的在优化目标上是正向的,或者有意义的。
159.在一些实施例中,需要将用户流量采用hash的方式均分,以保证各个分区下的数据分布一致。
160.选用不同的hash算法,均匀度会有所不同,但差别不大,本实施例采用murmurhash。
161.为了避免单独评估分流的误差,本实施例采取aabb的分流方式(结合图16),a为对照组(对照组a1、a2),b为实验组(实验组b1、b2),全体流量中,90%用户分配到对照组,10%分配到实验组。根据对照组统计值和实验组统计值进行结果评估。
162.本发明实施例还提供一种提升数字商城广告转化效果的实时竞价排序系统,包括:判断模块,用于判断是否为翻页请求,若不是翻页请求,则进入广告排序流程;广告排序流程模块,用于执行所述广告排序流程,所述广告排序流程包括:获取流量基本信息;根据流量基本信息中的搜索关键词与过滤条件过滤相关产品,生成初始广告队列;根据定向条件进一步过滤广告队列;计算队列中的广告基础出价;将广告队列推送进实时推理服务,通过模型对广告的点击率和/或转化率实时计算;读取流量分配系数,计算队列中的广告出现机会,形成最终排序,输出广告队列;输出模块,用于输出排序首位广告并从队列中弹出该广告。应当理解是,上述各个程序模块与方法实施例中所描述的各个步骤具有一一对应的关系,在方法实施例中描述的技术方案也可以应用于各个程序模块的具体配置中,为避免重复,在此不再赘述。
163.综上,竞价服务综合评估了广告自身的数据表现,流量特征,产品特征,用户的行为特征等综合预估广告效果,是专为数字商城站内流量场景设计的服务流程。可以自动化无需人工干预的为商城广告客户提供营销效果的可见提升。
164.本发明具有如下特点:整体考虑数字商城的数据资产,包括交易数据、用户行为数据、搜索数据、用户特征、商品特征,挖掘数据价值,行之有效的将之组合,为营销行为提供支持;对业务数据逐个梳理并形成输出物;引入数字广告的实时竞价技术,最大化流量价值;广告素材(商品素材)排序是对转化提升最有效的方法,本发明中通过科学的计算并根据效果与数据变化持续优化;具有一套效果测试、评定的机制,合理化评估竞价方法的实际效果;具有反作弊机制,清洗无效数据与恶意行为;在保护用户隐私的前提下,进行以上行为。
165.图17示出了能够实施本发明的多个实施例的计算设备600的框图。电子设备旨在表示各种形式的数字计算机,本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
166.如图17所示,设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来
执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
167.设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
168.本文中应用了具体个例对发明构思进行了详细阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离该发明构思的前提下,所做的任何显而易见的修改、等同替换或其他改进,均应包含在本发明的保护范围之内。