多平台大流量信息的实时分发方法、系统及其存储介质与流程

文档序号:36708386发布日期:2024-01-16 11:44阅读:22来源:国知局
多平台大流量信息的实时分发方法、系统及其存储介质与流程

本技术涉及信息分发的领域,尤其是涉及一种多平台大流量信息的实时分发方法、系统及其存储介质。


背景技术:

1、网络广告是通过投放平台来利用网站上的广告横幅、文本链接或者多媒体的方法,在互联网刊登或发布广告,通过网络传递到互联网用户的一种高科技广告运作方式。为了提高广告的投放效果,投放平台会同时对接多个或者多种消费展示平台,将消费展示平台的展示机会进行综合管理。投放平台是广告主为了推销自己的产品或服务在互联网上向目标群体进行有偿的信息传达的中间平台,利于引起群体和广告主之间信息交流的活动。

2、随着网络广告技术的发展,投放平台所流转信息的流量越来越大,而随着流量变得巨量,且目前传统流量分发多数只是控制总qps(queries-per-second)流量并不做分发算法的优化,使得网络广告的投放效果变得有待提高。例如,当广告主需要的流量为100qps,而广告平台的流量为10000万qps时,投放过程中间会产生很大的投放损失,因此,需要一种方法能够实时选择合适的流量并将合适的流量有效地匹配给广告主。


技术实现思路

1、为了能够实时选择合适的流量并将合适的流量有效地匹配给广告主,本技术提供一种多平台大流量信息的实时分发方法、系统及其存储介质。

2、一方面,本技术提供的一种多平台大流量信息的实时分发方法,采用如下的技术方案:

3、一种多平台大流量信息的实时分发方法,包括如下步骤:

4、获取当前用户的报价数据;

5、根据所述报价数据生成与所述当前用户对应的用户标签;

6、根据所述用户标签使用第一预测算法预测所述当前用户的报价次数;

7、根据第一组合算法计算所有所述当前用户的组合序列,取所述报价次数最大的所述组合序列;

8、选取所述组合序列中相关性权重排序中前第一预设数量的用户标签;

9、使用第二预测算法,输出达到预设的需求报价值的所述组合序列,为所述组合序列对应的信息分发至发布平台;其中,使用选取的所述用户标签作为第二预测算法的算子;

10、根据输出的所述组合序列中相关性权重排序中前第一预设数量的用户标签更新所述第二预测算法的算子。

11、通过采用上述技术方案,先根据当前用户的报价行为进行初筛,然后使用第一预测算法计算出报价次数,然后通过第一组合算法得到报价次数最大的组合序列,根据相关性权重选取用户标签,使用第二预测算法输出所需要的组合序列,并将组合序列的信息分发至发布平台,并且根据输出的结果更新第二预测算法的算子,实现信息分发过程中的实时调整,无需对每个用户进行单一的分发计算,适用于大流量的分发场景,最终将达到需求报价值的用户的信息发送至发布平台,即,能够实时选择合适的流量并将合适的流量有效地匹配给广告主。

12、可选地,所述第一预测算法包括随机森林算法、决策树算法或梯度提升算法;

13、所述随机森林算法包括如下步骤:

14、根据所述用户标签对当前用户进行分类得到多个用户集群;

15、对所述用户集群进行集群分析得到与所述用户集群对应的人群标签;

16、根据人群标签计算出对应的标签的所述相关性权重;

17、根据所述相关性权重计算出分类后的所述用户集群的报价次数。

18、通过采用上述技术方案,使用随机森林算法能够对多个人群标签进行优化,并计算每个人群标签的相关性权重,利于第二预测算法的运算。

19、可选地,所述根据人群标签计算出对应的标签的所述相关性权重的步骤中,还包括如下子步骤:

20、计算所述用户集群的接受者操作特性曲线下面积;

21、根据所述接受者操作特性曲线下面积删除所述相关性权重排序中后第二预设数量的所述相关性权重;

22、将实时的所述接受者操作特性曲线下面积与预设条件时的所述接受者操作特性曲线下面积进行比较,如果删除所述相关性权重后的所述接受者操作特性曲线下面积大于预设条件时的所述接受者操作特性曲线下面积,继续删除所述相关性权重排序中后第二预设数量的所述相关性权重。

23、通过采用上述技术方案,将用户集群放入测试集,通过测试集数据的接受者操作特性曲线下面积即auc结合不断删除影响比较小的权重,利于提升计算效率与性能。

24、可选地,所述根据人群标签计算出对应的标签的所述相关性权重的步骤中,还包括如下子步骤:

25、预设条件时的所述接受者操作特性曲线下面积为完整特征时的所述接受者操作特性曲线下面积乘以调整系数;所述预设条件为非完整特征或单特征;

26、所述调整系数正相关于更新所述第二预测算法的算子的变化差值。

27、通过采用上述技术方案,变化差值可反映方法的应用效果,从而能够在方法运行过程中不断地优化调整系数,提升计算结果的准确度。

28、可选地,所述第一组合算法包括如下步骤:

29、计算每个所述人群标签对应的所述报价次数的次数和值;

30、根据所述次数和值对所述人群标签进行排序;

31、获取排序中前第三预设数量的所述人群标签,作为组合序列输出。

32、通过采用上述技术方案,能够得到所需的组合序列以产生所需的报价。

33、可选地,所述第一组合算法包括如下步骤:

34、计算第三预设数量的所述人群标签对应的所述报价次数的次数和值;

35、获取所述第二预测算法上一次输出结果中第三预设数量的所述人群标签;其中,所述第三预设数量为所述第一预测算法中的所述人群标签的数量与所述第二预测算法中的所述人群标签的数量的最小值;

36、计算获取到的所述人群标签的历史报价次数与历史报价额,根据所述历史报价次数与所述历史报价额计算出报价总额;

37、若所述报价总额与所述次数和值的比值大于预设的参考比值,则根据所述次数和值对所述人群标签进行排序;否则,根据所述报价总额对所述人群标签进行排序;

38、获取排序中前第四预设数量的所述人群标签,作为组合序列输出。

39、通过采用上述技术方案,在组合的过程中即考虑次数和值的价值体现也考虑报价总额的价值体现,两者比值能够综合反映计算结果的准确度,根据比值来选择排序的方法,使输出的组合序列能够价值最大化,而且在排序阶段进行调整相比于在计算阶段进行调整利于降低计算量。

40、可选地,所述第二预测算法为多臂老虎机算法,包括如下步骤:

41、将所述多臂老虎机算法的每个臂即算子的预期值初始为0或者随机值;

42、根据随机选择策略、选择最高上界置信度策略或者分布采样策略选择预期值最高的臂;

43、基于选择的所述臂计算输出结果值;

44、根据最新的所述结果值或者所述臂的所有所述结果值的平均值更新所述臂的预期值。

45、通过采用上述技术方案,使用多臂老虎机算法作为第二预测算法能够在不知道每个臂的真实奖励分布的情况下,通过自主学习优化臂。

46、可选地,方法还包括如下步骤:

47、循环执行所述第二预测算法达到预设的迭代次数或时间限制后,停止更新所述算子。

48、通过采用上述技术方案,达到上述停止条件后能够得到最佳的算子。

49、另一方面,本技术提供的一种多平台大流量信息的实时分发系统,采用如下的技术方案:

50、一种多平台大流量信息的实时分发系统,包括处理器,所述处理器中运行有上述中任意一项所述的多平台大流量信息的实时分发方法的程序。

51、另一方面,本技术提供的一种存储介质,采用如下的技术方案:

52、一种存储介质,存储有上述中任意一项所述的多平台大流量信息的实时分发方法的程序。

53、综上所述,本技术包括以下至少一种有益技术效果:先根据报价行为对当前用户进行初筛,然后使用第一预测算法计算出报价次数,然后通过第一组合算法得到报价次数最大的组合序列,根据相关性权重选取用户标签,使用第二预测算法输出所需要的组合序列,并将组合序列的信息分发至发布平台,并且根据输出的结果更新第二预测算法的算子,实现信息分发过程中的实时调整,能够实时选择合适的流量并将合适的流量有效地匹配给广告主;

54、将用户集群放入测试集,通过测试集数据的接受者操作特性曲线下面积即auc结合不断删除影响比较小的权重,利于提升计算效率与性能;变化差值可反映方法的应用效果,从而能够在方法运行过程中不断地优化调整系数;

55、第二预测算法能够在不知道每个算子的真实奖励分布的情况下,通过自主学习优化算子而得到最佳的算子,提升计算结果的准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1