一种展示信息的选取方法及装置制造方法
【专利摘要】本发明公开了一种展示信息的选取方法,用以解决现有技术中达不到流量的全局分配最优化,而导致流量的利用率较低的问题。方法包括:确定当前流量的类别;根据将不同类别的流量分配给相应的展示信息的概率,从确定出类别的当前流量对应的展示信息中,选取与当前流量最匹配的展示信息;其中,概率是基于最小化投放不足量和最优化均匀投放规则,根据每个展示信息分别需求的流量总量、每个类别的流量的预测总量以及每个展示信息所对应流量的类别确定的。本发明还公开一种展示信息的选取装置。
【专利说明】一种展示信息的选取方法及装置
【技术领域】
[0001] 本申请涉及计算机【技术领域】,尤其涉及一种展示信息的选取方法及装置。
【背景技术】
[0002] 流量(Page View,PV)库存预定是指,预测网站未来一段时间可能产生的PV,从而 在有客户(如广告商)订购PV时,根据客户的订购需求,对预测出的PV进行分配,以使得 在规定时间内有足够的PV满足不同客户的需求。
[0003] 以广告商A、B先后订购PV为例,以下具体说明现有技术如何实现为A期望展示的 展不信息(一般为广告)a和B期望展不的展不信息(一般为广告)b分配PV :
[0004] 由于A先于B订购PV,因此先确定A订购的PV总量以及订购的PV的类别。比如, 假设A订购的PV总量为100万,且要求100万PV的来源包括北京、上海和广东(S卩100万 的PV总量由相应的三个类别的PV构成),同时,A对分别来源于北京,上海和广东的PV量 没有具体的要求。
[0005] 基于A的上述需求,按照现有技术,可以随机确定一种PV分配方案,比如,该方案 可以为:为A分配100万PV,且这100万PV中,有33万的PV来源为北京,有33万的PV来 源为上海,另有34万的PV来源为广东。
[0006] 接下来,会确定B订购的PV总量,以及订购的PV的类别。比如,假设B订购的PV 总量为40万,且要求该40万PV的来源必须是北京。
[0007] 在实际中,如果假设预测出网站未来一段时间可能产生的来源为北京的PV总量 一共是50万,那么,会出现这样的问题:虽然该50万的PV能够满足B的需求,但由于给A 已经分配了来源于北京的33万的PV,则该50万的PV中,当前只剩下17万可分配给B。
[0008] 按照上述PV分配方式可知,实际为A和B分配的PV总量是100+17 = 117万。
[0009] 而事实上,由于A对分别来源于北京、上海和广东的PV量没有具体的要求,因此, 若为A分配来源为北京的10万PV,并为B分配来源于北京的40万PV,是能够同时满足A 和B的需求的。显然,若为A分配来源为北京的10万PV,则为A和B分配的PV总量可以达 到100+40 = 140万,该总量显然大于前文所述的117万。
[0010] 由此可见,现有技术中采用的按照订购顺序进行PV分配的方式是不合理的,往往 达不到PV的全局分配最优化,从而造成PV的利用率较低。
【发明内容】
[0011] 本申请实施例提供一种展示信息的选取方法,用于解决现有技术中达不到流量的 全局分配最优化,而导致流量的利用率较低的问题。
[0012] 本申请实施例还提供一种展示信息的选取装置,用于解决现有技术中达不到流量 的全局分配最优化,而导致流量的利用率较低的问题。
[0013] 本申请实施例采用下述技术方案:
[0014] 一种展示信息的选取方法,包括:
[0015] 确定当前流量的类别;
[0016] 根据将不同类别的流量分配给相应的展示信息的概率,从确定出类别的当前流量 对应的展示信息中,选取与当前流量最匹配的展示信息;
[0017] 其中,所述概率是基于最小化投放不足量和最优化均匀投放规则,根据每个展示 信息分别需求的流量总量、每个类别的流量的预测总量以及每个展示信息所对应流量的类 别确定的。
[0018] 一种展示信息的选取装置,包括:
[0019] 确定类别单元,用于确定当前流量的类别;
[0020] 选取单元,用于根据将不同类别的流量分配给相应的展示信息的概率,从确定出 的所述类别的流量对应的展示信息中,选取与当前流量最匹配的展示信息;
[0021] 其中,所述概率是基于最小化投放不足量和最优化均匀投放规则,根据每个展示 信息分别需求的流量总量、每个类别的流量的预测总量以及每个展示信息所对应流量的类 别确定的。
[0022] 本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0023] 由于作为展示信息选取依据的概率,是基于最小化投放不足量和最优化均匀投放 规则,并综合了每个展示信息分别需求的流量总量、每个类别的流量的预测总量以及每个 展示信息所对应的流量的类别确定的,因此该概率可以体现不同展示信息需求的流量总量 以及不同展示信息所对应的流量的类别之间的关联。相比于现有技术中由于不考虑不同展 示信息需求的流量总量以及不同展示信息所对应的流量的类别之间的关联性,而导致的全 局PV分配不合理的方案,本方案可以达到流量的全局分配最优化,提高流量的利用率。
【专利附图】
【附图说明】
[0024] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0025] 图1为本申请实施例1提供的一种展示信息的选取方法的实现流程图;
[0026] 图2为本申请所提供的流量的类别与展示信息之间的关系结构图;
[0027] 图3为本申请实施例2提供的一种展示信息的选取装置的具体结构示意图。
【具体实施方式】
[0028] 为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及 相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一 部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0029] 以下结合附图,详细说明本申请各实施例提供的技术方案。
[0030] 实施例1
[0031] 为了解决现有技术中达不到流量的全局分配最优化,而导致流量的利用率较低的 问题。本申请提出一种展示信息的选取方法,该方法的实现流程图如图1所示,主要包括下 述步骤:
[0032] 步骤11,确定当前流量的类别。
[0033] 为便于描述,后文将该类别称为"确定出的类别"。
[0034] 步骤12,根据将不同类别的流量分配给相应的展示信息的概率,从确定出类别的 当前流量所对应的展示信息中,选取与当前流量最匹配的展示信息。
[0035] 其中,将不同类别的流量分配给相应的展示信息的概率是基于最小化投放不足量 和最优化均匀投放规则,根据每个展示信息分别需求的流量总量、每个类别的流量的预测 总量以及每个展示信息所对应流量的类别确定的。
[0036] 采用本申请实施例提供的上述方法,由于作为展示信息选取依据的概率,是基于 最小化投放不足量和最优化均匀投放规则,并综合了每个展示信息分别需求的流量总量、 每个类别的流量的预测总量以及每个展示信息所对应的流量的类别确定的,因此该概率可 以体现不同展示信息需求的流量总量以及不同展示信息所对应的流量的类别之间的关联。 相比于现有技术中由于不考虑不同展示信息需求的流量总量以及不同展示信息所对应的 流量的类别之间的关联性,而导致的全局PV分配不合理的方案,上述方法可以达到流量的 全局分配最优化,提高流量的利用率。
[0037] 在一种实施例中,当将不同类别的流量分配给相应的展示信息的概率中,存在至 少两个当前流量分配给相应的展示信息的概率时,可以通过如下子步骤a?子步骤c实现 步骤12 :
[0038] 子步骤a,根据至少两个当前流量分配给相应的展示信息的概率,确定与至少两个 概率一一对应的相应数目的概率区间。
[0039] 其中,"相应数目"可以与存在的"至少两个当前流量分配给相应的展示信息的概 率"的数目相同。
[0040] 子步骤b,根据生成的随机数和相应数目的概率区间,确定生成的随机数所处的概 率区间。
[0041] 子步骤c,根据生成的随机数所处的概率区间所对应的概率,从确定出类别的当前 流量对应的展示信息中,选取该概率相应的展示信息作为与当前流量最匹配的展示信息。
[0042] 针对上述子步骤a?子步骤c进一步举例:如图2所示,i、j分别表示流量类别的 标号和展示信息的标号;PV_i为标号为i的流量的类别;AD^为标号为j的展示信息;X ij 为类别为i的流量可以分配给标号为j的展示信息的概率,其中,e [0, 1]。
[0043] 比如,若假设:步骤11中所述的流量是类别为"1"的流量,PV_1可分配给AD_1和 AD_2的概率分别为X11 = 0. 4和X12 = 0. 6,那么可确定出区间大小分别与"0. 4"和"0. 6" 相匹配的第一概率区间[0,0. 4]和第二概率区间(0.4,1];然后,按照特定的随机数生成规 贝1J,生成一个随机数,比如该随机数为0. 5 ;由于该随机数0. 5是落在与"0. 6"相匹配的第 二概率区间内的,那么就可以将"〇. 6"所对应的AD_2这个展示信息选出来。本申请实施例 中,为"0. 4"这一概率值确定第一概率区间[0,0. 4],以及为"0. 6"这一概率值确定第二概 率区间(〇. 4,1]的原因是:随机数在[0,1]之间是均匀分布的,从而随机数落入[0,0. 4]的 可能性与[0,0. 4]的区间大小是匹配的;类似的,随机数落入(0.4,1]的可能性与(0.4,1] 的区间大小也是匹配的。即,,随机数落入第一概率区间的概率与PV_1可分配给AD_1的概 率是相同的;随机数落入第二概率区间的概率与PV_1可分配给AD_2的概率是相同的。
[0044] 或者,可确定出区间大小分别与"0. 6"和"0. 4"相匹配的第三概率区间[0,0. 6] 和第四概率区间(0.6,1];然后,按照特定的随机数生成规则,生成一个随机数,比如该随 机数为0. 3 ;由于该随机数0. 3是落在与"0. 6"相匹配的第三概率区间内的,那么就可以将 "0. 6"所对应的AD_2这个展示信息选出来。
[0045] 其中,上述特定的随机数生成规则包括:生成的随机数属于[0, 1]这一范围。
[0046] 针对上述举例存在一种特殊情况,若步骤11中所述的流量是类别为"4"的流量, 而如图2所示,PV_4只分配给AD_2,此时说明,针对PV_4只有一个对应的展示信息可提供, 那么可以直接将PV_4所对应的AD_2这个展示信息选出来即可。
[0047] 在一种实施方式中,可以采用以下方式确定不同类别的流量分配给相应的展示信 息的概率:
[0048] 首先,确定每个展示信息分别需求的流量总量、每个展示信息所对应的流量的类 另IJ,以及每个类别的流量的预测总量;
[0049] 然后,基于最小化投放不足量和最优化均匀投放规则,根据每个展示信息分别需 求的流量总量、每个展示信息所对应的流量的类别、每个类别的流量的预测总量以及每个 类别的流量针对各展示信息的已分配量,确定不同类别的流量分配给相应的展示信息的概 率。
[0050] 其中,每个展示信息分别需求的流量总量,可以是展示信息发布者分别为每个展 示信息订购的流量总量。
[0051] 本申请实施例中,展示信息与流量的类别的对应关系可以参见说明书附图2。
[0052] 如图2所示,图2右侧的"AD_1 :北京"表示展示信息AD_1需要展示给用户特征数 据中包含有"北京"的用户。其中,"北京"为用户所处地理区域的信息。"AD_2:男性"表示 展示信息AD_2需要展示给用户特征数据中包含有"男"的用户。其中,"男"是用户性别信 肩、。
[0053] 图2右侧的类似信息的含义此处不再一一赘述。
[0054] 此外,图2左侧的"PV_1 :北京,男"表示产生PV_1的用户的用户特征数据包含"北 京"和"男"。"PV_2 :北京,女,20-25岁"表示产生PV_2的用户的用户特征数据包含"北京"、 "女"和 "20-25 岁"。
[0055] 图2左侧的类似信息的含义此处不再一一赘述。
[0056] 图2中,由连线相连的ADJ与PV_i之间存在对应关系。比如,AD_1与PV_1、PV_2 和PV_3由连线相连,则表示AD_1与PV_1、PV_2和PV_3之间存在对应关系。该对应关系说 明,针对PV_1、PV_2和PV_3这三个类别的流量,可选取的展示信息包括AD_1。再比如,PV_1 与AD_1和AD_2由连线相连,则表示PV_1与AD_1和AD_2之间存在对应关系。该对应关系 说明,PV_1可以分配给AD_1和AD_2两个展示信息流量。
[0057] 此外,还可以采用以下方式确定不同类别的流量分配给相应的展示信息的概率:
[0058] 首先,确定每个展示信息分别需求的流量总量、每个展示信息所对应的流量的类 另IJ、每个类别的流量的预测总量,以及每个展示信息的权重值;
[0059] 然后,基于最小化投放不足量和最优化均匀投放规则,根据每个展示信息分别需 求的流量总量、每个展示信息所对应的流量的类别、每个类别的流量的预测总量、每个类别 的流量针对各展示信息的已分配量,以及每个展示信息的权重值,确定不同类别的流量分 配给相应的展示信息的概率。
[0060] 在一种实施方式中,确定每个类别的流量的预测总量,可以通过如下方式:
[0061] 1)预测网站可提供的流量总量;
[0062] 其中,预测网站可提供的流量总量可以通过下述方式预测:首先,按照将同一页面 上的、产生相同流量的展示位置分到同一位置集合中的方式,对网站的不同页面中的展示 位置进行分类,得到多个位置集合;然后,获取每个集合在某一段时间内产生的历史流量, 并去噪,得到去噪后的历史流量;最后,利用时间序列模型对去噪后的历史流量进行建模, 预测网站未来可提供的流量总量。其中,去噪是指从获取到的历史流量中,去除由于网络问 题、或突发性事件等造成不可控因素所带来的突增的流量或极低的流量。
[0063] 本申请实施例中,还可以采用其他现有技术,实现对网站可提供的流量总量的预 测。
[0064] 2)根据历史流量,预测用户特征数据;
[0065] 其中,预测用户特征数据是指预测将来可能访问网站的用户的用户特征数据。用 户特征数据可以包括下述一项或多项:
[0066] 用户所处地理区域的信息;
[0067] 用户对于网站的访问时刻的信息;
[0068] 用户性别信息。
[0069] 具体地,对于预测出用户特征数据的方式,可以通过以历史流量为基础,通过重采 样的技术,模拟出未来某一段时间的用户行为,进而确定相应的用户特征数据。
[0070] 3)对预测出的用户特征数据进行分类,并根据分类结果以及网站可提供的流量总 量,确定每个类别的流量的预测总量。
[0071] 针对上述步骤1)?3)举例:如图2所示,首先,若假设预测网站可提供的流量 总量为200万PV ;然后,对于根据历史流量预测出的用户特征数据:"北京,男"、"北京,女, 20-25岁"、"北京,女,其他年龄"或"广东,男"等进行分类,得到分类结果。进一步地,为分 类结果分配相应的流量的类别的标号,可以得到如图2所示的PV_1、PV_2、PV_3、PV_4 ;最 后,若假设PV_1的历史流量为占历史流量总量的0. 1,则可以确定出网站可分配给PV_1的 流量的预测总量为〇. IX 200万PV = 20万PV。
[0072] 图2左侧的类似的确定类别的流量的总量的方式此处不再一一赘述。
[0073] 另外,在一种实施方式中,还可以基于最小化投放不足量和最优化均匀投放规则, 根据每个展示信息分别需求的流量总量、每个展示信息所对应的流量的类别、每个类别的 流量的预测总量,以及展示信息的权重值,确定不同类别的流量分配给相应的展示信息的 概率。
[0074] 例如,若在计算不同类别的流量分配给相应的展示信息的概率时,还未为展示信 息分配了流量(即还没有分配了实际流量),那么,在一种实施方式中,可以设置如式[1]所 示的最小优化函数公式:
【权利要求】
1. 一种展示信息的选取方法,其特征在于,包括: 确定当前流量的类别; 根据将不同类别的流量分配给相应的展示信息的概率,从确定出类别的当前流量对应 的展示信息中,选取与当前流量最匹配的展示信息; 其中,所述概率是基于最小化投放不足量和最优化均匀投放规则,根据每个展示信息 分别需求的流量总量、每个类别的流量的预测总量以及每个展示信息所对应流量的类别确 定的。
2. 如权利要求1所述的方法,其特征在于,当存在至少两个当前流量分配给相应的展 示信息的概率时,所述根据将不同类别的流量分配给相应的展示信息的概率,从确定出类 别的当前流量对应的展示信息中,选取与当前流量最匹配的展示信息,包括: 根据至少两个当前流量分配给相应的展示信息的概率,确定与所述至少两个概率一一 对应的相应数目的概率区间; 根据生成的随机数和相应数目的概率区间,确定生成的随机数所处的概率区间; 根据生成的随机数所处的概率区间所对应的概率,从确定出类别的当前流量对应的展 示信息中,选取该概率相应的展示信息作为与当前流量最匹配的展示信息。
3. 如权利要求1所述的方法,其特征在于,采用下述方式,确定所述概率: 确定每个展示信息分别需求的流量总量、每个展示信息所对应流量的类别,以及每个 类别的流量的预测总量; 基于最小化投放不足量和最优化均匀投放规则,根据每个展示信息分别需求的流量总 量、每个展示信息所对应的流量的类别、每个类别的流量的预测总量以及每个类别的流量 针对各展示信息的已分配量,确定所述概率。
4. 如权利要求1所述的方法,其特征在于,采用下述方式,确定所述概率: 确定每个展示信息分别需求的流量总量、每个展示信息所对应流量的类别,以及每个 类别的流量的预测总量,以及每个展示信息的权重值; 基于最小化投放不足量和最优化均匀投放规则,根据每个展示信息分别需求的流量总 量、每个展示信息所对应的流量的类别、每个类别的流量的预测总量、每个类别的流量针对 各展示信息的已分配量,以及每个展示信息的权重值,确定所述概率。
5. 如权利要求3或4所述的方法,其特征在于,确定每个类别的流量的预测总量,包 括: 预测网站可提供的流量总量; 根据历史流量,预测用户特征数据; 对所述预测出的用户特征数据进行分类,并根据分类结果以及网站可提供的流量总 量,确定每个类别的流量的预测总量。
6. -种展示信息的选取装置,其特征在于,包括: 确定概率单元,用于基于最小化投放不足量和最优化均匀投放规则,根据每个展示信 息分别需求的流量总量、每个类别的流量的预测总量以及每个展示信息所对应流量的类 另IJ,确定将不同类别的流量分配给相应的展示信息的概率; 确定类别单元,用于确定当前流量的类别; 选取单元,用于根据确定概率单元确定的将不同类别的流量分配给相应的展示信息的 概率,从确定出类别的当前流量对应的展示信息中,选取与当前流量最匹配的展示信息。
7. 如权利要求6所述的装置,其特征在于,所述选取单元包括: 确定概率区间数目子单元,用于当存在至少两个当前流量分配给相应的展示信息的 概率时,根据至少两个当前流量分配给相应的展示信息的概率,确定与所述至少两个概率 一一对应的相应数目的概率区间; 确定概率区间子单元,用于根据生成的随机数和相应数目的概率区间,确定生成的随 机数所处的概率区间; 选取展示信息子单元,用于根据生成的随机数所处的概率区间所对应的概率,从确定 出类别的当前流量对应的展示信息中,选取该概率相应的展示信息作为与当前流量最匹配 的展示信息。
8. 如权利要求6所述的装置,其特征在于,所述确定概率单元具体用于: 确定每个展示信息分别需求的流量总量、每个展示信息所对应的流量的类别,以及每 个类别的流量的预测总量; 基于最小化投放不足量和最优化均匀投放规则,根据每个展示信息分别需求的流量总 量、每个展示信息所对应的流量的类别、每个类别的流量的预测总量以及每个类别的流量 针对各展示信息的已分配量,确定所述概率。
9. 如权利要求6所述的装置,其特征在于,所述确定概率单元具体用于: 确定每个展示信息分别需求的流量总量、每个展示信息所对应的流量的类别、每个类 别的流量的预测总量,以及每个展示信息的权重值; 基于所述规则,根据每个展示信息分别需求的流量总量、每个展示信息所对应的流量 的类别、每个类别的流量的预测总量、每个类别的流量针对各展示信息的已分配量,以及每 个展示信息的权重值,确定所述概率。
10. 如权利要求8或9所述的装置,其特征在于,所述确定概率单元具体用于: 预测网站可提供的流量总量;根据历史流量,预测用户特征数据;对所述预测出的用 户特征数据进行分类,并根据分类结果以及网站可提供的流量总量,确定每个类别的流量 的预测总量。
【文档编号】G06Q30/02GK104361415SQ201410699755
【公开日】2015年2月18日 申请日期:2014年11月27日 优先权日:2014年11月27日
【发明者】潘伟, 白彦冰, 彭坤, 方庆安 申请人:新浪网技术(中国)有限公司