一种资源分配的方法及服务器的制造方法
【专利摘要】本发明实施例公开了一种资源分配的方法,包括:获取第一历史数据,根据第一历史数据建模得到第一预估模型,第一预估模型用于表征服务器为终端提供服务得到的反馈结果与资源的预测关系,该第一历史数据为与第一预估模型构建相关的全量数据;获取第二历史数据,根据第二历史数据和第一预估模型建模得到第二预估模型的过程中,持续检测基于第二预估模型得到的数据输出结果是否满足预设策略,该第二历史数据为与第二预估模型构建相关的近期;直至检测到基于第二预估模型得到的数据输出结果满足预设策略时,停止对第二预估模型的建模,得到实际运用于资源配比的第二模型;根据第二模型进行实际资源配比的处理。本发明实施例还提供了一种服务器。
【专利说明】
一种资源分配的方法及服务器
技术领域
[0001] 本发明涉及通信领域中的网络运营技术,尤其涉及一种资源分配的方法及服务 器。
【背景技术】
[0002] 随着网络的迅速发展,智能终端的大量普及,用户使用网络或智能终端上安装的 各种应用可以实现各种各样的生活服务,比如,网上交水/电/煤气费,上网打游戏,上网看 视频等各种消费和娱乐服务。不同的平台可以为用户提供不同的服务类型,也可以通过一 个平台整合多种服务类型来提供给用户。然而,平台不可能无限量的扩充各种服务类型,因 此,平台的资源是有限的,平台与智能终端通过网络进行信息交互时,网络资源也是有限 的,如何能将平台提供的服务与其资源配比相适应,以期达到最佳的运行效率是要解决的 技术问题。而想要分析出平台提供的服务与其资源配比是否相适应,需要收集服务器为终 端提供服务得到的反馈结果(如回报或收益)来用于分析,即:服务器通过平台为终端提供 服务得到的反馈结果(如回报或收益)与资源的关系进行分析才可以得到所要的处理结果, 使平台达到最佳的运行效率,同时以最少的运营成本得到最佳的反馈结果(如回报或收 益)。而现有技术中,为了解决该技术问题,设置了一个理想化的前提:服务器为终端提供服 务得到的反馈结果与资源是成正比的,实际应用中,二者之间并不总是正比的,从而,采用 现有技术,是无法得到准确的处理结果的,势必也无法使平台达到最佳的运行效率。
【发明内容】
[0003] 为解决上述技术问题,本发明实施例期望提供一种资源分配的方法及服务器,能 够更精确的确定平台上各业务产品的最佳资源分配方式,达到平台的收益的总和最大化。
[0004] 本发明的技术方案是这样实现的:
[0005] 本发明实施例提供了一种资源分配的方法,包括:
[0006] 获取第一历史数据,根据所述第一历史数据建模得到第一预估模型,所述第一预 估模型用于表征服务器为终端提供服务得到的反馈结果与资源的预测关系,所述第一历史 数据为与第一预估模型构建相关的全量数据;
[0007] 获取第二历史数据,根据所述第二历史数据和所述第一预估模型建模得到第二预 估模型的过程中,持续检测基于所述第二预估模型得到的数据输出结果是否满足预设策 略,所述预设策略用于表征根据所述第二预估模型得到的数据输出结果运用于资源配比 时,对应获得的所述服务器为终端提供服务得到的反馈结果高于历史阈值,所述第二历史 数据为与第二预估模型构建相关的近期增量数据;
[0008] 直至检测到基于所述第二预估模型得到的数据输出结果满足预设策略时,停止对 第二预估模型的建模,得到实际运用于所述资源配比的第二模型;
[0009] 根据所述第二模型进行实际资源配比的处理。
[0010]在上述方案中,所述根据所述第二模型进行实际的资源配比处理,包括:
[0011] 获取待处理的目标数据,根据所述第二模型对所述待处理的目标数据进行运算, 得到实际资源配比。
[0012] 在上述方案中,所述获取第二历史数据,根据所述第二历史数据和所述第一预估 模型建模得到第二预估模型的过程,包括:
[0013] 获取所述待处理的目标数据对应的业务产品的属性、业务产品的上线天数及业务 产品的历史指标值,根据所述业务产品的属性、所述业务产品的上线天数及所述业务产品 的历史指标值及预设待求权值向量,建模得到第三预估模型,所述第三预估模型用于表征 所述资源配比与资源的预测关系;
[0014] 获取业务产品的历史总收益,根据所述业务产品的历史总收益、所述第三预估模 型和所述第一预估模型建模得到所述第二预估模型。
[0015] 在上述方案中,所述根据所述第二模型进行实际资源配比的处理之后,所述方法 还包括:
[0016] 经过预设时间后,获取更新后的第一历史数据和更新后的第二历史数据,根据所 述更新后的第一历史数据和所述更新后的第二历史数据对所述第二模型进行调整;
[0017] 根据调整后的所述第二模型进行实际资源配比的处理。
[0018] 在上述方案中,所述获取第一历史数据,根据所述第一历史数据建模得到第一预 估丰吴型,包括:
[0019] 获取所述待处理的目标数据对应的所述业务产品的属性、所述业务产品的上线天 数及所述业务产品的历史指标值,根据所述待处理的目标数据对应的所述业务产品的属 性、所述业务产品的上线天数及所述业务产品的历史指标值量建模得到所述第一预估模 型。
[0020] 本发明实施例还提供了一种服务器,包括:
[0021] 获取单元,用于获取第一历史数据,所述第一历史数据为与第一预估模型构建相 关的全量数据;
[0022] 建模单元,用于根据获取单元获取的所述第一历史数据建模得到第一预估模型, 所述第一预估模型用于表征服务器为终端提供服务得到的反馈结果与资源的预测关系;
[0023] 所述获取单元,还用于获取第二历史数据,所述第二历史数据为与第二预估模型 构建相关的近期增量数据;
[0024] 检测单元,还用于所述建模单元根据所述获取单元获取的所述第二历史数据和所 述第一预估模型建模得到第二预估模型的过程中,持续检测基于所述建模单元建立的所述 第二预估模型得到的数据输出结果是否满足预设策略,所述预设策略用于表征根据所述第 二预估模型得到的数据输出结果运用于资源配比时,对应获得的所述服务器为终端提供服 务得到的反馈结果高于历史阈值;
[0025] 停止单元,用于直至所述检测单元检测到基于所述第二预估模型得到的数据输出 结果满足预设策略时,停止对第二预估模型的建模,以及,
[0026] 所述建模单元,还用于得到实际运用于所述资源配比的第二模型;
[0027] 资源处理单元,用于根据所述建模单元得到的所述第二模型进行实际资源配比的 处理。
[0028] 在上述服务中,所述获取单元,还用于获取待处理的目标数据;
[0029] 资源处理单元,具体用于根据所述建模单元得到的所述第二模型对所述获取单元 获取的所述待处理的目标数据进行运算,得到实际资源配比。
[0030] 在上述服务器中,所述获取单元,具体用于获取所述待处理的目标数据对应的业 务产品的属性、业务产品的上线天数及业务产品的历史指标值;
[0031] 所述建模单元,还用于根据所述获取单元获取的所述业务产品的属性、所述业务 产品的上线天数及所述业务产品的历史指标值及预设待求权值向量,建模得到第三预估模 型,所述第三预估模型用于表征所述资源配比与资源的预测关系;
[0032] 所述获取单元,还用于获取业务产品的历史总收益;
[0033] 所述建模单元,具体用于根据所述获取单元获取的所述业务产品的历史总收益、 所述第三预估模型和所述第一预估模型建模得到所述第二预估模型。
[0034] 在上述服务器中,所述服务器还包括:调整单元;
[0035]所述获取单元,还用于所述资源处理单元根据所述第二模型进行实际资源配比的 处理之后,经过预设时间后,获取更新后的第一历史数据和更新后的第二历史数据;
[0036]所述调整单元,用于根据所述获取单元获取的所述更新后的第一历史数据和所述 更新后的第二历史数据对所述建模单元得到的所述第二模型进行调整;
[0037]所述资源处理单元,还用于根据所述调整单元调整后的所述第二模型进行实际资 源配比的处理。
[0038] 在上述服务器中,所述获取单元,具体用于获取所述待处理的目标数据对应的所 述业务产品的属性、所述业务产品的上线天数及所述业务产品的历史指标值;
[0039] 所述建模单元,具体用于根据所述获取单元获取的所述待处理的目标数据对应的 所述业务产品的属性、所述业务产品的上线天数及所述业务产品的历史指标值建模得到 所述第一预估模型。
[0040] 本发明实施例提供了一种资源分配的方法及服务器,通过获取第一历史数据,根 据第一历史数据建模得到第一预估模型,第一预估模型用于表征服务器为终端提供服务得 到的反馈结果与资源的预测关系,该第一历史数据为与第一预估模型构建相关的全量数 据;获取第二历史数据,根据第二历史数据和第一预估模型建模得到第二预估模型的过程 中,持续检测基于第二预估模型得到的数据输出结果是否满足预设策略,预设策略用于表 征根据第二预估模型得到的数据输出结果运用于资源配比时,对应获得的服务器为终端提 供服务得到的反馈结果高于历史阈值,该第二历史数据为与第二预估模型构建相关的近期 增量数据;直至检测到基于第二预估模型得到的数据输出结果满足预设策略时,停止对第 二预估模型的建模,得到实际运用于资源配比的第二模型;根据第二模型进行实际资源配 比的处理。采用上述技术实现方案,由于基于业务产品的基于用户行为的历史数据为依据, 通过建立反馈结果与资源的预测关系,并基于反馈结果与资源的预测关系构建出关于资源 分配决策模型,通过模型训练找到平台上对个业务产品而言最佳的资源配比,即更精确的 确定平台上各业务产品的最佳资源分配方式,并使得采用最佳资源配比达到平台的收益的 总和最大化。
【附图说明】
[0041] 图1为现有技术中的业务运营示意图;
[0042] 图2为本发明实施例中进行信息交互的各种硬件实体的示意图;
[0043] 图3为本发明实施例提供的一种资源分配方法的流程图一;
[0044] 图4为本发明实施例提供的一种示例性的神经网络的结构示意图;
[0045] 图5为本发明实施例提供的一种资源分配方法的流程图二;
[0046] 图6为本发明实施例提供的一种资源分配方法的流程图三;
[0047] 图7为本发明实施例提供的一种服务器的结构示意图一;
[0048] 图8为本发明实施例提供的一种服务器的结构示意图二;
[0049] 图9为本发明实施例提供的一种服务器的结构示意图三。
【具体实施方式】
[0050] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述。
[0051] 首先,对本文中涉及的以下用语说明如下:
[0052] 1)长尾池:是指总资源中除去考察池以外的部分,占总资源中的较大部分,用于选 定业务产品的运营,以获取收益。因为一般该池子中的业务产品数目较多,其中大部分业务 产品的收益一般呈现出长尾现象,因此按业务惯例,将这部分资源称为长尾池。
[0053] 2)考察池:是指总资源中辟出的较小一部分,用于检查新业务产品的收益情况,如 果对其满意,则将其置于长尾池中。
[0054] 3)资源:是指针对在线业务产品情况,主要指流量(pv)、曝光量等。需要说明的是, 在特定时间段内,平台上可供使用的资源量是固定不变的,多个业务产品竞争获取这有限 的资源。业务产品是指例如应用宝上(平台)发布的各种游戏、广告、软件等应用。平台是指 多项产品的聚集地,例如腾讯的QQ、应用宝等。
[0055] 针对业务产品和平台而言,需要说明的是,平台是服务器和终端之间的交互平台, 服务器通过平台发布业务产品,终端通过该平台曝光或显示应用该业务产品,以应用宝为 例,应用宝作为一个平台,整合了各种类型的第三方应用,这些第三方应用就是业务产品, 基于平台提供的这些业务产品可以为用户提供各种服务。
[0056] 4)收益:是指金钱收入或其它商业性目标。例如:一段时间内的在线广告收入,某 业务产品的注册用户数、活跃用户数,用户接受个性化推荐结果的次数,某游戏注册用户中 的付费比率,付费用户的曝光点击率(即每千次 pv中用户点击下载的次数)等都可以为收 益。
[0057]示例性的,服务器通过平台发布或上线了一款新的游戏,终端通过平台可以看到 这款新的游戏,进而才可能在该终端上玩这款游戏,但是,平台上的业务产品占用的流量空 间或曝光量是固定的,当一款新的游戏上线时,肯定要为其分配曝光量等资源,以使得通过 平台在终端上曝光(显示),因此,服务器就要进行合理的资源重新分配,而用户终端玩或使 用这款新的游戏,就要对其进行点击触发(曝光点击率)或者进行用户注册等等,由于当一 款应用的曝光点击率或用户注册量很高时,会吸引投资、广告投入和知名度等,最终产生发 布方想要的有形资产或无形资产,因此,这些曝光点击率或用户注册量就是该新款游戏的 收益。
[0058]需要说明的是,采用自动和手动两种方式进行资源分配的方法。采用手动方式进 行资源分配的方法为:如图1所示,根据新业务产品在头η天的表现(业务产品指标),由业务 人员分析后决定该新业务产品是被淘汰,还是被挑选进入长尾池与已有业务产品一起由业 务人员为其进行每天的资源分配。其中,长尾池中所有业务产品的资源分配规则,主要依据 于业务人员的业务经验,例如,那些收益潜力越大的业务产品,为其分配的资源量也越大。 采用自动方式进行资源分配的方法为:假定收益与业务产品获得的资源量成正比,由此可 将资源分配的问题转化为一个线性优化问题,服务器通过解决线性优化问题,获得各业务 产品的资源分配的最佳方案,从而使得平台的总收益最大化。
[0059] 然而,采用现有技术为业务产品分配资源的过程中,由于手动分配方式是由业务 人员根据业务经验进行资源分配的,人的主观能动性占主要地位,因此,很难实现业务产品 资源分配的最佳方案,从而影响平台的总收益最大化;以及由于主动分配方式是将收益与 业务产品获得的资源量成正比实现的,而实际应用中,平台上的收益与业务产品获得的资 源量不一定是成正比,因此,服务器按上述主动分配方式分配资源时,影响了各业务产品的 资源分配的最佳方案选择的精确性,导致平台获得的收益不一定是最大的,即影响平台的 总收益最大化。
[0060] 如图2所示,为本发明实施例中信息交互的各种硬件实体的示意图,图2中包括:一 个或多个服务器41~4n、终端设备21-25及网络31,网络31中包括路由器,网关等等网络实 体,图中并未体现。终端设备21-25通过有线网络或者无线网络与服务器进行业务产品信息 交互,以便从终端21-25通过用户行为产生业务产品的指标并传输至服务器。终端设备的类 型如图2所示,包括手机(终端23)、平板电脑或PDA(终端25)、台式机(终端22)、PC机(终端 24)、一体机(终端21)等类型。其中,终端设备中安装有各种用户所需的业务产品,比如具备 娱乐功能的应用(如视频应用,音频播放应用,游戏应用,阅读软件),又如具备服务功能的 应用(如地图导航应用、团购应用、拍摄应用等)。
[0061] 基于上述图2所示的系统,以用户所需的应用为游戏应用为例,服务器通过平台进 行业务产品的发布,终端通过网络获取在线业务产品并进行使用,用户对业务产品的使用 产生基于用户行为的指标等历史数据并传输至服务器,该服务器统计获取这些历史数据和 业务产品的在线天数等历史数据提出一种资源分配方法。本发明实施例提供的资源分配方 法由于基于业务产品的基于用户行为的历史数据为依据,通过建立反馈结果与资源的预测 关系,并基于反馈结果与资源的预测关系构建出关于资源分配决策模型,通过模型训练找 到平台上对个业务产品而言最佳的资源配比,即更精确的确定平台上各业务产品的最佳资 源分配方式,并使得采用最佳资源配比达到平台的收益的总和最大化。
[0062] 上述图2的例子只是实现本发明实施例的一个系统架构实例,本发明实施例并不 限于上述图2所述的系统结构,基于该系统架构,提出本发明各个实施例。
[0063] 实施例一
[0064] 本发明实施例提供了一种资源分配方法,如图3所示,该方法可以包括:
[0065] S101、获取第一历史数据,根据该第一历史数据建模得到第一预估模型,该第一预 估模型用于表征服务器为终端提供服务得到的反馈结果与资源的预测关系。
[0066] 这里,第一历史数据为全量数据,是服务器用于数据分析所收集的全部数据内容, 具体用于表征业务产品被访问时自身的数据和用户反馈的访问数据。
[0067] 需要说明的是,本发明实施例提供的一种资源分配的方法,主要是针对服务器提 供的平台上发布的业务产品的资源分配的方法。
[0068] 可以理解的是,由于通过服务器的平台发布的业务产品也越来越多了,目前,在平 台上,每天都存在大量的业务产品,由于用户使用这些业务产品使得这些业务产品为平台 带来了收益,因此,运营商通过合理分配资源给各业务产品,来达到收益最大化的目的。本 发明实施例提供的就是一种针对业务产品进行合理的资源分配的方案。
[0069] 本发明实施例的设计思想主要为:服务器根据平台上记录的业务产品对应的历史 数据设计一个资源分配算法,然后将该资源分配算法应用到后续的资源分配中,从而使得 平台收益最大化。
[0070] 具体的,服务器会通过平台记录的第一历史数据建模得到用于表征服务器为终端 提供服务得到的反馈结果与资源的预测关系的第一预估模型,即本发明实施例中,为了预 估计收益与资源的关系,该服务器通过平台的历史数据建模来实现第一预估计模型。
[0071] 可以理解的是,本发明实施例终端的反馈结果可以为收益。
[0072]需要说明的是,本发明实施例中的第一历史数据是指业务产品的属性、业务产品 的上线天数(进入长尾池的天数)及业务产品的历史指标值等。其中,本发明实施例中的业 务产品的历史指标值是指曝光量、下载量、注册量、登录数、付费数、收益等。
[0073]进一步地,在服务器获取第一历史数据之前,该服务器要先进行数据准备工作,即 记录长尾池中各业务产品每天的:产品类别、截止到当日的在长尾池中已运行天数(简称 "天数")、当日指标值(如曝光量、下载量、注册量、登录数、付费数、收益)等基于用户行为的 指标。这样,在服务器建立第一预估模型时,该服务器就可以统计或获取到所有的在线业务 产品的第一历史数据了。
[0074]需要说明的是,本发明实施例中的第一历史数据指的是所有在线的业务产品的在 建模当天之前的历史数据。本发明实施例中的业务产品的历史指标值是指在建模当天之前 的η天里的指标值(即近期数据)。
[0075] 示例性的,服务器根据业务产品的属性C、业务产品的上线天数D、业务产品的历 史指标值Ρ、建模得到表征资源Ε与收益r的预测关系的第一预估模型,例如,r = f(C,D,P, E)〇
[0076] 需要说明的是,在本发明实施例中,C、D、P都是可以获知的,因此,收益r只取决于 E,即改变每天的资源分配量,就会改变每天的收益。
[0077]需要说明的是,本发明实施例中的第一预估模型是非线性的,优选的,第一预估模 型可以为神经网络模型。这是由于神经网络模型的输出为连续值,这样,采用神经网络模型 的后续总收益的最优化的算法选型的可选范围更大,结果也比模型输出结果为离散值情况 更精确。其中,神经网络模型中的隐层单元数目可通过实验确定。
[0078] 具体的,假设服务器获取的业务产品A的第一历史数据示例性的如表1所示,业务 产品的属性Cu、业务产品的上线天数D^、业务产品的历史指标值P inj、建模得到表征资源Ei 与收益η。其中,(^表示第j天第i个产品的类别,表示第j天第i个产品的进入长尾池的天 数,表示第j-Ι到第j-n天的第i个产品的指标值。假设n=14时,假设业务产品的历史指 标值为6个指标,则占用84个字段,(^占用1个字段,占用1个字段,Ei占用1个字段,第 一预估模型的输入变量为84+1+1+1=87个(1=((^,0小?如上)),输出变量为1个 7=出)。
[0079] 表 1
[0080]
[0081] 因此,采用3层神经网络模型,其结构如图4所示。这里的隐层(中间层)输出值 hi,···,hP的计算公式为公式(1):
[0082]
( 1 )
[0083] 其中,b = 1,…,q,xm+i = l(偏置项),f (X) = l/(l+e-x),wab是输入层第a个节点与 隐层第b个节点之间的连接权值。
[0084] 输出层y的计算为公式(2):
[0085]
( 2 )
[0086] 其中,其中仇是隐层第b个节点与输出层第k个节点之间的连接权值。
[0087] 需要说明的是,模型参数w(矩阵)、β(向量)的求解过程如下:
[0088] w(神经网络中输入层与隐层之间的连接权值):根据极限学习机的原理,w可取为 任意的随机值,例如位于[_1,1]之间的随机值。且一旦赋值,在后续的模型优化过程中就不 再变化。因此,不管模型的输入变量有多少,都不影响模型的可调参数总个数。
[0089] 超参数p :是神经网络的隐层节点数,也是整套算法中的唯一超参数,取得过小或 过大,都可能导致欠拟合或过拟合,只能通过实验确定一个最佳值。
[0090] 模型训练求β(神经网络中隐层与输出层之间的连接权值):按照极限学习机的原 理,归结为求一个Moore-Penrose广义逆就可。
[0091] 总之,求得β之后,神经网络模型(第一预估模型)就建立起来了。将来给定(Cu, Di j,Pinj,Ei)值,就能求得η 了。
[0092] 需要说明的是,神经网络模型时一个业务产品一天的总收益与资源的预侧关系, 将所有产品的所有在线天数的收益与资源的关系求和就得到本发明是实施例中的第一预 估模型了。
[0093] S102、获取第二历史数据,根据该第二历史数据和第一预估模型建模得到第二预 估模型的过程中,持续检测基于该第二预估模型得到的数据输出结果是否满足预设策略, 该预设策略用于表征根据该第二预估模型得到的数据输出结果运用于资源配比时,对应获 得的服务器为终端提供服务得到的反馈结果高于历史阈值。
[0094] 这里,第二历史数据为增量数据,是服务器用于数据分析所收集的全部数据内容 中的近期数据内容,具体用于业务产品被访问时自身的数据、用户反馈的访问数据,还可以 包括据这些数据所产生的收益。
[0095] 通俗的说,基于第二历史数据和第一预估模型建模得到第二预估模型的过程中, 第二历史数据和第一预估模型可以作为已知参量,为了得到最精确的、最终实际采用的第 二预估模型,还需要持续检测基于该第二预估模型得到的数据输出结果(为了与后续的数 据输出结果进行区别,这里以第一数据输出结果进行表示),该第一数据输出结果可以理解 为补偿参量,将该补偿参量反馈输入至基于上述已知参量得到的第二预估模型中,继续监 测基于该第二预估模型得到的数据输出结果(这里以第二数据输出结果进行表示,第二数 据输出结果不同于第一数据输出结果),当第二数据输出结果满足预设策略,即:将该第二 数据输出结果运用于资源配比时,对应获得的服务器为终端提供服务得到的反馈结果高于 历史阈值,那么,可以停止对第二预估模型的训练过程,此时得到的第二预估模型即为最终 实际采用的第二预估模型。
[0096]示例性的,本发明实施例中的表1中所示的业务产品的属性Cij、业务产品的上线天 数D^、业务产品的历史指标值Pinj为第一历史数据,根据业务产品的属性Cu、业务产品的上 线天数D^、业务产品的历史指标值P inj以及资源EiS所占用的字段的个数,按照公式(1)来 建立第一预估模型;第二历史数据为相应的业务产品的属性Cu、业务产品的上线天数D^、 业务产品的历史指标值Pw、资源Ei以及服务器获取的业务产品在建模之前的历史总收益 (实际的历史真实总收益)的具体数据,该服务器根据第二历史数据,对历史上长尾池里的 业务产品重新分配资源比例,希望获得的历史"收益"与历史真实收益的比值RevRise能达 到最大,即公式(3):
[00971
(3)
[0098]其中,N表示截止到建模日历史上有统计指标数据的那些所有天,M」表示第j天长 尾池里的产品个数,Clj表示第j天第i个产品的类别,表示第j天第i个产品的进入长尾池 的天数,表示第j-Ι到第j-n天的第i个产品的指标值R real为历史真实总收益。同时,还要 满足所有业务产品的资源配比之和要为1的条件,即公式(4)。
[00991
(4 )
[0100]也就是说,服务器需要解决一个带N个等式约束的求函数最大值的优化问题,即需 要寻找最合适的W(待求数据参数),使得RevRise最大。
[0101] 为了便于建模和优化,可以将函数g()进行改写,如公式(5):
[0102]
(5)
[0103] 这样改写后的公式(5),满足公式(4)的约束条件,因此,公式(3)最终改写为公式 (6):
[0104]
(6)
[0105] 也就是说,服务器根据第二历史数据、待求权值向量(待求数据参数)以及第一预 估模型和第三预估模型,建模第二预估模型。
[0106] 由上可知,按照上述公式(5)得到的W就是第一数据输出结果,其中,W为资源配比 的补偿参量,服务器经过持续检测,检测到满足预设策略,也就是公式(6)的条件的输出结 果W就是第二数据输出结果。
[0107] 需要说明的是,本发明实施例提供的资源分配的方法中是通过建立收益和资源分 配关系的目的找到使得重新进行资源分配时要比之前的资源分配方式的收益高,最佳的就 是获取能够使得按照调整后的资源配比进行资源分配时,后续产生的收益要比之前未调整 时的历史真实总收益(历史阈值)高到最大值。在服务器预估计了收益与资源的关系之后, 该服务器就根据包含业务产品的历史真实总收益的第二历史数据,建立一个带有与资源相 关的变量(数据输出结果)的第二预估模型,以通过检测第二预估模型是否达到预估计收益 高于历史真实总收益最大(预设策略)来确定最终实际采用的第二预估模型。也就是说,第 二预估模型中的输出结果是与资源相关的变量,通过不断的试验和训练,找到了能够满足 最佳预估收益的输出结果,通过该输出结果就能得到使得预估收益最大的资源配比,服务 器按照该资源配比进行实际的资源分配,就能使得调整后的业务产品的收益最大了。
[0108] 示例性的,预设资源配比与变量W的关系式,由于第一预估模型建立的是预估收 益与资源的关系,因此,根据第一预估模型和历史真实总收益建立的第二预估模型中的输 入为与W相关的资源和预估收益,输出的W的求解结果,对于W的求解就是第二预估模型的训 练过程,不停的调整第二预估模型,直至输出结果达到预设策略的时候,此时该第二预估模 型被最终确定下来,可以作为最终实际采用的第二预估模型。当求解出W之后,就可以求解 出满足要求的资源配比了。由于本发明实施例将资源化解为关于W的关系式,因此,通过第 二预估模型建立的是W的模型,这时,想要达到预设模型就必须满足通过输出结果得到的资 源配比能够使得获得的服务器为终端提供服务得到的反馈结果高于历史阈值才可以。
[0109] 因此,服务器建立第一预估模型之后,若想要预测的收益最大,则还需跟实际的历 史真实总收益比较,于是,该服务器获取第二历史数据(包括历史真实总收益),由于根据第 一预估模型中的资源量是服务器不能直接获知的,因此,该服务器根据第二历史数据和第 一预估模型建模得到的第二预估模型中仍含有待求数据参数(即数据输出结果),该待求数 据参数为求解本发明实施例中的资源量的未知参数。由于服务器想要预测一个收益最大化 的目标,因此,服务器需要不断进行检测基于该第二预估模型得到的数据输出结果(待求数 据参数)是否满足预设策略,该预设策略用于表征根据该第二预估模型得到的数据输出结 果运用于资源配比时(利用数据输出结果可求得资源配比),对应获得的服务器通过平台为 终端提供服务得到的反馈结果高于历史阈值(通过资源配比求得业务产品的资源,从未求 得反馈结果(收益)),由于第二预估模型是一个不断优化训练的模型,服务器通过不断优化 第二预估模型直至找到数据输出结果对应的收益最大的模型。
[0110]需要说明的是,本发明实施例中的历史阈值指的是服务器获取到的历史真实总收 益,当然通过本发明实施例提供的预估模型预测到的收益比历史阈值越高越好,选择一个 比历史阈值最高的预测收益对应的数据输出结果就可以求出最优的实际的资源配比了。
[0111] S103、直至检测到基于第二预估模型得到的数据输出结果满足预设策略时,停止 对第二预估模型的建模,得到实际运用于资源配比的第二模型。
[0112] 当服务器检测到基于第二预估模型得到的数据输出结果满足预设策略时,说明这 时的数据输出结果就是我们需要的最优解,因此,该服务器停止对第二预估模型的优化,确 定了真正后面要用于求解资源配比的第二模型,该第二模型就是停止优化时的第二预估模 型了。
[0113] 可以理解的是,由于第二模型是关于待求数据参数的模型,当服务器确定出满足 预设策略的最优待求数据参数解时,该服务器就可以根据待求数据参数求解出资源配比 了。这样,服务器就可以通过预估模型找出业务产品的最优资源分配比例了。
[0114] S104、根据第二模型进行实际资源配比的处理。
[0115] 服务器得到实际运用于资源配比的第二模型之后,该服务器就可以通过该第二模 型实现实际资源配比的相关处理了。
[0116] 具体的,服务器得到实际资源配比之后,将业务产品按照各自对应的资源配比进 行资源的分配,由于该实际资源配比是满足预设策略最优的配比,因此,在业务产品按照上 述资源配比进行资源分配后,收益就可以实现最大化了。也就是说,本发明实施例是通过利 用各业务产品在长尾池中的历史指标数据,建立产品收益与获得分配的资源量之间的关系 (非线性关系)以及确定资源量比例的公式,使得按照该公式在近期历史上分配资源比例的 话(即假设历史可以重来),所获收益能够远远超出历史上的实际收入(最大化)。以后就按 该公式求得的资源配比做实际的资源比例分配。
[0117]实施例二
[0118] 本发明实施例提供了一种资源分配方法,如图5所示,该方法可以包括:
[0119] S201、获取第一历史数据,根据该第一历史数据建模得到第一预估模型,该第一预 估模型用于表征服务器为终端提供服务得到的反馈结果与资源的预测关系。
[0120] 需要说明的是,本发明实施例提供的一种资源分配的方法,主要是针对服务器提 供的平台上发布的业务产品的资源分配的方法。
[0121] 可以理解的是,由于通过服务器的平台发布的业务产品也越来越多了,目前,在平 台上,每天都存在大量的业务产品,由于用户使用这些业务产品使得这些业务产品为平台 带来了收益,因此,运营商通过合理分配资源给各业务产品,来达到收益最大化的目的。本 发明实施例提供的就是一种针对业务产品进行合理的资源分配的方案。
[0122] 本发明实施例的设计思想主要为:服务器根据平台上记录的业务产品对应的历史 数据设计一个资源分配算法,然后将该资源分配算法应用到后续的资源分配中,从而使得 平台收益最大化。
[0123] 具体的,服务器会通过平台记录的第一历史数据建模得到用于表征服务器为终端 提供服务得到的反馈结果与资源的预测关系的第一预估模型,即本发明实施例中,为了预 估计收益与资源的关系,该服务器通过平台的历史数据建模来实现第一预估计模型。
[0124] 可以理解的是,本发明实施例终端的反馈结果可以为收益。
[0125] 需要说明的是,本发明实施例中的第一历史数据是指业务产品的属性、业务产品 的上线天数(进入长尾池的天数)及业务产品的历史指标值等。其中,本发明实施例中的业 务产品的历史指标值是指曝光量、下载量、注册量、登录数、付费数、收益等。第一历史数据 用于表征业务产品被访问时自身的数据和用户反馈的访问数据。
[0126] 进一步地,在服务器获取第一历史数据之前,该服务器要先进行数据准备工作,即 记录长尾池中各业务产品每天的:产品类别、截止到当日的在长尾池中已运行天数(简称 "天数")、当日指标值(如曝光量、下载量、注册量、登录数、付费数、收益)等基于用户行为的 指标。这样,在服务器建立第一预估模型时,该服务器就可以统计或获取到所有的在线业务 产品的第一历史数据了。
[0127] 需要说明的是,本发明实施例中的第一历史数据指的是所有在线的业务产品的在 建模当天之前的历史数据。本发明实施例中的业务产品的历史指标值是指在建模当天之前 的η天里的指标值(即近期数据)。
[0128] 示例性的,服务器根据业务产品的属性C、业务产品的上线天数D、业务产品的历 史指标值P、建模得到表征资源E与收益r的预测关系的第一预估模型,例如,r = f(C,D,P, E)〇
[0129] 需要说明的是,在本发明实施例中,C、D、P都是可以获知的,因此,收益r只取决于 E,即改变每天的资源分配量,就会改变每天的收益。
[0130]需要说明的是,本发明实施例中的第一预估模型是非线性的,优选的,第一预估模 型可以为神经网络模型。这是由于神经网络模型的输出为连续值,这样,采用神经网络模型 的后续总收益的最优化的算法选型的可选范围更大,结果也比模型输出结果为离散值情况 更精确。其中,神经网络模型中的隐层单元数目可通过实验确定。
[0131] 具体的,假设服务器获取的业务产品A的第一历史数据如表1所示,业务产品的属 性Cu、业务产品的上线天数D^、业务产品的历史指标值、建模得到表征资源Ei与收益 Γι。 其中,Cu表示第j天第i个产品的类别,表示第j天第i个产品的进入长尾池的天数,Pinj表 示第j-Ι到第j-η天的第i个产品的指标值。假设n= 14时,假设业务产品的历史指标值为6个 指标,则占用84个字段,(^占用1个字段,占用1个字段,Ei占用1个字段,第一预估模型 的输入变量为84+1+1+1=87个(1=((^,0小?如上)),输出变量为1个 7=出)。
[0132] 因此,采用3层神经网络模型,其结构如图4所示。这里的隐层(中间层)输出值 hi,···,hP的计算公式为公式(1):
[0133]
⑴
[0134] 其中,b= 1,…,q,xm+i = 1(偏置项),f (X) = l/(l+e-x),wab是输入层第a个节点与隐 层第b个节点之间的连接权值。
[0135] 输出层y的计算为公式(2):
[0136]
(2)
[0137] 其中,其中仇是隐层第b个节点与输出层第k个节点之间的连接权值。
[0138] 需要说明的是,模型参数w(矩阵)、β(向量)的求解过程如下:
[0139] w(神经网络中输入层与隐层之间的连接权值):根据极限学习机的原理,w可取为 任意的随机值,例如位于[_1,1]之间的随机值。且一旦赋值,在后续的模型优化过程中就不 再变化。因此,不管模型的输入变量有多少,都不影响模型的可调参数总个数。
[0140] 超参数p :是神经网络的隐层节点数,也是整套算法中的唯一超参数,取得过小或 过大,都可能导致欠拟合或过拟合,只能通过实验确定一个最佳值。
[0141] 模型训练求β(神经网络中隐层与输出层之间的连接权值):按照极限学习机的原 理,归结为求一个Moore-Penrose广义逆就可。
[0142] 总之,求得β之后,神经网络模型(第一预估模型)就建立起来了。将来给定(C^, Di j,Pinj,Ei)值,就能求得η 了。
[0143] 需要说明的是,神经网络模型时一个业务产品一天的总收益与资源的预侧关系, 将所有产品的所有在线天数的收益与资源的关系求和就得到本发明是实施例中的第一预 估模型了。
[0144] S202、获取第二历史数据,根据该第二历史数据和第一预估模型建模得到第二预 估模型的过程中,持续检测基于该第二预估模型得到的数据输出结果是否满足预设策略, 该预设策略用于表征根据该第二预估模型得到的数据输出结果运用于资源配比时,对应获 得的服务器为终端提供服务得到的反馈结果高于历史阈值。
[0145]服务器建立第一预估模型之后,若想要预测的收益最大,则还需跟实际的历史总 收益比较,于是,该服务器获取第二历史数据,该第二历史数据用于表征业务产品被访问时 自身的数据、用户反馈的访问数据以及产生的收益(即历史总收益),由于根据第一预估模 型中的资源量是服务器不能直接获知的,因此,该服务器根据第二历史数据和第一预估模 型建模得到的第二预估模型中仍含有待求数据参数(即数据输出结果),该待求数据参数为 求解本发明实施例中的资源量的未知参数。由于服务器想要预测一个收益最大化的目标, 因此,服务器需要不断进行检测基于该第二预估模型得到的数据输出结果(待求数据参数) 是否满足预设策略,该预设策略用于表征根据该第二预估模型得到的数据输出结果运用 于资源配比时(利用数据输出结果可求得资源配比),对应获得的服务器为终端提供服务得 到的反馈结果高于历史阈值(通过资源配比求得业务产品的资源,从未求得反馈结果(收 益)),由于第二预估模型是一个不断优化训练的模型,服务器通过不断优化第二预估模型 直至找到数据输出结果对应的收益最大的模型。
[0146]需要说明的是,本发明实施例中的历史阈值指的是服务器获取到的历史总收益, 当然通过本发明实施例提供的预估模型预测到的收益比历史阈值越高越好,选择一个比历 史阈值最高的预测收益对应的数据输出结果就可以求出最优的实际的资源配比了。
[0147] S203、直至检测到基于第二预估模型得到的数据输出结果满足预设策略时,停止 对第二预估模型的建模,得到实际运用于资源配比的第二模型。
[0148] 当服务器检测到基于第二预估模型得到的数据输出结果满足预设策略时,说明这 时的数据输出结果就是我们需要的最优解,因此,该服务器停止对第二预估模型的优化,确 定了真正后面要用于求解资源配比的第二模型,该第二模型就是停止优化时的第二预估模 型了。
[0149] 可以理解的是,由于第二模型是关于待求数据参数的模型,当服务器确定出满足 预设策略的最优待求数据参数解时,该服务器就可以根据待求数据参数求解出资源配比 了。这样,服务器就可以通过预估模型找出业务产品的最优资源分配比例了。
[0150] S204、获取待处理的目标数据,根据第二模型对待处理的目标数据进行运算,得到 实际资源配比。
[0151]服务器得到实际运用于资源配比的第二模型之后,该服务器就可以通过该第二模 型实现实际资源配比的相关处理了。
[0152] 具体的,服务器得到实际资源配比之后,将业务产品按照各自对应的资源配比进 行资源的分配,由于该实际资源配比是满足预设策略最优的配比,因此,在业务产品按照上 述资源配比进行资源分配后,收益就可以实现最大化了。也就是说,本发明实施例是通过利 用各业务产品在长尾池中的历史指标数据,建立产品收益与获得分配的资源量之间的关 系(非线性关系)以及确定资源量比例的公式,使得按照该公式在近期历史上分配资源比例 的话(即假设历史可以重来),所获收益能够远远超出历史上的实际收入(最大化)。以后就 按该公式求得的资源配比做实际的资源比例分配。
[0153] 需要说明的是,待处理的目标数据可以为服务器从平台上获取的业务产品相关数 据,该服务器根据第二模型数据对业务产品进行运算,得到了该业务产品的实际资源配比, 该服务器就按照该资源配比对各业务产品分配资源了。
[0154] S205、经过预设时间后,获取更新后的第一历史数据和更新后的第二历史数据,根 据更新后的第一历史数据和所述更新后的第二历史数据对所述第二模型进行调整。
[0155] S206、根据调整后的第二模型进行实际资源配比的处理。
[0156] 需要说明的是,在进行一次建模获取最优的资源配比之后,随着时间推移、市场的 变化、用户偏好的缓慢蠕变,第二模型的效果可能逐渐降低,这时就需要服务器根据新的数 据,对构件第二模型的相关模型进行更新,使得其切合最新数据情况,保持收益不至于因为 模型本身的问题而降低。
[0157] 具体的,在预设时间后,服务器可以获取最新的历史数据代替第一历史数据和第 二历史数据,即对第一历史数据和第二历史数据进行更新,并根据更新后的第一历史数据 和所述更新后的第二历史数据对所述第二模型进行调整,最后,根据调整后的第二模型进 行实际资源配比的处理。
[0158] 实施例三
[0159] 本发明实施例提供了一种资源分配方法,如图6所示,该方法可以包括:
[0160] S301、获取待处理的目标数据对应的业务产品的属性、业务产品的上线天数、业务 产品的历史指标值。
[0161] S302、根据待处理的目标数据对应的业务产品的属性、业务产品的上线天数、业务 产品的历史指标值建模得到第一预估模型,该第一预估模型用于表征服务器为终端提供服 务得到的反馈结果与资源的预测关系。
[0162] 需要说明的是,本发明实施例提供的一种资源分配的方法,主要是针对服务器提 供的平台上发布的业务产品的资源分配的方法。
[0163] 可以理解的是,由于通过服务器的平台发布的业务产品也越来越多了,目前,在平 台上,每天都存在大量的业务产品,由于用户使用这些业务产品使得这些业务产品为平台 带来了收益,因此,运营商通过合理分配资源给各业务产品,来达到收益最大化的目的。本 发明实施例提供的就是一种针对业务产品进行合理的资源分配的方案。
[0164] 本发明实施例的设计思想主要为:服务器根据平台上记录的业务产品对应的历史 数据设计一个资源分配算法,然后将该资源分配算法应用到后续的资源分配中,从而使得 平台收益最大化。
[0165] 具体的,服务器会通过平台记录的第一历史数据(待处理的目标数据对应的业务 产品的属性、业务产品的上线天数、业务产品的历史指标值)建模得到用于表征服务器为终 端提供服务得到的反馈结果与资源的预测关系的第一预估模型,即本发明实施例中,为了 预估计收益与资源的关系,该服务器通过平台的历史数据建模来实现第一预估计模型。
[0166] 可以理解的是,本发明实施例终端的反馈结果可以为收益。
[0167] 需要说明的是,本发明实施例中的第一历史数据是指业务产品的属性、业务产品 的上线天数(进入长尾池的天数)及业务产品的历史指标值等。其中,本发明实施例中的业 务产品的历史指标值是指曝光量、下载量、注册量、登录数、付费数、收益等。
[0168] 进一步地,在服务器获取第一历史数据之前,该服务器要先进行数据准备工作,即 记录长尾池中各业务产品每天的:产品类别、截止到当日的在长尾池中已运行天数(简称 "天数")、当日指标值(如曝光量、下载量、注册量、登录数、付费数、收益)等基于用户行为的 指标。这样,在服务器建立第一预估模型时,该服务器就可以统计或获取到所有的在线业务 产品的第一历史数据了。
[0169] 需要说明的是,本发明实施例中的第一历史数据指的是所有在线的业务产品的在 建模当天之前的历史数据。本发明实施例中的业务产品的历史指标值是指在建模当天之前 的η天里的指标值(即近期数据)。
[0170] 示例性的,服务器根据业务产品的属性C、业务产品的上线天数D、业务产品的历史 指标值Ρ、建模得到表征资源Ε与收益r的预测关系的第一预估模型,例如,r = f(C,D,P,E)。
[0171] 需要说明的是,在本发明实施例中,C、D、P都是可以获知的,因此,收益r只取决于 E,即改变每天的资源分配量,就会改变每天的收益。
[0172]需要说明的是,本发明实施例中的第一预估模型是非线性的,优选的,第一预估模 型可以为神经网络模型。这是由于神经网络模型的输出为连续值,这样,采用神经网络模型 的后续总收益的最优化的算法选型的可选范围更大,结果也比模型输出结果为离散值情况 更精确。其中,神经网络模型中的隐层单元数目可通过实验确定。
[0173]具体的,假设服务器获取的业务产品A的第一历史数据如表1所示,业务产品的属 性Cu、业务产品的上线天数D^、业务产品的历史指标值、建模得到表征资源Ei与收益Γι。 其中,Cu表示第j天第i个产品的类别,表示第j天第i个产品的进入长尾池的天数,P inj表 示第j-Ι到第j-η天的第i个产品的指标值。假设n= 14时,假设业务产品的历史指标值为6个 指标,则占用84个字段,(^占用1个字段,占用1个字段,Ei占用1个字段,第一预估模型 的输入变量为84+1+1+1=87个(1=((^,0小?如上)),输出变量为1个 7=出)。
[0174]因此,采用3层神经网络模型,其结构如图4所示。这里的隐层(中间层)输出值 hi,···,hP的计算公式为公式(1):
[0175]
⑴
[0176] 其中,b= 1,…,q,xm+i = 1(偏置项),f (X) = l/(l+e-x),wab是输入层第a个节点与隐 层第b个节点之间的连接权值。
[0177] 输出层v的计筧为公式(2):
[0178]
(2 )
[0179]其中,其中仇是隐层第b个节点与输出层第k个节点之间的连接权值。
[0180]需要说明的是,模型参数w(矩阵)、β(向量)的求解过程如下:
[0181] w(神经网络中输入层与隐层之间的连接权值):根据极限学习机的原理,w可取为 任意的随机值,例如位于[_1,1]之间的随机值。且一旦赋值,在后续的模型优化过程中就不 再变化。因此,不管模型的输入变量有多少,都不影响模型的可调参数总个数。
[0182] 超参数p :是神经网络的隐层节点数,也是整套算法中的唯一超参数,取得过小或 过大,都可能导致欠拟合或过拟合,只能通过实验确定一个最佳值。
[0183] 模型训练求β(神经网络中隐层与输出层之间的连接权值):按照极限学习机的原 理,归结为求一个Moore-Penrose广义逆就可。
[0184] 总之,求得β之后,神经网络模型(第一预估模型)就建立起来了。将来给定(Cij, Di j,Pinj,Ei)值,就能求得η 了。
[0185] 需要说明的是,神经网络模型时一个业务产品一天的总收益与资源的预侧关系, 将所有产品的所有在线天数的收益与资源的关系求和就得到本发明是实施例中的第一预 估模型了。
[0186] S303、根据业务产品的属性、业务产品的上线天数及业务产品的历史指标值及预 设待求权值向量,建模得到第三预估模型,该第三预估模型用于表征资源配比与资源的预 测关系。
[0187] 需要说明的是,本发明实施例中的第三预估模型也是非线性模型,预设待求权值 向量为该非线性模型中带求解的未知参数。优选的,第三预估模型可以为神经网络模型,此 时,预设待求权值向量为实施例中的第一预估模型隐层与输出之间的连接权值,第三预估 模型中的其他参数的求解都与第一预估模型的原理一致。
[0188] 特别的,这里的资源与资源配比的关系是指各业务产品对应的资源。
[0189] 示例性的,服务器根据业务产品的属性C、业务产品的上线天数D、业务产品的历史 指标值P、建模得到表征资源E与资源配比e的预测关系的第三预估模型,例如,e = g(C,D,P, W),E = T*e = T*g(C,D,P,W)。其中,T为总资源量,W为预设待求权值向量。
[0190] S304、获取业务产品的历史总收益,根据业务产品的历史总收益、第三预估模型和 第一预估模型建模得到第二预估模型。
[0191]服务器建模得到表征资源配比与资源的预测关系第三预估模型之后,该服务器还 可以获取业务产品在建模之前的历史总收益(实际的历史真实总收益),于是,为了建立资 源配比与收益之间的关系,并且使得预测收益最大化,服务器根据业务产品的历史总收益、 第三预估模型和第一预估模型建模得到第二预估模型。
[0192] 示例性的,出=8((^,0小?_,1),即,某款产品根据其类型匕、天数0^当天之前的 η天里的指标值Ριη、确定对它的次日资源分配比例ei,其中W是该模型中的待求数据参数(待 求权值向量)。另外,记第j天的所有游戏的总资源量为L,则第i款产品该天获得的资源量 为 Ei = Tj*ei。
[0193] 假设服务器按照第二预估模型,对历史上长尾池里的业务产品重新分配资源比 例,贝希望获得的历史"收益"与历史真实收益的比值RevRise能达到最大,即公式(3):
[0194]
(3)
[0195] 其中,N表示截止到建模日历史上有统计指标数据的那些所有天,M」表示第j天长 尾池里的产品个数,Clj表示第j天第i个产品的类别,表示第j天第i个产品的进入长尾池 的天数,PW表示第j-Ι到第j-n天的第i个产品的指标值,R real为历史真实总收益。同时,还 要满足所有业务产品的资源配比之和要为1的条件,即公式(4)。
[0196]
⑷
[0197] 也就是说,服务器需要解决一个带N个等式约束的求函数最大值的优化问题,即需 要寻找最合适的W(待求数据参数),使得RevRise最大。
[0198] 为了便于建模和优化,可以将函数g()进行改写,如公式(5):
[0199]
(5)
[0200] 这样改写后的公式(5),满足公式(4)的约束条件,因此,公式(3)最终改写为公式 (6):
[0201]
( 6 )
[0202]也就是说,服务器根据第二历史数据、待求权值向量(待求数据参数)以及第一预 估模型和第三预估模型,建模第二预估模型。
[0203] S305、根据业务产品的历史总收益、第三预估模型和第一预估模型建模得到第二 预估模型的过程中,持续检测基于该第二预估模型得到的数据输出结果是否满足预设策 略,该预设策略用于表征根据第二预估模型得到的数据输出结果运用于资源配比时,对应 获得的服务器为终端提供服务得到的反馈结果高于历史阈值。
[0204] 服务器建立第一预估模型和第二预估模型之后,若想要预测的收益最大,则还需 跟实际的历史总收益比较,于是,该服务器获取第二历史数据(包括历史总收益),由于根据 第一预估模型中的资源量是服务器不能直接获知的,因此,该服务器根据第二历史数据、第 一预估模型和第三预估模型建模得到的第二预估模型中仍含有待求数据参数(即数据输出 结果),该待求数据参数为求解本发明实施例中的资源量的未知参数。由于服务器想要预测 一个收益最大化的目标,因此,服务器需要不断进行检测基于该第二预估模型得到的数据 输出结果(待求数据参数)是否满足预设策略,该预设策略用于表征根据该第二预估模型得 到的数据输出结果运用于资源配比时(利用数据输出结果可求得资源配比),对应获得的服 务器为终端提供服务得到的反馈结果高于历史阈值(通过资源配比求得业务产品的资源, 从未求得反馈结果(收益)),由于第二预估模型是一个不断优化训练的模型,服务器通过不 断优化第二预估模型直至找到数据输出结果对应的收益最大的模型。
[0205] 需要说明的是,本发明实施例中的历史阈值指的是服务器获取到的历史总收益, 当然通过本发明实施例提供的预估模型预测到的收益比历史阈值越高越好,选择一个比历 史阈值最高的预测收益对应的数据输出结果就可以求出最优的实际的资源配比了。
[0206] 示例性的,服务器在业务产品的历史总收益、第三预估模型和第一预估模型建模 得到第二预估模型的过程中,持续检测基于该第二预估模型得到的数据输出结果是否满足 预设策略,该预设策略用于表征根据第二预估模型得到的数据输出结果运用于资源配比 时,对应获得的服务器为终端提供服务得到的反馈结果高于历史阈值被改写为检测基于第 二预估模型得到的数据输出结果(待求权值向量或待求数据参数的函数S(W))最小即可。
[0207] S306、直至检测到基于第二预估模型得到的数据输出结果满足预设策略时,停止 对第二预估模型的建模,得到实际运用于资源配比的第二模型。
[0208] 当服务器检测到基于第二预估模型得到的数据输出结果满足预设策略时,说明这 时的数据输出结果就是我们需要的最优解,因此,该服务器停止对第二预估模型的优化,确 定了真正后面要用于求解资源配比的第二模型,该第二模型就是停止优化时的第二预估模 型了。
[0209] 可以理解的是,由于第二模型是关于待求数据参数的模型,当服务器确定出满足 预设策略的最优待求数据参数解时,该服务器就可以根据待求数据参数求解出资源配比 了。这样,服务器就可以通过预估模型找出业务产品的最优资源分配比例了。
[0210] 示例性的,服务器检测到基于第二预估模型得到的数据输出结果满足预设策略 时,得到实际运用于资源配比的第二模型,也就是对公式(6)进行最小值求解的过程,求出 关于W的解,将该W用于第三预估模型就可以得到实际资源配比。
[0211] 具体的,公式(6)的求解过程可以采用粒子群优化算法,也可以可采用其它启发式 直接搜索法的优化算法,例如:遗传算法、模拟退火、禁忌搜索、粒子群、蚁群、量子启发、差 分进化、人工免疫、贝叶斯优化等算法。
[0212] 举例来说,以采用粒子群优化算法求函数f(x)的最小值的过程具体为:
[0213] (1)、确定初始群体的位置;随机选择s个点U(1),…,x(s)},作为初始群体x (1) (0),…,x(s)(0)。
[0214] (2)、确定初始粒子的速度;
[0215]
[0216] (3)、初始化每个粒子的最好位置及全体粒子历史上的最好位置;
[0217] 设5^1)(〇)=叉(1)(〇),1 = 1,...,?,且记5^为{丫(1)(〇),...,5^)(〇)}中的;|^最小值对应 的那个(如果有多个相同的,取最小下标的那个)。同时,设t = 0。
[0218] (4)、确定新的粒子位置;
[0219]
[0220] (5)、对全体粒子进行估值;
[0221] For each i = l,· · ·,s,计算f(x(1)(t+l))
[0222] (6)、更新每个粒子的最佳位置,及全体粒子的最佳位置;
[0223](注:y(1)表示第i个粒子的历史上最佳的粒子,yg表示全局最佳的粒子)
[0224]
[0225]
[0226] (7)、检查迭代终止条件。
[0227] If t〈Tmax,then取t = t+l,返回(5);否则终止,最后得到的ySfji;是所求出的解。
[0228] S307、获取待处理的目标数据,根据该第二模型对待处理的目标数据进行运算,得 到实际资源配比。
[0229] 服务器得到实际运用于资源配比的第二模型之后,该服务器就可以通过该第二模 型实现实际资源配比的相关处理了。
[0230] 具体的,服务器得到实际资源配比之后,将业务产品按照各自对应的资源配比进 行资源的分配,由于该实际资源配比是满足预设策略最优的配比,因此,在业务产品按照上 述资源配比进行资源分配后,收益就可以实现最大化了。也就是说,本发明实施例是通过利 用各业务产品在长尾池中的历史指标数据,建立产品收益与获得分配的资源量之间的关系 (非线性关系)以及确定资源量比例的公式,使得按照该公式在近期历史上分配资源比例的 话(即假设历史可以重来),所获收益能够远远超出历史上的实际收入(最大化)。以后就按 该公式求得的资源配比做实际的资源比例分配。
[0231] 需要说明的是,待处理的目标数据可以为服务器从平台上获取的业务产品相关数 据,该服务器根据第二模型数据对业务产品进行运算,得到了该业务产品的实际资源配比, 该服务器就按照该资源配比对各业务产品分配资源了。
[0232] 进一步地,在一段时间之后,服务器可以通过获取新的历史数据对第二模型进行 更新,以保证收益最大化的持续。
[0233] 实施例四
[0234]如图7所示,本发明实施例提供了一种服务器1,该服务器1可以包括:
[0235] 获取单元10,用于获取第一历史数据,所述第一历史数据为与第一预估模型构建 相关的全量数据,所述第一历史数据用于表征业务产品被访问时自身的数据和用户反馈的 访问数据。
[0236] 建模单元11,用于根据获取单元10获取的所述第一历史数据建模得到第一预估模 型,所述第一预估模型用于表征服务器为终端提供服务得到的反馈结果与资源的预测关 系。
[0237] 所述获取单元10,还用于获取第二历史数据,所述第二历史数据为与第二预估模 型构建相关的近期增量数据,所述第二历史数据用于表征业务产品被访问时自身的数据、 用户反馈的访问数据以及产生的收益。
[0238] 检测单元12,还用于所述建模单元11根据所述获取单元10获取的所述第二历史数 据和所述第一预估模型建模得到第二预估模型的过程中,持续检测基于所述建模单元11建 立的所述第二预估模型得到的数据输出结果是否满足预设策略,所述预设策略用于表征根 据所述第二预估模型得到的数据输出结果运用于资源配比时,对应获得的所述服务器为终 端提供服务得到的反馈结果高于历史阈值。
[0239] 停止单元13,用于直至所述检测单元12检测到基于所述第二预估模型得到的数据 输出结果满足预设策略时,停止对第二预估模型的建模;以及,
[0240] 所述建模单元11,还用于得到实际运用于所述资源配比的第二模型。
[0241] 资源处理单元14,用于根据所述建模单元11得到的所述第二模型进行实际资源配 比的处理。
[0242] 可选的,所述获取单元10,还用于获取待处理的目标数据。
[0243] 资源处理单元14,具体用于根据所述建模单元11得到的所述第二模型对所述获取 单元10获取的所述待处理的目标数据进行运算,得到实际资源配比。
[0244] 可选的,所述获取单元10,具体用于获取所述待处理的目标数据对应的业务产品 的属性、业务产品的上线天数及业务产品的历史指标值。
[0245] 所述建模单元11,还用于根据所述获取单元10获取的所述业务产品的属性、所述 业务产品的上线天数及所述业务产品的历史指标值及预设待求权值向量,建模得到第三预 估模型,所述第三预估模型用于表征所述资源配比与资源的预测关系。
[0246] 所述获取单元10,还用于获取业务产品的历史总收益。
[0247] 所述建模单元11,具体用于根据所述获取单元10获取的所述业务产品的历史总收 益、所述第三预估模型和所述第一预估模型建模得到所述第二预估模型。
[0248] 可选的,如图8所示,所述服务器还包括:调整单元15。
[0249] 所述获取单元10,还用于所述资源处理单元14根据所述第二模型进行实际资源配 比的处理之后,经过预设时间后,获取更新后的第一历史数据和更新后的第二历史数据。
[0250] 所述调整单元15,用于根据所述获取单元10获取的所述更新后的第一历史数据和 所述更新后的第二历史数据对所述建模单元11得到的所述第二模型进行调整。
[0251] 所述资源处理单元14,还用于根据所述调整单元15调整后的所述第二模型进行实 际资源配比的处理。
[0252] 可选的,所述获取单元10,具体用于获取所述待处理的目标数据对应的所述业务 产品的属性、所述业务产品的上线天数及所述业务产品的历史指标值。
[0253] 所述建模单元11,具体用于根据所述获取单元10获取的所述待处理的目标数据对 应的所述业务产品的属性、所述业务产品的上线天数及所述业务产品的历史指标值建模得 到所述第一预估模型。
[0254] 如图9所示,在实际应用中,上述建模单元11、检测单元12、停止单元13、资源处理 单元14和调整单元15都可由位于服务器上的处理器16实现,具体为中央处理器(CPU)、微处 理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等实现,所述获取单元10可 由服务器的接收器17实现,该服务器还包括发送器18和存储器19,具体的,所述发送器18可 以发布新的在线业务产品的信息,第一历史数据及其软件代码、第一历史数据及其软件代 码、数据输出结果及其软件代码,第一预估模型及其软件代码、第二预估模型及其软件代 码、第三预估模型及其软件代码、第二模型及其软件代码,以及实际资源配比及其软件代 码、可以保存在存储器19中,该存储器19、发送器18、接收器17可以与处理器16连接,其中, 存储器19用于存储可执行程序代码,该程序代码包括计算机操作指令,存储器19可能包含 高速RAM存储器,也可能还包括非易失性存储器,例如,至少一个磁盘存储器。
[0255] 需要说明的是,本发明实施例中的服务器1和图2中的服务器41~4n为同一种设 备。
[0256] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形 式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储 介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0257] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流 程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序 指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产 生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实 现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0258] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0259] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机 或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。
[0260] 以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
【主权项】
1. 一种资源分配的方法,其特征在于,包括: 获取第一历史数据,根据所述第一历史数据建模得到第一预估模型,所述第一预估模 型用于表征服务器为终端提供服务得到的反馈结果与资源的预测关系;所述第一历史数据 为与第一预估模型构建相关的全量数据; 获取第二历史数据,根据所述第二历史数据和所述第一预估模型建模得到第二预估模 型的过程中,持续检测基于所述第二预估模型得到的数据输出结果是否满足预设策略,所 述预设策略用于表征根据所述第二预估模型得到的数据输出结果运用于资源配比时,对应 获得的所述服务器为终端提供服务得到的反馈结果高于历史阈值;所述第二历史数据为与 第二预估模型构建相关的近期增量数据; 直至检测到基于所述第二预估模型得到的数据输出结果满足预设策略时,停止对第二 预估模型的建模,得到实际运用于所述资源配比的第二模型; 根据所述第二模型进行实际资源配比的处理。2. 根据权利要求1所述的方法,其特征在于,所述根据所述第二模型进行实际的资源配 比处理,包括: 获取待处理的目标数据,根据所述第二模型对所述待处理的目标数据进行运算,得到 实际资源配比。3. 根据权利要求1所述的方法,其特征在于,所述获取第二历史数据,根据所述第二历 史数据和所述第一预估模型建模得到第二预估模型的过程,包括: 获取所述待处理的目标数据对应的业务产品的属性、业务产品的上线天数及业务产品 的历史指标值,根据所述业务产品的属性、所述业务产品的上线天数及所述业务产品的历 史指标值及预设待求权值向量,建模得到第三预估模型,所述第三预估模型用于表征所述 资源配比与资源的预测关系; 获取业务产品的历史总收益,根据所述业务产品的历史总收益、所述第三预估模型和 所述第一预估模型建模得到所述第二预估模型。4. 根据权利要求1或2所述的方法,其特征在于,所述根据所述第二模型进行实际资源 配比的处理之后,所述方法还包括: 经过预设时间后,获取更新后的第一历史数据和更新后的第二历史数据,根据所述更 新后的第一历史数据和所述更新后的第二历史数据对所述第二模型进行调整; 根据调整后的所述第二模型进行实际资源配比的处理。5. 根据权利要求1所述的方法,其特征在于,所述获取第一历史数据,根据所述第一历 史数据建模得到第一预估模型,包括: 获取所述待处理的目标数据对应的所述业务产品的属性、所述业务产品的上线天数及 所述业务产品的历史指标值及资源分配量,根据所述待处理的目标数据对应的所述业务产 品的属性、所述业务产品的上线天数及所述业务产品的历史指标值及资源分配量建模得到 所述第一预估模型。6. -种服务器,其特征在于,包括: 获取单元,用于获取第一历史数据,所述第一历史数据为与第一预估模型构建相关的 全量数据; 建模单元,用于根据获取单元获取的所述第一历史数据建模得到第一预估模型,所述 第一预估模型用于表征服务器为终端提供服务得到的反馈结果与资源的预测关系; 所述获取单元,还用于获取第二历史数据,所述第二历史数据为与第二预估模型构建 相关的近期增量数据; 检测单元,还用于所述建模单元根据所述获取单元获取的所述第二历史数据和所述第 一预估模型建模得到第二预估模型的过程中,持续检测基于所述建模单元建立的所述第二 预估模型得到的数据输出结果是否满足预设策略,所述预设策略用于表征根据所述第二预 估模型得到的数据输出结果运用于资源配比时,对应获得的所述服务器为终端提供服务得 到的反馈结果高于历史阈值; 停止单元,用于直至所述检测单元检测到基于所述第二预估模型得到的数据输出结果 满足预设策略时,停止对第二预估模型的建模,以及, 所述建模单元,还用于得到实际运用于所述资源配比的第二模型; 资源处理单元,用于根据所述建模单元得到的所述第二模型进行实际资源配比的处 理。7. 根据权利要求6所述的服务器,其特征在于, 所述获取单元,还用于获取待处理的目标数据; 资源处理单元,具体用于根据所述建模单元得到的所述第二模型对所述获取单元获取 的所述待处理的目标数据进行运算,得到实际资源配比。8. 根据权利要求6所述的服务器,其特征在于, 所述获取单元,具体用于获取所述待处理的目标数据对应的业务产品的属性、业务产 品的上线天数及业务产品的历史指标值; 所述建模单元,还用于根据所述获取单元获取的所述业务产品的属性、所述业务产品 的上线天数及所述业务产品的历史指标值及预设待求权值向量,建模得到第三预估模型, 所述第三预估模型用于表征所述资源配比与资源的预测关系; 所述获取单元,还用于获取业务产品的历史总收益; 所述建模单元,具体用于根据所述获取单元获取的所述业务产品的历史总收益、所述 第三预估模型和所述第一预估模型建模得到所述第二预估模型。9. 根据权利要求6或7所述的服务器,其特征在于,所述服务器还包括:调整单元; 所述获取单元,还用于所述资源处理单元根据所述第二模型进行实际资源配比的处理 之后,经过预设时间后,获取更新后的第一历史数据和更新后的第二历史数据; 所述调整单元,用于根据所述获取单元获取的所述更新后的第一历史数据和所述更新 后的第二历史数据对所述建模单元得到的所述第二模型进行调整; 所述资源处理单元,还用于根据所述调整单元调整后的所述第二模型进行实际资源配 比的处理。10. 根据权利要求6所述的服务器,其特征在于, 所述获取单元,具体用于获取所述待处理的目标数据对应的所述业务产品的属性、所 述业务产品的上线天数及所述业务产品的历史指标值; 所述建模单元,具体用于根据所述获取单元获取的所述待处理的目标数据对应的所述 业务产品的属性、所述业务产品的上线天数及所述业务产品的历史指标值建模得到所述第 一预估模型。
【文档编号】H04L12/26GK105897616SQ201610327386
【公开日】2016年8月24日
【申请日】2016年5月17日
【发明人】岳亚丁, 熊祎, 梁宇, 庄广安, 邱志勇
【申请人】腾讯科技(深圳)有限公司