利用参数估计的零售预估的制作方法
【专利摘要】一种系统生成多个变量的参数估计。所述系统接收包括用户接受准则和用户目标的输入数据。所述系统将输入数据编码为矩阵并利用对偶线性规划变换输入数据。所述系统然后使用利用装箱的变量的对偶单纯型法求解对偶线性规划,并恢复参数值以用于参数估计。参数估计可以用来提供零售预估。
【专利说明】利用参数估计的零售预估
【技术领域】
[0001]一个实施例一般针对计算机系统,并且具体针对使用参数估计的零售预估计算机系统。
【背景技术】
[0002]参数估计提供数据的有效利用和分析以帮助数学建模现象和出现在这些模型中的常量的估计。大部分参数估计可以涉及四个优化问题:(1)准则:用于优化(最小化或最大化)的最佳函数的选择;(2)估计:选择的函数的优化;(3)设计:获得最佳参数估计的最优设计;以及(4)建模:最佳描述用来测量数据的系统的数学模型的确定。
[0003]参数估计方法通常使用线性回归技术,也称为“最小二乘法”(“0LS”)。但是,此类方法已知不“健壮”,因为他们易受到数据中孤立点(outlier)的损坏。单个孤立数据点的添加可以显著地影响估计的参数的值。
【发明内容】
[0004]一个实施例是生成多个变量的参数估计的系统。系统接受包括用户接受准则和用户目标的输入数据。系统将输入数据编码成矩阵并且利用对偶线性规划变换输入数据。然后系统利用对偶单纯型法求解对偶线性规划以得到装箱的变量,并且恢复用于参数估计的参数值。参数估计可以用来提供零售预估。
【专利附图】
【附图说明】
[0005]图1是可以实施本发明的实施例的计算机系统的方框图。
[0006]图2是根据一个实施例的在生成零售参数估计时图1的零售参数估计模块的功能的流程图。
【具体实施方式】
[0007]—个实施例是用于零售建模和利用参数估计的预测的计算机系统。系统以诸如浮点阵列之类的密集矩阵格式存储输入数据,创建附加临时阵列以表示适当的对偶公式,并且利用修正的对偶单纯型法求解得到的特殊结构化的对偶线性规划以获得装箱的变量以达到期望的优化级别。结果是用于零售建模和预测的参数值。
[0008]参数估计方法可以使用于零售预估。例如,方法可以用于确定对于消费者产品的需求的价格弹性,诸如如果衬衫的价格降低20%,则销售将增加多少。如上所述的也称为“最小二乘法(“0LS”)的诸如线性回归之类的一些已知的参数估计方法,易受数据中孤立点的影响。其它已知方法包括“最大似然估计法”(“MLE”)。
[0009]此外,用户接受约束的并入(例如,当校准零售模型以预测由于促销的销售时,用户可以合理地预期模型将预测较高折扣导致较高销售,或与在报纸内页的广告相比较头版广告将驱使更多的销售)使得问题很难解决。一些现有技术解决方案仅仅丢弃不满足用户接受准则的此类模型。但是,这导致增加的预测误差。
[0010]此外,商业解决者通常仅仅优化与“吻合度”有关的单个度量,即使用户可以考虑多个准则。例如,用户可以对最小化用于一组预测的预测误差感兴趣,同时确保没有单个预测具有大于设置的阈值的误差。
[0011]线性规划(“LP”)已经用于参数估计问题,因为它已被显示生成相对不受数据孤立点影响的健壮答案。LP也允许用户接受约束的指定。但是,甚至最可扩展的已知LP实施方式也是太计算密集并且没有证明是完全实际的,特别是当被应用于直接/自然LP时,此类参数估计问题的编码涉及大量数据。
[0012]图1是可以实施本发明的实施例的计算机系统10的方框图。虽然显示为单个系统,但是系统10的功能可以被实施为分布式系统。系统10包括总线12或用于通信信息的其它通信机制,和用于处理信息的被耦接到总线12的处理器22。处理器22可以是任何类型一般或特定目的的处理器。系统10还包括用于存储信息和由处理器22运行的指令的存储器14。存储器14可以由随机存取存储器(“RAM”)、只读存储器(“ROM”)、诸如磁或光盘之类的静态存储器、或任何其它类型计算机可读的介质的任何组合组成。系统10还包括诸如网络接口卡之类的通信设备20以提供网络访问。因此,用户可以与系统10直接、或经由网络或任何其它方法远程对接。
[0013]计算机可读介质可以是可以由处理器22访问的任何可用介质,并且包括易失性和非易失性介质、可移除和非可移除介质、以及通信介质。通信介质可以包括计算机可读指令、数据结构、程序模块或诸如载波或其它传输机制之类的调制的数据信号中的其它数据,并且包括任何信息传输介质。
[0014]处理器22还经由总线12被耦接到诸如液晶显示器(“IXD”)之类的用于向用户显示信息的显示器24。键盘26和诸如电脑鼠标之类的光标控制设备28还被耦接到总线12以使得用户能够与系统10对接。
[0015]在一个实施例中,存储器14存储当由处理器22运行时提供功能的软件模块。模块包括提供用于系统10的操作系统功能的操作系统15。模块还包括使用参数估计来对零售进行定价、预测和建模的零售参数估计模块16,如下面更详细公开的。系统10可以属于诸如企业资源计划(“ERP”)系统之类的更大的系统。因此,系统10将通常包括一个或多个附加的功能模块18以包括附加的功能。数据库17被耦接到总线12以便为模块16和18提供集中的存储并且存储定价信息、库存信息,等等。
[0016]输入数据
[0017]一个实施例使用以下输入数据/标记:
[0018]m=要被同时估计预测模型(i=l,…,m)的参数的数目,其中m通常不多于30 ;
[0019]η=用于这些m个参数的每个的系数的历史观察量的数目(j=l,…,η),其中η通常非常大(I, 000, 000个观察量或更多);
[0020]a’ ^.=在观察量j中的参数i的观察系数;
[0021]Si=用于参数i的用户可接受的符号约束(这需要参数i取非负的或者非正的值);
[0022](Ii, Ui) =参数i的值的上界和下界;
[0023]Wj=观察量j的相对权重(重要性);
[0024]bf在观察量j中的因变量(目标)的RHS值,例如,销售提升、周销售率,等等;[0025]a i=对参数值i的惩罚,(保证将几乎没有预测力的参数截止);
[0026]Uack=对大于一个参数值的加权和施加联合(组合)限制的第k个用户接受约束。此约束如下表示:
[0027]XiClik^vali≥ek,其中,导出以下输出数据:
[0028](输出数据)Vali=参数i的值(其值将要被分析确定的决策变量),其跨所有观察量满足所有用户接受约束,同时最小化因变量的预测的值与观察的值之间的绝对误差和。
[0029]求解上述的传统方法是使用最小化由Min SjOvSiaij^vali)2给出的均方误差和的普通最小二乘法(“0LS”)。但是,在符号约束和其它用户接受约束的情况下,OLS失败。准规划(“QP”)问题不得不被求解,其往往在实际的性能和对于大η的响应需要方面失败,并且在其中误差的分布不类似钟形曲线的许多情况中可能不是健壮的估计器,并且因变量(或目标)的几个显著但畸变的观察量的存在可以干扰结果模型的实际预测力。
[0030]在倾向于避免这些上述问题的此类情况中的可替换方式是线性规划(“LP”)方法。具体地,最小化绝对偏差的和的LP方法可以是采样中间值的健壮的估计器。但是,此方法具有各种缺点,诸如:
[0031]?在LP中的误差最小化函数形式是不可微分且非平滑的,并且因此影响性能要求。
[0032].求解大型LP通常需要对所谓稀疏商业LP解决者(例如,来自于IBM公司的IBMILOG CPLEX优化器,或来自于 Gurobi公司的Gurobi优化)的投资。
[0033].即使诸如如上所述那些良好的商业解决者,如果没有提供正确的数学模型作为输入(存在几个可替换),则性能可以是不良的。
[0034]本发明的实施例利用高效LP公式用于经由三级变换序列导出的参数估计。实施例还使用以各种用户接受约束和误差最小化目标的形式的新颖度量和用户接受要求。实施例采用结果LP形成的特殊结构以显著地改善实际收敛。此外,实施例与加速解方法的经验收敛的快速排序子例程结合使用三态数据结构。
[0035]图2是根据一个实施例的在生成零售参数估计时图1的零售参数估计模块16的功能的流程图。在一个实施例中,由存储在存储器或其它计算机可读或有形介质中的软件执行、并由处理器运行图2的流程图的功能。在其它实施例中,可以由硬件(例如,通过使用特定用途集成电路(“ASIC”)、可编程门阵列(“PGA”)、现场可编程门阵列(“FPGA”)等等)、或硬件和软件的任何组合执行功能。
[0036]在202处,接收包括用户接受准则、用户目标和所考虑的观察量和变量的输入数据。用户接受准则可以包括用户关于模型应当如何表现的直觉、和硬约束(例如,降价将永不会导致减少销售)和软约束(例如,头版广告倾向于劣于后页广告)。
[0037]在一个实施例中,在202处的输入数据可以是以下形式:
[0038]?回归器系数矩阵(即,其元素表示元素a’ [][]的浮点二维阵列)。此输入通常是稀疏形式(即,没有非零的元素并且它们的位置被提供)。
[0039].以稀疏或密集形式的因变量的观察的值(b[])。
[0040]?利用布尔值、整数和浮点数值数据(符号约束,参数间约束、期望的偏离值以减少实际参数的数目)的组合以参数化形成提供的用户接受约束、和数值容差参数。
[0041].期望的误差最小化目标:最小化绝对偏差的和、最小化最大偏差、或最小化两个目标的组合。
[0042]在204处,以密集矩阵格式(即,利用标准的浮点阵列)编码输入数据。
[0043]在206处,创建并填充附加临时阵列以表示适当的对偶变量LP公式(下面详细公开的DP,DP2,或DP3),其最佳匹配在202处接收到的用户目标。
[0044]在208处,利用下面公开的用于装箱的变量的修正的对偶单纯型法求解得到的特殊结构化的对偶线性规划以达到期望的优化级别。在一个实施例中,也布置了分类方法以导出用于此结构的快速收敛。
[0045]在210处,基于求解的参数确定用户接受约束是否是可行的。如果用户接受约束在210处可行,则在212处从在206处确定的最优解中的最优对偶值恢复参数值。否则,没有解被返回,并且在214处生成不可实行的状态。
[0046]数学变换
[0047]在一个实施例中,经由三级变换变换标准的LP公式以生成三个新颖的对偶LP公式(被称为“DP”、“DP2”或“DP3”)中的一个。如结合在以上图2中公开的,输入数据应用于LP公式以生成输出。
[0048]变换步骤1:原始LP公式(最小化最小绝对偏差的加权和):
[0049]定义Vali=决策变量Yi
[0050]LAD:最小化
【权利要求】
1.一种在其上存储有指令的计算机可读介质,所述指令在由处理器执行时使得处理器执行多个变量的参数估计,所述指令包括: 接收输入数据,所述输入数据包括用户接受准则和用户目标; 将输入数据编码为矩阵; 使用对偶线性规划变换输入数据; 使用利用装箱的变量的对偶单纯型法求解对偶线性规划;以及 恢复参数值以用于参数估计。
2.如权利要求1所述的计算机可读介质,其中对偶线性规划包括:
dp:最大化
3.如权利要求1所述的计算机可读介质,其中对偶线性规划包括:
DP2:最大化.
4.如权利要求1所述的计算机可读介质,其中对偶线性规划包括:
DP3:最大化
5.如权利要求1所述的计算机可读介质,其中所述矩阵是密集形式。
6.如权利要求1所述的计算机可读介质,还包括: 对于能够从下界翻转到上界或从上界翻转到下界的每个变量,生成三态系数的阵列;以及 以比率的递增顺序对三态系数分类。
7.如权利要求1所述的计算机可读介质,其中求解对偶线性规划生成初步变量值和对偶变量值。
8.如权利要求1所述的计算机可读介质,其中参数估计提供零售预估。
9.一种多个变量的参数估计的计算机执行的方法,所述方法包括: 接收输入数据,所述输入数据包括用户接受要求和用户目标; 将输入数据编码为矩阵; 使用对偶线性规划变换输入数据; 使用利用装箱的变量的对偶单纯型法求解对偶线性规划;以及 恢复参数值以用于参数估计。
10.如权利要求9所述的计算机执行的方法,其中对偶线性规划包括:
sM DP:最大化 经历:
11.如权利要求9所述的计算机执行的方法,其中对偶线性规划包括: DP2:最大化念¥<
jIA-1 经历:
12.如权利要求9所述的计算机执行的方法,其中对偶线性规划包括: BK DP3:最大化ΣΜ.Τ;
/ IA.1 经历:
13.如权利要求9所述的计算机执行的方法,其中所述矩阵是密集形式。
14.如权利要求9所述的计算机执行的方法,还包括: 对于能够从下界翻转到上界或从上界翻转到下界的每个变量,生成三态系数的阵列;以及 以比率的递增顺序对三态系数分类。
15.如权利要求9所述的计算机执行的方法,其中求解对偶线性规划生成初步变量值和对偶变量值。
16.如权利要求9所述的计算机执行的方法,其中参数估计提供零售预估。
17.一种零售预估系统,包括: 处理器; 耦接到处理器并且存储指令的计算机可读介质; 其中指令在由处理器运行时,包括: 接收输入数据,所述输入数据包括用户接受准则和用户目标; 将输入数据编码为矩阵; 使用对偶线性规划变换输入数据; 使用利用装箱的变量的对偶单纯型法求解对偶线性规划;以及 恢复参数值以用于参数估计,所述参数值包括零售预估。
18.如权利要求17所述的系统,其中对偶线性规划包括: dp:最大化
19.如权利要求17所述的系统,其中对偶线性规划包括: DP2:最大化
20.如权利要求17所述的系统,其中对偶线性规划包括: DP3:最大化
【文档编号】G06F17/10GK103649942SQ201280031078
【公开日】2014年3月19日 申请日期:2012年5月30日 优先权日:2011年6月24日
【发明者】S·苏布拉马尼安, B·K·克利什南 申请人:甲骨文国际公司