使用收入加权的协同过滤器预测商品偏好的系统、方法和计算机程序产品的制作方法
【专利摘要】公开的实施例提供了一种系统、方法和计算机程序产品,用于识别更有可能被个体用户购买的消费品。在某些实施例中,协同过滤器可以用于根据商品与用户偏好匹配的程度对商品进行排序。所述协同过滤器可以是分层的,并且可以考虑多种因素。实例因素可以包括基于可观察特征的、商品之间的相似度、多个用户合计在线搜索行为的汇总、被确定为对个体用户最重要的商品特征以及基准商品,对照它测量出另一件商品被选择的条件概率。
【专利说明】使用收入加权的协同过滤器预测商品偏好的系统、方法和计算机程序产品
【技术领域】
[0001]一般来说,本公开涉及在市场中使用的协同过滤器。更确切地说,本文所公开的实施例涉及的系统、方法和计算机程序产品实施协同过滤器,用于识别一定的消费品。
【背景技术】
[0002]目前,为了服务商品相对低价(如包装杂货)、频繁消费(如电影租赁)、捆绑了其他商品(如买剃须刀的消费者也可能购买替换刀片),和/或商品之间的可度量相似性不大(如书籍)的市场,存在着协同过滤器。当消费者没有特别需要的商品的相关信息,或是不明白这样的信息时,消费者在协商中就处于严重的劣势。使这个问题加剧的是以下事实:由于各种因素,包括当地商品或商品特征的供求之间相互依赖,交易发生在商品生命周期中的时间点,以及多笔交易的彼此相互关系,消费者难以理解这些复杂的协商的交易。例如,卖方可能会牺牲一笔交易的一个方面的利润,但在对于同一个(或不同)消费者的另一笔交易中把这个利润赚回来。
[0003]对于涉及复杂交易的商品,目前可用的数据一般是一维的。举个特例来说,商品A的建议零售价(如$20,000)可能没有考虑这个价格是如何敏感(“对这件商品定价$19,000是好还是不好? ”),或在大约相同价位上比较商品A和B孰优孰劣。所以总有改进的余地。
【发明内容】
[0004]本文公开的实施例提供了一种系统、方法和计算机程序产品,用于识别更可能被个体用户购买的消费品。在某些实施例中,协同过滤器可以用于根据商品与用户偏好匹配的程度对商品进行排序。所述协同过滤器可以是分层的,并且可以考虑多种因素。实例因素可以包括基于可观察特征的、商品之间的相似度、多个用户合计在线搜索行为的汇总、被确定为对所述个体用户最重要的商品特征以及基准商品,对照它测量出另一件商品被选择的条件概率。实例可观察的特征包括但不限于价格、颜色、尺寸等。
[0005]在某些实施例中,识别更可能被个体用户购买的消费品的方法可以包括确定基于可观察特征的、商品之间的相似度。在某些实施例中,本文公开的协同过滤器可以包括多个软件组件,包括第一组件,用于确定基于可观察特征的、商品之间的相似度。在某些实施例中,所述过滤器的第一组件可以被设置为计算第一观察结果与第二观察结果之间的个体特征差异,计算第一观察结果与第二观察结果之间的复合相似度,以及对第一观察结果与第二观察结果的所有可能值重复这些计算。
[0006]在某些实施例中,识别更可能被个体用户购买的消费品的方法可以进一步包括合计多个用户的在线搜索或商品查询行为。在某些实施例中,本文公开的协同过滤器可以进一步包括第二组件,用于合计多个用户的在线搜索行为。所述过滤器的第二组件可以用多种方式实施。例如,在一个实施例中,所述第二组件可以被设置为仅对于搜索路径(商品发现序列)中每一“跳变”收集浏览商品频率。在另一个实施例中,所述第二组件可以被设置为仅对于搜索路径中全部“跳变”收集浏览商品频率。在又一个实施例中,所述第二组件可以被设置为仅对于搜索路径中所有成对商品收集浏览商品频率,而忽略其被搜索的顺序。
[0007]在某些实施例中,识别更可能被个体用户购买的消费品的方法可以进一步包括确定对于所述个体用户最重要的商品特征。新用户有可能表现出明显不同于其他用户的商品查询行为。本文公开的过滤器可以包括第三组件,通过新用户的商品查询行为确定对于所述个体用户可能最重要的特征。在某些实施例中应用了加权算法。当用户确定了其基准商品后,向每个特征分配的权重与用于计算商品之间的所述相似度的权重是相同的。可以试探性地确定初始特征权重。所述第一跳变后,当用户选择下一件商品时,所述基准商品与下一件商品中的特征进行对比以确定它们在多个维度中差异多大。这个过程可以持续到用户的商品查询终止。
[0008]根据所述单一跳变搜索行为,在商品查询日志历史中,对于每一个观察结果都可以存在着两件商品之间隐含的配对。当用户设置了基准商品后,本文公开的若干实施例可以用于预测用户可能的下一步行动。在某些实施例中,预测用户的商品偏好的方法可以包括以下内容:
[0009]-对于利用基准商品i的每个配对的观察结果,确定预期的下一件被选择的商品j。下一步,对于基准商品为i的一切情况,遍历全部其他观察结果以确定下一件被选择的商品t。
[0010]-对于商品i之后被选择的商品为t的每一种情况,对于给定半径计算内核K(dtt)
[0011]-确定用户在i之后将选择商品j的条件概率。这可以同时反映由总行为qu(h)加权的基于结构的、特点的相似度。在一个实施例中,其逆可以为du=l_Sij。
[0012]-对于每件商品t,给定基准商品i,有可能预测被选择的商品并与实际被选择的下一件商品对比,以及对不正确的预测结果分配惩罚值。假定基准商品i,预测的下一件商品选择为j,实际的下一件商品选择为k,那么惩罚值可以为:
[0013]j=k 时 Lj,k(i)=0
[0014]j 古 k 时 Lj,k (i) =max (Rk-Rj, O)
[0015]在这个实例中,Rk可以为销售一件商品k可能产生的收益。
[0016]-对于历史数据组中的每一个观察结果,都可以计算惩罚值,并且能够汇总对不正确预测的惩罚值之和L。
[0017]-预测误差受加权的相似度Sij驱动。因此改变权重Wp可以改变L的值。
[0018]-在一个实施例中,叶帕涅奇尼科夫内核可以取半径0.5。对于p=l,…,m特征,以选择的初始权重wP=l/m开始,可以使用多组权重确定使得总惩罚值L最小的权重组。
[0019]-能够运行M次迭代,每次迭代中分开的一组权重表示对上一次迭代的权重的小
扰动,约束为满足条件:
【权利要求】
1.一种计算机程序产品,包括至少一种非临时性的计算机可读介质,存储由至少一个处理器可翻译的指令,用于实施协同过滤器,所述协同过滤器包括: 第一组件,被配置为根据可观察的特征确定多件商品之间的相似度; 第二组件,被配置为合计多个用户的在线搜索行为;以及 第三组件,被配置为确定对于个体用户最重要的可观察的特征,其中,所述协同过滤器的第三组件应用基准商品及至少一个下一件商品的可观察的特征,在多个维度考察个体用户的商品查询行为,其中,所述基准商品由所述个体用户确定。
2.根据权利要求1的计算机程序产品,其中,所述协同过滤器的第一组件进一步被配置为: a)计算第一个观察结果与第二个观察结果之间的个体特征差异; b)计算第一个观察结果与第二个观察结果之间的复合相似度;以及 c)对第一个观察结果与第二个观察结果的全部可能值重复a)和b)。
3.根据权利要求1的计算机程序产品,其中,所述协同过滤器的第二组件进一步被配置为仅仅对于商品查询顺序中个体用户的每次跳变收集商品浏览频率。
4.根据权利要求1的计算机程序产品,其中,所述协同过滤器的第二组件进一步被配置为仅仅对于商品查询顺序中个体用户的全部跳变收集商品浏览频率。
5.根据权利要求1的计算机程序产品,其中,所述协同过滤器的第二组件进一步被配置为仅仅对于商品查询顺序中全部商品配对收集商品浏览频率。`
6.一种方法,用于识别更可能被个体用户购买的消费品,包括: 对于多件商品中的每件单个商品,确定个体用户将选择单个商品的概率,其中,根据以下指标确定所述概率: 基于可观察特征的、多件商品之间的相似度; 对多个用户合计在线搜索行为;以及 个体用户对基准商品的偏好,其中,所述基准商品由个体用户确定;以及 对多个商品被确定的概率,按递减顺序排序,其中,更有可能被个体用户购买的商品排在不大可能被个体用户购买的商品之前。
7.根据权利要求6的方法,进一步包括确定多件商品之间的相似度: a)计算第一个观察结果与第二个观察结果之间的个体特征差异; b)计算第一个观察结果与第二个观察结果之间的复合相似度;以及 c)对第一个观察结果与第二个观察结果的全部可能值重复a)和b)。
8.根据权利要求6的方法,进一步包括仅仅对于商品查询顺序中个体用户的每次跳变收集商品浏览频率。
9.根据权利要求6的方法,进一步包括仅仅对于商品查询顺序中个体用户的全部跳变收集商品浏览频率。
10.根据权利要求6的方法,进一步包括仅仅对于商品查询顺序中全部商品配对收集商品浏览频率。
11.根据权利要求6的方法,进一步包括: 对于与基准商品相关联的每个配对观察结果,确定预期被选择的第一下一件商品;以及考察与基准商品相关联的全部观察结果以确定预期被选择的第二下一件商品。
12.根据权利要求11的方法,进一步包括: 每次在基准商品后选择第二下一件商品时,对于给定半径定义内核。
13.根据权利要求11的方法,进一步包括: 确定个体用户在基准商品后将选择第一下一件商品的条件概率。
14.根据权利要求11的方法,进一步包括: 对个体用户将选择哪件下一件商品作出预测; 把预测结果与个体用户选择的实际下一件商品进行对比;以及 如果预测结果不正确那么向预测结果分配惩罚值。
15.根据权利要求14的方法,其中,所述预测结果是多个预测结果之一,进一步包括: 确定对于多个预测结果中全部不正确预测结果的总惩罚值;以及 确定一组权重,使得总惩罚值最小化。
16.—种系统,包括: 在计算机上运行以及协同工作以实施协同过滤器的第一软件组件、第二软件组件以及第三软件组件,其中: 第一软件组件被配置为根据可观察的特征确定多件商品之间的相似度; 第二软件组件被配置为合计 多个用户的在线搜索行为;以及 第三软件组件被配置为确定对于个体用户最重要的可观察的特征,其中,所述协同过滤器的第三组件应用基准商品及至少一个下一件商品的可观察的特征,在多个维度考察个体用户的商品查询行为,其中,所述基准商品由所述个体用户确定。
17.根据权利要求16的系统,其中,所述协同过滤器的第一软件组件进一步配置为: a)计算第一个观察结果与第二个观察结果之间的个体特征差异; b)计算第一个观察结果与第二个观察结果之间的复合相似度;以及 c)对第一个观察结果与第二个观察结果的全部可能值重复a)和b)。
18.根据权利要求16的系统,其中,所述协同过滤器的第二软件组件进一步被配置为仅仅对于商品查询顺序中个体用户的每次跳变收集商品浏览频率。
19.根据权利要求16的系统,其中,所述协同过滤器的第二软件组件进一步被配置为仅仅对于商品查询顺序中个体用户的全部跳变收集商品浏览频率。
20.根据权利要求16的系统,其中,所述协同过滤器的第二软件组件进一步被配置为仅仅对于商品查询顺序中个体用户的全部商品配对收集商品浏览频率。
【文档编号】G06Q10/04GK103782311SQ201280031076
【公开日】2014年5月7日 申请日期:2012年6月26日 优先权日:2011年6月30日
【发明者】T·J·沙利文, M·D·斯温桑 申请人:真车股份有限公司