一种面向垂直电子商务网站的首页推荐方法

文档序号:6352673阅读:182来源:国知局
专利名称:一种面向垂直电子商务网站的首页推荐方法
技术领域
本发明属于个性化推荐领域,对垂直电子网站的新用户进行首页推荐。推荐的方 法是通过JavMcript脚本采集用户的“访问带入信息”,再结合“访问带入信息——下单产 品信息”相关度矩阵计算该用户和每件产品的相关度,推荐相关度最高的N件产品。
背景技术
随着电子商务的不断发展,商品种类和个数快速增长,往往用户需要花费很长时 间才能找到自己喜欢的商品。为了提高用户的满意度,减少在浏览查找过程中的用户流失 问题,个性化推荐方法应运而生。目前个性化推荐系统主要采用的方法是内容过滤和协同过滤推荐。内容过滤通过 采集用户以前的浏览信息,购买信息,推荐给用户相似内容的产品。协同过滤通过采集或者 计算得到用户的评分信息,分为基于用户的协同过滤和基于产品的协同过滤两种。基于用 户的协同过滤根据评分信息计算相似用户,推荐相似用户购买过的产品。基于产品的协同 过滤根据评分信息计算和用户购买过的产品相似的产品推荐给用户。但是内容过滤和协同 过滤都存在新用户问题,对没有任何历史数据的新用户难以进行有效推荐。新用户推荐可以通过要求用户注册时填入个人信息(年龄,性别,职业,爱好等)或 对用户进行问卷调查得到相关数据再进行推荐,但是这两种方法由于需要额外的用户操 作,用户体验较差,常常造成用户的流失。

发明内容
本发明所要解决的技术问题是提出面向垂直电子商务网站新用户的首页推荐方 法,垂直电子商务网站旗下的商品都是同一类型的商品,垂直电子商务的用户中新用户的 比例很高,很多新用户是在下单购买时才注册登录。一个垂直电子商务网站的新用户既没 有历史行为信息数据(历史评分,浏览,购买等行为),大部分情况也没有人口统计信息数据 (年龄,性别,职业),所以传统的推荐方法难以满足这个特殊场景的需要。本发明的技术方案为一种针对垂直电子商务网站的首页推荐方法。通过 JavaScript脚本采集用户的“访问带入信息”和“下单产品信息”。根据历史数据计算“访 问带入信息”各维度和“下单产品信息”各维度的相关度。当一个新用户访问网站首页时, 根据该用户的“访问带入信息”和通过历史数据得到的相关度计算得到该用户和所有产品 的相关度,推荐相关度最高的N件产品。—种面向垂直电子商务网站新用户的首页推荐方法,其特征是具体步骤如下
1)通过JavMcript脚本采集用户“访问带入信息”和“下单产品信息”,建立历史数据 库;(“访问带入信息”包括用户的地域信息,访问时间信息,浏览器信息,操作系统信息,系 统语言信息,访问方式信息以及可能有的搜索关键词信息等;“下单产品信息”包括产品颜 色,款式,价格,材料,品牌等)
2)对“访问带入信息”和“下单产品信息”进行预处理;把每个用户的“访问带入信息“处理为一组关键字的集合,”下单产品信息“处理为另一组关键字的集合,这两组关键字共 同构成一条记录,存进历史数据库;
3)根据历史数据库中的所有记录计算“访问带入信息”各维度和“下单产品信息”各维 度的相关度,得到“访问带入信息——下单产品信息”相关度矩阵;“访问带入信息”和“下单 产品信息”的每个维度代表一个关键字,相关度矩阵是一个m X η的二维矩阵,m代表“访 问带入信息”的维度数,η代表“下单产品信息”的维度数;
4)当一个新用户访问网站首页时,通过JavMcript脚本得到该用户的“访问带入信 息”,并处理为一组关键字的集合;
5)如果该用户的“访问带入信息”中包含搜索的关键词,根据历史数据库,用搜索的关 键词和产品信息的特征关键字做匹配,匹配的目的是把产品集由全部产品约减为符合该用 户搜索关键词的产品的集合;如果不包含搜索的关键字,则直接进入步骤(6);
6)根据该用户的“访问带入信息”和由历史数据库得到的相关度矩阵计算该用户和产 品集中每件产品的相关度,将所有产品按相关度由大到小排序,想该用户推荐相关度最高 的前N件产品。本发明的有益效果是本发明能够适用于垂直电子商务网站的新用户既没有历史 行为信息数据(历史评分,浏览,购买等行为),大部分情况也没有人口统计信息数据等殊场 景的需要。垂直电子商务网站旗下的商品都是同一类型的商品,垂直电子商务的用户中新 用户的比例很高,本发明方法是有益的。


图1是针对垂直电子商务网站的首页推荐方法的流程图。
具体实施例方式参阅图1,本发明通过采集新用户的“访问带入信息”来解决新用户没有任何数据 的问题,并结合由历史数据训练得到的“访问带入信息——下单产品信息”的相关度矩阵来 计算新用户和产品集中产品的相关度,推荐相关度最高的N件产品。其具体步骤如下
1)通过Jav必cript脚本采集用户“访问带入信息”和“下单产品信息”,建立历史数 据库。“访问带入信息,,包括用户的地域信息(如中国-江苏-南京),访问时间信息(如 2010-12-1 08:00),浏览器信息(如IE 6. 0),操作系统信息(如Win32),系统语言信息 (如English),访问方式信息(如通过Google搜索访问)以及可能有的搜索关键词信息 等。“下单产品信息”包括产品颜色,款式,价格,材料,品牌等; “访问带入信息”可以通过以下JavMcript脚本采集得到 var χ = navigator; var Name=x. appName ; // 浏览器
var Version= parseFloat (χ. appVersion) ; // 浏览器片反本 var Platform=X. platform;// i^i^M^i
var SystemLanguage=X. systemLanguage x. systemLanguage:χ. language;// 系统语
var Refer=encodeURIComponent(encodeURIComponent(document, referrer));// 访问方式
var Str=new Date();
var Date=Str. getTime () ;// 时|1]
var country=geoip_country_name () ; // 国家
var region=geoip_region_name () ; // 地区
var city=geoip_city () ;// 城市
“下单产品信息”可以通过查询数据库中的产品信息表得到。
2)对“访问带入信息”和“下单产品信息”进行预处理;把每个用户的“访问带入信息 “处理为一组关键字的集合,”下单产品信息“处理为另一组关键字的集合,这两组关键字共 同构成一条记录,存进历史数据库;
比如预处理后历史数据库中的一条记录为
访问带入信息(江苏,南京,12月,上午,IE, Win32, English, Google,眼镜) 下单产品信息(黑色,太阳镜,100-150元,塑料,宝姿)
3)计算“访问带入信息”各维度和“下单产品信息”各维度的相关度,得到“访问带入信 息——下单产品信息”相关度矩阵;“访问带入信息”和“下单产品信息”的每个维度代表一 个关键字,相关度矩阵是一个m X η的二维矩阵,m代表“访问带入信息”的维度数,η代表 “下单产品信息”的维度数;
相关度矩阵的计算方法如下
假设“访问带入信息”有m个维度,“下单产品信息”有η个维度,相关度矩阵为A(m, η)。Ai, j代表“访问带入信息”第i个维度和“下单产品信息”第j个维度的相关度。历史 数据库中共有N条记录,每条记录由“访问带入信息”和“下单产品信息”组成。Ai,」的计 算方法是
—包含“访问带入信息”第i佛度且包含“下机口口信息”第j个维戲记纖 w包含η方问带入信息”第己雜
4)当一个新用户访问网站首页时,通过JavMcript脚本得到该用户的“访问带入信 息”并处理为一组关键字的集合;
采集方法同步骤(1)。5)如果该用户的“访问带入信息”中包含搜索的关键字,用搜索的关键字和产品信 息做匹配,把产品集由全部产品约减为符合该用户搜索关键字的产品的集合;如果不包含 搜索关键字,则直接进入步骤(6)。如场景是一个笔记本在线销售网站,用户搜索的是“联 想笔记本”,通过将搜索关键字和产品信息做匹配,把产品集由全部笔记本约减为所有的联 想品牌的笔记本。6)根据该用户的“访问带入信息”和由历史数据库得到的相关度矩阵计算该用户 和产品集中每件产品的相关度,将所有产品按相关度由大到小排序,想该用户推荐相关度 最高的前N件产品。相关度计算方法如下
假设“访问带入信息——下单产品信息”相关度矩阵是A(m,η),当前用户的“访问带 入信息”用长度为m的向量U表示。如果当前用户的“访问带入信息”包含“访问带入信息”的第i个维度,Ui= 1;否则Ui= 0。产品集中的某件产品用长度为η的向量V表示。如果 该产品的“产品信息”包含“下单产品信息”的第i个维度,Vi = 1 ;否则Vi = 0。则当前用 户和该产品的相关度计算方法为 相关度=UXAXVt0
权利要求
1.一种面向垂直电子商务网站的首页推荐方法,其特征是通过脚本(如JavMcript) 采集用户的“访问带入信息”和“下单产品信息”;根据历史数据计算“访问带入信息”各维 度和“下单产品信息”各维度的相关度作为推荐基础;当一个新用户访问网站首页时,根据 该用户的“访问带入信息”和通过历史数据得到的相关度矩阵计算得到该用户和所有产品 的相关度,推荐相关度最高的N件产品。
2.根据权利要求1所述的一种面向垂直电子商务网站新用户的首页推荐方法,其特征 是具体步骤如下1)通过JavMcript脚本采集用户“访问带入信息”和“下单产品信息”,建立历史数据 库;“访问带入信息”包括用户的地域信息,访问时间信息,浏览器信息,操作系统信息,系统 语言信息,访问方式信息以及可能有的搜索关键词信息等;“下单产品信息”包括产品颜色, 款式,价格,材料,品牌等2)对“访问带入信息”和“下单产品信息”进行预处理;把每个用户的“访问带入信息 “处理为一组关键字的集合,”下单产品信息“处理为另一组关键字的集合,这两组关键字共 同构成一条记录,存进历史数据库;3)根据历史数据库中的所有记录计算“访问带入信息”各维度和“下单产品信息”各维 度的相关度,得到“访问带入信息——下单产品信息”相关度矩阵;“访问带入信息”和“下单 产品信息”的每个维度代表一个关键字,相关度矩阵是一个m X η的二维矩阵,m代表“访 问带入信息”的维度数,η代表“下单产品信息”的维度数;4)当一个新用户访问网站首页时,通过JavMcript脚本得到该用户的“访问带入信 息”,并处理为一组关键字的集合;5)如果该用户的“访问带入信息”中包含搜索的关键词,根据历史数据库,用搜索的关 键词和产品信息的特征关键字做匹配,匹配的目的是把产品集由全部产品约减为符合该用 户搜索关键词的产品的集合;如果不包含搜索的关键字,则直接进入步骤(6);6)根据该用户的“访问带入信息”和由历史数据库得到的相关度矩阵计算该用户和产 品集中每件产品的相关度,将所有产品按相关度由大到小排序,想该用户推荐相关度最高 的前N件产品。
3.根据权利要求2所述的面向垂直电子商务网站的首页推荐方法,其特征是计算相关 度矩阵的计算方法如下假设“访问带入信息”有m个维度,“下单产品信息”有η个维度,相关度矩阵为A (m, η) j代表“访问带入信息”第i个维度和“下单产品信息”第j个维度的相关度;历史数 据库中共有N条记录,每条记录由“访问带入信息”和“下单产品信息”组成」的计算 方法是
全文摘要
面向垂直电子商务网站的首页推荐方法,通过脚本(如JavaScript)采集用户的“访问带入信息”和“下单产品信息”;根据历史数据计算“访问带入信息”各维度和“下单产品信息”各维度的相关度作为推荐基础;当一个新用户访问网站首页时,根据该用户的“访问带入信息”和通过历史数据得到的相关度矩阵计算得到该用户和所有产品的相关度,推荐相关度最高的N件产品。本发明能够适用于垂直电子商务网站的新用户既没有历史行为信息数据(历史评分,浏览,购买等行为),大部分情况也没有人口统计信息数据等殊场景的需要。垂直电子商务网站旗下的商品都是同一类型的商品,垂直电子商务的用户中新用户的比例很高,本发明方法是有益的。
文档编号G06F17/30GK102073717SQ20111000213
公开日2011年5月25日 申请日期2011年1月7日 优先权日2011年1月7日
发明者刘嘉, 惠成峰, 祁奇, 陈振宇 申请人:南京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1