一种基于可视聚类对消费地点进行混合推荐的方法
【技术领域】
[0001] 本发明涉及消费地点推荐,尤其涉及存在大量信用卡消费记录的情况下,充分挖 掘消费者在某些消费地点的偏好倾向,使用混合推荐方法,从多角度为消费者推荐最可能 感兴趣的其它消费地点。
【背景技术】
[0002] 推荐系统已应用到包括搜索引擎、电子商务、信息检索、社会网络服务、新闻传媒 等在内的许多领域。当前的推荐技术主要包括:基于内容推荐、协同过滤推荐和基于关联规 则推荐。但这些方法都存在许多缺点:基于内容的推荐即根据消费者已有消费记录为其推 荐与之前选择类似的消费地点,这种方法只能为消费者提供其以前感兴趣的地点,不能发 现消费者以后会感兴趣的地点;协同过滤的推荐即为消费者提供与其消费特征类似的他人 所选择的消费地点,这种推荐方法缺乏个性化;基于关联规则的推荐没有考虑关联规则中 各个项的先后次序,而消费者的消费有着严格的先后次序。
[0003] 传统的数据挖掘技术和算法让用户难以理解和使用,而且不能以用户为驱动进行 交互。可视化使数据和挖掘结果更容易理解,允许对结果进行比较和检验,也用于指导数据 挖掘算法,使用户参与到决策分析的过程中。可视化数据挖掘技术建立在可视化和分析过 程的基础上,它以刻画结构和显示数据的功能性,以及人类感知模式、例外、倾向和关系的 能力为基础,用可视化来加强数据挖掘处理过程。
[0004] 目前,因其便利通用、可透支信用额度的特点,信用卡消费成为许多人的消费首 选。随着计算机水平的飞速发展,对信用卡消费记录进行采集与保存的方法已经十分完善。 合理分析信用卡消费记录能够发现用户的消费特征与模式,抓住用户的倾向性消费心理, 提高用户类别识别的准确度,对相似消费特征的地点进行统计,为用户提供更加个性化的 推荐服务,这成为银行、信用卡公司及商场、超市等消费场所进一步提升企业服务水平的必 然要求。
【发明内容】
[0005] 本发明的主要目的是针对各类推荐方法都存在各自优缺点的情况,提出一种包括 基于内容的推荐和协同过滤推荐的混合推荐方法,基于雷达图可视聚类的方法,以用户可 参与交互的方式,为对消费者进行消费地点的个性化推荐。
[0006] 本发明的设计思路为:基于雷达图可视聚类的方法,将消费地点、消费者映射到雷 达图中,在选择合适维度的情况下,类似的消费地点、消费者会因其相近的消费模式而聚集 在一起,用户可以选择标记参与交互,从而为消费者推荐与其之前所选消费地点消费特征 类似的其它地点、与此消费者消费模式类似的其他消费者所选择的地点。
[0007] -种基于可视聚类对消费地点进行混合推荐的方法,包含以下步骤:
[0008] 步骤1):对信用卡消费记录进行数据的预处理,得到包括消费者、消费地点、消费 时间和消费金额字段的消费基本信息表Basic_Inf〇r_Tab和消费者已消费地点集合P ;
[0009] 步骤2):根据步骤1)得到的消费基本信息表Basic_Inf〇r_Tab,对消费地点进行 RadViz可视聚类,得到消费特征类似的消费地点聚类;
[0010] 步骤3):根据步骤2)得到的消费地点聚类,对消费者进行RadViz可视聚类,得到 消费模式相近的消费者聚类;
[0011] 步骤4):根据步骤2)得到的消费地点聚类进行基于内容的推荐,根据步骤3) 得到的消费者聚类进行协同过滤推荐,将得到的消费地点,添加到对应消费地点推荐列表 中;
[0012] 步骤5):根据步骤4)建立的消费者消费地点推荐列表RecommencLList,对消费地 点按出现次数进行排序,然后将出现次数最多的N个消费地点推荐给消费者,即完成对消 费者进行个性化消费地点的推荐。
[0013] 所述步骤1)包括以下步骤:
[0014] 步骤1. 1):根据信用卡交易记录建立消费基本信息表Basic_Infor_Tab,用来描 述某消费者在何时何地进行多少消费金额的消费,即该表包括消费者、消费地点、消费时 间、消费金额字段;
[0015] 步骤1. 2):对每一消费者创建相应已消费地点集合P,从步骤1. 1)所得消费基本 信息表中选取该消费者所在行中的消费地点,并将其加入集合P ;
[0016] 步骤1. 3):根据步骤1. 1)建立的消费基本信息表,计算相关统计信息,包括消费 次数Count、消费金额平均值Avg、消费金额最大值Max和消费金额最小值Min ;
[0017] 所述步骤2)对消费地点的RadViz可视聚类的具体步骤如下:
[0018] 步骤2. 1):选取消费时间或统计信息作为维度锚点,将其均匀分布在RadViz圆 周;
[0019] 步骤2. 2):对消费地点进行可视化,消费地点会因维度锚点对其产生的弹簧拉力 而在雷达图中确定其最终位置;
[0020] 步骤2. 3):类似消费地点将因相似的消费特征而在RadViz中聚集在一起,所述 某地点的消费特征指在该消费地点的消费发生的时间、消费的金额和消费者,根据自适应 K-Means算法对RadViz圆环内地点进行初始聚类,首先,设置初始聚类个数K=U反],其中X 为消费基本信息表Basic_Infor_Tab中消费地点个数,同时,设置迭代次数In= 1,聚类内 记录个数限制Nummin= 3,最多迭代次数I _= 100 ;其次,在RadViz中随机选定K个记录 点作为聚类中心Center;,使用K-Means算法产生K个初始聚类Q,i = 1,2,· · ·,K ;然 后判断每个聚类中记录个数Nunii是否小于类内记录个数限制Nummin,若Νιιη^< Nummin,则取 消该类的中心Center;,K = K-1,迭代次数In= I n+l,重新使用K-Means方法对RadViz进 行聚类,若每个聚类中记录个数Numi都大于Num_或迭代次数I n>最多迭代次数1_,则完 成初始聚类;
[0021] 步骤2. 4):对步骤2. 3)中的初始聚类个数K、聚类内记录个数限制Num_、最多迭 代次数1_进行调整,直到得到聚类半径小于聚类间质心距离,聚类半径为聚类^的质心到 边缘记录的最大值的最终聚类结果为止,其中初始聚类个数K的调整范围为大于0不大于 X的整数,聚类内记录个数限制Num_的调整范围为大于0的整数,最多迭代次数I _的调 整范围为大于0的整数。
[0022] 最终聚类结果中的不同聚类由用户框选,并用不同颜色来区分不同聚类内的地点 以便于用户肉眼识别,由于RadViz可视聚类是可视化的聚类,通过选框和不同颜色这两种 手段,就可以让用户清楚方便的看到并识别出不同聚类。
[0023] 所述步骤3)对消费者的RadViz可视聚类具体步骤如下:
[0024] 步骤3. 1):根据步骤2)对消费地点聚类的结果,选择一个或两个聚类中的地点作 为雷达图RadViz维度锚点,均匀分布在RadViz圆周;
[0025] 步骤3. 2):对消费者进行可视化,消费者会因维度锚点对其产生的弹簧力而在雷 达图中确定其最终位置;
[0026] 步骤3. 3):类似消费者将因相似的消费模式而在RadViz中聚集在一起,所述消费 者的消费模式指在该消费者在进行消费时的消费时间、消费金额和消费地点,根据自适应 K-Means算法对RadViz圆环内地点进行初始聚类,首先,设置初始聚类个数其中X 为消费基本信息表Basic_Infor_Tab中消费地点个数,同时设置迭代次数In= 1,聚类内记 录个数限制Nummin= 3 ;其次,在RadViz中随机选定K个记录点作为聚类中心Center ;,使 用K-Means算法产生K个初始聚类Q,i = 1,2,· · ·,K ;然后判断每个聚类中记录个数 Nunii是否小于类内记录个数限制Nummin,若NumK Nummin,则取消该类的中心Center;,K = K-1,迭代次数In= I n+l,重新使用K-Means方法对RadViz进行聚类,若每个聚类中记录个 数Nunii都大于Num min或迭代次数In>最多迭代次数I _,则完成初始聚类;
[0027] 步骤3. 4):对步骤3. 3)中的初始聚类个数K、聚类内记录个数限制Nummin、最多迭 代次数1_进行调整,直到得到聚类半径小于聚类间质心距离,聚类半径为聚类^的质心到 边缘记录的最大值的最终聚类结果为止,其中初始聚类个数K的调整范围为大于0不大于 X的整数,聚类内记录个数限制Num_的调整范围为大于0的整数,最多迭代次数I _的调 整范围为大于0的整数。
[0028] 最终聚类结果中的不同聚类由用户框选,并用不同颜色来区分不同聚类内的地点 以便于用户肉眼识别,由于RadViz可视聚类是可视化的聚类,通过选框和不同颜色这两种 手段,就可以让用户清楚方便的看到并识别出不同聚类。
[0029] 所述步骤4)中基于内容的推荐方法和协同过滤的推荐方法发现消费地点的具体 步骤如下:
[0030] 步骤4. 1):对于步骤1.2)集合P即某消费者以前消费过的地点中的每一地点Pi, 根据步骤2)对消费地点的RadViz可视聚类,将Pi所在聚类中的其它地