一种基于可视聚类对消费地点进行混合推荐的方法

文档序号：9598339阅读：379来源：国知局

一种基于可视聚类对消费地点进行混合推荐的方法
【技术领域】
[0001] 本发明涉及消费地点推荐，尤其涉及存在大量信用卡消费记录的情况下，充分挖掘消费者在某些消费地点的偏好倾向，使用混合推荐方法，从多角度为消费者推荐最可能感兴趣的其它消费地点。
【背景技术】
[0002] 推荐系统已应用到包括搜索引擎、电子商务、信息检索、社会网络服务、新闻传媒等在内的许多领域。当前的推荐技术主要包括：基于内容推荐、协同过滤推荐和基于关联规则推荐。但这些方法都存在许多缺点：基于内容的推荐即根据消费者已有消费记录为其推荐与之前选择类似的消费地点，这种方法只能为消费者提供其以前感兴趣的地点，不能发现消费者以后会感兴趣的地点；协同过滤的推荐即为消费者提供与其消费特征类似的他人所选择的消费地点，这种推荐方法缺乏个性化；基于关联规则的推荐没有考虑关联规则中各个项的先后次序，而消费者的消费有着严格的先后次序。
[0003] 传统的数据挖掘技术和算法让用户难以理解和使用，而且不能以用户为驱动进行交互。可视化使数据和挖掘结果更容易理解，允许对结果进行比较和检验，也用于指导数据挖掘算法，使用户参与到决策分析的过程中。可视化数据挖掘技术建立在可视化和分析过程的基础上，它以刻画结构和显示数据的功能性，以及人类感知模式、例外、倾向和关系的能力为基础，用可视化来加强数据挖掘处理过程。
[0004] 目前，因其便利通用、可透支信用额度的特点，信用卡消费成为许多人的消费首选。随着计算机水平的飞速发展，对信用卡消费记录进行采集与保存的方法已经十分完善。合理分析信用卡消费记录能够发现用户的消费特征与模式，抓住用户的倾向性消费心理，提高用户类别识别的准确度，对相似消费特征的地点进行统计，为用户提供更加个性化的推荐服务，这成为银行、信用卡公司及商场、超市等消费场所进一步提升企业服务水平的必然要求。

【发明内容】

[0005] 本发明的主要目的是针对各类推荐方法都存在各自优缺点的情况，提出一种包括基于内容的推荐和协同过滤推荐的混合推荐方法，基于雷达图可视聚类的方法，以用户可参与交互的方式，为对消费者进行消费地点的个性化推荐。
[0006] 本发明的设计思路为：基于雷达图可视聚类的方法，将消费地点、消费者映射到雷达图中，在选择合适维度的情况下，类似的消费地点、消费者会因其相近的消费模式而聚集在一起，用户可以选择标记参与交互，从而为消费者推荐与其之前所选消费地点消费特征类似的其它地点、与此消费者消费模式类似的其他消费者所选择的地点。
[0007] -种基于可视聚类对消费地点进行混合推荐的方法，包含以下步骤：
[0008] 步骤1):对信用卡消费记录进行数据的预处理，得到包括消费者、消费地点、消费时间和消费金额字段的消费基本信息表Basic_Inf〇r_Tab和消费者已消费地点集合P ;
[0009] 步骤2):根据步骤1)得到的消费基本信息表Basic_Inf〇r_Tab，对消费地点进行 RadViz可视聚类，得到消费特征类似的消费地点聚类；
[0010] 步骤3):根据步骤2)得到的消费地点聚类，对消费者进行RadViz可视聚类，得到消费模式相近的消费者聚类；
[0011] 步骤4):根据步骤2)得到的消费地点聚类进行基于内容的推荐，根据步骤3) 得到的消费者聚类进行协同过滤推荐，将得到的消费地点，添加到对应消费地点推荐列表中；
[0012] 步骤5):根据步骤4)建立的消费者消费地点推荐列表RecommencLList，对消费地点按出现次数进行排序，然后将出现次数最多的N个消费地点推荐给消费者，即完成对消费者进行个性化消费地点的推荐。
[0013] 所述步骤1)包括以下步骤：
[0014] 步骤1. 1):根据信用卡交易记录建立消费基本信息表Basic_Infor_Tab，用来描述某消费者在何时何地进行多少消费金额的消费，即该表包括消费者、消费地点、消费时间、消费金额字段；
[0015] 步骤1. 2):对每一消费者创建相应已消费地点集合P，从步骤1. 1)所得消费基本信息表中选取该消费者所在行中的消费地点，并将其加入集合P ;
[0016] 步骤1. 3):根据步骤1. 1)建立的消费基本信息表，计算相关统计信息，包括消费次数Count、消费金额平均值Avg、消费金额最大值Max和消费金额最小值Min ;
[0017] 所述步骤2)对消费地点的RadViz可视聚类的具体步骤如下：
[0018] 步骤2. 1):选取消费时间或统计信息作为维度锚点，将其均匀分布在RadViz圆周；
[0019] 步骤2. 2):对消费地点进行可视化，消费地点会因维度锚点对其产生的弹簧拉力而在雷达图中确定其最终位置；
[0020] 步骤2. 3):类似消费地点将因相似的消费特征而在RadViz中聚集在一起，所述某地点的消费特征指在该消费地点的消费发生的时间、消费的金额和消费者，根据自适应 K-Means算法对RadViz圆环内地点进行初始聚类，首先，设置初始聚类个数K=U反]，其中X 为消费基本信息表Basic_Infor_Tab中消费地点个数，同时，设置迭代次数In= 1，聚类内记录个数限制Nummin= 3，最多迭代次数I _= 100 ;其次，在RadViz中随机选定K个记录点作为聚类中心Center;，使用K-Means算法产生K个初始聚类Q，i = 1，2，· · ·，K ;然后判断每个聚类中记录个数Nunii是否小于类内记录个数限制Nummin，若Νιιη^< Nummin，则取消该类的中心Center;，K = K-1，迭代次数In= I n+l，重新使用K-Means方法对RadViz进行聚类，若每个聚类中记录个数Numi都大于Num_或迭代次数I n>最多迭代次数1_，则完成初始聚类；
[0021] 步骤2. 4):对步骤2. 3)中的初始聚类个数K、聚类内记录个数限制Num_、最多迭代次数1_进行调整，直到得到聚类半径小于聚类间质心距离，聚类半径为聚类^的质心到边缘记录的最大值的最终聚类结果为止，其中初始聚类个数K的调整范围为大于0不大于 X的整数，聚类内记录个数限制Num_的调整范围为大于0的整数，最多迭代次数I _的调整范围为大于0的整数。
[0022] 最终聚类结果中的不同聚类由用户框选，并用不同颜色来区分不同聚类内的地点以便于用户肉眼识别，由于RadViz可视聚类是可视化的聚类，通过选框和不同颜色这两种手段，就可以让用户清楚方便的看到并识别出不同聚类。
[0023] 所述步骤3)对消费者的RadViz可视聚类具体步骤如下：
[0024] 步骤3. 1):根据步骤2)对消费地点聚类的结果，选择一个或两个聚类中的地点作为雷达图RadViz维度锚点，均匀分布在RadViz圆周；
[0025] 步骤3. 2):对消费者进行可视化，消费者会因维度锚点对其产生的弹簧力而在雷达图中确定其最终位置；
[0026] 步骤3. 3):类似消费者将因相似的消费模式而在RadViz中聚集在一起，所述消费者的消费模式指在该消费者在进行消费时的消费时间、消费金额和消费地点，根据自适应 K-Means算法对RadViz圆环内地点进行初始聚类，首先，设置初始聚类个数其中X 为消费基本信息表Basic_Infor_Tab中消费地点个数，同时设置迭代次数In= 1，聚类内记录个数限制Nummin= 3 ;其次，在RadViz中随机选定K个记录点作为聚类中心Center ;，使用K-Means算法产生K个初始聚类Q，i = 1，2，· · ·，K ;然后判断每个聚类中记录个数 Nunii是否小于类内记录个数限制Nummin，若NumK Nummin，则取消该类的中心Center;，K = K-1，迭代次数In= I n+l，重新使用K-Means方法对RadViz进行聚类，若每个聚类中记录个数Nunii都大于Num min或迭代次数In>最多迭代次数I _，则完成初始聚类；
[0027] 步骤3. 4):对步骤3. 3)中的初始聚类个数K、聚类内记录个数限制Nummin、最多迭代次数1_进行调整，直到得到聚类半径小于聚类间质心距离，聚类半径为聚类^的质心到边缘记录的最大值的最终聚类结果为止，其中初始聚类个数K的调整范围为大于0不大于 X的整数，聚类内记录个数限制Num_的调整范围为大于0的整数，最多迭代次数I _的调整范围为大于0的整数。
[0028] 最终聚类结果中的不同聚类由用户框选，并用不同颜色来区分不同聚类内的地点以便于用户肉眼识别，由于RadViz可视聚类是可视化的聚类，通过选框和不同颜色这两种手段，就可以让用户清楚方便的看到并识别出不同聚类。
[0029] 所述步骤4)中基于内容的推荐方法和协同过滤的推荐方法发现消费地点的具体步骤如下：
[0030] 步骤4. 1):对于步骤1.2)集合P即某消费者以前消费过的地点中的每一地点Pi，根据步骤2)对消费地点的RadViz可视聚类，将Pi所在聚类中的其它地

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周芳芳;黄伟;赵颖;樊晓平;吴青;章杰;
技术所有人：中南大学;
我是此专利的发明人

上一篇：一种识别机器操作行为的方法及装置的制造方法
上一篇：应用于电子商务平台的信用评估系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。