一种基于K-means算法的用户聚类分析系统的制作方法

文档序号:8922967阅读:467来源:国知局
一种基于K-means算法的用户聚类分析系统的制作方法
【技术领域】
[0001]本发明涉及一种聚类分析技术领域,特别是涉及一种基于κ-means算法的用户聚类分析系统。
【背景技术】
[0002]自IBM公司于2008年提出“智慧地球”概念以来,作为其中的一个重要部分一一“智慧旅游”引起了国内广泛的关注。之后国家政策的扶持以及互联网的发展,使得新兴的在线旅游市场发展势头迅猛。根据劲旅咨询最新发布《2013年中国在线旅游市场研宄报告》,2013年中国旅游市场总交易额约为29475亿元,其中在线旅行市场交易额约为2522亿元,中国旅游市场在线渗透率为8.6%。
[0003]人们面对着大量的数据,却往往无法找到需要的信息,信息爆炸使得如何有效地利用和处理大量的数据成为当今世界共同关心的问题。随着数据库技术、人工智能、数理统计和云计算等技术的发展,数据挖掘技术在各行各业得到了迅速应用。
[0004]从技术角度来讲,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中人们事先不知道但又是潜在有用的信息和知识的过程;从商业角度来讲,数据挖掘是一种新的商业信息处理技术,其主要特点是对数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取有利于商业决策的关键信息和知识。
[0005]随着智能终端的普及、在线旅游市场的发展和旅游监管部门及景区的信息化,监管部门、景区和其它机构积攒了大量的数据,为数据挖掘技术的引入提供了充分的条件。
[0006]目前的旅游信息管理系统在基础数据统计、监测方面发挥了重要作用,却并未实现对隐藏知识的充分挖掘;从海量的数据中进行用户聚类分析,挖掘其中蕴含的巨大价值,成为目前亟待解决的问题之一。数据挖掘技术在旅游市场的应用,将使得现代旅游成为充满便捷、人性化、以及蕴含巨大经济市场的智慧旅游。

【发明内容】

[0007]本发明的目的是为了提升对具体旅游数据进行有效挖掘的能力,提供一种基于K-means算法的用户聚类分析系统。
[0008]本发明所采用的技术方案是:
[0009]本发明通过实时数据采集、实时分析技术,实时统计分析用户喜好,通过归属省份的分析,分析旅游用户的来源地特征,并基于用户特征数据,通过多维度的聚类,建立旅游消费行为的用户画像,进行精细化的营销。
[0010]I)旅游用户用餐偏好分析
[0011]通过菜系种类、餐厅等级、用餐区域、平均花费、就餐人数等等维度进行聚类分析,分析不同地域不同游客群的特征情况。
[0012]2)旅游用户住宿偏好分析
[0013]通过旅社星级、价格水准、旅社类型、位置区域等维度,分析用户群的特征,从而进行个性化的服务或推荐。
[0014]3)旅游用户消费偏好分析
[0015]通过电子商务平台的购买及浏览记录、住宿及用餐的消费额及比例、驻留时间等信息,对用户消费偏好进行聚类分析,了解游客群特征,提升服务质量和个性化体验。
[0016]基于K-means算法的用户聚类分析方法,
[0017]a、随机选取K个数据作为中心点,
[0018]b、然后计算每一个样本i与中心点的距离,选取最小的目标中心点即为所属的类,
[0019]C、对应每一个类,重新计算中心(该类别中所有样本的均值),
[0020]d、重复迭代b、c步骤直至收敛,即聚类中心不再变化。
[0021]本发明的有益效果是,
[0022]基于K-means算法的用户聚类分析系统,可以实现对旅游用户的喜好的聚类分析,建立旅游消费行为的用户画像,进行精细化营销。
【具体实施方式】
[0023]为了加深对本发明的理解,下面结合实施例对本发明作进一步详细的说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
[0024]本发明的具体实施例是,
[0025]本发明通过实时数据采集、实时分析技术,实时统计分析用户喜好,通过归属省份的分析,分析旅游用户的来源地特征,并基于用户特征数据,通过多维度的聚类,建立旅游消费行为的用户画像,进行精细化的营销。
[0026]I)旅游用户用餐偏好分析
[0027]通过菜系种类、餐厅等级、用餐区域、平均花费、就餐人数等等维度进行聚类分析,分析不同地域不同游客群的特征情况。
[0028]2)旅游用户住宿偏好分析
[0029]通过旅社星级、价格水准、旅社类型、位置区域等维度,分析用户群的特征,从而进行个性化的服务或推荐。
[0030]3)旅游用户消费偏好分析
[0031]通过电子商务平台的购买及浏览记录、住宿及用餐的消费额及比例、驻留时间等信息,对用户消费偏好进行聚类分析,了解游客群特征,提升服务质量和个性化体验。
[0032]基于K-means算法的用户聚类分析方法,
[0033]a、随机选取K个数据作为中心点,
[0034]b、然后计算每一个样本i与中心点的距离,选取最小的目标中心点即为所属的类,
[0035]C、对应每一个类,重新计算中心(该类别中所有样本的均值),
[0036]d、重复迭代b、c步骤直至收敛,即聚类中心不再变化。
[0037]要说明的是,以上所述实施例是对本发明技术方案的说明而非限制,所属技术领域普通技术人员的等同替换或者根据现有技术而做的其他修改,只要没超出本发明技术方案的思路和范围,均应包含在本发明所要求的权利范围之内。
【主权项】
1.一种基于κ-means算法的用户聚类分析系统,其特征在于:包括 旅游用户用餐偏好分析 通过菜系种类、餐厅等级、用餐区域、平均花费、就餐人数等等维度进行聚类分析,分析不同地域不同游客群的特征情况; 旅游用户住宿偏好分析 通过旅社星级、价格水准、旅社类型、位置区域等维度,分析用户群的特征,从而进行个性化的服务或推荐; 旅游用户消费偏好分析 通过电子商务平台的购买及浏览记录、住宿及用餐的消费额及比例、驻留时间等信息,对用户消费偏好进行聚类分析,了解游客群特征,提升服务质量和个性化体验。
【专利摘要】本发明公开了一种基于K-means算法的用户聚类分析系统,旅游用户用餐偏好分析,通过菜系种类、餐厅等级、用餐区域、平均花费、就餐人数等等维度进行聚类分析,分析不同地域不同游客群的特征情况;旅游用户住宿偏好分析,通过旅社星级、价格水准、旅社类型、位置区域等维度,分析用户群的特征,从而进行个性化的服务或推荐;旅游用户消费偏好分析,通过电子商务平台的购买及浏览记录、住宿及用餐的消费额及比例、驻留时间等信息,对用户消费偏好进行聚类分析,了解游客群特征,提升服务质量和个性化体验。本发明可以实现对旅游用户的喜好的聚类分析,建立旅游消费行为的用户画像,进行精细化营销。
【IPC分类】G06Q50/14, G06K9/62
【公开号】CN104899602
【申请号】CN201510296227
【发明人】陈勇, 胡中骥
【申请人】江苏马上游科技股份有限公司
【公开日】2015年9月9日
【申请日】2015年6月3日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1