用户行为分析的方法
【技术领域】
[0001]本发明涉及信息技术,特别涉及用户行为分析的方法。
【背景技术】
[0002]用户行为分析在电子商务、智能营销等领域广泛应用,是收集用户的控制动作信息,分析用户在使用资源时表现出来的规律、个性化的习惯,并生成用户偏好信息。
[0003]智能电视的问世,改变了用户观看电视节目的传统,实现让用户通过移动端(手机、平板等)观看电视的功能。大数据对用户使用移动端产生的行为属性进行了采集和存储,利用大数据对用户行为进行分析,提取用户兴趣,了解其特点,一方面可以进行用户个性化定制和推送,另一方面可以优化完善移动端APP界面组织,提升界面交互能力,使用户操作更加简洁。
【发明内容】
[0004]本发明要解决的技术问题是:提供一种用户行为分析的方法,获取用户行为数据,并对用户进行分析,将分析结果展示给商家。
[0005]为解决上述问题,本发明采用的技术方案是:用户行为分析的方法,包括如下步骤:
[0006]a.采集用户的行为数据,并上传给数据处理系统;
[0007]b.数据处理系统对上传的行为数据进行处理;
[0008]c.周期性地从数据处理系统中抽取数据,并存储到数据仓库系统;
[0009]d.依据数据仓库系统中的存储数据确定用户的行为分析维度,并依据所述行为分析维度在数据库管理系统中建立数据库模型;
[0010]e.从数据仓库系统中抽取出目标数据,对目标数据进行清洗和转换,将清洗和转换后的数据进行汇总分析,并将汇总分析后的结果数据加载到数据库管理系统的对应数据表中;
[0011]f.将所述结果数据进行各类图形展示。
[0012]进一步的,步骤a中所述行为数据包括用户点播的内容及格式。
[0013]进一步的,步骤a中的行为数据以json格式上传给数据处理系统。
[0014]进一步的,步骤d中数据仓库系统的存储数据包括节目类型、节目名称、观看记录数、观看人数。
[0015]进一步的,在进行抽取目标数据时,以数据上报到的时间作为分区字段抽取数据。
[0016]进一步的,步骤e中的清洗指:剔除不完整的数据、卖场机以及测试机上报的干扰数据。
[0017]本发明的有益效果是:通过定期获取用户行为,经过清洗、转换、汇总分析后,最终按照预先定义好的数据库模型把汇总分析好的结果数据加载到对应表中去,商家能够有效精准的用户推送,优化移动端APP界面组织,提升用户体验,增加移动端APP及电视的使用量。
【附图说明】
[0018]图1为实施例方法的流程图
【具体实施方式】
[0019]下面结合附图和实施例对本发明进一步说明。
[0020]用户在点播过程中,行为数据量大,且用户喜好电视节目具有近期有效性,如一部电影,从上映到后续一段时间内受到用户关注度较大,我们在分析这类数据的时候不需要全量扫描所有行为数据,因此数据仓库系统可以选用hive。hive是一种基于Hadoop的数据仓库系统,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,同时hive的分区存储机制大大节省数据扫描分析时间。
[0021]本发明选用kafka对行为数据进行处理,kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据,具有如下特性通过0(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能高吞吐量:即使是非常普通的硬件kafka也可以支持每秒数十万的消息;ii1.支持通过kafka服务器和消费机集群来分区消息;iv.支持Hadoop并行数据加载。
[0022]数据库管理系统选用mysql,mysql具有用于存储不同数据的数据表,不同数据的数据表可以方便的存储不同数据,且还兼具体积小、速度快、总体拥有成本低、开放源码的特点。
[0023]如图1所示,本发明具体实现步骤如下:
[0024]1.采集用户点播的内容、格式等行为数据,并将行为数据以以json格式上传给kafka ο其中,行为数据以json格式传送到kafka进行处理,json作为一种轻量级的数据格式,具有传输效率高的特点。
[0025]2.kafka对行为数据进行处理;
[0026]3.每天定时地从kafka中抽取数据,并加载到hive中。
[0027]4.依据hive中的节目类型、节目名称、观看记录数、观看人数等数据,确定用户的行为分析维度,并依据所述行为分析维度在mysql中建立数据仓库模型。
[0028]5.从hive中抽取出目标数据,并对目标数据进行清洗、转换。
[0029]在进行抽取目标数据时,我们可以数据上报到的时间p_log_date作为分区字段,抽取有效时间内用户行为数据,提高数据清洗分析效率。
[0030]上述清洗指剔除不完整的数据、卖场机以及测试机上报的干扰数据,以保证最后用户行为分析结果的准确性。清洗的具体步骤为:根据给卖场机用户机打的标记,剔除isprototype = ' Γ or isprototype = ’ true’代表的卖场机数据;测试机可根据电视软件版本排除,以及用IP定位,通过IP地址剔除公司(企业)内部测试机。
[0031]6.将清洗和转换后的数据进行汇总分析,并将汇总分析后的结果数据加载到数据库管理系统的对应数据表中。
[0032]7.对结果数据进行各类图形展示。可直观看出近段时间(近一个月),每个节目类型下的节目观看排行情况,供业务查看及进行深度分析。商家根据深度分析的结果能够有效、精准地进行用户推送,优化移动端APP界面组织,提升用户体验,增加移动端APP及电视的使用量。
[0033]本发明通过对数据的精准分析,准确定位用户喜好,方便用户使用,提升用户体验,增加移动端APP及电视的使用量。
[0034]以上描述了本发明的基本原理和主要的特征,说明书的描述只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
【主权项】
1.用户行为分析的方法,其特征在于,包括如下步骤: a.采集用户的行为数据,并上传给数据处理系统; b.数据处理系统对上传的行为数据进行处理; c.周期性地从数据处理系统中抽取数据,并存储到数据仓库系统; d.依据数据仓库系统中的存储数据确定用户的行为分析维度,并依据所述行为分析维度在数据库管理系统中建立数据库模型; e.从数据仓库系统中抽取出目标数据,对目标数据进行清洗和转换,将清洗和转换后的数据进行汇总分析,并将汇总分析后的结果数据加载到数据库管理系统的对应数据表中; f.将所述结果数据进行各类图形展示。2.根据权利要求1所述的用户行为分析的方法,其特征在于,步骤a中所述行为数据包括用户点播的内容及格式。3.根据权利要求1所述的用户行为分析的方法,其特征在于,步骤a中的行为数据以json格式上传给数据处理系统。4.根据权利要求1所述的用户行为分析的方法,其特征在于,步骤d中数据仓库系统的存储数据包括节目类型、节目名称、观看记录数、观看人数。5.根据权利要求1所述的用户行为分析的方法,其特征在于,步骤e中,在进行抽取目标数据时,以数据上报到的时间作为分区字段抽取数据。6.根据权利要求1所述的用户行为分析的方法,其特征在于,步骤e中的清洗指:剔除不完整的数据、卖场机以及测试机上报的干扰数据。
【专利摘要】本发明涉及信息技术领域,提供一种用户行为分析的方法,获取用户行为数据,并对用户进行分析,将分析结果展示给商家。本方法包括:采集用户的行为数据,并上传给数据处理系统;数据处理系统对上传的行为数据进行处理;周期性地从数据处理系统中抽取数据,并存储到数据仓库系统;依据数据仓库系统中的存储数据确定用户的行为分析维度,并依据所述行为分析维度在数据库管理系统中建立数据库模型;从数据仓库系统中抽取出目标数据,对目标数据进行清洗和转换,将清洗和转换后的数据进行汇总分析,并将汇总分析后的结果数据加载到数据库管理系统的对应数据表中;将所述结果数据进行各类图形展示。发明适用于智能电视。
【IPC分类】G06F17/30
【公开号】CN105426478
【申请号】CN201510797227
【发明人】滕娜娜, 杜科, 唐军, 梁敏, 罗弦, 漆尧, 唐永瑞
【申请人】四川长虹电器股份有限公司
【公开日】2016年3月23日
【申请日】2015年11月18日