1.基于海量跨屏收视行为数据的直播推荐方法,其特征在于,包括以下步骤:
(1)设置终端数据采集模块、HDFS分布式存储模块、ETL模块、推荐模块、WEB应用模块;
(2)终端数据采集模块用于采集用户在多媒体信息播放终端的收视行为数据,并将所采集的数据转发给HDFS分布式存储模块负责存储;
(3)HDFS分布式存储模块除了负责存储用户收视行为数据,还负责存储其他第三方系统异构数据;
(4)ETL模块负责从HDFS分布式存储模块对所存储的用户收视行为数据进行提取、转换和加载,并为推荐模块提供基础元素数据;
(5)推荐模块包括策略处理模块、算法处理模块、线下推荐结果、线上推荐结果、内容-特征推荐结果数据;
(6)WEB应用模块为终端内嵌的web应用程序,用于推荐请求和推荐内容的展示。
2.根据权利要求1的基于海量跨屏收视行为数据的直播推荐方法,其特征在于,所述多媒体信息播放终端包括DVB STB、OTT、智能电视、手机、平板电脑。
3.根据权利要求1的基于海量跨屏收视行为数据的直播推荐方法,其特征在于,所述其他第三方系统异构数据为PV、UV这些页面浏览数据。
4.根据权利要求1的基于海量跨屏收视行为数据的直播推荐方法,其特征在于,所述推荐模块中的策略处理模块用于为算法处理模块提供基础数据,由用户标签、内容标签、用户画像三部分组成;内容标签定义了用户所收看节目的节目类型、所属地区、节目状态、情感类型这些属性;用户标签定义了用户的个人属性、社会属性、消费行为属性、爱好偏向属性、收视行为属性;用户画像通过内容标签和用户标签的数据整合,标记了用户的标签模型视图,由此勾勒用户的整体轮廓和兴趣偏好。
5.根据权利要求1的基于海量跨屏收视行为数据的直播推荐方法,其特征在于,所述推荐模块中的算法处理模块所采用的推荐算法主要使用协同过滤、用户相似度计算、节目相似度计算、聚类算法、关联规则、统计,在自然语言处理上,使用分词、索引、关键词和舆情相关的算法、基于时间序列的预测,GBDT+LR的排序算法框架,实现基于用户画像的个性化推荐。
6.根据权利要求1的基于海量跨屏收视行为数据的直播推荐方法,其特征在于,所述推荐模块中的线下推荐结果是将用户特征属性、内容特征属性和业务规则相结合,融合推荐算法形成的线下推荐结果集。
7.根据权利要求1的基于海量跨屏收视行为数据的直播推荐方法,其特征在于,所述推荐模块中的线上推荐结果是基于用户实时的收视行为数据和页面浏览行为数据,结合用户应用场景、条件规则,形成的实时线上推荐结果集。
8.根据权利要求1的基于海量跨屏收视行为数据的直播推荐方法,其特征在于,所述推荐模块中的内容-特征推荐结果数据是融合线下推荐结果和线上推荐结果,经过预处理、去重、过滤、排名这些步骤后形成的最终推荐结果集。