1.一种基于关联规则的直播平台用户兴趣度挖掘系统,其特征在于,包括:数据采集模块,用于从服务器获取直播平台用户行为信息,生成采样事务事件库和测试事务事件库;
关联规则模型构建模块,采用spark计算框架对采样事务事件库进行频繁模式的挖掘,得到关联规则模型;
用户兴趣度输出模块,用于将测试事务事件库作为输入变量输入关联规则模型,获得关联规则模型的输出变量,将输出变量作为用户兴趣内容。
2.如权利要求1所述的一种基于关联规则的直播平台用户兴趣度挖掘系统,其特征在于:采样事务事件库为选取采样时间内用户的行为信息记为事件生成的。
3.如权利要求2所述的一种基于关联规则的直播平台用户兴趣度挖掘系统,其特征在于:测试事务事件库为选取采样时间后用户的行为信息记为事件生成的。
4.如权利要求1所述的一种基于关联规则的直播平台用户兴趣度挖掘系统,其特征在于:所述关联规则模型构建模块包括:
表头构造单元,所述表头构造单元用于构造项目表头,设定spark计算框架的计算并行度,预设支持度阈值,扫描采样事务事件库,获得采样事务事件库中包含的全部的频繁项和每个频繁项的支持度,对所有的频繁项按照支持度降序排列得到频繁项集合F;
FP-树构造单元,所述FP-树构造单元用于构造原始FP-树,扫描采样事务事件库,将采样事务事件库中的每个事件的每个频繁项按照频繁项集合F中的顺序进行重排,并按照重排之后的顺序把每个事物的每个频繁项插入FP-树中,形成原始FP-树;
函数调用单元,所述函数调用单元用于调用FP-growth函数进行频繁项的挖掘;
FP-树计算模块,所述FP-树计算模块用于进行FP-树频集算法,得到支持度大于支持度阈值的频繁模式。
5.使用如权利要求1所述的基于关联规则的直播平台用户兴趣度挖掘系统的挖掘方法,其特征在于,包括如下步骤:
S1,数据采集模块从服务器获取直播平台用户行为信息,选取采样时间内用户的行为信息记为事件,生成采样事务事件库;
S2,关联规则模型构建模块基于spark计算框架对采样事务事件库进行频繁模式的挖掘,得到关联规则模型;
S3,数据采集模块从服务器获取直播平台用户行为信息,选取采样时间后用户的行为信息记为事件,生成测试事务事件库;
S4,用户兴趣度输出模块将测试事务事件库作为关联规则模型的输入变量,并输入关联规则模型,获得关联规则模型的输出变量,将输出变量作为用户兴趣内容。
6.如权利要求5所述的基于关联规则的直播平台用户兴趣度挖掘方法,其特征在于,还包括:
S5,用户兴趣度输出模块根据用户兴趣内容生成用户兴趣列表。
7.如权利要求5所述的基于关联规则的直播平台用户兴趣度挖掘方法,其特征在于:采用FP-树频集算法进行频繁模式的挖掘。
8.如权利要求7所述的基于关联规则的直播平台用户兴趣度挖掘方法,其特征在于:采用FP-树频集算法进行频繁模式的挖掘,具体步骤如下:
S21,构造项目表头:设定spark计算框架的计算并行度,预设支持度阈值,扫描采样事务事件库,获得采样事务事件库中包含的全部的频繁项和每个频繁项的支持度,对所有的频繁项按照支持度降序排列得到频繁项集合F;
S22,构造原始FP-树:再次扫描采样事务事件库,将采样事务事件库中的每个事件的每个频繁项按照频繁项集合F中的顺序进行重排,并按照重排之后的顺序把每个事物的每个频繁项插入FP-树中,形成原始FP-树;
S23,调用FP-growth函数进行频繁项的挖掘;
S24,根据FP-树频集算法,得到的支持度大于支持度阈值的频繁模式。
9.如权利要求8所述的基于关联规则的直播平台用户兴趣度挖掘方法,其特征在于:FP-树中一个节点表示一个直播间,一条路径对应一个用户的观看行为信息,每条路径上节点的计数值表示支持度,所述支持度用于确定任意两个直播间的关联程度。
10.如权利要求8所述的基于关联规则的直播平台用户兴趣度挖掘方法,其特征在于:频繁模式为每个直播间到其它直播间的随机观看概率。