一种基于用户行为数据和潜在用户影响力分析的在线广告推送方法及其推送评估方法
【技术领域】
[0001] 本发明涉及数据预测推荐技术领域,具体来说是一种基于用户行为数据和潜在用 户影响力分析的在线广告推送方法及其推送评估方法。
【背景技术】
[0002] 传统的网络在线广告推送系统,仅会根据产品选择出最有可能购买该产品的用 户,然后向这些用户推送广告信息。然而,传统的广告系统忽略了广告信息在被推送到这些 用户后的传播过程和途径。对于一个在线广告营销系统而言,一个最基本的标准就是:根 据待营销的产品,选择向一组潜在用户推广该产品,最终购买该产品的用户最多,同时产生 的收益也最大。因此,若在产品广告投放过程中,即能预测出那些最有可能购买该产品的用 户,也能推荐出能够使广告信息进一步传播更远的用户,则预测推送效果会更好。这就需要 从技术框架权衡这两方面的重要性,解决广告投放过程中的种子用户选取问题,使广告的 投放效果更好,产品能被更多的用户所知所买。
【发明内容】
[0003] 本发明的目的是为了解决现有技术中无法挖掘出潜在用户影响力的缺陷,提供一 种基于用户行为数据和潜在用户影响力分析的在线广告推送方法及其推送评估方法来解 决上述问题。
[0004] 为了实现上述目的,本发明的技术方案如下:
[0005] -种基于用户行为数据和潜在用户影响力分析的在线广告推送方法及其推送评 估方法,包括以下步骤:
[0006] 媒体信息和用户信息的特征提取,根据媒体信息库和用户行为数据库,采用概率 主题模型和隐马尔科夫模型,提取出媒体信息的特征和用户的喜好特征信息;
[0007] 基于网络传播影响力进行建模,根据用户之间的网络,建立一个影响力传播模型, 模拟用户之间的信息传播效应;
[0008] 划分出潜在影响力人群,根据已提取的媒体信息特征和用户喜好特征,估算待发 布媒体信息会影响到的用户,以这些用户为初始用户,划分出相应的潜在影响力人群,针对 潜在影响力人群进行在线广告推送;
[0009] 推送效果评估,利用通过多重影响力计算方法,计算待发布信息通过用户集合S 对所用网络用户的影响力。
[0010] 所述的媒体信息和用户信息的特征提取包括以下步骤:
[0011] 根据媒体信息库C,对于媒体的音频信息使用隐马尔科夫模型识别音频信息的文 字内容,并扩充入媒体的文字描述信息中;
[0012] 根据媒体信息库C,对媒体的文字描述信息使用概率主题模型进行主题分类,
[0013] 定义并提取主题数为η个,即为[山,(12,…,dj,
[0014] 定义并提取视频i的主题描述O1,即O1= [0 i,O2,…,0n],其中,〇"表示视频i在第 η个主题上的分布概率;
[0015] 通过网页爬虫技术来抓取网站上的用户行为数据,利用概率主题模型获取用户u 对这η个主题的喜好程度,记为Pu= [u U2,…,un]。
[0016] 所述的基于网络传播影响力进行建模包括以下步骤:
[0017] 根据社交网络信息,将用户当成网络的节点,将用户之间的链接关系当成网络的 边;
[0018] 使用带权重的有向图G = <V,E,T>来表示社交网络,其中:
[0019] V为节点集合,每个节点代表一个用户个体;
[0020] E为所有有向边集合,代表一种朋友或链接关系;
[0021] T为用户之间影响力传播概率矩阵,Tl j表示节点i到节点j的影响力传播概率;
[0022] 计算节点之间的影响力传播概率,其包括以下步骤:
[0023] 根据用户对媒体信息的行为记录,通过概率主题模型获得用户u所看媒体信息库 C中各个主题[山,d2,…,dn]的喜好程度,
[0024] 记为Du。= [d ul, du2,…,dun],其中dui E [0, 1]表示用户u对主题i的喜好程度;
[0025] 采用相似度计算方法来计算两个用户喜好特性的相似度,其计算公式如下:
[0026]
[0027] 其中,Dlc为用户i对各个主题的喜好程度,D lc= [d u, dl2,…,dj ;
[0028] Djc为用户j对各个主题的喜好程度,D jc= [d n, dj2,…,djn];
[0029] 计算用户之间的影响力传播概率T1,,其计算公式如下:
[0030]
[0031] 其中,N(j)表示用户j的入度邻居节点。
[0032] 所述的划分出潜在影响力人群包括以下步骤:
[0033] 抽取待发布媒体信息m在各个主题的相关度Oni,即Oni= [0 ^1, Oni2,…,O1J ;
[0034] 根据用户i对各个主题的喜好程度P1= [i i,i2,…,in],采用余弦相似度方法来计 算该待发布媒体信息m对每个用户i的潜在影响力,其计算公式如下:
[0035]
'"'9:
[0036] 根据所有用户的inf (i)值,选取K个最大值所对应的用户集合S,用户集合S作为 潜在影响力人群进行在线广告推送。
[0037] 所述的推送效果评估包括以下步骤:
[0038] 建立一个n*K的影响力矩阵F°,
[0039] 其中t表示待发布媒体通过第j个潜在影响用户对用户i的影响力,
[0040]
[0041 ]若 i e S 且 i = j,则 t = 1 ;
[0042]若 i e S 且 i 辛 j,则 t = 0 ;
[0043] 多重影响力传播计算,通过公式F = T*F进行一次迭代计算,
[0044] 其中,T为用户之间的影响力传播概率矩阵;
[0045] 重置待发布媒体对潜在用户的影响力inf⑴;
[0046] 重复进行多重影响力传播计算和重置inf (i),直至矩阵F收敛;
[0047] 输出矩阵F,计算待发布媒体的整体影响力A和待发布媒体对用户i的影响力B, 其中:
[0048] 待发布媒体的整体影响力A =矩阵F中所有非零值的和;
[0049] 待发布媒体对用户i的影响力B =矩阵F中第i行仁的和。
[0050] 有益效果
[0051] 本发明的一种基于用户行为数据和潜在用户影响力分析的在线广告推送方法及 其推送评估方法,与现有技术相比在预测媒体传播范围时不仅能够考虑用户与媒体信息, 还能考虑媒体信息在用户之间的传播效应,能够更加准确的分析和预测媒体信息在网络中 的真实影响力。本发明首先采用基于用户兴趣主题的影响力传播概率计算方法,能够更加 真实的反应用户之间的影响力传播概率;其次,考虑了用户之间的级联传播效应,提出了潜 在影响用户估计方法和多重影响力计算方法,能够快速计算一组用户的自身影响力,并能 够计算这组用户所能产生的级联效应,更准确的分析并预测信息在网路中的传播范围。本 发明所推荐的一组用户能够导致更多用户购买该产品,可以在Windows或Linux服务器上 实现,可采用mysql数据库存储数据,采用Java语言实施编码,并通过前台页面展示给客户 使用,适用于在线广告系统、个性化推荐系统等。
【附图说明】
[0052] 图1为本发明的方法流程图。
【具体实施方式】
[0053] 为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的 实施例及附图配合详细的说明,说明如下:
[0054] 如图1所示,本发明所述的一种基于用户行为数据和潜在用户影响力分析的在线 广告推送方法及其推送评估方法,使用概率主题模型、隐马尔科夫模型