一种基于用户兴趣的讲座内容实时推荐方法及系统与流程

文档序号:32345071发布日期:2022-11-26 11:04阅读:43来源:国知局
一种基于用户兴趣的讲座内容实时推荐方法及系统与流程

1.本发明涉及信息推荐技术领域,尤其涉及一种基于用户兴趣的讲座内容实时推荐方法及系统。


背景技术:

2.疫情变化频繁,极大的影响人们的生产生活方式,各类会议纷纷转为线上或者线下线上同时进行,疫情的不确定性也给会议的排期推广带来了极大的挑战,由于网络世界的特殊性,人们对于主动推广的信息往往是免疫的、间断性的,因此一个会议讲座通过多方软件进行对感兴趣用户个体进行推荐,可以进一步提高这个讲座会议的收看率,现有的信息推荐技术主要有通过协同过滤推荐、关联规则推荐和决策树推荐,这些推荐技术主要是通过对用户日常浏览的种类以及时间段进行汇总分析从而实现推荐,而决策树推荐会在此基础上结合权重比值进行有效推荐,但是他们的推荐获取渠道单一,对用户的分析并不够透彻,因为会出现所推荐的结果信息较为单一,不能满足现阶段人们的实际精准推送需要。


技术实现要素:

3.为了解决上述技术问题,本发明的目的是提供一种基于用户兴趣的讲座内容实时推荐方法及系统,能够选取出对该讲座具有较高兴趣的人群并进行讲座内容的实时推送。
4.本发明所采用的第一技术方案是:一种基于用户兴趣的讲座内容实时推荐方法,包括以下步骤:
5.对用户的行为属性进行分析,得到用户的兴趣方向;
6.对讲座的语音内容进行预处理处理,得到讲座的摘要内容;
7.根据用户的兴趣方向,将讲座的摘要内容推送至对应的用户。
8.进一步,所述对用户的行为属性进行分析,得到用户的兴趣方向这一步骤,其具体包括:
9.获取用户的行为属性,所述用户的行为属性为用户对讲座的历史评分记录;
10.对用户的行为属性进行分析,构建评分矩阵;
11.通过矩阵分解算法对评分矩阵进行分解处理,得到子矩阵;
12.对子矩阵进行遍历处理,得到子矩阵中的零向量;
13.通过引入隐向量对子矩阵中的零向量进行迭代计算,直至满足迭代次数,输出最终计算变量;
14.将最终计算变量替代对应子矩阵中的零向量进行计算并对其计算结果进行判断,确认用户的兴趣方向。
15.进一步,所述评分矩阵如下所示:
16.f
x,x
=a
x
*by17.上式中,f
x,y
表示评分矩阵,a
x
表示由用户构成的向量,by表示由讲座名称构成的向量,x表示第x个用户,y表示第y场讲座。
18.进一步,所述评价损失函数表示如下:
[0019][0020]
上式中,loss表示评价损失函数,r
im
表示评分矩阵第i行第m列,pi表示用户评分矩阵的第i行,表示讲座评分矩阵的第m行的转置,α表示固定权重值,pi表示用户矩阵的特定行,qm表示评分矩阵的特定行。
[0021]
进一步,所述对讲座的语音内容进行预处理处理,得到讲座的摘要内容这一步骤,其具体包括:
[0022]
获取讲座的语音内容;
[0023]
对讲座的语音内容进行转换处理,得到讲座的文本内容;
[0024]
对讲座的文本内容进行相似度计算,得到计算后的讲座文本内容;
[0025]
基于文本摘要模型,对计算后的讲座文本内容进行摘要提取处理,得到讲座的摘要内容。
[0026]
进一步,所述对讲座的文本内容进行相似度计算,得到计算后的讲座文本内容这一步骤,其具体包括:
[0027]
对讲座文本内容进行相似度计算,得到计算结果并进行判断;
[0028]
将计算结果小于预设阈值的讲座文本内容进行合并,得到计算后的讲座文本内容。
[0029]
进一步,所述基于文本摘要模型,对计算后的讲座文本内容进行摘要提取处理,得到讲座的摘要内容这一步骤,其具体包括:
[0030]
将计算后的讲座文本内容输入至文本摘要模型;
[0031]
基于文本摘要模型的编码层,对计算后的讲座文本内容进行编码处理,得到对应的词向量;
[0032]
基于文本摘要模型的解码层;对词向量进行解码于特征提取处理,得到解码后的词向量;
[0033]
对解码后的词向量进行线性变换处理,得到变换后的词向量;
[0034]
基于文本摘要模型的输出层,对变换后的词向量进行输出处理,生成对应的讲座摘要内容。
[0035]
本发明所采用的第二技术方案是:一种基于用户兴趣的讲座内容实时推荐系统,包括:
[0036]
分析模块,用于对用户的行为属性进行分析,得到用户的兴趣方向;
[0037]
预处理模块,用于对讲座的语音内容进行预处理处理,得到讲座的摘要内容;
[0038]
推荐模块,用于根据用户的兴趣方向,将讲座的摘要内容推送至对应的用户。
[0039]
本发明方法及系统的有益效果是:本发明通过获取用户的行为属性信息并进行选取出在对该讲座有较高兴趣的用户,对用户进行深度分析,能够提高讲座推送的精准度,再通过讲座文本模型对讲座的每一段文本信息进行摘要提取,可以根据讲座文本的重要性进行实时推送至具有较高兴趣的人群,进一步提高讲座推送的实际精准度。
附图说明
[0040]
图1是本发明一种基于用户兴趣的讲座内容实时推荐方法的步骤流程图;
[0041]
图2是本发明一种基于用户兴趣的讲座内容实时推荐系统的结构框图;
[0042]
图3是本发明主要的流程设计示意图;
[0043]
图4是本发明文本摘要模块的框架结构示意图。
具体实施方式
[0044]
下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0045]
参照图1和图3,本发明提供了一种基于用户兴趣的讲座内容实时推荐方法,该方法包括以下步骤:
[0046]
s1、对用户的行为属性进行分析,得到用户的兴趣方向;
[0047]
s11、进行前期数据收集,并构建一个得分矩阵;
[0048]
具体地,收集前期用户参加同方向类型的讲座后对该次讲座的评价数据,所述构建的得分矩阵具体如下所示:
[0049]fx,y
=a
x
*by[0050]
上式中,f
x,y
表示评分矩阵,a
x
表示由用户构成的向量,by表示由讲座名称构成的向量,x表示第x个用户,y表示第y场讲座;
[0051]
得分矩阵由用户构成的向量a以及讲座名称构成的向量b共同组成,f
x,y
表示第x个用户在第y场讲座进行的评分,一般的,认为如果某个用户给某场讲座给出的分数较低,则说明该次讲座对该用户不合心意,其转化(付费)的可能性就越低,如果某个用户给出的某场讲座分数越高,则证明该次讲座越好,其越能吸引人们进行付费转化;
[0052]
s12、对得分矩阵进行分解,得到对应的用户评分矩阵和讲座评分矩阵;
[0053]
具体地,因为用户不是每个讲座都有参加,因此该用户评价得分矩阵必然是稀疏的,使用矩阵分解算法,构造两个中间矩阵,使得这两个中间矩阵的乘矩阵上的点与原始用户矩阵中已有的值尽可能的相同,具体地矩阵分解公式为:
[0054]fx,y
=f
x,k
*f
k,y
[0055]
上式中,k表示中间变量;
[0056]
可以理解成影响用户x评价的因素的个数,也是第y场讲座分数好坏的指标个数,k越大,所得到的结果就越精细,越能满足人们的需要,对于用户x和讲座y,有一个评分r
x,y
,这个评分就是矩阵f
x,y
中的对应值,分解后,对每一个评分r,都可以用分解后的向量乘积,来进行表示,因此对预测评分与真实评分,有r
x,y-f
x,k
*f
k,y

[0057]
对p矩阵和q矩阵求解,就是找到合适的p矩阵和q矩阵的值,将其计算预测后的分数,随后记录该分数与实际分数之间的误差,并按照梯度下降的方式更新p矩阵和q矩阵的元素值,直到上述误差达到允许范围内;
[0058]
s13、进行不断的迭代计算,直至结果逼近原始稀疏矩阵中的值;
[0059]
其评分损失函数的计算公式如下所示:
[0060][0061]
上式中,loss表示评价损失函数,r
im
表示评分矩阵第i行第m列,pi表示用户评分矩阵的第i行,表示讲座评分矩阵的第m行的转置,α表示固定权重值,pi表示用户矩阵的特定行,qm表示评分矩阵的特定行;
[0062]
对于用户,其参与的讲座有一些共同的特征和隐藏因素,对用户进行表示就是一个一行k列的矩阵p,矩阵里的值就表示这些隐藏因素对用户做出分数的重要程度,同理,对于讲座,这里也表示成一个一行k列的矩阵q,该矩阵的每一个值表示该次讲座的若干个值得注意的点。上述所表明的两个k在数量上和意义是一致的,k就是影响用户评分的因子,k为人为指定的值。因此,第i个用户在第m次会议的推荐得分就直接为
[0063]
假设现有一个n行m列的评价矩阵,有一些人没有评价,其反映在评价矩阵上就是零,即如果第n位用户没有参加第m个会议,其分数就置为零;为了求解上述分数为零的用户的预测分数,这里使用一个隐参数(隐向量),上述矩阵可以表述为[n,m],由矩阵乘法可以得到[n,m]可以由[n,k]与[k,m]的乘积得来,这个k,就是中间变量,也叫隐变量。可以通俗的理解为用户的一些偏好什么的东西,k这个值的大小是人为设置的,如果设置大了,在用户量和会议数大时,需要进行的推理计算会大幅度增加,小了拟合效果不一定好,因此选择一个合适的k,兼顾速度和精度,这里取k为3;接下来,随机生成一组矩阵p[n,3]和矩阵q[3,m]。遍历原矩阵的每一个不为零的点,矩阵p的第m行,与矩阵q的第n列相乘,得到的结果被认为是[n,m],原始的值与前述值相比较得到的差值就为误差值,根据上述误差值求得损失值和优化值,依照损失值和优化值对矩阵p和矩阵q进行更新,重复上述迭代过程,就完成了循环计算,最后误差值小于预设范围,或者循环次数约束达到,循环停止,就完成了对原始用户打分矩阵的分解,分解后的矩阵p和矩阵q的乘积与原始矩阵的误差很小,原始矩阵中值为0的值也就由上述矩阵乘积的值确定了,此时判断上述的值是否达到感兴趣的阈值,如果超过,则在一定程度上可以说明该用户在这场会议上是可能感兴趣的;
[0064]
即构建一个评分矩阵,将这个评分矩阵看成一个训练样本,通过矩阵分解方法将评分矩阵进行分解,得到一个用户评分矩阵与一个会议讲座名称矩阵,对用户评分矩阵进行遍历处理,提取其中分数值为零的向量,通过损失函数对这个用户评分矩阵中的零向量进行优化处理,多次迭代优化,直至他的输出结果与这个用户对其他会议的评分区别不大,将这个输出结果替换至用户评分矩阵对应的零向量,再对用户评分矩阵进行计算;
[0065]
通过数据对本发明的步骤s1进行阐述,具体如下:
[0066]
假设有abcde五位用户参与了abcde五场讲座,其中五场讲座全部为信息技术方向,也就是目标方向,其中d和e参与了正在进行的f讲座,因此其对f讲座的代替分数,由上述规则得到如下表所示,
[0067]
表1用户对参加过的讲座的历史评分表格
[0068] abcdefa403230b032340c023020
d114222e200232.3
[0069]
其中,矩阵中为0的数据表示该用户没有对该讲座进行评价,其余数字依次表示喜好程度,最大满分为5分;
[0070]
得到上述结构后,利用矩阵分解算法将表中0处位置补充,补充结果如下表所示,
[0071]
表2补充后的得分矩阵数据表
[0072] abcdefa3.967842.948682.985182.005582.997882.82140b3.814032.986772.014312.973293.977743.46837c2.377471.982242.986392.613332.010572.72940d1.004131.011753.962081.989561.993651.99248e2.007071.633042.120902.005172.968782.28597
[0073]
将计算完成后的矩阵设定阈值比较,这里将阈值设定为2.5,将拟合后评分超过2.5的值保留,小于2.5的值舍去,所留下来的就是高评分人员-高兴趣人员,就可以对其进行针对性的推送讲座摘要句子。
[0074]
s2、对讲座的语音内容进行预处理处理,得到讲座的摘要内容;
[0075]
s21、获取讲座的语音内容;
[0076]
s22、对讲座的语音内容进行转换处理,得到讲座的文本内容并对其进行相似度计算,得到计算后的讲座文本内容;
[0077]
具体地,对于语音转化后得到的文本信息,按照段落顺序,依次送入文本摘要模型,其中,首先对语言转文本生成的段落进行相似度比较,以判断两个段落是否为同一件事情或者同一个内容,对每一段文本,需要进行相似度计算,以确定文本是否属于同一件事情,相似度计算的主要依据是将两段段落文本转化为词向量,随计算两段文本的余弦相似度值,最后将计算出的结果,与提前定义好的人工阈值进行比较,进而得到两段文本是否相似,如果为同一个内容,则将两个段落拼接成一个段落,送入模型中;如果不为同一内容,则分别将两个段落送入模型中。
[0078]
s23、基于文本摘要模型,对计算后的讲座文本内容进行摘要提取处理,得到讲座的摘要内容。
[0079]
具体地,参照图4,对每段送入模型的段落,首先通过bert预训练模型将其转化为带有位置信息的词向量,这是进行摘要抽取的第一步,信息转化,将计算机不能编码识别的文字信息,转化为计算机能够识别的数字信息,即为词向量,本段内容主要是为了将段落内容紧密联系起来,使得生成的词向量能够更好地表示原文内容,便于下游后续nlp任务提取,进一步输入解码器模块,一个解码器层有若干个解码层,每个解码层是一个多头自注意力模块和前馈神经网络模块,通过上述模块将编码过得词向量进行特征抽取,最后通过一个softmax层进行归一化,即线性转换处理,是为了下游的输出任务进行的操作。具体是将解码后的特征向量进行拉直,便于下一步进行输出概率,进而得到最后的输出,将上述输出放入解码器,将原词向量提取出来的特征以及生成的第一个词进行如上述所述的解码器进行解码过程,最终输出一个完整的句子,完成启发式摘要抽取的全过程
[0080]
s3、根据用户的兴趣方向,将讲座的摘要内容推送至对应的用户。
[0081]
具体地,推送可以是通过qq微信等即时聊天工具进行推送;可以通过电话或者短信等传统方式进行推送,还可以通过会议app等强信息流进行资讯推送等。
[0082]
参照图2,一种基于用户兴趣的讲座内容实时推荐系统,包括:
[0083]
分析模块,用于对用户的行为属性进行分析,得到用户的兴趣方向;
[0084]
预处理模块,用于对讲座的语音内容进行预处理处理,得到讲座的摘要内容;
[0085]
推荐模块,用于根据用户的兴趣方向,将讲座的摘要内容推送至对应的用户。
[0086]
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0087]
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本技术权利要求所限定的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1