一种基于大数据的短视频推荐系统及方法与流程

文档序号:32747912发布日期:2022-12-30 23:08阅读:252来源:国知局
一种基于大数据的短视频推荐系统及方法与流程

1.本发明涉及短视频推荐技术领域,具体为一种基于大数据的短视频推荐系统及方法。


背景技术:

2.随着互联网的普及和成熟,消费者对基于互联网的内容消费和网络社交需求不断增大,消费习惯逐渐成熟,传统的文字和图片形式已经不能满足当下的用户需求,视频成为用户更加偏好的内容传播方式。原因主要有:1)内容丰富化,相比于图文形式,短视频的信息承载量更大,可以传达更加丰富的内容;2)表达个性化,短视频能够更大程度上满足用户表达自我的需求,全面而生动地展示用户希望传达的信息;3)形式互动化,短视频在形式上的互动性更强,能够更加促进用户的社交欲望和社交需求。
3.然后目前,现有的短视频推荐方法仍存在缺陷:
4.现有的短视频推荐方法基本都是根据用户浏览历史记录进行短视频推荐,无法根据用户浏览短视频的浏览行为变化及时对用户当前浏览短视频的类型进行调整,但从浏览历史记录推荐短视频存在信息滞后性、延时性的问题,无法满足用户的实时浏览需求,使得短视频平台中短视频推荐水平受到影响,导致不能根据用户浏览行为进行针对性推荐,降低短视频平台中短视频推荐的精确性,影响用户的短视频浏览体验感,进而造成短视频平台的用户流失。


技术实现要素:

5.本发明的目的在于提供一种基于大数据的短视频推荐系统及方法,以解决上述背景技术中提出的问题。
6.为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的短视频推荐方法,该方法包括以下步骤:
7.s1、获取用户浏览短视频时手指接触面积的历史数据,分别设置用户拇指接触面积区间和用户食指接触面积区间;
8.s2、获取用户登录视频网站预设时间t0内手指接触屏幕的次数,对用户浏览短视频时各次手指接触面积进行检测,得到用户浏览短视频时各次手指接触面积的集合;
9.s3、获取各次手指接触面积数据,构建触屏手指判断模型,并判断出用户触屏手指情况;
10.s4、获取基于用户触屏手指情况下短视频的浏览记录,建立短视频类型预测模型,对短视频类型偏好进行分析;
11.s5、建立最佳短视频推荐模型,按照短视频推荐得分从大到小的顺序将对应短视频列表推荐给短视频用户。
12.根据上述技术方案,在步骤s1中,获取用户浏览短视频时手指接触面积的历史数据,设置用户拇指接触面积区间为[a1,b1],设置用户食指接触面积区间为[a2,b2];
[0013]
其中,用户拇指接触最小面积记为a1,用户拇指接触最大面积记为b1,用户食指接触最小面积记为a2,用户食指接触最大面积记为b2。
[0014]
对于手指接触面积区间的设置,在本发明中,用户浏览视频的习惯一般为拇指滑动屏幕或为食指滑动屏幕,且一般情况下拇指接触面积要大于食指接触面积,故而设置两个不同的接触面积区间分别代表拇指接触面积区间和食指接触面积区间。
[0015]
根据上述技术方案,在步骤s2-s3中,获取用户登录视频网站预设时间内手指接触屏幕的次数,记为n,检测用户浏览短视频时各次手指接触面积,得到用户浏览短视频时各次手指接触面积的集合sa(s
a1
,s
a2
,...,s
ai
,...,s
an
),其中,s
ai
为用户浏览视频时第i次手指接触面积;
[0016]
选取各次手指接触面积集合sa中的众数作为触屏手指的接触面积,记为s
ax

[0017]
构建触屏手指判断模型为:
[0018][0019]
其中,ρ=1表示用户浏览视频时触屏手指为拇指,ρ=0表示用户浏览视频时触屏手指为食指。
[0020]
对于预设时间t0,在本发明中,因为要基于用户短时间内的浏览行为判断用户浏览视频的状态,故而设置的预设时间t0较短,一般为3-5分钟。
[0021]
对于用户浏览短视频时各次手指接触面积的集合sa,在本发明中,存在由于某次拇指接触屏幕不完全导致拇指接触面积采集的数据处于食指接触面积区间内,为防止误判,故而设置选取各次手指接触面积集合sa中的众数作为触屏手指的接触面积,只有当集合sa中手指接触面积数据大概率地出现时,才能进行准确地判断。
[0022]
对于手指方便情况,在本发明中,用户浏览视频的习惯一般为在手指方便状态时,用拇指滑动屏幕,而在手指不方便状态时,则会选择用拇指滑动屏幕,故而当用户在预设时间t0内浏览视频时触屏手指一直为拇指,判断当前用户手指属于方便状态;当用户在预设时间t0内浏览视频时触屏手指一直为食指,判断当前用户手指属于不方便状态。
[0023]
根据上述技术方案,在步骤s4中,所述短视频类型预测模型包括:
[0024]
获取用户预设时间t0内基于用户触屏手指情况下短视频的浏览记录,构建短视频标签偏好模型和短视频时长偏好模型;
[0025]
设置时间序列数t;
[0026]
所述短视频标签偏好模型为:
[0027][0028]
其中,im为短视频标签推荐概率;tm为预设时间区间内包含的时间序列数的数量;i
t
为第t段时间内短视频的浏览次数;is为第t段时间内短视频的总浏览次数;
[0029]
获取预设时间t0内基于用户触屏手指情况下用户浏览短视频的视频时长,选取众数作为短视频浏览偏好时长,记为t
l
;设置长时长视频与短时长视频的临界值,记为tn;
[0030]
构建短视频时长偏好模型:
[0031][0032]
其中,ω=1表示用户浏览视频时偏好时长视频为长时长视频,ω=0表示用户浏览视频时偏好时长视频为短时长视频。
[0033]
对于视频时长类型,在本发明中,用户在手指方便状态下浏览的视频时长类型一般为长短时长视频均可,而在手指不方便状态下,不能一直滑动屏幕切换视频,用户浏览的视频时长类型一般为长时长视频,故而根据短视频时长偏好模型判断用户当前对视频时长的偏好情况。
[0034]
根据上述技术方案,在步骤s5中,所述最佳短视频推荐模型包括:
[0035]
构建最佳短视频推荐模型:
[0036][0037]
其中,k为短视频推荐得分;j为归一化的基础短视频得分;μ1、μ2分别为短视频标签数据和短视频时长数据的均值;σ1、σ2分别为短视频标签数据和短视频时长数据的标准差;a为短视频标签数值,b为短视频时长数值;
[0038]
按照短视频推荐得分的从大到小对短视频进行排序,并依次推送给短视频用户。
[0039]
一种基于大数据的短视频推荐系统,该系统包括触屏次数获取模块、手指接触面积采集模块、手指接触面积检测模块、触屏手指判断模块、视频类型预测模块和推荐模块;
[0040]
所述触屏次数获取模块用于获取用户登录视频网站预设时间内手指接触屏幕的次数;所述手指接触面积采集模块用于采集用户正在浏览短视频时手指接触面积;所述手指接触面积检测模块用于对用户浏览短视频时各次手指接触面积进行检测,得到用户浏览短视频时各次手指接触面积的集合;所述触屏手指判断模块用于基于各次手指接触面积数据进行判断,得出用户触屏手指情况;所述视频类型预测模块用于基于预设时间内用户触屏手指情况下的浏览记录预测用户当前偏好的视频类型;所述推荐模块用于按照短视频推荐得分的从大到小对短视频进行排序,并依次推送给短视频用户。
[0041]
所述触屏次数获取模块的输出端与所述手指接触面积采集模块的输入端相连接;所述手指接触面积采集模块的输出端与所述手指接触面积检测模块的输入端相连接;所述手指接触面积检测模块的输出端与所述触屏手指判断模块的输入端相连接;所述触屏手指判断模块的输出端与所述视频类型预测模块的输入端相连接;所述视频类型预测模块的输出端与所述推荐模块的输入端相连接。
[0042]
根据上述技术方案,所述视频类型预测模块包括短视频标签偏好分析单元和短视频时长偏好分析单元;
[0043]
所述短视频标签偏好分析单元用于分析短视频用户对每个视频标签的偏好情况;并获得浏览偏好概率;所述短视频时长偏好分析单元用于分析短视频用户浏览视频的偏好时长,并以众数作为预测浏览时长;
[0044]
所述短视频时长偏好分析单元的输出端与所述短视频时长偏好分析单元的输入端相连接;所述所述短视频时长偏好分析单元的输出端与所述推荐模块的输入端想连接。
[0045]
根据上述技术方案,所述推荐模块包括推荐列表构建单元、推荐单元;
[0046]
所述推荐列表构建单元用于基于当前用户浏览视频时长类型构建用户推荐列表;
所述推荐单元用于按照推荐列表将实时推荐用户同类型的短视频;
[0047]
所述推荐列表构建单元的输出端与所述推荐单元的输入端相连接,所述推荐单元的输出端连接到视频播放端口。
[0048]
与现有技术相比,本发明所达到的有益效果是:
[0049]
本发明可以根据用户预设时间内用户浏览短视频的浏览行为变化及时对用户当前浏览短视频的类型进行调整,解决从浏览历史行为推荐短视频存在信息滞后性、延时性的问题,进行针对性推荐,满足用户的实时浏览需求,提高短视频平台中短视频推荐的精确性和用户的短视频浏览体验感,提高短视频平台中短视频推荐水平;
附图说明
[0050]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0051]
图1是本发明一种基于大数据的短视频推荐系统及方法的流程示意图;
[0052]
图2是本发明一种基于大数据的短视频推荐系统的结构示意图。
具体实施方式
[0053]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0054]
请参阅图1-图2,本发明提供技术方案:
[0055]
所述一种基于大数据的短视频推荐方法包括以下步骤:
[0056]
s1、获取用户浏览短视频时手指接触面积的历史数据,分别设置用户拇指接触面积区间和用户食指接触面积区间;
[0057]
s2、获取用户登录视频网站预设时间t0内手指接触屏幕的次数,对用户浏览短视频时各次手指接触面积进行检测,得到用户浏览短视频时各次手指接触面积的集合;
[0058]
s3、获取各次手指接触面积数据,构建触屏手指判断模型,并判断出用户触屏手指情况;
[0059]
s4、获取基于用户触屏手指情况下短视频的浏览记录,建立短视频类型预测模型,对短视频类型偏好进行分析;
[0060]
s5、建立最佳短视频推荐模型,按照短视频推荐得分从大到小的顺序将对应短视频列表推荐给短视频用户。
[0061]
根据上述技术方案,在步骤s1中,获取用户浏览短视频时手指接触面积的历史数据,设置用户拇指接触面积区间为[a1,b1],设置用户食指接触面积区间为[a2,b2];
[0062]
其中,用户拇指接触最小面积记为a1,用户拇指接触最大面积记为b1,用户食指接触最小面积记为a2,用户食指接触最大面积记为b2。
[0063]
根据上述技术方案,在步骤s2-s3中,获取用户登录视频网站预设时间内手指接触屏幕的次数,记为n,检测用户浏览短视频时各次手指接触面积,得到用户浏览短视频时各次手指接触面积的集合sa(s
a1
,s
a2
,...,s
ai
,...,s
an
),其中,s
ai
为用户浏览视频时第i次手指
接触面积;
[0064]
选取各次手指接触面积集合sa中的众数作为触屏手指的接触面积,记为s
ax

[0065]
构建触屏手指判断模型为:
[0066][0067]
其中,ρ=1表示用户浏览视频时触屏手指为拇指,ρ=0表示用户浏览视频时触屏手指为食指。
[0068]
根据上述技术方案,在步骤s4中,所述短视频类型预测模型包括:
[0069]
获取用户预设时间t0内基于用户触屏手指情况下短视频的浏览记录,构建短视频标签偏好模型和短视频时长偏好模型;
[0070]
设置时间序列数t;
[0071]
所述短视频标签偏好模型为:
[0072][0073]
其中,im为短视频标签推荐概率;tm为预设时间区间内包含的时间序列数的数量;i
t
为第t段时间内短视频的浏览次数;is为第t段时间内短视频的总浏览次数;
[0074]
获取预设时间t0内基于用户触屏手指情况下浏览短视频的视频时长,选取众数作为短视频浏览偏好时长,记为t
l
;设置长时长视频与短时长视频的临界值,记为tn;
[0075]
构建短视频时长偏好模型:
[0076][0077]
其中,ω=1表示用户浏览视频时偏好时长视频为长时长视频,ω=0表示用户浏览视频时偏好时长视频为短时长视频。
[0078]
根据上述技术方案,在步骤s5中,所述最佳短视频推荐模型包括:
[0079]
构建最佳短视频推荐模型:
[0080][0081]
其中,k为短视频推荐得分;j为归一化的基础短视频得分;μ1、μ2分别为短视频标签数据和短视频时长数据的均值;σ1、σ2分别为短视频标签数据和短视频时长数据的标准差;a为短视频标签数值,b为短视频时长数值;
[0082]
按照短视频推荐得分的从大到小对短视频进行排序,并依次推送给短视频用户。
[0083]
一种基于大数据的短视频推荐系统,该系统包括触屏次数获取模块、手指接触面积采集模块、手指接触面积检测模块、触屏手指判断模块、视频类型预测模块和推荐模块;
[0084]
所述触屏次数获取模块用于获取用户登录视频网站预设时间内手指接触屏幕的次数;所述手指接触面积采集模块用于采集用户正在浏览短视频时手指接触面积;所述手指接触面积检测模块用于对用户浏览短视频时各次手指接触面积进行检测,得到用户浏览短视频时各次手指接触面积的集合;所述触屏手指判断模块用于基于各次手指接触面积数据进行判断,得出用户触屏手指情况;所述视频类型预测模块用于基于预设时间内用户触
屏手指情况下的浏览记录预测用户当前偏好的视频类型;所述推荐模块用于按照短视频推荐得分的从大到小对短视频进行排序,并依次推送给短视频用户。
[0085]
所述触屏次数获取模块的输出端与所述手指接触面积采集模块的输入端相连接;所述手指接触面积采集模块的输出端与所述手指接触面积检测模块的输入端相连接;所述手指接触面积检测模块的输出端与所述触屏手指判断模块的输入端相连接;所述触屏手指判断模块的输出端与所述视频类型预测模块的输入端相连接;所述视频类型预测模块的输出端与所述推荐模块的输入端相连接。
[0086]
根据上述技术方案,所述视频类型预测模块包括短视频标签偏好分析单元和短视频时长偏好分析单元;
[0087]
所述短视频标签偏好分析单元用于分析短视频用户对每个视频标签的偏好情况;并获得浏览偏好概率;所述短视频时长偏好分析单元用于分析短视频用户浏览视频的偏好时长,并以众数作为预测浏览时长;
[0088]
所述短视频时长偏好分析单元的输出端与所述短视频时长偏好分析单元的输入端相连接;所述所述短视频时长偏好分析单元的输出端与所述推荐模块的输入端想连接。
[0089]
根据上述技术方案,所述推荐模块包括推荐列表构建单元、推荐单元;
[0090]
所述推荐列表构建单元用于基于当前用户浏览视频时长类型构建用户推荐列表;所述推荐单元用于按照推荐列表将实时推荐用户同类型的短视频;
[0091]
所述推荐列表构建单元的输出端与所述推荐单元的输入端相连接,所述推荐单元的输出端连接到视频播放端口。
[0092]
在实施例1中:
[0093]
一短视频用户在早上乘坐地铁上班期间浏览短视频,设置用户拇指接触面积区间为[0.6,1.2],设置用户食指接触面积区间为[0.3,0.7];获取用户登录视频网站预设时间3分钟内手指接触屏幕的次数为10次,对用户浏览短视频时各次手指接触面积进行检测,得到用户浏览短视频时各次手指接触面积的集合sa(0.6,0.65,0.7,0.65,0.8,0.75,0.65,0.65,0.8,0.7),选取各次手指接触面积集合sa中的众数s
ax
=0.65作为触屏手指的接触面积;由于所以ρ=1,表示用户浏览视频时触屏手指为拇指。
[0094]
获取用户预设时间3分钟内基于触屏手指为拇指情况下短视频的浏览记录,构建短视频标签偏好模型和短视频时长偏好模型;
[0095]
设置时间序列数t;
[0096]
所述短视频标签偏好模型为:
[0097][0098]
其中,im为短视频标签推荐概率;tm为预设时间区间内包含的时间序列数的数量;i
t
为第t段时间内短视频的浏览次数;is为第t段时间内短视频的总浏览次数;
[0099]
获取预设时间3分钟内基于触屏手指为拇指情况下浏览短视频的视频时长,选取众数作为短视频浏览偏好时长,记为t
l
;设置长时长视频与短时长视频的临界值,记为tn;
[0100]
构建短视频时长偏好模型:
[0101][0102]
其中,ω=1表示用户浏览视频时偏好时长视频为长时长视频,ω=0表示用户浏览视频时偏好时长视频为短时长视频。
[0103]
根据上述技术方案,在步骤s5中,所述最佳短视频推荐模型包括:
[0104]
构建最佳短视频推荐模型:
[0105][0106]
其中,k为短视频推荐得分;j为归一化的基础短视频得分;μ1、μ2分别为短视频标签数据和短视频时长数据的均值;σ1、σ2分别为短视频标签数据和短视频时长数据的标准差;a为短视频标签数值,b为短视频时长数值;
[0107]
按照短视频推荐得分的从大到小对短视频进行排序,并依次推送给短视频用户。
[0108]
在实施例2中:
[0109]
一短视频用户在实用午餐时浏览短视频,设置用户拇指接触面积区间为[0.6,1.2],设置用户食指接触面积区间为[0.3,0.7];获取用户登录视频网站预设时间3分钟内手指接触屏幕的次数为5次,对用户浏览短视频时各次手指接触面积进行检测,得到用户浏览短视频时各次手指接触面积的集合sa(0.3,0.35,0.4,0.35,0.45),选取各次手指接触面积集合sa中的众数s
ax
=0.35作为触屏手指的接触面积;由于所以ρ=0,表示用户浏览视频时触屏手指为食指。
[0110]
获取用户预设时间3分钟内基于触屏手指为食指情况下短视频的浏览记录,构建短视频标签偏好模型和短视频时长偏好模型;
[0111]
设置时间序列数t;
[0112]
所述短视频标签偏好模型为:
[0113][0114]
其中,im为短视频标签推荐概率;tm为预设时间区间内包含的时间序列数的数量;i
t
为第t段时间内短视频的浏览次数;is为第t段时间内短视频的总浏览次数;
[0115]
获取预设时间3分钟内基于触屏手指为食指情况下浏览短视频的视频时长,选取众数作为短视频浏览偏好时长,记为t
l
;设置长时长视频与短时长视频的临界值,记为tn;
[0116]
构建短视频时长偏好模型:
[0117][0118]
其中,ω=1表示用户浏览视频时偏好时长视频为长时长视频,ω=0表示用户浏览视频时偏好时长视频为短时长视频。
[0119]
根据上述技术方案,在步骤s5中,所述最佳短视频推荐模型包括:
[0120]
构建最佳短视频推荐模型:
[0121]
[0122]
其中,k为短视频推荐得分;j为归一化的基础短视频得分;μ1、μ2分别为短视频标签数据和短视频时长数据的均值;σ1、σ2分别为短视频标签数据和短视频时长数据的标准差;a为短视频标签数值,b为短视频时长数值;
[0123]
按照短视频推荐得分的从大到小对短视频进行排序,并依次推送给短视频用户。
[0124]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0125]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1