决策分类器的训练、音视频的推荐方法、装置及存储介质与流程

文档序号:20353142发布日期:2020-04-10 23:09阅读:194来源:国知局
决策分类器的训练、音视频的推荐方法、装置及存储介质与流程

本发明实施例涉及音视频处理领域,尤其涉及一种决策分类器的训练、音视频的推荐方法、装置及存储介质。



背景技术:

随着网络技术、影视数字化技术以及硬盘存储技术的发展,各类的网络影视系统逐渐兴起,用户通常采用互联网影视系统进行音视频的观看。

在互联网影视系统中拥有着海量的影视节目库,由于是海量影视节目库,绝大部分的用户都不会也不能花费大量的精力来遍历影视系统上的所有影视节目,因此互联网影视系统的影视节目推荐就显得相当重要。

相关技术中,通常采用用户的历史观看记录或用户的历史搜索记录为用户进行影视节目的推荐,该推荐方式不能准确推测出用户的喜好,无法实现影视节目的精准推荐。



技术实现要素:

鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种决策分类器的训练、音视频的推荐方法、装置及存储介质。

第一方面,本发明实施例提供一种决策分类器的训练方法,包括:

从日志文件中获取用户对音视频的历史操作数据;

基于所述历史操作数据对多个不同类型的初始模型同时进行模型训练得到多个训练后的分类模型;

根据设定规则从多个所述分类模型中选择部分模型作为候选模型;

更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,从训练好的所述候选模型中选择设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器。

在一个可能的实施方式中,所述根据设定规则从多个所述分类模型中选择部分模型作为候选模型,包括:

确定每个所述分类模型输出结果的正确率和运算时间;

基于所述正确率和所述运算时间对所述分类模型进行排序;

从排序后的所述分类模型中选择部分模型作为候选模型。

在一个可能的实施方式中,所述方法还包括:

按照用户类型将设定时间段内的多个所述历史操作数据中的部分数据作为为训练样本,所述训练样本中包括至少两个所述历史操作数据,每个所述历史操作数据设置有对应的权重;

所述基于所述历史操作数据对多个初始模型同时进行模型训练得到多个训练后的分类模型,包括:

将所述训练样本输入多个初始模型同时进行模型训练;

若所述初始模型的输出结果与所述用户类型的相似度大于第一阈值,则确定所述初始模型训练完成,得到训练后的分类模型;

若所述初始模型的输出结果与所述用户类型的相似度小于等于第一阈值,则继续执行所述初始模型的训练步骤。

在一个可能的实施方式中,所述更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,从训练好的所述候选模型中选择设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器,包括:

更新所述训练样本中每个所述历史操作数据的权重;

基于boosting算法采用更新后的所述训练样本对所述候选模型进行训练;

确定每个所述候选模型输出结果的正确率和分类范围;

基于所述正确率和所述分类范围对所述候选模型进行排序;

从排序后的所述候选模型中选择部分模型作为所述目标候选模型;

若所述目标候选模型的数量达到设定数量,则根据设定数量的所述目标候选模型生成决策分类器。

在一个可能的实施方式中,所述方法还包括:

按照用户类型将设定时间段内的多个所述历史操作数据中的剩余部分数据作为测试样本;

将所述测试样本输入所述决策分类器,以使所述决策分类器输出预测结果;

若所述预测结果与所述用户类型的相似度大于第二阈值,则确定所述决策分类器训练完成;

若所述预测结果与所述用户类型的相似度小于第二阈值,则继续执行所述候选模型的训练步骤。

在一个可能的实施方式中,

所述将所述测试样本输入所述决策分类器,以使所述决策分类器输出预测结果,包括:

将所述测试样本输入所述决策分类器中的每个所述目标候选模型;

所述目标候选模型基于所述测试样本确定输出结果;

将多个所述输出结果中占比最高的作为所述决策分类器输出的预测结果。

第二方面,本发明实施例提供一种音视频的推荐方法,包括:

从日志文件中获取用户对音视频的历史操作数据;

将所述历史操作数据输入所述决策分类器,以使所述决策分类器输出所述用户的类型;

向所述用户推荐与所述类型对应的音视频;

其中,所述决策分类器为利用如上述第一方面任一方法获得的。

第三方面,本发明实施例提供一种决策分类器的训练装置,包括:

获取模块,用于从日志文件中获取用户对音视频的历史操作数据;

第一训练模块,用于基于所述历史操作数据对多个不同类型的初始模型同时进行模型训练得到多个训练后的分类模型;

确定模块,用于根据设定规则从多个所述分类模型中选择部分模型作为候选模型;

第二训练模块,用于更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,从训练好的所述候选模型中选择设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器。

第四方面,本发明实施例提供一种音视频的推荐装置,包括:

获取模块,用于从日志文件中获取用户对音视频的历史操作数据;

分类模块,用于将所述历史操作数据输入所述决策分类器,以使所述决策分类器输出所述用户的类型;

推荐模块,用于向所述用户推荐与所述类型对应的音视频。

第五方面,本发明实施例提供一种计算机设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的决策分类器的训练方法步骤,或上述第二方面所述的音视频的推荐方法步骤。

第六方面,本发明实施例提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述第一方面中任一所述的决策分类器的训练方法,或上述第二方面中所述的音视频的推荐方法。

第七方面,本发明实施例提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面中任一所述的决策分类器的训练方法,或上述第二方面中所述的音视频的推荐方法。

本发明实施例的决策分类器的训练方法,通过从日志文件中获取用户对音视频的历史操作数据;基于所述历史操作数据对多个不同类型的初始模型同时进行模型训练得到多个训练后的分类模型;根据设定规则从多个所述分类模型中选择部分模型作为候选模型;更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,从训练好的所述候选模型中选择设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器,决策分类器集成多个目标候选模型,在进行用户进行分类时,采用多个目标候选模型同时输出分类结果,将多个分类结果中占比最高的作为决策分类器的预测结果,相比于单一模型,预测用户的类型更加精准,通过决策分类器利用用户的历史操作数据,可以实现对用户的精准分类,便于后续根据该类型为用户推荐音视频。

附图说明

图1为本发明实施例提供的一种决策分类器的训练方法的流程示意图;

图2为本发明实施例涉及的基于所述历史操作数据对多个初始模型同时进行模型训练得到多个训练后的分类模型的流程示意图;

图3为本发明实施例涉及的根据设定规则从多个所述分类模型中选择部分模型作为候选模型的流程示意图;

图4为本发明实施例涉及的更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,得到设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器的流程示意图;

图5为本发明实施例提供的另一种决策分类器的训练方法的流程示意图;

图6为本发明实施例提供的一种音视频的推荐方法的流程示意图;

图7为本发明实施例提供的一种决策分类器的训练装置的结构示意图;

图8为本发明实施例提供的一种音视频的推荐装置的结构示意图;

图9为本发明实施例提供的一种计算机设备的结构示意图;

图10为本发明实施例提供的另一种计算机设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。

图1为本发明实施例提供的一种决策分类器的训练方法的流程示意图,如图1所示,该方法具体包括:

s11、从日志文件中获取用户对音视频的历史操作数据。

本发明实施例涉及的决策分类器应用于用户的分类,采用用户对音视频的历史操作数据对初始模型进行训练,得到训练好的分类模型,再基于分类模型生成决策分类器。

用户使用音视频软件执行音视频播放操作时,通过日志文件的形式记录在执行音视频播放操作过程中对音视频的历史操作数据,该历史操作数据可以包括:搜索音视频的搜索文本数据、音视频的播放时长、音视频的评价数据等。

具体可按照时间的顺序获取日志文件(可获取时间最新的日志文件),从日志文件中获取历史操作数据,在该时间段内的日志文件中包含有一个用户对多个不同音视频的历史操作数据或多个用户对多个不同音视频的历史操作数据。

进一步地,根据历史操作数据定义该用户的类型,该类型可以作为初始模型训练的标准。

s12、基于所述历史操作数据对多个不同类型的初始模型同时进行模型训练得到多个训练后的分类模型。

本发明实施例中的决策分类器由多个模型组成,多模型的目的在于克服单一模型不适用所有输入数据的问题,可以选择卷积神经网络模型、朴素贝叶斯(naivebayes,nb)模型、支持向量机(supportvectormachine,svm)模型等作为本发明实施例的初始模型。

需要说明的是,本实施例不限定对初始模型作具体限定,初始模型可以通过训练执行用户的分类即可,主要采用多模型的形式进行用户的分类。

在本实施例中,根据获取到的历史操作数据分析得到用户的类型,该类型可以表征用户通常观看何种类型的音视频,该类型也可以认为是用户的标签,该类型可以作为训练分类模型、目标候选模型的训练标准。

训练的过程可以是:

将历史操作数据作为不同类型的初始模型的输入,进行模型训练,将初始模型的输出结果与用户的类型进行相似度比对,若输出结果与用户的类型的相似度达到设定条件,则认为初始模型训练完成,得到多个训练后的分类模型;若输出结果与用户的类型的相似度未达到设定条件,调整初始模型的运算参数,直至输出结果与用户的类型的相似度达到设定条件。

s13、根据设定规则从多个所述分类模型中选择部分模型作为候选模型。

在本实施例中,训练好的分类模型包括多个,从多个分类模型匹配出符合设定规则的部分模型作为候选模型,设定的规则可以根据分类模型输出结果的正确率、分类模型的运算时间等因素确定。

s14、更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,从训练好的所述候选模型中选择设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器。

本实施例中的候选模型的类型不相同,造成候选模型的输出结果也存在差异,因此,对候选模型(分类模型)进行二次训练,为达到训练效果,采用更新历史操作数据权重的形式,生成新的训练样本,采用新训练样本对候选模型进行训练。

候选模型训练的步骤与初始模型训练的步骤类似,同样是以用户的类型作为依据,在候选模型训练完成后,从训练好的候选模型中选择设定数量的候选模型作为目标候选模型,选择的标准可以依据候选模型输出结果的正确率和候选模型的运算时间等因素,组合设定数量的目标候选模型作为决策分类器。

图2为本发明实施例涉及的基于所述历史操作数据对多个初始模型同时进行模型训练得到多个训练后的分类模型的流程示意图,如图2所示,具体包括:

s121、按照用户类型将设定时间段内的多个所述历史操作数据中的部分数据作为训练样本。

在本实施例中,从日志文件中获取多个历史操作数据,可以根据用户的类型将设定时间段内的多个历史操作数据中的部分数据作为训练样本,,例如,获取到设定时间段内的150个历史操作数据,其中,包括100个用户a的历史操作数据和50个用户b的历史操作数据。

具体可采用k-折交叉验证的方式将历史操作数据划分为训练样本和测试样本,训练样本用于对初始模型进行训练,测试样本用于对决策分类器进行测试,所述训练样本和所述测试样本中包括至少两个所述历史操作数据。

例如,将100个用户a的历史操作数据随机分为5份,将其中的4份作为训练样本,将其中的1份作为测试样本,每份训练样本中包括20个历史操作数据,设置在初始模型训练过程中20个历史操作数据对应的权重均为5%。

在本发明实施例的一可选方案中,可将每个训练样本中的多个历史操作数据转换为对应的数据序列,训练样本采用数据序列的形式呈现。

s122、将所述训练样本输入多个初始模型同时进行模型训练。

将训练样本输入多个初始模型,同时多对个初始模型进行模型训练,在训练过程中根据用户的属性作为标准,调整初始模型中的运算参数,进而调整初始模型的输出结果。

s123、若所述初始模型的输出结果与所述用户类型的相似度大于第一阈值,则确定所述初始模型训练完成,得到训练后的分类模型。

s124、若所述初始模型的输出结果与所述用户类型的相似度小于等于第一阈值,则继续执行所述初始模型的训练步骤。

通过不断调整初始模型中运算参数的形式,以使初始模型的输出结果越来越接近用户的类型,当初始模型的输出结果与用户类型的相似度大于第一阈值,则确定所述初始模型训练完成,得到训练后的分类模型;若初始模型的输出结果与用户类型的相似度小于等于第一阈值,则继续调整初始模型的运算参数,继续执行初始模型的训练步骤。

图3为本发明实施例涉及的根据设定规则从多个所述分类模型中选择部分模型作为候选模型的流程示意图,如图3所示,具体包括:

s131、确定每个所述分类模型输出结果的正确率和运算时间。

s132、基于所述正确率和所述运算时间对所述分类模型进行排序。

s133、从排序后的所述分类模型中选择部分模型作为候选模型。

在本发明实施例中,在分类模型训练完成后,统计每个分类模型输出结果的正确率,以及每个分类模型输出输出结果的运算时间。

根据正确率和运算时间对多个分类模型进行排序,具体排序的规则可以根据正确率和运算时间进行加权计算得出,如,设置正确率的权重为60%,运算时间的权重为40%,确定每个分类模型的系数,根据该系数的高低对多个分类模型进行排序。

系数的计算方式可以是:

k=r*a+h*b

其中,k为系数,r为正确率,a为正确率的权重,h为运算时间,b为运算时间的权重。

从排序后的结果中,选择系数高于系数阈值的分类模型作为候选模型。

在本发明实施例的一可选方案中,若不存在系数高于系数阈值的后续模型,则可以按照系数的高低选择系数较高的设定数量的分类模型作为候选模型;或者,重新对初始模型进行训练,提高第一阈值的大小(如将第一阈值从85%提升至90%),以使存在系数高于系数阈值的分类模型。

图4为本发明实施例涉及的更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,从训练好的所述候选模型中选择设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器的流程示意图,如图4所示,具体包括:

s141、更新所述训练样本中每个所述历史操作数据的权重。

本实施例中的训练样本包括多个历史操作数据,在训练初始模型阶段,每个历史操作数据的权重均相同,对分类模型训练过程中,更新训练样本中每个历史操作数据的权重,更新的方式可以是随机更新,或者增加训练样本中训练难度大的历史操作数据的权重,减少训练样本中训练难度小的历史操作数据的权重。

其中,所述历史操作数据至少包括以下之一:

所述音视频的名称、用户观看所述音视频的时长数据、所述音视频的评价数据、所述音视频的收藏数据或所述音视频的推荐数据。

训练样本包括至少两个历史操作数据,每个历史操作数据可作为训练样本的一个维度,每个训练样本中至少包括两个维度,为区别初始模型和候选模型的训练样本不同,更新训练样本中每个所述历史操作数据的权重,在保证训练样本基础数据相同的前提下,调整训练样本中的维度占比以区别初始模型的训练样本。

s142、基于boosting算法采用更新后的所述训练样本对所述候选模型进行训练。

s143、确定每个所述候选模型输出结果的正确率和分类范围。

s144、基于所述正确率和所述分类范围对所述候选模型进行排序。

s145、从排序后的所述候选模型中选择部分模型作为所述目标候选模型。

s146、若所述目标候选模型的数量达到设定数量,则根据设定数量的所述目标候选模型生成决策分类器。

利用boosting算法将更新权重后的训练样本作为候选模型的输出,对候选模型进行训练,在boosting算法采用迭代的方式对候选模型进行训练(候选模型训练的步骤和初始模型训练的步骤类似),在每次迭代过程中,分别确定每个候选模型输出结果的正确率和分类范围,根据正确率和分类范围对候选模型进行排序,分类范围是指候选模型输出结果对应的分类范围,可以表征候选模型分类的多样性。

排序的形式可以采用加权的形式确定,设置正确率的权重和分类范围的权重,进而加权得到每个候选模型的系数,根据该系数进行排序,相关步骤可参照图3部分的相关描述。

从选择系数高于系数阈值的分类模型作为目标候选模型,若不存在系数高于系数阈值的分类模型,则可以按照系数的高低选择系数较高的设定数量的候选模型作为目标候选模型;或者,重新对候选模型进行训练,提高第一阈值的大小(如将第一阈值从85%提升至90%),以使存在系数高于系数阈值的候选模型。

经过boosting算法的一轮或多个迭代使目标候选模型的数量达到设定数量时,将设定数量的所述目标候选模型集成为决策分类器。

在本发明实施例中,决策分类器包括多个目标候选模型,需要对用户进行分类时,从日志文件中获取用户对音视频的历史操作数据,并历史操作数据输入决策分类器,决策分类器中的多个目标候选模型同时将历史操作数据作为输入,得到多个输出结果,从多个输出结果中确定占比最高的输出结果作为决策分类器的输出结果。

在本发明实施例的一可选方案中,生成决策分类器后,采用测试数据对决策分类器进行测试。

图5为本发明实施例提供的另一种决策分类器的训练方法的流程示意图,如图5所示,该方法具体包括:

s11、从日志文件中获取用户对音视频的历史操作数据。

s12、基于所述历史操作数据对多个初始模型同时进行模型训练得到多个训练后的分类模型。

s13、根据设定规则从多个所述分类模型中选择部分模型作为候选模型。

s14、更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,得到设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器。

s15、将所述测试样本输入所述决策分类器,以使所述决策分类器输出预测结果。

具体地,按照用户类型将设定时间段内的多个所述历史操作数据中的剩余部分数据作为测试样本,例如,将100个用户a的历史操作数据随机分为5份,将其中的4份作为训练样本,将其中的1份作为测试样本,每份训练样本中包括20个历史操作数据。

需要说明的是:本实施例中训练样本和测试样本处于同一设定时间段内的多个历史操作数据中,使决策分类器在训练阶段和测试阶段均符合用户在特定时间段的行为习惯。

进一步地,将所述测试样本输入所述决策分类器中的每个所述目标候选模型;所述目标候选模型基于所述测试样本确定输出结果;将多个所述输出结果中占比最高的作为所述决策分类器输出的预测结果。

例如,决策分类器中包含t个目标候选模型,测试样本输入至t个目标候选模型得到t个输出结果,统计t个输出结果的类型,将输出结果的类型占比最高的作为决策分类器的输出结果。

s16、若所述预测结果与所述用户类型的相似度大于第二阈值,则确定所述决策分类器训练完成。

s17、若所述预测结果与所述用户类型的相似度小于第二阈值,则继续执行所述候选模型的训练步骤。

需要说明的是,本实施例的第二阈值大于第一阈值,例如第一阈值为:85%,第二阈值为95%。

本发明实施例的决策分类器的训练方法,通过从日志文件中获取用户对音视频的历史操作数据;基于所述历史操作数据对多个初始模型同时进行模型训练得到多个训练后的分类模型;根据设定规则从多个所述分类模型中选择部分模型作为候选模型;更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,得到设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器,决策分类器集成多个目标候选模型,在进行用户进行分类时,采用多个目标候选模型同时输出分类结果,将多个分类结果中占比最高的作为决策分类器的预测结果,相比于单一模型,预测用户的类型更加精准,通过决策分类器利用用户的历史操作数据,可以实现对用户的精准分类,便于后续根据该类型为用户推荐音视频。

图6为本发明实施例提供的一种音视频的推荐方法的流程示意图,如图6所示,该方法具体包括:

s61、从日志文件中获取用户对音视频的历史操作数据。

s62、将所述历史操作数据输入所述决策分类器,以使所述决策分类器输出所述用户的类型。

s63、向所述用户推荐与所述类型对应的音视频。

决策分类器输出用户的类型后,该类型可以表征用户观看音视频的类型,也即用户的标签,服务器根据该类型从影视节目库中匹配出与该类型对应的音视频,向用户推荐与该类型对应的音视频。

例如,若决策分类器输出用户的类型为喜剧类型,则从服务器从影视节目库中匹配喜剧类型的音视频,并向用户推荐喜剧类型的音视频。

图7为本发明实施例提供的一种决策分类器的训练装置的结构示意图,如图7所示具体包括:

获取模块71,用于从日志文件中获取用户对音视频的历史操作数据;

第一训练模块72,用于基于所述历史操作数据对多个初始模型同时进行模型训练得到多个训练后的分类模型;

确定模块73,用于根据设定规则从多个不同类型的所述分类模型中选择部分模型作为候选模型;

第二训练模块74,用于更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,从训练好的所述候选模型中选择设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器。

本实施例提供的决策分类器的训练装置可以是如图7中所示的决策分类器的训练装置,可执行如图1-5中决策分类器的训练方法的所有步骤,进而实现图1-5所示决策分类器的训练方法的技术效果,具体请参照图1-5相关描述,为简洁描述,在此不作赘述。

图8为本发明实施例提供的一种音视频的推荐装置的结构示意图,如图8所示具体包括:

获取模块81,用于从日志文件中获取用户对音视频的历史操作数据;

分类模块82,用于将所述历史操作数据输入所述决策分类器,以使所述决策分类器输出所述用户的类型;

推荐模块83,用于向所述用户推荐与所述类型对应的音视频。

本实施例提供的音视频的推荐装置可以是如图8中所示的音视频的推荐装置,可执行如图6中音视频的推荐方法的所有步骤,进而实现图6所示音视频的推荐方法的技术效果,具体请参照图6相关描述,为简洁描述,在此不作赘述。

图9为本发明实施例提供的一种计算机设备的结构示意图,如图9所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信,

存储器903,用于存放计算机程序;

处理器901,用于执行存储器903上所存放的程序时,实现如下步骤:

从日志文件中获取用户对音视频的历史操作数据;基于所述历史操作数据对多个不同类型的初始模型同时进行模型训练得到多个训练后的分类模型;根据设定规则从多个所述分类模型中选择部分模型作为候选模型;更新所述历史操作数据的权重,采用更新后的所述训练样本对所述候选模型进行训练,从训练好的所述候选模型中选择设定数量的目标候选模型,根据设定数量的所述目标候选模型生成决策分类器。

可选地,确定每个所述分类模型输出结果的正确率和运算时间;基于所述正确率和所述运算时间对所述分类模型进行排序;从排序后的所述分类模型中选择部分模型作为候选模型。

可选地,按照用户类型将设定时间段内的多个所述历史操作数据中的部分数据作为为训练样本,所述训练样本中包括至少两个所述历史操作数据,每个所述历史操作数据设置有对应的权重;将所述训练样本输入多个初始模型同时进行模型训练;若所述初始模型的输出结果与所述用户类型的相似度大于第一阈值,则确定所述初始模型训练完成,得到训练后的分类模型;若所述初始模型的输出结果与所述用户类型的相似度小于等于第一阈值,则继续执行所述初始模型的训练步骤。

可选地,更新所述训练样本中每个所述历史操作数据的权重;基于boosting算法采用更新后的所述训练样本对所述候选模型进行训练;确定每个所述候选模型输出结果的正确率和分类范围;基于所述正确率和所述分类范围对所述候选模型进行排序;从排序后的所述候选模型中选择部分模型作为所述目标候选模型;若所述目标候选模型的数量达到设定数量,则根据设定数量的所述目标候选模型生成决策分类器。

可选地,按照用户类型将设定时间段内的多个所述历史操作数据中的剩余部分数据作为测试样本;将所述测试样本输入所述决策分类器,以使所述决策分类器输出预测结果;若所述预测结果与所述用户类型的相似度大于第二阈值,则确定所述决策分类器训练完成;若所述预测结果与所述用户类型的相似度小于第二阈值,则继续执行所述候选模型的训练步骤。

可选地,将所述测试样本输入所述决策分类器中的每个所述目标候选模型;所述目标候选模型基于所述测试样本确定输出结果;将多个所述输出结果中占比最高的作为所述决策分类器输出的预测结果。

上述计算机设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的决策分类器的训练方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的决策分类器的训练方法。

图10为本发明实施例提供的另一种计算机设备的结构示意图,如图10所示,包括处理器1001、通信接口1002、存储器1003和通信总线1004,其中,处理器1001,通信接口1002,存储器1003通过通信总线1004完成相互间的通信,

存储器1003,用于存放计算机程序;

处理器1001,用于执行存储器1003上所存放的程序时,实现如下步骤:

从日志文件中获取用户对音视频的历史操作数据;将所述历史操作数据输入所述决策分类器,以使所述决策分类器输出所述用户的类型;向所述用户推荐与所述类型对应的音视频。

上述计算机设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的音视频的推荐方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的音视频的推荐方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1