视频推荐模型的训练方法、装置、电子设备和存储介质与流程

文档序号：37310968发布日期：2024-03-13 21:00阅读：14来源：国知局

所属的技术人员能够理解，本技术的各个方面可以实现为系统、方法或程序产品。因此，本技术的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。与上述方法实施例基于同一发明构思，本技术实施例中还提供了一种电子设备。在一种实施例中，该电子设备可以是服务器，如图1所示的服务器120。在该实施例中，电子设备的结构可以如图13所示，包括存储器1301，通讯模块1303以及一个或多个处理器1302。存储器1301，用于存储处理器1302执行的计算机程序。存储器1301可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统，以及运行即时通讯功能所需的程序等；存储数据区可存储各种即时通讯信息和操作指令集等。存储器1301可以是易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，ram)；存储器1301也可以是非易失性存储器(non-volatilememory)，例如只读存储器，快闪存储器(flash memory)，硬盘(hard disk drive，hdd)或固态硬盘(solid-state drive，ssd)；或者存储器1301是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质，但不限于此。存储器1301可以是上述存储器的组合。处理器1302，可以包括一个或多个中央处理单元(central processing unit，cpu)或者为数字处理单元等等。处理器1302，用于调用存储器1301中存储的计算机程序时实现上述视频推荐模型的训练方法。通讯模块1303用于与终端设备和其他服务器进行通信。本技术实施例中不限定上述存储器1301、通讯模块1303和处理器1302之间的具体连接介质。本技术实施例在图13中以存储器1301和处理器1302之间通过总线1304连接，总线1304在图13中以粗线描述，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。总线1304可以分为地址总线、数据总线、控制总线等。为便于描述，图13中仅用一条粗线描述，但并不描述仅有一根总线或一种类型的总线。存储器1301中存储有计算机存储介质，计算机存储介质中存储有计算机可执行指令，计算机可执行指令用于实现本技术实施例的视频推荐模型的训练方法。处理器1302用于执行上述的视频推荐模型的训练方法，如图2所示。在另一种实施例中，电子设备也可以是其他电子设备，如图1所示的终端设备110。在该实施例中，电子设备的结构可以如图14所示，包括：通信组件1410、存储器1420、显示单元1430、摄像头1440、传感器1450、音频电路1460、蓝牙模块1470、处理器1480等部件。通信组件1410用于与服务器进行通信。在一些实施例中，可以包括电路无线保真(wireless fidelity，wifi)模块，wifi模块属于短距离无线传输技术，电子设备通过wifi模块可以帮助用户收发信息。存储器1420可用于存储软件程序及数据。处理器1480通过运行存储在存储器1420的软件程序或数据，从而执行终端设备110的各种功能以及数据处理。存储器1420可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器1420存储有使得终端设备110能运行的操作系统。本技术中存储器1420可以存储操作系统及各种应用程序，还可以存储执行本技术实施例视频推荐模型的训练方法的计算机程序。显示单元1430还可用于显示由用户输入的信息或提供给用户的信息以及终端设备110的各种菜单的图形用户界面(graphical user interface，gui)。具体地，显示单元1430可以包括设置在终端设备110正面的显示屏1432。其中，显示屏1432可以采用液晶显示器、发光二极管等形式来配置。显示单元1430可以用于显示本技术实施例中的视频推荐对象界面等。显示单元1430还可用于接收输入的数字或字符信息，产生与终端设备110的用户设置以及功能控制有关的信号输入，具体地，显示单元1430可以包括设置在终端设备110正面的触控屏1431，可收集用户在其上或附近的触摸操作，例如点击按钮，拖动滚动框等。其中，触控屏1431可以覆盖在显示屏1432之上，也可以将触控屏1431与显示屏1432集成而实现终端设备110的输入和输出功能，集成后可以简称触摸显示屏。本技术中显示单元1430可以显示应用程序以及对应的操作步骤。摄像头1440可用于捕获静态图像，用户可以将摄像头1440拍摄的图像通过应用发布。摄像头1440可以是一个，也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device，ccd)或互补金属氧化物半导体(complementary metal-oxide-semiconductor，cmos)光电晶体管。感光元件把光信号转换成电信号，之后将电信号传递给处理器1480转换成数字图像信号。终端设备还可以包括至少一种传感器1450，比如加速度传感器1451、距离传感器1452、指纹传感器1453、温度传感器1454。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。音频电路1460、扬声器1461、传声器1462可提供用户与终端设备110之间的音频接口。音频电路1460可将接收到的音频数据转换后的电信号，传输到扬声器1461，由扬声器1461转换为声音信号输出。终端设备110还可配置音量按钮，用于调节声音信号的音量。另一方面，传声器1462将收集的声音信号转换为电信号，由音频电路1460接收后转换为音频数据，再将音频数据输出至通信组件1410以发送给比如另一终端设备110，或者将音频数据输出至存储器1420以便进一步处理。蓝牙模块1470用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如，终端设备可以通过蓝牙模块1470与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接，从而进行数据交互。处理器1480是终端设备的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或执行存储在存储器1420内的软件程序，以及调用存储在存储器1420内的数据，执行终端设备的各种功能和处理数据。在一些实施例中，处理器1480可包括一个或多个处理单元；处理器1480还可以集成应用处理器和基带处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，基带处理器主要处理无线通信。可以理解的是，上述基带处理器也可以不集成到处理器1480中。本技术中处理器1480可以运行操作系统、应用程序、用户界面显示及触控响应，以及本技术实施例的视频推荐模型的训练方法。另外，处理器1480与显示单元1430耦接。在一些可能的实施方式中，本技术提供的视频推荐模型的训练方法的各个方面还可以实现为一种程序产品的形式，其包括计算机程序，当程序产品在电子设备上运行时，计算机程序用于使电子设备执行本说明书上述描述的根据本技术各种示例性实施方式的视频推荐模型的训练方法中的步骤，例如，电子设备可以执行如图2中所示的步骤。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。本技术的实施方式的程序产品可以采用便携式紧凑盘只读存储器(cd-rom)并包括计算机程序，并可以在电子设备上运行。然而，本技术的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。可读介质上包含的计算机程序可以用任何适当的介质传输，包括但不限于无线、有线、光缆、rf等等，或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本技术操作的计算机程序，程序设计语言包括面向对象的程序设计语言—诸如java、c++等，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。计算机程序可以完全地在用户电子设备上执行、部分地在用户电子设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中，远程电子设备可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户电子设备，或者，可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本技术的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。此外，尽管在附图中以特定顺序描述了本技术方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序命令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序命令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的命令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序命令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的命令产生包括命令装置的制造品，该命令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。尽管已描述了本技术的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。显然，本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样，倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内，则本技术也意图包含这些改动和变型在内。

背景技术：

1、在视频推荐场景中，通常对象交互过的视频(下称非冷启动视频)能够被捕获一些交互信息，从而被推荐到与该视频交互信息匹配的对象的推荐列表中。但是在视频平台中，也会有新发布的视频加入平台，这些新加入平台的视频(下称冷启动视频)，它们没有任何交互记录，相比于一般视频较难挖掘出视频的交互特性。所以如何将冷启动视频更准确的加入对象的推荐列表中，成为视频推荐中的重要问题。

2、在相关技术中，由于冷启动视频没有对应的交互记录，因而常采用全零向量来替代冷启动视频的交互表示，而对于非冷启动视频，则基于相应的交互记录正常表示，这种差异的出现，导致即使冷启动视频内容上更符合对象偏好，也可能因为这种差异导致冷启动视频不被推荐，从而影响推荐系统的推荐质量。

3、综上，如何提高冷启动视频推荐的准确性是亟待解决的。

技术实现思路

1、本技术实施例提供一种视频推荐模型的训练方法、装置、电子设备和存储介质，用以提高视频推荐的准确性。

2、本技术实施例提供的一种视频推荐模型的训练方法，包括：

3、将选取的各训练样本输入待训练的视频推荐模型，每个训练样本包含样本对象、样本视频和样本标签，所述样本标签表征：相应样本对象是否对相应样本视频产生交互；

4、基于所述视频推荐模型对选取的各训练样本分别进行特征提取，获得相应的提取结果，其中，每个提取结果包含：相应样本视频的内容特征和第一交互特征，以及相应样本对象的对象特征；以及，分别将所述各训练样本包含的样本视频对应的内容特征进行特征映射，获得相应的第二交互特征；

5、分别基于所述各训练样本各自对应的提取结果和第二交互特征进行推荐预测，获得相应的预测结果；

6、基于各预测结果与对应样本标签之间的差异，以及所述各预测结果之间的差异，对所述视频推荐模型进行参数调整。

7、本技术实施例提供的一种视频推荐模型的训练装置，包括：

8、输入单元，用于将选取的各训练样本输入待训练的视频推荐模型，每个训练样本包含样本对象、样本视频和样本标签，所述样本标签表征：相应样本对象是否对相应样本视频产生交互；

9、第一获取单元，用于基于所述视频推荐模型对选取的各训练样本分别进行特征提取，获得相应的提取结果，其中，每个提取结果包含：相应样本视频的内容特征和第一交互特征，以及相应样本对象的对象特征；以及，分别将所述各训练样本包含的样本视频对应的内容特征进行特征映射，获得相应的第二交互特征；

10、第二获取单元，用于分别基于所述各训练样本各自对应的提取结果和第二交互特征进行推荐预测，获得相应的预测结果；

11、调整单元，用于基于各预测结果与对应样本标签之间的差异，以及所述各预测结果之间的差异，对所述视频推荐模型进行参数调整。

12、可选的，对于一个样本视频，若所述样本视频为非冷启动视频，则所述一个样本视频的第一交互特征是基于与相应样本对象的交互信息提取到的；若所述样本视频为冷启动视频，则所述一个样本视频的第一交互特征是基于对应的内容特征进行特征映射得到的。

13、可选的，所述第二获取单元具体用于：

14、分别将所述各训练样本各自对应的内容特征和第一交互特征进行组合，获得相应的第一视频特征，及分别将所述各训练样本各自对应的内容特征和第二交互特征进行组合，获得相应的第二视频特征；

15、分别基于所述各训练样本各自对应的第一视频特征和对象特征进行推荐预测，获得相应的第一预测子结果；

16、分别基于所述各训练样本各自对应的第二视频特征和对象特征进行推荐预测，获得相应的第二预测子结果；

17、分别基于所述各训练样本各自对应的第二交互特征和对象特征进行推荐预测，获得相应的第三预测子结果；

18、分别基于各训练样本各自对应的第一预测子结果、第二预测子结果和第三预测子结果，获得相应的预测结果。

19、可选的，所述调整单元具体用于：

20、基于所述各训练样本的第三预测子结果与对应样本标签之间的差异，构建元损失函数；

21、基于所述各训练样本的第一预测子结果与第二预测子结果之间的差异，构建成对损失函数；

22、基于所述元损失函数和所述成对损失函数构建目标损失函数，并基于所述目标损失函数对所述视频推荐模型进行参数调整。

23、可选的，所述装置还包括：

24、映射单元，用于在所述第二获取单元分别基于所述各训练样本各自对应的提取结果和第二交互特征进行推荐预测，获得相应的预测结果之前，基于预配置的视频映射矩阵，分别对各训练样本对应的第一视频特征和第二视频特征进行映射；

25、基于预配置的对象映射矩阵，分别对各训练样本对应的对象特征进行映射；

26、所述调整单元具体用于：

27、基于所述元损失函数和所述成对损失函数，以及所述视频映射矩阵、所述对象映射矩阵和用于提取内容特征的嵌入因子，构建所述目标损失函数。

28、可选的，训练样本集由包含不同样本对象的训练样本子集组成，每个训练样本子集中对应同一样本对象；

29、所述输入单元还用于通过如下方式选取各训练样本：

30、从所述训练样本集中选取一个训练样本子集，并从所述训练样本子集中选取主训练样本组和辅助训练样本组，所述主训练样本组和所述辅助训练样本组包含的训练样本的数量相同；

31、所述输入单元具体用于：

32、分别将所述主训练样本组和所述辅助训练样本组中的训练样本，输入所述视频推荐模型。

33、可选的，所述第二获取单元具体用于：

34、基于所述主训练样本组中，各主训练样本各自对应的第二交互特征和对象特征进行推荐预测，获得所述各主训练样本各自对应的第三预测子结果；

35、基于获得的各第三预测子结果和相应的样本标签之间的差异，对所述视频推荐模型中的交互表示网络进行梯度更新，所述交互表示网络用于将所述样本视频对应的内容特征进行特征映射，获得相应的第二交互特征；

36、基于所述辅助训练样本组中，各辅助训练样本各自对应的第二交互特征和对象特征进行推荐预测，获得所述各辅助训练样本各自对应的第三预测子结果。

37、可选的，所述调整单元具体用于：

38、基于所述主训练样本组中，各主训练样本各自对应的第三预测子结果和相应的样本标签之间的差异，构建主损失函数；

39、基于所述辅助训练样本组中，各辅助训练样本各自对应的第三预测子结果和相应的样本标签之间的差异，构建辅助损失函数；

40、将所述主损失函数和所述辅助损失函数进行加权求和，获得所述元损失函数。

41、可选的，所述成对损失函数包括：所述主训练样本组和所述辅助训练样本组各自对应的成对损失函数；每个训练样本组包括：至少一个样本标签表征交互的正样本，和至少一个样本标签表征未交互的负样本；

42、所述调整单元具体用于通过如下方式构建每个训练样本组对应的成对损失函数：

43、对于一个训练样本组，基于所述一个训练样本组中，正样本的第一预测子结果和负样本的第一预测子结果之间的差异，构建第一损失函数；

44、基于所述一个训练样本组中，正样本的第二预测子结果和负样本的第一预测子结果之间的差异，构建第二损失函数；

45、基于所述第一损失函数和所述第二损失函数，确定所述成对损失函数。

46、可选的，所述调整单元具体用于：

47、基于所述一个训练样本组中，正样本的第一预测子结果和负样本的第二预测子结果之间的差异，以及正样本的第二预测子结果和负样本的第二预测子结果之间的差异，构建第三损失函数；

48、基于所述第一损失函数，所述第二损失函数，和所述第三损失函数进行加权求和，确定所述成对损失函数。

49、可选的，所述装置还包括：

50、预测单元，用于将待检测视频和待检测对象输入已训练的视频推荐模型；

51、基于所述已训练的视频推荐模型，分别对所述待检测视频和所述待检测对象进行特征提取，获得所述待检测视频对应的目标内容特征和目标交互特征，以及所述待检测对象对应的目标对象特征；

52、将所述待检测视频的目标内容特征和目标交互特征进行组合，获得相应的目标视频特征；

53、基于所述目标视频特征和所述目标对象特征进行推荐预测，获得相应的目标预测结果，所述目标预测结果用于表征将所述待检测视频，推荐给所述待检测对象的概率。

54、本技术实施例提供的一种电子设备，包括处理器和存储器，其中，所述存储器存储有计算机程序，当所述计算机程序被所述处理器执行时，使得所述处理器执行上述任意一种视频推荐模型的训练方法的步骤。

55、本技术实施例提供一种计算机可读存储介质，其包括计算机程序，当所述计算机程序在电子设备上运行时，所述计算机程序用于使所述电子设备执行上述任意一种视频推荐模型的训练方法的步骤。

56、本技术实施例提供一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序存储在计算机可读存储介质中；当电子设备的处理器从计算机可读存储介质读取所述计算机程序时，所述处理器执行所述计算机程序，使得所述电子设备执行上述任意一种视频推荐模型的训练方法的步骤。

57、本技术有益效果如下：

58、本技术实施例提供了一种视频推荐模型的训练方法、装置、电子设备和存储介质，由于本技术提出了基于视频的内容特征学习生成第二交互特征，以第二交互特征模拟冷启动视频的交互信息，以使在进行视频推荐模型训练时，冷启动视频的交互特征不会为全0，缓解冷启动视频在训练过程中因没有交互信息而产生的劣势问题。同时，本技术提供了通过各训练样本各自对应的第一交互特征、第二交互特征和内容特征，以及对象特征来预测样式对象是否会对样本视频产生交互，进而，结合各预测结果与对应样本标签之间的差异，以及，各预测结果之间的差异，对视频推荐模型进行参数调整。其中，结合各预测结果与对应样本标签之间的差异调整模型参数，可以有效提高第二交互特征学习的准确性，而结合各预测结果之间的差异调整模型参数，可以进一步缩小非冷启动视频和冷启动视频的表示差异，最终能够基于预测结果改善冷启动视频在测试阶段预测时的劣势问题，有效提高视频推荐的准确性。

59、本技术的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈昊
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：一种信息推送的方法、装置和电子设备与流程
上一篇：时序数据分析方法、装置、计算设备及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。