一种模型推理方法及装置与流程

文档序号：37750937发布日期：2024-04-25 10:37阅读：13来源：国知局

本发明涉及数据处理，特别是涉及一种模型推理方法及装置。

背景技术：

1、在资源推荐过程中，服务器响应于资源推荐请求，获取候选资源的信息，并将候选资源的信息输入至资源推荐模型中，资源推荐模型基于候选资源的信息进行模型推理，输出是否推荐候选资源的参考信息，从而服务器基于各个候选资源对应的参考信息，确定待向用户推荐的资源，并向用户所使用客户端反馈所确定资源的信息。

2、为了保证向用户推荐资源的准确性，资源推荐模型所处理的信息通常为高维度、数据量大的信息，这样导致了资源推荐过程中模型推理的计算量较大，效率较低。

技术实现思路

1、本发明实施例的目的在于提供一种模型推理方法及装置，以提高模型推理的效率。具体技术方案如下：

2、第一方面，本发明实施例提供了一种模型推理方法，所述方法包括：

3、周期性获取候选资源的与目标用户相关的用户侧特征，并将所述用户侧特征输入资源推荐模型，以使得所述资源推荐模型基于所述用户侧特征进行模型推理，得到表征所述候选资源的推荐优先级的第一推理结果，缓存所述第一推理结果；

4、获得所述候选资源的与用户无关的资源特征，并将所述资源特征输入所述资源推荐模型，以使得所述资源推荐模型基于所述资源特征进行模型推理，得到表征所述候选资源的推荐优先级的第二推理结果，缓存所述第二推理结果；

5、响应于接收到所述目标用户的资源推荐请求，获取所述候选资源的特征中针对所述目标用户的实时特征；

6、将所述实时特征输入所述资源推荐模型，以使得所述资源推荐模型基于所述实时特征进行模型推理，得到表征所述候选资源的推荐优先级的第三推理结果；

7、获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息，其中，所述成功获得的推理结果包括：所述第一推理结果和第三推理结果中已成功获得的推理结果以及所述第二推理结果。

8、本发明的一个实施例中，所述获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息，包括：

9、获得所述资源推荐模型基于已成功获得的各个推理结果进行加和处理得到的、是否推荐所述候选资源的参考信息。

10、本发明的一个实施例中，所述资源推荐模型按照以下方式进行模型推理：

11、根据模型的输入特征对应的权重系数，对输入特征中各特征维度的特征值进行加权求和，得到推理结果。

12、本发明的一个实施例中，所述根据模型的输入特征对应的权重系数，对输入特征中各特征维度的特征值进行加权求和，得到推理结果，包括：

13、在输入特征为所述用户侧特征的情况下，对所述用户侧特征进行时效性划分，得到属于预设的各个时效类型的子特征；

14、针对每一时效类型，根据该时效类型对应的子权重系数，对该时效类型的子特征的特征值进行加权求和，得到子推理结果；

15、将各个时效类型对应的子推理结果进行加和处理，得到所述第一推理结果。

16、本发明的一个实施例中，所述时效类型包括历史特征类型、近线特征类型以及实时特征类型，所述历史特征类型对应的特征时效性低于所述近线特征类型对应的特征时效性，所述近线特征类型对应的特征时效性低于所述实时特征类型对应的特征时效性。

17、本发明的一个实施例中，所述周期性获取候选资源的与目标用户相关的用户侧特征，包括：

18、在所述目标用户为活跃用户的情况下，周期性获取候选资源的与所述目标用户相关的用户侧特征。

19、本发明的一个实施例中，所述资源推荐模型包括数据计算层、数据缓存层以及在线推理层；

20、所述将所述用户侧特征输入资源推荐模型，包括：

21、将所述用户侧特征输入所述数据计算层；

22、所述资源推荐模型基于所述用户侧特征进行模型推理，得到表征所述候选资源的推荐优先级的第一推理结果，缓存所述第一推理结果，包括：

23、所述数据计算层基于所述用户侧特征进行模型推理，得到表征所述候选资源的推荐优先级的第一推理结果，并将所述第一推理结果存储至所述数据缓存层；

24、所述将所述资源特征输入所述资源推荐模型，包括：

25、将所述资源特征输入所述数据计算层；

26、所述资源推荐模型基于所述资源特征进行模型推理，得到表征所述候选资源的推荐优先级的第二推理结果，缓存所述第二推理结果，包括：

27、所述数据计算层基于所述资源特征进行模型推理，得到表征所述候选资源的推荐优先级的第二推理结果，并将所述第二推理结果存储至所述数据缓存层；

28、所述将所述实时特征输入所述资源推荐模型，包括：

29、将所述实时特征存储至所述数据缓存层；

30、所述资源推荐模型基于所述实时特征进行模型推理，得到表征所述候选资源的推荐优先级的第三推理结果，包括：

31、所述在线推理层从所述数据缓存层中获取所述实时特征，基于所述实时特征进行模型推理，得到表征所述候选资源的推荐优先级的第三推理结果；

32、所述获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息，包括：

33、获得所述在线推理层基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息。

34、第二方面，本发明实施例提供了一种模型推理装置，所述装置包括：

35、第一获取模块，用于周期性获取候选资源的与目标用户相关的用户侧特征，并将所述用户侧特征输入资源推荐模型，以使得所述资源推荐模型基于所述用户侧特征进行模型推理，得到表征所述候选资源的推荐优先级的第一推理结果，缓存所述第一推理结果；

36、第二获取模块，用于获得所述候选资源的与用户无关的资源特征，并将所述资源特征输入所述资源推荐模型，以使得所述资源推荐模型基于所述资源特征进行模型推理，得到表征所述候选资源的推荐优先级的第二推理结果，缓存所述第二推理结果；

37、第三获取模块，用于响应于接收到所述目标用户的资源推荐请求，获取所述候选资源的特征中针对所述目标用户的实时特征；

38、特征输入模块，用于将所述实时特征输入所述资源推荐模型，以使得所述资源推荐模型基于所述实时特征进行模型推理，得到表征所述候选资源的推荐优先级的第三推理结果；

39、信息获得模块，用于获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息，其中，所述成功获得的推理结果包括：所述第一推理结果和第三推理结果中已成功获得的推理结果以及所述第二推理结果。

40、本发明的一个实施例中，所述信息获得模块，具体用于：

41、获得所述资源推荐模型基于已成功获得的各个推理结果进行加和处理得到的、是否推荐所述候选资源的参考信息。

42、本发明的一个实施例中，所述资源推荐模型按照以下方式进行模型推理：

43、根据模型的输入特征对应的权重系数，对输入特征中各特征维度的特征值进行加权求和，得到推理结果。

44、本发明的一个实施例中，所述根据模型的输入特征对应的权重系数，对输入特征中各特征维度的特征值进行加权求和，得到推理结果，包括：

45、在输入特征为所述用户侧特征的情况下，对所述用户侧特征进行时效性划分，得到属于预设的各个时效类型的子特征；

46、针对每一时效类型，根据该时效类型对应的子权重系数，对该时效类型的子特征的特征值进行加权求和，得到子推理结果；

47、将各个时效类型对应的子推理结果进行加和处理，得到所述第一推理结果。

48、本发明的一个实施例中，所述时效类型包括历史特征类型、近线特征类型以及实时特征类型，所述历史特征类型对应的特征时效性低于所述近线特征类型对应的特征时效性，所述近线特征类型对应的特征时效性低于所述实时特征类型对应的特征时效性。

49、本发明的一个实施例中，所述第一获取模块，具体用于：

50、在所述目标用户为活跃用户的情况下，周期性获取候选资源的与所述目标用户相关的用户侧特征。

51、本发明的一个实施例中，所述资源推荐模型包括数据计算层、数据缓存层以及在线推理层；

52、所述第一获取模块，具体用于：

53、将所述用户侧特征输入所述数据计算层；

54、所述资源推荐模型基于所述用户侧特征进行模型推理，得到表征所述候选资源的推荐优先级的第一推理结果，缓存所述第一推理结果，包括：

55、所述数据计算层基于所述用户侧特征进行模型推理，得到表征所述候选资源的推荐优先级的第一推理结果，并将所述第一推理结果存储至所述数据缓存层；

56、所述第二获取模块，具体用于：

57、将所述资源特征输入所述数据计算层；

58、所述资源推荐模型基于所述资源特征进行模型推理，得到表征所述候选资源的推荐优先级的第二推理结果，缓存所述第二推理结果，包括：

59、所述数据计算层基于所述资源特征进行模型推理，得到表征所述候选资源的推荐优先级的第二推理结果，并将所述第二推理结果存储至所述数据缓存层；

60、所述第三获取模块，具体用于：

61、将所述实时特征存储至所述数据缓存层；

62、所述资源推荐模型基于所述实时特征进行模型推理，得到表征所述候选资源的推荐优先级的第三推理结果，包括：

63、所述在线推理层从所述数据缓存层中获取所述实时特征，基于所述实时特征进行模型推理，得到表征所述候选资源的推荐优先级的第三推理结果；

64、所述信息获得模块，具体用于：

65、获得所述在线推理层基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息。

66、第三方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

67、存储器，用于存放计算机程序；

68、处理器，用于执行存储器上所存放的程序时，实现上述第一方面任一所述的方法步骤。

69、第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面任一所述的方法步骤。

70、本发明实施例有益效果：

71、由以上可见，应用本发明实施例提供的方案进行模型推理时，在服务器响应于资源推荐请求之前，资源推荐模型已经缓存有基于用户侧特征得到的第一推理结果、以及基于资源特征得到的第二推理结果，这样在服务器响应于资源推荐请求，即进行资源推荐的过程中，资源推荐模型仅需要对少量的实时特征进行处理，得到第三推理结果，并基于成功获得的推理结果输出参考信息，而无需在这一过程中对大量的用户侧特征以及资源特征进行处理，因此，应用本发明实施例提供的模型推理方案，在实现实时推荐的前提下，能够减少资源推荐过程中资源推荐模型的处理量，从而提高模型推理的效率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：魏菱延,李剑戈,吴华普,刘菲
技术所有人：中信建投证券股份有限公司
我是此专利的发明人

上一篇：一种手机屏幕尺寸在线检测装置的制作方法
上一篇：电极用安装装置以及脉冲激光沉积镀膜设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。