本技术涉及人工智能领域,尤其涉及一种数据处理方法及相关装置。
背景技术:
1、人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
2、选择率预测(或者称之为点击率预测),是指预测用户在特定环境下对某个物品的选择概率。例如,应用商店、在线广告等应用的推荐系统中,选择率预测起到关键作用;通过选择率预测可以实现最大化企业的收益和提升用户满意度,推荐系统需同时考虑用户对物品的选择率和物品竞价,其中,选择率为推荐系统根据用户历史行为预测得到,而物品竞价代表该物品被选择/下载后系统的收益。例如,可以通过构建一个函数,该函数可以根据预测的用户选择率和物品竞价计算得到一个函数值,推荐系统按照该函数值对物品进行降序排列。
3、为满足用户个性化的需求,推荐系统包括多种推荐场景:浏览器、负一屏、视频流等。用户根据偏好在不同的场景产生不同的行为,每个场景有用户特有的行为特性。在通常情况下,会为每一个场景单独建模。为单个场景独立建模,由于同一个用户在不同的场景中会有不同的行为,无法有效捕获用户不同场景下的行为特征,且在场景比较多的情况下,为每个场景独立建模并维护,会造成较大的人力和资源消耗。且,若通过一个特征提取网络来提取多个场景下的特征,由于不同场景之间的特征不同,网络无法学习到共有的行为特性,导致操作信息的预测精度较差。
技术实现思路
1、本技术提供了一种数据处理方法,可以在保证不增加推荐模型的规模的前提下,提高多推荐场景的预测精度。
2、第一方面,本技术提供了一种数据处理方法,所述方法包括:获取提示prompt和第一特征表示;所述prompt为根据和推荐场景相关的信息得到;所述第一特征表示为对用户和物品的属性信息进行特征提取得到;根据所述prompt和第一特征表示的融合结果,通过推荐模型,预测所述用户对所述物品的操作信息;在所述操作信息满足预设条件时,向所述用户推荐所述物品。
3、在现有的实现中,将用户和物品的属性信息对应的特征表示作为推荐模型的输入,来预测用户对物品的操作信息,然而上述方式为了能够在多推荐场景中仍然可以得到较高精度的预测结果,一种实现是通过构建更复杂的推荐模型,推荐模型包括多个分支(也就是多个塔),每个分支可以负责处理一个推荐场景的预测,然而,随着推荐场景的不断变多,会使得推荐模型的规模变大,这在一些场景中是不被接受的。
4、本技术实施例中,除了将用户和物品的属性信息对应的特征表示作为推荐模型的输入,还将能够携带和推荐场景相关的信息的提示prompt(也就是该prompt为根据和推荐场景相关的信息得到)作为推荐模型的输入,能够引导推荐模型在进行操作信息的预测时进行偏向于prompt指示的场景的特点来预测,进而在保证不增加推荐模型的规模的前提下,提高多推荐场景的预测精度。
5、在一种可能的实现中,所述和推荐场景相关的信息包括:所述推荐场景的指示信息;或者,所述用户的属性信息;或者,所述用户的属性信息的特征表示。
6、在一种可能的实现中,所述获取prompt,包括:对所述和推荐场景相关的信息进行独热编码,得到所述prompt;或,通过神经网络,对所述和推荐场景相关的信息进行处理,得到所述prompt;或,通过神经网络,对所述和推荐场景相关的信息进行处理,得到多个权重,每个权重对应一个特征表示,并根据所述权重,将多个所述特征表示进行融合,得到所述prompt。
7、在一种可能的实现中,推荐场景可以为一种服务于特定需求的应用程序,比如华为浏览器、华为视频,也可以指具体的频道,比如浏览器信息流中的娱乐频道、新闻频道、科技频道等。
8、在一种可能的实现中,不同的推荐场景为不同的应用程序,或者是,不同的推荐场景为为不同类的应用程序(例如视频类的应用程序和浏览器类的应用程序为不同的应用程序),或者是,不同的推荐场景为相同应用程序的不同功能(例如同一个应用程序的不同频道,例如新闻频道、科技频道等),上述不同的功能可以按照推荐类别进行划分。
9、在一种可能的实现中,不同的所述推荐场景可以为推荐所在的不同的物理场景,例如不同的城市、不同的省份等。
10、在一种可能的实现中,不同的所述推荐场景可以为不同开发者开发的应用程序。
11、在一种可能的实现中,不同的所述推荐场景可以为不同或者不同类的电商产品。
12、在一种可能的实现中,属性信息包括用户的用户属性,用户属性包括如下的至少一种:性别,年龄,职业,收入,爱好,教育程度。
13、在一种可能的实现中,属性信息包括物品的物品属性,物品属性包括如下的至少一种:物品名称,开发者,安装包大小,品类,好评度。
14、其中,用户的属性信息可以为与用户喜好特征相关的属性,性别、年龄、职业、收入、爱好以及受教育程度中的至少一种,其中,性别可以为男或者女,年龄可以为0-100之间的数字,职业可以为教师、程序员、厨师等等,爱好可以为篮球、网球、跑步等等,受教育程度可以为小学、初中、高中、大学等等;本技术并不限定用户的属性信息的具体类型;
15、其中,物品可以为实体物品,或者是虚拟物品,例如可以为app、音视频、网页以及新闻资讯等物品,物品的属性信息可以为物品名称、开发者、安装包大小、品类以及好评度中的至少一种,其中,以物品为应用程序为例,物品的品类可以为聊天类、跑酷类游戏、办公类等等,好评度可以为针对于物品的打分、评论等;本技术并不限定物品的属性信息的具体类型。
16、第二方面,本技术提供了一种数据处理方法,所述方法包括:获取提示prompt和第一特征表示;所述prompt为根据和推荐场景相关的信息得到;所述第一特征表示为对用户和物品的属性信息进行特征提取得到;根据所述prompt和第一特征表示的融合结果,通过推荐模型,预测所述用户对所述物品的操作信息;根据所述操作信息和对应的标签,更新所述推荐模型。
17、在现有的实现中,在进行适用于多推荐场景的推荐模型的微调时,需要对嵌入层和推荐模型的全部均进行更新,这会导致负迁移和跷跷板效应,即提升某个场景的推荐准确率需要以损害其他场景的表现为代价,进而导致模型的在多场景的推荐精度较差,
18、本技术实施例中,引入了能够指示推荐场景的提示prompt作为推荐模型的输入,在模型微调(可选的,也可以适用于预训练)时,可以固定不同场景之间共有的部分,而更新模型中和场景强相关的部分(例如用于生成prompt的神经网络或者是推荐模型中的线性层等),可以使得在进行一个推荐场景的模型训练时模型针对于该场景的推荐精度的提高,同时也不会损害模型在其他推荐场景中的表现。
19、在一种可能的实现中,所述获取提示prompt和第一特征表示,包括:通过神经网络,对所述和推荐场景相关的信息进行处理,得到所述prompt;或,通过神经网络,对所述和推荐场景相关的信息进行处理,得到多个权重,每个权重对应一个特征表示,并根据所述权重,将多个所述特征表示进行融合,得到所述prompt;通过嵌入层,对所述用户和物品的属性信息进行特征提取,得到所述第一特征表示。
20、在一种可能的实现中,所述方法还包括:根据所述操作信息和对应的标签,在保持所述嵌入层的参数固定的情况下,更新所述神经网络。
21、在一种可能的实现中,所述更新所述推荐模型,包括:仅更新所述推荐模型中的部分网络。
22、在一种可能的实现中,所述部分网络为线性层。
23、在一种可能的实现中,所述和推荐场景相关的信息包括:
24、所述推荐场景的指示信息;或者,
25、所述用户的属性信息;或者,
26、所述用户的属性信息的特征表示。
27、在一种可能的实现中,
28、不同的所述推荐场景为不同的应用程序;或者,
29、不同的所述推荐场景为不同类的应用程序;或者,
30、不同的所述推荐场景为同一个应用程序的不同功能;或者,
31、不同的所述推荐场景为推荐所在的不同的物理场景;或者,
32、不同的所述推荐场景为不同开发者开发的应用程序;或者,
33、不同的所述推荐场景为不同或者不同类的电商产品。
34、第三方面,本技术提供了一种数据处理装置,所述装置包括:
35、处理模块,用于获取第一特征表示和第二特征表示;所述第一特征表示为通过对提示prompt进行特征提取得到的,所述第二特征表示为对用户和物品的属性信息进行特征提取得到的;所述prompt携带和推荐场景相关的信息;根据所述第一特征表示和第二特征表示的融合结果,通过推荐模型,预测所述用户对所述物品的操作信息;
36、推荐模型,用于在所述操作信息满足预设条件时,向所述用户推荐所述物品。
37、在一种可能的实现中,所述和推荐场景相关的信息包括:
38、所述推荐场景的指示信息;或者,
39、所述用户的属性信息;或者,
40、所述用户的属性信息的特征表示。
41、在一种可能的实现中,所述处理模块,具体用于:
42、对所述和推荐场景相关的信息进行独热编码,得到所述prompt;或,
43、通过神经网络,对所述和推荐场景相关的信息进行处理,得到所述prompt;或,
44、通过神经网络,对所述和推荐场景相关的信息进行处理,得到多个权重,每个权重对应一个特征表示,并根据所述权重,将多个所述特征表示进行融合,得到所述prompt。
45、在一种可能的实现中,
46、不同的所述推荐场景为不同的应用程序;或者,
47、不同的所述推荐场景为不同类的应用程序;或者,
48、不同的所述推荐场景为同一个应用程序的不同功能;或者,
49、不同的所述推荐场景为推荐所在的不同的物理场景;或者,
50、不同的所述推荐场景为不同开发者开发的应用程序;或者,
51、不同的所述推荐场景为不同或者不同类的电商产品。
52、第四方面,本技术提供了一种数据处理装置,所述装置包括:
53、处理模块,用于获取提示prompt和第一特征表示;所述prompt为根据和推荐场景相关的信息得到;所述第一特征表示为对用户和物品的属性信息进行特征提取得到;
54、根据所述prompt和第一特征表示的融合结果,通过推荐模型,预测所述用户对所述物品的操作信息;
55、更新模块,用于根据所述操作信息和对应的标签,更新所述推荐模型。
56、在一种可能的实现中,所述处理模块,具体用于:
57、通过神经网络,对所述和推荐场景相关的信息进行处理,得到所述prompt;或,通过神经网络,对所述和推荐场景相关的信息进行处理,得到多个权重,每个权重对应一个特征表示,并根据所述权重,将多个所述特征表示进行融合,得到所述prompt;
58、通过嵌入层,对所述用户和物品的属性信息进行特征提取,得到所述第一特征表示。
59、在一种可能的实现中,所述更新模块,还用于:
60、根据所述操作信息和对应的标签,在保持所述嵌入层的参数固定的情况下,更新所述神经网络。
61、在一种可能的实现中,所述更新模块,具体用于:
62、仅更新所述推荐模型中的部分网络。
63、在一种可能的实现中,所述部分网络为线性层。
64、在一种可能的实现中,所述和推荐场景相关的信息包括:
65、所述推荐场景的指示信息;或者,
66、所述用户的属性信息;或者,
67、所述用户的属性信息的特征表示。
68、在一种可能的实现中,
69、不同的所述推荐场景为不同的应用程序;或者,
70、不同的所述推荐场景为不同类的应用程序;或者,
71、不同的所述推荐场景为同一个应用程序的不同功能;或者,
72、不同的所述推荐场景为推荐所在的不同的物理场景;或者,
73、不同的所述推荐场景为不同开发者开发的应用程序;或者,
74、不同的所述推荐场景为不同或者不同类的电商产品。
75、第五方面,本技术实施例提供了一种数据处理装置,可以包括存储器、处理器以及总线系统,其中,存储器用于存储程序,处理器用于执行存储器中的程序,以执行如上述第一方面任一可选的方法。
76、第六方面,本技术实施例提供了一种数据处理装置,可以包括存储器、处理器以及总线系统,其中,存储器用于存储程序,处理器用于执行存储器中的程序,以执行如上述第二方面任一可选的方法。
77、第七方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面及任一可选的方法、以及上述第三方面任一可选的方法。
78、第八方面,本技术实施例提供了一种计算机程序产品,包括代码,当代码被执行时,用于实现上述第一方面及任一可选的方法、以及上述第二方面任一可选的方法。
79、第九方面,本技术提供了一种芯片系统,该芯片系统包括处理器,用于支持执行设备或训练设备实现上述方面中所涉及的功能,例如,发送或处理上述方法中所涉及的数据;或,信息。在一种可能的设计中,芯片系统还包括存储器,所述存储器,用于保存执行设备或训练设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。