本技术涉及智能体,尤其涉及一种推荐智能体系统、推荐方法和推荐装置。
背景技术:
1、智能推荐系统是数字化营销业务中的重要组成部分,它可以根据用户的需求和兴趣,从海量的信息中筛选出最合适的产品,提高用户的满意度和忠诚度。
2、传统的智能推荐系统进行推荐的过程为:获取用户与前端应用的历史交互数据,基于历史交互数据使用推荐系统模型得到推荐结果。由于历史交互数据只能反映用户过去的产品偏好,这使得基于历史推荐交互数据得到的推荐结果可能与用户当前的产品偏好不一致,导致推荐结果不准确。
技术实现思路
1、鉴于上述问题,本技术提供了一种推荐智能体系统、推荐方法和推荐装置,以实现提高推荐结果的准确度的目的。具体方案如下:
2、本技术第一方面提供一种推荐智能体系统,包括:感知模块、记忆模块、规划模块和执行模块;
3、所述感知模块,用于获取人机交互过程中采集的第一对话数据和/或多模态环境数据,其中,所述第一对话数据包括至少一轮对话数据;
4、所述记忆模块,用于获取用户意图相关的历史人机交互数据和拟推荐目标对象,其中,所述用户意图反映用户倾向的推荐对象;
5、所述规划模块,用于检索所述用户意图匹配的参考工作流,根据所述感知模块获取的数据、所述历史人机交互数据、所述拟推荐目标对象和所述参考工作流,生成初始智能体工作流,其中,所述参考工作流是指对所述用户意图相关的场景中的对象进行成功推荐时使用的编排工作流,或与所述用户意图匹配且验证推荐效果后的人工编排工作流,所述初始智能体工作流是将所述参考工作流作为推荐大模型推理使用的思维链,由所述推荐大模型规划编排出的工作流;
6、所述规划模块,还用于调用所述执行模块执行所述初始智能体工作流,基于执行过程中产生的第二对话数据和/或返回数据判断是否对所述初始智能体工作流进行更新,若是,则基于所述第一对话数据、所述第二对话数据和所述参考工作流对所述初始智能体工作流进行更新,调用所述执行模块自更新位置开始执行更新后的智能体工作流,以完成推荐,其中,所述第二对话数据是基于逐步对话式引导策略与所述用户进行的至少一轮对话数据。
7、在一种可能的实现中,所述规划模块在根据所述感知模块获取的数据、所述历史人机交互数据、所述拟推荐目标对象和所述参考工作流,生成初始智能体工作流时,具体用于:
8、将所述感知模块获取的数据、所述历史人机交互数据、所述拟推荐目标对象和所述参考工作流填入所述推荐大模型的第一提示词prompt模板中,得到第一提示指令prompt;
9、将所述第一提示指令prompt输入所述推荐大模型中,得到所述推荐大模型输出的所述初始智能体工作流;
10、其中,所述推荐大模型在训练阶段使用的训练数据包括:训练多模态环境数据和/或训练对话数据、训练历史人机交互数据、训练拟推荐目标对象、训练参考工作流,以及对应的训练初始智能体工作流。
11、在一种可能的实现中,所述推荐大模型在训练阶段使用的训练数据还包括:预配置的自定义工作流和工作流生成规则,其中,所述工作流生成规则用于指示所述推荐大模型遵循所述自定义工作流中的执行逻辑和执行顺序生成所需的工作流。
12、在一种可能的实现中,在所述记忆模块获取用户意图相关的历史人机交互数据和拟推荐目标对象之前,所述感知模块还用于:
13、根据所述感知模块获取的数据,确定所述用户意图。
14、在一种可能的实现中,所述感知模块在根据所述感知模块获取的数据,确定所述用户意图时,具体用于:
15、将所述感知模块获取的数据填入所述推荐大模型的第二提示词prompt模板中,得到第二提示指令prompt;
16、将所述第二提示指令prompt输入所述推荐大模型中,得到所述推荐大模型输出的所述用户意图;
17、其中,所述推荐大模型在训练阶段使用的训练数据包括:训练多模态环境数据和/或训练对话数据,以及对应的训练用户意图。
18、在一种可能的实现中,所述记忆模块在获取所述用户意图相关的历史人机交互数据和拟推荐目标对象时,具体用于:
19、根据所述用户意图,从第一记忆库获取所述历史人机交互数据;
20、根据所述用户意图,从第二记忆库获取所述拟推荐目标对象。
21、在一种可能的实现中,所述多模态环境数据包括图像数据、视频数据、音频数据中的一种或多种。
22、在一种可能的实现中,所述历史人机交互数据为所述用户与推荐助手的历史对话数据的内容概要。
23、本技术第二方面提供一种推荐方法,应用于推荐智能体系统,包括:
24、获取人机交互过程中采集的第一对话数据和/或多模态环境数据,其中,所述第一对话数据包括至少一轮对话数据;
25、获取用户意图相关的历史人机交互数据和拟推荐目标对象,其中,所述用户意图反映用户倾向的推荐对象;
26、检索所述用户意图匹配的参考工作流,根据所述第一对话数据和/或所述多模态环境数据、所述历史人机交互数据、所述拟推荐目标对象,以及所述参考工作流,生成初始智能体工作流,其中,所述参考工作流是指对所述用户意图相关的场景中的对象进行成功推荐时使用的编排工作流,或与所述用户意图匹配且验证推荐效果后的人工编排工作流,所述初始智能体工作流是将所述参考工作流作为推荐大模型推理使用的思维链,由所述推荐大模型规划编排出的工作流;
27、执行所述初始智能体工作流,基于执行过程中产生的第二对话数据和/或返回数据判断是否对所述初始智能体工作流进行更新,若是,则基于所述第一对话数据、所述第二对话数据和所述参考工作流对所述初始智能体工作流进行更新,自更新位置开始执行更新后的智能体工作流,以完成推荐,其中,所述第二对话数据是基于逐步对话式引导策略与所述用户进行的至少一轮对话数据。
28、本技术第三方面提供一种推荐装置,应用于推荐智能体系统,包括:
29、数据获取单元,用于获取人机交互过程中采集的第一对话数据和/或多模态环境数据,其中,所述第一对话数据包括至少一轮对话数据;
30、记忆提取单元,用于获取用户意图相关的历史人机交互数据和拟推荐目标对象,其中,所述用户意图反映用户倾向的推荐对象;
31、工作流编排单元,用于检索所述用户意图匹配的参考工作流,根据所述第一对话数据和/或所述多模态环境数据、所述历史人机交互数据、所述拟推荐目标对象,以及所述参考工作流,生成初始智能体工作流,其中,所述参考工作流是指对所述用户意图相关的场景中的对象进行成功推荐时使用的编排工作流,或与所述用户意图匹配且验证推荐效果后的人工编排工作流,所述初始智能体工作流是将所述参考工作流作为推荐大模型推理使用的思维链,由所述推荐大模型规划编排出的工作流;
32、动态规划单元,用于执行所述初始智能体工作流,基于执行过程中产生的第二对话数据和/或返回数据判断是否对所述初始智能体工作流进行更新,若是,则基于所述第一对话数据、所述第二对话数据和所述参考工作流对所述初始智能体工作流进行更新,自更新位置开始执行更新后的智能体工作流,以完成推荐,其中,所述第二对话数据是基于逐步对话式引导策略与所述用户进行的至少一轮对话数据。
33、借由上述技术方案,本技术提供的推荐智能体系统,感知模块获取人机交互过程中采集的第一对话数据和/或多模态环境数据,根据获取的数据,确定用户意图,记忆模块获取用户意图相关的历史人机交互数据和拟推荐目标对象,规划模块检索用户意图匹配的参考工作流,根据感知模块获取的数据、历史人机交互数据、拟推荐目标对象和参考工作流,生成初始智能体工作流,调用执行模块执行初始智能体工作流,基于执行过程中产生的第二对话数据和/或返回数据判断是否对初始智能体工作流进行更新,若是,则基于第一对话数据、第二对话数据和参考工作流对初始智能体工作流进行更新,调用执行模块自更新位置开始执行更新后的智能体工作流,以完成推荐。
34、由于第一对话数据和多模态环境数据是在用户需要推荐时产生的数据,因而第一对话数据和多模态环境数据能够更好地反映出用户当前的偏好,而历史人机交互数据则能够反映用户过去的兴趣,因此,本技术提供的推荐智能体系统在进行推荐时同时参考第一对话数据、多模态环境数据和历史人机交互数据,能够更准确地确定出用户倾向的推荐对象,提高了推荐准确度。
35、而拟推荐目标对象为推荐过程提供了推荐方向,基于拟推荐目标对象规划初始智能体工作流,再基于初始智能体工作流进行产品推荐,能够在推荐过程中引导用户建立对拟推荐目标对象的兴趣,提高了拟推荐目标对象推荐成功的概率,同时,拟推荐目标对象的存在使得主动推荐成为可能。
36、进一步,本技术中的历史人机交互数据为用户历史长期的记忆数据,将历史人机交互数据与拟推荐目标对象结合,使得本技术能够规划出长期的推荐策略,提高了推荐成功的概率。
37、再进一步的,本技术可以借鉴用户意图相关的场景中的对象的成功推荐经验,将成功推荐该对象时使用的参考工作流作为推荐大模型推理使用的思维链,使得推荐大模型能够借鉴成功推荐的思维模式,提高了推荐大模型自动规划的准确性,基于推荐大模型编排出的准确性更高的初始智能体工作流进行推荐,提高了推荐的准确率。而即使检索不到用户意图相关的场景中的对象进行成功推荐时使用的编排工作流,本技术依然能够将与用户意图匹配且验证推荐效果后的人工编排工作流作为参考工作流,使得基于参考工作流生成的初始智能体工作流能够更有效地进行推荐,提高了推荐成功率。
38、此外,无论当前的推荐任务是否复杂,本技术均能够检索到相对应的参考工作流,在学习该参考工作流的推荐思维模式后再生成初始智能体工作流,使得初始智能体工作流能够面向当前的推荐任务提供更优的推荐策略,提高了推荐准确率和成功率。而相比于现有的推荐方案仅能解决简单推荐任务而言,本技术能够提供准确的初始智能体工作流来解决复杂的推荐任务,应用范围更广。
39、再进一步的,本技术提供的推荐智能体系统在基于自动规划的初始智能体工作流进行推荐的过程中,能够采用逐步对话式引导策略与用户进行一轮或多轮对话得到第二对话数据,第二对话数据以及初始智能体工作流执行过程中产生的返回数据的加入使得本技术更理解用户意图,进而在理解用户意图的基础上动态更新初始智能体工作流,使得更新后的智能体工作流与用户意图更匹配,提高了推荐的准确率。