面向婴幼儿成长发育的智能问答方法、系统、介质及设备

文档序号:39276410发布日期:2024-09-06 00:51阅读:40来源:国知局
面向婴幼儿成长发育的智能问答方法、系统、介质及设备

本发明属于智能问答系统领域,具体涉及一种面向婴幼儿成长发育的智能问答方法、系统、介质及设备。


背景技术:

1、婴幼儿成长发育领域知识迭代更新迅速,且需要处理的知识较为繁杂;目前的许多问答系统缺乏自然语言处理能力,难以理解用户的复杂查询,提供的答案也缺乏个性化和深度。并且缺乏针对婴幼儿成长发育领域的专业知识库支持,无法提供专业的指导。因此,开发一个专业化的问答系统,能够提供基于最新医学研究、儿童发展理论以及科学的指导方案的专业化、个性化的咨询服务显得尤为重要。


技术实现思路

1、为了弥补现有技术中的缺陷,本发明利用lora微调技术和检索增强生成技术,依托于领域专业知识库来克服以上障碍。具体来说,面向婴幼儿成长发育领域大模型的智能问答系统依托专业领域知识库,利用lora微调技术对现有的经过预训练的大模型进行微调。此外,为了提高问答系统的专业性,对输入的问题进行检索增强生成。此外,针对用户交互性的问题,形成前后端交互形式,设计前端页面与用户进行交互。其技术方案为:

2、一种面向婴幼儿成长发育的智能问答方法,包括以下步骤:

3、s1:构建婴幼儿成长发育领域的专业知识库;

4、s2:以预训练大模型baichuan2-7b-chat基础,通过低秩适应技术进行深度微调;

5、s3:融入检索增强生成技术rag,以prompt提示作为指引,有效检索知识库内关联信息,协助模型推理进程;

6、s4:采用flask框架,构建前端用户界面,借助标准化json格式数据交换,实现前端与后端间通讯。

7、优选的,步骤s1中,从世界卫生组织指南、儿童保健学专著、中国人群身体活动指南以及默沙东诊疗手册,系统性地萃取并整合了涵盖营养、健康、安全保障与早期学习的多元维度的婴幼儿成长发育知识,构建婴幼儿成长发育领域的专业知识库。

8、优选的,步骤s1中,专业知识库由相应专业人士根据各类权威知识库进行整理,并最终整合为问答形式。

9、优选的,步骤s2中,使用lora技术对经过预训练的大模型进行微调步骤如下:

10、s21.首先获取预训练模型baichuan2-7b-chat,记作,使用s1中所获取的专业知识库作为微调数据集,设置相应微调参数,

11、s22.如果当前轮数小于设定的轮数,进入下一步,否则进入步骤s25;

12、s23.继续进行微调,将轮数加1;

13、s24.进入s22;

14、s25.获取经过lora微调之后的张量及相应参数,与之前的预训练模型进行合并,得到经过微调后的模型;

15、s26.结束。

16、优选的,步骤s3中,使用检索增强生成技术对s2中得到的经过微调后的大模型进行增强的步骤如下:

17、s31.使用s1中所获取的专业知识库作为rag数据集,使用开源embedding数据集bge-large-zh-v1.5作为检索增强生成技术的embedding库数据集,将自然语言文本转化为高维向量空间中的稠密向量,以捕获语义层面的内在联系;

18、s32.获取用户输入,将其转换为与专业知识库中条目同维度的向量,确保两者能在同一语义空间内进行有效对比;

19、s33.根据的嵌入的内容与rag数据集中所有文本向量进行匹配计算,找出最相似的前10个向量所对应的文本条目;

20、s34.将检索得到的最相关文本条目提炼为一个精炼的提示h,该提示h既概括了关键知识要点,又与原始用户提问紧密相连;

21、s35.将和h一同作为最终输入传入给;

22、s36.处理最终输入,该模型凭借其强大的语言理解和生成能力,能够在充分理解提示内容的基础上,生成对用户问题的详尽、连贯且精准的回答。

23、优选的,采用flask框架将s3中得到的经过微调后和检索增强生成后的大模型作为后端,设计前端页面实现智能问答系统的步骤如下:

24、s41.利用前端输入框获取用户的问题输入;

25、s42.将获取的输入利用flask框架,转换为json数据格式并传入后端服务器;

26、s43.后端服务器获取前端传入的输入,将对应输入传给经过微调和检索增强的模型进行推理;

27、s44.将推理得到的输出转换为json数据格式并传给前端页面;

28、s45.前端页面接受后端出来的输出,设计相应的动画,以动画形式展示给用户。

29、优选的,步骤s21中,设置学习率为1e-4,确保模型稳定收敛到最优解;设置adam优化器中β1为0.9,β2为0.98,以控制优化,并设置当前轮数为1。

30、一种面向婴幼儿成长发育的智能问答系统,包括专业知识库模块;信息处理模块和输出模块;

31、专业知识库模块:从世界卫生组织指南、儿童保健学专著、中国人群身体活动指南以及默沙东诊疗手册,系统性地萃取并整合了涵盖营养、健康、安全保障与早期学习的多元维度的婴幼儿成长发育知识,构建婴幼儿成长发育领域的专业知识库;

32、信息处理模块:以开源预训练大模型baichuan2-7b-chat作为根基,通过低秩适应技术进行深度微调,融入检索增强生成技术,借助精心设计的prompt提示作为指引,与用户输入信息相关联,有效检索知识库内关联信息,协助模型推理进程;

33、输出模块:采用flask框架,构建前端用户界面,借助标准化json格式数据交换,实现前端与后端间通讯。

34、一种计算机设备,包括至少一个处理器以及存储有计算机程序的计算机可读介质,所述计算机程序被所述处理器读取并运行时,实现如本技术的方法。

35、一种计算机可读介质,所述计算机可读介质存储有计算机程序,所述计算机程序被处理器读取并运行时,实现本技术的方法。

36、相较于现行技术,本发明之优势及其益处概述如下:

37、1.本发明致力于运用面向特定领域的大型预训练模型,构建一个智能问答系统,以实现在实际情境中,于维护用户隐私的同时,对婴幼儿成长发育范畴的疑问给予专业且权威解答的能力。传统问答系统往往局限于提供普通常识的解答,难以胜任专业领域的咨询需求。再者,传统的实体就诊途径,除可能导致个人隐私外泄外,还受限于多种物理条件的约束。尽管经微调的大型模型在特定领域展现良好效能,但鉴于所采纳数据库规模及专业性有限,未能达到最优表现。本发明引入检索增强生成技术,对提出的问题进行深化处理,并采取直观的用户界面设计,促进人机交流。

38、2.设计一种通用的面向婴幼儿成长发育领域大模型的智能问答系统架构,旨在克服当前问答系统在专业度与隐私保护方面的局限。该系统通过利用少量针对性强的数据集对预先训练完成的模型进行调整,促使模型在特定领域内展现高度专业化水平。结合检索增强生成技术,进一步强化模型的信息检索机能,从而显著提升应答质量。

39、3.开发出一种用户界面设计,旨在增强互动体验,确保使用者能够便捷地与系统沟通,实现更加人性化的交互模式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1