本发明涉及自然语言处理,具体涉及一种基于大模型的行业数据查询方法及装置。
背景技术:
1、随着大数据的发展,各行各业的人员会通过查询行业数据来进行数据分析。
2、目前查询行业数据的方式为:查询人员通过结构化查询语言(structured querylanguage,sql)来从数据库中查询想要的行业数据。但是,前述查询方式需要查询人员耗费一定时间来学习sql并编写准确的sql指令,查询成本较高、查询准确率较低和查询效率较低。
技术实现思路
1、有鉴于此,本发明实施例提供一种基于大模型的行业数据查询方法及装置,以解决现有查询方式存在的查询成本较高、查询准确率较低和查询效率较低等问题。
2、为实现上述目的,本发明实施例提供如下技术方案:
3、本发明实施例第一方面公开一种基于大模型的行业数据查询方法,所述方法包括:
4、加载目标行业对应的大模型,所述目标行业为任意行业,所述目标行业对应的大模型基于样本数据训练得到;
5、获取按照任意查询模式构建的以自然语言表达的查询语句;
6、将所述查询语句输入所述大模型,使所述大模型从所述目标行业对应的通用数据表中查询与所述查询语句相匹配的查询结果,所述通用数据表的核心列包含以下任意一项或多项:指标列、维度列、属性列、值列和单位列;
7、若获取得到由所述大模型反馈的所述查询结果,输出所述查询结果。
8、优选的,获取按照任意查询模式构建的以自然语言表达的查询语句,包括:
9、检测到用户输入内容时,展示智能提示信息,所述智能提示信息包含:各个查询模式对应的提问样式;
10、获取所述用户按照任意所述查询模式对应的提问样式构建的以自然语言表达的查询语句。
11、优选的,基于样本数据训练得到所述目标行业对应的大模型的过程,包括:
12、获取所述目标行业对应的样本数据,其中,所述样本数据包含多组问答脚本对,每组所述问答脚本对包含相对应的问题脚本和答案脚本,所述问题脚本的类型为属性脚本、指标维度脚本、范围询问脚本、值问法脚本或值范围反问脚本;
13、在启用第一训练方式的情况下,利用部分所述样本数据对预训练模型进行部分模型参数的调整,以得到所述目标行业对应的大模型;
14、在启用第二训练方式的情况下,利用全量所述样本数据对特定模型或所述预训练模型进行全面训练,以得到所述目标行业对应的大模型。
15、优选的,将所述查询语句输入所述大模型之后,还包括:
16、若获取得到由所述大模型反馈的错误信息,输出所述错误信息和/或建议信息,所述错误信息用于表征所述大模型不能识别所述查询语句,所述建议信息用于建议采用任意所述查询模式来构建所述查询语句。
17、优选的,还包括:
18、收集反馈信息;
19、按照所述反馈信息修正所述大模型。
20、优选的,还包括:
21、按照预设的更新周期,对所述大模型进行更新迭代。
22、本发明实施例第二方面公开一种基于大模型的行业数据查询装置,所述装置包括:
23、加载单元,用于加载目标行业对应的大模型,所述目标行业为任意行业,所述目标行业对应的大模型基于样本数据训练得到;
24、获取单元,用于获取按照任意查询模式构建的以自然语言表达的查询语句;
25、查询单元,用于将所述查询语句输入所述大模型,使所述大模型从所述目标行业对应的通用数据表中查询与所述查询语句相匹配的查询结果,所述通用数据表的核心列包含以下任意一项或多项:指标列、维度列、属性列、值列和单位列;
26、输出单元,用于若获取得到由所述大模型反馈的所述查询结果,输出所述查询结果。
27、优选的,所述获取单元包括:
28、展示模块,用于检测到用户输入内容时,展示智能提示信息,所述智能提示信息包含:各个查询模式对应的提问样式;
29、获取模块,用于获取所述用户按照任意所述查询模式对应的提问样式构建的以自然语言表达的查询语句。
30、优选的,所述加载单元包括:
31、获取模块,用于获取所述目标行业对应的样本数据,其中,所述样本数据包含多组问答脚本对,每组所述问答脚本对的类型为属性脚本、指标维度脚本、范围询问脚本、值问法脚本或值范围反问脚本,每组所述问答脚本对包含相对应的问题脚本和答案脚本;
32、第一训练模块,用于在启用第一训练方式的情况下,利用部分所述样本数据对预训练模型进行部分模型参数的调整,以得到所述目标行业对应的大模型;
33、第二训练模块,用于在启用第二训练方式的情况下,利用全量所述样本数据对特定模型或所述预训练模型进行全面训练,以得到所述目标行业对应的大模型。
34、优选的,所述输出单元还用于:若获取得到由所述大模型反馈的错误信息,输出所述错误信息和/或建议信息,所述错误信息用于表征所述大模型不能识别所述查询语句,所述建议信息用于建议采用任意所述查询模式来构建所述查询语句。
35、基于上述本发明实施例提供的一种基于大模型的行业数据查询方法及装置,该方法为:加载目标行业对应的大模型;获取按照任意查询模式构建的以自然语言表达的查询语句;将查询语句输入大模型,使大模型从目标行业对应的通用数据表中查询与查询语句相匹配的查询结果;若获取得到由大模型反馈的查询结果,输出查询结果。本方案中,加载目标行业对应的大模型,获取用户以自然语言表达的查询语句,将查询语句输入大模型以获得查询结果。用户不需要学习sql和编写sql指令,通过自然语言和大模型即可查询想要的查询结果,降低查询成本、提高查询准确率和提高查询效率。
1.一种基于大模型的行业数据查询方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,获取按照任意查询模式构建的以自然语言表达的查询语句,包括:
3.根据权利要求1所述的方法,其特征在于,基于样本数据训练得到所述目标行业对应的大模型的过程,包括:
4.根据权利要求1所述的方法,其特征在于,将所述查询语句输入所述大模型之后,还包括:
5.根据权利要求1-4中任一所述的方法,其特征在于,还包括:
6.根据权利要求1-4中任一所述的方法,其特征在于,还包括:
7.一种基于大模型的行业数据查询装置,其特征在于,所述装置包括:
8.根据权利要求7所述的装置,其特征在于,所述获取单元包括:
9.根据权利要求7所述的装置,其特征在于,所述加载单元包括:
10.根据权利要求7所述的装置,其特征在于,所述输出单元还用于:若获取得到由所述大模型反馈的错误信息,输出所述错误信息和/或建议信息,所述错误信息用于表征所述大模型不能识别所述查询语句,所述建议信息用于建议采用任意所述查询模式来构建所述查询语句。