本发明涉及人工智能,尤其涉及一种生成式大模型推理结果的验证方法及验证系统。
背景技术:
1、大语言模型(large language model,llm)今年来在自然语言处理(naturallanguage processing,nlp)领域取得了显著的进步。然而,大语言模型中具有若干模型,验证大语言模型的推理过程是否在预期的模型中进行,尤其是在特定领域知识的模型中,是一个亟待解决的问题。
2、目前现有技术通常关注于推理结果的准确性,缺乏对推理过程本身的验证,并且缺乏对隐私的保护和数据的完整性。
3、因此,有必要提供一种新型的生成式大模型推理结果的验证方法及验证系统以解决现有技术中存在的上述部分问题。
技术实现思路
1、本发明的目的在于提供一种生成式大模型推理结果的验证方法及验证系统,以实现对生成式大模型推理过程和推理结果的验证。
2、为实现上述目的,本发明的所述生成式大模型推理结果的验证方法,包括以下步骤:
3、s1:获取大型语言模型推理过程的证据链,所述证据链包括输入数据、若干中间结果数据、若干权重数据、若干算法随机选择数及推理结果;
4、s2:根据所述证据链和目标模型数据复现所述大型语言模型的推理过程,并且在复现所述大型语言模型的推理过程时将每一步骤得到的中间结果数据与所述证据链中对应的中间结果数据进行比较,以得到对比结果,并在判断所述对比结果满足验证条件后,复现所述大型语言模型的推理过程的下一步骤;
5、s3:在复现所述大型语言模型的推理过程的全部步骤后,将复现所述大型语言模型的推理过程时得到的推理结果与所述证据链中的推理结果进行比较,以完成对所述证据链中的推理结果的验证。
6、所述生成式大模型推理结果的验证方法的有益效果在于:获取大型语言模型推理过程的证据链,根据所述证据链和目标模型数据复现所述大型语言模型的推理过程,并且在复现所述大型语言模型的推理过程时将每一步骤得到的中间结果数据与所述证据链中对应的中间结果数据进行比较,以得到对比结果,并在判断所述对比结果满足验证条件后,复现所述大型语言模型的推理过程的下一步骤,能够完成对生成式大模型推理过程的验证,在复现所述大型语言模型的推理过程的全部步骤后,将复现所述大型语言模型的推理过程时得到的推理结果与所述证据链中的推理结果进行比较,以完成对所述证据链中的推理结果的验证,保证了对生成式大模型推推理结果的验证。
7、可选地,所述大型语言模型的推理过程包括以下步骤:
8、s11:将所述输入数据转化为数字编码;
9、s12:将所述数字编码转化为推理模型认可的数字编码序列;
10、s13:所述推理模型根据所述数字编码序列预测新数字编码序列;
11、s14:根据映射表将所述新数字编码序列转换为所述推理结果。
12、可选地,步骤s12和步骤s13均包括若干子步骤。
13、可选地,步骤s1中,获取大型语言模型推理过程的证据链,包括:
14、获取大型语言模型在步骤s12和步骤s13的证据链。其有益效果在于:能够在保证不影响复现所述大型语言模型推理过程的前提下,有效减少所述证据链的大小以及计算量。
15、可选地,所述生成式大模型推理结果的验证方法,还包括:
16、根据所述证据链形成梅克尔帕特里夏树;
17、将所述梅克尔帕特里夏树的根节点传输至可信平台进行存储。
18、可选地,所述生成式大模型推理结果的验证方法,还包括:
19、对所述梅克尔帕特里夏树的根节点进行加密,以得到加密值,然后将所述加密值传输至可信平台进行存储;
20、所述加密包括通过加密公式对所述根节点进行加密,以得到加密值,所述加密公式为c=gv×hr,c为加密值,g和h为椭圆曲线上的生成元,v为根节点。
21、可选地,所述生成式大模型推理结果的验证方法还包括:
22、执行步骤s1至步骤s3时,采用可信执行环境或零知识证明,以保护所述大型语言模型和所述目标模型数据的隐私。
23、可选地,,所述大型语言模型的推理过程包括多头注意力机制算法和多智能体算法中的至少一种,获取多头注意力机制算法和多智能体算法中未被丢弃的结果形成所述证据链。
24、可选地,将复现所述大型语言模型的推理过程时得到的推理结果与所述证据链中的推理结果进行比较,包括:
25、判断复现所述大型语言模型的推理过程时得到的推理结果是否包含时间戳信息;
26、若判断复现所述大型语言模型的推理过程时得到的推理结果不包含时间戳信息,则计算复现所述大型语言模型的推理过程时得到的推理结果的哈希值以及所述证据链中的推理结果的哈希值;
27、将复现所述大型语言模型的推理过程时得到的推理结果的哈希值与所述证据链中的推理结果的哈希值进行对比,若复现所述大型语言模型的推理过程时得到的推理结果的哈希值与所述证据链中的推理结果的哈希值相同,则验证通过。
28、本发明还提供了一种生成式大模型推理结果的验证系统,包括获取单元、复现单元和比较单元,所述获取单元用于获取大型语言模型推理过程的证据链,所述证据链包括输入数据、若干中间结果数据、若干权重数据、若干算法随机选择数及推理结果;所述复现单元用于根据所述证据链和目标模型数据复现所述大型语言模型的推理过程,并且在复现所述大型语言模型的推理过程时将每一步骤得到的中间结果数据与所述证据链中对应的中间结果数据进行比较,以得到对比结果,并在判断所述对比结果满足验证条件后,复现所述大型语言模型的推理过程的下一步骤;所述比较单元用于在所述复现单元复现所述大型语言模型的推理过程的全部步骤后,将复现所述大型语言模型的推理过程时得到的推理结果与所述证据链中的推理结果进行比较,以完成对所述证据链中的推理结果的验证。
29、所述生成式大模型推理结果的验证系统的有益效果在于:所述获取单元用于获取大型语言模型推理过程的证据链,所述复现单元用于根据所述证据链和目标模型数据复现所述大型语言模型的推理过程,并且在复现所述大型语言模型的推理过程时将每一步骤得到的中间结果数据与所述证据链中对应的中间结果数据进行比较,以得到对比结果,并在判断所述对比结果满足验证条件后,复现所述大型语言模型的推理过程的下一步骤,能够完成对生成式大模型推理过程的验证,所述比较单元用于在所述复现单元复现所述大型语言模型的推理过程的全部步骤后,将复现所述大型语言模型的推理过程时得到的推理结果与所述证据链中的推理结果进行比较,以完成对所述证据链中的推理结果的验证,保证了对生成式大模型推推理结果的验证。
1.一种生成式大模型推理结果的验证方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的生成式大模型推理结果的验证方法,其特征在于,所述大型语言模型的推理过程包括以下步骤:
3.根据权利要求2所述的生成式大模型推理结果的验证方,其特征在于,步骤s12和步骤s13均包括若干子步骤。
4.根据权利要求3所述的生成式大模型推理结果的验证方法,其特征在于,步骤s1中,获取大型语言模型推理过程的证据链,包括:
5.根据权利要求1所述的生成式大模型推理结果的验证方法,其特征在于,还包括:
6.根据权利要求5所述的生成式大模型推理结果的验证方法,其特征在于,还包括:
7.根据权利要求1所述的生成式大模型推理结果的验证方法,其特征在于,还包括:
8.根据权利要求1所述的生成式大模型推理结果的验证方法,其特征在于,所述大型语言模型的推理过程包括多头注意力机制算法和多智能体算法中的至少一种,获取多头注意力机制算法和多智能体算法中未被丢弃的结果形成所述证据链。
9.根据权利要求1所述的生成式大模型推理结果的验证方法,其特征在于,将复现所述大型语言模型的推理过程时得到的推理结果与所述证据链中的推理结果进行比较,包括:
10.一种生成式大模型推理结果的验证系统,其特征在于,包括获取单元、复现单元和比较单元,所述获取单元用于获取大型语言模型推理过程的证据链,所述证据链包括输入数据、若干中间结果数据、若干权重数据、若干算法随机选择数及推理结果;所述复现单元用于根据所述证据链和目标模型数据复现所述大型语言模型的推理过程,并且在复现所述大型语言模型的推理过程时将每一步骤得到的中间结果数据与所述证据链中对应的中间结果数据进行比较,以得到对比结果,并在判断所述对比结果满足验证条件后,复现所述大型语言模型的推理过程的下一步骤;所述比较单元用于在所述复现单元复现所述大型语言模型的推理过程的全部步骤后,将复现所述大型语言模型的推理过程时得到的推理结果与所述证据链中的推理结果进行比较,以完成对所述证据链中的推理结果的验证。