本技术属于数据处理,具体地说,涉及工程项目大语言模型训练方法及监督评价系统。
背景技术:
1、随着人工智能的飞速发展,出现了越来越多的大语言模型,大语言模型是一种基于深度学习技术的自然语言处理模型,可以生成自然语言文本,大语言模型需要大量的训练数据和计算资源来训练,学习到语言的规律和模式,广泛应用在文本生成、机器翻译、知识问答、智能对话系统等多个领域中,大语言模型训练集的有效性决定了大语言模型的性能的优劣。
2、大语言模型在训练时需要进行多次迭代调控,但是如何进行迭代调控,进行多少次迭代调控是难以控制的,若是迭代调控的方向错误,就可能会造成大语言模型的方向偏离,无法满足工程项目的使用,若是大语言模型已经满足使用需求,后续迭代调控只会造成无效的资源浪费,若是迭代调控的次数不足,就有可能会造成大语言模型的精确度不足,难以满足工程项目的业务需求。
技术实现思路
1、为解决上述问题和技术缺陷,本技术实施例采用如下的技术方案,工程项目大语言模型训练方法,包括以下步骤:
2、步骤1、收集多源数据,对数据进行预处理,去除异常数据,获取标准多源数据;
3、步骤2、根据预处理后的标准多源数据,建立大语言模拟模型和第一训练模型;
4、步骤3、使用大语言模拟模型进行模拟测试应用,对大语言模拟模型进行多次测试和迭代微调,将大语言模拟模型输出结果作为标准输出结果,根据标准输出结果建立第二训练模型;
5、步骤4、获取待训练评价的大语言模型,使用第一训练模型对大语言模型进行训练,得到第一训练结果;
6、步骤5、再使用第二训练模型对大语言模型进行第二次训练,得到第二训练结果,使用第二训练模型对第一训练模型进行评级,得到第一训练模型的评级结果;
7、步骤6、根据第一训练结果、第二训练结果和第一训练模型的评级结果对大语言模型进行评级,得到大语言模型的评级结果;
8、步骤7、根据大语言模型的评级结果对大语言模型输出结果进行监督评价,得到监督评价结果对大语言模型进行模型调控。
9、优选地,所述第一训练模型和第二训练模型每隔预设周期,都会通过更新多源数据对训练模型进行更新,第一训练模型和第二训练模型区别在于第一训练模型的更新频率大于第二训练模型的更新频率。
10、优选地,所述使用第二训练模型对第一训练模型进行评级是将第二训练结果和第一训练结果进行偏差值计算,评级包括:第一评级、第二评级和第三评级;
11、设置两个大小不一的训练模型评级偏差值,将差值计算结果与两个评级偏差值进行比较;
12、若是差值计算结果小于较小的训练模型评级偏差值,则将第一训练模型评为第一评级;
13、若是差值计算结果大于较大的训练模型评级偏差值,则将第一训练模型评为第三评级;
14、否则,则将第一训练模型评为第二评级;
15、当第一训练模型为第二评级或第三评级时,对第一训练模型进行多次迭代微调,直至第一训练模型被评为第一评级。
16、进一步地,所述对大语言模型进行评级步骤如下:
17、步骤601、将第一训练结果与第二训练结果进行偏差值计算,设置两个大小不一的大语言模型评级偏差值,将差值计算结果与两个大语言模型评级偏差值进行比较,评级包括:第一评级、第二评级和第三评级;
18、步骤602、若是差值计算结果小于较小的大语言模型评级偏差值,则将大语言模型评为第一评级;
19、若是差值计算结果大于较大的大语言模型评级偏差值,则将大语言模型评为第三评级;
20、否则,则将大语言模型评为第二评级;
21、步骤603、若是第一训练模型为第一评级,则不对大语言模型的上述评级进行修正;
22、若是第一训练模型为第三评级,则将大语言模型的上述评级修正为第三评级;
23、若是第一训练模型为第二评级,且大语言模型上述评级为第一评级,则将该监测节点从第一评级修正为第二评级,否则,该大语言模型的上述评级全部修正为第三评级。
24、更进一步地,所述第一训练模型和第二训练模型会对大语言模型进行多次训练,对大语言模型进行多次评级,大语言模型将得到多个评级,将最后评级作为大语言模型的评级。
25、工程项目大语言模型监督评价系统,包括:
26、源数据收集模块,用于收集多源数据,对数据进行预处理,去除异常数据,获取标准多源数据;
27、第一训练模型建立模块,用于根据预处理后的标准多源数据,建立大语言模拟模型和第一训练模型;
28、第二训练模型建立模块,用于使用大语言模拟模型进行模拟测试应用,对大语言模拟模型进行多次测试和迭代微调,将大语言模拟模型输出结果作为标准输出结果,根据标准输出结果建立第二训练模型;
29、第一训练模块,用于获取待训练评价的大语言模型,使用第一训练模型对大语言模型进行训练,得到第一训练结果;
30、第二训练模块,用于使用第二训练模型对大语言模型进行第二次训练,得到第二训练结果,使用第二训练模型对第一训练模型进行评级,得到第一训练模型的评级结果;
31、大语言模型评级模块,用于根据第一训练结果、第二训练结果和第一训练模型的评级结果对大语言模型进行评级,得到大语言模型的评级结果;
32、大语言模型调控模块,用于根据大语言模型的评级结果对大语言模型输出结果进行监督评价,得到监督评价结果对大语言模型进行模型调控。
33、优选地,所述第一训练模型和第二训练模型每隔预设周期,都会通过更新多源数据对训练模型进行更新,第一训练模型和第二训练模型区别在于第一训练模型的更新频率大于第二训练模型的更新频率。
34、优选地,所述使用第二训练模型对第一训练模型进行评级是将第二训练结果和第一训练结果进行偏差值计算,评级包括:第一评级、第二评级和第三评级;
35、设置两个大小不一的训练模型评级偏差值,将差值计算结果与两个评级偏差值进行比较;
36、若是差值计算结果小于较小的训练模型评级偏差值,则将第一训练模型评为第一评级;
37、若是差值计算结果大于较大的训练模型评级偏差值,则将第一训练模型评为第三评级;
38、否则,则将第一训练模型评为第二评级;
39、当第一训练模型为第二评级或第三评级时,对第一训练模型进行多次迭代微调,直至第一训练模型被评为第一评级。
40、进一步地,所述对大语言模型进行评级步骤如下:
41、将第一训练结果与第二训练结果进行偏差值计算,设置两个大小不一的大语言模型评级偏差值,将差值计算结果与两个大语言模型评级偏差值进行比较,评级包括:第一评级、第二评级和第三评级;
42、若是差值计算结果小于较小的大语言模型评级偏差值,则将大语言模型评为第一评级;
43、若是差值计算结果大于较大的大语言模型评级偏差值,则将大语言模型评为第三评级;
44、否则,则将大语言模型评为第二评级;
45、若是第一训练模型为第一评级,则不对大语言模型的上述评级进行修正;
46、若是第一训练模型为第三评级,则将大语言模型的上述评级修正为第三评级;
47、若是第一训练模型为第二评级,且大语言模型上述评级为第一评级,则将该监测节点从第一评级修正为第二评级,否则,该大语言模型的上述评级全部修正为第三评级。
48、更进一步地,所述第一训练模型和第二训练模型会对大语言模型进行多次训练,对大语言模型进行多次评级,大语言模型将得到多个评级,将最后评级作为大语言模型的评级。
49、相比于现有技术,本技术实施例的有益效果为:
50、(1)本技术通过获取多源数据,得到获取标准多源数据,再建立大语言模拟模型和第一训练模型,然后对大语言模拟模型进行多次测试和迭代微调,得到标准输出结果,建立第二训练模型,使用两个训练模型对大语言模型进行训练评价,从而得到大语言模型的评价结果,根据评价结果对大语言模型进行模型调控,使调控后的大语言模型更加精确,满足工程项目的使用需求;
51、(2)本技术设立三级评级等级,根据两个评级结果对第一训练模型进行等级评级,从而判断第一训练模型的可信任程度,再对大语言模型进行等级评级,初步判断大语言模型的可信任程度,再结合第一训练模型的可信任程度,得到大语言模型的最终等级评级,也就能根据大语言模型的最终等级评级判断是否可靠和精确,从而能够控制对大语言模型的迭代训练调控次数,避免大语言模型过度迭代造成资源浪费,也避免大语言模型训练迭代次数较少,降低精确度。