一种GPU测试方法、装置、存储介质及电子设备与流程

文档序号:37640404发布日期:2024-04-18 18:01阅读:8来源:国知局
一种GPU测试方法、装置、存储介质及电子设备与流程

本说明书涉及计算机,尤其涉及一种gpu测试方法、装置、存储介质及电子设备。


背景技术:

1、随着机器学习模型的规模逐渐增大,模型参数在亿级甚至十亿级规模的大模型开始越来越多的应用于各种领域,如何训练这种大模型称为业界的热点话题。

2、目前,图形处理器(graphics processing unit,gpu)开始广泛应用于大模型的训练中,而鉴于市场上存在形形色色的多种gpu,如何对gpu性能进行进行更为有效的测试成为了一个亟待解决的问题。


技术实现思路

1、本说明书实施例提供一种gpu测试方法、装置、存储介质及电子设备,以部分解决上述现有技术存在的问题。

2、本说明书实施例采用下述技术方案:

3、本说明书提供的一种gpu测试方法,电子设备上安装有待测试gpu和标准gpu,所述方法包括:

4、获取待训练机器学习模型的配置信息以及训练样本;

5、基于所述配置信息,分别通过所述待测试gpu和所述标准gpu,采用所述训练样本对所述待训练机器学习模型进行训练;

6、在通过所述待测试gpu对所述待训练机器学习模型进行训练的过程中,采集所述待训练机器学习模型的训练性能数据,作为待测训练性能数据;在通过所述标准gpu对所述待训练机器学习模型进行训练的过程中,采集所述待训练机器学习模型的训练性能数据,作为比对训练性能数据;

7、根据所述待测训练性能数据和所述比对训练性能数据,获取针对所述待测试gpu的测试信息。

8、可选地,第一电子设备上安装有待测试gpu、第一统一计算架构,以及基于所述第一统一计算架构的第一深度神经网络加速库,所述基于所述第一统一计算架构的第一深度神经网络加速库用于使第一电子设备通过所述待测试gpu对所述待训练机器学习模型进行训练;

9、第二电子设备上安装有标准gpu、第二统一计算架构,以及基于所述第二统一计算架构的第二深度神经网络加速库,所述基于所述第二统一计算架构的第二深度神经网络加速库用于使第二电子设备通过所述标准gpu对所述待训练机器学习模型进行训练。

10、可选地,所述配置信息包括多种类型的待训练机器学习模型的配置信息;

11、分别通过所述待测试gpu和所述标准gpu,采用所述训练样本对所述待训练机器学习模型进行训练,具体包括:

12、分别通过所述待测试gpu和所述标准gpu,采用所述训练样本对多种类型的待训练机器学习模型进行训练。

13、可选地,采用所述训练样本对所述待训练机器学习模型进行训练,具体包括:

14、在预设的每个第一周期内,采用所述训练样本,基于预设的第一参数和预设的第二参数,对所述待训练机器学习模型进行训练;

15、在预设的每个第二周期内,采用所述训练样本,基于预设的第三参数和预设的第四参数,对所述待训练机器学习模型进行训练;

16、其中,所述第二周期长于所述第一周期,所述第一参数和第三参数用于表征训练的轮次,所述第二参数和第四参数用于表征训练过程中的每次迭代输入至所述待训练机器学习模型的训练样本的数量,所述第三参数大于所述第一参数,所述第四参数的数量大于所述第二参数的数量。

17、可选地,所述方法还包括:

18、获取通过待测试gpu训练得到的机器学习模型,作为第一模型;获取通过标准gpu训练得到的机器学习模型,作为第二模型;

19、将测试样本分别输入所述第一模型和第二模型,将所述第一模型输出的处理结果作为待测结果,将所述第二模型输出的处理结果作为比对结果;采集所述第一模型输出所述待测结果的过程中的运行性能数据,作为待测运行性能数据;采集所述第二模型输出所述比对结果的过程中的运行性能数据,作为比对运行性能数据;

20、根据所述待测训练性能数据和所述比对训练性能数据,获取针对所述待测试gpu的测试信息,具体包括:

21、根据所述待测训练性能数据、所述比对训练性能数据、所述待测结果、所述比对结果、所述待测运行性能数据和所述比对运行性能数据,获取针对所述待测试gpu的测试信息。

22、可选地,所述训练性能数据包括以下数据中的至少一种:

23、训练所采用的训练样本的数量;

24、训练轮次;

25、训练过程中的平均损失;

26、训练过程中的每秒处理的数据量;

27、各训练样本的平均训练耗时;

28、每轮次训练的耗时;

29、训练总耗时。

30、可选地,所述运行性能数据至少包括以下数据中的至少一种:

31、输入的测试样本的数量;

32、运行过程中的每秒处理的数据量;

33、处理每个测试样本的平均耗时;

34、对每个测试样本进行前处理的平均耗时;

35、对每个测试样本进行后处理的平均耗时;

36、处理各测试样本的总耗时。

37、可选地,根据所述待测训练性能数据、所述比对训练性能数据、所述待测结果、所述比对结果、所述待测运行性能数据和所述比对运行性能数据,获取针对所述待测试gpu的测试信息,具体包括:

38、根据所述待测结果,确定所述第一模型的准确率;根据所述比对结果,确定所述第二模型的准确率;

39、根据所述待测训练性能数据、所述比对训练性能数据、所述第一模型的准确率、所述第二模型的准确率、所述待测运行性能数据和所述比对运行性能数据,获取针对所述待测试gpu的测试信息。

40、可选地,所述方法还包括:

41、根据所述待测训练性能数据和所述比对训练性能数据,展示所述待测试gpu训练模型的训练性能测试信息;和/或

42、根据所述第一模型的准确率和所述第二模型的准确率,展示所述待测试gpu运行模型的精度测试信息;和/或

43、根据所述待测运行性能数据和所述比对运行性能数据,展示所述待测试gpu运行模型的运行性能测试信息。

44、本说明书提供的一种gpu测试装置,所述装置位于电子设备中,所述电子设备上安装有待测试gpu和标准gpu,所述装置包括:

45、获取模块,用于获取待训练机器学习模型的配置信息以及训练样本;

46、训练模块,用于基于所述配置信息,分别通过所述待测试gpu和所述标准gpu,采用所述训练样本对所述待训练机器学习模型进行训练;

47、采集模块,用于在通过所述待测试gpu对所述待训练机器学习模型进行训练的过程中,采集所述待训练机器学习模型的训练性能数据,作为待测训练性能数据;在通过所述标准gpu对所述待训练机器学习模型进行训练的过程中,采集所述待训练机器学习模型的训练性能数据,作为比对训练性能数据;

48、测试模块,用于根据所述待测训练性能数据和所述比对训练性能数据,获取针对所述待测试gpu的测试信息。

49、本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的gpu测试方法。

50、本说明书提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的gpu测试方法。

51、本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:

52、本说明书实施例分别通过待测试gpu和标准gpu对待训练机器学习模型进行训练,并在训练过程中分别采集待测试gpu和标准gpu在训练过程中的训练性能数据,最后可根据待测试gpu和标准gpu的训练性能数据对待测试gpu进行测试,从而可科学全面、自动化地测试gpu在应用于训练大模型时的通用计算能力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1