一种获取图形处理器信息的方法、装置、设备及存储介质与流程

文档序号:32943238发布日期:2023-01-14 09:45阅读:53来源:国知局
一种获取图形处理器信息的方法、装置、设备及存储介质与流程

1.本发明涉及数据处理技术领域,尤其涉及一种获取图形处理器信息的方法、装置、设备及存储介质。


背景技术:

2.随着人工智能、深度学习、云计算等高新技术的发展,gpu服务器所占市场份额在快速增加,并广泛应用于专业图形可视化、数据中心和消费级娱乐游戏等领域。
3.出于需要,bmc会与gpu进行大量信息交互。现有技术采用的是同步读取gpu信息的方式,即bmc向gpu发送请求信息后等待gpu的响应,gpu收到请求信息后进行响应发送给bmc。
4.然而,现有的bmc读取gpu信息的方式缺乏一定的稳定性。当bmc向gpu发送请求时,如果其中一个gpu未能响应从而请求失败,bmc读取gpu信息的进程就会一直阻塞。由于无法读取其他gpu信息,后续的gpu监控工作也就无法进行。同时,现有的bmc读取gpu信息的方式是单线程阻塞等待gpu的响应,存在一定延时,会影响整个监控gpu进程的运行速度,无法及时获取到所有要监控的gpu信息。


技术实现要素:

5.本发明提供了一种获取图形处理器信息的方法、装置、设备及存储介质,以解决单线程读取gpu信息的阻塞和延时问题。
6.根据本发明的一方面,提供了一种获取图形处理器信息的方法,包括:
7.在轮询标志位为第一状态的情况下,通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识;
8.在所述轮询标志位为第二状态的情况下,通过轮询线程根据所述轮询标识向所述至少一个图形处理器发送状态轮询请求;
9.通过所述轮询线程根据所述图形处理器返回的状态轮询响应获取图形处理器信息。
10.可选地,所述通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识,包括:
11.通过所述主线程根据待获取图形处理器信息的类型,向所述至少一个图形处理器发送对应类型的信息读取请求;
12.通过所述主线程获取所述图形处理器返回的信息读取响应,其中,所述信息读取响应包含图形处理器对所述信息读取请求的接收状态和轮询标识;
13.通过所述主线程根据所述接收状态获取所述信息读取响应中的轮询标识。
14.通过上述方式实现在主线程发送信息读取请求之后,根据信息读取响应校验信息读取请求是否被成功接收,可以减少程序出错的可能性,提高程序的稳定性。
15.可选地,所述通过所述主线程根据所述接收状态获取所述信息读取响应中的轮询
标识,包括:
16.在所述接收状态为接收成功的情况下,通过所述主线程获取所述信息读取响应中的轮询标识;
17.在所述接收状态为接收失败的情况下,返回执行通过所述主线程根据待获取图形处理器信息的类型,向所述至少一个图形处理器发送对应类型的信息读取请求。
18.通过上述方式实现在信息读取请求接收成功的情况下,主线程才会获取轮询标识,在未接收成功的情况下,主线程重新发送信息读取请求,避免因信息读取请求未被图形处理器成功接收,而不能获取该图形处理器的图形处理器信息的情况发生。
19.可选地,在根据所述图形处理器返回的信息读取响应获取轮询标识之后,还包括:
20.通过所述主线程将所述轮询标志位修改为第二状态。
21.通过这种方式实现在获取轮询标识之后,通过主线程将轮询标志位修改为第二状态,以启动轮询线程。
22.可选地,所述通过所述轮询线程根据所述图形处理器返回的状态轮询响应获取图形处理器信息,包括:
23.通过所述轮询线程获取所述图形处理器返回的状态轮询响应;
24.通过所述轮询线程根据所述状态轮询响应确定所述轮询标识的有效性和所述图形处理器信息的准备进度;
25.对于所述轮询标识为有效轮询标识且所述准备进度为准备完成的目标图形处理器,通过轮询线程获取所述目标图形处理器的图形处理器信息。
26.通过上述方式实现对轮询标识的有效性校验,避免因gpu提供无效的轮询标识导致轮询线程一直轮询不到图形处理器信息的情况。
27.可选地,所述通过所述轮询线程根据所述状态轮询响应确定所述轮询标识的有效性,包括:
28.通过所述轮询线程判断所述状态轮询响应中是否包含图形处理器信息的准备进度;
29.若是,则确定所述轮询标识为有效轮询标识;
30.否则,通过轮询线程将所述轮询标识作为目标轮询标识,继续执行轮询,根据目标轮询标识对应的图形处理器返回的状态轮询响应判断所述目标轮询标识是否有效;
31.如果在对所述目标轮询标识对应的图形处理器的轮询次数未超过所述设定次数的情况下,检测到对应的状态轮询响应包含图形处理器信息的准备进度,则确定所述目标轮询标识为有效轮询标识;
32.如果在对所述目标轮询标识对应的图形处理器的轮询次数达到或超过所述设定次数的情况下,未检测到对应的状态轮询响应包含图形处理器信息的准备进度,则确定所述目标轮询标识为无效轮询标识,通过所述轮询线程将所述轮询标志位修改为第一状态。
33.通过检测状态轮询响应不包含图形处理器信息的图形处理器,在设定次数的轮询操作中是否返回包含图形处理器信息的方式,校验轮询标识的有效性,避免因轮询线程一致轮询不到图形处理器信息而导致程序阻塞。
34.可选地,还包括:
35.在通过所述轮询线程获取的图形处理器信息符合监测的情况下,通过所述轮询线
程将所述轮询标志位修改为第一状态。
36.通过上述方式实现在获取到各类型的待获取图形处理器信息之后,将轮询标志位修改为第一状态,以结束轮询工作。
37.根据本发明的另一方面,提供了一种获取图形处理器信息的装置,包括:
38.轮询标识获取模块,用于在轮询标志位为第一状态的情况下,通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识;
39.状态轮询请求发送模块,用于在所述轮询标志位为第二状态的情况下,通过轮询线程根据所述轮询标识向所述至少一个图形处理器发送状态轮询请求;
40.信息获取模块,用于通过所述轮询线程根据所述图形处理器返回的状态轮询响应获取图形处理器信息。
41.可选地,所述轮询标识获取模块410,包括:
42.信息读取请求发送单元,用于通过所述主线程根据待获取图形处理器信息的类型,向所述至少一个图形处理器发送对应类型的信息读取请求。
43.信息读取响应获取单元,用于通过所述主线程获取所述图形处理器返回的信息读取响应,其中,所述信息读取响应包含图形处理器对所述信息读取请求的接收状态和轮询标识。
44.轮询标识读取单元,用于通过所述主线程根据所述接收状态获取所述信息读取响应中的轮询标识。
45.可选地,所述轮询标识读取单元,包括:
46.轮询标识读取子单元,用于在所述接收状态为接收成功的情况下,通过所述主线程获取所述信息读取响应中的轮询标识。
47.信息读取请求发送子单元,用于在所述接收状态为接收失败的情况下,返回执行通过所述主线程根据待获取图形处理器信息的类型,向所述至少一个图形处理器发送对应类型的信息读取请求。
48.可选地,所述装置还包括:
49.第一修改模块,用于通过所述主线程将所述轮询标志位修改为第二状态。
50.可选地,所述信息获取模块430,包括:
51.状态轮询响应获取单元,用于通过所述轮询线程获取所述图形处理器返回的状态轮询响应。
52.进度和有效性确定单元,用于通过所述轮询线程根据所述状态轮询响应确定所述轮询标识的有效性和所述图形处理器信息的准备进度。
53.信息获取单元,用于对于所述轮询标识为有效轮询标识且所述准备进度为准备完成的目标图形处理器,通过轮询线程获取所述目标图形处理器的图形处理器信息。
54.可选地,所述进度和有效性确定单元具体用于:
55.通过所述轮询线程判断所述状态轮询响应中是否包含图形处理器信息的准备进度;
56.若是,则确定所述轮询标识为有效轮询标识;
57.否则,通过轮询线程将所述轮询标识作为目标轮询标识,继续执行轮询,根据目标
轮询标识对应的图形处理器返回的状态轮询响应判断所述目标轮询标识是否有效;
58.如果在对所述目标轮询标识对应的图形处理器的轮询次数未超过所述设定次数的情况下,检测到对应的状态轮询响应包含图形处理器信息的准备进度,则确定所述目标轮询标识为有效轮询标识;
59.如果在对所述目标轮询标识对应的图形处理器的轮询次数达到或超过所述设定次数的情况下,未检测到对应的状态轮询响应包含图形处理器信息的准备进度,则确定所述目标轮询标识为无效轮询标识,通过所述轮询线程将所述轮询标志位修改为第一状态。
60.可选地,还包括:
61.第二修改模块,用于在通过所述轮询线程获取的图形处理器信息符合监测的情况下,通过所述轮询线程将所述轮询标志位修改为第一状态。
62.根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
63.至少一个处理器;以及
64.与所述至少一个处理器通信连接的存储器;其中,
65.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的获取图形处理器信息的方法。
66.根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的获取图形处理器信息的方法。
67.本发明实施例的技术方案,通过在轮询标志位为第一状态的情况下,通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识;在所述轮询标志位为第二状态的情况下,通过轮询线程根据所述轮询标识向所述至少一个图形处理器发送状态轮询请求;通过所述轮询线程根据所述图形处理器返回的状态轮询响应获取图形处理器信息,解决了单线程获取信息的阻塞和延时问题,相比现有技术的单线程同步读取gpu信息,去除了bmc阻塞等待gpu返回信息的过程,减少了bmc等待gpu返回信息的时延,提高了bmc读取gpu信息的效率以及程序的稳定性,有利于确保gpu监控工作的平稳进行,提高了系统的安全性。
68.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
69.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
70.图1为本发明实施例提供的一种获取图形处理器信息的方法的流程图;
71.图2为本发明实施例提供的一种获取轮询标识方法中主线程执行方法的流程图;
72.图3为本发明实施例提供的一种获取图形处理器信息方法中轮询线程执行方法的流程图;
73.图4为本发明实施例提供的另一种获取图形处理器信息的方法的流程图;
74.图5为本发明实施例提供的一种获取图形处理器信息的装置的结构示意图;
75.图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
76.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
77.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
78.图1为本发明实施例提供的一种获取图形处理器信息的方法的流程图,本实施例可适用于bmc读取gpu信息的情况,该方法可以由获取图形处理器信息的装置来执行,该获取图形处理器信息的装置可以采用硬件和/或软件的形式实现,该获取图形处理器信息的装置可配置于电子设备中。例如,电子设备可以为服务器或服务器集群等。
79.如图1所示,该方法包括:
80.步骤110、在轮询标志位为第一状态的情况下,通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识。
81.通常情况下,基板管理控制器(bmc,baseboard management controller)负责监控服务器的状态信息,需要与图形处理器(gpu,graphic processing unit)进行大量的信息交互,例如获取图形处理器的温度信息进行风扇调速控制,获取图形处理器的资产信息提供管理者查阅等。
82.轮询标志位为调整主线程与轮询线程工作状态的标志位,通过轮询标志位的状态使主线程和轮询线程之间的配合有序进行。轮询标志位的状态通过置位或清空的操作而改变。例如,在轮询标志位被清空之后,轮询标志位为第一状态。在轮询标志位被置位之后,轮询标志位为第二状态。
83.在本发明中,在轮询标志位为第一状态的情况下,基板管理控制器通过主线程向图形处理器信息发送信息读取请求,根据基板管理控制器向图形处理器信息发送的信息读取请求图形处理器会返回一个信息读取响应,如果基板管理控制器发送的信息读取请求是有效的,可以根据接收到图形处理器返回的信息读取响应读取轮询标识。主线程接收到轮询标识后将其写入全局变量,同时将轮询标志位由第一状态修改为第二状态。
84.在根据所述图形处理器返回的信息读取响应获取轮询标识之后,还包括:
85.通过主线程将轮询标志位修改为第二状态。例如,通过主线程置位轮询标志位,以
将轮询标志位修改为第二状态。
86.步骤120、在所述轮询标志位为第二状态的情况下,通过轮询线程根据所述轮询标识向所述至少一个图形处理器发送状态轮询请求。
87.需要说明的是,轮询标志位由第一状态变为第二状态后,轮询线程开始轮询工作,此时主线程不需要等待图形处理器返回要读取的信息,而是继续发送读取其他信息的命令,轮询线程是和主线程并行工作。
88.具体的,当轮询线程监听到轮询标识位由第一状态变为第二状态后从全局变量中获取轮询标识,然后向图形处理器发送状态轮询请求获取所要读取信息的状态,根据请求命令的返回状态判断轮询标识是否有效。如果轮询标识有效,则继续向下一个图形处理器发送状态轮询请求。如果不能确定轮询标识有效,则在继续向下一个图形处理器发送状态轮询请求之前,记录该图形处理器的轮询次数。如果该图形处理器的轮询次数等于或超过设定次数的情况下,仍未获取到包含图形处理器信息的状态轮回响应,则确定该轮询标识无效。
89.步骤130、通过所述轮询线程根据所述图形处理器返回的状态轮询响应获取图形处理器信息。
90.具体的,根据轮询线程向图形处理器发送状态轮询请求,图形处理器会返回一个状态轮询响应,若图形处理器在内存中准备好了基板管理控制器要读取的状态信息数据,通过轮询线程可以读取该图形处理器的内存中的图形处理器信息,并将所读取数据写入共享内存。如果所有待获取gpu信息的图形处理器中目标类型的gpu信息均被轮询线程读取,则确定通过轮询线程获取的图形处理器信息符合监测,将轮询标志位清空,轮询工作至此完成。基板管理控制器可以通过共享内存获取相应的数据。
91.本发明实施例中,通过在轮询标志位为第一状态的情况下,通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识;在所述轮询标志位为第二状态的情况下,通过轮询线程根据所述轮询标识向所述至少一个图形处理器发送状态轮询请求;通过所述轮询线程根据所述图形处理器返回的状态轮询响应获取图形处理器信息,解决了单线程获取信息的阻塞和延时问题,相比现有技术的单线程同步读取gpu信息,解决了单线程获取信息的阻塞和延时问题,相比现有技术的单线程同步读取gpu信息,去除了bmc阻塞等待gpu返回信息的过程,减少了bmc等待gpu返回信息的时延,提高了bmc读取gpu信息的效率以及程序的稳定性,有利于确保gpu监控工作的平稳进行,提高了系统的安全性。
92.图2为本发明实施例提供的一种获取轮询标识方法中主线程执行方法的流程图,本实施例在上述实施例的基础上对通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识进一步细化。如图2所示,该方法包括:
93.步骤210、通过所述主线程根据待获取图形处理器信息的类型,向所述至少一个图形处理器发送对应类型的信息读取请求。
94.具体的,待获取图形处理器信息可以包括温度、功耗、利用率等信息,基板管理控制器根据待获取图形处理器信息类型的不同,向各个图形处理器循环发送不同的信息读取请求。
95.假设有4个gpu,分别为gpu1、gpu2、gpu3和gpu4,待获取图形处理器信息的类型包括温度、功耗等,则主线程依次向gpu1、gpu2、gpu3和gpu4发送温度信息读取请求,无需阻塞等待gpu返回信息读取响应。相似地,主线程依次向gpu1、gpu2、gpu3和gpu4发送功耗信息读取请求,对于其他类型的待获取图形处理器信息采用相似的方式循环发送信息读取请求。
96.步骤220、通过所述主线程获取所述图形处理器返回的信息读取响应,其中,所述信息读取响应包含图形处理器对所述信息读取请求的接收状态和轮询标识。
97.具体的,图形处理器在通过主线程接受到基板管理控制器发送的信息读取请求后会返回一个对应的信息读取响应,信息读取响应包含图形处理器对信息读取请求的接收状态,接收状态可以是接收成功或接收失败。若接收状态为接收成功,信息读取响应中还会包含一个轮询标识。
98.步骤230、通过所述主线程根据所述接收状态获取所述信息读取响应中的轮询标识。
99.具体的,所述通过所述主线程根据所述接收状态获取所述信息读取响应中的轮询标识,包括:
100.在所述接收状态为接收成功的情况下,通过所述主线程获取所述信息读取响应中的轮询标识;在所述接收状态为接收失败的情况下,返回执行通过所述主线程根据待获取图形处理器信息的类型,向所述至少一个图形处理器发送对应类型的信息读取请求。
101.具体的,若接收状态为接收成功,图形处理器返回的信息读取响应中还会包含一个与信息读取请求对应的轮询标识,基板管理控制器可以通过主线程读取响应中的轮询标识。若接收状态为接收失败,则基板管理控制器重新发送读取信息的请求。
102.本发明实施例加入了错误检验机制,避免因gpu概率性接收请求失败导致无法返回轮询标识,进而不能获取图形处理器信息的情况,根据信息读取响应校验信息读取请求是否被成功接收,如果请求失败,主线程则重新发送请求,有利于及时排查错误,提高程序运行的稳定性。
103.图3为本发明实施例提供的一种获取图形处理器信息方法中轮询线程执行方法的流程图,本实施例在上述实施例的基础上对通过所述轮询线程根据所述图形处理器返回的状态轮询响应获取图形处理器信息进一步细化。如图3所示,该方法包括:
104.步骤310、通过所述轮询线程获取所述图形处理器返回的状态轮询响应。
105.具体的,根据轮询线程向图形处理器发送状态轮询请求,图形处理器会返回一个状态轮询响应,状态轮询响应包括图形处理器信息的准备进度。
106.沿用上述4个gpu的示例,轮询线程依次向gpu1、gpu2、gpu3和gpu4发送温度信息的状态轮询请求,无需阻塞等待gpu返回状态轮询响应。轮询线程依次向gpu1、gpu2、gpu3和gpu4发送功耗信息的状态轮询请求,对于其他类型的待获取图形处理器信息采用相似的方式循环发送状态轮询请求。
107.步骤320、通过所述轮询线程根据所述状态轮询响应确定所述轮询标识的有效性和所述图形处理器信息的准备进度。
108.示例性地,所述通过所述轮询线程根据所述状态轮询响应确定所述轮询标识的有效性,包括:
109.通过所述轮询线程判断所述状态轮询响应中是否包含图形处理器信息的准备进
度;若是,则确定所述轮询标识为有效轮询标识;否则,否则,通过轮询线程将所述轮询标识作为目标轮询标识,继续执行轮询,根据目标轮询标识对应的图形处理器返回的状态轮询响应判断所述目标轮询标识是否有效;
110.如果在对所述目标轮询标识对应的图形处理器的轮询次数未超过所述设定次数的情况下,检测到对应的状态轮询响应包含图形处理器信息的准备进度,则确定所述目标轮询标识为有效轮询标识;
111.如果在对所述目标轮询标识对应的图形处理器的轮询次数达到或超过所述设定次数的情况下,未检测到对应的状态轮询响应包含图形处理器信息的准备进度,则确定所述目标轮询标识为无效轮询标识,通过所述轮询线程将所述轮询标志位修改为第一状态。
112.具体的,图形处理器接收到状态轮询请求后,立即开始在内存中准备基板管理控制器要读取的状态信息数据,同时会返回轮询线程一个包含准备进度信息的状态轮询响应,确定该图形处理器对应的轮询标识有效。若轮询线程收到图形处理器返回的正在执行中的进度信息,则继续向下一个图形处理器发送状态轮询请求。轮询线程轮询一轮(假设有4个gpu,则轮询一轮为分别向gpu1、gpu2、gpu3和gpu4发送过一次状态轮询请求)之后会继续向上一轮轮询结果为正在准备gpu信息的图形处理器发送状态轮询请求,以查询数据准备进度,直到图形处理器返回一个准备完成的进度信息。若图形处理器返回的状态轮询响应中没有包含信息的准备进度,则不能确定轮询标识为有效标识,将该轮询标识作为目标轮询标识,继续执行轮询,根据目标轮询标识对应的图形处理器返回的状态轮询响应判断目标轮询标识是否有效。例如,预先设置轮询10次且未获取到包含图形处理器信息的准备进度的状态轮询响应,则确定对应的轮询标识为无效标识。如果在第5次对目标轮询标识对应的图形处理器进行轮询时,获取到包含图形处理器的准备进度的状态轮询响应,则确定目标轮询标识为有效标识。如果对目标轮询标识对应的图形处理器进行完10次轮询且任何一次轮询得到的状态轮询响应中均不好汉图形处理器信息的准备进度,则确定目标轮询标识为无效标识,并将轮询标志位由第二状态修改为第一状态,监听到轮询标志位为第一状态后,基板管理控制器会通过主线程向图形处理器信息再次发送信息读取请求。
113.步骤330、对于所述轮询标识为有效轮询标识且所述准备进度为准备完成的目标图形处理器,通过轮询线程获取所述目标图形处理器的图形处理器信息。
114.具体的,当轮询线程接收到图形处理器返回的准备完成的进度信息时,可以到图形处理器的内存中读取准备好的数据,并将读取完成的数据写入共享内存,以方便基板管理控制器获得。
115.步骤340、在通过所述轮询线程获取的图形处理器信息符合监测的情况下,通过所述轮询线程将所述轮询标志位修改为第一状态。
116.其中,监测要求用于规定各被监测图形处理器以及各图形处理器中的待获取图形处理器信息。例如,监测要求可以为分别获取gpu1、gpu2、gpu3和gpu4中的温度信息和功耗信息。满足监控要求可以理解为获取到gpu1、gpu2、gpu3和gpu4中所有轮询标识有效的gpu的温度信息和功耗信息。
117.本发明实施例加入了错误检验机制,避免因gpu会概率性的提供无效的轮询标识导致轮询线程持续轮询不到数据的情况,通过校验轮询标识的有效性排除无效的轮询标识,重新获取有效的轮询标识,避免因轮询线程一致轮询不到图形处理器信息而导致程序
阻塞,有利于及时排查错误,提高程序运行的稳定性。
118.图4为本发明实施例提供的另一种获取图形处理器信息的方法的流程图。该方法包括:
119.s401、主线程监听轮询标志位。
120.s402、轮询线程监听轮询标志位。
121.具体地,主线程和轮询线程并行存在,分别监听轮询标志位。
122.s403、主线程循环发送信息读取请求到gpui,其中,i=1,2,
……
,n。
123.s404、gpui向主线程发送信息读取响应,所述信息读取响应包含轮询标识。
124.s405、主线程判断信息读取请求是否是有效请求,若是,则执行s406,否则执行s403。
125.示例性地,主线程根据信息读取响应判断信息读取请求是否被gpui成功接收,从而判断信息读取请求是否是有效请求。
126.s406、主线程将轮询标识写入全局变量,并置位轮询标志位。
127.示例性地,如果信息读取请求为有效请求,则主线程将图形处理器响应该信息读取请求返回的轮询标识写入全局变量,并将轮询标志位置位,以使轮询标志位为第二状态。
128.s407、轮询线程从全局变量中获取轮询标识。
129.s408、轮询线程向gpui发送状态轮询请求。
130.s409、gpui向轮询线程发送状态轮询响应。
131.s410、轮询线程判断轮询标识是否有效,若是,则执行s408,否则执行s411。
132.s411、在轮询标识为无效标识的情况下,轮询线程清空轮询标志位,继续执行s403,以通知主线程重新发送信息读取请求到无效标识对应的图形处理器。
133.s412、轮询线程根据状态轮询响应中的gpu信息的准备进度,确定gpu信息的准备进度为准备完成的目标gpu。
134.s413、轮询线程向目标gpu发送内存读取请求。
135.s414、目标gpu向轮询线程发送内存读取响应,其中,内存读取响应中包含gpu信息。
136.s415、轮询线程将gpu信息写入共享内存。
137.图5为本发明实施例提供的一种获取图形处理器信息的装置的结构示意图。如图5所示,该装置包括:
138.轮询标识获取模块510,用于在轮询标志位为第一状态的情况下,通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识。
139.状态轮询请求发送模块520,用于在所述轮询标志位为第二状态的情况下,通过轮询线程根据所述轮询标识向所述至少一个图形处理器发送状态轮询请求。
140.信息获取模块530,用于通过所述轮询线程根据所述图形处理器返回的状态轮询响应获取图形处理器信息。
141.可选地,所述轮询标识获取模块510,包括:
142.信息读取请求发送单元,用于通过所述主线程根据待获取图形处理器信息的类型,向所述至少一个图形处理器发送对应类型的信息读取请求。
143.信息读取响应获取单元,用于通过所述主线程获取所述图形处理器返回的信息读取响应,其中,所述信息读取响应包含图形处理器对所述信息读取请求的接收状态和轮询标识。
144.轮询标识读取单元,用于通过所述主线程根据所述接收状态获取所述信息读取响应中的轮询标识。
145.可选地,所述轮询标识读取单元,包括:
146.轮询标识读取子单元,用于在所述接收状态为接收成功的情况下,通过所述主线程获取所述信息读取响应中的轮询标识。
147.信息读取请求发送子单元,用于在所述接收状态为接收失败的情况下,返回执行通过所述主线程根据待获取图形处理器信息的类型,向所述至少一个图形处理器发送对应类型的信息读取请求。
148.可选地,所述装置还包括:
149.第一修改模块,用于通过所述主线程将所述轮询标志位修改为第二状态。
150.可选地,所述信息获取模块530,包括:
151.状态轮询响应获取单元,用于通过所述轮询线程获取所述图形处理器返回的状态轮询响应。
152.进度和有效性确定单元,用于通过所述轮询线程根据所述状态轮询响应确定所述轮询标识的有效性和所述图形处理器信息的准备进度。
153.信息获取单元,用于对于所述轮询标识为有效轮询标识且所述准备进度为准备完成的目标图形处理器,通过轮询线程获取所述目标图形处理器的图形处理器信息。
154.可选地,所述进度和有效性确定单元具体用于:
155.通过所述轮询线程判断所述状态轮询响应中是否包含图形处理器信息的准备进度;
156.若是,则确定所述轮询标识为有效轮询标识;
157.否则,通过轮询线程将所述轮询标识作为目标轮询标识,继续执行轮询,根据目标轮询标识对应的图形处理器返回的状态轮询响应判断所述目标轮询标识是否有效;
158.如果在对所述目标轮询标识对应的图形处理器的轮询次数未超过所述设定次数的情况下,检测到对应的状态轮询响应包含图形处理器信息的准备进度,则确定所述目标轮询标识为有效轮询标识;
159.如果在对所述目标轮询标识对应的图形处理器的轮询次数达到或超过所述设定次数的情况下,未检测到对应的状态轮询响应包含图形处理器信息的准备进度,则确定所述目标轮询标识为无效轮询标识,通过所述轮询线程将所述轮询标志位修改为第一状态。
160.可选地,还包括:
161.第二修改模块,用于在通过所述轮询线程获取的图形处理器信息符合监测的情况下,通过所述轮询线程将所述轮询标志位修改为第一状态。
162.本发明实施例中,通过在轮询标志位为第一状态的情况下,通过主线程向至少一个图形处理器发送信息读取请求,根据所述图形处理器返回的信息读取响应获取轮询标识;在所述轮询标志位为第二状态的情况下,通过轮询线程根据所述轮询标识向所述至少一个图形处理器发送状态轮询请求;通过所述轮询线程根据所述图形处理器返回的状态轮
询响应获取图形处理器信息,解决了单线程获取信息的阻塞和延时问题,相比现有技术的单线程同步读取gpu信息,去除了bmc阻塞等待gpu返回信息的过程,减少了bmc等待gpu返回信息的时延,提高了bmc读取gpu信息的效率以及程序的稳定性,有利于确保gpu监控工作的平稳进行,提高了系统的安全性。
163.本发明实施例所提供的获取图形处理器信息的装置可执行本发明任意实施例所提供的获取图形处理器信息的方法,具备执行方法相应的功能模块和有益效果。
164.图6为本发明实施例提供的一种电子设备的结构示意图。图6示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如服务器、刀片式服务器、大型计算机、和其它适合的计算机。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
165.如图6所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
166.电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
167.处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如获取图形处理器信息的方法。
168.在一些实施例中,方法获取图形处理器信息可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的方法获取图形处理器信息的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行获取图形处理器信息的方法。
169.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该
至少一个输出装置。
170.用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
171.在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
172.为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
173.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
174.计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
175.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
176.上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1