本申请涉及电源芯片调试,尤其是涉及一种测试参数调整方法、装置、计算设备及存储介质。
背景技术:
1、针服务器主板开发阶段需要针对cpu供电相关的核心电源模块等进行针对性测试和调节,目前广泛使用的各个厂家电源芯片,输出电压、电流、相位、时延、斜率、offset等参数均可调整。在前期测试静态电流阶段,需按照cpu厂家标准和本产品对应的规格,人工手动多次尝试,确定下来符合厂商标准、裕量较为充分的配置文件。这种调试方式有两点弊端,一方面,多次调试多个参数较为依赖经验,耗时较长。另一方面,人工手动调试存在误差和不确定性,很难有根据地找出最优的裕量空间,为cpu提供最优的静态供电。
技术实现思路
1、本申请提供了测试参数调整方法、装置、计算设备及存储介质,能够合理的得到符合厂商标准、裕量较为充分的电源芯片配置参数。
2、第一方面,本申请提供一种测试参数调整方法,采用如下的技术方案:
3、一种测试参数调整方法,应用于电源芯片,包括以下步骤:
4、根据预采集的基准参数区间,设置环境参数区间,所述基准参数区间包括电压值区间、电流值区间、gain值区间和offset值区间;
5、根据所述环境参数区间通过预训练的强化学习算法进行调参,得到目标参数作为电源芯片的配置参数,所述目标参数值包括电压值、电流值、gain值和offset值。
6、进一步地,上述强化学习算法为马尔科夫决策过程。
7、进一步地,上述马尔科夫决策过程的环境参数包括电压值参数、电流值参数、gain值参数和offset值参数,所述电压值参数、所述电流值参数、所述gain值参数和所述offset值参数分别具有预设的权重。
8、进一步地,上述环境参数中,所述电压值参数的权重为10%,所述电流值参数的权重为10%,所述gain值参数的权重为40%,所述offset值参数的权重为40%。
9、进一步地,上述根据所述环境参数区间通过预训练的强化学习算法进行调参包括以下步骤:
10、s1001:初始化所述马尔科夫决策过程的动作列表,所述动作列表包括在所述环境区间内随机生成一个当前环境参数和若干个有序的执行动作;
11、s1002:根据所述当前环境参数通过动作评价函数计算所述当前环境参数的最大累计回报,所述动作评价函数q(st,at)的计算公式为:
12、q(st,at)=r(st,at)+γmaxq(st+1,at+1);
13、其中,r(st,at)为当前动作的反馈收益,γ为折扣系数,γ的取值范围为[0,1],st为当前的环境参数对应的环境状态,at为当前的环境参数对应的执行动作,at+1表示所述动作列表中的下一步执行动作,st+1表示动作列表中的下一步执行动作对应的环境状态;
14、s1003:判断环境状态是否满足预设的目标函数状态,若满足,输出当前的环境状态对应的环境参数作为目标参数,若不满足,重复步骤s1002,直到得到满足预设的目标函数状态的环境参数。
15、进一步地,上述步骤1002中,还包括设置学习率α,得到动作评价函数q(st,at)的计算公式为:
16、q(st,at)=(1-α)q(st,at)+α(r(st,at)+γmaxq(st+1,at+1))
17、其中,学习率α的取值范围为(0,1),所述学习率α用于使所述动作评价函数q(st,at)在目标区域内收敛。
18、进一步地,上述根据所述环境参数区间通过预训练的强化学习算法进行调参还包括:调用vrtt工具gui的调试接口,模拟当前环境参数对应的电源芯片工况,得到动作评价函数q(st,at)的最大累计回报。
19、第二方面,本申请提供一种测试参数调整装置,采用如下的技术方案:
20、一种测试参数调整装置,包括:
21、预处理模块,用于根据预采集的基准参数区间,设置环境参数区间;
22、参数调整模块,用于根据所述环境参数区间通过预训练的强化学习算法进行调参,得到目标参数;
23、输出模块,用于将目标参数值输出为电源芯片的配置参数。
24、第三方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
25、一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序用于实现上述的方法。
26、第四方面,本申请提供一种计算设备,采用如下的技术方案:
27、一种计算设备,所述计算设备包括存储器和处理器,所述存储器用于存储计算机程序,当所述计算机程序被所述处理器执行时,实现上述的方法。
28、综上所述,本申请包括以下至少一种有益技术效果:
29、本申请提供的一种测试参数调整方法、装置、计算设备及存储介质通过采集电源芯片中电压值、电流值、gain值和offset值的基准参数区间,可以在基准参数区间内选取环境参数区间,进一步地缩小强化学习算法的迭代区间,提高强化学习算法的计算效率;通过强化学习算法对环境参数区间进行调参,具体地,对电压值、电流值、gain值和offset值进行调节,可以有依据地得到裕量充足的电源芯片配置参数,提高了电源芯片调试结果的可信度,同时也极大地提高了电源芯片调试的效率。
1.一种测试参数调整方法,应用于电源芯片,其特征在于,包括以下步骤:
2.根据权利要求1所述的测试参数调整方法,其特征在于:所述强化学习算法为马尔科夫决策过程。
3.根据权利要求2所述的测试参数调整方法,其特征在于:所述马尔科夫决策过程的环境参数包括电压值参数、电流值参数、gain值参数和offset值参数,所述电压值参数、所述电流值参数、所述gain值参数和所述offset值参数分别具有预设的权重。
4.根据权利要求3所述的测试参数调整方法,其特征在于:所述环境参数中,所述电压值参数的权重为10%,所述电流值参数的权重为10%,所述gain值参数的权重为40%,所述offset值参数的权重为40%。
5.根据权利要求3或4所述的测试参数调整方法,其特征在于:所述根据所述环境参数区间通过预训练的强化学习算法进行调参包括以下步骤:
6.根据权利要求5所述的测试参数调整方法,其特征在于:所述步骤1002中,还包括设置学习率α,得到动作评价函数q(st,at)的计算公式为:
7.根据权利要求5所述的测试参数调整方法,其特征在于:所述根据所述环境参数区间通过预训练的强化学习算法进行调参还包括:调用vrtt工具gui的调试接口,模拟当前环境参数对应的电源芯片工况,得到动作评价函数q(st,at)的最大累计回报。
8.一种测试参数调整装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机程序,所述计算机程序用于实现如权利要求1至7中任一权利要求所述的方法。
10.一种计算设备,其特征在于,所述计算设备包括存储器和处理器,所述存储器用于存储计算机程序,当所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一权利要求所述的方法。