本公开的示例实施例总体涉及计算机领域,特别地涉及用于模型性能评测的方法、装置、设备和计算机可读存储介质。
背景技术:
1、随着机器学习技术的发展,已经可以利用机器学习模型来执行多种应用环境中的任务。这些机器学习模型广泛应用于各种领域,包括图像识别、语音识别、医疗诊断、股市分析、自动驾驶等。但目前的机器学习模型依然存在一些问题,导致无法正常为用户提供服务。
技术实现思路
1、在本公开的第一方面,提供了一种模型性能评测的方法。该方法包括:获取用于模型攻击的意图样本集和模式样本集,意图样本集包括与模型攻击有关的一个或多个攻击意图样本,模式样本集包括针对模型的一个或多个攻击模式样本;基于意图样本集所包括的攻击意图样本和模式样本集所包括的攻击模式样本,生成第一测试样本集,第一测试样本集中的测试样本具有攻击意图和攻击模式;以及基于目标模型执行第一测试样本集的输出数据,确定针对目标模型的抗攻击性能的评测结果。
2、在本公开的第二方面,提供了一种用于模型性能评测的装置。该装置包括:获取模块,被配置为获取用于模型攻击的意图样本集和模式样本集,意图样本集包括与模型攻击有关的一个或多个攻击意图样本,模式样本集包括针对模型的一个或多个攻击模式样本;生成模块,被配置为基于意图样本集所包括的攻击意图样本和模式样本集所包括的攻击模式样本,生成第一测试样本集,第一测试样本集中的测试样本具有攻击意图和攻击模式;以及确定模块,被配置为基于目标模型执行第一测试样本集的输出数据,确定针对目标模型的抗攻击性能的评测结果。
3、在本公开的第三方面,提供了一种电子设备。该设备包括至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令在由至少一个处理单元执行时使设备执行第一方面的方法。
4、在本公开的第四方面,提供了一种计算机可读存储介质。该计算机可读存储介质上存储有计算机程序,计算机程序可由处理器执行以实现第一方面的方法。
5、应当理解,本内容部分中所描述的内容并非旨在限定本公开的实施例的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。
1.一种模型性能评测方法,包括:
2.根据权利要求1所述的方法,其中,所述获取用于模型攻击的意图样本集和模式样本集包括:
3.根据权利要求2所述的方法,其中,生成所述意图样本集和所述模式样本集包括:
4.根据权利要求3所述的方法,还包括:
5.根据权利要求1所述的方法,其中,确定针对所述目标模型的抗攻击性能的评测结果包括:
6.根据权利要求5所述的方法,其中确定针对所述目标模型的抗攻击性能的评测结果还包括:
7.根据权利要求1所述的方法,其中生成所述第一测试样本集包括:
8.根据权利要求1所述的方法,还包括:
9.根据权利要求8所述的方法,还包括:
10.一种模型性能评测装置,包括:
11.一种电子设备,包括:
12.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可由处理器执行以实现根据权利要求1至9任一项所述的方法。