1.一种模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的模型训练方法,其特征在于,所述选定攻击类别和攻击逻辑,包括:
3.根据权利要求2中所述的模型训练方法,其特征在于,所述初始攻击逻辑还包括与所述攻击类别语义信息强相关的辅助语义引导类别,以及属于辅助语义引导类别的类别样本约束集;
4.根据权利要求3所述的模型训练方法,其特征在于,所述根据所述攻击逻辑构建待训练模型,包括:
5.根据权利要求1所述的模型训练方法,其特征在于,所述利用所述对抗样本输入至少一个替代模型,得到目标损失值,包括:
6.根据权利要求5所述的模型训练方法,其特征在于,所述根据所述至少一个替代模型的损失和所述样本约束之间的损失,确定目标损失值,包括:
7.一种对抗样本的生成方法,其特征在于,所述方法包括:
8.一种模型评估方法,其特征在于,所述方法包括:
9.一种模型训练装置,其特征在于,所述装置包括:
10.一种计算机可读存储介质,其特征在于,其包括指令,当其在计算机上运行时,使得所述计算机执行如权利要求1至8中任一项所述的方法。