对抗攻击中的常用评价指标

您所在的位置:网站首页 对抗如何 对抗攻击中的常用评价指标

对抗攻击中的常用评价指标

2023-11-06 12:56| 来源: 网络整理| 查看: 265

①在对抗攻击中,评估指标 nq 代表非规范化残差(non-normalized residual)。

一个分类器在输入数据时会生成一个输出,通常为概率或类别。而对抗攻击是指利用某些方法对输入进行修改,来使得分类器的输出出现错误的情况。

为了判断分类器对对抗性样本的鲁棒性,我们需要使用一些评估指标。其中 nq 是一种针对特定对抗攻击的评估指标,它可以衡量攻击后输出的置信度与原始置信度之间的差距。

与其它指标相比,nq 更注重攻击后的置信度变化,它的值越大表示对抗攻击对分类器效果越大,分类器对对抗样本的鲁棒性也就越差。

②对抗攻击的评价指标 asr (attack success rate) 是指攻击者通过对输入数据进行修改,成功欺骗模型并得到错误输出的比率。

asr 是衡量分类器鲁棒性的重要指标之一,因为它可以告诉我们分类器在遭受特定攻击时的容错能力,即攻击者多大的概率可以获得正确的结果。对于攻击者来说,asr 越高就越容易实施攻击,而对于分类器的开发者来说,asr 越低就代表分类器的鲁棒性越强。

需要注意的是,asr 并不能完全反映分类器的鲁棒性,因为在现实生活中,攻击者通常会使用更加隐蔽和复杂的攻击方式,例如黑盒攻击、迁移攻击等。因此,除了 asr 之外,研究人员还需要同时考虑其它的评价指标,以全面评估分类器的鲁棒性。 



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3