神经元覆盖率(NC)对于测试深度神经网络有意义吗? |
您所在的位置:网站首页 › 周围神经网络覆盖了人体的每一个角落吗 › 神经元覆盖率(NC)对于测试深度神经网络有意义吗? |
阅读论文《Is Neuron Coverage a Meaningful Measure for Testing Deep Neural Networks?》。记录阅读笔记。 全文内容总结: 在以往研究中,基于增加NC可以提高测试集质量的隐含假设,NC被用于指导测试生成。 本文设计了一种新的促进多样性的正则化算法,该算法可以嵌入现有的对抗性攻击算法(CW、PGD)中。并评估增加NC是否能生成测试套件满足: 能检测对抗性攻击产生自然输入对特定类别预测没有偏见结果却发现:增加NC会使生成有效测试套件更困难,即更高的NC会导致检测到的缺陷更少、自然输入更少、预测偏好更有偏差。 最后,作者呼吁一种新的测试生成技术,能同时考虑缺陷检测、自然性和输出公正性。 算法思想: 本文的正则化算法通过惩罚倾斜的层状激活而促进更多不同的神经激活分布,将所有神经元吸引到平均激活程度(在现有对抗性攻击中增强)。即诱导先前不活跃的神经元放电,从而增加NC(将NC增加和多样化纳入优化目标)。 评估标准: 缺陷检测能力生成测试输入的自然度(IS、FID)输出公正性(即模型预测对特定类别标签的偏向or不偏向程度。执行该评估是因为测试套件必须执行多样化的输出行为,而不应只偏爱几个输出值)(Pielous均衡度)所使用的数据集、模型和算法: 2个图像分类数据集(MINIST、CIFAR10)、1个自动驾驶汽车数据集(Udacity Self-Driving Car)6个基于分类的DNN模型、2个基于回归的DNN模型CW攻击、PGD攻击总共生成了2095个测试套件,超过200,000图像。 结论: 64个实验结果中只有2个支持NC与缺陷检测能力呈强正相关的假设,而33个呈负相关。结论:增加NC可能会损害缺陷检测。64个实验结果中只有1个支持NC与输入的真实性和自然性呈强正相关的假设,而44个呈负相关。结论:增加NC可能会使生成的输入变得更加不自然。64个实验结果中只有3个支持NC与输出预测的公正性呈强正相关的假设,而21个呈负相关。结论:增加NC会使扰动偏向具有较高NC的类别标签。讨论: 对DeepXplore和DeepTest生成的测试套件进行了类似分析,从单个神经元的意义大小对NC的意义进行了讨论,列出了支持论文结果的分析。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |