低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法
在深度神经网络(DNNs)中,展现出了卓越的准确性。然而,它们对额外噪声,即对抗性攻击,表现出了脆弱性。先前的研究设这种脆弱性可能源于高准确度的DNNs过度依赖于纹理和背景等无关紧要且不受限制的特征。然而,新的研究揭示了这种脆弱性与高准确度的DNNs过度信任其权重及背景等无关因素的特定特征无关。
在最近的AAAI 2024学术会议上,悉尼大学的研究人员揭示了“从图像中提取的边缘信息能够提供与形状和背景相关的相关性强且鲁棒的特征”。
论文链接:https://ojs.aaai.org/index.php/AAAI/article/view/28110
这些特征在帮助预训练深度网络改善对抗鲁棒性的同时,还不影响其在清晰图像上的准确性。
研究人员提出了一种轻量级且适用的EdgeNet,可无缝集成到现有的预训练深度网络中,包括Vision Transformers(ViTs),这是最新一代用于视觉分类的先进模型家族。
EdgeNet是一种处理从干净的自然图像或嘈杂的对抗性图像中提取的边缘的边缘缘提取技术,可以注入到预训练好并被冻结的骨干深度网络的中间层。这种深度网络具有优秀的骨干鲁棒性特征,可以提取具有丰富语义信息的特征。通过将EdgeNet插入到这样的网络中,可以利用其高质量的骨干深度网络
需要注意的是,这种方法带来的额外成本极低:使用传统的边缘检测算法(例如文中所提到的Canny边缘检测器)获取这些边缘的成本与深度网络的推理成本相比微乎其微;而训练EdgeNet的成本则与使用诸如Adapter等技术对骨干网络进行微调的成本不相上下。
EdgeNet 架构
为了将图像中的边缘信息注入到预训练的骨干网络中,作者引入了一个名为EdgeNet的侧支网络。这个轻量级、即插即用的侧枝网络可以无缝地集成到现有的预训练深度网络中,包括像ViTs这样的最新模型。
经过输入图像中提取的边缘信息运行,EdgeNet 可以生成一组具有鲁棒性的特征。这个过程产生了一个具有鲁棒性的特征,有鲁棒性的特征可以被选择性地注入到预训练好的骨干深度网络中,以便在深度网络的中间层中进行冻结。
通过注入这些鲁棒特征,能够提升网络在防御对抗性扰动方面的能力。同时,由于骨干网络是被冻结的,而新特征的注入是有选择性的,所以可以保持预训练网络在识别未经扰动的清晰图像方面的准确性。
如图所示,作者在原有的构建块基础上,以一定间隔 N 插入新的 EdgeNet 构建块
。新的中间层输出可以由以下公式表示:
EdgeNet 构建块
为了实现选择性特征提取和选择性特征注入,这些 EdgeNet 构建块采取了一种“三明治”结构:每个块的前后都添加了零卷积(zero convolution)来控制输入与输出。在这两个零卷积之间是一个具有随机初始化的、与骨干网络架构相同的 ViT block
利用零输入,充当提取与优化目标相关信息的过滤器;利用零输出, 充当确定要集成到骨干中的信息的过滤器。此外,通过零初始化,可以确保了骨干内的信息流保持不受影响。因此,对 EdgeNet 的后续微调变得更加简化。
训练目标
在训练 EdgeNet 的过程中,预训练好的 ViT 骨干网络除了分类头均被冻结住,不进行更新。优化目标仅专注于为边缘特征引入的 EdgeNet 网络,以及骨干网络内的分类头。在这里,作者采用了一个非常简化的联合优化目标以保障训练的效率:
在公式9 中,α 是准确性损失函数的权重,β 是鲁棒性损失函数的权重。通过调整 α 和 β 的大小,可以微调 EdgeNet 训练目标的平衡性,以达到在提升其鲁棒性的同时不显着损失准确性的目的。
实验结果
作者们在 ImageNet 数据集上针对两大类鲁棒性进行了测试。
第一类是抵御对抗攻击的鲁棒性,包括白盒攻击与黑盒攻击;
第二类是抵御一些常见的扰动的鲁棒性,包括ImageNet-A 中的自然对抗样本(Natural Adversarial Examples),ImageNet-R 中的分布外数据(Out-of-Distribution Data)和ImageNet-C 中的常见数据扭曲( Common Corruptions)。
作者还针对不同扰动下提取到的边缘信息进行了可视化。
网络规模与性能测试
在实验部分,作者首先测试了不同规模EdgeNet 的分类性能和计算开销(Table 1)。在综合考虑分类性能和计算计算开销后,他们确定 #Intervals = 3的配置为最佳设置。
在这个配置中,EdgeNet 与基准模型相比获得了显着的准确度和鲁棒性提升。它在分类性能、计算要求和鲁棒性之间取得了平衡的妥协。
该配置在保持合理的计算效率的同时,在清晰准确度和鲁棒性方面取得了实质性的增益。
准确性与鲁棒性对比
作者将他们提出的EdgeNet 与5个不同类别的SOTA 方法进行了对比(Table 2)。这些方法包括在自然图像上训练的 CNNs、鲁棒的 CNNs、在自然图像上训练的 ViTs、鲁棒的ViTs 和经过鲁棒微调的ViTs。
考虑的指标包括在对抗攻击(FGSM 和 PGD)下的准确性、在ImageNet-A上的准确性以及在ImageNet-R上的准确性。
此外,还报告了ImageNet-C 的平均错误(mCE),较低的值表示更好的性能。实验结果表明 EdgeNet 在面对 FGSM 和 PGD 攻击时展现出卓越的性能,同时在清晰的 ImageNet-1K 数据集及其变体上表现出与先前 SOTA 方法相持平的水平。
除此之外,作者还开展了黑盒攻击的实验(Table 3)。实验结果表明,EdgeNet 也能十分有效的抵挡黑盒攻击。
结论
在这项工作中,作者提出了一种名为 EdgeNet 的新方法,它通过利用从图像中提取到的边缘信息,可以提升深度神经网络(特别是 ViTs)的鲁棒性。
这是一个轻量级且可以无缝集成到现有网络中的模块,它能够有效的提高对抗性鲁棒性。实验证明,EdgeNet 具有高效性——它仅带来了极小的额外计算开销。
此外 EdgeNet 在各种鲁棒基准上具有广泛适用性。这使其成为该领域引人注目的进展。
此外,实验结果证实,EdgeNet 可以有效抵抗对抗性攻击,并能在干净图像上保持的准确性,这突显了边缘信息在视觉分类任务中作为鲁棒且相关特征的潜力。
值得注意的是,EdgeNet 的鲁棒性不仅限于对抗性攻击,还涵盖了涉及自然对抗性示例(ImageNet-A)、分布之外的数据(ImageNet-R)和常见破坏(ImageNet-C)情景。
这种更广泛的应用凸显了EdgeNet的多功能性,并显示其作为视觉分类任务中多样挑战的全面解决方案的潜力。
以上是低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

使用C 中的chrono库可以让你更加精确地控制时间和时间间隔,让我们来探讨一下这个库的魅力所在吧。C 的chrono库是标准库的一部分,它提供了一种现代化的方式来处理时间和时间间隔。对于那些曾经饱受time.h和ctime折磨的程序员来说,chrono无疑是一个福音。它不仅提高了代码的可读性和可维护性,还提供了更高的精度和灵活性。让我们从基础开始,chrono库主要包括以下几个关键组件:std::chrono::system_clock:表示系统时钟,用于获取当前时间。std::chron

DMA在C 中是指DirectMemoryAccess,直接内存访问技术,允许硬件设备直接与内存进行数据传输,不需要CPU干预。1)DMA操作高度依赖于硬件设备和驱动程序,实现方式因系统而异。2)直接访问内存可能带来安全风险,需确保代码的正确性和安全性。3)DMA可提高性能,但使用不当可能导致系统性能下降。通过实践和学习,可以掌握DMA的使用技巧,在高速数据传输和实时信号处理等场景中发挥其最大效能。

C 在实时操作系统(RTOS)编程中表现出色,提供了高效的执行效率和精确的时间管理。1)C 通过直接操作硬件资源和高效的内存管理满足RTOS的需求。2)利用面向对象特性,C 可以设计灵活的任务调度系统。3)C 支持高效的中断处理,但需避免动态内存分配和异常处理以保证实时性。4)模板编程和内联函数有助于性能优化。5)实际应用中,C 可用于实现高效的日志系统。

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,删除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段时,需指定位置以优化查询性能和数据结构;删除字段前需确认操作不可逆;使用在线DDL、备份数据、测试环境和低负载时间段修改表结构是性能优化和最佳实践。

在C 中测量线程性能可以使用标准库中的计时工具、性能分析工具和自定义计时器。1.使用库测量执行时间。2.使用gprof进行性能分析,步骤包括编译时添加-pg选项、运行程序生成gmon.out文件、生成性能报告。3.使用Valgrind的Callgrind模块进行更详细的分析,步骤包括运行程序生成callgrind.out文件、使用kcachegrind查看结果。4.自定义计时器可灵活测量特定代码段的执行时间。这些方法帮助全面了解线程性能,并优化代码。

数字虚拟币交易平台top10分别是:1. Binance,2. OKX,3. Coinbase,4. Kraken,5. Huobi Global,6. Bitfinex,7. KuCoin,8. Gemini,9. Bitstamp,10. Bittrex,这些平台均提供高安全性和多种交易选项,适用于不同用户需求。

交易所内置量化工具包括:1. Binance(币安):提供Binance Futures量化模块,低手续费,支持AI辅助交易。2. OKX(欧易):支持多账户管理和智能订单路由,提供机构级风控。独立量化策略平台有:3. 3Commas:拖拽式策略生成器,适用于多平台对冲套利。4. Quadency:专业级算法策略库,支持自定义风险阈值。5. Pionex:内置16 预设策略,低交易手续费。垂直领域工具包括:6. Cryptohopper:云端量化平台,支持150 技术指标。7. Bitsgap:

如何实现鼠标滚动事件穿透效果?在我们浏览网页时,经常会遇到一些特别的交互设计。比如在deepseek官网上,�...
