-
2025-07-31 10:57:31
- R-Drop论文复现
- R-Drop是基于Dropout的改进正则化方法,通过对模型输出层施加约束减少过拟合。其让每个样本两次通过带Dropout的同一模型,用KL散度约束两次输出一致,总损失为交叉熵与KL散度之和。代码实现仅增KL项,实验显示能有效提升模型正确率。
-
893
-
2025-07-31 10:56:13
- 论文解读一篇关于语义生成论文(要求控制单独语义生成)
- 本文聚焦语义多模态图像合成(SMIS)任务,旨在通过特定类控制器调整对应区域生成图像,且不影响其他部分。针对现有方法局限,提出GroupDNet,利用组卷积并逐步减少解码器组数,提升可控性与生成质量。实验表明其优越性,还能支持多种合成应用。
-
661
-
2025-07-31 10:53:59
- Paddle2.0-AI图像安全-图像对抗样本初探-常见攻击策略
- 本文介绍图像对抗样本的三种常见攻击策略:FGSM、BIM和PGD,附Paddle实现代码(见Paddle-Adversarial-Toolbox仓库)。FGSM通过梯度符号快速生成扰动;BIM为其迭代改进版,提升成功率;PGD在BIM基础上增加迭代轮数和随机化处理,增强攻击效果。
-
397
-
2025-07-31 10:52:19
- 情人节:借助二次元老婆研究特征解耦
- 本项目旨在实现二次元头像的特征解耦,让B头像风格影响A头像主体且保持A大体不变。采用Konachan动漫头像数据集,基于SPADE架构,A为内容主体,B为风格。通过Encoder-Decoder提取特征,利用KLDLoss、VGG损失等训练,使生成图融合A主体与B风格,测试显示能体现特征影响差异。
-
316
-
2025-07-31 10:50:46
- 深度学习三步走(二)网络篇
- 本文介绍卷积神经网络(CNN),涵盖其包含的卷积层、ReLU层等各类层及相关运算、参数计算等,还讲解激活函数、BatchNorm层、Dropout,列举LeNet等经典网络,提及CNN改进思路,从优化指标和通用方法等方面阐述如何优化CNN。
-
401
-
2025-07-31 10:48:24
- PaddleSeg代码解读-数据增强与模型结构解读
- 本文是PaddleSeg代码解读第二篇,先解读数据增强代码,介绍了transforms中Compose等多个预处理与增强类的实现,它们通过__call__方法运作。再解读模型与Backbone代码,以FCN网络为例,介绍其结构及HRNet主干网络的构成模块与运作方式。
-
255
-
2025-07-31 10:43:09
- 模型压缩之聚类量化
- 本文围绕模型压缩中的聚类量化展开,先概述模型量化是通过简化参数比特位存储实现压缩。重点介绍Deep Compression的聚类量化思路,包括参数聚类等步骤,还给出用K-Means算法实现聚类量化的代码,搭建网络训练并展示量化前后权重分布及效果,体现聚类量化的作用。
-
599
-
2025-07-31 10:41:43
- 文字识别:基于PaddlePaddle复现PANet
- 该论文提出PAN网络,以ResNet-18为骨干,结合FPEM、FFM和像素聚合法,平衡场景文本检测的精度与速度。基于Paddle的复现项目,部分数据集F-measure达81.46%,超验收标准。
-
794
-
2025-07-31 10:40:04
-
2025-07-31 10:38:38
- 【AI达人特训营第三期】Conv2Former:一种ViT风格的卷积模块
- 本文复现了Conv2Former模型,其采用Transformer风格的QKV结构,以卷积生成权重加权,平衡全局信息提取与计算开销。在CIFAR-10数据集上,用Conv2Former-N参数({64,128,256,512}维度,{2,2,8,2}深度)训练50个epoch,验证集准确率达82%,参数884万,优于Swin-T的75%准确率与2753万参数,展现出设计优越性。
-
901