-
2025-07-31 13:58:34
- CV GAN模型常用的一些东西,面向新人
- 本文分享了CV GAN相关的实用轮子和技巧,助新人节省时间。包括VGG的感知损失实现代码及使用示例,SNGAN的谱归一化应用,MultiscaleDiscriminator等多种判别器架构,还探讨了模型初始化问题,介绍Xavier和He初始化方法及相关代码,为GAN实践提供便利。
-
1061
-
2025-07-31 13:57:10
-
2025-07-31 13:55:32
- StyleClip
- 本文介绍StyleCLIP:文本驱动的图像处理。它结合StyleGAN V2与CLIP模型,通过语言描述编辑图像,不受预标注属性限制。复现用PaddleGAN的预训练模型,包括StyleGAN V2生成器、Pixel2Style2Pixel转换风格向量,依赖Paddle-CLIP和dlib。还说明安装、生成图片、风格向量及训练等步骤与参数。
-
939
-
2025-07-31 13:46:30
-
2025-07-31 13:45:24
- PPYOLOE详解第二弹:你真的知道什么是Neck嘛?
- 本文先介绍双阶段检测模型Neck,以FPN论文为例讲4种结构。再讲单阶段检测模型,回顾YOLOv1到v3中Neck的发展,最后重点介绍PANet及PPYOLOE的Neck结构,还给出了相关代码,展现了目标检测网络Neck的演变与特点。
-
315
-
2025-07-31 13:43:48
- 【PaddleHub模型贡献】一行代码实现蛇种识别
- 该内容围绕蛇类识别模型展开,先安装PaddleX,解压数据集并划分,设置GPU后进行图像预处理与增强,定义数据迭代器,用ResNet50_vd_ssld模型训练,接着导出并转换模型为PaddleHub模块,测试单张和多张图片识别效果,最后介绍在GitHub提pr的步骤。
-
591
-
2025-07-31 13:39:27
- 【论文复现赛第六期-语义分割】CCNet
- 本文复现了CCNet语义分割模型,其核心为Criss-Cross Attention模块,通过循环操作让像素建立联系以获取丰富语义。使用PaddleSeg复现,采用ResNet101骨干网,在Cityscapes验证集上mIoU达80.95%,已合入PaddleSeg,还提供了训练、验证等流程及复现经验。
-
908
-
2025-07-31 13:39:21
-
2025-07-31 13:35:29
- EdgeViTs的一些改进以及完全体复现
- 本文回顾EdgeViTs复现,介绍BN、LN、GN区别,详述复现详情:将原始结构的LN层换为GN层,把FFN层双层全连接层改为两层卷积层,复现了不同计算复杂度下的结构,还包括模型组成及实验,用Flowers数据集训练并可视化过程。
-
462
-
2025-07-31 13:33:00
- 表格学习:基于飞桨复现TabNet网络
- 本文基于PaddlePaddle复现TabNet网络,该网络可处理表格数据,支持端到端学习,通过顺序注意实现特征选择与可解释性。复现项目在Forest Cover Type数据集精度达0.96777,超PyTorch版本。文中介绍模型结构、数据集、环境配置、训练测试步骤,还总结了复现中自定义算子等问题及解决方法。
-
1032