-
2025-07-18 10:20:00
- 抠像任务:基于飞桨复现BackgroundMattingV2模型
- 本文介绍飞桨框架复现Real-Time-High-Resolution-Background-Matting论文的项目,含相关链接与依赖。论文网络分base和refine模块,复现采用多阶段训练,用多个数据集,添加laplacian_loss,还说明训练、验证及预测过程。
-
453
-
2025-07-18 10:14:54
- 【Paddle打比赛】手写字体OCR识别竞赛baseline
- 本文介绍基于Paddle的世界人工智能创新大赛AIWIN手写字体OCR识别竞赛任务一baseline方案。涵盖竞赛背景与任务,说明数据处理步骤:创建文件夹、上传解压数据,将标注转为PaddleOCR所需格式,生成字典;还涉及模型构建,包括识别算法选择、安装PaddleOCR、下载预训练模型及训练,最后提及模型预测及结果保存,鼓励进一步优化。
-
325
-
2025-07-18 10:09:50
- 边缘检测系列3:【HED】 Holistically-Nested 边缘检测
- 本文介绍经典论文《Holistically-Nested Edge Detection》中的HED模型,这是多尺度端到端边缘检测模型。给出其Paddle实现,包括HEDBlock构建、HED_Caffe模型(对齐Caffe预训练模型)及精简HED模型,还涉及预训练模型加载、预处理、后处理操作及推理过程。
-
581
-
2025-07-18 10:06:41
- Mobile-ViT:改进的一种更小更轻精度更高的模型
- 本文介绍了轻量级通用视觉Transformer——MobileViT,它结合CNN与ViT优势,适用于移动设备,性能优于MobileNetV3等网络,且泛化、鲁棒性更佳。文中给出其PaddlePaddle实现代码,定义数据集、数据增强,构建模型,设置优化器等进行训练,并与MobileNetV2做对比实验,验证了MobileViT的有效性。
-
624
-
2025-07-18 10:03:50
- Paddle可视化神经网络热力图(CAM)
- 本文介绍了使用Paddle实现神经网络热力图(CAM)可视化的方法。CAM可展示CNN分类时关注的区域,文中详细阐述其原理,提供了完整代码,包括图像预处理、模型输出提取、梯度计算等步骤,还说明如何通过热力图指导数据集扩充和数据增强,帮助优化模型性能。
-
452
-
2025-07-18 10:01:50
- SimAM:无参数Attention!助力分类/检测/分割涨点!
- 本项目基于中山大学提出的无参数SimAM注意力机制,在Caltech101的16类子集上验证其效果。SimAM从神经科学出发,通过能量函数挖掘神经元重要性,生成三维权重,优于传统一维、二维注意力。项目构建含SimAM的TowerNet模型,与ResNet50等经典网络对比,经数据准备、模型训练后,显示加入SimAM后性能和鲁棒性显著提升,验证了其有效性。
-
944
-
2025-07-18 09:53:56
- PaddleHub人脸关键点检测:一键生成蜡笔小新的远房表弟
- 本文介绍了将人像转化为“蜡笔小宸”(蜡笔小新风格)的方法。步骤包括:登录“蜡笔大陆”安装所需库;用PaddleHub进行人脸68个关键点检测,为后续操作打基础;提取眉毛关键点,通过连线并控制宽度刻画粗眉;运用图像局部平移算法,依据人脸关键点进行“胖脸”操作,使脸部更圆润。还可通过run.py一键执行,调整参数获得对应效果。
-
620
-
2025-07-18 09:51:10
- ResNet及BCD版本详解且在眼疾识别中应用实例
- 本文阐述ResNet模型及其变体(B、C、D版本)的理论,包括残差单元、恒等映射、瓶颈模块等基础知识与架构,还介绍了模型演变。并以iChallenge-PM数据集为例,在眼疾识别中应用ResNet,通过训练、验证不同版本模型,评估其在病理性近视识别上的效果,各版本准确率达96.75%以上。
-
1034
-
2025-07-18 09:46:19
- 去除摩尔纹,治愈强迫症, 来卷网盘赛,榜评0.55623
- 数字屏幕在现代日常生活中无处不在:我们在家里有电视屏幕,在办公室有笔记本电脑/台式机屏幕,在公共场所有大尺寸LED屏幕。拍摄这些屏幕的图片以快速保存信息已成为一种惯例。然而,在对这些屏幕拍照的时候通常会出现波纹图像,从而降低了照片的图像质量。当两个重复的图案相互干扰时,出现摩尔纹图案。在拍摄屏幕图片的情况下,相机滤色镜阵列(CFA)会干扰屏幕的亚像素布局。
-
546
-
2025-07-18 09:42:03
- 【NLP】基于Seq2Seq的代码注释自动生成技术研究
- 该本科毕设研究代码注释自动生成,基于Seq2Seq模型,以Java代码为输入,用北大胡星等人的数据集,构建含编码器、Bahdanau注意力机制、解码器的模型,经训练测试,10个epoch结果不理想,需继续优化。
-
585