-
2025-08-01 14:05:31
- 印地语-英语OCR
- 本文介绍利用PaddleOCR训练调优印地语-英语OCR模型的过程。先配置环境、准备检测和识别数据,再训练检测模型并通过自蒸馏调优,使H-mean提升约15.2%;训练识别模型并以enhanced_ctc调优,准确率提升2%左右。最后将模型转成inference和serving模型,完成部署与服务请求。
-
749
-
2025-08-01 14:04:18
-
2025-08-01 14:02:48
- 自定义dataset,教你制作自己的 VOC 数据读取器
- 本文介绍了如何在PaddlePaddle中构建VOC2012数据集及自定义类VOC数据集的加载器。先解析VOC2012目录结构,通过继承Dataset类,实现__init__、__getitem__等方法读取图片和标注,还进行了数据测试。同时,调整代码适配自定义数据集,完成数据加载与可视化。
-
558
-
2025-08-01 13:48:43
- 【论文复现赛】第六期冠军项目-MetaHeac-推荐系统
- 本文复现论文提出的MetaHeac模型,基于PaddlePaddle 2.3.0框架,在腾讯Look-alike数据集上进行,解决look-alike建模挑战,复现AUC达0.7112,还介绍了数据集、环境、步骤、代码结构及复现心得。
-
475
-
2025-08-01 13:46:29
- 花书线性回归-PaddlePaddle版(第一课)
- 本文围绕线性回归展开,介绍其基本元素,包括线性模型、损失函数、解析解、随机梯度下降及预测应用,还涉及矢量化加速以提升效率,解释了正态分布与平方损失的关联,并将线性回归视为单层神经网络,展现从线性回归到深度网络的过渡。
-
446
-
2025-08-01 13:39:18
- 【ICLR 2022】RegionViT:从区域到局部的ViT
- RegionViT提出从区域到局部的视觉Transformer结构,以金字塔结构引入区域到局部注意替代全局自注意。先生成不同贴片大小的区域和局部令牌,经区域自注意提取全局信息,再通过局部自注意传递给局部令牌,结合相对位置编码。在多视觉任务上表现优异,实现高效且兼具全局感受野与局部性。
-
268
-
2025-08-01 13:37:48
- 【论文复现】基于 PaddlePaddle 实现 HashNet
- 本文介绍基于PaddlePaddle复现HashNet(ICCV2017)的项目。HashNet针对图像检索中哈希学习的问题,通过数据均衡化和改进符号激活函数提升性能。项目在COCO2014数据集上复现,16/32/48/64bits的结果达0.619、0.682、0.715、0.734,超验收指标。还含环境配置、快速开始流程、代码结构等,提供GitHub repo及相关资源。
-
860
-
2025-08-01 13:36:12
- 基于PaddlePaddle复现的PeleeNet
- 本文介绍PaddlePaddle实现的PeleeNet,这是高效CNN架构,适用于移动设备。其采用Two-Way Dense Layer、Stem Block等结构,复现了相关精度。还说明数据集准备、环境配置,以及模型训练、评估、预测和推理部署方法,也提及自动化测试脚本等内容。
-
263
-
2025-08-01 11:43:27
- 基于PaddlePaddle复现的CycleMLP
- 本文提出了一个简单的 MLP-like 的架构 CycleMLP,它是视觉识别和密集预测的通用主干,不同于现代 MLP 架构,例如 MLP-Mixer、ResMLP 和 gMLP,其架构与图像大小相关,因此是在目标检测和分割中不可行。
-
727
-
2025-08-01 11:41:38
- PP-OCR论文翻译
- PP-OCR是实用超轻量OCR系统,识别6622个汉字模型仅3.5M,63个字母数字符号模型2.8M。其含文本检测、检测框校正和文本识别三部分,采用多种策略提升能力或减小尺寸,还发布多语言预训练模型,开源且代码可在GitHub获取,在多场景有应用价值。
-
383