2025-07-18 11:23:33
EasyEdge:PaddleX 2.0动态图检测模型的部署
本文测试了EasyEdge对PaddleX2.0动态图训练模型的支持情况。先介绍相关项目与社区答疑方式,确认支持后,进行动态图转静态图(模型导出),再配置EasyEdge,上传模型文件并查看适配设备,最后生成安卓APP验证效果,实现端云协同部署,还提及该平台可明确模型适用设备及评测部署效果。
908
2025-07-18 11:19:39
PVT v2:超越 Swin 的新型金字塔 ViT
本文复现了PVT v2模型,其基于v1改进,亮点是Linear SRA。代码包含导入包、基础模块定义、模型组网等部分,还提供了不同缩放结构及预训练权重。通过在Cifar10数据集上训练5轮验证性能,模型表现良好。PVT v2引入卷积等操作提升性能,参数量和计算量较小,下游任务表现佳。
407
2025-07-18 11:17:37
基于 Milvus 和 MIND 算法的商品召回
本教程将分别讲解实现该项目使用到的主要组件,以及如何进行数据处理,如何使用 Paddlerec 实现模型 MIND 的训练和测试,最后还提供了如何通过训练好的模型 MIND 和 Milvus 启动一个召回服务。
912
2025-07-18 11:15:05
论文复现赛:对抗攻击
本文复现《Towards Deep Learning Models Resistant to Adversarial Attacks》,基于PaddlePaddle在MNIST数据集实现对抗训练,采用Min-Max思路与FGSM、PGD生成对抗样本,复现精度优于原文献,分析超参数影响及框架差异,为对抗防御提供参考。
559
2025-07-18 11:00:51
2025-07-18 10:58:13
PointPillars:基于点云的3D快速目标检测网络
PointPillars是一个基于点云的快速目标检测网络,在配置为Intel i7 CPU和1080ti GPU上的预测速度为62Hz,在无人驾驶领域中常常能够使用上它,是一个落地且应用广泛的一个3D快速目标检测网络。
334
2025-07-18 10:56:31
基于 PaddlePaddle 框架的 SegNet 论文复现
本文复现了SegNet语义分割模型,其为编码器-解码器结构,编码器对应VGG-16前13层,解码器共13层,损失函数采用带median frequency weight的加权交叉熵。在Ai Studio环境配置后,基于PaddleSeg,经模型搭建、损失函数设计及调参,在camvid数据集上复现,结果超原论文60.1%的mIoU精度。
324
2025-07-18 10:54:34
基于图像分类网络VGG实现中草药识别
中草药识别案例是图像分类问题,相较于目标检测、实例分割、行为识别、轨迹跟踪等难度较大的计算机视觉任务,图像分类只需要让计算机『看出』图片里的物体类别,更为基础但极为重要。图像分类在许多领域都有着广泛的应用,如:安防领域的智能视频分析和人脸识别等,医学领域的中草药识别,互联网领域基于内容的图像检索和相册自动归类,农业领域的害虫识别等。
896
2025-07-18 10:52:32
AgentOCR:一个多语言支持、易于使用的 OCR 项目
AgentOCR 是基于 PaddleOCR 和 ONNXRuntime 开发的 OCR 项目,含 Python 包和标注软件。其 API 与 PPOCR 基本一致,易切换,依赖少、易打包。可通过 pip 安装,需手动装 ONNXRuntime。支持多语言识别,通过配置文件快速切换,调用简单,能输出识别文本及位置、置信度等信息。
190
2025-07-18 10:49:55
『抽丝剥茧』深度解析PaddleClas—分类,一篇带你学会分类实践
本文介绍了使用PaddleClas进行图像分类的流程。先查看飞桨版本,安装PaddleClas环境,了解其功能与全局配置。接着以flowers102数据集为例,演示下载、配置文件修改、训练及预测过程。还讲解了自定义蝴蝶数据集的处理、训练、中断续训、预测、评估和批处理预测等操作。
849