- 分类:
- 人工智能
-
- 2024年最新版PaddleOCR新手指导(训练自己的数据集与知识蒸馏)
- 本文介绍2024年新手掌握PaddleOCR的使用,包括其超轻量等特性。涵盖快速使用步骤,如解压数据集、安装环境、准备模型和测试图像,及单张和多张图像测试。还讲解训练数据集、文字检测与识别的训练和测试,模型转换,以及知识蒸馏的配置、训练等内容,最后提及多种部署选项。
- 人工智能 . 科技周边 1118 2025-07-22 10:22:17
-
- 『IMAGE-CAPTION』基于CNN-RNN的影像报告生成-PRE
- 根据我提供的内容生成一段120字左右的摘要
- 人工智能 . 科技周边 998 2025-07-22 10:21:52
-
- 基于PP-PicoDet的【PP吸烟视频分析预警系统】
- PP吸烟视频分析预警检测系统基于PP-PicoDet模型,可检测禁烟场所吸烟行为并报警,应用场景广泛。其数据处理含解压缩、划分数据集等,环境需特定版本PaddlePaddle等。通过修改配置文件训练模型,经评估、预测后导出,还可转换为Paddle Lite模型部署于Android,mAP达85.92%,速度快且轻量。
- 人工智能 . 科技周边 352 2025-07-22 10:14:48
-
- 最少代码,基于PaddleGAN实现GAN的趣味项目应用
- 本项目借助PaddleGAN演示6个有趣应用,助开发者快速上手。先介绍GAN含生成网络G和判别网络D,及PaddleGAN的作用。接着说明解压缩或安装PaddleGAN及相关软件的步骤。最后展示人脸生成、人脸卡通化等6个示例的功能、示意图及预测代码。
- 人工智能 . 科技周边 182 2025-07-22 10:10:14
-
- PPOCRLabel半自动工具标注自制身份证数据集
- 该项目基于PPOCRLabel半自动化标注工具,使用Python和PyQt5编写,支持多种语言模型,可实现OCR数据高效标注。项目通过代码生成身份证数据集,利用PPOCRLabel标注后用于OCR模型训练,还提供了配置好的环境及相关资料,鼓励用户加入SIG小组共同开发。
- 人工智能 . 科技周边 765 2025-07-22 10:08:23
-
- 【方案分享】第十一届 “中国软件杯”大学生软件设计大赛遥感解译赛道 比赛方案分享
- 本文围绕遥感变化检测项目展开,参考多个相关项目,指出存在随机bug及解决办法。其在相同训练轮数下精度提升明显,还分享了调参思路,涉及数据集、模型、训练超参、后处理等方面。此外,详述了数据预处理、网络训练、测试、推理等流程,并附相关报错及统计数据。
- 人工智能 . 科技周边 865 2025-07-22 10:04:38
-
- 淄博烧烤爆火!基于 PaddleX 实现常用香料分类
- 本文介绍基于PaddleX开发常用香料分类模型的流程。先因淄博烧烤爆火,提及在家DIY烧烤时香料识别的需求,接着说明用MobileNetV2模型,步骤包括安装PaddleX、解压数据集、配置GPU、定义图像处理流程和数据集,再进行模型训练与预测,最后提到还可使用百度EasyDL开发。
- 人工智能 . 科技周边 853 2025-07-22 10:01:59
-
- 百度网盘AI大赛-图像处理挑战赛:文档检测优化赛 Baseline
- 该内容围绕百度网盘AI大赛文档检测优化赛展开,介绍用Resnet152+Linear网络结构回归文档拐角坐标的方案。包括获取数据、构造含预处理的读取器、定义网络,训练时经多轮训练及调学习率达0.89左右精度,还涉及打包提交文件的相关说明。
- 人工智能 . 科技周边 768 2025-07-22 09:59:56
-
- 【图像去噪】第六期论文复现赛——DnCNN
- 本文围绕DnCNN图像去噪算法展开复现研究。该算法基于残差学习和批量归一化,适用于图像复原。复现采用PaddlePaddle框架,在BSD68测试集、噪声15条件下,10次测试平均PSNR达31.73757,达标。文中还介绍了数据集、文件结构、环境依赖、核心代码及训练、评估等操作流程。
- 人工智能 . 科技周边 704 2025-07-22 09:57:56
-
- 《人工智能导论:案例与实践》基于LSTM实现电影评论的情感分析
- 本实验旨在让学习者掌握循环神经网络等知识,基于LSTM构建IMDB电影评论情感分析模型。实验流程包括数据处理(下载、读取、格式转换等)、模型构建、训练配置、训练、保存、评估和推理。通过多轮训练,模型准确率达0.7650,能对电影评论情感倾向进行有效分析。
- 人工智能 . 科技周边 851 2025-07-22 09:55:16
-
- 基于PaddleDetection的人脸情绪识别
- 本文介绍基于PaddleDetection的情绪识别项目。使用Fer2013数据集,先预处理数据,构建VGG模型训练,经300轮迭代精度达62.16%。后用ResNet34模型优化,准确率提升至64.85%。还利用PaddleDetection进行人脸识别,将表情识别结果标注在人脸框上,完成情绪识别全流程。
- 人工智能 . 科技周边 1026 2025-07-22 09:51:28
-
- AI Overviews有隐私风险吗 数据安全政策解读
- AIOverviews类产品存在隐私和数据安全风险,主要源于用户查询、模型生成内容等环节涉及个人信息流转。1.数据处理流程包括接收查询→调用模型推理→返回结果,过程中原始输入、中间数据和输出可能被记录或存储;2.平台若默认保存数据用于优化模型,将增加泄露风险;3.部分产品缓存生成内容且缺乏加密传输机制,可能在传输中被拦截;4.是否构成风险取决于平台是否明确数据流向并提供关闭选项;5.平台政策常见要点包括匿名化处理、限定保留周期、用户控制权及企业版加密支持;6.降低风险的方法包括避免输入敏感信息、
- 人工智能 . 科技周边 535 2025-07-22 09:50:02
-
- 目标检测理论与YOLOv4详解
- 本文介绍目标检测相关内容,包括其让计算机识别图像中目标类别并定位的目的,发展历程中从穷举法到RCNN等算法的演进。还讲解了边界框、锚框、交并比等基础概念,以及YOLO系列算法思想和YOLOv4在输入、骨干网络等阶段的技术细节。
- 人工智能 . 科技周边 683 2025-07-22 09:48:10
-
- Coding-Party 基于飞桨的农作物智能识别系统
- 基于深度学习的病虫害检测方法不仅具有重要的学术研究价值,而且具有非常广阔的市场应用前景。其次轻量化模型的构建需要成为未来研究考虑的重要组成部分,使得农作物病害智能识别可以
- 人工智能 . 科技周边 580 2025-07-22 09:46:32
-
- 如何使用豆包AI做语音转文本 豆包AI语音识别与总结技巧
- 豆包AI语音转文本识别错误可通过优化录音环境、使用高质量麦克风、清晰发音及调整语速等方式改善;完成识别后应仔细校对、手动修改错误,并利用其纠错功能;若问题持续,可向官方反馈或训练个性化模型;必要时可尝试其他语音识别工具或专业服务。针对总结功能的局限,应确保原始文本逻辑清晰、表达准确,避免深层含义或关键信息被忽略,同时结合人工审查与创造性分析,以提升总结效果。使用时明确目标、优化输入质量、结合其他工具及持续学习新技术,能更高效利用豆包AI的语音转文本与总结功能。
- 人工智能 . 科技周边 1208 2025-07-22 09:45:04
PHP讨论组
组员:3305人话题:1500
PHP一种被广泛应用的开放源代码的多用途脚本语言,和其他技术相比,php本身开源免费; 可以将程序嵌入于HTML中去执行, 执行效率比完全生成htmL标记的CGI要高许多,它运行在服务器端,消耗的系统资源相当少,具有跨平台强、效率高的特性,而且php支持几乎所有流行的数据库以及操作系统,最重要的是


