- 分类:
- 人工智能
-
- 【AI达人特训营第三期】Conv2Former:一种ViT风格的卷积模块
- 本文复现了Conv2Former模型,其采用Transformer风格的QKV结构,以卷积生成权重加权,平衡全局信息提取与计算开销。在CIFAR-10数据集上,用Conv2Former-N参数({64,128,256,512}维度,{2,2,8,2}深度)训练50个epoch,验证集准确率达82%,参数884万,优于Swin-T的75%准确率与2753万参数,展现出设计优越性。
- 人工智能 . 科技周边 901 2025-07-31 10:38:38
-
- 如何通过夸克AI大模型生成API文档 夸克AI大模型代码注释与文档写作
- 如何准备代码注释以获得最佳的API文档生成效果?1.每个函数、类、方法都应有清晰注释,包含功能、参数、返回值、异常说明;2.使用标准文档注释格式如Javadoc或Sphinx,帮助模型理解结构;3.注释内容越详细,生成的文档越完善,例如Python函数应明确参数类型和逻辑说明。
- 人工智能 . 科技周边 575 2025-07-31 10:36:02
-
- 如何靠夸克AI大模型创建知识星球盈利 夸克AI大模型社群付费内容生成
- 明确细分领域,如“AI工具赋能个人品牌建设”,精准击中用户痛点;2.构建“AI+人工”流程:你主导选题与Prompt设计,AI生成初稿,你再事实核查、注入经验、优化逻辑与表达;3.多模态转化内容为PPT、音频、短视频脚本提升形式多样性;4.通过活跃社群互动、定期分享强化价值感知实现留存与口碑;5.定价采用订阅制,初期低价引流,后期随价值提升涨价,持续提供超预期价值才是盈利根本。
- 人工智能 . 科技周边 936 2025-07-31 10:35:01
-
- 点云生成:基于Paddle2.0实现WGAN-GP在点云上的一些尝试
- 本文尝试在点云上应用WGAN-GP,判别器借鉴PointNet结构,生成器为自定义搭建。使用ModelNet40数据集,取1024个点训练。定义了FeatureNet、UFeatureNet等网络,通过Adam优化器训练,每2轮可视化生成结果,20轮保存模型,目前可运行但效果待提升。
- 人工智能 . 科技周边 1022 2025-07-31 10:34:51
-
- Higgs Audio V2— 开源语音大模型,能模拟多人互动场景
- HiggsAudioV2是什么HiggsAudioV2是由李沐及其领导的BosonAI团队推出的一款开源语音大模型。该模型基于超过1000万小时的海量音频数据进行训练,具备多语言对话生成、自动韵律控制、语音克隆以及歌声合成等多项先进功能。它能够逼真模拟多人之间的自然对话,智能匹配说话人的情绪与语调变化,支持低延迟的实时语音交互体验。模型支持零样本语音克隆,用户仅需提供一段简短的语音片段,即可复现特定人物的声音特征,并可用于演唱合成。此外,HiggsAudioV2还能同步生成语音与
- 人工智能 . 科技周边 515 2025-07-31 10:32:03
-
- deepseek目标定位技巧 deepseek怎么分析院校难度
- 要让DeepSeek给出更精准的院校推荐,首先要明确自身需求并提供详尽且结构化的背景信息,包括学术成绩、科研实习经历、个人兴趣及未来规划;2.提问时要细化输入内容,避免模糊表述,结合具体绩点、项目成果、专业课程表现等信息,帮助DeepSeek进行多维度加权分析;3.充分利用其多轮对话能力,通过追问和补充细节不断修正和深化分析,使推荐更贴合实际意图;4.在分析院校难度时,DeepSeek会综合考虑非量化因素,如学科声誉、师资力量、毕业生去向、校友资源及校园文化等,并通过关联文本信息间接评估其影响力
- 人工智能 . 科技周边 341 2025-07-31 10:31:01
-
- 如何让豆包AI帮忙编程 豆包AI代码辅助教学
- 豆包AI能有效辅助编程学习和问题解决。对于代码卡壳问题,可直接描述需求获取示例代码并理解逻辑;针对报错信息,复制错误提示及上下文代码能让豆包AI快速定位原因并提供修改建议;在逻辑设计方面,通过提问结构安排(如登录系统的设计),可获得清晰的程序框架;高效使用的关键在于精准提问,明确任务细节与环境条件,从而提升学习效率与代码质量。
- 人工智能 . 科技周边 521 2025-07-31 10:19:01
-
- 【AI达人特训营】多模型集成学习的艺术作品作者识别
- 该项目借助多模型集成学习识别艺术作品作者。使用PaddleClas训练ResNet50_vd、VGG16和PPLCNetV2模型,基于含49位作者、7226张图片的Art数据集,经数据处理后划分训练集和验证集。通过硬投票集成模型结果,可纠正单一模型错误,提升识别效果,如成功识别Edgar Degas和Rembrandt的作品。
- 人工智能 . 科技周边 1030 2025-07-31 10:17:50
-
- 从采集数据到部署到JetsonNano全流程
- 该内容介绍了使用PaddleDetection进行目标检测的完整流程:先通过labelme采集标注数据得到图片和json文件,再用x2coco.py转为COCO格式;接着选择ppyolo模型,新建model.yml配置文件并训练;之后导出静态图模型;最后在Jetson Nano上部署,编写infer.py实现实时检测。
- 人工智能 . 科技周边 880 2025-07-31 10:14:13
-
- 【ICLR 2024】MogaNet: 高效多阶门控聚合网络
- MogaNet是高效多阶门控聚合网络,属纯卷积架构。其通过SMixer和CMixer模块,在空间和通道交互中促进多阶交互并情境化,平衡复杂度与性能。在ImageNet分类等任务表现优异,轻量版MogaNet-T以1.44G FLOPs达80.0%精度,超ParC-Net-S且节省59% FLOPs。代码复现含各组件及训练过程,实验验证了其有效性。
- 人工智能 . 科技周边 358 2025-07-31 10:10:24
-
- 如何用夸克AI大模型提升语义理解力 夸克AI大模型自然语言能力演示
- 夸克AI大模型通过大规模预训练、Transformer架构、持续学习与微调、多模态融合等方式提升语义理解力。1.大规模预训练使其掌握丰富语言与世界知识,理解多种表达形式;2.Transformer架构捕捉长距离依赖关系,增强上下文理解能力;3.持续学习与微调让模型适应不同任务与场景;4.多模态融合结合文本、图像、音频等信息,实现更全面的语义理解。
- 人工智能 . 科技周边 738 2025-07-31 10:10:01
-
- 【AI达人创造营第二期】TrtPose复现、手动转TRT并训练动物姿态
- 本文推荐英伟达开源的一个自底向上姿态模型,无需先进行人物检测,直接对姿态关键点进行估计,再进行多人匹配, 运行效率非常高。TrtPose是一款轻量级,推理速度极快的姿态估计模型,作者在本地基于C++、Cuda和Tensorrt实现的TrtPose,单帧推理不足2ms, 在JetsonNano上也运行得非常快。
- 人工智能 . 科技周边 475 2025-07-31 10:06:57
-
- 盘点图像分割中的损失函数
- 图像分割一直是一个活跃的研究领域,在设计基于复杂图像分割的深度学习架构时,通常会遇到了一个至关重要的选择,即选择哪个损失/目标函数,因为它们会激发算法的学习过程,以为其数据集获得更好的结果。本项目盘点了过去的几年里各种论文提出了不同的目标损失函数,为大家在训练分割模型时提供帮助。
- 人工智能 . 科技周边 712 2025-07-31 10:05:50
-
- 【AI达人特训营第三期】时频图分类项目
- 本项目基于ResNet50,将其BottleneckBlock模块中conv2特征层的标准卷积替换为DCN可变性卷积,构建ResNet50-DCN模型,用于科大讯飞24类语音时序图谱分类。使用2143条训练样本、429条验证样本训练,90轮后验证集最高准确率79%,未深入调优,有提升空间,还包含数据处理、模型训练及推理等过程。
- 人工智能 . 科技周边 777 2025-07-31 10:04:33
-
- 【新手入门】检索篇 - RAG技术深度实战与优化
- 本文围绕RAG技术展开深度解析,介绍其基础原理,即结合信息检索与文本生成,解决大模型知识截止、深度不足等问题。还阐述核心组件,如文档加载器等,讲解文档分块策略、向量化与相似度计算,以及检索策略优化、系统集成、性能优化和实际应用案例等内容。
- 人工智能 . 科技周边 1117 2025-07-31 10:02:57
PHP讨论组
组员:3305人话题:1500
PHP一种被广泛应用的开放源代码的多用途脚本语言,和其他技术相比,php本身开源免费; 可以将程序嵌入于HTML中去执行, 执行效率比完全生成htmL标记的CGI要高许多,它运行在服务器端,消耗的系统资源相当少,具有跨平台强、效率高的特性,而且php支持几乎所有流行的数据库以及操作系统,最重要的是


