微调美洲驼3.2并在本地使用:逐步指南
解锁骆驼的力量3.2:综合指南和本地部署
大语模型(LLM)的景观正在迅速发展,重点是较小,更有效的模型。 Llama 3.2凭借其轻巧和视力模型的变化体现了这一趋势。本教程详细介绍了如何利用Llama 3.2的功能,特别是3B轻型模型,用于在客户支持数据集上进行微调以及使用JAN应用程序进行的本地部署。 在潜水之前,强烈鼓励初学者完成AI基础知识课程,以掌握LLM和生成AI的基础。>作者的图像
探索骆驼3.2型号
轻量级模型
轻巧的家族包括1B和3B参数变体。 它们的紧凑型尺寸允许进行设备处理,确保数据隐私和快速,成本效益的文本生成。 这些模型利用修剪和知识蒸馏来提高效率和性能。 3B模型超过了诸如Gemma 2和Phi 3.5-Mini之类的竞争对手,例如诸如教学和摘要之类的任务。
>来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉
视觉模型
视觉模型(11b和90b参数)是为图像推理而设计的,能够解释文档和图表。 它们的多模式能力源于将预训练的图像编码与语言模型集成在一起。 在视觉理解任务中,他们的表现优于克劳德3 haiku和gpt-4o mini。
来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉
以深入了解Llama 3.2的架构,基准和安全功能(Llama Guard 3),请参阅《官方Llama 3.2指南》。
>在Kaggle上访问Llama 3.2虽然Llama 3.2是开源的,但访问需要接受条款和条件。 这是通过kaggle访问它的方法:
- >请访问llama.com,填写访问表格,选择轻量级和视觉模型。 >导航到元| Llama 3.2型号页面上的型号并提交表格。
- 接受条款和条件。
- 等待笔记本创建选项。 选择“变形金刚”选项卡,选择您的模型变体,然后创建一个新的笔记本。
- 将加速器配置为“ gpu t4 x2”。 >
- >使用 。
-
transformers
随后的步骤涉及使用accelerate
库库加载令牌和模型,指定本地模型目录,设置%pip install -U transformers accelerate
,创建文本生成管道以及使用自定义提示的运行推断。 随附的Kaggle笔记本中提供了详细的代码示例。 类似的步骤适用于访问Llama 3.2视觉模型,尽管GPU要求明显更高。 >微调美洲驼3.2 3b指示
>本节通过微调Llama 3.2 3B指示模型在客户支持数据集上使用transformers
library和Qlora进行有效培训。
>设置
- 启动一个新的Kaggle笔记本和设置环境变量,用于拥抱面部和重量和偏见(WANDB)访问。
- 安装必要的软件包:
transformers
,datasets
,accelerate
,peft
,trl
,bitsandbytes
,wandb
和 。
- >使用您的API键登录以拥抱脸和魔杖。 >
- >定义基本模型,新模型名称和数据集名称的变量。
- 根据您的GPU功能确定适当的
- >>>>。
torch_dtype
>使用attn_implementation
进行4位量化的模型以最大程度地减少内存使用情况。 >
- 加载令牌。
BitsAndBytesConfig
- 加载和处理数据集
>加载
。- 洗牌并选择数据的子集(例如,1000个样本以进行更快的培训)。
bitext/Bitext-customer-support-llm-chatbot-training-dataset
>通过将系统指令,用户查询和助手响应组合到聊天格式中,创建一个“文本”列。
- 设置模型
-
apply_chat_template
>使用辅助函数识别所有线性模块名称。
使用
- 对lora进行配置。
- >设置
- ,并使用适当的超参数来进行高效培训。
LoraConfig
创建一个 - 实例,提供模型,数据集,洛拉配置,培训参数和令牌。
TrainingArguments
> - 模型培训
SFTTrainer
使用
模型推理
trainer.train()
>测试使用数据集中的示例提示的微调模型。
保存模型
>在本地保存微调模型,然后将其推到拥抱的脸上轮毂。
合并和导出微调模型>本节详细介绍了将微调的洛拉适配器与基本型号合并,并将其导出到拥抱的面轮。 它涉及加载基本模型和洛拉适配器,使用
>和
合并它们,然后保存并将合并模型推到集线器。>转换为gguf和本地部署
最后,教程将使用GGGUF我的回购工具在拥抱脸部和使用JAN应用程序本地部署它时将合并模型转换为GGGUF格式。 这涉及下载GGUF文件,将其导入JAN,并设置系统提示并停止令牌以获得最佳性能。结论
以上是微调美洲驼3.2并在本地使用:逐步指南的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一
