目录
轻巧的家族包括1B和3B参数变体。 它们的紧凑型尺寸允许进行设备处理,确保数据隐私和快速,成本效益的文本生成。 这些模型利用修剪和知识蒸馏来提高效率和性能。 3B模型超过了诸如Gemma 2和Phi 3.5-Mini之类的竞争对手,例如诸如教学和摘要之类的任务。
来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉
>设置
>加载
使用
保存模型
>转换为gguf和本地部署
结论
首页 科技周边 人工智能 微调美洲驼3.2并在本地使用:逐步指南

微调美洲驼3.2并在本地使用:逐步指南

Mar 03, 2025 am 10:30 AM

解锁骆驼的力量3.2:综合指南和本地部署

大语模型(LLM)的景观正在迅速发展,重点是较小,更有效的模型。 Llama 3.2凭借其轻巧和视力模型的变化体现了这一趋势。本教程详细介绍了如何利用Llama 3.2的功能,特别是3B轻型模型,用于在客户支持数据集上进行微调以及使用JAN应用程序进行的本地部署。 在潜水之前,强烈鼓励初学者完成AI基础知识课程,以掌握LLM和生成AI的基础。

>作者的图像

Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide 探索骆驼3.2型号

Llama 3.2提供了两个模型系列:轻量级和视野。轻巧的模型在多语言文本生成和工具使用方面表现出色,非常适合资源受限环境。另一方面,视觉模型专门研究图像推理和多模式任务。

轻量级模型

轻巧的家族包括1B和3B参数变体。 它们的紧凑型尺寸允许进行设备处理,确保数据隐私和快速,成本效益的文本生成。 这些模型利用修剪和知识蒸馏来提高效率和性能。 3B模型超过了诸如Gemma 2和Phi 3.5-Mini之类的竞争对手,例如诸如教学和摘要之类的任务。

>

来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉

视觉模型

Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide 视觉模型(11b和90b参数)是为图像推理而设计的,能够解释文档和图表。 它们的多模式能力源于将预训练的图像编码与语言模型集成在一起。 在视觉理解任务中,他们的表现优于克劳德3 haiku和gpt-4o mini。

来源:Llama 3.2:用开放的,可自定义的模型革命性的边缘AI和视觉

以深入了解Llama 3.2的架构,基准和安全功能(Llama Guard 3),请参阅《官方Llama 3.2指南》。

>在Kaggle上访问Llama 3.2

虽然Llama 3.2是开源的,但访问需要接受条款和条件。 这是通过kaggle访问它的方法:Fine-tuning Llama 3.2 and Using It Locally: A Step-by-Step Guide

  1. >请访问llama.com,填写访问表格,选择轻量级和视觉模型。
  2. >导航到元| Llama 3.2型号页面上的型号并提交表格。
  3. 接受条款和条件。
  4. 等待笔记本创建选项。 选择“变形金刚”选项卡,选择您的模型变体,然后创建一个新的笔记本。
  5. 将加速器配置为“ gpu t4 x2”。
  6. >
  7. >使用
  8. transformers随后的步骤涉及使用accelerate库库加载令牌和模型,指定本地模型目录,设置%pip install -U transformers accelerate,创建文本生成管道以及使用自定义提示的运行推断。 随附的Kaggle笔记本中提供了详细的代码示例。 类似的步骤适用于访问Llama 3.2视觉模型,尽管GPU要求明显更高。
  9. >微调美洲驼3.2 3b指示

>本节通过微调Llama 3.2 3B指示模型在客户支持数据集上使用transformers library和Qlora进行有效培训。

>设置

  1. 启动一个新的Kaggle笔记本和设置环境变量,用于拥抱面部和重量和偏见(WANDB)访问。
  2. 安装必要的软件包:transformersdatasetsacceleratepefttrlbitsandbyteswandb
  3. >使用您的API键登录以拥抱脸和魔杖。
  4. >
  5. >定义基本模型,新模型名称和数据集名称的变量。
加载模型和令牌

    根据您的GPU功能确定适当的
  1. >>>>。 torch_dtype>使用attn_implementation进行4位量化的模型以最大程度地减少内存使用情况。
  2. >
  3. 加载令牌。BitsAndBytesConfig
  4. 加载和处理数据集

>加载

  1. 洗牌并选择数据的子集(例如,1000个样本以进行更快的培训)。bitext/Bitext-customer-support-llm-chatbot-training-dataset
  2. >通过将系统指令,用户查询和助手响应组合到聊天格式中,创建一个“文本”列。
  3. 设置模型
  4. apply_chat_template
  5. >使用辅助函数识别所有线性模块名称。

使用

    对lora进行配置。
  1. >设置
  2. ,并使用适当的超参数来进行高效培训。LoraConfig
  3. 创建一个
  4. 实例,提供模型,数据集,洛拉配置,培训参数和令牌。TrainingArguments>
  5. 模型培训SFTTrainer
  6. 使用
训练模型。 使用WANDB进行监视培训和验证损失。

模型推理

trainer.train()>测试使用数据集中的示例提示的微调模型。

>

保存模型

>在本地保存微调模型,然后将其推到拥抱的脸上轮毂。

合并和导出微调模型

>本节详细介绍了将微调的洛拉适配器与基本型号合并,并将其导出到拥抱的面轮。 它涉及加载基本模型和洛拉适配器,使用

>和

合并它们,然后保存并将合并模型推到集线器。

>转换为gguf和本地部署

最后,教程将使用GGGUF我的回购工具在拥抱脸部和使用JAN应用程序本地部署它时将合并模型转换为GGGUF格式。 这涉及下载GGUF文件,将其导入JAN,并设置系统提示并停止令牌以获得最佳性能。>

结论

微调较小的LLMS为定制特定任务的模型提供了一种经济高效且有效的方法。 本教程提供了一个实用指南,以利用Llama 3.2的功能,从访问和微调到本地部署,使用户能够构建和部署自定义AI解决方案。 切记查阅随附的Kaggle笔记本以获取详细的代码示例。

以上是微调美洲驼3.2并在本地使用:逐步指南的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1665
14
CakePHP 教程
1424
52
Laravel 教程
1322
25
PHP教程
1270
29
C# 教程
1249
24
10个生成AI编码扩展,在VS代码中,您必须探索 10个生成AI编码扩展,在VS代码中,您必须探索 Apr 13, 2025 am 01:14 AM

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? Apr 13, 2025 am 10:18 AM

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

视觉语言模型(VLMS)的综合指南 视觉语言模型(VLMS)的综合指南 Apr 12, 2025 am 11:58 AM

介绍 想象一下,穿过​​美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

pixtral -12b:Mistral AI&#039;第一个多模型模型 - 分析Vidhya pixtral -12b:Mistral AI&#039;第一个多模型模型 - 分析Vidhya Apr 13, 2025 am 11:20 AM

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

超越骆驼戏:大型语言模型的4个新基准 超越骆驼戏:大型语言模型的4个新基准 Apr 14, 2025 am 11:09 AM

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

如何使用AGNO框架构建多模式AI代理? 如何使用AGNO框架构建多模式AI代理? Apr 23, 2025 am 11:30 AM

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

多动症游戏,健康工具和AI聊天机器人如何改变全球健康 多动症游戏,健康工具和AI聊天机器人如何改变全球健康 Apr 14, 2025 am 11:27 AM

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一

See all articles