首页 科技周边 人工智能 微调骆驼3.1用于文本分类

微调骆驼3.1用于文本分类

Mar 05, 2025 am 11:08 AM

>本教程展示了精神健康情感分析的Llama 3.1-8B-IT模型。 我们将自定义模型以预测文本数据中的患者心理健康状况,将适配器与基本模型合并,并在拥抱面枢纽中部署完整的模型。 至关重要的是,请记住,在医疗保健中使用AI时,道德考虑是至关重要的。此示例仅用于说明目的。 >我们将使用Kaggle,使用Transformers库进行推理以及微调过程本身来介绍访问Llama 3.1型号。 先前对LLM微调的理解(请参阅我们的“微调LLMS介绍性指南”)是有益的。

>由作者Fine-Tuning Llama 3.1 for Text Classification

图像

理解Llama 3.1 Meta AI的多语言大语言模型(LLM)

Llama 3.1在语言理解和发电方面表现出色。 它提供8B,70B和405B参数版本,它建立在具有优化变压器的自动回归体系结构上。 经过多种公共数据的培训,它支持八种语言,并拥有128K上下文长度。 它的商业许可证很容易获得,并且在各种基准测试中都优于几个竞争对手。

来源:Llama 3.1(Meta.com)

> Fine-Tuning Llama 3.1 for Text Classification

>在kaggle上访问和使用Llama 3.1

我们将利用Kaggle的免费GPU/TPU。 请按照以下步骤:

>在meta.com上注册(使用您的kaggle电子邮件)。

> >访问Llama 3.1 Kaggle存储库和请求模型访问。> >使用提供的“代码”按钮启动Kaggle笔记本。

选择您的首选型号版本,然后将其添加到笔记本上。

安装必要的软件包(

)。
  1. 加载模型和令牌:
  2. 创建提示并运行推断:
  3. %pip install -U transformers accelerate
  4. 精神健康分类
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import torch

base_model = "/kaggle/input/llama-3.1/transformers/8b-instruct/1"

tokenizer = AutoTokenizer.from_pretrained(base_model)
model = AutoModelForCausalLM.from_pretrained(base_model, return_dict=True, low_cpu_mem_usage=True, torch_dtype=torch.float16, device_map="auto", trust_remote_code=True)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.float16, device_map="auto")
登录后复制
messages = [{"role": "user", "content": "What is the tallest building in the world?"}]
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
outputs = pipe(prompt, max_new_tokens=120, do_sample=True)
print(outputs[0]["generated_text"])
登录后复制
>设置:

>使用Llama 3.1启动新的Kaggle笔记本,安装必需的软件包(Fine-Tuning Llama 3.1 for Text Classification

    ),并添加“心理健康的情感分析”数据集。配置权重和偏见(使用您的API键)。
  1. 数据处理:加载数据集,清洁它(删除模棱两可的类别:“自杀”,“压力”,“人格障碍”),洗牌并分成培训,评估和测试集(使用3000个样本提高效率)。 创建提示并入语句和标签。

    >
  2. 模型加载:使用4位量化的记忆效率,加载Llama-3.1-8b-Insruct模型。加载令牌器并设置垫子令牌ID。

  3. >>预先调整评估:创建功能以预测标签和评估模型性能(准确性,分类报告,混淆矩阵)。 在微调之前评估模型的基线性能。

  4. 微调:使用适当的参数配置lora。设置培训论点(根据您的环境根据需要进行调整)。使用SFTTrainer训练模型。使用权重和偏见监控进度。

  5. > 在调查后评估:

    在微调后重新评估模型的性能。
  6. 合并并保存:PeftModel.from_pretrained()在新的kaggle笔记本中,使用model.merge_and_unload()

    将微调适配器与基本模型合并。测试合并模型。保存并将最终型号和令牌推到拥抱的脸部集线器上。
  7. >

/kaggle/input/...记住将占位符(如

)替换为您的实际文件路径。 完整的代码和详细说明可在原始响应中提供。 该凝结版本提供了高级概述和密钥代码片段。 在使用敏感数据时,始终优先考虑道德考虑。

以上是微调骆驼3.1用于文本分类的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
<🎜>掩盖:探险33-如何获得完美的色度催化剂
2 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1677
14
CakePHP 教程
1430
52
Laravel 教程
1333
25
PHP教程
1278
29
C# 教程
1257
24
如何使用AGNO框架构建多模式AI代理? 如何使用AGNO框架构建多模式AI代理? Apr 23, 2025 am 11:30 AM

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 Apr 16, 2025 am 11:37 AM

该版本包括三种不同的型号,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

火箭发射模拟和分析使用Rocketpy -Analytics Vidhya 火箭发射模拟和分析使用Rocketpy -Analytics Vidhya Apr 19, 2025 am 11:12 AM

模拟火箭发射的火箭发射:综合指南 本文指导您使用强大的Python库Rocketpy模拟高功率火箭发射。 我们将介绍从定义火箭组件到分析模拟的所有内容

DeepCoder-14b:O3-Mini和O1的开源竞赛 DeepCoder-14b:O3-Mini和O1的开源竞赛 Apr 26, 2025 am 09:07 AM

在AI社区的重大发展中,Agentica和AI共同发布了一个名为DeepCoder-14B的开源AI编码模型。与OpenAI等封闭源竞争对手提供代码生成功能

提示:chatgpt生成假护照 提示:chatgpt生成假护照 Apr 16, 2025 am 11:35 AM

Chip Giant Nvidia周一表示,它将开始制造AI超级计算机(可以处理大量数据并运行复杂算法的机器),完全是在美国首次在美国境内。这一消息是在特朗普总统SI之后发布的

跑道AI的Gen-4:AI蒙太奇如何超越荒谬 跑道AI的Gen-4:AI蒙太奇如何超越荒谬 Apr 16, 2025 am 11:45 AM

从数字营销到社交媒体的所有创意领域,电影业都站在技术十字路口。随着人工智能开始重塑视觉讲故事的各个方面并改变娱乐的景观

盖伊·佩里(Guy Peri)通过数据转换帮助麦考密克的未来 盖伊·佩里(Guy Peri)通过数据转换帮助麦考密克的未来 Apr 19, 2025 am 11:35 AM

盖伊·佩里(Guy Peri)是麦考密克(McCormick)的首席信息和数字官。尽管他的角色仅七个月,但Peri正在迅速促进公司数字能力的全面转变。他的职业生涯专注于数据和分析信息

See all articles