Zephyr-7B的綜合指南：功能，用法和微調-人工智慧-PHP中文網

了解Zephyr-7b

>設置並準備環境

結論

首頁

科技週邊

人工智慧

Zephyr-7B的綜合指南：功能，用法和微調

Jennifer Aniston

Mar 08, 2025 am 09:55 AM

探索Zephyr-7B：強大的開源LLM

> OpenAI LLM排行榜嗡嗡作響，旨在競爭GPT-4的新開源車型，而Zephyr-7B是一個出色的競爭者。本教程從WebPilot.ai探索了這種尖端語言模型，展示了它與變形金剛管道的使用，並在代理 - 教學數據集上進行了微調。 AI的新手？ AI基礎知識技能軌道是一個很好的起點。

了解Zephyr-7b

Zephyr系列的一部分

Zephyr-7b經過訓練，可以充當有益的助手。它的優勢在於生成連貫的文本，翻譯語言，總結信息，情感分析和上下文感知的問題回答。

Zephyr-7b-β：微調的漫威

該系列中的第二個模型是 Zephyr-7b-β是一個微調的Mistral-7b模型。在公共和合成數據集的混合物中，使用直接偏好優化（DPO）培訓，它擅長解釋複雜的查詢並彙總冗長的文本。在發行時，它在MT-Bench和Alpacaeval基準測試的7B聊天模型中排名第一。通過Zephyr Chat上的免費演示測試其功能。

來自Zephyr Chat Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

> >使用擁抱的臉型變壓器訪問Zephyr-7b

>本教程使用擁抱的臉部變壓器來輕鬆訪問。（如果遇到加載問題，請諮詢推理Kaggle筆記本。

安裝庫：

確保您有最新版本：>

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

登入後複製

import torch
from transformers import pipeline

登入後複製

利用多個GPU進行更快的生成。

device_map="auto"torch.bfloat16生成文本：

下面的示例演示了生成python代碼。

model_name = "HuggingFaceH4/zephyr-7b-beta"

pipe = pipeline(
    "text-generation",
    model=model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

登入後複製

prompt = "Write a Python function that can clean the HTML tags from the file:"

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

登入後複製

系統提示：

使用Zephyr-7B樣式系統提示自定義響應：> Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

自定義數據集上的微調Zephyr-7b

>設置並準備環境

安裝庫：

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

登入後複製

導入模塊：

import torch
from transformers import pipeline

登入後複製

> kaggle秘密（對於kaggle筆記本）：檢索擁抱的臉和偏見和偏見API鍵。
擁抱面部和重量和偏見登錄：>

model_name = "HuggingFaceH4/zephyr-7b-beta"

pipe = pipeline(
    "text-generation",
    model=model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

登入後複製

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

> Agentinstruct DataSet處理

prompt = "Write a Python function that can clean the HTML tags from the file:"

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

登入後複製

函數將數據集適應Zephyr-7b的及時樣式。

format_prompt

messages = [
    {
        "role": "system",
        "content": "You are a skilled software engineer who consistently produces high-quality Python code.",
    },
    {
        "role": "user",
        "content": "Write a Python code to display text in a star pattern.",
    },
]

prompt = pipe.tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

登入後複製

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >加載和準備模型

具有4位精度的

這對於有限的VRAM的GPU有效培訓至關重要。

%%capture
%pip install -U bitsandbytes
%pip install -U transformers
%pip install -U peft
%pip install -U accelerate
%pip install -U trl

登入後複製

# ... (Import statements as in original tutorial) ...

登入後複製

>這允許僅通過更新適配器層中的參數來進行有效的微調。 >

訓練模型

!huggingface-cli login --token $secret_hf
# ... (wandb login as in original tutorial) ...

登入後複製

>配置超參數（請參閱微調千層面2教程）。

base_model = "HuggingFaceH4/zephyr-7b-beta"
dataset_name = "THUDM/AgentInstruct"
new_model = "zephyr-7b-beta-Agent-Instruct"

登入後複製

使用擁抱Face的TRL庫來創建教練。 >

# ... (format_prompt function and dataset loading as in original tutorial) ...

登入後複製

開始訓練：

# ... (bnb_config and model loading as in original tutorial) ...

登入後複製

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >保存和部署微調模型

保存模型：

推到擁抱麵線：

# ... (tokenizer loading and configuration as in original tutorial) ...

登入後複製

# ... (peft_config and model preparation as in original tutorial) ...

登入後複製

測試微型模型 Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning >用各種提示測試模型的性能。原始教程中提供了示例。

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

結論

> Zephyr-7b-beta表現出令人印象深刻的功能。本教程為即使在資源受限的GPU上，也提供了利用和微調這一強大的LLM的綜合指南。考慮大型語言模型（LLMS）概念課程，以了解更深的LLM知識。

以上是Zephyr-7B的綜合指南：功能，用法和微調的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1669

CakePHP 教程

1428

Laravel 教程

1329

PHP教程

1273

C# 教程

1256

Related knowledge

如何使用AGNO框架構建多模式AI代理？ Apr 23, 2025 am 11:30 AM

在從事代理AI時，開發人員經常發現自己在速度，靈活性和資源效率之間進行權衡。我一直在探索代理AI框架，並遇到了Agno（以前是Phi-

如何在SQL中添加列？ - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表語句：動態地將列添加到數據庫在數據管理中，SQL的適應性至關重要。需要即時調整數據庫結構嗎？ Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

超越駱駝戲：大型語言模型的4個新基準 Apr 14, 2025 am 11:09 AM

陷入困境的基準：駱駝案例研究 2025年4月上旬，梅塔（Meta）揭開了其Llama 4套件的模特，擁有令人印象深刻的性能指標，使他們對GPT-4O和Claude 3.5 Sonnet等競爭對手的良好定位。倫斯的中心

OpenAI以GPT-4.1的重點轉移，將編碼和成本效率優先考慮 Apr 16, 2025 am 11:37 AM

該版本包括三種不同的型號，GPT-4.1，GPT-4.1 MINI和GPT-4.1 NANO，標誌著向大語言模型景觀內的特定任務優化邁進。這些模型並未立即替換諸如

多動症遊戲，健康工具和AI聊天機器人如何改變全球健康 Apr 14, 2025 am 11:27 AM

視頻遊戲可以緩解焦慮，建立焦點或支持多動症的孩子嗎？隨著醫療保健在全球範圍內挑戰，尤其是在青年中的挑戰，創新者正在轉向一種不太可能的工具：視頻遊戲。現在是世界上最大的娛樂印度河之一

Andrew Ng的新簡短課程 Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量：深入研究安德魯·NG的新課程想像一個未來，機器可以完全準確地理解和回答您的問題。這不是科幻小說；多虧了AI的進步，它已成為R

火箭發射模擬和分析使用Rocketpy -Analytics Vidhya Apr 19, 2025 am 11:12 AM

模擬火箭發射的火箭發射：綜合指南本文指導您使用強大的Python庫Rocketpy模擬高功率火箭發射。我們將介紹從定義火箭組件到分析模擬的所有內容

Google揭示了下一個2025年雲上最全面的代理策略 Apr 15, 2025 am 11:14 AM

雙子座是Google AI策略的基礎雙子座是Google AI代理策略的基石，它利用其先進的多模式功能來處理和生成跨文本，圖像，音頻，視頻和代碼的響應。由DeepM開發

See all articles

Zephyr-7B的綜合指南：功能，用法和微調

了解Zephyr-7b

>設置並準備環境

具有4位精度的

結論

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題