Zephyr-7B的綜合指南:功能,用法和微調
探索Zephyr-7B:強大的開源LLM
> OpenAI LLM排行榜嗡嗡作響,旨在競爭GPT-4的新開源車型,而Zephyr-7B是一個出色的競爭者。本教程從WebPilot.ai探索了這種尖端語言模型,展示了它與變形金剛管道的使用,並在代理 - 教學數據集上進行了微調。 AI的新手? AI基礎知識技能軌道是一個很好的起點。
了解Zephyr-7b
Zephyr系列的一部分Zephyr-7b經過訓練,可以充當有益的助手。它的優勢在於生成連貫的文本,翻譯語言,總結信息,情感分析和上下文感知的問題回答。
Zephyr-7b-β:微調的漫威
該系列中的第二個模型是 Zephyr-7b-β是一個微調的Mistral-7b模型。 在公共和合成數據集的混合物中,使用直接偏好優化(DPO)培訓,它擅長解釋複雜的查詢並彙總冗長的文本。 在發行時,它在MT-Bench和Alpacaeval基準測試的7B聊天模型中排名第一。 通過Zephyr Chat上的免費演示測試其功能。
來自Zephyr Chat
> >使用擁抱的臉型變壓器訪問Zephyr-7b
>本教程使用擁抱的臉部變壓器來輕鬆訪問。 (如果遇到加載問題,請諮詢推理Kaggle筆記本。>
安裝庫:
確保您有最新版本:- >導入庫:
!pip install -q -U transformers !pip install -q -U accelerate !pip install -q -U bitsandbytes
- 創建管道:
import torch from transformers import pipeline
- 提供更快的計算和減少的內存使用情況(但精度略低)。
-
device_map="auto"
torch.bfloat16
生成文本: 下面的示例演示了生成python代碼。
model_name = "HuggingFaceH4/zephyr-7b-beta" pipe = pipeline( "text-generation", model=model_name, torch_dtype=torch.bfloat16, device_map="auto", )
prompt = "Write a Python function that can clean the HTML tags from the file:" outputs = pipe( prompt, max_new_tokens=300, do_sample=True, temperature=0.7, top_k=50, top_p=0.95, ) print(outputs[0]["generated_text"])
使用Zephyr-7B樣式系統提示自定義響應:
-
自定義數據集上的微調Zephyr-7b
>設置並準備環境
- 安裝庫:
!pip install -q -U transformers !pip install -q -U accelerate !pip install -q -U bitsandbytes
-
導入模塊:
import torch from transformers import pipeline
-
> kaggle秘密(對於kaggle筆記本):檢索擁抱的臉和偏見和偏見API鍵。
-
擁抱面部和重量和偏見登錄:
>
model_name = "HuggingFaceH4/zephyr-7b-beta" pipe = pipeline( "text-generation", model=model_name, torch_dtype=torch.bfloat16, device_map="auto", )
- 定義模型和數據集名稱:
- >
prompt = "Write a Python function that can clean the HTML tags from the file:" outputs = pipe( prompt, max_new_tokens=300, do_sample=True, temperature=0.7, top_k=50, top_p=0.95, ) print(outputs[0]["generated_text"])
format_prompt
messages = [ { "role": "system", "content": "You are a skilled software engineer who consistently produces high-quality Python code.", }, { "role": "user", "content": "Write a Python code to display text in a star pattern.", }, ] prompt = pipe.tokenizer.apply_chat_template( messages, tokenize=False, add_generation_prompt=True ) outputs = pipe( prompt, max_new_tokens=300, do_sample=True, temperature=0.7, top_k=50, top_p=0.95, ) print(outputs[0]["generated_text"])
>加載和準備模型
具有4位精度的
>- 負載模型:
- 這對於有限的VRAM的GPU有效培訓至關重要。
%%capture %pip install -U bitsandbytes %pip install -U transformers %pip install -U peft %pip install -U accelerate %pip install -U trl
- >加載tokenizer:
# ... (Import statements as in original tutorial) ...
- 添加適配器層(peft):
- >這允許僅通過更新適配器層中的參數來進行有效的微調。 >
!huggingface-cli login --token $secret_hf # ... (wandb login as in original tutorial) ...
>
- 培訓參數:
- >配置超參數(請參閱微調千層面2教程)。
base_model = "HuggingFaceH4/zephyr-7b-beta" dataset_name = "THUDM/AgentInstruct" new_model = "zephyr-7b-beta-Agent-Instruct"
- SFT培訓師:
- 使用擁抱Face的TRL庫來創建教練。
>
# ... (format_prompt function and dataset loading as in original tutorial) ...
# ... (bnb_config and model loading as in original tutorial) ...
>保存和部署微調模型
# ... (tokenizer loading and configuration as in original tutorial) ...
- >
# ... (peft_config and model preparation as in original tutorial) ...
測試微型模型
>用各種提示測試模型的性能。原始教程中提供了示例。
結論
> Zephyr-7b-beta表現出令人印象深刻的功能。本教程為即使在資源受限的GPU上,也提供了利用和微調這一強大的LLM的綜合指南。 考慮大型語言模型(LLMS)概念課程,以了解更深的LLM知識。
以上是Zephyr-7B的綜合指南:功能,用法和微調的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

在從事代理AI時,開發人員經常發現自己在速度,靈活性和資源效率之間進行權衡。我一直在探索代理AI框架,並遇到了Agno(以前是Phi-

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

陷入困境的基準:駱駝案例研究 2025年4月上旬,梅塔(Meta)揭開了其Llama 4套件的模特,擁有令人印象深刻的性能指標,使他們對GPT-4O和Claude 3.5 Sonnet等競爭對手的良好定位。倫斯的中心

該版本包括三種不同的型號,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,標誌著向大語言模型景觀內的特定任務優化邁進。這些模型並未立即替換諸如

視頻遊戲可以緩解焦慮,建立焦點或支持多動症的孩子嗎? 隨著醫療保健在全球範圍內挑戰,尤其是在青年中的挑戰,創新者正在轉向一種不太可能的工具:視頻遊戲。現在是世界上最大的娛樂印度河之一

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

模擬火箭發射的火箭發射:綜合指南 本文指導您使用強大的Python庫Rocketpy模擬高功率火箭發射。 我們將介紹從定義火箭組件到分析模擬的所有內容

雙子座是Google AI策略的基礎 雙子座是Google AI代理策略的基石,它利用其先進的多模式功能來處理和生成跨文本,圖像,音頻,視頻和代碼的響應。由DeepM開發
