Zephyr-7B에 대한 포괄적 인 가이드 : 기능, 사용 및 미세 조정-일체 포함-php.cn

집

기술 주변기기

일체 포함

Zephyr-7B에 대한 포괄적 인 가이드 : 기능, 사용 및 미세 조정

Jennifer Aniston

Mar 08, 2025 am 09:55 AM

Zephyr-7b 탐색 : 강력한 오픈 소스 llm

OpenAi LLM 리더 보드는 GPT-4와 경쟁하기위한 새로운 오픈 소스 모델로 윙윙 거리고 있으며 Zephyr-7B는 눈에 띄는 경쟁자입니다. 이 튜토리얼은 WebPilot.ai 의이 최첨단 언어 모델을 탐색하여 변압기 파이프 라인과 함께 사용하고 에이전트 강의 데이터 세트에서 미세 조정을 보여줍니다. AI에 새로? AI 기초 기술 트랙은 좋은 출발점입니다.

zephyr-7b 이해 Zephyr 시리즈의 일부인 Zephyr-7b는 유용한 조수로 기능하도록 훈련되었습니다. 그것의 강점은 일관된 텍스트를 생성, 언어 번역, 정보 요약, 감정 분석 및 상황 인식 질문 응답에 있습니다. Zephyr-7b-β : 미세 조정 된 Marvel 시리즈의 두 번째 모델 인 Zephyr-7B-β는 미세 조정 된 Mistral-7B 모델입니다. 공개 및 합성 데이터 세트의 혼합에서 DPO (Direct Preference Optimization)를 사용하여 교육을받은 이들은 복잡한 쿼리를 해석하고 긴 텍스트를 요약하는 데 탁월합니다. 출시시, MT-Bench 및 Alpacaeval 벤치 마크에서 7B 채팅 모델 중 최고 자리를 차지했습니다. Zephyr 채팅에서 무료 데모로 기능을 테스트하십시오.

Zephyr Chat의 이미지

포옹 얼굴 변압기로 Zephyr-7B에 접근합니다 이 튜토리얼은 포옹 페이스 트랜스포머를 사용하여 쉽게 접근 할 수 있습니다. (로드 문제가 발생하면 추론 Kaggle 노트북을 참조하십시오.)

라이브러리 설치 :

최신 버전이 있는지 확인하십시오

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning 도서관 가져 오기 :

파이프 라인 생성 : 는 여러 GPU를 사용하여 더 빠른 생성을 위해 사용합니다. 는 더 빠른 계산과 메모리 사용이 줄어든 (그러나 정밀도가 약간 낮음)를 제공합니다.

텍스트 생성 :

아래의 예는 파이썬 코드를 생성하는 것을 보여줍니다

Zephyr-7B 스타일 시스템 프롬프트로 응답을 사용자 정의합니다

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

로그인 후 복사

사용자 정의 데이터 세트에서 미세 조정 zephyr-7b 이 섹션은 Kaggle의 무료 GPU (약 2 시간)를 사용하여 사용자 정의 데이터 세트에서 미세 조정 Zephyr-7B-Beta를 안내합니다. (문제 해결에 대해서는 미세 조정 Kaggle 노트북을 참조하십시오.) 환경 설정 및 준비 <h2> 라이브러리 설치 : </h2> <ol> <li> <strong> 가져 오기 모듈 : </strong> </li> </ol> <div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">!pip install -q -U transformers !pip install -q -U accelerate !pip install -q -U bitsandbytes
로그인 후 복사

포옹 얼굴과 무게 및 편견 API 키를 검색합니다.

import torch
from transformers import pipeline

로그인 후 복사

모델 및 데이터 세트 이름을 정의하십시오 :
AgentInstruct 데이터 세트 처리 함수는 데이터 세트를 Zephyr-7b의 프롬프트 스타일에 적용합니다.

모델을로드하고 준비합니다 <pre class="brush:php;toolbar:false">model_name = "HuggingFaceH4/zephyr-7b-beta" pipe = pipeline( "text-generation", model=model_name, torch_dtype=torch.bfloat16, device_map="auto", )

로그인 후 복사

4 비트 정밀도를 가진 로드 모델 :

제한된 VRAM을 사용하여 GPU에 대한 효율적인 교육에 중요합니다. Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

로드 토큰 화기 :

prompt = "Write a Python function that can clean the HTML tags from the file:"

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

로그인 후 복사

어댑터 레이어 추가 (PEFT) :

이를 통해 어댑터 레이어에서 매개 변수 만 업데이트하여 효율적인 미세 조정이 가능합니다.

모델 훈련 format_prompt 훈련 인수 :

하이퍼 파라미터 구성 (자세한 내용은 미세 조정 llama 2 튜토리얼 참조).

messages = [
    {
        "role": "system",
        "content": "You are a skilled software engineer who consistently produces high-quality Python code.",
    },
    {
        "role": "user",
        "content": "Write a Python code to display text in a star pattern.",
    },
]

prompt = pipe.tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)

outputs = pipe(
    prompt,
    max_new_tokens=300,
    do_sample=True,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
)
print(outputs[0]["generated_text"])

로그인 후 복사

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning

SFT 트레이너 :

포옹 페이스의 TRL 라이브러리를 사용하여 트레이너를 만듭니다.

훈련 시작 :

%%capture
%pip install -U bitsandbytes
%pip install -U transformers
%pip install -U peft
%pip install -U accelerate
%pip install -U trl

로그인 후 복사

미세 조정 모델을 저장하고 배포합니다

모델을 저장 :

# ... (Import statements as in original tutorial) ...

로그인 후 복사

포옹 페이스 허브로 밀어 넣으십시오 :

미세 조정 모델 테스트 다양한 프롬프트로 모델의 성능을 테스트하십시오. 예제는 원본 자습서에 제공됩니다

Comprehensive Guide to Zephyr-7B: Features, Usage, and Fine-tuning 결론 Zephyr-7B-Beta는 인상적인 기능을 보여줍니다. 이 튜토리얼은 자원으로 제한 된 GPU 에서도이 강력한 LLM을 활용하고 미세 조정하는 포괄적 인 안내서를 제공합니다. 더 깊은 LLM 지식을위한 마스터 큰 언어 모델 (LLMS) 개념 과정을 고려하십시오.

위 내용은 Zephyr-7B에 대한 포괄적 인 가이드 : 기능, 사용 및 미세 조정의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

자바 튜토리얼

1666

Cakephp 튜토리얼

1425

라라벨 튜토리얼

1328

PHP 튜토리얼

1273

C# 튜토리얼

1253

Related knowledge

10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다. Apr 13, 2025 am 01:14 AM

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - &#8217

GPT-4O vs Openai O1 : 새로운 OpenAI 모델은 과대 광고 가치가 있습니까? Apr 13, 2025 am 10:18 AM

소개 OpenAi는 기대가 많은 "Strawberry"아키텍처를 기반으로 새로운 모델을 출시했습니다. O1로 알려진이 혁신적인 모델은 추론 기능을 향상시켜 문제를 통해 생각할 수 있습니다.

SQL에서 열을 추가하는 방법? - 분석 Vidhya Apr 17, 2025 am 11:43 AM

SQL의 Alter Table 문 : 데이터베이스에 열을 동적으로 추가 데이터 관리에서 SQL의 적응성이 중요합니다. 데이터베이스 구조를 즉시 조정해야합니까? Alter Table 문은 솔루션입니다. 이 안내서는 Colu를 추가합니다

Pixtral -12B : Mistral AI의 첫 번째 멀티 모드 모델 -Anuctics Vidhya Apr 13, 2025 am 11:20 AM

소개 Mistral은 최초의 멀티 모드 모델, 즉 Pixtral-12B-2409를 발표했습니다. 이 모델은 Mistral의 120 억 개의 매개 변수 인 NEMO 12B를 기반으로합니다. 이 모델을 차별화하는 것은 무엇입니까? 이제 이미지와 Tex를 모두 가져갈 수 있습니다

Agno 프레임 워크를 사용하여 멀티 모달 AI 에이전트를 구축하는 방법은 무엇입니까? Apr 23, 2025 am 11:30 AM

에이전트 AI에서 작업하는 동안 개발자는 종종 속도, 유연성 및 자원 효율성 사이의 상충 관계를 탐색하는 것을 발견합니다. 나는 에이전트 AI 프레임 워크를 탐구하고 Agno를 만났다 (이전에는 ph-이었다.

라마 드라마 너머 : 대형 언어 모델에 대한 4 개의 새로운 벤치 마크 Apr 14, 2025 am 11:09 AM

문제가있는 벤치 마크 : 라마 사례 연구 2025 년 4 월 초, Meta는 LLAMA 4 제품군을 공개하여 GPT-4O 및 Claude 3.5 Sonnet과 같은 경쟁자들에 대해 호의적으로 배치 한 인상적인 성능 지표를 자랑했습니다. Launc의 중심

ADHD 게임, 건강 도구 및 AI 챗봇이 글로벌 건강을 변화시키는 방법 Apr 14, 2025 am 11:27 AM

비디오 게임이 불안을 완화하거나 집중하거나 ADHD를 가진 어린이를 지원할 수 있습니까? 건강 관리 도전이 전 세계적으로 급증함에 따라, 특히 청소년들 사이에서 혁신가들은 비디오 게임 인 가능성이없는 도구로 전환하고 있습니다. 이제 세계 최대의 엔터테인먼트 인더스 중 하나입니다