Huggingface Smollm으로 개인 AI 조수를 만드는 방법-일체 포함-php.cn

집

기술 주변기기

일체 포함

Huggingface Smollm으로 개인 AI 조수를 만드는 방법

William Shakespeare

Apr 18, 2025 am 11:52 AM

ON-DEVICE AI의 힘을 활용 : 개인 챗봇 CLI 구축

최근에 개인 AI 조수의 개념은 공상 과학처럼 보였다. 클라우드 서비스 나 외부 서버에 의존하지 않는 스마트 한 지역 AI 동반자를 꿈꾸는 기술 애호가 인 Alex를 상상해보십시오. SLM (Small Language Models)의 발전 덕분에 Alex의 꿈은 이제 현실입니다. 이 기사는 Huggingf 터미널 내에서 채팅, 질문에 대답하고 대화를 저장할 수있는 기능적 AI 보조원을 구축합니다. Op-Device ai의 세계를 탐구합시다!

주요 학습 목표 :

Huggingface Smollm 모델의 기능과 응용 프로그램을 파악하십시오.
Op-Device AI 응용 프로그램에 SLM 모델을 활용하십시오.
SLM 아키텍처 내에서 GQA (Grouped-Query 관심)를 탐색하십시오.
Typer 및 Rich 라이브러리를 사용하여 대화식 CLI 응용 프로그램을 개발하십시오.
강력한 AI 애플리케이션을 위해 Huggingface 모델을 Langchain과 통합하십시오.

목차 :

Huggingface Smollm 소개
그룹화 된 관심 이해 (GQA)
GQA 로의 깊은 다이빙
Smollm 사용
타이퍼 탐험
타이퍼 구현
프로젝트 설정
채팅 응용 프로그램 구축
자주 묻는 질문

Huggingface Smollm : 더 자세한 표정

Smollm은 세 가지 크기 (135m, 360m 및 1.7b 매개 변수)로 제공되는 일련의 최첨단 소형 언어 모델입니다. 고품질 코퍼스 (Cosmopedia v2-합성 교과서, 교육 파이썬 샘플 및 교육 웹 데이터의 혼합)에 대한 교육을받은 이러한 모델은 공통 감각 추론 및 세계 지식과 관련된 벤치 마크에서 뛰어나고 Huggingface에 따르면 크기 범주에서 다른 모델을 능가합니다.

성능 비교 :

Huggingface Smollm으로 개인 AI 조수를 만드는 방법

주제 분포 :

Huggingface Smollm으로 개인 AI 조수를 만드는 방법

135m 및 360m 매개 변수 모델은 Mobilellm과 같은 아키텍처를 사용하여 GQA를 통합하고 폭 이상 깊이 우선 순위를 정합니다.

GQA (Grouped-Query주의) : 효율성 재정의

주의 메커니즘은 다양한 형태로 제공됩니다.

Huggingface Smollm으로 개인 AI 조수를 만드는 방법

멀티 헤드주의 (MHA) : 각 헤드에는 독립적 인 쿼리, 키 및 가치 헤드가 있습니다.
다중 정체주의 (MQA) : 공유 키 및 가치 헤드를 공유하지만 각 헤드는 MHA보다 더 효율적인 자체 쿼리를 유지합니다.
GQA (Grouped-Query Arection) : 그룹 내에서 키 및 가치 헤드를 공유하는 그룹의주의 헤드를 그룹화합니다. 속도와 효율성을 최적화합니다. 이를 팀이 협력 적으로 일하는 팀으로 생각하여 생산성 향상을위한 리소스를 공유하십시오.

GQA를 자세히 이해합니다

GQA는 각 그룹 내에서 키 및 값 헤드를 공유하여주의 헤드를 그룹화하여 처리 효율성을 향상시킵니다. 이것은 각 머리에 고유 한 키와 값이있는 전통적인 방법과 대조됩니다.

Huggingface Smollm으로 개인 AI 조수를 만드는 방법

주요 고려 사항 :

GQA-G : G 그룹과 GQA.
GQS-1 : MQA와 유사한 단일 그룹 케이스.
GQA-H : 그룹의 수는 MHA와 유사한주의 헤드 수와 같습니다.

GQA의 이점 :

속도 증가 : 특히 대형 모델에서는 더 빠른 처리.
효율성 향상 : 데이터 처리 감소, 메모리 절약 및 처리 전력.
최적의 균형 : 속도와 정확도의 균형을 달성합니다.

Smollm과 협력합니다

PIP를 사용하여 Pytorch 및 Transformers를 설치하십시오.

 PIP Torch Transformers를 설치하십시오

로그인 후 복사

다음 코드 스 니펫 ( main.py 에 배치)은 smollm-360m-instruct 모델을 사용합니다 (다른 크기에 적응할 수 있음).

 Transformers에서 AutoTokenizer의 AutomodElforcausAllm을 가져옵니다

Checkpoint = "HuggingFacetb/Smollm-360m-instruct"
# ... (원래 기사에서와 같이 코드의 나머지)

로그인 후 복사

예제 출력 :

Huggingface Smollm으로 개인 AI 조수를 만드는 방법

(원래 기사의 구조와 내용을 팔로우하여 원래 의미를 유지하면서 개선 된 흐름과 명확성을 위해 문구 및 문장 구조를 조정하면서 나머지 섹션 (단위, 프로젝트 설정, 채팅 응용 프로그램 및 FAQ)을 계속하십시오.

위 내용은 Huggingface Smollm으로 개인 AI 조수를 만드는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

자바 튜토리얼

1664

Cakephp 튜토리얼

1422

라라벨 튜토리얼

1316

PHP 튜토리얼

1268

C# 튜토리얼

1242

Related knowledge

Meta Llama 3.2- 분석 Vidhya를 시작합니다 Apr 11, 2025 pm 12:04 PM

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다. Apr 13, 2025 am 01:14 AM

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - &#8217

AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등 Apr 11, 2025 pm 12:01 PM

이번 주 AI 환경 : 발전의 회오리 바람, 윤리적 고려 사항 및 규제 토론. OpenAi, Google, Meta 및 Microsoft와 같은 주요 플레이어

직원에게 AI 전략 판매 : Shopify CEO의 선언문 Apr 10, 2025 am 11:19 AM

Shopify CEO Tobi Lütke의 최근 메모는 AI 숙련도가 모든 직원에 대한 근본적인 기대를 대담하게 선언하여 회사 내에서 중요한 문화적 변화를 표시합니다. 이것은 도망가는 트렌드가 아닙니다. 그것은 p에 통합 된 새로운 운영 패러다임입니다

GPT-4O vs Openai O1 : 새로운 OpenAI 모델은 과대 광고 가치가 있습니까? Apr 13, 2025 am 10:18 AM

소개 OpenAi는 기대가 많은 "Strawberry"아키텍처를 기반으로 새로운 모델을 출시했습니다. O1로 알려진이 혁신적인 모델은 추론 기능을 향상시켜 문제를 통해 생각할 수 있습니다.

비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서 Apr 12, 2025 am 11:58 AM

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

LLAMA 3.2를 실행하는 3 가지 방법 분석 Vidhya Apr 11, 2025 am 11:56 AM

메타의 라마 3.2 : 멀티 모달 AI 강국 Meta의 최신 멀티 모드 모델 인 LLAMA 3.2는 AI의 상당한 발전으로 향상된 언어 이해력, 개선 된 정확도 및 우수한 텍스트 생성 기능을 자랑합니다. 그것의 능력 t

최고의 프롬프트 엔지니어링 기술의 최신 연간 편집 Apr 10, 2025 am 11:22 AM

내 칼럼을 처음 접할 수있는 분들을 위해, 나는 구체화 된 AI, AI 추론, AI의 첨단 획기적인 혁신, AI 교육, AI의 수비, ai re

See all articles

Huggingface Smollm으로 개인 AI 조수를 만드는 방법

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제