Rumah Peranti teknologi AI Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm

Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm

Apr 18, 2025 am 11:52 AM

Memanfaatkan kuasa AI di peranti: Membina CLI Chatbot Peribadi

Pada masa lalu, konsep pembantu AI peribadi kelihatan seperti fiksyen sains. Bayangkan Alex, seorang peminat teknologi, bermimpi seorang sahabat AI yang pintar, yang tidak bergantung pada perkhidmatan awan atau pelayan luaran. Terima kasih kepada kemajuan dalam model bahasa kecil (SLMS), impian Alex kini menjadi kenyataan. Artikel ini membimbing anda melalui perjalanan Alex dalam membuat aplikasi CLI sembang AI menggunakan Smollm Huggingface, fleksibiliti Langchain, dan antara muka mesra pengguna Typer. Anda akan membina pembantu AI berfungsi yang mampu berbual, menjawab soalan, dan menyimpan perbualan -semua di dalam terminal anda. Mari kita meneroka dunia AI di peranti!

Objektif Pembelajaran Utama:

  • Memegang fungsi dan aplikasi model SMOLLM Huggingface.
  • Gunakan model SLM untuk aplikasi AI pada peranti.
  • Terokai perhatian kumpulan-pertanyaan (GQA) dalam seni bina SLM.
  • Membangunkan aplikasi CLI interaktif menggunakan typer dan perpustakaan yang kaya.
  • Mengintegrasikan model Huggingface dengan Langchain untuk aplikasi AI yang mantap.

Jadual Kandungan:

  • Memperkenalkan Smollm Huggingface
  • Memahami Perhatian Kumpulan Kumpulan (GQA)
  • Menyelam jauh ke GQA
  • Menggunakan Smollm
  • Meneroka Typer
  • Melaksanakan typer
  • Persediaan Projek
  • Membina permohonan sembang
  • Soalan yang sering ditanya

Huggingface Smollm: Penampilan lebih dekat

Smollm adalah satu siri model bahasa kecil canggih, yang terdapat dalam tiga saiz (135m, 360m, dan parameter 1.7B). Dilatih di korpus berkualiti tinggi (Cosmopedia V2-gabungan buku teks sintetik, sampel python pendidikan, dan data web pendidikan), model-model ini cemerlang dalam tanda aras yang berkaitan dengan pemikiran akal dan pengetahuan dunia, mengatasi model lain dalam kategori saiz mereka mengikut Huggingface.

Perbandingan Prestasi:

Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm

Pengagihan Topik:

Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm

Model parameter 135m dan 360m menggunakan seni bina seperti Mobilellm, menggabungkan GQA dan mengutamakan kedalaman melebihi lebar.

Perhatian berkumpulan (GQA): Kecekapan ditakrifkan semula

Mekanisme perhatian datang dalam pelbagai bentuk:

Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm

  • Perhatian Multi-Head (MHA): Setiap kepala mempunyai pertanyaan bebas, kunci, dan nilai kepala-komputasi mahal.
  • Perhatian Multi-Kuarsa (MQA): Saham kunci dan nilai kepala, tetapi setiap kepala mengekalkan pertanyaannya sendiri-lebih cekap daripada MHA.
  • Perhatian Kumpulan Kumpulan (GQA): Kumpulan kepala perhatian, berkongsi kepala dan nilai nilai dalam kumpulan-mengoptimumkan kelajuan dan kecekapan. Fikirkannya sebagai satu pasukan yang bekerjasama, berkongsi sumber untuk meningkatkan produktiviti.

Memahami GQA secara terperinci

GQA meningkatkan kecekapan pemprosesan dengan mengumpulkan kepala perhatian, berkongsi kepala dan nilai nilai dalam setiap kumpulan. Ini berbeza dengan kaedah tradisional di mana setiap kepala mempunyai kunci dan nilai sendiri.

Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm

Pertimbangan utama:

  • GQA-G: GQA dengan kumpulan G.
  • GQS-1: Kes satu kumpulan, sama dengan MQA.
  • GQA-H: Bilangan kumpulan sama dengan bilangan kepala perhatian, sama dengan MHA.

Faedah GQA:

  • Peningkatan kelajuan: pemprosesan lebih cepat, terutamanya dalam model besar.
  • Kecekapan yang lebih baik: Mengurangkan pengendalian data, menjimatkan memori dan kuasa pemprosesan.
  • Keseimbangan optimum: mencapai keseimbangan antara kelajuan dan ketepatan.

Bekerja dengan Smollm

Pasang pytorch dan transformer menggunakan PIP:

 Pip Pasang Transformer Obor
Salin selepas log masuk

Coretan kod berikut (yang akan diletakkan di main.py ) menggunakan model SMOLLM-360M-Instruct (anda boleh menyesuaikan diri dengan saiz lain):

 Dari Transformers Import Automelforcausallm, Autotokenizer

Checkpoint = "HuggingFacetB/SMOLLM-360M-Instruct"
# ... (selebihnya kod seperti dalam artikel asal)
Salin selepas log masuk

Output Contoh:

Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm

(Teruskan dengan bahagian -bahagian yang tersisa, persediaan projek, melaksanakan aplikasi sembang, dan FAQ -mengikuti struktur dan kandungan artikel asal, menyesuaikan struktur dan struktur ayat untuk aliran dan kejelasan yang lebih baik sambil mengekalkan makna asal.)

Atas ialah kandungan terperinci Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Sistem Fusion, dijelaskan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1672
14
Tutorial PHP
1277
29
Tutorial C#
1256
24
Bagaimana Membina Ejen AI Multimodal Menggunakan Rangka Kerja AGNO? Bagaimana Membina Ejen AI Multimodal Menggunakan Rangka Kerja AGNO? Apr 23, 2025 am 11:30 AM

Semasa bekerja pada AIS AI, pemaju sering mendapati diri mereka menavigasi perdagangan antara kelajuan, fleksibiliti, dan kecekapan sumber. Saya telah meneroka rangka kerja AI yang agentik dan menjumpai Agno (sebelum ini adalah Phi-

Bagaimana untuk menambah lajur dalam SQL? - Analytics Vidhya Bagaimana untuk menambah lajur dalam SQL? - Analytics Vidhya Apr 17, 2025 am 11:43 AM

Pernyataan Jadual Alter SQL: Menambah lajur secara dinamik ke pangkalan data anda Dalam pengurusan data, kebolehsuaian SQL adalah penting. Perlu menyesuaikan struktur pangkalan data anda dengan cepat? Pernyataan Jadual ALTER adalah penyelesaian anda. Butiran panduan ini menambah colu

Terbuka beralih fokus dengan GPT-4.1, mengutamakan pengekodan dan kecekapan kos Terbuka beralih fokus dengan GPT-4.1, mengutamakan pengekodan dan kecekapan kos Apr 16, 2025 am 11:37 AM

Pelepasan ini termasuk tiga model yang berbeza, GPT-4.1, GPT-4.1 Mini dan GPT-4.1 Nano, menandakan langkah ke arah pengoptimuman khusus tugas dalam landskap model bahasa yang besar. Model-model ini tidak segera menggantikan antara muka yang dihadapi pengguna seperti

Kursus Pendek Baru mengenai Model Embedding oleh Andrew Ng Kursus Pendek Baru mengenai Model Embedding oleh Andrew Ng Apr 15, 2025 am 11:32 AM

Buka kunci kekuatan model embedding: menyelam jauh ke kursus baru Andrew Ng Bayangkan masa depan di mana mesin memahami dan menjawab soalan anda dengan ketepatan yang sempurna. Ini bukan fiksyen sains; Terima kasih kepada kemajuan dalam AI, ia menjadi R

Simulasi dan analisis pelancaran roket menggunakan Rocketpy - Analytics Vidhya Simulasi dan analisis pelancaran roket menggunakan Rocketpy - Analytics Vidhya Apr 19, 2025 am 11:12 AM

Simulasi Rocket dilancarkan dengan Rocketpy: Panduan Komprehensif Artikel ini membimbing anda melalui mensimulasikan pelancaran roket kuasa tinggi menggunakan Rocketpy, perpustakaan Python yang kuat. Kami akan merangkumi segala -galanya daripada menentukan komponen roket untuk menganalisis simula

Google melancarkan strategi ejen yang paling komprehensif di Cloud Seterusnya 2025 Google melancarkan strategi ejen yang paling komprehensif di Cloud Seterusnya 2025 Apr 15, 2025 am 11:14 AM

Gemini sebagai asas strategi AI Google Gemini adalah asas kepada strategi ejen AI Google, memanfaatkan keupayaan multimodalnya untuk memproses dan menjana respons di seluruh teks, imej, audio, video dan kod. Dibangunkan oleh DeepM

Robot Humanoid Sumber Terbuka yang Anda Boleh Mencetak Diri 3D: Memeluk Wajah Membeli Robotik Debunga Robot Humanoid Sumber Terbuka yang Anda Boleh Mencetak Diri 3D: Memeluk Wajah Membeli Robotik Debunga Apr 15, 2025 am 11:25 AM

"Super gembira untuk mengumumkan bahawa kami memperoleh robotik debunga untuk membawa robot sumber terbuka ke dunia," kata Hugging Face pada X. "Sejak Remi Cadene menyertai kami dari Tesla, kami telah menjadi platform perisian yang paling banyak digunakan untuk robot terbuka terima kasih

DeepCoder-14b: Pertandingan sumber terbuka untuk O3-Mini dan O1 DeepCoder-14b: Pertandingan sumber terbuka untuk O3-Mini dan O1 Apr 26, 2025 am 09:07 AM

Dalam perkembangan penting bagi komuniti AI, Agentica dan bersama-sama AI telah mengeluarkan model pengekodan AI sumber terbuka bernama DeepCoder-14b. Menawarkan keupayaan penjanaan kod setanding dengan pesaing sumber tertutup seperti OpenAI

See all articles