Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm
Memanfaatkan kuasa AI di peranti: Membina CLI Chatbot Peribadi
Pada masa lalu, konsep pembantu AI peribadi kelihatan seperti fiksyen sains. Bayangkan Alex, seorang peminat teknologi, bermimpi seorang sahabat AI yang pintar, yang tidak bergantung pada perkhidmatan awan atau pelayan luaran. Terima kasih kepada kemajuan dalam model bahasa kecil (SLMS), impian Alex kini menjadi kenyataan. Artikel ini membimbing anda melalui perjalanan Alex dalam membuat aplikasi CLI sembang AI menggunakan Smollm Huggingface, fleksibiliti Langchain, dan antara muka mesra pengguna Typer. Anda akan membina pembantu AI berfungsi yang mampu berbual, menjawab soalan, dan menyimpan perbualan -semua di dalam terminal anda. Mari kita meneroka dunia AI di peranti!
Objektif Pembelajaran Utama:
- Memegang fungsi dan aplikasi model SMOLLM Huggingface.
- Gunakan model SLM untuk aplikasi AI pada peranti.
- Terokai perhatian kumpulan-pertanyaan (GQA) dalam seni bina SLM.
- Membangunkan aplikasi CLI interaktif menggunakan typer dan perpustakaan yang kaya.
- Mengintegrasikan model Huggingface dengan Langchain untuk aplikasi AI yang mantap.
Jadual Kandungan:
- Memperkenalkan Smollm Huggingface
- Memahami Perhatian Kumpulan Kumpulan (GQA)
- Menyelam jauh ke GQA
- Menggunakan Smollm
- Meneroka Typer
- Melaksanakan typer
- Persediaan Projek
- Membina permohonan sembang
- Soalan yang sering ditanya
Huggingface Smollm: Penampilan lebih dekat
Smollm adalah satu siri model bahasa kecil canggih, yang terdapat dalam tiga saiz (135m, 360m, dan parameter 1.7B). Dilatih di korpus berkualiti tinggi (Cosmopedia V2-gabungan buku teks sintetik, sampel python pendidikan, dan data web pendidikan), model-model ini cemerlang dalam tanda aras yang berkaitan dengan pemikiran akal dan pengetahuan dunia, mengatasi model lain dalam kategori saiz mereka mengikut Huggingface.
Perbandingan Prestasi:
Pengagihan Topik:
Model parameter 135m dan 360m menggunakan seni bina seperti Mobilellm, menggabungkan GQA dan mengutamakan kedalaman melebihi lebar.
Perhatian berkumpulan (GQA): Kecekapan ditakrifkan semula
Mekanisme perhatian datang dalam pelbagai bentuk:
- Perhatian Multi-Head (MHA): Setiap kepala mempunyai pertanyaan bebas, kunci, dan nilai kepala-komputasi mahal.
- Perhatian Multi-Kuarsa (MQA): Saham kunci dan nilai kepala, tetapi setiap kepala mengekalkan pertanyaannya sendiri-lebih cekap daripada MHA.
- Perhatian Kumpulan Kumpulan (GQA): Kumpulan kepala perhatian, berkongsi kepala dan nilai nilai dalam kumpulan-mengoptimumkan kelajuan dan kecekapan. Fikirkannya sebagai satu pasukan yang bekerjasama, berkongsi sumber untuk meningkatkan produktiviti.
Memahami GQA secara terperinci
GQA meningkatkan kecekapan pemprosesan dengan mengumpulkan kepala perhatian, berkongsi kepala dan nilai nilai dalam setiap kumpulan. Ini berbeza dengan kaedah tradisional di mana setiap kepala mempunyai kunci dan nilai sendiri.
Pertimbangan utama:
- GQA-G: GQA dengan kumpulan G.
- GQS-1: Kes satu kumpulan, sama dengan MQA.
- GQA-H: Bilangan kumpulan sama dengan bilangan kepala perhatian, sama dengan MHA.
Faedah GQA:
- Peningkatan kelajuan: pemprosesan lebih cepat, terutamanya dalam model besar.
- Kecekapan yang lebih baik: Mengurangkan pengendalian data, menjimatkan memori dan kuasa pemprosesan.
- Keseimbangan optimum: mencapai keseimbangan antara kelajuan dan ketepatan.
Bekerja dengan Smollm
Pasang pytorch dan transformer menggunakan PIP:
Pip Pasang Transformer Obor
Coretan kod berikut (yang akan diletakkan di main.py
) menggunakan model SMOLLM-360M-Instruct (anda boleh menyesuaikan diri dengan saiz lain):
Dari Transformers Import Automelforcausallm, Autotokenizer Checkpoint = "HuggingFacetB/SMOLLM-360M-Instruct" # ... (selebihnya kod seperti dalam artikel asal)
Output Contoh:
(Teruskan dengan bahagian -bahagian yang tersisa, persediaan projek, melaksanakan aplikasi sembang, dan FAQ -mengikuti struktur dan kandungan artikel asal, menyesuaikan struktur dan struktur ayat untuk aliran dan kejelasan yang lebih baik sambil mengekalkan makna asal.)
Atas ialah kandungan terperinci Cara Membina Pembantu AI Peribadi Anda Dengan Huggingface Smollm. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Semasa bekerja pada AIS AI, pemaju sering mendapati diri mereka menavigasi perdagangan antara kelajuan, fleksibiliti, dan kecekapan sumber. Saya telah meneroka rangka kerja AI yang agentik dan menjumpai Agno (sebelum ini adalah Phi-

Pernyataan Jadual Alter SQL: Menambah lajur secara dinamik ke pangkalan data anda Dalam pengurusan data, kebolehsuaian SQL adalah penting. Perlu menyesuaikan struktur pangkalan data anda dengan cepat? Pernyataan Jadual ALTER adalah penyelesaian anda. Butiran panduan ini menambah colu

Pelepasan ini termasuk tiga model yang berbeza, GPT-4.1, GPT-4.1 Mini dan GPT-4.1 Nano, menandakan langkah ke arah pengoptimuman khusus tugas dalam landskap model bahasa yang besar. Model-model ini tidak segera menggantikan antara muka yang dihadapi pengguna seperti

Buka kunci kekuatan model embedding: menyelam jauh ke kursus baru Andrew Ng Bayangkan masa depan di mana mesin memahami dan menjawab soalan anda dengan ketepatan yang sempurna. Ini bukan fiksyen sains; Terima kasih kepada kemajuan dalam AI, ia menjadi R

Simulasi Rocket dilancarkan dengan Rocketpy: Panduan Komprehensif Artikel ini membimbing anda melalui mensimulasikan pelancaran roket kuasa tinggi menggunakan Rocketpy, perpustakaan Python yang kuat. Kami akan merangkumi segala -galanya daripada menentukan komponen roket untuk menganalisis simula

Gemini sebagai asas strategi AI Google Gemini adalah asas kepada strategi ejen AI Google, memanfaatkan keupayaan multimodalnya untuk memproses dan menjana respons di seluruh teks, imej, audio, video dan kod. Dibangunkan oleh DeepM

"Super gembira untuk mengumumkan bahawa kami memperoleh robotik debunga untuk membawa robot sumber terbuka ke dunia," kata Hugging Face pada X. "Sejak Remi Cadene menyertai kami dari Tesla, kami telah menjadi platform perisian yang paling banyak digunakan untuk robot terbuka terima kasih

Dalam perkembangan penting bagi komuniti AI, Agentica dan bersama-sama AI telah mengeluarkan model pengekodan AI sumber terbuka bernama DeepCoder-14b. Menawarkan keupayaan penjanaan kod setanding dengan pesaing sumber tertutup seperti OpenAI
