Jadual Kandungan
2. Masukkan Kunci API Terbuka
dua pertanyaan ujian digunakan:
skrip menetapkan saluran paip
DeepSeek R1
Rumah Peranti teknologi AI Bagaimana Membina Sistem Rag Menggunakan DeepSeek R1?

Bagaimana Membina Sistem Rag Menggunakan DeepSeek R1?

Mar 07, 2025 am 09:39 AM

Saya telah membaca banyak tentang ejen RAG dan AI, tetapi dengan pelepasan model baru seperti DeepSeek V3 dan Deepseek R1, nampaknya kemungkinan membina sistem RAG yang cekap telah bertambah baik, menawarkan ketepatan pengambilan yang lebih baik, keupayaan penalaran yang dipertingkatkan, dan arkitek yang lebih berskala untuk aplikasi dunia nyata. Penyepaduan mekanisme pengambilan yang lebih canggih, peningkatan pilihan penalaan halus, dan keupayaan multi-modal mengubah bagaimana agen AI berinteraksi dengan data. Ia menimbulkan persoalan sama ada pendekatan kain tradisional masih menjadi cara terbaik ke hadapan atau jika seni bina yang lebih baru dapat memberikan penyelesaian yang lebih efisien dan kontekstual. Sistem pengambilan semula (RAG)

sistem telah merevolusikan cara model AI berinteraksi dengan data dengan menggabungkan pendekatan berasaskan pengambilan semula dan generatif untuk menghasilkan tindak balas yang lebih tepat dan konteks. Dengan kedatangan

DeepSeek R1

, model sumber terbuka yang dikenali untuk kecekapan dan keberkesanan kosnya, membina sistem RAG yang berkesan telah menjadi lebih mudah dan praktikal. Dalam artikel ini, kami sedang membina sistem RAG menggunakan DeepSeek R1. Jadual Kandungan Apakah DeepSeek R1?

Apakah DeepSeek R1?

    DeepSeek R1
  • adalah model AI sumber terbuka yang dibangunkan dengan matlamat menyediakan keupayaan penalaran dan pengambilan yang berkualiti tinggi di sebahagian kecil daripada kos model proprietari seperti tawaran OpenAI. Ia mempunyai lesen MIT, menjadikannya secara komersil dan sesuai untuk pelbagai aplikasi. Juga, model yang kuat ini, membolehkan anda melihat katil tetapi Openai O1 dan O1-Mini tidak menunjukkan sebarang token. 
  • Untuk mengetahui bagaimana DeepSeek R1 mencabar model Openai O1: DeepSeek R1 vs Openai O1: Mana yang lebih cepat, lebih murah dan lebih bijak? 
  • faedah menggunakan DeepSeek R1 untuk sistem RAG
  • Membangun sistem Generasi Pengambilan Pengambilan (RAG) Menggunakan DeepSeek-R1 menawarkan beberapa kelebihan yang ketara:

1. Keupayaan Penalaran Lanjutan

: DeepSeek-R1 memancarkan penalaran seperti manusia dengan menganalisis dan memproses langkah-langkah langkah demi langkah sebelum mencapai kesimpulan. Pendekatan ini meningkatkan keupayaan sistem untuk mengendalikan pertanyaan yang kompleks, terutamanya di kawasan yang memerlukan kesimpulan logik, penalaran matematik, dan tugas pengekodan.

2. Kebolehcapaian sumber terbuka

: Dikeluarkan di bawah lesen MIT, DeepSeek-R1 adalah sumber terbuka sepenuhnya, yang membolehkan pemaju akses tidak terhad kepada modelnya. Keterbukaan ini memudahkan penyesuaian, penalaan halus, dan integrasi ke dalam pelbagai aplikasi tanpa kekangan yang sering dikaitkan dengan model proprietari.

3. Prestasi yang kompetitif : Ujian penanda aras menunjukkan bahawa DeepSeek-R1 melakukan setanding dengan, atau bahkan melampaui, model terkemuka seperti Openai's O1 dalam tugas yang melibatkan penalaran, matematik, dan pengekodan. Tahap prestasi ini memastikan bahawa sistem RAG yang dibina dengan DeepSeek-R1 dapat memberikan respons yang berkualiti tinggi dan tepat merentasi pertanyaan yang pelbagai dan mencabar.

4. Ketelusan dalam Proses Pemikiran : DeepSeek-R1 menggunakan metodologi "rantai-of-shought", menjadikan langkah-langkah penalarannya dapat dilihat semasa kesimpulan. Ketelusan ini membantu menyahpepijat dan memperbaiki sistem semasa membina kepercayaan pengguna dengan memberikan pandangan yang jelas ke dalam proses membuat keputusan.

5. Keberkesanan Kos : Sifat sumber terbuka DeepSeek-R1 menghapuskan yuran pelesenan, dan seni bina yang cekap mengurangkan keperluan sumber pengiraan. Faktor-faktor ini menyumbang kepada penyelesaian yang lebih kos efektif untuk organisasi yang ingin melaksanakan sistem RAG yang canggih tanpa menanggung perbelanjaan yang ketara.

Mengintegrasikan DeepSeek-R1 ke dalam sistem RAG memberikan gabungan kuat kebolehan penalaran, ketelusan, prestasi, dan kecekapan kos, menjadikannya pilihan yang menarik untuk pemaju dan organisasi yang bertujuan untuk meningkatkan keupayaan AI mereka.

Langkah -langkah untuk membina sistem RAG menggunakan DeepSeek R1

skrip adalah saluran paip generasi pengambilan semula (RAG) yang:

  • memuatkan dan memproses dokumen PDF dengan memisahkannya ke halaman dan mengeluarkan teks.
  • menyimpan perwakilan vektor teks dalam pangkalan data (ChromAdb).
  • mengambil semula kandungan yang relevan menggunakan carian persamaan apabila pertanyaan diminta.
  • menggunakan LLM (model DeepSeek) untuk menghasilkan respons berdasarkan teks yang diambil.
Pasang prasyarat

  • Muat turun Ollama: Klik di sini untuk memuat turun
  • untuk pengguna Linux: jalankan arahan berikut di terminal anda:
curl -fsSL https://ollama.com/install.sh | sh
Salin selepas log masuk
Salin selepas log masuk
selepas ini menarik DeepSeek R1: 1.5b menggunakan:

ollama pull deepseek-r1:1.5b
Salin selepas log masuk
Salin selepas log masuk
ini akan mengambil sedikit masa untuk memuat turun:

ollama pull deepseek-r1:1.5b

pulling manifest
pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB                         
pulling 369ca498f347... 100% ▕████████████████▏  387 B                         
pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB                         
pulling f4d24e9138dd... 100% ▕████████████████▏  148 B                         
pulling a85fe2a2e58e... 100% ▕████████████████▏  487 B                         
verifying sha256 digest 
writing manifest 
success 
Salin selepas log masuk
Salin selepas log masuk
Setelah melakukan ini, buka buku nota Jupyter anda dan mulakan dengan bahagian pengekodan:

1. Pasang ketergantungan

Sebelum berlari, skrip memasang perpustakaan Python yang diperlukan:

  • Langchain → Rangka Kerja untuk Bangunan Aplikasi Menggunakan Model Bahasa Besar (LLMS).
  • Langchain-Openai → Menyediakan Integrasi dengan Perkhidmatan Terbuka.
  • langchain-community → menambah sokongan untuk pelbagai pemuat dan utiliti dokumen.
  • Langchain-Chroma → Membolehkan integrasi dengan ChromAdb, pangkalan data vektor.

2. Masukkan Kunci API Terbuka

Untuk mengakses model penyembuhan OpenAI, skrip menggesa pengguna untuk memasuki kunci API mereka menggunakan Getpass (). Ini menghalang mendedahkan kelayakan dalam teks biasa.

3. Sediakan pembolehubah persekitaran

skrip

menyimpan kekunci API sebagai pemboleh ubah persekitaran. Ini membolehkan bahagian lain kod untuk mengakses Perkhidmatan Terbuka tanpa kelayakan Hardcoding , yang meningkatkan keselamatan.

4. Inisialisasi Embeddings Openai

Skrip memulakan model embedding terbuka yang dipanggil "teks-embedding-3-kecil". Model ini

menukarkan teks ke dalam embeddings vektor , yang merupakan perwakilan berangka dimensi tinggi dari makna teks. Lembutan ini kemudiannya digunakan untuk membandingkan dan mengambil kandungan serupa .

5. Muatkan dan pecahkan dokumen PDF

fail pdf (agenticai.pdf) adalah

dimuatkan dan dibahagikan kepada halaman . Setiap teks halaman diekstrak, yang membolehkan lebih kecil dan lebih mudah diuruskan ketulan teks daripada memproses keseluruhan dokumen sebagai satu unit.

6. Buat dan simpan pangkalan data vektor

    teks yang diekstrak dari pdf adalah
  • ditukar menjadi embeddings vektor .
  • Embeddings ini
  • disimpan dalam ChromAdb , pangkalan data vektor berprestasi tinggi .
  • Pangkalan data menggunakan
  • kesamaan kosinus , memastikan pengambilan teks yang cekap dengan tahap persamaan semantik yang tinggi.
7. Ambil teks yang sama menggunakan ambang persamaan

A dibuat menggunakan Chromadb, yang:

    Cari 3 Top 3 yang paling serupa
  • dokumen berdasarkan pertanyaan yang diberikan. hasil penapis berdasarkan ambang persamaan 0.3, yang bermaksud dokumen mestilah mempunyai kesamaan sekurang -kurangnya 30% untuk memenuhi syarat sebagai relevan.
  • 8. Pertanyaan untuk dokumen serupa

dua pertanyaan ujian digunakan:

"Apakah ibukota lama India?"
    • Tiada hasil yang dijumpai
    • , yang menunjukkan bahawa dokumen yang disimpan tidak mengandungi maklumat yang relevan.
    "Apa itu Agentic Ai?"
    • berjaya mendapatkan semula teks yang relevan
    • , menunjukkan bahawa sistem boleh mengambil konteks yang bermakna.
  1. 9. Bina Rag (Retrieval-Augmented Generation) rantai

skrip menetapkan saluran paip

, yang memastikan bahawa:

  • Pengambilan teks berlaku sebelum menghasilkan jawapan.
  • Respons Model adalah berdasarkan ketat pada kandungan yang diambil , mencegah halusinasi.
  • A digunakan untuk mengarahkan model untuk menghasilkan respons berstruktur.
10. Muatkan sambungan ke LLM (Model DeepSeek)

Daripada Openai's GPT, skrip

memuatkan DeepSeek-R1 (parameter 1.5B) , LLM yang kuat dioptimumkan untuk tugas-tugas berasaskan pengambilan semula.

11. Buat rantai berasaskan RAG

modul Langchain's

Retrieval digunakan untuk:

  • mengambil kandungan yang relevan dari pangkalan data vektor.
  • Format tindak balas berstruktur menggunakan template prompt.
  • menghasilkan jawapan ringkas dengan model DeepSeek.
12. Uji rantai kain

skrip menjalankan pertanyaan ujian:

"Beritahu perspektif pemimpin mengenai agentik ai"

llm menghasilkan tindak balas berasaskan fakta dengan ketat menggunakan konteks yang diambil.

Sistem

mengambil maklumat yang relevan dari pangkalan data .

kod untuk membina sistem rag menggunakan deepseek r1

inilah kod:

Pasang kebergantungan terbuka dan langchain

curl -fsSL https://ollama.com/install.sh | sh
Salin selepas log masuk
Salin selepas log masuk
masukkan kunci AI API terbuka

ollama pull deepseek-r1:1.5b
Salin selepas log masuk
Salin selepas log masuk
Pembolehubah Persekitaran Persediaan

ollama pull deepseek-r1:1.5b

pulling manifest
pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB                         
pulling 369ca498f347... 100% ▕████████████████▏  387 B                         
pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB                         
pulling f4d24e9138dd... 100% ▕████████████████▏  148 B                         
pulling a85fe2a2e58e... 100% ▕████████████████▏  487 B                         
verifying sha256 digest 
writing manifest 
success 
Salin selepas log masuk
Salin selepas log masuk
Buka model embedding AI

!pip install langchain==0.3.11
!pip install langchain-openai==0.2.12
!pip install langchain-community==0.3.11
!pip install langchain-chroma==0.1.4
Salin selepas log masuk
Buat vektor db dan berterusan pada cakera

from getpass import getpass
OPENAI_KEY = getpass('Enter Open AI API Key: ')
Salin selepas log masuk
persamaan dengan pengambilan ambang

import os
os.environ['OPENAI_API_KEY'] = OPENAI_KEY
Salin selepas log masuk
from langchain_openai import OpenAIEmbeddings
openai_embed_model = OpenAIEmbeddings(model='text-embedding-3-small')
Salin selepas log masuk
from langchain_community.document_loaders import PyPDFLoader
loader = PyPDFLoader('AgenticAI.pdf')
pages = loader.load_and_split()
texts = [doc.page_content for doc in pages]

from langchain_chroma import Chroma
chroma_db = Chroma.from_texts(
texts=texts,
collection_name='db_docs',
collection_metadata={"hnsw:space": "cosine"}, # Set distance function to cosine
embedding=openai_embed_model
)
Salin selepas log masuk

Bagaimana Membina Sistem Rag Menggunakan DeepSeek R1? Bina rantai kain

Muatkan sambungan ke LLM
similarity_threshold_retriever = chroma_db.as_retriever(search_type="similarity_score_threshold",search_kwargs={"k": 3,"score_threshold": 0.3})

query = "what is the old capital of India?"
top3_docs = similarity_threshold_retriever.invoke(query)
top3_docs
Salin selepas log masuk

sintaks langchain untuk rantai kain
[]
Salin selepas log masuk

query = "What is Agentic AI?"
top3_docs = similarity_threshold_retriever.invoke(query)
top3_docs
Salin selepas log masuk

checkout artikel terperinci kami mengenai kerja dan perbandingan DeepSeek dengan model yang serupa: Bagaimana Membina Sistem Rag Menggunakan DeepSeek R1?

DeepSeek R1- Openai's O1 terbesar pesaing di sini!

    Membina aplikasi AI dengan DeepSeek-V3
  • DeepSeek-V3 vs Gpt-4o vs Llama 3.3 70b
  • DeepSeek V3 vs GPT-4O: Mana yang lebih baik?
  • DeepSeek R1 vs Openai O1: Mana yang lebih baik?
  • bagaimana untuk mengakses Deepseek Janus Pro 7b?
  • Kesimpulan
Membina sistem RAG menggunakan

DeepSeek R1

menyediakan cara yang kos efektif dan berkuasa untuk meningkatkan pengambilan dokumen dan penjanaan tindak balas. Dengan sifat sumber terbuka dan keupayaan penalaran yang kuat, ia adalah alternatif yang hebat untuk penyelesaian proprietari. Perniagaan dan pemaju boleh memanfaatkan fleksibiliti untuk membuat aplikasi yang didorong oleh AI yang disesuaikan dengan keperluan mereka.

Ingin membina aplikasi menggunakan DeepSeek? Semak kursus DeepSeek percuma kami hari ini!

Atas ialah kandungan terperinci Bagaimana Membina Sistem Rag Menggunakan DeepSeek R1?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Sistem Fusion, dijelaskan
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1664
14
Tutorial PHP
1269
29
Tutorial C#
1248
24
Bermula dengan Meta Llama 3.2 - Analytics Vidhya Bermula dengan Meta Llama 3.2 - Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta's Llama 3.2: Lompat ke hadapan dalam Multimodal dan Mobile AI META baru -baru ini melancarkan Llama 3.2, kemajuan yang ketara dalam AI yang memaparkan keupayaan penglihatan yang kuat dan model teks ringan yang dioptimumkan untuk peranti mudah alih. Membina kejayaan o

10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari 10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari Apr 13, 2025 am 01:14 AM

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let &#8217

AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagi AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagi Apr 11, 2025 pm 12:01 PM

Landskap AI minggu ini: Badai kemajuan, pertimbangan etika, dan perdebatan pengawalseliaan. Pemain utama seperti Openai, Google, Meta, dan Microsoft telah melepaskan kemas kini, dari model baru yang terobosan ke peralihan penting di LE

GPT-4O vs OpenAI O1: Adakah model Openai baru bernilai gembar-gembur? GPT-4O vs OpenAI O1: Adakah model Openai baru bernilai gembar-gembur? Apr 13, 2025 am 10:18 AM

Pengenalan OpenAI telah mengeluarkan model barunya berdasarkan seni bina "strawberi" yang sangat dijangka. Model inovatif ini, yang dikenali sebagai O1, meningkatkan keupayaan penalaran, yang membolehkannya berfikir melalui masalah MOR

Panduan Komprehensif untuk Model Bahasa Visi (VLMS) Panduan Komprehensif untuk Model Bahasa Visi (VLMS) Apr 12, 2025 am 11:58 AM

Pengenalan Bayangkan berjalan melalui galeri seni, dikelilingi oleh lukisan dan patung yang terang. Sekarang, bagaimana jika anda boleh bertanya setiap soalan dan mendapatkan jawapan yang bermakna? Anda mungkin bertanya, "Kisah apa yang anda ceritakan?

3 Kaedah untuk menjalankan Llama 3.2 - Analytics Vidhya 3 Kaedah untuk menjalankan Llama 3.2 - Analytics Vidhya Apr 11, 2025 am 11:56 AM

Meta's Llama 3.2: Powerhouse AI Multimodal Model multimodal terbaru Meta, Llama 3.2, mewakili kemajuan yang ketara dalam AI, yang membanggakan pemahaman bahasa yang dipertingkatkan, ketepatan yang lebih baik, dan keupayaan penjanaan teks yang unggul. Keupayaannya t

Bagaimana untuk menambah lajur dalam SQL? - Analytics Vidhya Bagaimana untuk menambah lajur dalam SQL? - Analytics Vidhya Apr 17, 2025 am 11:43 AM

Pernyataan Jadual Alter SQL: Menambah lajur secara dinamik ke pangkalan data anda Dalam pengurusan data, kebolehsuaian SQL adalah penting. Perlu menyesuaikan struktur pangkalan data anda dengan cepat? Pernyataan Jadual ALTER adalah penyelesaian anda. Butiran panduan ini menambah colu

Pixtral -12b: Model Multimodal Pertama Mistral Ai ' Pixtral -12b: Model Multimodal Pertama Mistral Ai ' Apr 13, 2025 am 11:20 AM

Pengenalan Mistral telah mengeluarkan model multimodal yang pertama, iaitu Pixtral-12B-2409. Model ini dibina atas parameter 12 bilion Mistral, NEMO 12B. Apa yang membezakan model ini? Ia kini boleh mengambil kedua -dua gambar dan Tex

See all articles