如何使用DeepSeek R1構建抹布系統?
>我已經閱讀了很多有關RAG和AI代理商的信息,但是隨著DeepSeek V3和DeepSeek R1等新模型的發布,似乎建立有效的抹布系統的可能性已大大提高,提供了更好的檢索準確性,增強的推理能力,以及對現實世界應用程序的更可擴展的架構。更複雜的檢索機制,增強的微調選項和多模式功能的整合正在改變AI代理與數據相互作用的方式。它提出了有關傳統抹布方法是否仍然是前進的最佳方法,或者較新的體系結構是否可以提供更有效且上下文意識到的解決方案的問題。
>檢索效果生成(RAG)系統通過結合基於檢索的基於檢索和生成的方法來產生更準確和上下文感知的響應,從而徹底改變了AI模型與數據相互作用的方式。隨著> DeepSeek R1的出現,這是一種以其效率和成本效益而聞名的開源模型,建立有效的抹布系統變得更加易於訪問和實用。在本文中,我們將使用DeepSeek R1構建一個抹布系統。
>目錄的表- >什麼是deepSeek r1?
- >使用DeepSeek R1用於RAG System
- >使用DeepSeek R1
什麼是deepseek r1?
deepSeek r1是一種開源的AI模型,其目的是提供高質量的推理和檢索功能,以諸如Openai產品(例如OpenAI的產品)成本的一小部分。它具有MIT許可證,使其在商業上可行,適合廣泛的應用程序。另外,這個強大的模型可讓您看到嬰兒床,但是OpenAI O1和O1-Mini不會顯示任何理由令牌。
知道DeepSeek R1有多挑戰OpenAi O1型號:DeepSeek R1 vs Openai O1:哪一個更快,更便宜,更聰明?
>將DeepSeek R1用於抹布系統的好處 >使用DeepSeek-R1構建檢索功能的一代(RAG)系統提供了幾個顯著優勢:
1。先進的推理能力:DeepSeek-R1通過在得出結論之前逐步分析和處理信息來模擬類似人類的推理。這種方法增強了系統處理複雜查詢的能力,尤其是在需要邏輯推理,數學推理和編碼任務的領域。
2。開源可訪問性:根據MIT許可證發布,DeepSeek-R1是完全開源的,使開發人員無限制地訪問其模型。這種開放性促進了自定義,微調和集成到各種應用程序中,而沒有通常與專有模型相關的限制。3。競爭性能:基準測試表明,DeepSeek-R1在涉及推理,數學和編碼的任務中,諸如OpenAI的O1之類的領先模型(例如OpenAI的O1)上的領先模型。這種級別的性能確保了用DeepSeek-R1構建的抹布系統可以在各種和具有挑戰性的查詢中提供高質量,準確的響應。
4。思維過程中的透明度:
將DeepSeek-R1整合到抹布系統中,提供了高級推理能力,透明度,性能和成本效率的有效組合,使其成為旨在增強其AI功能的開發人員和組織的令人信服的選擇。 >使用DeepSeek R1 構建抹布系統的步驟
腳本是一個檢索型的一代(抹布)管道:
>
>通過將其分成頁面並提取文本來加載和處理PDF文檔。
- 在數據庫(Chromadb)中存儲文本的矢量化表示
- 。 當詢問查詢時,使用相似性搜索檢索相關內容 >使用LLM(DeepSeek Model)
- 基於檢索到的文本生成響應。 >安裝先決條件
- >>下載ollama:
- >單擊此處下載> 對於Linux用戶:
>在您的終端中運行以下命令:
-
之後,使用:
> 這將需要一點時間才能下載:> - 執行此操作後,打開jupyter筆記本,然後從編碼部分開始:
> 1。安裝依賴項 在運行之前,腳本安裝所需的Python庫: - > langchain-openai→提供與OpenAI服務的集成。
- > langchain-chroma→啟用與矢量數據庫Chromadb的集成。
- 2。輸入OpenAI API鍵
- 。 數據庫使用餘弦相似性 ,以確保具有高度語義相似性的文本有效檢索。
- 7。使用相似性閾值檢索相似的文本 使用Chromadb創建a retiever
- >根據給定查詢搜索最相似的 文檔。
- “印度的舊首都是什麼?” > >未找到結果
- ,這表明存儲的文檔不包含相關信息。
-
- 9。建造一個抹布(檢索儀)鏈 腳本設置了
,這確保了: - >
-
在生成答案之前,
- >文本檢索發生。 > 模型的響應是嚴格基於檢索到的內容
- a提示模板用於指示模型生成結構化響應。
- 10。加載連接到LLM(DeepSeek模型) 而不是OpenAI的GPT,腳本 加載DeepSeek-r1(1.5b參數)
的,防止幻覺的。 11。創建一個基於抹布的鏈
langchain's檢索模塊用於:
>從矢量數據庫中
獲取相關內容 使用提示模板
>格式化結構化響應- 。
用DeepSeek模型生成簡潔的答案。
- 12。測試抹布鏈
- 腳本運行一個測試查詢:“告訴領導者對代理AI的看法”
- llm嚴格使用檢索到的上下文生成基於事實的響應。 系統
>使用DeepSeek R1
構建抹布系統的代碼這是代碼:
>安裝OpenAI和Langchain依賴項
輸入打開AI API鍵
>設置環境變量
打開AI嵌入模型
與閾值檢索相似性curl -fsSL https://ollama.com/install.sh | sh
登入後複製ollama pull deepseek-r1:1.5b
登入後複製ollama pull deepseek-r1:1.5b pulling manifest pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB pulling 369ca498f347... 100% ▕████████████████▏ 387 B pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB pulling f4d24e9138dd... 100% ▕████████████████▏ 148 B pulling a85fe2a2e58e... 100% ▕████████████████▏ 487 B verifying sha256 digest writing manifest success
登入後複製!pip install langchain==0.3.11 !pip install langchain-openai==0.2.12 !pip install langchain-community==0.3.11 !pip install langchain-chroma==0.1.4
登入後複製from getpass import getpass OPENAI_KEY = getpass('Enter Open AI API Key: ')
登入後複製langchain語法用於抹布鏈 import os os.environ['OPENAI_API_KEY'] = OPENAI_KEY
登入後複製from langchain_openai import OpenAIEmbeddings openai_embed_model = OpenAIEmbeddings(model='text-embedding-3-small')
登入後複製from langchain_community.document_loaders import PyPDFLoader loader = PyPDFLoader('AgenticAI.pdf') pages = loader.load_and_split() texts = [doc.page_content for doc in pages] from langchain_chroma import Chroma chroma_db = Chroma.from_texts( texts=texts, collection_name='db_docs', collection_metadata={"hnsw:space": "cosine"}, # Set distance function to cosine embedding=openai_embed_model )
登入後複製>查看我們有關DeepSeek工作和與類似模型進行比較的詳細文章:
> DeepSeek R1- Openai的O1最大競爭對手在這裡!
>>使用DeepSeek-V3similarity_threshold_retriever = chroma_db.as_retriever(search_type="similarity_score_threshold",search_kwargs={"k": 3,"score_threshold": 0.3}) query = "what is the old capital of India?" top3_docs = similarity_threshold_retriever.invoke(query) top3_docs
登入後複製構建AI應用程序
> deepSeek-v3 vs gpt-4o vs llama 3.3 70b[]
登入後複製deepseek v3 vs gpt-4o:哪個更好?
deepseek r1 vs openai o1:哪個更好?>query = "What is Agentic AI?" top3_docs = similarity_threshold_retriever.invoke(query) top3_docs
登入後複製如何訪問DeepSeek Janus Pro 7b?
結論
- >使用
- > DeepSeek R1 構建抹布系統,提供了一種具有成本效益的強大方法來增強文檔檢索和響應生成。憑藉其開源性和強大的推理能力,它是專有解決方案的絕佳選擇。企業和開發人員可以利用其靈活性來創建根據其需求量身定制的AI驅動應用程序。
>是否想使用DeepSeek構建應用程序?立即簽約我們免費的DeepSeek課程!
。這樣可以防止在純文本中暴露憑據。
3。設置環境變量 腳本
將API鍵存儲為環境變量。這允許代碼的其他部分訪問OpenAI Services
,而無需硬編碼憑據,可以提高安全性。 4。初始化OpenAI嵌入 腳本初始化了一個名為“ text-embedding-3-small”的OpenAI嵌入模型。該模型將文本轉換為向量嵌入
,這是文本含義的高維數字表示。這些嵌入後來用於比較和檢索類似的內容。
。5。加載並拆分PDF文檔 > pdf文件(Agenicai.pdf)已加載並分成頁面>。提取每個頁面文本,允許
較小,更易於管理的文本塊,而不是將整個文檔作為一個單元處理。
>6。創建並存儲矢量數據庫 從PDF中提取的文本轉換為vector嵌入
。這些嵌入被存儲在Chromadb
中,一個高性能- vector數據庫
>
8。查詢類似文檔 使用了兩個測試查詢:
“什麼是代理AI?”
成功檢索相關的文本- ,證明系統可以獲取有意義的上下文。
以上是如何使用DeepSeek R1構建抹布系統?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

介紹 Openai已根據備受期待的“草莓”建築發布了其新模型。這種稱為O1的創新模型增強了推理能力,使其可以通過問題進行思考

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

陷入困境的基準:駱駝案例研究 2025年4月上旬,梅塔(Meta)揭開了其Llama 4套件的模特,擁有令人印象深刻的性能指標,使他們對GPT-4O和Claude 3.5 Sonnet等競爭對手的良好定位。倫斯的中心

在從事代理AI時,開發人員經常發現自己在速度,靈活性和資源效率之間進行權衡。我一直在探索代理AI框架,並遇到了Agno(以前是Phi-

視頻遊戲可以緩解焦慮,建立焦點或支持多動症的孩子嗎? 隨著醫療保健在全球範圍內挑戰,尤其是在青年中的挑戰,創新者正在轉向一種不太可能的工具:視頻遊戲。現在是世界上最大的娛樂印度河之一
