目錄
知道DeepSeek R1有多挑戰OpenAi O1型號:DeepSeek R1 vs Openai O1:哪一個更快,更便宜,更聰明? 
>
>在您的終端中運行以下命令:
。這樣可以防止在純文本中暴露憑據。
存儲為環境變量。這允許代碼的其他部分訪問OpenAI Services
,而不是將整個文檔作為一個單元處理。
這些嵌入被存儲在Chromadb
11。創建一個基於抹布的鏈
>使用DeepSeek R1
打開AI嵌入模型
> DeepSeek R1- Openai的O1最大競爭對手在這裡!
首頁 科技週邊 人工智慧 如何使用DeepSeek R1構建抹布系統?

如何使用DeepSeek R1構建抹布系統?

Mar 07, 2025 am 09:39 AM

>我已經閱讀了很多有關RAG和AI代理商的信息,但是隨著DeepSeek V3和DeepSeek R1等新模型的發布,似乎建立有效的抹布系統的可能性已大大提高,提供了更好的檢索準確性,增強的推理能力,以及對現實世界應用程序的更可擴展的架構。更複雜的檢索機制,增強的微調選項和多模式功能的整合正在改變AI代理與數據相互作用的方式。它提出了有關傳統抹布方法是否仍然是前進的最佳方法,或者較新的體系結構是否可以提供更有效且上下文意識到的解決方案的問題。

>

檢索效果生成(RAG)系統通過結合基於檢索的基於檢索和生成的方法來產生更準確和上下文感知的響應,從而徹底改變了AI模型與數據相互作用的方式。隨著> DeepSeek R1的出現,這是一種以其效率和成本效益而聞名的開源模型,建立有效的抹布系統變得更加易於訪問和實用。在本文中,我們將使用DeepSeek R1構建一個抹布系統。

>目錄的表

    >什麼是deepSeek r1?
  • >使用DeepSeek R1用於RAG System
  • >使用DeepSeek R1

什麼是deepseek r1?

deepSeek r1是一種開源的AI模型,其目的是提供高質量的推理和檢索功能,以諸如Openai產品(例如OpenAI的產品)成本的一小部分。它具有MIT許可證,使其在商業上可行,適合廣泛的應用程序。另外,這個強大的模型可讓您看到嬰兒床,但是OpenAI O1和O1-Mini不會顯示任何理由令牌。 

知道DeepSeek R1有多挑戰OpenAi O1型號:DeepSeek R1 vs Openai O1:哪一個更快,更便宜,更聰明? 

>將DeepSeek R1用於抹布系統的好處 >使用DeepSeek-R1構建檢索功能的一代(RAG)系統提供了幾個顯著優勢:

1。先進的推理能力:DeepSeek-R1通過在得出結論之前逐步分析和處理信息來模擬類似人類的推理。這種方法增強了系統處理複雜查詢的能力,尤其是在需要邏輯推理,數學推理和編碼任務的領域。

2。開源可訪問性:根據MIT許可證發布,DeepSeek-R1是完全開源的,使開發人員無限制地訪問其模型。這種開放性促進了自定義,微調和集成到各種應用程序中,而沒有通常與專有模型相關的限制。

3。競爭性能:基準測試表明,DeepSeek-R1在涉及推理,數學和編碼的任務中,諸如OpenAI的O1之類的領先模型(例如OpenAI的O1)上的領先模型。這種級別的性能確保了用DeepSeek-R1構建的抹布系統可以在各種和具有挑戰性的查詢中提供高質量,準確的響應。

4。思維過程中的透明度>採用了“經過思考”方法,使其推理步驟在推理過程中可見。這種透明度有助於調試和完善系統,同時通過提供對決策過程的清晰見解來建立用戶信任。 5。成本效益

:DeepSeek-R1的開源性質消除了許可費,其有效的體系結構降低了計算資源要求。這些因素為希望實施複雜的抹布系統而不會產生巨大費用的組織有助於更具成本效益的解決方案。

將DeepSeek-R1整合到抹布系統中,提供了高級推理能力,透明度,性能和成本效率的有效組合,使其成為旨在增強其AI功能的開發人員和組織的令人信服的選擇。 >使用DeepSeek R1 構建抹布系統的步驟

腳本是一個檢索型的一代(抹布)管道:

>

>通過將其分成頁面並提取文本來加載和處理PDF文檔

    在數據庫(Chromadb)中存儲文本的矢量化表示
  • 。 當詢問查詢時,使用相似性搜索檢索相關內容
  • >使用LLM(DeepSeek Model)
  • 基於檢索到的文本生成響應。 >安裝先決條件
  • >>下載ollama:
  • >單擊此處下載> 對於Linux用戶:
>

>在您的終端中運行以下命令:

  • 之後,使用:> 這將需要一點時間才能下載:>
  • 執行此操作後,打開jupyter筆記本,然後從編碼部分開始:> 1。安裝依賴項
  • 在運行之前,腳本安裝所需的Python庫:>
      langchain→使用大語言模型(LLM)構建應用程序的框架。
    • > langchain-openai→提供與OpenAI服務的集成。
    • >蘭鏈 - 社區→增加了對各種文檔加載程序和實用程序的支持。
    • >
    • langchain-chroma→啟用與矢量數據庫Chromadb的集成。
    • 2。輸入OpenAI API鍵
    >要訪問OpenAI的嵌入模型,該腳本會提示用戶使用getPass()安全地輸入其API鍵

    。這樣可以防止在純文本中暴露憑據。

    3。設置環境變量 腳本

    將API鍵

    存儲為環境變量。這允許代碼的其他部分訪問OpenAI Services

    ,而無需硬編碼憑據

    ,可以提高安全性。 4。初始化OpenAI嵌入 腳本初始化了一個名為“ text-embedding-3-small”的OpenAI嵌入模型。該模型將文本轉換為向量嵌入

    ,這是文本含義的高維數字表示。這些嵌入後來用於比較和檢索類似的內容

    5。加載並拆分PDF文檔 > pdf文件(Agenicai.pdf)已加載並分成頁面>。提取每個頁面文本,允許

    較小,更易於管理的文本塊

    ,而不是將整個文檔作為一個單元處理。

    >

    6。創建並存儲矢量數據庫 從PDF中提取的文本轉換為vector嵌入

    這些嵌入被存儲在Chromadb

    中,一個高性能
      vector數據庫
    • 數據庫使用餘弦相似性
    • ,以確保具有高度語義相似性的文本有效檢索。
    • 7。使用相似性閾值檢索相似的文本 使用Chromadb創建a retiever
    • >根據給定查詢搜索最相似的
    • 文檔。
    基於0.3的相似性閾值過濾結果,這意味著文檔必須至少具有30%的相似性才能符合相關性。

    >

    8。查詢類似文檔 使用了兩個測試查詢:

    • “印度的舊首都是什麼?” >
    • >未找到結果
    • ,這表明存儲的文檔不包含相關信息。

    “什麼是代理AI?”

    成功檢索相關的文本
      ,證明系統可以獲取有意義的上下文。
      • 9。建造一個抹布(檢索儀)鏈
      • 腳本設置了
      rag Pipeline
    1. ,這確保了:
    2. >
        在生成答案之前,
      • >文本檢索發生。 >
      • 模型的響應是嚴格基於檢索到的內容的,防止幻覺的。
      • a提示模板用於指示模型生成結構化響應。
      • 10。加載連接到LLM(DeepSeek模型) 而不是OpenAI的GPT,腳本
      • 加載DeepSeek-r1(1.5b參數)
      >是一種針對基於檢索的任務的功能強大的LLM。

      11。創建一個基於抹布的鏈

      langchain's檢索模塊用於:

      >

      從矢量數據庫中

      獲取相關內容 使用提示模板

      >格式化結構化響應
        。 用DeepSeek模型生成簡潔的答案。
      • 12。測試抹布鏈
      • 腳本運行一個測試查詢:“告訴領導者對代理AI的看法”
      • llm嚴格使用檢索到的上下文生成基於事實的響應
      • 系統
      >從數據庫中檢索相關信息。

      >使用DeepSeek R1

      構建抹布系統的代碼

      這是代碼:

      >安裝OpenAI和Langchain依賴項

      輸入打開AI API鍵

      >設置環境變量

      打開AI嵌入模型

      創建一個向量db並持續在磁盤上

      curl -fsSL https://ollama.com/install.sh | sh
      登入後複製
      與閾值檢索相似性

      ollama pull deepseek-r1:1.5b
      登入後複製

      ollama pull deepseek-r1:1.5b
      
      pulling manifest
      pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB                         
      pulling 369ca498f347... 100% ▕████████████████▏  387 B                         
      pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB                         
      pulling f4d24e9138dd... 100% ▕████████████████▏  148 B                         
      pulling a85fe2a2e58e... 100% ▕████████████████▏  487 B                         
      verifying sha256 digest 
      writing manifest 
      success 
      登入後複製

      構建抹布鏈
      !pip install langchain==0.3.11
      !pip install langchain-openai==0.2.12
      !pip install langchain-community==0.3.11
      !pip install langchain-chroma==0.1.4
      登入後複製

      >加載連接到LLM
      from getpass import getpass
      OPENAI_KEY = getpass('Enter Open AI API Key: ')
      登入後複製

      langchain語法用於抹布鏈

      import os
      os.environ['OPENAI_API_KEY'] = OPENAI_KEY
      登入後複製
      from langchain_openai import OpenAIEmbeddings
      openai_embed_model = OpenAIEmbeddings(model='text-embedding-3-small')
      登入後複製
      from langchain_community.document_loaders import PyPDFLoader
      loader = PyPDFLoader('AgenticAI.pdf')
      pages = loader.load_and_split()
      texts = [doc.page_content for doc in pages]
      
      from langchain_chroma import Chroma
      chroma_db = Chroma.from_texts(
      texts=texts,
      collection_name='db_docs',
      collection_metadata={"hnsw:space": "cosine"}, # Set distance function to cosine
      embedding=openai_embed_model
      )
      登入後複製

      如何使用DeepSeek R1構建抹布系統?>查看我們有關DeepSeek工作和與類似模型進行比較的詳細文章:

      > DeepSeek R1- Openai的O1最大競爭對手在這裡!

      >
      similarity_threshold_retriever = chroma_db.as_retriever(search_type="similarity_score_threshold",search_kwargs={"k": 3,"score_threshold": 0.3})
      
      query = "what is the old capital of India?"
      top3_docs = similarity_threshold_retriever.invoke(query)
      top3_docs
      登入後複製
      >使用DeepSeek-V3

      構建AI應用程序

      > deepSeek-v3 vs gpt-4o vs llama 3.3 70b
      []
      登入後複製

      deepseek v3 vs gpt-4o:哪個更好?

      deepseek r1 vs openai o1:哪個更好?
      query = "What is Agentic AI?"
      top3_docs = similarity_threshold_retriever.invoke(query)
      top3_docs
      登入後複製
      >

      如何訪問DeepSeek Janus Pro 7b? 如何使用DeepSeek R1構建抹布系統?

      結論

        >使用
      • > DeepSeek R1
      • 構建抹布系統,提供了一種具有成本效益的強大方法來增強文檔檢索和響應生成。憑藉其開源性和強大的推理能力,它是專有解決方案的絕佳選擇。企業和開發人員可以利用其靈活性來創建根據其需求量身定制的AI驅動應用程序。

        >是否想使用DeepSeek構建應用程序?立即簽約我們免費的DeepSeek課程!

以上是如何使用DeepSeek R1構建抹布系統?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1321
25
PHP教程
1269
29
C# 教程
1249
24
10個生成AI編碼擴展,在VS代碼中,您必須探索 10個生成AI編碼擴展,在VS代碼中,您必須探索 Apr 13, 2025 am 01:14 AM

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

GPT-4O vs OpenAI O1:新的Openai模型值得炒作嗎? GPT-4O vs OpenAI O1:新的Openai模型值得炒作嗎? Apr 13, 2025 am 10:18 AM

介紹 Openai已根據備受期待的“草莓”建築發布了其新模型。這種稱為O1的創新模型增強了推理能力,使其可以通過問題進行思考

視覺語言模型(VLMS)的綜合指南 視覺語言模型(VLMS)的綜合指南 Apr 12, 2025 am 11:58 AM

介紹 想像一下,穿過​​美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

pixtral -12b:Mistral AI&#039;第一個多模型模型 - 分析Vidhya pixtral -12b:Mistral AI&#039;第一個多模型模型 - 分析Vidhya Apr 13, 2025 am 11:20 AM

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

超越駱駝戲:大型語言模型的4個新基準 超越駱駝戲:大型語言模型的4個新基準 Apr 14, 2025 am 11:09 AM

陷入困境的基準:駱駝案例研究 2025年4月上旬,梅塔(Meta)揭開了其Llama 4套件的模特,擁有令人印象深刻的性能指標,使他們對GPT-4O和Claude 3.5 Sonnet等競爭對手的良好定位。倫斯的中心

如何使用AGNO框架構建多模式AI代理? 如何使用AGNO框架構建多模式AI代理? Apr 23, 2025 am 11:30 AM

在從事代理AI時,開發人員經常發現自己在速度,靈活性和資源效率之間進行權衡。我一直在探索代理AI框架,並遇到了Agno(以前是Phi-

多動症遊戲,健康工具和AI聊天機器人如何改變全球健康 多動症遊戲,健康工具和AI聊天機器人如何改變全球健康 Apr 14, 2025 am 11:27 AM

視頻遊戲可以緩解焦慮,建立焦點或支持多動症的孩子嗎? 隨著醫療保健在全球範圍內挑戰,尤其是在青年中的挑戰,創新者正在轉向一種不太可能的工具:視頻遊戲。現在是世界上最大的娛樂印度河之一

See all articles