如何使用DeepSeek R1构建抹布系统?
>我已经阅读了很多有关RAG和AI代理商的信息,但是随着DeepSeek V3和DeepSeek R1等新模型的发布,似乎建立有效的抹布系统的可能性已大大提高,提供了更好的检索准确性,增强的推理能力,以及对现实世界应用程序的更可扩展的架构。更复杂的检索机制,增强的微调选项和多模式功能的整合正在改变AI代理与数据相互作用的方式。它提出了有关传统抹布方法是否仍然是前进的最佳方法,或者较新的体系结构是否可以提供更有效且上下文意识到的解决方案的问题。
>检索效果生成(RAG)系统通过结合基于检索的基于检索和生成的方法来产生更准确和上下文感知的响应,从而彻底改变了AI模型与数据相互作用的方式。随着> DeepSeek R1的出现,这是一种以其效率和成本效益而闻名的开源模型,建立有效的抹布系统变得更加易于访问和实用。在本文中,我们将使用DeepSeek R1构建一个抹布系统。
>目录的表- >什么是deepSeek r1?
- >使用DeepSeek R1用于RAG System
- >使用DeepSeek R1
什么是deepseek r1?
deepSeek r1是一种开源的AI模型,其目的是提供高质量的推理和检索功能,以诸如Openai产品(例如OpenAI的产品)成本的一小部分。它具有MIT许可证,使其在商业上可行,适合广泛的应用程序。另外,这个强大的模型可让您看到婴儿床,但是OpenAI O1和O1-Mini不会显示任何理由令牌。
知道DeepSeek R1有多挑战OpenAi O1型号:DeepSeek R1 vs Openai O1:哪一个更快,更便宜,更聪明?
>将DeepSeek R1用于抹布系统的好处 >使用DeepSeek-R1构建检索功能的一代(RAG)系统提供了几个显着优势:
1。先进的推理能力:DeepSeek-R1通过在得出结论之前逐步分析和处理信息来模拟类似人类的推理。这种方法增强了系统处理复杂查询的能力,尤其是在需要逻辑推理,数学推理和编码任务的领域。
2。开源可访问性:根据MIT许可证发布,DeepSeek-R1是完全开源的,使开发人员无限制地访问其模型。这种开放性促进了自定义,微调和集成到各种应用程序中,而没有通常与专有模型相关的限制。3。竞争性能:基准测试表明,DeepSeek-R1在涉及推理,数学和编码的任务中,诸如OpenAI的O1之类的领先模型(例如OpenAI的O1)上的领先模型。这种级别的性能确保了用DeepSeek-R1构建的抹布系统可以在各种和具有挑战性的查询中提供高质量,准确的响应。
4。思维过程中的透明度:
将DeepSeek-R1整合到抹布系统中,提供了高级推理能力,透明度,性能和成本效率的有效组合,使其成为旨在增强其AI功能的开发人员和组织的令人信服的选择。 >使用DeepSeek R1 构建抹布系统的步骤
脚本是一个检索型的一代(抹布)管道:
>
>通过将其分成页面并提取文本来加载和处理PDF文档。
- 在数据库(Chromadb)中存储文本的矢量化表示
- 。 当询问查询时,使用相似性搜索检索相关内容 >使用LLM(DeepSeek Model)
- 基于检索到的文本生成响应。 >安装先决条件
- >>下载ollama:
- >单击此处下载> 对于Linux用户:
>在您的终端中运行以下命令:
-
之后,使用:
> 这将需要一点时间才能下载:> - 执行此操作后,打开jupyter笔记本,然后从编码部分开始:
> 1。安装依赖项 在运行之前,脚本安装所需的Python库: - > langchain-openai→提供与OpenAI服务的集成。
- > langchain-chroma→启用与矢量数据库Chromadb的集成。
- 2。输入OpenAI API键
- 。 数据库使用余弦相似性 ,以确保具有高度语义相似性的文本有效检索。
- 7。使用相似性阈值检索相似的文本 使用Chromadb创建a retiever
- >根据给定查询搜索最相似的 文档。
- “印度的旧首都是什么?” > >未找到结果
- ,这表明存储的文档不包含相关信息。
-
- 9。建造一个抹布(检索仪)链 脚本设置了
,这确保了: - >
-
在生成答案之前,
- >文本检索发生。> 模型的响应是严格基于检索到的内容
- a提示模板用于指示模型生成结构化响应。
- 10。加载连接到LLM(DeepSeek模型) 而不是OpenAI的GPT,脚本 加载DeepSeek-r1(1.5b参数)
的,防止幻觉的。 11。创建一个基于抹布的链
langchain's检索模块用于:
>从矢量数据库中
获取相关内容 使用提示模板
>格式化结构化响应- 。
用DeepSeek模型生成简洁的答案。
- 12。测试抹布链
- 脚本运行一个测试查询:“告诉领导者对代理AI的看法”
- llm严格使用检索到的上下文生成基于事实的响应。 系统
>使用DeepSeek R1
构建抹布系统的代码这是代码:
>安装OpenAI和Langchain依赖项
输入打开AI API键
>设置环境变量
打开AI嵌入模型
与阈值检索相似性curl -fsSL https://ollama.com/install.sh | sh
登录后复制ollama pull deepseek-r1:1.5b
登录后复制ollama pull deepseek-r1:1.5b pulling manifest pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB pulling 369ca498f347... 100% ▕████████████████▏ 387 B pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB pulling f4d24e9138dd... 100% ▕████████████████▏ 148 B pulling a85fe2a2e58e... 100% ▕████████████████▏ 487 B verifying sha256 digest writing manifest success
登录后复制!pip install langchain==0.3.11 !pip install langchain-openai==0.2.12 !pip install langchain-community==0.3.11 !pip install langchain-chroma==0.1.4
登录后复制from getpass import getpass OPENAI_KEY = getpass('Enter Open AI API Key: ')
登录后复制langchain语法用于抹布链 import os os.environ['OPENAI_API_KEY'] = OPENAI_KEY
登录后复制from langchain_openai import OpenAIEmbeddings openai_embed_model = OpenAIEmbeddings(model='text-embedding-3-small')
登录后复制from langchain_community.document_loaders import PyPDFLoader loader = PyPDFLoader('AgenticAI.pdf') pages = loader.load_and_split() texts = [doc.page_content for doc in pages] from langchain_chroma import Chroma chroma_db = Chroma.from_texts( texts=texts, collection_name='db_docs', collection_metadata={"hnsw:space": "cosine"}, # Set distance function to cosine embedding=openai_embed_model )
登录后复制>查看我们有关DeepSeek工作和与类似模型进行比较的详细文章:
> DeepSeek R1- Openai的O1最大竞争对手在这里!
>>使用DeepSeek-V3similarity_threshold_retriever = chroma_db.as_retriever(search_type="similarity_score_threshold",search_kwargs={"k": 3,"score_threshold": 0.3}) query = "what is the old capital of India?" top3_docs = similarity_threshold_retriever.invoke(query) top3_docs
登录后复制构建AI应用程序
> deepSeek-v3 vs gpt-4o vs llama 3.3 70b[]
登录后复制deepseek v3 vs gpt-4o:哪个更好?
deepseek r1 vs openai o1:哪个更好?>query = "What is Agentic AI?" top3_docs = similarity_threshold_retriever.invoke(query) top3_docs
登录后复制如何访问DeepSeek Janus Pro 7b?
结论
- >使用
- > DeepSeek R1 构建抹布系统,提供了一种具有成本效益的强大方法来增强文档检索和响应生成。凭借其开源性和强大的推理能力,它是专有解决方案的绝佳选择。企业和开发人员可以利用其灵活性来创建根据其需求量身定制的AI驱动应用程序。
>是否想使用DeepSeek构建应用程序?立即签约我们免费的DeepSeek课程!
。这样可以防止在纯文本中暴露凭据。
3。设置环境变量 脚本
将API键存储为环境变量。这允许代码的其他部分访问OpenAI Services
,而无需硬编码凭据,可以提高安全性。 4。初始化OpenAI嵌入 脚本初始化了一个名为“ text-embedding-3-small”的OpenAI嵌入模型。该模型将文本转换为向量嵌入
,这是文本含义的高维数字表示。这些嵌入后来用于比较和检索类似的内容。
。5。加载并拆分PDF文档 > pdf文件(Agenicai.pdf)已加载并分成页面>。提取每个页面文本,允许
较小,更易于管理的文本块,而不是将整个文档作为一个单元处理。
>6。创建并存储矢量数据库 从PDF中提取的文本转换为vector嵌入
。这些嵌入被存储在Chromadb
中,一个高性能- vector数据库
>
8。查询类似文档 使用了两个测试查询:
“什么是代理AI?”
成功检索相关的文本- ,证明系统可以获取有意义的上下文。
以上是如何使用DeepSeek R1构建抹布系统?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

Meta's Llama 3.2:多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步,具有增强的语言理解力,提高的准确性和出色的文本生成能力。 它的能力t

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex
