矫正抹布(crag)行动
通过合并信息检索,检索增强的生成(RAG)赋予大型语言模型(LLMS)。这使LLM可以访问外部知识库,从而产生更准确,最新和上下文适当的响应。高级抹布技术矫正抹布(crag),通过引入自我反射和自我评估机制来进一步提高准确性。
关键学习目标
本文涵盖:
- CRAG的核心机制及其与Web搜索的集成。
- CRAG的文档相关性评估使用二进制评分和查询重写。
- 岩壁和传统抹布之间的关键区别。
- 使用Python,Langchain和Tavily实施动手CRAG实施。
- 配置评估人员,查询重写器和Web搜索工具的实用技能,以优化检索和响应准确性。
作为数据科学博客马拉松的一部分出版。
目录
- 克拉格的基本机制
- 岩壁与传统抹布
- 实用的crag实施
- 克拉格的挑战
- 结论
- 常见问题
克拉格的基本机制
CRAG通过将Web搜索集成到其检索和生成过程中来增强LLM输出的可靠性(见图1)。
文件检索:
- 数据摄入:索引相关数据,并配置了Web搜索工具(例如Tavily AI)以实时数据检索。
- 初始检索:基于用户查询的静态知识库检索文档。
相关性评估:
评估者评估检索的文件相关性。如果超过70%的文件被视为无关紧要,则启动纠正措施;否则,响应产生将进行。
Web搜索集成:
如果文档相关性不足,则CRAG使用Web搜索:
- 查询细化:对原始查询进行了修改以优化Web搜索结果。
- Web搜索执行:诸如Tavily AI之类的工具获取其他数据,以确保访问当前和不同的信息。
响应生成:
CRAG从初始检索和Web搜索中综合数据,以创建一个连贯,准确的响应。
岩壁与传统抹布
与传统抹布不同,Crag会积极验证和完善检索到的信息,这与传统的抹布不同,这依赖于未经验证的文档检索。 CRAG经常合并实时的Web搜索,从而提供对最新信息的访问,这与传统抹布对静态知识库的依赖不同。这使得crag非常适合需要高精度和实时数据集成的应用程序。
实用的crag实施
本节详细介绍了使用Python,Langchain和Tavily的CRAG实施。
步骤1:库安装
安装必要的库:
! !
步骤2:API密钥配置
设置您的API键:
导入操作系统 os.environ [“ tavily_api_key”] =“” os.environ [“ openai_api_key”] =“”
步骤3:库导入
导入所需的库(省略了简短的代码,但类似于原始示例)。
步骤4:记录分块和猎犬的创建
(对于简短而省略了代码,但类似于原始示例,使用pypdfloader,递归cearsivecharactertextsplitter,openaiembeddings和Chroma)。
步骤5:抹布链设置
(对于简短而省略了代码,但类似于原始示例,使用hub.pull("rlm/rag-prompt")
和ChatOpenAI
)。
步骤6:评估器设置
(为简洁而省略了代码,但类似于原始示例,定义Evaluator
类并使用ChatOpenAI
进行评估)。
步骤7:查询重写器设置
(为简洁而省略了代码,但类似于原始示例,使用ChatOpenAI
进行查询重写)。
步骤8:Web搜索设置
来自langchain_community.tools.tavily_search导入tavilySearchResults web_search_tool = tavilySearchResults(k = 3)
步骤9-12:Langgraph Workflow设置和执行
(为简短而省略了代码,但在概念上与原始示例相似,定义GraphState
,函数节点( retrieve
, generate
, evaluate_documents
, transform_query
, web_search
),并使用StateGraph
进行连接。)最终输出和与传统抹布的比较也非常相似。
克拉格的挑战
CRAG的有效性在很大程度上取决于评估者的准确性。弱评估者可能会引入错误。可伸缩性和适应性也是关注点,需要持续更新和培训。 Web搜索集成引入了偏见或不可靠的信息的风险,需要强大的过滤机制。
结论
CRAG显着提高了LLM输出精度和可靠性。其评估和补充使用实时Web数据检索信息的能力使其对于要求高精度和最新信息的应用程序很有价值。但是,持续改进对于解决与评估者准确性和Web数据可靠性相关的挑战至关重要。
关键要点(类似于原始的,但为简洁而改写)
- CRAG使用Web搜索当前相关信息来增强LLM响应。
- 它的评估者确保了响应生成的高质量信息。
- 查询转换优化了Web搜索结果。
- 与传统的抹布不同,CRAG会动态整合实时网络数据。
- crag积极验证信息,减少错误。
- CRAG对需要高精度和实时数据的应用是有益的。
经常询问的问题(类似于原始问题,但为简洁而改写)
- Q1:什么是crag?答:高级抹布框架集成了Web搜索,以提高准确性和可靠性。
- Q2:岩壁与传统抹布?答:crag积极验证并完善检索到的信息。
- Q3:评估者的角色?答:评估文档相关性并触发更正。
- 问题4:文件不足?答:用网络搜索补充crag。
- Q5:处理不可靠的Web内容?答:需要高级过滤方法。
(注意:图像保持不变,并且如原始输入所示。)
以上是矫正抹布(crag)行动的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu
