了解命中率,MRR和MMR指标
介绍
想象一下浏览书店以进行完美阅读。您渴望特定于流派的建议,但希望发现新作者的多样性。检索增强的生成(RAG)系统的功能相似,将信息检索与创意响应生成融为一体。评估其绩效需要指标,例如命中率(衡量成功的建议)和平均相互等级(MRR,考虑建议顺序)。最大边缘相关性(MMR)确保了建议的相关性和多样性。这些指标保证了准确,多样化和引人入胜的建议。
概述
本指南探讨了命中率,MMR及其在评估抹布系统中的作用。您将学会将MMR用于在检索结果中平衡相关性和多样性,计算命中率和MRR评估检索有效性,并使用这些性能指标分析/改善抹布系统。
目录
- 什么是命中率?
- 计算命中率
- 命中率限制
- 平均相互等级(MRR)
- 计算MRR
- 最大边缘相关性(MMR)
- 计算MMR
- MMR示例
- 常见问题
什么是命中率?
命中率通过测量所需项目在顶级建议中出现的频率来评估建议系统性能。在抹布中,它表示成功将相关数据纳入生成的输出的频率。
计算命中率?
命中率是通过将相关项目出现在顶级建议中的查询数量除以查询总数的查询数量来计算的。数学上:
示例:三个查询(Q1,Q2,Q3),带有相应的目标节点(N1,N2,N3)。检索的节点是:
Q1的命中率为1,Q3为0。所以:
命中率限制
命中率的主要限制是无视检索到的节点的位置。考虑两个猎犬:
两者都具有相同的命中率(66.66%),但是Retriever 2始终将正确的节点排名更高(位置1比Q1的位置3)。这凸显了对考虑排名的度量的需求。
平均相互等级(MRR)
平均相互等级(MRR)通过考虑排名列表中的第一个相关项目的等级来评估信息检索系统。在RAG中,它评估了检索组件在寻找相关文档以进行准确响应生成时的性能。
计算MRR?
其中n是查询的数量,而ranki是查询i的第一个相关文档的等级。
例子:
Q1的MRR为1/3。所以:
请注意,尽管命中率达到66.66%,但MRR为44.4%,奖励将相关物品更高的检索员奖励。
最大边缘相关性(MMR)
最大边缘相关性(MMR)重新排列结果以优化相关性和多样性。它可以平衡新颖性和相关性,以确保已检索的项目全面解决查询方面。
计算MMR?
λ(mmr_threshold)控制相关性/多样性权衡。接近1的λ优先考虑相关性;接近0的λ优先考虑多样性。
MMR示例
使用与命中率相同的示例,具有假定的相关性和相似性得分,λ= 0.5:
原始文档中提供了Q1,Q2和Q3的详细MMR计算和重新排列。最终重新排列的节点说明了MMR在相关性和多样性之间达到的平衡。
结论
命中率,MRR和MMR对于评估和改善抹布系统至关重要。命中率和MRR专注于相关信息检索频率和排名,而MMR平衡相关性和多样性。优化这些指标可增强抹布系统的响应质量和用户体验。
常见问题
Q1。什么是命中率?答:这是最高建议中的查询与相关项目与查询总数的比率。
Q2。什么是MMR?答:最大的边际相关性是一种重新排列技术,平衡了检索结果中的相关性和多样性。
Q3。为什么命中率对抹布很重要?答:更高的命中率表明更好地检索相关信息,从而导致更准确的响应。
Q4。为什么MMR对抹布很重要? A. MMR确保各种各样的相关结果,为查询提供全面的答案。
以上是了解命中率,MRR和MMR指标的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年
