目录
介绍
概述
目录
什么是命中率?
计算命中率?
命中率限制
平均相互等级(MRR)
计算MRR?
最大边缘相关性(MMR)
计算MMR?
MMR示例
结论
常见问题
首页 科技周边 人工智能 了解命中率,MRR和MMR指标

了解命中率,MRR和MMR指标

Apr 21, 2025 am 09:44 AM

介绍

想象一下浏览书店以进行完美阅读。您渴望特定于流派的建议,但希望发现新作者的多样性。检索增强的生成(RAG)系统的功能相似,将信息检索与创意响应生成融为一体。评估其绩效需要指标,例如命中率(衡量成功的建议)和平均相互等级(MRR,考虑建议顺序)。最大边缘相关性(MMR)确保了建议的相关性和多样性。这些指标保证了准确,多样化和引人入胜的建议。

概述

本指南探讨了命中率,MMR及其在评估抹布系统中的作用。您将学会将MMR用于在检索结果中平衡相关性和多样性,计算命中率和MRR评估检索有效性,并使用这些性能指标分析/改善抹布系统。

目录

  • 什么是命中率?
  • 计算命中率
  • 命中率限制
  • 平均相互等级(MRR)
  • 计算MRR
  • 最大边缘相关性(MMR)
  • 计算MMR
  • MMR示例
  • 常见问题

什么是命中率?

命中率通过测量所需项目在顶级建议中出现的频率来评估建议系统性能。在抹布中,它表示成功将相关数据纳入生成的输出的频率。

计算命中率?

命中率是通过将相关项目出现在顶级建议中的查询数量除以查询总数的查询数量来计算的。数学上:

了解命中率,MRR和MMR指标

示例:三个查询(Q1,Q2,Q3),带有相应的目标节点(N1,N2,N3)。检索的节点是:

了解命中率,MRR和MMR指标

Q1的命中率为1,Q3为0。所以:

了解命中率,MRR和MMR指标

命中率限制

命中率的主要限制是无视检索到的节点的位置。考虑两个猎犬:

了解命中率,MRR和MMR指标

两者都具有相同的命中率(66.66%),但是Retriever 2始终将正确的节点排名更高(位置1比Q1的位置3)。这凸显了对考虑排名的度量的需求。

平均相互等级(MRR)

平均相互等级(MRR)通过考虑排名列表中的第一个相关项目的等级来评估信息检索系统。在RAG中,它评估了检索组件在寻找相关文档以进行准确响应生成时的性能。

计算MRR?

了解命中率,MRR和MMR指标

其中n是查询的数量,而ranki是查询i的第一个相关文档的等级。

例子:

了解命中率,MRR和MMR指标

Q1的MRR为1/3。所以:

了解命中率,MRR和MMR指标

请注意,尽管命中率达到66.66%,但MRR为44.4%,奖励将相关物品更高的检索员奖励。

最大边缘相关性(MMR)

最大边缘相关性(MMR)重新排列结果以优化相关性和多样性。它可以平衡新颖性和相关性,以确保已检索的项目全面解决查询方面。

计算MMR?

了解命中率,MRR和MMR指标

λ(mmr_threshold)控制相关性/多样性权衡。接近1的λ优先考虑相关性;接近0的λ优先考虑多样性。

MMR示例

使用与命中率相同的示例,具有假定的相关性和相似性得分,λ= 0.5:

了解命中率,MRR和MMR指标

原始文档中提供了Q1,Q2和Q3的详细MMR计算和重新排列。最终重新排列的节点说明了MMR在相关性和多样性之间达到的平衡。

结论

命中率,MRR和MMR对于评估和改善抹布系统至关重要。命中率和MRR专注于相关信息检索频率和排名,而MMR平衡相关性和多样性。优化这些指标可增强抹布系统的响应质量和用户体验。

常见问题

Q1。什么是命中率?答:这是最高建议中的查询与相关项目与查询总数的比率。

Q2。什么是MMR?答:最大的边际相关性是一种重新排列技术,平衡了检索结果中的相关性和多样性。

Q3。为什么命中率对抹布很重要?答:更高的命中率表明更好地检索相关信息,从而导致更准确的响应。

Q4。为什么MMR对抹布很重要? A. MMR确保各种各样的相关结果,为查询提供全面的答案。

以上是了解命中率,MRR和MMR指标的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

开始使用Meta Llama 3.2 -Analytics Vidhya 开始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

10个生成AI编码扩展,在VS代码中,您必须探索 10个生成AI编码扩展,在VS代码中,您必须探索 Apr 13, 2025 am 01:14 AM

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

AV字节:Meta' llama 3.2,Google的双子座1.5等 AV字节:Meta' llama 3.2,Google的双子座1.5等 Apr 11, 2025 pm 12:01 PM

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

向员工出售AI策略:Shopify首席执行官的宣言 向员工出售AI策略:Shopify首席执行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

视觉语言模型(VLMS)的综合指南 视觉语言模型(VLMS)的综合指南 Apr 12, 2025 am 11:58 AM

介绍 想象一下,穿过​​美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? Apr 13, 2025 am 10:18 AM

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

阅读AI索引2025:AI是您的朋友,敌人还是副驾驶? 阅读AI索引2025:AI是您的朋友,敌人还是副驾驶? Apr 11, 2025 pm 12:13 PM

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

See all articles