적중률, MRR 및 MMR 메트릭 이해-일체 포함-php.cn

완벽한 읽기를 위해 서점을 탐색한다고 상상해보십시오. 당신은 장르에 따른 권장 사항을 간절히 원하지만 새로운 작가를 발견하려는 다양성을 원합니다. RAG (Resprieved-Augmented Generation) 시스템은 유사하게 기능하여 정보 검색과 창의적 응답 생성과 혼합됩니다. 성능을 평가하려면 적중률 (성공적인 권장 사항 측정) 및 평균 상호 순위 (MRR, 권장 사항 순서를 고려한 MRR)와 같은 지표가 필요합니다. 최대 한계 관련성 (MMR)은 제안의 관련성과 다양성을 보장합니다. 이 메트릭은 정확하고 다양하며 매력적인 권장 사항을 보장합니다.

개요

이 안내서는 히트율, MMR 및 RAG 시스템 평가에서의 역할을 탐구합니다. 검색된 결과의 관련성과 다양성의 균형을 맞추기 위해 MMR을 적용하고, 검색 효과를 평가하기 위해 적중률 및 MRR을 계산하며, 이러한 성능 메트릭을 사용하여 RAG 시스템을 분석/개선하는 법을 배웁니다.

적중률은 얼마입니까?

적중률은 원하는 항목이 최상위 N 권장 사항 내에 얼마나 자주 나타나는지를 측정하여 추천 시스템 성능을 평가합니다. Rag에서는 관련 데이터를 생성 된 출력에 성공적으로 통합하는 빈도를 나타냅니다.

적중률 계산?

적중률은 관련 항목이 Top-N 권장 사항에 나타나는 쿼리 수를 총 쿼리 수로 나누어 계산됩니다. 수학적 :

적중률, MRR 및 MMR 메트릭 이해

예 : 해당 대상 노드 (N1, N2, N3)가있는 3 개의 쿼리 (Q1, Q2, Q3). 검색된 노드는 다음과 같습니다.

적중률, MRR 및 MMR 메트릭 이해

적중률은 Q1의 경우 1, Q2, Q3의 경우 0입니다. 그러므로:

적중률, MRR 및 MMR 메트릭 이해

적중률 제한

적중률의 주요 제한은 검색된 노드의 위치에 대한 무시입니다. 두 개의 리트리버를 고려하십시오.

적중률, MRR 및 MMR 메트릭 이해

둘 다 동일한 적중률 (66.66%)을 가지지 만 리트리버 2는 일관되게 올바른 노드를 높이 평가합니다 (Q1의 위치 1 대 위치 3). 이것은 순위를 고려하는 메트릭의 필요성을 강조합니다.

평균 상호 순위 (MRR)

평균 상호 순위 (MRR)는 순위 목록에서 첫 번째 관련 항목의 순위를 고려하여 정보 검색 시스템을 평가합니다. Rag에서는 정확한 응답 생성을위한 관련 문서를 찾는 데있어 검색 구성 요소의 성능을 평가합니다.

MRR 계산?

적중률, MRR 및 MMR 메트릭 이해

여기서 n은 쿼리 수이고 랭키는 쿼리 i의 첫 번째 관련 문서의 순위입니다.

예:

적중률, MRR 및 MMR 메트릭 이해

Q1의 MRR은 1/3입니다. 그러므로:

적중률, MRR 및 MMR 메트릭 이해

66.66%의 적중률에도 불구하고 MRR은 44.4%로 관련 항목을 더 높은 리트리버로 보상합니다.

최대 한계 관련성 (MMR)

최대 한계 관련성 (MMR) 리 평가는 관련성과 다양성을 모두 최적화합니다. 검색된 항목이 종합적으로 쿼리 측면을 해결하기 위해 참신과 관련성의 균형을 유지합니다.

MMR 계산?

적중률, MRR 및 MMR 메트릭 이해

λ (mmr_threshold)는 관련성/다양성 트레이드 오프를 제어합니다. λ에 가까운 λ는 관련성을 우선시합니다. λ에 가까운 λ는 다양성을 우선시합니다.

MMR 예

적중률과 동일한 예제를 사용하고 관련성 및 유사성 점수가 가정하고 λ = 0.5 :

적중률, MRR 및 MMR 메트릭 이해

Q1, Q2 및 Q3의 상세한 MMR 계산 및 재평가는 원본 문서에 제공됩니다. 최종 재 순위 노드는 MMR이 관련성과 다양성 사이의 균형을 보여줍니다.

결론

적중률, MRR 및 MMR은 RAG 시스템을 평가하고 개선하는 데 중요합니다. 적중률과 MRR은 관련 정보 검색 빈도 및 순위에 중점을두고 MMR은 관련성과 다양성의 균형을 유지합니다. 이러한 메트릭을 최적화하면 RAG 시스템 응답 품질 및 사용자 경험이 향상됩니다.

자주 묻는 질문

Q1. 적중률은 얼마입니까? A. 상단 N 권장 사항에 관련 항목이있는 쿼리 비율은 총 쿼리 수입니다.

Q2. MMR이란 무엇입니까? A. 최대 한계 관련성은 검색된 결과의 균형과 관련성과 다양성의 재 순위 기술입니다.

Q3. RAG에 적중률이 중요한 이유는 무엇입니까? A. 적중률이 높을수록 관련 정보가 더 나은 검색을 의미하여보다 정확한 응답으로 이어집니다.

Q4. MMR이 헝겊에 중요한 이유는 무엇입니까? A. MMR은 다양한 결과를 보장하여 쿼리에 대한 포괄적 인 답변을 제공합니다.

위 내용은 적중률, MRR 및 MMR 메트릭 이해의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

자바 튜토리얼

1664

Cakephp 튜토리얼

1423

라라벨 튜토리얼

1317

PHP 튜토리얼

1268

C# 튜토리얼

1244

Related knowledge

Meta Llama 3.2- 분석 Vidhya를 시작합니다 Apr 11, 2025 pm 12:04 PM

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다. Apr 13, 2025 am 01:14 AM

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - &#8217

AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등 Apr 11, 2025 pm 12:01 PM

이번 주 AI 환경 : 발전의 회오리 바람, 윤리적 고려 사항 및 규제 토론. OpenAi, Google, Meta 및 Microsoft와 같은 주요 플레이어

직원에게 AI 전략 판매 : Shopify CEO의 선언문 Apr 10, 2025 am 11:19 AM

Shopify CEO Tobi Lütke의 최근 메모는 AI 숙련도가 모든 직원에 대한 근본적인 기대를 대담하게 선언하여 회사 내에서 중요한 문화적 변화를 표시합니다. 이것은 도망가는 트렌드가 아닙니다. 그것은 p에 통합 된 새로운 운영 패러다임입니다

GPT-4O vs Openai O1 : 새로운 OpenAI 모델은 과대 광고 가치가 있습니까? Apr 13, 2025 am 10:18 AM

소개 OpenAi는 기대가 많은 "Strawberry"아키텍처를 기반으로 새로운 모델을 출시했습니다. O1로 알려진이 혁신적인 모델은 추론 기능을 향상시켜 문제를 통해 생각할 수 있습니다.

비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서 Apr 12, 2025 am 11:58 AM

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

LLAMA 3.2를 실행하는 3 가지 방법 분석 Vidhya Apr 11, 2025 am 11:56 AM

메타의 라마 3.2 : 멀티 모달 AI 강국 Meta의 최신 멀티 모드 모델 인 LLAMA 3.2는 AI의 상당한 발전으로 향상된 언어 이해력, 개선 된 정확도 및 우수한 텍스트 생성 기능을 자랑합니다. 그것의 능력 t

최고의 프롬프트 엔지니어링 기술의 최신 연간 편집 Apr 10, 2025 am 11:22 AM

내 칼럼을 처음 접할 수있는 분들을 위해, 나는 구체화 된 AI, AI 추론, AI의 첨단 획기적인 혁신, AI 교육, AI의 수비, ai re

See all articles

적중률, MRR 및 MMR 메트릭 이해

소개

개요

목차

적중률은 얼마입니까?

적중률 계산?

적중률 제한

평균 상호 순위 (MRR)

MRR 계산?

최대 한계 관련성 (MMR)

MMR 계산?

MMR 예

결론

자주 묻는 질문

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제