자체 경영 : AI는 언제 다시 확인 해야하는지 알고 있습니다-일체 포함-php.cn

집

기술 주변기기

일체 포함

자체 경영 : AI는 언제 다시 확인 해야하는지 알고 있습니다

Lisa Kudrow

Mar 08, 2025 am 09:24 AM

자기 반사 검색 세대 생성 (자체-방해) : 적응 형 검색 및 자체 크리티브로 LLM을 향상시킵니다. 큰 언어 모델 (LLM)은 변형 적이지만 매개 변수 지식에 대한 의존은 종종 사실적인 부정확성으로 이어집니다. 검색된 세대 생성 (RAG)은 외부 지식을 통합하여이를 해결하는 것을 목표로하지만 전통적인 RAG 방법은 한계가 있습니다. 이 기사는 LLM의 품질과 사실을 크게 향상시키는 새로운 접근법 인 자조를 탐구합니다.

표준 래그의 단점 표준 래그는 관련성에 관계없이 고정 된 수의 구절을 검색합니다. 이것은 몇 가지 문제로 이어집니다 :

관련없는 정보 :

불필요한 문서 검색은 출력 품질을 희석합니다.

적응성 부족 : 작업 요구에 따라 검색을 조정할 수 없음. 일관되지 않은 출력 : 생성 된 텍스트는 지식 통합에 대한 명시 적 훈련이 부족하여 검색된 정보와 일치하지 않을 수 있습니다.

자기 평가의 부재 :

검색된 구절 또는 생성 된 출력의 품질 또는 관련성을 평가하기위한 메커니즘 없음. 제한된 소스 속성 : 생성 된 텍스트에 대한 소스 지원의 인용이 충분하지 않음.

자기-자체 소개 : 적응 적 검색 및 자기 반성

자체-자체는 적응 형 검색 및 자기 반성을 통합하여 LLM을 향상시킵니다. Standard Rag와 달리 "토큰 검색"을 사용하여 필요한 경우에만 통로를 역동적으로 검색합니다. 결정적으로, 그것은 자체 세대 프로세스를 평가하기 위해 특별한 반사 토큰 (ISREL), ISSUP (지원) 및 ISUSE (유틸리티)를 사용합니다. 자조의 주요 특징은 다음을 포함합니다 주문형 검색 : 필요할 때만 효율적인 검색 반사 토큰 :
검색된 통로 관련 및 출력 품질 평가 엔드 투 엔드 훈련 : 출력 생성 및 반사 토큰 예측에 대한 동시 교육. 사용자 정의 가능한 디코딩 :
자체-래그 워크 플로우
1. 모델은 외부 지식이 필요한지 여부를 결정합니다. 관련 구절 검색 : 필요한 경우, Retriever 모델 (예 : Contriever-MS Marco)을 사용하여 관련 구절을 검색합니다. 병렬 처리 및 세그먼트 생성 : 생성기 모델은 각각 검색된 구절을 처리하여 관련 비평 토큰을 가진 여러 연속 후보를 만듭니다. 자기 비판 및 평가 :
2. 최고의 세그먼트 및 출력 선택 : 세그먼트 레벨 빔 검색은 비판 토큰 확률을 포함하는 가중 점수를 기반으로 최상의 출력 시퀀스를 선택합니다. 훈련 과정 : 2 단계 교육 과정에는 반사 토큰을 생성하기 위해 오프라인 비평가 모델을 훈련 한 다음 이러한 토큰으로 보강 된 데이터를 사용하여 생성기 모델을 훈련시키는 것이 포함됩니다.
3. 자체 규모의 장점
4. 자체-래그는 몇 가지 주요 장점을 제공합니다 : 개선 된 사실 정확도 : 주문형 검색 및 자체 크리티브는 사실 정확도를 높입니다. 강화 된 관련성 :
5. 더 나은 인용 및 검증 가능성 : 상세한 인용 및 평가는 투명성과 신뢰성을 향상시킵니다. 사용자 정의 가능한 동작 :
6. 오프라인 비평가 모델 훈련은 추론 오버 헤드를 줄입니다 Langchain 및 Langgraph를 사용한 구현 이 기사는 Langchain 및 Langgraph를 사용하여 실질적인 구현을 자세히 설명하며 종속성 설정, 데이터 모델 정의, 문서 처리, 평가자 구성, Rag 체인 설정, 워크 플로 기능, 워크 플로 구성 및 테스트를 다룹니다. 이 코드는 다양한 쿼리를 처리하고 응답의 관련성과 정확성을 평가할 수있는 자체 래그 시스템을 구축하는 방법을 보여줍니다.