自己ぼろきれ：いつ再確認するかを知っているAI-AI-php.cn

ホームページ

テクノロジー周辺機器

自己ぼろきれ：いつ再確認するかを知っているAI

Lisa Kudrow

Mar 08, 2025 am 09:24 AM

自己反射的検索の高等世代（自己rag）：適応的検索と自己批判でLLMを強化する

大規模な言語モデル（LLM）は変革的ですが、パラメトリック知識への依存はしばしば事実上の不正確さにつながります。検索された生成（RAG）は、外部の知識を組み込むことでこれに対処することを目指していますが、従来のRAGメソッドは制限に悩まされています。この記事では、LLMの品質と事実を大幅に向上させる新しいアプローチである自己狂気を調査します。

標準的なragの欠点に対処します

標準のRAGは、関連性に関係なく、固定数のパッセージを取得します。これにより、いくつかの問題が発生します：

無関係な情報：不要なドキュメントの検索は、出力品質を希釈します。
タスク要求に基づいて検索を調整できないと、一貫性のないパフォーマンスが発生します。一貫性のない出力：
自己評価の欠如：回収された通路または生成された出力の品質または関連性を評価するためのメカニズムはありません。
限られたソースの帰属：生成されたテキストのソースサポートの引用が不十分です。
自己狂気の導入：適応型検索と自己反省

自己狂気の重要な機能は次のとおりです

オンデマンド検索：

必要な場合にのみ効率的な検索。

リフレクショントークン：

ISREL、ISSUP、およびISUSEトークンを使用した自己評価

自己批評：回収された通過の関連性と出力品質の評価。
エンドツーエンドのトレーニング：出力生成と反射トークン予測の同時トレーニング。>
カスタマイズ可能なデコード：検索頻度とさまざまなタスクへの適応の柔軟な調整。
セルフラグワークフロー
1. 入力処理と取得決定：モデルは、外部知識が必要かどうかを判断します。
2. 関連するパッセージの取得：必要に応じて、関連するパッセージはレトリーバーモデル（例：Contriever-MS Marco）を使用して取得されます。
3. ジェネレーターモデルは、それぞれの検索された通路を処理し、関連する批評トークンを持つ複数の継続候補を作成します。自己批評と評価：
4. 最適なセグメントと出力の選択：セグメントレベルのビーム検索は、批評トークンの確率を組み込んだ加重スコアに基づいて最適な出力シーケンスを選択します。
5. トレーニングプロセス：2段階のトレーニングプロセスには、批評家モデルをオフラインでトレーニングしてリフレクショントークンを生成することが含まれ、その後、これらのトークンで補強されたデータを使用してジェネレーターモデルをトレーニングします。
- 詳細な引用と評価により、透明性と信頼性が向上します。カスタマイズ可能な動作：
- 効率的な推論：
- LangchainとLanggraph を使用した
- 実装この記事では、LangchainとLanggraphを使用した実用的な実装を詳しく説明し、依存関係のセットアップ、データモデル定義、ドキュメント処理、評価者の構成、RAGチェーン設定、ワークフロー機能、ワークフロー構築、テストをカバーしています。コードは、さまざまなクエリを処理し、その応答の関連性と正確性を評価できる自己ぼろきシステムを構築する方法を示しています。
- その利点にもかかわらず、自己ragには制限があります：