Cognee Llamaindex：強力なグラフラグパイプラインの構築-AI-php.cn

決定論的レイヤーを有効にします

ステップ1：環境をセットアップ

なぜcogneeとllamaindexを選択しますか？

simplified deployment

ホームページ

テクノロジー周辺機器

Cognee Llamaindex：強力なグラフラグパイプラインの構築

Christopher Nolan

Mar 05, 2025 am 10:20 AM

外部の知識を大規模な言語モデル（LLM）に接続する場合、開発者はしばしば、多くのソースからのデータの統合（構造化された、その多くが構造化されていない）に取り組んでいますが、それでも高速で正確な情報を返します。この課題は、検索の継続世代（RAG）の中心にあります。これは、LLMがオンデマンドでドメイン固有のデータを引き込むための説得力のある方法を提供します。しかし、データが拡大し、正確な接続の必要性が高まるにつれて、ぼろきれパイプラインは扱いにくい可能性があります。学習目標

検索された世代の基礎（RAG）とLLM機能の強化におけるその役割を理解してください。

CogneeとLlamaindexがどのようにGraphRagを有効にして、より構造化されたコンテキストを意識した知識を取得できるかを学びます。

RAGシステムの従来のチャンクベースの方法よりもグラフベースの検索の利点を発見してください。
この記事は、

データサイエンスブログの一部として公開されました。

目次rag in birf 結論よくある質問

rag briag

検索された生成（RAG）は、推論中に外部の知識を大規模な言語モデルに注入します。データをベクトル埋め込みに変換してベクトルデータベースに保存することにより、RAGシステムにより、LLMが本質的に所有していないドメイン固有の情報を推論することができます。主な利点は次のとおりです
- ドメイン固有のデータをLLMSに接続する：汎用言語モデルと専門知識のギャップを埋める。
- コストの削減：クエリに関連するデータのみを取得することにより、より集中したLLM使用を有効にします。
- 精度の向上：ベースLLMSの機能を上回るターゲットを絞ったドメインに調整した応答を提供します。 ただし、従来のぼろきれには、複数のツールをジャグリングし、複雑なメタデータを扱い、進化するデータセットの更新を管理する必要があります。さらに、各チャンクは主に単独で扱われているため、標準のRAGの「チャンクと埋め込み」方法論はグローバルなコンテキストを失う可能性があります。
cogneeは、人間が精神的マップを作成する方法からインスピレーションを引き出す知識と記憶管理のフレームワークです。オブジェクト、概念、および関係をグラフ構造としてモデル化することにより、生データに構造とコンテキストをもたらし、知識をより操作可能で相互運用可能にするのに役立ちます。 Llamaindexは、多用途のデータ統合ライブラリとして機能し、データベース、API、および非構造化されていないテキストを含むさまざまなソースからのデータをシームレスにファンネル化することにより、これを補完します。 PDF、SQLテーブル、またはJSONエンドポイントを扱うかどうかにかかわらず、LlamainDexはこれらの情報ストリームを一貫したパイプラインに統合できます。
なぜcognee？

知識の人間にインスパイアされたモデル
：認知は認知機能を模倣し、その関係を強調するグラフのオブジェクトと概念を表します。
堅牢なセマンティックレイヤー
：これらのグラフをオントロジーの形式化することにより、開発者は意味と関係を体系的にキャプチャできます。
- ：希望するLLMまたはVectorストア（Openai、ローカルオープンソースモデル、Redis、またはお気に入りのグラフデータベースなど）を選択し、Cognee内でシームレスに接続します。 cognee llamaindex = graphrag
- を作成するGraphRagが作成されます
- ：テキストチャンクを埋め込むのではなく、概念、ノード、関係のセマンティックレイヤーを構築します。柔軟なドメイン固有のオントロジーを生成します
決定論的レイヤーを有効にします
：グラフベースのロジックと関係を通じて、より一貫した説明可能な結果を確保します。

GraphRagパイプラインの構築：概念的概要
- エンドツーエンドのワークフローには簡単なPythonコード（ここでスキップします）が含まれていますが、以下はCogneeとLlamaindexを使用してGraphRagパイプラインを構築する方法の概念的な概要です。
  ステップ1：環境をセットアップ
  
  必要な依存関係（Cognee、Llamaindex、および選択したLLMおよびデータベースプロバイダー）をインストールして構成します。この最初のステップにより、環境にはベクターの埋め込み、グラフストレージ、LLM推論を管理するために必要なものがすべて揃っています。
```
!pip install llama-index-graph-rag-cognee==0.1.2

# Import required libraries
import os
import asyncio

import cognee
from llama_index.core import Document
from llama_index.graph_rag.cognee import CogneeGraphRAG

# Set API key for OpenAI
if "OPENAI_API_KEY" not in os.environ:
    os.environ["OPENAI_API_KEY"] = ""
```
  ログイン後にコピー
  ログイン後にコピー
  ステップ2：データセットを準備
  
  短いテキストスニペットまたはドキュメントセット全体がある場合でも、そのデータを収集してコレクションにロードします。 llamaindexはさまざまなファイル形式やデータソースを処理できますが、通常、マネージャー可能なセグメントまたは「ドキュメント」でテキストを提供します。
  
  ステップ3：cogneegraphragを初期化
```
documents = [
    Document(
        text="Jessica Miller, Experienced Sales Manager with a strong track record in driving sales growth and building high-performing teams."
    ),
    Document(
        text="David Thompson, Creative Graphic Designer with over 8 years of experience in visual design and branding."
    ),
]
```
  ログイン後にコピー
  次に、cogneegraphragオブジェクトを作成して、グラフ（たとえば、ネットワークを使用したメモリ、または専用のグラフデータベースにメモリを保存する方法）とベクトルストレージ（例えば、LancedB、Pinecone、または別のベクターデータベース）を保存する方法を指定します。また、OpenaiやローカルモデルなどのLLMプロバイダーと、関連するAPIキーも選択します。
  
  ステップ4：データを追加および処理
  
  ドキュメントをシステムにロードして、CogneeとLlamaindexが解析して埋め込まれるようにします。データが整ったら、テキストを分析し、意味のあるエンティティ、関係、メタデータを抽出する変換ステップを呼び出します。これらは、ナレッジグラフのノードとエッジになります。
```
cogneeRAG = CogneeGraphRAG(
    llm_api_key=os.environ["OPENAI_API_KEY"],
    llm_provider="openai",
    llm_model="gpt-4o-mini",
    graph_db_provider="networkx",
    vector_db_provider="lancedb",
    relational_db_provider="sqlite",
    relational_db_name="cognee_db",
)
```
  ログイン後にコピー
  ステップ5：検索を実行
  
  データの上に構築されたナレッジグラフを使用すると、2つの主要なタイプのクエリを実行できます。
```
# Load documents into CogneeGraphRAG
await cogneeRAG.add(documents, "test")
```
  ログイン後にコピー
  ナレッジグラフベースの検索
  - グラフのグローバルな関係を活用して、情報の一部がどのようにリンクするかを確認します。
  - - 従来のチャンク検索を使用して、グローバルグラフのコンテキストを必ずしも活用せずに関連するテキストパッセージを見つけます。グラフベースのアプローチの利点は、すべてのドキュメント全体でコンテキストと関係を考慮できることです。たとえば、複数のドキュメントが個人または概念を参照する場合、グラフアプローチは、より包括的な回答のためにそれらを統一し、相互参照するのに役立ちます。
  - ステップ6：関連するノードを探索直接検索を超えて、GraphRagを使用すると、関係をナビゲートできます。特定のエンティティにリンクされているすべての概念または人々を見たいとしますが、知識グラフはこれらの接続を明らかにし、より深い洞察を提供することができます。これらの手順の終わりまでに、パイプラインは標準のRAGのチャンクレベルの制約によって制限されなくなりました。代わりに、LLMは、知識の堅牢で相互に接続されたビューを活用できます。それは、より洞察力に富み、まとまりがあり、コンテキストが豊富な答えにつながります
    !pip install llama-index-graph-rag-cognee==0.1.2 # Import required libraries import os import asyncio import cognee from llama_index.core import Document from llama_index.graph_rag.cognee import CogneeGraphRAG # Set API key for OpenAI if "OPENAI_API_KEY" not in os.environ: os.environ["OPENAI_API_KEY"] = ""
    ログイン後にコピー
    ログイン後にコピー
    なぜcogneeとllamaindexを選択しますか？
    
    cogneeとllamaindexは、グラフベースの推論と柔軟なデータ統合を組み合わせて、従来のぼろをより構造的で洞察に満ちたアプローチに変換します。この相乗効果は、知識の検索を強化し、コンテキストの理解を向上させ、AI搭載アプリケーションの展開を簡素化します。
    相乗エージェントフレームワークとメモリ
    
    GraphRagは、エージェント内の長期、短期、およびドメイン固有のメモリを促進します。グラフベースの構造で詳細な知識を維持することにより、エージェントは時間の経過とともにより正確にコンテキストを思い出し、シームレスに新しい情報に適応できます。
    強化されたクエリと洞察
    より全体的な見方をすれば、クエリは自動的に洗練されている可能性があります。時間が経つにつれて、グラフはその関係を自己最適化し、より豊かで接続されたデータを生み出すことができます。単一のチャンクから単一のスニペットを返す代わりに、エージェントは複数の参照を合成したり、散在した事実を統合したりできます。
    simplified deployment
    
    cogneeは、複雑さを抽象化することを目指しています。 LLMS、ベクトルデータベース、グラフストアの標準統合が付属しています。つまり、最小限のオーバーヘッドでGraphRagパイプラインを展開できます。これにより、インフラストラクチャの手間を扱うよりも、洞察を探るのにもっと時間を費やすことができます。
    
    テキストを超えて：知識グラフの視覚化
    グラフラグの最大の強みの1つは、テキストを動的なセマンティックレイヤーに変換する方法にあります。各エンティティ（例：人、場所、概念）をノードとして表す想像してください。エッジは、組織における人の役割や別の概念との関係など、参照をキャプチャする場合があります。
    この視覚化は、開発者と利害関係者の両方に役立ちます
    
    パターンを識別
    ：密接に関連する概念またはエンティティのクラスターを参照してください。
    
    検証
    および
    ：関係の不正確さをすばやく見つけ、データパイプラインでそれらを修正します。
    - 洞察を伝えます：より直感的な形式で複雑な相互依存関係を伝えます。
    - 実際には、エッジが役割、場所、または成果にリンクする各人のノードがすべて一貫したグラフ図に記載されています。その情報の複数のテキストフラグメントを検索するよりも明確です。 GraphRagの可能性のロックを解除します 構造化されたデータと非構造化データをAIワークフローに統合することは、小さな偉業ではありません。しかし、Cogneeのグラフベースのセマンティックレイヤーを使用したデータ摂取のためのLlamaindexの力を統合することにより、パイプライン全体をより効率的で、より一貫性があり、最終的にはより洞察に満ちた合理化されたアプローチを獲得します。
    - ？
      単一の知識グラフで、IT製品リスト、科学論文、または顧客のやり取りなど、あらゆる形態のデータを持参できます。
      あなたのLLMは、チャンクされた通路から「推測」していません。全体的な知識マップから推測しています
      オントロジーの洗練、関係の視覚化、データの最適な解釈方法を繰り返すなどの高レベルのタスクに焦点を当てることができます。
      あなたが専門のチャットボットを構築するソロ開発者であろうと、知識プラットフォームをアーキテクテクタリングするエンタープライズチームであろうと、GraphRagは堅牢で柔軟な基盤を提供します。
      もっと学びたいか、自分で試してみたいですか？Google Colabで詳細なデモを実行できます。環境のセットアップ、データのロード、知識グラフの作成、クエリの実行方法を正確に確認できます。
      botdingライン：高度な言語モデルと並行してデータの潜在能力を最大限に活用することに真剣に取り組む場合、CogneeとLlamaindexのGraphRagアプローチが次のステップです。構成の数行といくつかの適切に構造化されたデータを使用すると、プレーンテキストを実用的なインテリジェンスに変換できます。これは、構造化されていないドキュメントと真に「スマート」な洞察とのギャップを詰め込むことができます。
      結論
      
      cogneeとllamaindexは、構造化された知識検索と高度なインデックス作成手法を統合することにより、RAGシステムを強化するための強力な組み合わせを提供します。この相乗効果により、さまざまなAIアプリケーション全体で、文脈の理解、検索効率、適応性が向上します。グラフベースの推論と柔軟なデータ統合を活用することにより、組織はよりインテリジェントでスケーラブルで正確なAIソリューションを構築できます。 AI駆動型の知識システムが進化するにつれて、CogneeやLlamaindexのようなツールは、情報検索の将来を形成する上で重要な役割を果たします。
      キーテイクアウト
      
      cogneeとllamaindexは、構造化された知識を取得してRAGシステムを強化します。
      グラフベースの推論により、コンテキストの理解と意思決定が改善されます
      柔軟なデータ統合により、多様なAIアプリケーション全体の適応性が保証されます
      組み合わせにより、検索の効率と応答の精度が向上します。
      
      将来のAIシステムは、知識ベースのワークフローを最適化するためにそのようなツールに依存します。

以上がCognee Llamaindex：強力なグラフラグパイプラインの構築の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Java チュートリアル

1654

CakePHP チュートリアル

1413

Laravel チュートリアル

1306

PHP チュートリアル

1252

C# チュートリアル

1225

Related knowledge

Meta Llama 3.2を始めましょう - 分析Vidhya Apr 11, 2025 pm 12:04 PM

メタのラマ3.2：マルチモーダルとモバイルAIの前進メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。成功に基づいてo

10生成AIコーディング拡張機能とコードのコードを探る必要があります Apr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング！その日はどのようなコーディング関連のタスクを計画していますか？このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。終わり？ - ＆＃8217を見てみましょう

従業員へのAI戦略の販売：Shopify CEOのマニフェスト Apr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

AVバイト：Meta＆＃039; s llama 3.2、GoogleのGemini 1.5など Apr 11, 2025 pm 12:01 PM

今週のAIの風景：進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

GPT-4o vs Openai O1：新しいOpenaiモデルは誇大広告に値しますか？ Apr 13, 2025 am 10:18 AM

導入 Openaiは、待望の「Strawberry」アーキテクチャに基づいて新しいモデルをリリースしました。 O1として知られるこの革新的なモデルは、推論能力を強化し、問題を通じて考えられるようになりました

ビジョン言語モデル（VLM）の包括的なガイド Apr 12, 2025 am 11:58 AM

導入鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか？あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか？

SQLに列を追加する方法は？ - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

AIインデックス2025を読む：AIはあなたの友人、敵、または副操縦士ですか？ Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう：認知（何が起こっているのかを理解する）、感謝（利益を見る）、受け入れ（顔の課題）、責任（責任を見つける）。認知：人工知能はどこにでもあり、急速に発展しています私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

See all articles