O3-MINIとCREWAIを使用したRAGベースの研究アシスタント
Openaiの最新モデルであるO3-Miniは、高度な推論、問題解決、およびコード生成機能を備えたコーディングタスクに革命をもたらしています。複雑なクエリを効率的に処理し、構造化されたデータを統合し、AIアプリケーションで新しい標準を設定します。この記事では、O3-MINIとCREWAIを使用して、複数のPDFから情報を取得し、ユーザークエリをインテリジェントにプロセスする検索(RAG)研究アシスタントエージェントを構築するために検討します。 CrewaiのCrewdoclingsource、Serperdevtool、およびOpenaiのO3-Miniを使用して、研究ワークフローの自動化を強化します。 目次
- O3-miniとCrewai
- 前提条件
- ステップ1:必要なライブラリをインストールするステップ2:必要なモジュールをインストールする
- ステップ2:必要なモジュールのインポート
- ステップ3:API Keys
ステップ5:AIモデルを定義します- ステップ6:Web検索ツールの構成
- ステップ7:ドキュメント検索の埋め込みモデルを定義します
- ステップ8:AIエージェントを作成
- ステップ9:
- 結論
- よくある質問
- 作業Python環境(3.8以降)
OpenAIおよびSERPER(Google Scholar API)のAPIキー- apiキー
これらを所定の位置に置いて、私たちは構築を開始する準備ができています!
ステップ1:必要なライブラリをインストール
最初に、必要なライブラリをインストールする必要があります。これらのライブラリは、ドキュメント処理、AIエージェントオーケストレーション、およびWeb検索機能の基礎を提供します。
!pip install crewai !pip install 'crewai[tools]' !pip install docling
CREWAIは、AIエージェントを設計および管理するための堅牢なフレームワークを提供し、特殊な役割の定義を可能にし、効率的な研究自動化を可能にします。また、タスク委任を促進し、AIエージェント間のスムーズなコラボレーションを確保します。 さらに、CREWAI [Tools]は、AIエージェントの機能を強化する重要なツールをインストールし、APIと対話し、Web検索を実行し、データをシームレスに処理できるようにします。
- Doclingは、研究文書から構造化された知識を抽出することを専門としており、PDF、アカデミックペーパー、テキストベースのファイルの処理に最適です。このプロジェクトでは、ARXIVの研究論文から重要な調査結果を抽出するために使用されます。
- ステップ2:必要なモジュールをインポート
- これでは、
OSモジュールは、APIキーなどの環境変数を安全に管理して、スムーズな統合を管理しています。
llmは、AIの推論と応答の生成を促進します。import os from crewai import LLM, Agent, Crew, Task from crewai_tools import SerperDevTool from crewai.knowledge.source.crew_docling_source import CrewDoclingSource
エージェントは、タスクを効率的に処理するための専門的な役割を定義します
乗組員は複数のエージェントを管理し、シームレスなコラボレーションを確保します- タスクは、特定の責任を割り当てて追跡します。
-
Crewdoclingsourceは研究文書を統合し、構造化された知識の抽出と分析を可能にします。 - APIキーを取得する方法?
- serper APIキー:serper.devに登録して、APIキーを取得します。
- これらのAPIキーにより、AIモデルとWeb検索機能へのアクセスが可能です。
ステップ4:研究文書を読み込みます
os.environ['OPENAI_API_KEY'] = 'your_openai_api_key' os.environ['SERPER_API_KEY'] = 'your_serper_api_key'
>
https://arxiv.org/pdf/2501.18438:o3-miniとdeepseek-r1の安全性を比較します- https://arxiv.org/pdf/2401.02954:長期的な視点でオープンソース言語モデルのスケーリングについて説明します。
- ステップ5:AIモデルを定義します
!pip install crewai !pip install 'crewai[tools]' !pip install docling
- o3-mini:推論のための強力なAIモデル。
- 温度= 0:決定論的出力を保証します(同じクエリの同じ答え)。
研究機能を強化するために、必要な情報が提供されたドキュメントにない場合に関連するアカデミックペーパーを取得するWeb検索ツールを統合します。
import os from crewai import LLM, Agent, Crew, Task from crewai_tools import SerperDevTool from crewai.knowledge.source.crew_docling_source import CrewDoclingSource
- これは、Google Scholar Search API Endpointを指定します。一般的なWebページではなく、学術記事、研究論文、学術源で検索が特に実行されるようにします。
n_results = 2
- このパラメーターは、ツールによって返される検索結果の数を制限し、最も関連性の高い情報のみが取得されるようにします。この場合、Google Scholarから上位2つの研究論文を取得し、高品質の学術ソースに優先順位を付けるように設定されています。結果の数を減らすことにより、アシスタントは応答を簡潔で効率的に保ち、正確性を維持しながら不必要な情報の過負荷を回避します。 ステップ7:ドキュメント検索の埋め込みモデルを定義します
ドキュメントから関連情報を効率的に取得するには、類似性ベースの検索のためにテキストを数値表現に変換する埋め込みモデルを使用します。
CREWAIの埋め込みは、テキストを数値表現(埋め込み)に変換し、効率的なドキュメント検索とセマンティック検索を可能にするために使用されます。この場合、埋め込みモデルは、特に高品質の埋め込みを生成するための適切に最適化されたモデルである「Text-rembedding-ada-002」を使用してOpenAIによって提供されます。 APIキーは、環境変数から取得してリクエストを認証します。
CREWAIは、OpenAIやGemini(GoogleのAIモデル)を含む複数の埋め込みプロバイダーをサポートしているため、精度、パフォーマンス、コストの考慮事項に基づいて最適なモデルを選択できます。ステップ8:AIエージェントを作成
os.environ['OPENAI_API_KEY'] = 'your_openai_api_key' os.environ['SERPER_API_KEY'] = 'your_serper_api_key'
ドキュメント検索エージェントは、提供された研究論文や文書から回答を取得する責任があります。技術的な内容を分析し、関連する洞察を抽出する専門家として機能します。必要な情報が見つからない場合、さらに探索するためにクエリをWeb検索エージェントに委任できます。 Allow_deLegation = True設定は、この委任プロセスを有効にします
!pip install crewai !pip install 'crewai[tools]' !pip install docling
ステップ9:エージェントのタスクを定義します
import os from crewai import LLM, Agent, Crew, Task from crewai_tools import SerperDevTool from crewai.knowledge.source.crew_docling_source import CrewDoclingSource
次に、エージェントの2つのタスクを作成します。
最初のタスクには、利用可能な研究論文や文書を使用して特定の質問に答えることが含まれます。タスク1:ドキュメントから情報を抽出
ドキュメントベースの検索で回答が得られないときに、次のタスクが作用します。
タスク2:必要に応じてWeb検索を実行します
os.environ['OPENAI_API_KEY'] = 'your_openai_api_key' os.environ['SERPER_API_KEY'] = 'your_serper_api_key'
ステップ10:乗組員を組み立てます
CREWAIの乗組員は、ドキュメント検索エージェントとWeb検索エージェントを調整することにより、エージェントを管理してタスクを効率的に完了します。最初にアップロードされたドキュメント内で検索し、必要に応じてWeb検索に委任します。
content_source = CrewDoclingSource( file_paths=[ "https://arxiv.org/pdf/2501.12948", "https://arxiv.org/pdf/2501.18438", "https://arxiv.org/pdf/2401.02954" ], )
knowlede_sources = [content_source]は、関連するドキュメントを提供します
Embedder = Embedderはセマンティック検索を有効にします
verbose =より良い追跡のための真のログのアクション、スムーズなワークフローを確保します。- ステップ11:リサーチアシスタントを実行
- 最初のクエリはドキュメントに向けられて、研究者エージェントが応答を提供できるかどうかを確認します。尋ねられる質問は、「O3-mini vs deepseek-r1:どちらがより安全ですか?」です。
- 例クエリ1:
llm = LLM(model="o3-mini", temperature=0)
応答
:
serper_tool = SerperDevTool( search_url="https://google.serper.dev/scholar", n_results=2 # Fetch top 2 results )
例クエリの例: ここで、「どちらが良いのか、O3 MiniまたはDeepseek R1?」という質問があります。ドキュメントでは利用できません。システムは、ドキュメント検索エージェントが回答を見つけることができるかどうかを確認します。そうでない場合は、タスクをWeb検索エージェントに委任します
:
出力から、必要な情報はドキュメント研究者エージェントによって見つからなかったため、Web Searcherエージェントを使用して応答が生成されたことがわかります。さらに、答えが最終的に取得されたソースが含まれています。
結論
このプロジェクトでは、研究論文とWebから情報を効率的に取得および分析するAI駆動の研究助手を首尾よく構築しました。 Crewaiを使用してエージェントの調整、ドキュメント処理のためにドクリング、学術検索のためにSerperを使用して、構造化された洞察を使用して複雑なクエリに答えることができるシステムを作成しました。アシスタントは最初にドキュメント内で検索し、必要に応じてWeb検索にシームレスに委任し、正確な応答を確保します。このアプローチは、情報の検索と分析を自動化することにより、研究効率を高めます。さらに、O3-MINIリサーチアシスタントをCrewaiのCrewdoclingsourceおよびSerperDevtoolと統合することにより、システムのドキュメント分析機能をさらに強化しました。さらにカスタマイズすることで、このフレームワークを拡張して、より多くのデータソース、高度な推論、および研究ワークフローの改善をサポートできます。
無料のコースでOpenai O3-Miniをフィーチャーした素晴らしいプロジェクトを探索できます。
よくある質問q1。クルワイとは?
a。 Crewaiは、特定の役割とタスクを備えたAIエージェントを作成および管理できるフレームワークです。複数のAIエージェント間のコラボレーションを使用して、複雑なワークフローを自動化します。 Crewaiは複数のエージェントをどのように管理しますか? Crewaiは、各エージェントが定義された役割を持ち、必要に応じてタスクを委任できる構造化されたアプローチを使用します。クルーオブジェクトは、これらのエージェントを調整して、タスクを効率的に完了します。 Crewdoclingsourceとは何ですか? Crewdoclingsourceは、研究論文、PDF、およびテキストベースのドキュメントから構造化された知識を抽出する文書処理ツールです。 SERPER APIとは? SERPER APIは、AIアプリケーションがGoogle Scholarのアカデミックペーパーの検索を含むGoogle検索クエリを実行できるようにするツールです。 Serper APIは無料で使用できますか? Serper APIは、無料層の検索要求の数に制限があり、無料のプランと有料プランの両方を提供しています。 Serper APIと従来のGoogle検索の違いは何ですか?標準のGoogle検索とは異なり、SERPER APIは検索結果への構造化されたアクセスを提供し、AIエージェントが関連する研究論文を効率的に抽出できるようにします。 Crewdoclingsourceは複数のファイル形式を処理できますか?はい、PDFやテキストベースのファイルなど、一般的な研究文書形式をサポートしています。以上がO3-MINIとCREWAIを使用したRAGベースの研究アシスタントの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

ねえ、忍者をコーディング!その日はどのようなコーディング関連のタスクを計画していますか?このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。 終わり? - &#8217を見てみましょう

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

導入 Openaiは、待望の「Strawberry」アーキテクチャに基づいて新しいモデルをリリースしました。 O1として知られるこの革新的なモデルは、推論能力を強化し、問題を通じて考えられるようになりました

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t
