ホームページ ウェブフロントエンド jsチュートリアル OpenAI JSON モードと JSON スキーマによるデータ抽出の簡素化

OpenAI JSON モードと JSON スキーマによるデータ抽出の簡素化

Jan 04, 2025 pm 12:59 PM

Simplifying Data Extraction with OpenAI JSON Mode and JSON Schemas

ChatGPT-3.5 のリリース後、初めて ChatGPT-3.5 を試したとき、さまざまなアプリケーションに対するその可能性に興奮しました。しかし、大きな障害に遭遇すると、私の興奮はすぐに冷めてしまいました。返される貴重な情報は非常に読みやすいものでしたが、アプリケーションが確実に取り込める形式ではありませんでした。皮肉なことに、LLM は非構造化テキストから情報を抽出することに優れていますが、それを非構造化形式でしか返すことができません。 LLM からプログラムで結果を抽出しようとすると、最高に​​おいしい料理を提供する素晴らしいレストランにいるような気分になりました。しかし、調理器具は何もなく、目で見て匂いを嗅ぐことはできますが、そこに到達することはできません。

私はこの本のあらゆるトリックを試して、構造化データのようなものを理解させようとしました。 「各項目をバーまたは改行で区切って、解説を省略してください」と私は懇願します。うまくいくこともあれば、うまくいかないこともありました。時には、善意ではあるが少し混乱しているアシスタントのように、アイテムに「親切に」番号を付けたり、並べ替えたりすることもあります。また、おしゃべりな同僚を思わせるコメントがこっそり入ることもありました。私は、JSON だけを返すように明確な条件で要求しましたが、コンマが省略されることがありました。まるで受動攻撃的なジャブを打っているかのようでした。結局、私は諦めて、しぶしぶ、あまり刺激的ではないが、より予測可能な従来のアルゴリズムの範囲に戻りました。

幸いなことに、数か月後、OpenAI は LLM に有効な JSON を強制的に返す機能である JSON モードを導入しました。この機能を試してみることにしましたが、アプリケーションでの結果の処理が大幅に効率的であることがわかりました。 JSON モードを有効にした場合の出力の例を次に示します:

PROMPT:‍
Parse the following sentence into words and then return the results
as a list of the original word and the translation in English and
return the results in JSON.
-- sentence --
早安‍


RESULTS:
{
  "results": [
    {
      "original": "早安",
      "translation": "Good morning"
    }
  ]
}
ログイン後にコピー
ログイン後にコピー

この出力は確かに改善されています。ただし、出力は有効な JSON ですが、その構造はプロンプトの内容によって異なる場合があります。より予測可能なアプローチは、必要な戻り形式を指定することです。これを実現する 1 つの方法は、LLM が従うサンプル JSON 構造を提供することです。この方法では、サンプルを作成し、それを解析するコードを作成します。構造が変更された場合は、両方の場所で変更を行う必要があります。

別のアプローチは、結果を保持するデータ転送オブジェクト (DTO) を定義し、それを LLM への指示と結果の解析の両方に使用して、同期の問題を回避することです。まず、DTO を定義します。例:‍

record Entries(List<Entry> entries) {
    record Entry(String originalWord, String wordInEnglish, String pronunciation) {}
}
ログイン後にコピー
ログイン後にコピー

これで、DTO をプロンプト命令および解析コードで使用できるようになりました。

// Construct the prompt with the output schema.
var prompt = MessageFormat.format("""
   Parse the following sentence into English and return the results
   in JSON according to the following JSON schema.

   人工智慧將引領未來,以智慧之光照亮人類無限可能的前程。
   --- output json schema ---
   {0}
   """, jsonSchemaOf(Entries.class));
   var result = sendPrompt(prompt, Entries.class);
ログイン後にコピー

Jackson JSON スキーマ ジェネレーターを使用するコードは次のとおりです。

PROMPT:‍
Parse the following sentence into words and then return the results
as a list of the original word and the translation in English and
return the results in JSON.
-- sentence --
早安‍


RESULTS:
{
  "results": [
    {
      "original": "早安",
      "translation": "Good morning"
    }
  ]
}
ログイン後にコピー
ログイン後にコピー

注: デフォルトでは、生成されたスキーマには参照に使用される ID フィールドが含まれるため、トークンが無駄になる可能性があります。これらの未使用の ID を削除するコードについては、リポジトリの OpenAI JSON モード サンプルを参照してください。

最後に、Azure OpenAI Java SDK を使用して OpenAI にプロンプ​​トを送信するコードを示します。

record Entries(List<Entry> entries) {
    record Entry(String originalWord, String wordInEnglish, String pronunciation) {}
}
ログイン後にコピー
ログイン後にコピー

このソリューションはほとんどの場合うまく機能します。 LLM は JSON スキーマを効果的に理解しますが、注意が必要です。時々、それが間違っているケースを見たことがあります。たとえば、フィールドが文字列で、その名前が複数形 (例: 「exampleValues」) の場合、LLM は代わりに文字列の配列を返すことを要求することがあります。

LLM は、場合によっては平均的な人の能力を超える、驚くべき成果を生み出すことができます。しかし、少なくとも現時点では、生成された出力を確実にフォーマットするという、より日常的な作業に彼らが苦労していることは興味深いです。

以上がOpenAI JSON モードと JSON スキーマによるデータ抽出の簡素化の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Python vs. JavaScript:学習曲線と使いやすさ Python vs. JavaScript:学習曲線と使いやすさ Apr 16, 2025 am 12:12 AM

Pythonは、スムーズな学習曲線と簡潔な構文を備えた初心者により適しています。 JavaScriptは、急な学習曲線と柔軟な構文を備えたフロントエンド開発に適しています。 1。Python構文は直感的で、データサイエンスやバックエンド開発に適しています。 2。JavaScriptは柔軟で、フロントエンドおよびサーバー側のプログラミングで広く使用されています。

JavaScriptとWeb:コア機能とユースケース JavaScriptとWeb:コア機能とユースケース Apr 18, 2025 am 12:19 AM

Web開発におけるJavaScriptの主な用途には、クライアントの相互作用、フォーム検証、非同期通信が含まれます。 1)DOM操作による動的なコンテンツの更新とユーザーインタラクション。 2)ユーザーエクスペリエンスを改善するためにデータを提出する前に、クライアントの検証が実行されます。 3)サーバーとのリフレッシュレス通信は、AJAXテクノロジーを通じて達成されます。

JavaScript in Action:実際の例とプロジェクト JavaScript in Action:実際の例とプロジェクト Apr 19, 2025 am 12:13 AM

現実世界でのJavaScriptのアプリケーションには、フロントエンドとバックエンドの開発が含まれます。 1)DOM操作とイベント処理を含むTODOリストアプリケーションを構築して、フロントエンドアプリケーションを表示します。 2)node.jsを介してRestfulapiを構築し、バックエンドアプリケーションをデモンストレーションします。

JavaScriptエンジンの理解:実装の詳細 JavaScriptエンジンの理解:実装の詳細 Apr 17, 2025 am 12:05 AM

JavaScriptエンジンが内部的にどのように機能するかを理解することは、開発者にとってより効率的なコードの作成とパフォーマンスのボトルネックと最適化戦略の理解に役立つためです。 1)エンジンのワークフローには、3つの段階が含まれます。解析、コンパイル、実行。 2)実行プロセス中、エンジンはインラインキャッシュや非表示クラスなどの動的最適化を実行します。 3)ベストプラクティスには、グローバル変数の避け、ループの最適化、constとletsの使用、閉鎖の過度の使用の回避が含まれます。

Python vs. JavaScript:コミュニティ、ライブラリ、リソース Python vs. JavaScript:コミュニティ、ライブラリ、リソース Apr 15, 2025 am 12:16 AM

PythonとJavaScriptには、コミュニティ、ライブラリ、リソースの観点から、独自の利点と短所があります。 1)Pythonコミュニティはフレンドリーで初心者に適していますが、フロントエンドの開発リソースはJavaScriptほど豊富ではありません。 2)Pythonはデータサイエンスおよび機械学習ライブラリで強力ですが、JavaScriptはフロントエンド開発ライブラリとフレームワークで優れています。 3)どちらも豊富な学習リソースを持っていますが、Pythonは公式文書から始めるのに適していますが、JavaScriptはMDNWebDocsにより優れています。選択は、プロジェクトのニーズと個人的な関心に基づいている必要があります。

Python vs. JavaScript:開発環境とツール Python vs. JavaScript:開発環境とツール Apr 26, 2025 am 12:09 AM

開発環境におけるPythonとJavaScriptの両方の選択が重要です。 1)Pythonの開発環境には、Pycharm、Jupyternotebook、Anacondaが含まれます。これらは、データサイエンスと迅速なプロトタイピングに適しています。 2)JavaScriptの開発環境には、フロントエンドおよびバックエンド開発に適したnode.js、vscode、およびwebpackが含まれます。プロジェクトのニーズに応じて適切なツールを選択すると、開発効率とプロジェクトの成功率が向上する可能性があります。

JavaScript通訳者とコンパイラにおけるC/Cの役割 JavaScript通訳者とコンパイラにおけるC/Cの役割 Apr 20, 2025 am 12:01 AM

CとCは、主に通訳者とJITコンパイラを実装するために使用されるJavaScriptエンジンで重要な役割を果たします。 1)cは、JavaScriptソースコードを解析し、抽象的な構文ツリーを生成するために使用されます。 2)Cは、Bytecodeの生成と実行を担当します。 3)Cは、JITコンパイラを実装し、実行時にホットスポットコードを最適化およびコンパイルし、JavaScriptの実行効率を大幅に改善します。

Webサイトからアプリまで:JavaScriptの多様なアプリケーション Webサイトからアプリまで:JavaScriptの多様なアプリケーション Apr 22, 2025 am 12:02 AM

JavaScriptは、Webサイト、モバイルアプリケーション、デスクトップアプリケーション、サーバー側のプログラミングで広く使用されています。 1)Webサイト開発では、JavaScriptはHTMLおよびCSSと一緒にDOMを運用して、JQueryやReactなどのフレームワークをサポートします。 2)ReactNativeおよびIonicを通じて、JavaScriptはクロスプラットフォームモバイルアプリケーションを開発するために使用されます。 3)電子フレームワークにより、JavaScriptはデスクトップアプリケーションを構築できます。 4)node.jsを使用すると、JavaScriptがサーバー側で実行され、高い並行リクエストをサポートします。

See all articles