論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます-AI-php.cn

NLP はバイオニクスにも適用されます

ホームページ

テクノロジー周辺機器

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

王林

Apr 13, 2023 pm 03:55 PM

ai モデル

2020 年 5 月のリリース以来、約 2 年半の間、GPT-3 は、その魔法のようなテキスト生成機能の恩恵により、人間が非常に上手に文章を書くのを支援することができました。

しかし、最終的には、GPT-3 はテキスト生成モデルであり、人間の執筆プロセスとはまったく異なるものであると言えます。

たとえば、論文や作文を書きたい場合、まず頭の中でフレームワークを構築し、関連する情報を確認して下書きを作成し、その後、テキストを常に修正して磨き上げてくれる家庭教師を見つける必要があります。この期間中にアイデアを修正することもあり、最終的にはそれが良い記事になる可能性があります。

生成モデルによって取得されるテキストは、文法要件を満たすことしかできませんが、内容の配置にロジックがなく、自己修正機能もないため、AI が自律的に記述できるようになるのはまだ遠いです。

最近、メタ AI リサーチとカーネギーメロン大学の研究者は、人間の執筆プロセスを完全にシミュレートする新しいテキスト生成モデル PEER (Plan、Edit Edit、Explain、Repeat) を提案しました。テキストを編集して繰り返します。

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

論文アドレス: https://arxiv.org/abs/2208.11663

PEER は、従来の言語モデルが解決できる問題を解決します生成のみ最終的には生成されたテキストを制御できなくなりますが、自然言語コマンドを入力することで、PEER は生成されたテキストを変更できます。

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

最も重要なことは、研究者が PEER の複数のインスタンスをトレーニングしたことです。PEER は、書き込みプロセスで複数のリンクを埋めることができるため、自己トレーニングを使用できるようになります) テクノロジートレーニングデータの質、量、多様性が向上します。

トレーニングデータを生成できるということは、PEER の可能性がエッセイの執筆をはるかに超えていることを意味します。PEER は履歴を編集せずに他の分野でも使用でき、指示に従い、有益なコメントを書き、そしてその行動能力について説明します。

NLP はバイオニクスにも適用されます

自然言語による事前トレーニングの後、大規模ニューラルネットワークのテキスト生成効果はすでに非常に強力ですが、これらのモデルの生成方法は基本的に結果として得られるテキストを一度に出力することは、人間が反復的に書くプロセスとは大きく異なります。

ワンタイム生成には、テキスト内の文章を遡って修正・改良することができない、また、なぜその文章が生成されたのかを説明できないなどのデメリットも多くあります。また、生成されたテキストの正確性をテストすることも難しく、結果にエラーが発生することが多く、幻覚的なコンテンツ、つまり事実と一致しないテキストが生成されます。これらの欠陥は、一貫性のある事実に基づいたテキストを必要とする人間と協力して書くモデルの能力も制限します。

PEER モデルはテキストの「編集履歴」に基づいてトレーニングされ、モデルが人間の執筆プロセスをシミュレートできるようになります。

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

1. PEER モデルの実行中、ユーザーまたはモデルは計画 (Plan) を指定し、実行したいアクション (アクション) を自然言語で記述する必要があります。情報の追加や文法エラーの修正など;

2. 次に、テキストを編集してこのアクションを実行します;

3. モデルは自然言語で説明し、関連リソースを示すことができます ( Explain) テキストの最後に参照を追加するなど、この編集の結果;

4. 生成されたテキストをさらに更新する必要がなくなるまで、このプロセスを繰り返します。

この反復的なアプローチにより、モデルは、一貫性があり、一貫性があり、事実に基づいたテキストを記述するという複雑なタスクを複数のより簡単なサブタスクに分割できるだけでなく、人間が生成プロセスにより深く関与できるようになります。モデルを正しい方向に導き、ユーザーに計画やコメントを提供したり、自分でモデルの編集を開始したりする時間ができます。

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

メソッドの説明から、関数を実現する上で最も難しいことは、Transformer を使用してモデルを構築することではなく、トレーニングデータを見つけて必要なデータを見つけることであることがわかります。大規模な言語をトレーニングする方法を見つけることほとんどの Web サイトでは編集履歴が提供されていないため、このプロセスに必要なデータをモデルに必要な規模で学習することは明らかに困難であり、クローラーを通じて取得した Web ページをトレーニングデータとして使用することはできません。

クローラーを介して同じ Web ページを異なる時点で編集履歴として取得することさえ、編集を計画または説明する関連テキストがないため、現実的ではありません。

PEER は、これまでの反復編集手法と似ており、一次編集および関連コメントのデータソースとして Wikipedia を使用します。これは、Wikipedia がさまざまなトピックに関するコメントを含む編集の完全な履歴を提供し、記事の規模が大きいためです。多くの場合、引用文が含まれており、関連文書を見つけるのに役立ちます。

しかし、トレーニングデータの唯一のソースとして Wikipedia のみに依存することには、さまざまな欠点もあります:

1. Wikipedia のみを使用してトレーニングされたモデルは、予想されるテキストコンテンツと予測計画に悪影響を及ぼします。編集は Wikipedia と同様にする必要があります;

2. Wikipedia のコメントはノイズが多いため、多くの場合、コメントは計画や説明に適切な入力ではありません;

3. Wikipedia の多くの文章この背景情報の欠如は検索システムを使用することで補うことができますが、そのようなシステムでさえ、多くの編集者にとってサポートとなる背景情報を見つけることができない場合があります。

研究者らは、Wikipedia がコメント編集履歴の唯一のソースであることによって引き起こされるすべての問題を解決する簡単な方法を提案しました。それは、複数の PEER インスタンスをトレーニングし、これらのインスタンスを使用して編集プロセスのさまざまな側面を設定する方法を学習するというものです。これらのモデルを使用して、トレーニングコーパスの欠落部分の代替として合成データを生成できます。

最終的にトレーニングされた 4 つのエンコーダー/デコーダーモデル:

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

1. PEER-Edit の入力はテキスト x と一連のドキュメント、およびモデル出力です。は計画と編集されたテキストです。p は計画されたテキストです。

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

2. PEER-Undo の入力は編集されたテキストとドキュメントのセットであり、モデルの出力は編集を元に戻すかどうかです。

3. PEER-Explain は編集の説明を生成するために使用され、入力はソーステキスト、編集されたテキスト、および一連の関連ドキュメントです。

4. PEER-Document はソーステキスト、編集されたテキスト、および計画を入力し、モデル出力はこの編集で最も役立つ背景情報です。

PEER のすべてのバリアントモデルは、欠落部分を補うトレーニングデータの生成と、既存データの「低品質」部分の置き換えの両方で、合成データを生成するために使用されます。

テキストに編集履歴がない場合でも、任意のテキストデータをトレーニングできるようにするために、PEER-Undo を使用して合成「逆方向」編集を生成します。つまり、PEER-Undo が繰り返し適用されます。テキストが空になるまでソーステキストを編集し、その後 PEER-Edit を呼び出して逆方向にトレーニングします。

計画を生成するときは、PEER-Explain を使用して、コーパス内の多くの低品質のコメントを修正するか、コメントのないテキストを処理します。 PEER-Explainの出力から複数の結果を「潜在的なプラン」としてランダムにサンプリングし、実際に編集される可能性を計算し、最も確率の高いものを新しいプランとして選択します。

特定の編集操作に関連するドキュメントが見つからない場合は、PEER-Document を使用して、編集操作を実行するための情報を含む一連の合成ドキュメントを生成します。最も重要なことは、PEER-Edit はこれをトレーニング中にのみ実行し、推論段階では合成ドキュメントを提供しないことです。

生成された計画、編集、ドキュメントの品質と多様性を向上させるために、研究者らは、トレーニング中のモデルによって生成された出力シーケンスに特定の制御マーカーをプリセットしてから推論する制御メカニズムも実装しました。これらの制御タグは、モデルの生成をガイドするプロセスで使用されます。タグには次のものが含まれます:

1. type は、PEER-Explain によって生成されるテキストタイプを制御するために使用されます。オプションの値は命令 (出力) to 不定詞で始まる必要があります。.. ..) およびその他;

2, length, PEER-Explain の出力長を制御します。オプションの値には、s (2 ワード未満)、m (2- 3 単語)、l (4 ～ 5 単語)、および

4. 単語、ソーステキストと PEER-Undo の編集済みテキストの間の異なる単語の数を制御するために使用されます。オプションの値はすべて整数です。

##5. を含む、PEER-Undo Document によるテキスト出力に特定の部分文字列が含まれていることを確認するために使用されます

PEER は、PEER 編集に制御文字を導入しません。ユーザーがモデルを使用して解決できる編集タスクの種類を決定し、モデルの汎用性を高めます。

実験的比較フェーズでは、PEER はトレーニング前の初期化に LM-Adapted T5 の 3B パラメーターバージョンを使用します。

一連の計画に従い、提供されたドキュメントを利用し、さまざまなドメイン、特に編集履歴のないドメインで編集を行う PEER の能力を評価するために、新しいデータセットが導入されます。さまざまなテキストタイプとドメインに合わせて編集します。

データは、Wikipedia の百科事典ページ、Wikinews のニュース記事、料理、園芸、法律、映画、政治、旅行、職場に関する StackExchange サブフォーラムの 3 つの英語 Web ソースから収集されました。問題の収集、これらすべてのサイト編集者の意図を詳述するコメントを含む編集履歴を提供し、それを計画としてモデルにフィードします。

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

Wikinews と StackExchange サブセットのトレーニングでは、実際の編集ではなくプレーンテキストデータのみが提供されるため、編集履歴のない領域での編集能力がテストされます。

実験結果は、PEER のパフォーマンスがすべてのベースラインをある程度上回っていることを示しており、計画とドキュメントはモデルで使用できる補足情報を提供します

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

# Natural Edits のすべてのサブセットで PEER を評価すると、計画がドメイン間で大きく役立つことが明らかになり、Wikipedia 編集における計画を理解する能力は他のドメインに直接応用できることが示唆されます。重要なのは、PEER のドメイン適応バリアントは、Natural Edits のすべてのサブセットで通常の PEER よりも大幅に優れており、特にガーデニング、政治、映画のサブセットで大幅な改善が見られます (それぞれ 84%、71%)。 Diff) は、異なるドメインで PEER を適用する場合に合成編集を生成することの有効性も示しています。

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

以上が論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Java チュートリアル

1665

CakePHP チュートリアル

1424

Laravel チュートリアル

1322

PHP チュートリアル

1270

C# チュートリアル

1249

Related knowledge

CでChronoライブラリを使用する方法は？ Apr 28, 2025 pm 10:18 PM

CでChronoライブラリを使用すると、時間と時間の間隔をより正確に制御できます。このライブラリの魅力を探りましょう。 CのChronoライブラリは、時間と時間の間隔に対処するための最新の方法を提供する標準ライブラリの一部です。 Time.HとCtimeに苦しんでいるプログラマーにとって、Chronoは間違いなく恩恵です。コードの読みやすさと保守性を向上させるだけでなく、より高い精度と柔軟性も提供します。基本から始めましょう。 Chronoライブラリには、主に次の重要なコンポーネントが含まれています。STD:: Chrono :: System_Clock：現在の時間を取得するために使用されるシステムクロックを表します。 STD :: Chron

CでDMA操作を理解する方法は？ Apr 28, 2025 pm 10:09 PM

CのDMAとは、直接メモリアクセステクノロジーであるDirectMemoryAccessを指し、ハードウェアデバイスがCPU介入なしでメモリに直接データを送信できるようにします。 1）DMA操作は、ハードウェアデバイスとドライバーに大きく依存しており、実装方法はシステムごとに異なります。 2）メモリへの直接アクセスは、セキュリティリスクをもたらす可能性があり、コードの正確性とセキュリティを確保する必要があります。 3）DMAはパフォーマンスを改善できますが、不適切な使用はシステムのパフォーマンスの低下につながる可能性があります。実践と学習を通じて、DMAを使用するスキルを習得し、高速データ送信やリアルタイム信号処理などのシナリオでその効果を最大化できます。

CでハイDPIディスプレイを処理する方法は？ Apr 28, 2025 pm 09:57 PM

CでのハイDPIディスプレイの取り扱いは、次の手順で達成できます。1）DPIを理解してスケーリングし、オペレーティングシステムAPIを使用してDPI情報を取得し、グラフィックスの出力を調整します。 2）クロスプラットフォームの互換性を処理し、SDLやQTなどのクロスプラットフォームグラフィックライブラリを使用します。 3）パフォーマンスの最適化を実行し、キャッシュ、ハードウェアアクセラレーション、および詳細レベルの動的調整によりパフォーマンスを改善します。 4）ぼやけたテキストやインターフェイス要素などの一般的な問題を解決し、DPIスケーリングを正しく適用することで解決します。

Cのリアルタイムオペレーティングシステムプログラミングとは何ですか？ Apr 28, 2025 pm 10:15 PM

Cは、リアルタイムオペレーティングシステム（RTOS）プログラミングでうまく機能し、効率的な実行効率と正確な時間管理を提供します。 1）Cハードウェアリソースの直接的な動作と効率的なメモリ管理を通じて、RTOのニーズを満たします。 2）オブジェクト指向の機能を使用して、Cは柔軟なタスクスケジューリングシステムを設計できます。 3）Cは効率的な割り込み処理をサポートしますが、リアルタイムを確保するには、動的メモリの割り当てと例外処理を避ける必要があります。 4）テンプレートプログラミングとインライン関数は、パフォーマンスの最適化に役立ちます。 5）実際のアプリケーションでは、Cを使用して効率的なロギングシステムを実装できます。

Cのスレッドパフォーマンスを測定する方法は？ Apr 28, 2025 pm 10:21 PM

Cのスレッドパフォーマンスの測定は、標準ライブラリのタイミングツール、パフォーマンス分析ツール、およびカスタムタイマーを使用できます。 1.ライブラリを使用して、実行時間を測定します。 2。パフォーマンス分析にはGPROFを使用します。手順には、コンピレーション中に-pgオプションを追加し、プログラムを実行してGmon.outファイルを生成し、パフォーマンスレポートの生成が含まれます。 3. ValgrindのCallGrindモジュールを使用して、より詳細な分析を実行します。手順には、プログラムを実行してCallGrind.outファイルを生成し、Kcachegrindを使用して結果を表示することが含まれます。 4.カスタムタイマーは、特定のコードセグメントの実行時間を柔軟に測定できます。これらの方法は、スレッドのパフォーマンスを完全に理解し、コードを最適化するのに役立ちます。

定量的交換ランキング2025デジタル通貨のトップ10の推奨事項定量取引アプリ Apr 30, 2025 pm 07:24 PM

交換に組み込まれた量子化ツールには、1。Binance：Binance先物の定量的モジュール、低い取り扱い手数料を提供し、AIアシストトランザクションをサポートします。 2。OKX（OUYI）：マルチアカウント管理とインテリジェントな注文ルーティングをサポートし、制度レベルのリスク制御を提供します。独立した定量的戦略プラットフォームには、3。3Commas：ドラッグアンドドロップ戦略ジェネレーター、マルチプラットフォームヘッジアービトラージに適しています。 4。Quadency：カスタマイズされたリスクしきい値をサポートするプロフェッショナルレベルのアルゴリズム戦略ライブラリ。 5。Pionex：組み込み16のプリセット戦略、低い取引手数料。垂直ドメインツールには、6。cryptohopper：クラウドベースの定量的プラットフォーム、150の技術指標をサポートします。 7。BITSGAP：

フィールドをMySQLテーブルに追加および削除する手順 Apr 29, 2025 pm 04:15 PM

MySQLでは、AlterTabletable_nameaddcolumnnew_columnvarchar（255）afterexisting_columnを使用してフィールドを追加し、andtabletable_namedopcolumncolumn_to_dropを使用してフィールドを削除します。フィールドを追加するときは、クエリのパフォーマンスとデータ構造を最適化する場所を指定する必要があります。フィールドを削除する前に、操作が不可逆的であることを確認する必要があります。オンラインDDL、バックアップデータ、テスト環境、および低負荷期間を使用したテーブル構造の変更は、パフォーマンスの最適化とベストプラクティスです。

Cで文字列ストリームを使用する方法は？ Apr 28, 2025 pm 09:12 PM

Cで文字列ストリームを使用するための主な手順と予防策は次のとおりです。1。出力文字列ストリームを作成し、整数を文字列に変換するなどのデータを変換します。 2。ベクトルを文字列に変換するなど、複雑なデータ構造のシリアル化に適用します。 3.パフォーマンスの問題に注意を払い、大量のデータを処理するときに文字列ストリームを頻繁に使用することを避けます。 std :: stringの追加方法を使用することを検討できます。 4.メモリ管理に注意を払い、ストリングストリームオブジェクトの頻繁な作成と破壊を避けます。 std :: stringstreamを再利用または使用できます。

See all articles

論文を 100 回改訂しても慌てる必要はありません。 Meta が新しい記述言語モデル PEER をリリース: 参照が追加されます

NLP はバイオニクスにも適用されます

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック