人類のコンピューターの使用：AIアシスタントがコンピューターを引き継ぎます-AI-php.cn

ホームページ

テクノロジー周辺機器

人類のコンピューターの使用：AIアシスタントがコンピューターを引き継ぎます

Jennifer Aniston

Mar 15, 2025 am 09:31 AM

AnthropicのClaude AIは、コンピューターを制御する能力を獲得します。革新的なアップデートにより、Claudeは画面を「表示」することでデスクトップ、クリック、タイプ、スクロールをナビゲートできます。このベータ機能は、AIのソフトウェアとの相互作用を変換し、生産性の向上を約束しています。人類がこの技術の可能性を探求するため、安全性は依然として最も重要です。

人類のコンピューターの使用：AIアシスタントがコンピューターを引き継ぎます

なぜ人類がコンピューターの使用に焦点を当てているのですか？
AI画面の相互作用の指導
イノベーションと安全性のバランス
Anthropicのコンピューターの使用方法
Anthropicのコンピューター使用の機能
制限と課題
Claudeでのコンピューターの使用の探索：方法と例
メッセージAPIを使用します
参照実装：Dockerコンテナ
Dockerでコンピューターの使用をセットアップします
コンピューターの使用をテストします
人類のQuickStartsアプリ
迅速な展開のためにレプリット
ユースケース
結論
よくある質問

なぜコンピューターの使用に焦点を合わせるのですか？

ほとんどの毎日のタスクはコンピューターで発生します。 AIが人間のようなソフトウェアを使用できるようにすると、計り知れない可能性が解除されます。これにより、カスタムツールの必要性がなくなり、プログラムのシームレスなナビゲーションが可能になります。これは、論理と画像認識のAIの進歩に基づいており、以前は不可能な偉業への扉を開きます。

AI画面の相互作用の指導

Claudeのコンピューター使用スキルは、イノベーションと技術的な専門知識の融合に起因していました。マルチモーダル機能を活用して、研究者はクロードを訓練してコンピューター画面を解釈し、視覚データをアクションに変換しました。重要な課題は、カーソル制御のための正確なピクセル測定でした。シンプルなソフトウェアから始めて、クロードはこれらのスキルを一般化し、驚くべき問題解決能力と自己修正を示しました。トレーニングは複雑でしたが、結果は印象的であり、Osworldのようなベンチマークで最先端のパフォーマンスを達成していますが、まだ人間の正確さとはほど遠いものです。

人類のコンピューターの使用：AIアシスタントがコンピューターを引き継ぎます

イノベーションと安全性のバランス

すべてのAIの進歩は安全性の懸念を示しています。この機能は本質的に認知力を高めることはありませんが、実際のアプリケーションに対する障壁を低下させます。安全評価は、ClaudeをAI安全レベル2に配置し、追加の保護措置がすぐに必要ではないことを示しています。ただし、将来の進歩はリスクを増幅し、「迅速な注入」攻撃に対処するなど、積極的な脆弱性緩和を必要とする可能性があります。人類の信頼と安全チームは、潜在的な誤用を積極的に監視し、虐待の検出とタスクガイダンスを実施します。開発者はベストプラクティスに従うことをお勧めし、データプライバシーが優先されます。 Claudeは、デフォルトでユーザーデータやスクリーンショットのトレーニングを受けていません。

人類のコンピューターの使用：どのように機能しますか

1。ツールとプロンプト： APIリクエストに人類定義のツールを含めて、明確なプロンプトを提供します（たとえば、「猫の写真をデスクトップに保存」）。

2。ツールの選択： Claudeはプロンプトを評価し、適切なツールを選択し、ツール使用要求（フォーマットされたAPI呼び出し）を作成します。 stop_reasonフィールドは、ツールの使用法を示します。

3。ツールの実行と結果：ツールはコンテナまたはVMで実行され、結果をtool_resultブロックを介してClaudeに返します。

4.反復問題解決： Claudeは、結果を繰り返し分析し、さらなるツールのニーズを決定し、GPTの考え方の推論と同様に、タスクが完了するまで繰り返します。

人類のコンピューターの使用：AIアシスタントがコンピューターを引き継ぎます

機能

クロードは扱うことができます：

ファイル操作： Excelファイルへのアクセスと編集、スクリーンショットの保存。
フォームオートメーション：フォームの充填、データ入力の自動。
Webスクレイピング：自然言語を使用したWebサイト情報の抽出。

制限と課題

意図しないアクション： Claudeは無関係なタスクを実行し、遅延を引き起こす可能性があります。
無限ループ：解決なしに繰り返されるアクション、リソースを消費します。
リスクシナリオ：機密操作中のエラーは深刻な結果をもたらす可能性があります。

Claudeでのコンピューターの使用の探索

ドキュメントの詳細は、メッセージAPIを介してコンピューターを使用できるようにします。

メッセージAPIを使用します

メッセージAPIにより、プログラマティック命令の送信が可能になり、Claudeが計算リソースを安全に利用できるようになります。許可、入力、環境を指定します。

コードの例（イラスト）：

人類のインポート

＃...（APIキーセットアップ）...

Response = client.beta.messages.create（
    Model = "Claude-3-5-Sonnet-20241022"、
    ＃...（ツールの定義とメッセージ）...
））

印刷（応答）

ログイン後にコピー

Dockerコンテナの実装

Dockerコンテナはセットアップを簡素化し、一貫した環境を提供します。これは人類の推奨アプローチです。

Dockerでコンピューターの使用をセットアップします