目次
拡張プロンプト
バイアス緩和:
システム要件:
ステップ4:システム全体のAPIキーを定義します
APIキーと認証の問題
トラブルシューティング:
パフォーマンスと応答時間
安定した拡散は、テキストプロンプトから画像を生成することに焦点を当てたAIモデルのコレクションで構成されています。ユーザーは目的の画像の説明を提供し、モデルはこれらのプロンプトに基づいて対応する視覚表現を生成します。

安定した拡散はどのように機能するのか?このイノベーションは、GPTなどの大規模な言語モデルで一般的に使用される変圧器アーキテクチャを拡散モデルで統合し、両方のアーキテクチャの強みを活用する可能性を提供します。" >安定した拡散は、テキストプロンプトから画像を生成することに焦点を当てたAIモデルのコレクションで構成されています。ユーザーは目的の画像の説明を提供し、モデルはこれらのプロンプトに基づいて対応する視覚表現を生成します。

安定した拡散はどのように機能するのか?このイノベーションは、GPTなどの大規模な言語モデルで一般的に使用される変圧器アーキテクチャを拡散モデルで統合し、両方のアーキテクチャの強みを活用する可能性を提供します。

ホームページ テクノロジー周辺機器 AI 安定した拡散3 APIの使用方法

安定した拡散3 APIの使用方法

Mar 07, 2025 am 09:05 AM

安定性AIは、2024年2月に安定した拡散3の早期プレビューを発表しました。AIモデルはまだプレビュー中ですが、2024年4月に、チームは、Firworks AIと提携した後、安定性AI開発者プラットフォームAPIで安定したAI開発者プラットフォームで安定した拡散3と安定した拡散3ターボを利用できると発表しました。

安定した拡散3は、単に一連のテキストからイメージまでの生成AIモデルであることに注意してください。 Stability AIのチームによると、モデルは、OpenaiのDall-E 3やMidjourney V6などの他のテキストからイメージまでのジェネレーターを

「タイポグラフィと迅速なアドヒアランス」に "なぜ安定した拡散3?

安定した拡散3は、特にテキスト生成の改善と迅速な能力の観点から、テキストからイメージの生成スペースでそれを非常に競争力のあるものにするいくつかの進歩と機能を紹介します。

これらの進歩を探りましょう:

拡張プロンプト

  • コンテキストの理解:安定した拡散3には、最先端の自然言語処理(NLP)手法が組み込まれているため、ユーザープロンプトをよりよく理解して解釈できます。これにより、ユーザー入力に対するより正確でコンテキストに関連する応答が可能になります。
  • プロンプトの連続性:以前のバージョンとは異なり、Stable Diffusion 3は次のプロンプトでより良い連続性を維持し、生成されたテキストがコヒーレントのままであり、会話全体でユーザーの入力と整列していることを確認します。 テキスト生成の改善

微調整された言語モデル:
    安定した拡散3は、大規模なデータセットで広範なトレーニングを受けた微調整された言語モデルを利用して、テキスト生成機能が強化されます。これらのモデルは、文法、構文、およびセマンティクスをよりよく理解し、より首尾一貫した自然な反応につながります。
  • 応答の変動の減少:トレーニング方法とモデルアーキテクチャの改善により、安定した拡散3は応答の変動性を低下させ、さまざまなプロンプトとコンテキストでより一貫した高品質の出力を生成します。
  • 高度なプロンプト拡張
マルチターンダイアログサポート:

安定した拡散3は、マルチターンダイアログをより効果的に処理でき、ユーザーとAIモデル間の複数の交換にわたって一貫性とコンテキストを維持できます。

    迅速な拡張手法:
  • モデルは、高度な迅速な拡張技術を採用して、より有益で文脈的に関連する応答を生成し、対話を豊かにし、ユーザーにクエリに対する包括的な回答を提供します。 微調整された制御メカニズム
  • パラメーターチューニング:
  • 安定した拡散3には、ユーザーが応答長、創造性レベル、トピックの関連性などのパラメーターを調整できるように、よりカスタマイズされたインタラクションエクスペリエンスを可能にする微調整された制御メカニズムを備えています。

バイアス緩和:

モデルには、テキスト生成にバイアスを緩和し、ユーザープロンプトへの応答における公平性と包括性を促進するための手段を組み込んでいます。
  • 安定した拡散3 APIを開始します このセクションは、安定性APIから始めるための手順を実行します。
  • ステップ1:アカウントを作成します。 安定性AIのAPIを使用する前に、アカウントを作成する必要があります。ユーザー名とパスワードを使用してサインアップできますが、新しいユーザーはGoogleアカウントを使用してサインアップするための25の無料クレジットを取得します。
  • ステップ2:APIキーを請求します。
アカウントを作成したら、API GETが必要になります。これは、APIキーページにあります。ドキュメントでは、安定性AIは、「このサイトでドキュメントされたすべてのAPIが同じ認証メカニズムを使用していると述べています。APIキーを承認ヘッダーで渡します。」

ステップ3:クレジットのトッピング。 APIをリクエストするクレジットが必要です。クレジットは、APIを呼び出すときに消費される通貨単位です。消費される量は、モデルとモダリティによって異なります。すべてのクレジットを使い果たした後、請求ダッシュボードから100クレジットごとに1ドルでさらに購入できます。 このチュートリアルでは、Google ColabとComfyuiを使用して、安定した拡散3 APIを使用して画像を生成する方法を示します。次のセクションでは、各ツールの使用を開始する手順をカバーします。 Google Colabを使用して、安定した拡散3 APIを使用して

Google Colabを開始するには、Googleアカウントを作成する必要があります。リンクをクリックして指示に従ってください。

すでにGoogleアカウントをお持ちの場合は、新しいノートブックを開き、以下の手順に従ってください。

注:この例で使用されているコードは、安定性AIによってSD3_APIチュートリアルから取得されます。

ステップ1:要件をインストールします

ステップ2:安定性APIに接続します ステップ3。関数を定義します

ステップ4。画像を生成します
from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
ドキュメントによると、安定した画像サービスには、現在生産されている1つの提供のみが含まれています。

sd3:

は6.5クレジットを使用します
import getpass
# To get your API key, visit https://platform.stability.ai/account/keys
STABILITY_KEY = getpass.getpass('Enter your API Key')
ログイン後にコピー
ログイン後にコピー

sd3ターボ:4クレジット

を使用します
def send_generation_request(
    host,
    params,
):
    headers = {
        "Accept": "image/*",
        "Authorization": f"Bearer {STABILITY_KEY}"
    }

    # Encode parameters
    files = {}
    image = params.pop("image", None)
    mask = params.pop("mask", None)
    if image is not None and image != '':
        files["image"] = open(image, 'rb')
    if mask is not None and mask != '':
        files["mask"] = open(mask, 'rb')
    if len(files)==0:
        files["none"] = ''

    # Send request
    print(f"Sending REST request to {host}...")
    response = requests.post(
        host,
        headers=headers,
        files=files,
        data=params
    )
    if not response.ok:
        raise Exception(f"HTTP {response.status_code}: {response.text}")

    return response
ログイン後にコピー

テストしましょう。 この例では、低地の熱帯地域にトゥーカンの鳥の画像を作成します。

これが作成されたものです:

  • 安定した拡散を使用して著者によって作成された画像3
  • さあ、SD3ターボを使用して果物で作られた車の画像を作成しましょう。 このコードを実行すると、次の画像が作成されました

# SD3

prompt = "This dreamlike digital art captures a vibrant, Toucan bird in a lowland tropic area" #@param {type:"string"}
negative_prompt = "" #@param {type:"string"}
aspect_ratio = "1:1" #@param ["21:9", "16:9", "3:2", "5:4", "1:1", "4:5", "2:3", "9:16", "9:21"]
seed = 0 #@param {type:"integer"}
output_format = "jpeg" #@param ["jpeg", "png"]

host = f"https://api.stability.ai/v2beta/stable-image/generate/sd3"

params = {
    "prompt" : prompt,
    "negative_prompt" : negative_prompt,
    "aspect_ratio" : aspect_ratio,
    "seed" : seed,
    "output_format" : output_format,
    "model" : "sd3",
    "mode" : "text-to-image"
}

response = send_generation_request(
    host,
    params
)

# Decode response
output_image = response.content
finish_reason = response.headers.get("finish-reason")
seed = response.headers.get("seed")

# Check for NSFW classification
if finish_reason == 'CONTENT_FILTERED':
    raise Warning("Generation failed NSFW classifier")

# Save and display result
generated = f"generated_{seed}.{output_format}"
with open(generated, "wb") as f:
    f.write(output_image)
print(f"Saved image {generated}")

output.no_vertical_scroll()
print("Result image:")
IPython.display.display(Image.open(generated))
ログイン後にコピー
安定した拡散を使用して著者によって作成された画像3ターボ

comfyui 安定した拡散3 APIの使用方法でAPIを使用します

comfyuiは、安定した拡散のための堅牢で柔軟なグラフィカルユーザーインターフェイス(GUI)です。グラフベースのインターフェイスを備えており、フローチャートスタイルのデザインを使用して、ユーザーが洗練された安定した拡散ワークフローを作成および実行できるようにします。

システム要件:

  • グラフィックスプロセシングユニット(GPU):RTX 3060 TI以上など、最低8GBのVRAMを備えた適切なNVIDIA GPU。
  • >>
  • 中央処理ユニット(CPU):Intel Xeon E5、I5、Ryzen 5などを含む現代プロセッサ。
  • ランダムアクセスメモリ(RAM):16GB以上。
  • オペレーティングシステム:Windows 10/11またはlinux。 モデルと生成された画像用のコンピューター上の適切なストレージスペース。
  • ステップ1:comfyui
  • をインストールします
WindowsにComfyuiをインストールするための最も簡単な方法には、リリースページにあるスタンドアロンインストーラーを使用することが含まれます。このインストーラーには、PytorchやHugging Face Transformersなどの重要な依存関係が含まれており、個別のインストールの必要性を排除します。

包括的なパッケージを提供し、複雑な構成を必要とせずにWindowsでcomfyuiの迅速なセットアップを可能にします。

単にダウンロード、抽出、モデルの追加、起動!

ステップ1.1:

このgithubリポジトリからcomfyuiのスタンドアロンバージョンをダウンロード - リンクをクリックすると、ダウンロードが開始されます。

ステップ1.2:

最新のcomfyui-windows.zipファイルをダウンロードしたら、7-zipやwinrarなどのユーティリティを使用して抽出します。 ステップ1.3:

Comfyuiの使用を開始するには、チェックポイントモデルが必要です。安定した拡散または抱きしめの顔からチェックポイントモデルをダウンロードできます。モデルをフォルダーに入れます:

ステップ1.4:

ここで、run_nvidia_gpu.bat(推奨)またはrun_cpu.batを実行するだけです。これにより、ブラウザでComfyuiを自動的に開始する必要があります コマンドラインは、ブラウザで開くことができるURL http://127.0.1:8188/を実行して生成します。 ステップ2:comfyuiマネージャー

をインストールします
from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
ファイルExplorerアプリケーション内で、インストールしたディレクトリを見つけます。 Windowsを使用していることを考えると、「comfyui_windows_portable」という名前にする必要があります。ここから、comfyuiに移動し、custom_nodesに移動します。この場所から、アドレスバーにCMDを入力し、Enterを押します。

これはコマンドプロンプト端末を開く必要があります。ここでは、次のコマンドを挿入する必要があります。 完了したら、Comfyuiを再起動します。新しい「

マネージャー

」ボタンがフローティングパネルに表示されます。

ステップ3:安定性AI APIノードをインストールします

[管理]ボタンを選択し、「

カスタムノードをインストールします。

」に移動して、「

stability api。

を検索します。
import getpass
# To get your API key, visit https://platform.stability.ai/account/keys
STABILITY_KEY = getpass.getpass('Enter your API Key')
ログイン後にコピー
ログイン後にコピー
「comfyuiの安定性APIノード」ノードを見つけ、右側にあるインストールボタンをクリックしてインストールプロセスを開始します。これに続いて、「」ボタンが表示されます。 「restart」をクリックして、comfyuiを再起動します。

ステップ4:システム全体のAPIキーを定義します

このステップはオプションですが、お勧めします。つまり、安定性AIカスタムノード内の各ノードの安定性AI APIキーを設定できます。これにより、すべてのワークフローでAPIキーを繰り返し入力する必要がなくなり、ワークフローJSONファイルを共有するときにAPIキーを不注意に共有するリスクが低下します。

そうするために、カスタムノードディレクトリに移動します:

from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
sai_platform_key.txtという名前の新しいファイルを作成します。 APIキーをファイルに貼り付け、ドキュメントを保存してから、comfyuiを再起動します。

ステップ5:ワークフローをロードして実行します

安定した拡散3テキストから画像へのワークフローをインストールし、comfyuiにドロップします。

あなたは今行くのがいいです!

トラブルシューティングとヒント

他のツールと同様に、途中でいくつかの問題に遭遇する可能性が常にあります。 APIまたはセットアッププロセスの問題に直面しているユーザーのための最も一般的な課題とトラブルシューティング手順は次のとおりです。

APIキーと認証の問題

チャレンジ:

ユーザーは、APIキーまたは誤った認証資格情報のためにAPIにアクセスするときに認証エラーに直面する可能性があります。

トラブルシューティング:APIキーをダブルチェックし、コピーして正しく貼り付けていることを確認します。キーに余分なスペースや文字がないことを確認してください。 Stable Diffusion 3サーバーによってAPIキーが適切に認証されていることを確認してください。 クレジット管理の問題

チャレンジ:ユーザーは、クレジットの不十分なクレジットや請求エラーなど、クレジット管理に関連する問題に遭遇する可能性があります。

トラブルシューティング:

安定した拡散3ダッシュボードのクレジット残高を確認して、十分なクレジットを確保してください。請求情報を確認し、サポートチームとの請求エラーまたは不一致に対応します。

接続性とネットワークの問題

チャレンジ:

ユーザーは、APIにアクセスできないように接続性の問題またはネットワーク中断を経験する場合があります。 トラブルシューティング:

安定したインターネット接続があり、ネットワークの中断がないことを確認してください。問題を分離するには、別のネットワークまたはデバイスからAPIにアクセスしてみてください。接続性の問題を引き続き経験している場合は、インターネットサービスプロバイダーにお問い合わせください。

互換性と依存関係エラー

チャレンジ:

ユーザーは、必要なツールとライブラリをインストールまたは使用する際に、互換性の問題や依存関係エラーに遭遇する場合があります。

トラブルシューティング:安定した拡散3 APIの互換性要件を確認し、互換性のあるバージョンのツールとライブラリを使用していることを確認してください。エラーを引き起こしている依存関係を更新または再インストールします。トラブルシューティングガイダンスについては、ドキュメントとコミュニティフォーラムを参照してください。

パフォーマンスと応答時間

チャレンジ:ユーザーは、特にピーク使用時間中にAPIと対話するときに、応答時間やパフォーマンスの問題が遅い場合があります。

トラブルシューティング: APIのパフォーマンスと追跡回答時間を監視して、パターンまたはトレンドを特定します。パフォーマンスと優先度の高いアクセスを改善するために、より高い層のサブスクリプション計画にアップグレードすることを検討してください。一貫して遅い応答時間がある場合は、サポートチームに連絡してください。

ドキュメントとサポート

チャレンジ:ユーザーは、APIドキュメントを理解するのが難しい場合や、特定の問題のトラブルシューティングの支援が必要な場合があります。

トラブルシューティング:

APIの使用、トラブルシューティング、ベストプラクティスに関するガイダンスについては、安定した拡散3ドキュメントを参照してください。未解決の問題や質問がある場合は、サポートチームまたはコミュニティフォーラムに連絡してください。 結論

安定した拡散3は、一連のテキストから画像への生成AIモデルです。この記事では、Google ColabとComfyuiでAPIを使用し始める実用的な手順について説明しました。これで、独自の画像を作成するスキルがあります。忘れないように、できるだけ早く学んだことを必ず適用してください。

お読みいただきありがとうございます!

さらなる学習

安定した拡散Web UI:初心者向けの包括的なユーザーガイド

ドリームブースとロラを使用した安定した拡散XLを微調整します

安定した拡散を実行する方法
  • PythonのDiffusersを使用したAIを使用して、フォトリアリックな画像を生成
  • faqs
  • 安定した拡散3 APIを効果的に使用するためのベストプラクティスは何ですか?

安定した拡散を使用するためのベストプラクティス3 APIには、明確かつ特定のプロンプトの提供、異なるパラメーターの実験、希望の結果を達成するためのクレジット使用量の監視、枯渇を避けるための監視、最新のドキュメントと機能の最新情報を維持することが含まれます。 安定した拡散3とは何ですか?

安定した拡散は、テキストプロンプトから画像を生成することに焦点を当てたAIモデルのコレクションで構成されています。ユーザーは目的の画像の説明を提供し、モデルはこれらのプロンプトに基づいて対応する視覚表現を生成します。

安定した拡散はどのように機能するのか?このイノベーションは、GPTなどの大規模な言語モデルで一般的に使用される変圧器アーキテクチャを拡散モデルで統合し、両方のアーキテクチャの強みを活用する可能性を提供します。

以上が安定した拡散3 APIの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Meta Llama 3.2を始めましょう - 分析Vidhya Meta Llama 3.2を始めましょう - 分析Vidhya Apr 11, 2025 pm 12:04 PM

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

10生成AIコーディング拡張機能とコードのコードを探る必要があります 10生成AIコーディング拡張機能とコードのコードを探る必要があります Apr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング!その日はどのようなコーディング関連のタスクを計画していますか?このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。 終わり? - &#8217を見てみましょう

AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5など AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5など Apr 11, 2025 pm 12:01 PM

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

従業員へのAI戦略の販売:Shopify CEOのマニフェスト 従業員へのAI戦略の販売:Shopify CEOのマニフェスト Apr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

ビジョン言語モデル(VLM)の包括的なガイド ビジョン言語モデル(VLM)の包括的なガイド Apr 12, 2025 am 11:58 AM

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

GPT-4o vs Openai O1:新しいOpenaiモデルは誇大広告に値しますか? GPT-4o vs Openai O1:新しいOpenaiモデルは誇大広告に値しますか? Apr 13, 2025 am 10:18 AM

導入 Openaiは、待望の「Strawberry」アーキテクチャに基づいて新しいモデルをリリースしました。 O1として知られるこの革新的なモデルは、推論能力を強化し、問題を通じて考えられるようになりました

SQLに列を追加する方法は? - 分析Vidhya SQLに列を追加する方法は? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント:データベースに列を動的に追加する データ管理では、SQLの適応性が重要です。 その場でデータベース構造を調整する必要がありますか? Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

最高の迅速なエンジニアリング技術の最新の年次編集 最高の迅速なエンジニアリング技術の最新の年次編集 Apr 10, 2025 am 11:22 AM

私のコラムに新しいかもしれない人のために、具体化されたAI、AI推論、AIのハイテクブレークスルー、AIの迅速なエンジニアリング、AIのトレーニング、AIのフィールディングなどのトピックなど、全面的なAIの最新の進歩を広く探求します。

See all articles