ホームページ テクノロジー周辺機器 AI GradioとLangchainでOLMO-2をローカルに実行します

GradioとLangchainでOLMO-2をローカルに実行します

Mar 06, 2025 am 10:55 AM

olmo 2:アクセス可能なAI

のための強力なオープンソースLLM

自然言語処理の分野(NLP)は、特に大規模な言語モデル(LLM)で急速に進歩しています。独自のモデルは歴史的に支配的でしたが、オープンソースの代替品は急速にギャップを埋めています。 Olmo 2は、完全な透明性とアクセシビリティを維持しながら、閉鎖モデルに匹敵するパフォーマンスを提供し、パフォーマンスを提供します。この記事は、トレーニング、パフォーマンス、および実用的なアプリケーションを調査し、Olmo 2を掘り下げています。

キー学習ポイント:

    オープンソースLLMSとOLMO 2のAI研究への貢献の重要性を把握してください。
  • Olmo 2のアーキテクチャ、トレーニング方法、およびベンチマークの結果を理解してください
  • オープンウェイト、部分的に開いた、完全に開いたモデルアーキテクチャを区別します。
  • GradioとLangchainを使用して地元でOlmo 2を実行することを学ぶ。
  • Pythonコードの例を使用してOlmo 2を使用してチャットボットアプリケーションを作成します。
  • (この記事はデータサイエンスブログの一部です。)
目次:

オープンソースLLMSの必要性

olmo 2の紹介 Olmo 2のトレーニングの分解

    Olmo 2の機能を探る
  • Olmo 2
  • とのチャットボットの構築
  • 結論
  • よくある質問
  • オープンソースLLMSの需要
  • 独自のLLMの最初の支配は、アクセシビリティ、透明性、バイアスに関する懸念を引き起こしました。 オープンソースLLMSは、コラボレーションを促進し、精査、修正、改善を可能にすることにより、これらの問題に対処します。 このオープンアプローチは、分野を進め、LLMテクノロジーへの公平なアクセスを確保するために不可欠です。
AI(AI2)のOLMOプロジェクトのためのアレン研究所は、このコミットメントを実証しています。 Olmo 2は、単にモデルの重みをリリースするだけではありません。トレーニングデータ、コード、トレーニングレシピ、中級チェックポイント、命令チューニングモデルを提供します。この包括的なリリースは、再現性とさらなるイノベーションを促進します

olmo 2

を理解しています

Olmo 2は、その前身であるOlmo-0424を大幅に改善します。 7Bおよび13Bパラメーターモデルは、英語のアカデミックベンチマークでLlama 3.1のようなオープンウェイトモデルに匹敵する、またはそれを超えるパフォーマンスを示しています。

重要な改善には、次のものが含まれます

  • 実質的なパフォーマンスの向上:Olmo-2(7bおよび13b)は、アーキテクチャ、データ、またはトレーニング方法の進歩を示している以前のOLMOモデルよりも顕著な改善を示しています。 MAP-NEO-7Bとの競争力のある
  • Olmo-2、特に13Bバージョンは、完全にオープンモデルの中で強力なベースラインであるMAP-NEO-7Bに匹敵するスコアを達成します。

Running OLMo-2 Locally with Gradio and LangChainolmo 2のトレーニング方法

Olmo 2のアーキテクチャは、元のOlmoに基づいて構築されており、安定性とパフォーマンスを改善するための改良を取り入れています。 トレーニングプロセスは、2つの段階で構成されています

財団トレーニング: olmo-mix-1124データセット(多様なオープンソースからの約3.9兆トークン)を利用して、言語理解のための堅牢な基盤を確立します。

    洗練と専門化:
  1. モデルの知識とスキルを改善するために、高品質のWebデータとドメイン固有のデータ(アカデミックコンテンツ、Q&Aフォーラム、指導データ、数学ワークブック)のキュレーションされたミックスであるDolmino-Mix-1124データセットを採用しています。 「モデルスープ」は、最終的なチェックポイントをさらに強化します
  2. LLMS olmo-2は完全にオープンなモデルであるため、モデルのオープン性の異なるレベルの区別を明確にしましょう。
オープンウェイトモデル:

モデルの重みのみがリリースされます。Running OLMo-2 Locally with Gradio and LangChain

部分的にオープンモデル:トレーニングプロセスの完全な画像ではありませんが、重みを超えていくつかの追加情報をリリースします。

完全にオープンモデル:

ウェイト、トレーニングデータ、コード、レシピ、チェックポイントなど、完全な透明性を提供します。 これにより、完全な再現性が可能になります

    主要な違いを要約するテーブルを以下に示します。
  • olmo 2を局所的に探索して実行しています

    Olmo 2はすぐにアクセスできます。 モデルとデータをダウンロードするための手順と、トレーニングコードと評価メトリックが利用可能です。 Olmo 2をローカルに実行するには、Ollamaを使用します。 インストール後、コマンドラインでollama run olmo2:7bを実行するだけです。 必要なライブラリ(LangchainおよびGradio)は、PIPでインストールできます。

    olmo 2 でチャットボットを構築します

    次のPythonコードは、Olmo 2、Gradio、およびLangchainを使用してチャットボットの構築を示しています。

    このコードは、基本的なチャットボットインターフェイスを提供します。 この基盤の上に、より洗練されたアプリケーションを構築できます。 例の出力とプロンプトは、元の記事に示されています。
    import gradio as gr
    from langchain_core.prompts import ChatPromptTemplate
    from langchain_ollama.llms import OllamaLLM
    
    def generate_response(history, question):
        template = """Question: {question}
    
        Answer: Let's think step by step."""
        prompt = ChatPromptTemplate.from_template(template)
        model = OllamaLLM(model="olmo2")
        chain = prompt | model
        answer = chain.invoke({"question": question})
        history.append({"role": "user", "content": question})
        history.append({"role": "assistant", "content": answer})
        return history
    
    with gr.Blocks() as iface:
        chatbot = gr.Chatbot(type='messages')
        with gr.Row():
            with gr.Column():
                txt = gr.Textbox(show_label=False, placeholder="Type your question here...")
        txt.submit(generate_response, [chatbot, txt], chatbot)
    
    iface.launch()
    ログイン後にコピー

    Running OLMo-2 Locally with Gradio and LangChainRunning OLMo-2 Locally with Gradio and LangChain Running OLMo-2 Locally with Gradio and LangChainRunning OLMo-2 Locally with Gradio and LangChain結論

    Olmo 2は、オープンソースLLMエコシステムへの重要な貢献を表しています。 その強力なパフォーマンスは、完全な透明性と組み合わさって、研究者と開発者にとって貴重なツールになります。 すべてのタスクで普遍的に優れているわけではありませんが、そのオープンな性質はコラボレーションを促進し、アクセス可能で透明なAIの分野での進歩を加速します。

    キーテイクアウト:

    OLMO-2の13Bパラメーターモデルは、さまざまなベンチマークで優れたパフォーマンスを示し、他のオープンモデルよりも優れています。 完全なモデルのオープンネスは、より効果的なモデルの開発を促進します。

    チャットボットの例では、LangchainとGradioとの統合の容易さを示しています。
    • よくある質問(FAQ)
    • (元の記事のFAQはここに含まれています。)
    • (注:画像URLは変更されていません。)

以上がGradioとLangchainでOLMO-2をローカルに実行しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

クリエイティブプロジェクトのための最高のAIアートジェネレーター(無料&有料) クリエイティブプロジェクトのための最高のAIアートジェネレーター(無料&有料) Apr 02, 2025 pm 06:10 PM

この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

Meta Llama 3.2を始めましょう - 分析Vidhya Meta Llama 3.2を始めましょう - 分析Vidhya Apr 11, 2025 pm 12:04 PM

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

ベストAIチャットボットが比較されました(chatgpt、gemini、claude& more) ベストAIチャットボットが比較されました(chatgpt、gemini、claude& more) Apr 02, 2025 pm 06:09 PM

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

ChatGpt 4 oは利用できますか? ChatGpt 4 oは利用できますか? Mar 28, 2025 pm 05:29 PM

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

トップAIライティングアシスタントは、コンテンツの作成を後押しします トップAIライティングアシスタントは、コンテンツの作成を後押しします Apr 02, 2025 pm 06:11 PM

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します

AIエージェントを構築するためのトップ7エージェントRAGシステム AIエージェントを構築するためのトップ7エージェントRAGシステム Mar 31, 2025 pm 04:25 PM

2024年は、コンテンツ生成にLLMSを使用することから、内部の仕組みを理解することへの移行を目撃しました。 この調査は、AIエージェントの発見につながりました。これは、最小限の人間の介入でタスクと決定を処理する自律システムを処理しました。 buildin

最高のAI音声ジェネレーターの選択:レビューされたトップオプション 最高のAI音声ジェネレーターの選択:レビューされたトップオプション Apr 02, 2025 pm 06:12 PM

この記事では、Google Cloud、Amazon Polly、Microsoft Azure、IBM Watson、DecriptなどのトップAI音声ジェネレーターをレビューし、機能、音声品質、さまざまなニーズへの適合性に焦点を当てています。

従業員へのAI戦略の販売:Shopify CEOのマニフェスト 従業員へのAI戦略の販売:Shopify CEOのマニフェスト Apr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

See all articles