GradioとLangchainでOLMO-2をローカルに実行します
olmo 2:アクセス可能なAI
のための強力なオープンソースLLM自然言語処理の分野(NLP)は、特に大規模な言語モデル(LLM)で急速に進歩しています。独自のモデルは歴史的に支配的でしたが、オープンソースの代替品は急速にギャップを埋めています。 Olmo 2は、完全な透明性とアクセシビリティを維持しながら、閉鎖モデルに匹敵するパフォーマンスを提供し、パフォーマンスを提供します。この記事は、トレーニング、パフォーマンス、および実用的なアプリケーションを調査し、Olmo 2を掘り下げています。
キー学習ポイント:
- オープンソースLLMSとOLMO 2のAI研究への貢献の重要性を把握してください。
- Olmo 2のアーキテクチャ、トレーニング方法、およびベンチマークの結果を理解してください オープンウェイト、部分的に開いた、完全に開いたモデルアーキテクチャを区別します。
- GradioとLangchainを使用して地元でOlmo 2を実行することを学ぶ。 Pythonコードの例を使用してOlmo 2を使用してチャットボットアプリケーションを作成します。
- (この記事はデータサイエンスブログの一部です。)
オープンソースLLMSの必要性
olmo 2の紹介 Olmo 2のトレーニングの分解
-
Olmo 2の機能を探る
- Olmo 2 とのチャットボットの構築
- 結論
- よくある質問
- オープンソースLLMSの需要
- 独自のLLMの最初の支配は、アクセシビリティ、透明性、バイアスに関する懸念を引き起こしました。 オープンソースLLMSは、コラボレーションを促進し、精査、修正、改善を可能にすることにより、これらの問題に対処します。 このオープンアプローチは、分野を進め、LLMテクノロジーへの公平なアクセスを確保するために不可欠です。
olmo 2
を理解していますOlmo 2は、その前身であるOlmo-0424を大幅に改善します。 7Bおよび13Bパラメーターモデルは、英語のアカデミックベンチマークでLlama 3.1のようなオープンウェイトモデルに匹敵する、またはそれを超えるパフォーマンスを示しています。
重要な改善には、次のものが含まれます
- 実質的なパフォーマンスの向上:Olmo-2(7bおよび13b)は、アーキテクチャ、データ、またはトレーニング方法の進歩を示している以前のOLMOモデルよりも顕著な改善を示しています。 MAP-NEO-7Bとの競争力のある
- Olmo-2、特に13Bバージョンは、完全にオープンモデルの中で強力なベースラインであるMAP-NEO-7Bに匹敵するスコアを達成します。
olmo 2のトレーニング方法
Olmo 2のアーキテクチャは、元のOlmoに基づいて構築されており、安定性とパフォーマンスを改善するための改良を取り入れています。 トレーニングプロセスは、2つの段階で構成されています
財団トレーニング:
- 洗練と専門化:
- モデルの知識とスキルを改善するために、高品質のWebデータとドメイン固有のデータ(アカデミックコンテンツ、Q&Aフォーラム、指導データ、数学ワークブック)のキュレーションされたミックスであるDolmino-Mix-1124データセットを採用しています。 「モデルスープ」は、最終的なチェックポイントをさらに強化します
- LLMS olmo-2は完全にオープンなモデルであるため、モデルのオープン性の異なるレベルの区別を明確にしましょう。
モデルの重みのみがリリースされます。
部分的にオープンモデル:トレーニングプロセスの完全な画像ではありませんが、重みを超えていくつかの追加情報をリリースします。
完全にオープンモデル:ウェイト、トレーニングデータ、コード、レシピ、チェックポイントなど、完全な透明性を提供します。 これにより、完全な再現性が可能になります
- 主要な違いを要約するテーブルを以下に示します。
-
olmo 2を局所的に探索して実行しています
Olmo 2はすぐにアクセスできます。 モデルとデータをダウンロードするための手順と、トレーニングコードと評価メトリックが利用可能です。 Olmo 2をローカルに実行するには、Ollamaを使用します。 インストール後、コマンドラインで
ollama run olmo2:7b
を実行するだけです。 必要なライブラリ(LangchainおよびGradio)は、PIPでインストールできます。olmo 2 でチャットボットを構築します
次のPythonコードは、Olmo 2、Gradio、およびLangchainを使用してチャットボットの構築を示しています。import gradio as gr from langchain_core.prompts import ChatPromptTemplate from langchain_ollama.llms import OllamaLLM def generate_response(history, question): template = """Question: {question} Answer: Let's think step by step.""" prompt = ChatPromptTemplate.from_template(template) model = OllamaLLM(model="olmo2") chain = prompt | model answer = chain.invoke({"question": question}) history.append({"role": "user", "content": question}) history.append({"role": "assistant", "content": answer}) return history with gr.Blocks() as iface: chatbot = gr.Chatbot(type='messages') with gr.Row(): with gr.Column(): txt = gr.Textbox(show_label=False, placeholder="Type your question here...") txt.submit(generate_response, [chatbot, txt], chatbot) iface.launch()
ログイン後にコピー結論
Olmo 2は、オープンソースLLMエコシステムへの重要な貢献を表しています。 その強力なパフォーマンスは、完全な透明性と組み合わさって、研究者と開発者にとって貴重なツールになります。 すべてのタスクで普遍的に優れているわけではありませんが、そのオープンな性質はコラボレーションを促進し、アクセス可能で透明なAIの分野での進歩を加速します。
キーテイクアウト:OLMO-2の13Bパラメーターモデルは、さまざまなベンチマークで優れたパフォーマンスを示し、他のオープンモデルよりも優れています。 完全なモデルのオープンネスは、より効果的なモデルの開発を促進します。
チャットボットの例では、LangchainとGradioとの統合の容易さを示しています。- よくある質問(FAQ)
- (元の記事のFAQはここに含まれています。) )
- (注:画像URLは変更されていません。)
以上がGradioとLangchainでOLMO-2をローカルに実行しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します

2024年は、コンテンツ生成にLLMSを使用することから、内部の仕組みを理解することへの移行を目撃しました。 この調査は、AIエージェントの発見につながりました。これは、最小限の人間の介入でタスクと決定を処理する自律システムを処理しました。 buildin

この記事では、Google Cloud、Amazon Polly、Microsoft Azure、IBM Watson、DecriptなどのトップAI音声ジェネレーターをレビューし、機能、音声品質、さまざまなニーズへの適合性に焦点を当てています。

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです
