ホームページ テクノロジー周辺機器 AI Deepseekの後、Kimi K1.5はOpenai O1を照らします

Deepseekの後、Kimi K1.5はOpenai O1を照らします

Mar 07, 2025 am 11:34 AM

kimi K1.5:風景を再形成する生成AI推論モデル

補強学習(RL)および大規模な言語モデル(LLM)の最近のブレークスルーは、生成AI推論に革命をもたらす態勢の整ったモデルであるKimi K1.5の作成で頂点に達しました。 この記事では、Kimi K1.5の主要な特徴、革新、潜在的な影響を掘り下げて、付随する研究から洞察を引き出します。

目次:

    kimi k1.5?
  • とは何ですか
  • kimi K1.5トレーニング
  • kimi k1.5ベンチマーク
  • kimi K1.5の重要なイノベーション
  • kimi k1.5対deepseek r1
  • kimi k1.5へのアクセスAPI
  • 結論

kimi k1.5?とは何ですか

kimi K1.5は、LLMを使用してRLをスケーリングする際にかなりの跳躍を表しています。モンテカルロツリー検索などの複雑な方法に依存する従来のモデルとは異なり、自己回帰予測とRL技術を中心とした合理化されたアプローチを採用しています。 その設計により、マルチモーダルタスクを処理し、Math VistaやLive Code Benchなどのベンチマークで例外的なパフォーマンスを紹介できます。

kimi k1.5トレーニング

Kimi K1.5のトレーニングは、RLとマルチモーダル統合を通じて推論を強化するために設計されたマルチステージプロセスです。

    事前トレーニング:
  1. モデルは、テキスト(英語、中国語、コード、数学、一般的な知識)と視覚データを含む広大で高品質のマルチモーダルデータセットで事前に処理されており、関連性と多様性のために厳密にフィルタリングされています。

    監視された微調整(SFT):これには2つのフェーズが含まれます。さまざまなタスクで約100万の例を使用したバニラSFTと、複雑な推論経路をトレーニングするための長鎖(COT)SFT。
  2. 補強学習(RL):慎重にキュレーションされたプロンプトセットがRLトレーニングを駆動します。 このモデルは、応答の精度を評価する報酬モデルによって導かれた一連の推論ステップを介してソリューションを生成することを学びます。 オンラインミラーの降下はポリシーを最適化します

  3. 部分的なロールアウト:長いコンテキストを効率的に処理するために、Kimi K1.5は部分的なロールアウトを使用し、後の継続のために未完成の部分を保存します。

  4. 長さのペナルティとサンプリング:

    長さのペナルティは簡潔な回答を促進しますが、カリキュラムと優先順位付けされたサンプリング戦略では、最初に簡単なタスクにトレーニングを集中します。

  5. 評価と反復:ベンチマークに対する継続的な評価ガイド反復モデルの更新。
  6. >

    kimi k1.5システムの概要と部分的なロールアウト図:
kimi k1.5ベンチマーク

kimi K1.5は、多様なタスク全体で最先端のパフォーマンスを示しています:

  • Mathematics:
  • コーディング:
  • Codeforcesで94のスコアを達成し、Openai O1を一致させ、O1-MINIおよびQWQ 72Bプレビューを超えました。 視覚的推論:
  • Mathvista_testで74.9を獲得し、QVQ 72b(71.4)およびOpenai O1-Mini(71)を上回りました。
  • 一般的な知識:MMLU(em)で87.4を獲得し、Openai 4o(87.2)を上回る。
  • 推論戦略図:

kimi k1.5重要なイノベーション

After DeepSeek, Kimi k1.5 Outshines OpenAI o1

長いコンテキストのスケーリング:最大128,000トークンのプロセス、部分的なロールアウトによる効率を向上させます。

  • 思考の推論のチェーン:適応性のための長いCOT戦略と短いCOT戦略を組み合わせています。
  • 補強学習パイプライン:
  • キュレーションされたプロンプト、監視付き微調整、およびポリシーの最適化を備えた洗練されたRLパイプライン。 マルチモーダルデータ処理:
  • テキストと視覚データを効果的に処理します
  • kimi k1.5対deepseek r1
  • kimi K1.5およびDeepseek R1は、LLM開発へのさまざまなアプローチを表しています。 Kimi K1.5の合理化されたアーキテクチャ、統合RL、および長いコンテキスト処理は、Deepseek R1のより伝統的な方法と区別します。 違いは、コンテキストが多い複雑なタスクでのパフォーマンスに影響を与えます
  • api

経由でkimi k1.5にアクセスします APIアクセスには、Kimiの管理コンソールへの登録が必要です。 Pythonコードスニペットの例は、API相互作用を示しています:

結論

Kimi K1.5は、生成AI推論の重要な進歩を表し、最先端の結果を達成しながらRL設計を簡素化します。 コンテキストでのその革新スケーリングとマルチモーダルデータ処理は、さまざまな業界で幅広い意味を持つ主要なモデルとして位置付けています。

以上がDeepseekの後、Kimi K1.5はOpenai O1を照らしますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

10生成AIコーディング拡張機能とコードのコードを探る必要があります 10生成AIコーディング拡張機能とコードのコードを探る必要があります Apr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング!その日はどのようなコーディング関連のタスクを計画していますか?このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。 終わり? - &#8217を見てみましょう

GPT-4o vs Openai O1:新しいOpenaiモデルは誇大広告に値しますか? GPT-4o vs Openai O1:新しいOpenaiモデルは誇大広告に値しますか? Apr 13, 2025 am 10:18 AM

導入 Openaiは、待望の「Strawberry」アーキテクチャに基づいて新しいモデルをリリースしました。 O1として知られるこの革新的なモデルは、推論能力を強化し、問題を通じて考えられるようになりました

PIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics Vidhya PIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics Vidhya Apr 13, 2025 am 11:20 AM

導入 Mistralは、最初のマルチモーダルモデル、つまりPixtral-12B-2409をリリースしました。このモデルは、Mistralの120億個のパラメーターであるNemo 12bに基づいて構築されています。このモデルを際立たせるものは何ですか?これで、画像とTexの両方を採用できます

SQLに列を追加する方法は? - 分析Vidhya SQLに列を追加する方法は? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント:データベースに列を動的に追加する データ管理では、SQLの適応性が重要です。 その場でデータベース構造を調整する必要がありますか? Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

AGNOフレームワークを使用してマルチモーダルAIエージェントを構築する方法は? AGNOフレームワークを使用してマルチモーダルAIエージェントを構築する方法は? Apr 23, 2025 am 11:30 AM

エージェントAIに取り組んでいる間、開発者は速度、柔軟性、リソース効率の間のトレードオフをナビゲートすることがよくあります。私はエージェントAIフレームワークを探索していて、Agnoに出会いました(以前はPhi-でした。

ラマドラマを超えて:大規模な言語モデル用の4つの新しいベンチマーク ラマドラマを超えて:大規模な言語モデル用の4つの新しいベンチマーク Apr 14, 2025 am 11:09 AM

問題のあるベンチマーク:ラマのケーススタディ 2025年4月上旬、MetaはLlama 4スイートのモデルを発表し、GPT-4oやClaude 3.5 Sonnetなどの競合他社に対して好意的に位置付けた印象的なパフォーマンスメトリックを誇っています。ラウンクの中心

OpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先します OpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先します Apr 16, 2025 am 11:37 AM

このリリースには、GPT-4.1、GPT-4.1 MINI、およびGPT-4.1 NANOの3つの異なるモデルが含まれており、大規模な言語モデルのランドスケープ内のタスク固有の最適化への動きを示しています。これらのモデルは、ようなユーザー向けインターフェイスをすぐに置き換えません

ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法 ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法 Apr 14, 2025 am 11:27 AM

ビデオゲームは不安を緩和したり、ADHDの子供を焦点を合わせたり、サポートしたりできますか? ヘルスケアの課題が世界的に急増しているため、特に若者の間では、イノベーターはありそうもないツールであるビデオゲームに目を向けています。現在、世界最大のエンターテイメントインダスの1つです

See all articles