首页 科技周边 人工智能 在DeepSeek之后,Kimi K1.5击败Openai O1

在DeepSeek之后,Kimi K1.5击败Openai O1

Mar 07, 2025 am 11:34 AM

kimi k1.5:一种生成的AI推理模型,重塑了景观

最近的增强学习(RL)和大语言模型(LLM)的突破已经达到了创建Kimi K1.5的最终突破,这是一种准备彻底改变生成AI推理的模型。 本文深入研究了Kimi K1.5的主要特征,创新和潜在影响,从随附的研究中获得见解。 目录的

表:

什么是kimi k1.5?
  • kimi k1.5培训
  • kimi k1.5基准
  • kimi k1.5的关键创新
  • kimi k1.5 vs. deepseek r1
  • >通过API
  • 访问Kimi K1.5
  • 结论
什么是kimi k1.5?

kimi k1.5代表了用LLM缩放RL的实质性飞跃。与依靠复杂方法(例如蒙特卡洛树搜索)等传统模型不同,它采用了以自动回归预测和RL技术为中心的简化方法。 它的设计使其能够处理多模式任务,在Math Vista和Live Code -Bench等基准中展示出色的性能。>

Kimi K1.5的培训是一个多阶段的过程,旨在通过RL和多模式集成来增强推理:

预处理:该模型是在庞大的高质量多模式数据集中鉴定的,包括文本(英语,中文,代码,数学,数学,通用知识)和视觉数据,并严格过滤有关相关性和多样性。

  1. 有监督的微调(SFT):

    这涉及两个阶段:Vanilla SFT在各种任务中使用约100万个示例,以及长期链(COT)SFT来培训复杂的推理。

  2. 增强学习(RL):经过精心策划的提示集驱动RL培训。 该模型学会通过一系列推理步骤生成解决方案,并在评估响应准确性的奖励模型的指导下。 在线镜下降优化了策略。
  3. 局部推广:
  4. >有效处理长上下文,kimi k1.5使用部分推出,保存未完成的部分以供以后继续。
  5. 长度惩罚和抽样:

    长度惩罚鼓励简洁的答案,而课程和优先采样策略将重点放在更轻松的任务上。
  6. >>评估与迭代:

    针对基准测试的连续评估指导迭代模型更新。
  7. kimi k1.5系统概述和部分推出图:

kimi k1.5展示了各种任务的最先进的表现:

  • 数学:在AIME 2024上获得了77.5的完美分数,超过Openai O1(74.4)和Openai O1 Mini(63.6)。 在Math-500上得分96.2。
  • 编码:>在CodeForces上达到94分,匹配OpenAi O1并超过O1-Mini和QWQ 72B Preview。
  • 视觉推理:
  • 在MathVista_test上得分74.9,超过QVQ 72B(71.4)和Openai O1-Mini(71)。
  • 经常知识:
  • 在mmlu(em)上得分为87.4,表现优于OpenAi 4o(87.2)。
  • 推理策略图:

kimi k1.5关键创新After DeepSeek, Kimi k1.5 Outshines OpenAI o1

>

>

长上下文缩放:
    处理多达128,000个令牌,通过部分推出来提高效率。
  • 思维推理链:
  • 结合了适应性的长长和简短的COT策略。
  • >加固学习管道:一条精致的RL管道,带有精心策划的提示,监督微调和策略优化。
  • >
  • 多模式数据处理:有效地处理文本和视觉数据。
  • kimi k1.5 vs. deepseek r1
  • > Kimi K1.5和DeepSeek R1代表LLM开发的不同方法。 Kimi K1.5的简化架构,集成的RL和长篇小说处理将其与DeepSeek R1更传统的方法区分开。 差异会影响其在复杂的,上下文重重的任务上的表现。

>通过API

访问Kimi K1.5 API访问需要注册Kimi的管理控制台。 一个示例Python代码段演示了API交互:>

结论 Kimi K1.5代表生成AI推理的显着进步,在实现最新结果的同时简化了RL设计。 它在上下文缩放和多模式数据处理位置上的创新是一个领先的模型,具有各个行业的广泛含义。

以上是在DeepSeek之后,Kimi K1.5击败Openai O1的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1669
14
CakePHP 教程
1428
52
Laravel 教程
1329
25
PHP教程
1273
29
C# 教程
1256
24
如何使用AGNO框架构建多模式AI代理? 如何使用AGNO框架构建多模式AI代理? Apr 23, 2025 am 11:30 AM

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

超越骆驼戏:大型语言模型的4个新基准 超越骆驼戏:大型语言模型的4个新基准 Apr 14, 2025 am 11:09 AM

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 Apr 16, 2025 am 11:37 AM

该版本包括三种不同的型号,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

多动症游戏,健康工具和AI聊天机器人如何改变全球健康 多动症游戏,健康工具和AI聊天机器人如何改变全球健康 Apr 14, 2025 am 11:27 AM

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一

Andrew Ng的新简短课程 Andrew Ng的新简短课程 Apr 15, 2025 am 11:32 AM

解锁嵌入模型的力量:深入研究安德鲁·NG的新课程 想象一个未来,机器可以完全准确地理解和回答您的问题。 这不是科幻小说;多亏了AI的进步,它已成为R

火箭发射模拟和分析使用Rocketpy -Analytics Vidhya 火箭发射模拟和分析使用Rocketpy -Analytics Vidhya Apr 19, 2025 am 11:12 AM

模拟火箭发射的火箭发射:综合指南 本文指导您使用强大的Python库Rocketpy模拟高功率火箭发射。 我们将介绍从定义火箭组件到分析模拟的所有内容

Google揭示了下一个2025年云上最全面的代理策略 Google揭示了下一个2025年云上最全面的代理策略 Apr 15, 2025 am 11:14 AM

双子座是Google AI策略的基础 双子座是Google AI代理策略的基石,它利用其先进的多模式功能来处理和生成跨文本,图像,音频,视频和代码的响应。由DeepM开发

See all articles