目录
小脑WSE
词汇表
用WSE提高游戏
漏斗数据
肯尼迪文件
有关WSE的更多信息
首页 科技周边 人工智能 用餐盘推动现代LLM的极限?

用餐盘推动现代LLM的极限?

May 16, 2025 am 05:34 AM

用餐盘推动现代LLM的极限?

通常,我们知道AI很大,而且越来越大。快速越来越快。

但是,具体来说,并不是每个人都熟悉行业中一些最新的硬件和软件方法,以及它们如何促进更好的结果。人们正在努力揭示LLM技术中更多固有的力量。事情正在快速剪辑。

小脑WSE

其中之一是小脑WSE或晶圆刻度发动机 - 这是一个庞大的处理器,可以为以前难以想象的AI功能提供动力。

首先,您不再将其称为微处理器。它是餐盘的大小 - 8.5 x 8.5英寸。它具有数十万个核心,以及令人惊叹的上下文能力。

但是,让我从一些基本术语开始,您可以在以前是麻省理工学院学生的摩根·罗克特(Morgan Rockett)的演讲中听到,在评估LLM输出时谈论基础知识。

词汇表

LLM是神经网络。他们使用令牌化过程,其中令牌是一小部分数据,这些数据被放入机器编程问题的整体上下文中。

然后是上下文 - 程序可以回顾以前的令牌,并将它们绑在更大的图像中。

还有推理 - 计算机实时思考问题或提出回应的方式。

Rockett越过的另一个术语是费率限制,如果您不拥有该模型,则必须忍受该模型运营商施加的阈值。

用WSE提高游戏

罗克特(Rockett)在解释这些系统背后的硬件时透露的是,他是一个脑伴侣,这是一个大量芯片的开创性。

查看常见的硬件设置,他跨越了四个系统 - NVIDIA GPU,Google TPU,Grok LPU(语言处理单元)和小脑WSE。

他在谈到WSU产品时说:“市场上实际上没有什么比这更喜欢的。 “就速度基准而言,脑脑是一家新兴的芯片公司。它们每秒有2500个令牌,这几乎是即时的响应。这是文本的整个页面,并且会产生太快,而且阅读太快了。”

他指出,Grok目前排名第二,每秒约1600个令牌。

漏斗数据

本演示文稿中展示的方法基本上是一个大文件的给定块的选择,以及该文件内容的摘要。

Rockett指出,真正的大文件太大了,无法管理LLM,因此介绍了三种方法:Log2,Square Root和Double Square Root - 所有这些方法都涉及对块进行抽样以获得凝聚力的结果,而不会使用“漏斗”设计,而无需超载模型。

在演示中,他在4 GB的数据集上显示了4至5秒的推断模型,他说,同等的纸张或400万个令牌的纸张堆积为10英尺。

肯尼迪文件

他选择使用的数据是我们可用信息的总档案,围绕60年代暗杀的变革事件。

罗克特(Rockett)以他的方法来展示了该模型,并与几乎无限的RAM合作,在这里,令牌化是主要时间负担。

他说,借助输入技术,您可以达到速率限制,并且可以想象可以解决令牌化。

查看视频以获取有关档案的摘要,介绍了那个时代中央情报局的许多秘密活动,并在猪湾活动中绑定了更多活动。

有关WSE的更多信息

Rockett可以回到脑部处理器的实际用途,其中提到了法律,政府和贸易界,那里的快速信息至关重要。

我想要更多具体的例子,所以我问了chatgpt。它返回了该硬件的许多有趣的用例,包括阿拉伯联合酋长国的AI和Cloud Company,以及Mayo诊所,各种制药公司以及Lawrence Livermore国家实验室(包括Lawrence Livermore的核项目,包括我做的故事)。

然后我问了一个不同的问题:

“你可以用脑WSE吃晚餐吗?”

“身体上?” Chatgpt回答。 “是的,但是您将同时承担财务和技术暴行……脑晶圆尺度发动机(WSE)是有史以来最大的芯片 - 就像盘子一样,它就像在罗塞塔石上吃意大利面一样 - 可能是技术上的可能,但非常荒谬,但非常荒谬。”

这给了我这三个主要原因,不要尝试如此愚蠢的事情(我逐字依附):

  • 这是非常脆弱的 - 即使是面包屑也可以简化一些东西。
  • 它运行非常热,需要积极的冷却,因此您可能会无意地(不良)烹饪食物。
  • 表面不是食物安全。任何酱汁都会使您的保修无效,并可能毒害您。

“简而言之:您可以从中吃晚饭,” Chatgpt说,“一次。然后您没有碎片,没有晚餐,也没有工作。将其用作盘子就像在Rosetta Stone上吃掉意大利面,从技术上讲是可能的,但非常荒谬。”

Touché,chatgpt。触摸。

这是其中最迷人的硬件之一,以及它适合上下文推理方程式。当我们增强这些系统时,我们会看到几乎实时需要很长时间发生的事情。那是一个真正的大开眼界。

以上是用餐盘推动现代LLM的极限?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1677
14
CakePHP 教程
1431
52
Laravel 教程
1334
25
PHP教程
1280
29
C# 教程
1257
24
如何使用AGNO框架构建多模式AI代理? 如何使用AGNO框架构建多模式AI代理? Apr 23, 2025 am 11:30 AM

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 Apr 16, 2025 am 11:37 AM

该版本包括三种不同的型号,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

火箭发射模拟和分析使用Rocketpy -Analytics Vidhya 火箭发射模拟和分析使用Rocketpy -Analytics Vidhya Apr 19, 2025 am 11:12 AM

模拟火箭发射的火箭发射:综合指南 本文指导您使用强大的Python库Rocketpy模拟高功率火箭发射。 我们将介绍从定义火箭组件到分析模拟的所有内容

DeepCoder-14b:O3-Mini和O1的开源竞赛 DeepCoder-14b:O3-Mini和O1的开源竞赛 Apr 26, 2025 am 09:07 AM

在AI社区的重大发展中,Agentica和AI共同发布了一个名为DeepCoder-14B的开源AI编码模型。与OpenAI等封闭源竞争对手提供代码生成功能

提示:chatgpt生成假护照 提示:chatgpt生成假护照 Apr 16, 2025 am 11:35 AM

Chip Giant Nvidia周一表示,它将开始制造AI超级计算机(可以处理大量数据并运行复杂算法的机器),完全是在美国首次在美国境内。这一消息是在特朗普总统SI之后发布的

一个提示可以绕过每个主要LLM的保障措施 一个提示可以绕过每个主要LLM的保障措施 Apr 25, 2025 am 11:16 AM

隐藏者的开创性研究暴露了领先的大语言模型(LLM)的关键脆弱性。 他们的发现揭示了一种普遍的旁路技术,称为“政策木偶”,能够规避几乎所有主要LLMS

盖伊·佩里(Guy Peri)通过数据转换帮助麦考密克的未来 盖伊·佩里(Guy Peri)通过数据转换帮助麦考密克的未来 Apr 19, 2025 am 11:35 AM

盖伊·佩里(Guy Peri)是麦考密克(McCormick)的首席信息和数字官。尽管他的角色仅七个月,但Peri正在迅速促进公司数字能力的全面转变。他的职业生涯专注于数据和分析信息

See all articles