Jamba 1.5:具有混合Mamba-Transformer架构
JAMBA 1.5:一种强大的混合语言模型,用于长篇文化处理
Jamba 1.5是AI21实验室的尖端大语言模型,具有令人印象深刻的处理能力,可处理广泛的文本上下文。有两个版本可供选择:Jamba 1.5大型(940亿参数)和Jamba 1.5 Mini(120亿个参数) - 它利用了将MAMBA结构化状态空间模型(SSM)与传统变压器结构相结合的独特混合体系结构。这种创新的方法可以处理空前的256K有效上下文窗口,这是开源模型的重大飞跃。
关键功能:
- 庞大的上下文窗口:最多256K令牌的过程,非常适合冗长的文档和复杂的任务。
- 混合体系结构:结合了变压器和MAMBA模型的优势,以获得最佳效率和性能。
- 有效的量化:利用专家量定量化来减少记忆足迹和更快的处理。
- 多语言支持:跨九种语言有效地发挥作用:英语,西班牙语,法语,葡萄牙语,意大利语,荷兰语,德语,阿拉伯语和希伯来语。
- 多功能应用程序:适用于广泛的NLP任务,包括问答,摘要,文本生成和分类。
- 可访问的部署:可通过AI21的Studio API,拥抱的脸和云合作伙伴获得。
建筑细节:
方面 | 细节 |
---|---|
基础体系结构 | 混合变压器 - 曼巴(Mamba |
模型变体 | jamba-1.5大(94B活动参数,总计398b)和jamba-1.5-mini(12B活动参数,总计52B) |
层组成 | 9个街区,每个街区有8层; 1:7变压器与曼巴层的比率 |
专家的混合物(MOE) | 16位专家,选择每个令牌的前2个 |
隐藏的尺寸 | 8192 |
注意力头 | 64个查询头,8个钥匙值头 |
上下文长度 | 多达256K令牌 |
量化技术 | MOE和MLP层的ExpertsInt8 |
激活功能 | 集成的变压器和MAMBA激活 |
效率 | 在8x80GB GPU上针对高吞吐量和低潜伏期进行了优化 |
访问和利用Jamba 1.5:
Jamba 1.5很容易通过AI21的工作室API和拥抱的脸访问。该模型可以针对特定域进行微调,以进一步提高性能。下面提供了使用AI21 API的Python示例:
Python示例:
从AI21导入AI21Client 来自AI21.models.Chat Import Chatmessage 消息= [ChatMessage(content =“ 2-3行中的令牌是什么? 客户端= ai21client(api_key ='')#替换'用API键 响应= client.chat.completions.create( 消息=消息, 型号=“ jamba-1.5-mini”, 流= true ) 零件回应: 打印(块。
结论:
Jamba 1.5代表了大型语言模型的重大进步,提供了强大的功率和效率融合。它处理异常长上下文的能力,再加上其多功能应用程序和可访问的部署选项,使其成为多种NLP任务的宝贵工具。
常见问题(常见问题解答):(类似于原始问题,但出于简洁而改写)
- Q1:什么是Jamba 1.5?答:具有94B(大)或12B(mini)参数的混合变压器 - 曼巴(Mamba)大型语言模型,优化了用于遵循和长篇文章处理的说明。
- Q2:Jamba 1.5如何有效地处理长上下文?答:通过其混合体系结构和ExpertsInt8量化,启用了256K令牌上下文窗口,并减少了内存使用情况。
- Q3:什么是expertsint8量化?答:使用MOE和MLP层中INT8精度的压缩技术,以提高效率。
- 问题4:Jamba 1.5公开可用吗?答:是的,在Jamba Open Model许可下,可以通过拥抱脸访问。
以上是Jamba 1.5:具有混合Mamba-Transformer架构的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年
