DeepSeek释放3FS和Shmperpond框架
DeepSeek于2025年2月28日显着增强了开源功能,揭示了Fire-Flyer文件系统(3FS)和Smplearpond数据处理框架。 这些工具旨在彻底改变数据访问和处理,特别是用于AI培训和推断。
? #opensourceweek的第5天:3FS,所有DeepSeek数据访问的强大引擎> fire-flyer文件系统(3FS) - 一个并行文件系统,最大化现代SSD和RDMA网络的带宽。
6.6 tib/s骨料读取吞吐量(180节点群集) ⚡3.66TIB/min…
- DeepSeek(@Deepseek_ai)2025年2月28日
目录的
>
> fire-flyer文件系统(3FS)
- 快速启动:3FS和Smermpond
- >故障排除和监视
- 摘要
- > fire-flyer文件系统(3FS)
- 3FS是为现代SSD和RDMA网络构建的高性能,分布式文件系统。 它提供了强大的共享存储解决方案,简化了分布式应用程序开发。 理解RDMA
远程直接内存访问(RDMA)绕过操作系统限制,从而在两台计算机的内存之间启用直接数据传输。这会导致更快,更有效的沟通。
键3FS功能
-
>无与伦比的性能和易用性:
> - 6.6 tib/s骨料读取吞吐量(180节点群集)。
- 3.66 tib/min吞吐量在Graysort基准(25节点群集)上。
- > 40 GIB/S峰值吞吐量每个客户端节点for Kvcache查找。
>分解架构: -
将数千个SSD的吞吐量与数百个存储节点的网络带宽结合在一起。
- >为应用程序提供了局部性的存储访问。
- 鲁棒一致性:
> - >使用分配查询(CRAQ)采用链复制,以实现强大的一致性,简化了应用程序编码。
- 标准文件接口:
- >使用基于交易键值商店的无状态元数据服务(例如FoundationDB)。
维护熟悉的文件接口,消除了对新API学习的需求。
- >支持的工作负载
数据制备:
>
- > dataLoader:
- >启用跨计算节点训练样本的随机访问,消除预摘要或数据集随机改组。 >检查点:
- 支持大规模训练的高通量平行检查点。 推理的 kvcache:
- 提供了具有成本效益的高通量替代基于DRAM的基于DRAM的替代品,其容量显着增加。 >性能基准
- 广泛的测试验证了3FS性能。 大型集群的读取压力测试即使在同时进行培训工作流量。
Shmperpond Framework 天文,旨在补充3FS,是一个轻巧的分布式数据处理框架。它使用DuckDB作为计算引擎,并在分布式文件系统(例如3FS)上以镶木格式存储数据。 。 钥匙太理庞德特征
高性能:
可伸缩性:
通过高性能分布式文件系统处理PETABYTE尺度数据,而无需内存。 简单:由于缺乏长期服务或复杂的依赖性而易于部署和维护。>>>>>>
- 有效的数据处理:
-
无缝3FS集成:
利用3FS的高吞吐量和强大的一致性。 - 快速启动:3FS和Smermpond 3fs安装
- 克隆存储库并安装依赖项:
-
git clone https://github.com/deepseek-ai/3fs
-
cd 3fs
-
git submodule update --init --recursive
-
./patches/apply.sh
请咨询3FS文档以获取更多详细信息。
天短快速启动
-
确保安装Python 3.8。
- >安装Skermpond:
pip install smallpond
- 初始化天简会:
import smallpond; sp = smallpond.init()
- >加载镶木木:
df = sp.read_parquet("path/to/dataset/*.parquet")
> - 重新分配数据(示例):
-
df = df.repartition(3)
-
df = df.repartition(3, by_row=True)
-
df = df.repartition(3, hash_by="host")
-
- 变换数据(示例):
-
df = df.map('a b as c')
-
df = df.map(lambda row: {'c': row['a'] row['b']})
-
- 保存数据:
df.write_parquet("path/to/output/dataset.parquet")
- 跑步的工作:
sp.run(df)
Smallpond提供监视和调试工具。日志分析有助于解决执行问题。 可以通过官方支持渠道获得全面的文档,教程和用例。
摘要 -
以上是DeepSeek释放3FS和Shmperpond框架的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年
