目录
> fire-flyer文件系统(3FS)
远程直接内存访问(RDMA)绕过操作系统限制,从而在两台计算机的内存之间启用直接数据传输。这会导致更快,更有效的沟通。
键3FS功能
可伸缩性:
天短快速启动
首页 科技周边 人工智能 DeepSeek释放3FS和Shmperpond框架

DeepSeek释放3FS和Shmperpond框架

Mar 03, 2025 pm 07:07 PM

DeepSeek Releases 3FS & Smallpond Framework

DeepSeek于2025年2月28日显着增强了开源功能,揭示了Fire-Flyer文件系统(3FS)和Smplearpond数据处理框架。 这些工具旨在彻底改变数据访问和处理,特别是用于AI培训和推断。

? #opensourceweek的第5天:3FS,所有DeepSeek数据访问的强大引擎

> fire-flyer文件系统(3FS) - 一个并行文件系统,最大化现代SSD和RDMA网络的带宽。

6.6 tib/s骨料读取吞吐量(180节点群集) ⚡3.66TIB/min…

- DeepSeek(@Deepseek_ai)2025年2月28日

目录的

>

> fire-flyer文件系统(3FS)

Shmperpond Framework
  • 快速启动:3FS和Smermpond
  • >故障排除和监视
  • 摘要
  • > fire-flyer文件系统(3FS)
  • 3FS是为现代SSD和RDMA网络构建的高性能,分布式文件系统。 它提供了强大的共享存储解决方案,简化了分布式应用程序开发。
  • 理解RDMA

远程直接内存访问(RDMA)绕过操作系统限制,从而在两台计算机的内存之间启用直接数据传输。这会导致更快,更有效的沟通。

键3FS功能

  • >无与伦比的性能和易用性:>
      6.6 tib/s骨料读取吞吐量(180节点群集)。
    • 3.66 tib/min吞吐量在Graysort基准(25节点群集)上。
    • > 40 GIB/S峰值吞吐量每个客户端节点for Kvcache查找。
  • >分解架构:
  • 将数千个SSD的吞吐量与数百个存储节点的网络带宽结合在一起。
      >为应用程序提供了局部性的存储访问。>
    • 鲁棒一致性:
  • >使用分配查询(CRAQ)采用链复制,以实现强大的一致性,简化了应用程序编码。
    • 标准文件接口:
  • >使用基于交易键值商店的无状态元数据服务(例如FoundationDB)。 维护熟悉的文件接口,消除了对新API学习的需求。
    • >支持的工作负载
  • 数据制备:
有效地管理数据分析管道中的大量中间输出。

>
    > dataLoader:
  • >启用跨计算节点训练样本的随机访问,消除预摘要或数据集随机改组。
  • >检查点:
  • 支持大规模训练的高通量平行检查点。 推理的
  • kvcache:
  • 提供了具有成本效益的高通量替代基于DRAM的基于DRAM的替代品,其容量显着增加。 >性能基准
  • 广泛的测试验证了3FS性能。 大型集群的读取压力测试即使在同时进行培训工作流量。 Shmperpond Framework 天文,旨在补充3FS,是一个轻巧的分布式数据处理框架。它使用DuckDB作为计算引擎,并在分布式文件系统(例如3FS)上以镶木格式存储数据。
  • 钥匙太理庞德特征

高性能: duckdb提供了用于有效数据处理的本地级别性能。>

可伸缩性:

通过高性能分布式文件系统处理PETABYTE尺度数据,而无需内存。

简单:

由于缺乏长期服务或复杂的依赖性而易于部署和维护。>>>>>>

    有效的数据处理:分类大数据集的两相方法可提高性能和效率(例如,在30分钟内的8,192个分区中排序110.5 TIB)。
  • 无缝3FS集成:利用3FS的高吞吐量和强大的一致性。
  • 快速启动:3FS和Smermpond 3fs安装
  • 克隆存储库并安装依赖项:
    1. git clone https://github.com/deepseek-ai/3fs
    2. cd 3fs
    3. git submodule update --init --recursive
    4. ./patches/apply.sh

    请咨询3FS文档以获取更多详细信息。

    天短快速启动

    • 确保安装Python 3.8。

    • >安装Skermpond:

      pip install smallpond

    • 初始化天简会:

      import smallpond; sp = smallpond.init()

    • >加载镶木木:

      df = sp.read_parquet("path/to/dataset/*.parquet")>

    • 重新分配数据(示例):

      • df = df.repartition(3)
      • df = df.repartition(3, by_row=True)
      • df = df.repartition(3, hash_by="host")
    • 变换数据(示例):

      • df = df.map('a b as c')
      • df = df.map(lambda row: {'c': row['a'] row['b']})
    • 保存数据:

      df.write_parquet("path/to/output/dataset.parquet")

    • 跑步的工作:

      sp.run(df)

    >故障排除和监视

    Smallpond提供监视和调试工具。日志分析有助于解决执行问题。 可以通过官方支持渠道获得全面的文档,教程和用例。

    摘要

    > 3FS和Smermpond的开源释放代表了数据处理的重大进步。他们的高性能,易用性以及一致性增强了开发人员和研究人员的能力。 这些工具为现代,数据密集型应用程序提供了强大的基础架构。

以上是DeepSeek释放3FS和Shmperpond框架的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1655
14
CakePHP 教程
1413
52
Laravel 教程
1306
25
PHP教程
1252
29
C# 教程
1226
24
开始使用Meta Llama 3.2 -Analytics Vidhya 开始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

10个生成AI编码扩展,在VS代码中,您必须探索 10个生成AI编码扩展,在VS代码中,您必须探索 Apr 13, 2025 am 01:14 AM

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

AV字节:Meta' llama 3.2,Google的双子座1.5等 AV字节:Meta' llama 3.2,Google的双子座1.5等 Apr 11, 2025 pm 12:01 PM

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

向员工出售AI策略:Shopify首席执行官的宣言 向员工出售AI策略:Shopify首席执行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

视觉语言模型(VLMS)的综合指南 视觉语言模型(VLMS)的综合指南 Apr 12, 2025 am 11:58 AM

介绍 想象一下,穿过​​美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? Apr 13, 2025 am 10:18 AM

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

阅读AI索引2025:AI是您的朋友,敌人还是副驾驶? 阅读AI索引2025:AI是您的朋友,敌人还是副驾驶? Apr 11, 2025 pm 12:13 PM

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

See all articles