DeepSeek“开源周”收官

DeepSeek“开源周”收官

时光鸡 2025-02-28 简单报 32 次浏览 0个评论

ZAKER 科技 2 月 28 日消息,国内 AI 明星公司 DeepSeek 为期五天的 " 开源周 " 今日结束,其于 2 月 24 日正式启动,计划开源 5 个代码库,旨在与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。

在这五天里,DeepSeek 先后开源了 FlashMLA、DeepEP、DeepGEMM、优化并行策略(DualPipe 和 EPLB)以及面向全数据访问的推进器 3FS(Fire-Flyer 文件系统)多个项目。

DeepSeek“开源周”收官

FlashMLA 是专为英伟达 Hopper GPU 优化的高效 MLA 解码内核,专为处理可变长度序列设计;DeepEP 是首个用于 MoE(混合专家模型)训练和推理的开源 EP 通信库;而 DeepGEMM 则提供支持给 V3/R1 的训练和推理;DualPipe 是一种用于 V3/R1 训练中计算与通信重叠的双向管道并行算法。

这些代码库将提供给全球开发者二次开发和改进,并有望促进 AI 技术在更广泛领域应用上取得突破。

DeepSeek“开源周”收官

转载请注明来自个人生活安排日历,本文标题:《DeepSeek“开源周”收官》

每一天,每一秒,你所做的决定都会改变你的人生!
Top
网站统计代码