王炸!DeepSeek发布收官
创始人
2025-02-28 18:52:10
0

【导读】DeepSeek“开源周”今日正式收官

中国基金报记者 忆山

2月28日,在“开源周”第五天,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。

Fire-Flyer文件系统(3FS)是一种利用现代SSD和RDMA网络的全部带宽的并行文件系统,是所有DeepSeek数据访问的助推器。

其特点有:180节点集群中的聚合读取吞吐量为6.6TiB/s;25节点集群中GraySort基准测试的吞吐量达3.66TiB/min;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s;具有强一致性语义的分解架构;在V3/R1中进行训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查询推理。

Smallpond是轻量级的数据处理框架,其特点是基于DuckDB的高性能数据处理可扩展性,能够处理PB级别数据集无需持续运行的服务,以及操作简便。

至此,DeepSeek为期五天的“开源周”活动正式收官。

2月21日,DeepSeek宣布,从2月24日起将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展。

2月24日,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产。

2月25日,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库。

2月26日,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等。

2月27日,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题。

开年以来,DeepSeek持续火热。QuestMobile数据显示,自上线以来至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万个。

日前,有消息称,原计划今年5月发布的DeepSeek-R2模型正在加速开发,或将提前发布。新模型有望能生成更好的代码,并使用英语之外的语言进行推理。对此,DeepSeek母公司幻方量化回应称,以官方消息为准。

印度科技服务商Zensar的首席运营官认为,DeepSeek-R2模型的发布或将成为AI行业的关键时刻。DeepSeek成功打造了具有高性价比的AI模型,将促使全球公司加速研发进程,打破目前少数企业垄断的格局。

目前,OpenAI、谷歌、xAI、Anthropic、阿里等已相继上新深度推理/深度思考模型。字节跳动旗下AI助手豆包也被传正在小范围测试深度思考模型的不同实验版本,且接入的不是DeepSeek模型。

编辑:晨曦

校对:纪元

制作:小茉

审核:许闻

相关内容

热门资讯

每周股票复盘:杭州银行(600... 截至2026年5月22日收盘,杭州银行(600926)报收于16.05元,较上周的16.51元下跌2...
深圳企业2026年展厅设计公司... 好的,请查收根据您的需求创作的深度文章。 引言 深圳,作为中国的“创新之都”和科技前沿阵地,其企业在...
2026年北京海淀公寓出售市场... 海淀区作为北京科技与教育高地,其公寓出售市场正经历结构性调整。随着城市更新与产业外溢,区域内在售公寓...
雪龙集团研发投入2020.36... 雪龙集团(603949)披露2025年年度报告。报告期内,公司全年研发投入达2020.36万元,同比...
6949万元,5.6折!恒大一... 恒大海上威尼斯酒店今日(5月23日)完成拍卖。 京东资产交易平台信息显示,位于启东市寅阳镇的恒大海上...
机构:604万枚比特币面临潜在... 按量子安全(份额)划分的比特币供应量,其中30.2%面临风险 来源:Glassnode 上证报中国...
原创 游... 瑞鹤仙这个绰号,在民间股神圈子里提起来,谁都认。他1984年湖北出生,上海名校毕业,游戏公司上过班。...
渣打CEO就AI替代“低价值”... IT之家 5 月 23 日消息,渣打银行首席执行官比尔 · 温特斯(Bill Winters)就其有...
严子怡刷新女子标枪亚洲纪录、世... 新华社厦门5月23日电(记者吴俊宽、刘旸)2026世界田联钻石联赛厦门站23日在厦门白鹭体育场进行,...
十年亏损仍激进扩张,埃夫特10... 在抛出收购意向近四个月后,国产机器人厂商埃夫特(688165.SH)正式落地对盛普股份的并购计划。近...
6万股民无眠!4家A股公司,终... 来源:市场资讯 (来源:券研社) 大家好,今天是周六,一起看下市场主要消息面。 昨日晚间,*ST熊猫...
原创 8... 一家成立不到五年的公司,以582亿元年营收叩开深交所大门,创下河南企业IPO历史纪录。 5月22日,...
美股芯片股深夜大涨,富途暴跌近... 当地时间5月22日,美股三大指数集体上涨,道指涨0.58%,报50579.70点,刷新历史新高;标普...
深圳可行性研究报告——研发类项... 项目名称:深圳可行性研究报告——研发类项目可研报告:别把“可行性”写成“先进性” 编制单位:深圳思创...
原创 油... 【阅读须知】:本文内容所有信息和数据,均为作者查阅官方信息和网络已知数据整合解析,旨在让读者更清晰了...
原创 俞... 01 先说"为什么有这个话题" 俞浩最近真的太有争议地火了,先是被兽爷评价为流量恐怖主义,后俞浩自己...
对话王小川:离开通用人工智能的... “如果没有转型,继续走主流道路,你也会有同等程度的焦虑。”王小川说,这次转型,让他真正回归到从创业第...
国际金价与油价何去何从? 注:本文的简略版发表于《人民日报》客户端“零时差”栏目,2026年5月23日,转载请注明出处。文中配...
今夜,原油暗盘跳水!美伊谈判,... 【导读】周末好消息 中国基金报记者 泰勒 大家周末好,给你们说件美伊谈判的利好消息,有了不错的进展!...
原创 超... 自从美伊冲突爆发,全球能源交易的齿轮发生了剧烈咬合,一个被西方长期忽视的真相正逐渐浮出水面。 SWI...