DeepSeek的爆红,指出了当下AI最大困境
创始人
2025-01-30 12:45:26
0

回望计算机历史,DeepSeek 恰逢其时。

近期,「横空出世」的 DeepSeek 是中国春节前的意外之喜,也震荡了大洋彼岸美国的应用商店、科技公司、甚至股市。

DeepSeek 在中美两区双登顶 App Store 免费榜第一;让英伟达一夜股价狂跌近 17%,市值蒸发 5890 亿美元,直接创下华尔街有史以来单日个股暴跌价值纪录,其他人工智能衍生服务的公司股价也纷纷大跌。

Meta 员工内部爆料称,DeepSeek 让公司进入恐慌模式,连夜成立四个专门研究小组;美国总统直言:DeepSeek 是对美国 AI 行业的当头棒喝。

Sam Altman 也被卷到了|图源:X

震惊、恐慌、难堪、好奇、赞许、骄傲……由 DeepSeek 引发的复杂情绪在中美两国的科技界里蔓延着。

但 DeepSeek 只是「横空出世」吗?除了深度求索公司强大的技术力之外,它的出现是否有迹可循?意外背后是否有着一种必然

01.AI 行业的规模化困境

微软 Windows 部门前总裁,曾带领开发出 Windows 7、Windows 8 的科技老兵 Steven Sinofsky 近日在 X 上发表长文《DeepSeek 是不可避免的,原因如下)》,从技术史的角度,看到了 AI 行业如今的窘境,和 DeepSeek 问世的必然。

图源:X

在 Sinofsky 看来,DeepSeek 的出现是技术发展的必然

当下 AI 的发展轨迹是堆叠在资本之上,因此大型的 AI 公司要么自身是科技巨头,比如 Google、Meta,OpenAI 与微软、xAI 背靠马斯克,要么凭借业内资源完成大额融资的初创公司,像是 Perplexity 和 Anthropic。

这些公司因为坐拥更好的资源,所以在 AI 的技术探索上,一直在用扩张的思路发展,买数据、买芯片、买算力、买人……这种用资本换扩张的路径,让美国的 AI 行业现在看起来像一场大型军备竞赛。

但 Sinofsky 回望计算机发展史,他发现了一个规律:创新会带来新的产品,纵向扩展(scale up)紧随其后,即持续推动产品演进成更高、更快、更强的版本,但这种模式会被横向扩展(scale out)所颠覆,「更快更强」会被「小巧但多」所取代。

以计算设备的发展为例,纵向扩展下,电脑从占据一整个房间的 ENIAC,演进到晶体管计算器,到可以放在办公桌上的集成电路计算机、再到沿用至今的微型处理器。但性能更强的桌面电脑,普及率和数量都不如横向扩展后的智能手机

带入到 AI,Sinofsky 认为过去五年的 AI 公司的发展思路就是纵向扩展:更大的模型、更多的参数、更强的计算能力。这是他们的先发优势,但也让他们陷入了大公司的惯性里,一直在做性能提升,而没有质的飞跃

这也被 Sinofsky 称之为「规模化的困境」,在当下的 AI 行业里,尽管有许多技术进展,但代价是巨大的资本投入。训练集群的基础设施硬件,定期扫描互联网去训练数据,再到用户端调用服务,大模型的发展速度和资金的燃烧速度不相上下。

然而回望计算机发展史,技术发展的成本会逐渐下降而不是上升,AI 行业目前显然在背道而驰

主要 AI 模型的培训成本|图源:新浪科技

02.DeepSeek 正在重塑 AI?

在技术史上,有许多「大卫与歌利亚」般的故事。当向上发展的规模化到达一定高度后,就必然会诞生做横向扩展的产品,它们重塑行业,也让巨头感到恐惧。

Sinofsky 以互联网举例,美国通讯巨头 AT&T 曾认为,构建互联网不能依靠一些「玩具型」的技术,而应该扩展电话网络,增加通讯设备,让信号更稳更强。原因很简单,他们坐拥通讯网络的基础设施

然而真正互联网的构建,是依托于当时的小公司思科发明的路由器,蒂姆·伯纳斯-李发明的 HTTP、HTML 等协议和编码,网景开发的浏览器……这些个人和小公司当时都没有大量的资金和基础设施,但靠有限的资源构建起了互联网。

套用到 AI 行业,就是 DeepSeek。

它价少、性能强、好调用,它不依靠硬件堆砌,实现了和超大规模 AI 不相上下的推理效果,证明了大模型的发展,不是只有巨量的资本投入这一条路径。

DeepSeek 在这个意义上,摆脱了规模化的困境,创造了新的可能。也正是因为低成本,才能让它敢于开源,让更多人、更多初创公司能参与到 AI 的开发里。

就像 DeepSeek 创始人梁文锋在采访里所说「未来世界可能是一个术业有专攻的分工世界……我们认为现阶段是技术创新爆炸性增长的时期,长期来看,我们希望创造一个生态系统,让行业直接利用我们的技术和产出。拥有一个强大的技术生态系统更重要。」

人人用得起的 API|图源:DeepSeek

Marc Anderson 所称,DeepSeek R1 的发布,宛如当年太空竞赛里,苏联率先把第一颗人造卫星送上太空,这是人工智能的「斯普特尼克时刻」,也是最令人惊叹、最让人印象深刻的突破之一。

然而在 DeepSeek 团队眼里,AI 不应该是军备竞赛,它不应该限于某家公司、某个平台、某个功能,而是如同互联网一般,拥有无限潜力的技术生态

AI 的发展也符合了科技史的某种叙事,只是此前的科技故事一直由硅谷驱动,而这一次,颠覆性的创新的主角来自中国,且新章节才开始书写。

来源:极客公园

相关内容

热门资讯

白银首破70美元关口、黄金逼近... 财联社12月24日讯(编辑 赵昊)在地缘政治紧张局势升级、以及美联储进一步降息预期的推动下,黄金和白...
金银年末狂奔!白银“疯牛”碾压... 2025仅剩几天,“贵金属牛”年末蒙眼狂奔。 金银势必成为今年全球大类资产中最大赢家。 周二,现货白...
891家!湖南公布2025年上... 12月22日,省委金融办对2025年湖南省上市后备企业资源库入库企业名单(以下简称:名单)进行公示,...
京东回应法国仓库失窃事件 新华社巴黎12月23日电(记者崔可欣 李文昕)23日晚间,京东公司就法国仓库失窃一事向媒体回应说,当...
和讯投顾孔晓云:冲高回落的主要... 我们开始今天的复盘,朋友们今天试了3937.13之后,尾盘收在3919.98点。和讯投顾孔晓云表示,...
“着力稳定房地产市场”明年怎么... 12月22日至23日,全国住房城乡建设工作会议在北京召开,会议全面盘点2025年工作,系统总结“十四...
“食物银行”,城市公益的全新打... 最近,在广东深圳市福田区,有一种特殊的柜机“食物银行”引发大众关注。它看起来很像常见的自动贩卖机,但...
安徽27天新生儿住院治疗黄疸期... 12月22日,安徽合肥的陈先生向大河报《看见》记者反映,其出生仅27天的儿子在安徽省妇女儿童医学中心...
原创 快... 中文互联网最大规模安全事故之一。 作者 I 薛星星 编辑 I 蒋浇 封面 I 我是谁:没有绝对安全的...
原创 5... 2025年,周鸿祎在互联网展现出极高的公众关注度。 周鸿祎经常身着红色服饰、录制视频内容、开展科普工...
2025年这些“亿级交通项目”... 今天,国务院新闻办公室举行新闻发布会,交通运输部副部长李扬介绍了新时代交通运输服务经济社会高质量发展...
正在派送中!“呼和浩特风味”火... 走进内蒙古张小聚食品科技有限公司的生产车间 只见打包台上快递单如雪片般堆积 这是年终促销活动后 仓库...
美国重要数据公布,金银铜盘中创... 每经编辑|杜宇 当地时间12月23日,美股三大指数集体收涨,均录得日线4连涨。纳指涨0.57%,标...
一度高达18%!多晶硅交割价与... 界面新闻记者 | 韩理 界面新闻编辑 | 宋烨珺 逼仓,洗盘,囤居——期货市场上,由优势资金优势...
中国LPR连续7个月不变 中新社北京12月22日电 (记者 庞无忌)中国人民银行授权全国银行间同业拆借中心22日公布最新一期贷...
《生而全球 · 闪耀世界》卖家... ,系统展现亚马逊 EASY GO 解决方案助力卖家全球拓展的路径与成效,核心内容如下: 报告围绕 “...
武汉,冲刺万亿消费之城 一座新的万亿消费城市正在诞生。 “到2027年,全市社会消费品零售总额超1.07万亿元。” 近日公布...
上万“僵尸账号”罕见突袭快手直... 每经记者|王郁彪 每经编辑|文多 12月22日晚10点左右,一场突如其来的大规模网络攻击席卷了快手...
返点率不足4%至业绩承压,新业... (图片来源:视觉中国) 蓝鲸新闻12月23日讯 近日,香港交易所显示,米多多集团股份有限公司(以下简...
“22万科MTN004”获30... 本报记者 李昱丞 12月22日晚间,万科企业股份有限公司(以下简称“万科”)发布公告称,万科2022...