原创 千亿天价买下“赛博富士康”,扎克伯格为AI疯魔
创始人
2025-06-13 23:30:22
0

进入2025年的夏季后,AI圈也变得愈发躁动。就在不久前,OpenAI宣布将以64亿美元全资收购前苹果首席设计师乔尼・艾维的AI设备初创公司io后,Meta方面也开始行动。近日有消息显示,Meta已同意以148亿美元收购人工智能数据标注公司Scale AI的49%股份,这将是该公司有史以来最大规模的外部投资。

Meta的这一举措,被美国AI圈解读为扎克伯格大刀阔斧重组该公司人工智能业务的一部分。据知情人士透露,扎克伯格近期正在组建被称为“超级智能组”(Superintelligence Group)的AI实验室,并将其视为Meta的最高优先事项,以在日趋激烈的AI技术竞赛中保持市场竞争力。

扎克伯格对Meta AI“动刀”,或许源自于他们最新的Llama 4遭遇滑铁卢。作为Meta在4月推出的最新模型,Llama 4在推出时曾号称"2万亿参数"、"指标精度超越GPT-4",结果在第三方基准测试中直接成了吊车尾,与官方公布的测评成绩形成强烈反差,在诸如代码、长文本等场景悉数翻车。

以至于在扎克伯格的视角下,LIama 4成了“王婆卖瓜,自卖自夸”的典型。其实大模型翻车并不奇怪,可为何LIama 4不及预期会引发Meta如此剧烈的反应呢?因为不同于OpenAI、xAI、Anthropic、谷歌,Meta的AI路线图截然不同。该公司的策略是押注开源模型,更关注与学界、而非业界的联系,试图通过开源赢得AI开发者和研究者的青睐,再通过这些人来将Meta AI的影响力渗透到普通用户中。

不得不说,Meta这番另辟蹊径的做法是有效果的,此前LIama模型就曾长期被业界视为是“救命稻草”,大量的AI研究、AI创业都是基于LIama而来。可是中国开源模型的崛起速度超过了硅谷的想象,深度求索的DeepSeek、阿里的Qwen都让Meta的Llama不再是唯一可用的开源模型,这就意味着他们在AI赛道中开始掉队。

其实扎克伯格对于Meta现有AI部门不满是有迹可循的,先是旗舰模型LIama 4 Behemoth延期,紧接着Meta方面宣布AI部门重组,拆分为“AI产品”与“AGI基础”两大团队。所以Meta如今选择收购Scale AI也并不让人感到意外,因为后者作为AI行业首屈一指的数据提供商,能弥补Meta在数据上的短板。

Meta在训练AI时遇到了数据荒,这并非天方夜谭。作为全球最大的社交平台,Meta旗下的Facebook、Instagram、Threads拥有数以十亿计的用户,后者天然就是数据的贡献者。可问题在于,对于目前AI大模型预训练来说,社交平台产生的数据属于低质量数据,不可能直接拿来就用。

去年,谷歌的AI搜索功能AI Overviews(AI概览)曾输出“用胶水将芝士固定在披萨上”、“推荐摄入石头获取营养”等令人匪夷所思的错误,其实就是AI概览采信了Reddit用户发的帖子。可问题是Reddit用户的原帖并不是正经的科普,而是为了搞笑、“整活”。

当用户查询如何将芝士和披萨饼胚粘在一起时,AI给出“加点胶水”这样的回答并不是无厘头,而是因为在AI的视角下,胶水作为粘合剂确实能让芝士和披萨饼胚粘在一起。同时AI概览推荐用户吃石头补充营养,也是因为石头里真的有钙、镁、钠、钾等人体所需的微量元素。

为了防止这类“有毒”的低质量数据进入AI大模型的数据库,出现“垃圾进,垃圾出”的效果,就需要数据标注。为了有效利用海量的社交数据,所以Meta选择收购Scale AI并非不能理解。

看到这里,或许有的朋友会问,为什么Meta不自己干呢?其实这是因为他们不可能把宝贵的人力资源用于数据标注。

数据标注工作是将各种图片、文本、视频等数据集打上标签,使得其成为二进制、计算机可以理解和识别的信息,并将无法使用的数据清洗出去。数据标注的技术门槛其实相当之低,标出图片中的行人、车辆、建筑,在一段语音中判断说话人的语气就是这个工作的主要场景,基本完成了初级教育的人就能轻松胜任。

而数字标注从业者的工作内容,就是对着电脑屏幕,根据开发者给定的规则来为数据打上各式各样的标注,与流水线上工人干的活没什么区别,属于非常典型的“赛博搬砖”。比如Scale AI的核心竞争力,就是在肯尼亚、菲律宾的24万数据标注员。以至于有AI创业者调侃,Scale AI与AI的关系仅限于公司名称。

反观作为硅谷大厂的Meta,据《华尔街日报》2024年的相关报道显示,他们在2023年支付给员工的工资中位数约为29.6万美元,是硅谷巨头中最多的。按照每周40小时的标准工时计算,Mete员工的平均时薪是144美元,所以Meta用自家员工来做数据标注工作就属于暴殄天物。

相信有不少人认为Meta花费148亿美元买下Scale AI,就好像当年用10亿美元收购Instagram一样,都是既加强自身竞争力,又能遏制竞争对手的妙手。然而许多在AI从业者看来,这一次扎克伯格或是病急乱投医。

如果是在DeepSeek-R1问世前,Meta收购Scale AI还称得上是一桩不错的交易,Meta也确实能借助Scale AI的廉价劳动力来丰富数据供给,从而训练更大规模的Llama模型。可DeepSeek-R1已经证明了⽆需监督微调的预训练步骤、直接通过强化学习(RL) 训练,也能让模型展现出卓越的推理能⼒。

监督式微调则指的是利用标注数据来调整预训练大语言模型,使得其适应特定下游任务的过程。如果不需要监督式微调,数据标注也就失去了价值。这也是为什么今年年初DeepSeek-R1爆红时,Scale AI创始人Alexandr Wang会歇斯底里地攻击DeepSeek。

其实DeepSeek真正直接打击的还不是英伟达,而是Scale AI。当然,完全放弃监督式微调、纯粹依靠RL也过于极端,业界当下的主流是RL为主、监督式微调为辅,尽量寻找博士水平(PhD-Level)的专家标注出高质量数据。换而言之,除非DeepSeek的路线被证明不能抵达人工智能领域的“圣杯”AGI,否则Meta这次花大价钱其实是买了一个注定会没落的AI独角兽。

当然,对于拥有720亿美元现金和短期等价物的Meta而言,花148亿美元买一个能马上缓解AI掉队危机的Scale AI,也不是什么不可接受的事情。

相关内容

热门资讯

潮声丨“洋老板”涌入义乌,投资... 01义乌外资经营主体总量于2024年7月31日突破10000户,成为全国首个外资经营主体破万的县级市...
量子通信新突破! “经典-确定... 近期,来自宾夕法尼亚大学(University of Pennsylvania)联合纽约市立大学(C...
有人称其“欠款千万未还”、拉横... 中国澳门女子乒乓球运动员朱雨玲在美国大满贯夺冠不久,7月20日,一抖音博主发视频称朱雨玲欠其朋友上千...
白银:美国数据走弱,短期偏强或... 【美国8月CPI创新高,初请失业金人数激增,白银短期偏强运行】国际上,美国8月未季调CPI年率达2....
原创 芯... 这个周末,消息面并不平静,有芯片的利好,也有存储器涨价的消息,接下来就为大家做个解读: 1、商务部发...
“报行合一”+政策松绑,上市险... 2025年上半年,银保渠道业绩大涨成为A股5大上市险企业绩的共性特征。上海证券报记者统计发现,虽然险...
推动海上风电规范有序建设 海上风电是清洁能源的重要组成部分。我国海上风能资源丰富,大力发展海上风电,对保障能源安全、加快绿色低...
治理“电鸡”乱象,一线城市出手... 今年9月开始,广州外卖小哥的电动自行车,将陆续拥有专用号牌。 9月1日,随着编号为“WA0001”的...
原创 美... 近日,美国政坛上演了一出令人啼笑皆非的闹剧。一向以强硬作风著称的特朗普总统,这次可谓是遭遇了后院起火...
原创 海... 说起海澜之家,当前互联网最火的无疑是两个,一个是其经典广告“男人的衣柜”,另一个则是其堪比二战德国鹰...
19只基金紧急“刹车”,3只一... 华夏时报记者 耿倩 上海报道 《华夏时报》制表 “为保护基金份额持有人利益,基金管理人决定将该基金...
原创 笑... 你能想象吗,一句“恶心”,居然能把两个大男人闹得全国人都在围观,罗永浩一句话,西贝老板贾国龙彻底炸了...
今飞凯达拟调减项目规模结项,1... 来源:新浪财经-鹰眼工作室 近日,浙江今飞凯达轮毂股份有限公司(证券代码:002863)发布公告称,...
恩捷股份:10吨级的固态电解质... 9月12日,恩捷股份发布调研公告显示,近期公司下游客户的隔膜需求和订单呈现稳定增长态势,目前公司产能...
原创 九... 紧接着九三阅兵,中国又宣布将于9月17日至19日举办第十二届北京香山论坛。论坛的主题为“共护国际秩序...
曾金策9月14日:下周黄金价格... 黄金消息面: 从消息面上看,美就业数据疲弱,初请失业金人数飙升,强化美联储下周降息预期,支撑金价。但...
速达股份(001277.SZ)... 格隆汇9月12日丨速达股份(001277.SZ)公布,股东扬中市徐工产业投资合伙企业(有限合伙)(简...
兔兔陪伴与济南普济堂互联网医院... 2025年9月9日,兔兔陪伴健康陪诊服务平台(以下简称“兔兔陪诊”)与济南普济堂互联网医院正式签署战...
江沐洋:9.13国际黄金走势分... 金价周五上涨,接近本周早些时候创下的纪录高位,美国劳动力市场疲软的迹象强化了美联储将在下周进行今年首...
每周股票复盘:中控技术(688... 截至2025年9月12日收盘,中控技术(688777)报收于50.62元,较上周的48.35元上涨4...