撰文| 涂彦平
编辑| 张 南
设计| 荆 芥
这就是智力产生的过程。
一种新工厂,Tokens生成器,人工智能基石。
Tokens开辟新领域,将数据转化为知识,汲取我们学到的一切。
Tokens正在利用清洁能源,并揭开星辰秘密。
它们帮助机器人在虚拟世界中学习,在现实世界中完善自身,开辟新道路,为丰收铺平道路。
在关键时刻,Tokens已经到位。
在漫长旅途中,它们从未停歇。
它们能在人类无法工作的地方发挥作用。
这样,我们都能呼吸得更轻松。
而那些最幼小的心脏,也会跳动得更有力。
Tokens正帮助我们开辟新天地,从而赋能世界。
这样我们就能到达星云一号。
分离已确认。
远远超出这个范围。
我们将携手迈向下一个伟大的飞跃,
创造一个为全人类而构建的光明新未来。
一切,都从这里开始。
加州圣何塞,当地时间3月16日,GTC 2026大会开幕,在英伟达创始人兼首席执行官黄仁勋正式演讲之前,现场播放了一段视频。
一个舒缓的女声念出了上述文字。从内容来看,它完全可以称得上是一首“Token赞歌”。而在随后长达两个多小时的演讲中,“Token”一词也被反复提及。
无独有偶。
也是在16日,阿里巴巴集团CEO吴泳铭宣布了一项组织调整:成立Alibaba Token Hub事业群,围绕“Token的创造、输送与应用”这一核心主线,整合阿里内部多个AI相关业务板块。此举被外界解读为阿里AI战略正式进入“Token驱动”阶段。
在吴泳铭看来,Token正成为阿里AI战略的全新引擎。
而在黄仁勋那里,Token则有了一个全新的定义:Token即商品。
01
「需要Token,大量的Token」
“推理的转折点已经到来——此时所需的Tokens数量、计算量大约增加了1万倍。”黄仁勋表示。
Token数量的增长历程大致可以梳理出三个节点:
ChatGPT开启了生成式AI时代,Token成为人与机器对话的语言;
ChatGPT o1等推理AI让模型开始“思考”,Token不仅用于生成内容,更用于反思、规划、问题拆解;
Claude Code则让AI真正投入工作,能够读取文件、编写代码、测试、迭代,Token的使用量因此呈指数级增长。
黄仁勋提到,去年,英伟达与AI原生企业的合作呈爆炸式增长。AI初创企业获得的风险投资已达1500亿美元。原因在于,这是历史上第一次这些公司普遍都需要计算能力,而且是大量的计算能力。
“他们需要Token,大量的Token。他们要么需要创建和构建Token,要么会创建和生成Token,或者会整合由Anthropic和OpenAI等公司创建的增值Token。”
黄仁勋表示,受到这一浪潮的影响,市场对英伟达GPU的计算需求“已经爆表”。“我相信在过去几年里,计算需求增长了100万倍。”
他预测,从2025到2027年期间,该需求增长将至少为公司带来1万亿美元收入。
02
「数据中心即Token工厂」
演讲中,黄仁勋提出了一个颠覆性概念:数据中心即Token工厂。“你的数据中心,它以前是一个文件数据中心。现在这里是一个Token生产工厂。”
在这个新工厂里,每瓦特电力的Token产出,成为衡量效率的核心指标。就像工厂的生产线,Token工厂的目标是:在有限的能源和空间内,最大化Token的吞吐量。
“每瓦Token数量很重要,因为每个数据中心、每个工厂,从定义上来说都是电力受限的。一座1吉瓦的工厂永远不会变成2吉瓦。”
因此,在给定功率下,每瓦吞吐量越高,就能产生越多的Token。
未来,每一家CSP、每一家计算机公司、每一家云公司、每一家AI公司、每一家公司,都会关注其Token工厂的效率。
他展示了一张关键图表——可能是对AI工厂未来最重要的一张图表,纵轴是Token吞吐量,横轴是推理速度。“全世界每位CEO都会关注这件事。”因为AI工厂的吞吐量和Token生成速度将直接决定明年的收入。
“从现在开始,你所看到的世界上的每一位CEO都会按照我接下来要描述的方式研究他们的业务,因为这就是你们的Token工厂。这是你的AI工厂。这是你的收入。”黄仁勋以一种毋庸置疑的语气为CEO们指出方向。
然后,他说,英伟达的Token成本是全球最低的,无可匹敌。“在一个1吉瓦的工厂里,通过架构创新,我们将把Token生成速度从200万提高到7亿,增长350倍。”
黄仁勋解释这正是软件和芯片极致协同设计的惊人力量。
当天,英伟达发布了Vera Rubin平台,这是一次系统性创新,它包含7款芯片,5套机架级系统,以及一台面向代理式AI的超级计算机。
与Blackwell平台相比,Vera Rubin NVL72机架仅需四分之一数量的GPU即可训练大型混合专家模型,每瓦特推理吞吐量最高可提升10倍的同时,每Token成本仅为原平台的十分之一。
而Groq 3 LPX机架与Vera Rubin强强联合,使每兆瓦的推理吞吐量提升高达35倍,并为万亿参数模型带来了多达10倍的营收机遇。
“Token是你的新商品,计算是你的收入,所以你要确保架构在未来尽可能地优化。”黄仁勋的这句话也是说给CEO们听的。
03
「Token经济学」
“Token是新的商品,就像所有商品一样,一旦达到拐点,就会分化为不同层次。”黄仁勋提出,不同层级的AI服务对应不同的Token定价策略。
比如,高吞吐量低生成速度的方案可以用于免费层级;而更大、更快、支持更长上下文的模型属于中间层级。
这样,免费、每百万Tokens收费3美元、每百万Tokens收费6美元等阶梯定价模式将逐步形成。
“当你拥有更智能的人工智能模型时,每一次点击都会让你提高价格。”
他认为,未来可能会出现每百万Tokens收费45美元甚至150美元的高级模式。
假设每天要使用5000万Tokens,以每百万Tokens的价格150美元计算,也就是7500美元。“对于一个研究团队来说,这根本不是问题。”
黄仁勋说,“这就是未来,这就是人工智能的发展方向,这就是它现在的样子。必须从这里开始,才能确立它的价值和用途,并变得越来越好。”
在演讲的尾声,他描绘了一个Token驱动的未来:
“未来我们公司的每一位工程师都需要年度Token预算。他们的基本年薪将达到几十万(美元),我打算再给他们大约一半的Token,这样他们的能力就能提升10倍。”
他还给出判断:每一家软件公司,都将成为Token制造商,为员工、为客户制造token。
黄仁勋的整场演讲,就像是一首写给Token的情书。Token不仅是技术的产物,更是新时代的语言与货币。从数据中心到太空,从智能汽车到机器人,燃烧的Token正在重塑世界。
他勾勒出一幅Token经济学图景,也是在试图呈现AI进入推理时代的底层商业模式。这个商业模式以Token为中心,这幅Token经济学图景,则以英伟达为中心。