有多少AI公司,如今困在智算中心?
创始人
2024-11-10 03:53:36
0

文 | 新眸,作者|李小东

直到现在,算力仍然被看作是制约国内AI发展的主要因素。

为了解决这一问题,尤其是ChatGPT出现后,智算中心被视为AI时代如同水和电一般的新基建,在全国各地落地开花。截至今年上半年,全国建成和在建的智算中心超过250个,有媒体报道,仅今年前七个月,就涌现出了140个新的中标项目。

建设这些智算中心背后涉及的公司和机构,除了城投、运营商、金融企业和一些央国企,大型的互联网云计算公司,比如华为云、阿里云、腾讯云,甚至还有些从房地产等行业跨界过来的公司。

但另一组数据同样值得关注:IDC指出,以企业为主要用户的通用算力中心利用率,目前仅为10%-15%;之前有中科院院士公开表示,一些重量级的智算中心,现在大多甚至都处于闲置状态。

从算力不足,到所谓的算力“过剩”,核心问题实际上并没有完全解决。这就意味着,动辄投资数十亿甚至过百亿的大项目,不仅没有发挥出应该有的价值,还成了这场AI热潮中代价最高的新难题。

算力供给风起云涌

不少人对“智算中心”这个词可能还感到陌生。但它其实不算个新词,可以理解为更高阶的“计算中心”。

在计算机科学兴起之初,由于计算设备昂贵且稀缺,许多机构和组织会建立专门的计算中心,来集中提供高性能的计算资源和服务。随着计算机技术的不断进步和普及,从最初的大型机时代到如今的云计算、边缘计算,计算中心的形式和功能也发生了变化。

相较于传统算力中心,智算中心在硬件层面使用GPU替代CPU,GPU并行处理在面对大规模数据集运算时计算效率更高;另一方面,智算中心在软件层面部署了AI框架,能将计算任务调配给不同的计算平台,从而实现最大的效率。

按应用角度来看,传统计算中心更多地以存储数据和提供互联网服务为主;而智算中心是专门给AI应用提供算力和数据存储。

三年前,在推动产业数字化转型的背景下,国内首个智算中心落地武汉,总投资约4.6亿元,由于这类项目的建设过程中,通常会采用预制模块化机房和整柜交付的方式,所以实际建设周期很短,仅仅6个月就能够建成。

当时一期的建设规模为100P FLOPS的AI算力,由数千颗昇腾AI处理器组成,算力峰值性能相当于5万台高性能PC机。这是个怎样的概念呢?以天文探索的场景为例,普通算力需要169天才能找到的特定星星,智算中心只用不到100秒。

新眸统计2021以来建成的智算中心,从以地方主导的项目,如武汉、合肥、南京、京津冀等,到后来以商汤、阿里云、百度云等大厂为主开始投资运营,投入资金、算力规模整体呈现出明显逐阶上涨的趋势。

比如2022年投入运营的“商汤科技人工智能智算中心”,一期投入56亿元,机柜数量5000个,峰值训练算力达到3740P FLOPS;同年后来阿里云的张北智算中心上线,算力规模达到12000P FLOPS,总投入180亿元。

过去的一年里,智算中心以量出圈。

具体表现在,一些四五线城市的智算中心拔地而起,比如甘肃庆阳、安徽宿州、山东枣庄等。相比大城市,这些城市土地资源丰富且价格低廉,渴望经济转型,并带动周边产业发展,因此对智算中心给予如税收优惠和资金补贴等支持,并且审批流程更简化,建设进度更快。

另一方面,智算中心需要实现算力的标准化、服务化,达到随用随取,类似于传统公有云服务。这意味着智算中心不仅仅是提供硬件资源,而是要转型为提供算力服务,因此很多企业,甚至是传统企业都涌入了跨界做算力租赁的赛道。

同花顺数据显示,截至目前,算力租赁概念股已经多达108家。例如,主营彩票印刷业务的鸿博股份,是A股首家宣布跨界算力的上市公司;莲花健康主业是做味精的,也采购了大量英伟达GPU开展算力租赁业务。

算力租赁,一个新的风口赛道

简单来说,算力租赁就是当你在需要强大算力来完成某个项目时,不去自己购买昂贵的计算设备,而是去租用。服务商根据需求,搭建好所需的计算环境或系统,然后通过签订合同的方式,把这套计算能力租给你用。

客户付的是租金,用完之后这套设备的所有权还是归服务提供方,也不需要自己去维护或者买下这些设备。通常情况下,算力租赁有四种收费方式,按小时、按算力规模、按使用量和套餐计费。

具体来看,一般小型科创公司在做一些科研项目、短期的数据处理任务等,对算力的使用时间不确定,按小时计费就可以灵活控制成本。比如SFCompute公司提供按小时计费的服务,用户可以根据自己的需求租用H100 GPU,价格还很便宜。

按算力规模计费,通常涉及到服务器性能、GPU数量等方面的评估,性能越好、效率越高,服务租金也更高。其次还有按照数据处理量、网络流量的使用情况来计费的方式。针对一些大型企业或有特殊需求的客户,提供商可以根据客户的具体要求定制个性化的套餐。

为什么要租?

众所周知,这两年大模型训练、微调、推理需求急剧增加,但关键在于,AI应用在不同的开发阶段,对算力的需求也不同。在开发周期中,需要大量的训练算力;当模型开发完成上线后,就不再需要训练算力而是推理算力。

当下算力租赁下的迫切需求,更多是源于模型训练。至于需要多少,参考GPT-4训练过程中A100卡数量达到万张量级。考虑到服务器采购与租金成本,以及对算力的弹性需求,调试、维护成本,工程师研发时间成本,算力租赁成为大多数大模型厂商的最佳选择。

然而,在目前的算力租赁市场,竞争格局呈现户参与者众多,但格局分散的特点。传统的云服务提供商,高端算力资源相对充足,但对外租赁的比例较少。具备IDC建设运营能力的企业,比如浪潮信息、中科曙光,以及跨行过来做算力的企业也越来越多。

另一个问题,国内在近几年的算力投入下,与国外的差距不断缩小,甚至单从规模上看,已经到了全球顶尖的水准,尤其是智算中心的储备,也远非供不应求的状态。

那么,在这种情况下,为什么还会有那么多公司争相做租赁生意?

事实上,在供需方面,国内的算力规模虽然增长,但面向AI、高性能计算的算力缺口一直存在。根据赛迪顾问的数据,2023年国内智能算力需求达123.6EFLOPS,但供给仅有57.9EFLOPS,不到一半。

另一方面,算力需求未被云计算大厂承接住。据业内人士指出,主要是因为大模型训练需高性能GPU集群,而大厂提供的多是单节点服务,缺乏节点间超高带宽互联基础设施,无法满足需求。

再加上建设新集群成本高,现有基础设施又无法重复利用,并且大厂更关注在单节点可用性与可靠性,在高性能集群业务上并无优势,要不然也不会有其他算力租赁公司的发展机会。

据东吴证券研报,算力租赁公司的毛利率约为40%左右,净利率约为20%左右,最大的一个门槛就是资金——用来硬件采购、场地租赁、运维团队组建;但技术门槛并不高,企业可以通过与技术供应商合作、引进专业人才等方式快速搭建和运营大规模的算力中心。

对于一些主业经营承压、急于寻找新盈利增长点的企业来说,这个新赛道的吸引力巨大。

智算中心的背后逻辑

2023年,莲花控股成立莲花紫星开展算力租赁业务。公告显示,算力项目预计总投入约 2.9 亿元。今年前8个月,莲花紫星营业收入超过3515万元,但净利润为-398.13万元。整体仍处于亏损,主要原因是设备的折旧及利息费用影响金额较大,人员成本支出占比较高,尚未发挥出规模效应。

短时间内赚不到钱,并不是说这不是一门好生意。通过梳理开展算力租赁的A股公司的财务数据发现,大部分的确都处在增收不增利的状态,极少数实现盈利,但这些与“算力”概念相关的企业,最直接的收获,可能就是短期内几乎都出现过明显上涨的股价。

如果要问算力租赁还有哪些不确定性,市场需求、政策变化、技术水平,以及交付和供应链、国产替代等等,都是重要的影响因素。不过对于当下涉足这个赛道的企业来说,更关键的问题是真正的know how。

智算中心并非买了一堆GPU后就能靠租售躺赚。单就硬件部署,要解决的就包括:高性能的AI芯片、异构架构设计、高速低延迟的网络、存储系统、安全配置、监控管理、液冷装置等等复杂步骤。

除此以外,训练算力的租赁对象主要是大模型公司,那么租赁公司,尤其是跨行的企业,怎么获取这些客户资源,获取稳定的客户支持?这些问题在实操的过程中更难解决。截至目前,已经陆续有几家上市公司放弃了算力租赁业务。

那回到开头的话题,智算中心的ROI过低,什么原因?

除了供给与需求的不匹配,地区间的经济发展水平和产业结构差异,比如东部地区算力需求旺盛而供给相对不足之外,最早撇下的泡沫,是那些在缺乏充分市场调研的情况下,盲目投入智算中心建设的公司。

其次,结合算力租赁市场当下的窘境,智算中心的高效运行不仅依赖于高性能的硬件,还需要软件层面的优化和协调。智算不仅仅是卡的问题,而是一个软硬件协调的系统。当软件能力不够时,卡自身的发挥也会受限,导致用卡效率不高。

智算中心不景气,直接影响了算力租赁市场的低迷,反过来,算力资源无法得到有效利用,一些企业因缺乏应用场景而闲置算力资源,造成浪费,如此循环。

值得注意的是,囿于国内外技术差距以及芯片卡脖子,国产替代越发的被反复提及。但在这个过程中,最难解决的是应用生态的问题。

打个比方,如果国内芯片厂商在技术上采取封闭式模式,厂商通过高价设备销售、辅助运营服务等方式实现了商业利益的最大化,虽然能够集中力量办大事,实现端到端的控制。

但封闭性也会导致可用的开源软件、商用软件极少,用户自有软件的迁移适配成本极高,一些用户的软件无法适配,依此建立的智算中心只能处于闲置状态。

相关内容

热门资讯

恒运昌登陆科创板:募资加大研发... 2026年1月28日,深圳市恒运昌真空技术股份有限公司(下称“恒运昌”)成功登陆上交所科创板。 恒运...
原创 在... 在喧嚣中守脑,于混沌里擒龙——2026年1月28日A股复盘如果你今天又在盘中追涨杀跌,被洗得里嫩外焦...
港股风向标|恒指放量拉升逼近2... 财联社1月28日讯(编辑 冯轶)今日港股做多情绪重燃,三大指数高开高走。截至收盘,恒生指数收涨2.5...
恒运昌科创板上市!深圳2026... 1月28日,南都·湾财社记者获悉,深圳市恒运昌真空技术股份有限公司(简称“恒运昌”,股票代码“688...
新票委阵容“鹰味十足”!能否拦... 来源:金十数据 随着多位强硬的“鹰派”成员手握投票权,无论谁掌舵美联储,都将面对一个全新的、更具抵...
UI设计培训优选郴州科泰,专业... 在数字化浪潮席卷全球的今天,UI设计作为连接技术与用户的桥梁,已成为互联网行业不可或缺的核心岗位。据...
康明斯宣布动力系统业务重要人事... 康明斯日前宣布,为进一步推动业务增长与组织能力建设,自2026年2月1日起,现任康明斯动力系统事业部...
多地公布数字人民币最新“成绩单... 2026年伊始,随着新一代数字人民币计量框架、管理体系等正式落地,我国数字人民币试点工作全面迈入2....
洋河股份变脸!取消70亿保底分... 我的好朋友:闺蜜财经 图片由AI生成 撰文|杆姐&编辑|爱丽丝 白酒巨头洋河股份一场“明升实降”的...
两只新股公募网下获配近8亿元 ... 深圳商报·读创客户端记者 陈燕青 公募打新延续积极态势。据公募排排网数据显示,振石股份、恒运昌2只新...
卖零食的,上市首日暴涨88%!... 今天,鸣鸣很忙(01768.HK)正式在港交所主板挂牌上市,成为港股市场上的“量贩零食第一股”。 上...
中国电子等在无锡成立电子基础产... 天眼查App显示,近日,中电科(无锡)电子基础产业股权基金(有限合伙)成立,执行事务合伙人为中电科网...
母婴场景化营销效果:IP活动曝... 在母婴垂直领域,不同平台在用户定位、功能设计和运营模式上存在差异。以下从几个维度对妈妈网、宝宝树和亲...
变盘?危险的下注开始了 作者| 猫哥 来源| 大猫研究所 猫哥来了! 01 今天的行情属于大树底下不长草,个股1涨2跌,成交...
复星医药为多家控股子公司提供担... 来源:中访网 中访网数据 上海复星医药(集团)股份有限公司近日发布公告,披露了其为旗下多家控股子公司...
马云李彦宏,把最烧钱的业务送上... 作者:相青,编辑:嘉辛 2026年伊始,大厂造芯业务的独立进程明显加速。 近期,阿里巴巴也传出消息称...
省政协委员王历彩:发展多式联运... 【编者按】河南省十四届人大四次会议、河南省政协十三届四次会议分别于1月26日、1月25日在郑州开幕。...
港股“AGI第一股”,盘中涨超... 1月28日,港股AGI(通用人工智能)赛道企业云知声上演股价狂飙行情。午后开盘,公司股价不断拉升,最...
十五五时期中小银行发展的八大优... 作者:金融界银行研究院院长陈国汪 中小银行作为我国金融体系的重要组成部分,在服务实体经济、支持地方发...
贵金属风口催生7连板!白银有色... 在贵金属风口与资金追捧的双重推动下,白银有色(601212.SH)股价迎来一波凌厉拉升,成为近期A股...