趋境科技获高瓴创投、Z基金领投天使轮,助力企业10倍降本部署DeepSeek|甲子光年
创始人
2025-02-27 15:21:58
0

AI私有化部署的破局者浮出水面。

作者|田思奇 ‍‍

编辑|王博

AI推理需求的狂飙,从2024年延续到2025年春天。一个更紧迫的命题出现了:如何在保证性能的前提下,系统性降低千亿级大模型的部署成本?

在AI Infra赛道,又一家“清华系” 明星公司登台亮相,带来了别具一格的破局方案。

「甲子光年」获悉, 趋境科技(Approaching.AI)近日已完成数千万元天使轮融资,本轮融资由高瓴创投(GL Ventures)、Z基金领投,水木校友种子基金跟投,老股东真知创投继续追投。

图片来源:趋境科技

完成融资后,趋境科技将在研发投入上加大力度,加速大模型推理软硬一体工作站和服务器等产品的迭代升级,同时全力推动更高性能的大模型推理引擎的研发与落地应用,助力更多企业在大模型领域实现落地实践。

值得一提的是本轮融资的行业背景。今年春节过后,能源、通信、汽车、金融、建筑等多个领域的国央企相继宣布完成DeepSeek大模型私有化部署。就连英伟达特供中国的“阉割版”AI芯片H20,也因 DeepSeek模型部署需求而翻红。

不过,「甲子光年」留意到,千亿参数模型私有化部署仍困难重重。成本高昂、推理耗时久,中小企业预算压力巨大,部分企业无奈选用轻量化模型,这在一定程度上牺牲了模型的智能化水平。

也就是说,从 “能用” 到 “好用”,还有很长的路要走。

IDC数据显示,中国AI算力市场将从2024年的190亿美元增长到2028年的552亿美元。未来五年,中国推理算力需求年复合增速将达190%。为了进一步帮企业减轻负担, 行业迫切需要高性价比的AI Infra解决方案

趋境科技这家成立仅一年多的企业, 凭借 “以存换算” 和全系统异构协同优化的创新路径,成功突破了千亿参数模型落地过程中的 “成本高企” 与 “性能折损” 双重困境,成为AI Infra领域备受瞩目的新兴力量。

那么,它究竟是如何做到的?

1.以存换算与全系统异构协同,释放推理潜能

清华系团队是AI Infra赛道的中流砥柱,趋境科技也是其中的佼佼者。该公司成立于2023年底,由真知创投创始人任旭阳、清华大学计算机科学与技术系教授武永卫联合发起,核心管理团队,包括CEO艾智远、首席战略官陈超、研发负责人陈祥麟,均出身武永卫教授门下,创业前在业内知名企业主导关键产品的研发与交付。

清华大学的KVCache.AI团队,也是趋境科技的长期深度技术合作伙伴。双方的合作使趋境科技兼具领先的技术创新视角和产品实践视角。双方优势互补, 为突破效率、效果、成本所构成的“不可能三角”,提供了新的解决思路和探索方向。

早在去年7月,趋境科技与清华KVCache.AI团队就前瞻性地提出GPU/CPU的异构协同推理架构,并合作开源 KTransformers项目。借助该项目,仅需单个消费级GPU配合CPU,就能完成数千亿规模的高效稀疏大模型推理。

今年2月10日,更新后的KTransformers宣布支持DeepSeek-R1/V3 671B大模型,迅速在国内外社区引发强烈反响,GitHub星标在短短几天内突破1万,开发者们纷纷自行复现并发布部署教学视频。有B站up主的教学视频发布当天播放量超过20万,登上全站热搜榜第一名。

在个人用户的单并发使用场景下,从开发者复现的数据来看,该更新实际内存占用约380G,显存占用约14G,一些用户计算发现,其成本不到7万元。在开源社区里,甚至还有开发者用5000成本自行搭配硬件,复现了单并发在4-5tokens/s输出速度的方案。

基于以存换算和全系统异构协同的核心技术,趋境科技近期还推出产品——AI大模型推理软硬一体工作站,将DeepSeek大模型起步部署门槛降低90%。

工作站面向中低并发场景,单台塔式机器即可支持DeepSeek 671B参数模型的流畅推理,还支持各主流大模型的推理,最多可同时支持3个大模型的并发服务。该工作站采用液冷散热与软硬一体设计,运行安静无噪,内置AI办公套件,做到了“开箱即用”,让中小团队以较低成本获得强大的推理能力。

图片来源:趋境科技

2.趋势引领,重塑AI Infra价值

通过底层架构创新,趋境科技开创了软硬协同的 “智算” 新范式。在行业落地过程中,这些创新技术也正在助力企业在大模型领域实现更多可能性,推动行业朝着更高效、更智能的方向发展。

目前,趋境科技的推理工作站已在政务、金融、法律等领域逐步落地应用,同时与领军安全企业长亭科技、中国信创云先行者中国电子云等厂商建立了战略合作关系。

「甲子光年」注意到,趋境科技的技术突破揭示了AI Infra领域的三大趋势,为行业提供了新的发展范式。

首先,是从 “训练自由” 走向 “推理自由”。随着Scaling Law向推理阶段转移,算力基建需要从GPU单点优化转向全系统协同。以往算力运用较为分散,而趋境科技的架构将这些算力整合起来,形成高效协同的 “作战部队”。通过 “以存换算” 技术,趋境科技将存力转化为算力补充,降低对算力的过度依赖。

第二,助力国产算力生态发展。面对国产GPU性能与英伟达存在差距的现状,趋境科技另辟蹊径,通过异构协同优化技术,降低了对高端硬件的依赖。它将CPU、GPU等算力紧密整合,让全系统异构设备实现高效联动,成功突破了显存容量的限制,充分释放了全系统的存力和算力。这不仅推动了国产算力生态的发展,还大幅降低了大模型的落地成本。

同时,在趋境科技的助力下,企业在垂直领域实现 “轻量化” 部署成为可能。在中低并发场景下,企业无需再耗费巨资自建百万级集群,能够以更低的成本和更快的速度完成大模型的私有化部署。对于成本预算有限、急切期望将大模型应用于实际业务的企业而言,是极具价值的高效解决方案,也是实现数字化转型的一条捷径。

对于正在探索大模型落地的企业而言,与其在算力军备竞赛中苦苦挣扎,不妨也将目光聚焦于如何以更低成本、更高效率地释放模型潜力。

在算力基础设施重心从训练转向推理的趋势下,趋境科技以 “技术 + 场景” 双轮驱动,用技术创新诠释了AI Infra的 “新基建” 价值。也为行业发展提供了可借鉴的思路。

正如该公司所言,AI民主化不是降低智力标准,而是重构技术边界,让每个勇于创新的团队,都能平等获取这个时代最顶尖的AI生产力。

(封面图和文中未说明图片由AI生成)

相关内容

热门资讯

硕恩网络启动北交所IPO:年入... 瑞财经 王敏 1月21日,上海硕恩网络科技股份有限公司(以下简称“硕恩网络”)在上海监管局启动IPO...
黄金牛市终结信号?特朗普放过欧... 来源:市场资讯 文章来源:汇通财经 周三(1月21日)尾盘,黄金价格从历史高点附近出现明显回调,主要...
【乳品科普】巴氏杀菌机核心技术... 提到乳品加工设备,巴氏杀菌机是基础中的基础,但多数人只知其 “加热杀菌” 的表象,却不懂核心部件的技...
【要闻】何朝晖率队赴上海开展招... △1月18日至20日,娄底市委副书记、市长何朝晖率队赴上海开展招商考察,聚焦产业协作、科技创新与区域...
5400美元!高盛大幅上调黄金... 黄金市场的游戏规则已经改变。黄金不再仅仅是央行的游戏,私营部门的巨鲸们正在入场,并且他们是为了对冲“...
苏州银行招标结果:苏州银行股份... 证券之星消息,根据天眼查APP-财产线索数据整理,苏州银行股份有限公司1月20日发布《苏州银行股份有...
2026年新手炒黄金实战:不想... 2026年的金融市场像极了一场过山车,全球流动性的反复收紧让金价波动率创下了近五年的新高。看着K线图...
「杭州社淘」海外食品饮品品牌的... 进入中国市场,对于海外食品饮品品牌而言,是巨大的机遇,也意味着要穿越一道复杂的“本土化”峡谷。峡谷的...
萤石网络2025年成绩单:营收... 1月20日,萤石网络发布2025年度业绩快报公告。公告显示,2025年该公司实现营业总收入59.01...
赣锋锂业在上海成立全球能源科技... 每经AI快讯,天眼查工商信息显示,近日,赣锋全球(上海)能源科技有限公司成立,法定代表人为张頔源,注...
原创 准... 最近,特朗普又挥起了他的关税大棒,扬言要对法国葡萄酒和香槟征收高达200%的关税。要知道,中美贸易战...
A股窄幅震荡,沪指半日微跌0.... 每经记者|刘明涛 每经编辑|赵云 1月22日,A股窄幅整理,截至上午收盘,上证指数跌0.15%报4...
溢价超4000倍!白银有色未竞... 来源:每日经济新闻 一场引人关注的金矿争夺战落幕,交易金额创下甘肃金属矿成交纪录,而竞拍中的失意者...
银发商店受欢迎 本报记者 季觉苏 市民在上海银发商店试拉小提琴。 在上海银发商店,工作人员在展示拐杖凳。 以上图...
柬埔寨太子集团旗下公司疑充当美... 近日,美国做空机构CapitalWatch发布了一份针对纳斯达克上市公司AppLovin的深度调查报...
某银行2025业绩佳,A股看多 2026年1月20日收盘后发布2025年业绩快报。2025年公司营收719.68亿元,同比增8.01...
别人吃肉我喝汤?致那些正在“煎... 最近的行情确实让不少持仓红利的朋友感到“煎熬”。一边是半导体、AI、商业航天等科技板块热火朝天,仿佛...
这场公益行动上,微马跑友体验了... 大众卫生报·新湖南客户端1月20日讯(通讯员 蒋连军)1月18日,一场以“运动有爱,再生无碍”为主题...
1.22:早盘冲高回落,午后A... 周四早盘,沪深A股走出了预期中的冲高上涨,但是冲高回落。盘面上看,多数个股上涨,人气还不错。早盘冲高...
马斯克“大战”奥尔特曼,扯下了... 1月21日,马斯克和创造了ChatGPT的OpenAI公司CEO奥尔特曼在社交媒体上发生了一场“大战...