在介绍字节芯片之前,先了解一下字节的系统部团队,此团队主要负责字节跳动数据中心、服务器、网络、CDN等基础设施的设计、研发,采购、交付与管理,为公司业务的发展以及企业客户提供高效,稳定、具备可扩展性的基础设施。
部门当前业务开展包括数据中心设计建设、实施,芯片与服务器研发,网络工程研发,接入与分发技术,以及高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链等众多底层软硬件技术与方向。
今天要介绍的芯片部门也就是属于上面说的系统部,团队负责人为技术总监王剑,他向杨震原汇报。王剑是字节今年成立的开源委员会的主要负责人之一,他于 2016 年加入字节跳动,主要工作经验在于网络和数据系统架构。
从汇报对象可见到字节对芯片的重视程度极高。
在2022 火山引擎原动力大会上,负责字节跳动火山引擎和数据中台的副总裁杨震原首次透露了字节的芯片自研进展,称自研芯片涉及视频编解码、云端推理加速等场景,并称字节也在和芯片供应商探索 RISC 架构芯片在云端的使用,目前字节并没有开发 CPU、GPU 等通用芯片,已启动的各芯片自研自用,不会对外销售。
官网招聘信息可以看到,字节在芯片方面招聘的岗位基本上是全流程的,包括AI/SOC架构、设计、验证、后端,甚至封装设计、产品等,从这一点看,同属于互联网造芯,字节比腾讯在自研方面投入更大,腾讯芯片规模较小,主要岗位集中在设计方面,更多的是合作。
据了解,目前字节AI芯片进展迅速,第一代可能已经流片,进入量产测试阶段。
之前有篇文章,整体介绍了互联网造芯的情况《互联网"芯"事系列篇》,目前国内互联网造芯大致可以分为两种:
一种是以腾讯为代表的“投资 + 部分自研” 模式,团队规模相对小,芯片自用。
腾讯云与智慧事业群 CEO 汤道生表示,腾讯造芯的核心思路是基于自身需求,要么降低成本,要么更高效地使用基础设施。
之所以强调芯片自用,可能也和当下形势有关,目前腾讯云服务器CPU大部分仍由英特尔和AMD等公司提供。而腾讯的专有云企业版则使用“一云多芯异构兼容”方案,X86架构使用英特尔以及国产“海光”处理器,GPU部分由英伟达提供技术支持;ARM架构使用华为鲲鹏以及飞腾的处理器方案。如果大张旗鼓的宣布自研,可能在合作和利益上有所损失,字节对外宣布自用,大概率也是因为这个。
另一种以阿里的平头哥和百度昆仑芯为代表,除了自用,他们也希望对外售卖芯片,有更大市场企图。
目前昆仑芯从百度独立出来,ai芯片已经量产。阿里的野心则更大,数据中心通用芯片 ARM CPU 倚天 710芯片,不管是性能还是技术复杂度,可谓是国内首屈一指。
此外,有信息透露,之前阿里与浙江国资组成的联合体曾竞购拥有重要半导体资产的紫光集团,如果成功,阿里将把芯片业务版图拓展至手机终端芯片(紫光展锐)、存储器(紫光旗下长江存储),并获得与云计算业务紧密协同的服务器业务(紫光旗下新华三),但最终未能成功。
字节目前的造芯路线和腾讯类似。腾讯投资了 AI 芯片公司燧原、DPU 公司云豹、AI 视觉芯片公司爱芯等;字节对外投资 RISC-V 初创企业睿思芯、基于 RISC-V 架构的 AI 处理器厂商希姆计算、GPU 公司摩尔线程和 DPU 公司云脉芯联等。
字节造芯一方面是互联网造芯的趋势,另一方面是为了降低成本,为自己的业务场景打造更适合的芯片。
字节已启动的主要芯片项目与其业务密切相关:AI 芯片用以处理大量推荐算法;视频编解码芯片对应抖音、TikTok 等字节短视频应用的海量视频处理需求;FPGA 智能网卡对应提升数据中心整体效率的需求。据杨震原透露,字节 95% 的业务已经跑在自己的数据中心上。智能网卡的功能就是将不同数据处理工作合理分配给 CPU 或 GPU,从 CPU 手中接管网络、安全、虚拟化、存储等数据中心运维任务,提升效率。
在用量足够大的情况下,自研芯片可减少成本,更好控制供应,同时可实现更好的软硬协同,提升整体效果。
系统部负责人王剑直接向公司副总裁杨震原汇报,在王剑之下,芯片团队有数位技术负责人。
AI 芯片部门主要负责人是施云峰和李继峰。施云峰毕业于北京大学信息科学技术学院,有 14年工作经验,先后任职于联发科、美满和华芯通(高通与贵州政府成立的合资公司),于 2018 年加入字节,主要负责前端。
李继峰同样毕业于北大,2020 年加入字节前曾任职于 IBM、EDA 厂商 Cadence 和比特大陆,主要负责后端。
RISC-V 项目和服务器芯片项目由卢山(Shan Lu)负责。卢山从业超过 20 年,曾先后在美国英特尔和高通工作,有参与开发服务器、IoT 等场景的多类芯片的经验,2019 年加入字节跳动。小道消息透露,近期可能有新的人选会接替这个位置,持续关注中。
FPGA NIC 项目由罗腊咏负责,他毕业于中科大电子工程与信息科学系,曾任职于微软亚洲研究院和腾讯网络平台部。FPGA NIC 是实现智能网卡和 DPU(数据处理器,可以被视作升级版的智能网卡) 的方案之一,优势是更灵活、更易应对业务变化。
互联网在芯片行业可能还会发生很多故事,国外谷歌的TPU、亚马逊的Inferentia,国内的平头哥、昆仑芯、腾讯字节等,陆续还会有很多互联网大厂布局芯片行业,可能更多的是投资的形式。
未来可能有很多芯片公司出现和消失,但可以肯定的是国内芯片的发展会持续向前,中国"芯"系列文章持续更新分享。
诗说芯语用芯陪伴,讲述芯片行业故事,关注芯片市场发展,聚焦芯片行业资讯和公司招聘信息
往期文章:中国"芯"势力-星云智联
中国"芯"势力-壁仞
中国"芯"势力-沐曦
中国"芯"势力-摩尔线程
中国"芯"势力-寒武纪
下一篇:2023年如何把握互联网