一、云计算是什么?
二、中国的云计算行业是如何发展至今的?
在回答问题之前,我们先了解下背景:
随着因特网的普及,大规模化的应用日渐新增,比如搜索引擎、数据库、AI系统等,用单台计算机已经支撑不起来了,投入的研发成本远大于收益,换言之,传统的算力结构已经到顶,目光开始聚焦在集群上。既然一台计算机不够,那就用多个计算机组成一个服务器集群,整体抽象为一台逻辑计算机。
至此,算力革命开始,衍生出一批新时代的算力企业:AWS、谷歌云等,迅速占领国际市场。
回到一问题,通俗理解,云计算是一种算力的使用方式,它能将服务器群组接入网络,由运营方来负责服务器集群的运维,使用方只需要提出请求,通过网络得到分配的计算资源即可。
你可以将这里的云想象成一台超级计算机,它拥有一个超级大的水池,通过网络管道,池子里的算力被用来分给各种计算服务。因此云计算具备了灵活性、按需分配资源、实现效率最大化的特点,把算力变成电力一样的单元。
以上引出了一个问题:云计算带来的算力革命为何如此重要?
如果把数据看成新时代的石油,算力就相当于开采和炼油设备,没有算力,数据就是一堆0和1构成的冗杂编码,无法发挥价值。此外,算力还是一个承上启下的中间层,连接着芯片研发和自主软件的上下游。
但在十多年前的中国,没人意识到这代表着什么。时间拉回10年前,当时要部署一台线上且可用服务器,需要什么?答案是:集群、路由、数据库、系统、机房、水冷、运维+一个保安。彼时,这是不可接收的成本。“不过是把一些东西放到网上,需要这么多屁事吗?”——这是中国过去的计算行业一直难以突破,技术依赖国外,比如:人工智能、量子计算、新一代通讯等等。
由于我国的计算机行业起步太晚,互联网才刚迎来风口,大家都在埋头赚钱,企业普遍没有什么算力瓶颈,对于互联网公司,产品日活的正常才是重要的。而像云计算这样的超大算力集群建设,无论是投资基础设施还是集成应用,回报周期太长。
21世纪初,国内还停留在hao123引流的门户时代,没几个人听说云计算、数据中心。但在国外,这场算力的革命已经进行到下半场了。IBM、亚马孙、微软等巨头已经开始从单机计算转向分布式计算。
结局和芯片、操作系统一样,在这一轮的技术变革中落后了。
此时,作为微软亚洲研究院副院长的王坚。带队研究的方向之一叫做,分布式计算系统,这套系统的另一个名字:云计算。08年冬天王坚离开微软,成立了阿里云团队,独立于其他业务之外。
无OS、无芯片、无计算系统,在这个条件下,从0啃下云计算,这也是他们将自研的云计算系统命名为飞天的原因之一。云计算的研发需要完成看似简单的两个步骤:造云、上云。在埋头研发了5年后,阿里云团队用最硬核的拔电源测试法,让5000台服务器断电重启(造云的及格线就是稳定调度5000台服务器),并恢复了正常运行,这意味着造云成功了。接下来就是需要上云用云才能知道系统有哪些Bug。先是阿里金融,在09年底完成了新版本上线,阿里金融的运行总算稳定下来;而这也为后来的支付宝提供了大规模服务打下了基础。接下来,淘宝、天猫团队陆续接入阿里云,在短期试错后稳定运行。
除了内部上云,当时还有一家来自上海的小工作室也找到了阿里云,想要尝试在云上部署游戏服务器,上云节省了大量的运维成本,让内部能更专注于游戏研发,这家工作室就是今天的米哈游,崩坏和原神至今仍运行在阿里云上。到了13年,阿里云自研的平台系统成为了各项业务通用的计算平台。所有的计算都开始迁移到以飞天为基础的系统上,同年7月,淘宝最后一个Oracle数据库下线,阿里用了5年时间,在超高速行驶中没有踩一脚刹车,成功为整个集团的算力平台更换了发动机。在核心系统稳定上云后,阿里云才终于有了大规模对外提供服务的底气。
2019年,王坚当选了中国工程院院士。作为一个自学计算机出身的博士,他完成了一个在外人看来不可能完成的任务。(致敬,泪目~)