人工智能从架构上分为三层,基础层、技术和产品层、应用层。基础层主要是为人工智能技术提供计算能力、数据输入和计算模型(算法),包括超算/云计算平台,GPU/FPGA/NPU等人工智能芯片,相关的数据资源以及大数据工具、以及相应的神经网络、分类、聚类回归等算法。技术和产品层主要结合相应的软件技术、AI框架(Caffe/Tensorflow)、结合行业数据形成相应的软硬件产品,包括AI平台和中台、云边端设备(云端服务器、终端设备、边端设备)以及基于行业或场景的解决方案,应用层主要为下游各行业商业落地场景是国内人工智能发展最为活跃的领域,呈现出百花齐放的态势,主要应用包括在金融、交通、安防、工业等行业,形成智能安防、智能投顾、智能客服、智能家居、无人驾驶、机器人等多个落地场景。
从产品角度,伴随着人工智能的发展,除了上游AI芯片成为核心零部件,在中游产生相应云端的服务器、边端智能设备和终端设备和智能传感器,在下游形成面对具体应用和场景的解决方案。
人工智能(AI)概念自1956年提出到现在,大致经历了三个阶段:1)基于符号规则的人工智能,2)基于数据连接的人工智能,3)规则和深度学习融合的可信安全人工智能,目前正在朝着第三代方向发展。
从1956年开始,主要将人的知识经验形成相应的符号规则进行推理,80年代基于知识库形成专家系统,但由于计算力有限,加上知识和规则无法穷尽,其智能程度和应用场景非常受限。到了90年代,基于数据的机器学习算法逐渐成熟,包括神经网络、和基于支持向量机的浅层机器学习算法受到关注,在分类和回归问题上取得很好的效果。但这些算法存在无法处理大数据以及存在梯度消失等问题。直到2006年“深度学习”概念被提出,基于统计学习的人工智能进入快速发展期,并取得很多重大突破性的成果。经历了10年的发展,深度学习已经广泛应用于各个场景,但依旧存在一些问题,主要是由于基于统计的深度学习是基于神经网络,具有不可解释性,因此面对重大问题无法解决可信的问题。近年来,清华大学张拔院士提出基于知识和数据融合的第三代人工智能,需要融合知识规则和深度学习,继希望能够解决可信和安全的问题。
2.2人工智能技术发展
目前人工智能大多数应用还主要是基于第二代人工智能(数据和学习)。从数据处理到得出结论需要经历训练和推理两个过程,其中训练主要解决建模的问题,推理主要解决问题分析判断的问题。算法、算力和数据是基于深度学习的人工智能的三大生产要素,预计未来第三代人工智能发展成熟后,知识将成为第四大生产要素。
从数据种类角度,目前数据主要可以分为三大类,主要包括图像、语音和文字数据。从数据是否进行格式化,可以分为结构化数据(表格、数据库)和非结构化数据(文本、图像)。图像数据占据人类获取信息量,以及存储空间的70%以上,目前深度学习的主要应用领域也是图像和语音。由于深度学习对数据量有较大需求,因此对数据管理也提出了一定的需求。在数据管理方面主要是数据库相关技术的发展和进步,为了满足实际需求而推动数据库相关的技术发展。一方面,从早期传统关系型数据库逐渐形成非关系型数据库,解决非结构化数据的高效查询和存储问题。在架构上传统数据库主要是集中式数据库,随着云计算的兴起,分布式数据库技术得到发展,解决了数据异地存储、同步和读写计算的问题。从数据存储架构来讲,针对数据的存储、清洗以及分析也逐渐形成相应的中间件产品和概念,包括大数据平台、数据仓库、数据湖以及最新兴起的数据中台。
从算力角度,算力主要依托于计算芯片产品,目前提供的方案有基于传统芯片(GPU/CPU/FPGA)方案,也有基于人工智能算法设计的芯片,包括通用型芯片和专用ASIC芯片。在芯片领域,GPU/FPGA/神经网络芯片三分天下。芯片产品的发展驱动力一方面来自芯片制程工艺的推进,另一方面来源于需求推动。为满足训练和推理以及各种应用场景数据计算的需求,需要更低功耗,更高效率的产品或方案。从而推动新的智能处理器芯片设计技术的发展,底层主要包括智能处理器指令集、微架构、高性能数据库等芯片设计技术。芯片之上推动着相应的服务器或智能终端的发展,其更多是针对具体功能和应用形成相对专用高效的方案。
从算法角度观察,算法和数据和具体落地行业和应用紧密结合,不同应用具有较大的差异性。算法的发展历史就是人工智能的发展历史。1950-1970年代,属于人工智能的“推理时代”,1970-1990年代,人工智能进入”知识工程“时代;2000年至今,人工智能的”数据挖掘“时代。期间伴随着感知器算法,神经网络算法、BP算法、随机森林、k-临近、朴素贝叶斯、决策树算法,支持向量机算法的出现。直到近期在神经网络的分支发展处深度神经网络,并得到快速发展。
最新算法的发展方面,在通用底层算法领域,2014年谷歌Lan Goodfellow 提出GAN,生产模型和判别模型两个模型框架,在图像生成和语义分割方面具有很好的效果。2017年Hinton 提出胶囊网络解决CNN空间关系的识别判断问题。此外联合学习和强化学习分别对提出,其中联合学习可以提高数据的丰富性,同时保护敏感数据,强化学习解决了时间上序贯决策问题。
在人工智能技术落地到具体场景,解决具体问题的时候,需要融合并形成对应的产品。最早人工智能仅仅指一些机器学习算法,在实验室搭建几台服务器进行数据清洗,训练和推理。随着神经网络分支的深度学习的突破性进展,行业的应用和需求爆发。深度学习需要依托于庞大的数据集,以及高效的计算能力,因此伴随着发展出现了相应的标准化的产品,满足数据、算法、算力的需求,如 第二章-2.1 产业链架构图中,在不同的环节形成多种产品。
人工智能对数据的存储并没有特殊的要求,主要是面对大数据量的时候能够进行高效的查找计算。结构化数据库和非结构化数据库并不是相互替代而是相互补充的关系。主流的SQL数据库包括MySQL、Orcal,非结构化数据库包括MongDB、HBase、Redis、Flare、CouchDB 、Elastic。此外随着NLP和知识图谱的发展,图数据库的重要性也越来越突出,图数据属于NoSQL的一种,但主要为满足图谱的网络结构而设计,目前主流的图数据库包括Neo4j、FlockDB、GraphDB、HugeGraph等。
(2)算力
在底层算力层,形成的产品包括人工智能芯片、加速板卡、人工智能服务器等。芯片按照类型可以分为传统芯片和新型智能芯片,早期人工智能处理训练问题还主要使用多个传统GPU、CPU来解决。但随着行业的发展,设计更加适合深度学习、机器学习的芯片成了当务之急。国外主要芯片厂商包括英伟达、intel、谷歌、高通等国际芯片大厂,国内新成立的公司包括地平线、中星微、寒武纪、深鉴、灵汐、比特大陆、云知声等,其中不乏快速长大的独角兽企业。具体形成的代表性产品如下表:
资料来源:寒武纪招股说明书
而在芯片之上,形成了一些针对特定技术的开发平台/板卡,比如英伟达的自动驾驶平台NVIDA DRIVE AGX、针对机器学习和人工智能的NVIDA DGXTM 系统。该平台通过集成AI软件套件,从而简化部属,帮助开发者从原来几个月时间搭建平台变成几个小时。此外还有深鉴科技的人脸监测识别模组DP-1200-F1,主要基于FPGA针对人脸识别形成高效的开发模组。地平线的MATRIX自动驾驶计算平台,能够帮助快速搭建自动驾驶的计算系统,边缘AI计算性能,满足高性能、低功耗需求,可提供 L4 级别的自动驾驶感知系统。
在算法方面,形成产品类型包括开源框架、AI中台。机器学习框架最主流的有TensorFlow和Pytorch。
由于开源框架无法直接应用于实际应用,还需要进行很多接口开发,以及提升框架的稳定性和易用性。基于开源框架可以形成具有行业特征的AI中台或者数据中台,中台中包含各种深度学习框架,并添加了许多企业中间件,从而方便开发者的使用,甚至可以做到拖拽式的使用分析。典型的比如第四范式的4 Paradigm sage EE。如下图4 Paradigm sage EE包含4部分组件,用大规模分布式架构实现高效的离线计算和实时计算,能力覆盖从数据处理、模型调研、应用构建、应用上线到AI治理全流程,为企业和开发者提供超高维、高性能、低门槛、可扩展、企业级的AI平台级解决方案.,助力企业优化运营效率,提升决策水平,开拓全新商业模式,实现AI时代的业务转型。
在具体的落地应用中,通常会将算力和算法融合形成标准化的产品,比如在云端、边端、终端形成智能化硬件,云端主要是以服务器为主,边端主要为智能盒子、智能处理系统,终端包括各种智能传感器。云端服务器主要为了满足训练所需的大数据量计算而设计,类似很久以前的超级计算机。在边端主要为了满足多个终端的上传的数据处理和协同和管理,比如自动驾驶系统需要同时处理多路激光雷达、摄像头、毫米波雷达等传感器的数据。电厂、电站以及传统工厂等在传统摄像机的基础上可以通过智能边端实时对数据进行回传处理。在终端主要为了解决实时高效计算的需求,同时由于数据量大,影响网络传输,因此通常需要在边端进行预处理,将信息进行结构化,再进行传输,主要应用场景包括人脸抓拍、汽车车纹识别、交通违章识别、电路巡检、工厂安监等应用场景。边端和终端主要是为了满足推理的计算需求,其在设计上对于计算性能以及功耗、硬件体积均具有一定的要求。
上一篇:管理熵系统——让企业管理可被测量
下一篇:吉林大学企业管理考研?