到了 2022 年,人工智能有哪些真正可落地的应用?
admin
2023-07-04 13:20:43
0

我尝试试图从科学计算角度(AI for Science)来回答这个问题。从这个角度来看,2022年以后,我们未来可能会看到更多相关AI方面的顶刊论文抛弃我们常见的模型-仿真或者模型-实验思维,发展到AI数据处理-总结实验结果上,这是对目前科研模式的一个根本性变化,而且从目前的信息来看,相关进展已经开始落地并实现。

大家都知道,科学研究普遍存在两种目的,一种是为了发现世界上存在的某些普遍规律,这通常适用于自然科学等基础科学,而另一种是为了解决现实中存在的各种问题,这通常适用于大多工程学科。但是随着我们需要解决的问题越来越细节,越来越逼近真实世界,模型的复杂度也就越来越高,单纯的数学工具难以总结出有用规律。AI支持的科学计算就成了同时解决上述两种问题的一个途径。

1. AI 为什么可以 For Science?

在很早很早以前,大概在伽利略时代,当时的科学家主要寄希望于通过观察自然现象来总结规律,以记录,描述和归纳自然现象为特征,从原始的钻木取火,发展到后来以伽利略为代表的文艺复兴时期的科学发展初级阶段,实验开启了现代科学之门。

但是,在当时,实验条件往往非常简陋,实验本身受到的干扰因素过多,并不能非常精确的反映物理现象,所以科学家们开始简化实验模型,开始简化假设,然后通过数学和计算方法进行归纳总结。此后的牛顿时代,随着数学的发展,当时的科学界则通过数学建模和相应的推导归纳总结”第一性原理“,从简单的数学中发现规律,比如信息理论的发展,比如麦克斯韦方程组的简历,再比如牛顿的三大定律。



但由于世界本身的复杂性,对于此后的大多数问题,我们并不能直接建立有效的模型进行解释,因为其数学问题总是过于复杂。这个问题直到上个世纪计算机产业的蓬勃发展,以及随之而来的数字仿真的兴盛,才逐渐开始改变。目前大多数论文都采用的数值仿真,也基本由那时而来。

随着计算机组件的小型化,单位计算成本逐渐降低,计算机仿真越来越多地取代实验,成为科研的常用方法。科学家会希望完成更加精确的物理世界建模,再通过仿真验证自己提出的科学问题和假设,最终(可能会)在现实中完成实验。同时,算法也帮助人类第一次大规模实现了从基本原理出发解决实际问题的能力,并由此构建起了现代工业和技术赖以生存的基础。



即使这些算法取得的解往往不是现实问题”最优“或者”最有效“的解,算法也依然得到了大量发展。其根本原因是,在现实世界里,可以控制的变量往往”过多“,导致需要解决的问题的复杂程度成指数级增长,而受限于人类经验本身,我们自己建立的模型往往并不能完全考虑”如此多“的解。换句话说,我们人类能够设计并理解的计算问题,往往是模型驱动的,而现实世界的模型往往不能直接获得。数据驱动的方法,或许才应该代替现在的方法成为主流。



这样,在未来的科学研究里,我们应该会改变现有的科研流程,也就是上图中的理论→模型→数据→仿真→实验,变成,数据→理论→实验。换句话说,我们有可能会先拥有数据,再从算法中找到这些数据中潜在的模式,人类再总结出通用理论,之后通过实际实验来验证这些结论。

事实上这种已经在科学界讨论多年,也正如上图所述,很多人称之为”第四范式“。即通过大数据分析发现数据中蕴含的大量相关关系。但是,这种方法本身无法从大量的相关关系中甄别出事物的本 质规律。

比如,前几年间,通过对 160 万份病历的大数据分析,研究人员发现帕金森病的起因与人的阑尾有关,此后有些对第四范式十分执着的学者召集了更大量的帕金森病患者以彻查他们的基因,调查他们的生活环境和生活习惯,以期从中发现一些共性。但是,其结论却不尽人意。因为帕金森病患者的生活习惯非常繁杂,而且人往往只有一个阑尾,单独靠第四范式的数据驱动方法做漫无边际的相关性分析,不仅要消耗大量的计算资源,也难以真正预测未来的趋势与变化。



从繁杂的相关关系中找到事物最重要的影响因素的方法其实有望被人工智能改变。从这个角度上看,人工智能对科学的改变不仅在虚拟世界中建立算法模型和模拟实验,甚至在一定程度上让人工智能可以独立完成人类科学家所给出的完整命题,并给出结论。

2. AI for Science的当前进展

就AI for Science领域,大众所知最明显的进展显然是AlphaFold以及其第二代。当然,还包括一些重复性比较高,比较依赖经验的领域,比如:

  • [天文]2017 年,Google AI 研究员Chris Shallue和得克萨斯大学奥斯汀分校的天体物理学家 Andrew Vanderburg通过TensorFlow在距地球 2545光年远的开普勒 90 星系中成功发现两颗新行星,而不论是在此之前还是之后,AI都在相关领域发挥了大量作用,经过训练后的AI预测行星成功率高达90%。
  • [气象]2021年,DeepMind通过观测雷达数据的大规模训练,以过去的雷达数据为基础,对未来的5-90min内的天气作出详细和可信的预测,最终结果非常令人振奋,比当前预测的主流算法实用度和精度都要高出一截。
  • [分子模拟]同样是2021年左右,ACM的戈登贝尔奖颁发给了一个“用机器学习将分子动力学的从头计算方法的精度推至 1 亿个原子”的项目,这某种程度上代表了机器学习领域在分子模拟这个领域的突破进展,而且目前分子模拟相关已经应用在了很多科学模拟过程中。

此外,在类似偏微分方程求解等等一系列非常有挑战性的科学计算领域里,AI都展现出了巨大的潜力。而且,如果大家关注业界咨询的话,其实会发现目前AI的创业公司(甚至很多大厂)都已经在相关领域内开始布局,并大量培养相关的科学计算生态。

因此其实可以相信,目前相关领域其实正在开始落地并真正展现商业化潜力。

3. AI for Science的未来

尽管不管是从商业前景(大家可以仔细观察一下本领域内创业公司的融资速度),还是从学术前景来看,AI科学计算领域都有非常重要大价值,但是其实相关领域的几个关键问题一直在阻碍「科学+AI」进一步发展,而其中大多数都来自算法一线人员与科研一线人员相关知识的差距。

这里包括但是不限于,算法人员在设计AI时经常做出不切实际的假设,并且很少探索科学方法本身,但是相关领域的进展目前却主要依赖AI算法工程师的工作,这就导致很多跨领域的科学问题非常容易被忽略,而即使能够成功开展,也需要AI算法工程师与科研人员之间密切的交流。

比如在AlphaFold里,就有数十位各领域顶尖研究员的密切合作,才会带来AI在蛋白质预测领域的不断发展和真正落地。

所以,从这个角度,AI for Science需要开展更多相关工作,联系其各领域的科研人员,才能完成更多创新。

大概这样。

相关内容