AI+Semiconductor:AI/ML在半导体制造业的应用
admin
2023-09-09 02:24:07
0

全文2.3万字左右,欢迎各位看官耐心阅读。另外,

为对AI+Semicondutor感兴趣的朋友找一个交流的地方,有兴趣的朋友,可以加入,共同交流AI在半导体集成电路领域各个场景下的应用。

后面可能因为人数原因,需要邀请才能进入,后面的朋友可以在我的主页上找我的联系方式,我来邀请。



引言

关于机器学习在半导体领域的应用这一话题,目前互联网上的著作已经汗牛充栋,本文也仅仅是进行冰山一角似的介绍。

目前Machine Learning或者AI已经在超大规模集成电路的诸多方向产生了应用,无论是学术界还是工业界都做了相应的探索,并且在诸多方面取得了成功。因此,本文的撰写目的是:1)目前有哪些在工业界已经落地的项目;2)还有哪些目前学术界和工业界依旧在探索中前进。另外,下文中,如果出现的包括Machine Learning、AI、ML,大数据分析,我们都将其称之为AI,虽然严格意义上不能画等号。还有一点说明,虽然是说半导体产业还是还是讲的集成电路产业,虽然不能画等号。

目前AI在半导体制造业领域的应用主要集中在如下几个方面:1)面向集成电路主要产业链,集中在集成电路设计、制造、封装;2)面向集成电路支撑产业,材料和设备以及EDA等软件公司。



工业界最佳实践

本章节主要从工业界视角,根据相关报道对半导体产业(实际上依旧是集成电路产业为主)中应用AI/ML技术的玩家进行相关的综述。与其他研究报告不同的是,本章节不仅仅从芯片制造商(包括IDM、Fab)的角度展开,也会对包括材料商、设备厂商、软件公司(EDA软件公司、数据分析软件公司)、OSAT等多个角度展开。因此,在综述本章节内容的时候,会涉及到包括Intel、Applied Materials、Micron、TSMC、ASML等诸多公司。

Intel(英特尔)

作为全球顶尖的半导体制造商,Intel早就将AI应用于半导体制造领域。Intel针对AI在半导体制造领域的应用发布了白皮书《High-Value AI in Intel’s Semiconductor Manufacturing Environment》。在其发布的白皮书中,Intel介绍了目前在其工厂中所采用的AI技术,如下图所示。目前而言,英特尔公司正在生产数千款人工智能模型。




图 The adoption of AI in Intel’s factories includes various applications

上图揭示了Intel在探索AI与半导体制造的结合,其应用场景广泛。比如ML-based Advanced Process Control属于集成电路领域非常重要的APC领域;Process Tool Matching属于工具管理领域,在集成电路中很多情况下将Fab中的设备或者装备叫做Tool;Automatic Defect Classification属于缺陷分类领域(Defect Classifying),这个领域也是半导体中AI应用较为广泛的领域。此外还有包括RCA(Root Cause Analysis)、测试等诸多领域。

在白皮书中,Intel不仅仅介绍了他们的AI应用,其还介绍了Intel是如何开展AI在半导体制造领域应用的考量,或者叫做方法论,也可以叫做原则。当然了,Intel将其称之为框架(Prioritizing AI Use Cases to Optimize Business Value)。通过这个框架,Intel来分析和决策将AI应用于工厂的具体场景中。

在这个被称之为优先级框架的架构下,其三个主要部分分别是:(1)实质性的业务价值;(2)可行性;(3)实现价值的时间。具体如下图所示。




图 Prioritization matrix for AI projects.

结合上图,在进行AI/ML战略时,实施和规划团队可以结合如下具体问题展开。比如:

1)有成本、生产力或良率收益吗?

2) 目标应用程序是否具有容错性?也就是说,偶尔出现的假阳性可以接受吗?

3) 该解决方案能够真正实现大规模的自动化吗?也就是说,它能否能够将人工智能模型集成到现有的人工智能制造自动化系统中

4)该解决方案能够真正实现大规模的自动化吗?也就是说,它能否能够将人工智能模型集成到现有的人工智能制造自动化系统中?

在白皮书中,Intel提及到其AI/ML技术的实施和应用提到了其围绕清晰的目标展开,同时借助POC(Proof of Concept)等手段,取得了不错的成果,并列举了三个AI应用相关的案例。这三个案例分别是:1)ADC with Computer Vision and Machine Learning;2)Root-Cause Analysis;3)Sort Test Probe Card Inspection。具体这三个案例,我将会在后面的具体章节中展开。

此外,Intel也在白皮书中做了对大数据分析项目失败案例的思考,以及针对AI/ML在半导体制造业领域的应用的呼吁。

TSMC(台积电)

TSMC一般指台积电,是一家目前执半导体制造之牛耳的半导体制造厂商。关于TSMC在半导体制造中应用AI技术的报道已经有不少了。在这里主要简单的引用两个资料。

早在2020年8月份,就已经有国外媒体报道,台积电(TSMC)已经在使用人工智能和机器学习技术来改进他们的芯片生产。

TSMC在其官网上介绍道[1],“公司先进、敏捷和智能的操作系统继续推动卓越制造。台积电整合人工智能、机器学习、专家系统和先进算法,构建智能制造环境。智能制造技术广泛应用于调度和调度、员工生产力、设备生产力、工艺和设备控制、质量防御和机器人控制,以优化质量、生产力、效率和灵活性,同时最大限度地提高成本效益并加速整体创新。台积电还整合了智能移动设备、物联网和移动机器人等新应用,并结合智能自动化材料处理系统(AMHS),整合晶圆制造数据收集和分析,有效利用制造资源,最大限度地提高制造效率。因此,该系统提供了快速启动、短周期、稳定的制造、准时交付和总体质量满意度,并提供了极大的灵活性,可以在需要时快速支持客户的紧急拉入请求。”。

下图所示为TSMC在“Agile and Intelligent Operations”中所提到的Intelligent Fab。




Intelligent Fab with self-diagnosis and self-feedback capabilities. Source:TSMC

关于TSMC在Metrology中结合AI技术的介绍,主要是来自于其团队在VLSI Workshop上所做的报告[2]。TSMC的Yi-hung Lin在其报告《Metrology with Angstrom Accuracy Required by Logic IC Manufacturing-Challenges From R&D to High Volume Manufacturing and Solutions in the AI Era》中对AI时代的半导体量测技术做了回顾和展望[3]

其对目前半导体制造中的Metrology的现状和未来的展望如下图所示。




图 半导体制造中的量测技术的AS-IS与TO BE

之后,Lin介绍了目前在半导体量测技术中的量测技术以及他们目前将AI与之结合做得尝试。包括将AI与Optical Critical Dimension (OCD) Spectroscopy、Transmission Electron Microscopy(TEM)、1.3.Scanning Electron Microscopy(SEM)等技术的结合。

在报告中Lin等人还对将AI与Metrology结合的技术要求做了总结,相关内容将会在后文的半导体量测与AI结合的章节中展开描述。

Micron(美光)

Micron是一家全球领先的半导体解决方案供应商。目前一篇名为《Using Machine Learning in Fabs》[4]的文章中,引用了Micron相关人员的信息,从中可以梳理出Micron将AI与半导体制造结合的布局。根据文章所述,Micron主要在如下领域将AI与半导体制造技术进行了结合。第一个领域是Defect Classifying,第二个领域是来自于设备或者机台的预测性维护。

在文章中,Micron主要是介绍了其在AI-ADC,即将AI应用于ADC(自动缺陷分类)领域的应用。Micron在其位于马塞诸塞州的Fab中部署AI-ADC,该工厂主要生产DRAM、NAND和NOR Flash等产品,并将其在其他工厂中进行扩展。

在AI-ADC中,Micron将数百万个已经保存的缺陷图像放进Hoodoop中,并利用NVIDIA的深度学习平台进行学习,并对学习结果进行打分,一旦该模型打分足够高,即对其进行冻结,并开始使用。下图所示为Micron提供的一份神经网络图。




A neural network is a function that can learn Source: Micron

缺陷是经过AI-ADC来系统性的审查与分类的,而对于那些较为不常见的缺陷则仍是由操作员进行分类。

如我们所知,查找和分类缺陷仅仅是整个半导体Fab中的一部分,实际上在半导体制造中的关键是要找到引起这些缺陷的根本因素,并且寻求到解决方案,并消除这些因素的影响。

多年来,预测性维护(Predictive Maintenance)一直是FAB中的一项关键技术。这个想法是监视和预测设备的性能,以减少故障和下降。为此,芯片制造商使用常规的FAB检测方法来定位和预测故障。

当然,目前也有一些新颖的方法。例如,在Fab 6中,Micron部署了所谓的声学异常检测。为此,Micron将麦克风放在设备附近的机器人上。使用机器学习,对系统进行了训练,来检测声学异常,以识别设备的潜在故障和变化。

在工厂中,该技术(Predictive Maintenance)用于提醒维护团队。它可以防止不定期的停机时间。声学技术已经发展了不少年,至少对于某些人来说,它在Fab中很有用。目前可以依赖于AI技术中所涉及到的丰富的算力来对该技术场景下的噪声进行过滤和分析。

Applied Materials(应用材料)

作为全球最大的半导体装备公司,Applied Materials(应用材料,AMAT)在将AI与半导体制造业结合方面也是走得非常靠前。关于Applied Materials将AI与半导体制造结合的信息,本文主要引述如下几个层面的信息,便于大家对这家全球最大的半导体装备制造公司有所了解。

Applied AI(X)Actionable Insight Accelerator

2021年4月5日,Applied Materials公司宣布了其AIX TM平台。下图所示为Applied的AIx平台[5]




图 Applied AIx TM平台

AIx是可操作洞察加速器的缩写,使工程师能够实时观察半导体工艺,对晶圆和单个芯片进行数百万次测量,并优化数千个工艺变量,以提高半导体性能、功率、面积和上市时间(PPACt)。AIx平台适用于所有应用材料工艺设备、eBeam计量系统和检测系统,并可从实验室扩展到工厂。通过为工程师提供在研发过程中识别创新配方的能力,AIx加快了他们的转移,并进入了大批量生产(HVM)。AIx今天已经在使用了,它改进了逻辑芯片和内存芯片的PPACt。

AIx平台包括:

ChamberAITM:应用材料工艺室的新传感器和机器学习算法,为工程师提供变量的实时分析,包括化学、能量、压力、温度和持续时间。

On-board metrology:独特的真空计量,使新薄膜在沉积时被测量,以埃级精度。

Inline metrology:基于应用材料公司eBeam计量的独特算法,相对于传统方法可以提供100倍的测量速度,并提高50%的分辨率。工程师每小时可以获得超过100万个3D晶圆测量值,以便在纳米尺度上评估配方中的微小变化如何影响芯片上的器件和结构。

AppliedPROTM:工艺配方优化器生成数字工艺地图,帮助加速材料和配方的开发,减少可变性和扩大工艺窗口。AppliedPRO可用于优化单个腔室和工具,以及加速跨系统的匹配。

Digital twins:AIx平台包括选定的应用材料室和系统的数字孪生模型,使虚拟实验能够加速配方开发,改进匹配和斜坡转移,并优化大产量生产的输出和产量。

Computing:AIx平台包括使用机器学习和人工智能算法来存储和分析大量数据所需的计算资源。

ExtractAI寻找缺陷降低半导体工厂运营成本

2021年,在一篇报道中,AMAT提出其ExtractAI工具通过寻找缺陷来帮助半导体工厂降低其运营成本[6]

可以说芯片是我们物种中最复杂的人工制品之一,需要数十亿纳米级的部件协同工作。一个小缺陷可能会导致整个芯片变得无用,或者导致以后出现意外问题。

为了解决这个问题,芯片制造商历来扫描半导体寻找问题——但在如此微观的规模上,这些努力可能需要数天时间。

Applied希望使用新的光学扫描仪Enlight对整个芯片和问题区域进行更广泛的扫描,时间约为15分钟。然后,将使用更先进的电子显微镜进行仔细观察。

借助于内部开发的ExtractAI软件,显微镜可以找出已知的故障点(其中大约1000个)进行分析,而不是查看整个芯片。基于人工智能的系统会了解这些地点的位置,并寻找表明它应该搜索其他区域的迹象。这个过程大约需要一个小时。

通过依靠人工智能,Applied Materials声称它可以节省时间、更早地发现问题并降低制造成本。理想情况下,它应该能够帮助半导体制造商分析缺陷是如何发生的,并可能随着时间的推移降低缺陷率。

该公司表示,自 2019 年以来,与客户进行的早期测试已产生超过 4 亿美元的节省。

ASML

既然提到半导体制造业的最佳实践的话,无论如何也绕不开ASML这做高峰。作为全球最大的高端光刻机厂商,ASML也在积极推动AI技术在光刻技术中的应用。

2017年,ASML在国际光学工程学会SPIE的光掩模技术大会上发表了《Machine learning assisted SRAF placement for full chip》[7](机器学习辅助SRAF放置全芯片)的论文,与传统的RB-SRAF相比,ASML将深度卷积神经网络应用于芯片布局中,且提升了光刻速度。

在其提交论文的Abstract部分,ASML做了如下介绍。亚分辨率辅助功能 (SRAF)广泛用于计算光刻中的工艺窗口(PW)增强。基于规则的SRAF(RB-SRAF) 方法适用于简单的设计和规则的重复模式,但需要一个涉及Litho、OPC和设计工艺协同优化(DTCO)工程师的较长开发周期。此外,RB-SRAF是基于启发式的,不能保证SRAF放置对于复杂模式是最佳的。相比之下,使用引导图构建 SRAF的基于模型的SRAF(MB-SRAF)技术足以为32nm及以下节点提供所需的工艺窗口。它为全芯片提供了改进的光刻余量,并消除了手动开发复杂规则以辅助2D结构的挑战。在ASML Brion Tachyon 平台上开发的机器学习辅助SRAF放置技术使其能够进一步推动 MB-SRAF的极限。使用由Tachyon逆光刻引擎完全优化的连续传输掩模(CTM)训练深度卷积神经网络(DCNN)。然后使用神经网络生成的SRAF引导图来辅助全芯片SRAF放置。这与当前的全芯片 MB-SRAF方法不同,后者利用掩模灵敏度的引导图来提高光刻目标图案边缘的光学图像对比度。ASML期望机器学习辅助的SRAF放置可以实现比MB-SRAF方法更好的工艺窗口,并且全芯片负担得起的运行时间明显快于反向光刻。其将描述机器学习辅助SRAF技术的现状,并展示其在全芯片掩模合成中的应用以及它如何扩展计算光刻路线图。

东电电子(TEL)

前面提到了Applied Materials、ASML等半导体装备公司,那还是沿着半导体装备公司的路线往下写。这里要提一下东电电子(TOKYO ELECTRON LTD.,TEL),东电电子是日本最大的半导体设备制造商。

这里主要根据其对外的一篇报告展开。TEL针对AI在半导体领域的应用给出了如下图所示的报告《Applying Machine Learning to R&D for Semiconductor Process Development》。




图 《Applying Machine Learning to R&D for Semiconductor Process Development》. Source:TEL

TEL在使用ML来进行半导体工艺开发的时候,详细阐述了其项目的背景、目标、使用的技术(包括了Python、PCA分析等多种技术),除了单纯的工艺开发和优化之外,还有材料和工艺的协同优化。当然了,包括数据的收集和处理,在报告中,TEL也做了相应的介绍。




图 Process and Materials Research & Development Flow. Source:TEL



图 《Applying Machine Learning to R&D for Semiconductor Process Development》Summary. Source:TEL

在报告的总结部分,TEL给出了利用Python的机器学习方法在半导体工艺开发的研发阶段具有不错的效果,同时亦可以将工艺和材料协同优化通过ML的方法进行。最终,TEL也对接下来的步骤做了展望,即利用ML去寻找新材料和开发新工艺。但是,其也提到了在这个过程中需要更大的数据集,以及更多的模型参数,比如增加材料参数等。

其他制造厂商、软硬件厂商与服务商

当然在半导体制造业还有很多的制造厂商、设计公司、软硬件厂商与服务商将AI/ML用于半导体制造业。这里不一一详细介绍。在后文的具体应用场景中,将会为大家持续展开介绍。

AI在半导体制造场景下的应用(The application of AI in semiconductor manufacturing scenarios)

关于AI在半导体制造场景下的应用,Intel针对AI在半导体制造领域的应用发布了白皮书《High-Value AI in Intel’s Semiconductor Manufacturing Environment》[8]。以下3个案例:1)ADC;2)RCA;3)Sort Test Probe Card Inspection均摘自该白皮书。

ADC与计算机视觉和机器学习

具有计算机视觉和机器学习功能的 ADC 是Intel在 HVM 中部署的首批 AI 解决方案之一。在线缺陷计量有助于在纳米硅芯片布局中检测偏移并捕捉问题,以免它们成为严重的良率和质量问题。 ADC 有助于从源头上查明问题。

如图下图所示,培训人员以 90% 的准确率手动分类缺陷可能需要 6 到 9 个月的时间。 即使在培训完成后,由于多种原因,专家操作员通常也只能保持 70-85% 的准确率,包括:1)工作高度重复;2)流程变更可能导致需要进一步培训的新缺陷类型;3)对IC 缺陷进行分类本来就很困难。 一些缺陷需要设计布局交叉引用才能准确诊断,而另一些缺陷则根本无法被人眼和大脑感知。




Defect measurements – accuracy vs. time.

清楚地理解了问题陈述后,Intel团队在工作中与其内部由工艺、产量、缺陷量测和设备工程师组成的跨职能团队合作,实施了机器学习(包括深度神经网络)ADC 解决方案。 该解决方案已在 TD 和 HVM 中部署在英特尔制造的每个技术节点中,包括英特尔 至强 可扩展处理器和英特尔 傲腾 技术。 部署本身需要付出巨大的努力和投资才能将 AI 算法集成到工厂自动化系统中。 集成包括几个层次:1)带有缺陷检测系统的输入端;2)用户侧允许缺陷工程师和技术人员标记图像并配置相应的目标布局信息;3)工厂运营方面自动生成统计过程控制 (SPC) 警报并暂停工厂批次。

ADC 使Intel能够以所需的准确率对英特尔工厂生产的晶圆上的大部分缺陷进行测量和分类,与其他解决方案相比,其总拥有成本没有任何增加。 此外,还能够在晶圆后制造过程中使用现有的成像设备来实现具有计算机视觉和机器学习功能的 ADC,这有助于及早防止错误并在不增加成本的情况下提高产量。



Root Cause Analysis

大规模机器学习和高级分析的另一个很好的例子是 RCA 解决方案,Intel已经在其所有工厂的所有技术节点上普及了该解决方案。 在半导体制造中,快速找到良率和质量问题的根本原因对于盈利能力和客户满意度都至关重要。

问题:在英特尔的制造规模上,找出良率问题的根本原因通常需要挖掘数十亿个参数,涉及电子测试、SPC、工具、操作、缺陷、排队时间 (QTimes)、工艺时间、晶圆槽顺序、 设备日志和许多其他数据类型。 这类似于大海捞针。 精通分析的工程师,拥有丰富的领域知识和多年的经验,可能能够在几小时或几天内智能地挖掘所有可用数据; 但即使是两名工程师也很难分享这些知识,更不用说在英特尔的所有工厂之间分享了。为了使 RCA 民主化,Intel开发了可解释的机器学习引擎(包括增强的决策树、新颖的委员会方法、特征选择和规则归纳技术),可以处理大量、嘈杂、异构和经常丢失的非随机 (MNAR) 制造数据。 这些引擎为诸如 RCA 之类的任务提供了解决方案,但首先需要付出很大的努力才能将数据转换为可分析的形式。 Intel团队运用半导体领域的专业知识创建了一个定制的大数据存储基础设施,为 RCA 所需的多维数据提供非常快速的数据访问; 与数小时或数天相比,工程师现在可以在几分钟内找到潜在的根本原因。 通过在即用型快速数据基础设施之上无缝集成机器学习分析,大大减少了查找、提取、清理和连接数据的重复性任务。

Sort Test Probe Card Inspection

英特尔工厂部署的另一个实用 AI 解决方案发生在排序测试期间(Sort test)(如下图所示)。 排序测试是晶圆制造的最后一步,在该步骤中测试晶圆上的各个裸片以确定良率(合格裸片的数量)。 技术人员使用一种称为探针卡的硬件将测试模式传送到晶圆上的芯片,其中测试器引脚与探针卡进行物理接触。在该场景下遇到的问题是由于接触的物理性质造成的。 探针卡容易磨损,这反过来又会混淆测试结果。 从历史上看,技术人员会定期使用显微镜手动检查探针卡。 这项任务费力、耗时,并且存在重大的人体工程学风险。




Probe Card defects – from manual to AI inspection.

Intel采用多阶段方法为探针卡构建全自动检测系统。在每个阶段,Intel都构建了减少技术人员工作量的中间应用程序。整体解决方案现在合并了这些应用程序。例如,当探针卡在测试设备上时,一个应用程序会自动收集图像数据。审查工具仅标记探针卡的异常区域。另一个应用程序允许技术人员轻松标记数据,这反过来又允许创建标记数据集来训练深度学习 AI 系统。通过从最小可行产品开始并逐步增加功能,Intel开发了一个对技术人员有用的解决方案,即使他们帮助实现了完全自动化的目标。该系统现已完全自动化并部署在多个工厂,显着提高了生产力:以前每个工厂每周需要长达 46 小时的任务已减少到不到 60 秒

AI在半导体量测领域的应用(AI+Metrology)

前面提到TSMC团队提到的AI在Metrology领域的应用,这里对相关内容做一个展开。

半导体行业的一个方面(或很快将)严重依赖人工智能支持——半导体工艺表征的计量,无论是在初始工艺开发/启动期间,还是在推动持续工艺改进的在线检测。 半导体加工的每个方面,从光刻设计规则规范到持续的良率分析,基本上都依赖于关键尺寸 (CD) 光刻图案和材料成分的准确可靠数据。在VLSI 2020 研讨会上,台积电先进计量工程组经理 Yi-hung Lin 就半导体计量技术的现状以及人工智能方法提供必要突破以支持未来工艺节点开发的机会发表了引人注目的演讲。

下图说明了计量技术的使用顺序。 在开发过程中对制造材料规格和光刻目标进行初步分析。 一旦工艺过渡到制造,就会实施在线(非破坏性)检查,以确保变化在高良率的工艺窗口内。 随着时间的推移,不同设计的广度,特别是在多条晶圆厂生产线上引入工艺,需要关注尺寸匹配、晶圆到晶圆、批次到批次以及晶圆厂到晶圆厂的生产线。



“预学习”机会表明,初始过程启动计量数据可用作 AI 模型开发的训练集,随后应用于生产。 理想情况下,这些模型将用于加快实现大批量生产的时间。

OCD 光谱依旧是过程计量数据的关键来源。 它快速、廉价且无损——然而,OCD 的使用在深亚微米节点中发生了变化。 下图说明了光学光源在表面计量中的应用。



入射(可见或越来越多的 X 射线)波长被提供给表面的 3D 模拟模型,该模型求解电磁方程以预测散射。 将这些预测结果与测量光谱进行比较,并对模型进行调整——当测量结果和 EM 模拟结果收敛时,就可以实现计量“解决方案”。当适当的(1D 或 2D)“光栅状”图案用于入射光的反射衍射时,OCD 照明最适用。 然而,挑战在于当前的表面形貌绝对是三维的,并且感兴趣的材料测量不类似于平面光栅。 光学 X 射线散射法通过这些 3D 形貌提供了更高的分析精度,但它是一种极其缓慢的数据收集方法。

TSMC 使用术语 ML-OCD 来描述源自其他计量技术的 AI 模型如何为融合 EM 仿真方法提供有效的替代方案。 如下图所示,ML-OCD 光谱数据将作为模型开发的输入训练数据集,输出目标是(破坏性)透射电子显微镜 (TEM) 的测量值,接下来将进行讨论。



TEM 利用聚焦电子束,该电子束被引导通过非常薄的样品——例如 100nm 或更薄。 由于电子波长小得多(比光学光子小 1000 倍),由此产生的(黑白)图像提供了材料横截面的高倍放大细节。



TSMC团队强调了两个领域,其中 ML 技术将是 TEM 图像的理想选择。 第一种将利用熟悉的图像处理和分类技术自动提取 CD 特征,这对于“模糊”TEM 图像特别有用。 第二个是作为 ML-OCD 的训练集输出,如上所述。 TSMC团队指出,使用 TEM 数据进行 ML-OCD 建模的一个问题是需要大量 TEM 样本数据作为模型输出目标。 (与入射 OCD 曝光的场相比,TEM 图像的精细分辨率加剧了这个问题。)

此外,AI/ML还可以与SEM结合。ML 方法可应用于 SEM 图像以进行缺陷识别和分类,并通过将缺陷与特定工艺步骤相关联来帮助确定根本原因。



目前半导体制造业中诸多设备,针对不同的空间尺度和时间尺度均有对应的设备,不过随着技术的发展,先进的量测技术也在发展。相信会有更多和AI结合的机会。

关于集成电路中的工艺检测设备,可以参阅《集成电路产业全书》。这里做一个简要描述。工艺检测设备[9]是应用于工艺过程中的测量类设备和缺陷(含颗粒)检查类设备的统称。在集成电路芯片生产过程中,在线工艺检测设备要对每一道工艺(或数道相近工艺)的圆片进行无损的定量测量和检查,以保证工艺的关键物理参数(如薄膜厚度、线宽、沟/孔深度、侧壁角等)满足工艺指标,发现可能出现的“致命”缺陷并对其进行分了,剔除不合格的圆片,避免后续工艺的浪费。同时,工艺检测设备可以帮助工程师及时找出生产设备或工艺流程出现的偏移或问题,及时进行纠正或解决,从而保证芯片(Die)的成品率,以及最终生产线芯片出货的稳定性和可预期性。工艺检测设备的另一个重要作用是帮助工程师在工艺开发和试生产时优化生产类设备(如光刻、薄膜、刻蚀、CMP等设备)的运行参数和光掩模的设计,查找影响芯片工艺质量的缺陷,发现并消除缺陷来源,继而优化整个工艺流程,缩短开发时间,快速提升成品率并实现量产。因此,工艺检测设备是保证集成电路芯片生产线快速进入量产阶段并获取稳定的高成品率和高经济效益的关键性设备。集成电路芯片制造工艺流程中在线使用的工艺检测设备种类繁多,应用于前端芯片制造工艺的主要检测设备分为如下4类。

(1)圆片表面的颗粒和残留异物检查,以及工艺工程中圆片的缺陷和异物的检查和分类。

(2)薄膜材料的厚度和物理常数(如折射率、消光系数、组分和应力等)的测量。

(3)圆片在光刻胶曝光显影后、刻蚀后和CMP工艺后的关键尺寸(CD)和形貌结构的参数测量。

(4)套刻对准的偏差测量。

在后段封装工艺中,芯片倒装(Flip-Chip)、圆片级封装(Wafer-Level Package)和硅通孔(Through Silicon Via,TSV)等先进工艺要求对凸点(Bump)、通孔(TSV)、铜柱(Copper Pillar)等的缺损/异物残留及其形状、间距、高度的一致性,以及再布线层(Redistribution Layer,RDL)进行无接触定量检查和测量。在集成电路工业发展的早期,检测通常是在无图形的监控圆片上进行的。随着制造工艺的发展,单个芯片的价值越来越高。为了获取尽量高的芯片成品率(Die Yield),需要严格控制圆片之间、同一圆片上芯片之间的工艺一致性。因此,对工艺过程中的圆片进行在线检测成为必然,这就要求检测设备必须具备智能化的图像识别功能,能够快速、准确地找到工艺流程中规定的测量区域去完成检查和测量,并且自动地将数据实时上传至生产线控制终端系统,为各工艺段的生产设备的参数微调提供依据,并预警设备异常,从而保证每道工艺均落在容许的工艺窗口内,使整条生产线平稳、连续地运行。对于一个24h不间断生产的现代化量产线,总检测次数十分庞大,因此检测设备的吞吐量也成为与灵敏度、准确性、稳定性同样重要的指标,是检测设备更新换代和同类设备之间比较的一个重要参考。针对集成电路芯片制造工艺中采用的不同材料及结构,工艺检测设备分别采用了包括宽波段光谱(紫外到红外)、电子束、激光和X射线等多种不同技术。随着工艺不断向细微化发展,集成电路单元的几何尺寸越来越小,器件形成过程中的结构也越来越复杂,并由传统的二维平面结构向三维结构转变(如FinFET、3D NAND和TSV等),这些都对检测设备的灵敏度、可适用性及稳定性等不断提出了新的挑战,也为工艺检测设备的技术发展和进步提供了动力。工艺检测设备不仅要确保集成电路芯片生产线快速实现量产和取得高成品率,还要对生产类设备进行定量的监控,确保生产类设备正常运行,为生产设备的维护、保养和验收提供依据,帮助工程师排查生产设备出现的异常。随着芯片结构的不断细微化和工艺的不断复杂化,工艺检测设备在先进的前段生产线中起着越来越重要的作用。根据相关数据统计,目前工艺检测设备投资占整个前端工艺设备总投资的10%—15%。如同其他集成电路工业专用设备,工艺检测设备的供应商主要集中在美国、日本、以色列等少数国家。

应用场景:机器学习在良率学习和优化领域的应用

良率学习和优化(Yield Learning and Optimization)对于先进集成电路设计和制造来说至关重要。机器学习的最新进展为提高集成电路(IC)良率学习和优化的性能和效率带来了许多新机会。Yibo Lin在《Machine Learning for Yield Learning and Optimization》[10]一文中,总结了以Yield Learning and Optimization为目的的,使用各种机器学习/深度学习技术的一些最新成果,包括不确定性下的性能建模、具有转移/主动学习的光刻建模、光刻热点检测和IC掩模优化。解释了最先进的方法,并讨论了其挑战/机遇。

Machine Learning for hotspot detection

目前,业界已经提出了各种可制造性设计 (DFM) 技术,以弥合设计需求与当前主流 193nm 光刻技术引入的制造限制之间的巨大差距。 然而,由于光刻系统的复杂性和工艺变化,依旧会发生无法打印特定图案的情况,称为坏点(hotspot)。




Example of hotspot patterns

光刻hotspot检测通常需要昂贵的光刻模拟。 因此,高效且准确的光刻hotspot检测对于版图整理和设计收敛是十分必要的。

现有的hotspot检测方法主要分为三类:光刻模拟、模式匹配和机器学习。 光刻模拟可靠但耗时。 模式匹配方法首先建立一个hotspot模式库。 任何要检测的新模式都会与库中的现有模式进行比较,如果找到匹配项,则将其标记为hotspot。 这种包括模糊模式匹配在内的技术缺乏预测从未见过的hotspot模式的能力。 另一方面,机器学习方法已经证明了识别看不见的hotspot模式的良好泛化能力。 这些方法通常对标记的数据集进行一次性训练以获得机器学习模型并有效地预测新的布局模式是否为hotspot。

机器学习技术在光刻hotspot检测方面取得了巨大成功。 然而,为了标记足够多的布局图案以准备训练集,需要进行大量的光刻模拟。 特别是对于新技术节点早期的版图设计,标注数据样本的数量是有限的。 因此,在保持模型的高检测性能(即提高数据效率)的同时,用更少的训练实例构建机器学习模型依旧具有挑战性。

有几种方法可以提高热点检测的数据效率,例如半监督学习和主动学习。 半监督学习可能是减少与训练模型相关的前期成本和时间的可行选择。 它利用标记和未标记的样本来帮助模型训练并减轻对大量标记训练数据的依赖。

Machine Learning for Mask Optimization

掩模合成在后端设计流程中需要大量时间。 掩模合成的典型流程如下图所示。




Mask synthesis flow

下图所示为将机器学习中的GAN应用到OPC中去[11]




Neural network architecture of GAN-OPC

尽管将机器学习技术应用于 OPC 和 SRAF 取得了成功,但依旧存在挑战。对于 GAN-OPC,有两个主要挑战。首先,训练很难达到很好的收敛性,这是 GAN 中的一个常见问题。尽管使用自动编码器进行预训练等技术可能会有所帮助,但不同初始化的性能差异很大。其次,在使用生成模型产生ILT引擎的起点后,运行时瓶颈依旧由ILT引擎主导。因此,为了提高运行时间,生成模型需要达到更高的精度,从而可以进一步减少 ILT 迭代。在 SRAF 生成中,机器学习模型用于一次对一个像素进行预测。对于具有 M ×N 像素的布局剪辑,需要 MN 预测。由于芯片布局通常具有微米级的宽度和高度,精度应具有纳米级,因此M和N相当大。这最终限制了使用复杂模型来获得更高的预测精度。因此,逐像素建模方法存在运行时瓶颈,以进一步提高解决方案的质量。像 GAN-OPC 这样的生成模型是解决这个问题的一种很有前途的方法。

应用场景:AI在芯片设计领域的应用

众所周知,目前EDA是集成电路工业软件的核心技术和产品之一。EDA的发展也是伴随着集成电路自动化设计方法学的发展而来的。

目前EDA分类的话,主要是如下图所示的这一类分类方法。当然也可以按照EDA软件在研发设计与生产制造等环节的介入情况进行分类。




EDA工具软件分类 图片来源:东兴证券《全球EDA芯片设计软件行业深度报告》

上文提到的其他的分类方法,可以参照概伦电子招股说明书中提到的[12],按照研发设计、生产制造的形式进行分类,具体如下图所示。




集成电路设计和制造流程、关键环节及相应 EDA 支撑关系

一个完整的集成电路设计和制造流程主要包括工艺平台开发、集成电路设计和集成电路制造三个阶段。各阶段主要内容及细分环节如下:

①工艺平台开发阶段主要由晶圆厂(包括晶圆代工厂、IDM 制造部门等)主导完成,在其完成半导体器件和制造工艺的设计后,建立半导体器件的模型并通过 PDK 或建立 IP 和标准单元库等方式提供给集成电路设计企业(包括芯片设计公司、半导体 IP 公司、IDM 设计部门等)。

②集成电路设计阶段主要由集成电路设计企业主导完成,其基于晶圆厂提供的 PDK 或 IP 和标准单元库进行电路设计,并对设计结果进行电路仿真及验证。若仿真及验证结果未达设计指标要求,则需对设计方案进行修改和优化并再次仿真,直至达到指标要求方能进行后续的物理实现环节。物理实现完成后仍需对设计进行再次仿真和验证,最终满足指标要求并交付晶圆厂进行制造。在大规模集成电路设计过程中,由于工艺复杂、集成度高等因素,电路设计、仿真及验证和物理实现环节往往需要反复进行。

③集成电路制造阶段主要由晶圆厂根据物理实现后的设计文件完成制造。若制造结果不满足要求,则可能需要返回到工艺开发阶段进行工艺平台的调整和优化,并重新生成器件模型及 PDK 提供给集成电路设计企业进行设计改进。

上述三个设计与制造的主要阶段均需要对应的 EDA 工具作为支撑,包括用于支撑工艺平台开发和集成电路制造两个阶段的制造类 EDA 工具以及支撑集成电路设计阶段的设计类 EDA 工具。其中,设计类 EDA 工具根据设计方法学的不同,按照设计层级自下而上,可进一步细分为晶体管级、门级、RTL 级、系统和行为级EDA工具,各层级EDA工具的仿真和验证精度依次降低、速度依次提升,其拟实现的目标和应用场景也有所不同。例如高层级的系统和行为级仿真和验证主要适用于产品设计早期的原型验证,评估产品原型的性能和功能;最底层的晶体管级仿真和验证则主要决定了最终产品的性能和良率。针对于大规模集成电路,设计方法往往从系统和行为级设计开始,逐层设计、仿真、验证和实现,并输出可以交付制造的晶体管级版图信息。

EDA也经历了多个阶段,同样集成电路自动化设计方法学也从过去的方法,走向了DTCO和MSCO等多种方法学。AI在芯片设计领域的应用,总结下来可以分为两种:AI inside和AI outside。所谓AI inside就是如何通过AI加速或者赋能EDA等工具;而AI outside就是通过其他工具来打造AI产品。

Machine Learning in VLSI Computer-Aided Design

在《Machine Learning in VLSI Computer-Aided Design》[13]一书中,对于AI/ML如何加速和辅助超大规模集成电路中计算机辅助设计做了如下总结。



半导体器件建模(Semiconductor Device Modeling)

之所以写半导体器件建模,主要是因为半导体器件建模是EDA中的核心技术之一。之前与人合作写文章的时候,还是刚入行的时候,对于很多东西也是听别人说说,现在自己回头来研究的话,发现其中的众多妙处,直至此刻方能体会。而关于半导体器件建模方面,依然有不少的与AI结合的地方。

关于半导体器件建模,张傲与高建军在其著作《硅基射频器件的建模与参数提取》[14]一书中,做过如下介绍。

半导体器件建模是将半导体器件的物理特性转化为数学问题的过程,并与电路仿真软件相结合,为工艺和电路设计搭建桥梁,使得设计和工艺制造尽可能一致。器件模型的精确性是影响电路设计精度的重要因素,模型越精确,设计电路时的仿真结果越接近最终芯片流片测试结果。随着电路规模的扩大,频段和指标的不断提高,对器件模型的精度要求也越来越高,对器件建模工作提出了新的要求,需要不断建立新的器件模型来指导电路设计。

半导体器件模拟软件是指通过分析器件物理结构、求解相应的泊松方程和电流连续性方程等,最后得到器件的输出特性(如直流和交流特性),用以制造器件设计和生产。与此同时,也可以反映器件物理结构参数(如场效应器件的栅长、栅宽和双极性晶体管的基极、发射极尺寸)对器件输出特性的影响。这些半导体器件模拟软件大多是二维或准二维模拟器,利用这些模拟器可以对射频微波半导体器件的物理结构进行分析,然后制成版图进行生产。

半导体器件建模流程

半导体器件建模就是寻求一种等效电路模型,以便用它来代替元器件进行电路设计和分析。模型应该满足以下条件:

(1)能够真实反映元器件工作时的物理特性;

(2)在很宽的频带内仍能保证足够的精度;

(3)在保证精度的前提下,模型参数尽可能少;

(4)构建的模型参数必须容易提取;

(5)能够准确预测线性特性和非线性特性等。

器件建模流程图如下图所示。




器件建模流程图

器件的流片测试:建模的前提是有实际测试的器件数据,因此需要首先将器件流片制造出来,搭建测试平台,获得建模所需要的各种数据。

模型的构建与参数提取:结合实际测量数据或仿真数据相关特性,提出最符合器件特性的等效电路模型和解析计算式,并提取模型中的拟合参数和物理参数。值得注意的是,在进行数据处理的过程中会涉及去嵌技术和模型参数提取方法的选择。

模型验证:当参数提取完毕后,需要把建好的模型嵌入计算机辅助软件中进行仿真验证,模型在计算机辅助软件中嵌入后,可以将器件测试数据或仿真数据与模型模拟结果进行比较,看两者是否一致、精度是否达到指标要求,如果没有,则需要修改模型,重新提取模型参数,直到测试数据与模型数据的误差值在允许范围之内,至此建模过程结束。

换一个角度——TCAD: TCAD to SPICE model generation flow

关于TCAD的介绍,其实在本专栏《半导体行业的局外人与局中人》[15][16][17]中已经做了一些介绍,不过针对为何选择TCAD来做半导体器件建模为SPICE模型提参这一块,之前介绍得比较少。不过,没有关系,接下来可以详细介绍一下。

在前文已经提到,对于半导体器件建模除了可以用compact model等多种方式来构建之外,另外就是可以通过TCAD来做半导体器件建模。在《Introducing Technology Computer-Aided Design (TCAD): Fundamentals, Simulations, and Applications》[18]一书中对此有较为详细的介绍。众所周知,TCAD既可以做器件模拟,又可以做工艺仿真。下图所示为,如何采用TCAD构建半导体器件模型并用于提参。




TCAD to SPICE model generation flow

那么为什么需要用TCAD来进行半导体器件建模呢?主要原因是有的时候很多器件模型还是处在构想中,上来就造吧,是否有意义呢?其次,对于基于compact model等方法的模型面向新型器件的时候,还是需要通过量测的方式产生大量的数据。因此,采用TCAD进行器件模型的构建未尝不是一件好事。而且根据相关数据显示以及行业案例,ITRS曾经发表过数据,大概是TCAD能够从时间维度和资金维度为foundry厂降低40%左右的成本。

另外就是compact model的开发跟不上目前对于器件和技术开发的节奏,而电路仿真需要compact model。下图所示即为对新型的compact model的需求。比如考虑到应力应变工程等诸多内容。




Requirements for the development of advanced compact models

基于上述TCAD进行半导体器件建模的典型流程大致如下:

仅使用器件模拟来提取SPICE参数:(1)定义测试结构;(2)使用经过校准的器件模型生成I-V数据;(3)提取SPICE模型参数。

基于工艺和器件的TCAD的SPICE模型参数提取:(1)校准现有/成熟技术的TCAD模型;(2)执行工艺仿真以优化新的工艺配方/目标;(3)执行器件仿真以优化新的器件目标;(4)生成I-V和C-V数据;(5)使用参数提取工具(例如Paramos)提取SPICE模型。

关于半导体器件建模就暂时写到这里吧,有兴趣的朋友可以详细看一些专业书籍进行学习,比如本部分内容参考的:(1)《硅基射频器件的建模与参数提取》;(2)《Introducing Technology Computer-Aided Design (TCAD): Fundamentals, Simulations, and Applications》。

关于AI与TCAD的结合,主要集中在包括用AI加速TCAD计算效率,或者说AI结合TCAD重新构建模型。具体内容可以参考本专栏的文章:

而关于目前学术界在TCAD领域的研究热点,可以参照该问题下,我的回答[19]

TCAD领域学术界在研究什么?工业界的应用又是什么情况呢?未来前景如何? - 李剑的回答 - 知乎 https://www.zhihu.com/question/328487447/answer/2681547111

应用场景:AI在半导体装备领域的应用

集成电路装备简介

集成电路产业一直遵循“一代装备,一代工艺,一代产品”的模式发展。正因为如此,集成电路制造与检测设备成为了产业技术升级和发展的先导与核心[20]



集成电路制造往往需要经过上千个工艺步骤才能完成,每个工艺步骤都要依赖特定设备的加工处理才能实现。制造与检测设备是集成电路的核心技术及工艺载体,是产业发展的基础,集人类超精细加工技术之大成,代表着当今世界微细制造的最高水平。因此,集成电路产业是一个国家高端制造能力的综合体现,是全球高科技国力竞争的战略必争制高点。

芯片集成度的不断提高,不仅使芯片内在结构和生产工艺不断创新,对生产工艺赖以实现的设备技术也提出了新的需求。目前,许多加工技术的精度已经趋近于物理极限,使得集成电路制造设备的性能要求越来越高,先进设备的研发也更具有挑战性。



随着集成电路制造技术的发展,在集成电路制造过程中其制造流程变得更为复杂,所需设备众多[21]










Fab厂建厂成本分解:设备成本比重越来越高

半导体设备在晶圆生产线的资本支出中占比接近八成,且呈增长势头。按照平均水平, 晶圆代工厂的建设成本构成中设备占比约 80%,土地和厂务等占约 10%,人力成本占 5~10%。随着制程的进步,晶圆制造生产线的投资越来越高,且半导体设备在资本支出中比重越 来越大。假设12英寸90nm 晶圆生产线的建设成本是 20 亿美元,那么 12英寸20nm同样规模的晶圆生产线的建设成本则高达 67 亿美元。在 90nm 生产线的建设成本中设备占比约 70%,那么 20nm 生产线中设备占比为约 85%,提高了 15 个百分点。在 20nm 的晶圆制造生产中的设备投资高达 56.95 亿美元。晶圆生产线中最重要最关键的半导体设备是光刻机(Lithography),其先进程度直接决定了生产线的制程节点。目前全球只有荷兰的 ASML 和日本的 Nikon 两家可以提供先进的光刻机,因此,光刻机及相关设备在晶圆生产线的设备成本构成中占比最高,约占 30%。此外,刻蚀(Etch)、物理气相沉积(PVD)、化学气相沉积(CVD)、检测(Metrology)设备也是较为重要的设备,成本中所占比例也较高。 在晶圆加工过程中,晶圆生产线不仅需要开动设备,也需要不断地消耗各种半导体材料和化学品,比如硅片、抛光液、清洗液等。由于设备价格高昂,是晶圆生产线投资中所占比重最高,因此,在晶圆(Wafer)的制造成本中,设备和厂房的折旧占比非常高。 以 8 寸线的晶圆制造成本为例,设备厂房折旧占比为 51.7%,备件及维护占 8.8%,人员工资占 9.5%,水电设施占4.5%。材料和化学品在成本中的占比约 25%,其中又以硅片最为重要[22]

关于集成电路装备的介绍,有兴趣的朋友可以查看本专栏下的文章:

仿真与AI在集成电路装备领域的应用

集成电路装备的仿真一直是装备制造商关注的重点。其涉及到多尺度仿真技术。而多尺度仿真技术现在面临的问题是:

1)是否算得准?

2)是否算得动?是否算得动,存在两个问题:1)是否能够在空间上处理计算、仿真模拟的体系;2)是否能够在时间尺度上模拟足够的时间尺度。

3)是否通用?

在多尺度仿真领域目前有多种方法想来尝试打通多尺度仿真,包括参数传递方法、暴力计算、包括周期性边界条件等,目前来看随着AI技术的发展,AI可能是一个比较重要的方向。可能通过AI的方式能够提供一种比较好的方向。通过AI可能能够解决维数灾难,通过AI也可以为优化提供加速器。具体的案例可以参照上文中提到的TCAD与AI的结合。

那么实际上集成电路多尺度仿真主要是涉及:1)宏观尺度,设备结构设计;2)宏观尺度,温度场、热场、流场、浓度场分布;3)微观尺度,包括纳米剖面分析;4)微观尺度,化学反应机理研究;5)多物理场耦合等。

关于集成电路多尺度设备与工艺仿真研究,可以参考如下这篇文章。

这里需要指出的是TCAD中也有Process Simulation,但是和装备厂商的Process Simulation不是一回事。

关于AI在这里的应用,我们可以从材料生长这个角度切入。关于晶体生长目前有诸多软件可以使用,包括宏观层面的ANSYS Fluent、Comsol Multiphysics、Star-CCM+等,不过这些都是通用软件,在专业性上还是得看包括STR公司的CGsim等软件,即便如此,也只是偏宏观层面的。实际上晶体生长是一个多尺度问题。

关于晶体生长的多尺度模拟方法,西安交通大学刘立军教授团队发表过相关的文章《晶体生长数值模拟领域的若干研究进展》[23],该文章不仅介绍了晶体生长的多种方法,并且介绍了如何将AI与CFD技术融合实现智能优化。有兴趣的朋友可以详细参阅。

晶体生长热场和工艺的优化一直是学术界和产业界特别感兴趣的研究方向。但是如果仅仅通过数值模拟进行优化研究的话,往往需要进行多组耗时的模拟分析才能对某一变量进行定性优化,而对于像晶体生长过程这种多变量多目标参数问题的优化则显得无能为力。针对这个问题,日本名古屋Ujihara教授研究组针对溶液法生长碳化硅的过程,将数值模拟得到的800组训练样本对神经网络进行训练,训练后的神经网络可以准确地对不同工艺参数下坩埚内流动状态与碳原子过饱和度进行预测,并且计算速度相较于数值计算提高了10e7倍。下图为基于神经网络的预测模型与基于CFD模拟获得的溶液中过饱和度和流速分布对比分析,可见神经网络预测结果可以准确反应溶液的流动特征。该方法可以与优化算法结合,对工艺参数进行高校而准确的优化。这一方法的提出将使得以获得高质量大尺寸半导体晶体材料为目标的多目标问题进行优化成为可能。



AI在半导体材料领域的应用

关于AI在半导体材料领域的应用,其实已经有不少探索了。主要集中在材料发现、材料性能预测等多个方面。在包括材料基因组以及材料信息学领域的工作中有大量的描述,其中也包括了包括Intel和Samsung等公司在进行新型存储材料研发时采用了相关技术。包括IBM也利用AI进行新型光刻胶材料的研发。

IBM结合人工智能和量子力学计算技术进行光刻胶材料的研发[24],并在1年时间内发现并合成了一种新的光刻胶用分子。主要是因为在光刻胶中有一种Photoacid generators(PAGs)。一般意义上,要发现和合成1种新材料基本上要花费10年时间,接近1亿美金。而IBM团队借助于其端到端的AI使能工作流程,发现了3种候选物,算是破了记录,这种效率和速度是人类科学家所无法完成的。



关于AI在半导体材料领域的应用可以参考如下两篇文章。

另外深势科技也发表了《2022 AI4S全球发展观察与展望》[25],其中也有不少相关的内容,有兴趣的朋友也可以去看看。

如何开展AI在半导体制造业中的应用

关于如何开展AI在半导体制造业中的应用这一主题,我们需要比较慎重的考量。目前,关于AI的应用的研究很多。但是AI本身在不同的场景中的应用情况也不尽相同。虽然很多行业都在号称使用AI技术,这里需要说明一下,在本文中将AI与大数据分析强行画上了等号,但是实际上这两者之间又不能混为一谈。

AI与大数据项目为何频遭折戟?看看Intel的宝贵经验

AI或者大数据项目虽然有很多公司都尝试了相关的应用,但是依然有不少公司的相关项目最终都折戟了,这是什么原因呢?原因很多了!由于本文主要研究AI与大数据项目在半导体领域的应用,因此,我们还是参照本行业的Leader的经验展开。

在讲述AI与大数据技术在半导体领域的应用的时候,我们无法绕开的就是Intel,这家世界顶级半导体器件制造商。其在综述过去将AI技术应用于半导体制造领域的时候,发布了一份白皮书——《High-Value AI in Intel’s Semiconductor Manufacturing Environment》。这份白皮书中详细的分析了为什么很多大数据相关的项目最终折戟的原因,当然,此份白皮书中依然有不少其他的类容,包括Intel是如何进行AI在半导体制造领域的实践的,有哪些用例(use case)等,还有Intel是如何组织团队进行AI在半导体领域应用实践的。

在这份白皮书中,Intel讲到互联网上有大量文章强调人工智能跨行业和大数据项目的巨大失败率。人工智能项目的失败率在60%到85%之间。人工智能项目失败的主要原因之一是,有些项目的创建时没有考虑到明确的用例。Intel认为,人工智能不应该成为寻找问题的解决方案。下图所示为网络上总结的人工智能项目失败的原因分析。




一个高级分析解决方案的构建块

在互联网上,尽管对人工智能有大量投资,但人工智能项目的失败率在60%到85%之间。Intel认为,人工智能项目失败的主要原因之一是,其中大多数项目的创建都没有考虑到明确的用例。

除了选择一个特定的用例外,人工智能项目成功的另一个方面是采用全局思考的方法和角度,这里面包括四个基本要素:1)理解问题;2)解决方案部署;3)建模和4)数据管理。忽略其中一个因素会使整个项目处于危险之中,极有可能导致竹篮打水一场空的失败处境。

Key 1: 理解要解决的问题/业务理解

虽然它只代表了饼状图的10%,但理解要解决的问题是至关重要的。没有任何办法可以替代该领域的专业知识。人工智能的实现不能与最终将部署解决方案的业务功能隔离。我们首先将领域专家——工艺工程师、设备工程师和良率工程师——引入一个工作小组,在生成概念证明(POC)AI解决方案之前,首先了解问题声明和相关的业务价值。PoC经过了领域专家的彻底验证,并在下一步之前进行了迭代完善。

Key 2:解决方案部署(DevOps)

解决方案部署(DevOps)占整个全局的另外10%。DevOps是在整个组织中普及复杂算法的唯一方法。即使在PoC阶段,我们也已经在计划如何实现面向HVM(大规模生产)的部署,其中包括将该解决方案集成到我们的工厂自动化系统中,以确保被采用。

Key 3:建模(Modeling)

建模代表了高级分析派的30%。在这里,我们遵循两个规则:

(1) 首先使用简单的可解释技术,如鲁棒的线性模型或单一决策树,然后使用不太透明的人工智能方法,如集成或更重的神经网络。

(2) 使用为其数据域定制的最好的AI引擎(算法)。具体来说,Intel在那些性能非常优异的引擎上投入了大量资金,它们可以处理半导体数据的独特特征——高度不平衡的数据、缺失的数据、分类数据,以及经常出现的“肮脏”数据。Intel不断地将定制人工智能引擎的性能和准确性与世界各地数百万数据科学家使用的开源引擎进行基准测试。根据用例的不同,Intel可能会使用自定义的AI引擎或开源引擎,或者两者的混合。

Key 4:数据管理

数据管理是整个项目中的最大部分——大约占50%。然而,它往往是高级分析中最不令人兴奋的一个方面。数据的问题是,它以不同的格式存在——结构化和非结构化、视频文件、文本和图像——并存储在不同的地方,具有不同的安全和隐私要求。Intel在该过程中面临的数据挑战与其他公司类似;不过他们已经通过多个数据计划解决了这些问题,并继续改进它们。

根据上文的阐述,其实这里面讲了一个重要的点就是:不要为了AI而AI,其次就是要用AI产生价值。

另外,根据上文的描述,我认为实际上AI在半导体制造业的使用应该算是一个数据治理工程,也是一个数字化转型战略的体现。

麦肯锡认为成功大规模实施AI/ML的6个关键因素

关于AI在半导体制造业的现状,不少研究机构与实施AI+Semiconductor战略的公司均做了相应的展望,比如麦肯锡、Intel等等。

麦肯锡在其报告《Scaling AI in the sector that enables it: Lessons for semiconductor-device makers》中做了相关的总结。在报告中,麦肯锡认为成功大规模实施AI/ML的6个关键因素分别是:(1) creation of a strategic road map(创建战略路线图);(2)Talent and organization(人才与组织);(3)Technology(技术);(4)Data(数据);(5)Adoption and scaling(采用和扩展);(6)Agile delivery(敏捷交付)。具体如下图所示。




图 麦肯锡总结的成功大规模实施AI/ML技术的6个关键因素

行动计划

为对AI+Semicondutor感兴趣的朋友找一个交流的地方,有兴趣的朋友,可以加入,共同交流AI在半导体集成电路领域各个场景下的应用。

后面可能因为人数原因,后面的朋友可以在我的主页上找我的联系方式,我来邀请。

参考

  1. ^https://www.tsmc.com/english/dedicatedFoundry/manufacturing/intelligent_operations
  2. ^Yi-hung Lin, “Metrology with Angstrom Accuracy Required by Logic IC Manufacturing – Challenges From R&D to High Volume Manufacturing and Solutions in the AI Era”, VLSI 2020 Symposium, Workshop WS2.3.
  3. ^https://semiwiki.com/semiconductor-manufacturers/287593-a-compelling-application-for-ai-in-semiconductor-manufacturing/
  4. ^https://semiengineering.com/using-machine-learning-in-fabs/
  5. ^https://ml.globenewswire.com/Resource/Download/3b8f218b-050a-461c-823b-3c8eb75b1975
  6. ^https://aibusiness.com/document.asp?doc_id=768134
  7. ^https://www.spiedigitallibrary.org/conference-proceedings-of-spie/10451/104510D/Machine-learning-assisted-SRAF-placement-for-full-chip/10.1117/12.2283493.short?SSO=1
  8. ^https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/AI-in-Semiconductor-Manufacturing-Solving-the-n-i-n-Problem/post/1355654
  9. ^王阳元. 集成电路产业全书[M]. 2018年9月第1版. 北京:电子工业出版社, 2018年 :1441-1442.
  10. ^Lin, Yibo, et al. "Machine learning for yield learning and optimization." 2018 IEEE International Test Conference (ITC). IEEE, 2018.
  11. ^H. Yang, S. Li, Y. Ma, B. Yu, and E. F. Young, “Gan-opc: mask optimization with lithography-guided generative adversarial nets,” in Proceedings of the 55th Annual Design Automation Conference. ACM, 2018, p. 131.
  12. ^概伦电子招股说明书
  13. ^Elfadel, Ibrahim M., Duane S. Boning, and Xin Li, eds. Machine learning in VLSI computer-aided design. Cham: Springer, 2019.
  14. ^张傲,高建军. 硅基射频器件的建模与参数提取【M】.电子工业出版社
  15. ^https://zhuanlan.zhihu.com/p/358031139
  16. ^https://zhuanlan.zhihu.com/p/358750347
  17. ^https://zhuanlan.zhihu.com/p/360010376
  18. ^Maiti C K . Introducing Technology Computer-Aided Design (TCAD): Fundamentals, Simulations, and Applications[M]. 2017.
  19. ^https://www.zhihu.com/question/328487447/answer/2681547111
  20. ^王阳元等. 《集成电路产业全书》 Page 1188
  21. ^http://m.elecfans.com/article/731554.html
  22. ^半导体设备和材料的国产化机遇——半导体行业深度专题之五
  23. ^刘立军. 晶体生长数值模拟领域的若干研究进展[J]. 中国材料进展, 2019, 38(5):5.
  24. ^https://research.ibm.com/interactive/photoresist/
  25. ^https://baijiahao.baidu.com/s?id=1740761985070634994&wfr=spider&for=pc

相关内容