CN113678064B - 用于在设施位置之间调整预测模型的***和方法 - Google Patents

用于在设施位置之间调整预测模型的***和方法 Download PDF

Info

Publication number
CN113678064B
CN113678064B CN202080027325.2A CN202080027325A CN113678064B CN 113678064 B CN113678064 B CN 113678064B CN 202080027325 A CN202080027325 A CN 202080027325A CN 113678064 B CN113678064 B CN 113678064B
Authority
CN
China
Prior art keywords
model
predictive model
updated
data
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080027325.2A
Other languages
English (en)
Other versions
CN113678064A (zh
Inventor
A·胡博
J·奥努勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ASML Holding NV
Original Assignee
ASML Holding NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP19175717.8A external-priority patent/EP3742229A1/en
Application filed by ASML Holding NV filed Critical ASML Holding NV
Publication of CN113678064A publication Critical patent/CN113678064A/zh
Application granted granted Critical
Publication of CN113678064B publication Critical patent/CN113678064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41885Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70058Mask illumination systems
    • G03F7/7015Details of optical elements
    • G03F7/70175Lamphouse reflector arrangements or collector mirrors, i.e. collecting light from solid angle upstream of the light source
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70216Mask projection systems
    • G03F7/70283Mask effects on the imaging process
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70483Information management; Active and passive control; Testing; Wafer monitoring, e.g. pattern monitoring
    • G03F7/70491Information management, e.g. software; Active and passive control, e.g. details of controlling exposure processes or exposure tool monitoring processes
    • G03F7/705Modelling or simulating from physical phenomena up to complete wafer processes or whole workflow in wafer productions
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/708Construction of apparatus, e.g. environment aspects, hygiene aspects or materials
    • G03F7/70908Hygiene, e.g. preventing apparatus pollution, mitigating effect of pollution or removing pollutants from apparatus
    • G03F7/70916Pollution mitigation, i.e. mitigating effect of contamination or debris, e.g. foil traps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41875Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by quality surveillance of production
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32193Ann, neural base quality management
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32335Use of ann, neural network
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/37Measurements
    • G05B2219/37224Inspect wafer
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/45Nc applications
    • G05B2219/45031Manufacturing semiconductor wafers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Manufacturing & Machinery (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Atmospheric Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Environmental & Geological Engineering (AREA)

Abstract

本文描述了一种用于配置半导体制造工艺的方法,该方法包括:向一个或多个远程位置提供包括多个模型参数的初始预测模型;在一个或多个远程位置用本地数据训练初始预测模型,使得至少一个模型参数被更新;从一个或多个远程位置接收至少一个更新模型参数;基于从一个或多个远程位置接收的至少一个更新模型参数,确定聚合模型参数;以及基于聚合模型参数调整初始预测模型,经调整的预测模型可操作以配置半导体制造工艺。

Description

用于在设施位置之间调整预测模型的***和方法
相关申请的交叉引用
本申请要求2019年4月9日提交的EP申请19168014.9和2019年5月21日提交的EP申请19175717.8的优先权,这些申请通过引用整体并入本文。
技术领域
本文的说明书主要涉及图案形成工艺。更具体地,本说明书涉及用于在设施位置之间调整预测模型的***和方法。
背景技术
光刻投影设备可以用于例如集成电路(IC)的制造。在这种情况下,图案形成装置(例如掩模)可以包含或提供与IC的个体层相对应的图案(“设计布局”),并且该图案可以通过诸如穿过图案形成装置上的图案照射目标部分的方法而被转印到已经涂覆有辐射敏感材料(“抗蚀剂”)层的衬底(例如硅晶片)上的目标部分(例如包括一个或多个模具)上。一般地,单个衬底包含多个相邻的目标部分,由光刻投影设备将图案相继转印到这些目标部分上,一次一个。在一种类型的光刻投影设备中,将整个图案形成装置上的图案一次性转印到一个目标部分上。这种设备通常被称为步进器。在通常称为步进-扫描设备的替代设备中,投影光束沿给定参考方向(“扫描”方向)在图案形成装置上扫描,同时平行于或反平行于该参考方向同步地移动衬底。图案形成装置上不同的图案部分被逐步地转印到一个目标部分上。由于光刻投影设备一般具有减小比率M(例如4),因此衬底移动的速度F是投影光束扫描图案形成装置的速度的1/M。关于如本文所述的光刻装置的更多信息可以例如从US6,046,792中收集,该文献通过引用并入本文。
在将图案从图案形成装置转印到衬底之前,衬底可以经历各种工序,诸如涂底漆、抗蚀剂涂覆和软烘烤。曝光后,衬底可以经历其它工序(“曝光后工序”),诸如曝光后烘烤(PEB)、显影、硬烘烤和转印图案的测量/检查。这一系列工序被用作制造装置(例如IC)的个体层的基础。然后,衬底可以经历各种工艺,诸如蚀刻、离子注入(掺杂)、金属化、氧化、化学机械抛光等,所有这些工艺均旨在完成装置的个体层。如果装置中需要若干层,则对每个层重复整个程序或其变型。最终,装置将存在于衬底上的每个目标部分中。然后,通过诸如切割或锯切之类的技术将这些装置彼此分离,由此可以将各个装置安装在载体上、连接至引脚等。
因此,制造诸如半导体装置的装置通常涉及使用多种制造工艺来处理衬底(例如,半导体晶片),以形成装置的各种特征和多个层。通常使用例如沉积、光刻、蚀刻、化学机械抛光和离子注入来制造和处理这些层和特征。可以在衬底的多个模具上制造多个装置,然后分离出个体装置。这种装置制造工艺可以被认为是图案形成工艺。图案形成工艺涉及图案形成步骤,诸如使用光刻设备中的图案形成装置进行光学和/或纳米压印光刻,以将图案形成装置上的图案转印到衬底上,并且通常但可选地涉及一个或多个相关的图案处理步骤,诸如通过显影设备进行抗蚀剂显影、使用烘烤工具烘烤衬底、使用蚀刻设备蚀刻使用图案等。图案形成工艺通常涉及一个或多个计量过程。
如上所述,光刻是制造诸如IC的装置的中心步骤,其中,形成在衬底上的图案限定诸如微处理器、存储器芯片等装置的功能元件。类似的光刻技术也用于平板显示器、微机电***(MEMS)和其它装置的形成。
随着半导体制造工艺的持续进步,功能元件的尺寸持续减小,同时每个装置的功能元件(诸如晶体管)数量在数十年内稳定地增加,呈现出通常被称为“摩尔定律”的趋势。在当前的技术状态下,使用光刻投影设备制造装置层,光刻投影设备使用来自深紫外照射源的照射将设计布局投影到衬底上,从而形成尺寸远低于100nm(即小于来自照射源(例如193nm照射源)的辐射波长的一半)的个体功能元件。
根据分辨率公式CD=k1×λ/NA,其中,λ是所采用的辐射波长(目前大多数情况下是248nm或193nm),NA是光刻投影设备中投影光学器件的数值孔径,CD是“临界尺寸”——通常是印刷的最小特征尺寸——并且k1是经验分辨率因子,这种尺寸小于光刻投影设备的典型分辨率极限的特征的印刷工艺通常被称为低k1光刻。一般地,k1越小,越难在衬底上再现形状和尺寸与设计者为了实现特定的电功能和性能而设计的形状和尺寸相似的图案。为了克服这些困难,对光刻投影设备、设计布局或图案形成装置应用复杂的微调步骤。这些步骤包括,例如但不限于,优化NA和光学相干性设置、定制照射方案、使用相移图案形成装置、设计布局中的光学邻近校正(OPC,有时也称为“光学和工艺校正”),或通常被定义为“分辨率增强技术”(RET)的其它方法。本文使用的术语“投影光学器件”应广义地理解为包括各种类型的光学***,例如包括折射光学器件、反射光学器件、孔径和反射折射光学器件。术语“投影光学器件”还可以包括根据这些设计类型中的任何一种操作,共同地或单独地引导、成形或控制辐射投影光束的部件。术语“投影光学器件”可以包括光刻投影设备中的任何光学部件,无论该光学部件位于光刻投影设备的光路上的什么位置。投影光学器件可以包括用于在辐射通过图案形成装置之前对来自源的辐射进行成形、调节和/或投影的光学部件,和/或用于在辐射通过图案形成装置之后对辐射进行成形、调节和/或投影的光学部件。投影光学器件一般不包括源和图案形成装置。
发明内容
根据一个实施例,提供了一种用于配置半导体制造工艺的方法,该方法包括:向一个或多个远程位置提供包括多个模型参数的初始预测模型;在一个或多个远程位置用本地数据训练初始预测模型,使得至少一个模型参数被更新;从一个或多个远程位置接收至少一个更新模型参数;基于从一个或多个远程位置接收的至少一个更新模型参数,确定聚合模型参数;以及基于聚合模型参数调整初始预测模型,经调整的预测模型可操作为配置半导体制造工艺。
根据一个实施例,提供了一种用于调整光刻工艺的的方法。在一些实施例中,该方法包括调整用于增强光刻工艺的预测模型。该方法包括向一个或多个远程位置提供包括多个模型参数的初始预测模型。该方法包括在一个或多个远程位置用本地数据训练初始预测模型,使得至少一个模型参数被更新。该方法包括从初始预测模型被训练的一个或多个远程位置中的每个远程位置接收至少一个更新模型参数。该方法包括基于从一个或多个远程位置接收的至少一个更新模型参数,确定聚合更新模型参数。该方法包括基于聚合更新模型参数调整初始预测模型。经调整的预测模型可操作以增强光刻工艺。
在一个实施例中,至少一个模型参数包括权重。
在一个实施例中,该方法还包括在向一个或多个远程位置提供初始预测模型之前,使用全局数据训练初始预测模型。全局数据包括不同的数据集,和/或与本地数据相关但不相同的数据集(例如,从而在模型训练地足够接近之后,允许用(有限的)本地数据微调本地模型(例如无需更新所有变量)。全局数据与多于一个远程位置相关联,使得在一个或多个远程位置用本地数据训练初始预测模型包括再训练初始预测模型以更新至少一个模型参数,从而更好地反映本地数据的细节。
在一个实施例中,使用全局数据训练初始预测模型包括利用与掩模版或收集器相关联的图像数据以及与污染或成像性能相关联的缺陷信息,训练初始预测模型。
在一个实施例中,预测模型是神经网络。在一个实施例中,至少一个模型参数包括神经网络的权重和偏差。
在一个实施例中,经调整的预测模型可操作以增强光刻工艺包括将经调整的预测模型用于识别光刻工艺中的掩模版污染。在一个实施例中,经调整的预测模型可操作以增强光刻工艺包括将经调整的预测模型用于确定对于光刻工艺中的曝光,收集器污染是否处于可接受水平。
在一个实施例中,一个或多个远程位置包括远离生成和训练初始预测模型、接收更新模型参数、确定聚合更新模型参数并且确定经调整的预测模型的设施位置的一个或多个设施位置。
在一个实施例中,初始预测模型的生成和训练由服务提供商执行;向一个或多个远程位置提供初始预测模型由服务提供商执行;远程位置和本地数据与服务提供商的客户相关联;服务提供商从一个或多个远程位置中的每个远程位置接收更新模型参数;服务提供商从一个或多个远程位置中的每个远程位置确定聚合更新模型参数;并且服务提供商基于聚合更新模型参数来确定经调整的预测模型。
在一个实施例中,该方法还包括迭代地向一个或多个远程位置提供经调整的预测模型,接收更新模型参数,确定聚合更新模型参数,以及再调整经调整的预测模型,直到满足停止条件。在一个实施例中,停止条件包括再调整的预测模型收敛。在一个实施例中,再调整的预测模型收敛包括聚合更新模型参数的变化量在阈值变化量内。
在一个实施例中,本地数据对于一个或多个远程位置中的每个远程位置保持是本地的,并且不与(1)提供初始预测模型、接收更新模型参数、确定聚合更新模型参数并且确定经调整的预测模型的位置,或(2)其它远程位置共享。
在一个实施例中,确定聚合更新模型参数包括对从一个或多个远程位置中的每个远程位置接收的相应模型参数求平均。
在一个实施例中,该方法还包括向使用本地数据对初始预测模型进行训练的第一远程位置提供初始预测模型,使得初始预测模型的权重基于第一远程位置处的本地数据更新;从第一远程位置接收更新权重;基于从第一远程位置接收的更新权重,调整初始预测模型;向使用本地数据对经调整的预测模型进行重训练的第二远程位置提供经调整的预测模型,从而基于第二远程位置处的本地数据再更新权重;从第二远程位置接收再更新权重;以及基于从第二远程位置接收的再更新权重,再调整经调整的预测模型。
在一个实施例中,该方法还包括迭代地向附加远程位置提供再调整的预测模型,接收再更新权重,以及基于再更新权重,进一步调整再调整的预测模型。
在一个实施例中,该方法还包括对提供的初始预测模型或至少一个模型参数中的一者或两者执行完整性检查。
在一个实施例中,该方法还包括对从一个或多个远程位置中的每个远程位置接收的更新后的至少一个模型参数执行完整性检查。
在一个实施例中,该方法还包括对提供的初始预测模型或多个模型参数中的一者或两者进行加密。在一个实施例中,加密被配置为使得利用本地数据的训练在不对提供的初始预测模型进行解密的情况下发生。在一个实施例中,该方法还包括对从一个或多个远程位置中的每个远程位置接收的更新后的至少一个模型参数进行解密。
在一个实施例中,向一个或多个远程位置中每个远程位置处的一个或多个模型服务器提供初始预测模型。给定模型服务器与给定远程位置处的本地数据服务器分离。
在一个实施例中,初始预测模型包括部分训练的预测模型。部分训练的预测模型包括多个模型参数,使得在提供至给定远程位置之后,用本地数据进行训练包括完全训练初始预测模型。
根据另一实施例,提供了一种用于调整包括多个模型参数的预测模型的方法。该方法包括将与半导体制造工艺相关联的本地训练数据提供给预测模型,以确定第一更新模型参数值。该方法包括接收通过至少部分地向预测模型提供外部训练数据而获得的第二更新模型参数值。该方法包括基于预测模型准确度的预期改善,调整预测模型。调整包括利用第一更新模型参数值和/或第二更新模型参数值,更新模型参数。
在一个实施例中,多个模型参数包括权重,第一更新模型参数值包括第一更新权重值,并且第二更新模型参数值包括第二更新权重值。
在一个实施例中,该方法还包括,在向预测模型提供本地训练数据之前,使用全局数据训练预测模型。全局数据包括不同的数据集和/或与本地训练数据相似但不同的数据集。在一些实施例中,全局数据可以与多于一个远程位置相关联,使得提供本地训练数据包括再训练(部分)预测模型以确定第一更新模型参数值。例如,服务提供商可以能够收集一个特定光刻机设置的足够数据,但是客户会使用具有不同机器设置的光刻***。在该示例中,基于服务提供商数据训练的部分模型参数可以是足够有效的,但是其它部分可能需要基于客户数据训练,以使模型更好地与客户生成的数据匹配。
在一个实施例中,预测模型是神经网络。在一个实施例中,多个模型参数包括神经网络的权重和偏差。
在一个实施例中,该方法还包括向远程位置提供预测模型。远程位置包括远离生成预测模型的设施位置的设施位置。远程位置包括下述设施位置,在该设施位置处:将与半导体制造工艺相关联的本地训练数据提供给预测模型,以确定第一更新模型参数值;接收第二更新模型参数值;并且调整预测模型。
在一个实施例中,预测模型由服务提供商提供,并且远程位置和本地训练数据与服务提供商的客户相关联。在一个实施例中,本地训练数据保持对于客户是本地的,并且不与服务提供商共享。
在一个实施例中,该方法还包括对预测模型执行完整性检查。
在一个实施例中,对预测模型进行加密。
根据另一实施例,提供了一种用于增强光刻工艺的神经网络的调整方法。该方法包括基于训练数据来训练初始神经网络。训练数据包括用于光刻工艺的过程数据和相应性能数据。初始神经网络包括多个权重。该方法包括将初始神经网络传输至一个或多个远程位置,在该一个或多个远程位置,用本地数据再训练初始神经网络。本地数据包括与远程位置相关联的光刻工艺的过程数据和相应性能数据,从而在一个或多个远程位置中的每个远程位置处基于本地数据更新权重。该方法包括从一个或多个远程位置中的每个远程位置接收更新权重;确定从一个或多个远程位置中的每个远程位置接收到的聚合更新权重;以及基于聚合更新权重,调整初始神经网络。经调整的神经网络可操作为增强光刻工艺。
在一个实施例中,经调整的神经网络可操作为增强光刻工艺包括用于识别和分类光刻工艺中的掩模版污染(尺寸)的经调整的神经网络。在一个实施例中,经调整的神经网络可操作以增强光刻工艺包括经调整的神经网络用于确定对于光刻工艺中的曝光,收集器污染是否处于可接受水平的神经网络。
在一个实施例中,一个或多个远程位置包括远离生成和训练初始神经网络、接收更新权重、确定聚合更新权重并确定经调整的神经网络的设施位置的一个或多个设施位置。
在一个实施例中,初始神经网络的生成和训练由服务提供商执行;向一个或多个远程位置提供初始神经网络由服务提供商执行;远程位置和本地数据与服务提供商的客户相关联;服务提供商从一个或多个远程位置中的每个远程位置接收更新权重;聚合更新权重由服务提供商确定;并且服务提供商基于聚合更新权重来确定经调整的神经网络。
根据另一实施例,提供了一种计算机程序产品,包括记录有指令的非暂态计算机可读介质,当由计算机执行时,指令实施上述(一个或多个)方法。
附图说明
并入说明书并构成说明书一部分的附图示出一个或多个实施例,并与说明书一起解释这些实施例。现在将仅通过示例的方式参考所附示意图描述本公开的实施例,其中,相应附图标记表示相应部件,并且其中:
图1示出根据一个实施例的光刻***的各种子***的框图。
图2示出根据一个实施例,用于在光刻投影设备中模拟光刻的示例性流程图。
图3示出根据一个实施例,调整用于增强光刻工艺的预测模型的本发明方法的操作概要。
图4A示出根据一个实施例,从服务提供商向客户提供和/或以其它方式分配预测模型。
图4B示出根据一个实施例,各个客户如何具有自己的本地数据。
图4C示出根据一个实施例,向客户分配诸如神经网络的预测模型的一组最新权重。
图4D示出根据一个实施例,在一个或多个远程客户位置利用本地数据来训练(和/或再训练)预测模型。
图4E示出根据一个实施例,在各个远程客户位置处确定更新权重和/或其它模型参数。
图5示出根据一个实施例的服务提供商,在服务提供商处可以存储模型和模型参数、可以提供模型服务器、可以执行完整性检查,并且可以执行加密/解密。
图6A示出根据一个实施例的远程客户位置,在该位置处可以存储模型和模型参数、可以提供一个或多个模型服务器、可以执行完整性检查,并且可以执行解密/加密。
图6B示出根据一个实施例,与给定远程客户位置处的本地数据服务器分离的模型服务器。
图7示出根据一个实施例,当在远程位置接收到来自服务提供商的参数(例如权重、偏差等)时,最新参数如何被加载到具有本地操作数据的模型的本地副本中、参数如何被更新,以及更新的参数如何被发送回服务提供商。
图8示出根据一实施例的预测模型的本地副本。
图9示出根据一个实施例,调整用于增强光刻工艺的预测模型的另一本发明方法的操作概要。
图10是根据一个实施例的示例计算机***的框图。
图11是根据一个实施例的光刻投影设备的示意图。
图12是根据一个实施例的另一光刻投影设备的示意图。
图13是根据一个实施例的图12的设备的更详细视图。
图14是根据一个实施例的图12和图13的设备的源收集器模块SO的更详细视图。
具体实施方式
复杂的数据驱动技术在服务提供商及其客户的业务中扮演着越来越重要的角色。由这些技术生成的或用于这些技术的数据可以包括可以货币化的信息。由于这个和其它原因,客户可能不愿意与服务提供商共享数据,因为在共享数据之前可能难以评估数据的价值。服务提供商和客户的示例并非旨在是限制性的。其它应用也是可以设想的。例如,本文描述的***和方法可以用于任何类型的提供商及提供商提供的任何内容的关联用户。
基于数据的预测模型被用于各种问题的许多解决方案中。神经网络是预测模型的一个示例。训练神经网络的一种方式是使用标记训练数据进行训练。标记训练数据包括过程数据(例如用于光刻工艺)和相应性能数据。性能数据例如通过人工检查和/或其它方法确定。对于一些服务提供商,神经网络(或任何其它预测模型)可能需要利用属于客户位置和/或仅在客户位置处可用的数据进行训练。
本发明的***和方法包括数据控制和预测模型(例如神经网络)训练架构,该架构支持基于客户数据进行训练而无需客户共享该数据。有利地,该架构可以减少或消除客户数据(和/或属于客户的其它知识产权)从客户位置意外散布的风险,同时仍然能够提供优化的预测模型。本发明的***和方法被配置为促进使用来自多个客户的数据训练复杂模型,而无需实际访问该数据(例如从服务提供商的观点)。这允许使用客户数据来训练预测模型,使得服务提供商可以向参与客户递送最优模型,而不会引入(或至少降低)数据从客户位置意外散布的风险。
例如,机器学习可以应用于由光刻***生成或在光刻***上可用的数据。在一些情况下,数据相对稀疏,跨不同(例如客户)站点(例如与单个客户相关联的多个站点,或与不同客户相关联的不同站点)共享数据是可行的,以促进基于可用数据训练与光刻***相关联的模型。然而,由于客户想要保护自己的知识产权(例如数据)和/或出于其它原因,客户通常不愿意(与供应商、客户彼此之间等)共享数据。本发明的***和方法有利于向多个***(例如在多个站点、潜在地多个客户)共享初始模型,允许客户执行学习步骤,并且让客户仅与服务提供商共享本地更新的模型参数。本发明的***和方法不需要客户共享自己的本地数据。利用本发明的***和方法,服务提供商可以重复所描述的(一个或多个)工艺,例如直到模型已经收敛(例如“联邦学习”法)。在一些实施例中,本发明的***和方法被配置为促进基于一个数据集来预训练模型,该数据集与对于客户本地的数据集相关(但不相同),并将预训练模型分配给客户,客户将通过基于客户的本地数据继续训练来“微调”(部分)模型。最终模型不返回给供应商,也不以任何其它方式(例如在客户数据不足以训练整个模型的情况下可以应用的“迁移学习”法)来分配。
尽管在本文中具体参考了IC的制造,但显然应当理解的是,本文说明书还有许多其它可能的应用。例如,其可以应用于集成光学***制造、磁畴存储器的引导和检测图案、液晶显示面板、薄膜磁头等。在这些替代应用中,本领域技术人员将理解,在此类替代应用的上下文中,在本文中对术语“掩模版”、“晶片”或“模具”的任何使用应分别视为可与更通用的术语“掩模”、“基片”和“目标部分”互换使用。另外,需要注意的是,本文所描述的方法可以在多个领域中有许多其它可能的应用,诸如语言处理***、自动驾驶汽车、医学成像与诊断、语义分割、去噪、芯片设计、电子设计自动化等。本发明的方法可以应用于机器学习模型预测中的不确定性量化有利的任何领域。
在本文件中,术语“辐射”和“光束”旨在包含所有类型的电磁辐射,包括紫外辐射(例如波长为365、248、193、157或126nm)和EUV(极紫外辐射,例如波长在约5-100nm的范围内)。
图案形成装置可以包括或形成一个或多个设计布局。设计布局可以利用CAD(计算机辅助设计)程序生成。这个过程通常被称为EDA(电子设计自动化)。大多数CAD程序遵循一组预定的设计规则,以形成功能性设计布局/图案形成装置。这些规则是基于处理和设计限制而设置的。例如,设计规则限定装置(诸如栅极、电容器等)或互连线之间的空间容限,以确保装置或线不会以不期望的方式彼此相互作用。一个或多个设计规则限制可以被称为“临界尺寸”(CD)。装置的临界尺寸可以定义为线或孔的最小宽度,或者两条线或两个孔之间的最小间隔。因此,CD调节所设计的装置的整体尺寸和密度。装置制造中的一个目标是在衬底上(经由图案形成装置)如实地复制原始设计意图。
本文中使用的术语“掩模”或“图案形成装置”可以广义地解释为表示能够用于赋予入射的辐射光束与待在衬底的目标部分上形成的图案对应的图案化横截面的一般图案形成装置。术语“光阀”也可以用于该上下文中。除典型掩模(透射或反射、二进制、相移、混合等)外,此类图案形成装置的其它示例包括可编程序反射镜阵列。此类装置的一个示例是具有粘弹性控制层和反射表面的矩阵可寻址表面。这种设备的基本原理是(例如)反射表面的寻址区域将入射辐射反射为衍射辐射,而未寻址区域将入射辐射反射为非衍射辐射。使用适当的滤波器,可以从反射束中滤除非衍射辐射,仅留下衍射辐射;以这种方式,根据矩阵可寻址表面的寻址图案将光束图案化。可以使用适当的电子装置来执行所需要的矩阵寻址。此类图案形成装置的其它示例还包括可编程LCD阵列。这种构造的一个示例在美国专利No.5,229,872中给出,该专利通过引用并入于此。
作为简要介绍,图1示出示例性光刻投影设备10A。主要部件是辐射源12A,其可以是深紫外(DUV)受激准分子激光器源或其它类型的源,包括极紫外(EUV)源(如上所述,光刻投影设备本身不需要具有辐射源)照射光学器件,用于例如限定部分相干(用Σ表示)并且可以包括对来自源12A的辐射进行整形的光学器件14A、16Aa和16Ab;图案形成装置18A;以及透射光学器件16Ac,用于将图案形成装置图案的图像投影到衬底平面22A上。投影光学器件光瞳面处的可调滤光器或光圈20A可以限制撞击在衬底平面22A上的光束角的范围,其中,最大可能角限定投影光学器件的数值孔径NA=n sin(Θmax),其中,n是衬底与投影光学器件的最后一个元件之间的介质的折射率,并且Θmax是从投影光学器件出射的仍然可以撞击衬底平面22A的光束的最大角度。
在光刻投影设备中,源向图案形成装置提供照射(即辐射),并且投影光学器件经由图案形成装置将照射引导并且成形到衬底上。投影光学器件可以包括部件14A、16Aa、16Ab和16Ac中的至少一些部件。空间图像(AI)是在衬底水平的辐射强度分布。抗蚀剂模型可以用于从空间图像计算抗蚀剂图像,其示例可以在美国专利申请公开No.US2009-0157630中找到,该专利的公开内容以整体通过引用并入于此。抗蚀剂模型仅与抗蚀剂层的性质(例如在曝光、曝光后烘烤(PEB)和显影期间发生的化学工艺的影响)有关。光刻投影设备的光学性质(例如照射、图案形成装置和投影光学器件的性质)决定空间图像并且可以在光学模型中限定。由于光刻投影设备中使用的图案形成装置可以改变,因此,期望将图案形成装置的光学性质与包括至少源和投影光学器件的光刻投影设备的其余部分的光学性质分离。用于将设计布局转换为各种光刻图像(例如空间图像、抗蚀剂图像等)、使用这些技术和模型应用OPC以及评估性能(例如工艺窗口方面)的技术和模型的细节在美国专利申请公开US2008-0301620号、2007-0050749号、2007-0031745号、2008-0309897号、2010-0162197号和2010-0180251号中描述,这些专利中每个专利的公开内容以整体通过引用并入于此。
通常希望能够通过计算确定图案形成工艺如何在衬底上产生期望图案。因此,可以提供仿模拟来模拟工艺的一个或多个部分。例如,期望能够模拟将图案形成装置图案转印到衬底的抗蚀剂层上的光刻工艺,以及抗蚀剂显影之后在该抗蚀剂层中产生的图案。
图2示出光刻投影设备中的模拟光刻的示例性流程图。照射模型31表示照射的光学特性(包括辐射强度分布和/或相位分布)。投影光学器件模型32表示投影光学器件的光学特性(包括投影光学器件引起的辐射强度分布和/或相位分布的变化)。设计布局模型35表示设计布局的光学特性(包括给定设计布局引起的辐射强度分布和/或相位分布的变化),这是图案形成装置上或由图案形成装置形成的特征布置的表达。可以使用照射模型31、投影光学器件模型32和设计布局模型35来模拟空间图像36。可以使用抗蚀剂模型37从空间图像36模拟抗蚀剂图像38。光刻的模拟可以例如预测抗蚀剂图像的轮廓和/或CD。
更具体地,照射模型31可以表示照射的光学特性,包括但不限于NA-σ设置以及任何特定照射形状(例如,诸如环形、四极、偶极等的离轴照射)。投影光学器件模型32可以表示投影光学器件光学特性,例如,包括像差、失真、折射率、物理尺寸或维度等。设计布局模型35还可以表示物理图案形成装置的一个或多个物理属性,例如,如美国专利7,587,704号中所描述的,该专利以整体内容通过引用并入本文。与光刻投影设备相关的光学性质(例如照射、图案形成装置和投影光学器件的性质)决定空间图像。由于光刻投影设备中使用的图案形成装置可以改变,因此,期望将图案形成装置的光学性质与包括至少照射和投影光学器件(由此包括设计布局模型35)的光刻投影设备的其余部分的光学性质分离。
抗蚀剂模型37可以用于从空间图像计算抗蚀剂图像,其示例可以在美国专利8,200,468号中找到,该专利以整体内容通过引用并入于此。抗蚀剂模型通常与抗蚀剂层的性质(例如,在曝光、曝光后烘烤和/或显影期间发生的化学工艺的影响)有关。
模拟的目的是精确地预测例如边缘布置、空间图像强度斜率和/或CD,然后可以与预期设计进行比较。预期设计一般被定义为OPC前设计布局,可以以诸如GDSII、OASIS或其它文件格式的标准化数字文件格式提供。
从设计布局可以标识一个或多个部分,这些部分被称为“片段(clip)”。在一个实施例中,提取代表设计布局中的复杂图案的片段集(通常约50-1000个片段,但也可以使用任何数量的片段)。如本领域技术人员将理解的,这些图案或片段表示设计的小部分(例如电路、单元等),特别地,片段表示需要特别注意和/或验证的小部分。换言之,片段可以是设计布局的部分,也可以是相似的,或者具有相似行为的设计布局部分,其中,关键特征通过经验(包括由客户提供的片段)、反复试验、或者运行全芯片仿真来标识。片段通常包括一个或多个测试图案或量规图案。客户可以基于设计布局中需要特定图像优化的已知关键特征区域,先验地提供初始较大的片段集。备选地,在另一实施例中,可以通过使用标识关键特征区域的某种自动(诸如机器视觉)或手动算法,从整个设计布局提取初始较大片段集。
在一些示例中,模拟和建模可以用于配置图案形成装置图案的一个或多个特征(例如执行光学邻近校正)、照射的一个或多个特征(例如改变照射的空间/角度强度分布的一个或多个特性,诸如改变形状),和/或投影光学器件的一个或多个特征(例如数值孔径等)。这种配置一般可以分别称为掩模优化、源优化和投影优化。这种优化可以独立地执行,或者以不同的组合方式进行组合。一个此类示例是源掩模优化(SMO),这涉及配置图案形成装置图案的一个或多个特征,以及照射的一个或多个特征。优化技术可以集中在一个或多个片段上。优化可以使用本文描述的机器学习模型来预测各种参数(包括图像等)的值。
在一个实施例中,***的优化过程可以表示为成本函数。优化过程可以包括找到使成本函数最小化的***参数(设计变量)集。取决于优化的目标,成本函数可以具有任何适当形式。例如,成本函数可以是***的某些特性(评估点)相对于这些特性的预期值(例如理想值)的偏差的加权均方根(RMS)。成本函数也可以是这些偏差的最大值(即最差偏差)。术语“评估点”应当广义地理解为包括***的任何特性。***的设计变量可以被限制在有限范围内和/或因***实施方式的实践而相互依赖。对于光刻投影设备,约束通常与硬件的物理性质和特性相关联,诸如可调范围和/或图案形成装置可制造性设计标准。评估点可以包括衬底上抗蚀剂图像上的物理点,以及诸如剂量和聚焦的非物理特性。
在一个实施例中,照射模型31、投影光学器件模型32、设计布局模型35、抗蚀剂模型37、SMO模型和/或与集成电路制造工艺相关联和/或包含在集成电路制造工艺中的其它模型可以是执行本文方法操作的经验模型。经验模型可以基于各种输入(例如,光刻工艺中使用的掩模或晶片图像的一个或多个特性、设计布局的一个或多个特性、图案形成装置的一个或多个特性、照射的一个或多个特性,诸如波长等)之间的相关性来预测输出。注意,对于掩模版污染的情况:由***测量的是掩模版顶部位置或薄膜上的颗粒污染的高速估计,并且“地面实况”通常是更低但更准确的颗粒离线测量。
作为一个示例,经验模型可以是预测模型、机器学习模型和/或任何其它参数化模型。在一个实施例中,预测和/或机器学习模型(例如)可以是和/或包括数学方程、算法、图表、网络(例如神经网络)和/或其它工具和机器学习模型组件。例如,预测和/或机器学习模型可以是和/或包括具有输入层、输出层以及一个或多个中间层或隐藏层的一个或多个神经网络。在一个实施例中,一个或多个神经网络可以是和/或包括深度神经网络(例如在输入层和输出层之间具有一个或多个中间层或隐藏层的神经网络)。
作为一个示例,一个或多个神经网络可以基于神经单元(或人工神经元)的大合集。一个或多个神经网络可以松散地模拟生物大脑工作的方式(例如经由通过轴突连接的大簇生物神经元)。神经网络中的每个神经单元可以与该神经网络的许多其它神经单元相连。这种连接可以增强或抑制神经元对相连神经单元的激活状态的影响。在一个实施例中,每个个体神经单元可以具有将其所有输入的值组合在一起的求和函数。在一个实施例中,每个连接(或神经单元本身)可以具有阈值函数,使得信号必须超过阈值才能被允许传播至其它神经单元。这些神经网络***可以是自学习和训练的,而不是明确编程的,并且与传统计算机程序相比,可以在解决问题的某些领域中有明显更佳的表现。在一个实施例中,一个或多个神经网络可以包括多个层(例如其中,信号路径从前层横穿到后层)。在一个实施例中,神经网络可以利用反向传播技术,其中,使用正向刺激来重置“前”神经单元的权重。在一个实施例中,对一个或多个神经网络的刺激和抑制可以是更自由流动的,其中,连接以更混乱且复杂的方式相互作用。在一个实施例中,一个或多个神经网络的中间层包括一个或多个卷积层、一个或多个递归层和/或其它层。
可以使用训练数据集来训练一个或多个神经网络(即确定其参数)。训练数据可以包括训练样本集。每个样本可以是包括输入对象(通常是向量,也可以称为特征向量)和期望输出值(也称监控信号)的对。训练算法分析训练数据,并且通过基于训练数据调整神经网络的参数(例如一个或多个层的权重)来调整神经网络的行为。例如,给定{(x1,y1),(x2,y2),...,(xN,yN)}形式的N个训练样本的集,使得xi是第i个示例的特征向量,yi是其监控信号,训练算法寻找神经网络g:X→Y,其中,X是输入空间,Y是输出空间。特征向量是表示某一物体(例如以上示例中的晶片设计,或由线上掩模版污染测量装置收集的图像,且y是由缓慢但准确的离线掩模版污染测量***确定的实际大小)的数值特征n维向量。与这些向量相关联的向量空间通常被称为特征空间。经过训练后,神经网络可以用于使用新样本进行预测。
神经网络可以通过最小化给定的成本函数来训练和/或以其它方式训练。例如,梯度下降是一种公知的迭代方法,其中,迭代在所有可用数据上发生。取决于神经网络,在确定最优模型参数之前,训练可能需要经历数千次(或更多次)迭代循环。梯度下降可以是和/或包括随机梯度下降,其中,以小(但有噪声的)步长连续地(例如一个接一个地)对每个个体训练样本(例如每个工艺/性能数据对)执行计算。这可以产生相对准确的训练模型,但对于大的训练数据集,训练可能花费很长时间。梯度下降也可以是批量梯度下降和/或包括批量梯度下降,其中,同时执行多个训练样本对的计算。这可以产生更平滑收敛的模型(例如由于平均),并且可以应用并行性。然而,批量梯度下降需要所有数据都存在,并且为了性能,需要将所有数据装入电子存储器中(这对于大数据集可能是个问题)。梯度下降也可以是和/或包括小批量梯度下降,其中,每次对训练过程/性能数据对的一个子集(小批量)执行计算。在小批量梯度下降中,训练数据集被分成小批量。循环发生在所有小批量上,并且重复这一过程,直到确定最佳参数。
利用由服务提供商和/或其它集中式***生成和/或训练的现有预测模型在中央***(例如与服务提供商相关联)上从远程***(例如与服务提供商的客户相关联)收集训练数据。来自远程***的信息的意外散布常常是一个问题。开发了本发明的***和方法以解决这些和其它缺点。
本***和方法被配置为确定预测模型并且将预测模型与模型参数一起分配给不同的(例如客户)***。个体(例如客户)***可以用一个小批量的本地训练数据来训练(或再训练)分布式模型。将所得到的本地更新模型参数(例如权重、偏差和/或其它模型参数)返回中央(例如服务提供商)***,在该中央***中发生某种形式的聚合(例如平均和/或其它聚合)。将聚合的模型参数再分配给不同的客户***,并且重复该过程,直到确定最优模型参数。
作为一个示例,本***和方法可以促进从服务提供商到客户的模型和模型参数(例如权重、偏差等)分配。每个客户拥有其自己的数据(可以视为小批量)。客户仅使用自己的训练数据来执行梯度下降的其中一个步骤。所得到的更新模型参数(例如权重、偏差等)被返回给服务提供商。由于客户数据量远大于模型参数量,所以客户数据的细节在更新模型参数中被隐藏/遮挡。一旦训练完成,本发明的***和方法就被配置为使得服务提供商能够递送基于可用数据训练的最佳模型,其中,该模型能够在客户之间共享,而(从服务提供商的角度)无需直接访问客户数据。
图3示出用于调整增强光刻工艺的预测模型的本发明方法300的操作概要。方法300包括向一个或多个远程位置(304)提供包括多个模型参数的初始预测模型。在一些实施例中,一个或多个远程位置包括远离生成和训练初始预测模型、接收更新模型参数、确定聚合更新模型参数并确定经调整的预测模型的设施位置的一个或多个设施位置(例如,如下文所述)。
在一些实施例中,预测模型是神经网络和/或其它预测模型。在一个实施例中,多个模型参数包括神经网络的权重、偏差和/或其它参数。提供初始预测模型包括将初始预测模型传输和/或以其它方式分配到一个或多个远程位置。传输和/或以其它方式分配初始预测模型可以包括通过电子邮件、短信和/或其它电子消息传送模型、经由网站提供模型、经由基于云的存储介质存储和/或提供对模型的访问、将模型存储在非暂态存储介质上并且物理地转移非暂态存储介质,和/或其它方式的传输或分配。
在一个或多个远程位置处,用本地数据训练和/或再训练初始预测模型。本地数据包括与远程位置相关联的过程数据和相应性能数据。过程数据和相应性能数据可以包括例如与远程位置相关联的用于光刻建模和/或制造工艺的数据,和/或其它数据。在一些实施例中,第一本地数据可以与第一远程位置相关联,第二本地数据可以与第二远程位置相关联,以此类推。在一些实施例中(例如,如本文所描述的),远程位置与服务提供商的客户相关联,其中,服务提供商向个体客户提供初始预测模型的副本。用本地数据再训练初始预测模型可以包括提供本地数据作为预测模型和/或在个体参与远程位置(例如客户)处进行其它训练的输入。例如,可以在若干不同远程位置中的每个远程位置处不同地再训练初始预测模型。这种再训练可以并行地发生,例如,在不同的远程位置并行地发生,因为每个远程位置均使用其本身的本地数据进行再训练。
在一个实施例中,在向一个或多个远程位置提供初始预测模型之前,使用全局数据生成和/或训练(302)初始预测模型。全局数据包括比本地数据更大的数据集、与本地数据不同的数据集(不一定更大)和/或其它数据。全局数据(过程和相应性能数据)可以与服务提供商相关联,可以与来自一个或多个远程位置的数据相关(但不相同),可以与来自多于一个远程位置的数据相关和/或相关联,和/或包括其它数据。全局数据可以包括例如与若干远程位置相关联、相关和/或代表若干远程位置的过程数据和相应性能数据。过程数据和对应性能数据可以包括用于光刻建模和/或制造工艺的数据,例如与若干远程位置相关联、相关和/或代表若干远程位置的数据,和/或其它数据。在一些实施例中,全局数据是基于预期过程行为确定的合成数据或基于该合成数据。在一些实施例中,全局数据可以是种子数据和/或模型参数(例如一般是随机选择的权重)。在此类实施例中,实际学习可以仅在客户处发生(如果适用,可以与服务提供商处可用的相关训练数据组合)。对于掩模版污染情况的示例,服务提供商可以从内部掩模版成像***收集颗粒数据,并且使用显微镜从物理颗粒收集细节。客户也可以在其自己的进程中本地并行地执行此类操作。在该示例中,服务提供商可以从训练自己的本地数据开始,然后基于组合的客户数据细化数据。如果该数据在服务提供商处不是本地可用的,则例如,分配给客户的第一模型可以具有“随机权重”(例如以建立起始点)。
在一个或多个远程位置用本地数据训练(或再训练)初始预测模型包括再训练初始预测模型以更新至少一个模型参数。例如,可以在一个或多个远程位置用本地数据训练(或再训练)初始预测模型,从而在一个或多个远程位置的每一个远程位置处基于本地数据更新(一个或多个)权重、(一个或多个)偏差和/或其它参数。训练和/或再训练初始预测模型可以包括将本地数据提供给初始预测模型,作为初始预测模型的输入(例如,如上所述)。初始预测模型可以操作(例如,如上文中关于神经网络描述的)为基于提供给预测模型的相应过程数据,学习更好地预测性能数据。例如,学习更好地预测性能可以包括迭代地更新一个或多个模型参数,并且确定更新是否导致对已知性能数据的更好或更差的预测。
方法300包括从训练(或再训练)后的初始预测模型的一个或多个远程位置中的每个远程位置接收(306)至少一个更新模型参数。这可以包括从一个或多个远程位置中的每个远程位置接收更新权重、偏差和/或其它参数。继续参照上面的示例,可以从第一远程位置(客户)、第二远程位置(客户)等接收更新权重、偏差和/或其它参数。
方法300包括基于从一个或多个远程位置接收的至少一个更新模型参数,确定(308)聚合更新模型参数。这可以包括例如确定从一个或多个远程位置中的每个远程位置接收的聚合更新权重、偏差和/或其它参数。在一个实施例中,确定聚合更新模型参数包括对相应模型参数求平均和/或进行其它聚合。例如,权重与从一个或多个远程位置中的每个远程位置远程位置接收的其它对应权重求平均,并且偏差与从一个或多个远程位置中的每个远程位置远程位置接收的其它对应偏差求平均等。作为更具体的示例,可以在若干远程位置(例如客户)中的每个远程位置处确定更新后的第一权重和第二权重,从而接收第一权重的若干值和第二权重的若干值。响应于接收,可以将第一权重的若干值一起求平均(和/或以其它方式聚合),并且单独地,可以将第二权重的若干值一起平均(和/或以其它方式聚合)。可以针对任何数量的权重、偏差和/或其它模型参数重复该过程。
在一些实施例中,方法300包括基于聚合更新模型参数调整(310)初始预测模型。这可以包括例如基于聚合更新权重、偏差和/或其它参数,调整例如初始神经网络。在一些实施例中,调整(310)初始预测模型包括用聚合更新模型参数替代预测模型的先验模型参数。在一些实施例中,用一个、一些或所有聚合更新模型参数进行替代。在一些实施例中,方法300包括自动地用一个、一些或所有聚合更新模型参数进行替代。在一些实施例中,方法300包括促进用户选择和/或以其它方式指示(例如经由如本文所述的用户接口)要用哪些聚合更新模型参数进行替代。
在一些实施例中,调整(310)初始预测模型可以由例如服务提供商执行。在此类实施例中,服务提供商可以调整初始预测模型,并且将经调整的预测模型提供给远程(例如客户)位置。
在一些实施例中,方法300包括迭代地向一个或多个远程位置(例如客户)提供(312)经调整的预测模型(和/或经聚合更新模型参数),接收经更新模型参数(例如从客户),确定聚合更新模型参数,以及再调整经调整的预测模型,直到满足停止条件。在一些实施例中,停止条件包括再调整的预测模型收敛。在一些实施例中,再调整的预测模型收敛包括聚合更新模型参数的变化量在阈值变化量内,和/或其它模型聚合标准。
作为简要概述,在一些实施例中,初始预测模型的生成和训练由服务提供商执行。向一个或多个远程位置提供初始预测模型由服务提供商执行。远程位置和本地数据与服务提供商的客户相关联。服务提供商从一个或多个远程位置中的每个远程位置接收更新模型参数。服务提供商从一个或多个远程位置中的每个远程位置确定聚合更新模型参数。服务提供商(和/或个体客户)基于聚合更新模型参数来确定经调整的预测模型。本地数据对于一个或多个远程位置(例如客户)中的每个远程位置保持是本地的,并且不与(1)提供初始预测模型、接收更新模型参数、确定聚合更新模型参数以及确定经调整的预测模型位置(例如服务提供商),或(2)远程位置(例如客户)中的其它位置共享。
在一些实施例中,经调整的预测模型(例如神经网络)可操作以增强光刻工艺(例如,如上文所述),和/或具有其它应用。例如,给定一组过程数据,经调整的预测模型可能更能够预测光刻工艺的性能数据。该预测模型可以被迭代地调整为增强光刻工艺预测的准确度。这些预测可以用于确定和/或调整工艺参数、确定和/或调整特征设计、确定制造操作的顺序、确定哪个制造设备用于制造过程和/或促进其它强化。
作为非限制性示例,图4A至图4E示出向远程位置提供初始预测模型、从远程位置接收更新模型参数、确定聚合更新模型参数,以及调整初始预测模型。图4A示出从服务提供商402向一个或多个客户404(例如远程位置)提供和/或以其它方式分配(400)预测模型401(M)。如图4A所示,预测模型401(M)被分配给第一客户“客户(1)”、第二客户“客户(2)”……和第K客户“客户(K)”。可以向每个客户404提供相同的模型401(M)。如上所述,提供预测模型401(M)包括将预测模型401(M)传输和/或以其它方式分配给一个或多个客户404。传输和/或以其它方式分配初始预测模型可以包括通过电子邮件、短信和/或其它电子消息传送模型、经由网站提供模型、经由基于云的存储介质存储和/或提供对模型的访问、将模型存储在非暂态存储介质上并且物理地转移非暂态存储介质,和/或其它方式的传输或分配。
图4B示出各个客户404(例如客户1、客户2……客户K)如何具有其自己的本地数据406。本地数据可以包括与(例如)客户404相关联的光刻工艺的过程数据和相应性能数据,和/或其它数据。例如,本地数据406(B1)与客户404(1)相关联,本地数据406(B2)与客户404(2)相关联,……本地数据406(Bk)与客户404(K)相关联。图4B还示出服务提供商402如何分配(400)具有最新(例如最近更新和/或最近确定/聚合的)模型参数的模型401(M)版本。在图4B所示的示例中,预测模型可以是神经网络,并且模型参数可以包括权重(W)。图4B示出服务提供商402如何具有最新权重WL(例如W=WL)。
图4C示出向客户404(1)、404(2)……404(K)分配(410)模型401(M)(例如,诸如神经网络的预测模型)的最新权重W。相同的权重W被分配(410)至每个个体远程客户位置。个体客户404可以以最新权重W加载模型401(M)。例如,操作412、414和416示出个体客户404(1、2……K)以权重W加载模型401(M)。权重W可以分别在每个个体远程客户位置处加载至模型401(M)(例如模型401(M)的本地副本)中。在一些实施例中,最新权重W可以在包括模型401(M)(例如具有模型401M的初始发布)的相同通信中,和/或在单独的通信和/或传输中(例如如本文所述的接收、聚合和更新权重和/或其它模型参数的迭代之后)发送给客户404。
图4D示出在一个或多个远程客户(例如404(1)、404(2)……404(K))位置处用本地数据406(例如B1、B2……Bk)训练(和/或再训练)(420)模型401(M)。在一个或多个远程客户位置404处用本地数据406训练(或再训练)模型401(M)包括在各个客户位置404处向模型401(M)提供本地数据406,并且使模型401(M)更新至少一个模型参数。例如,可以在一个或多个远程客户位置404处用本地数据406训练(或再训练)模型401(M),从而基于一个或多个远程客户位置404中的每个远程客户位置处的本地数据406来更新(一个或多个)权重、(一个或多个)偏差和/或其它参数。在一些实施例中,训练(和/或再训练)包括在给定远程客户位置404处仅使用本地数据406在本地执行梯度下降中的一个步骤(例如,如上文所描述的)。与梯度下降步骤的执行相关联的一个数学运算非限制性示例可以是:
图4D示出这种数学运算在过程中可能的发生位置的占位符422。应当注意的是,来自一个远程客户位置404的本地数据406不与任何其它远程客户位置404和/或服务提供商402共享。在各个远程客户位置404处并行地执行多个单独的梯度下降计算。
图4E示出各个远程客户位置404(例如404(1)、404(2)……404(K))处更新权重W和/或其它模型参数的确定450、452、454。将更新权重(在该示例中)返回(460)给服务提供商402。服务提供商402聚合(460)更新权重。在图4E所示的示例中,聚合包括求平均。在一些实施例中,聚合更新权重可以包括例如确定从一个或多个远程用户位置404中的每个远程用户位置接收的聚合更新权重、偏差和/或其它参数。确定聚合更新模型参数包括对从一个或多个远程位置中的每个远程位置接收的相应模型参数求平均和/或进行其它聚合(例如权重与权重求平均、偏差与偏差求平均等)。
图4E还示出聚合更新权重(在本示例中)如何变为(被视为)最新权重WL,以及如何利用这些最新权重重复图4A至图4E所示的操作。例如,响应模型在个体迭代之后不收敛,可以迭代地重复(例如利用新的最新权重)图4A至图4E所示的操作。在一些实施例中,该方法还包括基于聚合更新模型参数(例如,本示例中的权重)调整预测模型401(M)。这可以包括例如基于聚合更新权重、偏差和/或其它参数,调整例如初始神经网络。
返回图3,在一些实施例中,使用全局数据(例如操作302)训练初始预测模型(例如神经网络)包括利用与掩模版或收集器相关联的图像数据以及与污染或成像性能相关联的缺陷信息,训练初始预测模型。在一些实施例中,经调整的预测模型可操作以增强光刻工艺包括将经调整的预测模型用于识别光刻工艺中的掩模版污染。在一些实施例中,经调整的预测模型可操作以增强光刻工艺包括将经调整的预测模型用于确定对于光刻工艺中的曝光,收集器污染是否处于可接受水平。与集成电路制造工艺和/或其它工艺的若干不同方面相关的其它示例是可以设想的。例如,在一个实施例中,该方法可以包括使用预测模型预测晶片几何形状,作为半导体制造工艺的一部分。在一个实施例中,该方法可以包括使用预测模型生成预测套刻,作为半导体制造工艺的一部分。这些仅仅是示例,而不是限制性的。
图5示出服务提供商402,在服务提供商402处可以存储模型和模型参数502,可以提供一个或多个模型服务器504(例如被配置为促进向远程位置提供模型和/或模型参数、聚合更新模型参数、调整预测模型等),可以执行完整性检查506,并且可以执行加密508/解密510。
在一些实施例中,方法300(图3)包括(例如操作304)对提供的初始预测模型和/或预测模型的其它版本、一个或多个模型参数和/或其它信息进行加密508(图5)。在一些实施例中,加密508被配置为使得利用本地数据的训练在不对提供的初始预测模型进行解密的情况下发生。在一些实施例中,方法300包括(例如操作306)对从一个或多个远程位置中的每个远程位置接收的更新后的至少一个模型参数进行解密510(图5)。在一些实施例中,对提供到/来自一个或多个远程位置(例如客户)的信息进行加密508和/或解密510有助于增加远程位置处的用户对本地数据不会意外与服务提供商和/或远程位置中的其它远程位置共享的信任和/或信心。在一些实施例中,例如,对提供到/来自一个或多个远程位置的信息进行加密508和/或解密510有助于增加服务提供商对给定预测模型可以保持专有并且不会在客户之间共享或由客户反向修改的信任和/或信心。
在一些实施例中,方法300(图3)包括对提供的初始预测模型和/或预测模型的其它版本、一个或多个模型参数和/或其它信息执行完整性检查506(图5)。例如,在一些实施例中,该方法包括对从一个或多个远程位置中的每个远程位置接收的一个或多个更新模型参数执行完整性检查。在一些实施例中,执行完整性检查一般可以包括确定接收值是否在预期值范围内。例如,执行完整性检查可以包括确定更新参数值(例如权重)是否在神经网络的期望权重范围内。值的预期范围可以对应于个体参数,使得不同参数具有不同的预期范围(例如不同权重、不同偏差等具有不同范围)。预期范围可以基于模型参数的先前值确定、可以在制造时确定、可以由用户(例如经由本文描述的用户接口)确定和/或调整,和/或通过其它方式确定。作为完整性检查的其它可能非限制性示例,客户可以查看模型的新版本是否实际上改善,或者服务提供商可以检查收敛趋势等。其它示例也是可以设想的。
在一些实施例中,如上所述,加密/解密和/或完整性检查可以由服务提供商执行,和/或由远程位置处的客户执行。例如,图6A示出远程客户位置404,在远程客户位置404可以存储模型和模型参数602,可以提供一个或多个模型服务器604(例如被配置为促进在远程客户位置404处接收模型和/或模型参数、更新模型参数等),可以执行完整性检查606(例如对进入和/或离开数据),并且可以执行加密608/解密610。如图6A所示,在一些实施例中,向一个或多个远程位置404中每个远程位置处的一个或多个模型服务器604提供预测模型。在一些实施例中,通向和/或来自远程位置404(例如客户)的通信仅涉及模型布局、模型权重和/或其它信息。
在一些实施例中,如图6B所示,给定模型服务器604与给定远程客户位置404处的本地数据服务器700分离。图6B还示出与模型服务器604分离的本地数据存储器702。来自本地数据存储器702的数据对于远程客户位置404保持是本地的,并且不与服务提供商402和/或其它客户的其它远程客户位置404共享。本地数据存储702可以存储客户(例如)想要保密和/或存储在远程位置404处的数据和/或其它数据。这些数据可以包括操作和/或过程数据,和/或客户不想与服务提供商402和/或其它远程位置404共享的其它数据。
图7示出当在远程位置404处接收到来自服务提供商402(例如经由通信601)的最新参数(例如权重、偏差等)时,最新参数如何被加载(704)到模型(和/或与最新参数一起和/或在最新参数之前从服务提供商402发送的模型)的本地副本中,参数如何被更新,以及更新参数如何被发送回服务提供商402(例如经由通信601)。例如,最新参数可以通过模型服务器604和/或其它部件加载(704)到模型的本地副本中。最新参数可以与来自本地数据服务器700的本地操作数据706和/或其它信息一起加载(704)到模型的本地副本中。
如上所述,更新参数可以包括在一个或多个远程位置404用本地数据706训练(或再训练)预测模型。这种训练(或再训练)可以由训练服务器710和/或远程位置404处的其它部件执行。包括再训练初始预测模型以更新至少一个模型参数。例如,可以通过在远程位置404处执行本地梯度下降420,利用本地数据706训练(或再训练)预测模型,从而基于本地数据706更新(一个或多个)权重、(一个或多个)偏差和/或其它参数。这可以发生在一个或多个远程位置404中的每个远程位置处。训练和/或再训练预测模型可以包括将本地数据提供给初始预测模型,作为初始预测模型的输入(例如,如上所述)。预测模型可以操作(例如,如上文中关于神经网络描述的)为基于提供给预测模型的相应过程数据,学习更好地预测性能数据。例如,学习更好地预测性能可以包括迭代地更新一个或多个模型参数,并且确定更新是否导致对已知性能数据的更好或更差的预测。
在一些实施例中,图3、图4A至图4E、图5、图6A至图6B、图7和图8中示出和描述的方法和/或操作包括向第一远程位置提供初始预测模型,在第一远程位置用本地数据训练初始预测模型,使得初始预测模型的权重、偏差和/或其它参数基于第一远程位置处的本地数据更新。可以从第一远程位置接收更新的权重、偏差和/或其它参数。这些方法和/或操作可以包括基于从第一远程位置接收的聚合更新权重、偏差和/或其它参数,调整初始预测模型。这些方法和/或操作可以包括将经调整的预测模型提供给第二远程位置,在第二远程位置用本地数据训练经调整的预测模型,从而基于第二远程位置处的本地数据再更新权重;这些方法和/或操作可以包括从第二远程位置接收再更新权重;以及基于从第二远程位置接收的再更新权重,再调整经调整的预测模型。在一些实施例中,这些方法和/或操作可以包括迭代地向附加远程位置提供再调整的预测模型(例如逐一执行上文所述的操作),接收再更新权重,以及基于再更新权重,进一步调整再调整的预测模型。
在一些实施例中,初始预测模型(和/或服务提供商提供的任何预测模型)包括部分训练的预测模型。部分训练的预测模型包括多个模型参数,使得在提供至给定远程位置(例如客户)之后,用本地数据进行训练包括完全训练预测模型。在一些实施例中,给定远程位置处的用户(例如客户)可以基于完全训练的预测模型来确定是否从给定远程位置传送更新的至少一个模型参数。例如,响应用户对完全训练的预测模型的准确度表示满意,用户可以决定模型的进一步迭代对于给定远程位置是不必要的,并且决定不将更新模型参数传送回服务提供商。
图8示出预测模型的本地副本800。在一些实施例中,如图8所示,一旦预测模型的本地副本800在给定远程位置404处达到特定客户的足够预测性能水平,客户就可选择放弃从服务提供商402接收对模型的更新和/或将更新模型参数返回给服务提供商402。客户可以使用自己的操作数据,利用充分执行模型来运行自己的操作。在一些实施例中,即使是在继续使用其自己模型的本地副本800时,客户也可以继续将更新模型参数返回给服务提供商402。
图9示出调整用于增强光刻工艺的预测模型的另一本发明方法的操作900概要。方法900包括将与半导体制造工艺相关联的本地训练数据提供(904)给预测模型。预测模型可以具有相应值的各种参数(例如权重、偏差等)。可以将本地训练数据提供(904)给预测模型,以确定第一更新模型参数值(例如权重、偏差和/或其它参数)。这可以包括执行本地梯度下降,从而基于本地数据更新(一个或多个)权重、(一个或多个)偏差和/或其它参数。
方法900包括操作906,操作906包括接收通过至少部分地向预测模型提供外部训练数据而获得的第二更新模型参数值。在一些实施例中,多个模型参数包括权重和/或偏差(和/或如上所述的其它参数)。第一更新模型参数值可以包括例如第一更新权重值和/或偏差值,并且第二更新模型参数值可以包括例如第二更新权重值和/或偏差值。在一些实施例中,第二更新模型参数可以由例如位于远离确定第一更新模型参数的客户位置的服务提供商提供。在一些实施例中,服务提供商和/或客户向预测模型提供外部训练数据。在一些实施例中,服务提供商生成外部训练数据,并且可以不向客户提供外部训练数据。
方法900包括基于预测模型准确度的预期改善,调整(908)预测模型。调整908包括利用第一更新模型参数值和/或第二更新模型参数值,更新模型参数。例如,如果使用预测模型的客户决定第一更新模型参数值(相对于第二更新模型参数值)使得预测模型的预测更准确,则客户可以使用第一更新模型参数值运行预测模型。这仅仅是一个示例,而不是限制性的。在一些实施例中,客户可以使用第一更新模型参数值和第二更新模型参数值中的一个,可以仅使用第二更新模型参数和/或可以使用其它组合。
在一个实施例中,该方法还包括,在向预测模型提供本地训练数据之前,使用全局数据生成和/或训练(902)预测模型。在一个实施例中,操作902包括向远程位置提供预测模型。如上所述,远程位置包括远离生成预测模型的设施位置的设施位置。远程位置包括下述设施位置,在该设施位置处:将与半导体制造工艺相关联的本地训练数据提供给预测模型,以确定第一更新模型参数值;接收第二更新模型参数值;并且调整预测模型。
本发明的其它实施例在下编号条款列表中公开:
1.一种用于调整光刻工艺的方法,所述方法包括:
向一个或多个远程位置提供包括多个模型参数的初始预测模型;
在所述一个或多个远程位置处用本地数据训练所述初始预测模型,使得至少一个模型参数被更新;
从所述初始预测模型被训练的一个或多个远程位置中的每个远程位置接收至少一个更新模型参数;
基于从所述一个或多个远程位置接收的所述至少一个更新模型参数,确定聚合更新模型参数;以及
基于所述聚合更新模型参数调整所述初始预测模型,经调整的预测模型可操作以增强所述光刻工艺。
2.根据条款1所述的方法,其中,所述至少一个模型参数包括权重。
3.根据条款1或2所述的方法,还包括,在向所述一个或多个远程位置提供所述初始预测模型之前,使用全局数据训练所述初始预测模型,所述全局数据包括大于所述本地数据的数据集,所述全局数据与多于一个所述远程位置相关联,
使得在所述一个或多个远程位置处用本地数据训练所述初始预测模型包括再训练所述初始预测模型以更新所述至少一个模型参数。
4.根据条款3所述的方法,其中,使用全局数据训练所述初始预测模型包括利用与掩模版或收集器相关联的图像数据以及与污染或成像性能相关联的缺陷信息,训练所述初始预测模型。
5.根据条款1至4中任一项所述的方法,其中,所述预测模型是神经网络。
6.根据条款5所述的方法,其中,所述至少一个模型参数包括所述神经网络的权重和偏差。
7.根据条款1至6中任一项所述的方法,其中,所述经调整的预测模型可操作以增强所述光刻工艺包括将所述经调整的预测模型用于识别所述光刻工艺中的掩模版污染。
8.根据条款1至6中任一项所述的方法,其中,所述经调整的预测模型可操作以增强所述光刻工艺包括将所述经调整的预测模型用于确定对于所述光刻工艺中的曝光,收集器污染是否处于可接受水平。
9.根据条款1至8中任一项所述的方法,其中,所述一个或多个远程位置包括远离生成和训练所述初始预测模型、接收所述更新模型参数、确定所述聚合更新模型参数并确定所述经调整的预测模型的设施位置的一个或多个设施位置。
10.根据条款9所述的方法,其中,所述初始预测模型的生成和训练由服务提供商执行;向所述一个或多个远程位置提供所述初始预测模型由所述服务提供商执行;所述远程位置和所述本地数据与所述服务提供商的客户相关联;所述服务提供商从所述一个或多个远程位置中的每个远程位置接收所述更新模型参数;由所述服务提供商确定从所述一个或多个远程位置中的每个远程位置接收的所述聚合更新模型参数;并且通过所述服务提供商基于所述聚合更新模型参数来确定所述经调整的预测模型。
11.根据条款1至10中任一项所述的方法,还包括迭代地向所述一个或多个远程位置提供所述经调整的预测模型,接收所述更新模型参数,确定所述聚合更新模型参数,以及再调整所述经调整的预测模型,直到满足停止条件。
12.根据条款11所述的方法,其中,所述停止条件包括再调整的预测模型收敛。
13.根据条款12所述的方法,其中,所述再调整的预测模型收敛包括所述聚合更新模型参数的变化量在阈值变化量内。
14.根据条款1至13中任一项所述的方法,其中,所述本地数据对于所述一个或多个远程位置中的每个远程位置保持是本地的,并且不与(1)提供所述初始预测模型、接收所述更新模型参数、确定所述聚合更新模型参数并确定所述经调整的预测模型的位置,或(2)其它远程位置共享。
15.根据条款1至14中任一项所述的方法,其中,确定所述聚合更新模型参数包括对从所述一个或多个远程位置中的每个远程位置接收的相应模型参数求平均。
16.根据条款1至15中任一项所述的方法,还包括向使用本地数据对所述初始预测模型进行训练的第一远程位置提供所述初始预测模型,使得所述初始预测模型的权重基于所述第一远程位置处的本地数据更新;
从所述第一远程位置接收更新权重;
基于从所述第一远程位置接收的所述更新权重,调整所述初始预测模型;
向使用本地数据对经调整的预测模型进行重训练的第二远程位置提供所述经调整的预测模型,从而基于所述第二远程位置处的本地数据再更新所述权重;
从所述第二远程位置接收再更新权重;以及
基于从所述第二远程位置接收的所述再更新权重,再调整所述经调整的预测模型。
17.根据条款16所述的方法,还包括迭代地向附加远程位置提供再调整的预测模型,接收所述再更新权重,以及基于所述再更新权重,进一步调整所述再调整的预测模型。
18.根据条款1至17中任一项所述的方法,还包括对提供的初始预测模型或所述至少一个模型参数中的一者或两者执行完整性检查。
19.根据条款1至18中任一项所述的方法,还包括对从所述一个或多个远程位置中的每个远程位置接收的更新后的至少一个模型参数执行完整性检查。
20.根据条款1至19中任一项所述的方法,还包括对所述提供的初始预测模型或所述多个模型参数中的一者或两者进行加密。
21.根据条款20所述的方法,其中,所述加密被配置为使得利用本地数据的所述训练在不对所述提供的初始预测模型进行解密的情况下发生。
22.根据条款1至21中任一项所述的方法,还包括对从所述一个或多个远程位置中的每个远程位置接收的所述更新后的至少一个模型参数进行解密。
23.根据条款1至22中任一项所述的方法,其中,向所述一个或多个远程位置中每个远程位置处的一个或多个模型服务器提供所述初始预测模型,给定模型服务器与给定远程位置处的本地数据服务器分离。
24.根据条款1至23中任一项所述的方法,其中,所述初始预测模型包括部分训练的预测模型,所述部分训练的预测模型包括所述多个模型参数,使得在提供至给定远程位置之后,用本地数据进行的所述训练包括完全训练所述初始预测模型。
25.根据条款24所述的方法,其中,所述给定远程位置处的用户基于所述完全训练的初始预测模型,确定是否从所述给定远程位置通信更新的至少一个模型参数。
26.一种用于调整包括多个模型参数的预测模型的方法,所述方法包括:
将与半导体制造工艺相关联的本地训练数据提供给所述预测模型,以确定第一更新模型参数值;
接收通过至少部分地向所述预测模型提供外部训练数据而获得的第二更新模型参数值;以及
基于预测模型准确度的预期改善,调整所述预测模型,其中,所述调整包括利用所述第一更新模型参数值和/或所述第二更新模型参数值,更新所述模型参数。
27.根据条款26所述的方法,其中,所述多个模型参数包括权重,所述第一更新模型参数值包括第一更新权重值,并且所述第二更新模型参数值包括第二更新权重值。
28.根据条款26或27所述的方法,还包括,在向所述预测模型提供所述本地训练数据之前,使用全局数据训练所述预测模型,所述全局数据包括大于所述本地训练数据的数据集,所述全局数据与多于一个所述远程位置相关联。
使得所述提供本地训练数据包括再训练所述预测模型以确定所述第一更新模型参数值。
29.根据条款26至28中任一项所述的方法,其中,所述预测模型是神经网络。
30.根据条款29所述的方法,其中,所述多个模型参数包括所述神经网络的权重和偏差。
31.根据条款26至30中任一项所述的方法,还包括向远程位置提供所述预测模型,所述远程位置包括远离生成所述预测模型的设施位置的设施位置,所述远程位置包括下述设施位置,在所述设施位置处:
将与所述半导体制造工艺相关联的所述本地训练数据提供给所述预测模型,以确定所述第一更新模型参数值;
接收所述第二更新模型参数值;并且
调整所述预测模型。
32.根据条款31所述的方法,其中,所述预测模型由服务提供商提供,并且所述远程位置和所述本地训练数据与所述服务提供商的客户相关联。
33.根据条款32所述的方法,其中,所述本地训练数据保持对于所述客户是本地的,并且不与所述服务提供商共享。
34.根据条款26至33中任一项所述的方法,还包括对所述预测模型执行完整性检查。
35.根据条款26至34中任一项所述的方法,其中,对所述预测模型进行加密。
36.一种用于增强光刻工艺的神经网络的调整方法,所述方法包括:
基于训练数据来训练初始神经网络,所述训练数据包括用于所述光刻工艺的过程数据和相应性能数据,所述初始神经网络包括多个权重;
将所述初始神经网络传输至一个或多个远程位置,在所述一个或多个远程位置,用本地数据再训练所述初始神经网络,所述本地数据包括与所述远程位置相关联的光刻工艺的过程数据和相应性能数据,从而在所述一个或多个远程位置中的每个远程位置处基于所述本地数据更新所述权重;
从所述一个或多个远程位置中的每个远程位置接收更新权重;
确定从所述一个或多个远程位置中的每个远程位置接收到的聚合更新权重;以及
基于所述聚合更新权重,调整所述初始神经网络,经调整的神经网络可操作为增强所述光刻工艺。
37.根据条款36所述的方法,其中,所述经调整的神经网络可操作以增强光刻工艺包括用于识别所述光刻工艺中的掩模版污染的所述经调整的神经网络。
38.根据条款36所述的方法,其中,所述经调整的神经网络可操作以增强光刻工艺包括用于确定对于所述光刻工艺中的曝光的所述经调整的神经网络,收集器污染是否处于可接受水平。
39.根据条款36至38中任一项所述的方法,其中,所述一个或多个远程位置包括远离生成和训练所述初始神经网络、接收所述更新权重、确定所述聚合更新权重并确定所述经调整的神经网络的设施位置的一个或多个设施位置。
40.根据条款36至39中任一项所述的方法,其中,所述初始神经网络的生成和训练由服务提供商执行;向所述一个或多个远程位置提供所述初始神经网络由所述服务提供商执行;所述远程位置和所述本地数据与所述服务提供商的客户相关联;所述服务提供商从所述一个或多个远程位置中的每个远程位置接收所述更新权重;所述聚合更新权重由所述服务提供商确定;并且所述服务提供商基于所述聚合更新权重来确定所述经调整的神经网络。
41.一种计算机程序产品,包括记录有指令的非暂态计算机可读介质,当由计算机执行时,所述指令实施条款1至40中任一项所述的方法。
图10是有助于实现本文所公开的方法、流程或***的计算机***100的框图。计算机***100包括总线102或用于传送信息的其它通信机构,以及与总线102耦接且用于处理信息的处理器104(或多个处理器104和105)。计算机***100还包括耦接至总线102的主存储器106,例如随机存取存储器(RAM)或其它动态存储装置,用于存储信息和待由处理器104执行的指令。主存储器106还可以用于在待由处理器104执行的指令执行期间,存储临时变量或其它中间信息。计算机***100还包括耦接至总线102的只读存储器(ROM)108或其它静态存储装置,用于存储静态信息和处理器104的指令。提供诸如磁盘或光盘的存储装置110,并将其耦接至总线102,用于存储信息和指令。
计算机***100可以经由总线102耦接至显示器112,诸如阴极射线管(CRT)或平板或触摸面板显示器,用于向计算机用户显示信息。输入装置114包括字母数字键和其它键,并且耦接至总线102,用于向处理器104传送信息和命令选择。另一种类型的用户输入装置是光标控制器116,诸如鼠标、轨迹球或光标方向键,用于向处理器104传送方向信息和命令选择,并且用于控制显示器112上的光标移动。输入装置通常在两个轴(第一轴(例,x)和第二轴(例如y))上具有两个自由度,这允许设备指定在平面中的位置。触摸面板(屏幕)显示器也可以用作输入装置。
根据一个实施例,本文描述的一个或多个方法部分可以由计算机***100响应于处理器104执行包含在主存储器106中的一个或多个指令的一个或多个序列而执行。这些指令可以从诸如存储装置110的另一计算机可读介质读入主存储器106。执行包含在主存储器106中的指令序列使得处理器104执行本文描述的处理步骤。也可以采用多处理布置中的一个或多个处理器执行包含在主存储器106中的指令序列。在一个替代实施例中,可以使用硬连线电路代替软件指令或与软件指令结合使用。因此,本文的描述不限于硬件电路和软件的任何特定组合。
本文使用的术语“计算机可读介质”指的是参与向处理器104提供指令以便执行的任何介质。这种介质可以采取许多形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如光盘或磁盘,诸如存储装置110。易失性介质包括动态存储器,诸如主存储器106。传输介质包括同轴电缆、铜线和光纤光学器件,包括包含总线102的电线。传输介质还可以采用声波或光波的形式,诸如在射频(RF)和红外(IR)数据通信期间生成的那些波。计算机可读介质的常见形式包括例如软盘、软磁盘、硬盘、磁带、任何其它磁介质、CD-ROM、DVD、任何其它光介质、打孔卡、纸带、任何其它具有孔图案的物理介质、RAM、PROM和EPROM、FLASH-EPROM、任何其它存储芯片或卡带、如下文所述的载波,或计算机可以读取的任何其它介质。
各种形式的计算机可读介质可以参与将一个或多个指令的一个或多个序列运载至处理器104以供执行。例如,指令最初可以承载在远程计算机的磁盘上。远程计算机可以将指令加载到其动态存储器中,并使用调制解调器通过电话线发送指令。计算机***100的本地调制解调器可以接收电话线上的数据,并使用红外发射器将数据转换为红外信号。耦接至总线102的红外检测器可以接收红外信号中携带的数据,并将数据置于总线102上。总线102将数据运载至主存储器106,处理器104从主存储器检索并执行指令。可选地,主存储器106接收到的指令可以在由处理器104执行之前或之后存储在存储装置110上。
计算机***100还可以包括耦接至总线102的通信接口118。通信接口118提供耦接至与本地网络122相连的网络链路120的双向数据通信。例如,通信接口118可以是综合业务数字网(ISDN)卡或调制解调器,以提供到相应类型电话线的数据通信连接。作为另一示例,通信接口118可以是局域网(LAN)卡,以提供到兼容LAN的数据通信连接。也可以实现无线连接。在任何此类实施方式中,通信接口118发送和接收携带代表各类信息的数字数据流的电信号、电磁信号或光信号。
网络链路120通常通过一个或多个网络向其它数据设备提供数据通信。例如,网络链路120可以通过本地网络122提供到主机计算机124或到由因特网服务提供商(ISP)126操作的数据设备的连接。ISP126进而通过全球分组数据通信网络提供数据通信服务,该网络现在一般称为“因特网”128。本地网络122和因特网128都使用携带数字数据流的电信号、电磁信号或光信号。通过各种网络的信号和网络链路120上通过通信接口118的信号(携带去往和来自计算机***100的数字数据)是传输信息的载波的示例性形式。
计算机***100可以通过网络、网络链路120和通信接口118发送消息和接收数据,包括程序代码。在因特网示例中,服务器130可以通过因特网128、ISP 126、本地网络122和通信接口118发送所请求的应用程序代码。例如,一个此类下载的应用可以提供本文描述的全部或部分方法。接收到的代码可以在被接收时由处理器104执行,和/或存储在存储装置110或其它非易失性存储装置中以供稍后执行。以这种方式,计算机***100可以获得载波形式的应用代码。
图11示意性地示出可以与本文描述的技术结合使用的示例性光刻投影设备。该设备包括:
——照射***(照射器)IL,用于调节辐射光束B。在该特定情况下,照射***还包括辐射源SO;
——第一物体台(例如图案形成装置台)MT,第一物体台设置有图案形成装置保持器,以保持图案形成装置MA(例如掩模版),并且连接至第一***,以相对于物品PS准确地定位图案形成装置;
——第二物体台(衬底台)WT,第二物体台设置有衬底保持器,用于保持衬底(例如涂覆有抗蚀剂的硅晶片),并且连接至第二***,以相对于物品PS准确地定位衬底;以及
——投影***(“透镜”)PS(例如折射、反射或反射折射光学***),用于将图案形成装置MA的被辐照部分在衬底W的目标部分C(例如包括一个或多个模具)上成像。
如本文所描述的,设备是透射型设备(即具有透射图案形成装置)。然而,一般地,例如,设备也可以是反射型设备(具有反射图案形成装置)。设备可以采用与典型掩模不同种类的图案形成装置;示例包括可编程反射镜阵列或LCD矩阵。
SO源(例如汞灯或受激准分子激光器、LPP(激光生成等离子体)EUV源)生成辐射光束。例如,该光束直接或在穿过调节装置(诸如扩束器Ex)之后被馈入照射***(照射器)IL。照射器IL可以包括调节装置AD,用于设置光束内强度分布的外部和/或内部径向范围(通常分别称为/σ-外和σ-内)。此外,照射器IL一般包括各种其它部件,诸如积分器IN和冷凝器CO。这样,撞击在图案形成装置MA上的光束B在其横截面上具有期望的均匀性和强度分布。
关于图10应当注意的是,源SO可以位于光刻投影设备的壳体内(例如当源SO是汞灯时经常是这种情况),但也可以远离光刻投影设备,其产生的辐射光束被引导至设备中(例如借助于合适的导向反射镜);当源SO是受激准分子激光器(例如基于KrF、ArF或F2激光)时,通常是后一种情况。
然后,光束PB与保持在图案形成装置台MT上的图案形成装置MA相交。穿过图案形成装置MA后,光束B穿过透镜PL,透镜PL将光束B聚焦到衬底W的目标部分C上。在第二定位装置(和干涉测量装置IF)的帮助下,衬底台WT可以精确地移动,例如以在光束PB的路径中定位不同的目标部分C。类似地,例如在从图案形成装置库中机械地获取到图案形成装置MA之后,或者在扫描期间,可以使用第一定位装置相对于光束B的路径精确地定位图案形成装置MA。一般地,借助于长行程模块(粗定位)和短行程模块(精定位),可以实现物体台MT、WT的移动,这在图11中没有明确示出。然而,在步进机的情况下(与步进-扫描工具相反),图案形成装置台MT可以仅连接至短行程致动器,或者可以是固定的。
所描述的工具可以以两种不同的模式使用:
——在步进模式下,图案形成装置台MT基本上保持静止不动,并且整个图案形成装置图像一次(即单次“闪光”)投影到目标部分C上。然后,衬底台WT沿x和/或y方向位移,使得不同的目标部分C可以被光束PB照射;
——在扫描模式下,基本上适用于相同的场景,只是给定目标部分C不在单次“闪光”中曝光。相反,图案形成装置台MT在给定方向(所谓的“扫描方向”,例如y方向)上以速度v移动,使得投影光束B在图案形成装置图像上扫描;同时,衬底台WT以速度V=Mv在相同或相反的方向上同时移动,其中,M是透镜PL的放大率(通常,M=1/4或1/5)。以这种方式,可以曝光相对大的目标部分C,而不必牺牲分辨率。
图12示意性地示出可以与本文描述的技术结合使用的另一示例性光刻投影设备1000。
光刻投影设备1000包括:
——源收集器模块SO
——照射***(照射器)IL,照射***被配置为用于调节辐射光束B(例如EUV辐射)
——支撑结构(例如图案形成装置台)MT,支撑结构被配置为支撑图案形成装置(例如掩模或掩模版)MA并连接至第一***PM,第一***PM被配置为准确地定位图案形成装置;
——衬底台(例如晶片台)WT,衬底台被构造为保持衬底(例如涂覆有抗蚀剂的晶片)W,并连接至第二***PW,第二***PW被配置为准确地定位衬底;以及
——投影***(例如反射式投影***)PS,投影***被配置为将图案形成装置MA施加至辐射光束B的图案投影在衬底W的目标部分C(例如包括一个或多个模具)上。
如图12所示,设备1000是反射型设备(例如采用反射图案形成装置)。应当注意的是,因为大多数材料在EUV波长范围内是吸收性的,所以图案形成装置可以具有多层反射器,包括例如钼和硅的多叠层。在一个示例中,多叠层反射器具有40层钼硅对,其中,每层的厚度是四分之一波长。可以用X射线光刻产生甚至更小的波长。由于大多数材料在EUV和X射线波长下是吸收性的,因此图案形成装置形貌上的图案形成吸收材料薄片(例如多层反射器顶部的TaN吸收器)限定印刷(正性抗蚀剂)或不印刷(负性抗蚀剂)特征的位置。
照射器IL接收来自源收集器模块SO的极紫外辐射光束。生成EUV辐射的方法包括但不必限于,将材料转换为等离子体状态,该等离子体状态具有至少一种元素,例如氙、锂或锡,具有EUV范围内的一个或多个发射线。一种此类方法通常被称为激光等离子体光源(“LPP”),其中,等离子体可以通过用激光束照射燃料产生,诸如具有线发射元素的材料液滴、流或簇。源收集器模块SO可以是EUV辐射***的一部分,EUV辐射***包括用于提供激发燃料的激光束的激光器,图12中未示出。得到的等离子体发射输出辐射,例如EUV辐射,该辐射使用设置在源收集器模块中的辐射收集器收集。激光器和源收集器模块可以是单独的实体,例如当CO2激光器被用于提供激发燃料的激光束时。
在这种情况下,不认为激光器形成光刻设备的一部分,并且辐射光束借助于包括例如合适的导向反射镜和/或扩束器的光束递送***,从激光器传到源收集器模块。在其它情况下,源可以是源收集器模块的一体部分,例如当源是放电产生的等离子体EUV发生器(通常称为DPP源)时。在一个实施例中,可以使用DUV激光源。
照射器IL可以包括调节器,用于调节辐射光束的角强度分布。一般地,至少可以调节照射器光瞳面内强度分布的外部和/或内部径向范围(通常分别称为σ-外和σ-内)。此外,照射器IL可以包括各种其它部件,诸如多面场镜和光瞳镜装置。照射器可以用于调节辐射光束,以在其横截面中具有期望的均匀性和强度分布。
辐射光束B入射到保持在支撑结构(例如图案形成装置台)MT上的图案形成装置(例如掩模)MA上,并且通过图案形成装置MA被图案化。从图案形成装置(例如掩模)MA反射之后,辐射光束B通过投影***PS,投影***PS将辐射光束聚焦在衬底W的目标部分C上。借助于第二***PW和位置传感器PS2(例如干涉仪装置、线性编码器或电容传感器),衬底台WT可以精确地移动,例如以在辐射光束B的路径中定位不同的目标部分C。类似地,第一***PM和另一位置传感器PS1可以用于相对于辐射光束B的路径精确地定位图案形成装置(例如掩膜)MA。可以利用掩模装置对准标记M1、M2和衬底对准标记P1、P2对准图案形成装置(例如掩膜)MA和衬底W。
所描述的设备1000可以用于以下至少一种模式:
在步进模式下,支撑结构(例如图案形成装置台)MT和衬底台WT基本上保持静止不动,同时将施加至辐射光束的整个图案一次性投影到目标部分C上(即单次静态曝光)。然后,衬底台WT沿X和/或Y方向位移,从而可以曝光不同的目标部分C。
在扫描模式下,同步地扫描支撑结构(例如图案形成装置台)MT和衬底台WT,同时将施加至辐射光束的图案投影到目标部分C上(即单次动态曝光)。衬底台WT相对于支撑结构(例如图案形成装置台)MT的速度和方向可以由投影***PS的(缩小)放大率和图像反转特征确定。
在另一模式下,保持可编程图案形成装置的支撑结构(例如图案形成装置台)MT基本上保持静止不动,并且在将施加至辐射光束的图案投影到目标部分C上的同时移动或扫描衬底台WT。在这种模式下,一般采用脉冲辐射源,并且在衬底台WT的每次移动之后或在扫描期间的连续辐射脉冲之间,根据需要更新可编程图案形成装置。这种操作模式可以容易地应用于使用可编程图案形成装置的无掩模光刻,诸如上面提到的可编程反射镜阵列类型。
图13更详细地示出设备1000,包括源收集器模块SO、照射***IL和投影***PS。源收集器模块SO被构造和布置为使得可以在源收集器模块SO的封闭结构220中保持真空环境。发射等离子体210的EUV辐射可以由放电产生的等离子体源形成。EUV辐射可以由气体或蒸汽产生,例如Xe气、Li蒸汽或Sn蒸汽,其中产生非常热的等离子体210,以发射电磁光谱的EUV范围内的辐射。例如,通过放电产生至少部分电离的等离子体,进而产生极热等离子体210。Xe、Li、Sn蒸气或任何其它适当气体或蒸气的分压例如为10Pa,这可能是有效生成辐射所需要的。在一个实施例中,提供受激锡(Sn)等离子体以产生EUV辐射。
由热等离子体210发射的辐射从源腔室211经由可选的气体阻挡件或污染物阱230(在一些情况下也称污染物阻挡件或箔片阱)进入收集器腔室212,气体阻挡件或污染物阱设置在源腔室211的开口中或开口后面。污染物阱230可以包括通道结构。污染物阱230还可以包括气体阻挡件或气体阻挡件与通道结构的组合。如本领域所公知的,本文中进一步提到的污染物阱或污染物阻挡件230至少包括通道结构。
收集器腔室211可以包括辐射收集器CO,其可以是所谓的掠入射收集器。辐射收集器CO具有上游辐射收集器侧251和下游辐射收集器侧252。穿过收集器CO的辐射可以被反射离开光栅光谱滤波器240,沿由点划线“O”表示的光轴聚焦在虚拟源点IF。虚拟源点IF通常被称为中间焦点,并且源收集器模块被布置为使得中间焦点IF位于封闭结构220的开口221处或其附近。虚拟源点IF是发射等离子体210的辐射的图像。
随后,辐射穿过照射***IL,照射***IL可以包括被布置为在图案形成装置MA处提供辐射光束21的期望角分布以及在图案形成装置MA处提供期望的均匀辐射强度的多面场镜装置22和多面光瞳镜装置24。辐射光束21在由支撑结构MT保持的图案形成装置MA处被反射后,形成图案化光束26,并且图案化光束26由投影***PS通过反射元件28、30成像到由衬底台WT保持的衬底W上。
一般地,照射光学器件单元IL和投影***PS中通常可以存在比所示更多的元件。取决于光刻设备的类型,光栅光谱滤波器240可以可选地存在。此外,可以存在比图中所示的反射镜更多的反射镜,例如,除图13中所示反射元件外,投影***PS中可以存在另外1-6个附加反射元件。
如图14所示,仅作为收集器(或收集器反射镜)的示例,收集器光学器件CO被描述为具有掠入射反射器253、254和255的嵌套收集器。掠入射反射器253、254和255围绕光轴O轴对称地设置,并且这种类型的收集器光学器件CO可以与放电产生的等离子体源(通常称为DPP源)组合使用。
备选地,源收集器模块SO可以是LPP辐射***的一部分,如图14所示。激光器LA被布置为将激光能量沉积到燃料中,诸如氙(Xe)、锡(Sn)或锂(Li),从而产生电子温度为几十eV的高度电离等离子体210。在这些离子的去激励和再结合期间产生的能量辐射从等离子体发射,由接近正入射的收集器光学器件CO收集,并且聚焦到封闭结构220的开口221上。
本文公开的概念可以模拟或数学建模用于成像亚波长特征的任何通用成像***,并且可能对于能够产生越来越短波长的新兴成像技术尤其有用。已经使用的新兴技术包括EUV(极紫外)、DUV光刻,这些新兴技术能够使用Arf激光产生193nm波长,甚至使用氟激光器产生157nm波长。此外,EUV光刻能够通过使用同步加速器或通过用高能电子撞击材料(固体或等离子体),产生在20-5nm范围内的波长,从而生成该范围内的光子。
虽然本文公开的概念可以用于在诸如硅晶片的衬底上成像,但应当理解的是,所公开的概念可以与任何类型的光刻成像***一起使用,例如那些用于在除了硅晶片之外的衬底上成像的光刻成像***。
以上描述旨在是说明性的而非限制性的。因此,对于本领域技术人员来说,在不背离下面阐述的权利要求范围的情况下,可以如所描述的进行修改是明显的。

Claims (15)

1.一种用于配置半导体制造工艺的方法,所述方法包括:
向一个或多个远程位置提供包括多个模型参数的初始预测模型;
在所述一个或多个远程位置处用本地数据训练所述初始预测模型,使得至少一个模型参数被更新;
从所述一个或多个远程位置接收至少一个更新模型参数;
基于从所述一个或多个远程位置接收的所述至少一个更新模型参数,确定聚合模型参数;以及
基于所述聚合模型参数来调整所述初始预测模型,经调整的预测模型可操作以配置所述半导体制造工艺。
2.根据权利要求1所述的方法,其中所述至少一个模型参数包括权重。
3.根据权利要求1所述的方法,还包括在向所述一个或多个远程位置提供所述初始预测模型之前,使用全局数据训练所述初始预测模型,所述全局数据包括大于所述本地数据的数据集,所述全局数据与多于一个所述远程位置相关联,
使得在所述一个或多个远程位置处用本地数据训练所述初始预测模型包括再训练所述初始预测模型。
4.根据权利要求1所述的方法,其中所述预测模型是神经网络,并且其中所述至少一个模型参数包括所述神经网络的权重和/或偏差。
5.根据权利要求1所述的方法,其中所述一个或多个远程位置包括一个或多个设施位置,所述一个或多个设施位置远离生成和训练所述初始预测模型、接收所述更新模型参数、确定所述聚合更新模型参数以及确定所述经调整的预测模型的设施位置。
6.根据权利要求1所述的方法,还包括迭代地向所述一个或多个远程位置提供所述经调整的预测模型、接收所述更新模型参数、确定所述聚合更新模型参数、以及再调整所述经调整的预测模型直到满足停止条件。
7.根据权利要求6所述的方法,其中所述停止条件包括经再调整的预测模型的收敛。
8.根据权利要求1所述的方法,其中所述初始预测模型包括部分训练的预测模型,所述部分训练的预测模型包括所述多个模型参数,使得在提供至给定远程位置之后,用本地数据进行的所述训练包括完全训练所述初始预测模型。
9.根据权利要求8所述的方法,其中在所述给定远程位置处的用户基于完全训练的初始预测模型确定是否从所述给定远程位置通信更新的至少一个模型参数。
10.一种用于调整包括多个模型参数的预测模型的方法,所述方法包括:
将与半导体制造工艺相关联的本地训练数据提供给所述预测模型,以确定第一更新模型参数值;
接收通过至少部分地向所述预测模型提供外部训练数据而获得的第二更新模型参数值;以及
基于预测模型准确度的预期改善调整所述预测模型,其中所述调整包括利用所述第一更新模型参数值和/或所述第二更新模型参数值更新所述模型参数。
11.根据权利要求10所述的方法,其中所述多个模型参数包括权重,所述第一更新模型参数值包括第一更新权重值,并且所述第二更新模型参数值包括第二更新权重值。
12.根据权利要求10所述的方法,还包括在向所述预测模型提供所述本地训练数据之前,使用全局数据训练所述预测模型,所述全局数据包括大于所述本地训练数据的数据集,所述全局数据与多于一个所述远程位置相关联;
使得提供所述本地训练数据包括再训练所述预测模型以确定所述第一更新模型参数值。
13.根据权利要求10所述的方法,还包括向远程位置提供所述预测模型,所述远程位置包括远离生成所述预测模型的设施位置的设施位置,所述远程位置包括以下设施位置,在所述设施位置处:
将与所述半导体制造工艺相关联的所述本地训练数据提供给所述预测模型,以确定所述第一更新模型参数值;
接收所述第二更新模型参数值;以及
调整所述预测模型。
14.一种计算机程序产品,包括在其上记录有指令的非暂态计算机可读介质,当由计算机执行时,所述指令被配置为:
向一个或多个远程位置提供包括多个模型参数的初始预测模型;
在所述一个或多个远程位置处用本地数据训练所述初始预测模型,使得至少一个模型参数被更新;
从所述一个或多个远程位置接收至少一个更新模型参数;
基于从所述一个或多个远程位置接收的所述至少一个更新模型参数,确定聚合模型参数;以及
基于所述聚合模型参数来调整所述初始预测模型,经调整的预测模型可操作以配置所述半导体制造工艺。
15.一种计算机程序产品,包括在其上记录有指令的非暂态计算机可读介质,当由计算机执行时,所述指令被配置为:
将与半导体制造工艺相关联的本地训练数据提供给预测模型,以确定第一更新模型参数值;
接收通过至少部分地向所述预测模型提供外部训练数据而获得的第二更新模型参数值;以及
基于预测模型准确度的预期改善调整所述预测模型,其中所述调整包括利用所述第一更新模型参数值和/或所述第二更新模型参数值更新所述模型参数。
CN202080027325.2A 2019-04-09 2020-03-12 用于在设施位置之间调整预测模型的***和方法 Active CN113678064B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19168014.9 2019-04-09
EP19168014 2019-04-09
EP19175717.8A EP3742229A1 (en) 2019-05-21 2019-05-21 Systems and methods for adjusting prediction models between facility locations
EP19175717.8 2019-05-21
PCT/EP2020/056653 WO2020207696A1 (en) 2019-04-09 2020-03-12 Systems and methods for adjusting prediction models between facility locations

Publications (2)

Publication Number Publication Date
CN113678064A CN113678064A (zh) 2021-11-19
CN113678064B true CN113678064B (zh) 2023-12-08

Family

ID=69770922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080027325.2A Active CN113678064B (zh) 2019-04-09 2020-03-12 用于在设施位置之间调整预测模型的***和方法

Country Status (5)

Country Link
US (1) US11994848B2 (zh)
EP (1) EP3953765B1 (zh)
KR (1) KR102648599B1 (zh)
CN (1) CN113678064B (zh)
WO (1) WO2020207696A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022157646A1 (en) * 2021-01-19 2022-07-28 Imagia Cybernetics Inc. Method of and system for providing an aggregated machine learning model in a federated learning environment and determining relative contribution of local datasets thereto
CN114386687B (zh) * 2021-12-31 2024-04-05 全芯智造技术有限公司 多层掩膜版之间套刻结果的预测方法及装置、终端
CN115877808B (zh) 2023-01-30 2023-05-16 成都秦川物联网科技股份有限公司 用于薄片工件加工的工业物联网及控制方法
CN116643537B (zh) * 2023-07-27 2023-10-03 中科航迈数控软件(深圳)有限公司 基于隐私保护的数控参数优化方法、装置、设备及介质
CN116720479B (zh) * 2023-08-10 2024-01-09 腾讯科技(深圳)有限公司 掩膜生成模型训练方法、掩膜生成方法及装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101939833A (zh) * 2007-08-31 2011-01-05 恪纳腾公司 用于跨晶片区域预测半导体参数的装置和方法
CN107004060A (zh) * 2014-11-25 2017-08-01 流动马赛克公司 用于半导体制造工艺的经改进工艺控制技术

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5229872A (en) 1992-01-21 1993-07-20 Hughes Aircraft Company Exposure device including an electrically aligned electronic mask for micropatterning
JP4075966B2 (ja) 1996-03-06 2008-04-16 エーエスエムエル ネザーランズ ビー.ブイ. 差分干渉計システム及びこのシステムを具えたリソグラフステップアンドスキャン装置
CN101258498B (zh) 2005-08-08 2011-04-13 Asml荷兰有限公司 用于形成光刻工艺的焦点曝光模型的***和方法
US7695876B2 (en) 2005-08-31 2010-04-13 Brion Technologies, Inc. Method for identifying and using process window signature patterns for lithography process control
US7617477B2 (en) 2005-09-09 2009-11-10 Brion Technologies, Inc. Method for selecting and optimizing exposure tool using an individual mask error model
US7694267B1 (en) 2006-02-03 2010-04-06 Brion Technologies, Inc. Method for process window optimized optical proximity correction
US7882480B2 (en) 2007-06-04 2011-02-01 Asml Netherlands B.V. System and method for model-based sub-resolution assist feature generation
US7707538B2 (en) 2007-06-15 2010-04-27 Brion Technologies, Inc. Multivariable solver for optical proximity correction
US20090157630A1 (en) 2007-10-26 2009-06-18 Max Yuan Method of extracting data and recommending and generating visual displays
NL1036189A1 (nl) 2007-12-05 2009-06-08 Brion Tech Inc Methods and System for Lithography Process Window Simulation.
NL2003699A (en) 2008-12-18 2010-06-21 Brion Tech Inc Method and system for lithography process-window-maximixing optical proximity correction.
US9633315B2 (en) * 2012-04-27 2017-04-25 Excalibur Ip, Llc Method and system for distributed machine learning
US20150012255A1 (en) * 2013-07-03 2015-01-08 International Business Machines Corporation Clustering based continuous performance prediction and monitoring for semiconductor manufacturing processes using nonparametric bayesian models
US20150242760A1 (en) 2014-02-21 2015-08-27 Microsoft Corporation Personalized Machine Learning System
US10430719B2 (en) * 2014-11-25 2019-10-01 Stream Mosaic, Inc. Process control techniques for semiconductor manufacturing processes
US10380503B2 (en) * 2016-04-08 2019-08-13 Here Global B.V. Distributed online learning for privacy-preserving personal predictive models
CN110268423A (zh) * 2016-08-19 2019-09-20 莫维迪乌斯有限公司 用于深度学习模型的分布式训练的***和方法
EP3352013A1 (en) * 2017-01-23 2018-07-25 ASML Netherlands B.V. Generating predicted data for control or monitoring of a production process
US20180314971A1 (en) * 2017-04-26 2018-11-01 Midea Group Co., Ltd. Training Machine Learning Models On A Large-Scale Distributed System Using A Job Server
KR102415583B1 (ko) * 2017-06-30 2022-07-04 삼성전자주식회사 Opc 모델의 최적화 방법 및 이를 이용한 반도체 소자의 제조 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101939833A (zh) * 2007-08-31 2011-01-05 恪纳腾公司 用于跨晶片区域预测半导体参数的装置和方法
CN107004060A (zh) * 2014-11-25 2017-08-01 流动马赛克公司 用于半导体制造工艺的经改进工艺控制技术

Also Published As

Publication number Publication date
EP3953765B1 (en) 2023-01-11
US11994848B2 (en) 2024-05-28
CN113678064A (zh) 2021-11-19
EP3953765A1 (en) 2022-02-16
US20220197264A1 (en) 2022-06-23
KR20210134975A (ko) 2021-11-11
KR102648599B1 (ko) 2024-03-15
WO2020207696A1 (en) 2020-10-15

Similar Documents

Publication Publication Date Title
TWI757663B (zh) 降低於機器學習模型預測中之不確定性之方法
KR102449586B1 (ko) 기계 학습에 의해 공정 모델들을 결정하는 방법들
CN113678064B (zh) 用于在设施位置之间调整预测模型的***和方法
JP2022518156A (ja) レイアウトパターン選択の方法及び装置
CN114096917B (zh) 用于减小模型预测不确定性的模型校准的预测数据选择
TW202117575A (zh) 用於在參數化模型預測中提高確定性的方法
KR20220130784A (ko) 프로세스 메트릭 인식 프로세스 제어를 위한 시스템 및 방법
WO2022028997A1 (en) Apparatus and method for selecting informative patterns for training machine learning models
EP3742229A1 (en) Systems and methods for adjusting prediction models between facility locations
TWI667553B (zh) 判定圖案之特性之方法
EP4200671A1 (en) Systems, products, and methods for image-based pattern selection
EP3660744A1 (en) Method for decreasing uncertainty in machine learning model predictions
WO2023046385A1 (en) Pattern selection systems and methods
EP4165471A1 (en) Aberration impact systems, models, and manufacturing processes
WO2023084063A1 (en) Generating augmented data to train machine learning models to preserve physical trends
WO2023088641A1 (en) Simulation model stability determination method
TW202338515A (zh) 熱控制系統、模型、及微影中之製造程序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant