CN114341885A - 用于增加参数化模型预测的确定性的方法 - Google Patents

用于增加参数化模型预测的确定性的方法 Download PDF

Info

Publication number
CN114341885A
CN114341885A CN202080062551.4A CN202080062551A CN114341885A CN 114341885 A CN114341885 A CN 114341885A CN 202080062551 A CN202080062551 A CN 202080062551A CN 114341885 A CN114341885 A CN 114341885A
Authority
CN
China
Prior art keywords
clusters
parameterized model
potential space
model
dimensional data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080062551.4A
Other languages
English (en)
Inventor
M·皮萨连科
斯科特·安德森·米德尔布鲁克斯
C·A·维索尔伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ASML Holding NV
Original Assignee
ASML Holding NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP19195954.3A external-priority patent/EP3789923A1/en
Application filed by ASML Holding NV filed Critical ASML Holding NV
Publication of CN114341885A publication Critical patent/CN114341885A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70483Information management; Active and passive control; Testing; Wafer monitoring, e.g. pattern monitoring
    • G03F7/70491Information management, e.g. software; Active and passive control, e.g. details of controlling exposure processes or exposure tool monitoring processes
    • G03F7/705Modelling or simulating from physical phenomena up to complete wafer processes or whole workflow in wafer productions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Exposure And Positioning Against Photoresist Photosensitive Materials (AREA)

Abstract

描述了一种用于增加参数化模型预测的确定性的方法。方法包括:将与参数化模型相关联的潜在空间中的维度数据聚类为集群。不同集群对应于给定输入的不同部分。方法包括:利用参数化模型,基于潜在空间中的维度数据来预测输出。方法包括:利用参数化模型,将潜在空间中的维度数据变换为与集群中的一个或多个相对应的给定输入的恢复版本。在一些实施例中,方法包括:确定哪些集群对应于具有更高方差的预测输出,并且通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的经确定的集群或集群部分中的一个或多个相关联的更多样化的训练数据来训练参数化模型。

Description

用于增加参数化模型预测的确定性的方法
相关申请的交叉引用
本申请要求于2019年9月6日提交的EP申请19195954.3和于2019年11月19日提交的EP申请19210026.1和于2020年7月29日提交的EP申请20188310.5的优先权,其通过引用全部并入本文。
技术领域
本描述涉及一种用于增加参数化模型预测的确定性的设备和方法。
背景技术
光刻投影设备可以例如在集成电路(IC)的制造中使用。在这种情况下,图案形成装置(例如掩模)可以包含或提供与IC的单个层相对应的图案(“设计布局”),并且通过诸如通过图案形成装置上的图案照射目标部分等方法,该图案可以被转移到衬底(例如硅晶片)上的目标部分(例如包括一个或多个管芯)上,该目标部分已经被涂有辐射敏感材料(“抗蚀剂”)层。通常,单个衬底包含多个相邻的目标部分,图案由光刻投影设备连续地转印至该目标部分,一次一个目标部分。在一种类型的光刻投影设备中,整个图案形成装置上的图案在一个操作中被转印至一个目标部分。这种设备通常被称为步进器。在一般称为步进扫描设备的替代设备中,投影束沿着给定参考方向(“扫描”方向)在图案形成装置上进行扫描,同时平行于或反平行于该参考方向移动衬底。图案形成装置上的图案的不同部分被逐渐转印至一个目标部分。通常,由于光刻投影设备将具有缩小率M(例如4),所以衬底被移动的速度F将是投影束扫描图案形成装置的1/M倍。关于本文描述的光刻装置的更多信息可以例如从US 6,046,792中收集,其通过引用并入本文。
在将图案从图案形成装置转印至衬底之前,衬底可能会经历各种程序,诸如涂覆、抗蚀剂涂层和软烘烤。在曝光后,衬底可以进行其他程序(“曝光后程序”),诸如曝光后烘烤(PEB)、显影、硬烘烤以及转印图案的测量/检查。该程序阵列被用作制造装置(例如IC)的单个层的基础。然后,衬底可以经历各种过程,诸如蚀刻、离子注入(掺杂)、金属化、氧化、化学机械抛光等,所有这些过程都旨在完成装置的单个层。如果装置中需要多层,那么整个程序或其变型针对每层重复。最终,装置将存在于衬底上的每个目标部分中。然后,这些装置通过诸如切割或锯切等技术彼此分离,从而单个装置可以被安装在载体上,连接至引脚等。
因此,诸如半导体装置等制造装置通常涉及使用许多制造过程来处理衬底(例如半导体晶片),以形成装置的各种特征和多层。这种层和特征通常使用例如沉积、光刻、蚀刻、化学机械抛光和离子注入来制造和处理。多个装置可以在衬底上的多个管芯上制作,然后被分离为单独的装置。该装置制造过程可以被认为是图案化过程。图案化过程涉及图案化步骤,诸如使用光刻设备中的图案形成装置进行光学和/或纳米印刷光刻,以将图案形成装置上的图案转印至衬底,并且通常但可选地涉及一个或多个相关的图案处理步骤,诸如由显影设备进行抗蚀剂显影,使用烘烤工具进行衬底的烘烤,使用蚀刻设备使用图案进行蚀刻等。图案化过程中通常涉及一个或多个量测过程。
如所提到的,光刻是诸如IC等装置制造中的中心步骤,其中在衬底上形成的图案限定了诸如微处理器、存储器芯片等装置的功能元件。类似的光刻技术也被用于平板显示器、微机电***(MEMS)和其他装置的形成中。
随着半导体制造过程的不断发展,遵循一般被称为“摩尔定律”的趋势,功能元件的尺寸被不断减小,而几十年来每个装置的功能元件(诸如晶体管)的数量却稳定增加。在当前的技术水平下,装置的各层是使用光刻投影设备制造的,该光刻投影设备使用来自深紫外照射源的照射将设计布局投影到衬底上,从而创建尺寸远低于100nm(即,小于来自照射源(例如193nm照射源)的辐射波长的一半)的单个功能元件。
根据分辨率公式CD=k1×λ/NA,尺寸小于光刻投影设备的经典分辨率极限的特征被印刷的过程一般被称为低k1光刻,其中λ是所采用的辐射的波长(当前大多数情况下为248nm或193nm),NA是光刻投影设备中的投影光学器件的数值孔径,CD是“临界尺寸”,通常是最小的印刷特征尺寸,并且k1是经验分辨率因子。通常,k1越小,就越难在衬底上再现与设计者计划的形状和尺寸类似的图案,以实现特定的电气功能性和性能。为了克服这些困难,复杂的微调步骤被应用于光刻投影设备、设计布局和/或图案形成装置。例如,这些包括但不限于NA和光学相干设置的优化、定制照射方案、相移图案形成装置的使用、设计布局中的光学邻近校正(OPC,有时也称为“光学和过程校正”)或通常限定为“分辨率增强技术”(RET)的其他方法。本文使用的术语“投影光学器件”应该被广义地解释为涵盖各种类型的光学***,例如包括折射光学器件、反射光学器件、孔径和折反射光学器件。术语“投影光学器件”还可以包括根据这些设计类型中的任何一种操作的部件,以共同地或单独地引导、整形或控制辐射的投影束。术语“投影光学器件”可以包括光刻投影设备中的任何光学部件,而不管光学部件位于光刻投影设备的光路上的何处。投影光学器件可以包括用于在辐射经过图案形成装置之前对来自源的辐射进行整形、调整和/或投影的光学部件和/或用于在辐射经过图案形成装置之后对辐射进行整形、调整和/或投影的光学部件。投影光学器件通常不包括源和图案形成装置。
发明内容
根据实施例,提供了一种用于进行参数化模型预测的方法。该方法包括:利用参数化模型,将与参数化模型相关联的潜在空间中的维度数据聚类为集群。不同集群对应于给定输入的不同部分。该方法包括:利用参数化模型,基于潜在空间中的维度数据来预测输出。该方法包括:利用参数化模型,将潜在空间中的维度数据变换为与集群中的一个或多个相对应的给定输入的恢复版本。
在一些实施例中,预测和变换是同时的。
在一些实施例中,潜在空间中的维度数据被变换为给定输入的恢复版本,以促进潜在空间中的兴趣点的可视化。
在一些实施例中,该方法还包括:识别潜在空间中的兴趣点。
在一些实施例中,兴趣点包括与潜在空间中的其他点相比具有相对较高的方差或不确定性的点、不位于集群内的点或者位于笛卡尔距离处的点中的一个或多个,与潜在空间中的其他点和/或集群之间的笛卡尔距离相比,该笛卡尔距离与潜在空间中的一个或多个其他点和/或集群相距相对较远。
在一些实施例中,该方法包括:使用兴趣点、集群、给定输入的恢复版本和/或输出来评估参数化模型的性能。
在一些实施例中,该方法还包括:利用参数化模型,将与给定输入相关联的较高维度数据变换为潜在空间中的维度数据。
在一些实施例中,参数化模型是机器学习模型。在一些实施例中,参数化模型包括编码器-译码器架构。在一些实施例中,编码器-译码器架构包括变分编码器-译码器架构,并且该方法包括:利用概率潜在空间训练变分编码器-译码器架构,该概率潜在空间在输出空间中生成实现。
在一些实施例中,潜在空间包括低维编码。
在一些实施例中,潜在空间中的维度数据由编码器-译码器架构的编码器编码。
在一些实施例中,输出利用编码器-译码器架构的第一部分基于潜在空间中的维度数据来预测。在一些实施例中,编码器-译码器架构的第一部分是第一译码器。在一些实施例中,潜在空间中的维度数据由编码器-译码器架构的第二译码器变换为给定输入的恢复版本。
在一些实施例中,给定输入包括与半导体制造过程相关联的图像、剪辑、编码图像、编码剪辑或者来自参数化模型的先前层的数据中的一个或多个。在一些实施例中,给定输入与半导体制造过程的目标图案设计、缺陷或者过程参数相关联。在一些实施例中,输出包括半导体制造过程的预测掩模图像、缺陷概率或者预测过程参数。
在一些实施例中,该方法包括:基于集群、输出和/或输入的恢复版本来调整参数化模型。在一些实施例中,调整可以被配置为增强输出的一个或多个部分与地面实况的一个或多个部分之间的一致性。
在一些实施例中,调整参数化模型包括:通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与一个或多个集群相关联的更多样化的训练数据来训练参数化模型。
在一些实施例中,通过增加潜在空间的维度来使参数化模型更具描述性,或者利用与一个或多个集群相关联的更多样化的训练数据来训练参数化模型包括:相对于先前的训练材料,使用与集群中的一个或多个相关的更多样化的图像、更多样化的数据和附加剪辑作为输入,以训练参数化模型;和/或使用更多维度对向量进行编码,并且在参数化模型中使用更多编码层。
在一些实施例中,更多样化的训练样本相对于先前训练材料包括附加和/或更多样化的图像、附加和/或更多样化的数据以及附加和/或更多样化的剪辑。
在一些实施例中,该方法还包括:确定潜在空间中的维度数据的哪些集群或集群的部分对应于预测输出,与维度数据的其他集群或者集群的其他部分相比,该预测输出具有更高的方差。
在一些实施例中,确定潜在空间中的维度数据的哪些集群或者集群的部分对应于具有更高方差的预测输出有助于选择附加训练数据。
在一些实施例中,该方法包括:通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的确定集群或集群部分中的一个或多个相关联的更多样化的训练数据来训练参数化模型。
在一些实施例中,该方法还包括:基于集群、输出和/或给定输入的恢复版本来调整参数化模型,以增加参数化模型的确定性,以预测衬底几何形状作为半导体制造过程的一部分。
在一些实施例中,该方法包括:基于集群、输出和/或给定输入的恢复版本来调整参数化模型,以增加参数化模型的确定性,以预测连续色调掩模(CTM)作为半导体制造过程的一部分。
在一些实施例中,该方法还包括训练参数化模型。训练包括对潜在空间中的维度数据进行采样,并且针对潜在空间中的每个样本:预测多个输出实现,以为潜在空间中的给定维度数据生成输出实现分布;以及确定与多个输出实现的分布相关联的不确定性。参数化模型基于给定维度数据和确定的不确定性来训练(例如单独的参数化模型可以使用给定维度数据和确定的不确定性来训练,并且来自该第二模型的输出可以被用于指导第一参数化模型的训练)。
在一些实施例中,给定维度数据和对应的不确定性形成输入输出训练对。在一些实施例中,参数化模型包括神经网络,并且其中利用给定维度数据和对应的不确定性训练参数化模型包括:将输入输出训练对提供给神经网络,因此神经网络可以学习预测新的输出实现。
在一些实施例中,该方法包括:使用经训练的参数化模型以预测掩模或掩模版几何形状,作为半导体制造过程的一部分。
根据另一实施例,提供了一种用于训练参数化模型的方法。该方法包括对潜在空间中的维度数据进行采样,并且针对潜在空间中的每个样本:预测多个输出实现,以为潜在空间中的给定维度数据生成输出实现分布;以及确定与多个输出实现的分布相关联的不确定性。参数化模型利用给定维度数据和确定的不确定性来训练。(例如,这可以是上面讨论的第二参数化模型和/或其他模型)。
在一些实施例中,参数化模型是机器学习模型。
在一些实施例中,参数化模型包括神经网络。
在一些实施例中,参数化模型包括编码器-译码器架构。
在一些实施例中,编码器架构包括参数化模型的一部分,被配置为将模型输入变换为潜在空间中的维度数据,并且译码器架构包括参数化模型的不同部分,被配置为将潜在空间中的维度数据变换为输出实现。
在一些实施例中,编码器架构和译码器架构包括具有一层或多层的一个或多个神经网络,该一层或多层具有一个或多个节点。
在一些实施例中,该方法还包括:利用参数化模型的该部分,将与模型输入相关联的较高维度数据变换为潜在空间中的维度数据,与关联于模型输入的较高维度数据相比,潜在空间中的维度数据包括低维数据。
在一些实施例中,模型输入包括与半导体制造过程相关联的图像、剪辑、编码图像、编码剪辑或者来自参数化模型的先前层的数据中的一个或多个。
在一些实施例中,模型输入与半导体制造过程的目标图案设计、缺陷或者过程参数相关联。
在一些实施例中,潜在空间中的维度数据包括与模型输入相关联的多维向量。
在一些实施例中,多个输出实现包括半导体制造过程的预测掩模图像、缺陷概率或者预测过程参数。
在一些实施例中,预测包括:利用神经网络的一层或多层和/或一个或多个节点,将维度数据的多维向量译码为输出实现。
在一些实施例中,确定不确定性包括:确定预测的多个输出实现的方差。
在一些实施例中,确定方差包括:确定预测的多个输出实现的范围、标准偏差、最大值、最小值、平均值、中位数和/或模式。
在一些实施例中,预测的多个输出实现包括图像,并且确定不确定性包括:确定指示图像之间的差异的指标。
在一些实施例中,给定维度数据和对应的不确定性形成输入输出训练对。
在一些实施例中,参数化模型包括神经网络,并且利用给定维度数据和对应的不确定性训练参数化模型包括:将输入输出训练对提供给神经网络,因此神经网络可以学习预测新的输出实现。
在一些实施例中,该方法还包括:确定潜在空间中的维度数据的哪些部分对应于预测输出实现,与维度数据的其他部分相比,该预测输出实现具有更高的方差,并且从对应于更高方差的部分中采样。
在一些实施例中,确定潜在空间中的维度数据的哪些部分对应于具有更高方差的预测输出实现有助于选择附加训练数据。
在一些实施例中,该方法还包括:使用经训练的参数化模型以预测掩模或掩模版几何形状,作为半导体制造过程的一部分。
在一些实施例中,该方法还包括:使用经训练的参数化模型以预测连续色调掩模(CTM),作为半导体制造过程的一部分。
根据另一实施例,提供了一种用于确定半导体制造过程参数的调整的方法。该方法包括:利用参数化模型,将与参数化模型相关联的潜在空间中的维度数据聚类为集群。不同集群对应于给定输入的不同部分。该方法包括:利用参数化模型,基于潜在空间中的维度数据来预测输出。该方法包括:利用参数化模型,将潜在空间中的维度数据变换为与集群中的一个或多个相对应的给定输入的恢复版本。该方法包括:基于集群、输出和/或给定输入的恢复版本,调整参数化模型的一个或多个参数,以增加参数化模型预测的确定性。该方法包括:基于来自经调整的参数化模型的预测,确定一个或多个半导体制造过程参数的调整。
在一些实施例中,该方法包括:基于集群、输出和/或给定输入的恢复版本来调整参数化模型,以增加参数化模型的确定性,以预测连续色调掩模(CTM)作为半导体制造过程的一部分。
在一些实施例中,一个或多个确定的半导体制造过程参数包括掩模设计、光瞳形状、剂量或焦点中的一个或多个。
在一些实施例中,一个或多个确定的半导体制造过程参数包括掩模设计。在一些实施例中,确定一个或多个半导体制造过程参数的调整包括:将掩模设计从第一掩模设计改变为第二掩模设计。
在一些实施例中,给定输入包括图像、剪辑、编码图像、编码剪辑或者来自参数化模型的先前层的数据中的一个或多个。
根据另一实施例,提供了一种在其上具有指令的非瞬态计算机可读介质,在由计算机执行时,该指令实施上述任何方法。
根据另一实施例,提供了一种用于增加参数化模型预测的确定性的方法。该方法包括:利用参数化模型,将与参数化模型相关联的潜在空间中的维度数据聚类为集群,其中不同集群对应于给定输入的不同部分;利用参数化模型,基于潜在空间中的维度数据来预测输出;利用参数化模型,将潜在空间中的维度数据变换为与一个或多个集群相对应的给定输入的恢复版本;以及基于集群、输出和/或给定输入的恢复版本,调整参数化模型的一个或多个参数,以增加参数化模型预测的确定性。
在一些实施例中,该方法还包括:确定潜在空间中的维度数据的哪些集群或集群的部分对应于预测输出,与维度数据的其他集群或者集群的其他部分相比,该预测输出具有更高的方差。
在一些实施例中,确定潜在空间中的维度数据的哪些集群或者集群的部分对应于具有更高方差的预测输出有助于选择附加训练数据。
在一些实施例中,调整包括:通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的确定集群或集群部分中的一个或多个相关联的更多样化的训练数据来训练参数化模型。
在一些实施例中,通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的确定集群或集群部分中的一个或多个相关联的更多样化的训练数据来训练参数化模型包括:相对于先前的训练材料,使用与集群中的一个或多个相关的更多样化的图像和更多样化的数据作为输入,以训练参数化模型;和/或使用更多维度对向量进行编码,并且在参数化模型中使用更多编码层。
在一些实施例中,该方法还包括训练参数化模型。训练包括对潜在空间中的维度数据进行采样,并且针对潜在空间中的每个样本:预测多个输出实现,以为潜在空间中的给定维度数据生成输出实现分布;以及确定与多个输出实现的分布相关联的不确定性。参数化模型基于给定维度数据和确定的不确定性来训练。
在一些实施例中,该方法还包括:确定潜在空间中的维度数据的哪些集群对应于预测输出实现,与维度数据的其他集群相比,该预测输出实现具有更高的方差,并且从对应于更高方差的集群中采样。
在一些实施例中,潜在空间中的各个集群对应于维度数据中的不同编码图案。
在一些实施例中,调整参数化模型的一个或多个参数包括:确定单独的每个图案的信息,指示哪些图案类型针对参数化模型是众所周知的并且导致相对一致的预测,以及哪些图案类型是参数化模型不熟悉的并且导致相对可变的预测。
在一些实施例中,单独的每个图案的信息包括方差、潜在空间覆盖范围和/或分布。
在一些实施例中,调整参数化模型的一个或多个参数包括:调整参数化模型的维度和/或参数化模型的一层或多层的权重。
在一些实施例中,该方法还包括:基于集群、输出和/或输入的恢复版本来调整参数化模型,以减小参数化模型预测的方差和/或增强新图案的参数化模型预测。
在一些实施例中,该方法还包括:识别潜在空间中的兴趣点,其中兴趣点包括与潜在空间中的其他点相比具有相对较高的方差或不确定性的点、不位于集群内的点或者位于笛卡尔距离处的点中的一个或多个,与潜在空间中的其他点和/或其他集群之间的笛卡尔距离相比,该笛卡尔距离与潜在空间中的一个或多个其他点和/或集群相距相对较远;以及使用兴趣点、集群、给定输入的恢复版本和/或输出来评估参数化模型的性能。
在一些实施例中,参数化模型包括编码器-译码器架构。潜在空间中的维度数据由编码器-译码器架构的编码器编码。输出利用编码器-译码器架构的译码器基于潜在空间中的维度数据来预测,并且潜在空间中的维度数据由编码器-译码器架构的第二译码器变换为给定输入的恢复版本。该方法还包括:用概率潜在空间训练变分编码器-译码器架构,该概率潜在空间在输出空间中生成实现。
根据另一实施例,提供了一种在其上具有指令的非瞬态计算机可读介质,在由计算机执行时,该指令实施本文描述的任何方法。
附图说明
被并入到说明书中并且构成说明书的一部分的附图图示了一个或多个实施例,并且与描述一起解释了这些实施例。本发明的实施例现在将仅通过示例参照所附示意图来描述,其中对应的参考符号指示对应的部分,并且其中:
图1示出了根据实施例的光刻***的各种子***的框图。
图2图示了根据实施例的用于光刻投影设备中模拟光刻的示例性流程图。
图3图示了根据实施例的用于增加参数化模型预测的确定性的方法的操作概要。
图4图示了根据实施例的包括变分自动编码器的参数化模型的示例。
图5图示了根据实施例的将潜在空间中的维度数据聚类为集群,其中不同的集群对应于给定输入的不同部分。
图6图示了根据实施例的潜在空间的可视化,具有对应方差函数以及由使方差最大化的示例梯度上升算法采取的可能路径。
图7是根据实施例的示例计算机***的框图。
图8是根据实施例的光刻投影设备的示意图。
图9是根据实施例的另一光刻投影设备的示意图。
图10是根据实施例的图9中的设备的更详细的视图。
图11是根据实施例的图9和图10的设备的源收集器模块SO的更详细视图。
具体实施方式
参数化模型(例如机器学习模型,诸如变分自动编码器和/或其他参数化模型)依赖于训练。为了限制训练时间和关联成本,用于训练这种模型的数据集应该具有最大的数据多样性和最小的尺寸。到目前为止,还没有好的方式来优化选择用于训练的数据。相反,训练数据是从更大的数据集中随机采样的,直到预定义的成本函数指标被达到为止。电子模型预测通常与昂贵的物理模型进行比较。例如,先前的亚分辨率辅助特征(SRAF)模型(仅作为一个示例)通常被训练,以使用这些昂贵的物理模型从目标设计中预测连续透射掩模(CTM)。先前模型的性能通常使用包括目标/物理衬底(例如物理CTM掩模)图像对的验证数据集进行评估。像这样的验证程序提供了经训练的参数化模型的性能的全局指示,但不提供根据训练期间遇到的图案类型的模型预测准确度的分解。
本发明的(多个)***和(多种)方法被配置为通过搜索训练数据(包括例如与模型预测中的较高不确定性相关联的图案)来改进参数化模型的训练。本发明的(多个)***和方法被配置为确定用于训练模型以提高其预测性能的增强输入(例如图案)集合,而不是依赖于随机或其他训练数据选择方法。本发明的(多个)***和(多种)方法被配置为使用所描述的训练数据选择操作来增加参数化模型预测的确定性。
本发明的(多个)***和(多种)方法利用参数化模型(例如变分编码器-译码器)的潜在空间的低维度和紧凑性来在潜在空间中直接执行(例如图案)聚类(例如用于编码图案)。这有助于逐个图案(或逐个集群)信息的确定。有利地,紧凑且解开的潜在空间导致图案集群的自然分离。通过确定单独的每个图案的信息(例如统计数据,诸如方差、潜在空间覆盖范围、每个集群的分布等),本发明的(多个)***和(多种)方法提供关于参数化模式众所周知的图案类型(例如导致一致的预测)和相对不熟悉的图案类型(例如导致广泛可变的预测)的信息。另外,这种图案聚类几乎不需要附加的计算资源,因为它比参数化模型的典型训练过程要便宜得多。
在一些实施例中,训练该模型可以包括对潜在空间中的维度数据进行采样,并且针对潜在空间中的每个样本:预测多个输出实现,以为潜在空间中的给定维度数据生成输出实现分布;以及确定与多个输出实现的分布相关联的不确定性。不确定性的这种采样和预测可以用完全分离的参数化模型来执行,例如上述编码器/译码器模型的子部分(例如可能包括或可能不包括编码器/译码器架构)和/或其他模型。单独的参数化模型然后可以利用给定的维度数据和确定的不确定性来训练(或重新训练)。例如,来自单独参数化模型的输出可以被用于指导(第一)模型的训练。这在下面进一步描述。
尽管在本文中可以具体引用半导体和/或IC的制造,但应该明确理解的是,本文的描述还有许多其他可能的应用。例如,它可以在半导体制造领域之外使用,只要预测参数化模型被使用即可。它可以被用于制造集成光学***、磁畴存储器的指导和检测图案、液晶显示面板、薄膜磁头等。在这些替代应用中的一些中,本领域技术人员将了解,在这种替代应用的上下文中,术语“掩模版”、“晶片”或“管芯”在本文中的任何使用应该被认为分别与更通用的术语“掩模”、“衬底”和“目标部分”可互换。另外,应该注意的是,本文描述的方法在诸如语言处理***、自动驾驶汽车、医学成像与诊断、语义分割、去噪、芯片设计、电子设计自动化等不同领域可能还有许多其他可能的应用。本方法可以被应用于量化机器学习模型预测的不确定性是有利的任何领域。
在本文档中,术语“辐射”和“束”被用于涵盖所有类型的电磁辐射,包括紫外辐射(例如波长为365、248、193、157或126nm)和EUV(极紫外辐射,例如波长在约5至100nm的范围内)。
图案形成装置可以包括或可以形成一个或多个设计布局。设计布局可以利用CAD(计算机辅助设计)程序生成。这个过程通常被称为EDA(电子设计自动化)。大多数CAD程序都遵循预定的设计规则集合,以创建功能设计布局/图案形成装置。这些规则是基于处理和设计限制设置的。例如,设计规则定义了装置(诸如门、电容器等)或互连线之间的空间公差,以确保装置或线不会以不期望的方式彼此交互。一个或多个设计规则限制可以被称为“临界尺寸”(CD)。装置的临界尺寸可以被定义为线或孔的最小宽度或者两个线或两个孔之间的最小空间。因此,CD调节了所设计装置的总尺寸和密度。装置制作中的目标中的一个目标是如实地(经由图案形成装置)在衬底上再现原始设计意图。
本文中采用的术语“掩模”或“图案形成装置”可以被广义地解释为指代通用图案形成装置,其可以被用于向传入的辐射束赋予图案化的横截面,对应于将在衬底的目标部分中创建的图案。在该上下文中,术语“光阀”也可以被使用。除了经典的掩模(透射或反射掩模;二进制、相移、混合掩模等)以外,其他这种图案形成装置的示例包括可编程反射镜阵列。这种装置的示例是具有粘弹性控制层和反射表面的矩阵可寻址表面。这种设备背后的基础原理是(例如)反射表面的寻址区域将入射辐射反射为衍射辐射,而未寻址区域将入射辐射反射为未衍射辐射。使用适当的滤光片,所述未衍射辐射可以从反射束中滤出,仅留下衍射辐射;通过这种方式,束根据矩阵可寻址表面的寻址图案而被图案化。所需的矩阵寻址可以使用合适的电子部件来执行。其他这种图案形成装置的示例还包括可编程LCD阵列。这种构造的示例是在美国专利号5,229,872中给出的,其通过引用并入本文。
作为简要介绍,图1图示了示例性光刻投影设备10A。主要部件是辐射源12A,它可以是深紫外(DUV)准分子激光源或者其他类型的源,包括:极紫外(EUV)源(如上面讨论的,光刻投影设备本身不需要具有辐射源);照射光学器件,其例如限定部分相干性(表示为σ),并且可以包括对来自源12A的辐射进行整形的光学器件部件14A、16Aa和16Ab;图案形成装置18A;以及透射光学器件16Ac,将图案形成装置图案的图像投影到衬底平面22A上。投影光学器件的光瞳平面处的可调整滤光片或孔径20A可能会限制撞击在衬底平面22A上的束角度范围,其中最大可能角度定义了投影光学器件的数值孔径NA=n sin(Θmax),其中n是衬底与投影光学器件的最后一个元件之间的介质的折射率,并且Θmax是从投影光学器件离开的束的最大角度,该束仍然可以撞击在衬底平面22A上。
在光刻投影设备中,源向图案形成装置提供照射(即,辐射),并且投影光学器件经由图案形成装置将照射引导并整形到衬底上。投影光学器件可以包括部件14A、16Aa、16Ab和16Ac中的至少一些。空间图像(AI)是衬底级别的辐射强度分布。抗蚀剂模型可以被用于从空间图像计算抗蚀剂图像,其示例可以在美国专利申请公开号US2009-0157360中找到,其公开内容通过引用全部并入本文。抗蚀剂模型仅与抗蚀剂层的性质相关(例如在曝光、曝光后烘烤(PEB)和显影期间发生的化学过程的影响)。光刻投影设备的光学性质(例如照射、图案形成装置和投影光学器件的性质)指定了空间图像,并且可以在光学模型中定义。由于在光刻投影设备中使用的图案形成装置可以被改变,因此期望将图案形成装置的光学性质与至少包括源和投影光学器件的光刻投影设备的其余部分的光学性质分开。用于将设计布局变换为各种光刻图像(例如空间图像、抗蚀剂图像等),使用这些技术和模型应用OPC并且评估性能(例如按照过程窗口)的技术和模型的细节是在美国专利申请公开号US 2008-0301620、2007-0050749、2007-0031745、2008-0309897、2010-0162197、2010-0180251中描述的,其中每一个的公开内容通过引用全部并入本文。
理解光刻过程的一个方面是理解辐射与图案形成装置的交互。在辐射经过图案形成装置之后,辐射的电磁场可以通过在辐射到达图案形成装置之前的辐射的电磁场以及表征交互的函数来确定。该函数可以被称为掩模透射函数(其可以被用于描述由透射图案形成装置和/或反射图案形成装置进行的交互)。
掩模透射函数可以具有多种不同形式。一种形式是二进制。二进制掩模透射函数在图案形成装置上的任何给定位置具有两个值(例如零和正常数)中的任一个。二进制形式的掩模透射函数可以被称为二进制掩模。另一形式是连续的。即,图案形成装置的透射率(或反射率)的模量是图案形成装置上的位置的连续函数。透射率(或反射率)的相位也可以是图案形成装置上的位置的连续函数。连续形式的掩模透射函数可以被称为连续色调掩模或连续透射掩模(CTM)。例如,CTM可以被表示为像素化图像,其中每个像素可以被分配介于0和1之间的值(例如0.1、0.2、0.3等),而不是0或1的二进制值。在一些实施例中,CTM可以是像素化灰度图像,每个像素具有值(例如在[-255,255]范围内,归一化值在[0,1]或[-1,1]范围内或其他适当范围内)。
薄掩模近似(也称为基尔霍夫边界条件)被广泛用于简化辐射与图案形成装置的交互的确定。薄掩模近似假设图案形成装置上的结构的厚度与波长相比非常小,并且掩模上的结构的宽度与波长相比非常大。因此,薄掩模近似假设图案形成装置之后的电磁场是入射电磁场与掩模透射函数的乘积。然而,随着光刻过程使用波长越来越短的辐射,并且图案形成装置上的结构变得越来越小,薄掩模近似的假设可能会被打破。例如,由于其有限的厚度(“掩模3D效应”或“M3D”),辐射与结构(例如顶表面和侧壁之间的边缘)的交互可能会变得显著。在掩模透射函数中涵盖这种散射可以使掩模透射函数能够更好地捕获辐射与图案形成装置的交互。薄掩模近似条件下的掩模透射函数可以被称为薄掩模透射函数。涵盖M3D的掩模透射函数可以被称为M3D掩模透射函数。
通常期望能够通过计算确定图案化过程将如何在衬底上产生期望图案。因此,模拟可以被提供,以模拟过程的一个或多个部分。例如,期望能够模拟将图案形成装置图案转印至衬底的抗蚀剂层上的光刻过程以及在抗蚀剂显影之后在该抗蚀剂层中产生的图案。
用于模拟光刻投影设备中的光刻的示例性流程图在图2中图示。源模型31表示照射的光学特性(包括辐射强度分布和/或相位分布)。投影光学器件模型32表示投影光学器件的光学特性(包括由投影光学器件引起的辐射强度分布和/或相位分布的变化)。设计布局模型35表示设计布局的光学特性(包括由给定设计布局引起的辐射强度分布和/或相位分布的变化),这是在图案形成装置上或由图案形成装置形成的特征布置的表示。空间图像36可以使用照射模型31、投影光学器件模型32和设计布局模型35来模拟。抗蚀剂图像38可以使用抗蚀剂模型37从空间图像36模拟。例如,掩模图像(诸如CTM掩模和/或其他掩模)也可以被模拟(例如通过设计布局模型35和/或其他模型)。例如,光刻的模拟可以预测抗蚀剂图像中的轮廓和/或CD。
更具体地,照射模型31可以表示照射的光学特性,包括但不限于NA西格玛(σ)设置以及任何特定照射形状(例如离轴照射,诸如环形、四极、偶极等)。投影光学器件模型32可以表示投影光学器件的光学特性,例如包括像差、失真、折射率、物理大小或尺寸等。设计布局模型35也可以表示物理图案形成装置的一个或多个物理性质,例如在美国专利号7,587,704中描述的,其通过引用全部并入本文。与光刻投影设备相关联的光学性质(例如照射、图案形成装置和投影光学器件的性质)指定了空间图像。由于在光刻投影设备中使用的图案形成装置可以被改变,因此期望将图案形成装置的光学性质与至少包括照射和投影光学器件(因此包括设计布局模型35)的光刻投影设备的其余部分的光学性质分开。
抗蚀剂模型37可以被用于从空间图像计算抗蚀剂图像,其示例可以在美国申请号8,200,468中找到,其通过引用全部并入本文。抗蚀剂模型通常与抗蚀剂层的性质相关(例如在曝光、曝光后烘烤和/或显影期间发生的化学过程的影响)。
模拟的目的是准确地预测例如边缘放置、空间图像强度斜率、亚分辨率辅助特征(SRAF)和/或CD,然后可以与预期或目标设计进行比较。预期设计通常被定义为OPC前设计布局,其可以以标准化的数字文件格式(诸如GDSII、OASIS或另一文件格式)提供。
通过设计布局,一个或多个部分可以被识别,其被称为“剪辑”。在一些实施例中,剪辑集合被提取,其表示设计布局中的复杂图案(通常为大约50至1000个剪辑,尽管任何数量的剪辑可以被使用)。如本领域技术人员将了解的,这些图案或剪辑表示设计的小部分(即,电路、单元等),并且特别是剪辑表示需要特别注意和/或验证的小部分。换言之,剪辑可能是设计布局的一部分,或者可能与设计布局的部分类似或具有类似的行为,其中关键特征通过经验(包括由客户提供的剪辑)、通过反复试验或通过运行全芯片模拟来识别。剪辑通常包含一个或多个测试图案或量规图案。初始的较大剪辑集合可以由客户基于需要特定图像优化的设计布局中的已知关键特征区域来先验地提供。备选地,在另一实施例中,初始的较大剪辑集合可以通过使用识别关键特征区域的某种自动(诸如机器视觉)或手动算法从整个设计布局中提取。
例如,模拟和建模可以被用于配置图案形成装置图案的一个或多个特征(例如执行光学邻近校正)、照射的一个或多个特征(例如改变照射的空间/角强度分布的一个或多个特性,诸如改变形状)和/或投影光学器件的一个或多个特征(例如数值孔径等)。这种配置通常可以被分别称为掩模优化、源优化和投影优化。这种优化可以单独执行,或者以不同的组合进行组合。一个这种示例是源掩模优化(SMO),它涉及配置图案形成装置图案的一个或多个特征连同照射的一个或多个特征。优化技术可以集中于一个或多个剪辑。优化可以使用本文描述的机器学习模型来预测各种参数(包括图像等)的值。
在一些实施例中,***的优化过程可以被表示为成本函数。优化过程可以包括寻找使成本函数最小化的***的参数(设计变量、过程变量等)集合。取决于优化的目标,成本函数可以具有任何合适的形式。例如,成本函数可以是***的某些特性(评估点)相对于这些特性的预期值(例如理想值)的偏差的加权均方根(RMS)。成本函数也可以是这些偏差中的最大值(即,最差偏差)。术语“评估点”应该被广义地解释为包括***或制作方法的任何特性。由于***和/或方法的实施方式的实用性,***的设计和/或过程变量可以被局限在有限范围和/或相互依赖。在光刻投影设备的情况下,约束通常与硬件的物理性质和特性相关联,诸如可调谐范围和/或图案形成装置可制造性设计规则。例如,评估点可以包括衬底上的抗蚀剂图像上的物理点以及诸如剂量和焦点等非物理特性。
在一些实施例中,照射模型31、投影光学器件模型32、设计布局模型35、抗蚀剂模型37、SMO模型和/或与集成电路制造过程相关联和/或包括在集成电路制造过程中的其他模型可以是执行本文描述的方法操作的经验模型。经验模型可以基于各种输入(例如掩模或晶片图像的一个或多个特性、设计布局的一个或多个特性、图案形成装置的一个或多个特性、光刻过程中使用的照射的一个或多个特性(诸如波长)等)来预测输出。
作为示例,经验模型可以是机器学习模型和/或任何其他参数化模型。在一些实施例中,机器学习模型(例如)可以是和/或包括数学方程、算法、绘图、图表、网络(例如神经网络)和/或其他工具和机器学习模型部件。例如,机器学习模型可以是和/或包括具有输入层、输出层和一个或多个中间层或隐藏层的一个或多个神经网络。在一些实施例中,一个或多个神经网络可以是和/或包括深度神经网络(例如在输入和输出层之间具有一个或多个中间层或隐藏层的神经网络)。
作为示例,一个或多个神经网络可以基于神经单元(或人工神经元)的大量集合。一个或多个神经网络可能松散地模仿生物大脑的工作方式(例如经由由轴突连接的大量生物神经元集群)。神经网络的每个神经单元可以与神经网络的许多其他神经单元连接。这种连接可以强制或抑制它们对连接的神经单元的激活状态的影响。在一些实施例中,每个单独的神经单元可以具有将其所有输入的值组合在一起的求和函数。在一些实施例中,每个连接(或神经单元本身)可以具有阈值函数,使得信号在被允许传播到其他神经单元之前必须超过阈值。与传统的计算机程序相比,这些神经网络***可能是自学习和训练的,而不是明确编程的,并且在问题解决的某些领域可以执行得明显更好。在一些实施例中,一个或多个神经网络可以包括多个层(例如其中信号路径从前层遍历到后层)。在一些实施例中,反向传播技术可以由神经网络使用,其中前向刺激被用于重置“前”神经单元上的权重。在一些实施例中,一个或多个神经网络的刺激和抑制可能更自由流动,连接以更混乱和复杂的方式交互。在一些实施例中,一个或多个神经网络的中间层包括一个或多个卷积层、一个或多个循环层和/或其他层。
一个或多个神经网络可以使用训练数据集(例如地面实况)来训练(即,其参数被确定)。训练数据可以包括训练样本集合。每个样本可以是一对,包括输入对象(通常是向量,这可以被称为特征向量)和期望的输出值(也称为监督信号)。训练算法分析训练数据,并且通过基于训练数据调整神经网络的参数(例如一层或多层的权重)来调整神经网络的行为。例如,给定N个训练样本的集合,形式为{(x1,y1),(x2,y2),…,(xN,yN)},使得xi是第i个示例的特征向量,yi是其监督信号,训练算法寻求神经网络g:X→Y,其中X是输入空间,并且Y是输出空间。特征向量是表示某个对象(例如以上示例中的晶片设计、剪辑等)的数值特征的n维向量。与这些向量相关联的向量空间通常被称为特征空间或潜在空间。在训练后,神经网络可以被用于使用新样本进行预测。
如上所述,本发明(多种)方法和(多个)***包括使用变分编码器-译码器架构的参数化模型(例如机器学习模型,诸如神经网络)。在模型(例如神经网络)的中间(例如中间层),本发明的模型制定了低维编码(例如潜在空间),它将信息封装到模型的输入(例如图像、张量或者与半导体制造过程的图案或其他特征相关联的其他输入)中。本发明的(多个)***和(多种)方法利用潜在空间的低维度和紧凑性直接在潜在空间中执行图案聚类。这有助于通过图案信息确定图案(集群)。有利地,紧凑且解开的潜在空间导致图案集群的自然分离。通过确定单独的每个图案的信息(例如统计数据,诸如方差、潜在空间覆盖范围、每个集群的分布等),本发明的(多个)***和(多种)方法提供关于参数化模式众所周知的图案类型(例如导致一致的预测)和相对不熟悉的图案类型(例如导致广泛可变的预测)的信息。
本发明的(多个)***和(多种)方法被配置为通过主动搜索包括(例如)与模型预测中的较高不确定性相关联的图案的训练数据来改进参数化模型的训练。本发明的(多个)***和(多种)方法被配置为基于导致更高不确定性的输入(图案)来确定用于训练的增强输入(例如图案)集合。使用该增强输入图案集合重新训练或进一步训练模型提高了模型的预测性能。该模型不必依赖于随机或其他数据选择方法来训练数据。
本发明的(多个)***和(多种)方法被配置为使用所描述的训练数据选择操作来增加参数化模型预测的确定性。通过重复潜在空间聚类的过程,识别与更高预测不确定性相关联的集群和/或图案,并且使用这些或相关图案重新训练模型,训练将比训练样本例如被随机选择时更有效。
应该注意的是,尽管机器学习模型、神经网络和/或编码器-译码器架构在整个说明书中提及,机器学习模型、神经网络和编码器-译码器架构只是示例,并且本文描述的操作可以被应用于不同的参数化模型。
图3图示了用于增加参数化模型预测的确定性的本方法的一个实施例的操作概要300。在操作40中,与给定输入相关联的较高维度数据可以用参数化模型变换为潜在空间中的低维数据。在操作42中,潜在空间中的维度数据由模型聚类为集群。不同集群对应于给定输入的不同部分。在操作44中,模型基于潜在空间中的维度数据来预测输出。在操作46中,潜在空间中的维度数据由模型变换为与集群中的一个或多个相对应的给定输入的恢复版本。在一些实施例中,变换可以包括编码或译码、投影、映射和/或其他变换操作。在一些实施例中,预测(操作44)和变换(操作46)是同时的或几乎同时的。在操作48中,模型基于集群、输出和/或给定输入的恢复版本重新训练、进一步训练和/或以其他方式调整,以增加参数化模型预测的确定性。
在一些实施例中,如本文描述的,参数化模型是机器学习模型。在一些实施例中,参数化模型包括编码器-译码器架构。在一些实施例中,编码器-译码器架构包括变分编码器-译码器架构,并且操作40和/或其他操作包括:利用概率潜在空间训练变分编码器-译码器架构,该概率潜在空间在输出空间中生成实现。潜在空间包括低维编码和/或其他信息(如本文描述的)。如果在给定由编码器计算的分布参数(诸如mu和σ)的情况下,潜在空间是通过从分布(诸如高斯)中采样形成的,则潜在空间是概率性的。
图4图示了参数化模型400的示例。例如,模型400可以是变分自动编码器。变分自动编码器可以使用编码器或编码器网络402,以将输入403(与图案和/或其他输入相关联的图像、文本、信号等)编码为连续表示,也称为潜在空间404,并且使用译码器或译码器网络406生成对应的输出405(预测的图像、文本、信号、数值等,代表图案和/或其他特征)。网络402、406两者的训练使用输入对象/输出值对(例如如上所述)来执行。在一些实施例中,模型400可以被完全训练。在这些实施例中,图3中描述的操作40至48可以被配置为通过确定哪些类型的图案导致模型400进行的预测中的更多不确定性来改进模型400。在一些实施例中,模型400可以被部分地训练。在这些实施例中,操作40至48可以促进模型400的至少部分训练,包括形成潜在空间404。如图4所示,模型400包括两个不同的译码器408和410或者译码器网络406的部分,其功能类似于译码器网络406中的译码器(如下所述)。在一些实施例中,译码器410被配置为反转编码器或编码器网络402的编码(映射),使得输出(例如下面描述的恢复版本411)类似于输入403。
例如,返回图3,在操作40中,变换(例如编码、投影、映射等)可以由机器学习(参数化)模型编码器-译码器架构的编码器(例如图4所示的编码器或编码器网络402)执行。例如,给定的输入可以包括图像、剪辑、编码图像、编码剪辑、向量、来自机器学习模型的先前层的数据、与半导体制造过程相关联的文本、信号、其他数据和/或可以被编码的任何其他数据和/或对象。例如,在一些实施例中,给定输入与半导体制造过程的目标图案设计、缺陷或者过程参数相关联。
在一些实施例中,低维编码表示输入(例如图像)的一个或多个特征。输入的一个或多个特征可以被认为是输入的关键或关键特征。例如,特征可以被认为是输入的关键或关键特征,因为它们比期望输出的其他特征相对更具预测性和/或具有其他特性。在低维编码中表示的一个或多个特征(维度)可以是预确定的(例如由程序员在创建本机器学习模型时)、由神经网络的先前层确定、由用户经由与本文描述的***相关联的用户界面调整和/或可以通过其他方法确定。在一些实施例中,由低维编码表示的特征(维度)的数量可以是预确定的(例如由程序员在创建本机器学习模型时),基于来自神经网络的先前层的输出确定,由用户经由与本文描述的***相关联的用户界面调整,和/或通过其他方法确定。
维度(特征)可以被用于对输入的事实、变量、性质、自由度、类型和/或其他特征进行归类。维度数据可以是具有多个事实、变量、多个自由度、多种类型和/或其他特征的数据。数据的事实、变量、自由度、类型等可能是数据的“维度”。维度数据可以具有多种形式,包括向量形式(例如多维向量)。在一些实施例中,潜在空间中的维度数据包括与模型输入相关联的多维向量和/或其他信息。通过非限制性示例,模型输入可以包括图像。图像可能具有相对较多数量的维度(特征)。例如,图像可以具有不同颜色和/或在不同位置和/或其他维度的像素尺寸、数量。潜在空间中的维度数据可能具有相对较少数量的维度(特征)。例如,潜在空间中的维度数据可以包括表示输入图像的关键特征的多维向量。
如上所述,在操作42中,潜在空间中的维度数据由模型聚类为集群,不同集群对应于给定输入的不同部分。图5图示了将潜在空间404中的维度数据502聚类500为集群504,不同的集群504对应于给定输入403的不同部分506至514。在图5所示的示例中,输入403是目标掩模设计的图像520。不同部分506至514与目标掩模设计的不同图案相关联。如图5所示,编码器或编码器网络402将目标设计的图像520中的较高维度数据映射到低维潜在空间404。
操作42(图3)包括确定潜在空间404(与目标掩模设计的不同图案相关联)中的维度数据502的哪些集群504或集群504的部分对应于预测输出405,与维度数据502的其他集群504或集群504的其他部分相比,预测输出405具有更高的方差。确定潜在空间404中的维度数据502的哪些集群504或集群504的部分对应于具有更高方差的预测输出405有助于选择附加的训练数据。例如,包括与对应于具有更高方差的输出的集群(例如一个或多个集群504)相关联的图案(例如506至514中的一个或多个)的训练数据可以被选择用于训练。
有利地,潜在空间404是低维度的(例如与图像空间相比)。这有助于聚类算法的应用。可以被应用的聚类算法的示例包括K均值聚类、均值偏移聚类、DBSCAN(具有噪声的应用的基于密度的空间聚类)、期望最大化聚类、凝聚层次聚类和/或其他聚类算法。应该注意的是,在一些实施例中,聚类可以直接在图像空间中而不是在潜在空间404中执行。至少由于图像空间的较高维度值,这在计算上可能更昂贵,但仍然是可能的。
在聚类之后,译码器408(或图4所示的译码器网络406的一部分,其功能类似于译码器)映射、投影、译码或以其他方式将潜在空间404中的低维编码变换为输出405。在该示例中,输出405是预测的CTM图像530。第二译码器410将潜在空间404中的低维编码映射、投影、译码或以其他方式变换回给定输入403的对应于一个或多个集群504的恢复版本411。在图5所示的示例中,给定输入的恢复版本是目标掩模设计的图像520的恢复图像532。因此,编码器或编码器网络402与第二译码器410组合实施了恒等算子的近似。恒等算子是将输入映射到输出而不修改它的算子。因此,理想的输出等于输入。在自动编码器(402+410)的情况下,由于压缩到较小的潜在空间404,我们有一个近似恒等算子,因为一些信息由于压缩而丢失。这对于可视化在潜在空间404中聚集和/或识别的图案是有用的。在一些实施例中,模型400可以被配置为提供从潜在空间404到诸如缺陷概率、过程窗口参数和/或其他性质等性质的映射(图5中未示出)。
响应于聚类,对应于各个集群504的图案形状506至514可以使用第二译码器410来可视化。另外,各个图案506至514(对应于各个集群504)可以使用诸如图案可变性、图案频率和/或其他指示符等指示符使用图案来表征。关于模型400的性能的决策可以基于这些指示符和/或其他信息做出。基于特定图案的高输出预测可变性,特定图案506至514和/或其他类似图案的更多示例可以被添加到训练数据集。附加细节在下面对操作44、46和48(图3)的继续讨论中提供。
在一些实施例中,操作42(图3)包括使用聚类、基于梯度的方法和/或其他方法确定潜在空间404中的位置,其对应于与潜在空间404中的其他位置相比具有更高方差(导致更多的模型预测不确定性)的预测输出(例如图案)。换言之,操作42可以包括搜索潜在空间404以识别潜在空间404中的模型400捕获最差的位置(其对应于图案)。与潜在空间404中的这些位置相对应的输入(例如图案的图像)可以被选择为附加的训练输入。
当模型400被训练(如本文描述的)时,潜在空间404形成编码图案的压缩、连续表示(例如),这有助于在潜在空间404中执行搜索和优化操作。例如,搜索和优化操作可以包括聚类、基于梯度的方法(例如梯度上升)和/或其他方法。
图6图示了潜在空间404的可视化600,其具有对应的方差函数602和由最大化方差的示例梯度上升算法采取的可能路径604(例如确定潜在空间404中的与关联于最高的预测不确定性的输入图案相对应的位置)。用于确定潜在空间404中的对应于最高方差(或预测不确定性)的位置的方法可以变化。不同的方差度量可以被用于最大化。例如,当图像中的小区域很关键时,最大方差值可能是相关的,而均方根方差值可能更好地描述总体拟合。针对应用图像的量测应用,对特征边缘高度加权的类均方根方法可以被使用。搜索方法也可以多种多样,梯度搜索只是一个示例。
在一些实施例中,这种搜索的起点可以是潜在空间404中的随机位置。在一些实施例中,对应于从一组可能的输入中确定的具有最高方差的输出(例如图案)的开始位置(例如图案的图像)可以被代替使用。在一些实施例中,操作42(图3)可以包括例如定期或随机地对潜在空间404进行粗略采样,然后选择具有最高输出方差的位置作为起点。这种方法也可以在优化期间使用,以避免最终达到局部最优。从起点开始,操作42可以在潜在空间404上执行梯度搜索(作为一个示例),以确定对应于最大输出方差的位置。
应该注意的是,输出(例如图案)应该与特定的用例相关(例如不需要外推来描述不相关的深奥图案)。这意味着可能不需要沿着或超出潜在空间404的边界进行搜索(当模型400得到合理训练时)。如果梯度搜索(例如)确定对应于最大输出方差的位置朝向潜在空间边界,则可能需要检查模型400输出405的相关性,潜在空间404可能需要在对应方向上扩展(例如通过增加维度、附加的训练数据等)和/或新的起始位置可能需要被确定。接近潜在空间404的原点的起始位置可能需要被避免,因为这可能是或类似于奇点,并且可能最终不会产生相关的译码图像。
再次参照图3和图5,在操作44(图3)中,输出405(图5)包括半导体制造过程的预测掩模图像(例如图5所示的530)、缺陷概率、预测过程参数和/或其他预测。输出405基于潜在空间404中的维度数据和/或其他信息来预测。输出405利用编码器-译码器架构的第一部分预测。在一些实施例中,编码器-译码器架构的第一部分是第一译码器408。然而,编码器-译码器架构的译码器408可以不是传统的译码器。例如,编码器-译码器架构的译码器408可以包括来自不穿过潜在空间404的编码器或编码器网络402的跳过连接550。例如,纯编码器-译码器架构通常不包括跳过连接。跳过连接被用于将高分辨率信息从输入传输到输出。这提高了输出的质量。潜在空间404不一定包含完整的信息以产生输出405,因为不需要这种信息。(然而,恢复版本411(如下所述)确实需要完全从潜在空间404生成。因此,在402和410之间不存在跳过连接。)
在操作46(图3)中,潜在空间404(图5)中的维度数据由编码器-译码器架构的第二部分变换(例如译码、投影、映射等)为给定输入403的恢复版本411。例如,编码器-译码器架构的第二部分可以是第二译码器410。应该注意的是,第二译码器410不包括编码器-译码器架构的第一部分(例如第一译码器408)中所包括的跳过连接550。潜在空间404中的维度数据被变换为给定输入403的恢复版本411,以促进潜在空间404中的兴趣点的可视化。兴趣点包括具有高方差或不确定性的点(例如如关于图6描述的)。在一些实施例中,兴趣点包括与潜在空间中的其他点相比具有相对较高的方差或不确定性的点、不位于集群内的点或者位于笛卡尔距离处的点中的一个或多个和/或其他兴趣点,该笛卡尔距离与潜在空间中的其他点和/或集群之间的笛卡尔距离相比,其与潜在空间中的一个或多个其他点和/或集群相距相对较远。例如,看起来不是任何集群的一部分的点可能是兴趣点。与另一点和/或另一集群相距阈值笛卡尔距离的点可以是兴趣点。这些示例并非旨在限制。
在操作48(图3)中,兴趣点、集群、输出、给定输入的恢复版本和/或其他信息可以被用于评估参数化模型400(图5)的性能。例如,兴趣点和/或输出可以被用于确定给定输入的预测一致性(或方差)。在一些实施例中,操作48包括:通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的确定集群或集群部分中的一个或多个或者潜在空间(图5和图6)中的位置(例如关联于更高预测不确定性的图案)相关联的更多样化的训练数据来训练参数化模型。在一些实施例中,增加潜在空间的维度包括配置潜在空间以描述或表示输入的更多维度或特征(参见上述图像的维度或特征的示例)。通过非限制性示例,增加潜在空间的维度可以包括在潜在空间中对特征向量进行编码,相对于给定输入(例如图像)和/或其他操作的原始或先前编码的特征向量,该特征向量具有更多特征。在一些实施例中,增加潜在空间的维度包括编码器-译码器网络架构中导致潜在空间(例如编码器和译码器之间的层)中的维度增加的任何改变。
在一些实施例中,确定单独的每个图案的信息(例如统计数据,诸如方差、潜在空间覆盖范围、每个集群的分布等),确定潜在空间404中与最高预测不确定性相关联的位置和/或上述其他操作有助于确定针对参数化模型400众所周知的图案类型(例如并且与一致的预测相关联)和相对不熟悉的图案类型(例如并且与广泛可变的预测相关联)。操作48可以包括通过训练模型400来改进参数化模型400的训练,训练数据包括与模型400预测中的较高不确定性相关联的图案。使用该增强输入(例如图案)集合重新训练或进一步训练模型400提高了模型的预测性能。
在一些实施例中,操作48包括基于集群、兴趣点(例如具有最高方差的点)、输出和/或输入的恢复版本重新训练、进一步训练和/或以其他方式调整参数化模型,以增强输出的一个或多个部分(例如特定图案的尺寸、具体类型的缺陷、制造过程参数窗口等)与地面实况的一个或多个部分之间的一致性。地面实况可以是由参数化模型建模的事物的物理版本的已知或测量性质(例如物理掩模的图案尺寸、具体类型的缺陷位置、实际制造过程中使用的过程参数等)。
在一些实施例中,通过增加潜在空间的维度来使参数化模型更具描述性,或者利用与关联于最高预测不确定性的一个或多个集群或点相关联的更多样化的训练数据来训练参数化模型包括:相对于先前的训练材料,使用与集群中的一个或多个相关的更多样化的图像、更多样化的数据和附加剪辑作为输入,以训练参数化模型;和/或使用更多维度对向量进行编码,并且在参数化模型中使用更多编码层。任何或所有这些事物可以基于与较高预测不确定性相关联的潜在空间404中的集群和对应图案和/或点和/或其他信息来确定。如上所述,使用该信息作为训练数据允许参数化模型对这些和其他类似图案做出更准确的预测。
在一些实施例中,与关联于最高预测不确定性的一个或多个集群或点相关联的数据可以包括对应于潜在空间中的一个或多个点(与潜在空间中的其他点相比具有相对较高的方差或不确定性)的数据、对应于位于具体集群内的点的数据、对应于不在集群内的点的数据、对应于位于笛卡尔距离处的点(与潜在空间中的其他点之间的笛卡尔距离相比与潜在空间中的一个或多个其他点相距相对较远)的数据和/或其他数据。例如,换言之,用于调整模型的训练数据的多样性不必被限于与潜在空间中的给定集群或点相关联的数据。与潜在空间中的具体集群或点无关的数据可以被用于调整(例如重新训练)模型,和/或被用于其他目的。例如,全新的或不同的训练数据可以被使用。更多样化的图像和/或更多样化的数据可以指描述新的和/或与用于先前训练不同的特征的图像和/或数据、描述与用于先前训练不同的目标设计或图案部分的图像和/或数据、与用于先前训练不同的处理条件的图像和/或数据和/或其他信息。
在一些实施例中,操作48包括基于取自潜在空间中的维度数据的样本训练、重新训练、进一步训练和/或以其他方式调整参数化模型。这种训练(重新训练等)包括对潜在空间中的维度数据进行采样,并且针对来自潜在空间的每个样本:预测多个输出实现,以为潜在空间中的给定维度数据生成输出实现分布;以及确定与多个输出实现的分布相关联的不确定性(或方差)。用于不确定性预测的单独参数化模型然后可以利用给定的维度数据和对应的确定的不确定性来训练(重新训练等)。例如,来自该单独参数化模型的输出可以被用于指导(例如找到与最高不确定性相关联的潜在空间区域)(第一)参数化模型的训练。
在一些实施例中,采样包括:确定潜在空间中的维度数据的哪些部分对应于预测输出实现,与维度数据的其他部分相比,该预测输出实现具有更高的方差,并且从对应于更高方差的部分中采样。在一些实施例中,采样可以基于来自梯度上升算法的输出和/或其他信息执行,该梯度上升算法被应用于上面关于图6描述的用于不确定性预测的单独参数化模式。如上所述和图6所示,梯度上升算法使潜在空间中的方差最大化(例如确定潜在空间404(图4)中对应于与最高预测不确定性相关联的输入图案的位置)。潜在空间(例如404)中的数据样本可以在由梯度上升算法输出的一个或多个位置处或附近获取。样本可以在由梯度上升算法输出的位置处或附近获取,因为该潜在空间维度数据表示参数化模型被训练最少以处置的一个或多个图案(例如生成最高的预测不确定性)。
应该注意的是,用于确定潜在空间404(图4)中的对应于最高方差(或预测不确定性)的位置的方法可以变化。如上所述,方差(或预测不确定性)的不同度量可以被用于最大化。例如,当图像中的小区域很关键时,最大方差值可能是相关的,而均方根方差值可能更好地描述总体拟合。针对具有图像的量测应用,对特征边缘高度加权的类均方根方法可以被使用。搜索方法也可以多种多样,梯度上升搜索算法只是一个示例。
在一些实施例中,给定维度数据和对应的不确定性形成输入输出训练对。在一些实施例中,单独的参数化模型包括机器学习模型,该机器学习模型包括变分自动编码器(例如具有编码和译码架构),该变分自动编码器包括至少一个神经网络(例如具有节点等,如本文描述的)。用给定的维度数据和对应的不确定性训练单独的参数化模型包括将输入输出训练对提供给神经网络,使得变分自动编码器可以学习预测新的输出实现。
如本文描述的,编码器架构包括参数化模型的一部分,被配置为将模型输入变换为潜在空间中的维度数据,并且译码器架构包括参数化模型的不同部分,被配置为将潜在空间中的维度数据变换为输出实现。
通过非限制性的实际示例,在一些实施例中,模型输入可以与用于半导体制造过程的目标图案设计、缺陷或过程参数相关联。潜在空间中的维度数据可以包括与模型输入相关联的多维向量。多个输出实现可以包括半导体制造过程的预测掩模图像、缺陷概率、预测过程参数和/或其他信息。在一些实施例中,预测包括:利用神经网络的一层或多层和/或一个或多个节点,将维度数据的多维向量译码为输出实现。
确定不确定性可以包括确定预测的多个输出实现的方差和/或其他信息。在一些实施例中,确定方差包括:确定预测的多个输出实现的范围、标准偏差、最大值、最小值、平均值、中位数、模式和/或其他特性。例如,预测的多个输出实现可以包括图像,并且确定不确定性可以包括:确定指示图像之间的差异的指标。指示这种差异的指标可以包括视觉指示符、给定图像性质的范围、给定图像性质的标准偏差、最大和/或最小图像性质、中间图像、模式图像和/或其他指标。
例如,换句话说,为不确定性预测训练单独的参数化模型可以包括对潜在空间z中的维度数据进行采样(例如生成输入数据),其中z表示潜在空间中的维度数据,其可以是潜在空间中的(低)维度编码(向量)。例如,潜在空间z中的维度数据的采样可以来自在参数化模型(例如变分自动编码器)的早期训练期间使用的(例如低维编码的)先验分布p(z)。针对z的每个样本,相同的样本多次通过变分自动编码器的译码器部分,以生成该样本(例如输出数据)的多个输出实现(预测)。这些输出实现可以被聚合,并且它们的方差v(z)可以被确定。例如,z的样本和对应的方差v(z)可以形成输入输出训练对(z,v(z))。为不确定性预测训练参数化模型可以包括向(至少一个)神经网络提供输入输出训练对,使得变分自动编码器可以学习(更好)预测新的输出实现(例如针对相同或不同的模型输入)。针对z的几个不同样本,这些操作可能会被重复几次。
在一些实施例中,操作48包括基于集群、兴趣点、输出和/或给定输入的恢复版本来调整参数化模型,以增加参数化模型的确定性。该调整可以被配置为减小参数化模型预测的方差,增强新图案的参数化模型预测,和/或被配置用于其他目的。在一些实施例中,操作48包括基于集群、兴趣点、输出和/或给定输入的恢复版本调整参数化模型的一个或多个参数(例如权重、层数、潜在空间的维度等),以增加参数化模型预测的确定性。在一些实施例中,调整参数化模型可以包括训练或重新训练本文描述的模型(例如基于与较高预测不确定性相关联的图案)。在一些实施例中,调整参数化模型可以包括手动改变权重、层数、潜在空间的维度等。
在一些实施例中,调整包括:通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的确定集群或集群部分中的一个或多个相关联的更多样化的训练数据来训练参数化模型(其中潜在空间中的各个集群对应于本文描述的维度数据中的不同编码图案)。调整可以包括:确定潜在空间中的维度数据的哪些集群或集群的部分对应于预测输出,与维度数据(例如如本文描述的)的其他集群或者集群的其他部分相比,该预测输出具有更高的方差。确定潜在空间中的维度数据的哪些集群或者集群的部分对应于具有更高方差的预测输出有助于选择附加训练数据。使参数化模型更具描述性包括:相对于先前的训练材料,使用与集群中的一个或多个相关的更多样化的图像和更多样化的数据作为输入,以训练参数化模型;使用更多维度对向量进行编码,并且在参数化模型中使用更多编码层;和/或其他操作。
在一些实施例中,调整参数化模型的一个或多个参数包括:确定单独的每个图案(例如或每个集群)的信息,指示哪些图案类型针对参数化模型是众所周知的并且导致相对一致的预测,以及哪些图案类型是参数化模型不熟悉的并且导致相对可变的预测(例如使用本文描述的一个或多个操作)。单独的每个图案的信息包括方差、潜在空间覆盖范围、分布和/或其他信息。
通过非限制性示例,可以进行调整以预测衬底、掩模、掩模版和/或其他几何形状,作为半导体制造过程的一部分。作为另一示例,操作48可以包括:基于集群、输出、兴趣点和/或给定输入的恢复版本来调整参数化模型,以增加参数化模型的确定性,以预测连续色调掩模(CTM)作为半导体制造过程的一部分。示例并非旨在限制。调整可以对任何参数化模型进行,其中增加参数化模型预测的确定性是有利的。
在一些实施例中,操作48包括:基于来自经调整的参数化模型的预测,确定一个或多个半导体制造过程参数的调整。在一些实施例中,一个或多个确定的半导体制造过程参数包括掩模设计、光瞳形状、剂量、焦点和/或其他参数中的一个或多个。在一些实施例中,一个或多个确定的半导体制造过程参数包括掩模设计,使得掩模设计从第一掩模设计改变为第二掩模设计。设想了与集成电路制作过程和/或其他过程的几个不同方面相关的其他示例。
图7是图示了可以辅助实施本文公开的方法、流程或设备的计算机***100的框图。计算机***100包括总线102或用于传递信息的其他通信机制以及与总线102耦合以用于处理信息的处理器104(或多个处理器104和105)。计算机***100还包括主存储器106,诸如随机存取存储器(RAM)或其他动态存储装置,其被耦合至总线102,以用于存储信息和要由处理器104执行的指令。主存储器106也可以被用于在要由处理器104执行的指令执行期间存储临时变量或其他中间信息。计算机***100还包括只读存储器(ROM)108或其他静态存储装置,其被耦合至总线102,以用于存储针对处理器104的静态信息和指令。诸如磁盘或光盘等存储装置110被提供,并且被耦合至总线102以用于存储信息和指令。
计算机***100可以经由总线102被耦合至显示器112,诸如阴极射线管(CRT)或平板或触摸板显示器,以用于向计算机用户显示信息。包括字母数字键和其他键的输入装置114被耦合至总线102,以用于将信息和命令选择传递给处理器104。另一类型的用户输入装置是光标控件116,诸如鼠标、轨迹球或光标方向键,以用于将方向信息和命令选择传递给处理器104,并且控制显示器112上的光标移动。该输入装置通常在两个轴(第一轴(例如x)和第二轴(例如y))上具有两个自由度,其允许装置指定平面中的位置。触摸板(屏幕)显示器也可以被用作输入装置。
根据一个实施例,响应于处理器104执行主存储器106中所包含的一个或多个指令的一个或多个序列,本文描述的一种或多种方法的部分可以由计算机***100执行。这种指令可以从诸如存储装置110等另一计算机可读介质读取到主存储器106中。主存储器106中所包含的指令序列的执行使处理器104执行本文描述的过程步骤。多处理布置中的一个或多个处理器也可以被采用,以执行主存储器106中所包含的指令序列。在替代实施例中,硬连线电路***可以代替软件指令使用或与软件指令组合使用。因此,本文的描述不被限于硬件电路***和软件的任何具体组合。
本文使用的术语“计算机可读介质”是指参与向处理器104提供指令以供执行的任何介质。这种介质可以采取许多形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如光盘或磁盘,诸如存储装置110。易失性介质包括动态存储器,诸如主存储器106。传输介质包括同轴电缆、铜线和光纤,包括构成总线102的电线。传输介质也可以采用声波或光波的形式,诸如在射频(RF)和红外(IR)数据通信期间生成的那些声波或光波。计算机可读介质的常见形式包括例如软盘、可折叠磁盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD、任何其他光学介质、穿孔卡片、纸带、具有孔洞图案的任何其他物理介质、RAM、PROM和EPROM、闪存EPROM、任何其他存储器芯片或者存储器匣、下文描述的载波或者计算机可以从中读取的任何其他介质。
各种形式的计算机可读介质可以涉及将一个或多个指令的一个或多个序列携带到处理器104以供执行。例如,指令最初可能被承载在远程计算机的磁盘上。远程计算机可以将指令加载到其动态存储器中,并且使用调制解调器通过电话线发送指令。计算机***100本地的调制解调器可以在电话线上接收数据,并且使用红外发送器将数据转换为红外信号。耦合至总线102的红外检测器可以接收红外信号中携带的数据,并且将数据放置在总线102上。总线102将数据携带到主存储器106,处理器104从主存储器106取回并执行指令。在由处理器104执行之前或之后,由主存储器106接收的指令可以可选地被存储在存储装置110上。
计算机***100还可以包括耦合至总线102的通信接口118。通信接口118提供耦合至网络链路120的双向数据通信,该网络链路120被连接至局部网络122。例如,通信接口118可以是集成服务数字网络(ISDN)卡或调制解调器,以提供与对应类型的电话线的数据通信连接。作为另一示例,通信接口118可以是局域网(LAN)卡,以提供与兼容LAN的数据通信连接。无线链路也可以被实施。在任何这种实施方式中,通信接口118发送和接收电信号、电磁信号或光学信号,其携带表示各种类型的信息的数字数据流。
网络链路120通常通过一个或多个网络向其他数据装置提供数据通信。例如,网络链路120可以通过本地网络122向主机计算机124或由互联网服务提供方(ISP)126操作的数据装置提供连接。ISP 126又通过全球分组数据通信网络(现在一般称为“互联网”128)提供数据通信服务。本地网络122和互联网128都使用携带数字数据流的电信号、电磁信号或光学信号。通过各种网络的信号以及在网络链路120上并且通过通信接口118的信号(将数字数据携带到计算机***100并且从计算机***100携带数字数据)是输送信息的载波的示例性形式。
计算机***100可以通过(多个)网络、网络链路120和通信接口118发送消息并且接收数据,包括程序代码。在互联网示例中,服务器130可以通过互联网128、ISP 126、本地网络122和通信接口118传输针对应用程序的请求代码。例如,一个这种下载应用可以提供本文描述的方法的全部或部分。接收到的代码可以在被接收到时由处理器104执行,和/或被存储在存储装置110或其他非易失性存储设备中,以供稍后执行。通过这种方式,计算机***100可以获得载波形式的应用代码。
图8是根据实施例的光刻投影设备的示意图。光刻投影设备可以包括照射***IL、第一载物台MT、第二载物台WT和投影***PS。照射***IL可以调节辐射束B。在该示例中,照射***还包括辐射源SO。第一载物台(例如图案形成装置台)MT可以被提供有图案形成装置保持器以保持图案形成装置MA(例如掩模版),并且被连接至第一***以相对于物品PS准确地定位图案形成装置。第二载物台(例如衬底台)WT可以被提供有衬底保持器以保持衬底W(例如涂有抗蚀剂的硅晶片),并且被连接至第二***以相对于物品PS准确地定位衬底。投影***(例如包括透镜)PS(例如折射、反射或反射折射光学***)可以将图案形成装置MA的辐射部分成像到衬底W的目标部分C(例如包括一个或多个管芯)上。
如所描绘的,该设备可以是透射型的(即,具有透射式图案形成装置)。然而,通常,它也可以是反射型的,例如(具有反射式图案形成装置)。该设备可以采用与经典掩模不同种类的图案形成装置;示例包括可编程反射镜阵列或LCD矩阵。
源SO(例如汞灯或准分子激光器、LPP(激光产生的等离子体)EUV源)产生辐射束。例如,该束直接地或者在遍历诸如扩束器等调节部件之后被馈送到照射***(照射器)IL中。照射器IL可以包括调整部件AD,以用于设置束中的强度分布的外部和/或内部径向范围(一般分别称为σ外部和σ内部)。另外,它通常将包括各种其他部件,诸如积分器IN和聚光器CO。通过这种方式,撞击在图案形成装置MA上的束B在其横截面中具有期望的均匀性和强度分布。
在一些实施例中,源SO可以在光刻投影设备的外壳内(例如当源SO是汞灯时通常是这种情况),但是它也可以远离光刻投影设备。例如,它产生的辐射束可以被引导到设备中(例如借助于合适的定向镜)。例如,当源SO是准分子激光器(例如基于KrF、ArF或F2激光)时,该后一种场景可能是这种情况。
束B可以随后拦截被保持在图案形成装置台MT上的图案形成装置MA。在遍历图案形成装置MA后,束B可以穿过透镜,该透镜将束B聚焦到衬底W的目标部分C上。借助于第二定位部件(和干涉测量部件IF),衬底台WT可以被准确地移动,例如以将不同的目标部分C定位在束B的路径中。类似地,第一定位部件可以被用于相对于束B的路径准确地定位图案形成装置MA,例如在图案形成装置MA从图案形成装置库中机械取回之后或者在扫描期间。通常,借助于长冲程模块(粗略定位)和短冲程模块(精细定位),载物台MT、WT的移动可以被实现。然而,在步进器(与步进扫描工具相对)的情况下,图案形成装置台MT可以被连接至短冲程致动器,或者可以是固定的。
所描绘的工具可以被用于两种不同的模式,步进模式和扫描模式。在步进模式下,图案形成装置台MT基本保持静止,并且整个图案形成装置图像在一个操作(即,单次“闪光”)中投影到目标部分C上。衬底台WT可以在x和/或y方向上偏移,使得不同的目标部分C可以被束B照射。在扫描模式下,基本上适用相同的场景,除了给定的目标部分C未在单次“闪光”中曝光之外。相反,图案形成装置台MT在给定方向(例如“扫描方向”或“y”方向)上以速度v可移动,使得投影束B在图案形成装置图像上扫描。并发地,衬底台WT同时沿着相同或相反方向以速度V=Mv移动,其中M是透镜的放大率(通常,M=1/4或1/5)。通过这种方式,相对较大的目标部分C可以被曝光,而不必牺牲分辨率。
图9是另一光刻投影设备LA的示意图。LA可以包括源收集器模块SO、被配置为调节辐射束B(例如EUV辐射)的照射***(照射器)IL、支撑结构MT、衬底台WT和投影***PS。支撑结构(例如图案形成装置台)MT可以被构造为支撑图案形成装置(例如掩模或掩模版)MA,并且被连接至被配置为准确地定位图案形成装置的第一***PM。衬底台(例如晶片台)WT可以被构造为保持衬底(例如涂有抗蚀剂的晶片)W,并且被连接至被配置为准确地定位衬底的第二***PW。投影***(例如反射式投影***)PS可以被配置为将由图案形成装置MA赋予辐射束B的图案投影到衬底W的目标部分C(例如包括一个或多个管芯)上。
如该示例中所示,LA可以是反射型的(例如采用反射式图案形成装置)。要注意的是,因为大多数材料在EUV波长范围内是吸收性的,所以图案形成装置可以具有多层反射器,该多层反射器包括例如钼和硅的多叠层。在一个示例中,多叠层反射器具有钼和硅的40层对,其中每层的厚度为四分之一波长。甚至更小的波长可以用X射线光刻产生。由于大多数材料在EUV和x射线波长处都是吸收性的,因此在图案形成装置形貌上的图案化吸收材料的薄片(例如多层反射器顶部的TaN吸收剂)定义了特征将在何处印刷(正性抗蚀剂)或不印刷(负性抗蚀剂)。
照射器IL可以接收来自源收集器模块SO的极紫外辐射束。产生EUV辐射的方法包括但不必限于将材料转换为具有至少一种元素(例如氙、锂或锡)的等离子态,其在EUV范围内具有一个或多个发射线。在一种这样的方法中,通常称为激光产生等离子体(“LPP”),等离子体可以通过用激束照射燃料(诸如具有谱线发射元素的材料微滴、流或集群)来产生。源收集器模块SO可以是EUV辐射***的一部分,该EUV辐射***包括激光器(未在图10中示出),以用于提供激发燃料的激束。所得的等离子体发射输出辐射,例如EUV辐射,其使用设置在源收集器模块中的辐射收集器来收集。激光器和源收集器模块可以是单独的实体,例如当CO2激光器被用于提供激束以进行燃料激发时。在该示例中,激光器可以不被认为形成光刻设备的一部分,并且借助于包括例如合适的导向镜和/或扩束器的束传送***,辐射束可以从激光器传递到源收集器模块。在其他示例中,源可能是源收集器模块的集成部分,例如当源是放电产生的等离子体EUV发生器(通常称为DPP源)时。
照射器IL可以包括调整器,以用于调整辐射束的角强度分布。通常,照射器的光瞳平面中的强度分布的至少外部和/或内部径向范围(一般分别被称为σ外部和σ内部)可以被调整。另外,照射器IL可以包括各种其他部件,诸如琢面场和光瞳反射镜装置。照射器可以被用于调节辐射束,以在其横截面中具有期望的均匀性和强度分布。
辐射束B可以被入射到图案形成装置(例如掩模)MA上,并且由图案形成装置图案化,该图案形成装置被保持在支撑结构(例如图案形成装置台)MT上。在从图案形成装置(例如掩模)MA反射之后,辐射束B穿过投影***PS,其将束聚焦到衬底W的目标部分C上。借助于第二***PW和位置传感器PS2(例如干涉测量装置、线性编码器或电容式传感器),衬底台WT可以被准确地移动(例如以将不同的目标部分C定位在辐射束B的路径中)。类似地,第一***PM和另一位置传感器PS可以被用于相对于辐射束B的路径准确地定位图案形成装置(例如掩模)MA。图案形成装置(例如掩模)MA和衬底W可以使用图案形成装置对准标记M1、M2和衬底对准标记P1、P2来对准。
所描绘的设备LA可以被用于以下模式中的至少一种,步进模式、扫描模式和静止模式。在步进模式下,在赋予辐射束的整个图案一次被投影到目标部分C上(即,单次静态曝光)时,支撑结构(例如图案形成装置台)MT和衬底台WT基本上保持静止。然后,衬底台WT在X和/或Y方向上偏移,使得不同的目标部分C可以被曝光。在扫描模式下,在赋予辐射束的图案被投影到目标部分C上(即,单次动态曝光)时,支撑结构(例如图案形成装置台)MT和衬底台WT被同步地扫描。衬底台WT相对于支撑结构(例如图案形成装置台)MT的速度和方向可以通过投影***PS的放大率(缩小率)和图像反转特性来确定。在静止模式下,在赋予辐射束的图案被投影到目标部分C上时,支撑结构(例如图案形成装置台)MT基本上保持静止,从而保持可编程图案形成装置,并且衬底台WT被移动或扫描。在这种模式下,通常脉冲式辐射源被采用,并且在衬底台WT的每次移动之后或者在扫描期间的连续辐射脉冲之间,可编程图案形成装置根据需要来更新。这种操作模式可以容易地被应用于无掩模光刻,其利用可编程图案形成装置(诸如上面引用类型的可编程反射镜阵列)。
图10是与图9(和图8)所示的LA类似或相同的光刻投影设备1000的详细视图。如图10所示,光刻投影设备可以包括源收集器模块SO、照射***IL和投影***PS。源收集器模块SO被配置为使得真空环境可以在源收集器模块SO的封闭结构220中维持。EUV辐射发射等离子体210可以由放电产生的等离子体源形成。EUV辐射可以由气体或蒸气产生,例如氙气、锂蒸气或锡蒸气,其中非常热的等离子体210被创建,以发射电磁谱的EUV范围内的辐射。热等离子体210是由例如放电创建的,该放电导致至少部分电离的等离子体。为了有效地生成辐射,可能需要例如10Pa的Xe、Li、Sn蒸气或任何其他合适的气体或蒸气的分压。在一些实施例中,激发锡(Sn)的等离子体被提供,以产生EUV辐射。
经由被定位在源室211中的开口中或后面的可选气体阻挡部或污染物陷阱230(在一些情况下也被称为污染物阻挡部或翼片阱),由热等离子体210发射的辐射从源室211传递到收集器室212中。污染物陷阱230可以包括通道结构。收集器室211可以包括辐射收集器CO,其可以是掠入射收集器。辐射收集器CO具有上游辐射收集器侧251和下游辐射收集器侧252。遍历收集器CO的辐射可以从光栅光谱滤光片240反射出来,以沿着由点虚线‘O’指示的光轴被聚焦在虚拟源点IF中。虚拟源点IF一般被称为中间焦点,并且源收集器模块被布置为使得中间焦点IF位于封闭结构220中的开口221处或附近。虚拟源点IF是辐射发射等离子体210的图像。
随后,辐射遍历照射***IL,该照射***IL可以包括琢面场反射镜装置22和琢面光瞳反射镜装置24,其被布置为在图案形成装置MA处提供辐射束21的期望角分布以及在图案形成装置MA处提供辐射强度的期望均匀性。在由支撑结构MT保持的图案形成装置MA处反射辐射束21时,图案化束26被形成,并且图案化束26由投影***PS经由反射元件28、30成像到由衬底台WT保持的衬底W上。照射光学器件单元IL和投影***PS中通常可以存在比所示更多的元件。取决于光刻设备的类型,光栅光谱滤光片240可以可选地存在。进一步地,可能存在比附图中所示的更多的反射镜,例如与图10所示的相比,投影***PS中可能存在1至6个附加反射元件。
如图10所图示的,收集器光学器件CO被描绘为具有掠入射反射器253、254和255的嵌套收集器,仅作为收集器(或收集器反射镜)的示例。掠入射反射器253、254和255围绕光轴O轴向对称地设置,并且这种类型的收集器光学器件CO可以与通常称为DPP源的放电产生的等离子体源组合使用。
图11是先前附图所示的光刻投影设备的源收集器模块SO的详细视图。源收集器模块SO可以是光刻投影设备辐射***的一部分。激光器LAS可以被布置为将激光能量沉积到燃料中,诸如氙(Xe)、锡(Sn)或锂(Li),从而创建电子温度为几十eV的高度电离的等离子体210。在这些离子的去激发和重组期间生成的带能辐射从等离子体发射,由近于法向入射的收集器光学器件CO收集并且聚焦到封闭结构220中的开口221上。
本文公开的概念可以模拟或数学建模任何通用成像***,以用于对亚波长特征进行成像,并且对于能够产生越来越短的波长的新兴成像技术可能尤其有用。已经使用的新兴技术包括EUV(极紫外)、DUV光刻,该技术能够使用ArF激光器产生193nm的波长,甚至使用氟激光器产生157nm的波长。而且,通过使用同步加速器或通过用高能电子撞击材料(固体或等离子体)以产生在该范围内的光子,EUV光刻能够产生在20至5nm范围内的波长。
实施例还可以使用以下条款来描述:
1.一种用于确定半导体制造过程参数的调整的方法,所述方法包括:
利用参数化模型,将与参数化模型相关联的潜在空间中的维度数据聚类为集群,其中不同集群对应于给定输入的不同部分;
利用参数化模型,基于潜在空间中的维度数据来预测输出;
利用参数化模型,将潜在空间中的维度数据变换为与集群中的一个或多个相对应的给定输入的恢复版本;
基于集群、输出和/或给定输入的恢复版本,调整参数化模型的一个或多个参数,以增加参数化模型预测的确定性;以及
基于来自经调整的参数化模型的预测,确定一个或多个半导体制造过程参数的调整。
2.根据条款1的方法,还包括:基于集群、输出和/或给定输入的恢复版本来调整参数化模型,以增加参数化模型的确定性,以预测连续色调掩模(CTM)作为半导体制造过程的一部分。
3.根据条款1至2中任一项的方法,其中一个或多个确定的半导体制造过程参数包括掩模设计、光瞳形状、剂量或焦点中的一个或多个。
4.根据条款3的方法,其中一个或多个确定的半导体制造过程参数包括掩模设计,并且确定一个或多个半导体制造过程参数的调整包括:将掩模设计从第一掩模设计改变为第二掩模设计。
5.根据条款1至4中任一项的方法,其中给定输入包括图像、剪辑、编码图像、编码剪辑或者来自参数化模型的先前层的数据中的一个或多个。
6.一种用于进行参数化模型预测的方法,所述方法包括:
利用参数化模型,将与参数化模型相关联的潜在空间中的维度数据聚类为集群,其中不同集群对应于给定输入的不同部分;
利用参数化模型,基于潜在空间中的维度数据来预测输出;以及
利用参数化模型,将潜在空间中的维度数据变换为与集群中的一个或多个相对应的给定输入的恢复版本。
7.根据条款6的方法,其中预测和变换是同时的。
8.根据条款6或7的方法,其中潜在空间中的维度数据被变换为给定输入的恢复版本,以促进潜在空间中的兴趣点的可视化。
9.根据条款6至8中任一项的方法,还包括:识别潜在空间中的兴趣点。
10.根据条款9的方法,其中兴趣点包括与潜在空间中的其他点相比具有相对较高的方差或不确定性的点、不位于集群内的点或者位于笛卡尔距离处的点中的一个或多个,与潜在空间中的其他点和/或其他集群之间的笛卡尔距离相比,所述笛卡尔距离与潜在空间中的一个或多个其他点和/或集群相距相对较远。
11.根据条款8至10中任一项的方法,还包括:使用兴趣点、集群、给定输入的恢复版本和/或输出来评估参数化模型的性能。
12.根据条款6至11中任一项的方法,还包括:利用参数化模型,将与给定输入相关联的较高维度数据变换为潜在空间中的维度数据。
13.根据条款6至12中任一项的方法,其中参数化模型是机器学习模型。
14.根据条款6至13中任一项的方法,其中参数化模型包括编码器-译码器架构。
15.根据条款14的方法,其中编码器-译码器架构包括变分编码器-译码器架构,所述方法还包括:利用概率潜在空间训练变分编码器-译码器架构,所述概率潜在空间在输出空间中生成实现。
16.根据条款15的方法,其中潜在空间包括低维编码。
17.根据条款14至16中任一项的方法,其中潜在空间中的维度数据由编码器-译码器架构中的编码器编码。
18.根据条款14至17中任一项的方法,其中输出利用编码器-译码器架构的第一部分基于潜在空间中的维度数据来预测。
19.根据条款18的方法,其中编码器-译码器架构的第一部分是第一译码器。
20.根据条款14至19中任一项的方法,其中潜在空间中的维度数据由编码器-译码器架构的第二译码器变换为给定输入的恢复版本。
21.根据条款6至20中任一项的方法,其中给定输入包括与半导体制造过程相关联的图像、剪辑、编码图像、编码剪辑或者来自参数化模型的先前层的数据中的一个或多个。
22.根据条款21的方法,其中给定输入与半导体制造过程的目标图案设计、缺陷或者过程参数相关联。
23.根据条款6至22中任一项的方法,其中输出包括半导体制造过程的预测掩模图像、缺陷概率或者预测过程参数。
24.根据条款6至23中任一项的方法,还包括:基于集群、输出和/或输入的恢复版本来调整参数化模型。
25.根据条款24的方法,其中调整被配置为增强输出的一个或多个部分与地面实况的一个或多个部分之间的一致性。
26.根据条款24或25中任一项的方法,其中调整参数化模型包括:通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与一个或多个集群相关联的更多样化的训练数据来训练参数化模型。
27.根据条款26的方法,其中通过增加潜在空间的维度来使参数化模型更具描述性,或者利用与一个或多个集群相关联的更多样化的训练数据来训练参数化模型包括:
相对于先前的训练材料,使用与集群中的一个或多个相关的更多样化的图像、更多样化的数据和附加剪辑作为输入,以训练参数化模型;和/或
使用更多维度对向量进行编码,并且在参数化模型中使用更多编码层。
28.根据条款26或27中任一项的方法,其中更多样化的训练样本相对于先前训练材料包括附加和/或更多样化的图像、附加和/或更多样化的数据以及附加和/或更多样化的剪辑。
29.根据条款6至28中任一项的方法,还包括:确定潜在空间中的维度数据的哪些集群或集群的部分对应于预测输出,与维度数据的其他集群或者集群的其他部分相比,所述预测输出具有更高的方差。
30.根据条款29的方法,其中确定潜在空间中的维度数据的哪些集群或者集群的部分对应于具有更高方差的预测输出有助于选择附加训练数据。
31.根据条款30的方法,还包括:通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的确定集群或集群部分中的一个或多个相关联的更多样化的训练数据来训练参数化模型。
32.根据条款6至31中任一项的方法,还包括:基于集群、输出和/或给定输入的恢复版本来调整参数化模型,以增加参数化模型的确定性,以预测衬底几何形状作为半导体制造过程的一部分。
33.根据条款6至32中任一项的方法,还包括:基于集群、输出和/或给定输入的恢复版本来调整参数化模型,以增加参数化模型的确定性,以预测连续色调掩模(CTM)作为半导体制造过程的一部分。
34.根据条款6至33中任一项的方法,还包括训练参数化模型,训练包括:
对潜在空间中的维度数据进行采样,并且针对潜在空间中的每个样本:
预测多个输出实现,以为潜在空间中的给定维度数据生成输出实现分布;以及
确定与多个输出实现的分布相关联的不确定性;以及
基于给定维度数据和确定的不确定性来训练参数化模型。
35.根据条款34的方法,其中参数化模型是机器学习模型。
36.根据条款34至35的方法,其中参数化模型包括神经网络。
37.根据条款34至36中任一项的方法,其中参数化模型包括编码器-译码器架构。
38.根据条款34至37中任一项的方法,其中编码器架构包括参数化模型的一部分,被配置为将模型输入变换为潜在空间中的维度数据,并且译码器架构包括参数化模型的不同部分,被配置为将潜在空间中的维度数据变换为输出实现。
39.根据条款38的方法,其中编码器架构和译码器架构包括具有一层或多层的一个或多个神经网络,所述一层或多层具有一个或多个节点。
40.根据条款38至39中任一项的方法,还包括:利用参数化模型的所述部分,将与模型输入相关联的较高维度数据变换为潜在空间中的维度数据,与关联于模型输入的较高维度数据相比,潜在空间中的维度数据包括低维数据。
41.根据条款38至40中任一项的方法,其中模型输入包括与半导体制造过程相关联的图像、剪辑、编码图像、编码剪辑或者来自参数化模型的先前层的数据中的一个或多个。
42.根据条款38至41中任一项的方法,其中模型输入与半导体制造过程的目标图案设计、缺陷或者过程参数相关联。
43.根据条款34至42中任一项的方法,其中潜在空间中的维度数据包括与模型输入相关联的多维向量。
44.根据条款34至43中任一项的方法,其中多个输出实现包括半导体制造过程的预测掩模图像、缺陷概率或者预测过程参数。
45.根据条款34至44中任一项的方法,其中预测包括:利用神经网络的一层或多层和/或一个或多个节点,将维度数据的多维向量译码为输出实现。
46.根据条款34至45中任一项的方法,其中确定不确定性包括:确定预测的多个输出实现的方差。
47.根据条款46的方法,其中确定方差包括:确定预测的多个输出实现的范围、标准偏差、最大值、最小值、平均值、中位数和/或模式。
48.根据条款34至47中任一项的方法,其中预测的多个输出实现包括图像,并且其中确定不确定性包括:确定指示图像之间的差异的指标。
49.根据条款34至48中任一项的方法,其中给定维度数据和对应的不确定性形成输入输出训练对。
50.根据条款49的方法,其中参数化模型包括神经网络,并且其中利用给定维度数据和对应的不确定性训练参数化模型包括:将输入输出训练对提供给神经网络,因此神经网络可以学习预测新的输出实现。
51.根据条款34至50中任一项的方法,还包括:确定潜在空间中的维度数据的哪些部分对应于预测输出实现,与维度数据的其他部分相比,所述预测输出实现具有更高的方差,并且从对应于更高方差的部分中采样。
52.根据条款51的方法,其中确定潜在空间中的维度数据的哪些部分对应于具有更高方差的预测输出实现有助于选择附加训练数据。
53.根据条款34至52中任一项的方法,还包括:使用经训练的参数化模型来预测掩模或掩模版几何形状,作为半导体制造过程的一部分。
54.根据条款34至53中任一项的方法,还包括:使用经训练的参数化模型来预测连续色调掩模(CTM),作为半导体制造过程的一部分。
55.一种用于训练参数化模型的方法,所述方法包括:
对潜在空间中的维度数据进行采样,并且针对潜在空间中的每个样本:
预测多个输出实现,以为潜在空间中的给定维度数据生成输出实现分布;以及
确定与多个输出实现的分布相关联的不确定性;以及
利用给定维度数据和确定的不确定性来训练参数化模型。
56.根据条款55的方法,其中参数化模型是机器学习模型。
57.根据条款55至56的方法,其中参数化模型包括神经网络。
58.根据条款55至57中任一项的方法,其中参数化模型包括编码器-译码器架构。
59.根据条款55至58中任一项的方法,其中编码器架构包括参数化模型的一部分,被配置为将模型输入变换为潜在空间中的维度数据,并且译码器架构包括参数化模型的不同部分,被配置为将潜在空间中的维度数据变换为输出实现。
60.根据条款59的方法,其中编码器架构和译码器架构包括具有一层或多层的一个或多个神经网络,所述一层或多层具有一个或多个节点。
61.根据条款59至60中任一项的方法,还包括:利用参数化模型的所述部分,将与模型输入相关联的较高维度数据变换为潜在空间中的维度数据,与关联于模型输入的较高维度数据相比,潜在空间中的维度数据包括低维数据。
62.根据条款59至61中任一项的方法,其中模型输入包括与半导体制造过程相关联的图像、剪辑、编码图像、编码剪辑或者来自参数化模型的先前层的数据中的一个或多个。
63.根据条款59至62中任一项的方法,其中模型输入与半导体制造过程的目标图案设计、缺陷或者过程参数相关联。
64.根据条款55至63中任一项的方法,其中潜在空间中的维度数据包括与模型输入相关联的多维向量。
65.根据条款55至64中任一项的方法,其中多个输出实现包括半导体制造过程的预测掩模图像、缺陷概率或者预测过程参数。
66.根据条款55至65中任一项的方法,其中预测包括:利用神经网络的一层或多层和/或一个或多个节点,将维度数据的多维向量译码为输出实现。
67.根据条款55至66中任一项的方法,其中确定不确定性包括:确定预测的多个输出实现的方差。
68.根据条款67的方法,其中确定方差包括:确定预测的多个输出实现的范围、标准偏差、最大值、最小值、平均值、中位数和/或模式。
69.根据条款55至68中任一项的方法,其中预测的多个输出实现包括图像,并且其中确定不确定性包括:确定指示图像之间的差异的指标。
70.根据条款55至69中任一项的方法,其中给定维度数据和对应的不确定性形成输入输出训练对。
71.根据条款70的方法,其中参数化模型包括神经网络,并且其中利用给定维度数据和对应的不确定性训练参数化模型包括:将输入输出训练对提供给神经网络,因此神经网络可以学习预测新的输出实现。
72.根据条款55至71中任一项的方法,还包括:确定潜在空间中的维度数据的哪些部分对应于预测输出实现,与维度数据的其他部分相比,所述预测输出实现具有更高的方差,并且从对应于更高方差的部分中采样。
73.根据条款72的方法,其中确定潜在空间中的维度数据的哪些部分对应于具有更高方差的预测输出实现有助于选择附加训练数据。
74.根据条款55至73中任一项的方法,还包括:使用经训练的参数化模型来预测掩模或掩模版几何形状,作为半导体制造过程的一部分。
75.根据条款55至74中任一项的方法,还包括:使用经训练的参数化模型来预测连续色调掩模(CTM),作为半导体制造过程的一部分。
76.一种在其上具有指令的非瞬态计算机可读介质,在由计算机执行时,所述指令实施条款1至75中任一项的方法。
77.一种用于增加参数化模型预测的确定性的方法,所述方法包括:
利用参数化模型,将与参数化模型相关联的潜在空间中的维度数据聚类为集群,其中不同集群对应于给定输入的不同部分;
利用参数化模型,基于潜在空间中的维度数据来预测输出;
利用参数化模型,将潜在空间中的维度数据变换为与集群中的一个或多个相对应的给定输入的恢复版本;以及
基于集群、输出和/或给定输入的恢复版本,调整参数化模型的一个或多个参数,以增加参数化模型预测的确定性。
78.根据条款77的方法,还包括:确定潜在空间中的维度数据的哪些集群或集群的部分对应于预测输出,与维度数据的其他集群或者集群的其他部分相比,所述预测输出具有更高的方差。
79.根据条款78的方法,其中确定潜在空间中的维度数据的哪些集群或者集群的部分对应于具有更高方差的预测输出有助于选择附加训练数据。
80.根据条款78或79的方法,其中调整包括:通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的确定集群或集群部分中的一个或多个相关联的更多样化的训练数据来训练参数化模型。
81.根据条款80的方法,其中通过增加潜在空间的维度来使参数化模型更具描述性,和/或利用与关联于更高方差的确定集群或集群部分中的一个或多个相关联的更多样化的训练数据来训练参数化模型包括:
相对于先前的训练材料,使用与集群中的一个或多个相关的更多样化的图像和更多样化的数据作为输入,以训练参数化模型;和/或
使用更多维度对向量进行编码,并且在参数化模型中使用更多编码层。
82.根据条款77至81中任一项的方法,还包括训练参数化模型,训练包括:
对潜在空间中的维度数据进行采样,并且针对潜在空间中的每个样本:
预测多个输出实现,以为潜在空间中的给定维度数据生成输出实现分布;以及
确定与多个输出实现的分布相关联的不确定性;以及
基于给定维度数据和确定的不确定性来训练参数化模型。
83.根据条款82的方法,还包括:确定潜在空间中的维度数据的哪些集群对应于预测输出实现,与维度数据的其他集群相比,所述预测输出实现具有更高的方差,并且从对应于更高方差的集群中采样。
84.根据条款77至83中任一项的方法,其中潜在空间中的各个集群对应于维度数据中的不同编码图案。
85.根据条款84的方法,其中调整参数化模型的一个或多个参数包括:确定单独的每个图案的信息,指示哪些图案类型针对参数化模型是众所周知的并且导致相对一致的预测,以及哪些图案类型是参数化模型不熟悉的并且导致相对可变的预测。
86.根据条款85的方法,其中单独的每个图案的信息包括方差、潜在空间覆盖范围和/或分布。
87.根据条款77至86中任一项的方法,其中调整参数化模型的一个或多个参数包括:调整参数化模型的维度和/或参数化模型的一层或多层的权重。
88.根据条款77至87中任一项的方法,还包括:基于集群、输出和/或输入的恢复版本来调整参数化模型,以减小参数化模型预测的方差和/或增强新图案的参数化模型预测。
89.根据条款77至88中任一项的方法,还包括:
识别潜在空间中的兴趣点,其中兴趣点包括与潜在空间中的其他点相比具有相对较高的方差或不确定性的点、不位于集群内的点或者位于笛卡尔距离处的点中的一个或多个,与潜在空间中的其他点和/或其他集群之间的笛卡尔距离相比,所述笛卡尔距离与潜在空间中的一个或多个其他点和/或集群相距相对较远;以及
使用兴趣点、集群、给定输入的恢复版本和/或输出来评估参数化模型的性能。
90.根据条款77至89中任一项的方法,其中参数化模型包括变分编码器-译码器架构;
其中潜在空间中的维度数据由编码器-译码器架构的编码器编码,输出利用编码器-译码器架构的译码器基于潜在空间中的维度数据来预测,并且潜在空间中的维度数据由编码器-译码器架构的第二译码器变换为给定输入的恢复版本;并且
其中所述方法还包括:用概率潜在空间训练变分编码器-译码器架构,所述概率潜在空间在输出空间中生成实现。
91.一种在其上具有指令的非瞬态计算机可读介质,在由计算机执行时,所述指令实施条款77至90中任一项的方法。
尽管本文公开的概念可以被用于在诸如硅晶片等衬底上成像,但是应该理解的是,所公开的概念可以与任何类型的光刻成像***一起使用,例如用于在除硅晶片之外的衬底上成像的那些光刻成像***。另外,所公开的元素的组合和子组合可以包括单独的实施例。例如,确定机器学习模型的可变性可以包括:确定由模型进行的各个预测的可变性和/或由模型生成的后验分布的采样集合的可变性。这些特征可以包括单独的实施例,和/或这些特征可以在同一实施例中一起使用。
以上描述旨在是说明性的,而不是限制性的。因此,对于本领域技术人员将显而易见的是,在不偏离下面陈述的权利要求的范围的情况下,修改可以如所描述的那样进行。

Claims (15)

1.一种用于增大参数化模型预测的确定性的方法,所述方法包括:
利用参数化模型,将与所述参数化模型相关联的潜在空间中的维度数据聚类为集群,其中不同集群对应于给定输入的不同部分;
利用所述参数化模型,基于所述潜在空间中的所述维度数据来预测输出;
利用所述参数化模型,将所述潜在空间中的所述维度数据变换为与所述集群中的一个或多个相对应的给定输入的恢复版本;以及
基于所述集群、所述输出和/或所述给定输入的所述恢复版本,调整所述参数化模型的一个或多个参数,以增大所述参数化模型预测的确定性。
2.根据权利要求1所述的方法,还包括:确定所述潜在空间中的所述维度数据的哪些集群或集群的部分对应于与所述维度数据的其他集群或者集群的其他部分相比具有更高的方差的预测输出。
3.根据权利要求2所述的方法,其中确定所述潜在空间中的所述维度数据的哪些集群或者集群的部分对应于具有更高方差的预测输出有助于选择附加训练数据。
4.根据权利要求2或3所述的方法,其中调整包括:通过增加所述潜在空间的维度来使所述参数化模型更具描述性,和/或利用与关联于所述更高方差的经确定的集群或集群部分中的一个或多个相关联的更多样化的训练数据,来训练所述参数化模型。
5.根据权利要求4所述的方法,其中通过增加所述潜在空间的所述维度来使所述参数化模型更具描述性,和/或利用与关联于所述更高方差的经确定的集群或集群部分中的一个或多个相关联的更多样化的训练数据,来训练所述参数化模型包括:
相对于先前的训练材料,使用与所述集群中的一个或多个相关的更多样化的图像和更多样化的数据作为输入,以训练所述参数化模型;和/或
使用更多维度对向量进行编码,并且在所述参数化模型中使用更多编码层。
6.根据权利要求1至5中任一项所述的方法,还包括训练所述参数化模型,所述训练包括:
对所述潜在空间中的所述维度数据进行采样,并且针对所述潜在空间中的每个样本:
预测多个输出实现,以针对所述潜在空间中的给定维度数据生成输出实现分布;以及
确定与所述多个输出实现的分布相关联的不确定性;以及基于所述给定维度数据和经确定的不确定性来训练所述参数化模型。
7.根据权利要求6所述的方法,还包括:确定所述潜在空间中的所述维度数据的哪些集群对应于与所述维度数据的其他集群相比具有更高的方差的预测输出实现,以及从对应于更高方差的所述集群中进行采样。
8.根据权利要求1至7中任一项所述的方法,其中所述潜在空间中的各个集群对应于所述维度数据中的不同编码图案。
9.根据权利要求8所述的方法,其中调整所述参数化模型的所述一个或多个参数包括:确定单独的每个图案的信息,所述单独的每个图案的信息指示哪些图案类型针对所述参数化模型是众所周知的并且导致相对一致的预测,以及指示哪些图案类型是所述参数化模型不熟悉的并且导致相对可变的预测。
10.根据权利要求9所述的方法,其中所述单独的每个图案的信息包括方差、潜在空间覆盖范围和/或分布。
11.根据权利要求1至10中任一项所述的方法,其中调整所述参数化模型的所述一个或多个参数包括:调整所述参数化模型的维度和/或所述参数化模型的一层或多层的权重。
12.根据权利要求1至11中任一项所述的方法,还包括:基于所述集群、所述输出和/或所述输入的所述恢复版本来调整所述参数化模型,以减小所述参数化模型预测的方差和/或增强针对新图案的所述参数化模型预测。
13.根据权利要求1至12中任一项所述的方法,还包括:
识别所述潜在空间中的兴趣点,其中所述兴趣点包括与所述潜在空间中的其他点相比具有相对较高的方差或不确定性的点、不位于集群内的点或者位于笛卡尔距离处的点中的一个或多个,所述笛卡尔距离与所述潜在空间中的其他点和/或其他集群之间的笛卡尔距离相比与所述潜在空间中的一个或多个其他点和/或集群相距相对较远;以及
使用所述兴趣点、所述集群、所述给定输入的所述恢复版本和/或所述输出来评估所述参数化模型的性能。
14.根据权利要求1至13中任一项所述的方法,其中所述参数化模型包括变分编码器-译码器架构;
其中所述潜在空间中的所述维度数据由所述编码器-译码器架构的编码器编码,所述输出是利用所述编码器-译码器架构的译码器基于所述潜在空间中的所述维度数据来被预测的,并且所述潜在空间中的所述维度数据由所述编码器-译码器架构的第二译码器变换为所述给定输入的所述恢复版本;并且
其中所述方法还包括:用概率潜在空间训练所述变分编码器-译码器架构,所述概率潜在空间在输出空间中生成实现。
15.一种在其上具有指令的非瞬态计算机可读介质,所述指令在由计算机执行时实施权利要求1至14中任一项的所述方法。
CN202080062551.4A 2019-09-06 2020-08-12 用于增加参数化模型预测的确定性的方法 Pending CN114341885A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP19195954.3A EP3789923A1 (en) 2019-09-06 2019-09-06 Method for increasing certainty in parameterized model predictions
EP19195954.3 2019-09-06
EP19210026.1 2019-11-19
EP19210026 2019-11-19
EP20188310 2020-07-29
EP20188310.5 2020-07-29
PCT/EP2020/072593 WO2021043551A1 (en) 2019-09-06 2020-08-12 Method for increasing certainty in parameterized model predictions

Publications (1)

Publication Number Publication Date
CN114341885A true CN114341885A (zh) 2022-04-12

Family

ID=71994524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080062551.4A Pending CN114341885A (zh) 2019-09-06 2020-08-12 用于增加参数化模型预测的确定性的方法

Country Status (5)

Country Link
US (1) US20220335290A1 (zh)
KR (1) KR20220038501A (zh)
CN (1) CN114341885A (zh)
TW (1) TWI757855B (zh)
WO (1) WO2021043551A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11380516B2 (en) 2017-04-13 2022-07-05 Fractilia, Llc System and method for generating and analyzing roughness measurements and their use for process monitoring and control
US20210064977A1 (en) * 2019-08-29 2021-03-04 Synopsys, Inc. Neural network based mask synthesis for integrated circuits
EP4075340A1 (en) * 2021-04-15 2022-10-19 ASML Netherlands B.V. Modular autoencoder model for manufacturing process parameter estimation
EP4075341A1 (en) * 2021-04-18 2022-10-19 ASML Netherlands B.V. Modular autoencoder model for manufacturing process parameter estimation
EP4075339A1 (en) * 2021-04-15 2022-10-19 ASML Netherlands B.V. Modular autoencoder model for manufacturing process parameter estimation
EP4060408A1 (en) * 2021-03-16 2022-09-21 ASML Netherlands B.V. Method and system for predicting process information with a parameterized model
WO2023030807A1 (en) * 2021-09-02 2023-03-09 Asml Netherlands B.V. Method of evaluating selected set of patterns
JP2024508077A (ja) * 2021-09-10 2024-02-22 フラクティリア,エルエルシー 確率的プロセスウィンドウの検出

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5229872A (en) 1992-01-21 1993-07-20 Hughes Aircraft Company Exposure device including an electrically aligned electronic mask for micropatterning
WO1997033205A1 (en) 1996-03-06 1997-09-12 Philips Electronics N.V. Differential interferometer system and lithographic step-and-scan apparatus provided with such a system
US7055126B2 (en) * 2003-10-27 2006-05-30 International Business Machines Corporation Renesting interaction map into design for efficient long range calculations
EP1920369A2 (en) 2005-08-08 2008-05-14 Brion Technologies, Inc. System and method for creating a focus-exposure model of a lithography process
US7695876B2 (en) 2005-08-31 2010-04-13 Brion Technologies, Inc. Method for identifying and using process window signature patterns for lithography process control
US7617477B2 (en) 2005-09-09 2009-11-10 Brion Technologies, Inc. Method for selecting and optimizing exposure tool using an individual mask error model
US7694267B1 (en) 2006-02-03 2010-04-06 Brion Technologies, Inc. Method for process window optimized optical proximity correction
US7882480B2 (en) 2007-06-04 2011-02-01 Asml Netherlands B.V. System and method for model-based sub-resolution assist feature generation
US7707538B2 (en) 2007-06-15 2010-04-27 Brion Technologies, Inc. Multivariable solver for optical proximity correction
US20090157630A1 (en) 2007-10-26 2009-06-18 Max Yuan Method of extracting data and recommending and generating visual displays
NL1036189A1 (nl) 2007-12-05 2009-06-08 Brion Tech Inc Methods and System for Lithography Process Window Simulation.
NL2003702A (en) * 2008-11-10 2010-05-11 Brion Tech Inc Pattern selection for lithographic model calibration.
NL2003699A (en) 2008-12-18 2010-06-21 Brion Tech Inc Method and system for lithography process-window-maximixing optical proximity correction.
US9588439B1 (en) * 2010-12-21 2017-03-07 Asml Netherlands B.V. Information matrix creation and calibration test pattern selection based on computational lithography model parameters
CN103106331B (zh) * 2012-12-17 2015-08-05 清华大学 基于降维和增量式极限学习机的光刻线宽智能预测方法
US9255877B2 (en) * 2013-05-21 2016-02-09 Kla-Tencor Corporation Metrology system optimization for parameter tracking
WO2017012840A1 (en) * 2015-07-17 2017-01-26 Asml Netherlands B.V. Methods and apparatus for simulating interaction of radiation with structures, metrology methods and apparatus, device manufacturing method
US10599046B2 (en) * 2017-06-02 2020-03-24 Samsung Electronics Co., Ltd. Method, a non-transitory computer-readable medium, and/or an apparatus for determining whether to order a mask structure

Also Published As

Publication number Publication date
US20220335290A1 (en) 2022-10-20
WO2021043551A1 (en) 2021-03-11
KR20220038501A (ko) 2022-03-28
TW202117575A (zh) 2021-05-01
TWI757855B (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
TWI757663B (zh) 降低於機器學習模型預測中之不確定性之方法
US20210271172A1 (en) Methods of determining process models by machine learning
TWI655553B (zh) 用於微影程序的電腦實施方法及電腦程式產品
TWI757855B (zh) 用於在參數化模型預測中提高確定性的方法
CN114096917B (zh) 用于减小模型预测不确定性的模型校准的预测数据选择
EP3789923A1 (en) Method for increasing certainty in parameterized model predictions
US20230107556A1 (en) Machine learning based subresolution assist feature placement
US20230267711A1 (en) Apparatus and method for selecting informative patterns for training machine learning models
TWI667553B (zh) 判定圖案之特性之方法
EP3660744A1 (en) Method for decreasing uncertainty in machine learning model predictions
JP7515626B2 (ja) 収差影響システム、モデル、及び製造プロセス
US20240184213A1 (en) Method of pattern selection for a semiconductor manufacturing related process
WO2023088649A1 (en) Determining an etch effect based on an etch bias direction
WO2023084063A1 (en) Generating augmented data to train machine learning models to preserve physical trends
CN115729052A (zh) 记录有指令的非瞬态计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination