TW202036387A

TW202036387A - 降低於機器學習模型預測中之不確定性之方法

Info

Publication number: TW202036387A
Application number: TW108143353A
Authority: TW
Inventors: 史考特安德森米德雷布魯克斯; 可拉吉馬可斯傑拉度馬堤司瑪麗亞凡; 馬克辛帕薩瑞可
Original assignee: 荷蘭商Ａｓｍｌ荷蘭公司
Priority date: 2018-11-30
Filing date: 2019-11-28
Publication date: 2020-10-01
Also published as: TWI757663B; JP7209835B2; KR20210082247A; US20210286270A1; CN113168556A; WO2020109074A1; JP2022510591A

Abstract

本文中描述一種用於量化參數化(例如機器學習)模型預測中之不確定性之方法。該方法包含使一參數化模型針對一給定輸入自該參數化模型預測多個後驗分佈。該多個後驗分佈包含若干分佈之一分佈。該方法包含藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的一可變性；及使用該經預測多個後驗分佈中之該經判定之可變性以量化該等參數化模型預測中之不確定性。該參數化模型包含編碼器-解碼器架構。該方法包含使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以預測晶圓幾何形狀、疊對及/或其他資訊而作為一半導體製造程序之部分。

Description

降低於機器學習模型預測中之不確定性之方法

本文中之描述大體而言係關於光罩製造及圖案化程序。更特定言之，該描述係關於一種用於判定及/或降低參數化(例如機器學習)模型預測中之不確定性之裝置及方法。

微影投影裝置可用於(例如)積體電路(IC)之製造中。在此狀況下，圖案化器件(例如光罩)可含有或提供對應於IC(「設計佈局」)之個別層之圖案，且可藉由諸如經由圖案化器件上之圖案來輻照已經塗佈有輻射敏感材料(「抗蝕劑」)層之基板(例如矽晶圓)上之目標部分(例如包含一或多個晶粒)之方法而將此圖案轉印至該目標部分上。一般而言，單一基板含有複數個鄰近目標部分，圖案係由微影投影裝置順次地轉印至該複數個鄰近目標部分，一次一個目標部分。在一種類型之微影投影裝置中，在一個操作中將整個圖案化器件上之圖案轉印至一個目標部分上。此裝置通常被稱作步進器。在通常被稱作步進掃描裝置(step-and-scan apparatus)之替代裝置中，投影光束在給定參考方向(「掃描」方向)上遍及圖案化器件進行掃描，同時平行或反平行於此參考方向而同步地移動基板。圖案化器件上之圖案之不同部分逐漸地轉印至一個目標部分。一般而言，由於微影投影裝置將具有縮減比率M (例如4)，故基板被移動之速度F將為投影光束掃描圖案化器件之速度的1/M倍。可例如自以引用方式併入本文中之US 6,046,792搜集到關於如本文中所描述之微影器件的更多資訊。

在將圖案自圖案化器件轉印至基板之前，基板可經歷各種工序，諸如，上底漆、抗蝕劑塗佈及軟烘烤。在曝光之後，基板可經受其他工序(「曝光後工序」)，諸如曝光後烘烤(PEB)、顯影、硬烘烤，及經轉印圖案之量測/檢測。此工序陣列係用作製造一器件(例如IC)之個別層的基礎。基板可接著經歷各種程序，諸如，蝕刻、離子植入(摻雜)、金屬化、氧化、化學-機械拋光等等，該等程序皆意欲精整器件之個別層。若在器件中需要若干層，則針對每一層來重複整個工序或其變體。最終，在基板上之每一目標部分中將存在一器件。接著藉由諸如切塊或鋸切之技術來使此等器件彼此分離，據此，可將個別器件安裝於載體上、連接至銷釘，等等。

因此，製造諸如半導體器件之器件通常涉及使用多個製作程序來處理基板(例如半導體晶圓)以形成該等器件之各種特徵及多個層。通常使用例如沈積、微影、蝕刻、化學機械拋光及離子植入來製造及處理此等層及特徵。可在一基板上之複數個晶粒上製作多個器件，且接著將其分離成個別器件。此器件製造程序可被認為是圖案化程序。圖案化程序涉及使用微影裝置中之圖案化器件進行圖案化步驟，諸如光學及/或奈米壓印微影，以將圖案化器件上之圖案轉印至基板，且圖案化程序通常但視情況涉及一或多個相關圖案處理步驟，諸如藉由顯影裝置進行抗蝕劑顯影、使用烘烤工具來烘烤基板、使用蝕刻裝置而使用圖案進行蝕刻等。另外，通常在圖案化程序中涉及一或多個度量衡程序。

如所提及，微影為在諸如IC之器件之製造時的中心步驟，其中形成於基板上之圖案界定器件之功能元件，諸如微處理器、記憶體晶片等。相似微影技術亦用於形成平板顯示器、微機電系統(MEMS)及其他器件。

隨著半導體製造程序繼續進步，幾十年來，功能元件之尺寸已不斷地減小，而每器件的諸如電晶體之功能元件之量已在穩固地增加，此遵循通常被稱作「莫耳定律(Moore's law)」之趨勢。在目前先進技術下，使用微影投影裝置來製造器件之層，該等微影投影裝置使用來自深紫外線照明源之照明將設計佈局投影至基板上，從而產生尺寸充分地低於100奈米、亦即小於來自照明源(例如193奈米照明源)之輻射之波長之一半的個別功能元件。

供印刷尺寸小於微影投影裝置之經典解析度極限之特徵的此程序根據解析度公式CD=k₁ ×λ/NA而通常被稱為低k₁ 微影，其中λ為所使用輻射之波長(當前在大多數狀況下為248奈米或193奈米)，NA為微影投影裝置中之投影光學件之數值孔徑，CD為「臨界尺寸」(通常為所印刷之最小特徵大小)，且k₁ 為經驗解析度因數。一般而言，k₁ 愈小，則在基板上再生類似於由設計者規劃之形狀及尺寸以便達成特定電功能性及效能的圖案變得愈困難。為了克服此等困難，將複雜微調步驟應用至微影投影裝置、設計佈局或圖案化器件。此等步驟包括(例如但不限於) NA及光學相干設定之最佳化、自訂照明方案、相移圖案化器件之使用、設計佈局中之光學近接校正(OPC，有時亦被稱作「光學及程序校正」)，或通常被定義為「解析度增強技術」(RET)之其他方法。如本文所使用之術語「投影光學件」應被廣泛地解譯為涵蓋各種類型之光學系統，包括例如折射光學件、反射光學件、孔徑及反射折射光學件。術語「投影光學件」亦可包括用於集體地或單個地導向、塑形或控制投影輻射光束的根據此等設計類型中之任一者而操作之組件。術語「投影光學件」可包括微影投影裝置中之任何光學組件，而不論光學組件位於微影投影裝置之光學路徑上之何處。投影光學件可包括用於在來自源之輻射通過圖案化器件之前塑形、調整及/或投影該輻射的光學組件，及/或用於在輻射通過圖案化器件之後塑形、調整及/或投影該輻射的光學組件。投影光學件通常排除源及圖案化器件。

根據一實施例，提供一種用於調整一光微影裝置之方法。該方法包含使一機器學習模型針對一給定輸入自該機器學習模型預測多個後驗分佈。該多個後驗分佈包含若干分佈之一分佈。該方法包含藉由自若干分佈之該分佈判定針對該給定輸入之該經預測多個後驗分佈的一可變性。該方法包含使用該經預測多個後驗分佈中之該經判定可變性以量化該等機器學習模型預測中之不確定性。該方法包含調整該機器學習模型之一或多個參數以減少該等機器學習模型預測中之該不確定性。該方法包含基於基於該給定輸入自該經調整機器學習模型進行之預測來判定一或多個光微影程序參數；及基於該一或多個經判定光微影程序參數來調整該光微影裝置。

在一實施例中，該機器學習模型之該一或多個參數包含該機器學習模型之該一或多個參數之一或多個權重。

在一實施例中，來自該經調整之機器學習模型之該等預測包含一經預測疊對或經預測晶圓幾何形狀中之一或多者。

在一實施例中，該一或多個經判定之光微影程序參數包含一光罩設計、一光瞳形狀、一劑量或一焦點中之一或多者。

在一實施例中，該一或多個經判定之光微影程序參數包含該光罩設計，且基於該光罩設計調整該光微影裝置包含將該光罩設計自一第一光罩設計改變至一第二光罩設計。

在一實施例中，該一或多個經判定之光微影程序參數包含該光瞳形狀，且基於該光瞳形狀調整該光微影裝置包含將該光瞳形狀自一第一光瞳形狀改變至一第二光瞳形狀。

在一實施例中，該一或多個經判定之光微影程序參數包含該劑量，且基於該劑量調整該光微影裝置包含將該劑量自一第一劑量改變至一第二劑量。

在一實施例中，該一或多個經判定之光微影程序參數包含該焦點，且基於該焦點調整該光微影裝置包含將該焦點自一第一焦點改變至一第二焦點。

在一實施例中，使該機器學習模型預測該多個後驗分佈包含使該機器學習模型使用參數丟棄來產生若干分佈之該分佈。

在一實施例中，使該機器學習模型針對一給定輸入自該機器學習模型預測該多個後驗分佈包含：使該機器學習模型預測對應於一第一後驗分佈P_Θ (z|x)之多個後驗分佈之一第一集合，及對應於一第二後驗分佈P_ϕ (y|z)之多個後驗分佈之一第二集合；藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的該可變性包含藉由自針對該第一集合及該第二集合之若干分佈之該分佈進行取樣來判定針對該給定輸入之經預測多個後驗分佈之該第一集合及該第二集合的該可變性；且使用該經預測多個後驗分佈中之該經判定可變性以量化該等機器學習模型預測中之該不確定性包含使用經預測多個後驗分佈之該第一集合及該第二集合中的該經判定可變性以量化該等機器學習模型預測中之該不確定性。

在一實施例中，該給定輸入包含一影像、一剪輯、一經編碼影像、一經編碼剪輯或來自該機器學習模型之一先前層之資料中的一或多者。

在一實施例中，該方法進一步包含使用該經預測多個後驗分佈中之該經判定之可變性及/或該經量化之不確定性以調整該機器學習模型，以藉由使該機器學習模型更具描述性或包括更多樣化訓練資料來降低該機器學習模型之該不確定性。

在一實施例中，取樣包含自若干分佈之該分佈隨機地選擇分佈，其中該取樣係高斯或非高斯的。

在一實施例中，判定該可變性包含運用一或多個統計運算量化可變性，該一或多個統計運算包括一平均值、一矩、偏度、一標準偏差、一方差、峰度或協方差中之一或多者。

在一實施例中，該機器學習模型之該不確定性係與該機器學習模型之該一或多個參數之權重的一不確定性以及與該機器學習模型相關聯之一潛在空間之一大小及描述性相關。

在一實施例中，調整該機器學習模型以降低該機器學習模型之該不確定性包含增加一訓練集大小及/或新增與該機器學習模型相關聯的一潛在空間之一維度。

在一實施例中，增加一訓練集大小及/或新增該潛在空間之一維度包含使用相對於先前訓練材料更多樣化的影像、更多樣化的資料，及額外剪輯作為輸入以訓練該機器學習模型；及使用更多維度以用於編碼向量，及在該機器學習模型中使用更多編碼層。

在一實施例中，使用該經預測多個後驗分佈中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性包含向與該機器學習模型相關聯之一潛在空間新增額外維度。

在一實施例中，使用該經預測多個後驗分佈中之該經判定之可變性以調整該機器學習模型之該一或多個參數從而降低該機器學習模型之該不確定性包含運用額外及更多樣化之訓練樣本來訓練該機器學習模型。

根據另一實施例，提供一種用於量化參數化模型預測中之不確定性之方法。該方法包含使一參數化模型針對一給定輸入自該參數化模型預測多個後驗分佈。該多個後驗分佈包含若干分佈之一分佈。該方法包含藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的一可變性；及使用該經預測多個後驗分佈中之該經判定之可變性以量化該等參數化模型預測中之不確定性。

在一實施例中，該參數化模型係一機器學習模型。

在一實施例中，使該參數化模型預測該多個後驗分佈包含使該參數化模型使用參數丟棄(parameter dropout)來產生若干分佈之該分佈。

在一實施例中，使該參數化模型針對一給定輸入自該參數化模型預測該多個後驗分佈包含：使該參數化模型預測對應於一第一後驗分佈P_Θ (z|x)之多個後驗分佈之一第一集合，及對應於一第二後驗分佈P_ϕ (y|z)之多個後驗分佈之一第二集合；藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的該可變性包含藉由自針對該第一集合及該第二集合之若干分佈之該分佈進行取樣來判定針對該給定輸入之經預測多個後驗分佈之該第一集合及該第二集合的該可變性；且使用該經預測多個後驗分佈中之該經判定可變性以量化該等參數化模型預測中之該不確定性包含使用經預測多個後驗分佈之該第一集合及該第二集合中的該經判定可變性以量化該等參數化模型預測中之該不確定性。

在一實施例中，該給定輸入包含一影像、一剪輯、一經編碼影像、一經編碼剪輯或來自該參數化模型之一先前層之資料中的一或多者。

在一實施例中，該方法進一步包含使用該經預測多個後驗分佈中之該經判定之可變性及/或該經量化之不確定性以調整該參數化模型，以藉由使該參數化模型更具描述性或包括更多樣化訓練資料來降低該參數化模型之該不確定性。

在一實施例中，該參數化模型包含編碼器-解碼器架構。

在一實施例中，該編碼器-解碼器架構包含可變編碼器-解碼器架構，且該方法進一步包含運用一機率性潛在空間訓練該可變編碼器-解碼器架構，該機率性潛在空間在一輸出空間中產生實現。

在一實施例中，該潛在空間包含一低維編碼。

在一實施例中，該方法進一步包含針對該給定輸入使用該編碼器-解碼器架構之一編碼器部分來判定一潛在變數之一條件機率。

在一實施例中，該方法進一步包含使用該編碼器-解碼器架構之一解碼器部分來判定一條件機率。

在一實施例中，該方法進一步包含自使用該編碼器-解碼器架構之該編碼器部分所判定的該潛在變數之該條件機率進行取樣，且針對每一樣本，使用該編碼器-解碼器架構之該解碼器部分預測一輸出。

在一實施例中，該參數化模型之該不確定性係與該參數化模型之參數之權重的一不確定性以及該潛在空間之一大小及描述性相關。

在一實施例中，該參數化模型之該不確定性係與該參數化模型之參數之權重的該不確定性以及該潛在空間之該大小及描述性相關，使得該等權重中之不確定性表現為該輸出中之不確定性，從而導致輸出方差增大。

在一實施例中，使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性包含增加一訓練集大小及/或新增該潛在空間之一維度。

在一實施例中，增加一訓練集大小及/或新增該潛在空間之一維度包含使用相對於先前訓練材料更多樣化的影像、更多樣化的資料，及額外剪輯作為輸入以訓練該參數化模型；及使用更多維度以用於編碼向量，及在該參數化模型中使用更多編碼層。

在一實施例中，使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性包含向該潛在空間新增額外維度。

在一實施例中，使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性包含運用額外及更多樣化之訓練樣本來訓練該參數化模型。

在一實施例中，該等額外及更多樣化之訓練樣本包含相對於先前訓練材料之更多樣化的影像、更多樣化的資料，及額外剪輯。

在一實施例中，該方法進一步包含使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以預測晶圓幾何形狀而作為一半導體製造程序之部分。

在一實施例中，使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以預測晶圓幾何形狀而作為一半導體製造程序之部分包含：使用相對於先前訓練材料更多樣化的影像、更多樣化的資料及額外剪輯作為輸入以訓練該參數化模型；及使用更多維度以用於編碼向量，及在該參數化模型中使用更多編碼層，該等更多樣化的影像、更多樣化的資料、額外剪輯、更多維度及更多編碼層係基於該經判定之可變性而判定。

在一實施例中，該方法進一步包含使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以產生一經預測疊對而作為一半導體製造程序之部分。

在一實施例中，使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以產生一經預測疊對而作為一半導體製造程序之部分包含：使用相對於先前訓練材料更多樣化的影像、更多樣化的資料及額外剪輯作為輸入以訓練該參數化模型；及使用更多維度以用於編碼向量，及在該參數化模型中使用更多編碼層，該等更多樣化的影像、更多樣化的資料、額外剪輯、更多維度及更多編碼層係基於該經判定之可變性而判定。

根據另一實施例，提供一種電腦程式產品，其包含其上記錄有指令之一非暫時性電腦可讀媒體，該等指令在由一電腦執行時實施以上所描述之該等方法中之任一者。

對於先前機器學習模型，藉由機器學習模型進行之預測之確定性並不清楚。亦即，在給出輸入的情況下，並不清楚先前機器學習模型是否產生準確且一致的輸出。產生準確且一致的輸出之機器學習模型在積體電路製造程序中係重要的。作為非限制性實例，當自光罩佈局設計產生光罩佈局時，關於機器學習模型之預測之不確定性可產生所提議光罩佈局中之不確定性。此等不確定性可導致關於例如晶圓之最終功能性的問題。每當使用機器學習模型以模型化積體電路製造程序中之個別操作或作出關於該等個別操作之預測時，都可將更多不確定性引入該程序中。然而，迄今為止，不存在用以判定來自模型之輸出中之可變性(或不確定性)的方法。

為了處理先前參數化(例如機器學習)模型之此等及其他缺點，本發明方法及系統包括使用編碼器-解碼器架構之模型。在此架構中間(例如中間層)中，本發明模型規劃低維編碼(例如潛在空間)，其將資訊囊封於至模型之輸入(例如影像、張量及/或其他輸入)中。使用變分推斷技術，編碼器以輸入為條件判定潛在向量之後驗機率分佈。在一些實施例中，該模型經組態以產生針對給定輸入之若干分佈之分佈(例如使用參數丟棄方法)。該模型以給定輸入為條件，自若干分佈之此分佈進行取樣。該模型可判定橫越經取樣分佈之變化。在取樣之後，該模型解碼樣本至輸出空間中。輸出之可變性及/或經取樣分佈中之變化定義模型之不確定性，其包括模型參數(權重)之不確定性以及潛在空間之簡化程度(小的及描述性的)。

儘管在本文中可特定地參考IC製造，但應明確理解，本文之描述具有許多其他可能應用。舉例而言，本文中之描述可用於製造整合式光學系統、用於磁疇記憶體之導引及偵測圖案、液晶顯示面板、薄膜磁頭等。在此等替代應用中，熟習此項技術者應瞭解，在此等替代應用之內容背景中，本文中對術語「倍縮光罩」、「晶圓」或「晶粒」之任何使用應被認為分別可與更一般之術語「光罩」、「基板」及「目標部分」互換。另外，應注意，本文中所描述之方法在多樣化領域中可具有許多其他可能的應用，該等領域諸如，語言處理系統、自動駕駛汽車、醫療成像及診斷、語意分段、去雜訊、晶片設計、電子設計自動化等。本發明方法可應用於其中量化機器學習模型預測中之不確定性係有利的任何領域中。

在本發明之文件中，術語「輻射」及「光束」用以涵蓋所有類型之電磁輻射，包括紫外線輻射(例如具有為365奈米、248奈米、193奈米、157奈米或126奈米之波長)及極紫外線輻射(EUV，例如具有在約5奈米至100奈米之範圍內之波長)。

圖案化器件可包含或可形成一或多個設計佈局。可利用電腦輔助設計(computer - aided design; CAD)程式來產生設計佈局。此程序常常被稱作電子設計自動化(EDA)。大多數CAD程式遵循一預定設計規則集合，以便產生功能設計佈局/圖案化器件。基於處理及設計限制而設定此等規則。舉例而言，設計規則定義器件(諸如閘、電容器等)或互連線之間的空間容許度，以確保器件或線彼此不會以非所要方式相互作用。設計規則限制中之一或多者可被稱作「臨界尺寸」(CD)。器件之臨界尺寸可被定義為線或孔之最小寬度或兩條線或兩個孔之間的最小空間。因此，CD調節經設計器件之總大小及密度。器件製作中之目標中之一者係在基板上如實地再生原始設計意圖(經由圖案化器件)。

本文中所使用之術語「光罩」或「圖案化器件」可被廣泛地解譯為係指可用以向入射輻射光束賦予經圖案化橫截面之通用圖案化器件，該經圖案化橫截面對應於待在基板之目標部分中產生之圖案。在此內容背景中，亦可使用術語「光閥」。除經典光罩(透射或反射；二元、相移、混合式等)以外，其他此類圖案化器件之實例包括可程式化鏡面陣列。此器件之實例為具有黏彈性控制層及反射表面之矩陣可定址表面。此裝置所隱含之基本原理為(例如)：反射表面之經定址區域將入射輻射反射為繞射輻射，而未經定址區域將入射輻射反射為非繞射輻射。在使用適當濾光器的情況下，可自反射光束濾出該非繞射輻射，從而僅留下繞射輻射；以此方式，光束根據矩陣可定址表面之定址圖案而變得圖案化。可使用合適電子構件來執行所需矩陣定址。其他此類圖案化器件之實例亦包括可程式化LCD陣列。以引用方式併入本文中之美國專利第5,229,872號中給出此構造之實例。

作為簡要介紹，圖1說明例示性微影投影裝置10A。主要組件為：輻射源12A，其可為深紫外線(DUV)準分子雷射源或包括極紫外線(EUV)源的其他類型之源(如上文所論述，微影投影裝置自身無需具有輻射源)；照明光學件，其例如定義部分相干性(被表示為均方偏差)且可包括塑形來自源12A之輻射的光學件14A、16Aa及16Ab；圖案化器件18A；及透射光學件16Ac，其將圖案化器件圖案之影像投影至基板平面22A上。在投影光學件之光瞳平面處的可調整濾光器或孔徑20A可限定照射於基板平面22A上之光束角度之範圍，其中最大可能角度界定投影光學件之數值孔徑NA= n sin(Θ_max )，其中n為基板與投影光學件之最後元件之間的介質之折射率，且Θ_max 為自投影光學件射出的仍可照射於基板平面22A上之光束的最大角度。

在微影投影裝置中，源將照明(亦即輻射)提供至圖案化器件，且投影光學件經由圖案化器件將照明導向至基板上且塑形該照明。投影光學件可包括組件14A、16Aa、16Ab及16Ac中之至少一些。空中影像(AI)為基板位階處之輻射強度分佈。可使用抗蝕劑模型以自空中影像演算抗蝕劑影像，可在全部揭示內容據此以引用方式併入之美國專利申請公開案第US 2009-0157630號中找到此情形之實例。抗蝕劑模型僅與抗蝕劑層之屬性(例如，在曝光、曝光後烘烤(PEB)及顯影期間發生的化學程序之效應)相關。微影投影裝置之光學屬性(例如，照明、圖案化器件及投影光學件之屬性)規定空中影像且可被定義於光學模型中。由於可改變用於微影投影裝置中之圖案化器件，故需要使圖案化器件之光學屬性與至少包括源及投影光學件的微影投影裝置之其餘部分之光學屬性分離。美國專利申請公開案第US 2008-0301620號、第2007-0050749號、第2007-0031745號、第2008-0309897號、第2010-0162197號及第2010-0180251號中描述了用以將設計佈局變換成各種微影影像(例如空中影像、抗蝕劑影像等)、使用技術及模型來應用OPC且評估效能(例如依據程序窗)的彼等技術及模型之細節，該等公開案中之每一者之全部揭示內容特此係以引用方式併入。

常常需要能夠以計算方式判定圖案化程序將如何在基板上產生所要圖案。因此，可提供模擬以模擬程序之一或多個部分。舉例而言，需要能夠模擬在抗蝕劑顯影之後將圖案化器件圖案轉印至基板之抗蝕劑層上之微影程序以及彼抗蝕劑層中之所產生之圖案。

圖2中說明用於模擬微影投影裝置中之微影的例示性流程圖。照明模型31表示照明之光學特性(包括輻射強度分佈及/或相位分佈)。投影光學件模型32表示投影光學件之光學特性(包括由投影光學件引起的輻射強度分佈及/或相位分佈之改變)。設計佈局模型35表示設計佈局之光學特性(包括由給定設計佈局造成的輻射強度分佈及/或相位分佈之改變)，該設計佈局為在圖案化器件上或由圖案化器件形成之特徵之配置的表示。可使用照明模型31、投影光學件模型32及設計佈局模型35來模擬空中影像36。可使用抗蝕劑模型37而自空中影像36模擬抗蝕劑影像38。微影之模擬可(例如)預測抗蝕劑影像中之輪廓及/或CD。

更具體言之，照明模型31可表示照明之光學特性，該等光學特性包括但不限於NA-均方偏差(σ)設定，以及任何特定照明形狀(例如，離軸照明，諸如，環形、四極、偶極等)。投影光學件模型32可表示投影光學件之光學特性，包括例如像差、失真、折射率、實體大小或尺寸等。設計佈局模型35亦可表示實體圖案化器件之一或多個物理屬性，如例如全文以引用方式併入之美國專利第7,587,704號中所描述。與微影投影裝置相關聯之光學屬性(例如照明、圖案化器件及投影光學件之屬性)規定空中影像。由於微影投影裝置中使用之圖案化器件可改變，故需要將圖案化器件之光學屬性與至少包括照明及投影光學件之微影投影裝置之其餘部分的光學屬性分離(因此設計佈局模型35)。

可使用抗蝕劑模型37以自空中影像演算抗蝕劑影像，可在全文特此以引用方式併入之美國專利第8,200,468號中找到此情形之實例。抗蝕劑模型通常與抗蝕劑層之屬性(例如，在曝光、曝光後烘烤及/或顯影期間發生的化學程序之效應)有關。

模擬之目標係準確地預測(例如)邊緣置放、空中影像強度斜率及/或CD，可接著將該等邊緣置放、空中影像強度斜率及/或CD與預期設計進行比較。預期設計通常被定義為預OPC設計佈局，其可以諸如GDSII、OASIS或其他檔案格式之標準化數位檔案格式而提供。

自此設計佈局，可識別被稱作「剪輯」之一或多個部分。在一實施例中，提取剪輯集合，其表示設計佈局中之複雜圖案(通常約為50個至1000個剪輯，但可使用任何數目個剪輯)。如熟習此項技術者應瞭解，此等圖案或剪輯表示設計之小部分(例如，電路、格胞等)，且該等剪輯尤其表示需要特定關注及/或驗證之小部分。換言之，剪輯可為設計佈局之部分，或可相似或具有臨界特徵係藉由經驗而識別(包括由客戶提供之剪輯)、藉由試誤法而識別或藉由執行全晶片模擬而識別的設計佈局之部分的相似行為。剪輯常常含有一或多個測試圖案或量規圖案。可由客戶基於設計佈局中需要特定影像最佳化之已知臨界特徵區域而先驗地提供初始較大剪輯集合。替代地，在另一實施例中，可藉由使用識別臨界特徵區域之某種自動化(諸如，機器視覺)或手動演算法而自整個設計佈局提取初始較大剪輯集合。

舉例而言，模擬及模型化可用以組態圖案化器件圖案之一或多個特徵(例如執行光學近接校正)、照明之一或多個特徵(例如改變照明之空間/角強度分佈之一或多個特性，諸如改變形狀)，及/或投影光學件之一或多個特徵(例如數值孔徑等)。此組態通常可分別被稱作光罩最佳化、源最佳化及投影最佳化。可獨立地執行或以不同組合形式組合此最佳化。一個此類實例為源-光罩最佳化(source-mask optimization，SMO)，其涉及組態圖案化器件圖案之一或多個特徵連同照明之一或多個特徵。最佳化技術可聚焦於剪輯中之一或多者。最佳化可使用本文中所描述之機器學習模型以預測各種參數(包括影像等)之值。

在一些實施例中，可將系統之最佳化程序表示為成本函數。最佳化程序可包含尋找系統之最小化成本函數之一組參數(設計變數、程序變數等)。成本函數可取決於最佳化之目標而具有任何合適形式。舉例而言，成本函數可為系統之某些特性(評估點)相對於此等特性之預期值(例如理想值)之偏差的加權均方根(RMS)。成本函數亦可為此等偏差(亦即，最差偏差)之最大值。術語「評估點」應被廣泛地解譯為包括系統或製作方法之任何特性。歸因於系統及/或方法之實施的實務性，系統之設計及/或程序變數可經限制至有限範圍及/或可相互相依。在微影投影裝置之狀況下，約束常常與硬體之物理屬性及特性(諸如可調諧範圍及/或圖案化器件可製造性設計規則)相關聯。評估點可包括基板上之抗蝕劑影像上之實體點，以及非物理特性，諸如(例如)劑量及焦點。

在一些實施例中，照明模型31、投影光學件模型32、設計佈局模型35、抗蝕劑模型37、SMO模型及/或與積體電路製造程序相關聯及/或在積體電路製造程序中所包括之其他模型可為執行本文中所描述之方法之操作的經驗模型。該經驗模型可基於各種輸入(例如，光罩或晶圓影像之一或多個特性、設計佈局之一或多個特性、圖案化器件之一或多個特性、微影程序中所使用之照明之一或多個特性，諸如波長，等)之間的相關性預測輸出。

作為一實例，經驗模型可為機器學習模型及/或任何其他參數化模型。在一些實施例中，機器學習模型(例如)可為及/或包括數學方程式、演算法、標繪圖、圖表、網路(例如神經網路)，及/或其他工具及機器學習模型組件。舉例而言，機器學習模型可為及/或包括具有一輸入層、一輸出層及一或多個中間或隱藏層之一或多個神經網路。在一些實施例中，一或多個神經網路可為及/或包括深度神經網路(例如，在輸入層與輸出層之間具有一或多個中間或隱藏層的神經網路)。

作為一實例，該一或多個神經網路可基於神經單元(或人工神經元)之大集合。該一或多個神經網路可不嚴格地模仿生物大腦工作之方式(例如，經由由軸突連接之大的生物神經元簇)。神經網路之每一神經單元可與該神經網路之許多其他神經單元連接。此類連接可加強或抑制其對所連接之神經單元之激活狀態之影響。在一些實施例中，每一個別神經單元可具有將所有其輸入之值組合在一起之求和函數。在一些實施例中，每一連接(或神經單元自身)可具有臨限值函數使得信號在其被允許傳播至其他神經單元之前必須超出臨限值。此等神經網路系統可為自學習及經訓練，而非經明確程式化，且與傳統電腦程式相比，可在某些問題解決領域中顯著更佳地執行。在一些實施例中，一或多個神經網路可包括多個層(例如，其中信號路徑自前端層橫穿至後端層)。在一些實施例中，可由神經網路利用反向傳播技術，其中使用前向刺激以對「前端」神經單元重設權重。在一些實施例中，對一或多個神經網路之刺激及抑制可更自由流動，其中連接以較混亂且複雜之方式相互作用。在一些實施例中，一或多個神經網路之中間層包括一或多個廻旋層、一或多個重現層及/或其他層。

可使用訓練資料之集合來訓練一或多個神經網路(亦即判定其參數)。訓練資料可包括訓練樣本之集合。每一樣本可為包含輸入物件(通常為向量，其可被稱為特徵向量)及所要輸出值(亦被稱為監督信號)之對。訓練演算法分析訓練資料且藉由基於訓練資料調整神經網路之參數(例如一或多個層之權重)來調整該神經網路之行為。舉例而言，在給出形式為{(x₁ ,y₁ ),(x₂ ,y₂ ),…,(x_N ,y_N )}之N個訓練樣本之集合使得x_i 為第i實例的特徵向量且y_i 為其監督信號之情況下，訓練演算法尋找神經網路g:X→Y，其中X為輸入空間且Y為輸出空間。特徵向量為表示某目標(例如如以上實例中之晶圓設計、剪輯等)之數值特徵之n維向量。與此等向量相關聯之向量空間常常被稱為特徵空間。在訓練之後，神經網路可用於使用新樣本來進行預測。

如上文所描述，本發明方法及系統包括使用編碼器-解碼器架構之參數化模型(例如機器學習模型，諸如神經網路)。在該模型(例如神經網路)之中間(例如中間層)中，本發明模型規劃低維編碼(例如潛在空間)，其將資訊囊封於至該模型之輸入(例如影像、張量及/或其他輸入)中。使用變分推斷技術，編碼器以輸入為條件判定潛在向量之後驗機率分佈。在一些實施例中，該模型經組態以產生針對給定輸入之若干分佈之分佈(例如使用參數丟棄方法)。本發明模型以輸入為條件，自後驗機率之若干分佈之此分佈進行取樣。在一些實施例中，取樣包含自若干分佈之該分佈隨機地選擇分佈。舉例而言，該取樣可為高斯或非高斯的。在取樣之後，該模型解碼樣本至輸出空間中。輸出之可變性及/或經取樣分佈之可變性定義模型之不確定性，其包括模型參數(例如參數權重及/或其他模型參數)之不確定性以及潛在空間之簡化程度(小的及描述性的)。在一些實施例中，判定可變性可包含運用一或多個統計運算及/或用於量化可變性之任何其他方法來量化可變性，該一或多個統計運算包括平均值、矩、偏度、標準偏差、方差、峰度、協方差中之一或多者。在一些實施例中，模型之不確定性係與模型之參數之權重的不確定性以及潛在空間之大小及描述性相關，使得權重中之不確定性表現為輸出中之不確定性，從而導致輸出方差增大。

對參數化模型之輸出可變性(以輸入為條件)之此量化可尤其用以決定模型之預測性如何。對參數化模型之輸出可變性之此量化亦可用以調整(例如更新及改良)該模型以使該模型更具描述性。此調整可例如包括向潛在空間新增更多維度、新增更多樣化的訓練資料及/或其他操作。對參數化模型之輸出可變性之該量化亦可用以導引增強參數化模型之預測之總品質所需的訓練資料之類型。應注意，儘管貫穿本說明書提及了機器學習模型及/或神經網路，但機器學習模型及/或神經網路為參數化模型之一個實例，且本文中所描述之操作可經應用至任何參數化模型。

圖3說明用於判定或判定及降低機器學習模型預測中之不確定性的本發明方法之操作之概述。在操作40處，訓練機器學習模型之編碼器-解碼器架構。在操作42處，使機器學習模型針對給定輸入(例如如下文所描述之x及/或z)自該機器學習模型預測多個輸出。給定輸入可包含例如影像、剪輯、經編碼影像、經編碼剪輯、向量、來自機器學習模型之先前層之資料，及/或可經編碼之任何其他資料及/或目標。

在一些實施例中，操作42包括機器學習模型以輸入為條件使用變分推斷技術以判定潛在向量及/或模型輸出之後驗機率分佈。在一些實施例中，機器學習模型經組態以產生針對給定輸入之若干分佈之分佈(例如使用參數丟棄方法)。若干分佈之分佈可包括例如若干分佈之第一後驗分佈(例如，針對下文所描述之p_𝜃 (z│x))，若干分佈之第二後驗分佈(例如，針對下文所描述之p_ϕ (y|z))，及/或若干分佈之其他分佈。機器學習模型以給定輸入為條件自若干分佈之該等分佈進行取樣。在取樣之後，機器學習模型可解碼樣本至輸出空間中。

在操作44處，判定針對給定輸入之經預測多個輸出實現及/或多個後驗分佈的可變性。在操作46處，使用經預測多個輸出實現及/或多個後驗分佈中之經判定可變性以調整機器學習模型以降低該機器學習模型之不確定性。在一些實施例中，操作46係可選的。在一些實施例中，操作46包含在具有或不具有校正性措施的情況下報告經判定之可變性(例如，除了調整機器學習模型以降低機器學習模型之不確定性以外及/或代替調整機器學習模型以降低機器學習模型之不確定性，亦報告經判定之可變性)。舉例而言，操作46可包括輸出經判定之可變性之指示。該指示可為電子指示(例如一或多個信號)、視覺指示(例如供顯示之一或多個圖形)、數值指示(例如一或多個數字)及/或其他指示。

操作40包含藉由自潛在空間取樣來訓練編碼器-解碼器架構，該潛在空間解碼成輸出空間。在一些實施例中，潛在空間包含低維編碼。作為非限制性實例，圖4說明廻旋編碼器-解碼器50。編碼器-解碼器50具有編碼部分52 (編碼器)及解碼部分54 (解碼器)。在圖4所展示之實例中，編碼器-解碼器50可輸出例如如圖4所展示之晶圓之經預測影像56。該(該等)影像56可具有由分段影像58說明之平均值57、由模型不確定性影像60說明之方差59，及/或其他特性。

作為另一非限制性實例，圖5說明神經網路62內之編碼器-解碼器架構61。編碼器-解碼器架構61包括編碼部分52及解碼部分54。在圖5中，x表示編碼器輸入(例如輸入影像及/或輸入影像之經提取特徵)且x'表示解碼器輸出(例如經預測輸出影像及/或輸出影像之經預測特徵)。在一些實施例中，x'可表示例如來自神經網路之中間層之輸出(相比於總模型之最終輸出)，及/或其他輸出。在一些實施例中，變數y可表示例如來自神經網路之總輸出。在圖5中，z表示潛在空間64及/或低維編碼(向量)。在一些實施例中，z為潛在變數或與潛在變數相關。輸出x' (及/或在一些實施例中y)經模型化為較低維度之隨機向量z ∈ Z的(可能極複雜的)函數，其分量為未觀測到(潛在)之變數。

在一些實施例中，低維編碼z表示輸入(例如影像)之一或多個特徵。輸入之一或多個特徵可被認為係輸入之關鍵或決定性特徵。特徵可被認為係輸入之關鍵或決定性特徵，此係因為其與所要輸出之其他特徵相比相對而言更具預測性，及/或例如具有其他特性。在低維編碼中所表示之一或多個特徵(維度)可(例如由程式設計師在創建本機器學習模型時)預定、由神經網路之先前層判定、由使用者經由與本文中所描述之系統相關聯的使用者介面調整，及/或可藉由其他方法來判定。在一些實施例中，由低維編碼表示之特徵(維度)之數量可(例如由程式設計師在創建本機器學習模型時)預定、基於來自神經網路之先前層之輸出而判定、由使用者經由與本文中所描述之系統相關聯的使用者介面而調整，及/或藉由其他方法來判定。

圖6A說明圖5之編碼器-解碼器架構61，其中在潛在空間64中取樣63 (例如，圖6A可被認為係圖5之更詳細版本)。如圖6A中所展示， p(z|x) ≈ q_𝜃 (z|x) [1]。項p(z|x)為在給定輸入x的情況下之潛在變數z之條件機率。項q_𝜃 (z|x)為或描述編碼器之層之權重。項p (z|x)為或描述在給定x的情況下之z之理論機率分佈。方程式 z ~N (μ, σ² I ) [2] 為或描述潛在變數z之先驗分佈，其中N 表示正常(例如高斯)分佈、μ為該分佈之平均值、σ為協方差，且I 為單位矩陣。如圖6A中所展示，μ及σ² 為定義機率之參數。其僅為模型在以給定輸入為條件的情況下嘗試獲悉之真正機率之代理。在一些實施例中，此代理可對任務更具描述性。其可為例如標準PDF，或可為可獲悉之某自由形式PDF。

返回至圖3，在一些實施例中，操作42包含運用編碼器-解碼器架構(例如圖5中所展示之61)之編碼器(例如圖4中所展示之52)針對給定輸入x判定或以其他方式獲悉潛在變數之條件機率p(z│x)。在一些實施例中，操作42包含判定或以其他方式獲悉編碼器-解碼器架構之條件機率p(x'│z) (及/或p y│z) (運用解碼器(例如圖5中所展示之54))。在一些實施例中，操作42包括藉由根據以下方程式最大化在訓練集D中產生x'_i 之可能性而獲悉ϕ (以下之方程式3中所展示)：

[3]

在一些實施例中，條件機率p(z│x)係由編碼器使用變分推斷技術來判定。在一些實施例中，變分推斷技術包含在參數分佈q_𝜃 (z│x)族中識別對p(z│x)之近似值，其中𝜃為根據以下方程式之族之參數： min KL (p(z│x), q_𝜃 (z│x)) [4] 且代入最大ELBO (𝜃)，其中ELBO代表下限之證據，給出 ELBO (𝜃) = E_q _ϴ _(z│x) [log p_ϴ (x│z)] - KL (q_𝜃 (z│x), p(z)) [5] 其中KL為庫爾貝克-萊佈勒(Kullback-Leibler)散度且用作兩個機率分佈之間的距離之量度，𝜃表示編碼之參數，且ϕ表示解碼之參數。條件機率q_𝜃 (z│x) (編碼器部分)及p_ϕ (x'|z)或p_ϕ (y|z) (解碼器部分)係藉由訓練獲得。

在一些實施例中，操作42包含自條件機率p(z│x)進行取樣，且針對每一樣本，使用編碼器-解碼器架構之解碼器基於以上所描述之方程式來預測經預測多個輸出實現之輸出。另外：E_q _{ϴ (} _z _| _x ₎ [f(z )]表示f(z)之預期值，其中自q(z|x)對z進行取樣。

在一些實施例中，操作44包含基於針對每一樣本之經預測輸出判定針對給定輸入(例如x)之經預測多個輸出實現的可變性。在給定輸入(例如x)的情況下，機器學習模型判定後驗分佈q_𝜃 (z│x)及p_𝜙 (x'│q_𝜃 (z|x))。因此，操作44包含判定後驗分佈q_𝜃 (z│x)。此後驗分佈至潛在空間之原點的距離係與機器學習模型之預測之不確定性成反比(例如，分佈愈接近潛在空間之原點，模型愈具不確定性)。在一些實施例中，操作44亦包含判定另一後驗分佈p_𝜙 (x'│q_𝜃 (z|x))。此後驗分佈之方差與機器學習模型之預測之不確定性直接相關(例如，第二後驗分佈之方差越大意謂不確定性越大)。操作44可包括判定此等後驗分佈中之一者或兩者且基於此等後驗分佈中之一者或兩者判定可變性。

圖6B說明圖4中所展示之編碼器解碼器架構50的另一視圖。如上文所描述，機器學習模型可獲悉針對給定輸入之後驗分佈p_𝜃 (z│x)及/或針對給定輸入之p_ϕ (y│z)。在一些實施例中，操作42包含使模型預測針對給定輸入之多個後驗分佈p_𝜃 (z│x)、針對給定輸入之多個後驗分佈p_ϕ (y│z)，及/或其他後驗分佈。針對p_𝜃 (z│x)及/或p_ϕ (y│z)中之每一者之多個後驗分佈可包含例如若干分佈之分佈。在一些實施例中，模型經組態以使用例如參數丟棄及/或其他技術來產生多個後驗分佈(例如針對p_𝜃 (z│x)及/或p_ϕ (y│z)中之每一者))。

在一些實施例中，操作44包含藉由自若干分佈之分佈進行取樣來判定針對給定輸入之經預測多個後驗分佈的可變性；及使用該經預測多個後驗分佈中之該經判定之可變性以量化參數化模型預測中之不確定性。舉例而言，使機器學習模型針對給定輸入自參數化模型預測多個後驗分佈可包含：使參數化模型預測對應於第一後驗分佈p_𝜃 (z|x)之多個後驗分佈之第一集合，及對應於第二後驗分佈p_ϕ (y|z)之多個後驗分佈之第二集合。判定針對給定輸入之經預測多個後驗分佈之可變性可包含藉由自針對第一及第二集合之若干分佈之分佈進行取樣(例如，藉由自針對p_𝜃 (z|x)之分佈進行取樣，及自針對p_ϕ (y|z)之分佈進行取樣)來判定針對給定輸入之經預測多個後驗分佈的第一及第二集合之可變性。在一些實施例中，取樣包含自若干分佈之分佈隨機地選擇分佈。舉例而言，該取樣可為高斯或非高斯的。

在一些實施例中，操作44包括判定經取樣分佈之可變性。舉例而言，圖6C說明實例預期分佈p (z|x) 600，及自針對p (z|x) 600之若干分佈之分佈之經取樣之分佈的可變性602。舉例而言，可變性602可由機器學習模型之不確定性造成。在一些實施例中，使用經預測多個後驗分佈中之經判定之可變性以量化參數化模型預測中之不確定性包含：使用經預測多個後驗分佈(例如，針對圖6C中所展示之p (z|x) 600的若干分佈之分佈，及針對p (y|z)之若干分佈之相似分佈)之第一及第二集合中的經判定之可變性以量化機器學習模型預測中之不確定性。

在一些實施例中，判定可變性可包含運用一或多個統計運算及/或用於量化可變性之任何其他方法來量化經取樣分佈之集合中之可變性，該一或多個統計運算包括平均值、矩、偏度、標準偏差、方差、峰度、協方差、範圍中之一或多者。舉例而言，判定後驗分佈之經取樣集合之可變性可包括判定針對給定輸入x_o (例如，針對圖6C中所展示之p (z|x) 600，或針對p (y|z)之若干分佈之相似分佈)之很可能的輸出之範圍604。作為另一實例，KL距離可用以量化不同分佈相隔多遠。

在一些實施例中，如上文所描述，機器學習模型預測之不確定性係與機器學習模型之參數之權重的不確定性以及潛在空間之大小及描述性相關。權重中之不確定性可顯現為輸出中之不確定性，從而造成輸出方差增大。舉例而言，若潛在空間(例如如本文所描述)係低維的，則將不能夠對寬廣觀測集合進行概括。另一方面，大維度潛在空間將需要更多的資料來訓練模型。

作為非限制性實例，圖7說明用作機器學習模型之輸入(例如x)之光罩影像70、基於光罩影像70預測的來自機器學習模型之經預測輸出(影像)之平均值72 (影像)、說明經預測輸出中之方差之影像74、使用光罩影像所產生的實際晶圓圖案之掃描電子顯微鏡(SEM)影像78，及說明後驗分佈(例如，p(y|z)-來自若干分佈之分佈之一個實例分佈)之潛在空間80。潛在空間80說明潛在向量z具有七個維度81至87。維度81至87圍繞潛在空間80之中心79分佈。潛在空間80中之維度81至87之分佈說明相對較確定之模型(較小方差)。相對較確定之模型之此證據係由如下事實證實：平均影像72及SEM影像78看起來相似，且方差影像74中不存在任何深色，或在不對應於SEM影像78中所展示之結構之區域的部位中不存在任何深色。

在一些實施例中(例如如本文所描述)，可將潛在空間80中所展示之後驗分佈(例如以統計方式或以其他方式)與使用相同輸入所產生的其他後驗分佈進行比較。本發明方法可包括基於此等後驗分佈之比較判定模型之確定性之指示。舉例而言，所比較之後驗分佈之間的差愈大，模型愈不確定。

作為對比非限制性實例，圖8說明與圖7中所展示之輸出相比機器學習模型輸出之較大變化(及較大不確定性)。圖8說明用作機器學習模型之輸入(例如x)之光罩影像88、基於光罩影像88預測的來自機器學習模型之經預測輸出之平均值89、說明經預測輸出中之方差之影像90、使用光罩影像所產生的實際光罩之SEM影像91，及說明後驗分佈之潛在空間92。潛在空間92說明潛在向量z再次具有若干維度93。潛在空間92中之維度93之分佈現在說明相對較不確定的模型。潛在空間92中之維度93之分佈更集中於原點處(較窄)，從而導致輸出之不確定性較大(例如如本文中所描述，方法包含判定第一後驗分佈p_θ (z|x)，其中第一後驗分佈至潛在空間之原點之距離係與機器學習模型之不確定性成反比)。相對較不確定之模型之此證據係由如下事實證實：平均影像89及SEM影像91看起來極不同，且在SEM影像91中未看見對應結構的部位中在方差影像90中存在大量深色。

此處再次地，可將潛在空間92中所展示之後驗分佈(例如以統計方式或以其他方式)與使用相同輸入所產生的其他後驗分佈進行比較。本發明方法可包括基於此等後驗分佈之比較判定模型之確定性之指示。

作為第三非限制性實例，圖9說明用作機器學習模型之輸入(例如x)之光罩影像94、基於光罩影像94預測的來自機器學習模型之經預測輸出之平均值95、說明經預測輸出中之方差之影像96、使用光罩影像94所產生的實際光罩之SEM影像97，及說明潛在向量z之若干維度99之潛在空間98。影像94至97以及潛在空間98中之維度99之分佈現在說明具有比圖7中所展示模型更多的變化但比圖8中所展示模型更少的變化的模型。舉例而言，平均影像95看起來相似於SEM影像97，但方差影像96在區域A中展示更強顏色，其中在SEM影像97中未看見對應結構。在一些實施例中，可將潛在空間98中所展示之後驗分佈與使用相同輸入所產生的其他後驗分佈進行比較以判定模型之不確定性。

返回至圖3，在一些實施例中，操作46經組態以使得使用經預測多個輸出實現中之經判定之可變性及/或多個後驗分佈以調整機器學習模型包含：基於基於給定輸入的來自經調整之機器學習模型的預測判定一或多個光微影程序參數；及基於該一或多個經判定之光微影程序參數調整光微影裝置。在一些實施例中，來自經調整之機器學習模型之預測包含經預測疊對、經預測晶圓幾何形狀及/或其他預測中之一或多者。在一些實施例中，一或多個經判定之光微影程序參數包含光罩設計、光瞳形狀、劑量、焦點及/或其他程序參數中之一或多者。

在一些實施例中，一或多個經判定之光微影程序參數包含光罩設計，且基於光罩設計調整光微影裝置包含將光罩設計自第一光罩設計改變至第二光罩設計。在一些實施例中，一或多個經判定之光微影程序參數包含光瞳形狀，且基於光瞳形狀調整光微影裝置包含將光瞳形狀自第一光瞳形狀改變至第二光瞳形狀。在一些實施例中，一或多個經判定之光微影程序參數包含劑量，且基於劑量調整光微影裝置包含將劑量自第一劑量改變至第二劑量。在一些實施例中，一或多個經判定之光微影程序參數包含，且基於焦點調整光微影裝置包含將焦點自第一焦點改變至第二焦點。

在一些實施例中，操作46經組態以使得使用經預測多個輸出實現中之經判定之可變性及/或多個後驗分佈以調整機器學習模型從而降低機器學習模型之不確定性包含增加訓練集大小及/或新增潛在空間之維度。在一些實施例中，增加訓練集大小及/或新增潛在空間之維度包含使用相對於先前訓練材料更多樣化的影像、更多樣化的資料，及額外剪輯作為輸入以訓練機器學習模型；及使用更多維度以用於編碼向量，及在機器學習模型中使用更多編碼層，及/或其他訓練集及/或維度增加操作。在一些實施中，額外及更多樣化之訓練樣本包含相對於先前訓練材料之更多樣化的影像、更多樣化的資料，及額外剪輯。

在一些實施例中，操作46經組態以使得使用經預測多個輸出實現中之經判定之可變性及/或多個後驗分佈以調整機器學習模型從而降低機器學習模型之不確定性包含向潛在空間新增額外維度及/或將更多層新增至機器學習模型。在一些實施例中，操作46經組態以使得使用經預測多個輸出實現中之經判定之可變性及/或多個後驗分佈以調整機器學習模型從而降低機器學習模型之不確定性包含相對於自潛在空間之先前取樣及/或用以訓練機器學習模型之先前訓練資料，運用自潛在空間之額外且更多樣化的取樣來訓練該模型。

作為非限制性實例，在一些實施例中，操作46包含使用經預測多個輸出實現中之經判定之可變性及/或多個後驗分佈以調整機器學習模型從而降低機器學習模型之不確定性，以在半導體製造程序中預測光罩幾何形狀。返回查看圖7至圖9，若來自機器學習模型之輸出(例如經預測平均影像)之可變性(例如如在可變性影像中所展示)係高的，如圖8中所展示，及/或若不同分佈之間之變化相對較高，則訓練集大小可增加，及/或潛在空間之維度可增加，如上文所描述。然而，若來自機器學習模型之輸出之可變性係低的，如圖7中所展示，或若不同分佈之間之變化相對較低，則可能幾乎不需要調整。

在一些實施例中，本發明方法可用以在不調整模型的情況下識別模型中之可能的瑕疵，且例如使用不同(例如實體)模型以重新判定特定剪輯(或影像、資料或任何其他輸入)之不確定性。在此實例中，不確定性可用以例如較佳研究給定程序之物理學(例如，抗蝕劑化學反應、各種圖案形狀之效應、材料等)。

預期與積體電路製作程序之若干不同態樣及/或其他程序相關的其他實例。舉例而言，在一些實施例中，操作46包含使用經預測多個輸出實現中之經判定之可變性及/或多個後驗分佈，以調整機器學習模型從而降低該機器學習模型之不確定性，以用於預測晶圓幾何形狀而作為半導體製造程序之部分。繼續此實例，使用經判定之可變性以調整機器學習模型從而降低參數化模型之不確定性，以預測晶圓幾何形狀而作為半導體製造程序之部分可包含：使用相對於先前訓練材料更多樣化的影像、更多樣化的資料及額外剪輯作為輸入以訓練機器學習模型；及使用更多維度以用於編碼向量，及在機器學習模型中使用更多編碼層，該等更多樣化的影像、更多樣化的資料、額外剪輯、更多維度及更多編碼層係基於經判定之可變性而判定。

在一些實施例中，操作46包含使用經預測多個輸出實現中之經判定之可變性及/或多個後驗分佈，以調整機器學習模型從而降低該機器學習模型之不確定性，以用於產生經預測疊對而作為半導體製造程序之部分。繼續此實例，使用經判定之可變性以調整機器學習模型從而降低該機器學習模型之不確定性，以產生經預測疊對而作為半導體製造程序之部分包含：使用相對於先前訓練材料更多樣化的影像、更多樣化的資料及額外剪輯作為輸入以訓練機器學習模型；及使用更多維度以用於編碼向量，及在參數化模型中使用更多編碼層，該等更多樣化的影像、更多樣化的資料、額外剪輯、更多維度及更多編碼層係基於例如經判定之可變性而判定。

圖10為說明可輔助實施本文中所揭示之方法、流程或裝置的電腦系統100之方塊圖。電腦系統100包括用於傳達資訊之匯流排102或其他通信機構，及與匯流排102耦接以用於處理資訊之一處理器104 (或多個處理器104及105)。電腦系統100亦包括耦接至匯流排102以用於儲存待由處理器104執行之資訊及指令的主記憶體106，諸如，隨機存取記憶體(RAM)或其他動態儲存器件。主記憶體106亦可用於在待由處理器104執行之指令之執行期間儲存暫時性變數或其他中間資訊。電腦系統100進一步包括耦接至匯流排102以用於儲存用於處理器104之靜態資訊及指令的唯讀記憶體(ROM) 108或其他靜態儲存器件。提供諸如磁碟或光碟之儲存器件110，且儲存器件110耦接至匯流排102以用於儲存資訊及指令。

電腦系統100可經由匯流排102而耦接至用於向電腦使用者顯示資訊之顯示器112，諸如，陰極射線管(CRT)或平板顯示器或觸控面板顯示器。包括文數字按鍵及其他按鍵之輸入器件114耦接至匯流排102以用於將資訊及命令選擇傳達至處理器104。另一類型之使用者輸入器件為用於將方向資訊及命令選擇傳達至處理器104且用於控制顯示器112上之游標移動的游標控制件116，諸如，滑鼠、軌跡球或游標方向按鍵。此輸入器件通常具有在兩個軸線--第一軸線(例如x)及第二軸線(例如y)中之兩個自由度，其允許該器件指定在平面中之位置。觸控面板(螢幕)顯示器亦可用作輸入器件。

根據一項實施例，本文中所描述之一或多個方法的部分可藉由電腦系統100回應於處理器104執行含有於主記憶體106中之一或多個指令的一或多個序列而執行。可將此類指令自另一電腦可讀媒體(諸如儲存器件110)讀取至主記憶體106中。主記憶體106中所含有之指令序列之執行使處理器104執行本文中所描述之程序步驟。呈多處理配置之一或多個處理器亦可用以執行主記憶體106中含有之指令序列。在一替代實施例中，可代替或結合軟體指令而使用硬連線電路系統。因此，本文之描述不限於硬體電路系統及軟體之任何特定組合。

本文中所使用之術語「電腦可讀媒體」係指參與將指令提供至處理器104以供執行之任何媒體。此媒體可採取許多形式，包括但不限於非揮發性媒體、揮發性媒體及傳輸媒體。非揮發性媒體包括(例如)光碟或磁碟，諸如，儲存器件110。揮發性媒體包括動態記憶體，諸如主記憶體106。傳輸媒體包括同軸纜線、銅線及光纖，包括包含匯流排102之電線。傳輸媒體亦可採取聲波或光波之形式，諸如，在射頻(RF)及紅外線(IR)資料通信期間產生之聲波或光波。電腦可讀媒體之常見形式包括例如軟碟、可撓性磁碟、硬碟、磁帶、任何其他磁性媒體、CD-ROM、DVD、任何其他光學媒體、打孔卡、紙帶、具有孔圖案之任何其他實體媒體、RAM、PROM及EPROM、FLASH-EPROM、任何其他記憶體晶片或卡匣、如下文所描述之載波，或可供電腦讀取之任何其他媒體。

可在將一或多個指令之一或多個序列攜載至處理器104以供執行時涉及電腦可讀媒體之各種形式。舉例而言，最初可將該等指令承載於遠端電腦之磁碟上。遠端電腦可將指令載入至其動態記憶體中，且使用數據機經由電話線而發送指令。在電腦系統100本端之數據機可接收電話線上之資料，且使用紅外線傳輸器以將資料轉換成紅外線信號。耦接至匯流排102之紅外線偵測器可接收紅外線信號中所攜載之資料且將資料置放於匯流排102上。匯流排102將資料攜載至主記憶體106，處理器104自該主記憶體106擷取及執行指令。由主記憶體106接收之指令可視情況在由處理器104執行之前或之後儲存於儲存器件110上。

電腦系統100亦可包括耦接至匯流排102之通信介面118。通信介面118提供對網路鏈路120之雙向資料通信耦合，網路鏈路120連接至區域網路122。舉例而言，通信介面118可為整合式服務數位網路(ISDN)卡或數據機以提供至對應類型之電話線的資料通信連接。作為另一實例，通信介面118可為區域網路(LAN)卡以提供對相容LAN之資料通信連接。亦可實施無線鏈路。在任何此類實施中，通信介面118發送且接收攜載表示各種類型之資訊之數位資料串流的電信號、電磁信號或光信號。

網路鏈路120通常經由一或多個網路而向其他資料器件提供資料通信。舉例而言，網路鏈路120可經由區域網路122而向主機電腦124或向由網際網路服務提供者(ISP) 126操作之資料設備提供連接。ISP 126又經由全球封包資料通信網路(現在通常被稱作「網際網路」) 128而提供資料通信服務。區域網路122及網際網路128兩者皆使用攜載數位資料串流之電信號、電磁信號或光信號。經由各種網路之信號及在網路鏈路120上且經由通信介面118之信號(該等信號將數位資料攜載至電腦系統100及自電腦系統100攜載數位資料)為輸送資訊的載波之例示性形式。

電腦系統100可經由網路、網路鏈路120及通信介面118發送訊息及接收資料，包括程式碼。在網際網路實例中，伺服器130可能經由網際網路128、ISP 126、區域網路122及通信介面118而傳輸用於應用程式之經請求程式碼。舉例而言，一個此類經下載應用程式可提供本文中所描述之方法的全部或部分。所接收程式碼可在其被接收時由處理器104執行，及/或儲存於儲存器件110或其他非揮發性儲存器中以供稍後執行。以此方式，電腦系統100可獲得呈載波之形式之應用程式碼。

圖11示意性地描繪可結合本文中所描述之技術利用的例示性微影投影裝置。該裝置包含： - 照明系統IL，其用以調節輻射光束B。在此特定狀況下，照明系統亦包含輻射源SO； - 第一物件台(例如，圖案化器件台) MT，其具備用以固持圖案化器件MA (例如，倍縮光罩)之圖案化器件固持器，且連接至用以相對於項目PS來準確地定位該圖案化器件之第一***； - 第二物件台(基板台) WT，其具備用以固持基板W (例如，抗蝕劑塗佈矽晶圓)之基板固持器，且連接至用以相對於項目PS來準確地定位該基板之第二***；及 - 投影系統(「透鏡」) PS (例如折射、反射或反射折射光學系統)，其用以將圖案化器件MA之經輻照部分成像至基板W之目標部分C (例如包含一或多個晶粒)上。

如本文中所描繪，裝置屬於透射類型(亦即，具有透射圖案化器件)。然而，一般而言，其亦可屬於反射類型，例如(具有反射圖案化器件)。裝置可使用相對於經典光罩不同種類之圖案化器件；實例包括可程式化鏡面陣列或LCD矩陣。

源SO (例如，水銀燈或準分子雷射、雷射產生電漿(laser produced plasma; LPP) EUV源)產生輻射光束。舉例而言，此光束係直接地或在已橫穿諸如光束擴展器Ex之調節構件之後饋入至照明系統(照明器) IL中。照明器IL可包含調整構件AD以用於設定光束中之強度分佈之外部徑向範圍及/或內部徑向範圍(通常分別被稱作σ外部及σ內部)。另外，照明器IL通常將包含各種其他組件，諸如積光器IN及聚光器CO。以此方式，照射於圖案化器件MA上之光束B在其橫截面中具有所要均一性及強度分佈。

關於圖10應注意，源SO可在微影投影裝置之外殼內(此常常為源SO為(例如)水銀燈時之狀況)，但其亦可遠離微影投影裝置，其產生之輻射光束經導引至該裝置中(例如憑藉合適導向鏡)；此後一情境常常為源SO為準分子雷射(例如基於KrF、ArF或F₂ 雷射作用)時之狀況。

光束PB隨後截取被固持於圖案化器件台MT上之圖案化器件MA。在已橫穿圖案化器件MA的情況下，光束B傳遞通過透鏡PL，該透鏡將該光束B聚焦至基板W之目標部分C上。憑藉第二定位構件(及干涉量測構件IF)，可準確地移動基板台WT，例如以便使不同目標部分C定位於光束PB之路徑中。相似地，第一定位構件可用以(例如)在自圖案化器件庫機械地擷取圖案化器件MA之後或在掃描期間相對於光束B之路徑來準確地定位圖案化器件MA。一般而言，將憑藉未在圖11中明確地描繪之長衝程模組(粗略定位)及短衝程模組(精細定位)來實現物件台MT、WT之移動。然而，在步進器(相對於步進掃描工具)之狀況下，圖案化器件台MT可僅連接至短衝程致動器，或可固定。

可在兩種不同模式中使用所描繪工具： - 在步進模式中，將圖案化器件台MT保持基本上靜止，且將整個圖案化器件影像一次性投影((亦即，單次「閃光」)至目標部分C上。接著使基板台WT在x方向及/或y方向上移位，使得可由光束PB輻照不同目標部分C； - 在掃描模式中，基本上相同情境適用，惟單次「閃光」中不曝光給定目標部分C除外。取而代之，圖案化器件台MT在給定方向(所謂的「掃描方向」，例如y方向)上以速度v可移動，使得造成投影光束B遍及圖案化器件影像進行掃描；同時發生地，基板台WT以速度V = Mv在相同或相對方向上同時地移動，其中M為透鏡PL之放大率(通常，M = 1/4或= 1/5)。以此方式，可在不必損害解析度的情況下曝光相對較大目標部分C。

圖12示意性地描繪可結合本文中所描述之技術利用的另一例示性微影投影裝置1000。

該微影投影裝置1000包含： - 源收集器模組SO； - 照明系統(照明器) IL，其經組態以調節輻射光束B (例如，EUV輻射)； - 支撐結構(例如，圖案化器件台) MT，其經建構以支撐圖案化器件(例如，光罩或倍縮光罩) MA，且連接至經組態以準確地定位該圖案化器件之第一***PM； - 基板台(例如，晶圓台) WT，其經建構以固持基板(例如，抗蝕劑塗佈晶圓) W，且連接至經組態以準確地定位該基板之第二***PW；及 - 投影系統(例如反射投影系統) PS，其經組態以將由圖案化器件MA賦予至輻射光束B之圖案投影至基板W之目標部分C (例如包含一或多個晶粒)上。

如圖12中所描繪，裝置1000屬於反射類型(例如，使用反射圖案化器件)。應注意，由於大多數材料在EUV波長範圍內具吸收性，故圖案化器件可具有包含例如鉬與矽之多堆疊的多層反射器。在一項實例中，多堆疊反射器具有鉬與矽之40個層對，其中每一層之厚度為四分之一波長。可運用X射線微影來產生更小波長。由於大多數材料在EUV及x射線波長下具吸收性，故圖案化器件構形上之經圖案化吸收材料薄片段(例如多層反射器之頂部上之TaN吸收器)界定特徵將印刷(正型抗蝕劑)或不印刷(負型抗蝕劑)之處。

照明器IL自源收集器模組SO接收極紫外線輻射光束。用以產生EUV輻射之方法包括但未必限於用在EUV範圍內之一或多種發射譜線將具有至少一元素(例如氙、鋰或錫)之材料轉換成電漿狀態。在一種此類方法(常常被稱為雷射產生電漿「LPP」)中，可藉由運用雷射光束來輻照燃料(諸如，具有該譜線發射元素之材料小滴、串流或叢集)而產生電漿。源收集器模組SO可為包括雷射(圖12中未繪示)的EUV輻射系統之部件，該雷射用於提供激發燃料之雷射光束。所得電漿發射輸出輻射，例如EUV輻射，該輻射係使用安置於源收集器模組中之輻射收集器予以收集。舉例而言，當使用CO₂ 雷射以提供用於燃料激發之雷射光束時，雷射與源收集器模組可為單獨實體。

在此類狀況下，不認為雷射形成微影裝置之部件，且輻射光束係憑藉包含(例如)合適導向鏡及/或光束擴展器之光束遞送系統而自雷射傳遞至源收集器模組。在其他狀況下，舉例而言，當源為放電產生電漿EUV產生器(常常被稱為DPP源)時，源可為源收集器模組之整體部件。在一實施例中，可使用DUV雷射源。

照明器IL可包含用於調整輻射光束之角強度分佈之調整器。通常，可調整照明器之光瞳平面中之強度分佈的至少外部徑向範圍及/或內部徑向範圍(通常分別被稱作σ外部及σ內部)。另外，照明器IL可包含各種其他組件，諸如琢面化場鏡面器件及琢面化光瞳鏡面器件。照明器可用以調節輻射光束，以在其橫截面中具有所要均一性及強度分佈。

輻射光束B入射於被固持於支撐結構(例如圖案化器件台) MT上之圖案化器件(例如光罩) MA上，且係由該圖案化器件而圖案化。在自圖案化器件(例如光罩) MA反射之後，輻射光束B穿過投影系統PS，投影系統PS將該光束聚焦至基板W之目標部分C上。憑藉第二***PW及位置感測器PS2 (例如干涉器件、線性編碼器或電容性感測器)，可準確地移動基板台WT，例如以便使不同目標部分C定位於輻射光束B之路徑中。相似地，第一***PM及另一位置感測器PS1可用以相對於輻射光束B之路徑來準確地定位圖案化器件(例如光罩) MA。可使用圖案化器件對準標記M1、M2及基板對準標記P1、P2來對準圖案化器件(例如光罩) MA及基板W。

所描繪裝置1000可用於以下模式中之至少一者中：

在步進模式中，在將被賦予至輻射光束之整個圖案一次性投影至目標部分C上時，使支撐結構(例如圖案化器件台) MT及基板台WT保持基本上靜止(亦即，單次靜態曝光)。接著，使基板台WT在X及/或Y方向上移位，使得可曝光不同目標部分C。

在掃描模式中，在將被賦予至輻射光束之圖案投影至目標部分C上時，同步地掃描支撐結構(例如圖案化器件台) MT及基板台WT (亦即，單次動態曝光)。可藉由投影系統PS之放大率(縮小率)及影像反轉特性來判定基板台WT相對於支撐結構(例如圖案化器件台) MT之速度及方向。

在另一模式中，在將被賦予至輻射光束之圖案投影至目標部分C上時，使支撐結構(例如圖案化器件台) MT保持基本上靜止，從而固持可程式化圖案化器件，且移動或掃描基板台WT。在此模式中，通常使用脈衝式輻射源，且在基板台WT之每一移動之後或在掃描期間之順次輻射脈衝之間根據需要而更新可程式化圖案化器件。此操作模式可易於應用於利用可程式化圖案化器件(諸如，上文所提及之類型之可程式化鏡面陣列)之無光罩微影。

圖13更詳細地展示裝置1000，其包括源收集器模組SO、照明系統IL及投影系統PS。源收集器模組SO經建構及配置成使得可將真空環境維持於源收集器模組SO之圍封結構220中。可由放電產生電漿源形成EUV輻射發射電漿210。可藉由氣體或蒸汽(例如，Xe氣體、Li蒸汽或Sn蒸汽)而產生EUV輻射，其中產生極熱電漿210以發射在電磁光譜之EUV範圍內之輻射。舉例而言，藉由造成至少部分離子化電漿之放電來產生極熱電漿210。為了輻射之高效產生，可需要為例如10帕斯卡之分壓之Xe、Li、Sn蒸汽或任何其他合適氣體或蒸汽。在一實施例中，提供受激發錫(Sn)電漿以產生EUV輻射。

由熱電漿210發射之輻射係經由定位於源腔室211中之開口中或後方的選用氣體障壁或污染物截留器230 (在一些狀況下，亦被稱作污染物障壁或箔片截留器)而自源腔室211傳遞至收集器腔室212中。污染物截留器230可包括通道結構。污染截留器230亦可包括氣體障壁，或氣體障壁與通道結構之組合。如在此項技術中已知，本文中進一步所指示之污染物截留器或污染物障壁230至少包括通道結構。

收集器腔室211可包括可為所謂的掠入射收集器之輻射收集器CO。輻射收集器CO具有上游輻射收集器側251及下游輻射收集器側252。橫穿收集器CO之輻射可自光柵光譜濾光器240反射以沿著由點虛線「O」指示之光軸而聚焦於虛擬源點IF中。虛擬源點IF通常被稱作中間焦點，且源收集器模組經配置以使得中間焦點IF位於圍封結構220中之開口221處或附近。虛擬源點IF為輻射發射電漿210之影像。

隨後，輻射橫穿照明系統IL，照明系統IL可包括琢面化場鏡面器件22及琢面化光瞳鏡面器件24，琢面化場鏡面器件22及琢面化光瞳鏡面器件24經配置以提供在圖案化器件MA處輻射光束21之所要角度分佈，以及在圖案化器件MA處之輻射強度之所要均一性。在由支撐結構MT固持之圖案化器件MA處的輻射光束21之反射後，就形成經圖案化光束26，且由投影系統PS將經圖案化光束26經由反射元件28、30而成像至由基板台WT固持之基板W上。

比所展示之元件更多的元件通常可存在於照明光學件單元IL及投影系統PS中。取決於微影裝置之類型，可視情況存在光柵光譜濾光器240。另外，可存在比諸圖所展示之鏡面多的鏡面，例如，在投影系統PS中可存在比圖13所展示之反射元件多1至6個的額外反射元件。

如圖14所說明之收集器光學件CO被描繪為具有掠入射反射器253、254及255之巢套式收集器，僅僅作為收集器(或收集器鏡面)之實例。掠入射反射器253、254及255經安置為圍繞光軸O軸向對稱，且此類型之收集器光學件CO可與常常被稱為DPP源之放電產生電漿源組合使用。

替代地，源收集器模組SO可為如圖14中所展示之LPP輻射系統之部件。雷射LA經配置以將雷射能量沈積至諸如氙(Xe)、錫(Sn)或鋰(Li)之燃料中，從而產生具有數十電子伏特之電子溫度之高度離子化電漿210。在此等離子之去激發及再結合期間產生之高能輻射係自電漿發射、由近正入射收集器光學件CO收集，且聚焦至圍封結構220中之開口221上。

可使用以下條項進一步描述實施例： 1. 一種用於量化於機器學習模型預測中之不確定性之方法，該方法包含：使一機器學習模型針對一給定輸入自該機器學習模型預測多個輸出實現；判定針對該給定輸入之該經預測多個輸出實現的一可變性；及使用該經預測多個輸出實現中之該經判定之可變性以量化來自該機器學習模型的該經預測多個輸出實現中之不確定性。 2. 如條項1之方法，其中使該機器學習模型預測多個輸出實現包含自以該給定輸入為條件之一條件機率進行取樣。 3. 如條項1至2中任一項之方法，其中一給定輸入包含一影像、一剪輯、一經編碼影像、一經編碼剪輯或來自該機器學習模型之一先前層之資料中的一或多者。 4. 如條項1至3中任一項之方法，其進一步包含使用該經預測多個輸出實現中之該經判定之可變性及/或該經量化之不確定性以調整該機器學習模型，以藉由使該機器學習模型更具描述性或包括更多樣訓練資料來降低該機器學習模型之該不確定性。 5. 如條項1至4中任一項之方法，其中該機器學習模型包含編碼器-解碼器架構。 6. 如條項5之方法，其中該編碼器-解碼器架構包含可變編碼器-解碼器架構，該方法進一步包含運用一機率性潛在空間訓練該可變編碼器-解碼器架構，該機率性潛在空間在一輸出空間中產生實現。 7. 如條項6之方法，其中該潛在空間包含一低維編碼。 8. 如條項7之方法，其進一步包含針對該給定輸入使用該編碼器-解碼器架構之一編碼器部分來判定一潛在變數之一條件機率。 9. 如條項8之方法，其進一步包含使用該編碼器-解碼器架構之一解碼器部分來判定一條件機率。 10. 如條項9之方法，其進一步包含自使用該編碼器-解碼器架構之該編碼器部分所判定的該潛在變數之該條件機率進行取樣，且針對每一樣本，使用該編碼器-解碼器架構之該解碼器部分預測一輸出。 11. 如條項10之方法，其中取樣包含自一給定條件機率分佈隨機地選擇數字，其中該取樣係高斯或非高斯的。 12. 如條項10之方法，其進一步包含基於針對該潛在空間中之每一樣本之該經預測輸出來判定針對該給定輸入之該經預測多個輸出實現的該可變性。 13. 如條項12之方法，其中判定該可變性包含運用一或多個統計運算量化可變性，該一或多個統計運算包括一平均值、一矩、偏度、一標準偏差、一方差、峰度或協方差中之一或多者。 14. 如條項8至13中任一項之方法，其中使用該編碼器-解碼器架構之該編碼器部分所判定的該潛在變數之該條件機率係由該編碼器部分使用變分推斷技術來判定。 15. 如條項14之方法，其中該等變分推斷技術包含一參數分佈族中使用該編碼器-解碼器架構之該編碼器部分來識別對該潛在變數之該條件機率之一近似值。 16. 如條項15之方法，其中一參數分佈族包含一參數化分佈，其中族係指該分佈之一類型或形狀，或分佈之組合。 17. 如條項1至16中任一項之方法，其進一步包含判定一第一後驗分佈，其中該第一後驗分佈至該潛在空間之一原點的一距離係與該機器學習模型之該不確定性成反比。 18. 如條項1至17中任一項之方法，其進一步包含判定一第二後驗分佈，其中該第二後驗分佈之一方差係與該機器學習模型之該不確定性直接相關。 19. 如條項18之方法，其中判定該第二後驗分佈包含對該潛在空間直接取樣。 20. 如條項18之方法，其中該第二後驗分佈係習得的。 21. 如條項1至20中任一項之方法，其中該機器學習模型之該不確定性係與該機器學習模型之參數之權重的一不確定性以及該潛在空間之一大小及描述性相關。 22. 如條項21之方法，其中該機器學習模型之該不確定性係與該機器學習模型之參數之權重的該不確定性以及該潛在空間之該大小及描述性相關，使得該等權重中之不確定性表現為該輸出中之不確定性，從而導致輸出方差增大。 23. 如條項2至22中任一項之方法，其中使用該經預測多個輸出實現中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性包含增加一訓練集大小及/或新增該潛在空間之一維度。 24. 如條項23之方法，其中增加一訓練集大小及/或新增該潛在空間之一維度包含使用相對於先前訓練材料更多樣化的影像、更多樣化的資料，及額外剪輯作為輸入以訓練該機器學習模型；及使用更多維度以用於編碼向量，及在該機器學習模型中使用更多編碼層。 25. 如條項2至24中任一項之方法，其中使用該經預測多個輸出實現中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性包含向該潛在空間新增額外維度。 26. 如條項2至25中任一項之方法，其中使用該經預測多個輸出實現中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性包含運用額外及更多樣化之訓練樣本來訓練該機器學習模型。 27. 如條項26之方法，其中該等額外及更多樣化之訓練樣本包含相對於先前訓練材料之更多樣化的影像、更多樣化的資料，及額外剪輯。 28. 如條項2至27中任一項之方法，其進一步包含使用該經預測多個輸出實現中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性，以預測晶圓幾何形狀而作為一半導體製造程序之部分。 29. 如條項28之方法，其中使用該經預測多個輸出實現中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性，以預測晶圓幾何形狀而作為一半導體製造程序之部分包含：使用相對於先前訓練材料更多樣化的影像、更多樣化的資料及額外剪輯作為輸入以訓練該機器學習模型；及使用更多維度以用於編碼向量，及在該機器學習模型中使用更多編碼層，該等更多樣化的影像、更多樣化的資料、額外剪輯、更多維度及更多編碼層係基於該經判定之可變性而判定。 30. 如條項2至29中任一項之方法，其進一步包含使用該經預測多個輸出實現中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性，以產生一經預測疊對而作為一半導體製造程序之部分。 31. 如條項30之方法，其中使用該經預測多個輸出實現中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性，以產生一經預測疊對而作為一半導體製造程序之部分包含：使用相對於先前訓練材料更多樣化的影像、更多樣化的資料及額外剪輯作為輸入以訓練該機器學習模型；及使用更多維度以用於編碼向量，及在該機器學習模型中使用更多編碼層，該等更多樣化的影像、更多樣化的資料、額外剪輯、更多維度及更多編碼層係基於該經判定之可變性而判定。 32. 一種用於量化參數化模型預測中之不確定性之方法，該方法包含：使一參數化模型針對一給定輸入自該參數化模型預測多個輸出實現；判定針對該給定輸入之該經預測多個輸出實現的一可變性；及使用該經預測多個輸出實現中之該經判定之可變性以量化來自該參數化模型的該經預測多個輸出實現中之不確定性。 33. 如條項32之方法，其中該參數化模型係一機器學習模型。 34. 一種電腦程式產品，其包含其上記錄有指令之一非暫時性電腦可讀媒體，該等指令在由一電腦執行時實施如條項1至33中任一項之方法。 35. 一種用於光微影裝置組態之方法，該方法包含：使一機器學習模型針對一給定輸入自該機器學習模型預測多個後驗分佈，該多個後驗分佈包含若干分佈之一分佈；藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的一可變性；使用該經預測多個後驗分佈中之該經判定之可變性以量化該等機器學習模型預測中之不確定性；調整該機器學習模型之一或多個參數以減少該等機器學習模型預測中之該不確定性；及基於針對該給定輸入來自該經調整之機器學習模型之預測，判定一或多個光微影程序參數以用於調整該光微影裝置。 36. 如條項35之方法，其進一步包含基於該一或多個經判定之光微影程序參數來調整該光微影裝置。 37. 如條項36之方法，其中該機器學習模型之該一或多個參數包含該機器學習模型之該一或多個參數之一或多個權重。 38. 如條項35至37中任一項之方法，其中來自該經調整之機器學習模型之該等預測包含一經預測疊對或經預測晶圓幾何形狀中之一或多者。 39. 如條項35至38中任一項之方法，其中該一或多個經判定之光微影程序參數包含一光罩設計、一光瞳形狀、一劑量或一焦點中之一或多者。 40. 如條項39之方法，其中該一或多個經判定之光微影程序參數包含該光罩設計，且基於該光罩設計調整該光微影裝置包含將該光罩設計自一第一光罩設計改變至一第二光罩設計。 41. 如條項39之方法，其中該一或多個經判定之光微影程序參數包含該光瞳形狀，且基於該光瞳形狀調整該光微影裝置包含將該光瞳形狀自一第一光瞳形狀改變至一第二光瞳形狀。 42. 如條項39之方法，其中該一或多個經判定之光微影程序參數包含該劑量，且基於該劑量調整該光微影裝置包含將該劑量自一第一劑量改變至一第二劑量。 43. 如條項39之方法，其中該一或多個經判定之光微影程序參數包含該焦點，且基於該焦點調整該光微影裝置包含將該焦點自一第一焦點改變至一第二焦點。 44. 如條項35至43中任一項之方法，其中使該機器學習模型預測該多個後驗分佈包含使該機器學習模型使用參數丟棄來產生若干分佈之該分佈。 45. 如條項35至44中任一項之方法，其中：使該機器學習模型針對一給定輸入自該機器學習模型預測該多個後驗分佈包含：使該機器學習模型預測對應於一第一後驗分佈P_Θ (z|x)之多個後驗分佈之一第一集合，及對應於一第二後驗分佈P_ϕ (y|z)之多個後驗分佈之一第二集合；藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的該可變性包含藉由自針對該第一集合及該第二集合之若干分佈之該分佈進行取樣來判定針對該給定輸入之經預測多個後驗分佈之該第一集合及該第二集合的該可變性；且使用該經預測多個後驗分佈中之該經判定可變性以量化該等機器學習模型預測中之該不確定性包含使用經預測多個後驗分佈之該第一集合及該第二集合中的該經判定可變性以量化該等機器學習模型預測中之該不確定性。 46. 如條項35至45中任一項之方法，其中該給定輸入包含一影像、一剪輯、一經編碼影像、一經編碼剪輯或來自該機器學習模型之一先前層之資料中的一或多者。 47. 如條項35至46中任一項之方法，其進一步包含使用該經預測多個後驗分佈中之該經判定之可變性及/或該經量化之不確定性以調整該機器學習模型，以藉由使該機器學習模型更具描述性或包括更多樣化訓練資料來降低該機器學習模型之該不確定性。 48. 如條項35至47中任一項之方法，其中取樣包含自若干分佈之該分佈隨機地選擇分佈，其中該取樣係高斯或非高斯的。 49. 如條項35至48中任一項之方法，其中判定該可變性包含運用一或多個統計運算量化可變性，該一或多個統計運算包括一平均值、一矩、偏度、一標準偏差、一方差、峰度或協方差中之一或多者。 50. 如條項35至49中任一項之方法，其中該機器學習模型之該不確定性係與該機器學習模型之該一或多個參數之權重的一不確定性以及與該機器學習模型相關聯之一潛在空間之一大小及描述性相關。 51. 如條項35至50中任一項之方法，其中調整該機器學習模型以降低該機器學習模型之該不確定性包含增加一訓練集大小及/或新增與該機器學習模型相關聯的一潛在空間之一維度。 52. 如條項51之方法，其中增加一訓練集大小及/或新增該潛在空間之一維度包含使用相對於先前訓練材料更多樣化的影像、更多樣化的資料，及額外剪輯作為輸入以訓練該機器學習模型；及使用更多維度以用於編碼向量，及在該機器學習模型中使用更多編碼層。 53. 如條項35至52中任一項之方法，其中使用該經預測多個後驗分佈中之該經判定之可變性以調整該機器學習模型從而降低該機器學習模型之該不確定性包含向與該機器學習模型相關聯之一潛在空間新增額外維度。 54. 如條項35至53中任一項之方法，其中使用該經預測多個後驗分佈中之該經判定之可變性以調整該機器學習模型之該一或多個參數從而降低該機器學習模型之該不確定性包含運用額外及更多樣化之訓練樣本來訓練該機器學習模型。 55. 一種用於量化參數化模型預測中之不確定性之方法，該方法包含：使一參數化模型針對一給定輸入自該參數化模型預測多個後驗分佈，該多個後驗分佈包含若干分佈之一分佈；藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的一可變性；及使用該經預測多個後驗分佈中之該經判定之可變性以量化該等參數化模型預測中之不確定性。 56. 如條項55之方法，其中該參數化模型係一機器學習模型。 57. 如條項55至56中任一項之方法，其中使該參數化模型預測該多個後驗分佈包含使該參數化模型使用參數丟棄來產生若干分佈之該分佈。 58. 如條項55至57中任一項之方法，其中：使該參數化模型針對一給定輸入自該參數化模型預測該多個後驗分佈包含：使該參數化模型預測對應於一第一後驗分佈P_Θ (z|x)之多個後驗分佈之一第一集合，及對應於一第二後驗分佈P_ϕ (y|z)之多個後驗分佈之一第二集合；藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的該可變性包含藉由自針對該第一集合及該第二集合之若干分佈之該分佈進行取樣來判定針對該給定輸入之經預測多個後驗分佈之該第一集合及該第二集合的該可變性；及使用該經預測多個後驗分佈中之該經判定可變性以量化該等參數化模型預測中之該不確定性包含使用經預測多個後驗分佈之該第一集合及該第二集合中的該經判定可變性以量化該等參數化模型預測中之該不確定性。 59. 如條項55至58中任一項之方法，其中該給定輸入包含一影像、一剪輯、一經編碼影像、一經編碼剪輯或來自該參數化模型之一先前層之資料中的一或多者。 60. 如條項55至59中任一項之方法，其進一步包含使用該經預測多個後驗分佈中之該經判定之可變性及/或該經量化之不確定性以調整該參數化模型，以藉由使該參數化模型更具描述性或包括更多樣化訓練資料來降低該參數化模型之該不確定性。 61. 如條項55至60中任一項之方法，其中該參數化模型包含編碼器-解碼器架構。 62. 如條項61之方法，其中該編碼器-解碼器架構包含可變編碼器-解碼器架構，該方法進一步包含運用一機率性潛在空間訓練該可變編碼器-解碼器架構，該機率性潛在空間在一輸出空間中產生實現。 63. 如條項62之方法，其中該潛在空間包含一低維編碼。 64. 如條項63之方法，其進一步包含針對該給定輸入使用該編碼器-解碼器架構之一編碼器部分來判定一潛在變數之一條件機率。 65. 如條項64之方法，其進一步包含使用該編碼器-解碼器架構之一解碼器部分來判定一條件機率。 66. 如條項65之方法，其進一步包含自使用該編碼器-解碼器架構之該編碼器部分所判定的該潛在變數之該條件機率進行取樣，且針對每一樣本，使用該編碼器-解碼器架構之該解碼器部分預測一輸出。 67. 如條項55之方法，其中取樣包含自若干分佈之該分佈隨機地選擇分佈，其中該取樣係高斯或非高斯的。 68. 如條項67之方法，其中判定該可變性包含運用一或多個統計運算量化可變性，該一或多個統計運算包括一平均值、一矩、偏度、一標準偏差、一方差、峰度或協方差中之一或多者。 69. 如條項62至68中任一項之方法，其中該參數化模型之該不確定性係與該參數化模型之參數之權重的一不確定性以及該潛在空間之一大小及描述性相關。 70. 如條項69之方法，其中該參數化模型之該不確定性係與該參數化模型之參數之權重的該不確定性以及該潛在空間之該大小及描述性相關，使得該等權重中之不確定性表現為該輸出中之不確定性，從而導致輸出方差增大。 71. 如條項62至70中任一項之方法，其中使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性包含增加一訓練集大小及/或新增該潛在空間之一維度。 72. 如條項71之方法，其中增加一訓練集大小及/或新增該潛在空間之一維度包含使用相對於先前訓練材料更多樣化的影像、更多樣化的資料，及額外剪輯作為輸入以訓練該參數化模型；及使用更多維度以用於編碼向量，及在該參數化模型中使用更多編碼層。 73. 如條項62至72中任一項之方法，其中使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性包含向該潛在空間新增額外維度。 74. 如條項60至73中任一項之方法，其中使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性包含運用額外及更多樣化之訓練樣本來訓練該參數化模型。 75. 如條項74之方法，其中該等額外及更多樣化之訓練樣本包含相對於先前訓練材料之更多樣化的影像、更多樣化的資料，及額外剪輯。 76. 如條項60至75中任一項之方法，其進一步包含使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以預測晶圓幾何形狀而作為一半導體製造程序之部分。 77. 如條項76之方法，其中使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以預測晶圓幾何形狀而作為一半導體製造程序之部分包含：使用相對於先前訓練材料更多樣化的影像、更多樣化的資料及額外剪輯作為輸入以訓練該參數化模型；及使用更多維度以用於編碼向量，及在該參數化模型中使用更多編碼層，該等更多樣化的影像、更多樣化的資料、額外剪輯、更多維度及更多編碼層係基於該經判定之可變性而判定。 78. 如條項60至77中任一項之方法，其進一步包含使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以產生一經預測疊對而作為一半導體製造程序之部分。 79. 如條項78之方法，其中使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性，以產生一經預測疊對而作為一半導體製造程序之部分包含：使用相對於先前訓練材料更多樣化的影像、更多樣化的資料及額外剪輯作為輸入以訓練該參數化模型；及使用更多維度以用於編碼向量，及在該參數化模型中使用更多編碼層，該等更多樣化的影像、更多樣化的資料、額外剪輯、更多維度及更多編碼層係基於該經判定之可變性而判定。 80. 一種電腦程式產品，其包含其上記錄有指令之一非暫時性電腦可讀媒體，該等指令在由一電腦執行時實施如條項35至79中任一項之方法。

本文中所揭示之概念可模擬或數學上模型化用於使次波長特徵成像之任何通用成像系統，且可尤其供能夠產生愈來愈短波長之新興成像技術使用。已經在使用中之新興技術包括能夠藉由使用ArF雷射來產生193奈米波長且甚至能夠藉由使用氟雷射來產生157奈米波長之極紫外線(EUV)、DUV微影。此外，EUV微影能夠藉由使用同步加速器或藉由運用高能電子來撞擊材料(固體或電漿)而產生在20奈米至5奈米之範圍內的波長，以便產生在此範圍內之光子。

雖然本文中所揭示之概念可用於在諸如矽晶圓之基板上的成像，但應理解，所揭示之概念可與任何類型之微影成像系統一起使用，例如，用於在不同於矽晶圓的基板上之成像的微影成像系統。另外，所揭示元件之組合及子組合可包含單獨的實施例。舉例而言，判定機器學習模型之可變性可包含判定由該模型進行之個別預測中之可變性，及/或由該模型產生之後驗分佈之經取樣集合中之可變性。此等特徵可包含單獨的實施例，及/或此等特徵可在同一實施例中一起使用。

以上描述意欲為說明性，而非限制性的。因此，對於熟習此項技術者將顯而易見，可在不脫離下文所闡明之申請專利範圍之範疇的情況下如所描述進行修改。

10A:微影投影裝置 12A:輻射源 14A:光學件/組件 16Aa:光學件/組件 16Ab:光學件/組件 16Ac:透射光學件/組件 18A:圖案化器件 20A:可調整濾光器或孔徑 21:輻射光束 22:琢面化場鏡面器件 22A:基板平面 24:琢面化光瞳鏡面器件 26:經圖案化光束 28:反射元件 30:反射元件 31:照明模型 32:投影光學件模型 35:設計佈局模型 36:空中影像 37:抗蝕劑模型 38:抗蝕劑影像 40:操作 42:操作 44:操作 46:操作 50:廻旋編碼器-解碼器 52:編碼部分 54:解碼部分 56:經預測影像 57:平均值 58:分段影像 59:方差 60:模型不確定性影像 61:編碼器-解碼器架構 62:神經網路 63:取樣 64:潛在空間 70:光罩影像 72:平均值 74:影像 78:掃描電子顯微鏡(SEM)影像 79:中心 80:潛在空間 81:維度 82:維度 83:維度 84:維度 85:維度 86:維度 87:維度 88:光罩影像 89:平均值 90:影像 91:掃描電子顯微鏡(SEM)影像 92:潛在空間 93:維度 94:光罩影像 95:平均值/平均影像 96:方差影像 97:掃描電子顯微鏡(SEM)影像 98:潛在空間 99:維度 100:電腦系統 102:匯流排 104:處理器 105:處理器 106:主記憶體 108:唯讀記憶體(ROM) 110:儲存器件 112:顯示器 114:輸入器件 116:游標控制件 118:通信介面 120:網路鏈路 122:區域網路 124:主機電腦 126:網際網路服務提供者(ISP) 128:網際網路 130:伺服器 210:EUV輻射發射電漿/極熱電漿/高度離子化電漿 211:源腔室 212:收集器腔室 220:圍封結構 221:開口 230:選用氣體障壁或污染物截留器/污染截留器/污染物障壁 240:光柵光譜濾光器 251:上游輻射收集器側 252:下游輻射收集器側 253:掠入射反射器 254:掠入射反射器 255:掠入射反射器 600:實例預期分佈p (z|x) 602:可變性 604:範圍 1000:微影投影裝置 A:區域 AD:調整構件 B:輻射光束 BD:光束遞送系統 C:目標部分 CO:聚光器/輻射收集器/近正入射收集器光學件 IF:干涉量測構件/虛擬源點/中間焦點 IL:照明系統/照明器/照明光學件單元 IN:積光器 LA:雷射 M₁:圖案化器件對準標記 M₂:圖案化器件對準標記 MA:圖案化器件 MT:第一物件台/圖案化器件台/支撐結構 O:光軸 P₁:基板對準標記 P₂:基板對準標記 PM:第一*** PS:項目/投影系統 PS2:位置感測器 PW:第二*** SO:源收集器模組 W:基板 WT:第二物件台/基板台 x:編碼器輸入 x':解碼器輸出 z:潛在空間64/低維編碼/潛在向量 μ:參數 σ²:參數

併入本說明書中且構成本說明書之一部分的隨附圖式說明一或多個實施例且連同描述一起解釋此等實施例。現在將參看隨附示意性圖式而僅作為實例來描述本發明之實施例，在該等圖式中，對應元件符號指示對應部件，且在該等圖式中：

圖1展示根據一實施例的微影系統之各種子系統的方塊圖。

圖2說明根據一實施例的用於模擬微影投影裝置中之微影的例示性流程圖。

圖3說明根據一實施例的用於降低於機器學習模型預測中之不確定性之本方法之操作的概述。

圖4說明根據一實施例之廻旋編碼器-解碼器。

圖5說明根據一實施例的神經網路內之編碼器-解碼器架構。

圖6A說明根據一實施例的圖5之可變編碼器-解碼器架構版本，其中在潛在空間中進行取樣。

圖6B說明圖4中所展示之編碼器解碼器架構的另一視圖。

圖6C說明實例預期分佈p (z|x)，及自針對p (z|x)之若干分佈之分佈的經取樣之分佈的可變性。

圖7說明根據一實施例的用作機器學習模型之輸入之光罩影像、基於該光罩影像預測的來自機器學習模型之經預測輸出之平均值、說明經預測輸出中之方差之影像、使用光罩影像所產生的實際光罩之掃描電子顯微鏡(SEM)影像，及說明後驗分佈之潛在空間。

圖8說明根據一實施例的用作機器學習模型之輸入之第二光罩影像、基於該第二光罩影像預測的來自機器學習模型之經預測輸出之第二平均值、說明經預測輸出中之方差之第二影像、使用第二光罩影像所產生的實際光罩之第二SEM影像，及說明第二後驗分佈之第二潛在空間。

圖9說明根據一實施例的用作機器學習模型之輸入之第三光罩影像、基於該第三光罩影像預測的來自機器學習模型之經預測輸出之第三平均值、說明經預測輸出中之方差之第三影像、使用第三光罩影像所產生的實際光罩之第三SEM影像，及說明第三後驗分佈之第三潛在空間。

圖10為根據一實施例之實例電腦系統的方塊圖。

圖11為根據一實施例之微影投影裝置的示意圖。

圖12為根據一實施例之另一微影投影裝置的示意圖。

圖13為根據一實施例的圖12中之裝置之更詳細視圖。

圖14為根據一實施例的圖12及圖13之裝置的源收集器模組SO之更詳細視圖。

52:編碼部分

54:解碼部分

61:編碼器-解碼器架構

62:神經網路

63:取樣

64:潛在空間

x:編碼器輸入

x':解碼器輸出

z:潛在空間64/低維編碼/潛在向量

μ:參數

σ²:參數

Claims

一種用於量化參數化模型預測中之不確定性之方法，該方法包含：使一參數化模型針對一給定輸入自該參數化模型預測多個後驗分佈，該多個後驗分佈包含若干分佈之一分佈；藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的一可變性；及使用該經預測多個後驗分佈中之該經判定之可變性以量化該等參數化模型預測中之不確定性。
如請求項1之方法，其中該參數化模型係一機器學習模型。
如請求項1之方法，其中使該參數化模型預測該多個後驗分佈包含：使該參數化模型使用參數丟棄來產生若干分佈之該分佈。
如請求項1之方法，其中：使該參數化模型針對一給定輸入自該參數化模型預測該多個後驗分佈包含：使該參數化模型預測對應於一第一後驗分佈P_Θ (z|x)之多個後驗分佈之一第一集合，及對應於一第二後驗分佈P_ϕ (y|z)之多個後驗分佈之一第二集合；藉由自若干分佈之該分佈進行取樣來判定針對該給定輸入之該經預測多個後驗分佈的該可變性包含：藉由自針對該第一集合及該第二集合之若干分佈之該分佈進行取樣來判定針對該給定輸入之經預測多個後驗分佈之該第一集合及該第二集合的該可變性；且使用該經預測多個後驗分佈中之該經判定可變性以量化該等參數化模型預測中之該不確定性包含：使用經預測多個後驗分佈之該第一集合及該第二集合中的該經判定可變性以量化該等參數化模型預測中之該不確定性。
如請求項1之方法，其中該給定輸入包含一影像、一剪輯、一經編碼影像、一經編碼剪輯或來自該參數化模型之一先前層之資料中的一或多者。
如請求項1之方法，其進一步包含使用該經預測多個後驗分佈中之該經判定之可變性及/或該經量化之不確定性以調整該參數化模型，以藉由使該參數化模型更具描述性或包括更多樣化訓練資料來降低該參數化模型之該不確定性。
如請求項1之方法，其中該參數化模型包含編碼器-解碼器架構。
如請求項7之方法，其中該編碼器-解碼器架構包含可變編碼器-解碼器架構，該方法進一步包含運用一機率性潛在空間訓練該可變編碼器-解碼器架構，該機率性潛在空間在一輸出空間中產生實現。
如請求項8之方法，其中該潛在空間包含一低維編碼。
如請求項9之方法，其進一步包含針對該給定輸入使用該編碼器-解碼器架構之一編碼器部分來判定一潛在變數之一條件機率。
如請求項10之方法，其進一步包含使用該編碼器-解碼器架構之一解碼器部分來判定一條件機率。
如請求項1之方法，其中取樣包含自若干分佈之該分佈隨機地選擇分佈，其中該取樣係高斯或非高斯的。
如請求項8之方法，其中該參數化模型之該不確定性係與該參數化模型之參數之權重的一不確定性以及該潛在空間之一大小及描述性相關。
如請求項8之方法，其中使用該經預測多個後驗分佈中之該經判定之可變性以調整該參數化模型從而降低該參數化模型之該不確定性包含：增加一訓練集大小及/或新增該潛在空間之一維度；向該潛在空間新增額外維度；或運用額外及更多樣化之訓練樣本來訓練該參數化模型。
一種電腦程式產品，其包含其上記錄有指令之一非暫時性電腦可讀媒體，該等指令在由一電腦執行時實施如請求項1之方法。