CN113139702B - 在制品数量的预测方法及预测*** - Google Patents

在制品数量的预测方法及预测*** Download PDF

Info

Publication number
CN113139702B
CN113139702B CN202110591292.0A CN202110591292A CN113139702B CN 113139702 B CN113139702 B CN 113139702B CN 202110591292 A CN202110591292 A CN 202110591292A CN 113139702 B CN113139702 B CN 113139702B
Authority
CN
China
Prior art keywords
data
quantity data
correlation coefficient
work
input feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110591292.0A
Other languages
English (en)
Other versions
CN113139702A (zh
Inventor
李嘉成
贾宇
张晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Huali Microelectronics Corp
Original Assignee
Shanghai Huali Microelectronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Huali Microelectronics Corp filed Critical Shanghai Huali Microelectronics Corp
Priority to CN202110591292.0A priority Critical patent/CN113139702B/zh
Publication of CN113139702A publication Critical patent/CN113139702A/zh
Application granted granted Critical
Publication of CN113139702B publication Critical patent/CN113139702B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Manufacturing & Machinery (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Factory Administration (AREA)

Abstract

本发明的在制品数量的预测方法包括:获取半导体工艺路线中的多个在制品数量数据以及对应的多个芯片产量数据;以多个在制品数量数据和多个芯片产量数据为数据集,清洗数据集,使得数据集符合半导体工艺路线的预设要求;获取半导体工艺路线中的多个输入特征组以及相对应的多个输出特征组;以多个输入特征组以及多个输出特征组为样本集,利用第一预设算法提取训练样本集,从而构建预测模型;根据多个输入特征组中的一部分数据的平均值,并基于预测模型计算在制品数量数据。本发明相较于现有技术,通过清洗数据集可以去除数据集中异常率较高的在制品数量数据以及对应的芯片产量数据,从而提升预测模型的准确性和稳定性。

Description

在制品数量的预测方法及预测***
技术领域
本发明涉及半导体技术领域,特别涉及一种在制品数量的预测方法及预测***。
背景技术
目前,半导体制造工厂通常是使用基于神经网络技术,依据历史中芯片的产量、机台的可利用时间率、各个工艺站点所需要加工的时间、机台工作数量等生产因素与在WIP(Work In Process,芯片的在制品数量)之间的关系,基于神经网络技术构建预测模型。通过将最近一周或一段时间内的平均数据,包括芯片的产量的平均数据、机台的可利用时间率、各个工艺站点所需要加工的时间的平均数据、机台工作数量的平均数据,作为预测值输入构建的预测模型中得到各设备工艺能力在制品数量堆积效益最大值。
由于神经网络具有复杂的非线性关系以及数据异常率较高的因素使得构建的预测模型选取各设备工艺能力在制品数量堆积效益最大值的点变得极困难,需要大量的人为干预手段来确保各设备工艺能力在制品数量堆积效益最大值的准确性,不能使预测模型达到自动化的目的;基于神经网络技术构建的预测模型需要基数较大的预测值作为输入量,导致没有进行数据清洗的步骤,预测值中会出现异样数据导致输出的各设备工艺能力在制品数量堆积效益最大值偏差较大。对于一个产品类型单一且产线产能平均的工厂来说,基于神经网络技术构建的预测模型输出得到的各设备工艺能力在制品数量堆积效益最大值的准确率较高,但是比较依赖预测值的准确性,而对于一个产品类型多样且产线不稳定的工厂来而言,基于神经网络技术构建的预测模型显然已经不能适用。
发明内容
本发明的目的在于提供一种在制品数量的预测方法及预测***,其目的之一在于解决现有的预测模型对在制品数量的预测准确性较低的问题,其目的之二在于解决现有的预测模型不适用于产品类型多样且产线不稳定的工厂。
为解决上述技术问题,基于本发明的一个方面,本发明提供一种在制品数量的预测方法,应用于半导体工艺路线,其包括:
获取半导体工艺路线中的多个在制品数量数据以及与所述在制品数量数据一一对应的多个芯片产量数据;
以多个所述在制品数量数据和对应的多个所述芯片产量数据为数据集,清洗所述数据集,使得所述数据集符合半导体工艺路线的预设要求;
获取半导体工艺路线中的多个输入特征组以及与所述输入特征组一一对应的多个输出特征组;所述输入特征组包括清洗后的所述数据集的在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,所述输出特征组包括清洗后的所述数据集的芯片产量数据;
以获取的多个所述输入特征组以及对应的多个所述输出特征组为样本集,利用第一预设算法提取训练所述样本集,从而构建预测模型;
根据多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于所述预测模型计算在制品数量数据。
可选的,以多个所述在制品数量数据和对应的多个所述芯片产量数据为数据集,清洗所述数据集,使得所述数据集符合半导体工艺路线的预设要求的步骤包括:
利用第二预设算法提取训练所述数据集的映射关系,于坐标系中拟合得到筛选函数;其中,横轴表示所述在制品数量数据,纵轴表示所述芯片产量数据;
分别计算所述数据集于所述坐标系中模拟形成的多个坐标点与所述筛选函数之间的纵轴偏差;若所述纵轴偏差的绝对值大于期望偏差,删除所述坐标点对应的所述在制品数量数据和所述芯片产量数据;若所述纵轴偏差的绝对值小于或等于所述期望偏差,保存所述坐标点对应的所述在制品数量数据和所述芯片产量数据。
可选的,所述第二预设算法包括最小二乘法。
可选的,于坐标系中拟合得到筛选函数的步骤之后,所述在制品数量的预测方法还包括:比较所述筛选函数的相关系数的绝对值与预设的期望相关系数;若所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数,保留所述筛选函数;若所述筛选函数的相关系数的绝对值小于所述期望相关系数,调整所述数据集并提取训练调整后的所述数据集,直到拟合后的所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数。
可选的,所述第一预设算法包括多项式回归;根据多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于所述预测模型计算在制品数量数据的步骤包括:
基于多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,将所述预测模型转化为所述输出特征组关于所述在制品数量数据的预测回归函数;
求解所述预测回归函数关于所述在制品数量数据的偏导数,并基于所述偏导数的极值计算在制品数量数据。
可选的,所述在制品数量的预测方法还包括:调整所述预测模型的所述输入特征组的在制品数量数据的权重因子、机台可利用时间率数据的权重因子、各工艺站点的加工时间数据的权重因子和机台可利用数量数据的权重因子。
基于本发明的另一个方面,本发明还提供一种在制品数量的预测***,应用于半导体工艺路线,其包括:
第一数据获取模块,其用于获取半导体工艺路线中的多个在制品数量数据以及与所述在制品数量数据一一对应的多个芯片产量数据;
数据清洗模块,其用于以多个所述在制品数量数据和对应的多个所述芯片产量数据为数据集,清洗所述数据集,使得所述数据集符合半导体工艺路线的预设要求;
第二数据获取模块,其用于获取半导体工艺路线中的多个输入特征组以及与所述输入特征组一一对应的多个输出特征组;所述输入特征组包括清洗后的所述数据集的在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,所述输出特征组包括清洗后的所述数据集的芯片产量数据;
模型构建模块,其用于以获取的多个所述输入特征组以及对应的多个所述输出特征组为样本集,利用第一预设算法提取训练所述样本集,从而构建预测模型;
数据预测模块,其用于根据多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于所述预测模型计算在制品数量数据。
可选的,所述数据清洗模块包括:
第一预处理单元,其用于利用第二预设算法提取训练所述数据集的映射关系,于坐标系中拟合得到筛选函数;其中,横轴表示所述在制品数量数据,纵轴表示所述芯片产量数据;
第二预处理单元,其用于分别计算所述数据集于所述坐标系中模拟形成的多个坐标点与所述筛选函数之间的纵轴偏差;若所述纵轴偏差的绝对值大于期望偏差,删除所述坐标点对应的所述在制品数量数据和所述芯片产量数据;若所述纵轴偏差的绝对值小于或等于所述期望偏差,保存所述坐标点对应的所述在制品数量数据和所述芯片产量数据。
可选的,所述数据清洗模块还包括第三预处理单元,其用于比较所述筛选函数的相关系数的绝对值与预设的期望相关系数;若所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数,所述第三预处理单元用于保留所述筛选函数;若所述筛选函数的相关系数的绝对值小于所述期望相关系数,所述第三预处理单元用于调整所述数据集并提取训练调整后的所述数据集,直到拟合后的所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数。
可选的,所述第一预设算法包括多项式回归;所述数据预测模块包括;
函数构建单元,其用于基于多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,将所述预测模型转化为所述输出特征组关于所述在制品数量数据的预测回归函数;
数据计算单元,其用于求解所述预测回归函数关于所述在制品数量数据的偏导数,并基于所述偏导数的极值计算在制品数量数据。
可选的,所述数据预测模块还包括权重调整单元,其用于调整所述预测模型的所述输入特征组的在制品数量数据的权重因子、机台可利用时间率数据的权重因子、各工艺站点的加工时间数据的权重因子和机台可利用数量数据的权重因子。
综上所述,本发明提供的应用于半导体工艺路线的在制品数量的预测方法包括:获取半导体工艺路线中的多个在制品数量数据以及与所述在制品数量数据一一对应的多个芯片产量数据;以多个在制品数量数据和对应的多个芯片产量数据为数据集,清洗数据集,使得数据集符合半导体工艺路线的预设要求;获取半导体工艺路线中的多个输入特征组以及与输入特征组一一对应的多个输出特征组;输入特征组包括清洗后的数据集的在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,输出特征组包括清洗后的数据集的芯片产量数据;以获取的多个输入特征组以及对应的多个输出特征组为样本集,利用第一预设算法提取训练样本集,从而构建预测模型;根据多个输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于预测模型计算在制品数量数据。本发明相较于现有技术,通过清洗数据集使得数据集符合半导体工艺路线的预设要求,可以去除数据集中异常率较高的在制品数量数据以及对应的芯片产量数据,从而提升预测模型的准确性和稳定性;通过输入特征组和输出特征组配置的预测模型具有自动化计算能力,可适用于产品类型多样且产线不稳定的工厂,增加工厂产能。
附图说明
本领域的普通技术人员应当理解,提供的附图用于更好地理解本发明,而不对本发明的范围构成任何限定。其中:
图1是本发明一实施例的在制品数量的预测方法的流程图;
图2是本发明一实施例的在制品数量的预测***的示意图;
图3是现有技术的在制品数量的预测方法的仿真图;
图4是本发明一实施例的在制品数量的预测方法的仿真图。
具体实施方式
为使本发明的目的、优点和特征更加清楚,以下结合附图和具体实施例对本发明作进一步详细说明。需说明的是,附图均采用非常简化的形式且未按比例绘制,仅用以方便、明晰地辅助说明本发明实施例的目的。此外,附图所展示的结构往往是实际结构的一部分。特别的,各附图需要展示的侧重点不同,有时会采用不同的比例。
如在本发明中所使用的,单数形式“一”、“一个”以及“该”包括复数对象,术语“或”通常是以包括“和/或”的含义而进行使用的,术语“若干”通常是以包括“至少一个”的含义而进行使用的,术语“至少两个”通常是以包括“两个或两个以上”的含义而进行使用的,此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括一个或者至少两个该特征,“一端”与“另一端”以及“近端”与“远端”通常是指相对应的两部分,其不仅包括端点,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。此外,如在本发明中所使用的,一元件设置于另一元件,通常仅表示两元件之间存在连接、耦合、配合或传动关系,且两元件之间可以是直接的或通过中间元件间接的连接、耦合、配合或传动,而不能理解为指示或暗示两元件之间的空间位置关系,即一元件可以在另一元件的内部、外部、上方、下方或一侧等任意方位,除非内容另外明确指出外。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本发明提供一种在制品数量的预测方法及预测***,其目的之一在于解决现有的预测模型对在制品数量的预测准确性较低的问题,其目的之二在于解决现有的预测模型不适用于产品类型多样且产线不稳定的工厂。
以下请参考附图对本实施例的在制品数量的预测方法及预测***进行描述。如图1所示,图1是本发明一实施例的在制品数量的预测方法的流程图,图2是本发明一实施例的在制品数量的预测***的示意图。
本实施例提供一种应用于半导体工艺路线的在制品数量的预测方法,所述在制品数量的预测方法包括步骤一S1:获取半导体工艺路线中的多个在制品数量数据以及与所述在制品数量数据一一对应的多个芯片产量数据。
相应地,本实施例提供一种应用于半导体工艺路线的在制品数量的预测***,所述在制品数量的预测***包括第一数据获取模块,其用于获取半导体工艺路线中的多个在制品数量数据以及与所述在制品数量数据一一对应的多个芯片产量数据。
可理解的,在制品数量(WIP,Work In Process),指从晶圆投入到芯片产品,FAB(工厂,车间)内寄存了相当数量的晶圆,统称为工厂内的在制品。芯片产量与在制品数量相关,需要使工厂内寄存的晶圆数量在一个最优值,从而使芯片产量的数量达到最优。
所述在制品数量的预测方法包括步骤二S2:以多个所述在制品数量数据和对应的多个所述芯片产量数据为数据集,清洗所述数据集,使得所述数据集符合半导体工艺路线的预设要求。
具体而言,步骤二S2可包括:
S21:利用第二预设算法提取训练所述数据集的映射关系,于坐标系中拟合得到筛选函数;其中,横轴表示所述在制品数量数据,纵轴表示所述芯片产量数据;
S22:分别计算所述数据集于所述坐标系中模拟形成的多个坐标点与所述筛选函数之间的纵轴偏差;若所述纵轴偏差的绝对值大于期望偏差,删除所述坐标点对应的所述在制品数量数据和所述芯片产量数据;若所述纵轴偏差的绝对值小于或等于所述期望偏差,保存所述坐标点对应的所述在制品数量数据和所述芯片产量数据。
相应地,所述在制品数量的预测***包括数据清洗模块,其用于以多个所述在制品数量数据和对应的多个所述芯片产量数据为数据集,清洗所述数据集,使得所述数据集符合半导体工艺路线的预设要求。
进一步,所述数据清洗模块包括第一预处理单元和第二预处理单元,第一预处理单元用于利用第二预设算法提取训练所述数据集的映射关系,于坐标系中拟合得到筛选函数;其中,横轴表示所述在制品数量数据,纵轴表示所述芯片产量数据;
第二预处理单元用于分别计算所述数据集于所述坐标系中模拟形成的多个坐标点与所述筛选函数之间的纵轴偏差;若所述纵轴偏差的绝对值大于期望偏差,删除所述坐标点对应的所述在制品数量数据和所述芯片产量数据;若所述纵轴偏差的绝对值小于或等于所述期望偏差,保存所述坐标点对应的所述在制品数量数据和所述芯片产量数据。
可理解的,将数据集于坐标系中的坐标模拟记作(A,B),筛选函数在横轴坐标为A处的纵轴坐标为B’,纵轴偏差的绝对值等于(B-B’)的绝对值;这里,对于期望偏差设为正数,对于其具体值,本领域技术人员可根据实际情况相应配置,这里不在举例说明。通过如上配置的数据清洗步骤以及数据清洗模块,可剔除数据集中异常率较高的数据,即与筛选函数偏差太大的数据,从而保证数据集的精度,使构建的预测模型的准确性和稳定性更高。
在一示范性的实施例中,所述第二预设算法为最小二乘法。数据集中有m个在制品数量数据以及对应的m个芯片产量数据,数据集是芯片产量数据关于在制品数量数据的特征,可记作(xi,yi)(i=1,2,3……,m),基于最小二乘法的原理可得到筛选函数:
其中,θ(θ0,θ1,θ2,θ3……θn)为参数。
转化为找到一组θ(θ0,θ1,θ2,θ3……θn)使得筛选函数关于数据集的残差平方和最小,即求解:
为便于叙述,这里记作对于θ(θ0,θ1,θ2,θ3……θn)求解,通常的做法是依次求出g(θ)关于θ0,θ1,θ2,θ3……θn的偏导数,即而后令各个偏导数为零,联合求解方程组求解得到θ(θ0,θ1,θ2,θ3……θn),随即得到筛选函数h(xi)。
进一步可知,纵轴偏差即为|h((xi)-yi|,期望偏差设为D,依次比较|h(x1)-y1|,|h((x2)-y2|,|h(x3)-y3|……|h(xm)-ym|与D的大小,从而决定数据集中待剔除的数据。
所述在制品数量的预测方法包括步骤三S3:获取半导体工艺路线中的多个输入特征组以及与所述输入特征组一一对应的多个输出特征组;所述输入特征组包括清洗后的所述数据集的在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,所述输出特征组包括清洗后的所述数据集的芯片产量数据;
相应地,所述在制品数量的预测***包括第二数据获取模块,其用于获取半导体工艺路线中的多个输入特征组以及与所述输入特征组一一对应的多个输出特征组;所述输入特征组包括清洗后的所述数据集的在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,所述输出特征组包括清洗后的所述数据集的芯片产量数据。
优选地,于坐标系中拟合得到筛选函数的步骤之后,所述在制品数量的预测方法还包括:比较所述筛选函数的相关系数的绝对值与预设的期望相关系数;若所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数,保留所述筛选函数;若所述筛选函数的相关系数的绝对值小于所述期望相关系数,调整所述数据集并提取训练调整后的所述数据集,直到拟合后的所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数。
相应地,所述在制品数量的预测***包括第三预处理单元,其用于比较所述筛选函数的相关系数的绝对值与预设的期望相关系数;若所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数,所述第三预处理单元用于保留所述筛选函数;若所述筛选函数的相关系数的绝对值小于所述期望相关系数,所述第三预处理单元用于调整所述数据集并提取训练调整后的所述数据集,直到拟合后的所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数。
可理解的,筛选函数的相关系数是用来检验筛选函数拟合数据集的拟合程度,根据现有技术可知,相关系数的平方为判定系数,通常也叫可决系数或拟合优度,用于检验筛选函数的拟合程度,其值域在0与1之间,包括0和1,拟合优度越大,说明筛选函数与数据集的拟合程度越好,反之,拟合程度越差。对于拟合优度的计算方法,本实施例不再展开说明,本领域技术人员可根据现有技术获悉。本实施例配置筛选函数的相关系数与期望相关系数的比较,而决定是否重新拟合筛选函数,可使拟合的筛选函数为关于数据集拟合程度最优的函数,保证数据集的精确性,从而保证后面构建的预测模型的复相关系数最大。对于期望相关系数的设定,本实施例不做限制,本领域技术人员可根据实际产线情况设定,在一个较优选的实施例中,期望相关系数设定在0.7~0.9之间,比如可以是0.8。
所述在制品数量的预测方法包括步骤四S4:以获取的多个所述输入特征组以及对应的多个所述输出特征组为样本集,利用第一预设算法提取训练所述样本集,从而构建预测模型;
相应地,所述在制品数量的预测***包括模型构建模块,其用于以获取的多个所述输入特征组以及对应的多个所述输出特征组为样本集,利用第一预设算法提取训练所述样本集,从而构建预测模型。
本实施例通过输入特征组和输入特征组基于第一预设算法构建的预测模型,相较于现有技术,考虑了多个自变量,即在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,可使构建的预测模型准确性更高、稳定性更好,适用于产品类型多样、产线不稳定的工厂。
所述在制品数量的预测方法包括步骤五S5:根据多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于所述预测模型计算在制品数量数据。
进一步,所述第一预设算法包括多项式回归;步骤S5具体包括:
S51:基于多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,将所述预测模型转化为所述输出特征组关于所述在制品数量数据的预测回归函数
S52:求解所述预测回归函数关于所述在制品数量数据的偏导数,并基于所述偏导数的极值计算在制品数量数据。
相应地,所述在制品数量的预测***包括数据预测模块,其用于根据多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于所述预测模型计算在制品数量数据。
进一步,所述第一预设算法包括多项式回归;所述数据预测模块包括;
函数构建单元,其用于基于多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,将所述预测模型转化为所述输出特征组关于所述在制品数量数据的预测回归函数;
数据计算单元,其用于求解所述预测回归函数关于所述在制品数量数据的偏导数,并基于所述偏导数的极值计算在制品数量数据。
可理解的,多项式回归是线性回归中的一种,研究一个因变量与多个自变量间多项式回归分析方法,多项式的最大优点是通过增加自变量的高次项对实测点进行逼近。
根据现有技术可知,一元m次多项式回归方程为:
f(x)=b0+b1x+b2x2+b3x3+…+bnxn
二元二次多项式回归方程为:
本实施例的多个自变量包括在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,根据多项式回归建立的预测模型为四元m次多项式回归方程。实际中,一元m次多项式回归方程便可解决问题,同时考虑多个自变量反而会使问题复杂化,基于此,本实施例将计算过后的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值输入相对应预测模型中的自变量中,从而使预测模型转化为芯片产量数据关于在制品数量数据的一元m次多项式回归方程,即所述的预测回归函数。进一步求解所述预测回归函数关于所述在制品数量数据的偏导数,并且令偏导数为0求解此时的在制品数量数据。对于预测回归函数中的系数(参数,b(b0,b1,b2,b3……bn)),可根据输入特征组中的在制品数量数据的值域,结合前文所述的最小二乘法偏导求解参数的方式求解,这里不再说明;也可以是在构建预测模型时,根据输入特征组中各个数据的值,设定自变量相关参数,带入机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值后,即生成所述的预测回归函数。对于产品类型多样,产线不稳定的工厂来说,可预测在制品数量为何值时,芯片产量达到最优,从而提高工厂的产能。此外,本实施例采用的多项式回归,相较于现有有技术的神经网络,算法选择方面更优,构建的预测模型更准确性。
优选地,所述在制品数量的预测方法还包括:调整所述预测模型的所述输入特征组的在制品数量数据的权重因子、机台可利用时间率数据的权重因子、各工艺站点的加工时间数据的权重因子和机台可利用数量数据的权重因子。
相应地,所述数据预测模块还包括权重调整单元,其用于调整所述预测模型的所述输入特征组的在制品数量数据的权重因子、机台可利用时间率数据的权重因子、各工艺站点的加工时间数据的权重因子和机台可利用数量数据的权重因子。
调节各权重因子,使构建的预测模型更准确,转化后的预测回归函数关于岁数样本集的拟合程度更好,能更准确地反应芯片产量与在制品数量的特征关系。具体地,本实施例中,与芯片产量数据关系最大的在制品数量数据,故将在制品数量数据的权重因子相应调大,而机台可利用时间率数据的权重因子、各工艺站点的加工时间数据的权重因子和机台可利用数量数据的权重因子,可根据实际情况调大、调小或者保持不变。
请参考图3和图4,图3是现有技术的在制品数量的预测方法的仿真图(基于神经网络技术构建),图4是本发明一实施例的在制品数量的预测方法的仿真图,图中,横轴表示在制品数量数据,纵轴表示芯片产量数据;Outout表示原始数据(未经处理)拟合的曲线,图3中Predicted Output表示基于神经网络技术拟合的曲线,图3中Predicted Output表示本实施例的在制品数量的预测方法的拟合曲线。由于图3和图4可知,本发明相较于现有技术,对于制品数量数据和芯片产量数据的拟合程度更高,跟接近半导体工艺线的实际生产情况,有利于工厂实现产能效益最大化。
综上所述,本发明提供的应用于半导体工艺路线的在制品数量的预测方法包括:获取半导体工艺路线中的多个在制品数量数据以及与所述在制品数量数据一一对应的多个芯片产量数据;以多个在制品数量数据和对应的多个芯片产量数据为数据集,清洗数据集,使得数据集符合半导体工艺路线的预设要求;获取半导体工艺路线中的多个输入特征组以及与输入特征组一一对应的多个输出特征组;输入特征组包括清洗后的数据集的在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,输出特征组包括清洗后的数据集的芯片产量数据;以获取的多个输入特征组以及对应的多个输出特征组为样本集,利用第一预设算法提取训练样本集,从而构建预测模型;根据多个输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于预测模型计算在制品数量数据。本发明相较于现有技术,通过清洗数据集使得数据集符合半导体工艺路线的预设要求,可以去除数据集中异常率较高的在制品数量数据以及对应的芯片产量数据,从而提升预测模型的准确性和稳定性;通过输入特征组和输出特征组配置的预测模型具有自动化计算能力,可适用于产品类型多样且产线不稳定的工厂,增加工厂产能。
上述描述仅是对本发明较佳实施例的描述,并非对本发明范围的任何限定,本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于本发明技术方案的保护范围。

Claims (8)

1.一种在制品数量的预测方法,应用于半导体工艺路线,其特征在于,包括:
获取半导体工艺路线中的多个在制品数量数据以及与所述在制品数量数据一一对应的多个芯片产量数据;
以多个所述在制品数量数据和对应的多个所述芯片产量数据为数据集,利用最小二乘法提取训练所述数据集的映射关系,于坐标系中拟合得到筛选函数,其中,横轴表示所述在制品数量数据,纵轴表示所述芯片产量数据;
分别计算所述数据集于所述坐标系中模拟形成的多个坐标点与所述筛选函数之间的纵轴偏差,并基于所述纵轴偏差清洗所述数据集;其中,若所述纵轴偏差的绝对值大于期望偏差,删除所述坐标点对应的所述在制品数量数据和所述芯片产量数据;若所述纵轴偏差的绝对值小于或等于所述期望偏差,保存所述坐标点对应的所述在制品数量数据和所述芯片产量数据;
获取半导体工艺路线中的多个输入特征组以及与所述输入特征组一一对应的多个输出特征组;所述输入特征组包括清洗后的所述数据集的在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,所述输出特征组包括清洗后的所述数据集的芯片产量数据;
以获取的多个所述输入特征组以及对应的多个所述输出特征组为样本集,利用多项式回归提取训练所述样本集,从而构建预测模型;
根据多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于所述预测模型计算在制品数量数据。
2.根据权利要求1所述的在制品数量的预测方法,其特征在于,于坐标系中拟合得到筛选函数的步骤之后,所述在制品数量的预测方法还包括:比较所述筛选函数的相关系数的绝对值与预设的期望相关系数;若所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数,保留所述筛选函数;若所述筛选函数的相关系数的绝对值小于所述期望相关系数,调整所述数据集并提取训练调整后的所述数据集,直到拟合后的所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数。
3.根据权利要求1所述的在制品数量的预测方法,其特征在于,根据多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于所述预测模型计算在制品数量数据的步骤包括:
基于多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,将所述预测模型转化为所述输出特征组关于所述在制品数量数据的预测回归函数;
求解所述预测回归函数关于所述在制品数量数据的偏导数,并基于所述偏导数的极值计算在制品数量数据。
4.根据权利要求3所述的在制品数量的预测方法,其特征在于,所述在制品数量的预测方法还包括:调整所述预测模型的所述输入特征组的在制品数量数据的权重因子、机台可利用时间率数据的权重因子、各工艺站点的加工时间数据的权重因子和机台可利用数量数据的权重因子。
5.一种在制品数量的预测***,应用于半导体工艺路线,其特征在于,包括:
第一数据获取模块,其用于获取半导体工艺路线中的多个在制品数量数据以及与所述在制品数量数据一一对应的多个芯片产量数据,其中,多个所述在制品数量数据和对应的多个所述芯片产量数据为数据集;
数据清洗模块,其包括第一预处理单元和第二预处理单元,所述第一预处理单元用于利用最小二乘法提取训练所述数据集的映射关系,于坐标系中拟合得到筛选函数,其中,横轴表示所述在制品数量数据,纵轴表示所述芯片产量数据;所述第二预处理单元用于分别计算所述数据集于所述坐标系中模拟形成的多个坐标点与所述筛选函数之间的纵轴偏差,并基于所述纵轴偏差清洗所述数据集;其中,若所述纵轴偏差的绝对值大于期望偏差,删除所述坐标点对应的所述在制品数量数据和所述芯片产量数据;若所述纵轴偏差的绝对值小于或等于所述期望偏差,保存所述坐标点对应的所述在制品数量数据和所述芯片产量数据;
第二数据获取模块,其用于获取半导体工艺路线中的多个输入特征组以及与所述输入特征组一一对应的多个输出特征组;所述输入特征组包括清洗后的所述数据集的在制品数量数据、机台可利用时间率数据、各工艺站点的加工时间数据和机台可利用数量数据,所述输出特征组包括清洗后的所述数据集的芯片产量数据;
模型构建模块,其用于以获取的多个所述输入特征组以及对应的多个所述输出特征组为样本集,利用多项式回归提取训练所述样本集,从而构建预测模型;
数据预测模块,其用于根据多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,并基于所述预测模型计算在制品数量数据。
6.根据权利要求5所述的在制品数量的预测***,其特征在于,所述数据清洗模块还包括第三预处理单元,其用于比较所述筛选函数的相关系数的绝对值与预设的期望相关系数;若所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数,所述第三预处理单元用于保留所述筛选函数;若所述筛选函数的相关系数的绝对值小于所述期望相关系数,所述第三预处理单元用于调整所述数据集并提取训练调整后的所述数据集,直到拟合后的所述筛选函数的相关系数的绝对值大于或等于所述期望相关系数。
7.根据权利要求5所述的在制品数量的预测***,其特征在于,所述数据预测模块包括:
函数构建单元,其用于基于多个所述输入特征组中的机台可利用时间率数据的平均值、各工艺站点的加工时间数据的平均值和机台可利用数量数据的平均值,将所述预测模型转化为所述输出特征组关于所述在制品数量数据的预测回归函数;
数据计算单元,其用于求解所述预测回归函数关于所述在制品数量数据的偏导数,并基于所述偏导数的极值计算在制品数量数据。
8.根据权利要求7所述的在制品数量的预测***,其特征在于,所述数据预测模块还包括权重调整单元,其用于调整所述预测模型的所述输入特征组的在制品数量数据的权重因子、机台可利用时间率数据的权重因子、各工艺站点的加工时间数据的权重因子和机台可利用数量数据的权重因子。
CN202110591292.0A 2021-05-28 2021-05-28 在制品数量的预测方法及预测*** Active CN113139702B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110591292.0A CN113139702B (zh) 2021-05-28 2021-05-28 在制品数量的预测方法及预测***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110591292.0A CN113139702B (zh) 2021-05-28 2021-05-28 在制品数量的预测方法及预测***

Publications (2)

Publication Number Publication Date
CN113139702A CN113139702A (zh) 2021-07-20
CN113139702B true CN113139702B (zh) 2024-04-30

Family

ID=76815821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110591292.0A Active CN113139702B (zh) 2021-05-28 2021-05-28 在制品数量的预测方法及预测***

Country Status (1)

Country Link
CN (1) CN113139702B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310285A (zh) * 2013-06-17 2013-09-18 同济大学 可用于半导体生产线动态调度的性能预测方法
CN105988424A (zh) * 2015-01-28 2016-10-05 中芯国际集成电路制造(上海)有限公司 半导体工艺制程信息的生成方法与生成装置
CN106846805A (zh) * 2017-03-06 2017-06-13 南京多伦科技股份有限公司 一种动态路网交通需求预测方法及其***
CN109034540A (zh) * 2018-06-29 2018-12-18 长安大学 一种基于在制品工序流的机床序列编排动态预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI604392B (zh) * 2012-06-22 2017-11-01 國立成功大學 在製品產出時程的推估方法與其電腦程式產品
TWI815173B (zh) * 2021-08-26 2023-09-11 力晶積成電子製造股份有限公司 半導體製程的生產排程估測方法以及系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310285A (zh) * 2013-06-17 2013-09-18 同济大学 可用于半导体生产线动态调度的性能预测方法
CN105988424A (zh) * 2015-01-28 2016-10-05 中芯国际集成电路制造(上海)有限公司 半导体工艺制程信息的生成方法与生成装置
CN106846805A (zh) * 2017-03-06 2017-06-13 南京多伦科技股份有限公司 一种动态路网交通需求预测方法及其***
CN109034540A (zh) * 2018-06-29 2018-12-18 长安大学 一种基于在制品工序流的机床序列编排动态预测方法

Also Published As

Publication number Publication date
CN113139702A (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
US6584368B2 (en) User configurable multivariate time series reduction tool control method
KR101930420B1 (ko) 샘플링 비율 결정 기법에 의한 계측 샘플링 방법 및 그 컴퓨터 프로그램 제품
US9299623B2 (en) Run-to-run control utilizing virtual metrology in semiconductor manufacturing
US9395408B2 (en) System for wafer quality predictive modeling based on multi-source information with heterogeneous relatedness
US7603328B2 (en) Dual-phase virtual metrology method
US9829415B2 (en) Metrology sampling method and computer program product thereof
KR100660861B1 (ko) 반도체 공정 결과를 예측하고 제어하는 반도체 공정 제어장치
US6819963B2 (en) Run-to-run control method for proportional-integral-derivative (PID) controller tuning for rapid thermal processing (RTP)
CN105789812B (zh) 一种腔体滤波器自动调节方法及***
CN107390644A (zh) 制造调整***
US20220315179A1 (en) Dynamic compensation method for curved surface deformation in ship segmental construction
US7336278B2 (en) Control of multi-variable processes
CN113139702B (zh) 在制品数量的预测方法及预测***
KR20140032087A (ko) 반도체 제조라인 관리 방법
CN117289668B (zh) 分布式减速机网络协同控制方法、装置、设备及存储介质
CN117250931A (zh) 基于数据融合的石膏板生产智能控制方法及***
CN114556350A (zh) 无需晶粒级输入数据的晶粒级产品建模
CN116990344A (zh) 一种氟化反应热测试方法及***
WO2010119939A1 (ja) プロセスパラメータ選択装置、プロセスパラメータ選択方法、プロセスパラメータ選択プログラム、および、プログラム記録媒体
KR20070090542A (ko) 오차 범위 설정 방법, 및 이를 이용한 반도체 장비의통계적 공정 관리 방법
CN112926821A (zh) 一种基于制程能力指数预测晶圆良率的方法
CN111854822B (zh) 一种基于相关熵和深层神经网络的半导体过程数据矫正方法
CN116627101B (zh) 一种复合基片生产线的控制方法及***
RU2745002C1 (ru) Способ контроля производственного процесса
KR20040024882A (ko) 진단장치와 진단방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant