CN114637782A - 一种针对结构化数值型数据生成文本的方法及装置 - Google Patents

一种针对结构化数值型数据生成文本的方法及装置 Download PDF

Info

Publication number
CN114637782A
CN114637782A CN202210343943.9A CN202210343943A CN114637782A CN 114637782 A CN114637782 A CN 114637782A CN 202210343943 A CN202210343943 A CN 202210343943A CN 114637782 A CN114637782 A CN 114637782A
Authority
CN
China
Prior art keywords
data sequence
numerical
abnormal data
abnormal
description text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210343943.9A
Other languages
English (en)
Inventor
夏敏
李云健
易丛文
徐文丞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhixian Future Industrial Software Co ltd
Original Assignee
Raft Ferry Shanghai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Raft Ferry Shanghai Technology Co ltd filed Critical Raft Ferry Shanghai Technology Co ltd
Priority to CN202210343943.9A priority Critical patent/CN114637782A/zh
Publication of CN114637782A publication Critical patent/CN114637782A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Factory Administration (AREA)

Abstract

本发明提供一种针对结构化数值型数据生成文本的方法,包括:获取结构化数值数据,该结构化数值数据为半导体制造相关的数值序列;基于预设的规则模板,为数值序列匹配对应的描述文本,该描述文本描述了数值序列对应的异常信息。本发明提供的针对结构化数值型数据生成文本的方法,将结构化数值型数据转化为更易于识别的文本数据,更好的揭示了半导体制造过程中的异常现象。

Description

一种针对结构化数值型数据生成文本的方法及装置
技术领域
本发明涉及半导体制造技术领域,尤其涉及一种针对结构化数值型数据生成文本的方法及装置。
背景技术
半导体制造过程中各个机台产生的数据对半导体的生产制造很重要,例如,当晶圆出现良率问题时,可以通过对各个机台产生的历史数据进行回溯分析,确定晶圆的缺陷和/或失效特征,以及缺陷和/或失效特征对应的根因,进而找到提升良率的方案,但是机台产生的数据为结构化数值型数据,需要较高的专业知识对结构化数值型数据进行分析,再结合过往经验才可判断出机台产生的结构化数值型数据披露的异常信息,这无疑增加了工作人员的工作量以及专业门槛。
发明内容
本发明的实施例提供一种针对结构化数值型数据生成文本的方法及装置,将结构化数值型数据转化为更易于识别的文本数据,更好的揭示了半导体制造过程中的异常现象。
第一方面,本发明提供了一种针对结构化数值型数据生成文本的方法,包括:获取结构化数值数据,该结构化数值数据为半导体制造相关的数值序列;基于预设的规则模板,为数值序列匹配对应的描述文本,该描述文本描述了数值序列对应的异常信息。
发明提供的针对结构化数值型数据生成文本的方法,将结构化数值型数据转化为更易于识别的文本数据,更好的揭示了半导体制造过程中的异常现象。
在一个可能的实现中,该方法还包括:基于所述数值序列的分布特征,确定所述数值序列中的异常数据序列段;
所述基于预设的规则模板,为所述数值序列匹配对应的描述文本,包括:
基于预设的规则模板,为所述异常数据序列段匹配对应的描述文本。
在一个可能的实现中,所述预设的规则模板包括多个异常判断条件和各个异常判断条件对应的异常现象描述;
所述基于预设的规则模板,为所述异常数据序列段匹配对应的描述文本,包括:
在所述多个异常判断条件中,确定所述异常数据序列段所符合的目标异常判断条件;
获取所述目标异常判断条件对应的异常现象描述,作为所述描述文本。
在另一个可能的实现中,所述数值序列包括多个异常数据序列段;所述方法还包括:
获取所述多个异常数据序列段在所述数值序列中的位置区间;
将第一异常数据序列段和第二异常数据序列段进行合并处理,得到第三异常数据序列段,所述第一异常数据序列段和第二异常数据序列段的位置区间存在重叠;
基于所述第一异常数据序列段的描述文本和第二异常数据序列段的描述文本,确定所述第三异常数据序列段的描述文本。
在另一个可能的实现中,所述基于所述第一异常数据序列段的描述文本和第二异常数据序列段的描述文本,确定所述第三异常数据序列段的描述文本,包括:
若所述第一异常数据序列段的描述文本和第二异常数据序列段的描述文本相同,则将其确定为所述第三异常数据序列段的描述文本;
若所述第一异常数据序列段的描述文本和第二异常数据序列段的描述文本不同,根据预设规则确定重叠部分的异常数据序列段以所述第一异常数据序列段的描述文本描述或第二异常数据序列段的描述文本进行描述。
在另一个可能的实现中,所述基于预设的规则模板,为所述数值序列匹配对应的描述文本,之前还包括:
对所述数值序列进行预处理。
在一个示例中,所述对所述数值序列进行预处理,包括以下中的一项或多项:
对所述数值序列进行清洗处理,以去除其中大于或等于第一预设阈值的数值和小于或等于第二预设阈值的数值,其中,所述第一预设阈值大于所述第二预设阈值;
对所述数值序列进行标准化处理。
在另一个可能的实现中,该方法还包括:
基于所述描述文本,进行知识抽取,用于形成与半导体制造相关的目标知识图谱。
第二方面,本发明提供了一种,针对结构化数值型数据生成文本的装置,包括:
获取模块,被配置为,获取结构化数值数据,所述结构化数值数据为半导体制造相关的数值序列;
匹配模块,被配置为,基于预设的规则模板,为所述数值序列匹配对应的描述文本,所述描述文本描述了所述数值序列对应的异常信息。
第三方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面和/或第二方面所述的方法。
第四方面,本发明还提供一种计算设备,包括存储器和处理器,所述存储器中存储有指令,当所述指令被处理器执行时,使得第一方面和/或第二方面所述的方法被实现。
第五方面,本发明提供一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括指令,当所述指令执行时,令计算机执行第一方面和/或第二方面所述的方法。
附图说明
图1为本发明实施例提供的一种针对结构化数值型数据生成文本的装置的应用场景示意图;
图2本发明实施例提供的一种针对结构化数值型数据生成文本的方法流程图;
图3为一种规则模板示意图;
图4为本发明实施例提供的一种针对结构化数值型数据生成文本的装置的结构示意图;
图5为本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
图1为本发明实施例提供的一种针对结构化数值型数据生成文本的装置的应用场景示意图。如图1所示,将半导体制造设备产生的数值序列,输入设备10中,输出文本序列,该文本序列描述了数值序列对应的异常信息。
设备10中部署了针对结构化数值型数据生成文本的装置,设备10可以根据需要选择合适的计算设备,例如,各种服务器设备,包括专用服务器计算机(例如个人计算机服务器、UNIX服务器、终端服务器)、刀片式服务器、大型计算机、服务器集群或任何其他适当的布置或组合;各种终端设备,包括各种类型的计算机设备,例如,便携式手持设备、通用计算机(例如个人计算机或膝上计算机)、工作站计算机、可穿戴设备等,设备20具体是何种的计算设备,本发明实施例不进行限定。
晶圆制造为半导体制造中的一种典型场景,下面以晶圆制造为例介绍本发明的具体方案。
图2为本发明实施例提供的一种针对结构化数值型数据生成文本的方法流程图。该方法可应用于图1所示的设备。如图2所示,本发明实施例提供的一种针对结构化数值型数据生成文本的方法至少包括步骤S201-S202。
在步骤S201中,获取结构化数值数据。
其中,结构化数值数据为晶圆制造相关的数值序列。
在一个示例中,晶圆制造相关的数值序列可以包括晶圆制造设备相关的数值序列例如,晶圆制造设备(也可称之为机台)在生产中通过传感器取得的包含设备的状态的数据,例如包括但不限于:温度,湿度,压力,电压,电流等;以及晶圆制造设备的使用率等;
和/或,晶圆相关的数据,例如,晶圆在生产流程中通过缺陷检测得到的数据(例如晶圆缺陷数据);晶圆在生产流程中通过电学测试得到的数据(例如晶圆的失效类型数据,包括CPU区间失效、GUP区间失效、存储区间失效等);晶圆的良率数据等纯数值型数据。
获取方式可以是多种,例如,可以是从半导体制造过程中的各机台的采集设备中直接获取,即采集各机台的实时数据的采集设备直接将采集到数据发送给设备10,或者,从数据库中调取获得第一类数据,该数据库存储有半导体制造过程中各机台产生的结构化数值数据,或者,通过接收用户的输入获取等。
在步骤S202中,基于预设的规则模板,为数值序列匹配对应的描述文本,该描述文本描述了数值序列对应的异常信息。
即在步骤S202中,将数值序列转化为自然语言文本描述,以更好的披露数晶圆制造设备生产过程中的异常现象。
在一个示例中,可以先基于数值序列的分布特征,确定数值序列中的异常数据序列段,再基于预设的规则模板,为异常数据序列段匹配对应的描述文本。
例如,首先把数值序列进行编码,并设计滑动窗口,根据数值序列的特征分布自动识别出数值序列中的异常数据,并表达为对该数据描述的文本数据。
在另一个示例中,预设的规则模板包括多个异常判断条件和各个异常判断条件对应的异常现象描述;
则基于预设的规则模板,为异常数据序列段匹配对应的描述文本,包括:在多个异常判断条件中,确定异常数据序列段所符合的目标异常判断条件;获取目标异常判断条件对应的异常现象描述,作为描述文本。
在一种实现中,多个异常判断条件和各个异常判断条件对应的异常现象描述可以参见图3所示。当数值序列的异常数据序列符合“1point is outside the controllimits”即“一点落在A区以外”则该数值序列对应的异常现象描述为“A large shift”即“有一个大的偏离”。也就是说,该数值序列的异常数据序列段对应的描述文本为“A largeshift”。
规则模板可以通过编程实现模板,从而得到对异常数据描述的文本。示例性的,一种规则模板的编程实现如下所示:
Figure BDA0003580344540000041
在另一个示例中,当所述数值序列包括多个异常数据序列段时,该方法还包括,获取多个异常数据序列段在数值序列中的位置区间;将第一异常数据序列段和第二异常数据序列段进行合并处理,得到第三异常数据序列段,第一异常数据序列段和第二异常数据序列段的位置区间存在重叠;基于第一异常数据序列段的描述文本和第二异常数据序列段的描述文本,确定第三异常数据序列段的描述文本。若第一异常数据序列段的描述文本和第二异常数据序列段的描述文本相同,则将其确定为第三异常数据序列段的描述文本;若第一异常数据序列段的描述文本和第二异常数据序列段的描述文本不同,根据预设规则确定重叠部分的异常数据序列段以第一异常数据序列段的描述文本描述或第二异常数据序列段的描述文本进行描述。
换言之,对多段异常数据序列段的匹配结果进行区间合并,对于区间有重叠的异常数据序列段进行合并,例如,一共8种异常检测模板的12种检测结果区间集合,区间集合中每一个元素是一个列表,列表中是该结果的区间集。
例如:[[0,2],[4,5],[6,10],[8,20],...]为一个区间集,[0,2]为其中的一个区间,这样的区间集一共有12个,每个区间集单独进行区间合并,最后得到12个合并后的区间集。
区间合并流程如下:
1.遍历这12种区间集;
2.去掉区间集中的空区间,避免bug;
3.若区间集中的区间不足两个,无需合并;
4.超过两个,则遍历每一个区间,原始输入的区间集中的区间已经按照区间左界从小到大排序,因此遍历时若当前区间右界>=下一区间左界,则二者合并为一个连续区间,左界为当前区间左界,右界为下一区间右界;
5.重复直至区间集遍历完成,则确定该模板对应的区间集。
合并区间后的重叠部分异常数据序列段按照预设的模板覆盖原则确定,例如,可以预设模板覆盖原则为,7->9->2,8->10->3,也就是说,当重叠部分异常数据序列段的模板覆盖原则为:模板7覆盖模板9和模板2,模板9覆盖模板2,模板8覆盖模板10和模板3,模板10覆盖模板3;即若区间合并时,重叠部分的异常数据段匹配的描述文本为模板7或9,则按照预设的模板覆盖原则,模板7覆盖模板9,则重叠部分的异常数据段以模板7的描述文本进行描述。
例如,若上位和下位现象存在区间上的重合,则在描述时只取上位现象,比如模板7:“a medium shift on the upper side”,假设其区间为[10,20],而模板9:“a smallshift on the upper side”,假设其区间为[15,30],则模板覆盖前是:“From 10to 20,there was a medium shift on the upper side;and from 15to 30,there was a smallshift on the upper side.”,覆盖后:““From 10to 20,there was a medium shift onthe upper side;and from 21to 30,there was a small shifton the upper side.”(small shift作为下位现象,其[15,20]区间段被上位现象medium shift覆盖)。
在另一个示例中,晶圆制造设备产生的数值序列可以是SPC(StatisticalProcess Control,统计过程控制)类型的数据。
可以理解的是,SPC是一种借助数理统计方法的过程控制工具。它对生产过程进行分析评价,根据反馈信息及时发现***性因素出现的征兆,并采取措施消除其影响,使过程维持在仅受随机性因素影响的受控状态,以达到控制质量的目的。利用统计的方法来监控过程的状态,确定生产过程在管制的状态下,以降低产品品质的变异。半导体制造过程中设备产生的数据即为SPC类型的数据,目前是工程师把这类数据通过SPC工具,即使用统计学方法进行分析,然后把分析的结果形成缺陷分析、良率提升的报告文档。
通过本发明实施例提供的一种针对结构化数值型数据生成文本的方法,将半导体制造过程中设备产生的SPC数据,通过模板匹配的方法直接将SPC数值数据其转化为更易于识别的SPC事件描述文本,以更好的披露半导体制造过程中存在的一些异常情况信息,便于良率分析工程师发现晶圆缺陷以及根因,和针对缺陷根因而做出的决策以提升晶圆的良率。
本发明的实施例提供的一种针对结构化数值型数据生成文本的方法,在步骤S202之前还包括对数值序列进行预处理的步骤。
例如,对数值序列进行预处理的步骤可以包括对数值序列进行清洗处理,以去除其中大于或等于第一预设阈值的数值和小于或等于第二预设阈值的数值,其中第一预设阈值大于第二预设阈值;和/或,对数值序列进行标准化处理。
由于数值序列中可能存在远高于正常水平的一些极大的数值或远低于正常水平的一些极小值,这些数值严重影响了wafer(晶圆)的平均值,故将其剔除后再求平均值,也就是对数值序列进行清洗处理,其中的预设阈值可以根据实际情况进行设定,本发明的实施例对预设阈值的取值不进行限定。也就是说,通过数据清洗处理,清洗掉数值序列中的一些偏离正常水平的一些极大值和极小值,以利于获得晶圆的平均值。
由于不同的SPC数值范围不一(比如ucl、lcl不一样),判断数值序列出现异常的范围也不同,所以需要对不同的SPC数值序列做相应的放缩使之纳入到同样的范围中,也就是对数值序列进行标准化处理,采用的方式是:
1、对去除离群点的同类型SPC数据(也就是清洗处理后的数值序列)计算均值μ和标准差σ;
2、x’[i]=(x[i]-μ)/σ(即z-score标准化);
3、ucl=μ+3σ;
4、lcl=μ-3σ;
5、这样处理后的数值序列,超过ucl的值将>3,小于lcl的值将<-3,也就是说,SPC数据的ucl和lcl限定的范围将变为[-3,3]。
本领域技术人员可以理解的是,ucl的含义为,特性值之规格上限,即产品特性大于ucl在工程上将造成不合格;lcl的含义为,特性值之规格下限,即产品特性小于lcl在工程上将造成不合格。
在一个示例中,上述方法还可以包括,基于描述文本,进行知识抽取,用于形成与晶圆制造相关的目标知识图谱,该目标知识图谱可以用于晶圆制造相关的自动推理,例如根据晶圆的SPC数据即可推理出该晶圆的缺陷、失效类别、缺陷/失效类别的根因、以及对应的解决该根因的决策以提升晶圆的良率中的一种或多种。
与前述方法实施例基于相同的构思,本发明实施例中还提供了一种针对结构化数值型数据生成文本的装置400,该针对结构化数值型数据生成文本的装置400包括用以实现图2和3所示的方法中的各个步骤的单元或模块。
图4为本发明实施例提供的一种针对结构化数值型数据生成文本的装置的结构示意图。如图4所示,该针对结构化数值型数据生成文本的装置400至少包括:
获取模块401,被配置为,获取结构化数值数据,所述结构化数值数据为晶圆制造相关的数值序列;
匹配模块402,被配置为,基于预设的规则模板,为所述数值序列匹配对应的描述文本,所述描述文本描述了所述数值序列对应的异常信息。
根据本发明实施例提供的针对结构化数值型数据生成文本的装置400可对应于执行本发明实施例中描述的方法,并且一种针对结构化数值型数据生成文本的装置400中的各个模块的上述和其它操作和/或功能分别为了实现图2和3中的各个方法的相应流程,具体实现可参见上文描述,为了简洁,在此不再赘述。
本发明实施例还提供一种计算设备,包括至少一个处理器、存储器和通信接口,所述处理器用于执行图2和3所述的方法。该计算设备可以为服务器或终端设备。
图5为本发明实施例提供的计算设备的结构示意图。
如图5所示,所述计算设备500包括至少一个处理器501、存储器502、通信接口和503。其中,处理器501和存储器502和通信接口503通信连接,可以通过无线或有线等方式实现通信。该通信接口503用于接收用户指令或采集设备发送的信息;存储器502存储有计算机指令,处理器501执行该计算机指令,执行前述方法实施例中的方法。
应理解,在本发明实施例中,该处理器501可以是中央处理单元CPU,该处理器801还可以是其他通用处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。
该存储器502可以包括只读存储器和随机存取存储器,并向处理器501提供指令和数据。存储器502还可以包括非易失性随机存取存储器。
该存储器502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
应理解,根据本发明实施例的计算设备500可以执行实现本发明实施例中图2和3所示方法,该方法实现的详细描述参见上文,为了简洁,在此不再赘述。
本发明的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机指令在被处理器执行时,使得上文提及的一种针对结构化数值型数据生成文本的方法被实现。
本发明的实施例提供了一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括指令,当该指令执行时,令计算机执行上文提及的一种针对结构化数值型数据生成文本的方法。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执轨道,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执轨道的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种针对结构化数值型数据生成文本的方法,其特征在于,包括:
获取结构化数值数据,所述结构化数值数据为半导体制造相关的数值序列;
基于预设的规则模板,为所述数值序列匹配对应的描述文本,所述描述文本描述了所述数值序列对应的异常信息。
2.根据权利要求1所述的方法,其特征在于,还包括:
基于所述数值序列的分布特征,确定所述数值序列中的异常数据序列段;
所述基于预设的规则模板,为所述数值序列匹配对应的描述文本,包括:
基于预设的规则模板,为所述异常数据序列段匹配对应的描述文本。
3.根据权利要求2所述的方法,其特征在于,所述预设的规则模板包括多个异常判断条件和各个异常判断条件对应的异常现象描述;
所述基于预设的规则模板,为所述异常数据序列段匹配对应的描述文本,包括:
在所述多个异常判断条件中,确定所述异常数据序列段所符合的目标异常判断条件;
获取所述目标异常判断条件对应的异常现象描述,作为所述描述文本。
4.根据权利要求2或3所述的方法,其特征在于,所述数值序列包括多个异常数据序列段;
所述方法还包括:
获取所述多个异常数据序列段在所述数值序列中的位置区间;
将第一异常数据序列段和第二异常数据序列段进行合并处理,得到第三异常数据序列段,所述第一异常数据序列段和第二异常数据序列段的位置区间存在重叠;
基于所述第一异常数据序列段的描述文本和第二异常数据序列段的描述文本,确定所述第三异常数据序列段的描述文本。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一异常数据序列段的描述文本和第二异常数据序列段的描述文本,确定所述第三异常数据序列段的描述文本,包括:
若所述第一异常数据序列段的描述文本和第二异常数据序列段的描述文本相同,则将其确定为所述第三异常数据序列段的描述文本;
若所述第一异常数据序列段的描述文本和第二异常数据序列段的描述文本不同,根据预设规则确定重叠部分的异常数据序列段以所述第一异常数据序列段的描述文本描述或第二异常数据序列段的描述文本进行描述。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于预设的规则模板,为所述数值序列匹配对应的描述文本,之前还包括:
对所述数值序列进行预处理。
7.根据权利要求6所述的方法,其特征在于,所述对所述数值序列进行预处理,包括以下中的一项或多项:
对所述数值序列进行清洗处理,以去除其中大于或等于第一预设阈值的数值和小于或等于第二预设阈值的数值,其中,所述第一预设阈值大于所述第二预设阈值;
对所述数值序列进行标准化处理。
8.根据权利要求1-7任一项所述的方法,还包括:
基于所述描述文本,进行知识抽取,用于形成与半导体制造相关的目标知识图谱。
9.一种针对结构化数值型数据生成文本的装置,其特征在于,包括:
获取模块,被配置为,获取结构化数值数据,所述结构化数值数据为半导体制造相关的数值序列;
匹配模块,被配置为,基于预设的规则模板,为所述数值序列匹配对应的描述文本,所述描述文本描述了所述数值序列对应的异常信息。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-8中任一项的所述的方法。
CN202210343943.9A 2022-04-02 2022-04-02 一种针对结构化数值型数据生成文本的方法及装置 Pending CN114637782A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210343943.9A CN114637782A (zh) 2022-04-02 2022-04-02 一种针对结构化数值型数据生成文本的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210343943.9A CN114637782A (zh) 2022-04-02 2022-04-02 一种针对结构化数值型数据生成文本的方法及装置

Publications (1)

Publication Number Publication Date
CN114637782A true CN114637782A (zh) 2022-06-17

Family

ID=81950946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210343943.9A Pending CN114637782A (zh) 2022-04-02 2022-04-02 一种针对结构化数值型数据生成文本的方法及装置

Country Status (1)

Country Link
CN (1) CN114637782A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116089808A (zh) * 2023-02-06 2023-05-09 迪爱斯信息技术股份有限公司 一种特征选择方法及装置
CN116090559A (zh) * 2023-02-03 2023-05-09 深圳智现未来工业软件有限公司 一种基于晶圆图检测数据生成知识点的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116090559A (zh) * 2023-02-03 2023-05-09 深圳智现未来工业软件有限公司 一种基于晶圆图检测数据生成知识点的方法
CN116089808A (zh) * 2023-02-06 2023-05-09 迪爱斯信息技术股份有限公司 一种特征选择方法及装置

Similar Documents

Publication Publication Date Title
CN114637782A (zh) 一种针对结构化数值型数据生成文本的方法及装置
CN109711440B (zh) 一种数据异常检测方法和装置
US8233494B2 (en) Hierarchical and incremental multivariate analysis for process control
US11625032B2 (en) Method and system for diagnosing anomaly in a manufacturing plant
WO2012094156A2 (en) Methods and apparatus for data analysis
US20140303912A1 (en) System and method for the automatic determination of critical parametric electrical test parameters for inline yield monitoring
CN109882834B (zh) 锅炉设备的运行数据监测方法及装置
CN114551271A (zh) 监测机台运行状况的方法及装置、存储介质及电子设备
KR20230042041A (ko) 공정 트레이스로부터의 장비 고장 모드의 예측
CN112565422B (zh) 一种对电力物联网故障数据的识别方法、***和存储介质
TWI663569B (zh) 多工作站系統的品質預測方法及其系統
CN112700050B (zh) 一种光伏电站超短期第1点功率预测方法及***
CN117520741A (zh) 一种基于大数据的半导体厂良率预测与提升的方法
CN116776647B (zh) 一种复合镍铜铝散热底板的性能预测方法及***
CN117272122A (zh) 晶圆异常的共性分析方法及装置、可读存储介质、终端
US20130030760A1 (en) Architecture for analysis and prediction of integrated tool-related and material-related data and methods therefor
CN113327072B (zh) 一种智能制造装备流程的数据共享方法及***
CN114172708A (zh) 网络流量异常的识别方法
Bassetto et al. Operational methods for improving manufacturing control plans: case study in a semiconductor industry
Ershov et al. Approach to the clustering modeling for the strong correlative control measurements for estimation of percent of the suitable integrated circuits in the semiconductor industry
Dahari et al. Robust Control Chart Application in Semiconductor Manufacturing Process
CN113591266A (zh) 一种电能表故障概率的分析方法及***
CN114818275A (zh) 一种构建知识图谱用于半导体制造良率分析的方法及装置
CN113283501A (zh) 基于深度学习的设备状态检测方法、装置、设备和介质
CN103942615A (zh) 噪点剔除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230411

Address after: Building A, Tianxia International Center, No. 8 Taoyuan Road, Dawangshan Community, Nantou Street, Nanshan District, Shenzhen City, Guangdong Province, 518054, 2605

Applicant after: Shenzhen Zhixian Future Industrial Software Co.,Ltd.

Address before: 200090 A307, 3rd floor, building a, East 1223, 1687 Changyang Road, Yangpu District, Shanghai

Applicant before: Raft Ferry (Shanghai) Technology Co.,Ltd.