JP4275359B2 - データ解析方法 - Google Patents

データ解析方法 Download PDF

Info

Publication number
JP4275359B2
JP4275359B2 JP2002182064A JP2002182064A JP4275359B2 JP 4275359 B2 JP4275359 B2 JP 4275359B2 JP 2002182064 A JP2002182064 A JP 2002182064A JP 2002182064 A JP2002182064 A JP 2002182064A JP 4275359 B2 JP4275359 B2 JP 4275359B2
Authority
JP
Japan
Prior art keywords
data
analysis
data analysis
time
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002182064A
Other languages
English (en)
Other versions
JP2004029971A (ja
Inventor
英大 白井
英隆 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Semiconductor Ltd
Original Assignee
Fujitsu Semiconductor Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Semiconductor Ltd filed Critical Fujitsu Semiconductor Ltd
Priority to JP2002182064A priority Critical patent/JP4275359B2/ja
Publication of JP2004029971A publication Critical patent/JP2004029971A/ja
Application granted granted Critical
Publication of JP4275359B2 publication Critical patent/JP4275359B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、広く産業界で取り扱われるデータ間の関連を把握し、産業上優位な結果をもたらすための有意性のある結果を抽出するデータ解析方法に関する。
【0002】
【従来の技術】
例えば、半導体製造工程において歩留りを向上させるため、製造段階で使用された装置の履歴、試験結果、設計情報、各種測定データ等に基づいて歩留りを低下させている要因をできるだけ速やかに見つけ出す作業が行われる。このためには、実際に物理解析を行うよりも事前に収集されたデータに基づいた統計解析を行っておくのが、経済性の面からも優れており、この統計解析を効率的に行うことが重要である。
【0003】
本願発明者等は、先にこのようなデータを統計解析する装置および方法として特願2000−284578号(特開2001−306999号公報)を出願している。統計的データ解析により有意差の抽出を行う場合、どのようなデータをどのような解析手法で解析するかは、解析者の持っている経験、技術等により決定される。この場合、一度の解析結果で意思決定がなされるのは稀であり、一般に各解析結果を解釈した後に、次になすべき解析条件(データや解析手法等)が検討、決定されたうえで、解析処理がなされる。
【0004】
図38は、一般的なデータ解析処理の手順を示すフローチャートである。決定された解析条件の設定を行い(ステップS50)、設定された解析条件に基づきデータの解析を実行し(ステップS51)、得られた解析結果を解釈し(ステップS52)、意思決定を行う(ステップS53)。意志決定されれば(ステップS53:Yes)、統計解析を終了し、今回の解析結果で意思決定できない場合には(ステップS53:No)、解析条件の変更を行い(ステップS54)、変更した解析条件に基づきデータの解析を実行する。
【0005】
【発明が解決しようとする課題】
上記ステップS54において変更される解析条件は、解析者によりその説明変数、目的変数、処理終了条件等が設定されたうえで実行プログラムに入力される。従って、この入力の際に操作ミスや、実行結果待ち等が生じるため解析効率が低下していた。ここで指定される解析条件は、ある程度パターン化できるものが多いが、解析結果を得た後でなければ最終的な解析条件を指定できない場合が多い。これらは解析自動化を阻害する要因の一つとなっている。特に、一回の解析に時間を要し、多くのパラメータを扱うデータマイニングのような処理に顕著に現れる。
【0006】
データ解析を効率的に行うためには、解析者がどのような手順で何を解析したいか、その説明変数、目的変数を何にすべきかを常に意識して進める必要がある。一般には、各解析者が各解析ケース毎に説明変数のカテゴリを認識しておこなっているが、従来は入力されたデータがどのようなカテゴリのものであるか判別せずに処理結果を出していた。
【0007】
特に、レコード数が少ないにもかかわらず、説明変数の数が多い半導体製造に係るプロセスデータについては、説明変数が複雑に絡み合い、解析対象、解析目的に合った処理手順、説明変数の選択を適切に行わないと、効率的にデータ解析を進めることができなかった。特に、時刻データはプロセスデータ解析において重要な役割を果たしており大量に取得されている。しかし、説明変数が増えすぎたり、交絡しやすくなる(独立でなくなる)ため、統計的有意差の抽出をより困難にしている。対応して計算時間をはじめとする計算機資源も多く必要となっていた。
【0008】
この発明は、上記問題点に鑑みてなされたものであって、生産工程における生産装置や処理時刻のデータの中から所望するデータ解析に必要なデータのみを容易に抽出でき、歩留り向上に有効な解析結果を効率よく得ることができるデータ解析方法を提供することを目的とする。また、レコード数が少なく説明変数が多いデータのデータ解析を自動的に実行できるデータ解析方法の提供を本発明の目的に含めることができる。
【0009】
【課題を解決するための手段】
上記目的を達成するため、本発明は、生産装置名や、処理時刻等のデータからデータ解析に必要なデータを抽出し、歩留りを低下させる問題の生産装置名や処理時刻及び出来映えや歩留り等のデータを絞り込みデータ解析を実行する。このデータ解析の実行に際して、データの説明変数に対しデータ項目のカテゴリを識別する付加文字列を付加することにより、解析処理時にカテゴリを認識できカテゴリに対応した解析手順を自動実行できる。この際、データの目的変数、説明変数を選択及び削除して所望する解析結果を得る。また、所望するデータ解析に不要なデータを説明変数の項目名によって削除し、異常値を有するレコードや項目を削除して必要なデータのみを用いたデータ解析を可能にする。
【0010】
この発明によれば、一通りの解析結果を実行した後に解析条件を指定するといった従来のような手間のかかるデータ解析を行わずとも、解析対象となるデータの説明変数に付加された付加文字列によってデータ項目のカテゴリを認識して必要なデータ解析処理を自動的に順次実行していくことができ、かつ解析結果の信頼性を向上できるようになる。そして、レコード数が少なく説明変数の数が多い半導体製造に係るプロセスデータのように、説明変数が複雑に絡み合うものであっても、解析対象、解析目的に適合した説明変数及び処理手順を選択でき、データ解析を効率的に遂行できるようになる。
【0011】
【発明の実施の形態】
(実施の形態1:データの自動解析)
以下に添付図面を参照して、この発明に係るデータ解析装置およびデータ解析方法の好適な実施の形態を詳細に説明する。この発明の実施の形態で扱う解析対象のオリジナルデータは、半導体製造に係るプロセスデータを例とし、このプロセスデータは時間変動を有しているものとする。このプロセスデータの解析を効率的に行うには、特に時間変動を示す時刻に関する項目が重要となる。以下に説明する各実施の形態では、歩留り要因等の解析のために各製造工程に配置された生産装置(工程装置)とその処理時刻を用い、低歩留り要因をデータマイニング技法(回帰木分析、決定木分析)の使用によって抽出し、さらに解析効率を向上させようとするものである。
【0012】
図1は、本発明の実施の形態に係るデータ解析装置に用いられる計算機システムのハードウェア構成を示す図である。このデータ解析装置は、キーボード等の装置操作用の操作手段およびネットワーク等を介してデータを入力するための入力装置1、入力されたデータに対し後述する解析処理を実行するCPU等を備えた中央処理装置2、CRT,LCD等の表示手段やプリンタ等の印字手段からなる出力装置3、およびHDD等のデータを格納保持する記憶装置4によって構成される。
【0013】
図2は、プロセスデータの流れを説明するための図である。半導体等の被製造対象の製造工程には、複数(N)の工程装置10a〜10nが配置される。各工程装置10a〜10nは、それぞれの製造工程におけるプロセスデータを管理サーバ11に送出する。このプロセスデータは、各工程において製造対象を製造した処理時刻、製造に関わった使用装置の名称、歩留り等からなる。管理サーバ11は、入力されたプロセスデータに基づき、製造情報データベースDB1を作成する。この製造情報データベースDB1は、図1に示す記憶装置4に対しネットワーク等を介して格納される。
【0014】
図3は、図1に示すシステム構成により実現されるデータ解析装置の機能ブロック図である。このデータ解析装置30には、図2に示す製造情報データベースDB1に格納された各工程装置のプロセスデータが入力される。このデータ解析装置30は、データ抽出手段31,データクレンジング/特徴化手段32,データ解析手段33,解析結果評価手段34,報告レポート出力手段35を備え、各手段はそれぞれ設定ファイルRF(RF1〜RF7)に記述された設定情報に従って処理を実行する。なお、各手段における処理を一連化し自動実行することを自動解析と称す。
【0015】
このデータ解析装置30は、回帰木分析等の解析処理プログラムを起動し、必要な入出力ファイル名及び目的変数と説明変数が指定された後、各種解析フロー設定ファイル群に従って自動的に▲1▼データベースからのデータ抽出、▲2▼データのクレンジング及び特徴化、▲3▼回帰木分析、▲4▼解析結果評価を順次行い、▲5▼工程履歴から問題工程と装置と時刻を抽出し、報告レポートREP1を出力する。
【0016】
この際、ロット番号(データ件数即ちレコード数に相当)と各工程の装置名と処理日時のデータに目的変数項目が付加されたデータを抽出及び加工してデータマイニング技法によるデータ解析を行い、自動的に注目すべき工程と装置と時刻を絞り込む。
【0017】
図4は、本発明のデータ解析装置におけるデータの処理手順の概要を示すフローチャートである。製造情報データベースDB1から抽出された解析対象の解析用データDATAは、プログラム初期化ファイルINI(後述する各設定ファイルRF1〜RF7を含む)の設定に従い、解析プログラムの実行によりデータ解析される。ここで、プログラム初期化ファイルINIの設定に基づき、解析プログラムは、解析用データDATA内のデータ項目のカテゴリを識別する付加文字列_xxを設定する。この付加文字列_xxは解析プログラムにより認識される。
【0018】
そして、解析プログラムで該当する処理モードが指定されると(ステップS1)、xxで示すカテゴリ種に対応する処理(目的変数や説明変数等の変数自動選択(ステップS2),あるいは変数手動選択(ステップS3))の後、回帰木分析等による解析処理が実行される(ステップS4)。解析処理は、一回目の解析処理に基づきあらかじめ設定された解析対象、解析手順に合わせて再実行するか否か選択される(ステップS5)。再実行時には、実行結果を抽出し(ステップS6)、目的変数、説明変数等の変数を自動選択あるいは削除し(ステップS7)、ステップS4に復帰して次の解析処理を実行して最終的な解析結果を得る。
【0019】
(データ抽出手段31について)
データ抽出手段31は、
(1)データ抽出及び変換の抽出条件設定と処理
(2)データマイニング条件設定と処理
(3)装置名及び時刻設定と処理
をそれぞれ実行する。
【0020】
(1)データ抽出及び変換の抽出条件設定と処理について
データ抽出及び変換は、抽出条件設定ファイルRF1データ抽出のプログラムに従い、製造情報データベースDB1に貯えられたプロセスデータを、決められた時間に、あるいは定期的に、設定された条件(対象品種、期間、項目)でロット番号と工程名と装置名と処理日時のデータに目的変数項目が付加されたデータを抽出する。
【0021】
(2)データマイニング条件設定と処理について
項目設定ファイルRF2とマイニング条件設定のプログラムに従い、レコード識別名、説明変数名、目的変数名、説明変数値名を選択し、解析用データ1(DATA1)を作成し出力する。具体的には、項目設定ファイルRF2を用いて次の内容を設定する。
レコード名:ロット番号
説明変数項目:製造工程(大工程名+小工程名)
説明変数値名:装置、時刻
目的変数名:YIELD、特性値(歩留り)等
【0022】
(3)装置名及び時刻設定処理について
この解析装置の製造工程履歴解析に必要となる説明変数値として装置名及び時刻を設定する。解析用データ1(DATA1)は1列目にレコード名、2列目以降に説明変数と目的変数を整列させる。図5は、解析用データ1(DATA1)の内容の一部を示す図表である。図示のように、説明変数項目名には、説明変数値名にその値の名前が付加され、識別できるようになっている。この例では、製造工程名に「_装置」又は「_時刻」が付加され、名前から工程とその値の内容が識別できる。この項目設定で設定された説明変数項目及び説明変数値名により、以降のデータクレンジング/特徴化手段32及びデータ解析手段33において製造工程と時刻又は装置を関連付けて識別できる。なお、生産ラインの各工程には複数台の装置(例えば、図示の工程01_装置における6nw2と6nw4)が配置され並列に動作して生産を行っている状態が示されている。
【0023】
(データクレンジング/特徴化手段32について)
データクレンジング/特徴化手段32は、データクレンジング設定ファイルRF3,特徴化設定ファイルRF4,およびデータクレンジング/特徴化のプログラムに従って、以下に示すデータクレンジング及び特徴化の処理を実行する。
(1)異常値処理条件設定及び処理
(2)経時変化に基づく装置名の変更設定及び処理
(3)一台装置工程における項目名変更
(4)不要項目削除設定及び処理
(5)異常値割合による項目削除及びレコード削除設定及び処理
(6)時刻データの解析条件設定及び処理
【0024】
上記(1)〜(6)の各処理を詳細に説明する。
(1)異常値処理条件設定及び処理について
データクレンジング/特徴化手段32は、データクレンジング設定ファイルRF3の設定内容に基づき、解析用データ1(DATA1)の説明変数項目値が欠損している場合には特定値に置き換える。このデータクレンジングの処理内容について説明する。図6は、データクレンジング後の解析用データ2(DATA2)の内容の一部を示す図表である。図5に示した解析用データ1(DATA1)の説明変数項目値がNull(欠損値)である箇所は、図6に示すように特定値(図示の例では欠損する数値は99999、欠損する文字列値はnop)に置き換えられる。
【0025】
そして、データクレンジング/特徴化手段32は、データクレンジング設定ファイルRF3の設定内容に基づき、この特定値を、値の一つとして解析するか、欠損値として解析するかを設定する。異常判断基準についても、その異常値定義と置換値を設定し、設定に従って異常値を処理する。
【0026】
(2)経時変化に基づく装置名の変更設定及び処理について
同一装置であっても、何らかのトラブルによってある時期から突然異常な装置に変わることがある。データクレンジング/特徴化手段32は、この突然の変化による目的変数値の変動を捉えて、異常な状態へ変化した装置に別の名前を付けることにより、さらに問題点を絞り込むことができるようになる。
【0027】
データクレンジング/特徴化手段32は、全装置について処理時刻による目的変数推移の特徴をウェーブレット変換等による特徴抽出(フィルタリングによるノイズ除去等)によって確認し、設定された基準に対し特徴の強かった装置については急上昇と急降下時期及び期間により特徴付けを行う。例えば、プログラム初期化ファイルINIの設定により急変動の量が全体の標準偏差の0.8倍以上を基準とする。また、装置名は、その推移特徴情報を付加した装置名へと変換する。この実施の形態では推移特徴情報を次のように装置名に付加する。
【0028】
▲1▼区切り文字(@)を付ける。
▲2▼その装置に対応する目的変数値が急上昇又は急降下した時期によって期間を最大で3つに分け、期間を表す記号(Fは前半、Mは中盤、Lは後半、記号無しは全体)を付ける。
▲3▼その装置の推移の形状を表す記号としてトレンドマークをつける。
▲4▼推移特徴の強さを表す記号として1桁の数字(0:弱い〜9:強い)を付ける。
【0029】
図7は、装置名に付与されるトレンドマークを示す図表である。図示のように、トレンドマークは、図6に示す解析用データ2(DATA2)全体を前半、中盤、後半の3つに分け、各期間別の目的変数値の推移の状態を示すものであり、前記ウェーブレット変換等の特徴抽出によって得られた状態が図示のように1(−^:前半が低く、後半が高い)〜5(−:特徴なし)までに分けられた設定となっている。
【0030】
推移特徴情報を付加した装置名の例を、図6に示す工程01_装置を用いると、
6nw2@F−^7
が得られる。上記例は、装置名が6nw2であり、前半期間(F)における目的変数値の推移の形状は前半が低く後半が高く、推移特徴が7であることを示す。また、推移特徴がまったく無い場合には、6nw2@−0となる。このようにデータクレンジング/特徴化手段32は、各工程装置それぞれについて、推移特徴情報を付加した装置名を作成する。なお、図6に示した解析用データ2(DATA2)はデータ全体の一部であるため、実際にはデータ全体を用いて特徴抽出された後の推移特徴情報が付加されることになる。
【0031】
(3)一台装置工程における項目名変更について
前述したが、半導体をはじめとする各種製造ラインの各工程では複数台の装置が配置され並列に動作させることが多い。しかし、ある一つの工程に一台の装置のみを配置し運用する場合もある。このような構成の工程については「一台装置工程」と定義する。一台装置工程では、複数台の装置同士間での差を確認することができないため、問題となる要因を配置された一台の装置における経時変化に基づき求める。
【0032】
説明変数となる工程の装置名が1種類の場合、その工程の装置間差は出せないため、説明変数から外す。該当する工程の処理時刻を示すデータ項目名に“_一台装置”を付加する。図6に示す例では、工程04_装置の処理時刻を“工程04_一台装置”に変更する。なお、該当する処理時刻データ項目が存在しない場合や、該当する処理時刻データ項目も1種類の値の場合は変更しない。この付加文字によって解析時に一台装置工程の時刻データ項目であることが認識される。
【0033】
(4)不要項目削除設定及び処理について
データを取得する段階で解析に不要となる説明変数項目が混じることがあり、この場合、解析前に不要項目を削除する設定を行う。この例では、初期設定として、直接製品加工を行わない検査工程等を除くために、説明変数項目名に含まれる検査工程名等の文字列を複数設定する。設定に基づいて不要項目を削除する。
【0034】
(5)異常値割合による項目削除及びレコード削除設定及び処理について
欠損値及び定義された異常値の割合が初期設定値を超えた項目とレコードを削除する。例えば、欠損値及び定義された異常値の割合が60%以上の項目を削除する。欠損値及び定義された異常値の割合が70%以上のレコードを削除する。目的変数値が欠損又は異常であるレコードは削除する。なお、説明変数のうち名義尺度の項目は値の種類が1又は100以上の項目は解析対象としない。
【0035】
(6)時刻データの解析条件設定及び処理について
装置は、初期設定によって説明変数における時刻データは順序尺度(時刻単位の処理対象)として扱う。また、第2の設定として、製造工程に存在する周期を用いて期間を区切り、期間を表す名前に加工した名義尺度(名前単位の処理対象)としても扱う。例えば、製造作業者の交代周期等がある。
【0036】
(データ解析手段33の解析処理について)
データ解析手段33は、解析設定ファイルRF5及び解析処理プログラムの内容に従って回帰木分析による下記の解析処理を実行する。
【0037】
(1)装置履歴+時刻データ解析の設定
製造工程の処理形態に応じて以下のように異なる解析処理を実行する。
▲1▼製造工程全体が先入れ先出しでロットを処理する場合
基本的にどの工程においてもロットの処理順番が同じとなるため、各工程の処理時刻は説明変数としては一つあれば十分であり、全ての装置項目と第1候補の時刻を説明変数とした解析を実行する。多少のロット処理順番の入れ替わりがある場合は、時刻データの数を増やし、「装置履歴+上位N候補時刻データ解析」を実行する。Nは1〜20が適正な範囲である。
【0038】
▲2▼製造工程全体が先入れ先出しでロットを処理しない場合
時刻データの独立性の検定手法を用いて、互いに独立でない工程の時刻データはまとめて一つの代表時刻項目にし、独立な時刻データのみの代表時刻項目群に絞り込む(時刻データの絞り込み)。その後、全ての装置名項目と絞り込んだ代表時刻項目群を説明変数とした「装置履歴+時刻データ解析」を実行する。
【0039】
(2)解析終了条件設定
回帰木分析終了条件は、例えば、分割集合の標準偏差が全体の0.5倍以下になった時として設定される。
【0040】
(3)解析の実行
データ解析手段33は、解析設定ファイルRF5及び解析処理プログラムの内容に従って解析を実行する。目的変数が複数設定されている場合は、設定された複数の項目を順次選択して解析する。
【0041】
▲1▼「装置履歴+上位N候補時刻データ解析」の処理内容
1.装置名項目及び一台装置の処理時刻項目だけを説明変数として、指定の目的変数について回帰木分析を行う。
2.次にその解析結果で候補となった上位N個の工程の時刻データを説明変数に追加して再度回帰木分析を行う。なお、第k候補に挙がった項目の時刻データが無かった場合は第k+1候補以降で時刻データの存在する項目の時刻データを探して追加する。無い場合は無かったことを、あった場合は第何候補であったかを解析結果で明示する(1≦k≦N)。
【0042】
▲2▼「装置履歴+時刻データ解析」の処理内容
全ての装置名項目と絞り込んだ代表時刻項目群を説明変数とした回帰木分析を行う。
【0043】
(解析結果評価手段34の解析結果の抽出、評価について)
上述したデータ解析手段33による自動解析は1度の実行で終わるものではない。解析対象期間又は対象ロットを変化させ、かつ、データクレンジング/特徴化手段32、及びデータ解析手段33の各種設定値を初期値から変化させながらくり返し解析を行い解析結果データ(DATA3)を得る。そして、この解析結果データ(DATA3)が示す得られた複数の結果を評価し、より信頼できる解析結果を得るようになっている。
【0044】
ここで回帰木分析及びt検定の概要について説明しておく。回帰木分析は、複数の属性を示す説明変数とそれにより影響を受ける目的変数からなるレコードの集合を対象とし、その目的変数に最も影響を与える属性と属性値を判別するものである。解析結果評価手段34は、データの特徴や規則性を示すルールを出力する。
【0045】
回帰木分析の処理は、各説明変数(属性)のパラメータ値(属性値)に基づいて集合の2分割を繰り返していくことで実現される。その集合分割の際、分割前の目的変数の平方和をS0、分割後の2つの集合のそれぞれの目的変数の平方和をS1およびS2としたとき、下記式(1)で示すΔSが最大となるように、分割するレコードの説明変数とそのパラメータ値を求める。
【0046】
ΔS=S0−(S1+S2) ・・・(1)
【0047】
ここで得られる説明変数とそのパラメータ値は、回帰木では分岐点に対応している。以降、分割された集合についても同様な処理を繰り返し、説明変数の目的変数に対する影響を調べる。以上が、一般によく知られている回帰木分析の手法であるが、集合分割の明確さをより詳しく把握するために、複数の上位分割候補に関して、ΔSの他に以下のパラメータ(a)〜(d)も回帰木分析結果の定量的な評価として使用する。
【0048】
(a)S比:
集合分割による平方和の低減率であり、集合分割により平方和がどの程度低減したかを示すパラメータである。この値が小さいほど集合分割の効果は大きく、集合分割が明確におこなわれているので、有意差が大である。
【0049】
S比=((S1+S2)/2)/S0 ・・・(2)
【0050】
(b)t値:
回帰木分析の処理実行により集合が2分割されるが、分割された2つの集合の平均(/X1,/X2)の差の検定のための値である。ここで、“/”は上線を示す。統計のt検定は、分割された集合における目的変数の平均値の有意差を示す基準となる。自由度、即ちデータ数が同じであるなら、tが大きいほど集合が明確に分割されており、有意差が大である。
【0051】
この際、分割された集合の分散に有意差がない場合には下記式(3)によりt値を求め、分割された集合の分散に有意差がある場合には下記式(4)によりt値を求める。ここで、N1およびN2は、それぞれ分割した集合1および集合2の要素数である。また、/X1および/X2はそれぞれ分割後の各集合の平均である。S1およびS2は、それぞれ分割後の各集合の目的変数の平方和である。
【0052】
【数1】
Figure 0004275359
【0053】
【数2】
Figure 0004275359
【0054】
(c)分割された集合の目的変数の平均値の差:
この値が大きいほど有意差が大である。
【0055】
(d)分割された各集合のデータ数:
両者の差が小さいほど異常値(ノイズ)による影響が小である。
【0056】
(1)解析結果の評価
評価は、探索設定ファイルRF6及び解析結果評価プログラムに基づき行う。この評価情報は各解析結果ごとに算出するが、各解析結果間で比較できる。
(2)信頼性の高い解析結果の探索
解析結果評価手段34は、探索設定ファイルRF6の設定に基づき、解析結果データ(DATA3)に対し信頼性の高い解析結果の探索の判断を行う。例えば、「回帰木第一分岐のt検定値で比較する。ただし、2分割グループの各データ数が設定基準以上であること」を条件とした比較評価値を用いる。この比較評価値によって、より信頼できる解析結果を探索することができる。そして、各設定ファイルRF1〜RF5の各設定値を変化させる範囲を限定すること又は自動解析時間を限定することにより、探索を終了させ、得られた複数の解析結果と各総合評価値と順位を得て、行った解析の中で最も信頼できる解析結果を抽出する。設定値を変化させる範囲と方法の設定の一部を図14(b)に示す。この設定に従って、2分割交絡度及び各項目の異常値割合の活用による多角的な分析を実行し、より明確な分析結果の探索を行っている。
【0057】
図8は、解析結果データ(DATA3)に基づく評価処理の内容を説明するための図表である。図示のように、以下の評価処理によって、項目名として各工程装置と各評価値(以下に説明するt検定値、低いグループと高いグループの装置名及び件数、平均値等)を算出し、t検定の検定値の値が大きい順に問題が大であるとして、順位Noを付与する。
【0058】
(報告レポート出力手段35について)
報告レポート出力手段35は、最も信頼できる解析結果について報告レポートを作成し、出力する。
(1)報告レポート作成について
解析結果にはファイルに回帰木のルール情報と、第一分岐の所定数候補(例えば上位20候補)の評価用統計値、及び各候補間の2分割交絡度、並びにレポート情報ファイルとしてHTMLファイルに回帰木図と主要2分岐及び上位2候補の有意差を簡潔な文章、及び箱髭図又は相関図をデータと関連付けて出力する。
【0059】
(2)具体的報告方法について
解析結果の報告は、報告条件設定ファイルRF7の設定及び報告処理プログラムに基づき処理される。例えば、報告内容は、画面表示及びあらかじめ設定した電子メールアドレスにアラーム通知し、報告レポートと報告レポートWEBアドレスを報告する。
【0060】
図9は、報告レポートの内容の一例を示す図である。報告レポートREP1は、解析結果に基づき、▲1▼総合判定内容(主要2分岐及び上位2候補の有意差を説明する簡潔な文章)A1,▲2▼統計的情報A2,▲3▼回帰木図A3,▲4▼回帰木図A3に対応する箱髭図A4,又は相関図A5を表示する。回帰木図A3は例えば、HTML等の記述形式で表示され、所望する工程装置をクリックすることにより、リンクされた該当する▲4▼箱髭図A4あるいは相関図A5を選択的に表示可能となっている。
【0061】
図10は、データ解析処理の処理手順を示すフローチャートである。図示のように、データ抽出手段31は製造情報データベースDB1からデータの抽出及び変換を行い解析用データ(DATA1)を得る(ステップS11)。次に、データクレンジング/特徴化手段32は解析用データ(DATA1)のデータをクレンジング及び特徴化した解析用データ(DATA2)を得る(ステップS12)。
【0062】
次に、データ解析手段33は、クレンジング及び特徴化後の解析用データ(DATA2)を回帰木分析の手法によりデータマイニングし解析結果データ(DATA3)を得る(ステップS13)。次に、解析結果評価手段34は、解析結果データ(DATA3)を用いて解析結果を評価する(ステップS14)。この評価時、信頼性の高い結果を探索する。例えば、設定した解析終了条件を満たすか否かを判断する(ステップS15)。満たしていない場合には(ステップS15:No)、解析対象期間又は対象ロットを変化させ、かつ、データクレンジング/特徴化手段32、及びデータ解析手段33の各種設定値を初期値から変化させながらくり返し解析を行いより信頼できる解析結果データ(DATA3)を得る。
【0063】
データ解析手段33の解析終了条件を満たす解析結果が得られると(ステップS15:Yes)、報告レポート出力手段35による報告レポートREP1を出力し(ステップS16)、データ解析処理を終了する。以上のデータ解析処理は、週単位や月単位で自動実行され、半導体製造工程等の製造段階で使用された装置の履歴、試験結果、設計情報、各種測定データ等のデータ解析によって得られた報告レポートREP1によって、歩留りを低下させている要因を容易に見つけ出すことができ、歩留りの向上が図れるようになる。
【0064】
図11〜図14は、上記解析処理を設定する設定ファイルの設定内容の一例を示す図である。図11は、データクレンジング設定ファイルRF3の一部を示す図表である。解析用データ1(DATA1)の説明変数項目値の欠損時の置換や特定値への置き換え、項目及びレコードを削除する異常値割合等が設定される。図12は、項目設定ファイルRF2の一部を示す図表である。日付型項目と装置型項目の識別文字例についてそれぞれ設定される。図13は、データクレンジング設定ファイルRF3の一部を示す図表である。特定文字列が使われている項目名を削除する場合の検索文字列が設定される。
【0065】
図14は、解析設定ファイルRF5と探索設定ファイルRF6の一部を示す図表である。図14(a)は解析設定ファイルRF5の一部であり、時刻データ解析の設定内容及び解析条件の設定内容が示され、前述した「装置履歴+上位N候補時刻データ解析」、あるいは「装置履歴+独立時刻データ解析」のいずれかが設定され、目的変数、説明変数の指定、解析処理の終了条件等が設定される。図14(b)は探索設定ファイルRF6の一部であり、多角的な分析を行うための設定がなされ、2分割交絡度の基本的活用方法や項目の異常値割合による選別方法等が設定されている。
【0066】
上記各設定内容は、この解析装置を適用する対象に固有の条件があった場合には、解析フロー設定ファイル群(設定ファイルRF1〜RF7)に対し必要な設定を追加又は変更することで容易に対応できる。
【0067】
(実施の形態2:データ解析のモード指定選択処理について)
本発明の実施の形態2は、既にクレンジング済みの解析対象データが得られている場合に、解析処理以降を自動的に行う構成である。データ解析装置30の構成は実施の形態1と同様であり説明を省略する。なお、実施の形態1で説明したデータ解析手段33における具体的なデータ解析処理についてこの実施の形態2で補足説明する。
【0068】
図15は、本発明の実施の形態2における解析処理の選択画面を示す図である。入出力データそれぞれのファイル名を選択すると図示のように表示項目40が表示される。表示項目40は4つの処理解析モードが表示されており、1〜4のいずれかを選択できる。1「装置履歴データ解析」,2「装置履歴+上位(n)候補時刻データ解析」,3「装置履歴+第1候補時刻データ解析」,4「Manual(手動解析)」である。
【0069】
図16は、入力データの内容を説明するための図表である。同図は、前述した図5(製造情報データベースDB1)に相当する。入力データは、図16に示すように、各ロット番号毎に、説明変数とする各工程の使用装置名と処理時刻、目的変数とする歩留り値等からなるCSV形式のファイルである。
【0070】
データ解析装置30のデータ抽出手段31は、上記の製造情報データベースDB1を取り込み自動的にデータ解析をして注目すべき工程の装置名や処理時刻を絞り込む。図12を用いて説明した項目設定ファイルRF2では、説明変数の使用装置名は工程名に付加文字列”_e”、処理時刻には工程名に付加文字列”_t”を付与する。即ち、工程Aでの使用装置名、処理時刻は各々”A_e”、”A_t”である。
【0071】
また、日付型項目を示す付加文字列として”_t”の他に、”_時刻”、”_DAY_TIME”が定義され、後者2つは代表識別文字列である”_t”に変換されて扱われる。装置項目を示す識別文字列についても同様である。これにより、異なるデータソースから収集されたデータであっても同一のカテゴリデータ種として扱えるようになる。
【0072】
上記の設定により、解析処理時には、付加文字列”_t”、”_時刻”、”_DAY_TIME”が付いたものを時刻データとみなし、一方、付加文字列”_e”、”_装置”、”_EQUIP”が付いたものを装置データとみなし、各処理モードに対応した解析処理を自動実行する。なお、自動実行は、上記4「Manual(手動解析)」以外のモード選択時に行われる。
【0073】
また、プログラム初期化ファイルINIの一部を構成している抽出条件設定ファイルRF1,項目設定ファイルRF2の設定内容に基づき、どのようなカテゴリのデータを説明変数として有しているかを判断する。そして、図12に例示した項目設定ファイルRF2の設定に基づき、工程の使用装置と処理時刻を有していると判断する。ここで、プログラム初期化ファイルINIの設定内容と一致する識別文字列がデータ内の項目にない場合は、全てマニュアル解析となる(図4における処理モード指定時ステップS1の時期の判断)。
【0074】
図17は、解析用データ2(DATA2)の一例を示す図表である。データ解析手段33にはこの解析用データに対する回帰木分析を行う。その結果、全8ロットの歩留りに影響を及ぼすのは工程1〜4の使用装置とその処理時刻であるとの解析結果を得る。図18は、解析処理結果の一例であるトレンドグラフを示す図である。横軸はロット番号、縦軸は歩留りである。同図には、工程2_eを構成する装置V201,V202について、ある期間に処理した4ロット(Lot2〜Lot5)の歩留りが高い状態と、工程2の装置V202で処理したロットの歩留りが低い状態が解析結果として得られる。
【0075】
次に、上記各処理モード別の解析処理を説明する。
(1)Manual(手動解析)
図15に示した解析処理の選択画面で「Manual(手動解析)」を選択すると、変数選択の項目リストL1に必要な項目が表示される。図19は、手動解析時の項目設定時の画面を示す図である。項目リストL1には、目的変数とする数値項目K1,説明変数とする文字項目K2が一覧表示されており、必要な数値項目K1,文字項目K2の選択と、条件設定を手動で行った後に解析処理を実行する。
【0076】
図20は、手動解析時の項目設定後の画面を示す図である。図示の例は、目的変数として選択した歩留りが目的変数リストS1に表示される。説明変数としては、全工程の使用装置と処理時刻(工程1_e〜工程4_e,工程1_t〜工程4_t)を選択した状態が説明変数リストS2に表示される。データ解析手段33は、この設定に基づき解析処理プログラムを実行する。上記データ解析の結果を図21に示す。図21は、全工程の使用装置と処理時刻を指定してデータ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【0077】
(2)装置履歴データ解析
図22は、装置履歴データ解析時における項目設定画面を示す図である。図15に示した解析処理の選択画面で「装置履歴データ解析」を選択すると、項目リストL1の文字項目K2には、各工程での使用装置を示す”_e”が付加文字列であるものだけが説明変数として自動的に一覧表示される。この後、手動で数値項目K1,文字項目K2に一覧表示された目的変数、説明変数を選択し、目的変数リストS1,説明変数リストS2に表示させる。
【0078】
データ解析手段33は、この設定に基づき説明変数が装置履歴であるものだけを用いて回帰木分析を実行する。上記データ解析の結果を図23に示す。図23は、全工程の履歴を指定してデータ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【0079】
図23によれば、工程2による処理装置差が最も有意(工程2が第一候補)であることが分かる。ただし、これだけでは時系列で見た場合の有意差が不明である。歩留りの低いロットが多い装置V202は、偶然に悪い期間(例えば、プロセス条件の一時的な変更等の使用装置以外の要因による変動があった期間等)に多くのロットを処理していた可能性もある。
【0080】
(3)装置履歴+上位候補時刻データ解析
図24は、装置履歴データ解析時における項目設定画面を示す図である。図15に示した解析処理の選択画面で「装置履歴+上位候補時刻データ解析」を選択すると、項目リストL1に時刻項目以外の全項目(目的変数とする数値項目K1,説明変数とする文字項目K2)が自動的に一覧表示される。この後、手動で数値項K1,文字項目K2に一覧表示された目的変数、説明変数を選択し、目的変数リストS1,説明変数リストS2に表示させる。
【0081】
データ解析手段33は、これら設定された目的変数と説明変数に基づき、回帰木分析を実行する。以上の処理は「(2)装置履歴データ解析」と同じ処理を実行しこの状態での結果は図23と同じである。
【0082】
次に、データ解析手段33は、得られたデータ解析結果を自動的に抽出し、回帰木図内および回帰木図の最上階層での集合分割の評価候補であるEvaluation Dataに挙げられた工程の処理時刻を新たに説明変数として追加する処理を行い、再度回帰木分析を自動的に実行する。
【0083】
この際、全4工程の処理時刻が説明変数として追加される。ここで、工程の使用装置名に対応する工程処理時刻の項目は、付加文字列を除いたものが同一であることに基づき抽出する。具体的に説明すると、2回目の回帰木分析では1回目で指定された説明変数に対して、時刻項目工程1_t,工程2_t,工程3_t,工程4_tが追加される。上記データ解析の結果を図25に示す。図25は、全工程の履歴と時刻データを指定してデータ解析を行った結果の回帰木と結果評価情報一覧を示す図である。なお、この図25に示す結果は前述した図21と同じになる。2回目のデータ解析の処理結果は新たに”EQ_Time”という名称のフォルダに保存される。
【0084】
上記結果によれば、工程1の時刻による差が最も有意であることが確認できるが、Evaluation Dataによる上位3候補(工程2,4の処理時刻)の差を確認すると、差がまったく同じで交絡していると想定される。実際にこれらの各工程でロットを処理した時刻の並び(順番)はまったく同じで、次の工程3についてもほとんど同様の推移(トレンド)が得られる。
【0085】
1回目の回帰木分析で出力されるEvaluation Dataを3項目目までとした場合は、図23に示したEvaluation Dataに挙がっている項目のうち工程1_eは除外され、かつ回帰木図内にも存在しない。このため、2回目の回帰木分析では工程1_tは説明変数として追加されないこととなる。図26は、工程を限定して再度データ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【0086】
(4)装置履歴+第1候補時刻データ解析
図27は、装置履歴+第1候補時刻データ解析時における項目設定画面を示す図である。図15に示した解析処理の選択画面で「装置履歴+第1候補時刻データ解析」を選択すると、項目リストL1には、目的変数とする数値項目K1,説明変数とする文字項目K2には時刻項目以外の全項目が自動的に一覧表示される。この後、手動で数値項目K1,文字項目K2に一覧表示された目的変数、説明変数を選択し、目的変数リストS1,説明変数リストS2に表示させる。
【0087】
データ解析手段33は、この設定に基づき説明変数が装置履歴であるデータだけを用いて回帰木分析を実行する。以上の解析処理は「(2)装置履歴データ解析」と同じ解析処理を行う。解析処理の結果は自動的に抽出され、Evaluation Dataに時刻データとして第一候補に挙がった項目のみを説明変数に追加し、再度回帰木分析を実行するまでを自動的に行う。本実施の形態では工程2の処理時刻が説明変数として追加される。図28は、工程を限定して再度データ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【0088】
前述した「(3)装置履歴+上位候補時刻データ解析」の処理モードで行った解析では交絡している各工程の時刻データ項目がまとまってEvaluation Dataの上位に挙げられる。この場合、実際の数百工程の時刻項目を説明変数にすると、回帰木図内を含めて各工程の時刻データ項目だけが出力される。これら各工程の時刻データ項目は交絡している場合が多く、代表になる時刻データは1項目だけで良い場合が多い。そこで、あらかじめ各装置単位のデータを説明変数として歩留りに関する回帰木分析を行い、その結果で第1候補になった工程を用いて、第1候補工程の時刻データのみを時刻データの代表として説明変数に追加し、再度、歩留りに関する回帰木分析を行う。
【0089】
2回目の解析の処理結果は、新たに”EQ_TimeXX”(XX:最初に時刻データが挙がった順位)という名称のフォルダに保存される。図29は、あるロット単位の不良率トレンドグラフを示す図である。図中横軸は各ロット、縦軸は各ロットの不良率である。図示の例では、非常に稀にしか発生しない不良が特定の8ロット(LOT3,4,6,7,8,K,L,M)で高い割合で生じていることが示されている。
【0090】
図30は、説明変数と目的変数を指定した決定木を示す図である。説明変数として工程の使用装置名、処理時刻を用い、目的変数として前記不良発生の8ロットが”H”,他の15ロットが”L”を指定して決定木分析を実行した結果が示されている。決定木図内の集合分岐は全て時刻項目である。そして、半導体製造工程においては、ほぼロット番号順に処理されていくので、時刻データは全てがほぼ交絡し、説明変数としてはほぼ等価であるといえる。従って、どの時刻データを採用しても大差がないので時刻データとしては最も有意とされた1項目に絞っても大差がなく、解析結果がむしろ解釈しやすいものとなる。
【0091】
図31は、説明変数と目的変数をさらに指定した決定木を示す図である。この図31には、図30の決定木図においてA工程の処理時刻A_tが最も目的変数に対して有意とされ、次に説明変数からA_t以外の時刻データを全て削除した説明変数による決定木分析結果が示されている。同図に示す最上階層での集合分岐は、図30と同様にA工程の処理時刻A_tによるが、以下はほとんどこのA工程の処理時刻A_tと等価である時刻データが除去されているため、その背後に隠れていた使用装置による差が現れる。
【0092】
これによると、工程DでDM2号機を使用し、工程EでEM4号機を使用した場合に高不良率となることが示されている。図32は、図31の結果を処理時刻別のトレンドグラフで表した状態を示す図である。図には工程EのEM4号機の時間変動が高不良率の時間変動に影響を及ぼしていたことが明確に現れている。
【0093】
以上説明した実施の形態2によれば、実施の形態1で説明したデータ解析の自動化では行えない作業、特にオペレータが注目したい事項を特定してデータ解析を行う場合や、生産設備の各生産工程に配置される生産装置の入れ替え等に対応したデータ解析を適切に行えるようになる。
【0094】
(実施の形態3:一台装置工程に関する他の処理例)
前述した実施の形態1において説明したデータ解析手段33の解析処理「(1)装置履歴+時刻データ解析の設定」によれば、
▲1▼製造工程全体が先入れ先出しでロットを処理する場合、基本的にどの工程においてもロットの処理順番が同じであり、各工程の処理時刻は説明変数としては一つあれば十分である。
▲2▼一台装置工程は、装置間差を確認することができない工程であるため、問題となる要因をその一台装置の経時変化に求める。
▲3▼さらに、装置台数が多い工程ほど、回帰木分析で2分割集合間の有意差が出やすい。
【0095】
これら▲1▼〜▲3▼の3つの事柄を応用して、本実施の形態では一台装置工程を含む全ての工程処理時刻は一つの説明変数で代表でき、かつ処理時刻による変動要因としては一台装置工程が他の複数台装置工程と同等以上に疑わしいと判断して、自動的に問題要因として疑わしい項目を絞り込むものである。
【0096】
この実施の形態3では、製造工程全体が先入れ先出しでロットを処理する場合、データクレンジング/特徴化手段32は、実施の形態1で説明した「(2)経時変化に基く装置名の変更設定及び処理」及び「(3)一台装置工程における項目名変更」で説明した各処理と異なり、説明変数名及び説明変数値名を変えずに一台装置工程に関する処理を行う。これにより、実施の形態1に比べて処理を単純にでき、データ件数、即ちレコード数(ロット数)が少ない場合における目的変数の外れ値による悪影響を抑えるようにしたものである。
【0097】
図33は、実施の形態3によるデータ解析手順を示すフローチャートである。処理内容を説明すると、実施の形態1で説明した「(1)異常値処理条件設定及び処理」を実行後の解析用データ1(DATA1)に対し、
【0098】
▲1▼一台装置工程抽出(リスト作成)
▲2▼代表項目として全一台装置工程の中で工程順の中間に位置する工程を選び、値は時刻(間隔尺度)とする。項目名は”一台装置工程時刻”とする。
▲3▼”一台装置工程時刻”を解析用データの説明変数に加え、他の全ての工程時刻項目は説明変数から除外する各処理を行い解析用データ2(DATA2)を得る(ステップS20)。図34は、抽出された一台装置工程リストREP2の一例を示す図表である。
【0099】
この後、解析用データ2(DATA2)に対しては、実施の形態1で説明した「(4)不要項目削除設定及び処理,(5)異常値割合による項目削除及びレコード削除設定及び処理,(6)時刻データの解析条件設定及び処理」、データ解析手段33でのデータ解析処理(回帰木分析実施)、解析結果評価手段34での解析結果評価を実行し(ステップS21)、解析終了条件を満たすと(ステップS22:Yes)、一台装置工程リストを含む報告レポートを作成し、これら報告レポートREP1と一台装置工程リストREP2を出力する(ステップS23)。
【0100】
次に、上記解析用データ2(DATA2)に対する解析処理について説明する。図35は、実施の形態3において用いる解析用データ2(DATA2)の一例を示す図表である。図示のように、工程5の使用装置が全てV501であり、この工程5が一台装置工程とされる。図36は、図35に示すロット番号別の歩留りを示す図である。
【0101】
図37は、図35に示す各工程の使用装置名と処理時刻を説明変数、歩留り値を目的変数とした場合の回帰木と結果評価情報一覧を示す図である。図37に示すように、最上階層での集合分岐の候補を示すEvaluation Dataの上位3項目は交絡しており、そのうちの一つの工程5_tは、工程5の処理時刻である。工程5の使用装置工程5_eは、種類数が1であるため回帰木分析実行時には説明変数から削除される。
【0102】
そして、Evaluation Dataに挙げられたうち、目的変数に対してその時刻変動が効いているとされた工程(ここでは、工程1,工程2,工程3,工程4,工程5)について対応する処理時刻を示す項目が抽出され、各項目の処理装置を示す項目でその種類数が1であるものが抽出される。
【0103】
上記のように、実施の形態3によれば、一台装置工程時刻に代表される経時変化による有意差が大きいことを抽出することができる。また、一台装置工程リストREP2の記載によって、一台装置工程に該当する工程を容易に把握できるようになる。図37に示す例における一台装置工程は、「工程5であり、この一つの工程」となる。
【0104】
以上説明したデータ解析処理に係る方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、各種記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【0105】
(付記1)所望するデータ解析に必要なデータをオリジナルデータの中から抽出するデータ抽出工程と、
前記データ抽出工程により抽出されたデータの異常値をデータクレンジングするデータクレンジング工程と、
前記データクレンジング工程によりデータクレンジングされたデータの特徴情報を求める特徴化工程と、
前記特徴化工程により求められた特徴情報を用いてデータの解析を行うデータ解析工程と、
を含むことを特徴とするデータ解析方法。
【0106】
(付記2)生産工程の品質の変動を示す目的変数と、該目的変数の変動を説明する説明変数とを含むプロセスデータのデータ解析を行うデータ解析方法において、
所望するデータ解析に必要なデータを前記プロセスデータの中から抽出するデータ抽出工程と、
前記データ抽出工程により抽出されたデータの説明変数の異常値をデータクレンジングするデータクレンジング工程と、
前記データクレンジング工程によりデータクレンジングされたデータの目的変数の変動を表す特徴情報を求める特徴化工程と、
前記特徴化工程により求められた特徴情報を用いて前記目的変数の変動要因を探索するためのデータ解析を行うデータ解析工程と、
を含むことを特徴とするデータ解析方法。
【0107】
(付記3)前記データ抽出工程は、前記データの説明変数の項目名にカテゴリを識別するための付加文字列を付加し、
前記データ解析工程は、前記付加文字列に基づき説明変数のカテゴリを識別したデータ解析を行うことを特徴とする付記2に記載のデータ解析方法。
【0108】
(付記4)前記データ抽出工程は、前記生産工程が備える生産装置を示す説明変数の項目名に対しては製造工程名に装置のカテゴリを意味する付加文字列を付加し、該生産装置が生産対象を生産した処理時刻を示す説明変数の項目名に対しては製造工程名に時刻のカテゴリを意味する付加文字列を付加することを特徴とする付記3に記載のデータ解析方法。
【0109】
(付記5)前記データ抽出工程による付加文字列を付加する指示と、及び前記データ解析工程におけるカテゴリを識別したデータ解析の指示とをあらかじめ設定ファイルに設定する設定工程を含み、
前記データ抽出工程及び前記データ解析工程は、それぞれの処理実行時に前記設定ファイルを読み出し、該設定ファイルに設定された指示に基づく処理を実行することを特徴とする付記3または4に記載のデータ解析方法。
【0110】
(付記6)前記特徴化工程は、時刻経過による目的変数の変動に関する特徴を求め、前記データの説明変数として用いられる前記生産装置の装置名に対し、前記求められた特徴に対応する所定の記号を付加することを特徴とする付記2〜5のいずれか一つに記載のデータ解析方法。
【0111】
(付記7)ある一つの生産工程に生産装置が一台のみ設けられる場合、
前記データクレンジング工程は、前記一台の生産装置に相当する装置名の説明変数をデータ解析対象から外すとともに、前記生産工程の処理時刻に相当する説明変数の項目名に前記一台の生産装置のみによって構成された工程であることを示す付加文字列を付加し、
前記データ解析工程は、前記データクレンジング工程にて付加文字列が付加された前記一台の生産装置のみによって構成された工程に対しては処理時刻の説明変数を用いたデータ解析を行うことを特徴とする付記2〜6のいずれか一つに記載のデータ解析方法。
【0112】
(付記8)前記データクレンジング工程は、前記プロセスデータのうち生産装置に関係するデータ以外のデータを説明変数の項目名に基づいて削除することを特徴とする付記2〜7のいずれか一つに記載のデータ解析方法。
【0113】
(付記9)前記データクレンジング工程は、前記プロセスデータのうち項目及びレコードに対して所定の異常値の割合を超えた項目及びレコードと、目的変数の値が欠損あるいは異常なレコードとを削除することを特徴とする付記2〜8のいずれか一つに記載のデータ解析方法。
【0114】
(付記10)前記データクレンジング工程は、前記生産装置の説明変数が処理時刻を示すデータを処理時刻データとして扱う設定と、生産工程における所定の周期を用いて期間を区切った際に該期間名のデータとして扱う設定とを選択可能なことを特徴とする付記2〜9のいずれか一つに記載のデータ解析方法。
【0115】
(付記11)前記生産工程の全てが生産対象のロットを先入れ先出しにより順次処理する場合、
前記データ解析工程は、全ての生産工程の装置項目と、全ての生産工程における上位数Nの候補となる処理時刻を解析対象の説明変数として用いることを特徴とする付記2〜10のいずれか一つに記載のデータ解析方法。
【0116】
(付記12)前記生産工程が生産対象のロットを先入れ先出しせずに独立処理する場合、
前記データ解析工程は、各生産工程の処理時刻についてそれぞれが独立した処理時刻であるか否かを判別する独立時刻判別工程と、
前記独立時刻判別工程によって独立していないと判別された生産工程の処理時刻をまとめて一つの代表時刻の項目を作成する代表時刻項目作成工程と、
全ての生産工程の生産装置の項目と、前記代表時刻項目作成工程により作成された代表時刻の項目をデータ解析対象の説明変数として用いることを特徴とする付記2〜10のいずれか一つに記載のデータ解析方法。
【0117】
(付記13)前記データ解析工程は、解析すべきデータの特徴性や規則性を表すルールをデータマイニング技法により抽出することを特徴とする付記2〜12のいずれか一つに記載のデータ解析方法。
【0118】
(付記14)前記データ解析工程により前記データのロットあるいは処理時刻を変化させて得た複数の解析結果を用いて所定の総合評価値を得る評価工程を含むことを特徴とする付記2〜13のいずれか一つに記載のデータ解析方法。
【0119】
(付記15)前記評価工程は、前記ルールの信頼度を表す情報として、前記データ解析工程により解析して得たデータの集合を2分割する際の分割の明確度を表す集合分割評価値を求めることを特徴とする付記14に記載のデータ解析方法。
【0120】
(付記16)前記評価工程は、前記集合分割評価値として次の式で表されるtの値を用いることを特徴とする付記15に記載のデータ解析方法。
【数3】
Figure 0004275359
【0121】
(付記17)前記評価工程により得られた評価結果に基づき、前記生産設備の問題となる前記生産工程、前記生産装置、あるいは前記処理時刻のいずれかを絞り込んだ報告レポートを出力するレポート出力工程を含むことを特徴とする付記16に記載のデータ解析方法。
【0122】
(付記18)前記生産工程の全てが生産対象のロットを先入れ先出しにより順次処理し、ある一つの生産工程に生産装置が一台のみ設けられる場合、
前記特徴化工程は、前記一台の生産装置からなる製造工程のリストを作成することを特徴とする付記2〜17のいずれか一つに記載のデータ解析方法。
【0123】
(付記19)生産工程の品質の変動を示す目的変数と、該目的変数の変動を説明する説明変数とを含むプロセスデータのデータ解析を行うデータ解析装置において、
所望するデータ解析に必要なデータを前記プロセスデータの中から抽出するデータ抽出手段と、
前記データ抽出手段により抽出されたデータの説明変数の異常値をデータクレンジングするデータクレンジング手段と、
前記データクレンジング手段によりデータクレンジングされたデータの目的変数の変動を表す特徴情報を求める特徴化手段と、
前記特徴化手段により求められた特徴情報を用いて前記目的変数の変動要因を探索するためのデータ解析を行うデータ解析手段と、
を備えたことを特徴とするデータ解析装置。
【0124】
(付記20)前記データクレンジング手段によりデータクレンジングされたデータの説明変数に対し、データ項目のカテゴリを示す付加文字列を付加する説明変数変換手段を備え、
前記データ解析手段は、前記付加文字列に基づきデータ項目のカテゴリを認識しカテゴリ別の解析処理を実行することを特徴とする付記19に記載のデータ解析装置。
【0125】
(付記21)前記説明変数変換手段は、データに含まれる説明変数及び目的変数の一覧を抽出し、データ解析に用いる説明変数及び目的変数を手動選択可能なことを特徴とする付記20に記載のデータ解析装置。
【0126】
(付記22)生産工程の品質の変動を示す目的変数と、該目的変数の変動を説明する説明変数とを含むプロセスデータのデータ解析を行うデータ解析プログラムであって、該プログラムは、コンピュータに対し、
所望するデータ解析に必要なデータを前記プロセスデータの中から抽出させ、
前記抽出されたデータの説明変数の異常値をデータクレンジングさせ、
前記データクレンジングされたデータの目的変数の変動を表す特徴情報を求めさせ、
前記特徴情報を用いて前記目的変数の変動要因を探索するためのデータ解析を行わせ、
前記データ解析によって得られた解析結果に対する所定の評価を行わせることを特徴とするデータ解析プログラム。
【0127】
【発明の効果】
本発明によれば、解析対象のデータを適切に抽出し、データクレンジング及び特徴化を行ってデータ解析を実行するものであり、特に、データカテゴリに対応する付加文字列をデータの説明変数に付加することにより、データの種別やデータカテゴリ間の関連性を明確にして所望するデータ解析処理を自動実行できるようになり、省資源で効率的に行えるという効果を奏する。加えて、手動によりデータ解析の条件設定等を行う場合においても、操作ミスを防ぐことができ、所望する解析処理と解析結果を得ることができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るデータ解析装置に用いられる計算機システムのハードウェア構成を示す図である。
【図2】プロセスデータの流れを説明するための図である。
【図3】図1に示すシステム構成により実現されるデータ解析装置の機能ブロック図である。
【図4】本発明のデータ解析装置におけるデータの処理手順の概要を示すフローチャートである。
【図5】解析用データ1(DATA1)の内容の一部を示す図表である。
【図6】データクレンジング後の解析用データ2(DATA2)の内容の一部を示す図表である。
【図7】装置名に付与されるトレンドマークを示す図表である。
【図8】解析結果データ(DATA3)に基づく評価処理の内容を説明するための図表である。
【図9】報告レポートの内容の一例を示す図である。
【図10】データ解析処理の処理手順を示すフローチャートである。
【図11】データクレンジング設定ファイルRF3の一部を示す図表である。
【図12】項目設定ファイルRF2の一部を示す図表である。
【図13】データクレンジング設定ファイルRF3の一部を示す図表である。
【図14】解析設定ファイルRF5と探索設定ファイルRF6の一部を示す図表である。
【図15】本発明の実施の形態2における解析処理の選択画面を示す図である。
【図16】入力データの内容を説明するための図表である。
【図17】解析用データ2(DATA2)の一例を示す図表である。
【図18】解析処理結果の一例であるトレンドグラフを示す図である。
【図19】手動解析時の項目設定時の画面を示す図である。
【図20】手動解析時の項目設定後の画面を示す図である。
【図21】全工程の使用装置と処理時刻を指定してデータ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【図22】装置履歴データ解析時における項目設定画面を示す図である。
【図23】全工程の履歴を指定してデータ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【図24】装置履歴データ解析時における項目設定画面を示す図である。
【図25】全工程の履歴と時刻データを指定してデータ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【図26】工程を限定して再度データ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【図27】装置履歴+第1候補時刻データ解析時における項目設定画面を示す図である。
【図28】工程を限定して再度データ解析を行った結果の回帰木と結果評価情報一覧を示す図である。
【図29】あるロット単位の不良率トレンドグラフを示す図である。
【図30】説明変数と目的変数を指定した決定木を示す図である。
【図31】説明変数と目的変数をさらに指定した決定木を示す図である。
【図32】図31の結果を処理時刻別のトレンドグラフで表した状態を示す図である。
【図33】本発明の実施の形態3によるデータ解析手順を示すフローチャートである。
【図34】抽出された一台装置工程リストREP2の一例を示す図表である。
【図35】実施の形態3において用いる解析用データ2(DATA2)の一例を示す図表である。
【図36】図35に示すロット番号別の歩留りを示す図である。
【図37】図35に示す各工程の使用装置名と処理時刻を説明変数、歩留り値を目的変数とした場合の回帰木と結果評価情報一覧を示す図である。
【図38】一般的なデータ解析処理の手順を示すフローチャートである。
【符号の説明】
1 入力装置
2 中央処理装置
3 出力装置
4 記憶装置
10a〜10n 工程装置
11 管理サーバ
DB1 製造情報データベース
30 データ解析装置
31 データ抽出手段
32 データクレンジング/特徴化手段
33 データ解析手段
34 解析結果評価手段
35 報告レポート出力手段
40 表示項目
A1 総合判定内容
A2 統計的情報
A3 回帰木図
A4 箱髭図
A5 相関図
DATA1 解析用データ1
DATA2 解析用データ2
K1 目的変数とする数値項目
K2 説明変数とする文字項目
L1 項目リスト
RF 設定ファイル
RF1 抽出条件設定ファイル
RF2 項目設定ファイル
RF3 データクレンジング設定ファイル
RF4 特徴化設定ファイル
RF5 解析設定ファイル
RF6 探索設定ファイル
RF7 報告条件設定ファイル
REP1 報告レポート
REP2 一台装置工程リスト
S1 目的変数リスト
S2 説明変数リスト

Claims (7)

  1. 生産工程の品質の変動を示す目的変数と、該目的変数の変動を説明する説明変数とを含むプロセスデータのデータ解析を行うデータ解析方法において、
    記憶装置に記憶された前記プロセスデータが入力される入力工程と、
    前記入力工程によって入力されたプロセスデータに含まれる各項目のうちの前記目的変数および前記説明変数の指定を受け付ける受付工程と、
    データ抽出手段によって、前記入力工程によって入力されたプロセスデータの中から、前記受付工程によって指定された目的変数および説明変数を抽出するデータ抽出工程と、
    データクレンジング/特徴化手段によって、前記データ抽出工程により抽出されたデータの説明変数の異常値を特定値に置き換えることによりデータクレンジングするデータクレンジング工程と、
    前記データクレンジング/特徴化手段によって、前記データクレンジング工程によりデータクレンジングされたデータの目的変数の変動を表す特徴情報を求める特徴化工程と、
    データ解析手段によって、前記特徴化工程により求められた特徴情報を用いて前記目的変数の変動要因を探索するためのデータ解析を行うデータ解析工程と、
    解析結果評価手段によって、前記データ解析工程により解析して得たデータの集合を2分割する際の分割の明確度を表す集合分割評価値を求める評価工程と、
    前記評価工程により得られた評価結果に基づく報告レポートを出力するレポート出力工程と、を含み、
    ある一つの生産工程に生産装置が一台のみ設けられる場合、
    前記データクレンジング工程は、前記一台の生産装置に相当する装置名の説明変数をデータ解析対象から外すとともに、前記生産工程の処理時刻に相当する説明変数の項目名に前記一台の生産装置のみによって構成された工程であることを示す付加文字列を付加し、
    前記特徴化工程は、前記一台の生産装置の目的変数の変動を表す特徴情報を求め、
    前記データ解析工程は、前記データクレンジング工程にて付加文字列が付加された前記一台の生産装置のみによって構成された工程に対しては処理時刻の説明変数を用いたデータ解析を行うことを特徴とするデータ解析方法。
  2. 前記データ抽出工程は、前記データの説明変数の項目名にカテゴリを識別するための付加文字列を付加し、
    前記データ解析工程は、前記付加文字列に基づき説明変数のカテゴリを識別したデータ解析を行うことを特徴とする請求項1に記載のデータ解析方法。
  3. 前記特徴化工程は、時刻経過による目的変数の変動に関する特徴を求め、前記データの説明変数として用いられる前記生産装置の装置名に対し、前記求められた特徴に対応する所定の記号を付加することを特徴とする請求項1または2に記載のデータ解析方法。
  4. 前記データクレンジング工程は、前記プロセスデータのうち生産装置に関係するデータ以外のデータを説明変数の項目名に基づいて削除することを特徴とする請求項1〜3のいずれか一つに記載のデータ解析方法。
  5. 前記データクレンジング工程は、前記プロセスデータのうち項目及びレコードに対して所定の異常値の割合を超えた項目及びレコードと、目的変数の値が欠損あるいは異常なレコードとを削除することを特徴とする請求項1〜4のいずれか一つに記載のデータ解析方法。
  6. 前記生産工程の全てが生産対象のロットを先入れ先出しにより順次処理する場合、
    前記データ解析工程は、全ての生産工程の装置項目と、全ての生産工程における上位数Nの候補となる処理時刻を解析対象の説明変数として用いることを特徴とする請求項1〜5のいずれか一つに記載のデータ解析方法。
  7. 前記生産工程が生産対象のロットを先入れ先出しせずに独立処理する場合、
    前記データ解析工程は、各生産工程の処理時刻についてそれぞれが独立した処理時刻で あるか否かを判別する独立時刻判別工程と、
    前記独立時刻判別工程によって独立していないと判別された生産工程の処理時刻をまとめて一つの代表時刻の項目を作成する代表時刻項目作成工程と、
    全ての生産工程の生産装置の項目と、前記代表時刻項目作成工程により作成された代表時刻の項目をデータ解析対象の説明変数として用いることを特徴とする請求項1〜6のいずれか一つに記載のデータ解析方法。
JP2002182064A 2002-06-21 2002-06-21 データ解析方法 Expired - Fee Related JP4275359B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002182064A JP4275359B2 (ja) 2002-06-21 2002-06-21 データ解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002182064A JP4275359B2 (ja) 2002-06-21 2002-06-21 データ解析方法

Publications (2)

Publication Number Publication Date
JP2004029971A JP2004029971A (ja) 2004-01-29
JP4275359B2 true JP4275359B2 (ja) 2009-06-10

Family

ID=31178725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002182064A Expired - Fee Related JP4275359B2 (ja) 2002-06-21 2002-06-21 データ解析方法

Country Status (1)

Country Link
JP (1) JP4275359B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4418693B2 (ja) * 2004-02-16 2010-02-17 株式会社イー・ファルコン 集団評価装置
JP4417897B2 (ja) 2005-09-14 2010-02-17 富士通マイクロエレクトロニクス株式会社 製造データ解析方法及び製造データ解析装置
JP5011830B2 (ja) * 2006-06-09 2012-08-29 富士通セミコンダクター株式会社 データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
WO2010100701A1 (ja) * 2009-03-06 2010-09-10 株式会社 東芝 学習装置、識別装置及びその方法
JP5045770B2 (ja) * 2010-02-24 2012-10-10 横河電機株式会社 プロセス解析システム
JP5215343B2 (ja) * 2010-03-17 2013-06-19 東芝テック株式会社 予測値算出装置
JP5327239B2 (ja) * 2011-01-31 2013-10-30 オムロン株式会社 データ収集装置、並びに、該データ収集装置の制御方法および制御プログラム
WO2013035680A1 (ja) * 2011-09-05 2013-03-14 日本電気株式会社 データ処理装置、条件付関数従属性ルール統合方法及びプログラム
JP5430702B2 (ja) * 2012-03-30 2014-03-05 三菱電機インフォメーションシステムズ株式会社 特異データ検出方法、特異データ検出プログラムおよび特異データ検出装置
JP5672336B2 (ja) * 2013-05-28 2015-02-18 オムロン株式会社 データ収集装置、並びに、該データ収集装置の制御方法および制御プログラム
JP6326510B2 (ja) * 2015-08-28 2018-05-16 株式会社日立製作所 評価システム、評価方法およびデータ解析システム
JP6856023B2 (ja) * 2015-09-30 2021-04-07 日本電気株式会社 最適化システム、最適化方法および最適化プログラム
CN112257435B (zh) * 2020-09-11 2024-05-14 安徽中科新辰技术有限公司 一种基于人工智能分词技术的警情数据治理方法
CN114022059B (zh) * 2022-01-06 2022-05-27 锱云(上海)物联网科技有限公司 产品的不良原因分析方法、***、终端设备和存储介质

Also Published As

Publication number Publication date
JP2004029971A (ja) 2004-01-29

Similar Documents

Publication Publication Date Title
JP4275359B2 (ja) データ解析方法
US7730023B2 (en) Apparatus and method for strategy map validation and visualization
US10664374B2 (en) Event analysis device, event analysis system, event analysis method, and event analysis program
CN102792282B (zh) 数据库管理方法、计算机、传感器网络***
JP6327234B2 (ja) イベント解析装置、イベント解析システム、イベント解析方法、およびイベント解析プログラム
US20140281760A1 (en) Management server, management system, and management method
JP2008511140A (ja) 局所的外れ値の検出のための方法および装置
JP5532053B2 (ja) 運用管理装置及び運用管理方法
KR20040045402A (ko) 제조 데이터를 분석하는 방법 및 장치
JP2008134705A (ja) データ処理方法及びデータ分析装置
US7577486B2 (en) Quality improvement system
US20030033291A1 (en) SQL execution analysis
TW583567B (en) Automatic intelligent system for performing yield rate improvement and multivariate analysis of production process parameters and method thereof
EP2256677A1 (en) Workflow processing program, method, and device
JP6244274B2 (ja) 相関ルール分析装置および相関ルール分析方法
Debuse et al. Building the KDD roadmap: A methodology for knowledge discovery
JP6684777B2 (ja) 製造物良・不良判定システムおよび製造物良・不良判定方法
KR20060114569A (ko) 특허정보시스템의 작동방법
US7203707B2 (en) System and method for knowledge asset acquisition and management
JP2002324206A (ja) データ解析方法及び装置
JP4446231B2 (ja) 製造データ分析方法及び装置
US7283928B2 (en) Computerized method and software for data analysis
WO2019012674A1 (ja) プログラムの統合解析管理装置及びその統合解析管理方法
TWI230349B (en) Method and apparatus for analyzing manufacturing data
JP4866520B2 (ja) データ解析方法、データ解析プログラムおよびデータ解析装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080609

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080730

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090115

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090303

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090304

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130313

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140313

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees