JP2013168020A - プロセスの状態予測方法 - Google Patents
プロセスの状態予測方法 Download PDFInfo
- Publication number
- JP2013168020A JP2013168020A JP2012030901A JP2012030901A JP2013168020A JP 2013168020 A JP2013168020 A JP 2013168020A JP 2012030901 A JP2012030901 A JP 2012030901A JP 2012030901 A JP2012030901 A JP 2012030901A JP 2013168020 A JP2013168020 A JP 2013168020A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- data
- local model
- vectors
- prediction method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 239000013598 vector Substances 0.000 claims abstract description 146
- 238000005259 measurement Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 101000911772 Homo sapiens Hsc70-interacting protein Proteins 0.000 description 1
- 101000585359 Homo sapiens Suppressor of tumorigenicity 20 protein Proteins 0.000 description 1
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】説明変数の数と過去事例数を併せて最適化することにより適切な局所モデルを構築することが可能なプロセスの状態予測方法を提供する。
【解決手段】プロセスの操業状態を示す観測データから構成される入力ベクトル及び出力ベクトルが対となって蓄積されたデータベースを作成し、予測したい時点における出力ベクトルに対応する入力ベクトルからなる要求点ベクトルに類似する近傍データベクトルをデータベースから取得し、近傍データベクトルから局所モデルを構築して、予測したい時点における出力ベクトルを求めるプロセスの状態予測方法において、入力ベクトルを構成する説明変数の数Mと近傍データベクトルの最大数NNMAXをパラメータとして複数の局所モデルを構築し、局所モデルによる予測値と実測値との誤差が最小となる局所モデルを選択する。
【選択図】図2
【解決手段】プロセスの操業状態を示す観測データから構成される入力ベクトル及び出力ベクトルが対となって蓄積されたデータベースを作成し、予測したい時点における出力ベクトルに対応する入力ベクトルからなる要求点ベクトルに類似する近傍データベクトルをデータベースから取得し、近傍データベクトルから局所モデルを構築して、予測したい時点における出力ベクトルを求めるプロセスの状態予測方法において、入力ベクトルを構成する説明変数の数Mと近傍データベクトルの最大数NNMAXをパラメータとして複数の局所モデルを構築し、局所モデルによる予測値と実測値との誤差が最小となる局所モデルを選択する。
【選択図】図2
Description
本発明は、プラント設備におけるプロセスの状態予測方法に関する。
あるプロセスについて、その状態を把握する必要があるとき、通常の計測機器では分析に時間がかかり、リアルタイムにプロセス状態を把握できないことがある。また、計測環境や計測対象によっては、計測機器の設置自体が困難な場合もある。プロセスの状態を示す明確な物理モデルが得られる場合は、高精度な予測値を計算によって求めることができるが、プラント設備におけるプロセスは複雑な物理化学現象が複合した形で発現することが殆どであるため、物理モデルで表せない場合が多い。
そこで、近年、計算機ハードウェアやデータベースシステム技術の進歩に伴い、大量データの蓄積と高速検索が可能になったこと等を背景に、“Just-In-Time(JIT)モデリング”と呼ばれる局所モデリング手法が注目されている。JITモデリングでは、観測したデータをデータベースに蓄積しておき、システムの予測等の必要が生じるたびに、入力である“要求点ベクトル”と関連性の高いデータベクトルをデータベースから近傍データベクトルとして検索し、検索した近傍データベクトルの出力を補間する局所モデルを構成して、“要求点ベクトル”の出力を予測する。この手法では、観測データの更なる蓄積があるたびに既存の局所モデルを廃棄し、再び新たな局所モデルを構築する。
JITモデリングでは、予測を行うたびに、データベースから要求点ベクトルと類似するデータベクトルを検索するため、データベースが大規模になると、計算負荷が大きくなりすぎるという問題がある。そのため、JITモデリングにステップワイズ法を適用して変数の低次元化を行う大規模データベースオンラインモデリング(LOM)という手法が開発されている。例えば、特許文献1、2では、熱反応炉の操業データからなる大規模データベースについて、ステップワイズ法を用いて炉頂ガス温度に対する寄与率が高い変数を選択して当該変数からなる新たなデータベースを作成し、新たなデータベースから取得した近傍データベクトルに基づいて構築した局所モデルを用いて炉頂ガス温度の予測を行っている。
なお、本明細書では、「要求点」と「近傍データ」がそれぞれベクトル量であることを明確にするため、「要求点」を「要求点ベクトル」、「近傍データ」を「近傍データベクトル」と記載する。また、データベクトルの集合である「データベクトル集合」を「データセット」と呼ぶことがある。
特許文献1、2において開示されているプロセスの状態予測方法では、ステップワイズ法を用いて、目的変数に対する寄与率が高い説明変数を選択している。具体的には、寄与率の指標であるF値に対する限界値を予め設定し、F値が限界値以上となるように説明変数が選択される。従って、ステップワイズ法では、限界値の設定が重要となるが、理論的に限界値を決定する方法が無く、経験的に限界値を決定しているという問題がある。
また、データベースを構成する過去事例数についても、採用する説明変数の数が変わると、それに応じて過去事例の最適数も変化するため、適切な局所モデルを構築するためには、説明変数の数と過去事例数を併せて最適化する必要がある。
また、データベースを構成する過去事例数についても、採用する説明変数の数が変わると、それに応じて過去事例の最適数も変化するため、適切な局所モデルを構築するためには、説明変数の数と過去事例数を併せて最適化する必要がある。
本発明はかかる事情に鑑みてなされたもので、説明変数の数と過去事例数を併せて最適化することにより適切な局所モデルを構築することが可能なプロセスの状態予測方法を提供することを目的とする。
上記目的を達成するため、本発明は、プラント設備におけるプロセスの操業状態を示す観測データから構成される入力ベクトル及び出力ベクトルが対となったデータベクトルが蓄積されたデータベースを作成し、予測したい時点における出力ベクトルに対応する入力ベクトルからなる要求点ベクトルに類似する前記データベクトルを近傍データベクトルとして前記データベースから少なくとも1つ以上取得し、前記近傍データベクトルから局所モデルを構築して、前記予測したい時点における出力ベクトルを予測するプロセスの状態予測方法において、
前記入力ベクトルを構成する説明変数の数Mと前記近傍データベクトルの最大数NNMAXをパラメータとして、前記近傍データベクトルが格納された近傍データベクトル集合を複数作成して前記各近傍データベクトル集合について主成分分析を実施し、前記要求点ベクトルに対するQ統計量が最小となる前記局所モデルを前記各近傍データベクトル集合ごとに構築して、前記局所モデルによる予測値と実測値との誤差を算出する工程と、
前記説明変数の数M及び前記近傍データベクトルの最大数NNMAXをパラメータとして構築された複数の前記局所モデルのなかで、前記誤差が最小となる前記局所モデルを選択する工程とを備えることを特徴としている。
前記入力ベクトルを構成する説明変数の数Mと前記近傍データベクトルの最大数NNMAXをパラメータとして、前記近傍データベクトルが格納された近傍データベクトル集合を複数作成して前記各近傍データベクトル集合について主成分分析を実施し、前記要求点ベクトルに対するQ統計量が最小となる前記局所モデルを前記各近傍データベクトル集合ごとに構築して、前記局所モデルによる予測値と実測値との誤差を算出する工程と、
前記説明変数の数M及び前記近傍データベクトルの最大数NNMAXをパラメータとして構築された複数の前記局所モデルのなかで、前記誤差が最小となる前記局所モデルを選択する工程とを備えることを特徴としている。
本発明では、入力ベクトルを構成する説明変数の数Mと近傍データベクトルの最大数NNMAX(過去事例数)の値を変えながら、各M値及び各NNMAX値ごとに局所モデルを構築し、各局所モデルによる予測値と実測値との誤差が最小となる局所モデルを選択するので、説明変数の数と過去事例数が併せて最適化され、適切な局所モデルを構築することが可能となる。
なお、局所モデルを構築する際に使用する主成分分析及びQ統計量は以下のような特徴を有している。
主成分分析では、変数間の相関関係を捉えるため、変数の線形結合によって主成分と呼ばれる新たな合成変数を作り出す。この主成分によって、対象とするデータベクトル集合の特徴を最も良く表現する部分空間を得ることができる。Q統計量は、主成分によって張られる部分空間では表現できない部分を表している。つまり、Q統計量は、対象とするデータベクトル集合と要求点ベクトルとの相関関係の非類似度を表し、Q統計量が小さいほど、要求点ベクトルに類似するデータベクトル集合であると判断できる。
主成分分析では、変数間の相関関係を捉えるため、変数の線形結合によって主成分と呼ばれる新たな合成変数を作り出す。この主成分によって、対象とするデータベクトル集合の特徴を最も良く表現する部分空間を得ることができる。Q統計量は、主成分によって張られる部分空間では表現できない部分を表している。つまり、Q統計量は、対象とするデータベクトル集合と要求点ベクトルとの相関関係の非類似度を表し、Q統計量が小さいほど、要求点ベクトルに類似するデータベクトル集合であると判断できる。
図1は、要求点ベクトルと近傍データベクトルとの相関関係を表した模式図である。図1(A)は、JITモデリングやLOMの場合を示しており、ベクトル間距離に基づいて近傍データベクトルを選択するため、異なる相関関係を有する近傍データベクトルが選択されるおそれがある。一方、図1(B)は、主成分分析及びQ統計量を用いた状態予測方法の場合を示しており、Q統計量を用いて、要求点ベクトルとデータベクトル集合(データセット)の相関関係を測るため、相関関係の高い○印のデータベクトル集合のみ選択される。
また、本発明に係るプロセスの状態予測方法では、前記局所モデルによる予測値と実測値との誤差は、二乗平均平方根誤差によって算出してもよく、評価区間全域に亘る誤差が単一の数値で示される。
本発明に係るプロセスの状態予測方法では、入力ベクトルを構成する説明変数の数Mと近傍データベクトルの最大数NNMAX(過去事例数)をパラメータとして作成した複数の近傍データベクトル集合それぞれについて主成分分析を実施し、要求点ベクトルに対するQ統計量が最小となる局所モデルを各近傍データベクトル集合ごとに構築して局所モデルによる予測値と実測値との誤差が最小となる局所モデルを選択するので、説明変数の数と過去事例数が併せて最適化され、適切な局所モデルを構築することが可能となる。
続いて、添付した図面を参照しつつ、本発明を具体化した実施の形態に付き説明し、本発明の理解に供する。
[プロセスの状態予測方法の概略手順]
先ず、本発明の一実施の形態に係るプロセスの状態予測方法の概略手順を以下に示す。
(A1)プラント設備におけるプロセスの操業状態を示す観測データから構成される入力ベクトル及び出力ベクトルが対となったデータベクトルが蓄積されたデータベースに関し、入力ベクトルを構成する説明変数の数Mの範囲と、予測したい時点における出力ベクトルに対応する入力ベクトルからなる要求点ベクトルに類似する近傍データベクトルの最大数NNMAX(過去事例数)の範囲を設定する。
先ず、本発明の一実施の形態に係るプロセスの状態予測方法の概略手順を以下に示す。
(A1)プラント設備におけるプロセスの操業状態を示す観測データから構成される入力ベクトル及び出力ベクトルが対となったデータベクトルが蓄積されたデータベースに関し、入力ベクトルを構成する説明変数の数Mの範囲と、予測したい時点における出力ベクトルに対応する入力ベクトルからなる要求点ベクトルに類似する近傍データベクトルの最大数NNMAX(過去事例数)の範囲を設定する。
(A2)説明変数の数M及び近傍データセットの最大数NNMAXの各範囲内において、M及びNNMAXを変化させながら、選択したM及びNNMAXそれぞれについて以下の処理を行う。
(A2−1)近傍データベクトルが格納された近傍データセット(近傍データベクトル集合)を近傍データベクトルの数を変えて(ただし、最大数NNMAXが上限である。)複数作成する。
(A2−2)作成した複数の近傍データセットについて主成分分析を実施して各近傍データセットごとに要求点ベクトルに対するQ統計量を算出し、Q統計量が最小となる近傍データセットを選択して局所モデルを構築する。
(A2−3)構築した局所モデルを用いて、予測したい時点における出力ベクトルの予測値を求め、実測値と比較してその誤差を算出する。
(A2−1)近傍データベクトルが格納された近傍データセット(近傍データベクトル集合)を近傍データベクトルの数を変えて(ただし、最大数NNMAXが上限である。)複数作成する。
(A2−2)作成した複数の近傍データセットについて主成分分析を実施して各近傍データセットごとに要求点ベクトルに対するQ統計量を算出し、Q統計量が最小となる近傍データセットを選択して局所モデルを構築する。
(A2−3)構築した局所モデルを用いて、予測したい時点における出力ベクトルの予測値を求め、実測値と比較してその誤差を算出する。
(A3)説明変数の数M及び近傍データセットの最大数NNMAXの各範囲内において構築された複数の局所モデルのなかで、実測値との誤差が最小となる局所モデルを選択する。
ここで、本実施の形態に係るプロセスの状態予測方法を構成する主要な手法について基本的な説明をしておく。
[JITモデリング]
現在の挙動と近似した挙動が過去に観測されていたならば、現在の挙動が進展する様子は過去のものと近似したものになるであろうと考えることができる。この考え方を再現した予測手法の1つがJust-In-Time(JIT)モデリングである。JITモデリングは決まったモデルを持たない代わりに、過去のデータベクトルをそのままデータベースとして保持する。プロセスの予測が必要となったとき、過去データが蓄積されたデータベースから、要求点ベクトルと類似性の高いデータベクトルを検索し、局所モデルを構築して出力の予測を行う手法である。
[JITモデリング]
現在の挙動と近似した挙動が過去に観測されていたならば、現在の挙動が進展する様子は過去のものと近似したものになるであろうと考えることができる。この考え方を再現した予測手法の1つがJust-In-Time(JIT)モデリングである。JITモデリングは決まったモデルを持たない代わりに、過去のデータベクトルをそのままデータベースとして保持する。プロセスの予測が必要となったとき、過去データが蓄積されたデータベースから、要求点ベクトルと類似性の高いデータベクトルを検索し、局所モデルを構築して出力の予測を行う手法である。
対象とするプロセスが非線形かつ動的なプロセスであるとき、次式の回帰モデルでそのプロセスを表すことができる。
ここで、プロセスの入力ベクトルxkと出力ベクトルykを以下のように定義する。つまり、出力ベクトルykは、k時における入力ベクトルxkに対する(k+p)時における出力、即ち予測値となる。
時間の経過と共に、入力ベクトルxkと出力ベクトルykのデータベクトルの組が(x1,y1),(x2,y2),…のように、対象とするプロセスから大量に得られ、データベクトル集合{(xk,yk)}(k=1,2,…)としてデータベースに蓄積される。kは離散化時間である。
予測したい時点における出力ベクトルykqに対応する入力ベクトルxkqを要求点ベクトルとし、要求点ベクトルと類似性が高い近傍データベクトルを上記データベースから取得する。要求点ベクトルと類似性が高い近傍データベクトルを選択する際の指標としては、次式で示すようなベクトル間距離(ユークリッド距離)などを用いることができる。
近傍データベクトル群{(xki,yki)}(i=1,2,…,m)が取得されると、この近傍データベクトル群を用いて局所モデルの構築を行い、出力ベクトルykqの予測を行う。局所モデルとしては、重回帰モデルや、以下に示す相加平均法あるいは重み付き線形平均法などが用いられる。
[主成分分析]
主成分分析は、データの特徴抽出及び低次元化を目的とする多変量解析手法であり、変数間の相関関係を捉えるため、変数の線形結合によって得られる主成分と呼ばれる合成変数を使用する。主成分分析では、データを最も良く表現できる方向に第1主成分を設定し、第1主成分と直交する空間上で、第1主成分では表現できないデータの変動を最も良く表現できる方向に第2主成分を設定するという手順で、主成分を次々と設定していく。ここで、データを最も良く表現する方向というのは、主成分得点の分散が最大となる方向という意味である。また、主成分得点とは、主成分が張る部分空間へデータを射影した値である。
主成分分析は、データの特徴抽出及び低次元化を目的とする多変量解析手法であり、変数間の相関関係を捉えるため、変数の線形結合によって得られる主成分と呼ばれる合成変数を使用する。主成分分析では、データを最も良く表現できる方向に第1主成分を設定し、第1主成分と直交する空間上で、第1主成分では表現できないデータの変動を最も良く表現できる方向に第2主成分を設定するという手順で、主成分を次々と設定していく。ここで、データを最も良く表現する方向というのは、主成分得点の分散が最大となる方向という意味である。また、主成分得点とは、主成分が張る部分空間へデータを射影した値である。
[Q統計量]
Q統計量は、データベクトルのうち、主成分によって張られる部分空間では表現できない部分を表す。Q統計量は二乗予測誤差とも呼ばれ、以下のように定義されている。
I行×J列のデータ行列Xがあるものとする。ここで、Jは変数の数、Iはサンプル数であり、各変数は標準化されている。
データ行列Xを特異値分解すると次式のようになる。
Q統計量は、データベクトルのうち、主成分によって張られる部分空間では表現できない部分を表す。Q統計量は二乗予測誤差とも呼ばれ、以下のように定義されている。
I行×J列のデータ行列Xがあるものとする。ここで、Jは変数の数、Iはサンプル数であり、各変数は標準化されている。
データ行列Xを特異値分解すると次式のようになる。
UとVは直交行列であり、対角行列Sの対角要素には特異値srが降順に並んでいる。採用する主成分の数をRとすると、第r主成分は負荷量行列VRの第r列vrで与えられる。
第r主成分得点trは(9)式で与えられ、第R主成分得点までをまとめて表現すると、(10)式となる。
第r主成分得点trは(9)式で与えられ、第R主成分得点までをまとめて表現すると、(10)式となる。
TRを元のJ次元空間上の座標で表すと、再構築データ行列X^は次のようになる。
このとき、Q統計量は次式で与えられる。
[誤差評価方法]
局所モデルによる予測値と実測値との誤差評価は、二乗平均平方根誤差(以下では、「RMSE」と呼ぶことがある。)によって行う。RMSEの定義式を(13)式に示す。
局所モデルによる予測値と実測値との誤差評価は、二乗平均平方根誤差(以下では、「RMSE」と呼ぶことがある。)によって行う。RMSEの定義式を(13)式に示す。
本実施の形態では、時刻t=t1からt=tMAXまでに亘る二乗平均平方根誤差RMSEI((14)式参照)を算出し、さらにデータ群による偏りを平均化するため、H個のデータ群それぞれについてRMSEIを算出して、そのトータル量RMSETOTAL((15)式参照)で評価する。例えば、RMSEIを24時間に亘って算出した誤差とし、RMSETOTALをH日間に亘って算出した誤差とするなどが考えられる。
[プロセスの状態予測方法の詳細手順]
続いて、図2及び図3のフローチャートに基づいて本実施の形態に係るプロセスの状態予測方法の手順について詳細に説明する。
(C1)プラント設備におけるプロセスの操業状態を示す観測データから構成される入力ベクトルxk及び出力ベクトルykのデータベクトルの組(xk,yk)(k=1,2,…)が蓄積された大規模データベース10を作成する。
(C2)入力ベクトルを構成する説明変数の数Mの最小値MMIN、最大値MMAX、増分値MINCと、近傍データベクトルの最大数NNMAX(過去事例数)の最小値NMIN、最大値NMAX、増分値NINCを設定する(ST10)。
続いて、図2及び図3のフローチャートに基づいて本実施の形態に係るプロセスの状態予測方法の手順について詳細に説明する。
(C1)プラント設備におけるプロセスの操業状態を示す観測データから構成される入力ベクトルxk及び出力ベクトルykのデータベクトルの組(xk,yk)(k=1,2,…)が蓄積された大規模データベース10を作成する。
(C2)入力ベクトルを構成する説明変数の数Mの最小値MMIN、最大値MMAX、増分値MINCと、近傍データベクトルの最大数NNMAX(過去事例数)の最小値NMIN、最大値NMAX、増分値NINCを設定する(ST10)。
(C3)説明変数の数Mの初期値をMMIN、近傍データセットの最大数NNMAXの初期値をNMINとする(ST11)。
(C4)出力ベクトルを構成する目的変数との単相関係数が大きな、即ち目的変数に対する寄与率が大きな上位M個の説明変数を選択し(ST12)、当該変数からなる新たなデータベース11を大規模データベース10から作成する。なお、目的変数と説明変数の間に時間遅れが存在する可能性がある場合は、見込まれる最大の時間遅れ変数も説明変数に加える。
作成されるデータベース11の構成を図4に示す。このデータベース11では、入力変数の数がM個、出力変数の数がL個、各変数のサンプル数がK個とされている。各データは日時に応じたIDが付けられ、同じIDに属するデータは1つのデータベクトルとして扱われる。
(C4)出力ベクトルを構成する目的変数との単相関係数が大きな、即ち目的変数に対する寄与率が大きな上位M個の説明変数を選択し(ST12)、当該変数からなる新たなデータベース11を大規模データベース10から作成する。なお、目的変数と説明変数の間に時間遅れが存在する可能性がある場合は、見込まれる最大の時間遅れ変数も説明変数に加える。
作成されるデータベース11の構成を図4に示す。このデータベース11では、入力変数の数がM個、出力変数の数がL個、各変数のサンプル数がK個とされている。各データは日時に応じたIDが付けられ、同じIDに属するデータは1つのデータベクトルとして扱われる。
(C5)予測したい時点における出力ベクトルYqに対応する入力ベクトルXqからなる要求点ベクトルを設定する(ST13)。図5に要求点ベクトルの構成を示す。
(C6)データベース11に格納されている各データベクトルと要求点ベクトルとのベクトル間距離を(4)式や(5)式を用いて計算し、ベクトル間距離が小さいものから順にNNMAX個の近傍データベクトルを全て収集する。そして、収集した近傍データベクトルを、ベクトル間距離が近い順に近傍データセットAとして保存する(ST14)。図6に近傍データセットAの構成を示す。図6において「No.」が近傍データ数を表している。
(C7)近傍データセットAの中から近傍データ数(No.)が1〜NNMINまでの近傍データベクトルを選択して近傍データセットB0を作成する(ST15)。即ち、要求点ベクトルとのベクトル間距離が近いものから順にNNMIN個の近傍データベクトルを選択する。図7に近傍データセットB0の構成を示す。
(C6)データベース11に格納されている各データベクトルと要求点ベクトルとのベクトル間距離を(4)式や(5)式を用いて計算し、ベクトル間距離が小さいものから順にNNMAX個の近傍データベクトルを全て収集する。そして、収集した近傍データベクトルを、ベクトル間距離が近い順に近傍データセットAとして保存する(ST14)。図6に近傍データセットAの構成を示す。図6において「No.」が近傍データ数を表している。
(C7)近傍データセットAの中から近傍データ数(No.)が1〜NNMINまでの近傍データベクトルを選択して近傍データセットB0を作成する(ST15)。即ち、要求点ベクトルとのベクトル間距離が近いものから順にNNMIN個の近傍データベクトルを選択する。図7に近傍データセットB0の構成を示す。
(C8)近傍データセットB0に対して主成分分析を実施し、負荷量行列VRを求める(ST16)。具体的には、近傍データセットB0をデータ行列Xとして特異値分解すればよい。
(C9)要求点ベクトルxqが(16)式で表されるとすると、要求点ベクトルxqを再構築した再構築ベクトルx^qは、負荷量行列VRを用いて(17)式により算出される。従って、近傍データセットB0に対するQ統計量は、(18)式より得ることができる(ST17)。算出されたQ統計量は、図8に示すQ値テーブルに保存される。
(C9)要求点ベクトルxqが(16)式で表されるとすると、要求点ベクトルxqを再構築した再構築ベクトルx^qは、負荷量行列VRを用いて(17)式により算出される。従って、近傍データセットB0に対するQ統計量は、(18)式より得ることができる(ST17)。算出されたQ統計量は、図8に示すQ値テーブルに保存される。
(C10)Q統計量が算出された近傍データセットB0の近傍データ数がNNMAX以上であるかどうか判断される(ST18)。近傍データ数がNNMAX未満である場合は、近傍データセットAの内、近傍データセットB0に含まれていない近傍データベクトルの中から、さらにS個の近傍データベクトルを、近傍データ数(No.)が小さいほうから(要求点ベクトルとのベクトル間距離が近いものから)選択し、近傍データセットB0に追加して新たな近傍データセットB1を作成する(ST19)。そして、ST16のステップに戻る。
(C11)一方、近傍データ数がNNMAX以上になった場合は、Q値テーブルに基づいて、Q統計量が最小となったデータセットBkをデータセットAから選択する。そして、データセットBkに対応する出力ベクトルを、データセットBkのIDに基づいてデータベース11から取得して、重回帰モデルや重み付き線形平均法などを用いて局所モデルを構築する(ST20)。
(C11)一方、近傍データ数がNNMAX以上になった場合は、Q値テーブルに基づいて、Q統計量が最小となったデータセットBkをデータセットAから選択する。そして、データセットBkに対応する出力ベクトルを、データセットBkのIDに基づいてデータベース11から取得して、重回帰モデルや重み付き線形平均法などを用いて局所モデルを構築する(ST20)。
(C12)時刻t=t1からt=tMAXまでに亘る二乗平均平方根誤差RMSEIを(14)式により算出し、H日間のトータル量であるRMSETOTALを(15)式により算出する(ST21)。
(C13)NNMAXがNMAX以上かどうかチェックが行われ(ST22)、NNMAXがNMAX未満の場合は、NNMAX+NINCを新規NNMAXに更新(ST25)してST14に戻る。
(C14)一方、NNMAXがNMAX以上の場合は、MがMMAX以上かどうかチェックが行われ(ST23)、MがMMAX未満の場合は、M+MINCを新規Mに更新(ST26)してST12に戻る。
(C15)MがMMAX以上の場合は、構築された複数の局所モデルのなかで、RMSETOTALが最小となる局所モデルを選択する(ST24)。
(C13)NNMAXがNMAX以上かどうかチェックが行われ(ST22)、NNMAXがNMAX未満の場合は、NNMAX+NINCを新規NNMAXに更新(ST25)してST14に戻る。
(C14)一方、NNMAXがNMAX以上の場合は、MがMMAX以上かどうかチェックが行われ(ST23)、MがMMAX未満の場合は、M+MINCを新規Mに更新(ST26)してST12に戻る。
(C15)MがMMAX以上の場合は、構築された複数の局所モデルのなかで、RMSETOTALが最小となる局所モデルを選択する(ST24)。
以上、本発明の一実施の形態について説明してきたが、本発明は何ら上記した実施の形態に記載の構成に限定されるものではなく、特許請求の範囲に記載されている事項の範囲内で考えられるその他の実施の形態や変形例も含むものである。例えば、上記実施の形態では、局所モデルによる予測値と実測値との誤差評価に、二乗平均平方根誤差を使用しているが、平均二乗誤差や平均絶対誤差等、他の評価方法を使用してもよい。
本実施の形態に係るプロセスの状態予測方法の効果について検証するため、熱反応炉の炉頂ガス温度の予測を行い、実測値との比較を行った。
検証に使用したデータは、2年間に亘るごみ処理プロセスにおいて測定された観測データである。取り込んだデータは、ノイズ除去のため、1時間の移動平均フィルタを掛けて平滑化した。サンプリング時間は20分、総データ数は38809個である。
図9は、検証時に設定した説明変数の数M及び過去事例数NNMAXに対して算出されたRMSETOTALの一覧を示したものである。本検証では、説明変数の数Mの最小値を20個、最大値を46個、増分値を2個とし、過去事例数NNMAXの最小値を100個、最大値を200個、増分値を50個として、RMSETOTALを算出した。その結果、説明変数の数Mが30個、過去事例数NNMAXが150個のときにRMSETOTALは最小となった。
なお、局所モデルの構築には重回帰モデルを使用した。
なお、局所モデルの構築には重回帰モデルを使用した。
本実施の形態に係るプロセスの状態予測方法によって構築された局所モデル(M=30、NNMAX=150)による予測値を実測値と対比した時刻歴グラフを図10に、従来の予測方法によって構築された局所モデル(M=20、NNMAX=150)による予測値を実測値と対比した時刻歴グラフを図11に、従来の予測方法によって構築された局所モデル(M=40、NNMAX=150)による予測値を実測値と対比した時刻歴グラフを図12にそれぞれ示す。
これらの図より、本実施の形態に係るプロセスの状態予測方法によって構築された局所モデルによる予測値が最も実測値に近く、従来の予測方法によって構築された局所モデルの場合、誤差が徐々に大きくなっていくことがわかる。
これらの図より、本実施の形態に係るプロセスの状態予測方法によって構築された局所モデルによる予測値が最も実測値に近く、従来の予測方法によって構築された局所モデルの場合、誤差が徐々に大きくなっていくことがわかる。
10:大規模データベース、11:データベース
Claims (2)
- プラント設備におけるプロセスの操業状態を示す観測データから構成される入力ベクトル及び出力ベクトルが対となったデータベクトルが蓄積されたデータベースを作成し、予測したい時点における出力ベクトルに対応する入力ベクトルからなる要求点ベクトルに類似する前記データベクトルを近傍データベクトルとして前記データベースから少なくとも1つ以上取得し、前記近傍データベクトルから局所モデルを構築して、前記予測したい時点における出力ベクトルを予測するプロセスの状態予測方法において、
前記入力ベクトルを構成する説明変数の数Mと前記近傍データベクトルの最大数NNMAXをパラメータとして、前記近傍データベクトルが格納された近傍データベクトル集合を複数作成して前記各近傍データベクトル集合について主成分分析を実施し、前記要求点ベクトルに対するQ統計量が最小となる前記局所モデルを前記各近傍データベクトル集合ごとに構築して、前記局所モデルによる予測値と実測値との誤差を算出する工程と、
前記説明変数の数M及び前記近傍データベクトルの最大数NNMAXをパラメータとして構築された複数の前記局所モデルのなかで、前記誤差が最小となる前記局所モデルを選択する工程とを備えることを特徴とするプロセスの状態予測方法。 - 請求項1記載のプロセスの状態予測方法において、前記局所モデルによる予測値と実測値との誤差は、二乗平均平方根誤差によって算出することを特徴とするプロセスの状態予測方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012030901A JP2013168020A (ja) | 2012-02-15 | 2012-02-15 | プロセスの状態予測方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012030901A JP2013168020A (ja) | 2012-02-15 | 2012-02-15 | プロセスの状態予測方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013168020A true JP2013168020A (ja) | 2013-08-29 |
Family
ID=49178375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012030901A Pending JP2013168020A (ja) | 2012-02-15 | 2012-02-15 | プロセスの状態予測方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013168020A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105913157A (zh) * | 2016-04-27 | 2016-08-31 | 熊运轩 | 消防应急照明与疏散指示***智能逃生逻辑矢量搜索算法 |
JP2017097803A (ja) * | 2015-11-27 | 2017-06-01 | 新日鐵住金株式会社 | 予測装置、方法及びプログラム |
KR20170079159A (ko) * | 2015-12-30 | 2017-07-10 | 주식회사 솔리드웨어 | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 |
CN110702889A (zh) * | 2019-09-23 | 2020-01-17 | 常州大学 | 邻苯二甲酸酯对水蚤毒性效应的预测方法、设备及介质 |
-
2012
- 2012-02-15 JP JP2012030901A patent/JP2013168020A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017097803A (ja) * | 2015-11-27 | 2017-06-01 | 新日鐵住金株式会社 | 予測装置、方法及びプログラム |
KR20170079159A (ko) * | 2015-12-30 | 2017-07-10 | 주식회사 솔리드웨어 | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 |
KR102044205B1 (ko) * | 2015-12-30 | 2019-11-13 | 주식회사 솔리드웨어 | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 |
CN105913157A (zh) * | 2016-04-27 | 2016-08-31 | 熊运轩 | 消防应急照明与疏散指示***智能逃生逻辑矢量搜索算法 |
CN110702889A (zh) * | 2019-09-23 | 2020-01-17 | 常州大学 | 邻苯二甲酸酯对水蚤毒性效应的预测方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5707230B2 (ja) | プロセスの状態予測方法 | |
JP5434837B2 (ja) | 品質予測装置、品質予測方法、プログラムおよびコンピュータ読み取り可能な記録媒体 | |
JP6525002B2 (ja) | メンテナンス時期決定装置、劣化予測システム、劣化予測方法および記録媒体 | |
JP5006214B2 (ja) | ばらつきシミュレーション・システム、ばらつき決定モデル方法と装置ならびにプログラム | |
JP5176206B2 (ja) | プロセスの状態類似事例検索方法及びプロセスの制御方法 | |
JP2009282926A (ja) | 時系列データ分析装置、方法及びプログラム | |
JP2013175108A (ja) | クラスタリング装置及びクラスタリングプログラム | |
KR20190072652A (ko) | 정보 처리 장치 및 정보 처리 방법 | |
JP2012178136A (ja) | 予測装置、予測方法、及び、プログラム | |
JP7144676B2 (ja) | 情報処理装置、品質関連式生成方法、および品質関連式生成プログラム | |
JP4488964B2 (ja) | プロセスの操業状態の制御方法及びコンピュータプログラム | |
Silva et al. | Damage detection in a benchmark structure using AR-ARX models and statistical pattern recognition | |
JP2013168020A (ja) | プロセスの状態予測方法 | |
JP5966836B2 (ja) | 評価支援方法、情報処理装置、及びプログラム | |
Ramya et al. | Environment change prediction to adapt climate-smart agriculture using big data analytics | |
JP5582487B2 (ja) | プロセスの状態予測方法 | |
CN113743453A (zh) | 一种基于随机森林的人口数量预测方法 | |
KR101884907B1 (ko) | 빅데이터 분석 기반 신뢰도 예측 방법 | |
TWI802294B (zh) | 實驗點推薦裝置、實驗點推薦方法及半導體裝置製造系統 | |
JP7353940B2 (ja) | 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム | |
JP5842704B2 (ja) | 推定装置、プログラム、及び推定方法 | |
JP4230890B2 (ja) | モデル同定装置,モデル同定プログラム及びモデル同定装置の動作方法 | |
JP6945511B2 (ja) | 推定装置、および推定方法 | |
Dai et al. | Life prediction method of hydrogen energy battery based on MLP and LOESS | |
JP2020052691A (ja) | 工数分析システム及びそのデータ構造 |