JP2022028363A - System identification device and system identification method - Google Patents
System identification device and system identification method Download PDFInfo
- Publication number
- JP2022028363A JP2022028363A JP2020131714A JP2020131714A JP2022028363A JP 2022028363 A JP2022028363 A JP 2022028363A JP 2020131714 A JP2020131714 A JP 2020131714A JP 2020131714 A JP2020131714 A JP 2020131714A JP 2022028363 A JP2022028363 A JP 2022028363A
- Authority
- JP
- Japan
- Prior art keywords
- system identification
- model
- parameter
- predetermined
- identification device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 42
- 238000011156 evaluation Methods 0.000 claims abstract description 29
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 33
- 230000000052 comparative effect Effects 0.000 description 6
- 238000013500 data storage Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000002939 conjugate gradient method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
Abstract
Description
本発明は、所定の動作を行う所定のシステムのモデルをシステム同定するシステム同定装置およびシステム同定方法に関する。 The present invention relates to a system identification device and a system identification method for system identification of a model of a predetermined system that performs a predetermined operation.
所定の動作を行う所定のシステムに対するシミュレーション(数値実験)では、前記システムのモデルが必要であり、また、前記システムの制御において、前記システムのモデルが利用される場合がある。このシミュレーションや制御では、その精度は、前記モデルの精度によって左右されるため、前記モデルを規定するパラメータを精度よく同定することが望まれる。このパラメータの同定方法は、例えば、特許文献1に開示されている。 A model of the system is required for a simulation (numerical experiment) for a predetermined system that performs a predetermined operation, and the model of the system may be used in controlling the system. In this simulation and control, the accuracy depends on the accuracy of the model, so it is desired to accurately identify the parameters that define the model. A method for identifying this parameter is disclosed in, for example, Patent Document 1.
前記特許文献1に開示されたパラメータ同定法は、鉛直多関節油圧マニピュレータの非線形モデルを表す状態空間方程式に基づき、前記鉛直多関節油圧マニピュレータの体積弾性率および流量係数を含む未知のパラメータを同定する。 The parameter identification method disclosed in Patent Document 1 identifies unknown parameters including the bulk modulus and flow coefficient of the vertical articulated hydraulic manipulator based on a state-space equation representing a nonlinear model of the vertical articulated hydraulic manipulator. ..
前記特許文献1に開示されたパラメータ同定法は、非線形モデルを同定できるが、本発明は、非線形に作用するパラメータを、複数ステップにわたり蓄積していく誤差を直接考慮しながらシステム同定できる新たなシステム同定装置およびシステム同定方法を提供することである。 The parameter identification method disclosed in Patent Document 1 can identify a non-linear model, but the present invention is a new system that can identify a system that directly considers an error accumulating parameters that act non-linear over a plurality of steps. It is to provide an identification device and a system identification method.
本発明者は、種々検討した結果、上記目的は、以下の本発明により達成されることを見出した。すなわち、本発明の一態様にかかるシステム同定装置は、所定の動作を行う所定のシステムのモデルをコンピュータによってシステム同定する装置であって、所定の入力値を前記システムに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムから得られる複数の実績データを取得する実績データ取得部と、前記所定の入力値を前記モデルに入力した場合に、前記複数の時点ごとに前記モデルによって推定される複数の推定データを取得する推定データ取得部と、前記複数の時点ごとに求められる前記実績データと前記推定データとの各差に基づく前記モデルの評価関数を、最小化することによって、前記パラメータを求めるパラメータ処理部とを備える。 As a result of various studies, the present inventor has found that the above object can be achieved by the following invention. That is, the system identification device according to one aspect of the present invention is a device that system-identifies a model of a predetermined system that performs a predetermined operation by a computer, and when a predetermined input value is input to the system, it is time-series. A performance data acquisition unit that acquires a plurality of performance data obtained from the system at each of a plurality of time points arranged in the line, and when the predetermined input value is input to the model, it is estimated by the model at each of the plurality of time points. The parameter is obtained by minimizing the estimation data acquisition unit that acquires a plurality of estimation data and the evaluation function of the model based on the difference between the actual data and the estimation data obtained at each of the plurality of time points. It is provided with a parameter processing unit for obtaining.
このようなシステム同定装置は、複数の時点ごとに求められる実績データと推定データとの各差に基づく前記モデルの評価関数を用いるので、非線形に作用するパラメータを、複数ステップにわたり蓄積していく誤差を直接考慮しながらシステム同定できる。 Since such a system identification device uses the evaluation function of the model based on the difference between the actual data and the estimated data obtained at each of a plurality of time points, an error of accumulating parameters acting non-linearly over a plurality of steps. The system can be identified while directly considering.
他の一態様では、上述のシステム同定装置において、前記パラメータ処理部は、前記評価関数を、前記モデルのパラメータがとり得る範囲を規定する拘束条件の下に、最小化することによって、前記パラメータを求める。 In another aspect, in the system identification apparatus described above, the parameter processing unit minimizes the evaluation function under a constraint condition that defines a range that the parameters of the model can take. Ask.
このようなシステム同定装置は、評価関数を、パラメータがとり得る範囲を規定する拘束条件の下に、最小化することによって、前記パラメータを求めるので、パラメータを、所定の条件を満たすように同定できる。 Such a system identification device obtains the parameter by minimizing the evaluation function under the constraint condition that defines the range that the parameter can take, so that the parameter can be identified so as to satisfy a predetermined condition. ..
他の一態様では、これら上述のシステム同定装置において、前記パラメータ処理部は、前記評価関数の勾配情報を用いた繰り返し計算によって前記パラメータを求める。 In another aspect, in these system identification devices described above, the parameter processing unit obtains the parameter by iterative calculation using the gradient information of the evaluation function.
このようなシステム同定装置は、評価関数の勾配情報を用いた繰り返し計算するので、パラメータを最適に収束できる。 Since such a system identification device repeatedly calculates using the gradient information of the evaluation function, the parameters can be optimally converged.
他の一態様では、これら上述のシステム同定装置において、前記所定のシステムは、油圧を生成する油圧ポンプと、前記油圧ポンプで生成された油圧を機械動力に変換する油圧アクチュエータと、前記油圧を制御する油圧制御弁とを備える油圧システムであり、前記所定の動作は、前記油圧アクチュエータで所定の対象物を動かす動作である。 In another aspect, in these system identification devices described above, the predetermined system controls a hydraulic pressure pump, a hydraulic pressure actuator that converts the hydraulic pressure generated by the hydraulic pressure pump into mechanical power, and the hydraulic pressure. It is a hydraulic system including a hydraulic control valve, and the predetermined operation is an operation of moving a predetermined object by the hydraulic actuator.
油圧システムは、通常、非線形に作用するパラメータを多数含むが、これによれば、油圧システムのモデルを精度よくシステム同定できるシステム同定装置が提供できる。 A hydraulic system usually contains a large number of parameters that act non-linearly, which can provide a system identification device capable of accurately system-identifying a model of a hydraulic system.
本発明の一態様にかかるシステム同定方法は、所定の動作を行う所定のシステムのモデルをコンピュータによってシステム同定する方法であって、所定の入力値を前記システムに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムから得られる複数の実績データを取得する実績データ取得工程と、前記所定の入力値を前記モデルに入力した場合に、前記複数の時点ごとに前記モデルによって推定される複数の推定データを取得する推定データ取得工程と、前記複数の時点ごとに求められる前記実績データと前記推定データとの各差に基づく前記モデルの評価関数を、最小化することによって、前記パラメータを求めるパラメータ処理工程とを備える。 The system identification method according to one aspect of the present invention is a method of system-identifying a model of a predetermined system performing a predetermined operation by a computer, and is arranged in time series when a predetermined input value is input to the system. A performance data acquisition process for acquiring a plurality of performance data obtained from the system at each of a plurality of time points, and a plurality of estimations made by the model at each of the plurality of time points when the predetermined input value is input to the model. The parameter is obtained by minimizing the estimation data acquisition process for acquiring the estimated data of the model and the evaluation function of the model based on the difference between the actual data and the estimated data obtained at each of the plurality of time points. It is equipped with a parameter processing process.
このようなシステム同定方法は、複数の時点ごとに求められる実績データと推定データとの各差に基づく前記モデルの評価関数を用いるので、非線形に作用するパラメータを、複数ステップにわたり蓄積していく誤差を直接考慮しながらシステム同定できる。 Since such a system identification method uses the evaluation function of the model based on the difference between the actual data and the estimated data obtained at each of a plurality of time points, an error of accumulating parameters that act non-linearly over a plurality of steps. The system can be identified while directly considering.
本発明にかかるシステム同定装置およびシステム同定方法は、非線形に作用するパラメータを、複数ステップにわたり蓄積していく誤差を直接考慮しながらシステム同定できる。 The system identification apparatus and system identification method according to the present invention can identify a system by directly considering an error accumulating over a plurality of steps of parameters acting non-linearly.
以下、図面を参照して、本発明の1または複数の実施形態が説明される。しかしながら、発明の範囲は、開示された実施形態に限定されない。なお、各図において同一の符号を付した構成は、同一の構成であることを示し、適宜、その説明を省略する。本明細書において、総称する場合には添え字を省略した参照符号で示し、個別の構成を指す場合には添え字を付した参照符号で示す。 Hereinafter, one or more embodiments of the present invention will be described with reference to the drawings. However, the scope of the invention is not limited to the disclosed embodiments. It should be noted that the configurations with the same reference numerals in the respective drawings indicate the same configurations, and the description thereof will be omitted as appropriate. In the present specification, when they are generically referred to, they are indicated by reference numerals without subscripts, and when they refer to individual configurations, they are indicated by reference numerals with subscripts.
(実施形態)
実施形態におけるシステム同定装置は、所定の動作を行う所定のシステムのモデルをコンピュータによってシステム同定する装置である。このシステム同定装置は、所定の入力値を前記システムに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムから得られる複数の実績データを取得する実績データ取得部と、前記所定の入力値を前記モデルに入力した場合に、前記複数の時点ごとに前記モデルによって推定される複数の推定データを取得する推定データ取得部と、前記複数の時点ごとに求められる前記実績データと前記推定データとの各差に基づく前記モデルの評価関数を、最小化することによって、前記パラメータを求めるパラメータ処理部とを備える。このようなシステム同定装置について、以下、より具体的に説明する。
(Embodiment)
The system identification device in the embodiment is a device that system-identifies a model of a predetermined system that performs a predetermined operation by a computer. This system identification device includes a performance data acquisition unit that acquires a plurality of performance data obtained from the system at each of a plurality of time points arranged in a time series when a predetermined input value is input to the system, and the predetermined input. When a value is input to the model, an estimation data acquisition unit that acquires a plurality of estimation data estimated by the model at each of the plurality of time points, and the actual data and the estimation data obtained at each of the plurality of time points. It is provided with a parameter processing unit for obtaining the parameters by minimizing the evaluation function of the model based on each difference from the above. Such a system identification device will be described in more detail below.
図1は、実施形態におけるシステム同定装置の構成を示すブロック図である。実施形態におけるシステム同定装置Dは、例えば、図1に示すように、入力部1と、出力部2と、インターフェース部(IF部)3と、制御処理部4と、記憶部5とを備える。
FIG. 1 is a block diagram showing a configuration of a system identification device according to an embodiment. As shown in FIG. 1, the system identification device D in the embodiment includes, for example, an input unit 1, an output unit 2, an interface unit (IF unit) 3, a control processing unit 4, and a
入力部1は、制御処理部4に接続され、例えば、システム同定の開始を指示するコマンド等の各種コマンド、および、システム同定の対象となる所定のシステムSの名称や、前記システムSに入力される入力値等の、システム同定装置Dを動作させる上で必要な各種データをシステム同定装置Dに入力する機器であり、例えば、キーボードやマウス等である。出力部2は、制御処理部4に接続され、制御処理部4の制御に従って、入力部1から入力されたコマンドやデータ、およびシステム同定装置Dで求めたモデルのパラメータ等を出力する機器であり、例えばCRTディスプレイ、液晶ディスプレイおよび有機ELディスプレイ等の表示装置やプリンタ等の印刷装置等である。 The input unit 1 is connected to the control processing unit 4, and is input to, for example, various commands such as a command for instructing the start of system identification, the name of a predetermined system S to be the target of system identification, and the system S. It is a device for inputting various data necessary for operating the system identification device D, such as an input value, into the system identification device D, for example, a keyboard, a mouse, or the like. The output unit 2 is a device connected to the control processing unit 4 and outputs commands and data input from the input unit 1 and model parameters obtained by the system identification device D according to the control of the control processing unit 4. For example, a display device such as a CRT display, a liquid crystal display and an organic EL display, a printing device such as a printer, and the like.
なお、入力部1および出力部2からいわゆるタッチパネルが構成されてもよい。このタッチパネルを構成する場合において、入力部1は、例えば抵抗膜方式や静電容量方式等の操作位置を検出して入力する位置入力装置であり、出力部2は、表示装置である。このタッチパネルでは、前記表示装置の表示面上に前記位置入力装置が設けられ、前記表示装置に入力可能な1または複数の入力内容の候補が表示され、ユーザが、入力したい入力内容を表示した表示位置を触れると、前記位置入力装置によってその位置が検出され、検出された位置に表示された表示内容がユーザの操作入力内容としてシステム同定装置Dに入力される。このようなタッチパネルでは、ユーザは、入力操作を直感的に理解し易いので、ユーザにとって取り扱い易いシステム同定装置Dが提供される。 A so-called touch panel may be configured from the input unit 1 and the output unit 2. In the case of configuring this touch panel, the input unit 1 is a position input device that detects and inputs an operation position such as a resistance film method or a capacitance method, and the output unit 2 is a display device. In this touch panel, the position input device is provided on the display surface of the display device, candidates for one or a plurality of input contents that can be input to the display device are displayed, and the user displays the input contents that he / she wants to input. When the position is touched, the position is detected by the position input device, and the display content displayed at the detected position is input to the system identification device D as the operation input content of the user. With such a touch panel, since the user can intuitively understand the input operation, the system identification device D that is easy for the user to handle is provided.
IF部3は、制御処理部4に接続され、制御処理部4の制御に従って、外部機器との間でデータの入出力を行う回路であり、例えば、シリアル通信方式であるRS-232CやRS-485のインターフェース回路、Bluetooth(登録商標)規格を用いたインターフェース回路、IrDA(Infrared Data Asscoiation)規格等の赤外線通信を行うインターフェース回路、および、USB(Universal Serial Bus)規格を用いたインターフェース回路等である。また、IF部3は、外部機器との間で通信を行う回路であり、例えば、データ通信カードや、IEEE802.11規格等に従った通信インターフェース回路等であってもよい。 The IF unit 3 is a circuit that is connected to the control processing unit 4 and inputs / outputs data to / from an external device according to the control of the control processing unit 4, for example, RS-232C or RS-, which is a serial communication method. An interface circuit of 485, an interface circuit using the Bluetooth (registered trademark) standard, an interface circuit for infrared communication such as the IrDA (Infrared Data Association) standard, and an interface circuit using the USB (Universal Serial Bus) standard. .. Further, the IF unit 3 is a circuit that communicates with an external device, and may be, for example, a data communication card, a communication interface circuit according to the IEEE802.11 standard, or the like.
記憶部5は、制御処理部4に接続され、制御処理部4の制御に従って、各種の所定のプログラムおよび各種の所定のデータを記憶する回路である。前記各種の所定のプログラムには、例えば、制御処理プログラムが含まれ、前記制御処理プログラムには、システム同定装置Dの各部1~3、5を当該各部の機能に応じてそれぞれ制御する制御プログラムや、所定の入力値をシステムSに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムSから得られる複数の実績データを取得する実績データ取得プログラムや、前記所定の入力値を前記システムSのモデルに入力した場合に、前記複数の時点ごとに前記モデルによって推定される複数の推定データを取得する推定データ取得プログラムや、前記複数の時点ごとに求められる前記実績データと前記推定データとの各差に基づく前記モデルの評価関数を、前記モデルのパラメータがとり得る範囲を規定する拘束条件の下に、最小化することによって、前記パラメータを求めるパラメータ処理プログラム等が含まれる。前記各種の所定のデータには、これら各プログラムを実行する上で必要なデータが含まれる。このような記憶部5は、例えば不揮発性の記憶素子であるROM(Read Only Memory)や書き換え可能な不揮発性の記憶素子であるEEPROM(Electrically Erasable Programmable Read Only Memory)等を備える。そして、記憶部5は、前記所定のプログラムの実行中に生じるデータ等を記憶するいわゆる制御処理部4のワーキングメモリとなるRAM(Random Access Memory)等を含む。なお、記憶部5は、比較的大容量となる学習データを記憶するために、大容量を記憶可能なハードディスク装置を備えてもよい。
The
制御処理部4は、システム同定装置Dの各部1~3、5を当該各部の機能に応じてそれぞれ制御し、所定の動作を行う所定のシステムSのモデルをシステム同定するための回路である。制御処理部4は、例えば、CPU(Central Processing Unit)およびその周辺回路を備えて構成される。制御処理部4には、前記制御処理プログラムが実行されることによって、制御部41、実績データ取得部42、推定データ取得部43およびパラメータ処理部44が機能的に構成される。
The control processing unit 4 is a circuit for system-identifying a model of a predetermined system S that controls each unit 1 to 3 and 5 of the system identification device D according to the function of each unit and performs a predetermined operation. The control processing unit 4 includes, for example, a CPU (Central Processing Unit) and its peripheral circuits. The control processing unit 4 is functionally configured with the
制御部41は、システム同定装置Dの各部1~3、5を当該各部の機能に応じてそれぞれ制御し、システム同定装置D全体の制御を司るものである。
The
実績データ取得部42は、所定の入力値をシステムSに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムSから得られる複数の実績データを取得するものである。実績データ取得部42は、例えば、図1に示すように、システムSに入力値を入力し、システムSから、所定のサンプリング間隔で、IF3を介して実績データを取り込むことで、時系列に並ぶ複数の時点ごとに前記システムSから得られる複数の実績データを取得する。この場合では、オンラインでパラメータが同定される。あるいは、例えば、所定の入力値をシステムSに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムSから得られる複数の実績データが入力部1を介して、破線で示すように、記憶部5に機能的に備えられる実績データ記憶部51に予め記憶され、実績データ取得部42は、実績データ記憶部51から、所定の入力値をシステムSに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムSから得られる複数の実績データを取得する。この場合では、オフラインでパラメータが同定される。
When a predetermined input value is input to the system S, the actual
なお、実績データ記憶部51に予め記憶される前記複数の実績データは、例えば、前記複数の実績データを管理するサーバ装置からネットワークおよびIF部3を介してダウンロードされてもよい。あるいは、例えば、実績データ記憶部51に予め記憶される前記複数の実績データは、前記複数の実績データを記憶する、USBメモリやSDカード(登録商標)等のメモリーカードからIF部3を介してダウンロードされてもよい。あるいは、例えば、CDドライブ装置やDVDドライブ装置がシステム同定装置Dにさらに備えられ、実績データ記憶部51に予め記憶される前記複数の実績データは、前記複数の実績データを記憶する、CD-R(Compact Disc Recordable)やDVD-R(Digital Versatile Disc Recordable)等の、コンピュータに読み取り可能な非一時的な記録媒体(Non-transitory computer readable medium)から、ダウンロードされてもよい。
The plurality of actual data stored in advance in the actual
推定データ取得部43は、前記所定の入力値を前記モデルに入力した場合に、前記複数の時点ごとにシステムSのモデルによって推定される複数の推定データを取得するものである。
The estimation
パラメータ処理部44は、前記複数の時点ごとに求められる前記実績データと前記推定データとの各差(各予測誤差)に基づく前記モデルの評価関数を、前記モデルのパラメータがとり得る範囲を規定する拘束条件の下に、最小化することによって、前記パラメータを求めるものである。
The
このような推定データ取得部43およびパラメータ処理部44について、以下、より具体的に説明する。
Such an estimation
推定データ取得部43およびパラメータ処理部44の処理は、次式(1)ないし式(5)の拘束条件付き最適化問題として表される。
これら式(1)ないし式(5)の拘束条件付き最適化問題は、次の手法によって解かれる。 The constrained conditional optimization problems of Eqs. (1) to (5) are solved by the following method.
従来の最小二乗法とは異なり、複数ステップにわたる二乗誤差を考慮するために、評価関数内の終端コストとランニングコストは、次式(8)および(9)のように設定される。
拘束条件の式(3)ないし式(5)を考慮して式(1)および式(2)を解くために、次式(10)のラグランジアンが導入される。
変分計算により、ラグランジアンの変分は、次式(12)のように得られる。
これらの必要条件に基づき、最適なパラメータθは、評価関数Jの勾配情報を用いた繰り返し計算により数値的に求められる。例えば、最適なパラメータθは、次式(16)のような更新則を繰り返し適用することで求められる。
まず、各時刻における状態の予測値x0、x1、・・・、xNが式(3)、式(4)および現在の推定値θを用いて導出される。次に、xNを式(13)に代入することでλN が導出される。すると、各時刻におけるラグランジュ乗数λ1、λ2、・・・、λN が式(14)を逆方向に解くことで導出される。これによって導出されたx0、x1、・・・、xおよびλ1、λ2、・・・、λNは、明らかに式(4)、式(13)および式(14)を満たすため、これらを用いた計算されたラグランジアンおよびその変分は、次式(17)および(18)を満たす。
式(18)は、dθの項のみをもつため、次式(19)のように書き換えられる。
十分に小さいηと式(16)および式(19)を用いて更新されたパラメータθは、常に評価関数Jを減少させる。よって、評価関数Jの局所最適値に到達するまで、すなわち、(∂J/∂θ)が十分小さくなる(=必要条件(15)が満たされる)までパラメータθを更新すると、パラメータθは、局所最適な値に収束する。なお、パラメータθを更新する際に、各パラメータが式(5)を満たすように更新範囲を制限する。 A sufficiently small η and the parameter θ updated with Eq. (16) and Eq. (19) always decrease the merit function J. Therefore, when the parameter θ is updated until the local optimum value of the evaluation function J is reached, that is, until (∂J / ∂θ) becomes sufficiently small (= the necessary condition (15) is satisfied), the parameter θ becomes local. Converges to the optimum value. When updating the parameter θ, the update range is limited so that each parameter satisfies the equation (5).
このように式(1)ないし式(5)の拘束条件付き最適化問題は、解かれる。 In this way, the constrained conditional optimization problem of Eqs. (1) to (5) is solved.
このようなシステム同定装置Dにおける入力部1、出力部2、IF部3、制御処理部4および記憶部5は、例えば、デスクトップ型やノート型等のコンピュータによって構成可能である。
The input unit 1, the output unit 2, the IF unit 3, the control processing unit 4, and the
次に、本実施形態の動作について説明する。図2は、前記システム同定装置の動作を示すフローチャートである。 Next, the operation of this embodiment will be described. FIG. 2 is a flowchart showing the operation of the system identification device.
このような構成のシステム同定装置Dは、その電源が投入されると、必要な各部の初期化を実行し、その稼働を始める。制御処理部4には、その制御処理プログラムの実行によって、制御部41、実績データ取得部42、推定データ取得部43およびパラメータ処理部44が機能的に構成される。モデルを求めるシステムSにおける式(1)ないし式(5)は、システム同定装置Dに予め入力され、記憶されているものとする。
When the power of the system identification device D having such a configuration is turned on, the necessary initialization of each part is executed and the system identification device D starts its operation. The control processing unit 4 is functionally configured with the
システム同定が開始されると、まず、システム同定装置Dは、制御処理部4のパラメータ処理部44によって、パラメータθを適用な値に初期化する(S1)。パラメータθの初期値は、繰り返し計算の初期値であるので、任意の値であってよい。
When the system identification is started, first, the system identification device D initializes the parameter θ to an applicable value by the
次に、システム同定装置Dは、制御処理部4の実績データ取得部42によって、モデルを求めるシステムSにおける、式(6)および式(7)の実績データを取得する(S2)。
Next, the system identification device D acquires the actual data of the equations (6) and (7) in the system S for which the model is obtained by the actual
次に、システム同定装置Dは、制御処理部4の推定データ取得部43によって、各時刻におけるシステムSの状態の予測値(各時刻におけるシステムSの推定データ)x0、x1、・・・、xNを式(3)、式(4)および現在のパラメータθ(前回の繰り返し計算で推定されたパラメータθ)を用いて求める(S3)。
Next, the system identification device D uses the estimation
次に、システム同定装置Dは、パラメータ処理部44によって、xNを式(13)に代入することでλN を求める(S4)。 Next, the system identification device D obtains λ N by substituting x N into the equation (13) by the parameter processing unit 44 (S4).
次に、システム同定装置Dは、パラメータ処理部44によって、式(16)および式(19)を用いてパラメータθを求めて更新する(S5)。
Next, the system identification device D obtains and updates the parameter θ by the
次に、システム同定装置Dは、パラメータ処理部44によって、(∂J/∂θ)が十分小さいか否かを判定する(S6)。より具体的には、パラメータ処理部44は、(∂J/∂θ)が、予め設定した、小さな所定の閾値以下であるか否かを判定する。この判定の結果、(∂J/∂θ)が、前記閾値以下で、十分小さい場合には、システム同定装置Dは、次に、処理S7を実行し、一方、前記判定の結果、(∂J/∂θ)が、前記閾値より大きく、十分小さくない場合には、システム同定装置Dは、処理を処理S2に戻す。これによって繰り返し計算が実行される。
Next, the system identification device D determines whether or not (∂J / ∂θ) is sufficiently small by the parameter processing unit 44 (S6). More specifically, the
この処理S7では、システム同定装置Dは、制御処理部4によって、この求めたパラメータθを出力部2に出力し、本処理を終了する。なお、必要に応じて、システム同定装置Dは、制御処理部4によって、この求めたパラメータθをIF部3を介して外部機器へ出力してもよい。 In this process S7, the system identification device D outputs the obtained parameter θ to the output unit 2 by the control process unit 4, and ends this process. If necessary, the system identification device D may output the obtained parameter θ to the external device via the IF unit 3 by the control processing unit 4.
以上説明したように、実施形態におけるシステム同定装置Dおよびこれに実装されたシステム同定方法は、複数の時点kごとに求められる実績データ;上付きバーxkと推定データ;xkとの各差に基づくシステムSのモデルの評価関数Jを用いるので、非線形に作用するパラメータθを、複数ステップにわたり蓄積していく誤差を直接考慮しながらシステム同定できる。1ステップ分の誤差のみを考慮してシステム同定する従来法に比べ、上記システム同定装置Dおよびシステム同定方法は、推定精度に優れている。 As described above, the system identification device D and the system identification method implemented therein are the actual data obtained at a plurality of time points k; the difference between the superposition bar x k and the estimated data; x k . Since the evaluation function J of the model of the system S based on the above is used, the parameter θ acting in a non-linear manner can be system-identified while directly considering the error accumulated over a plurality of steps. The system identification device D and the system identification method are superior in estimation accuracy as compared with the conventional method of system identification considering only an error of one step.
上記システム同定装置Dおよびシステム同定方法は、この評価関数Jを、パラメータθがとり得る範囲を規定する拘束条件θmin~θmaxの下に、最小化することによって、前記パラメータθを求めるので、パラメータθを、所定の条件を満たすように同定できる。 Since the system identification device D and the system identification method obtain the parameter θ by minimizing the evaluation function J under the constraint conditions θ min to θ max that define the range that the parameter θ can take. The parameter θ can be identified so as to satisfy a predetermined condition.
上記システム同定装置Dおよびシステム同定方法は、評価関数Jの勾配情報(∂J/∂θ)を用いた繰り返し計算するので(θ←θ-η(∂J/∂θ))、パラメータθを最適に収束できる。 Since the system identification device D and the system identification method are repeatedly calculated using the gradient information (∂J / ∂θ) of the evaluation function J (θ ← θ−η (∂J / ∂θ)), the parameter θ is optimal. Can converge to.
次に、油圧システムおよび機械システムの各モデルをシステム同定装置Dで求める実施例1および実施例2について説明する。 Next, Example 1 and Example 2 in which each model of the hydraulic system and the mechanical system is obtained by the system identification device D will be described.
(実施例1)
図3は、実施例1の油圧システムの構成を示す概略図である。図4は、実績値と実施例1の推定値と比較例の推定値との各比較結果を説明するための図である。図4Aは、油圧ポンプ61における吐出圧Ppの時間変化を示し、図4Bは、油圧アクチュエータ63にける第1ポート633の入出力圧Phの時間変化を示し、図4Cは、油圧アクチュエータ63における第2ポート634の入出力圧Prの時間変化を示し、これら各横軸は、経過時間であり、これら各縦軸は、圧力である。図4Dは、油圧アクチュエータ63におけるピストン位置xcの時間変化を示し、その横軸は、経過時間であり、その縦軸は、位置である。図4Eは、油圧アクチュエータ63におけるピストン速度の時間変化を示し、その横軸は、経過時間であり、その縦軸は、速度である。
(Example 1)
FIG. 3 is a schematic view showing the configuration of the hydraulic system of the first embodiment. FIG. 4 is a diagram for explaining each comparison result between the actual value, the estimated value of Example 1, and the estimated value of the comparative example. FIG. 4A shows the time change of the discharge pressure P p in the
実施例1は、モデルを求める、所定の動作を行う所定のシステムSが油圧システムであるケースである。この実施例1における油圧システム6は、例えば、図3に示すように、油圧を生成する油圧ポンプ61と、前記油圧ポンプ61で生成された油圧を機械動力に変換する油圧アクチュエータ63と、前記油圧を制御する油圧制御弁62とを備える。この油圧システム6では、前記所定の動作は、前記油圧アクチュエータ63で所定の対象物Obを動かす動作である。油圧アクチュエータ63は、シリンダ631とピストン632とを備え、シリンダ631は、その一方端に、油を入出力する第1ポート633と、その他方端に、油を入出力する第2ポート634とを備える。油圧ポンプ61は、油圧制御弁62に連結され、油圧制御弁62は、第1および第2ポート633、634それぞれに連結される。このような油圧システム6では、油圧ポンプ61で生成された油圧を、油圧制御弁62が第1ポート633から油を入力することで油圧アクチュエータ63に作用させ、ピストン632が前記一方端から前記他方端へ(紙面左側から右側へ)移動し、第2ポート634から油が出力されて油圧制御弁62に戻る。このピストン632の移動によって対象物Obが紙面左側から右側へ移動する。一方、油圧ポンプ61で生成された油圧を、油圧制御弁62が第2ポート634から油を入力することで油圧アクチュエータ63に作用させ、ピストン632が前記他方端から前記一方端へ(紙面右側から左側へ)移動し、第1ポート633から油が出力されて油圧制御弁62に戻る。このピストン632の移動によって対象物Obが紙面右側から左側へ移動する。
The first embodiment is a case where a predetermined system S for obtaining a model and performing a predetermined operation is a hydraulic system. The
このような油圧システム6の状態および状態方程式は、次式(20)および式(21)で表される。
なお、実施例1では、上記状態方程式を式(4)として適用するために、ルンゲ・クッタ法を用いて、微分方程式形式の状態方程式は、離散方程式に変換される。 In the first embodiment, in order to apply the equation of state as the equation (4), the equation of state in the form of a differential equation is converted into a discrete equation by using the Runge-Kutta method.
実施例1では、上述の実施形態におけるシステム同定装置Dによって、次式(22)のパラメータθがシステム同定された。ここで、パラメータθのVp、Vh、Vr、bFは、非線形に作用する。これらパラメータθは、その物理的な意味から正であるので、拘束条件として、θminは、0ベクトルに設定され、θmaxは、各要素が無限大であるベクトルに設定された。
上述の実施形態におけるシステム同定装置Dで式(22)のパラメータθをシステム同定することによって得られた油圧システム6のモデルにおけるシミュレーション結果が実線で図4に示されている。図4には、実績データが点線で示され、比較例のシミュレーション結果が一点鎖線で示されている。前記比較例は、油圧システム6を最小二乗法で近似したモデルである。
The simulation result in the model of the
実施形態におけるシステム同定装置Dは、比較例と比べ、非線形に作用するパラメータVp、Vh、Vr、bFを推定可能で、複数ステップ分の予測誤差を含めた推定が可能であるため、図4から、比較例より本実施例1の方が実績データを近似しており、システム同定したパラメータθを用いたシミュレーションの精度に優れることが見て取れる。 Compared to the comparative example, the system identification device D in the embodiment can estimate the parameters V p , V h , V r , and b F that act non-linearly, and can estimate including the prediction error for a plurality of steps. From FIG. 4, it can be seen that the actual data is closer to the actual data in the first embodiment than in the comparative example, and the accuracy of the simulation using the system-identified parameter θ is excellent.
(実施例2)
図5は、実施例2の機械システムの構成を示す概略図である。実施例2は、モデルを求める、所定の動作を行う所定のシステムSが機械システムであるケースである。この実施例2における機械システム7は、例えば、図5に示すように、バネ71を備えるダンパーである。この機械システム7では、前記所定の動作は、前記バネ71で所定の対象物Obを支持する動作である。
(Example 2)
FIG. 5 is a schematic view showing the configuration of the mechanical system of the second embodiment. The second embodiment is a case where a predetermined system S for obtaining a model and performing a predetermined operation is a mechanical system. The
このような機械システム7の状態および状態方程式は、次式(23)および式(24)で表される。
上記状態方程式を式(4)として適用するために、上記状態方程式は、例えばオイラー法を用いて次式(25)のように離散方程式に変換される。
ここで、tkは、離散時間kに対応する時刻である。上付きドットx(tk)は、時刻tkにおける、上付きドットxである。Δtは、時刻の離散化周期である。 Here, tk is a time corresponding to the discrete time k . The superscript dot x ( tk ) is the superscript dot x at time tk . Δt is the discretization period of time.
このような機械システム7も、上述の実施形態におけるシステム同定装置Dでシステム同定することによって、機械システム7のモデルが生成できる。
Such a
なお、上述の実施形態ならびに実施例1および実施例2では、例えば、式(6)および式(7)に示す1組の、時系列に並ぶ複数の時点ごとに前記システムから得られる複数の実績データが用いられたが、複数組の前記複数の実績データが用いられてもよい。これにより、パラメータθを更新するたびに使用する実績データを入れ替えることで、全ての実績データとの誤差を等しく反映したパラメータθが得られる。 In addition, in the above-mentioned embodiment and Example 1 and Example 2, for example, a set of a set shown in the formula (6) and the formula (7), a plurality of achievements obtained from the system at each of a plurality of time points arranged in a time series. Although the data was used, a plurality of sets of the plurality of actual data may be used. As a result, by exchanging the actual data to be used every time the parameter θ is updated, the parameter θ that equally reflects the error with all the actual data can be obtained.
また、上述の実施形態ならびに実施例1および実施例2では、拘束条件θmin~θmaxの下に、評価関数Jを最小化することによって、パラメータθが求められたが、拘束条件を考慮する必要が無いシステムSの場合には、拘束条件無しに、評価関数Jを最小化することによって、パラメータθが求められてもよい。 Further, in the above-described embodiment and in the first and second embodiments, the parameter θ is obtained by minimizing the evaluation function J under the constraint conditions θ min to θ max , but the constraint condition is taken into consideration. In the case of the system S, which is not necessary, the parameter θ may be obtained by minimizing the evaluation function J without any constraint condition.
また、上述の実施形態ならびに実施例1および実施例2において、評価関数Jにおける終端コストおよびランニングコストは、式(8)および式(9)に限定されるものではなく、モデルによって予測されるシステムの挙動と実際のシステムの挙動との差(予測誤差)に応じて値が増加する関数であれば、よい。 Further, in the above-described embodiment and in the first and second embodiments, the termination cost and the running cost in the evaluation function J are not limited to the equations (8) and (9), but are predicted by the model. Any function may be used as long as it is a function whose value increases according to the difference (prediction error) between the behavior of the system and the behavior of the actual system.
また、上述の実施形態ならびに実施例1および実施例2において、パラメータθの更新則は、古典的な勾配法の更新則である式(16)に限定されるものではなく、評価関数Jの勾配情報に基づく種々の勾配法が用いられてよい。例えば、共役勾配法や、慣性付き勾配法が用いられてもよい。 Further, in the above-described embodiment and in the first and second embodiments, the update rule of the parameter θ is not limited to the equation (16) which is the update rule of the classical gradient method, and the gradient of the evaluation function J is not limited to the equation (16). Various informed gradient methods may be used. For example, the conjugate gradient method or the gradient method with inertia may be used.
また、上述では、実施例1および実施例2によって、システム同定装置Dが油圧システム6および機械システム7に適用される例が示されたが、これらに限定されるものではなく、所定の動作を行う所定のシステムに広く適用可能である。
Further, in the above, Examples 1 and 2 show an example in which the system identification device D is applied to the
本発明を表現するために、上述において図面を参照しながら実施形態を通して本発明を適切且つ十分に説明したが、当業者であれば上述の実施形態を変更および/または改良することは容易に為し得ることであると認識すべきである。したがって、当業者が実施する変更形態または改良形態が、請求の範囲に記載された請求項の権利範囲を離脱するレベルのものでない限り、当該変更形態または当該改良形態は、当該請求項の権利範囲に包括されると解釈される。 In order to express the present invention, the present invention has been appropriately and sufficiently described through embodiments with reference to the drawings above, but those skilled in the art can easily modify and / or improve the above embodiments. It should be recognized that it is possible. Therefore, unless the modified or improved form implemented by a person skilled in the art is at a level that deviates from the scope of rights of the claims stated in the claims, the modified form or the improved form is the scope of rights of the claims. It is interpreted to be included in.
D システム同定装置
1 入力部
2 出力部
3 インターフェース部(IF部)
4 制御処理部
5 記憶部
41 制御部
42 実績データ取得部
43 推定データ取得部
44 パラメータ処理部
51 実績データ記憶部
D System identification device 1 Input unit 2 Output unit 3 Interface unit (IF unit)
4
Claims (5)
所定の入力値を前記システムに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムから得られる複数の実績データを取得する実績データ取得部と、
前記所定の入力値を前記モデルに入力した場合に、前記複数の時点ごとに前記モデルによって推定される複数の推定データを取得する推定データ取得部と、
前記複数の時点ごとに求められる前記実績データと前記推定データとの各差に基づく前記モデルの評価関数を、最小化することによって、前記パラメータを求めるパラメータ処理部とを備える、
システム同定装置。 A system identification device that uses a computer to identify a model of a predetermined system that performs a predetermined operation.
A performance data acquisition unit that acquires a plurality of performance data obtained from the system at each of a plurality of time points arranged in a time series when a predetermined input value is input to the system.
An estimation data acquisition unit that acquires a plurality of estimation data estimated by the model at each of the plurality of time points when the predetermined input value is input to the model.
It is provided with a parameter processing unit for obtaining the parameters by minimizing the evaluation function of the model based on the difference between the actual data and the estimated data obtained at each of the plurality of time points.
System identification device.
請求項1に記載のシステム同定装置。 The parameter processing unit obtains the parameter by minimizing the evaluation function under a constraint condition that defines a range that the parameter of the model can take.
The system identification apparatus according to claim 1.
請求項1または請求項2に記載のシステム同定装置。 The parameter processing unit obtains the parameter by iterative calculation using the gradient information of the evaluation function.
The system identification apparatus according to claim 1 or 2.
請求項1ないし請求項3のいずれか1項に記載のシステム同定装置。 The predetermined system is a hydraulic system including a hydraulic pressure pump that generates hydraulic pressure, a hydraulic actuator that converts the hydraulic pressure generated by the hydraulic pressure pump into mechanical power, and a hydraulic pressure control valve that controls the hydraulic pressure. Is an operation of moving a predetermined object with the hydraulic actuator.
The system identification apparatus according to any one of claims 1 to 3.
所定の入力値を前記システムに入力した場合に、時系列に並ぶ複数の時点ごとに前記システムから得られる複数の実績データを取得する実績データ取得工程と、
前記所定の入力値を前記モデルに入力した場合に、前記複数の時点ごとに前記モデルによって推定される複数の推定データを取得する推定データ取得工程と、
前記複数の時点ごとに求められる前記実績データと前記推定データとの各差に基づく前記モデルの評価関数を、最小化することによって、前記パラメータを求めるパラメータ処理工程とを備える、
システム同定方法。 It is a system identification method that identifies a model of a predetermined system that performs a predetermined operation by a computer.
A performance data acquisition process for acquiring a plurality of performance data obtained from the system at each of a plurality of time points arranged in a time series when a predetermined input value is input to the system.
An estimation data acquisition step of acquiring a plurality of estimation data estimated by the model at each of the plurality of time points when the predetermined input value is input to the model.
A parameter processing step for obtaining the parameters by minimizing the evaluation function of the model based on the difference between the actual data and the estimated data obtained at each of the plurality of time points is provided.
System identification method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020131714A JP2022028363A (en) | 2020-08-03 | 2020-08-03 | System identification device and system identification method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020131714A JP2022028363A (en) | 2020-08-03 | 2020-08-03 | System identification device and system identification method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022028363A true JP2022028363A (en) | 2022-02-16 |
Family
ID=80267568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020131714A Pending JP2022028363A (en) | 2020-08-03 | 2020-08-03 | System identification device and system identification method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022028363A (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60150109A (en) * | 1984-01-18 | 1985-08-07 | Hitachi Ltd | Identifying method of parameter |
JPH04213101A (en) * | 1990-11-05 | 1992-08-04 | Mitsubishi Heavy Ind Ltd | Process identifying device |
JPH05150803A (en) * | 1991-11-26 | 1993-06-18 | Yokogawa Electric Corp | Process identifying device |
JP2009003824A (en) * | 2007-06-25 | 2009-01-08 | Toyota Central R&D Labs Inc | Parameter identifying device and program thereof |
JP2015077643A (en) * | 2013-10-16 | 2015-04-23 | 国立大学法人信州大学 | Parameter identification method for vertical multijoint hydraulic manipulator, identification apparatus, and identification program |
JP2019057198A (en) * | 2017-09-22 | 2019-04-11 | 株式会社神戸製鋼所 | Parameter estimation method of hydraulic system |
JP2019168776A (en) * | 2018-03-22 | 2019-10-03 | 三菱重工業株式会社 | Parameter identification device and method and program thereof |
-
2020
- 2020-08-03 JP JP2020131714A patent/JP2022028363A/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60150109A (en) * | 1984-01-18 | 1985-08-07 | Hitachi Ltd | Identifying method of parameter |
JPH04213101A (en) * | 1990-11-05 | 1992-08-04 | Mitsubishi Heavy Ind Ltd | Process identifying device |
JPH05150803A (en) * | 1991-11-26 | 1993-06-18 | Yokogawa Electric Corp | Process identifying device |
JP2009003824A (en) * | 2007-06-25 | 2009-01-08 | Toyota Central R&D Labs Inc | Parameter identifying device and program thereof |
JP2015077643A (en) * | 2013-10-16 | 2015-04-23 | 国立大学法人信州大学 | Parameter identification method for vertical multijoint hydraulic manipulator, identification apparatus, and identification program |
JP2019057198A (en) * | 2017-09-22 | 2019-04-11 | 株式会社神戸製鋼所 | Parameter estimation method of hydraulic system |
JP2019168776A (en) * | 2018-03-22 | 2019-10-03 | 三菱重工業株式会社 | Parameter identification device and method and program thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111684366B (en) | Learning apparatus, learning method, and storage medium therefor | |
US7970482B2 (en) | Method and system for process control | |
JP6928669B2 (en) | Control system, factory system, learning system, estimation model generation method and actuator state estimation method | |
JP6781758B2 (en) | Systems for pressure flow measurement, non-temporary machine-readable media and methods of pressure flow control | |
JP2020086784A (en) | Manufacturing condition specification system and method | |
KR102577188B1 (en) | Create a control system for the target system | |
CN111684365B (en) | Learning apparatus, learning method and storage medium thereof | |
KR20220112681A (en) | Information processing device, recording medium, and process condition search method | |
JP2022028363A (en) | System identification device and system identification method | |
Senn et al. | Reducing the computational effort of optimal process controllers for continuous state spaces by using incremental learning and post-decision state formulations | |
CN114207729A (en) | Material property prediction system and material property prediction method | |
CN102597988A (en) | Thermodynamic process control based on pseudo-density root for equation of state | |
Karafyllis et al. | Output-feedback control of viscous liquid–tank system and its numerical approximation | |
WO2018194565A1 (en) | Monitoring the thermal health of an electronic device | |
JP6767355B2 (en) | Model building system and model building method | |
JP2009276981A (en) | Device, program, and method for tuning pid controller | |
JP7036128B2 (en) | Controls, control methods and programs | |
JP2010049392A (en) | Device for tuning pid controller, program for turning pid controller, and method for tuning pid controller | |
Cao et al. | Modeling and identification for soft sensor systems based on the separation of multi-dynamic and static characteristics | |
Li et al. | Model-based passive bilateral teleoperation with time delay | |
Hellwig et al. | Mutation strength control via meta evolution strategies on the ellipsoid model | |
JP7399832B2 (en) | Information processing device, information processing system, information processing method and program | |
Hedengren et al. | Order reduction of large scale DAE models | |
JP2005339004A (en) | Control device, device for adjustment of control parameter, method for adjustment of control parameter, program, and recording medium | |
JP6418537B1 (en) | Data prediction system, data prediction method, and data prediction program by regression analysis applying probability density function to explanatory variables |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231205 |