JPH0844710A - 擬似相関行列の近似を用いた逐次線型回帰モデル同定器 - Google Patents

擬似相関行列の近似を用いた逐次線型回帰モデル同定器

Info

Publication number
JPH0844710A
JPH0844710A JP20907194A JP20907194A JPH0844710A JP H0844710 A JPH0844710 A JP H0844710A JP 20907194 A JP20907194 A JP 20907194A JP 20907194 A JP20907194 A JP 20907194A JP H0844710 A JPH0844710 A JP H0844710A
Authority
JP
Japan
Prior art keywords
squares
equation
matrix
value
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP20907194A
Other languages
English (en)
Inventor
Koji Nanbara
興二 南原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP20907194A priority Critical patent/JPH0844710A/ja
Publication of JPH0844710A publication Critical patent/JPH0844710A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 擬似相関行列の正則性がない場合,優れた安
定性及び高い収束速度をもつモデル同定器を得る. 【構成】 適当な座標系上で,最小自乗法又は重み付き
最小自乗法の正規方程式の擬似相関行列を,その最大固
有値から決定されるスカラで近似し,そのとき求まる修
整量によって逐次推定値を改良する.

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】線型回帰モデルの係数の推定期待
値の収束性と推定値の分散の有界性を保証する推定値の
逐次更新型モデル同定器に関するものである.
【0002】
【従来の技術】線型回帰,あるいは,モデル同定問題で
は,最小自乗法がよく利用される.推定のための標本数
が少なくとも回帰係数の次数よりも大きくなければ,正
規方程式の擬似相関行列の正則性がえられないため,回
帰係数を決定できない.標本数の増加に対して,擬似相
関行列の漸近行列(存在するかどうかは必ずしも保証さ
れない)が正則となるとき,はじめて,回帰係数の推定
が可能となる.現実には,一種の線型方程式である正規
方程式を計算機によって解かなければならないから,計
算過程で生じる誤差に対する感度を下げるためにも,そ
して何よりも標本に含まれる誤差に対する感度を下げる
ためにも,擬似相関行列の最大固有値,最小固有値の比
である条件数が充分に1に近いという正則性を持ってい
なければならない.しかし,回帰係数の次数が高くなる
につれ,条件数は悪化しやすく,推定値が広く分散する
ことは避け難い.擬似相関行列の条件数の良否に左右さ
れる最小自乗法は必ずしも,充分に満足できるものでは
なく,現在でも,さまざまな改善が試みられている.
【0003】ところで,標本数を増加させることは,必
ずしも,条件数の,すなわち,推定の信頼性の向上を意
味しないばかりでなく,新たに加えられた標本による回
帰パラメータの推定値変化は極めて微小になる.もし,
標本の採集に時期的なズレがあり,しかも,パラメータ
が変化していたとすると,このパラメータ変化に対応し
た推定値は得られない.すなわち,標本数の増加ととも
に,状況変化への適応性は低下する.この適応性低下の
改善のため,重み付き最小自乗法が導入される.最小自
乗法が全ての標本に対して等しく重み付けを行なうのに
対して,比較的古い標本に軽い重み付けすることによっ
て,適応性の維持が図られる.しかしながら,このとき
も,擬似相関行列の正則性は保証されない.というより
も,元の最小自乗法よりも相関行列の変動が大きくなる
ため,条件数の悪化した推定の危険性が高まる.
【0004】最小自乗法に限らず重み付き最小自乗法で
も,完全な信頼性をあたえない.この悪化を防ぐため
に,説明変数が適当に分布している(制御工学では持続
的励振条件とか信号のリッチネス条件と呼ばれる条件を
満たす)標本を用意することにより正則性を保証するこ
とが考えられ,また,理論家の間ではよく提案される.
しかし,これは,対象が撹乱された状態にある,あるい
は,対象を撹乱状態におくことを意味し,撹乱実験が許
されない対象にはまったく無力であり,実験レベルで許
される仮定である.とくに,推定値を利用して適応的に
対象を安定した状態に導こうとする制御を考えている場
合,撹乱は矛盾した行為となり,受けいれ難い.したが
って,持続的励振条件,信号リッチネス条件のような条
件によって擬似相関行列の正則性を保証する必要がない
推定法が,実用性の点からは望ましいといえる.もちろ
ん,理想的な推定法は,このような条件が満たされてい
るときには,最小自乗法,あるいは,重み付き最小自乗
法と同等な推定結果をあたえるものでなくてはならな
い.
【0005】なお,最小自乗法,あるいは,重み付き最
小自乗法は,新しい標本が加えられたときの回帰パラメ
ータの推定値更新を逐次行なう,逐次最小自乗法,ある
いは,逐次重み付き最小自乗法と呼ばれる簡単な逐次化
アルゴリズムで等価表現することもできる.また,逐次
推定アルゴリズムには,この2つに限らず,非常に多く
の方法が提案されているが,推定の安定性と収束速度を
両立させるという点で,うえで指摘した推定法の課題を
完全には解決していない.
【0006】
【発明が解決しようとする課題】本発明の目的は,擬似
相関行列の正則性がない場合でも信頼性(推定値の有界
性)の失われない,そして,最小自乗法,あるいは,重
み付き最小自乗法により近い,したがって高速な推定値
収束が得られる逐次線型回帰モデル同定器を開発するこ
とにある.
【0007】
【課題を解決するための手段】具体的な解決策を示すま
えに,いましばらく,最小自乗法,重み付き最小自乗法
の問題点を詳しく述べることにする.被説明変数をy,
説明変数をx=(x,・・・,x〕,撹乱項をεと
する線型回帰モデル y=w・x+ε (1) を考える.ただし,xはある非零な定数とする.この
ことによって線型回帰モデルの一般性が失われることは
ない. いま,このモデルについて被説明変数y,説明
変数xの標本{y,x}が継続してあたえられるものと
し,新たな標本によって回帰係数w=〔w ・・・
〕の推定値を逐次,更新・改良する問題を考え
る,回帰係数の推定に対して,最小自乗法(least
squares),あるいは,その逐次形式である逐
次最小自乗法(recursiveleast squ
ares,RLS)は,よく用いられる代表的な方法で
あり,また,よく整備された理論をもつ基本的な方法で
ある.kという番号をつけられた標本の集合が,N
の標本{y〔k,j〕,x〔k,j〕}(j=1,2,
…,N)からなっているものとする.k番目の標本集
合に基づくwの推定値をw〔k〕とするとき,被説明
変数は y〔k,j〕=w〔k〕・x〔k,j〕+e〔k,j〕 (2) で表わすことができる.この残差e〔k,j〕の平方和
を最小とするw〔k〕をwの推定値として決定する方
法が最小自乗法である.このとき,撹乱項ε〔k,j〕
に対し以下の統計的性質 i) ε〔k,j〕の期待値E〔ε〔k,j〕〕=0. ii) ε〔k,j〕の分散cov〔ε〔k,j〕〕=
E〔(ε〔k,j〕−E〔ε〔k,j〕〕)〕=
σ. ただし,σは正の定数. iii) ε〔k,i〕とε〔k,j〕 (i≠j)は
無相関. を仮定すると,推定の期待値は最尤線型不偏推定量とし
てあたえられることが知られている.
【0008】k番目の標本集合について,αの重みつき
最小自乗法をもちいると,推定値w〔k〕は残差平方和
を最小にする
【数1】 の条件を満足する.ただし,α〔k,j〕≧0であり,
α〔k,j〕>0であるjがすくなくとも1つ存在する
ものとする.k−1番目の推定値w〔k−1〕とk番目
の推定値w〔k〕の差をΔw〔k〕とおくと, w〔k〕=w〔k−1〕+Δw〔k〕 (4) なる関係がえられる.一方, Δy〔k,j〕=y〔k,j〕−w〔k−1〕・x〔k,j〕 とすると,(2),(4)式より, Δy〔k,j〕=Δw〔k〕・x〔k,j〕+e〔k,j〕 となるから,(3)式の残差平方和を最小とする推定値
Δw〔k〕は,
【数2】 を満たす.ここで,上式を Δw〔k〕・A〔k〕・Δw〔k〕−2Δw〔k〕・b〔k〕+c〔k〕→ min (5) で書き改める.ただし,
【数3】 最小条件(5)式を満たす推定値Δw〔k〕は,正規方
程式 A〔k〕・Δw〔k〕=b〔k〕 (6) を満足する.Δw〔k〕がこの(6)式より求められる
とき,(4)式にしたがってw〔k〕をw〔k−1〕か
ら逐次更新することができる.このように更新される推
定量は,k番目の標本集合がk−1番目の集合に新たな
標本を1つ加えたものであるとき,時系列のモデル同定
に利用される逐次最小自乗法(RLS)と理論的に同じ
ものである.いま,正規方程式(6)式に含まれる説明
変数の擬似相関行列A〔k〕が正則でないとき解Δw
〔k〕は1意とはならず,最小自乗法あるいは,逐次最
小自乗法では推定値を決定することができない.この擬
似相関行列A〔k〕の正則性は標本集合に含まれる説明
変数の独立性にのみに依存するから,独立な説明変数に
よって対象を励起することが許される場合(この場合,
擬似相関行列A〔k〕は計画行列あるいは実験行列と呼
ばれる),あるいは,励起されていることが期待できる
など特殊な場合を除いて,最小自乗法を広く利用するこ
とができない.このような擬似相関行列の正則性が充分
でないときの最小自乗法の改善策が応用上重要であり,
その1つとして微小固有値の打ち切りが用いられてき
た.
【0009】擬似相関行列Aは半正定値対称行列だから
その固有値λは非負となる.いまλ≧λ≧・・・
≧λ≧0であり,それに属する正規化された固有ベク
トルを列ベクトルにもつ行列をVとする.この行列Vは
正則であり,逆行列V−1は転置行列Vに等しい.こ
の転置行列Vを上式の両辺に施すと正規方程式は で与えられる.いま,Δθ=Δw・Vとおくと,Vは正
規直交行列だからΔθは回転された座標上での推定量Δ
wと対応しており,また,Δθに対する正規方程式は diag〔λ,・・・,λ〕Δθ=Vb (7) となる.もしλ=0ならば,正規方程式のみからΔθ
は決定できない.さて,(6)式の最小条件のもとで
(5)式の残差平方和の最小値は, となることを考慮すると,λ=0ならば,いかなるΔ
θも残差平方和を変化させないから,最小自乗解Δθ
は一意ではない.いま,λ≧λi+1のように並ん
でおり,さらに,i>nなるiに対してλ=0である
ものとすると,〔ΔθΔθ・・・Δθ・・・Δθ
〕と〔ΔθΔθ・・・Δθ0・・・0〕は残差
平方和が同じという意味で同値関係にある.同値である
推定量をそのうちの1つ,たとえば〔ΔθΔθ・・
・Δθ0・・・0〕で代表させることで代表推定量が
定義できる.しかしながら,λが0の近傍にあるとき
(7)式より求められるΔθは誤差に対して高感度と
なり,数値的に安定な推定を難しくさせる.λが充分
に0の近傍にあるならば,このλを0とみなしても残
差平方和の増加は軽微であることから,ある小さなδに
対して,i>nのときλ≦δであるとすると,δを越
えないλを0とみなすことにより,推定の近似値を, Δθ=diag〔λ λ ・・・λ 0・・・0〕Vb (8) であたえることができる.上式の対角行列は一般有効逆
行列とよばれ,最小自乗法の数値安定性,すなわち推定
値の分散を改善するためにしばしば利用されてきた.あ
る修正量Δw〔k〕に対して,(2)あるいは(3)式
の残差平方和の期待値は値は,Δwの真値をΔw=w
−wとおけば,
【数4】 と表わされる.ただし,
【数5】 さらに,変換された座標上では,
【数6】 で表わされる.これらの式より,等しい残差平方和の期
待値をもつ推定量ΔwまたはΔθは超楕円(あるiに
ついてλ=0なるときは無心2次超曲面)を形成する
ことがわかる.仮定i)のもとでb〔k〕の期待値は 正規方程式(6)より, E〔b〔k〕〕=E〔A〔k〕・Δw〔k〕〕=A〔k〕・E〔Δw〔k〕 〕 であるから,最小自乗推定量の期待値と真値とはつぎの
関係をもつ. A〔k〕Δw〔k〕=A〔k〕・E〔Δw〔k〕〕 したがって,修正推定量Δwに対する(9),(10)
式の残差平方和Jの期待値は
【数7】 と表わされる.一方,b〔k〕分散共分散行列は となる.ところで,α〔k,j〕の上限をαsupとす
ると,差行列 は0≦α〔k,j〕≦αsupより,半正定行列である
から, cov〔b〕≦A〔k〕αsupσ (12). ただし,α〔k,j〕がαsupあるいは0に限られる
ならば,等号がなりたつ.さらに,座標の変換によっ
て, となる.一方,正規方程式(6)より となるから,最小自乗推定量の分散,共分散について cov.〔diag〔λ,・・・,λ〕・Δθ〕≦diag〔λ,・・ ・,λ〕・αsupσ (13) のGauss−Markov定理の分散式に相当する関
係が得られる.いま,上式で等号が成り立つ分散の広が
った最悪の場合を考よう.このとき,λΔθは互い
に無相関となるから,各iについて λ cov.〔Δθ〕=λαsupσ となる.この関係は特異解λ=0をもち,Δθの分
散は,λ≠0のときαsupσ/λとなり,iに
よって異なる.さらに,λ→0のときσ(Δθ
→∞となり有界性さえ失われる.しかしながら,最小自
乗推定量Δθの各標準偏差αsup 1/2σ/λ
1/2の比は先の超楕円の軸長比に一致しており,各i
に対して推定量の分散が異なるにもかかわらず,残差平
方和はどのiの標準偏差に対しても同じ大きさとなる.
とくにε(t)が正規分布するとき,λΔθの分布
も正規分布,あるいはデータ数Nが十分大きいならば
中心極限定理よりλθの漸近分布は正規分布とな
る.pを正規分布の確率密度関数とすれば,λΔθ
が互いに無相関であることより,diag〔λ,・・
・,λ〕・Δθの代表推定量の確率密度関数は
【数8】 で与えられる.すなわち,超楕円面の式,
【数9】 を満たす代表推定量は等確率密度をもつことがわかる.
Δθ(i>n)を任意に選んだ推定量は同値であるか
ら,無心2次超曲面(n=mのときには超楕円面)の式
【数10】 を満たす推定量は等確率密度をもつ代表推定量である
か,あるいはそれと同値な推定量となる.この等確率密
度超曲面と等残差平方和超曲面は一致し,ともに,疑似
相関行列A〔k〕から定まる超楕円曲面(無心2次超曲
面)で表わされることがわかる.このため,等確率密度
超曲面が推定量の分布にしたがって特定のiに対して引
き伸ばされているとしても,同じ擬似相関行列からつく
られる等残差平方和超曲面で測られるかぎり推定の良否
は分布の歪みとは無関係である.
【0010】しかし,異なる標本群を考えるとき,それ
ぞれの擬似相関行列から定まる異なる等残差平方和超楕
円をもっており,各標本群に基づく最小自乗推定値の評
価はそれぞれの等残差平方和超楕円によって異なる.と
くに,超楕円の長軸方向に分布する推定値については,
他の等残差平方和超楕円による評価が悪化しやすいか
ら,すべての等残差平方和超楕円対する評価の悪化を避
けるためには,すくなくとも長軸方向の分散を縮小させ
ることが必要である.(8)式の一般有効逆行列による
最小自乗推定近似値において,i番目の微小固有値が打
ち切られたものすると,推定値は更新されないからΔθ
の分散は0となり,確かに長軸方向の分散を縮小させ
る(0となる)ことがわかる.大きな打ち切り固有値の
選択は,推定値の分散を縮小させ,数値的安定性を向上
させるという点では許容される.しかし,この固有値を
越えないとき推定の更新は起こらないから,推定の真の
値への到達を確実に保証するためには充分に大きな説明
変数の励起を必要とし,打ち切られる固有値の個数を減
らさなければならない.固有値の打ち切りによって最小
自乗法の数値的安定性は改善されるものの,推定の真の
値への到達性は説明変数の励起状態に依存すると考えら
れる.この手法は固有値と固有ベクトルの複雑な計算を
必要し,とくに説明変数の次数が高いときに微小固有値
まで含めた多数の固有値を求めることは,計算に要する
時間と精度の点で非常な困難を伴う.このため,実際に
は比較的大きな値で多数の固有値を打ち切らざるをえな
いことがあることを考慮すると,この手法では正確な推
定が保証されない.
【0011】最小自乗法において,正規方程式の疑似相
関行列が0あるいは非常に小さな固有値をもつとき,推
定値はおおきな分散をもち信頼性が低下することはすで
にみてきたとおりである.この分散の大きさは,元の最
小自乗評価関数に更新量を調節する適当な評価関数項を
付け加えることによって,変更することができる.
(5)式の最小自乗法の原問題を実対称行列Dを用いて
次式のように δw・A・δw−2δw・b+c+δw・D・δw→min (14) 修整する.ただし,δwは修整された最小自乗法による
推定の更新値を示す.とくに,Dが適当な正数γのスカ
ラ行列γIに選ばれるならば,この推定は統計学で用い
られるリッジ回帰に相当する.この修整された問題に対
して,最小条件を満たすδwは, (A+D)・δw=b (15) であたえられる.(6)式と比較すると,このδwは擬
似相関行列AをA+Dで近似したときのΔwの近似とな
っていることがわかる.λmin(・)によって行列
(・)の最小固有値をあらわすものとすると,半正定値
行列Aに対して, λmin(A+D)≧λmin(A)+λmin(D)≧λmin(D) が成り立つから,すくなくともDを適当な正定値行列に
選択することによって,A+Dの最小固有値を任意に大
きくすることができることがわかる.したがって,A+
Dの最小固有値を確実に非零となるから,(6)式の元
の最小自乗解が一意でないときにも,(15)式の修整
最小自乗解δwをつねに一意に決定することができる.
リッジ回帰はこの正則化の効果を第一の目的とするもの
である.なお,固有値分解によって A=V・diag〔λ…λ 0… 0〕・V と表わされるAに対して,Dを D=V・diag〔0… 0∞ … ∞〕・V なる半正定値行列に選ぶとき,(15)式より, δθ=Vδw=diag〔λ λ ・・・λ 0・・・0〕Vb となり,この推定値は(8)式の推定値Δθと一致す
る.したがって,固有値打ち切りによる一般有効逆行列
の手法も,この修整の特殊な場合として含まれ,ここで
示した実対称行列Dを用いた修整によって一般的に取り
扱えることがわかる.さて,λ(・)によってi番目
の固有値を表わすものとすれば,修整された最小自乗解
δwの分散について,(13)式と同様の式 cov.〔diag〔λ(A+D)〕・δθ〕≦diag〔λ(A+D) 〕・αsupσ が成り立つことがいえる.したがって,この修整によっ
て,推定値δwの分散を任意に小さくすることが可能で
あり,推定を安定化することができる.A+Dの最小固
有値のおおきさの適当な選択によって,とくに,最小自
乗法の近似解δwの長軸方向の分散を元の最小自乗解Δ
wのそれよりちいさくおさえられることから,この修整
には,悪条件下の最小自乗法で生じた推定評価の不整合
を改善する好ましい効果を期待できる.この修整解δw
によって,推定値w〔k〕を(4)式と同様に, w〔k〕=w〔k−1〕+δw〔k〕 (16) で更新するものとしよう.さらに,半正定値行列D
〔k〕をある非零なλ〔k〕に対して, A〔k〕+D〔k〕=λ〔k〕・I となるように選ぶと,(15)式は (A〔k〕+D〔k〕)δw〔k〕=λ〔k〕δw〔k〕=b〔k〕 (17) となるから,更新量δw〔k〕は δw〔k〕=b〔k〕/λ〔k〕 (18) で与えられ,推定値は w〔k〕=w〔k−1〕+δw〔k〕=w〔k−1〕T’+b〔k〕/λ 〔k〕 (19) のような極めて簡単な更新アルゴリズムによって更新さ
れる.もし,k番目の推定に用いられる標本集合が,た
だ1つの標本を含むだけであり,λ〔k〕が適当な定数
に選らばれるならば,この更新アルゴリズムは制御工学
で急降下法より導かれたWidrowのLMS法と,ま
たは,λ〔k〕がその標本の内積に選ばれるならば改良
LMS法と一致する,あるいは,λ〔k〕が適当なアル
ゴリズムにしたがってkとともに増大する系列に選らば
れるならば,確率近似法(SA法)と一致することか
ら,最小自乗法の擬似相関行列をλで近似する本発明の
推定法はより広い一般性をもっている.このとき,
(4),(6)式の最小自乗法による推定では,推定値
wの期待値は真の更新値wと一致し,w〔k〕の分布
はw〔k−1〕の分布に依存しない単純な独立変動確率
過程に従うのに対し,(15),(16)式による推定
では,wの期待値は必ずしもwに一致せず,また,w
〔k〕の分布はw〔k−1〕に依存する非独立な変動確
率過程となる.以下に,本発明の推定法によって推定値
が推移するとき,期待値w〔k〕は,元の最小自乗法の
期待値(真値w)へ収束し,その分散も有界に保たれ
ることを示めし,この修整が実際に悪条件下の最小自乗
法を改良する有力な手段をあたえていることを明らかに
する.
【0012】
【作用】(19)式より,推定値の真値からの偏差は, (w〔k〕−w=(w〔k−1〕−w+b〔k〕/λ〔k〕 にしたがって推移することがわかる.さらに, であるから,(19)式のアルゴリズムによる推定値の
更新過程は,つぎの推移方程式,
【数11】 に従う.ただし,Φ〔k〕は,Φ〔k〕=I−A〔k〕
/λ〔k〕なる推移行列である.さて,任意wに対し
て,w
〔0〕=wを推定の初期条件とすると,推定値
【数12】 とあらわせるから,αx/λが無相関ならば,初期値w
に対して,k番目の推定の期待値は
【数13】 となる.したがって,k−1番目とk番目の期待値の真
の値からの偏差は (E〔w〔k〕〕−w=Φ〔k〕・(E〔w〔k−1〕〕−w (23) の関係をもつ.ここで,推移行列Φ〔k〕は実対称であ
るから,その全ての固有値に対して −1<λ(Φ〔k〕)≦1, すなわち,A〔k〕の最大固有値λmax(A〔k〕)
に対して, λ〔k〕>λmax(A〔k〕)/2 (24) ならば,つねに ‖E〔w〔k〕〕−w‖≦‖E〔w〔k−1〕〕−w‖ が成り立つ.このような数列 {‖E〔w〔k〕〕−w
‖}は単調減少(不増加)であり,下に有界だから,
【数14】 となることより,
【数15】 が成り立つ.したがって,ある極限E〔w〔∞)が存在
し,
【数16】 となる.この極限E〔w〔∞〕〕が有界であることは,
収束条件(24)式よりIIΦ≦Iとなり,有界な初期
ベクトルwに対して(22)式がつねに有界となるこ
とより明らかである.(23)式より, (E〔w〔k〕〕−E〔w〔k−1〕〕)=A〔k〕/λ〔k〕(E〔w〔k −1〕〕−w であるから
【数17】 の収束も成り立つ.ところで, を考慮すると,左辺と右辺の初項が,0に収束すること
より,右辺の第2項についても,
【数18】 でなければならない.したがって, i) E〔w〔∞〕〕=wであるか, ii)さもなければ,A〔k〕/λ〔k〕の少なくとも
1つの固有値は0に収束し,しかも,その固有値に属す
る固有ベクトルは,非零ベクトル(E〔w〔∞〕〕−w
)に収束しなければならない. 推定の期待値E〔w〔k〕〕は,i)の場合には,推定
期待値は真値wに収束し,偏り(baias)をもた
ない.ii)の場合には,充分大きなkに対して,A
〔k〕,A〔k+1〕,・・・によってそれぞれ定まる
残差平方和評価がほとんど等しくなるという意味で真値
と同値なE〔w〔∞〕〕に収束することがいえる.
ところで,ii)の場合は,説明変数がもともと独立で
ない,あるいは,充分大きなk以後の推定に用いられる
標本の説明変数が漸近的に線型従属となっているときに
おこる.前者は,対象の真の次数より次数の高い,いわ
ゆる,Over Parameterized Mod
elに回帰しようとするときに,また,後者は,対象を
撹乱するという理由で説明変数におおきな励起が許され
ないとき,あるいは,説明変数の偶然の励起を待つ以外
に手段がないときなどに,しばしば現われる.このと
き,真の値の推定はどのような手法によっても不可能で
あり,すくなくとも,推定期待値の無矛盾性,有界性は
保証されるから,この推定法の実用性を下げることには
ならない.もちろん,ii)の場合でも,説明変数の線
型従属性を乱すような適当に励起された標本が供給され
るとき,ふたたび真値への接近がおこる.
【0013】本発明の推定法において,推定期待値は真
値,あるいは,それと同値な値に収束することが示めさ
れた.つぎに,推定値の分散が有界に保たれ,実際に安
定化されることを示めす.(19)式で表わされる確率
過程はすでに述べたように非独立的である.各更新kに
おいて使用される標本集合が互いに重複部分をもたない
場合には,w〔k−1〕,w〔k−2〕・・・とk番目
の標本に含まれるε〔k,j〕とは独立となり,w
〔k〕の更新過程はw〔k−1〕とε〔k,j〕の加法
分布のみに依存する比較的に簡単なMarkov過程と
なる.まず,Markov過程の場合からはじめよう.
このとき,更新される推定値の分散は,(20)式よ
り,
【数19】 で表わされる.評価の重み係数αの上限を αsup≧α〔k,j〕 for all k and j (26) とすると,
【数20】 となり,(25)式より がえられる.疑似相関行列Aと推移行列Φは,Aの固有
ベクトルからなる正規直交行列Vとその転置行列V
よって,それぞれ, となる.ただし,rは,Aの各固有値λのλとの
比,r=λ/λとする.(27)式の分散共分散行
列の右および左からAの固有ベクトル行列Vとその転置
行列Vを掛けて,整理すると が得られる.ここで,Aの最大固有値λmax(A)と
の比が与えられたγsupを超えないように γsup≧λmax(A〔k〕)/λ〔k〕 for all k (29) λ〔k〕を選ぶものとする.このとき,{λmax(A
〔k〕)}が0でない(正の)下限をもつならば{λ
〔k〕}にも0でない(正の)下限λinfが存在す
る.(1)式で定義したように,説明変数{w}のう
ちすくなくともwは非零定数であること,適当なjに
対してα〔k,j〕は非零であることから,疑似相関行
列A〔k〕の最大固有値は0でない.すなわち,正の下
限λinfは実際に存在する.このとき,収束条件(2
4)式より 0<r<γsup<2 だから が成り立ち, となることがわかる.したがって,上式にαsupσ
をかけて,(28)式の両辺 の対角項に加えると, を得る.さらに,上式の両辺に左右からV,Vをそれ
ぞれ掛けて がえられる.いま,k−1番目の推定値分散について cov〔w〔k−1〕〕≦αsupσ/(2−γsup)λinf・I が満たされているものとすると,(30)式より, すなわち,k番目の推定値分散についても cov〔w〔k〕〕≦αsupσ/(2−γsup)λinf・I (31) が満たされる.ところで,初期推定値w
〔0〕=w
は,適当に与えられる確定値であるから,分散は, を満たす.したがって,すべてのkに対して,(31)
式が成り立つ.αsup,γsup,λinfは上限,
あるいは,下限であることから,(31)式の右辺の大
きさは有界であり,推定値の分散はつねに有界となるこ
とが証明される.
【0014】つぎに,標本集合に重複があり,推定確率
過程がMarcov性をもたないときの分散について考
察する.このとき,(21)式より明らかなように,k
番目の推定値w〔k〕の分布は,k番目までの推定に用
いられたすべての標本の分布の加法分布となる.したが
って,推定値w〔k〕の分散は,各撹乱項ε〔i,j〕
が推定値w〔k〕の分散にあたえる寄与の和として表わ
される.いま,k回までの推定値更新において,使用さ
れたある1つの標本(x,y)に着目する.ι回目(ι
≦k)の推定値更新におけるこの標本に対する評価重み
を, β(ι〕=α〔ι,j〕 (ι回目の更新の標本集合に
標本番号jとして含まれているとき,) β〔ι〕=0 (ι回目の更新の標本集合に含まれないとき,) (32) で置き換える.ただし,1つの標本集合には標本の重複
はないものとする.零でないβ〔ι〕(ι=1,2,・
・・,k)が2つ以上あるとき,この標本は更新の過程
で重複して使用されていることを意味し,更新はMar
cov過程とはならない.この標本に含まれる撹乱項ε
は他の標本に含まれる撹乱項とは独立だから,この撹乱
項εの分散共分散行列cov〔w〔k〕−w〕に
対する寄与の大きさをMとすると で与えられる.ただし,
【数21】 いま,Ψ,・・・,Ψを任意正方行列,γ,・・
・,γを任意スカラとすると,
【数22】 が成り立つ.上式の関係を考慮すると,(33)式よ
り, となる.ただし, γ〔k〕=β〔1〕/λ〔1〕+β〔2〕/λ〔2〕・・・・+β〔k〕/λ〔 k〕. 任意に与えられたγsupに対して,(29)式を満た
すようにλ〔k〕を決定するとき,すでに述べたように
λ〔k〕}の正の下限λinfが存在するから γ〔k〕≦(β〔1〕+β〔2〕+・・・+β〔k〕)/λinf・ いま,すべてのβ〔ι〕の和が収束し,ある上限β
supを越えないものとする,すなわち,
【数23】 とすると, γ〔k〕≦(βsup/λinf となり,推定値分散に対する寄与Mについて, が成り立つことがわかる.k回目の推定値の分散は,k
回目までの推定に使用された標本に含まれる各撹乱項ε
〔i,j〕の寄与Mの総和となるから,各撹乱項ε
〔i,j〕について,上式の両辺のそれぞれの総和を求
めると, cov〔w〔k〕〕≦Γ〔k〕 (34) が成り立つ.ただし,
【数24】 である.ところで,Ψ〔ι〕の定義より明らかなよう
に,このΓ〔k〕に対して, の推移方程式が成り立つ.疑似相関行列Aと推移行列Φ
は,Aの固有値λとλとの比をr=λ/λとすれ
ば,適当な行列Vによって, で表わせるから,(35)式の右および左から行列Vと
その転置行列Vを掛けて,整理すると と書き改めることができる.ここで,(29)式が満た
されるようにλ〔k〕を決定すれば, が成り立つ.したがって,上式にβsupσをかけ
て,(36)式の両辺の対角にそれぞれ加えると, がえられる.さらに,上式の両辺の左右からV,V
掛けて, なる関係をうる.いま, Γ〔k−1〕≦βsup/(2−γsup)λinf・I であるものとすると,(37)式の右辺は, となり,k+1についても,また, Γ〔k〕≦βsupσ/(2−γsup)λinf・I (38) が成り立つ.ところで,初期推定値w
〔0〕=wは適
当に与えられる確定値であるから, となり,(38)式を満たす.したがって,すべてのk
に対して, (38)式が満たされる.さらに,(3
4)式より,すべてのkに対して,(31)式と同様の cov〔w〔k〕〕≦Γ〔k〕≦βsupσ/(2−γsup)λinf・ I (39) が成り立つことがいえる.βsup,γsup,λ
infは上限,あるいは,下限であることから,(3
9)式の右辺の大きさは有界であり,推定値の分散はつ
ねに有界となることが証明される.
【0015】推定値w〔k〕の期待値の真値への収束お
よび分散の有界性は,推定過程のMarcov,非Ma
rcov性にかかわらず,すなわち,標本の重複使用の
有無にかかわらず,成立している.(31)式と(3
9)式を比較すると,ある1つの標本がある重みをもっ
て何度かにわけて参照されるとき,その重みの総和の上
限βsupが,ただ1度限りの参照の場合の重みの上限
αsupと同じであり,両者のλinfも同じならば,
その分散の七限は等しくなることがわかる.このような
標本集合があたえられるとき,分散の観点から評価する
かぎり,標本の重複使用の有無による優劣はないと想像
される.しかし,上記の条件を満たすように標本集合が
あたえられるとき,各更新において使用される標本集合
に含まれる標本数,すなわち,種類は,重複使用のある
ときの方が重複使用のないときより,つねに,多くな
る.ただ1つの標本によって更新されるLMS法,ある
いは,その改良法の欠点が収束速度の遅さにあることを
考えると,この違いは,推定期待値の収束速度の向上に
利用できる可能性があることを示している.
【0016】最小自乗法では,線型変換した説明変数に
適用した推定結果は,無変換のときの推定と等価であ
り,推定は説明変数の座標系変換に影響されないことは
明らかである.しかしながら,本推定法の推定過程,す
なわち収束速度は,説明変数の座標系に大きく左右され
る.つぎに,収束速度向上の問題について述べる.Xを
最終要素が非零定数xであるようなm次ベクトルの集
合とする.すなわち, X={x:x=〔x,・・・,x〕}. いま,x∈Xなる説明変数ベクトルを x′=P(x−z) (40) によって,別の座標系上の説明変数ベクトルx′に移
す.ただし,
【数25】 であり,Sは正則とする.このとき,x′∈Xとなるこ
とは明らかであり,第m要素はふたたび非零定数x
なる.このxの非零な要素が含まれることは,本推定
法の,収束条件(24)式を満たす非零なλの存在と,
(31),あるいは,(39)式の分散の有界性を規定
する非零なλinfの存在を保証するために必要であ
る.すなわち,変換された座標の上でも推定値の収束性
と分散の有限性は保たれる.このようなxのx′への変
換は, Z=I−〔0・・・0 z/Xm〕 (42) を考えると, x−z=Z・x (43) だから, T=P・Z (44) のような行列Tによって, x′=P(x−z)=T・x (45) と表わされ,Pが正則ならばTも正則となり,線型変換
となっている.さらに, w′=w・T−1 (46) で,w′を定義するとき,(2)式は, y=w・x+e=wT−1・Tx+e=w′・x′+e となるから,(w,x)と(w′,x′)は等価な表現
をあたえる.ところで,正則行列Tは1意ではないか
ら,このような等価表現は無数に存在する.2つの座標
系上で本推定法によって決定される更新量δw,δw′
は,(18)式より,それぞれ, となる.(46)式を使って,2番目の更新量を1番目
の座標系上に移すと, Tδw′=TT・b/λ′ であるから,2つの座標系で決定される更新量は互いに
等価とはならず,座標系によって推定量の更新過程は異
なり,推定性能は説明変数の座標系の選択に影響される
ことがわかる.いま,擬似相関行列Aが正則とすると,
最小自乗法によってあたえられる推定値期待値は最良と
なる.これを変換された座標上でE(Δw′〕で表わせ
ば,(6)式より, (TAT)・E〔Δw′〕=TE〔b〕 を満たす.一方,本推定法による推定期待値は λ′・E〔δw′〕=TE〔b〕 であるから,λ′I=TATとする有界な変換Tが存
在するならば, E〔δw′〕=E〔Δw′〕 となり,本推定法は,最良である最小自乗解と期待値に
おいて一致する.したがって,本推定法に対する最良の
座標系はこのような変換Tによってあたえられるところ
で,行列TATの最右下の要素はどのような変換Tに
対しても,つねにΣαx であるから, より,λ′=Σαx でなければならない.すなわ
ち, TAT=Σαx ・I なる有界な変換Tは最良の座標系をあたえ,このとき, λ′=λmax(TAT) なるλ′による推定は最良の期待値をあたえる.
【0017】いま,重みαによる平均Mを考え, M=Σαx/Σα, δx=x−M とおくとき,δxの第m要素はつねに0となる.したが
って, x′=Tx=T(δx+M)=T・δx+TM=P・δx+TM となるから, TM=〔0・・・0x ならば,δxとTMは独立となり,
【数26】 となる.ただし,Δは適当な行列である.このとき,そ
のすべての非零固有値を適当な変換SによってΣαx
とすることができるから,このような変換によってえ
られる座標上で期待される推定は最良となることがわか
る.逆に,TM≠〔0・・・0xのとき,上式の
右辺の行列の最終行,列の0部分は非零となるから,T
ATの最大固有植は,どのようなSに対しても λmax(TAT)>Σαx となり,座標上で期待される推定は最良とはならないこ
とがわかる.したがって,椎定期待値が最良となる座標
系を得るためには,変換Tは, を満たさなければならない.このことは,重み付き平均
を使って,x,・・,xm−1の説明変数から変動に
寄与しない(直流)成分を取り除き,真に変動する(交
流)成分δxを使って回帰すべきことを意味し,最小自
乗法で条件数を改善するためによく用いられる手法と一
致している.
【0018】つぎに,Sの決定法について述べる.この
座標系での推定値の分散は,(39)式によれば, cov〔w′〕≦βsupσ/(2−γsup)λinf・I であるから,もとの座標系上では, となる.TTが単位行列Iより大きいとき,推定値の
分散はもとの座標系上での推定より悪化する.このこと
は,(31)式でも同様である.ところで,
【数27】 において左上の(m−1)次部分正方行列は,SSと
なることよりw,・・・,wm−1の分散のみについ
ては, であり,SSが大きくなれば,それだけ,もとの座標
系上での推定値の分散は大きく悪化する.このことは,
(31)式についても同様である.さて,Δは,その正
規化固有ベクトルを列にもつ正規直交行列Vによって VΔV=diag〔λ・・・λm−1〕 と表わせる.ただし,λはΔの固有値である.対角行
列 R=diag〔r・・・rm−1〕 を使って, RVΔVR=diag〔r ・λ・・・rm−1 ・λm−1〕 となるから, S=RV (48) とすれば, SΔS=diag〔r ・λ・・・rm−1 ・λm−1〕 が得られる.このとき, r=(Σαx /λ1/2 と選べば, SΔS=Σαx I すなわち, TAT=Σαx I となり,最良の座標変換となることがわかる.しかし,
小さすぎるλに対して,rを上のように決定する
と,推定値の分散が悪化する.また,次数mが大きいと
き,すべての固有値および固有ベクトルを計算機で求め
ることは,精度の点,計算時間の点で問題がある.ベキ
乗法という計算法を用いれば,固有値の大きい方から順
に,固有ベクトルの何本かを比較的精度よく簡単に求め
ることができる.このようにして,あまり小さくないn
+1個の固有値とn本の正規化された固有ベクトルが求
められたものとする.そして, のように,rを決定すると,推定値分散を抑えた,よ
り最良の,すなわち,より推定値の収束速度の速い,し
かも,実用的な推定法となることがわかる.なお,固有
ベクトルはn本がわかっているのみであるが,推定値の
更新にはこれで充分であることが以下のようにして示さ
れる.(48)式より, いま,わかっているn本の固有ベクトルを列にもつ行列
をV,残りの固有ベクトルを列にもつ行列をVとす
ると,V=〔V〕となることより, である.すなわち,SSはわかっている固有ベクトル
と固有値だけから決定できる.さらに
【数28】 であり,λ′はΣαx か残りの固有値λn+1のい
ずれかであるTATの最大固有値より,収束条件(2
4)式を満たすように決定されるから,この推定法は計
算できる固有値,固有ベクトルだけを使って,より最良
の推定値が得られる実用的な方法となっている.
【0019】 つぎに,以上のような座標変換を伴った
推定法によって,その推定期待値が真値または,それと
同値な値に収束することを述べる.上のT〔k〕によっ
て,変換された座標系上での推定値w′〔k〕は,(2
3)式より, のように推移する.(46)式より, さらに,(41),(48)式より,
【数29】 (42),(47)式より,
【数30】 であることを考慮すると,
【数31】 は,対角行列となり,I−P〔k〕P〔k〕Z〔k〕
A〔k〕Z〔k〕/λ′〔k〕もまた,対角行列とな
り,その対角要素は−1より大きく,1を越えないこと
がわかる.したがって,ベクトルZ〔k〕T−1(w
〔k〕−wの各要素はZ〔k〕T−1(w〔k−
1〕−wの対応する各要素の絶対値の大きさを越
えない.さらに,(42)式を考慮すると,(w〔k〕
−w)の第1から第m−1の各要素は,(w〔k−
1〕−w)の対応する各要素の絶対値の大きさを越え
ない.したがって,w〔k〕の第1から第m−1の各要
素は,真値,もしくは,それと同値な値に単調に収束す
る.そして,説明変数が励起されているならば,w
〔k〕の第1から第m−1の各要素は,真値に収束し,
残りのw〔k〕の第mの要素も,真値へ収束する.ま
た,励起していないならば,z〔k〕は不変であるか
ら,w〔k〕の第1から第m−1の各要素の真値と同値
な値への収束に伴って,残りのw〔k〕の第mの要素
も,真値と同値な値に収束する.
【0020】以上に述べた方法は,固有値と固有ベクト
ルの計算の負担がやや重いため,強くリアルタイム性が
求められるとき,このまま実行することができない場合
もあるかもしれない.この負担を避けるため,すべての
kについて,T〔k〕を求めるかわりに,A〔k〕の平
均値の見積に対して求めた固定座標変換Tによる固定座
標上で推定する方法も考えられよう.このとき,平均的
に良い推定が期待できる.あるいは,対角行列に限定し
たS〔k〕によって,S〔k〕ΔS〔k〕の対角項を
Σαx に近づける一種の正規化の方法によっても,
固有値計算は避けられる.この正規化の手法は,疑似相
関行列の固有値の大きさが極端に異なるときに,大きさ
を揃え計算を安定させるために,通常の最小自乗法でも
有効とされている.
【0021】
【実施例】本モデル同定器に適当なフィードバック制御
を組み合わせることで,CE原理に基づいた適応制御系
を構成することができる.すなわち,本同定器によって
逐次更新推定される制御対象の線型回帰モデルのパラメ
ータを用いて,フィードバック制御器が設計手順を自動
化した自動設計器によって適応調整される.そして,こ
の調整されたフィードバック制御器によって,対象の制
御が最終的に達成される.制御の対象として, y〔k〕=−2y〔k−1〕−u〔k〕+2u〔k−1〕−1 の時系列システムを用いた.これは,不安定極,零点を
もつ自己不安定,非最小位相の,比較的制御の難しい系
となっている.このシステムに対して,被説明をy
〔k〕,説明変数ベクトルをx〔k〕=〔y〔k−1〕
・・・y〔k−10〕u〔k〕・・・u〔k−9)1〕
として同定器を設定した.この場合,推定されるパラメ
ータを21個もつ,対象より次数過多のOver Pa
rameteraized Modelで同定している
ことになり,最小自乗法では安定した推定を得ることは
難しい.ここでは,各時刻で採取されたこれらの変数の
標本を推定に重複して使用するものとする.ただし,時
刻が更新されるたびに,過去の標本の重みをγ(0.
9)倍することによって軽くした.この重み付けは,重
み付き最小自乗法でよく用いられexponentia
l windowと呼ばれるものと同じであり,この方
法では.最新の説明変数をx〔k〕とすると,たとえ
ば,擬似相関行列は A〔k〕=γA〔k−1〕+x〔k〕x〔k〕 のように更新される.このとき,βsupは1/(1−
γ)となり有限である.ところで,対象システムのパラ
メータがわかっているものとすると,この適応制御系に
組み込まれた制御器設計法は, u〔k〕=−1.2y〔k−1〕+1.2u〔k−1〕+0.6y−0.2 と設計するようになっている.ただし,yは設定値で
ある.まず,この制御による,0から1への設定値変更
時のシステムの応答を図1に示した,つぎに,適応制御
を実施した例を図2に示した.モデルの初期値として,
y〔k〕=u〔k〕のかなり真値とは異なるものを用い
たために,制御の開始後,大きな乱れを生じている.し
かしながら,モデル同定器の推定値の収束とともに最初
の設定値0へ整定している.その後の設定値の1への変
更に対する応答は,図1のものとほぼ一致していること
から,モデル同定の目的が達せられたことが確認でき
る.
【0022】
【発明の効果】最小自乗法あるいは重み付き最小自乗法
の擬似相関行列をその最大固有値の1/2より大きなス
カラで近似することによって,安定な逐次線型回帰モデ
ル同定器が得られた.そして,座標系のもつ推定性能に
与える影響を調べることによって,本同定器は,擬似相
関行列の固有植の大きさが非零な値に揃っているとき
に,最小自乗法の本来もっている最良の性能と一致する
ことがわかった.ただ1つの標本からつくられる擬似相
関行列の近似を用いた場合に相当するLHS法,あるい
はその改良された方法では非零となりうる固有値がただ
1つであり,その他はすべて0であるため,安定性の高
さにもかかわらず,推定値の収束速度の遅さに問題があ
った.本同定器では,標本が複数であり,しかも,重複
使用が許されるから,擬似相関行列の固有値は複数の非
零固有値をもち,その大きさも平均化の効果によって揃
うことが期待できる.したがって,より高速な収束速度
が得られる.さらに,座標変換を伴う場合,本同定器
は,推定の安定性を保ったまま最小自乗法の本来もって
いる最良の性能に近づけることができ,さらに高速な収
束速度が得られる.本同定器の安定性,高速性は,理論
的に裏づけられており,その実行に際して人的な補助を
必須要件としない.したがって,適応制御に代表される
ような自動意志決定マシンに応用することができ,省力
化,生産性向上に極めて有効である.
【図面の簡単な説明】
【図1】 確定システムとして設計されたときの制御系
の応答.
【図2】 モデル同定器を用いて適応設計されたときの
制御系の応答.

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】最小自乗法もしくは重み付き最小自乗法の
    擬似相関行列をその最大固有値の1/2より大きなスカ
    ラで近似することを特徴とする逐次線型回帰モデル同定
    器.
JP20907194A 1994-07-30 1994-07-30 擬似相関行列の近似を用いた逐次線型回帰モデル同定器 Pending JPH0844710A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20907194A JPH0844710A (ja) 1994-07-30 1994-07-30 擬似相関行列の近似を用いた逐次線型回帰モデル同定器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20907194A JPH0844710A (ja) 1994-07-30 1994-07-30 擬似相関行列の近似を用いた逐次線型回帰モデル同定器

Publications (1)

Publication Number Publication Date
JPH0844710A true JPH0844710A (ja) 1996-02-16

Family

ID=16566777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20907194A Pending JPH0844710A (ja) 1994-07-30 1994-07-30 擬似相関行列の近似を用いた逐次線型回帰モデル同定器

Country Status (1)

Country Link
JP (1) JPH0844710A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001318136A (ja) * 2000-03-30 2001-11-16 Lucent Technol Inc 重み付きリッジ回帰を使用する位置決定方法
JP2007218811A (ja) * 2006-02-20 2007-08-30 Nec Corp パラメータ推定方法及びその装置
US20150185309A1 (en) * 2013-12-31 2015-07-02 Red Point Positioning Corporation Method and system to estimate the location of a transmitting device in an (asynchronous) wireless network

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001318136A (ja) * 2000-03-30 2001-11-16 Lucent Technol Inc 重み付きリッジ回帰を使用する位置決定方法
JP2007218811A (ja) * 2006-02-20 2007-08-30 Nec Corp パラメータ推定方法及びその装置
JP4593494B2 (ja) * 2006-02-20 2010-12-08 日本電気株式会社 パラメータ推定装置
US20150185309A1 (en) * 2013-12-31 2015-07-02 Red Point Positioning Corporation Method and system to estimate the location of a transmitting device in an (asynchronous) wireless network
US10444321B2 (en) * 2013-12-31 2019-10-15 Red Point Positioning Corporation Method and system to estimate the location of a mobile device using time difference of arrival in an asynchronous wireless network

Similar Documents

Publication Publication Date Title
Zhao et al. Adaptive neural decentralised control for switched interconnected nonlinear systems with backlash-like hysteresis and output constraints
Davidian et al. Variance function estimation
CN106842237B (zh) 快速任意形状方向图主瓣保形自适应波束形成方法
Kariotoglou et al. Approximate dynamic programming for stochastic reachability
Helland Maximum likelihood regression on relevant components
EP0150762B1 (en) Apparatus for identification of a process parameter
Sánchez et al. Adaptive arrival cost update for improving moving horizon estimation performance
Han et al. Dimension-wise importance sampling weight clipping for sample-efficient reinforcement learning
Dumitrescu et al. Regularized k-svd
Mardikyan et al. Efficient choice of biasing constant for ridge regression
Naderi et al. Inversion-based output tracking and unknown input reconstruction of square discrete-time linear systems
Wen et al. Characterizing the gap between actor-critic and policy gradient
JPH0844710A (ja) 擬似相関行列の近似を用いた逐次線型回帰モデル同定器
Gerasimov et al. Performance improvement of discrete MRAC by dynamic and memory regressor extension
Chkifa et al. Randomized least-squares with minimal oversampling and interpolation in general spaces
Kulhavý Restricted exponential forgetting in real-time identification
Barakat et al. Reinforcement learning with general utilities: Simpler variance reduction and large state-action space
Zhang et al. Probabilistic decoupling control for stochastic non-linear systems using ekf-based dynamic set-point adjustment
Bianchin Data-driven exact pole placement for linear systems
Xia Robust and effective eSIF preconditioning for general SPD matrices
Monnez Stochastic approximation of eigenvectors and eigenvalues of the Q-symmetric expectation of a random matrix
Zhu et al. Guaranteed cost fault-tolerant control for uncertain stochastic systems via dynamic event-triggered adaptive dynamic programming
JPH11232252A (ja) 最小自乗法による推定補正値を抑制した線型システム同定器
Kuehn et al. Combined error estimates for local fluctuations of SPDEs
Burton et al. Continuous self-adaptive control using a smoothed variable structure controller

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050329

A521 Written amendment

Effective date: 20050528

Free format text: JAPANESE INTERMEDIATE CODE: A523

A02 Decision of refusal

Effective date: 20051115

Free format text: JAPANESE INTERMEDIATE CODE: A02