JP5692091B2 - 情報処理装置、情報処理方法およびコンピュータプログラム - Google Patents

情報処理装置、情報処理方法およびコンピュータプログラム Download PDF

Info

Publication number
JP5692091B2
JP5692091B2 JP2011546098A JP2011546098A JP5692091B2 JP 5692091 B2 JP5692091 B2 JP 5692091B2 JP 2011546098 A JP2011546098 A JP 2011546098A JP 2011546098 A JP2011546098 A JP 2011546098A JP 5692091 B2 JP5692091 B2 JP 5692091B2
Authority
JP
Japan
Prior art keywords
variance
variable
information processing
processing apparatus
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011546098A
Other languages
English (en)
Other versions
JPWO2011074509A1 (ja
Inventor
健児 青木
健児 青木
貴之 中田
貴之 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011546098A priority Critical patent/JP5692091B2/ja
Publication of JPWO2011074509A1 publication Critical patent/JPWO2011074509A1/ja
Application granted granted Critical
Publication of JP5692091B2 publication Critical patent/JP5692091B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S19/00Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
    • G01S19/38Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
    • G01S19/39Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
    • G01S19/396Determining accuracy or reliability of position or pseudorange measurements

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Complex Calculations (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、説明変数が与えられたもとでの目的変数の平均および分散を推定する情報処理装置、情報処理方法およびコンピュータプログラムに関する。
ある確率変数yが他の確率変数xに依存すると想定される場合に、回帰モデルを用いてその依存性を分析する方法がある。この方法は、回帰分析とも呼ばれる。回帰分析において、前述の確率変数yは、目的変数または従属変数と呼ばれる。また前述の確率変数xは、説明変数または独立変数と呼ばれる。
この回帰分析の一例が非特許文献1に記載されている。非特許文献1における回帰分析は、目的変数yの分散が説明変数xの値によらずに一定であること、すなわち目的変数の分散が説明変数の定義域において均一であることを仮定している。
また、ある確率変数yの平均と分散との両方がyの観測時刻tに依存すると想定される場合に、一般状態空間モデルを用いてその依存性を分析する方法がある。この一般状態空間モデルは、目的変数yの平均と分散との両方が目的変数yを観測した観測時刻tに依存するような時系列データに対して、目的変数yの平均と分散との依存性が表現されるモデルである。
この分析の一例が、非特許文献2に記載されている。
小西貞則、北川源四郎著「情報量規準シリーズ・予測と発見の科学2」朝倉書店、2004年9月25日、pp.16−22、35−37 森下真一、宮野悟編「bit別冊 発見とデータマイニング」共立出版株式会社、2000年5月5日、pp.159−168
非特許文献1に記載の技術は、目的変数の平均および分散が説明変数の定義域において均一であることを仮定している。したがって、非特許文献1に記載の技術は、目的変数の平均および分散が、説明変数に依存している場合、目的変数の平均および分散を推定することができない。すなわち、非特許文献1に記載の技術は、正確な回帰分析ができないという問題点があった。
また、非特許文献2に記載の技術は、所定の時刻毎に観測される離散的な時系列データを対象として分析を行う。したがって、非特許文献2に記載の技術は、目的変数の平均および分散が、連続値を取る説明変数に依存している場合、目的変数の平均および分散を推定することができない。すなわち、非特許文献2に記載の技術は、正確な回帰分析ができないという問題点があった。
本発明の目的の一例は、上述の課題を解決するための情報処理装置、情報処理方法および記録媒体を提供することにある。
本発明の第一の情報処理装置は、説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出するパラメータ推定部と、前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定する最適分割特定部と、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数および前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数をそれぞれ算出する平滑化部と、を備える。
本発明の第一の情報処理方法は、説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出し、前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定し、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数および前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数をそれぞれ算出する、工程を備える。
本発明の第一の記録媒体は、コンピュータに、説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出するパラメータ推定処理と、前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定する最適分割特定処理と、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数および前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数をそれぞれ算出する平滑化処理と、を実行させるプログラムを記録する。
本発明は、目的変数の平均および分散が連続値を取る説明変数に依存している場合においても、正確な回帰分析ができる。
図1は、本発明の第一の実施の形態の情報処理装置の構成を示したブロック図である。 図2は、説明変数xの位置および散らばりと、関数w(x)との関係を示した図である。 図3は、本発明の第一の実施の形態の情報処理装置の動作を示したフローチャートである。 図4は、シミュレーションにより発生させた擬似データにおける、仰角と信号誤差との関係を示した一例である。 図5は、第二の実施の形態の情報処理装置の動作を示したフローチャートである。 図6は、第二の実施の形態における信号誤差の分散の推定を行った結果の一例である。 図7は、第三の実施の形態の情報処理装置の構成を示したブロック図である。
次に本発明の実施の形態について、図面を参照した詳細な説明がなされる。
本発明の実施の形態についての説明の前に、一般的な回帰モデルにおける、回帰モデルのパラメータを推定する方法についての説明がなされる。
目的変数yと説明変数xとに関するn組の観測データのそれぞれが(yα,xα)と表されるとき、回帰モデルにおける、yαのxαに対する依存性は、[数1]のように表される。ただし、αは、1以上n以下の整数である。u(xα;w)は、回帰関数を示す。wは、回帰関数のパラメータを示す。εαは、誤差項を示す。
Figure 0005692091
また、回帰モデルでは、一般に誤差項εαは、平均0、分散σの正規分布N(0,σ)に独立に従うものと仮定される。この場合、説明変数X=(x,...,x)’が与えられたもとでの目的変数y1:n=(y,...,y)’の確率密度関数fは、[数2]のように表される。
Figure 0005692091
回帰モデルにおけるパラメータ(w’,σ)’を観測データから推定するための手法として、最尤推定法がある。最尤推定法では、確率密度関数fに対して、[数3]で表される対数尤度関数log fを最大にするパラメータの値が、所望の推定値となる。
Figure 0005692091
以下は、発明を実施するための形態についての詳細な説明である。なお、各図面および本明細書記載の各実施の形態において、同様の機能を備える構成要素には同一の符号が与えられている。
[第一の実施の形態]
図1は、本発明の第一の実施の形態の構成を示すブロック図である。
図1を参照すると、本発明の第一の実施の形態における情報処理装置11は、入力部101と、分割候補管理部102と、パラメータ推定部103と、最適分割特定部104と、平滑化部105と、を備える。
入力部101は、パラメータ推定部103と、最適分割特定部104と、平滑化部105と、それぞれ接続されている。分割候補管理部102は、パラメータ推定部103と接続されている。パラメータ推定部103は、入力部101と、分割候補管理部102と、最適分割特定部104と、平滑化部105とそれぞれ接続されている。最適分割特定部104は、入力部101と、パラメータ推定部103と、平滑化部105とそれぞれ接続されている。平滑化部105は、入力部101と、パラメータ推定部103と、最適分割特定部104と、平滑化部105とそれぞれ接続されている。
===入力部101===
入力部101は、目的変数yと説明変数xとのn組の観測データ(yα,xα)の入力を受ける。ここでαは、1以上n以下の整数である。本実施の形態では、説明変数xは、p次元ベクトルx=(x(1),...,x(p))’であるものとする。ただしpは、1以上の整数である。これは、例示であって、説明変数xは、スカラーであってもよい。
なお、入力部101は、データの入出力のためのインターフェース回路を含む。観測データ(yα,xα)の入力のための入力部は、連続的に発生する観測データ(yα,xα)を検出および受信するセンサ入力手段や通信手段であっても良い。
===分割候補管理部102===
分割候補管理部102は、xの定義域Rを複数の領域に分割する情報である分割候補をメモリに記憶する。
分割候補管理部102は、xの定義域Rを示す情報、Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxに基づいて、分割候補を算出する第1の演算回路を備え、その算出結果をメモリに記憶してもよい。Mは、2以上の整数である。xがp次元ベクトルである場合、Δxは、x=(Δx(1),...,Δx(p))’と表される。例えば、説明変数xが角度であった場合、Δxは、1度あるいは5度といった値をとってもよい。
この情報処理装置11のユーザは、あらかじめR、MおよびΔxを分割候補管理部102の内部に設定してもよい。あるいは、分割候補管理部102は、R、MおよびΔxをそれぞれ示す情報を外部から受信してもよい。または分割候補管理部102は、入力部101を介してR、MおよびΔxを受信してもよい。いずれの場合にも、分割候補管理部102の第1の演算回路は、設定された、あるいは受信した情報に基づいて、Rの分割候補Rを算出する。
ここで、分割候補Rについてさらに説明がなされる。
分割候補Rは、分割される領域の数がM以下かつ各領域の境界面がΔxの各成分を定数倍した空間で表現できる、Rの分割のことを指す。分割候補Rに基づいて特定される各領域がr (c)と示されると仮定すると、Rの各分割候補Rは、[数4]のように示される。ただし、r (c)中のiは、1以上m(c)以下の整数である。また、Cは、Rの分割候補の個数を示す。m(c)およびMは、m(c)≦Mなる関係を満たす。ただし、cは、1以上C以下の整数である。
Figure 0005692091
例えば、説明変数xが角度であり、Δxが5度である場合、各領域r (c)における角度の範囲は、Δxの整数倍、すなわち5の倍数である。
なお、分割候補管理部102は、分割候補Rに基づいて特定される各領域r (c)を示す情報と、各分割候補Rとを対応付けてメモリに記憶するものとする。
===パラメータ推定部103===
パラメータ推定部103は、分割候補管理部102よりRの分割候補Rを読み取る。そしてパラメータ推定部103は、各分割候補Rに含まれる領域r (c)毎に、その各領域における目的変数yの平均および分散の推定値をそれぞれ算出する。具体的には、パラメータ推定部103は、入力部101が入力を受ける観測データ(yα,xα)と、Rの各分割候補Rに基づいて、各領域r (c)の目的変数yの平均および分散の推定値をそれぞれ算出し出力する第2の演算回路を備える。
また、パラメータ推定部103の第2の演算回路は、各領域r (c)における目的変数yの平均および分散が定数であるとみなし、それぞれの推定値を最尤推定法によって求める。
本実施の形態における回帰モデルでは、ある分割候補Rにおける、説明変数X=(x,...,x)’が与えられたもとでの目的変数y1:n=(y,...,y)’の確率密度関数fは、以下の[数5]のように表される。
Figure 0005692091
ただし、μ (c)は、各領域r (c)における目的変数yの平均であり、(σ (c)は、各領域r (c)における目的変数yの分散である。また、μ(c)は、μ(c)=(μ (c),...,μ (c))’なる関係を満たす。(σ(c)は、(σ(c)=((σ (c),...,(σ (c))’なる関係を満たす。
[数5]は、領域r (c)毎に[数2]が適用されていること、各領域において観測データの分布が独立であることをそれぞれ示している。
第一に、パラメータ推定部103は、分割候補R毎に、説明変数X=(x,...,x)’が与えられたもとでの目的変数y1:n=(y,...,y)’の確率密度関数fを[数5]に基づいて特定する。
第二に、パラメータ推定部103は、[数6]で表される対数尤度関数log fを最大にするパラメータμ、σの値を、所望の推定値として特定する。
Figure 0005692091
具体的には、パラメータ推定部103は、分割候補R毎に所望の推定値をそれぞれ[数7]で示される数式に基づいて推定する。
Figure 0005692091
===最適分割特定部104===
最適分割特定部104は、分割候補Rの中から最適な分割候補Rを特定する。具体的には、最適分割特定部104は、パラメータ管理部103が出力する目的変数yの平均および分散の推定値に基づいて、分割候補Rごとにそれぞれの情報量規準を算出する第3の演算回路を含む。そして、最適分割特定部104は、もっとも小さな情報量規準に対応する分割候補Rを最適な分割として特定する。
第3の演算回路が算出のために適用する情報量規準として、例えば、以下の[数8]で表されるAIC(Akaike’s Information Criterion;赤池情報量規準)がある。さらに別の情報量規準として、例えば、[数9]で表されるBIC(Bayesian Information Criterion;ベイズ情報量規準)がある。これらは例示であって、モデルの正確性を示すあらゆる評価基準が、本実施の形態に適用されうる。
Figure 0005692091
Figure 0005692091
最適分割特定部104は、上述の情報量規準に基づき、もっとも小さな情報量規準に対応する分割候補Rを最適な分割として特定する。
===平滑化部105===
平滑化部105は、パラメータ推定部103が推定する目的変数yの平均の推定値を利用して、説明変数xの定義域R上における、目的変数yの平均の推定値を示す滑らかな関数を算出する。さらに、平滑化部105は、パラメータ推定部103が推定する目的変数yの分散の推定値を利用して、説明変数xの定義域R上における、目的変数yの分散の推定値を示す滑らかな関数を算出する。具体的には、平滑化部105は、最適な分割Rの各領域ri’ (*)にそれぞれ含まれる説明変数xαの各領域における位置とその説明変数xαの散らばりとに基づいて、前述の滑らかな関数を算出する第4の演算回路を含む。ただし、i’は、1以上m(*)以下の整数である。たとえば、平滑化部105の第4の演算回路は、以下の[数10]で表されるR上の滑らかな関数を算出する。この滑らかな関数とは、各領域における平均の推定値または分散の推定値を滑らかにつなぐように近似することで得られる、R上での連続関数である。
Figure 0005692091
ただし、[数10]に含まれる各変数は、それぞれ[数11]で示される関係を満たす。
Figure 0005692091
[数10]は、目的変数yの平均の推定値と分散の推定値とが、最適な分割Rの各領域ri’ (*)における平均の推定値と分散の推定値とのパラメータwi’(x)を重みとした、重みつき平均で表されることを示している。[数11]は、各領域ri’ (*)の重みを表す関数wi’(x)が、その領域内の説明変数xα(xα∈ri’ (*))の位置とその説明変数xαの散らばりSi’とに基づいて特定されることを示している。なお、本実施の形態では、その領域内の説明変数xαの位置とは、その領域内の説明変数xαの平均で表現されている。また、本実施の形態では説明変数xαの散らばりとは、説明変数xαの分散で表現されている。これらは、例示であって、説明変数xαの位置と説明変数xαの散らばりとは、それぞれを示す任意の指標が適用されうる。
図2は、説明変数xの位置および散らばりと、関数wi’(x)との関係を示したものである。図2では、説明変数xの位置として説明変数xの平均が、説明変数xの散らばりとして説明変数xの分散が、それぞれ用いられている。図2において、縦軸方向は、関数の重みを示し、横軸方向は、説明変数の定義域を示している。また、図2において、線グラフは、関数wi’(x)を示し、複数の点は、各説明変数の定義域上の位置を示している。
図2によれば、説明変数xの値が平均に近いほど関数wi’(x)の値が大きくなることを示している。また、図2によれば、説明変数xの分散が小さいほど関数wi’(x)の値が説明変数xの平均付近で急激に大きくなることを示している。
また、[数10]は、目的変数yの平均の推定値と分散の推定値とがカーネル密度推定と同様の算出方法によって算出されることを示している。この算出方法とは、例えば、カーネル関数を用いた分析手法が挙げられる。なお、カーネル密度推定とは、確率変数の確率密度関数を推定する手法の一つである。
以上のように、平滑化部105は、説明変数xの定義域R上における、目的変数yの平均の推定値を示す滑らかな関数を出力する。さらに平滑化部105は、説明変数xの定義域R上における、目的変数yの分散の推定値を示す滑らかな関数を出力する。また、平滑化部105は、各領域ri’ (*)内の説明変数xα(xα∈ri’ (*))の位置とその説明変数xαの散らばりSi’と説明変数X=(x,...,x)’とを出力する。ここで、平滑化部105は、上述の各情報を図示しない出力部に渡し、その出力部が、受け取った各情報を出力してもよい。
前述した分割候補管理部102における第1の演算回路は、1つまたは2つ以上のCPU(Central Processing Unit)とメモリとによるプログラム制御によって算出処理を実行してもよい。同様に、前述したパラメータ推定部103における第2の演算回路は、1つまたは2つ以上のCPUとメモリとによるプログラム制御によって算出処理を実行してもよい。前述の最適分割特定部104における第3の演算回路は、1つまたは2つ以上のCPUとメモリとによるプログラム制御によって算出処理を実行してもよい。前述の平滑化部105における第4の演算回路は、1つまたは2つ以上のCPUとメモリとによるプログラム制御によって算出処理を実行してもよい。
図3は、本発明の第一の実施の形態における情報処理装置11の動作の概要の一例を示すフローチャートである。
入力部101は、目的変数yと説明変数xとのn組の観測データ(yα,xα)の入力を受ける。また、入力部101は、xの定義域Rに関する情報、Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxを受け取る(ステップS201)。分割候補管理部102は、xの定義域Rに関する情報、Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxに基づいて、分割候補を算出する(ステップS202)。
パラメータ推定部103は、観測データ(yα,xα)と、Rの各分割候補Rに基づいて、領域r (c)毎にその領域における目的変数yの平均の推定値を算出する(ステップS203)。また、パラメータ推定部103は、観測データ(yα,xα)と、Rの各分割候補Rに基づいて、領域r (c)毎にその領域における目的変数yの分散の推定値を算出する(ステップS204)。
最適分割特定部104は、パラメータ管理部103が出力する目的変数yの平均の推定値および分散の推定値に基づいて、分割候補Rごとにそれぞれの情報量規準を算出する。そして、最適分割特定部104は、もっとも小さな情報量規準に対応する分割候補Rを最適な分割として特定する(ステップS205)。
平滑化部105は、説明変数xの定義域R上における、目的変数yの平均の推定値の滑らかな関数を算出する(ステップS206)。また、平滑化部105は、説明変数xの定義域R上における、目的変数yの分散の推定値の滑らかな関数を算出する(ステップS207)。具体的には、平滑化部105は、最適な分割Rの各領域ri’ (*)にそれぞれ含まれる説明変数xαの各領域における位置とその説明変数xαの散らばりとに基づいて、所望の滑らかな関数を算出する。
平滑化部105は、説明変数xの定義域R上における、目的変数yの平均の推定値の滑らかな関数を出力する。また、平滑化部105は、説明変数xの定義域R上における、目的変数yの分散の推定値の滑らかな関数を出力する。また、平滑化部105は、各領域r (*)内の説明変数xα(xα∈r (*))の位置とその説明変数xαの散らばりSと説明変数X=(x,...,x)’とを出力する(ステップS208)。
本実施の形態の情報処理装置11は、説明変数の定義域を複数の領域に分割し、その領域毎に目的変数の平均および分散を容易な計算によって特定できるモデルによって所望の平均および分散を推定する。したがって、目的変数の平均および分散が連続値を取る説明変数に依存している場合であっても、本実施の形態の情報処理装置11は、簡単に目的変数の平均および分散を推定することができる。そして本実施の形態の情報処理装置11は、目的変数の平均と分散とを同時に推定することができる。また、目的変数の平均および分散が非線形もしくは不連続な関数である場合、すなわち複雑な変化をする場合、これらの関数は単純なモデルの組み合わせにより表現されうる。したがって、本実施の形態の情報処理装置11は、容易にかつ適切に目的変数の平均および分散を推定することができる。
本実施の形態の情報処理装置11は、目的変数の平均および分散が連続値を取る説明変数に依存している場合においても、目的変数の平均および分散を推定することができるので、正確な回帰分析ができる。
例えば、本実施の形態の情報処理装置11は、説明変数が、幾何学空間における物理的な座標を示す情報である場合、その座標に応じて値が変化する事象を正確に回帰分析することが可能である。また、本実施の形態の情報処理装置11は、説明変数が、時刻を示す情報である場合、その時刻に応じて値が変化する事象を正確に回帰分析することが可能である。特に本実施の形態の情報処理装置11は、以上の理由により、航空機の着陸誘導といったデータの正確性が要求される分野においても適用可能である。
本実施の形態の情報処理装置11は、目的変数の平均および分散を滑らかな関数として定式化する。したがって複雑な計算を必要とせず、回帰分析にかかる計算量あるいは計算時間を減らすことが可能となる。
一般的な回帰モデルでは、目的変数yの分散が、説明変数xの値によらず一定であることが仮定されている。すなわち一般的な回帰モデルでは、目的変数の分散の均一性が、仮定されている。その理由は、回帰分析の対象とするデータに対して回帰関数u(x;w)が適切な関数である場合、各目的変数における誤差の大きさは一定であると仮定するのが自然だからである。また、一般的な回帰モデルでは、目的変数の平均と分散とがそれぞれ説明変数に依存する場合、それぞれのパラメータの推定が非常に困難になる、という数学的な理由がある。したがって目的変数の分散が均一でないデータに基づいた回帰分析において、分散の均一性を前提とする回帰モデルが適用されることは適切ではない。
目的変数の分散が均一でない場合における一般的な回帰分析の方法として、例えば加重最小二乗法やBox−Cox変換がある。これらの方法では、情報処理装置は、目的変数の分散の均一性が満たされるようにデータを変換し、変換したデータについて通常の回帰モデルを当てはめるものである。したがって、これらの方法では、目的変数と説明変数との依存関係を示す情報をあらかじめ情報処理装置のユーザが知っていなければ分析することができない。なぜなら、これらの方法では情報処理システムは目的変数の分散の不均一性の構造に関する知識に基づいてデータを変換するからである。
本実施の形態における情報処理装置11は、回帰分析の際、目的変数の分散の均一性を仮定しない。したがって、情報処理装置11は、目的変数の分散が均一でないデータに基づいて回帰分析することができる。また、本実施の形態における情報処理装置11は、目的変数の分散の依存性そのものをも分析する。したがって、目的変数と説明変数との依存関係を示す情報をあらかじめ情報処理装置11のユーザが知る必要はない。
[第二の実施の形態]
第二の実施の形態は、第一の実施の形態の情報処理装置11の具体的な動作を示した一例である。第二の実施の形態における情報処理装置11の構成は、第一の実施の形態の構成と同様である。したがって説明は、省略される。なお、第二の実施の形態は、情報処理装置11が説明変数としての仰角が与えられたもとでの目的変数としての信号誤差の分散を推定する具体的な一例である。
現在、航空機の高精度の着陸を可能とするために、GPS(Global Positioning System)などの人工衛星を利用した着陸誘導システムが研究されている。より安全な着陸誘導システムを構築するために、この着陸誘導システムは、人工衛星信号の誤差の大きさ(分散)を正確に測ることが求められる。一方、信号誤差は、地上から見た人工衛星の仰角に大きく依存する。
図4は、シミュレーションにより発生させた擬似的な観測データにおける、信号誤差と仰角との関係を示した図である。図4において、縦軸は信号誤差を、横軸は仰角を、それぞれ示している。本実施の形態では、信号誤差は、平均が0となるように正規化されている。また仰角は、0度から90度までの範囲の値を取るものとする。
本実施の形態の情報処理装置11は、説明変数としての仰角が与えられたもとでの目的変数としての信号誤差の大きさ、すなわち信号誤差の分散を観測データから推定することができる。
図5は、本発明の第二の実施の形態における情報処理装置11の動作の概要を示すフローチャートである。
入力部101は、図示されない地上受信機から、各人工衛星の仰角xを示す情報と信号誤差yを示す情報とを対応付けて観測データとして受信する。なお、以下では地上受信機は一つ存在するものと仮定されるが、地上受信機の個数は一つに限定されない。地上受信機が複数ある場合には、一つの地上受信機が以下に示す各情報処理を行ってもよい。あるいは、複数の地上受信機が以下に示す各情報処理を行い、それぞれが出力する情報処理の結果に基づいて、地上受信機または他の装置が一つの結果を出力してもよい。
具体的には、入力部101は以下に示す情報を受信する。第一に入力部101は、地上受信機から見た各人工衛星の仰角を示す情報をその地上受信機から受信する。なお、地上受信機は、入力部101の構成要素の一部であっても良い。あるいは、地上受信機は情報処理装置11とは異なる装置に備えられていてもよい。第二に入力部101は、その地上受信機が測定した、各人工衛星と当該地上受信機との幾何学距離を示す情報を受信する。第三に入力部101は、この地上受信機が人工衛星から受信するGPS信号の搬送波位相から計算される擬似距離を示す情報を受信する。入力部101は、この幾何学距離と擬似距離との差に基づいて信号誤差yを算出する(ステップS301)。これにより、入力部101は、仰角xを示す情報と、誤差yを示す情報とを含む観測データ(yα,xα)を生成する。
情報処理装置11のユーザは、あらかじめ仰角の定義域R、仰角の定義域Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxを入力部101または分割候補管理部102において設定しておく。本実施の形態では、R=90度、M=90、Δx=1度が成立すると仮定される。これは、例示であってそれぞれの値が限定されるものではない。
分割候補管理部102は、xの定義域Rに関する情報、Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxに基づいて、分割候補Rを算出する(ステップS302)。パラメータ推定部103は、観測データ(yα,xα)と、Rの各分割候補Rに基づいて、領域r (c)毎にその領域における信号誤差yの分散の推定値を算出する(ステップS303)。
最適分割特定部104は、分割候補Rごとにそれぞれの情報量規準を算出する。そして、最適分割特定部104は、もっとも小さな情報量規準に対応する分割候補Rを最適な分割として特定する(ステップS304)。
平滑化部105は、仰角xの定義域R上における、信号誤差yの分散の推定値の滑らかな関数を算出する(ステップS305)。具体的には、平滑化部105は、最適な分割Rの各領域ri’ (*)にそれぞれ含まれる仰角xαの各領域における位置とその仰角xαの散らばりとに基づいて、所望の滑らかな関数を算出する。そして、平滑化部105は、仰角xの定義域R上における、信号誤差yの分散の推定値の滑らかな関数を出力する。また、平滑化部105は、各領域ri’ (*)内の仰角xα(xα∈ri’ (*))の位置とその仰角xαの散らばりSと仰角X=(x,...,x)’とを出力する(ステップS306)。平滑化部105は、この情報処理装置11のユーザが指定したフォーマットによりこれらの情報を出力してもよい。このフォーマットは、通常、特定のプログラミング言語の関数の形式である。
図6は、本実施の形態における情報処理装置11による推定結果を表わしている。図6中の、横軸に関して線対称に書かれた線が、信号誤差の標準偏差(分散の正の平方根)の推定値を表わす関数である。図6は、低仰角ほど信号誤差の分散が大きくなることを示している。すなわち図6は、信号誤差の仰角に対する依存性を示している。
[第三の実施の形態]
図7は、本発明の第三の実施の形態における情報処理装置41の構成例を示すブロック図である。
情報処理装置41は、パラメータ推定部403と、最適分割特定部404と、平滑化部405とを備える。
パラメータ推定部403は、最適分割特定部404と、平滑化部405とそれぞれ接続されている。最適分割特定部404は、パラメータ推定部403と、平滑化部405とそれぞれ接続されている。平滑化部405は、パラメータ推定部403と、最適分割特定部404と、平滑化部405とそれぞれ接続されている。
パラメータ推定部403は、観測データに基づいて、説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、目的変数の平均および分散を算出する。観測データは、説明変数と、その説明変数に対して観測された値であり、平均および分散がその説明変数に依存するような目的変数と、をそれぞれ示す情報の組である。
最適分割特定部404は、前述の観測データと、パラメータ推定部403が算出した目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出する。そして、最適分割特定部404は、算出した情報量規準に基づいて一つの分割候補Rを最適な分割として特定する。
平滑化部405は、分割候補Rに基づいて特定される各領域における、パラメータ推定部403が算出した平均に基づいて、説明変数の定義域における目的変数の平均を示す滑らかな関数を算出する。さらに平滑化部405は、分割候補Rに基づいて特定される各領域における、パラメータ推定部403が算出した分散に基づいて、説明変数の定義域における目的変数の分散を示す滑らかな関数をそれぞれ算出する。
図7に示される情報処理装置41の動作は、本発明の第一の形態に示された情報処理装置11と同様である。情報処理装置41は、説明変数の定義域を複数の領域に分割し、その領域毎に目的変数の平均および分散を容易な計算によって特定できるモデルによって所望の平均および分散を推定する。したがって、本発明の第三の実施の形態の情報処理装置41は、第一の実施の形態の情報処理装置11と同様の効果を奏することができる。
以上、これまで述べてきた各実施の形態は、本発明の好適な実施形態であり、上記実施の形態のみに本発明の範囲を限定するものではない。各実施の形態は、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。
また、本発明の各実施の形態における各構成要素は、その機能をハードウェア的に実現することはもちろん、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリなどのコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における構成要素として機能させる。
本発明の効果の一例は、目的変数の平均および分散が連続値を取る説明変数に依存している場合においても、正確な回帰分析ができることである。
この出願は、2009年12月15日に出願された日本出願特願2009−284304を基礎とする優先権を主張し、その開示のすべてをここに取り込む。
各実施の形態による情報処理装置は、目的変数の平均および分散が、説明変数に依存している場合において、目的変数の平均および分散を推定する回帰分析に適用できる。
説明変数が、幾何学空間における物理的な座標を示す情報である場合、例えば、各実施の形態による情報処理装置は、次のような技術に適用できる。
・携帯電話の電波の強さの分析
・無線を用いたセンサの誤差の分析
・地質(土壌の成分)の成分分析
・川や海における水質データの分析
・地価の分布の解析
・交通量の変化の調査
また、説明変数が、時刻を示す情報である場合、例えば、各実施の形態による情報処理装置は、次のような技術に適用できる。
・工業製品の製造工程における部品の温度や硬度の解析
・自動車やオートバイの衝突実験での衝突後からの加速度の分析
11 情報処理装置
41 情報処理装置
101 入力部
102 分割候補管理部
103 パラメータ推定部
104 分割特定部
105 平滑化部
403 パラメータ推定部
404 分割特定部
405 平滑化部

Claims (10)

  1. 説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出するパラメータ推定部と、
    前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定する最適分割特定部と、
    前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数および前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数をそれぞれ算出する平滑化部と、
    を備える、情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記パラメータ推定部は、前記分割候補で特定される各領域における平均および分散は正規分布に従うと仮定して、前記各領域毎に前記目的変数の平均および分散を算出する、情報処理装置。
  3. 請求項1または2に記載の情報処理装置であって、
    前記最適分割特定部は、前記算出された情報量規準の最も小さい分割候補を特定する、情報処理装置。
  4. 請求項1ないし3のいずれか1項に記載の情報処理装置であって、
    前記平滑化部は、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散と、当該各領域に含まれる前記説明変数の当該領域上の位置と、に基づいて各滑らかな関数をそれぞれ算出する、情報処理装置。
  5. 請求項1ないし4のいずれか1項に記載の情報処理装置であって、
    前記平滑化部は、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散と、当該各領域に含まれる前記説明変数の散らばりと、に基づいて各滑らかな関数をそれぞれ算出する、情報処理装置。
  6. 請求項1ないし5のいずれか1項に記載の情報処理装置であって、
    前記平滑化部は、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に対しカーネル関数を算出し、当該カーネル関数に基づき各滑らかな関数をそれぞれ算出する、情報処理装置。
  7. 請求項1ないし6のいずれか1項に記載の情報処理装置であって、
    前記観測データと、前記説明変数の定義域を示す情報と、前記説明変数の定義域を分割する際の領域の数の最大値と、当該各領域の最小単位と、に基づいて前記分割候補を算出する分割候補管理部を備え、
    前記パラメータ推定部は、前記算出された分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出する、情報処理装置。
  8. 請求項1ないし7のいずれか1項に記載の情報処理装置であって、
    前記情報量規準は、赤池情報量規準またはベイズ情報量規準のいずれかである、情報処理装置。
  9. 説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出し、
    前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定し、
    前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数および前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数をそれぞれ算出する、工程をコンピュータが実行する情報処理方法。
  10. コンピュータに、
    説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出するパラメータ推定処理と、
    前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定する最適分割特定処理と、
    前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数および前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数をそれぞれ算出する平滑化処理と、を実行させるためのコンピュータプログラム。
JP2011546098A 2009-12-15 2010-12-07 情報処理装置、情報処理方法およびコンピュータプログラム Active JP5692091B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011546098A JP5692091B2 (ja) 2009-12-15 2010-12-07 情報処理装置、情報処理方法およびコンピュータプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009284304 2009-12-15
JP2009284304 2009-12-15
PCT/JP2010/072311 WO2011074509A1 (ja) 2009-12-15 2010-12-07 情報処理装置、情報処理方法および記録媒体
JP2011546098A JP5692091B2 (ja) 2009-12-15 2010-12-07 情報処理装置、情報処理方法およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JPWO2011074509A1 JPWO2011074509A1 (ja) 2013-04-25
JP5692091B2 true JP5692091B2 (ja) 2015-04-01

Family

ID=44167262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011546098A Active JP5692091B2 (ja) 2009-12-15 2010-12-07 情報処理装置、情報処理方法およびコンピュータプログラム

Country Status (6)

Country Link
US (1) US9104641B2 (ja)
EP (1) EP2515260A4 (ja)
JP (1) JP5692091B2 (ja)
KR (1) KR101303417B1 (ja)
CN (1) CN102656581B (ja)
WO (1) WO2011074509A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017037768A1 (ja) * 2015-08-28 2017-03-09 株式会社日立製作所 評価システム、評価方法およびデータ解析システム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5967017B2 (ja) * 2013-05-31 2016-08-10 Jfeスチール株式会社 影響因子抽出方法およびプログラム
WO2016017171A1 (ja) * 2014-08-01 2016-02-04 日本電気株式会社 流量予測装置、混合比推定装置、方法およびコンピュータ読み取り可能記録媒体
KR102395556B1 (ko) * 2014-12-18 2022-05-10 재단법인 포항산업과학연구원 오차의 정보량을 기반으로 한 모델의 입력 변수 선정 장치 및 방법
CN107832935B (zh) * 2017-10-30 2022-04-05 中国水利水电科学研究院 一种水文变量设计值的确定方法及装置
JP7065685B2 (ja) * 2018-05-07 2022-05-12 株式会社日立製作所 データ不足提示システムおよびデータ不足提示方法
JP7359144B2 (ja) * 2018-06-28 2023-10-11 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269215A (ja) * 2007-04-19 2008-11-06 Nippon Telegr & Teleph Corp <Ntt> 特異パターン検出システム、モデル学習装置、特異パターン検出方法、及び、コンピュータプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6469654B1 (en) * 2000-05-09 2002-10-22 Advanced Navigation & Positioning Corp. Transponder landing system
US6928398B1 (en) * 2000-11-09 2005-08-09 Spss, Inc. System and method for building a time series model
CN1202240C (zh) 2001-10-11 2005-05-18 华中农业大学 一种根瘤菌浓缩液体菌剂的制备方法
JP2004258991A (ja) * 2003-02-26 2004-09-16 Nec Corp Edr方向推定方法、システム、プログラム、及び記録媒体
US7436810B2 (en) * 2005-02-23 2008-10-14 Honeywell International Inc. Determination of wireless link quality for routing as a function of predicted delivery ratio
JP5092895B2 (ja) 2008-05-23 2012-12-05 富士通株式会社 光通信装置および光通信システム
US20130324431A1 (en) * 2010-06-24 2013-12-05 Baylor College Of Medicine Olfactory receptor copy number association with age at onset of alzheimer's disease

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269215A (ja) * 2007-04-19 2008-11-06 Nippon Telegr & Teleph Corp <Ntt> 特異パターン検出システム、モデル学習装置、特異パターン検出方法、及び、コンピュータプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CSNG200900410014; 金城 敬太: '帰納推論による時系列データからの関係構造の抽出' 知能と情報 Vol.21 No.4, 20090815, pp.587-597, 日本知能情報ファジィ学会 *
JPN6011001130; 金城 敬太: '帰納推論による時系列データからの関係構造の抽出' 知能と情報 Vol.21 No.4, 20090815, pp.587-597, 日本知能情報ファジィ学会 *
JPN6011001131; 戸田 尚宏: 'べき組合せ多項式回帰モデルとその係数推定精度' 電子情報通信学会論文誌 Vol.J72-A No.10, 19891025, pp.1556-1562 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017037768A1 (ja) * 2015-08-28 2017-03-09 株式会社日立製作所 評価システム、評価方法およびデータ解析システム
JPWO2017037768A1 (ja) * 2015-08-28 2017-08-31 株式会社日立製作所 評価システム、評価方法およびデータ解析システム

Also Published As

Publication number Publication date
WO2011074509A1 (ja) 2011-06-23
EP2515260A1 (en) 2012-10-24
KR20120093363A (ko) 2012-08-22
CN102656581A (zh) 2012-09-05
KR101303417B1 (ko) 2013-09-05
CN102656581B (zh) 2016-03-16
US9104641B2 (en) 2015-08-11
EP2515260A4 (en) 2018-01-10
JPWO2011074509A1 (ja) 2013-04-25
US20120331024A1 (en) 2012-12-27

Similar Documents

Publication Publication Date Title
JP5692091B2 (ja) 情報処理装置、情報処理方法およびコンピュータプログラム
Poterjoy et al. Efficient assimilation of simulated observations in a high-dimensional geophysical system using a localized particle filter
US20160004800A1 (en) Methods and systems for reservoir history matching for improved estimation of reservoir performance
Solonen et al. Estimating model error covariance matrix parameters in extended Kalman filtering
Hekmati et al. About the convergence of POD and EPOD modes computed from CFD simulation
Yamanaka et al. Data assimilation for three-dimensional phase-field simulation of dendritic solidification using the local ensemble transform Kalman filter
EP3351959B1 (en) Apparatus and method for performing a consistency testing using non-linear filters that provide predictive probability density functions
Greś et al. Low-rank approximation of Hankel matrices in denoising applications for statistical damage diagnosis of wind turbine blades
Risaliti et al. A state-input estimation approach for force identification on an automotive suspension component
CN110442142B (zh) 速度数据处理方法、装置、电子设备及计算机可读介质
JP4882544B2 (ja) 追尾処理装置及びその方法並びにプログラム
US20160223675A1 (en) Mobile terminal, position identification method, and position identification device
Sørensen et al. Data assimilation in hydrodynamic modelling: on the treatment of non-linearity and bias
JP5396311B2 (ja) 行動予測装置、方法およびプログラム
Gaël et al. On the impact of correlations on the congruence test: a bootstrap approach: Case study: B-spline surface fitting from TLS observations
JP6610898B2 (ja) 横メタセンタ高さ推定装置及び横メタセンタ高さ推定方法
US20200409817A1 (en) Method and apparatus for evaluating and selecting signal comparison metrics
JP6819797B2 (ja) 位置推定装置、位置推定方法とプログラム、並びに、位置推定システム
Maruyama et al. General introduction to surrogate model-based approaches to UQ
Lutsko Velocity correlations and the structure of nonequilibrium hard-core fluids
Jiang et al. Multi-objective optimal input design for grey-box identification modelling of ship manoeuvring motion
Stepanov et al. A Procedure of Comparative Analysis of Recursive Nonlinear Filtering Algorithms in Navigation Data Processing Based on Predictive Simulation
JP2019020338A (ja) 状態推定装置及びプログラム
Chauhan MPUQ-b: Bootstrapping Based Modal Parameter Uncertainty Quantification—Methodology and Application
US20220245486A1 (en) Prediction device, prediction method, and prediction program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150119

R150 Certificate of patent or registration of utility model

Ref document number: 5692091

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150