JP7359144B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP7359144B2
JP7359144B2 JP2020527434A JP2020527434A JP7359144B2 JP 7359144 B2 JP7359144 B2 JP 7359144B2 JP 2020527434 A JP2020527434 A JP 2020527434A JP 2020527434 A JP2020527434 A JP 2020527434A JP 7359144 B2 JP7359144 B2 JP 7359144B2
Authority
JP
Japan
Prior art keywords
variable
variables
explanatory
information
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020527434A
Other languages
English (en)
Other versions
JPWO2020004154A1 (ja
Inventor
隆司 磯崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Sony Group Corp
Original Assignee
Sony Corp
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Group Corp filed Critical Sony Corp
Publication of JPWO2020004154A1 publication Critical patent/JPWO2020004154A1/ja
Application granted granted Critical
Publication of JP7359144B2 publication Critical patent/JP7359144B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、情報処理装置、情報処理方法及びプログラムに関する。
近年、ビッグデータ等のデータから有用な情報を抽出するための、データ分析技術の向上が求められている。分析結果は、すでに起きた現象の理解、将来の予測、制御又は介入などのために用いられる。
多変数データの分析は、2変数間の相関関係等の関係性を推定することが基本事項の1つである。推定された2変数間あるいは多変数間の関係性をグラフィカルモデル(以下、グラフとも称する)として表現することは、多変数データの分析結果の可読性の良さからしばしば行われる。
例えば、下記非特許文献1、2及び特許文献1では、多変数データに基づいて多変数間の因果関係を推定し、その関係をグラフとして表現するための技術が開示されている。
P. Spirtes, C. Glymour, R. Scheines, "Causation, Prediction, and Search", MIT Press, second edition, 2000. J. Pearl, "Probabilistic Reasoning in Intelligent System", Morgan Kaufmann, 1988. E. Castillo, J. M. Gutierrez, and A. S. Hadi, Expert System and Probabilistic Network Models, Springer, 1997. J. Pearl, "Causality", Cambridge University Press, second edition, 2009.
特開2014-228991号公報
関係性をグラフで表現する様々な事例があり、例えば鉄道のネットワークでは駅をノード、路線を辺(エッジ)として表現することができ、辺が結ばれた2つの駅間の距離、所要時間又は運賃といった数値を、辺に割り当てることがなされている。これと同様に、ニューラルネットワークにおいても2つのノード間の関係を示す重み(数値)を辺に割り当てることができるため、相関又は因果を表わすネットワーク状のグラフにおいても変数を表わすノードの間の辺に重みに相当する相関係数又は相互情報量などの2つの変数間の関係の強さを割り当てることは容易に考えられ、実際多くの事例で表現されている。しかし、上記非特許文献1、2及び特許文献1に記載の技術では、グラフ情報と2変数間の関係の強さに関する情報が推定されるものの、これらの情報のみでは多変数の定量的な関係の強さを容易に知ることができない。
したがって、相関又は因果の関係においては、3変数以上の関係が重要な場合が頻繁に見受けられるものの、これらは上記の表現方法で表現することが難しいという問題があった。一方で、多変数の結合確率分布又は条件付き確率分布を調べることによって、多変数の関係を定量的に調べることは非特許文献4に記載されているように条件付き確率分布を調べることなどにより可能ではあるが、3変数以上の組み合わせの方法は多数存在し得るため、どの組み合わせが重要であるかが不明な場合、調べ尽くすために多大な労力を要するという問題があった。
そこで、本開示では、3変数以上の変数間の関係性を容易に把握あるいは分析することが可能な仕組みを提供する。
本開示によれば、3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報と、複数の前記説明変数の組み合わせのうち特定の前記説明変数の組み合わせに含まれる各々の前記説明変数の値の候補と前記ある着目する変数の値の候補との関係性を示す第2の情報と、1つの画面上に出力する制御部、を備える情報処理装置が提供される。
また、本開示によれば、3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報と、複数の前記説明変数の組み合わせのうち特定の前記説明変数の組み合わせに含まれる各々の前記説明変数の値の候補と前記ある着目する変数の値の候補との関係性を示す第2の情報と、1つの画面上に出力すること、を含む、プロセッサにより実行される情報処理方法が提供される。
また、本開示によれば、コンピュータを、3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報と、複数の前記説明変数の組み合わせのうち特定の前記説明変数の組み合わせに含まれる各々の前記説明変数の値の候補と前記ある着目する変数の値の候補との関係性を示す第2の情報と、1つの画面上に出力する制御部、として機能させるためのプログラムが提供される。
本開示によれば、3変数以上の変数間の関係性を容易に把握あるいは分析することが可能な仕組みが提供される。なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本開示の一実施形態に係る情報処理装置の論理的な構成の一例を示すブロック図である。 同実施形態に係る情報処理装置により出力されるUI画面の一例を示す図である。 同実施形態に係る情報処理装置により出力されるUI画面の一例を示す図である。 同実施形態に係る情報処理装置において実行される結合効果の分析処理の流れの一例を示すフローチャートである。 本実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.提案技術の概要
2.構成例
3.処理の流れ
4.適用例
5.ハードウェア構成例
6.まとめ
<<1.提案技術の概要>>
多変数データの分析の基本事項の1つは、まずは2変数間の関係性(相関関係又は因果関係)を調べることである。2変数の関係性は、変数を示すノードと関係性のある変数同士を接続するリンクとから成るグラフにより表現され得る。かかるグラフでは、リンクに相関係数等の関係性を示す情報が対応付けて表示され得る。このようなグラフにより、特に2変数間の関係性の可読性を向上させることができる。
しかし、3変数以上の多変数間の関係性について、特にどの多変数間の関係が重要であるかという観点での可読性を向上させるような試みはなされていなかった。これは何を指標として3変数以上の多変数の関係性を評価するかが具体的に検討されていなかったことに起因する。さらに、2変数間の関係性を既知とした上で、評価対象を3変数以上に拡張した場合にどれだけ情報量が増えるのか、という観点での指標も乏しかった。これらの情報をユーザが簡単に得るためのUI(User Interface)も、提供されていない。
相関関係や因果関係は、2変数間だけでなく、3変数以上の多変数の組み合わせでも存在し得る。例えば、複数の説明変数が、説明変数単体での影響とは異なる影響を、ひとつのある着目する変数に与え得る。ある着目する変数とは、分析対象として着目される変数である。このような、ある着目する変数を、以下では着目変数とも称する。このような効果を、結合効果とも称する。3変数以上の多変数の関係性の評価が可能になれば、結合効果を効率的に分析することが可能になる。
そこで、本開示では、多変数データの分析に関し、3変数以上の変数間の関係性を容易に把握あるいは分析することが可能な仕組みを提供する。
<<2.構成例>>
図1は、本開示の一実施形態に係る情報処理装置100の論理的な構成の一例を示すブロック図である。図1に示すように、本実施形態に係る情報処理装置100は、入力部110、出力部120及び制御部130を含む。
(1)入力部110
入力部110は、様々な情報の入力を受け付ける機能を有する。入力部110は、入力された情報を制御部130に出力する。
入力部110は、分析対象となる多変数データの入力を受け付ける。ここでの多変数データとは、3つ以上の変数から成る多変数の値を含むデータである。
入力部110は、分析のための各種入力を受け付ける。例えば、入力部110は、着目変数の指定、説明変数の指定、後述する説明変数の組み合わせに含まれる説明変数の数n、後述する選抜数m、及び後述する閾値Th等の入力を受け付ける。入力部110は、タッチパネル、キーボード又はマウス等の任意の入力装置を含んでいてもよく、かかる入力装置へのユーザ操作によりこれらの情報の入力を受け付ける。
(2)出力部120
出力部120は、様々の情報の出力を行う機能を有する。出力部120は、制御部130による制御に基づいて、各種情報を出力する。出力部120は、表示装置を含み、例えば分析結果を示すUI画面を出力してもよい。出力部120は、音声出力装置を含み、例えばユーザの音声入力を促すための音声を出力してもよい。出力部120は、任意の通信規格に準拠した通信装置を含み、例えば他の情報処理装置又は記憶装置に分析結果を示す情報を出力してもよい。出力部120は、印刷装置を含み、例えば分析結果を示すレポートを印刷してもよい。
(2)制御部130
制御部130は、情報処理装置100全体の動作を制御する機能を有する。図1に示すように、制御部130は、入出力制御部131、関係検出部132、関係変数群抽出部133、結合効果評価部134、詳細評価部135及びレポート作成部136を含む。制御部130は、これらの構成要素以外の構成要素を含んでいてもよい。
・入出力制御部131
入出力制御部131は、入力部110及び出力部120と、制御部130に含まれる他の構成要素(関係検出部132、関係変数群抽出部133、結合効果評価部134及び詳細評価部135及びレポート作成部136)とのインタフェースである。入出力制御部131は、入力部110により入力された情報を当該情報に対応する他の構成要素に出力し、他の構成要素から出力された情報を出力部120により出力させる。例えば、入出力制御部131は、入力部110により入力された多変数データを関係検出部132に出力する。また、入出力制御部131は、分析結果を示すUI画面を生成して出力部120により出力させ、入力部110により入力された当該UI画面へのユーザ操作を示す情報を、当該ユーザ操作に対応する他の構成要素に出力する。
・関係検出部132
関係検出部132は、2変数間の関係性を検出する機能を有する。詳しくは、関係検出部132は、入力部110により入力された多変数データに基づいて、2変数間の関係性の指標である第3の情報を計算する。そして、関係検出部132は、第3の情報に基づいて、2変数間の関係性を検出する。以下では、第3の情報を、2変数間の関係性の指標とも称する。
関係性は、相関関係であってもよい。その場合、2変数間の関係性の指標は、例えば相関関係を示す統計量である。そのような統計量としては、例えば相関係数が挙げられる。関係検出部132は、相関関係を示す統計量に基づいて、2変数間の相関関係の有無及び強さを検出する。
関係性は、因果関係であってもよい。その場合、2変数間の関係性の指標は、例えば因果関係を示す統計量である。関係検出部132は、独立成分分析による方法、罰則付き最尤法若しくはベイズ法による推定結果をスコアとしてこれを最大化する方法、又は変数間の条件付き独立性の統計的検定によって推定する方法などにより、2変数間の因果関係の有無及び強さを検出する。
関係検出部132は、検出した2変数間の関係性を示す情報を、入出力制御部131に出力する。入出力制御部131は、2変数間の関係性を示す情報に基づいて、多変数の関係性を表現するグラフを含むUI画面を生成し、出力部120により出力させる。例えば、入出力制御部131は、図2に示すUI画面10を生成して、出力部120により出力させる。
図2は、本実施形態に係る情報処理装置100により出力されるUI画面の一例を示す図である。図2に示すUI画面10は、ツールバー11及びグラフ領域13を含む画像である。ツールバー11には、分析処理のためのコマンドを含むメニューを表示させるためのオプションボタン12等の、各種操作又は設定のためのボタンが配置されている。ユーザは、ポインタ14をマウス等で操作して、ツールバー11又はグラフ領域13において任意の操作を行うことが可能である。グラフ領域13には、関係検出部132により検出された2変数間の相関関係又は因果関係を表現するグラフが含まれる。当該グラフは、変数をノードとし、変数間の相関関係又は因果関係をリンクとして表現するグラフである。リンクの先端(即ち、矢線で因果関係を示すリンクにおいては矢尻)側の変数を着目変数とすると、リンクの後端(矢線で因果関係を示すリンクにおいては矢尻の反対)側の変数は説明変数である。着目変数とは、予測、介入又は制御対象の変数であり、因果関係が示されている場合には結果側の変数に相当する。説明変数とは、着目変数を説明する変数であり、因果関係が示されている場合には原因側の変数に相当する。図2に示した例では、変数A~Eがノードとして表現されている。変数A~Eの関係性を説明すると、変数Cを着目変数としたとき変数Bが説明変数であり、変数Eを着目変数としたとき変数A~Dが説明変数である。このように、変数間の因果関係がリンクとして表現されることで、変数間の因果関係の有無を認識容易にすることが可能となる。あるいは変数間のある種の相関関係がリンクとして表現されていることもある。また、グラフにおいて、リンクに2変数間の関係性の指標が関連付けて表示されることが望ましい。例えば、図2に示した例では、変数AとEとの相関係数0.10、変数BとEとの相関係数0.22、変数CとEとの相関係数0.41、変数DとEとの相関係数0.26、変数BとCとの相関係数0.16が、各々のリンクに関連付けて表示されている。これにより、2変数間の関係性の強さを認識容易にすることが可能となる。
また、関係検出部132は、検出した2変数間の関係性を示す情報を、関係変数群抽出部133に出力する。
・関係変数群抽出部133
関係変数群抽出部133は、多変数のうち2つ以上の説明変数を含む説明変数の組み合わせを抽出する機能を有する。かかる組み合わせに含まれる説明変数の数をn≧2とする。関係変数群抽出部133は、着目変数として指定された変数と関係性があると関係検出部132により検出された変数から、n個の変数を含む変数の組み合わせを、説明変数の組み合わせとして抽出する。関係変数群抽出部133は、説明変数の組み合わせを複数抽出してもよい。
着目変数は、グラフにおけるノードの選択操作により指定され得る。その場合、関係変数群抽出部133は、説明変数を、グラフにおいて着目変数とリンクで接続された変数、又は着目変数とリンクで接続された変数の中で、着目変数の原因であると推定された変数若しくは着目変数の結果ではないと推定された変数から選択する。例えば、図2に示したUI画面10において、変数Eが着目変数として選択された場合、関係変数群抽出部133は、変数Eとリンクで接続された変数である変数A、B、C及びDから、n個の説明変数を抽出する。UI画面10における着目変数の選択は、例えば、マウスでポインタ14を変数上に移動させて、左クリックすることにより行われる。
説明変数は、グラフにおけるノードの選択操作により指定されてもよい。ユーザにより指定された説明変数の数をp個とすると、関係変数群抽出部133は、n-p個の説明変数を、グラフにおいて着目変数とリンクで接続された変数、又は着目変数とリンクで接続された変数の中で、着目変数の原因であると推定された変数若しくは着目変数の結果ではないと推定された変数から選択する。例えば、図2に示したUI画面10において、変数Eが着目変数として選択され、変数Aが説明変数の1つとして選択された場合、関係変数群抽出部133は、変数B、C及びDからn-1個の説明変数を抽出する。これにより、ユーザにより指定された特定の説明変数に関する結合効果を効率的に分析することが可能となる。
関係変数群抽出部133は、説明変数の組み合わせに含まれる説明変数の数nの指定を受け付ける。説明変数の数nは、ユーザにより指定され得る。この点について、図3を参照して説明する。
図3は、本実施形態に係る情報処理装置100により出力されるUI画面の一例を示す図である。図3に示すUI画面10は、図2に示すUI画面10において変数Eが着目変数として選択された後に表示される。図3に示したUI要素21~25は、ユーザ操作に応じて順次追加的に表示される。図3に示すUI画面10において、変数Eが着目変数として選択された状態で右クリックされる又はオプションボタン12が選択されると、分析処理のためのコマンドを含むメニュー21が表示される。メニュー21のうち「結合効果」が選択されると、nの選択を受け付けるためのサブメニュー22が表示される。ユーザは、サブメニュー22において任意の数字を選択することで、nを指定することができる。例えば、nとして2が選択されたとすると、変数A~Dのうち2個の変数の組み合わせが抽出される。なお、図3のその余のUI要素については、後に随時説明する。
関係変数群抽出部133は、抽出した説明変数の組み合わせを示す情報を、結合効果評価部134に出力する。
・結合効果評価部134
結合効果評価部134は、着目変数と関係変数群抽出部133により抽出された説明変数の組み合わせとの関係性を評価する機能を有する。
-第1の情報の計算
まず、結合効果評価部134は、着目変数と関係変数群抽出部133により抽出された説明変数の組み合わせとの関係性の強さを示す第1の情報を計算する。第1の情報は、エントロピー、相互情報量、相関係数、偏相関係数、検定のp値、その他の独立性、若しくは条件付き独立性の統計的尺度、又はそれらの組み合わせに基づいて計算される、関係性の強さを示す値である。かかる値により、結合効果が定量化される。かかる値が大きいことは結合効果が大きいことを意味し、小さいことは結合効果が小さいことを意味する。第1の情報を、以下では結合効果の第1の指標とも称する。
3変数の場合の結合効果の第1の指標Jは、次式のように計算され得る。
J=H(X|Y)-H(X|Y,Z)
=I(X;Z|Y) …(1)
ここで、Hは情報理論における情報エントロピーであり、Iは情報エントロピーを基礎として定義される相互情報量である。Xは着目変数であり、Y及びZは説明変数である。上記数式(1)におけるH(X|Y)は、Yを条件とするXの条件付き情報エントロピーであり、H(X|Y,Z)は、同様にYとZを条件とするXの条件付き情報エントロピーである。また、I(X;Z|Y)は、Yを条件とするXとZの相互情報量であり、上記数式(1)は恒等的に成立する(以下では情報エントロピーを単にエントロピーと記す)。上記数式(1)によれば、結合効果の第1の指標Jは、着目変数Xと説明変数Yとの2変数間の相関値と比較して、新たに加わった説明変数Zによってどれだけ情報量が増えたかを示す指標である。上記数式(1)に示すように、3変数の場合、結合効果の第1の指標は条件付き相互情報量となっている。
3変数の場合の結合効果の第1の指標Jは、次式のように計算されてもよい。
J=I(X;Z|Y)-I(X;Z) …(2)
上記数式(2)によれば、結合効果の第1の指標Jは、上記数式(1)に示した値から、着目変数Xと新たに加わった説明変数Zとの2変数間の相関量が減算された値である。
4変数の場合の結合効果の第1の指標Jは、次式のように計算され得る。
J=H(X|Y)-H(X|Y,Z,W) …(3)
ここで、Wは説明変数である。上記数式(3)によれば、結合効果の第1の指標Jは、着目変数Xと説明変数Yとの2変数間の相関値と比較して、新たに加わった説明変数Z及びWによってどれだけ情報量が増えたかを示す指標である。
4変数の場合の結合効果の第1の指標Jは、次式のように計算され得る。
J=H(X|Y)-H(X|Y,Z,W)-I(X;Z)-I(X;W) …(4)
上記数式(4)によれば、結合効果の第1の指標Jは、上記数式(3)に示した値から、着目変数Xと新たに加わった説明変数Z及びWとの2変数間の相関量が減算された値である。
-結合効果の第1の指標に基づく説明変数の組み合わせの整理
結合効果評価部134は、計算された結合効果の第1の指標に基づいて、複数の説明変数の組み合わせの整理を行う。結合効果評価部134は、複数の説明変数の組み合わせを、説明変数の組み合わせに係る結合効果の第1の指標の大小関係に基づく順番に並べて出力する。例えば、結合効果評価部134は、結合効果の第1の指標が大きい順に又は小さい順に、説明変数の組み合わせを並べたリストを出力する。その際、結合効果評価部134は、説明変数の組み合わせと当該組み合わせに係る結合効果の第1の指標とを対応付けて出力してもよい。このようなリストが出力されることにより、結合効果が高い順に、説明変数の組み合わせをユーザに提示することが可能となる。換言すると、より詳細に分析すべき説明変数の組み合わせを、順番にユーザに推薦することが可能となる。この点について、図3を再度参照して説明する。
図3に示したUI画面10のサブメニュー22において説明変数の数nとして2が選択された場合、リスト23が表示される。リスト23では、変数Eを着目変数としたときのn個の説明変数を含む説明変数の組み合わせが、結合効果の第1の指標が大きいものから順に上から下に並べられている。例えば、着目変数Eに対し結合効果が最も高い説明変数の組み合わせは変数B及びCの組み合わせであり、変数C及びDの組み合わせは2番目に高い。また、リスト23では、説明変数の組み合わせと当該組み合わせの結合効果の第1の指標とが対応付けて表示されている。例えば、変数Eに対する変数B及びCの結合効果の第1の指標は0.312であり、変数Eに対する変数C及びDの結合効果の第1の指標は0.299である。
結合効果評価部134は、複数の説明変数の組み合わせのうち、結合効果の第1の指標に基づき選抜された所定数の説明変数の組み合わせを示す情報を出力してもよい。かかる所定数をmとおくと、結合効果評価部134は、結合効果の第1の指標に基づく上位m個の説明変数の組み合わせを示す情報を出力する。図3に示したリスト23では、m=6であり、上位6個の説明変数の組み合わせを示す情報がリスト23に含まれる。これにより、結合効果の第1の指標が小さい説明変数の組み合わせの表示を省略することが可能となる。換言すると、より詳細に分析すべき説明変数の組み合わせを、数を絞ってユーザに推薦することが可能となる。結合効果評価部134は、上記所定数mの指定を受け付けてもよい。mの指定は、例えば、分析の前に予め設定され得る。
結合効果評価部134は、複数の説明変数の組み合わせのうち、結合効果の第1の指標が所定の閾値以上である説明変数の組み合わせを示す情報を出力してもよい。結合効果評価部134は、閾値と説明変数の組み合わせの選抜数mとを組み合わせてもよい。その場合、かかる閾値をThとおくと、結合効果評価部134は、結合効果の第1の指標が閾値Th以上であり、且つ上位m個以内の説明変数の組み合わせを示す情報を出力する。これにより、結合効果の第1の指標が小さい説明変数の組み合わせの表示を省略することが可能となる。換言すると、より詳細に分析すべき説明変数の組み合わせを、数を絞ってユーザに推薦することが可能となる。閾値Thの指定は、例えば、分析の前に予め設定され得る。
結合効果評価部134は、上記説明した評価結果を示す情報を詳細評価部135に出力する。例えば、結合効果評価部134は、結合効果の第1の指標が閾値Th以上であり、且つ上位m個以内の説明変数の組み合わせを、詳細評価部135に出力する。結合効果評価部134は、説明変数の組み合わせに、当該説明変数の組み合わせに係る結合効果の第1の指標を対応付けて、且つ結合効果の第1の指標に応じた順位を付して(例えば、大きい順に)、出力してもよい。又は、結合効果評価部134は、結合効果の第1の指標が小さい値であるほど結合効果が大きいと定義することも可能であり、その場合は結合効果の第1の指標が閾値Th以下であり、且つ下位m個以内の説明変数の組み合わせを、詳細評価部135に出力してもよい。その場合、結合効果評価部134は、説明変数の組み合わせに、当該説明変数の組み合わせに係る結合効果の第1の指標を対応付けて、且つ結合効果の第1の指標に応じた順位を付して(例えば、小さい順に)、出力してもよい。
・詳細評価部135
詳細評価部135は、結合効果をより詳細に評価する機能を有する。詳しくは、詳細評価部135は、複数の説明変数の組み合わせのうち特定の説明変数の組み合わせに含まれる各々の説明変数の値の候補と着目変数の値の候補との関係性を示す第2の情報を計算し、出力する。第2の情報は、条件付き確率の表、結合確率の表、クロス集計表又は重回帰式等である。典型的には、変数が離散値をとる場合には条件付き確率の表、結合確率の表又はクロス集計表が出力され、変数が連続値をとる場合には回帰式が出力される。ユーザは、第2の情報を参照することで、結合効果をより詳細に理解することが可能となる。以下では、第2の情報を、結合効果の第2の指標とも称する。詳細評価部135は、結合効果の第2の指標の評価対象とする特定の説明変数の組み合わせの指定を受け付ける。特定の説明変数の組み合わせは、ユーザにより指定され得る。この点について、図3を再度参照して説明する。
図3に示したUI画面10のリスト23において、変数C及びDの組み合わせが評価対象とする1の説明変数の組み合わせとして選択された場合、結合効果の第2の指標として何を評価するかを指定するためのサブメニュー24が表示される。図3では、サブメニュー24として条件付き確率のみが表示されている。ユーザがサブメニュー24において条件付き確率を選択すると、変数C及びDを説明変数とし変数Eを着目変数とした条件付き確率を示す表25が表示される。表25によれば、例えば、変数Cの値がc1であり変数Dの値がd1であるとき、変数Eがe1となる確率は0.85である。ユーザは、表25を参照することで、結合効果をより詳細に理解することが可能となる。
・レポート作成部136
レポート作成部136は、上述した結合効果の分析結果を示すレポートを作成する機能を有する。ここでのレポートとは、PDF(Portable Document Format)等の任意の形式のファイルである。上記では、UI画面上でのユーザ指示に応じて分析が進められる例を説明したが、レポート作成部136は、ユーザ指示を要さず又は一部のユーザ指示に基づいて、レポートを作成することができる。例えば、レポート作成部136は、着目変数の指定及び説明変数の数nの指定のみに基づいて、複数の説明変数の組み合わせに係る結合効果の第1の指標及び第2の指標の計算結果を列挙したレポートを作成することができる。
レポートは、関係検出部132による検出結果を示す情報を含み得る。例えば、レポートは、多変数の関係性を表現するグラフを含む。
レポートは、関係変数群抽出部133による抽出結果を示す情報を含み得る。例えば、レポートは、ユーザにより指定された変数又は任意の変数を着目変数とする、説明変数の抽出結果を示す情報を含む。
レポートは、結合効果評価部134による評価結果を示す情報を含み得る。例えば、レポートは、結合効果の第1の指標が閾値Th以上であり、且つ上位m個以内の説明変数の組み合わせに、当該説明変数の組み合わせに係る結合効果の第1の指標を対応付けて、且つ結合効果の第1の指標に応じた順位を付したリストを含み得る。又は、レポートは、結合効果の第1の指標が閾値Th以下であり、且つ下位m個以内の説明変数の組み合わせに、当該説明変数の組み合わせに係る結合効果の第1の指標を対応付けて、且つ結合効果の第1の指標に応じた順位を付したリストを含み得る。閾値Th及び選抜数mは、ユーザにより指定されてもよいし、任意の値であってもよい。
レポートは、詳細評価部135による評価結果を示す情報を含み得る。例えば、レポートは、ユーザに指定された又は任意の特定の説明変数の組み合わせと着目変数との条件付き確率の表、結合確率の表、クロス集計表又は重回帰式等を含み得る。
・補足
なお、上記では、詳細評価部135による評価は1つの説明変数の組み合わせに対して行われるものとして説明したが、本技術はかかる例に限定されない。詳細評価部135による評価は、複数の説明変数の組み合わせに対して行われてもよい。例えば、詳細評価部135は、全ての説明変数の組み合わせに対して結合効果の第2の指標を計算してもよい。そして、全ての説明変数の組み合わせに対する結合効果の第2の指標が、UI画面に出力されてもよいし、レポートとして出力されてもよい。この場合、結合効果評価部134は、結合効果の第1の指標に基づく順位付け及び選抜を省略してもよい。
さらに、上記では、nとしてひとつの値が指定されるものとして説明したが、本技術はかかる例に限定されない。例えば、nの上限値が指定されてもよい。その場合、2以上上限値以下の全てのnについて、結合効果評価部134及び詳細評価部135による評価が行われる。そして、2以上上限値以下の全てのnにおける、全ての説明変数の組み合わせに対する結合効果の第2の指標が、UI画面に出力されてもよいし、レポートとして出力されてもよい。
<<3.処理の流れ>>
図4は、本実施形態に係る情報処理装置100において実行される結合効果の分析処理の流れの一例を示すフローチャートである。図4に示すように、まず、入力部110は、多変数データを入力する(ステップS102)。次いで、関係検出部132は、多変数データの全変数について2変数間の関係性の指標を計算し、2変数間の関係を示すグラフを出力する(ステップS104)。次に、関係変数群抽出部133は、着目変数の指定、及び説明変数の個数nの指定を受け付け、n個の説明変数を含む説明変数の組み合わせを抽出する(ステップS106)。次いで、結合効果評価部134は、着目変数とn個の説明変数を含む説明変数の組み合わせとの関係性を示す第1の結合効果の指標を、n個の説明変数を含む説明変数の組み合わせの全てについて計算する(ステップS108)。次に、結合効果評価部134は、結合効果の第1の指標が閾値Th以上であり、且つ上位m個以内の説明変数の組み合わせを、結合効果の第1の指標が大きい順に、結合効果の第1の指標と対応付けて出力する(ステップS110)。次いで、詳細評価部135は、結合効果の第2の指標を計算すべき説明変数の組み合わせの指定を受け付ける(ステップS112)。そして、詳細評価部135は、指定された説明変数の組み合わせについて結合効果の第2の指標を計算し、計算結果を出力する(ステップS114)。
以上、結合効果の分析処理の流れの一例を説明した。なお、各構成要素による出力は、UI画面として出力されてもよい。また、各構成要素による出力は、レポート作成部136に入力され、レポート作成部136により生成されたレポートが出力されてもよい。また、ステップS110において、結合効果評価部134は、結合効果の第1の指標が閾値Th以下であり、且つ下位m個以内の説明変数の組み合わせを、結合効果の第1の指標が小さい順に、結合効果の第1の指標と対応付けて出力してもよい。
<<4.適用例>>
上記説明した提案技術の適用例を説明する。
(1)第1の適用例
第1の適用例は、製造系データ分析システムに提案技術が適用される例である。
ある製品の製造工場では、多数の測定器及びセンサにより情報が取得されている。例えば、製品の製造工程で取得される製品の形状についての測定値、加工機械が使われた際の加工機械の状態を示す電圧及び電流、並びに加工機械そのもののシリアル番号及びライン番号等が、取得される。また、工場の温度及び湿度などの情報も、取得される。そして、これらの情報と製品の最終的な出来栄えを示す情報とが紐付けられることで、多変数データが生成される。
この多変数データに相関分析等を適用することで、製品の出来栄えに影響を与えている因子を調べることができる。さらに、この多変数データに提案技術を適用することで、どの因子の組み合わせが製品の出来栄えに大きな影響を与えているか、というリスト(結合効果の第1の指標に基づき並べられた、説明変数の組み合わせのリスト)が提供される。製品の出来栄えに問題が発生した場合に、かかるリストにより、問題の要因となった因子を容易に特定することが可能になる。
(2)第2の適用例
第2の適用例は、顧客管理システムに提案技術が適用される例である。
企業には、その企業が提供する様々なサービスの顧客管理を目的とする、顧客管理システムが存在し得る。かかる顧客管理システムでは、顧客の年齢、性別、現住所、及び職業などの個人属性情報の他に、どのサービスを利用しているか否か、様々な契約の条件、オプション加入の有無等の情報、及び定期的なアンケート情報等が、顧客ごとに紐付けて管理される。これらの顧客ごとに紐付けて管理される情報は、多変数データである。
この多変数データに相関分析又は因果分析等を適用することで、サービスを継続しない人に特有の要因を調べることができる。さらに、この多変数データに提案技術を適用することで、サービスを継続しない人に特有の複合的な要因を容易に調べることができる。
(3)第3の適用例
第3の適用例は、疾病に関する調査研究支援システムに提案技術が適用される例である。
アンケート調査などにより、基本的な個人属性情報、様々な疾病の既往歴に関する情報、健康診断結果に関する情報、及び生活習慣に関係する情報を、個人ごとに紐付けたデータベースが作成され得る。なお、基本的な個人属性情報は、性別、年齢、職業、及び家族情報等を含む。健康診断結果に関する情報は、身長、体重、腹囲及び血圧等を含む。生活習慣に関係する情報は、飲酒、喫煙、睡眠時間及び運動習慣等を含む。これらの個人ごとに紐付けて管理される情報は、多変数データである。
この多変数データに相関分析又は因果分析等を適用することで、ある病気になりやすい人の特徴因子を調べることができる。さらに、この多変数データに提案技術を適用することで、分析者は、重要な複合的な要因の組み合わせが自動抽出されたレポートを容易に得ることが可能となる。
<<5.ハードウェア構成例>>
最後に、図5を参照して、本実施形態に係る情報処理装置のハードウェア構成について説明する。図5は、本実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。なお、図5に示す情報処理装置900は、例えば、図1に示した情報処理装置100を実現し得る。本実施形態に係る情報処理装置100による情報処理は、ソフトウェアと、以下に説明するハードウェアとの協働により実現される。
図5に示すように、情報処理装置900は、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903及びホストバス904aを備える。また、情報処理装置900は、ブリッジ904、外部バス904b、インタフェース905、入力装置906、出力装置907、ストレージ装置908、ドライブ909、接続ポート911及び通信装置913を備える。情報処理装置900は、CPU901に代えて、又はこれとともに、電気回路、DSP若しくはASIC等の処理回路を有してもよい。
CPU901は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置900内の動作全般を制御する。また、CPU901は、マイクロプロセッサであってもよい。ROM902は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。CPU901は、例えば、図1に示す制御部130を形成し得る。
CPU901、ROM902及びRAM903は、CPUバスなどを含むホストバス904aにより相互に接続されている。ホストバス904aは、ブリッジ904を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス904bに接続されている。なお、必ずしもホストバス904a、ブリッジ904および外部バス904bを分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。
入力装置906は、例えば、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチ及びレバー等、ユーザによって情報が入力される装置によって実現される。また、入力装置906は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置900の操作に対応した携帯電話やPDA等の外部接続機器であってもよい。さらに、入力装置906は、例えば、上記の入力手段を用いてユーザにより入力された情報に基づいて入力信号を生成し、CPU901に出力する入力制御回路などを含んでいてもよい。情報処理装置900のユーザは、この入力装置906を操作することにより、情報処理装置900に対して各種のデータを入力したり処理動作を指示したりすることができる。入力装置906は、例えば、図1に示す入力部110を形成し得る。
出力装置907は、取得した情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置で形成される。このような装置として、CRTディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ELディスプレイ装置、レーザープロジェクタ、LEDプロジェクタ及びランプ等の表示装置や、スピーカ及びヘッドホン等の音声出力装置や、プリンタ装置等がある。出力装置907は、例えば、情報処理装置900が行った各種処理により得られた結果を出力する。具体的には、表示装置は、情報処理装置900が行った各種処理により得られた結果を、テキスト、イメージ、表、グラフ等、様々な形式で視覚的に表示する。他方、音声出力装置は、再生された音声データや音響データ等からなるオーディオ信号をアナログ信号に変換して聴覚的に出力する。出力装置907は、例えば、図1に示す出力部120を形成し得る。
ストレージ装置908は、情報処理装置900の記憶部の一例として形成されたデータ格納用の装置である。ストレージ装置908は、例えば、HDD等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等により実現される。ストレージ装置908は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。このストレージ装置908は、CPU901が実行するプログラムや各種データ及び外部から取得した各種のデータ等を格納する。ストレージ装置908は、例えば、制御部130により作成されたレポートや、分析処理の途中結果及び最終的な結果等を記憶し得る。
ドライブ909は、記憶媒体用リーダライタであり、情報処理装置900に内蔵、あるいは外付けされる。ドライブ909は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体に記録されている情報を読み出して、RAM903に出力する。また、ドライブ909は、リムーバブル記憶媒体に情報を書き込むこともできる。
接続ポート911は、外部機器と接続されるインタフェースであって、例えばUSB(Universal Serial Bus)などによりデータ伝送可能な外部機器との接続口である。
通信装置913は、例えば、ネットワーク920に接続するための通信デバイス等で形成された通信インタフェースである。通信装置913は、例えば、有線若しくは無線LAN(Local Area Network)、LTE(Long Term Evolution)、Bluetooth(登録商標)又はWUSB(Wireless USB)用の通信カード等である。また、通信装置913は、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ又は各種通信用のモデム等であってもよい。この通信装置913は、例えば、インターネットや他の通信機器との間で、例えばTCP/IP等の所定のプロトコルに則して信号等を送受信することができる。本実施形態では、通信装置913は、入力部110及び/又は出力部120として機能し、制御部130に入力される情報を受信したり、制御部130から出力される情報を送信したりし得る。
なお、ネットワーク920は、ネットワーク920に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、ネットワーク920は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、ネットワーク920は、IP-VPN(Internet Protocol-Virtual Private Network)などの専用回線網を含んでもよい。
以上、本実施形態に係る情報処理装置900の機能を実現可能なハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて実現されていてもよいし、各構成要素の機能に特化したハードウェアにより実現されていてもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。
なお、上述のような本実施形態に係る情報処理装置900の各機能を実現するためのコンピュータプログラムを作製し、PC等に実装することが可能である。また、このようなコンピュータプログラムが格納された、コンピュータで読み取り可能な記録媒体も提供することができる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリ等である。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信されてもよい。
<<6.まとめ>>
以上、図1~図5を参照して、本開示の一実施形態について詳細に説明した。上記説明したように、本実施形態に係る情報処理装置100は、3つ以上の変数から成る多変数の値を含むデータに関し、多変数のうち着目変数の指定を受け付け、着目変数と多変数のうち2つ以上の説明変数を含む説明変数の組み合わせとの関係性の強さを示す第1の情報を出力する。出力される第1の情報は、結合効果の指標である。このように、本実施形態に係る情報処理装置100は、3変数以上の多変数の結合効果を容易に把握あるいは分析することが可能である。
多変数データを利用して、変数間の関係を理解するためのデータ分析を行うというユースケースは、極めて日常的且つ一般的である。このようなユースケースにおいて、3変数以上から成る重要な多変数の相関関係や因果関係を知ることは重要である。本実施形態に係る情報処理装置100によれば、この3変数以上の多変数の関係を定量的且つ容易に評価することが可能になった上に、その評価結果をユーザに可読容易に提示することが可能となった。これにより、データ分析の大幅な効率化とユーザによるデータ理解の高速化とが進み、それに基づくユーザの意思決定がよりスピーディになる効果が見込まれる。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
なお、本明細書において説明した各装置は、単独の装置として実現されてもよく、一部または全部が別々の装置として実現されても良い。例えば、図1に示した情報処理装置100の機能構成例のうち、制御部130が、入力部110及び出力部120とネットワーク等で接続されたサーバ等の装置に備えられていても良い。
また、本明細書においてフローチャート及びシーケンス図を用いて説明した処理は、必ずしも図示された順序で実行されなくてもよい。いくつかの処理ステップは、並列的に実行されてもよい。また、追加的な処理ステップが採用されてもよく、一部の処理ステップが省略されてもよい。
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、
前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報を出力する制御部、
を備える情報処理装置。
(2)
前記制御部は、変数をノードとし、変数間の相関関係又は因果関係をリンクとして表現するグラフを出力する、前記(1)に記載の情報処理装置。
(3)
前記ある着目する変数は、前記グラフにおけるノードの選択操作により指定される、前記(2)に記載の情報処理装置。
(4)
前記制御部は、前記説明変数を、前記グラフにおいて前記ある着目する変数とリンクで接続された変数、又は前記ある着目する変数とリンクで接続された変数の中で、前記ある着目する変数の原因であると推定された変数若しくは前記ある着目する変数の結果ではないと推定された変数から選択する、前記(2)又は(3)に記載の情報処理装置。
(5)
前記説明変数は、前記グラフにおけるノードの選択操作により指定される、前記(2)又は(3)に記載の情報処理装置。
(6)
前記制御部は、前記説明変数の組み合わせに含まれる前記説明変数の数の指定を受け付ける、前記(1)~(5)のいずれか一項に記載の情報処理装置。
(7)
前記制御部は、複数の前記説明変数の組み合わせを、前記説明変数の組み合わせに係る前記第1の情報の大小関係に基づく順番に並べて出力する、前記(1)~(6)のいずれか一項に記載の情報処理装置。
(8)
前記制御部は、前記説明変数の組み合わせと当該組み合わせに係る前記第1の情報とを対応付けて出力する、前記(7)に記載の情報処理装置。
(9)
前記制御部は、複数の前記説明変数の組み合わせのうち、前記第1の情報に基づき選抜された所定数の前記説明変数の組み合わせを示す情報を出力する、前記(7)又は(8)に記載の情報処理装置。
(10)
前記制御部は、前記所定数の指定を受け付ける、前記(9)に記載の情報処理装置。
(11)
前記第1の情報は関係性の強さを示す値であり、
前記制御部は、複数の前記説明変数の組み合わせのうち、前記第1の情報が所定の閾値以上又は以下である前記説明変数の組み合わせを示す情報を出力する、
前記(7)~(10)のいずれか一項に記載の情報処理装置。
(12)
前記制御部は、複数の前記説明変数の組み合わせのうち特定の前記説明変数の組み合わせに含まれる各々の前記説明変数の値の候補と前記ある着目する変数の値の候補との関係性を示す第2の情報を出力する、前記(1)~(11)のいずれか一項に記載の情報処理装置。
(13)
前記第2の情報は、条件付き確率の表、結合確率の表、クロス集計表又は重回帰式である、前記(12)に記載の情報処理装置。
(14)
前記グラフにおいて、前記リンクに2変数間の関係性の指標である第3の情報が関連付けて表示される、前記(2)又は前記(2)を引用する前記(3)~(13)のいずれか一項に記載の情報処理装置。
(15)
前記第3の情報は、相関関係又は因果関係を示す統計量である、前記(14)に記載の情報処理装置。
(16)
前記第1の情報は、エントロピー、相互情報量、相関係数、偏相関係数、検定のp値、その他の独立性、若しくは条件付き独立性の統計的尺度、又はそれらの組み合わせに基づいて計算される値である、前記(1)~(15)のいずれか一項に記載の情報処理装置。
(17)
3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、
前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報を出力すること、
を含む、プロセッサにより実行される情報処理方法。
(18)
コンピュータを、
3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、
前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報を出力する制御部、
として機能させるためのプログラム。
100 情報処理装置
110 入力部
120 出力部
130 制御部
131 入出力制御部
132 関係検出部
133 関係変数群抽出部
134 結合効果評価部
135 詳細評価部
136 レポート作成部

Claims (17)

  1. 3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、
    前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報と、
    複数の前記説明変数の組み合わせのうち特定の前記説明変数の組み合わせに含まれる各々の前記説明変数の値の候補と前記ある着目する変数の値の候補との関係性を示す第2の情報と、
    1つの画面上に出力する制御部、
    を備える情報処理装置。
  2. 前記制御部は、変数をノードとし、変数間の相関関係又は因果関係をリンクとして表現するグラフを出力する、請求項1に記載の情報処理装置。
  3. 前記ある着目する変数は、前記グラフにおけるノードの選択操作により指定される、請求項2に記載の情報処理装置。
  4. 前記制御部は、前記説明変数を、前記グラフにおいて前記ある着目する変数とリンクで接続された変数、又は前記ある着目する変数とリンクで接続された変数の中で、前記ある着目する変数の原因であると推定された変数若しくは前記ある着目する変数の結果ではないと推定された変数から選択する、請求項2に記載の情報処理装置。
  5. 前記説明変数は、前記グラフにおけるノードの選択操作により指定される、請求項2に記載の情報処理装置。
  6. 前記制御部は、前記説明変数の組み合わせに含まれる前記説明変数の数の指定を受け付ける、請求項1に記載の情報処理装置。
  7. 前記制御部は、複数の前記説明変数の組み合わせを、前記説明変数の組み合わせに係る前記第1の情報の大小関係に基づく順番に並べて出力する、請求項1に記載の情報処理装置。
  8. 前記制御部は、前記説明変数の組み合わせと当該組み合わせに係る前記第1の情報とを対応付けて出力する、請求項7に記載の情報処理装置。
  9. 前記制御部は、複数の前記説明変数の組み合わせのうち、前記第1の情報に基づき選抜された所定数の前記説明変数の組み合わせを示す情報を出力する、請求項7に記載の情報処理装置。
  10. 前記制御部は、前記所定数の指定を受け付ける、請求項9に記載の情報処理装置。
  11. 前記第1の情報は関係性の強さを示す値であり、
    前記制御部は、複数の前記説明変数の組み合わせのうち、前記第1の情報が所定の閾値以上又は以下である前記説明変数の組み合わせを示す情報を出力する、
    請求項7に記載の情報処理装置。
  12. 前記第2の情報は、条件付き確率の表、結合確率の表、クロス集計表又は重回帰式である、請求項に記載の情報処理装置。
  13. 前記グラフにおいて、前記リンクに2変数間の関係性の指標である第3の情報が関連付けて表示される、請求項2に記載の情報処理装置。
  14. 前記第3の情報は、相関関係又は因果関係を示す統計量である、請求項13に記載の情報処理装置。
  15. 前記第1の情報は、エントロピー、相互情報量、相関係数、偏相関係数、検定のp値、その他の独立性、若しくは条件付き独立性の統計的尺度、又はそれらの組み合わせに基づいて計算される値である、請求項1に記載の情報処理装置。
  16. 3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、
    前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報と、
    複数の前記説明変数の組み合わせのうち特定の前記説明変数の組み合わせに含まれる各々の前記説明変数の値の候補と前記ある着目する変数の値の候補との関係性を示す第2の情報と、
    1つの画面上に出力すること、
    を含む、プロセッサにより実行される情報処理方法。
  17. コンピュータを、
    3つ以上の変数から成る多変数の値を含むデータに関し、前記多変数のうちある着目する変数の指定を受け付け、
    前記ある着目する変数と前記多変数のうち2つ以上の説明変数を含む前記説明変数の組み合わせとの関係性の強さを示す第1の情報と、
    複数の前記説明変数の組み合わせのうち特定の前記説明変数の組み合わせに含まれる各々の前記説明変数の値の候補と前記ある着目する変数の値の候補との関係性を示す第2の情報と、
    1つの画面上に出力する制御部、
    として機能させるためのプログラム。
JP2020527434A 2018-06-28 2019-06-18 情報処理装置、情報処理方法及びプログラム Active JP7359144B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018123392 2018-06-28
JP2018123392 2018-06-28
PCT/JP2019/024159 WO2020004154A1 (ja) 2018-06-28 2019-06-18 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2020004154A1 JPWO2020004154A1 (ja) 2021-07-08
JP7359144B2 true JP7359144B2 (ja) 2023-10-11

Family

ID=68986625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020527434A Active JP7359144B2 (ja) 2018-06-28 2019-06-18 情報処理装置、情報処理方法及びプログラム

Country Status (5)

Country Link
US (1) US11615100B2 (ja)
EP (1) EP3816875A4 (ja)
JP (1) JP7359144B2 (ja)
CN (1) CN112368720A (ja)
WO (1) WO2020004154A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7268069B2 (ja) * 2020-02-21 2023-05-02 アクタピオ,インコーポレイテッド 学習装置、学習方法、学習プログラム、評価装置、評価方法、および評価プログラム
JP7434090B2 (ja) * 2020-07-08 2024-02-20 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、情報処理方法及び情報処理プログラム
WO2022149372A1 (ja) * 2021-01-08 2022-07-14 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム
CN113806452B (zh) * 2021-09-17 2022-10-25 北京百度网讯科技有限公司 信息处理方法、装置、电子设备及存储介质
WO2024004384A1 (ja) * 2022-06-27 2024-01-04 ソニーグループ株式会社 情報処理装置及び情報処理方法、並びにコンピュータプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005107747A (ja) 2003-09-29 2005-04-21 National Institute Of Advanced Industrial & Technology モデル作成装置、情報分析装置、モデル作成方法、情報分析方法、およびプログラム
JP2005122509A (ja) 2003-10-17 2005-05-12 Hitachi Ltd 階層構造データ分析方法、分析装置および分析プログラム
JP2012027880A (ja) 2010-07-28 2012-02-09 Hitachi Ltd 情報分析方法、計算機システム及び情報分析プログラム
JP2015060259A (ja) 2013-09-17 2015-03-30 株式会社日立製作所 データ分析支援システム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742877B1 (en) * 1999-07-22 2010-06-22 Becton, Dickinson & Company Methods, apparatus and computer program products for formulating culture media
US7311666B2 (en) * 2004-07-10 2007-12-25 Trigeminal Solutions, Inc. Apparatus for collecting information
US20090018975A1 (en) * 2007-07-10 2009-01-15 Massachusetts Institute Of Technology Method for establishing a commercial real estate price change index supporting tradable derivatives
CN102656581B (zh) * 2009-12-15 2016-03-16 日本电气株式会社 信息处理设备、信息处理方法和存储介质
JP4839416B1 (ja) * 2011-01-06 2011-12-21 アクアエンタープライズ株式会社 移動過程予測システム、移動過程予測方法、移動過程予測装置及びコンピュータプログラム
EP2791745B1 (en) * 2011-12-15 2020-09-09 Valmet Automation Oy A method of operating a process or machine
US20130304567A1 (en) * 2012-05-11 2013-11-14 Christopher Adrien Methods and appartus to assess marketing concepts prior to market participation
US20140289174A1 (en) * 2013-03-15 2014-09-25 Alexander Statnikov Data Analysis Computer System and Method For Causal Discovery with Experimentation Optimization
JP2014228991A (ja) 2013-05-21 2014-12-08 ソニー株式会社 情報処理装置および方法、並びにプログラム
US10776965B2 (en) * 2013-07-26 2020-09-15 Drisk, Inc. Systems and methods for visualizing and manipulating graph databases
JP6358260B2 (ja) * 2013-09-27 2018-07-18 日本電気株式会社 情報処理システム、情報処理方法およびプログラムを記憶する記録媒体
US20150178827A1 (en) * 2013-12-19 2015-06-25 Corelogic Solutions, Llc Computer modeling of propery tax delinquency risk
EP3552174A4 (en) * 2016-12-07 2020-05-27 Coogan-Pushner, Diane MUNICIPAL SOLVENCY INDEX
US20190332957A1 (en) * 2018-04-30 2019-10-31 Fujitsu Limited Causality for machine learning systems
EP3570227A1 (en) * 2018-05-16 2019-11-20 Ernst & Young GmbH Wirtschaftsprüfungsgesellschaft Interactive user interface for regression planning and evaluation system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005107747A (ja) 2003-09-29 2005-04-21 National Institute Of Advanced Industrial & Technology モデル作成装置、情報分析装置、モデル作成方法、情報分析方法、およびプログラム
JP2005122509A (ja) 2003-10-17 2005-05-12 Hitachi Ltd 階層構造データ分析方法、分析装置および分析プログラム
JP2012027880A (ja) 2010-07-28 2012-02-09 Hitachi Ltd 情報分析方法、計算機システム及び情報分析プログラム
JP2015060259A (ja) 2013-09-17 2015-03-30 株式会社日立製作所 データ分析支援システム

Also Published As

Publication number Publication date
EP3816875A1 (en) 2021-05-05
US20210124740A1 (en) 2021-04-29
CN112368720A (zh) 2021-02-12
EP3816875A4 (en) 2021-09-01
WO2020004154A1 (ja) 2020-01-02
US11615100B2 (en) 2023-03-28
JPWO2020004154A1 (ja) 2021-07-08

Similar Documents

Publication Publication Date Title
JP7359144B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7322714B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20180068371A1 (en) Learning Vector-Space Representations of Items for Recommendations using Word Embedding Models
EP3346428A1 (en) Sensor design support apparatus, sensor design support method and computer program
KR101957456B1 (ko) 뇌 질환 검출 및 예측 시스템 및 방법
JP2011248829A (ja) 評価予測装置、評価予測方法、及びプログラム
CN106796618A (zh) 时序预测装置和时序预测方法
JP7226320B2 (ja) 情報処理装置、情報処理方法及びプログラム
Ho A new approach to measuring Overall Liking with the Many-Facet Rasch Model
WO2020004049A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6285284B2 (ja) 意見活用支援装置、及び意見活用支援方法
KR101595784B1 (ko) 패혈증 고위험군 예측 방법 및 시스템
JP6635458B1 (ja) 情報処理装置
KR101346868B1 (ko) 인구분포통계에 따라 시간별 추출한 예측 투표자에 기초한 투표 결과 예측 방법
CN107729424A (zh) 一种数据可视化方法及设备
JP5296660B2 (ja) サービス規模成長性分析システムおよび方法ならびにそのためのプログラム
EP4006806A1 (en) Information processing device, information processing method, and information processing program
JP2008305229A (ja) 需要予測方法および装置
KR20220117677A (ko) 리뷰 큐레이션 제공 장치 및 방법
JP6804489B2 (ja) 情報提供装置及び情報提供方法
JP2021039735A (ja) 情報処理装置、及びプログラム
JP2008009819A (ja) セキュリティ診断システム
WO2022149372A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP7479534B2 (ja) 情報処理装置、推定装置、分析装置、情報処理方法及びコンピュータープログラム
WO2024004384A1 (ja) 情報処理装置及び情報処理方法、並びにコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230911

R151 Written notification of patent or utility model registration

Ref document number: 7359144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151