JP5350201B2 - 推論装置、推論方法、及びプログラム - Google Patents

推論装置、推論方法、及びプログラム Download PDF

Info

Publication number
JP5350201B2
JP5350201B2 JP2009278962A JP2009278962A JP5350201B2 JP 5350201 B2 JP5350201 B2 JP 5350201B2 JP 2009278962 A JP2009278962 A JP 2009278962A JP 2009278962 A JP2009278962 A JP 2009278962A JP 5350201 B2 JP5350201 B2 JP 5350201B2
Authority
JP
Japan
Prior art keywords
data
inference
attribute
unknown
psd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009278962A
Other languages
English (en)
Other versions
JP2011123574A (ja
Inventor
義夫 飯塚
将実 川岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009278962A priority Critical patent/JP5350201B2/ja
Publication of JP2011123574A publication Critical patent/JP2011123574A/ja
Application granted granted Critical
Publication of JP5350201B2 publication Critical patent/JP5350201B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、属性が既知なデータを学習し属性が未知なデータの属性を推論する推論装置に関し、特に推論装置の出力値を評価する技術に関する。
コンピュータを用いたデータ処理技術の一つとして、既知の事象から抽出した知識に基づいて、未知の事象を推論する推論技術がある。未知の事象を推論する推論装置の多くは、教師付き学習によって推論に用いる知識を得ている。教師付き学習とは、データの特性をあらわす特性値(「観測値」と呼ばれる場合もある)と共に求めたいデータの属性(「クラス・ラベル」と呼ばれる場合もある)が与えられたデータ(すなわち、属性が既知のデータ(既知データ))を用いて、属性と特性値との間の対応関係(知識)を学習する手法である。教師付き学習によって得られた知識を用いて、推論装置は、属性が未知のデータ(未知データ)に対して、その未知データの特性値から属性を推論する。従って、教師付き学習で得られた知識の良し悪しが、その知識を用いた推論装置の推論精度に大きく影響する。
従来の推論装置では、既知データの分布と未知データの分布が等しいことを前提にして教師付き学習を行っていた。それゆえ、十分多い数の既知データを用いて既知データの分布を正確に学習できれば、未知データの属性を精度良く推論できると考えられていた。
未知データの属性を推論するための学習が十分に行われているか否か(あるいはその十分さの程度)を、学習に用いた既知データに基づいて導出できるのであれば、当該未知データに対する推論の信頼性としてこれをユーザに提示することができる。例えば、特性値(複数の要素から構成されるベクトル)によって定義されるベクトル空間において、未知データの特性値と、未知データの最近傍(またはk近傍)にある既知データの特性値との間の距離を計算する。そして、その距離が所定値以上であれば未学習の特性値(すなわち学習不足)であると判断し、推論装置が出力する推論結果の信頼性が低いことをユーザに知らせることができる。また、未知データの特性値に対してベクトル空間中の所定距離内にある既知データの数を求め、その数に基づいて当該未知データに対する学習の十分さの程度を求め、これを推論の信頼度としてユーザに提示するという方法も考えられる。また、特許文献1では、未知データに対する属性の予測値が、未知データのk近傍にある既知データの属性の多くと一致する時に推論結果の信頼度が高いとしている。
また、近年では医療分野で例えば病変部の診断の支援を、推論装置を用いて行おうとしている。
特開2003−323601号公報
しかし、例えば病変部に対して属性を推論する場合などでは、画像のみからでは病変部の属性が不明であり、DND判定や組織の切り出し片の観察などによる病理判断で属性が判断される場合がある。さらに、病変部の属性が時間とともに変化することがわかってきている。
本願出願人はこのようなデータの特性が推論装置の推論精度に影響を与えることを見出した。
本発明は、この様な課題に鑑みてなされたものである。上記の課題を解決する装置を提供することを目的とする。
本発明の推論装置は、属性が既知である既知データから得られた特性値を用いて学習し、属性が未知である未知データの特性値に基づいて該未知データの属性を推論する推論手段と、
特性値であらわされる空間における前記未知データが属する部分空間に関して、前記部分空間に属する第1の方法で属性が既知となったデータの分布情報と、第1の方法では属性が不明であるデータの分布情報とから、前記部分空間を評価する値を計算する計算手段と、
前記推論手段によって得られた前記未知データの属性の推論結果と、前記計算手段によって得られた前期未知データが属する前記部分空間の評価値と、の少なくともいずれか一方を出力する出力手段と、を備えることを特徴とする。
本発明に係る推論装置によれば、推論装置が出力した推論結果の信頼性を評価することができる。
第1の実施形態に係る推論装置の機器構成例を示す図である。 既知データの分布にバイアスが存在する可能性を示す図である。 既知データ、未知データ及び対応データの分布の一例を示す図である。 第1の実施形態に係る推論装置の制御手順を示すフローチャートである。 信頼度GPSdの計算手順を示すフローチャートである。
以下、添付図面に従って本発明に係る推論装置及びその制御方法の好ましい実施形態について説明する。ただし、発明の範囲は図示例に限定されるものではない。
[第1の実施形態]
図1は、第1の実施形態に係る推論装置の機器構成例を示す図である。
推論装置1は、制御部10、モニタ104、マウス105、キーボード106を有する。制御部10は、中央処理装置(CPU)100、主メモリ101、磁気ディスク102、表示メモリ103を有し、それぞれは共有バス107で接続されている。そして、コンピュータが備えるCPU100が主メモリ101に格納されたプログラムを実行することにより、データベース2との通信、推論装置1の全体制御、等の各種制御が実行される。推論装置1は図示しない推論部200を有し、データの属性やデータの特性値を取得する。そして、特性値から属性を推論するものである。
CPU100は、主として推論装置1の各構成要素の動作を制御する。主メモリ101は、CPU100が実行する制御プログラムを格納したり、CPU100によるプログラム実行時の作業領域を提供したりする。磁気ディスク102は、オペレーティングシステム(OS)、周辺機器のデバイスドライブ、後述する診断支援処理等を行うためのプログラムを含む各種アプリケーションソフト等を格納する。表示メモリ103は、モニタ104のための表示用データを一時記憶する。モニタ104は、例えばCRTモニタや液晶モニタ等であり、表示メモリ103からのデータに基づいて画像を表示する。マウス105及びキーボード106はユーザ(医師)によるポインティング入力及び文字等の入力をそれぞれ行う。上記各構成要素は共通バス107により互いに通信可能に接続されている。
本実施形態において、未知データの中には、何らかの根拠に基づいて既知データと対応付けられているデータ(以下ではこれを対応データと呼ぶ)が存在しているものとする。これらデータは例えば病変部を含むものとする。
データベース2は、既知データ、未知データ、対応データに関する各種の情報(個々のデータの特性値ベクトルや、既知データ、未知データ、対応データの夫々の分布情報)を保持している。そして、推論装置1は、LAN(Local Area Network)3を介してデータベース2から各種の情報を読み出すことができる。あるいは、推論装置1に外部記憶装置、例えばFDD、HDD、CDドライブ、DVDドライブ、MOドライブ、ZIPドライブ等を接続し、それらのドライブから各種の情報を読み込むようにしてもよい。
推論精度に影響を与える状況を、図2を用いて説明する。
特性値によって定義されるベクトル空間(以下「空間」と呼ぶ場合もある)の少なくとも一部の部分空間(空間内の一部の領域)において、クラス毎に属性の調べ易さが他とは異なるような状況がある。このような場合では、一部のクラスに属するデータからしか既知データを得られない。この場合、該部分空間では既知データの分布と未知データの分布が異なる可能性が生じる。なお、以下ではこの様な状況を、既知データの分布にバイアス(統計的偏り)が存在している状況と呼ぶ。
図2を用いて、上記の状況を更に詳しく説明する。同図では、説明を簡単にするため、特性値は特性値V1と特性値V2から成る2次元データであると仮定する。記号○、□、△は、それぞれ異なる属性を持つ既知データを表す。記号?は、属性が不明の未知データを表す。二重線で囲った部分空間210は、上記の状況に記した部分空間を表す。
同図において、部分空間210では、属性□は比較的調べ易いため、属性□を持ったデータだけが既知データとして得られたことを示している。一方、部分空間210では、他の属性を持ったデータは調べ難いため、存在する可能性は否定できないものの、既知データとして得ることはできなかったことを示している。
同図に示した状況は、例えば、医用画像診断において、ある病変部の医用画像(X線写真、CT画像、MRI画像、マンモグラム、超音波画像など)から得られた画像所見や画像特徴量などの情報(特性値)から、その病変部の疾患名を属性として推論する場合(第一の応用例)などで生じる。例えば、ある患者の胸部CT画像中に結節と呼ばれる異常影が写っていた場合、この結節の原因となる疾患名として原発性肺癌、(他の身体部位に生じた)癌の肺転移、または良性結節が考えられる。結節サイズが比較的大きい(2〜3cm以上)場合は、通常、生検を行い、組織診断(病理診断)を行うため、いずれの疾患名(属性)も確定できることが多い。ところが、結節サイズが小さい(数mm程度)場合は、通常、経過観察となり、組織診断を行わないため、疾患名を確定できないことが多い。
ただし、治療を行わずに2年間経過観察を継続した場合に、結節サイズが変わらなかったかまたは縮小した場合は、臨床的な判断として、疾患名は良性結節であると診断される。特性値V1を結節サイズ、特性値V2を他の様々な画像所見や画像特徴量をまとめて表した値だとした場合、特性値V1(結節サイズ)が数mm程度の小さな結節は、特性値V2(他の様々な画像所見や画像特徴量)も明確に現れていないため、部分空間210に位置する。そして、上述の通り、部分空間210において、一部の良性結節(属性□)は疾患名が明らかとなるが、原発性肺癌(属性○)や癌の肺転移(属性△)の疾患名はほとんど得られない。
また別の例では、図2に示した状況は、ある生物をカメラ撮影した画像から得られた画像特徴量(特性値)から、その生物の分類(生物種やその亜種など)を属性として推論する場合(第二の応用例)などで生じる。生物種によっては、画像撮影はできるが、保護の観点または物理的な制約から、直接捕獲してDNA判定などの方法で属性を確定することができない場合がある。ただし、稀に、怪我をして保護された個体の属性を確定できることがある。特性値V1を生物のサイズ、特性値V2を生物の体表に現れる模様、属性を生物種の亜種だとした場合、幼年期の生物はサイズが小さく、体表の模様も明確に現れていないため、部分空間210に位置する。この例では、属性□に属する亜種は、何らかの理由(捕獲容易、人工飼育容易、怪我による保護が多いなど)により、部分空間210においても属性の確定が可能な場合が多いものとする。一方、属性○または△に属する亜種は、部分空間210において属性の確定が困難であるとする。それゆえ、部分空間210では、属性□に属する亜種だけが既知データとして得られる状況が生じる。
上記例の様な状況下において通常の教師付き学習を行うと、部分空間210に属する未知データは、その真の属性が○や△であったとしても、属性□であると推論されてしまう。しかも、未知データと既知データの間の距離が近い(あるいは、近傍に多数の既知データが存在する)場合には、上記のような信頼性の導出方法では、推論結果の信頼性が高いと判断されてしまう。すなわち、推論結果のみならず、信頼性の判断においても間違ってしまう。
図3は、特性値によって定義されるベクトル空間における既知データ、未知データ及び対応データの分布の一例を示す図である。図2と同様に図3では、全てのデータは特性値V1とV2から成る2次元ベクトル空間に分布すると仮定する。なお、本実施形態では説明を容易にするために特性値ベクトルの次元を2次元と仮定するが、特性値ベクトルの次元は任意の次元であってよい。このベクトル空間は、部分空間310〜390に分割されているものとする。ベクトル空間を部分空間に分割する方法はどのような方法であってもよいが、同図の例では、特性値V1及びV2を均等間隔の区間に分割することで部分空間を構成している。記号○、□、△は、それぞれ異なる属性を持つ既知データを表す。これらの属性を得る方法(第1の方法)は、応用例によって異なる。例えば、上述した第一の応用例においては、第1の方法として、例えば病変部の病理診断によってその属性を確定できる。また、上述した第二の応用例においては、第1の方法として、例えば捕獲した個体のDNA判定などにより属性を確定できる。記号?は、属性が不明の未知データの中で、既知データとの対応関係がわかっていないデータを表す。記号○’、□’、△’は、未知データの中でそれぞれ既知データ○、□、△との対応関係がわかっている対応データを表す。図2と図3の比較から明らかな様に、図2中の記号?で示した未知データの一部が、図3中の記号○’、□’、△’で示した対応データに置き換わっている。
ここで、データベース2に含まれる未知データの夫々が対応データか否を判定する方法について説明する。何れの未知データが対応データであるかは、未知データと既知データとの対応関係を調べることによって得ることができる。この対応関係を調べる方法(第2の方法)は、応用例によって異なる。例えば、上述した第一の応用例においては、第2の方法として以下の様に対応関係を調べることができる。
まず、図2に示された状況を再度述べる。結節サイズ(特性値V1)が数mm程度の小さな結節は、他の様々な画像特徴量(特性値V2)も明確に現れていないため、部分空間210(図3の部分空間310)に位置する。そして、部分空間210(図3の部分空間310)において、経過観察により一部の良性結節(属性□)は疾患名が明らかとなるが、原発性肺癌(属性○)や癌の肺転移(属性△)の疾患名はほとんど得られない、という状況が生じる。
上述の状況において、任意の患者を経過観察した場合、当初は図3の部分空間310に位置する未知データとして観察された結節が、時間の経過とともにサイズが増大し、特性値が部分空間340(または350)に位置する様になったとする。この場合、他の条件(結節サイズの増大速度や、過去の疾患暦など)を勘案した上で、生検及び組織診断(病理診断)を行うことになるため、サイズ増大後の結節の多くは、属性を確定でき、既知データとなる。この様にして、対応データを得ることができる。つまり、未知データであった小結節が、サイズ増大後に属性○(原発性肺癌)と診断されて既知データになった場合、前記小結節は属性○’を持つ対応データとなる。同様にして、属性□’を持つ対応データや、属性△’を持つ対応データが得られる。なお、良性結節であった小結節が、サイズ増大中に原発性肺癌や肺転移に変化することもあり得るので、上記対応データを既知データとはできない(上記小結節の疾患名は確定できない)ことに注意が必要である。
また、上述した第二の応用例においては、第2の方法として以下の様に対応関係を調べることができる。
まず、図2に示された状況を再度述べる。特性値V1を生物のサイズ、特性値V2を生物の体表に現れる模様、属性を生物種の亜種だとした場合、幼年期の生物はサイズが小さく、体表の模様も明確に現れていないため、部分空間210(図3の部分空間310)に位置する。属性□に属する亜種は、何らかの理由(捕獲容易、人工飼育容易、怪我による保護が多いなど)により、部分空間210(図3の部分空間310)においても属性の確定が可能な場合が多い。一方、属性○または△に属する亜種は、部分空間210(図3の部分空間310)において属性の確定が困難である。それゆえ、部分空間210(図3の部分空間310)では、属性□に属する亜種だけが既知データとして得られる状況が生じる。
上述の状況において、既知データの一つである成長した個体Yが、未知データの一つである幼年期の個体Xに対して養育行動を取っていることが観測された場合、既知データYと未知データXの間には血縁関係が類推される。ただし、養育行動の存在が直ちに血縁関係を保障する訳ではないので、未知データXの属性は確定できない。その一方で、既知データYと未知データXの間に血縁関係が存在する可能性は非常に高いので、未知データXは既知データYと確率的に対応づけられる。つまり、未知データXは既知データYの対応データとなる。
他にも対応データを求める方法はある。例えば、ある個体を継続的に観察可能な場合、その個体の成長過程を観測することによって、対応データを求めることができる。ある個体を幼年期に観察した時得られた特性値が図3の部分空間310に位置し、生物的特徴がはっきりしないため、未知データXだったとする。一定期間が経過し、前記個体が成長した後、前記個体を観測して得られた特性値が部分空間340(または350)に位置し、生物的特徴がはっきりしたため、属性を確定でき、既知データYになったとする。もし、何らかの手掛かりにより、幼年期に観測した未知データXと成長後に観測した既知データYとが同じ個体であることが保障されるなら、未知データXの属性を確定できるので、Xは既知データとなる。しかし、前記個体を継続的に観測し、同じ個体であることを識別し続けることが困難な場合、未知データXと既知データYとが同じ個体であることは保障されない。ただし、状況証拠などから、未知データXと既知データYとが同じ個体である可能性が高い場合、未知データXは既知データYの対応データとなる。
以上の様にして、対応データを得ることができる。なお、本実施形態では、データベース2に含まれる未知データの夫々が対応データか否を判定する処理は、事前に実行されているものとする。そして、その結果がデータベース2に保持されているものとする。
次に、図4のフローチャートを用いて、制御部10がどのように推論装置1を制御しているかについて説明する。なお、図4のフローチャートによって示される処理は、CPU100が主メモリ101に格納されているプログラムを実行することにより実現される。
ステップS401において、CPU100は、マウス105やキーボード106を用いたユーザ操作によって、属性の推論対象となる未知データdを推論装置1に入力する。あるいは、CPU100は、推論装置1に接続された外部記憶装置から未知データdを読み出してもよい。
ステップS402において、CPU100は、既存の推論手法を用いて未知データdの属性を推論する。ここで、属性の推論結果として得られる情報は、推論手法に応じて異なる可能性がある。一般に、どの推論手法を用いても、最も可能性の高い属性Ldを得ることはできる。さらに、ベイズ・ネットなどの確率的推論手法を用いれば、すべての属性(L1〜Ln,n≧2)に対して、各属性が正解となる確率(pL1〜pLn)を得ることができる。
ステップS403において、CPU100は、未知データdの特性値に基づき、未知データdが位置する部分空間PSを判定する。図3の例では、CPU100は、未知データdの特性値と各部分空間の境界線とを比較することにより、未知データdが部分空間310〜390のどこに位置するかを判定する。
ステップS404において、CPU100は、未知データdが位置する部分空間PS内のバイアス度BPSdを、既知データの分布情報と、対応データの分布情報とに基づいて計算する。例えば、部分空間PS内に存在する既知データ数KNPSdと、部分空間PS内に存在する対応データ数RNPSdを用いて、式(1)によりバイアス度BPSdを評価値として計算する。
PSd=RNPSd/(KNPSd+RNPSd+1)・・・(1)
(1)式を用いて計算したバイアス度BPSdは、値0以上値1未満となり、BPSd値が値1に近いほど既知データの分布のバイアスは大きい。例えば、図3において、上記未知データdが部分空間310に存在する(PS=1)とした場合、部分空間310内の既知データ数KNPSd=2、部分空間310内の対応データ数RNPSd=5なので、BPSd=5/8=0.625となる。一方、図3において、上記未知データdが部分空間320〜390のいずれかに存在するとした場合、部分空間320〜390内の対応データ数はいずれもRNPSd=0なので、BPSd=0となる。つまり、図3の例では、上記未知データdが部分空間310に存在する場合のみ、バイアス度BPSdは比較的大きな値となる。
ステップS405において、CPU100は、上記バイアス度BPSdを用いて、ステップS402で得た属性の推論結果の信頼度GPSdを計算する。以下、図5を用いて、信頼度GPSdの計算手順を例示する。
図5は、信頼度GPSdの計算手順を示すフローチャートである。同図によって示される処理は、CPU100が主メモリ101に格納されているプログラムを実行することにより実現される。
ステップS501において、CPU100は、部分空間PS内に存在する既知データ数KNPSdが所定の閾値ThKN以上かどうかを判断し、KNPSd値がThKN値以上の場合はステップS502に進み、KNPSd値がThKN値未満の場合はステップS503に進む。
ステップS502において、CPU100は、学習度TPSdに値1を代入する。一方、ステップS503において、CPU100は、(2)式を用いて学習度TPSdを計算する。
PSd=KNPSd/ThKN・・・(2)
なぜなら、一般に、図4のステップS402で用いる推論手法は、既知データを用いて機械学習を行うことにより、推論精度を向上させている。従って、一般に、部分空間PS内に存在する既知データ数KNPSdが多い程、部分空間PS内における属性の推論精度は高くなる。それゆえ、上述の方法で学習度TPSdを求めることが妥当である。
ステップS504において、CPU100は、(3)式を用いて信頼度GPSdを評価値として計算する。
PSd=W*(1−BPSd)+W*TPSd ・・・(3)
ここで、Wはバイアス度BPSdに掛ける重み、Wは学習度TPSdに掛ける重みであり、0≦W≦1、0≦W≦1、W+W=1の条件を満たす値を予め決めておく。W値とW値を変更することにより、バイアス度BPSdと学習度TPSdが信頼度GPSdに及ぼす影響を変更することができる。
以上の処理により、信頼度GPSdとして、値0以上1以下の実数値が得られる。GPSd値が値1に近い程、ステップS402で得られた属性の推論結果が信頼できることを意味する。
以下、図4の説明に戻る。
ステップS406において、CPU100は、ステップS402で得られた属性の推論結果及びステップS405で得られた信頼度GPSdを、表示メモリ103を介してモニタ104に出力(表示)する。この際、信頼度GPSdの値を直接表示することもできるが、他の表示方法を採用してもよい。例えば、ステップS402で得られた属性の推論結果の表示方法(文字や図形の種類、表示色、表示位置、表示サイズなど)を変更することにより、上記推論結果の信頼性の高さを視覚的に表現してもよい。
以上のようにして、対応データの分布に基づいて既知データの分布のバイアスを求めることができる。対応データは既知データ数とある程度比例した割合でしか増えないため、既知データのバイアス度を求めるための情報として好適である。
以上のようにして、既知データの分布にバイアスが存在する可能性がある場合に、このバイアスの可能性を検出し、検出結果をユーザに提示することができる。また、推論装置が出力した推論結果の信頼性を適切に評価し、ユーザに知らせることができる。これにより、ユーザは推論結果の信頼性の高さに応じて、推論装置の推論結果をどの程度参照すべきか判断できるため、推論装置をより効果的に利用できる。
(変形例)
なお、ステップS403において部分空間PSを取得(判定)する処理は、上記に限定されるものではない。例えば、未知データdの特性値から所定の範囲内の空間(例えば、未知データdを中心とする所定の半径の円内)を部分空間PSとして動的に定義してもよい。
また、ステップS404においてバイアス度BPSdを計算する処理は、上記に限定されるものではなく、既知データと対応データの分布情報に基づくものであれば式(1)を用いなくてもよい。例えば、データ間の距離を考慮した分布情報を用いてもよい。例えば、部分空間PS内の夫々のデータに関して、未知データdとの間の距離に応じて漸減する加重係数(例えば距離の逆数)を算出する。そして、部分空間PS内の既知データに関する加重係数の和KSPSdと、部分空間PS内の対応データに関する加重係数の和RSPSdを求め、式(4)によりバイアス度BPSdを計算してもよい。
PSd=RSPSd/(KSPSd+RSPSd+1)・・・(4)
これによると、未知データの近傍の情報を重視したバイアス度を得ることができる。なお、上記のように、未知データdからの距離に応じて夫々のデータの影響度が漸減するようなバイアス度BPSdの計算方法を用いる場合には、部分空間PSとして明確な境界を有する空間を定義しなくてもよい。この場合、未知データdを中心とした明確な境界を有さない範囲が、部分空間PSとなる。
また、ステップS404においてバイアス度BPSdを計算する処理は、上記に限定されるものではなく、既知データの分布情報と、対応データを含む未知データの分布情報とに基づいて計算してもよい。例えば、部分空間PS内に存在する既知データ数KNPSdと、部分空間PS内に存在する未知データ数UNPSdを用いて、式(5)によりバイアス度BPSdを計算してもよい。
PSd=UNPSd/(KNPSd+UNPSd+1)・・・(5)
これによると、対応データが得られていない場合であってもバイアス度が計算できる。特に、未知データが無制限に増えない場合には有効である。
また、ステップS405における信頼度GPSdの計算方法は、上記に示した方法以外であってもよい。例えば、1からBPSdを除算した値をGPSdとしてもよい。また、バイアス度BPSdが所定の閾値ThB以上の場合には信頼度GPSdを0、閾値ThB未満の場合には信頼度GPSdを1としてもよい。この場合、GPSd=0の時、ステップS402で得られた属性の推論結果が信頼できないことを意味する。また、GPSd=1の時、ステップS402で得られた属性の推論結果が信頼できることを意味する。
また、ステップS406において、ステップS402で得た属性の推論結果及びステップS405で得た信頼度GPSdを出力するのと共に、ステップS404で得たバイアス度BPSdを出力してもよい。また、信頼度GPSdは出力せずに属性の推論結果とバイアス度BPSdを出力してもよい。また、バイアス度BPSdが所定の閾値以上か否かに基づいてバイアスの有無を判定して、その判定結果を表示してもよい。
また、ステップS406において、上記出力内容を不図示の印刷装置に出力(印刷)してもよい。あるいは、上記出力内容を音声データに変換した後、不図示の音響出力装置に出力してもよい。
以上説明したように、本発明に係る推論装置によれば、既知データの分布にバイアスが存在する可能性がある場合に、このバイアスの存在やその程度やそれに係る推論の信頼性をユーザに提示することができる。そのため、推論装置が出力した推論結果の信頼性を適切に評価し、ユーザに知らせることができる、という効果がある。これにより、ユーザは推論結果の信頼性の高さに応じて、推論装置の推論結果をどの程度参照すべきか判断できるため、推論装置をより効果的に利用できる。
1 推論装置
2 データベース
3 LAN(Local Area Network)
10 制御部
100 CPU(計算手段)
104 モニタ
200 推論部

Claims (8)

  1. 属性が既知である既知データから得られた特性値を用いて学習し、属性が未知である未知データの特性値に基づいて該未知データの属性を推論する推論手段と、
    特性値であらわされる空間における前記未知データが属する部分空間に関して、前記部分空間に属する第1の方法で属性が既知となったデータの分布情報と、第1の方法では属性が不明であるデータの分布情報とから、前記推論手段が出力した前記部分空間における推論結果の信頼度を計算する計算手段と、
    前記推論手段によって得られた前記未知データの属性の推論結果と、前記計算手段によって得られた前記未知データが属する前記部分空間における前記推論結果の信頼度と、の少なくともいずれか一方を出力する出力手段と、を備えることを特徴とする推論装置。
  2. 前記計算手段は、前記部分空間に属する前記第1の方法では属性が不明であるデータ、あるいは、前記第1の方法では属性が不明であるが前記第1の方法と異なる第2の方法で属性が既知となったデータの少なくともいずれか一方の数と、前記第1の方法で属性が既知となったデータ数とから、前記部分空間における推論結果の信頼度を計算することを特徴とする請求項1に記載の推論装置。
  3. 前記第2の方法は所定時間でのデータの特性の変化から属性を得るものであることを特徴とする請求項2に記載の推論装置。
  4. 前記データは病変部に関する情報を含むものであり、前記特性値は病変部を代表する値であることを特徴とする請求項1に記載の推論装置。
  5. 前記第1の方法は前記病変部の病理診断から属性を得るものであることを特徴とする請求項4に記載の推論装置。
  6. 前記計算手段は、前記部分空間に属する前記第1の方法で属性が既知となったデータ数と前記第2の方法で属性が既知となったデータ数の割合を示す値と、前記第1の方法で属性が既知となったデータ数の所定値に対する比率を示す値とに基づいて前記信頼度を計算することを特徴とする請求項2に記載の推論装置。
  7. 属性が既知である既知データから得られた特性値を用いて学習し、属性が未知である未知データの特性値に基づいて該未知データの属性を推論する推論工程と、
    特性値であらわされる空間における前記未知データが属する部分空間に関して、前記部分空間に属する第1の方法で属性が既知となったデータの分布情報と、第1の方法では属性が不明であるデータの分布情報とから、前記部分空間における推論結果の信頼度を計算する計算工程と、前記推論工程によって得られた前記未知データの属性の推論結果と、前記計算工程によって得られた前記未知データが属する前記部分空間における推論結果の信頼度と、の少なくともいずれか一方を出力する出力工程と、を備えることを特徴とする推論方法。
  8. 請求項7に記載の推論方法をコンピュータに実行させるためのプログラム。
JP2009278962A 2009-12-08 2009-12-08 推論装置、推論方法、及びプログラム Active JP5350201B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009278962A JP5350201B2 (ja) 2009-12-08 2009-12-08 推論装置、推論方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009278962A JP5350201B2 (ja) 2009-12-08 2009-12-08 推論装置、推論方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011123574A JP2011123574A (ja) 2011-06-23
JP5350201B2 true JP5350201B2 (ja) 2013-11-27

Family

ID=44287432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009278962A Active JP5350201B2 (ja) 2009-12-08 2009-12-08 推論装置、推論方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5350201B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10049445B2 (en) 2011-07-29 2018-08-14 Canon Kabushiki Kaisha Image processing apparatus and image processing method of a three-dimensional medical image
JP6313741B2 (ja) * 2015-12-25 2018-04-18 キヤノン株式会社 画像処理装置及び画像処理装置の作動方法
JP6527614B2 (ja) * 2018-03-22 2019-06-05 キヤノン株式会社 画像処理装置及び画像処理装置の作動方法
JP7196933B2 (ja) 2018-12-10 2022-12-27 日本電気株式会社 学習装置および学習方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259415A (ja) * 1999-03-11 2000-09-22 Fuji Electric Co Ltd ファジィ推論値の信頼性評価方法
JP2004283188A (ja) * 2003-03-19 2004-10-14 Konica Minolta Holdings Inc 画像診断支援装置、画像診断支援方法、プログラム及び記憶媒体
JP4318221B2 (ja) * 2004-12-02 2009-08-19 富士通株式会社 医療情報分析装置、方法及びプログラム
JP5337992B2 (ja) * 2007-09-26 2013-11-06 富士フイルム株式会社 医用情報処理システム、医用情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2011123574A (ja) 2011-06-23

Similar Documents

Publication Publication Date Title
Dhar et al. Challenges of deep learning in medical image analysis—improving explainability and trust
JP6818424B2 (ja) 診断支援装置、情報処理方法、診断支援システム及びプログラム
Singh et al. An information fusion based method for liver classification using texture analysis of ultrasound images
JP5582707B2 (ja) 医療意志決定支援装置及びその制御方法
EP2506173B1 (en) Medical diagnosis support apparatus and medical diagnosis support method
JP5100285B2 (ja) 医用診断支援装置およびその制御方法、プログラム、記憶媒体
US9519866B2 (en) Diagnosis support apparatus, method of controlling the same, and storage medium
JP5875285B2 (ja) 医療診断支援装置、情報処理方法及びプログラム
JP6021346B2 (ja) 診断支援装置及びその制御方法
JP6362061B2 (ja) 診断支援システム、その作動方法、およびプログラム
JP5350201B2 (ja) 推論装置、推論方法、及びプログラム
WO2019107177A1 (en) Information processing apparatus, information processing system, information processing method, and program
JP2007151645A (ja) 医用画像診断支援システム
JPWO2012046842A1 (ja) 読影依頼システム、読影依頼仲介装置、制御プログラム及び読影結果評価方法
JP2021077331A (ja) データ処理装置及びデータ処理方法
JP7013145B2 (ja) 情報処理装置、情報処理システム、情報処理装置の作動方法及びプログラム
CN113496478B (zh) 医学影像辨识方法及医学影像辨识装置
JP6220435B2 (ja) 診断支援装置及びその制御方法
Vittinghoff et al. Survival analysis
Xu et al. Fairness in medical image analysis and healthcare: A literature survey
JP6527614B2 (ja) 画像処理装置及び画像処理装置の作動方法
JP6530841B2 (ja) 診断支援システム、その作動方法、診断支援装置、およびプログラム
JP6193964B2 (ja) 情報処理装置、情報処理装置の作動方法および情報処理システム
Langius-Wiffen et al. External validation of the RSNA 2020 pulmonary embolism detection challenge winning deep learning algorithm
JP7483502B2 (ja) 画像診断支援装置および画像診断支援方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130821

R151 Written notification of patent or utility model registration

Ref document number: 5350201

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151