JP4343140B2 - 評価装置及びそのコンピュータプログラム - Google Patents

評価装置及びそのコンピュータプログラム Download PDF

Info

Publication number
JP4343140B2
JP4343140B2 JP2005137203A JP2005137203A JP4343140B2 JP 4343140 B2 JP4343140 B2 JP 4343140B2 JP 2005137203 A JP2005137203 A JP 2005137203A JP 2005137203 A JP2005137203 A JP 2005137203A JP 4343140 B2 JP4343140 B2 JP 4343140B2
Authority
JP
Japan
Prior art keywords
partial space
data
storage unit
evaluation
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005137203A
Other languages
English (en)
Other versions
JP2006318013A (ja
Inventor
力 米森
正寿 西村
務 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2005137203A priority Critical patent/JP4343140B2/ja
Publication of JP2006318013A publication Critical patent/JP2006318013A/ja
Application granted granted Critical
Publication of JP4343140B2 publication Critical patent/JP4343140B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

本発明は、例えば企業の財務情報などの評価を行う評価装置及びそのコンピュータプログラムに関する。
従来、企業における大量の財務情報に基づいて、統計的な手法により特定の尺度に基づいて企業ごとのスコアを算出し、与信や投資の格付けなどを行うことが行われている。例えば、企業の倒産可能性をランキングする場合、ある特定の尺度として倒産可能性が高いものから非倒産の可能性が高いものを示す1つの尺度を適用し、統計的な手法により、企業の倒産確率をスコアとして算出して、与信を判断することが行われる。
このような統計的な手法の従来技術として、特許文献1に記載の「定性データを使用した倒産確率予測システム」などで使用されているロジットモデルがある。
ロジットモデルでは、以下のような手順で企業のスコアを算出する。
(1)与えられたモデル構成用のデータ、すなわち倒産対象企業の財務指標などの指標1から指標nまでの値を使って以下の式(1)に示されるようなモデルを構成する。ここで、式(1)のxは分析に用いる指標であり、aは指標に係る係数であり、モデルの構成とは、具体的には以下の式(1)においてaからaまでの係数パラメータを推定することである。
Figure 0004343140
(2)式(1)に対して評価対象企業のデータを代入してスコアを算出する。
上記の(1)及び(2)の手順により、あるモデルに基づいた評価対象企業ごとのスコアを算出することが可能となる(非特許文献1参照)。
特開2003−216804号公報 木島正明、小守林克哉、"信用リスク評価の数理モデル",出版社:朝倉書店
しかしながら、上記の従来技術では、ある特定の尺度として倒産可能性が高いものから非倒産の可能性が高いものを示す1つの尺度を適用した場合に得られる単独のモデルを用いるため、算出したスコアによる分析の結果を解釈する際に利用可能な情報は、モデルに付与される係数の大小のみであり、十分に分析の結果を解釈できないという問題があった。
また、上記の従来技術では、分析に使用する指標を決定する際、複数の分析結果や統計量の比較に基づいて、事前に分析に有効と考えられるものを人手によって設計されており、試行錯誤を要するという問題がある。
また、さらに、上記の従来技術では、構成したモデルを用いて企業ごとのスコアを算出した結果、十分な精度が得られなかった場合、算出されたスコアに基づいてモデルを修正することができないという問題がある。
本発明は、上記問題を解決すべくなされたもので、その目的は、評価対象データに対して、予め定められる特定の尺度に対応する複数の視点からのスコアの算出を行うことで、複数の視点からの分析を可能とする評価装置及びそのコンピュータプログラムを提供することにある。
また、本発明は、人手によらずに有効な指標を抽出することを可能とする評価装置及びそのコンピュータプログラムを提供することにある。
また、本発明は、構成したモデルに基づいて算出されるスコアにおいて十分な精度が得られない場合に、モデルを修正することを可能とする評価装置及びそのコンピュータプログラムを提供することにある。
上記問題を解決するために、本発明は、入力部と、部分空間構成部と、スコア算出部と、スコア算出結果出力部と、評価対象データ記憶部と、モデル構成用データ記憶部と、部分空間記憶部からなる評価装置であって、前記入力部は、p個の指標の値からなる1以上の評価対象データを入力し、前記評価対象データ記憶部に記録する評価対象データ記録手段と、前記評価対象データを評価する基準となるデータであり、n×p行列で表される前記p個の指標の値からなるn個のサンプルデータであるモデル構成用データと、部分空間を構成するKL展開に用いられる次元sを定める寄与率パラメータを入力し、前記モデル構成用データ記憶部に記録するモデル構成用データ記録手段とを備え、前記部分空間構成部は、前記入力部から入力された前記モデル構成用データの各サンプルに関連付けられる値であって評価を行う事象に応じて予め定められる所定の尺度の尺度値に基づいて、前記尺度値で表される分類に分類することにより、または、前記尺度値と予め定められる前記所定の尺度の境界値とを比較して分類することにより、または、分類されるサンプル数が所定のサンプル数になるように分類することにより、前記尺度値と前記モデル構成用データをm×p行列で表されるmサンプルのデータ群、及び、(n−m)×p行列で表される(n−m)サンプルのデータ群の2つに分類する分類手段と、分類された前記データ群それぞれについて、当該データ群に対してKL展開を適用し、前記モデル構成用データ記憶部から読み出した前記寄与率パラメータに基づきp×s行列(sは1以上p以下の自然数)の部分空間を構成する部分空間構成手段と、前記部分空間構成手段により構成された一方のデータ群に対応する部分空間を第1の部分空間とし、他方のデータ群に対応する部分空間を第2の部分空間として前記部分空間記憶部に記録する部分空間記録手段とを備え、前記スコア算出部は、前記評価対象データ記憶部から読み出した全ての評価対象データのそれぞれについて、前記部分空間記憶手段から読み出した前記第1の部分空間と前記評価対象データから生成されるベクトルとが成す第1の角度と、前記部分空間記憶手段から読み出した前記第2の部分空間と前記評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した前記第1の角度と前記第2の角度の差を前記評価対象データのスコアとして算出するスコア算出手段を備え、前記スコア算出結果出力部は、前記スコア算出手段により算出された各評価対象データのスコアを値の順に並べて出力する出力手段を備える、ことを特徴とする評価装置である。
本発明は、上記に記載の発明において、有効指標抽出部と、指標毎の有効度を記憶する有効指標記憶部とをさらに備え、前記有効指標抽出部は、前記部分空間記憶部から読み出した、一方のデータ群に対応する前記第1の部分空間と、前記第1の部分空間のp個の指標の基底ベクトルとがなす角度と、前記部分空間記憶部から読み出した、他方のデータ群に対応する前記第2の部分空間と、前記第2の部分空間のp個の指標の基底ベクトルとがなす角度を、前記指標ごとに算出し、算出した前記第1の部分空間と第2の部分空間の前記指標それぞれの角度に基づいて、前記指標ごとの有効度を算出する有効指標抽出手段と、前記有効指標抽出手段で算出された有効度を前記有効指標記憶部に記録する有効指標記録手段とを備える、ことを特徴とする。
本発明は、上記に記載の発明において、部分空間修正部をさらに備え、前記部分空間修正部は、前記モデル構成用データ記憶部から読み出した前記モデル構成用データにおける各サンプルのそれぞれについて、前記部空間記憶部から読み出した、一方のデータ群に対応する第1の部分空間と前記モデル用構成データの各サンプルから生成されるベクトルとが成す第3の角度と、前記部分空間記憶部から読み出した、他方のデータ群に対応する第2の部分空間と前記モデル用構成データの各サンプルから生成されるベクトルとが成す第4の角度とを求め、算出した前記第3の角度と前記第4の角度との差を各サンプルのスコアとして算出し、算出した各サンプルのスコアを値の順に並べて、前記分類手段にて分類された前記各データ群ごとのサンプル数に基づいて前記並べられた各サンプルを前記いずれかのデータ群に再分類する再分類手段と、前記第1の部分空間と前記第2の部分空間のそれぞれについて、前記分類手段により最初に分類されたいずれかのデータ群のサンプルのうち前記再分類手段により前記分類手段と同一のデータ群に分類されたサンプルの数と、前記分類手段により最初に分類された該データ群のサンプルの数とに基づいて算出される再現率が一定数以上になるまで、平均学習部分空間法により部分空間を移動させ、移動後の前記第1の部分空間と移動後の前記第2の部分空間を前記部分空間記憶部に記録する部分空間修正手段とを備え、前記スコア算出手段は、前記部分空間記憶部から読み出した、前記部分空間修正手段による移動後の第1の部分空間と第2の部分空間のそれぞれと、前記評価対象データ記憶部から読み出した前記評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度の差を当該評価対象データのスコアとする、ことを特徴とする。
本発明は、入力部と、部分空間構成部と、スコア算出部と、スコア算出結果出力部と、評価対象データ記憶部と、モデル構成用データ記憶部と、部分空間記憶部からなる評価装置のコンピュータに、前記入力部を、p個の指標の値からなる1以上の評価対象データを入力し、前記評価対象データ記憶部に記録する評価対象データ記録手段、前記評価対象データを評価する基準となるデータであり、n×p行列で表される前記p個の指標の値からなるn個のサンプルデータであるモデル構成用データと、部分空間を構成するKL展開に用いられる次元sを定める寄与率パラメータを入力し、前記モデル構成用データ記憶部に記録するモデル構成用データ記録手段、前記部分空間構成部を、前記入力部から入力された前記モデル構成用データの各サンプルに関連付けられる値であって評価を行う事象に応じて予め定められる所定の尺度の尺度値に基づいて、前記尺度値で表される分類に分類することにより、または、前記尺度値と予め定められる前記所定の尺度の境界値とを比較して分類することにより、または、分類されるサンプル数が所定のサンプル数になるように分類することにより、前記尺度値と前記モデル構成用データをm×p行列で表されるmサンプルのデータ群、及び、(n−m)×p行列で表される(n−m)サンプルのデータ群の2つに分類する分類手段、分類された前記データ群それぞれについて、当該データ群に対してKL展開を適用し、前記モデル構成用データ記憶部から読み出した前記寄与率パラメータに基づきp×s行列(sは1以上p以下の自然数)の部分空間を構成する部分空間構成手段、前記部分空間構成手段により構成された一方のデータ群に対応する部分空間を第1の部分空間とし、他方のデータ群に対応する部分空間を第2の部分空間として前記部分空間記憶部に記録する部分空間記録手段、前記スコア算出部を、前記評価対象データ記憶部から読み出した全ての評価対象データのそれぞれについて、前記部分空間記憶手段から読み出した前記第1の部分空間と前記評価対象データから生成されるベクトルとが成す第1の角度と、前記部分空間記憶手段から読み出した前記第2の部分空間と前記評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した前記第1の角度と前記第2の角度の差を前記評価対象データのスコアとして算出するスコア算出手段、前記スコア算出結果出力部を、前記スコア算出手段により算出された各評価対象データのスコアを値の順に並べて出力する出力手段、として機能させるためのコンピュータプログラムである。
この発明によれば、評価装置は、複数の指標によって示されるデータを含む評価対象データと、評価対象データを評価する基準となるモデル構成用データとを入力する。入力するモデル構成用データを、予め定められる所定の尺度に基づいて複数のデータ群に分類し、分類されるデータ群ごとに、当該データ群に含まれるモデル構成用データに基づいてデータ群ごとの部分空間を構成する。そして、構成される複数の部分空間のそれぞれと、前記入力手段が入力する評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度に基づいて当該評価対象データのスコアを算出する構成とした。これにより、モデル構成用データから予め定められる所定の尺度に対応して構成される複数の部分空間に基づいて、評価対象データごとのスコアを算出することができ、所定の尺度に対応する複数の視点からのスコアを得て、複数の視点からの分析を可能とすることができる。
また、本発明によれば、評価装置は、構成される複数の部分空間と、入力されるモデル構成用データと、予めモデル構成用データごとに定められるモデル構成用データが本来属するデータ群を示す情報と、に基づいて所定の演算を行うことにより部分空間を空間内で移動させる。また、モデル構成用データが移動後の部分空間に基づいて分類されることにより属することとなるデータ群を示す情報と、本来属するデータ群の情報との一致する割合が一定割合になるまで部分空間を移動させる構成とした。これにより、構成したモデル、すなわち部分空間に基づいて算出されるスコアにおいて十分な精度が得られない場合に、部分空間を移動させることでモデルを修正し、算出されるスコアの精度を向上させることができる。
また、本発明によれば、評価装置は、複数の部分空間が2つ存在する場合、一方の部分空間と、入力される評価対象データから生成されるベクトルとが成す第1の角度と、他方の部分空間と、入力される評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した第1の角度と第2の角度の差を算出し、算出した差をスコアとする構成とした。これにより、第1の角度と、第2の角度とに基づいて、所定の尺度における加点及び減点の両面の分析が可能となる。
また、本発明によれば、評価装置は、部分空間のそれぞれと、指標ごとの基底ベクトルとに基づいて、指標ごとの関連度を算出し、算出した部分空間ごとの関連度に基づいて、指標ごとの有効度を算出する構成とした。これにより、それぞれの部分空間に対応するモデルの特徴を指標ごとの有効度として定量的に示すことができ、人手によらずに有効な指標を抽出することが可能となる。
また、本発明によれば、評価装置は、部分空間が2つ存在する場合に、指標ごとに一方の部分空間の関連度から他方の部分空間の関連度を減算し、減算して得られた値を指標ごとの有効度として出力する構成とした。これにより、これにより、それぞれの部分空間に対応するモデルの特徴を有効度として定量的に示すことができる。また、さらに差分によって示されるモデル間における重要な指標を定量的及び視覚的に把握することが可能となり、設計工数を削減することが可能となる。
以下、本発明の一実施形態を図面を参照して説明する。
図1は、本実施形態による評価装置100を示す概略ブロック図である。評価装置100は例えば、企業の財務情報などの評価に用いられる装置であり、以下評価対象のデータとして企業のデータを適用して記載する。
評価装置100において、入力部10は、モデル構成用企業データと、評価対象企業データ及びモデル構成用パラメータを入力し、モデル構成用パラメータ及びモデル構成用企業データをモデル構成用企業データベース(以下、DBと記載)13に記録し、評価対象企業データを評価対象企業DB17に記録する。
部分空間構成部11は、入力部10から入力されるモデル構成用データに基づいて、特定の尺度に基づいた部分空間を2つ構成する。ここで、特定の尺度とは、例えば、評価として企業の倒産可能性を評価する場合、倒産確率を特定の尺度とすることができる。倒産確率を特定の尺度とした場合、倒産する確率は0〜100%の値で示され、当該値に基づいて、例えば、倒産確率が50%以上の評価対象を「尺度の値の大きい側」として倒産企業群とし、倒産確率が50%未満の評価対象を「尺度の値の小さい側」として非倒産企業群とすることで2つの部分空間に分けることが可能となる。
部分空間修正部12は、部分空間構成部11が構成した部分空間を、後述する適応的学習手法により、最終的に出力されるスコアの精度を高めるように部分空間を修正し、部分空間情報として部分空間データベース(以下、DBと記載)14に記録する。
有効指標抽出部15は、部分空間DB14から部分空間情報を読み出し、読み出した部分空間情報に対応する部分空間の関連度とその差分を算出し、算出した関連度と差分とを有効指標DB16に記録する。スコア算出部18は、部分空間DB14から部分空間情報を読み出し、評価対象企業DB17から評価対象企業データを読み出し、読み出した部分空間情報に対応する部分空間における評価対象企業データのスコアを算出し、算出したスコアをスコア算出結果出力部19に出力する。スコア算出結果出力部19は、スコア算出部18から入力されるスコアを値の順に並べて画面等に出力するか、あるいは記憶媒体等に記録する。
なお、部分空間構成部11は、入力部10から入力されるモデル構成用データを用いるのではなく、モデル構成用企業DB13からモデル構成用データを読み出し、読み出したモデル構成用データを用いるようにしてもよい。
次に図2から図9を参照して、評価装置100の動作について説明する。
図2から図5はそれぞれ、部分空間構成部11、部分空間修正部12、スコア算出部18及び有効指標抽出部15の処理を示したフローチャートであり、図6から図9は、当該処理の手順を概念的に示した図である。
最初に、図2及び図6を参照して部分空間構成部11の処理について説明する。
図2において、まず最初に部分空間構成部11は、入力部10からモデル構成用企業データ及び部分空間を構成するKL展開に用いられる部分空間の寄与率を定めるモデル構成用パラメータが入力される(ステップSa1)。ここで、モデル構成用企業データは、n×p行列(n:サンプル数(モデルとなる企業の数)、p:次元)で表される。具体的には図6の「手順1」に示されるようにA〜社の企業のデータとして「売上高」、「売上原価」、「従業員数」が示された場合、n=3となり、p=3となる。また、モデル構成用パラメータは、データが有する情報量(具体的にはデータの分散)のうち、どの程度をKL展開で構成される部分空間で近似するか、すなわちデータが有する誤差情報をどれだけ取り除くかに基づいて定められる値であり、0〜100%の値が設定される。
次に、部分空間構成部11は、予め定められる特定の尺度の値に基づいて、モデル構成用企業データの中の企業ごとにラベルを割り当て、モデル構成用企業データを2つのデータ群に分割する。例えば、特定の尺度が倒産と非倒産の2値データで表されるラベルとして与えられる場合、そのラベルを用いてサンプルを倒産企業群と非倒産企業群のような2つのデータ群に分類する。また、特定の尺度が上述したように倒産確率等の0〜100%の連続値あるいはそれに順ずる値で与えられる場合には、尺度の値の分布において尺度の値の大きい側、小さい側の両側から所定の値のサンプルを選択して、倒産企業群と非倒産企業群に分類することができる。なお、上述した例では倒産確率の50%を境界として「尺度の値の大きい側」と「尺度の値の小さい側」とを分けたが、この分け方は確率値が半分の50%には限られず、例えば、分割されるサンプル数が同じになるような尺度で分けるようにしてもよい。
このとき、分類されるモデル構成用企業データは、A(m×p行列)とB((n−m)×p行列)で表されることになる(ステップSa2)。具体的には、図6の手順1のイメージ図に示されるように「売上高」、「売上原価」、「従業員数」という3つの指標がある場合、各企業のモデル構成用企業データは、3次元の空間の1点に配置され、特定の尺度である倒産確率に基づいて倒産企業群と非倒産企業群の2つのデータ群に分類する。
次に、部分空間構成部11は、分類した2つのデータ群のそれぞれに対して、自己相関行列を算出し、算出した自己相関行列に対してKL(Karhunen-Loeve)展開を適用する。KL展開を用いることによって、自己相関行列から部分空間を構成するための基底行列を算出することができる。例えば、上記のように2つのデータ群に分けられたモデル構成用企業データA及びBに対して自己相関行列を算出するとAA は転置を表す)及びBB は転置を表す)として示され、それぞれの部分空間は、KL展開によりA’(p×q行列)及びB’(p×r行列)として算出される。なお、qとrは、上述した寄与率パラメータであるモデル構成用パラメータにより定められる値である(ステップSa3)。そして、構成した部分空間を部分空間DB14に記録するとともに部分空間修正部12に出力する(ステップSa4)。
なお、上記のKL展開とは、類別すべきカテゴリを特徴ベクトル成分の分布から形成される部分空間への射影を通して判定する統計的手法として知られている部分空間法において、変換するベクトル成分の固有ベクトル、すなわち上述した基底行列を計算するために用いられる手法である。このような固有ベクトルを算出できる計算方法であればKL展開以外の方法であっても適用することが可能である。
次に、図3を参照しつつ部分空間修正部12の処理について説明する。
部分空間修正部12は、部分空間構成部11から出力される部分空間構成部11が構成した2つの部分空間の情報を取得し、モデル構成用企業DB13からモデル構成用企業データを読み出す(ステップSb1)。次に、部分空間修正部12は、2つの部分空間の情報と、モデル構成用企業データとに基づいて、スコアを算出する。ここで、スコアの算出は、2つの部分空間A’とB’のぞれぞれと、個々のモデル構成用企業データから構成されるベクトルとの成す角度の差を算出することによって行われる。すなわち、部分空間A’(p×q行列)とベクトルの成す角度をangleAとし、部分空間B’(p×r行列)とベクトルの成す角度をangleBとした場合、その差分であるangleA−angleBがスコアの値となる。
次に、部分空間修正部12は、算出したスコアを降順に並べて、特定の尺度により分類を行い、さらに次式(2)で示される再現率を算出することで評価を行う(ステップSb2)。
Figure 0004343140
なお、式(2)の分母である「倒産企業群の企業数」とは、モデル構成用企業データの各データに予め対応付けて記憶されている本来分類されるべきデータ群を示す情報、例えば、倒産あるいは非倒産のデータ群を示す情報に基づいて算出される数値である。
次に、部分空間修正部12は、適応的学習によって部分空間の修正を行う。具体的には、部分空間を構成した基となる自己相関行列AA’とBB’に対して平均学習部分空間法に基づく次式(3)を適用することによって行う。
Figure 0004343140
式(3)において、Rには自己相関行列でありAA は転置を表す)あるいはBB は転置を表す)が代入される。下付き添え字のtは、更新時刻、あるいは更新回数を示している。また、γは更新幅のパラメータであり、予め更新させたい度合いに従って、例えば0.4程度の定数が設定される。
R及びγの上付き添え字i及びkは、クラスラベルであり、例えばモデル構成用企業データAのラベルをaとし、モデル構成用企業データBのラベルをbとした場合には、i、kは、aあるいはbとなる。例えば、t=0の場合、R は、AA’に対応し、R は、BB’に対応する。
また、R及びγの上付き添え字が(i,k)あるいは(k,i)のように2つあるものは、誤って分類されたサンプルに基づく行列であることを示している。例えば、R (i,k)は、Rt−1 (i)を用いてスコアを算出し、算出したスコアに基づいて分類が行われたときに、本来iとして分類されるべきサンプルがk(i≠k)に分類された場合に、当該kに分類されたサンプルを検出し、検出したサンプルから生成される行列Cの自己相関行列CC’に対応する。
ここで、図7を参照しつつ、式(3)によって行われる適応的学習について説明する。学習前の部分空間として図7の(適応的学習の方法)の(a)の図に示されるような状態が存在したとする。式(3)のi=a:倒産を示すラベル、k=b:非倒産を示すラベルとした場合、式(3)の右辺のそれぞれは以下のような適応的学習の処理を示すことになる。
(第1項):Rt−1 :t−1時点で基礎となる倒産企業の自己相関行列の項である。
(第2項):γ(a,b) (a,b):真のラベルが倒産であるのに、非倒産として分類されたため、倒産のサンプルを取り込むように部分空間を回転及び移動させるために加算を行う自己相関行列の項である。
(第3項):−γ(b,a) (b,a):真のラベルが非倒産であるのに、倒産として分類されたため、非倒産のサンプルを遠ざけるように部分空間を回転及び移動させるために減算を行う自己相関行列の項である。
図7の(b)の図が、第2項及び第3項の処理を2次元平面上で概念的に示した図であり、縦軸及び横軸は上記した指標に対応する。倒産企業の部分空間は、誤って分類されたサンプルを取り込むように回転及び移動し、非倒産企業の部分空間は、誤って分類されたサンプルから離れるように回転及び移動することになる。そして最終的に図7の(c)の図に示すように全てのサンプルについて本来分類されるべき部分空間に含まれることになる(ステップSb3)。
次に、部分空間修正部12は、修正された部分空間に基づいて、再現率を算出し、前回の再現率と今回算出した再現率とに基づいて比較を行う(ステップSb4)。例えば、今回の再現率を前回の再現率で割った割合の値が予め定められる一定割合値を超えていない場合には、修正を進めるためステップSb4の処理に戻り、超えている場合には、部分空間の情報を出力し、部分空間DB14に記録する(ステップSb5)。
次に、図4を参照しつつスコア算出部18の処理について説明する。
まず最初に、スコア算出部18は、部分空間修正部12によって構成され、部分空間DB14に記録された部分空間の情報を部分空間DB14から読み出す。また、評価対象企業データを評価対象企業DB17から読み出す(ステップSc1)。ここで、評価対象企業データは、n’×p行列(n’:サンプル数、p:次元)で構成されているとする。
次に、スコア算出部18は、図8の手順3に示すように、読み出した部分空間の情報によって示される部分空間と、読み出した評価対象企業データとに基づいて、各評価対象企業データのスコアを算出する。スコアの算出は、部分空間修正部12の処理において説明したように、部分空間ごとの評価対象企業データから構成されるベクトルとの成す角度を算出し、算出した角度の差がスコアとなる(ステップSc2)。
次に、スコア算出部は、他の評価対象企業データが存在するか否かを判定する(ステップSc3)。他の評価対象企業データが存在する場合には、ステップSc2の処理を繰り返し、他の評価対象企業が存在しない場合には、スコアをスコア算出結果出力部19に出力して処理を終了する(ステップSc4)。
次に、図5を参照しつつ有効指標抽出部15の処理について説明する。有効指標の抽出とは、例えば、倒産と非倒産の2つのモデルが存在する場合に、倒産と非倒産を分類する高い要因となっている指標を抽出することである。
まず最初に有効指標抽出部15は、部分空間修正部12によって構成され、部分空間DB14に記録された部分空間の情報を部分空間DB14から読み出す(ステップSd1)。次に、読み出した各部分空間に対して、分析指標の基底ベクトルとの角度を算出し、算出した角度を、モデルと分析指標との関連度する。また、さらに各部分空間から得られる関連度について差分を算出する(ステップSd2)。そして、算出した関連度及び差分を有効指標DB16に記録する(ステップSd3)。
図9は、図5の処理の具体例を示した図である。図9では、部分空間として倒産と非倒産の2つの部分空間が存在し、指標として「売上高」、「原価」、「販管費」、「負債比率」の4つの指標が存在する場合についての有効指標抽出を示している。そして、非倒産及び倒産の部分空間と各指標の基底ベクトルとの角度を算出して、関連度とし、さらに、非倒産と倒産の関連度の差を算出して、大きい値の順に並べることで「負債比率」が非倒産と倒産を分類する最も高い要因となっており、この指標が倒産企業を特徴付けるものとなっていることが視覚的に示されている。
(実際の企業データを用いた実施例)
次に、図10から図13を参照して、上記の評価装置100を実際の企業データに適用して分析を行った実施例について説明する。
モデル構成用データ及び評価対象データとして、日経メディアマーケティング株式会社のデータバンクNEEDS財務データを用い、モデル構成用データとして2002年度のデータを利用し、評価用データとして2003年度のデータを使用している。サンプル数は、2002年度のデータにおいて195社であり、2003年度のデータにおいて190社である。また、分析には112個の指標を用いた。
上記の実施形態では特定の尺度として「倒産」を例として説明したが、当該実施例では知的財産価値の一手法である「知の潜在力」を特定の尺度としており、当該尺度に基づいて2002年度のサンプルと2003年度のサンプルを予め分類した。分類結果は、2002年度のサンプルである195社は、上位(知の潜在力ありとして分類される企業)が97社であり、下位(知の潜在力なしとして分類される企業)98社として分類され、2003年度のサンプルである190社は、上位92社、下位98社として分類された。
図10は、評価装置100を適用し、実際のスコアの算出を行った結果のうち、上位19社の結果を示した図である。図10において、「知の潜在力あり」の項目に示される数値は、知の潜在力ありに対応する部分空間と当該企業の評価対象企業データから構成されるベクトルとの成す角度であり、「知の潜在力なし」の項目に示される数値は、知の潜在力なしに対応する部分空間と当該企業の評価対象企業データから構成されるベクトルとの成す角度である。また、「差分」の項目は、「知の潜在力あり」の項目の数値と「知の潜在力なし」の項目の数値との差であり、当該「差分」の値がスコアとなる。
図11は、評価装置100における部分空間修正部12において適応的学習を行うことにより部分空間の修正を行った場合の精度の向上度合い示した図である。「差分」の項目の値は、スコアの値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。また、「あり」の項目の値は、図10の「知の潜在力あり」の項目の数値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。また、「なし」の項目の値は、図10の「知の潜在力なし」の項目の数値に基づいて「知の潜在力あり」に分類された企業数に基づいて、次式(4)により算出された再現率を示した値である。
Figure 0004343140
図11(a)は、フィードバック前、すなわち部分空間の修正を行う前の精度であり、図11(b)は、フィードバックを行った後の精度であり、いずれの項目においても再現率が向上していることが示されている。
図12は、評価装置100の有効指標抽出部15により算出された指数ごとの関連度の値を可視化するために、生成されたグラフを示したものである。図12の菱形のマーク(あり)で示されたグラフは、「知の潜在力あり」の部分空間に基づいて算出された関連度であり、四角のマーク(なし)で示されたグラフは、「知の潜在力なし」の部分空間に基づいて算出された関連度である。三角のマーク(差分)で示されたグラフは「知の潜在力あり」の部分空間に基づいて算出された関連度と「知の潜在力なし」の部分空間に基づいて算出された関連度との差であり、図12の最も右の指標である「従業員数」が最も「知の潜在力あり」と「知の潜在力なし」を分ける最も高い要因になっていることが示されている。
図13は、本実施形態に係る評価装置100による精度と従来のロジットモデルによる精度を比較するための図である。図13に示されるように、本実施形態では、部分空間を修正する前(フィードバック前)であっても、部分空間を修正した後(フィードバック後)であっても、従来のロジットモデルによる精度よりも高い精度が得られている。
なお、上記の実施形態では、例として企業のデータを用いたが、本発明はこれに限られず、指標によって示される様々なデータを対象とすることができる。
また、上記の実施形態では、特定の尺度に対応する視点数を2つとしたが、本発明はこれに限られず、複数の視点数により実施することも可能である。
上述の評価装置は内部に、コンピュータシステムを有している。そして、上述した部分空間構成部11、部分空間修正部12、スコア算出部18、有効指標抽出部15に係る処理は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
本実施形態に係る評価装置の内部構成を示すブロック図である。 同実施形態に係る部分空間構築部に係る処理を示したフローチャートである。 同実施形態に係る部分空間修正部に係る処理を示したフローチャートである。 同実施形態に係るスコア算出部に係る処理を示したフローチャートである。 同実施形態に係る有効指標抽出部に係る処理を示したフローチャートである。 同実施形態に係る部分空間構築部に係る処理の概念図である。 同実施形態に係る部分空修正部に係る処理の概念図である。 同実施形態に係るスコア算出部に係る処理の概念図である。 同実施形態に係る有効指標抽出部に係る処理の概念図である。 本実施形態に係る評価装置を適用した実施結果(その1)を示した図である。 本実施形態に係る評価装置を適用した実施結果(その2)を示した図である。 本実施形態に係る評価装置を適用した有効指標抽出の実施結果を示した図である。 本実施形態に係る評価装置を適用した実施結果と従来技術の実施結果を示した図である。
符号の説明
10 入力部
11 部分空間構成部
12 部分空間修正部
18 スコアリング部
100 評価装置

Claims (4)

  1. 入力部と、部分空間構成部と、スコア算出部と、スコア算出結果出力部と、評価対象データ記憶部と、モデル構成用データ記憶部と、部分空間記憶部からなる評価装置であって、
    前記入力部は、
    p個の指標の値からなる1以上の評価対象データを入力し、前記評価対象データ記憶部に記録する評価対象データ記録手段と、
    前記評価対象データを評価する基準となるデータであり、n×p行列で表される前記p個の指標の値からなるn個のサンプルデータであるモデル構成用データと、部分空間を構成するKL展開に用いられる次元sを定める寄与率パラメータを入力し、前記モデル構成用データ記憶部に記録するモデル構成用データ記録手段と
    を備え、
    前記部分空間構成部は、
    前記入力部から入力された前記モデル構成用データの各サンプルに関連付けられる値であって評価を行う事象に応じて予め定められる所定の尺度の尺度値に基づいて、前記尺度値で表される分類に分類することにより、または、前記尺度値と予め定められる前記所定の尺度の境界値とを比較して分類することにより、または、分類されるサンプル数が所定のサンプル数になるように分類することにより、前記尺度値と前記モデル構成用データをm×p行列で表されるmサンプルのデータ群、及び、(n−m)×p行列で表される(n−m)サンプルのデータ群の2つに分類する分類手段と、
    分類された前記データ群それぞれについて、当該データ群に対してKL展開を適用し、前記モデル構成用データ記憶部から読み出した前記寄与率パラメータに基づきp×s行列(sは1以上p以下の自然数)の部分空間を構成する部分空間構成手段と、
    前記部分空間構成手段により構成された一方のデータ群に対応する部分空間を第1の部分空間とし、他方のデータ群に対応する部分空間を第2の部分空間として前記部分空間記憶部に記録する部分空間記録手段と
    を備え、
    前記スコア算出部は、
    前記評価対象データ記憶部から読み出した全ての評価対象データのそれぞれについて、
    前記部分空間記憶手段から読み出した前記第1の部分空間と前記評価対象データから生成されるベクトルとが成す第1の角度と、前記部分空間記憶手段から読み出した前記第2の部分空間と前記評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した前記第1の角度と前記第2の角度の差を前記評価対象データのスコアとして算出するスコア算出手段
    を備え、
    前記スコア算出結果出力部は、
    前記スコア算出手段により算出された各評価対象データのスコアを値の順に並べて出力する出力手段
    を備える、
    ことを特徴とする評価装置。
  2. 有効指標抽出部と、指標毎の有効度を記憶する有効指標記憶部とをさらに備え、
    前記有効指標抽出部は、
    前記部分空間記憶部から読み出した、一方のデータ群に対応する前記第1の部分空間と、前記第1の部分空間のp個の指標の基底ベクトルとがなす角度と、前記部分空間記憶部から読み出した、他方のデータ群に対応する前記第2の部分空間と、前記第2の部分空間のp個の指標の基底ベクトルとがなす角度を、前記指標ごとに算出し、算出した前記第1の部分空間と第2の部分空間の前記指標それぞれの角度に基づいて、前記指標ごとの有効度を算出する有効指標抽出手段と、
    前記有効指標抽出手段で算出された有効度を前記有効指標記憶部に記録する有効指標記録手段とを備える、
    ことを特徴とする請求項1に記載の評価装置。
  3. 部分空間修正部をさらに備え、
    前記部分空間修正部は、
    前記モデル構成用データ記憶部から読み出した前記モデル構成用データにおける各サンプルのそれぞれについて、前記部空間記憶部から読み出した、一方のデータ群に対応する第1の部分空間と前記モデル用構成データの各サンプルから生成されるベクトルとが成す第3の角度と、前記部分空間記憶部から読み出した、他方のデータ群に対応する第2の部分空間と前記モデル用構成データの各サンプルから生成されるベクトルとが成す第4の角度とを求め、算出した前記第3の角度と前記第4の角度との差を各サンプルのスコアとして算出し、算出した各サンプルのスコアを値の順に並べて、前記分類手段にて分類された前記各データ群ごとのサンプル数に基づいて前記並べられた各サンプルを前記いずれかのデータ群に再分類する再分類手段と、
    前記第1の部分空間と前記第2の部分空間のそれぞれについて、前記分類手段により最初に分類されたいずれかのデータ群のサンプルのうち前記再分類手段により前記分類手段と同一のデータ群に分類されたサンプルの数と、前記分類手段により最初に分類された該データ群のサンプルの数とに基づいて算出される再現率が一定数以上になるまで、平均学習部分空間法により部分空間を移動させ、移動後の前記第1の部分空間と移動後の前記第2の部分空間を前記部分空間記憶部に記録する部分空間修正手段と
    を備え、
    前記スコア算出手段は、
    前記部分空間記憶部から読み出した、前記部分空間修正手段による移動後の第1の部分空間と第2の部分空間のそれぞれと、前記評価対象データ記憶部から読み出した前記評価対象データから生成されるベクトルとが成す角度を算出し、算出した角度の差を当該評価対象データのスコアとする、
    ことを特徴とする請求項1または2に記載の評価装置。
  4. 入力部と、部分空間構成部と、スコア算出部と、スコア算出結果出力部と、評価対象データ記憶部と、モデル構成用データ記憶部と、部分空間記憶部からなる評価装置のコンピュータに、
    前記入力部を、
    p個の指標の値からなる1以上の評価対象データを入力し、前記評価対象データ記憶部に記録する評価対象データ記録手段、
    前記評価対象データを評価する基準となるデータであり、n×p行列で表される前記p個の指標の値からなるn個のサンプルデータであるモデル構成用データと、部分空間を構成するKL展開に用いられる次元sを定める寄与率パラメータを入力し、前記モデル構成用データ記憶部に記録するモデル構成用データ記録手段、
    前記部分空間構成部を、
    前記入力部から入力された前記モデル構成用データの各サンプルに関連付けられる値であって評価を行う事象に応じて予め定められる所定の尺度の尺度値に基づいて、前記尺度値で表される分類に分類することにより、または、前記尺度値と予め定められる前記所定の尺度の境界値とを比較して分類することにより、または、分類されるサンプル数が所定のサンプル数になるように分類することにより、前記尺度値と前記モデル構成用データをm×p行列で表されるmサンプルのデータ群、及び、(n−m)×p行列で表される(n−m)サンプルのデータ群の2つに分類する分類手段、
    分類された前記データ群それぞれについて、当該データ群に対してKL展開を適用し、前記モデル構成用データ記憶部から読み出した前記寄与率パラメータに基づきp×s行列(sは1以上p以下の自然数)の部分空間を構成する部分空間構成手段、
    前記部分空間構成手段により構成された一方のデータ群に対応する部分空間を第1の部分空間とし、他方のデータ群に対応する部分空間を第2の部分空間として前記部分空間記憶部に記録する部分空間記録手段、
    前記スコア算出部を、
    前記評価対象データ記憶部から読み出した全ての評価対象データのそれぞれについて、
    前記部分空間記憶手段から読み出した前記第1の部分空間と前記評価対象データから生成されるベクトルとが成す第1の角度と、前記部分空間記憶手段から読み出した前記第2の部分空間と前記評価対象データから生成されるベクトルとが成す第2の角度とを算出し、算出した前記第1の角度と前記第2の角度の差を前記評価対象データのスコアとして算出するスコア算出手段、
    前記スコア算出結果出力部を、
    前記スコア算出手段により算出された各評価対象データのスコアを値の順に並べて出力する出力手段、
    として機能させるためのコンピュータプログラム。
JP2005137203A 2005-05-10 2005-05-10 評価装置及びそのコンピュータプログラム Expired - Fee Related JP4343140B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005137203A JP4343140B2 (ja) 2005-05-10 2005-05-10 評価装置及びそのコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005137203A JP4343140B2 (ja) 2005-05-10 2005-05-10 評価装置及びそのコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2006318013A JP2006318013A (ja) 2006-11-24
JP4343140B2 true JP4343140B2 (ja) 2009-10-14

Family

ID=37538678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005137203A Expired - Fee Related JP4343140B2 (ja) 2005-05-10 2005-05-10 評価装置及びそのコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP4343140B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7844953B2 (en) 2005-06-30 2010-11-30 Fujitsu Limited Program, apparatus and method for verifying program

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5017005B2 (ja) * 2007-07-23 2012-09-05 株式会社エヌ・ティ・ティ・データ 評価装置及び方法ならびにそのコンピュータプログラム
JP6403912B1 (ja) * 2018-03-07 2018-10-10 株式会社エス・エム・エス 信用格付けシステムおよびプログラム
JP6797956B2 (ja) * 2019-03-14 2020-12-09 株式会社三井住友銀行 推計装置、推計方法およびプログラム
CN110826726B (zh) * 2019-11-08 2023-09-08 腾讯科技(深圳)有限公司 目标处理方法、目标处理装置、目标处理设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7844953B2 (en) 2005-06-30 2010-11-30 Fujitsu Limited Program, apparatus and method for verifying program

Also Published As

Publication number Publication date
JP2006318013A (ja) 2006-11-24

Similar Documents

Publication Publication Date Title
Galante et al. The challenge of modeling niches and distributions for data‐poor species: a comprehensive approach to model complexity
JP4937608B2 (ja) 指標推計装置、指標推計方法、及び指標推計プログラム
Gepp et al. Predicting financial distress: A comparison of survival analysis and decision tree techniques
US9323886B2 (en) Performance predicting apparatus, performance predicting method, and program
JP4391506B2 (ja) 評価装置、評価方法及び評価プログラム
WO2023279696A1 (zh) 业务风险客群的识别方法、装置、设备及存储介质
CN110188047B (zh) 一种基于双通道卷积神经网络的重复缺陷报告检测方法
US20080091627A1 (en) Data Learning System for Identifying, Learning Apparatus, Identifying Apparatus and Learning Method
JP6888484B2 (ja) 検索プログラム、検索方法、及び、検索プログラムが動作する情報処理装置
US20210125067A1 (en) Information processing device, information processing method, and program
CN104680144A (zh) 基于投影极速学习机的唇语识别方法和装置
JP4343140B2 (ja) 評価装置及びそのコンピュータプログラム
CN109635010B (zh) 一种用户特征及特征因子抽取、查询方法和***
JP2002358332A (ja) 品質機能展開を支援する方法およびプログラム
CN113256434B (zh) 车险理赔行为识别方法、装置、设备及存储介质
JP7428927B2 (ja) ノード情報推定方法、ノード情報推定プログラムおよび情報処理装置
CN115343676B (zh) 密封电子设备内部多余物定位技术的特征优化方法
CN114819777A (zh) 一种基于数字孪生技术的企业销售业务分析管理***
JP5391637B2 (ja) データ類似度計算システム、データ類似度計算方法およびデータ類似度計算プログラム
CN111612491B (zh) 状态分析模型构建方法、分析方法及装置
JP5446127B2 (ja) 判別方法、判別装置及びプログラム
CN113111885B (zh) 一种动态分辨率实例分割方法及计算机可读存储介质
US7139770B2 (en) Spatial data analysis apparatus and spatial data analysis method
CN114943674A (zh) 瑕疵检测方法、电子装置及存储介质
JP6499938B2 (ja) 稼働データ分類装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090708

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130717

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees