JP5075962B2

JP5075962B2 - 注目対象予測装置

Info

Publication number: JP5075962B2
Application number: JP2010225864A
Authority: JP
Inventors: 茂明櫻井
Original assignee: Toshiba Corp; Toshiba Solutions Corp
Current assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Priority date: 2010-10-05
Filing date: 2010-10-05
Publication date: 2012-11-21
Anticipated expiration: 2030-10-05
Also published as: JP2012079227A

Description

本発明の実施形態は、複数の対象の中から注目すべき対象を予測する注目対象予測装置に関する。

一般的に、複数の対象の中から次期において注目すべき対象を選別しなければならない場合がある。

例えば証券市場においては、多くの銘柄の中から注目すべき銘柄を選別して銘柄売買に関する意思決定をしなければならない。また、例えばプラント監視においては、多くのプラントの中から故障等の可能性があるプラントを選別してプラントの保守計画を作成する必要がある。

特開２００２−２６９３５７号公報特開２００７−０８７３５４号公報

しかしながら、多数の対象に対する情報が多数存在する中で、当該多数の対象の中から注目すべき対象を選別することは非常に困難である。したがって、多数の対象の中から自動的に注目すべき対象を予測して、当該注目すべき対象を提示できるような装置（注目対象予測装置）が望まれている。

また、このような注目対象予測装置を利用する利用者にとっては、多数の対象の中から注目すべき対象を容易かつ簡便に選別できることが望ましい。

そこで、本発明が解決しようとする課題は、多数の対象の中から注目すべき対象を利用者が容易かつ簡便に選別することが可能な注目対象予測装置を提供することにある。

実施形態によれば、複数の対象の中から注目すべき対象を予測する注目対象予測装置が提供される。

実施形態に係る注目対象予測装置は、対象表現格納手段と、第１のデータ収集手段と、第１の評価値算出手段と、第２のデータ収集手段と、変化率算出手段と、第３のデータ収集手段と、第２の評価値算出手段と、注目度算出手段と、提示手段とを具備する。

対象表現格納手段は、前記対象毎に、当該対象に関連する文字列を格納する。

第１のデータ収集手段は、予め定められた複数の期間内における文字列を含むテキスト情報を収集し、当該収集されたテキスト情報を時系列順に含む時系列テキストデータを取得する。

第１の評価値算出手段は、前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列および前記第１のデータ収集手段によって取得された時系列テキストデータに含まれる時系列順のテキスト情報に基づいて、前記対象毎に前記時系列順の評価値を算出する。

第２のデータ収集手段は、前記対象毎に、前記予め定められた複数の期間内における当該対象に関する数値を含む数値情報を収集し、当該数値情報を時系列順に含む時系列数値データを取得する。

変化率算出手段は、前記対象毎に前記第２のデータ収集手段によって取得された時系列数値データに含まれる時系列順における前後の数値情報に含まれる数値に基づいて、前記対象毎に前記時系列順の変化率を算出する。

第３のデータ収集手段は、前記予め定められた複数の期間後における文字列を含むテキスト情報を収集する。

第２の評価値算出手段は、前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列および前記第３のデータ収集手段によって収集されたテキスト情報に含まれる文字列に基づいて、前記対象毎に評価値を算出する。

注目度算出手段は、前記対象毎に前記第１の評価値算出手段によって算出された前記時系列順の評価値、前記対象毎に前記変化率算出手段によって算出された前記時系列順の変化率および前記対象毎に前記第２の評価値算出手段によって算出された評価値を用いて、前記対象毎の注目度を算出する。

提示手段は、前記注目度算出手段によって算出された前記対象毎の注目度を提示する。

実施形態に係る注目対象予測装置のハードウェア構成を示すブロック図。図１に示す注目対象予測装置３０の主として機能構成を示すブロック図。図２に示す対象表現格納部２２のデータ構造の一例を示す図。本実施形態に係る注目対象予測装置３０の処理手順を示すフローチャート。時系列予測モデル更新処理の処理手順を示すフローチャート。テキスト解析処理の処理手順を示すフローチャート。対象数値解析処理の処理手順を示すフローチャート。学習データ期間内におけるテキスト情報を時系列順に含む時系列テキストデータの一例を示す図。対象表現評価部３２の内部に格納された対象「Ａ社」の時系列順の対象表現評価値の一例を示す図。対象表現評価部３２の内部に格納された対象「Ｂ社」の時系列順の対象表現評価値の一例を示す図。対象表現評価部３２の内部に格納された対象「Ｃ社」の時系列順の対象表現評価値の一例を示す図。対象表現評価部３２の内部に格納された対象「Ｄ社」の時系列順の対象表現評価値の一例を示す図。対象「Ａ社」について収集された数値情報を時系列順に含む時系列数値データの一例を示す図。対象「Ｂ社」について収集された数値情報を時系列順に含む時系列数値データの一例を示す図。対象「Ｃ社」について収集された数値情報を時系列順に含む時系列数値データの一例を示す図。対象「Ｄ社」について収集された数値情報を時系列順に含む時系列数値データの一例を示す図。対象数値変化率評価部３３の内部に格納された対象「Ａ社」の時系列順の対象数値変化率の一例を示す図。対象数値変化率評価部３３の内部に格納された対象「Ｂ社」の時系列順の対象数値変化率の一例を示す図。対象数値変化率評価部３３の内部に格納された対象「Ｃ社」の時系列順の対象数値変化率の一例を示す図。対象数値変化率評価部３３の内部に格納された対象「Ｄ社」の時系列順の対象数値変化率の一例を示す図。時系列予測モデル生成部３４によって生成された時系列予測モデルの一例を示す図。対象表現評価部３２によって算出された対象「Ａ社」の対象表現評価値の一例を示す図。対象表現評価部３２によって算出された対象「Ｂ社」の対象表現評価値の一例を示す図。対象表現評価部３２によって算出された対象「Ｃ社」の対象表現評価値の一例を示す図。対象表現評価部３２によって算出された対象「Ｄ社」の対象表現評価値の一例を示す図。更新後の対象「Ａ社」の時系列順の対象表現評価値の一例を示す図。更新後の対象「Ｂ社」の時系列順の対象表現評価値の一例を示す図。更新後の対象「Ｃ社」の時系列順の対象表現評価値の一例を示す図。更新後の対象「Ｄ社」の時系列順の対象表現評価値の一例を示す図。対象「Ａ社」について収集された数値情報を含む時系列数値データの一例を示す図。対象「Ｂ社」について収集された数値情報を含む時系列数値データの一例を示す図。対象「Ｃ社」について収集された数値情報を含む時系列数値データの一例を示す図。対象「Ｄ社」について収集された数値情報を含む時系列数値データの一例を示す図。対象数値変化率評価部３３によって算出された対象「Ａ社」の対象数値変化率の一例を示す図。対象数値変化率評価部３３によって算出された対象「Ｂ社」の対象数値変化率の一例を示す図。対象数値変化率評価部３３によって算出された対象「Ｃ社」の対象数値変化率の一例を示す図。対象数値変化率評価部３３によって算出された対象「Ｄ社」の対象数値変化率の一例を示す図。更新後の対象「Ａ社」の時系列順の対象数値変化率の一例を示す図。更新後の対象「Ｂ社」の時系列順の対象数値変化率の一例を示す図。更新後の対象「Ｃ社」の時系列順の対象数値変化率の一例を示す図。更新後の対象「Ｄ社」の時系列順の対象数値変化率の一例を示す図。対象ランキング処理の処理手順を示すフローチャート。対象注目度算出部３５によって算出された対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」の各々の注目度の一例を示す図。対象ランキング表示部３６によって表示される対象毎の注目度のランキング結果の一例を示す図。パラメータの更新後に対象ランキング表示部３６によって表示される対象毎の注目度のランキング結果の一例を示す図。

以下、図面を参照して、実施形態について説明する。

図１は、本実施形態に係る注目対象予測装置のハードウェア構成を示すブロック図である。図１に示すように、コンピュータ１０は、例えばハードディスクドライブ（ＨＤＤ：Hard Disk Drive）のような外部記憶装置２０と接続されている。この外部記憶装置２０は、コンピュータ１０によって実行されるプログラム２１を格納する。コンピュータ１０および外部記憶装置２０は、注目対象予測装置３０を構成する。

この注目対象予測装置３０は、例えば証券市場等における複数の対象の中から注目すべき対象を予測する機能を有する。なお、この場合における対象としては例えば企業等が含まれる。

図２は、図１に示す注目対象予測装置３０の主として機能構成を示すブロック図である。図２に示すように、注目対象予測装置３０は、データ収集部３１、対象表現評価部３２、対象数値変化率評価部３３、時系列予測モデル生成部３４、対象注目度算出部３５および対象ランキング表示部３６を含む。本実施形態において、これらの各部３１〜３６は、図１に示すコンピュータ１０が外部記憶装置２０に格納されているプログラム２１を実行することにより実現されるものとする。このプログラム２１は、コンピュータ読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラム２１が、例えばネットワークを介してコンピュータ１０にダウンロードされても構わない。

また、注目対象予測装置３０は、対象表現格納部２２を含む。本実施形態において、対象表現格納部２２は、例えば図１に示す外部記憶装置２０に格納される。

対象表現格納部２２には、上記した対象毎に、当該対象に関連する文字列（以下、対象表現と表記）が格納される。この対象表現には、当該対象（企業）の名称、略称、愛称および当該企業が保有するブランド名等が含まれる。

データ収集部３１は、予め定められた期間（以下、学習データ収集期間と表記）内における文字列を含むテキスト情報を収集し、当該テキスト情報を時系列順に含む時系列テキストデータを取得する。なお、データ収集部３１によって収集されるテキスト情報には、例えばＷｅｂサイト等から発信されるニュースのヘッドライン等が含まれる。

また、データ収集部３１は、対象毎に、上記した学習データ収集期間内における当該対象に関する数値を含む数値情報を収集し、当該数値情報を時系列順に含む時系列数値データを取得する。データ収集部３１によって収集される数値情報には、対象（企業）の株価等が含まれる。なお、データ収集部３１は、数値情報を例えばＷｅｂサイト等から収集する。

更に、データ収集部３１は、上記した学習データ収集期間後から現在までの期間（以下、予測データ収集期間と表記）内における文字列を含むテキスト情報を収集する。

対象表現評価部３２は、対象毎に対象表現格納部２２に格納されている対象表現（当該対象に関連する文字列）およびデータ収集部３１によって取得された時系列テキストデータに含まれる時系列順のテキスト情報に基づいて、当該対象毎に時系列順の評価値を算出する。

また、対象表現評価部３２は、対象毎に対象表現格納部２２に格納されている対象表現およびデータ収集部３１によって上記した予測データ収集期間内に収集されたテキスト情報に基づいて、当該対象毎に評価値を算出する。

対象数値変化率評価部３３は、対象毎にデータ収集部３１によって取得された時系列数値データに含まれる時系列順における前後の数値情報に含まれる数値に基づいて、当該対象毎に当該時系列順の変化率を算出する。

時系列予測モデル生成部３４は、対象毎に対象表現評価部３２によって算出された時系列順の評価値および当該対象毎に対象数値変化率評価部３３によって算出された時系列順の変化率に基づいて、後述する時系列予測モデルを生成する。時系列予測モデル生成部３４によって生成された時系列予測モデルは、対象毎の注目度を算出する際に用いられる。なお、時系列予測モデル生成部３４によって生成された時系列予測モデルは、例えば当該時系列予測モデル生成部３４内部に格納される。

対象注目度算出部３５は、対象毎の注目度を算出する。対象注目度算出部３５は、対象毎に対象表現評価部３２によって算出された時系列順の評価値、対象毎に対象数値変化率評価部３３によって算出された時系列順の変化率および対象毎に対象表現評価部３２によって算出された評価値を用いて、当該対象毎の注目度を算出する。具体的には、対象注目度算出部３５は、時系列予測モデル生成部３４内部に格納された時系列予測モデル（時系列予測モデル生成部３４によって生成された時系列予測モデル）、対象毎に対象表現評価部３２によって算出された評価値および複数の予め定められたパラメータを用いて、対象毎の注目度を算出する。

対象ランキング表示部３６は、対象注目度算出部３５によって算出された対象毎の注目度を提示する。具体的には、対象ランキング表示部３６は、複数の対象を対象注目度算出部３５によって算出された注目度順に並び替え、当該複数の対象をランキング形式で表示する。

図３は、図２に示す対象表現格納部２２のデータ構造の一例を示す。図３に示すように、対象表現格納部２２には、対象と当該対象に関連する文字列（対象表現）とが対応づけて格納されている。ここでは、対象として「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」が存在するものとする。

図３に示す例では、対象表現格納部２２には、対象「Ａ社」と対象表現「Ａ社」、「Ｘ１ブランド」および「Ｘ２ブランド」とが対応づけて格納されている。これによれば、対象「Ａ社」に関連する文字列が「Ａ社」、「Ｘ１ブランド」および「Ｘ２ブランド」であることが示されている。

また、対象表現格納部２２には、対象「Ｂ社」と対象表現「Ｂ社」、「Ｂ１社」および「Ｙブランド」とが対応づけて格納されている。これによれば、対象「Ｂ社」に関連する文字列が「Ｂ社」、「Ｂ１社」および「Ｙブランド」であることが示されている。

また、対象表現格納部２２には、対象「Ｃ社」と対象表現「Ｃ社」および「Ｚブランド」とが対応づけて格納されている。これによれば、対象「Ｃ社」に関連する文字列が「Ｃ社」および「Ｚブランド」であることが示されている。

また、対象表現格納部２２には、対象「Ｄ社」と対象表現「Ｄ社」および「Ｄ１社」とが対応づけて格納されている。これによれば、対象「Ｄ社」に関連する文字列が「Ｄ社」および「Ｄ１社」であることが示されている。

次に、図４のフローチャートを参照して、本実施形態に係る注目対象予測装置３０の処理手順について説明する。

まず、注目対象予測装置３０の初期化が実行される（ステップＳ１）。ここでは、データ収集部３１は、テキスト情報（ニュースのヘッドライン）を収集する例えばＷｅｂサイトの設定、数値情報（対象の株価）を収集する例えばＷｅｂサイトの設定、当該収集の単位時間（データ収集単位時間）および当該収集の最大回数（データ収集最大回数）の設定を行う。

なお、これらの設定項目の値は、予めファイル等に記載しておいてもよいし、利用者によってインタフェースを通じて入力（設定）されても構わない。

データ収集部３１は、利用者の操作に応じてモードを設定する（ステップＳ２）。このとき、利用者は、例えば学習モード、予測モードおよび終了モードのいずれか１つを選択することができる。学習モードは、テキスト情報および数値情報を収集し、上記した時系列予測モデルを生成するためのモードである。予測モードは、複数の対象の中から注目すべき対象を予測し、当該注目すべき対象を提示するためのモードである。また、終了モードは、注目対象予測装置３０の動作（処理）を終了するためのモードである。

ステップＳ２においては、例えば利用者からのモードの選択を一定時間待ち、当該一定時間が経過しても当該利用者によってモードが選択されない場合には、学習モードが自動的に設定されてもよい。

なお、後述するようにデータ収集部３１によって設定されたモードに応じて注目対象予測装置３０の動作は異なる。

次に、データ収集部３１は、学習モードが設定されたか否かを判定する（ステップＳ３）。学習モードが設定されたと判定された場合（ステップＳ３のＹＥＳ）、後述する時系列予測モデル更新処理が実行される（ステップＳ４）。なお、この時系列予測モデル更新処理は、データ収集部３１、対象表現評価部３２、対象数値変化率評価部３３および時系列予測モデル生成部３４によって実行される。ステップＳ４の処理が実行されると、上記したステップＳ２に戻って処理が繰り返される。

なお、上記したようにステップＳ２において利用者からのモードの選択がされないような場合には学習モードが設定されるため、明示的に利用者によって予測モードまたは終了モードが選択されない限り、時系列予測モデル更新処理が繰り返されることになる。この場合、時系列予測モデル更新処理は、例えば上記した注目対象予測装置３０の初期化処理において設定されたデータ収集単位時間の間隔で繰り返される。

一方、学習モードが設定されていないと判定された場合（ステップＳ３のＮＯ）、データ収集部３１は、予測モードが設定されたか否かを判定する（ステップＳ５）。

予測モードが設定されたと判定された場合（ステップＳ５のＹＥＳ）、後述する対象ランキング処理が実行される（ステップＳ６）。なお、この対象ランキング処理は、データ収集部３１、対象表現評価部３２、対象注目度算出部３５および対象ランキング表示部３６によって実行される。ステップＳ６の処理が実行されると、上記したステップＳ２に戻って処理が繰り返される。

一方、予測モードが設定されていないと判定された場合（ステップＳ５のＮＯ）、つまり、終了モードが設定された場合、注目対象予測装置３０の動作（処理）は終了される。

次に、図５のフローチャートを参照して、上述した時系列予測モデル更新処理（図４に示すステップＳ４の処理）の処理手順について説明する。なお、時系列予測モデル更新処理は、上述したように学習モードが設定された場合に実行される処理である。

まず、データ収集部３１は、学習データ収集期間を設定する（ステップＳ１１）。例えば以前に時系列予測モデル更新処理が実行されていない場合、つまり、今回の時系列予測モデル更新処理が１回目である場合には、注目対象予測装置３０の初期化処理（図４に示すステップＳ１の処理）において設定されたデータ収集単位時間にデータ収集最大回数から１を減算した値を掛けた時間（つまり、「データ収集単位時間＊（データ収集最大回数−１）」）を現在から遡った時点（の直後）から現在までの期間を学習データ収集期間として設定する。具体的には、データ収集単位時間として１日が設定されており、データ収集最大回数として５回が設定されており、現在の日付が「２０１０／１／８」である場合には、現在の日付「２０１０／１／８」から「１日＊（５−１）」の時間を現在から遡った時点から現在までの期間、つまり、「２０１０／１／４〜２０１０／１／８」までの５日分（つまり、データ収集単位時間のデータ収集最大回数分）の期間が学習データ収集期間として設定される。

一方、以前に時系列予測モデル更新処理が実行されている場合、つまり、今回の時系列予測モデル更新処理が２回目以降である場合には、データ収集部３１は、前回の時系列予測モデル更新処理において設定された学習データ収集期間後（つまり、当該時系列予測モデル更新処理の終了後）から現在までの期間（つまり、１データ収集単位時間分の期間）を学習データ収集期間として設定する。具体的には、前回の時系列予測モデル更新処理において設定された学習データ収集期間が「２０１０／１／４〜２０１０／１／８」であり、現在の日付が「２０１０／１／９」である場合には、「２０１０／１／９」の１日分（つまり、１データ収集単位時間分）の期間が学習データ収集期間として設定される。

つまり、今回の時系列予測モデル更新処理が１回目である場合には学習データ収集期間として１データ収集単位時間より長い期間（データ収集単位時間のデータ収集最大回数分の期間）が設定され、今回の時系列予測モデル更新処理が２回目以降である場合には学習データ収集期間として１データ収集単位時間が設定される。

次に、データ収集部３１によって設定された学習データ収集期間に基づいて、テキスト解析処理が実行される(ステップＳ１２)。このテキスト解析処理においては、データ収集部３１によって設定された学習データ収集期間内における時系列テキストデータが取得され、当該取得された時系列テキストデータに基づいて対象毎の評価値（以下、対象表現評価値と表記）が算出される。

なお、データ収集部３１によって設定された学習データ収集期間が１データ収集単位時間より長い場合（つまり、今回の時系列予測モデル更新処理が１回目である場合）、テキスト解析処理においては、当該学習データ収集期間内におけるデータ収集単位時間毎の対象表現評価値（つまり、時系列順の対象表現評価値）が対象毎に算出される。一方、データ収集部３１によって設定された学習データ収集期間が１データ収集単位時間である場合（つまり、今回の時系列予測モデル更新処理が２回目以降である場合）、テキスト解析処理においては、当該学習データ収集期間内における１データ収集単位時間分の対象表現評価値が対象毎に算出される。なお、テキスト解析処理の詳細については後述する。

テキスト解析処理が実行されると、対象表現評価部３２は、当該テキスト解析処理において算出された対象毎の対象表現評価値に基づいて、当該対象毎の時系列順の対象表現評価値を更新する（ステップＳ１３）。なお、対象毎の時系列順の対象表現評価値は、例えば対象表現評価部３２の内部に格納される。

なお、上記したように学習データ収集期間が１データ収集単位時間より長い場合、ステップＳ１３においては、テキスト解析処理において算出された対象毎の時系列順の対象表現評価値（つまり、学習データ収集期間内におけるデータ収集単位時間毎の対象表現評価値）がそのまま格納される。一方、学習データ収集期間が１データ収集単位時間である場合、ステップＳ１３においては、前回の時系列予測モデル更新処理において既に格納されている対象毎の時系列順の対象表現評価値において最も古い日付（時間帯）の対象表現評価値が削除され、テキスト解析処理において算出された対象表現評価値（つまり、１収集単位時間分の対象表現評価値）が当該時系列順の対象表現評価値の最後に格納される。つまり、対象表現評価部３２の内部には、データ収集最大回数と同じ数の対象表現評価値が対象毎に格納される。

次に、データ収集部３１によって設定された学習データ収集期間に基づいて、対象数値解析処理が実行される（ステップＳ１４）。この対象数値解析処理においては、データ収集部３１によって設定された学習データ収集期間内における時系列数値データが取得され、当該取得された時系列数値データに基づいて対象毎の変化率（以下、対象数値変化率と表記）が算出される。

なお、上記したテキスト解析処理と同様に、データ収集部３１によって設定された学習データ収集期間が１データ収集単位時間より長い場合、対象数値解析処理においては、当該学習データ収集期間内におけるデータ収集単位時間毎の対象数値変化率（つまり、時系列順の対象数値変化率）が対象毎に算出される。一方、データ収集部３１によって設定された学習データ収集期間が１データ収集単位時間である場合、対象数値解析処理においては、当該学習データ収集期間内における１データ収集単位時間分の対象数値変化率が対象毎に算出される。なお、対象数値解析処理の詳細については後述する。

対象数値解析処理が実行されると、対象表現評価部３２は、当該対象数値解析処理において算出された対象毎の対象数値変化率に基づいて、当該対象毎の時系列順の対象数値変化率を更新する（ステップＳ１５）。なお、対象毎の時系列順の対象数値変化率は、例えば対象数値変化率評価部３３の内部に格納される。

なお、上記したように学習データ収集期間が１データ収集単位時間より長い場合、ステップＳ１５においては、対象数値解析処理において算出された対象毎の時系列順の対象数値変化率（つまり、学習データ収集期間内におけるデータ収集単位時間毎の対象数値変化率）がそのまま格納される。一方、学習データ収集期間が１データ収集単位時間である場合、ステップＳ１５においては、前回の時系列予測モデル更新処理において既に格納されている対象毎の時系列順の対象数値変化率において最も古い日付（時間帯）の対象数値変化率が削除され、対象数値解析処理において算出された対象数値変化率（つまり、１収集単位時間分の対象表現評価値）が当該時系列順の対象数値変化率の最後に格納される。

なお、後述するように対象数値変化率は時系列数値データに含まれる時系列順の数値情報における前後の数値情報に含まれる数値に基づいて算出されるため、対象数値変化率評価部３３の内部には、上記した対象表現評価部３２の内部に格納される対象毎の対象表現評価値の数（つまり、データ収集最大回数）より１つ少ない数の対象数値変化率が対象毎に格納される。

次に、時系列予測モデル生成部３４は、テキスト解析処理において算出された対象毎の時系列順の対象表現評価値（対象表現評価部３２の内部に格納された対象表現評価値）および対象数値解析処理において算出された対象毎の時系列順の対象数値変化率（対象数値変化率評価部３３の内部に格納された対象数値変化率）に基づいて、時系列予測モデルを生成する（ステップＳ１６）。この場合、時系列予測モデル生成部３４は、例えば予め用意されている式（１）を用いて時系列予測モデルを生成する。

式（１）において、ｐは、上記した注目対象予測装置３０の初期化処理において設定されたデータ収集最大回数から１を減算した値（つまり、「データ収集最大回数−１」）を表す。また、ｔは、対象を表す。更に、ｉは、上記した対象表現評価値および対象数値変化率の時系列順において最も古い日付（最初の日付）を１とした場合における各日付を表す。

また、式（１）において、αは、減衰率を表しており、過去の結果をどの程度反映するかを示すパラメータである。αは、［０，１］の範囲の値をとり、この値が大きい程、過去の結果を反映することになる。なお、α＝０の場合には「０の０乗は１」とみなす。

一方、式（１）において、βは、表現重視度を表しており、対象ｔを評価するにあたって、対象表現評価値を対象数値変化率と比べてどの程度重視するかを表すパラメータである。βは、［０，１］の範囲の値をとり、この値が大きい程、対象表現評価値を重視することになる。

上記したように時系列予測モデルは、対象毎の時系列順の対象表現評価値および対象毎の時系列順の対象数値変化率を用いて式（１）により生成される。つまり、時系列予測モデルには、式（１）において上記したパラメータ（αおよびβ）の具体的な値の組に対して対象毎に算出された値の各々が含まれる。

ステップＳ１６において生成された時系列予測モデルは、例えば時系列予測モデル生成部３４の内部に格納される。このように時系列予測モデル更新処理が実行される度に時系列予測モデルが更新される。

なお、上記したように時系列予測モデル更新処理が実行された場合、例えば当該時系列予測モデル更新処理において設定された学習データ収集期間が注目対象予測装置３０内において設定される。

次に、図６のフローチャートを参照して、上述したテキスト解析処理（図５に示すステップＳ１２の処理）の処理手順について説明する。このテキスト解析処理は、データ収集部３１および対象表現評価部３２によって実行される。

まず、データ収集部３１は、図５に示すステップＳ１１において設定された学習データ収集期間内における文字列を含むテキスト情報を収集する（ステップＳ２１）。この場合、データ収集部３１は、上記した注目対象予測装置３０の初期化処理において設定されたＷｅｂサイト（テキスト情報を収集するＷｅｂサイト）にアクセスし、例えば学習データ収集期間内の日付が付与されているテキスト情報を収集（ダウンロード）する。このデータ収集部３１によって収集されるテキスト情報に付与されている日付は、当該テキスト情報（例えば、ニュースのヘッドライン）が発信された日付を表す。なお、注目対象予測装置３０の初期化処理において複数のＷｅｂサイトが設定された場合には、当該各Ｗｅｂサイトからテキスト情報が収集される。

データ収集部３１は、収集されたテキスト情報を当該テキスト情報に付与されている日付順（つまり、時系列順）に整列して、当該テキスト情報を時系列順に含む時系列テキストデータを取得する。

データ収集部３１は、取得された時系列テキストデータを対象表現評価部３２に渡す。なお、対象表現評価部３２に渡された時系列テキストデータは、例えば対象表現評価部３２の内部に格納される。

以下、対象表現評価部３２は、データ収集部３１から渡された時系列テキストデータに含まれる時系列順のテキスト情報の各々についてステップＳ２２〜Ｓ２４の処理を実行する。

対象表現評価部３２は、データ収集部３１から渡された時系列テキストデータから、当該時系列テキストデータに含まれる時系列順のテキスト情報のうちの１つを取り出す（ステップＳ２２）。

対象表現評価部３２は、取り出されたテキスト情報が対象表現格納部２２に格納されている対象表現（対象に関連する文字列）を含むか否かを判定する（ステップＳ２３）。このステップＳ２３においては、対象表現格納部２２に格納されている対象表現の各々について処理が実行される。

テキスト情報が対象表現を含むと判定された場合（ステップＳ２３のＹＥＳ）、対象表現評価部３２は、当該テキスト情報に付与されている日付における、対象表現格納部２２において当該対象表現に対応づけられている対象のスコア（件数）に１を加算する（ステップＳ２４）。

一方、テキスト情報が対象表現を含まないと判定された場合（ステップＳ２３のＮＯ）、ステップＳ２４の処理は実行されない。

次に、対象表現評価部３２は、データ収集部３１から渡された時系列テキストデータに含まれる全てのテキスト情報について上記したステップＳ２２〜Ｓ２４の処理が実行されたか否かを判定する（ステップＳ２５）。

全てのテキスト情報について処理が実行されていないと判定された場合（ステップＳ２５のＮＯ）、上記したステップＳ２２に戻って処理が繰り返される。この場合、ステップＳ２２〜Ｓ２４の処理が実行されていないテキスト情報がステップＳ２２において取り出される。このようにテキスト情報の各々についてステップＳ２２〜Ｓ２４の処理が繰り返されることによって、学習データ収集期間内の各日付における対象毎のスコアを得ることができる。

一方、全てのテキスト情報について処理が実行されたと判定された場合（ステップＳ２５のＹＥＳ）、対象表現評価部３２は、学習データ収集期間内の各日付における対象毎の対象表現評価値を算出する（ステップＳ２６）。

対象表現評価部３２によって学習データ収集期間内の各日付における対象毎の対象表現評価値の全てが算出されると、テキスト解析処理は終了される。

対象表現評価部３２によって算出された学習データ収集期間内の各日付における対象毎の対象表現評価値は、対象毎、かつ、時系列順（日付順）に整列されて、上記したように対象表現評価部３２の内部に格納される。

上記した図６に示すステップＳ２３の処理においては単にテキスト情報が対象表現を含むか否かを判定するものとして説明したが、例えば自然言語処理技術に基づいて当該テキスト情報から固有名詞を抽出し、当該固有名詞の中に対象表現と一致するものが存在するか否かが判定される構成であっても構わない。また、対象表現に文字区切りの情報または品詞等の情報を付与して登録しておき、例えばテキスト情報の形態素解析結果と比較することにより、テキスト情報に対象表現が含まれるか否かが判定される構成であっても構わない。

また、ステップＳ２４においては単に対象表現を含むテキスト情報の数をスコアとしてカウントしているが、例えばテキスト情報に付随する時刻またはサイトに関する情報等を利用したテキスト情報の重みを考慮して、当該重みを加味した値をスコアとしても構わない。

次に、図７のフローチャートを参照して、上述した対象数値解析処理（図５に示すステップＳ１４の処理）の処理手順について説明する。この対象数値解析処理は、データ収集部３１および対象数値変化率評価部３３によって実行される。

まず、データ収集部３１は、図５に示すステップＳ１１において設定された学習データ収集期間内における対象に関する数値を含む数値情報を当該対象毎に収集する（ステップＳ３１）。この場合、データ収集部３１は、注目対象予測装置３０の初期化処理において設定されたＷｅｂサイト（数値情報を収集するＷｅｂサイト）にアクセスし、例えば学習データ収集期間内の日付が付与されている数値情報を収集（ダウンロード）する。このデータ収集部３１によって収集される数値情報に付与されている日付は、当該数値情報（例えば、対象の株価）が発信された日付を表す。なお、注目対象予測装置３０の初期化処理において複数のＷｅｂサイトが設定された場合には、当該各Ｗｅｂサイトからテキスト情報が収集される。

データ収集部３１は、対象毎に収集された数値情報を当該数値情報に付与されている日付順（つまり、時系列順）に整列して、当該数値情報を時系列順に含む対象毎の時系列数値データを取得する。

データ収集部３１は、取得された対象毎の時系列数値データを対象数値変化率評価部３３に渡す。なお、対象数値変化率評価部３３に渡された対象毎の時系列数値データは、例えば対象数値変化率評価部３３の内部に格納される。また、ここで説明している対象数値解析処理は上記したように時系列予測モデル更新処理において実行されるが、今回の時系列予測モデル更新処理が２回目以降である場合には、前回の時系列予測モデル更新処理における対象数値解析処理のステップＳ３１において対象毎に収集された数値情報を時系列順に含む時系列数値データ（以下、前回の時系列数値データと表記）が対象数値変化率評価部３３の内部に格納されているものとする。

以下、対象数値変化率評価部３３は、データ収集部３１から渡された対象毎の時系列数値データの各々についてステップＳ３２〜Ｓ３６の処理を実行する。

対象数値変化率評価部３３は、データ収集部３１から渡された対象毎の時系列数値データのうちの１つ対象の時系列数値データを取り出す（ステップＳ３２）。

次に、対象数値変化率評価部３３は、取り出された時系列数値データに時系列順に含まれる数値情報の各々についてステップＳ３３〜Ｓ３５の処理を実行する。なお、対象数値変化率評価部３３は、取り出された時系列数値データに含まれる数値情報を例えば時系列順に処理する。

対象数値変化率評価部３３は、ステップＳ３２において取り出された時系列数値データから、当該時系列数値データに含まれる時系列順の数値情報のうちの１つを取り出す（ステップＳ３３）。

対象数値変化率評価部３３は、対象数値変化率評価部３３の内部に格納されている時系列数値データに基づいて、ステップＳ３３において取り出された数値情報の前に数値情報があるか否かを判定する（ステップＳ３４）。ここで、ステップＳ３３において取り出された数値情報がステップＳ３２において取り出された時系列数値データに含まれる数値情報の時系列順における最初の数値情報であっても、上記したように前回の時系列数値データが残存している場合には、ステップＳ３３において取り出された数値情報の前に数値情報があると判定される。

ステップＳ３３において取り出された数値情報の前に数値情報があると判定された場合、対象数値変化率評価部３３は、当該取り出された数値情報および時系列順において当該数値情報の直前の数値情報（以下、直前数値情報と表記）に基づいて、当該直前数値情報に付与されている日付におけるステップＳ３２において時系列数値データが取り出された対象の対象数値変化率を算出する（ステップＳ３５）。

次に、対象数値変化率評価部３３は、ステップＳ３２において取り出された時系列数値データに含まれる全ての数値情報について上記したステップＳ３３〜Ｓ３５の処理が実行されたか否かを判定する（ステップＳ３６）。

ステップＳ３２において取り出された時系列数値データに含まれる全ての数値情報について処理が実行されていないと判定された場合（ステップＳ３６のＮＯ）、上記したステップＳ３３に戻って処理が繰り返される。この場合、ステップＳ３３〜Ｓ３５の処理が実行されていない数値情報がステップＳ３３において取り出される。

ここで、上記したようにステップＳ３２において取り出された時系列数値データに含まれる全ての数値情報についてステップＳ３３〜Ｓ３５の処理が繰り返されると、学習データ収集期間内の各日付における当該ステップＳ３２において時系列数値データが取り出された対象の対象数値変化率が算出される。このように算出された学習データ収集期間内の各日付における対象の対象数値変化率は、当該日付順（時系列順）に整列されて、対象数値変化率評価部３３の内部に格納される。

一方、ステップＳ３２において取り出された時系列数値データに含まれる全ての数値情報について処理が実行されたと判定された場合（ステップＳ３６のＹＥＳ）、対象数値変化率評価部３３は、データ収集部３１から渡された対象毎の時系列数値データの全てについてステップＳ３２〜Ｓ３６の処理が実行されたか否かを判定する（ステップＳ３７）。

対象毎の時系列数値データの全てについて処理が実行されていないと判定された場合（ステップＳ３７のＮＯ）、上記したステップＳ３２に戻って処理が繰り返される。この場合、ステップＳ３２〜Ｓ３６の処理が実行されていない対象の時系列数値データがステップＳ３２において取り出される。

一方、対象毎に時系列数値データの全てについて処理が実行されたと判定された場合（ステップＳ３７のＹＥＳ）、対象数値解析処理は終了される。

このように対象数値解析処理が実行されることによって、対象毎に時系列順の対象数値変化率が算出される。なお、対象数値解析処理において算出された対象数値変化率は、上記したように対象数値変化率評価部３３の内部に格納される。

次に、図８〜図４１を参照して、上述した時系列予測モデル更新処理について具体的に説明する。ここでは、複数の対象（企業）には、Ａ社、Ｂ社、Ｃ社、Ｄ社等が含まれるものとする。

なお、注目対象予測装置３０の初期化処理において設定されたデータ収集単位時間は１日であり、データ収集最大回数は５回であるものとする。また、対象表現格納部２２は、前述した図３に示すデータ構造を有するものとする。

時系列予測モデル更新処理においては、まず、学習データ収集期間がデータ収集部３１によって設定される。ここでは、今回の時系列予測モデル更新処理が１回目であるものとする。ここで、現在の日付が「２０１０／１／８」である場合には、上記したデータ収集単位時間（１日）およびデータ収集最大回数（５回）により、「２０１０／１／４〜２０１０／１／８」が学習データ収集期間として設定される。

次に、データ収集部３１によって設定された学習データ収集期間に基づいて、テキスト解析処理が実行される。

テキスト解析処理においては、まず、学習データ収集期間内におけるテキスト情報がデータ収集部３１によって収集される。データ収集部３１は、注目対象予測装置３０の初期化処理において設定されたＷｅｂサイトから、例えばニュースのヘッドラインをテキスト情報として収集する。これにより、データ収集部３１は、収集されたテキスト情報を時系列順に含む時系列テキストデータを取得する。

ここで、図８は、データ収集部３１によって収集された学習データ収集期間「２０１０／１／４〜２０１０／１／８」内におけるテキスト情報（ニュースのヘッドライン）を時系列順に含む時系列テキストデータの一例を示す。

なお、図８に示すように、時系列テキストデータに含まれるテキスト情報には、例えば日付、時刻および発信サイト（を示す情報）が付与されている。

具体的には、例えばテキスト情報「Ｂ１社新製品を発表」には、日付「２０１０／１／４」、時刻「８：００」および発信サイト「ｚサイト」が付与されている。これによれば、テキスト情報「Ｂ１社新製品を発表」が「２０１０／１／４」の「８：００」に「ｚサイト」から発信されたことが示されている。

次に、対象表現評価部３２は、データ収集部３１によって取得された時系列テキストデータから、当該時系列テキストデータに含まれる時系列順のテキスト情報のうちの１つを取り出す。ここでは、図８に示す時系列テキストデータに含まれる時系列順のテキスト情報のうち、テキスト情報「Ｂ１社新製品を発表」が取り出されたものとする。

対象表現評価部３２は、取り出されたテキスト情報が対象表現格納部２２に格納されている対象表現を含むか否かを判定する。ここで、図３に示す対象表現格納部２２を参照すると、テキスト情報「Ｂ１社新製品を発表」には、対象「Ｂ社」に対応づけて対象表現格納部２２に格納されている対象表現「Ｂ１社」が含まれている。

この場合、対象表現評価部３２は、テキスト情報「Ｂ１社新製品を発表」に付与されている日付「２０１０／１／４」における、対象表現「Ｂ１社」に対応づけられている対象「Ｂ社」のスコアに１を加算する。

ここでは、図８に示す時系列テキストデータに含まれるテキスト情報「Ｂ１社新製品を発表」について説明したが、他のテキスト情報についても同様である。

上記したように図８に示す時系列テキストデータに含まれるテキスト情報の全てについて処理が実行されると、対象表現評価部３２は、学習データ収集期間内の各日付における対象毎の対象表現評価値を算出する。なお、対象表現評価値は、学習データ収集期間内の各日付における対象毎のスコアおよび上記した式（２）を用いて算出される。

ここで、例えば日付「２０１０／１／４」における対象「Ｂ社」の対象表現評価値の算出について具体的に説明する。この日付「２０１０／１／４」における対象「Ｂ社」の対象表現評価値は、上記した式（２）により、日付「２０１０／１／４」における全ての対象のスコアの合計に対する日付「２０１０／１／４」における対象「Ｂ社」のスコアの割合として算出される。

ここでは、日付「２０１０／１／４」における対象「Ｂ社」の対象表現評価値の算出について説明したが、他の対象表現評価値についても同様に算出される。

上記したように今回の時系列予測モデル更新処理は１回目であるので、このように学習データ収集期間内の各日付における対象毎の対象表現評価値が算出されると、当該算出された対象表現評価値は、対象毎、かつ、時系列順（日付順）に整列されて、そのまま対象表現評価部３２の内部に格納される。

ここで、図９〜図１２は、対象表現評価部３２の内部に格納された対象毎の時系列順の対象表現評価値の一例を示す。

図９は、複数の対象のうちの対象「Ａ社」の時系列順の対象表現評価値の一例を示す。図１０は、複数の対象のうちの対象「Ｂ社」の時系列順の対象表現評価値の一例を示す。図１１は、複数の対象のうちの対象「Ｃ社」の時系列順の対象表現評価値の一例を示す。図１２は、複数の対象のうちの対象「Ｄ社」の時系列順の対象表現評価値の一例を示す。

なお、図９〜図１２に示すように、各対象の時系列順の対象表現評価値には、上記した学習データ収集期間「２０１０／１／４〜２０１０／１／８」内の各日付が付与された対象表現評価値が含まれる。

ここでは、対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」の時系列順の対象表現評価値について説明したが、対象表現評価部３２の内部には、これら以外の対象の時系列順の対象表現評価値についても同様に格納されている。

次に、データ収集部３１によって設定された学習データ収集期間に基づいて、対象数値解析処理が実行される。

対象数値解析処理においては、まず、対象毎に学習データ収集期間内における当該対象に関する数値を含む数値情報がデータ収集部３１によって収集される。データ収集部３１は、注目対象予測装置３０の初期化処理において設定されたＷｅｂサイトから、例えば対象（企業）毎の株価を数値情報として収集する。これにより、データ収集部３１は、収集された数値情報を時系列順に含む時系列数値データを取得する。

ここで、図１３〜図１６は、データ収集部３１によって対象毎に収集された学習データ収集期間「２０１０／１／４〜２０１０／１／８」内における数値情報（対象の株価）を時系列順に含む時系列数値データの一例を示す。

図１３は、複数の対象のうちの対象「Ａ社」について収集された数値情報（Ａ社の株価）を時系列順に含む時系列数値データの一例を示す。図１４は、複数の対象のうちの対象「Ｂ社」について収集された数値情報（Ｂ社の株価）を時系列順に含む時系列数値データの一例を示す。図１５は、複数の対象のうちの対象「Ｃ社」について収集された数値情報（Ｃ社の株価）を時系列順に含む時系列数値データの一例を示す。図１６は、複数の対象のうちの対象「Ｄ社」について収集された数値情報（Ｄ社の株価）を時系列順に含む時系列数値データの一例を示す。

なお、図１３〜図１６に示すように、時系列数値データに含まれる数値情報には、日付（を示す情報）が付与されている。

具体的には、例えば図１３に示す時系列数値データに含まれる数値情報「１０２０」には、日付「２０１０／１／４」が付与されている。これによれば、数値情報「１０２０」は、日付「２０１０／１／４」のＡ社の株価であることが示されている。

ここで、対象数値変化率評価部３３は、データ収集部３１によって取得された対象毎の時系列数値データのうちの１つの対象の時系列数値データを取り出す。ここでは、上記した図１３に示す対象「Ａ社」の時系列数値データが取り出されたものとする。

次に、対象数値変化率評価部３３は、取り出された対象「Ａ社」の時系列数値データから、当該時系列数値データに含まれる時系列順の数値情報のうちの１つを取り出す。ここでは、図１３に示す対象「Ａ社」の時系列数値データに含まれる時系列順の数値情報のうちの数値情報「１０２０」が取り出されたものとする。

ここで、上記したように今回の時系列予測モデル更新処理は１回目であるため、対象数値変化率評価部３３によって取り出された数値情報「１０２０」の前には数値情報がない。

また、対象「Ａ社」の時系列数値データに含まれる全ての数値情報について処理がされていないため、対象数値変化率評価部３３は、例えば時系列順において数値情報「１０２０」の次の数値情報「１０００」を対象「Ａ社」の時系列数値データから取り出す。

ここで取り出された数値情報「１０００」の前には数値情報「１０２０」がある。したがって、対象数値変化率評価部３３は、取り出された数値情報「１０００」および直前数値情報である数値情報「１０２０」と上記した式（３）とを用いて、当該数値情報「１０２０」に付与されている日付「２０１０／１／４」における対象「Ａ社」の対象数値変化率を算出する。この場合、日付「２０１０／１／４」における対象「Ａ社」の対象数値変化率は、式（３）により｜１０００−１０２０｜／１０２０≒０．０２となる。

ここでは、日付「２０１０／１／４」における対象「Ａ社」の対象数値変化率の算出について説明したが、他の対象数値変化率についても同様に算出される。

上記したように今回の時系列予測モデル更新処理は１回目であるので、このように学習データ収集期間内の各日付における対象毎の対象数値変化率が算出されると、当該算出された対象数値変化率は、対象語と、かつ、時系列順（日付順）に整列されて、そのまま対象数値変化率評価部３３の内部に格納される。

ここで、図１７〜図２０は、対象数値変化率評価部３３の内部に格納された対象毎の時系列順の対象数値変化率の一例を示す。

図１７は、複数の対象のうちの対象「Ａ社」の時系列順の対象数値変化率の一例を示す。図１８は、複数の対象のうちの対象「Ｂ社」の時系列順の対象数値変化率の一例を示す。図１９は、複数の対象のうちの対象「Ｃ社」の時系列順の対象数値変化率の一例を示す。図２０は、複数の対象のうちの対象「Ｄ社」の時系列順の対象数値変化率の一例を示す。

なお、図１７〜図２０に示すように、各対象の時系列順の対象数値変化率には、上記した学習データ収集期間「２０１０／１／４〜２０１０／１／８」内の各日付が付与された対象数値変化率が含まれる。

具体的には、例えば図１７に示す対象「Ａ社」の時系列順の対象数値変化率には、日付「２０１０／１／４」が付与された対象数値変化率「０．０２」が含まれている。なお、この日付「２０１０／１／４」は、対象数値変化率「０．０２」の算出の際に用いられた直前数値情報（図１３に示す数値情報「１０２０」）に付与されている日付である。

また、日付「２０１０／１／８」は上記した学習データ収集期間「２０１０／１／４〜２０１０／１／８」内であるが、当該日付「２０１０／１／８」が付与される対象数値変化率は、日付「２０１０／１／９」の数値情報が収集された後に算出されるため、図１７〜図２０に示すように空欄となっている。

ここでは、対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」の時系列順の対象数値変化率について説明したが、対象数値変化率評価部３３の内部には、これら以外の対象の時系列順の対象数値変化率についても同様に格納されている。

次に、時系列予測モデル生成部３４は、対象表現評価部３２の内部に格納された対象毎の時系列順の対象表現評価値（例えば、図９〜図１２）および対象数値変化率評価部３３の内部に格納された対象毎の時系列順の対象数値変化率（例えば、図１７〜図２０）に基づいて、時系列予測モデルを生成する。この場合、時系列予測モデル生成部３４は、上記した式（１）を用いて時系列予測モデルを生成する。

ここで、例えば対象「Ａ社」について時系列予測モデルが生成される場合について具体的に説明する。この場合、式（１）における対象ｔは、対象「Ａ社」である。また、データ収集最大回数は５回であるため、ｐは、４（データ収集最大回数−１）である。また、ｉ＝１は、日付「２０１０／１／４」を表す。以下同様に、ｉ＝２は日付「２０１０／１／５」を表し、ｉ＝３は日付「２０１０／１／６」を表し、ｉ＝４は日付「２０１０／１／７」を表し、ｉ＝５は日付「２０１０／１／８」を表す。

図２１は、時系列予測モデル生成部３４によって生成された時系列予測モデルの一例を示す。

なお、上述したように時系列予測モデルには、式（１）においてパラメータ（αおよびβ）の具体的な値の組に対して対象毎に算出された値が含まれる。

図２１に示す例では、パラメータαが０．００、０．２５、０．５０、０．７５、１．００の各値であり、パラメータβが０．２５、０．５０、０．７５の各値である場合に、当該パラメータαおよびβのそれぞれの組に対して式（１）により対象毎に算出された値を含む時系列予測モデルが示されている。

上記したように時系列予測モデル生成部３４によって時系列予測モデルが生成されると、時系列予測モデル更新処理は終了される。なお、時系列予測モデル生成部３４によって生成された時系列予測モデルは、当該時系列予測モデル生成部３４の内部に格納される。

ここで、上記した図４において説明したように時系列予測モデル更新処理が終了された場合であって、利用者の操作に応じて予測モードまたは終了モードが設定されない場合（つまり、学習モードが設定された場合）には、再び時系列予測モデル更新処理（つまり、２回目の時系列予測モデル更新処理）が実行される。この場合、時系列予測モデル更新処理は、前回の時系列予測モデル更新処理において設定された学習データ収集期間から１データ収集単位時間が経過した後に実行される。

以下、上記説明した１回目の時系列予測モデル更新処理（以下、前回の時系列予測モデル更新処理と表記）が実行された後に、再び時系列予測モデル更新処理（つまり、２回目の時系列予測モデル更新処理）が実行される場合について具体的に説明する。なお、現在の日付は、「２０１０／１／９」であるものとする。

まず、データ収集部３１は、学習データ収集期間を設定する。ここでは、今回の時系列予測モデル更新処理が２回目であり、現在の日付は「２０１０／１／９」であるため、前回の時系列予測モデル更新処理において設定された学習データ収集期間の直後から現在の日付まで、つまり、「２０１０／１／９（〜２０１０／１／９）」が学習データ収集期間として設定される。なお、前回の時系列予測モデル更新処理が実行された際に、例えば当該前回の時系列予測モデル更新処理において設定された学習データ収集期間「２０１０／１／４〜２０１０／１／８」（学習モードにおける前のデータ収集日）は設定されているものとする。

テキスト解析処理においては、まず、学習データ収集期間内におけるテキスト情報がデータ収集部３１によって収集される。ここでは、学習データ収集期間が「２０１０／１／９」であるため、「２０１０／１／９」分のニュースのヘッドラインがテキスト情報として収集される。これにより、データ収集部３１は、収集されたテキスト情報を含む時系列テキストデータを取得する。ここでデータ収集部３１によって取得された時系列テキストデータには、日付「２０１０／１／９」が付与されているテキスト情報のみが含まれる。

以下、対象表現評価部３２は、データ収集部３１によって取得された時系列テキストデータに含まれるテキスト情報および対象表現格納部２２に格納されている対象表現を用いて、上記した式（２）により学習データ収集期間内の日付（ここでは、日付「２０１０／１／９」）における対象毎の対象表現評価値を算出する。対象表現評価値の算出については、前述した通りであるため、その詳しい説明を省略する。

ここで、図２２〜図２５は、対象表現評価部３２によって算出された日付「２０１０／１／９」における対象毎の対象表現評価値の一例を示す。

図２２は、複数の対象のうちの対象「Ａ社」の対象表現評価値の一例を示す。図２３は、複数の対象のうちの対象「Ｂ社」の対象表現評価値の一例を示す。図２４は、複数の対象のうちの対象「Ｃ社」の対象表現評価値の一例を示す。図２５は、複数の対象のうちの対象「Ｄ社」の対象表現評価値の一例を示す。

なお、図２２〜図２５に示すように、各対象の対象表現評価値には、上記した学習データ収集期間「２０１０／１／９」内の日付（つまり、「２０１０／１／９」）が付与されている。

次に、上記した図２２〜図２５に示す各対象の対象表現評価値は対象表現評価部３２の内部に格納されることによって、当該各対象の時系列順の対象表現評価値が更新される。

ここで、例えば対象「Ａ社」の時系列順の対象表現評価値の更新について具体的に説明する。この場合、上述した図９に示す対象「Ａ社」の時系列順の対象表現評価値のうち、最も古い日付が付与されている対象表現評価値「０．０１」が対象表現評価部３２の内部から削除される。更に、図２２に示す対象「Ａ社」の対象表現評価値「０．４０」が対象表現評価部３２の内部に格納される。これによって、図９に示す対象「Ａ社」の時系列順の対象表現評価値は、図２６に示す対象「Ａ社」の時系列順の対象表現評価値に更新される。

同様に、図１０に示す対象「Ｂ社」の時系列順の対象表現評価値は、図２７に示す対象「Ｂ社」の時系列順の対象表現評価値に更新される。また、図１１に示す対象「Ｃ社」の時系列順の対象表現評価値は、図２８に示す対象「Ｃ社」の時系列順の対象表現評価値に更新される。図１２に示す対象「Ｄ社」の時系列順の対象表現評価値は、図２９に示す対象「Ｄ社」の時系列順の対象表現評価値に更新される。

ここでは、対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」について説明したが、これら以外の対象の対象表現評価値についても同様に更新される。

対象数値解析処理においては、まず、学習データ収集期間内における数値情報がデータ収集部３１によって収集される。ここでは、学習データ収集期間が「２０１０／１／９」であるため、データ収集部３１は、「２０１０／１／９」の対象（企業）毎の株価を数値情報として収集する。これにより、データ収集部３１は、収集された数値情報を含む時系列数値データを取得する。ここでデータ収集部３１によって取得された時系列数値データには、日付「２０１０／１／９」が付与されている数値情報のみが含まれる。

ここで、図３０〜図３３は、データ収集部３１によって対象毎に収集された学習データ収集期間「２０１０／１／９」内における数値情報（対象の株価）を含む時系列数値データの一例を示す。

図３０は、複数の対象のうちの対象「Ａ社」について収集された日付「２０１０／１／９」の数値情報（Ａ社の株価）を含む時系列数値データの一例を示す。図３１は、複数の対象のうちの対象「Ｂ社」について収集された日付「２０１０／１／９」の数値情報（Ｂ社の株価）を含む時系列数値データの一例を示す。図３２は、複数の対象のうちの対象「Ｃ社」について収集された日付「２０１０／１／９」の数値情報（Ｃ社の株価）を含む時系列数値データの一例を示す。図３３は、複数の対象のうちの対象「Ｄ社」について収集された日付「２０１０／１／９」の数値情報（Ｄ社の株価）を含む時系列数値データの一例を示す。

なお、図３０〜図３３に示す時系列数値データに含まれる数値情報には、上記した学習データ収集期間「２０１０／１／９」内の日付「２０１０／１／９」が付与されている。

次に、対象数値変化率評価部３３は、データ収集部３１によって取得された対象毎の時系列数値データに含まれる数値情報および当該数値情報の直前の数値情報（直前数値情報）を用いて、上記した式（３）により対象毎の対象数値変化率を算出する。

例えば対象「Ａ社」の対象数値変化率は、図３０に示す対象「Ａ社」の日付「２０１０／１／９」の数値情報「５５０」および当該数値情報「５５０」の直前の数値情報（ここでは、図１３に示す対象「Ａ社」の日付「２０１０／１／８」の数値情報「７５０」）を用いて、式（３）により算出される。

ここでは、対象「Ａ社」について説明したが、対象「Ｂ社」、「Ｃ社」および「Ｄ社」等の他の対象についても同様に対象数値変化率が算出される。

ここで、図３４〜図３７は、対象数値変化率評価部３３によって算出された対象毎の対象数値変化率の一例を示す。

図３４は、複数の対象のうちの対象「Ａ社」の対象数値変化率の一例を示す。図３５は、複数の対象のうちの対象「Ｂ社」の対象数値変化率の一例を示す。図３６は、複数の対象のうちの対象「Ｃ社」の対象数値変化率の一例を示す。図３７は、複数の対象のうちの対象「Ｄ社」の対象数値変化率の一例を示す。

なお、図３４〜図３７に示すように、各対象の対象数値変化率には、当該対象数値変化率の算出に用いられた直前の数値情報に付与されている日付（ここでは、日付「２０１０／１／８」）が付与されている。

次に、上記した図３４〜図３７に示す各対象の対象数値変化率は対象数値変化率評価部３３の内部に格納されることによって、当該各対象の時系列順の対象数値変化率が更新される。

ここで、例えば対象「Ａ社」の時系列順の対象数値変化率の更新について具体的に説明する。この場合、上述した図１７に示す対象「Ａ社」の時系列順の対象数値変化率のうち、最も古い日付が付与されている対象数値変化率「０．０２」が対象数値変化率評価部３３の内部から削除される。更に、図３４に示す対象「Ａ社」の対象数値変化率「０．２７」が対象数値変化率評価部３３の内部に格納される。なお、この対象「Ａ社」の対象数値変化率「０．２７」には、日付「２０１０／１／８」が付与される。これによって、図１７に示す対象「Ａ社」の時系列順の対象数値変化率は、図３８に示す対象「Ａ社」の時系列順の対象数値変化率に更新される。なお、日付「２０１０／１／９」が付与される対象数値変化率は、日付「２０１０／１／１０」の数値情報が収集された後に算出されるため図３８に示すように空欄となっている。

同様に、図１８に示す対象「Ｂ社」の時系列順の対象数値変化率は、図３９に示す対象「Ｂ社」の時系列順の対象数値変化率に更新される。また、図１９に示す対象「Ｃ社」の時系列順の対象数値変化率は、図４０に示す対象「Ｃ社」の時系列順の対象数値変化率に更新される。図２０に示す対象「Ｄ社」の時系列順の対象数値変化率は、図４１に示す対象「Ｄ社」の時系列順の対象数値変化率に更新される。

ここでは、対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」について説明したが、これら以外の対象の対象数値変化率についても同様に更新される。

次に、時系列予測モデル生成部３４は、対象表現評価部３２の内部に格納された対象毎の時系列順の対象表現評価値（例えば、図２６〜図２９）および対象数値変化率評価部３３の内部に格納された対象毎の時系列順の対象数値変化率（例えば、図３８〜図４１）を用いて、上記した式（１）により時系列予測モデルを生成する。なお、時系列予測モデルの生成処理については、前述した通りであるため、その詳しい説明を省略する。

時系列予測モデル生成部３４によって生成された時系列予測モデルは、当該時系列予測モデル生成部３４の内部に格納される（つまり、上書きされる）。これによって、時系列予測モデル更新処理においては、時系列予測モデルが更新される。

次に、図４２のフローチャートを参照して、上述した対象ランキング処理（図４に示すステップＳ６の処理）の処理手順について説明する。なお、対象ランキング処理は、上述したように予測モードが設定された場合に実行される処理である。

まず、データ収集部３１は、学習モードにおける前のデータ収集日（時系列予測モデル更新処理において設定された学習データ収集期間）が設定されているか否か、つまり、時系列予測モデル更新処理が実行されたことによって時系列予測モデルが生成されているか否かを判定する（ステップＳ４１）。

学習モードにおける前のデータ収集日が設定されていると判定された場合（ステップＳ４１のＹＥＳ）、データ収集部３１は、予測データ収集期間を設定する（ステップＳ４２）。この場合、データ収集部３１は、学習モードにおける前のデータ収集日の直後（つまり、時系列予測モデル更新処理において設定された学習データ収集期間後）から現在の日付までを、予測データ収集期間として設定する。なお、対象ランキング処理は上記した学習モードが設定された場合に実行される時系列予測モデル更新処理の間に実行されるため、データ収集部３１によって設定される予測データ収集期間は、注目対象予測装置３０の初期化処理において設定されたデータ収集単位時間より短くなるが、当該期間を１単位とみなすものとする。

次に、データ収集部３１によって設定された学習データ収集期間に基づいて、テキスト解析処理が実行される（ステップＳ４３）。なお、このテキスト解析処理は、前述した学習データ収集期間を予測データ収集期間とした場合の図５に示すステップＳ１２の処理（図６に示す処理）と同様であるため、その詳しい説明を省略する。つまり、ステップＳ４３のテキスト解析処理によれば、予測データ収集期間内の日付における対象毎の対象表現評価値（１データ収集単位時間分の対象表現評価値）が算出される。

対象注目度算出部３５は、ステップＳ４３のテキスト解析処理によって算出された対象毎の対象表現評価値および時系列予測モデル生成部３４の内部に格納されている時系列予測モデル（上述した時系列予測モデル更新処理において生成された時系列予測モデル）に基づいて、対象毎の注目度を算出する。

換言すれば、対象注目度算出部３５は、ステップＳ４３のテキスト解析処理によって算出された対象毎の対象表現評価値に時系列予測モデルを適用することにより、当該対象の次期における注目度を算出する。

この場合、対象注目度算出部３５は、例えば予め用意されている式（４）を用いて対象毎の注目度を算出する。

ここで、時系列予測モデル生成部３４の内部に上述した図２１に示す時系列予測モデルが格納されており、ステップＳ４３のテキスト解析処理によって例えば上述した図２２に示す対象「Ａ社」の対象表現評価値「０．４０」が算出された場合を想定する。この場合において、パラメータα（減衰率）として０．２５、パラメータβ（表現重視度）として０．５０が利用者によって指定されているとすると、対象「Ａ社」の注目度として０．４６１１９１（＝０．４０＋０．２５＊０．２４４７６３）が算出される。なお、この対象「Ａ社」の注目度の算出に用いられた値「０．２４４７６３」は、図２１に示す時系列予測モデルに含まれるα＝０．２５およびβ＝０．５０である場合に上述した式（１）により算出された値である。

ここでは、対象「Ａ社」の注目度について説明したが、他の対象「Ｂ社」、「Ｃ社」および「Ｄ社」等についても同様に注目度が算出される。なお、対象注目度算出部３５によって対象毎に算出される注目度は、値が大きい程、当該対象が次期において注目されることを表す。

ここで、図４３は、対象注目度算出部３５によって算出された対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」の各々の注目度の一例を示す。

図４３に示す例では、対象「Ａ社」の注目度は、０．４６１１９１である。この対象「Ａ社」の注目度「０．４６１１９１」は、上記したようにα＝０．２５およびβ＝０．５０が利用者によって指定されている場合であって、上述した図２２に示す対象「Ａ社」の対象表現評価値「０．４０」に図２１に示す時系列予測モデルが適用された場合に算出された注目度である。

また、対象「Ｂ社」の注目度は、０．００５５３０である。この対象「Ｂ社」の注目度「０．００５５３０」は、上記したようにα＝０．２５およびβ＝０．５０が利用者によって指定されている場合であって、上述した図２３に示す対象「Ｂ社」の対象表現評価値「０．００」に図２１に示す時系列予測モデルが適用された場合に算出された注目度である。

また、対象「Ｃ社」の注目度は、０．１７１３９９である。この対象「Ｃ社」の注目度「０．１７１３９９」は、上記したようにα＝０．２５およびβ＝０．５０が利用者によって指定されている場合であって、上述した図２４に示す対象「Ｃ社」の対象表現評価値「０．１５」に図２１に示す時系列予測モデルが適用された場合に算出された注目度である。

また、対象「Ｄ社」の注目度は、０．０２２９６２である。この対象「Ｄ社」の注目度「０．０２２９６２」は、上記したようにα＝０．２５およびβ＝０．５０が利用者によって指定されている場合であって、上述した図２５に示す対象「Ｄ社」の対象表現評価値「０．０２」に図２１に示す時系列予測モデルが適用された場合に算出された注目度である。

図４３においては、対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」以外の対象の注目度については省略されている。

再び図４２に戻ると、対象ランキング表示部３６は、対象注目度算出部３５によって対象毎に算出された注目度（の大きさ）に基づいて、当該対象を当該注目度順に並べ替える（ステップＳ４５）。

対象ランキング表示部３６は、対象が注目度順に並べ替えられた結果（つまり、対象毎の注目度のランキング結果）を利用者に対して提示（表示）する（ステップＳ４６）。

ここで、図４４は、対象ランキング表示部３６によって表示される対象毎の注目度のランキング結果の一例を示す。図４４においては、対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」以外の対象については省略されている。

図４４に示すように、対象毎の注目度のランキング結果においては、上記した図４３に示す注目度が大きい順に対象がランキング形式で表示される。

図４４に示す例では、対象「Ａ社」、「Ｃ社」、「Ｄ社」および「Ｂ社」の順で当該対象が注目度とともに表示されている。

なお、図４４においては対象「Ａ社」、「Ｂ社」、「Ｃ社」および「Ｄ社」の全てについて表示されるものとして説明したが、例えば注目度が上位ｎ（ｎは１以上の整数）の対象のみが表示される構成であっても構わない。

ここで、図４４に示すように対象毎の注目度のランキング結果が表示されると、利用者は、当該注目度の算出に用いられたパラメータ（αおよびβ）の更新（変更）を指示することができる。この場合、利用者は、更新後のパラメータの値を指定することができる。

次に、このような利用者の指示に応じてパラメータの更新がされたか否かが判定される（ステップＳ４７）。

パラメータの更新がされたと判定された場合（ステップＳ４７のＹＥＳ）、ステップＳ４４に戻って処理が繰り返される。この場合、対象注目度算出部３５は、利用者によって指定されたパラメータの値に基づいて、対象毎の注目度を再び算出する。このように再び対象毎の注目度が算出された後、上記したステップＳ４５およびＳ４６の処理が実行される。

ここで、図４５は、パラメータの更新後に対象ランキング表示部３６によって表示される対象毎の注目度のランキング結果の一例を示す。なお、図４５に示す対象毎の注目度は、パラメータαが０．２５から１．００に更新され、パラメータβが０．５０から０．２５に更新された場合に算出された注目度である。

このように、利用者の指示に応じてパラメータが更新されることにより、減衰率（α）および表現重視度（β）の様々な値の組の場合における対象毎の注目度のランキング結果を利用者に提示することができる。

上記したように本実施形態においては、利用者の操作に応じて学習モードが設定された場合には、学習データ収集期間（予め定められた期間）内におけるテキスト情報を収集し、当該収集されたテキスト情報を時系列順に含む時系列テキストデータを取得し、対象毎に対象表現格納部２２に格納されている対象表現（対象に関連する文字列）および当該取得された時系列テキストデータに含まれる時系列順のテキスト情報に基づいて、当該対象毎に時系列順の対象表現評価値を算出し、対象毎に学習データ収集期間（予め定められた期間）内における数値情報を収集し、当該数値情報を時系列順に含む時系列数値データを取得し、対象毎に取得された時系列数値データに含まれる時系列順における前後の数値情報に含まれる数値に基づいて、対象毎に時系列順の対象数値変化率を算出する。また、本実施形態においては、利用者の操作に応じて予測モードが設定された場合には、予測データ収集期間（学習データ収集期間後から現在までの期間）内におけるテキスト情報を収集し、対象毎に対象表現格納部２２に格納されている対象表現および当該収集されたテキスト情報に基づいて、当該対象毎に対象表現評価値を算出し、当該対象毎に算出された時系列順の対象表現評価値、当該対象毎に算出された時系列順の対象数値変化率および当該対象毎に算出された対象表現評価値を用いて、対象毎の注目度を算出し、当該算出された対象毎の注目度を利用者に提示する。

これにより、本実施形態においては、複数の対象の中から注目すべき対象を予測し、当該注目すべき対象を利用者に提示することができるため、利用者は、多数の対象の中から注目すべき対象を容易かつ簡便に選別することが可能となる。

つまり、本実施形態においては、現時点までにおける対象に対応する数値情報の変化を参照するだけでなく、数値情報の変化に影響を与える対象表現（対象に関連する文字列）の出現頻度（上述した当該対象のスコア）を参照することにより、例えば専門家等による知識を前提とすることなく、複数の情報源の情報に基づいた注目すべき対象の選別を支援することができる。

具体的には、本実施形態において、例えばニュースのヘッドラインをテキスト情報とし、企業の株価を数値情報とすることで、利用者は、証券市場において多数の企業（銘柄）の中から注目すべき銘柄を容易かつ簡便に選別することができる。なお、本実施形態は、例えばプラント監視の分野等にも適用することができる。具体的には、プラント監視の分野における保守員によって記録される日報をテキスト情報とし、プラントから収集される計測データを数値情報とすることで、利用者は、多数のプラントの中から注目すべきプラント（例えば、故障等の可能性があるプラント）を選別することができる。

また、本実施形態においては、学習モードが設定された場合に、対象毎に算出された時系列順の対象表現評価値および対象毎に算出された時系列順の変化率に基づいて時系列予測モデルを生成しておくことで、予測モードが設定された場合における対象毎の注目度の算出に必要な処理量を軽減することができる。

なお、本実施形態においては、各対象に対して１種類の数値情報（例えば、株価）しか存在しないものとして説明したが、当該各対象に対して複数の数値情報があり、当該複数の数値情報から算出される複数の対象毎の時系列順の対象数値変化率から時系列予測モデルが生成されても構わない。すなわち、本実施形態における対象（企業）の株価の数値情報に、例えば株価の出来高の数値情報を加えて時系列予測モデルが生成されても構わない。

また、本実施形態においては、データ収集部３１がテキスト情報を提供するＷｅｂサイトおよび数値情報を提供するＷｅｂサイトから各データを収集するものとして説明したが、例えばネットワーク環境でつながっている他の情報システム等からデータが収集されても構わない。

また、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組合せてもよい。

１０…コンピュータ、２０…外部記憶装置、２２…対象表現格納部、３０…注目対象予測装置、３１…データ収集部、３２…対象表現評価部、３３…対象数値変化率評価部、３４…時系列予測モデル生成部、３５…対象注目度算出部、３６…対象ランキング表示部。

Claims

複数の対象の中から注目すべき対象を予測する注目対象予測装置において、
前記対象毎に、当該対象に関連する文字列を格納する対象表現格納手段と、
予め定められた複数の期間内における文字列を含むテキスト情報を収集し、当該収集されたテキスト情報を時系列順に含む時系列テキストデータを取得する第１のデータ収集手段と、
前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列および前記第１のデータ収集手段によって取得された時系列テキストデータに含まれる時系列順のテキスト情報に基づいて、前記対象毎に前記時系列順の評価値を算出する第１の評価値算出手段と、
前記対象毎に、前記予め定められた複数の期間内における当該対象に関する数値を含む数値情報を収集し、当該数値情報を時系列順に含む時系列数値データを取得する第２のデータ収集手段と、
前記対象毎に前記第２のデータ収集手段によって取得された時系列数値データに含まれる時系列順における前後の数値情報に含まれる数値に基づいて、前記対象毎に前記時系列順の変化率を算出する変化率算出手段と、
前記予め定められた複数の期間後における文字列を含むテキスト情報を収集する第３のデータ収集手段と、
前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列および前記第３のデータ収集手段によって収集されたテキスト情報に含まれる文字列に基づいて、前記対象毎に評価値を算出する第２の評価値算出手段と、
前記対象毎に前記第１の評価値算出手段によって算出された前記時系列順の評価値、前記対象毎に前記変化率算出手段によって算出された前記時系列順の変化率および前記対象毎に前記第２の評価値算出手段によって算出された評価値を用いて、前記対象毎の注目度を算出する注目度算出手段と、
前記注目度算出手段によって算出された前記対象毎の注目度を提示する提示手段と
を具備する注目対象予測装置。
前記第１の評価値算出手段は、前記第１のデータ収集手段によって取得された時系列テキストデータに含まれる時系列順のテキスト情報に前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列が含まれているかを判定し、当該対象に関連する文字列が含まれている当該テキスト情報の数に応じて当該対象の当該時系列順の評価値を算出し、
前記第２の評価値算出手段は、前記第３のデータ収集手段によって収集されたテキスト情報に前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列が含まれているかを判定し、当該対象に関連する文字列が含まれている当該テキスト情報の数に応じて当該対象の評価値を算出する
請求項１記載の注目対象予測装置。
前記対象毎に前記第１の評価値算出手段によって算出された前記時系列順の評価値および前記対象毎に前記変化率算出手段によって算出された前記時系列順の変化率に基づいて、前記対象毎の注目度を算出するために用いられる時系列予測モデルを生成する時系列予測モデル生成手段を更に具備し、
前記注目度算出手段は、前記対象毎に前記第２の評価値算出手段によって算出された評価値および前記時系列予測モデル格納手段に格納された時系列予測モデルを用いて、前記対象毎の注目度を算出する
請求項１記載の注目対象予測装置。
前記注目度算出手段は、複数の予め定められたパラメータを用いて、当該パラメータ毎に前記対象毎の注目度を算出し、
前記提示手段は、利用者によって指定されたパラメータを用いて算出された前記対象毎の注目度を提示する
請求項１記載の注目対象予測装置。