JP2002351899A - データ分析装置及びデータ分析方法並びにプログラム - Google Patents

データ分析装置及びデータ分析方法並びにプログラム

Info

Publication number
JP2002351899A
JP2002351899A JP2001157198A JP2001157198A JP2002351899A JP 2002351899 A JP2002351899 A JP 2002351899A JP 2001157198 A JP2001157198 A JP 2001157198A JP 2001157198 A JP2001157198 A JP 2001157198A JP 2002351899 A JP2002351899 A JP 2002351899A
Authority
JP
Japan
Prior art keywords
time
documents
concept
document
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001157198A
Other languages
English (en)
Other versions
JP3813837B2 (ja
Inventor
Shigeaki Sakurai
茂明 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001157198A priority Critical patent/JP3813837B2/ja
Priority to US10/151,965 priority patent/US20020178155A1/en
Publication of JP2002351899A publication Critical patent/JP2002351899A/ja
Application granted granted Critical
Publication of JP3813837B2 publication Critical patent/JP3813837B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 時間情報を持つテキストの系列をもとに、意
思決定支援に適用できる概念時系列モデルを獲得するた
めのデータ分析装置を提供すること。 【解決手段】 格納部1と格納部2には、テキストと時
間情報と属性情報を含むドキュメントの集合と、キー概
念辞書をそれぞれ格納する。概念抽出部3は、属性情報
に基づいて、ドキュメントの集合から、互いに関連する
複数のドキュメントからなる部分集合を選択し、キー概
念辞書に基づいて、部分集合に属する複数のドキュメン
トの各々から、キー概念を抽出する。ドキュメント時間
抽出部4は、該部分集合に属する複数のドキュメントの
各々から、時間情報を抽出する。概念時系列データ生成
部5は、抽出されたキー概念と時間情報に基づいて、キ
ー概念を時系列的に並べた概念時系列データを生成す
る。概念時系列モデル学習部6は、概念時系列データを
モデル化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキストデータ及
び時間情報を含むドキュメントを分析するデータ分析装
置及びデータ分析方法に関する。
【0002】
【従来の技術】データの電子媒体上への格納が進むに連
れて、蓄積されている大量のデータの中から必要な情報
を効率よく抽出することが必要になってきている。
【0003】この問題に対して、特開2001−227
76(以下、文献1)に開示されたルール生成結果通知
システムでは、ある時点においてデータベースに格納さ
れているデータを入力として与えることにより、データ
に内在する規則性を発見する一方、別時点において同様
に規則性を発見し、それら規則性を比較することによっ
て、時間変化に伴う規則性の推移を示すことができるよ
うになっている。
【0004】一方、「対話タスクモデルのサンプル単語
時系列からの自己組織化」、電子情報通信学会J83−
D−II、 No.2、 p.827−839(200
0年)(以下、文献2)に開示された技術では、単語時
系列とその応答を示す単語からなるデータを多数集める
ことにより、単語時系列とその応答を示す単語との間の
関係をネットワーク構造にモデル化することができる。
また、当該モデルを利用することにより、新たに与えら
れた単語時系列に対応する応答を示す単語を予測するこ
とができる。
【0005】また、特開平11−123198(以下、
文献3)に開示されたデータ処理装置では、時系列デー
タを与えることにより、時系列データを意味のある単位
に分割し、意味的に類似した単位ごとにモデルを学習す
ることができる。また、当該モデルを利用することによ
り、新たに与えられた時系列データに対応する次の結果
を予測することができる。
【0006】
【発明が解決しようとする課題】文献1に開示された従
来技術では、変化した規則をユーザに提示するだけであ
り、時間変化に伴って発生する現象を予測することはで
きなかった。また、文献2に開示された従来技術では、
時系列データの一種である単語時系列を獲得する方法に
関しては示されておらず、問題に応じて単語時系列の生
成方法を設計する必要がある。また、文献3に開示され
た従来技術では、学習されるモデルがパターンに基づい
てなされているため、モデルの意味を直感的に理解する
ことができず、かつまた、時系列データに対する意味付
けが明示的になされていないため、予測結果に意味付け
を与えることができなかった。
【0007】本発明は、上記事情を考慮してなされたも
ので、蓄積されたテキストデータ及び時間情報を含むド
キュメントの集合から、規則性をモデル化するためのも
ととなる、単語(概念)時系列モデルを生成可能にする
データ分析装置及びデータ分析方法並びにプログラムを
提供することを目的とする。
【0008】また、本発明は、時間系列の中で与えられ
るテキストデータに対して、その一連のテキストデータ
に従って発生する結果を示す規則性をモデル化すること
を可能にするためのデータ分析装置及びデータ分析方法
並びにプログラムを提供することを目的とする。
【0009】また、本発明は、獲得されたモデルを利用
することにより、時間情報を含んだ新たなテキストデー
タに対して、その後に発生する結果を予測し、ユーザの
意思決定を支援することを可能にするためのデータ分析
装置及びデータ分析方法並びにプログラムを提供するこ
とを目的とする。
【0010】
【課題を解決するための手段】本発明に係るデータ分析
装置は、テキストデータ及び時間情報を含むドキュメン
トの集合を格納するためのドキュメント格納手段と、前
記ドキュメントのテキストデータが有する可能性のある
キー概念を含むキー概念辞書を格納するためのキー概念
辞書格納手段と、所定の基準に従って、前記ドキュメン
ト格納手段に蓄積された前記ドキュメントの集合から、
互いに関連する複数のドキュメントからなる部分集合を
選択するための選択手段と、前記キー概念辞書に基づい
て、選択された前記部分集合に属する複数のドキュメン
トの各々から、キー概念の集合を抽出するための第1の
抽出手段と、選択された前記部分集合に属する複数のド
キュメントの各々から、前記時間情報を抽出するための
第2の抽出手段と、前記部分集合に属する複数のドキュ
メントの各々から抽出された前記キー概念の集合及び該
複数のドキュメントの各々に含まれる前記時間情報に基
づいて、キー概念を時系列的に並べた概念時系列データ
を生成するための概念時系列データ生成手段とを備えた
ことを特徴とする。
【0011】好ましくは、複数の前記ドキュメントから
抽出された、複数の前記概念時系列データをもとにし
て、少なくともキー概念間の遷移関係を示すモデルを生
成するためのモデル生成手段を更に備えるようにしても
よい。
【0012】好ましくは、予測対象とする複数の前記ド
キュメントから生成した前記概念時系列データに前記モ
デルを適用して、該概念時系列データの持つ時間情報よ
り後に発生すると予測されるキー概念を抽出するための
予測手段を更に備えるようにしてもよい。
【0013】また、本発明に係るデータ分析方法は、テ
キストデータ及び時間情報を含むドキュメントの集合を
ドキュメント格納手段に格納し、所定の基準に従って、
前記ドキュメント格納手段に蓄積された前記ドキュメン
トの集合から、互いに関連する複数のドキュメントから
なる部分集合を選択し、選択された前記部分集合に属す
る複数のドキュメントの各々から、ドキュメントのテキ
ストデータが有する可能性のあるキー概念を含むキー概
念辞書に基づいて、キー概念の集合を抽出するととも
に、該ドキュメントに含まれる前記時間情報をそれぞれ
抽出し、前記部分集合に属する複数のドキュメントの各
々から抽出された前記キー概念の集合及び該複数のドキ
ュメントの各々に含まれる前記時間情報に基づいて、キ
ー概念を時系列的に並べた概念時系列データを生成する
ことを特徴とする。
【0014】なお、装置に係る本発明は方法に係る発明
としても成立し、方法に係る本発明は装置に係る発明と
しても成立する。また、装置または方法に係る本発明
は、コンピュータに当該発明に相当する手順を実行させ
るための(あるいはコンピュータを当該発明に相当する
手段として機能させるための、あるいはコンピュータに
当該発明に相当する機能を実現させるための)プログラ
ムとしても成立し、該プログラムを記録したコンピュー
タ読取り可能な記録媒体としても成立する。
【0015】本発明によれば、蓄積されたテキストデー
タ及び時間情報を含むドキュメントの集合から、規則性
をモデル化するためのもととなる、単語(概念)時系列
モデルを生成することが可能になる。
【0016】また、本発明によれば、時間的に推移する
一連のテキストデータの中から抽出されたキー概念の系
列から、キー概念間の関係を記述するモデルを獲得する
ことができる。
【0017】また、本発明によれば、時間的に推移する
一連のテキストデータの中から抽出されたキー概念の系
列と一連のテキストデータの最後に抽出されるキー概念
の系列を分類する分類クラスから、キー概念の系列とそ
の分類クラスの関係を記述するモデルを獲得することが
できる。
【0018】また、本発明によれば、獲得したモデルに
基づいて、一連の新たなテキストデータから、引き続い
て発生すると考えられるキー概念あるいは分類クラスを
予測することができ、ユーザの意思決定を支援すること
ができる。
【0019】例えば、営業日報等の日々蓄積されるテキ
ストデータに対して、時系列的な内容の推移に基づいて
将来を予測するモデルを抽出し、そのモデルを利用した
予測を行うことにより、利用者の意思決定を支援するこ
とができる。
【0020】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。
【0021】(第1の実施形態)図1に、本発明の第1
の実施形態に係る時系列テキストデータ分析装置の構成
例を示す。図1に示されるように、本時系列テキストデ
ータ分析装置は、ドキュメント格納部1、キー概念辞書
格納部2、概念抽出部3、ドキュメント時間抽出部4、
概念時系列データ生成部5、概念時系列モデル学習部
6、概念時系列モデル格納部7を備えている。
【0022】この時系列テキストデータ分析装置は、ソ
フトウェアによって実現することができる(すなわち計
算機上でプログラムを実行する形で実現することができ
る)。その際、そのソフトウェアの一部または全部の機
能をチップ化あるいはボード化して該計算機に組み込ん
で実現することもできる。また、この時系列テキストデ
ータ分析装置は、ソフトウェアによって実現する場合に
は、他のソフトウェアの一機能として組み込むようにす
ることも可能である。また、この時系列テキストデータ
分析装置を専用のハードウェアとして構成することも可
能である。
【0023】ドキュメント格納部1、キー概念辞書格納
部2、概念時系列モデル格納部7は、いずれも、例えば
ハードディスクや光ディスクや半導体メモリなどの記憶
装置によって構成される。なお、各記憶部は、別々の記
憶装置によって構成されていてもよいし、それらの全部
または一部が同一の記憶装置によって構成されていても
よい。
【0024】なお、図1では省略しているが、時系列テ
キストデータ分析装置は、外部とデータをやり取りする
ための入出力装置を備えている。もちろん、GUI(グ
ラフィカル・ユーザ・インタフェース)を備えてもよい
し、ネットワーク接続インタフェースを備えてもよい。
【0025】ドキュメント格納部1に格納されるドキュ
メントは、それぞれ、テキストデータと、時間情報と、
1又は複数の属性を含む。具体的には、小売業務におけ
る販売員の営業活動及び商品の売上動向を記載した時間
的に推移する一連のテキスト、ヘルプデスク業務におけ
る顧客からの様々な問い合わせと回答内容を記載した時
間的に推移する一連のテキストなど、種々の分野あるい
は目的に適用可能である。
【0026】以下、本時系列テキストデータ分析装置に
よる処理について説明する。
【0027】図2に、本時系列テキストデータ分析装置
の処理手順の一例を示す。
【0028】ここで、具体例として、ドキュメント格納
部1には、図3に示すドキュメントの集合が格納されて
いるものとする。なお、t1〜t21は、各ドキュメン
トの通し番号である。
【0029】まず、ステップS11においては、ドキュ
メント格納部1に格納されているドキュメントを概念抽
出部3に渡し、ドキュメントに付随する特徴に基づい
て、関連するドキュメントからなるドキュメント部分集
合を生成する。
【0030】例えば、ドキュメントの特徴として、「相
手先」、「担当」を選択した場合、「相手先」と「担
当」とからなる組が一致するドキュメントごとに関連す
るドキュメントの集合を収集する。この場合、図3のド
キュメントの集合から、図4〜図7に示す4種類のドキ
ュメントの部分集合が生成される。
【0031】なお、この関連するドキュメントを分類す
るキーは、例えば、外部から指定するようにしてもよ
い。また、クラスタリング手法を利用して、関連するド
キュメントを集めるようにすることも可能である。その
他にも、種々の方法が考えられる。
【0032】ステップS12においては、概念抽出部3
は、ステップS11で得られたドキュメントの部分集合
の各々ごとに、当該ドキュメントの部分集合に属する各
ドキュメントに付随する時間に関する情報(図3の例で
は、項目名「日時」の年月日のデータ)(例えば、当該
ドキュメントが作成された年月日(年月日時分)、ある
いは当該ドキュメントの本文に関係する年月日(年月日
時分))を参照することにより、時間の早い順にドキュ
メントの並べ替えを行う。なお、図4〜図7の例におい
ては、既にドキュメントは時間順に整列されているの
で、並べ替えによるドキュメントの格納位置の変更は発
生しない。
【0033】ステップS13においては、概念抽出部3
は、ドキュメントの部分集合を一つ取り出す。このと
き、取り出すドキュメントの部分集合が存在しなけれ
ば、ステップS19に処理を進める。一方、取り出すド
キュメントの集合が存在する場合には、ステップS14
に処理を進める。例えば、図4のドキュメント部分集合
が取り出されたとする。
【0034】ステップS14においては、概念抽出部3
は、取り出したドキュメントの部分事例集合の中から、
上から順に、ドキュメントを一つ取り出す(すなわち、
時間の早い順に取り出されることになる)。このとき、
取り出すドキュメントがない場合には、ステップS17
に処理を進める。一方、取り出すドキュメントがある場
合には、ステップS15に処理を進める。例えば、図4
のドキュメント部分集合から、その先頭のドキュメント
t1が取り出されたとする。
【0035】ステップS15においては、概念抽出部3
は、ステップS14にて取り出されたドキュメントに対
して、形態素解析を適用して、ドキュメントを形態素に
分割する。図8のl1に、この結果の一例を示す(な
お、l1〜l5は、各ドキュメントを形態素解析した結
果の通し番号である)。例えば、図4のドキュメントの
部分集合の先頭のドキュメントt1の項目「本文」の内
容(すなわち、“製品の売り込みに行ったところ手応え
があった。”)に対して、形態素解析を実施することに
より、図8のl1に示す形態素の集合(すなわち、「製
品」、「の」、「売り込み」、「に」、「行く」、「と
ころ」、「手応え」、「が」、「ある」、「。」)が得
られる。
【0036】ステップS16においては、概念抽出部3
は、キー概念辞書格納部2に格納されているキー概念辞
書とステップS15にて形態素解析された結果とを利用
して、当該ドキュメントに対応する特徴を抽出して、当
該ドキュメントに割り当てる。
【0037】例えば、キー概念辞書格納部2に、図9に
例示するキー概念辞書が格納されているものとして、図
8のl1に示す形態素の集合に基づいて特徴を求める場
合を考える。このとき、概念クラス「状況」、キー概念
「売り込み」、表層表現「売り込み」が、形態素の集合
の「売り込み」と一致するので、特徴「売り込み」が抽
出される。また、概念クラス「印象」、キー概念「良
好」、表層表現「手応えがある」が、形態素の集合の
「手応え」、「が」、「ある」と一致するので、特徴
「良好」が抽出される。図10に、この結果の一例を示
す(なお、c1〜c5は、ドキュメントに対して生成さ
れる特徴量の集合の通し番号である)。
【0038】以上は、繰り返し処理となり、図4の他の
ドキュメントについても同様に処理が行われる(図8の
l2〜l5、図10のc2〜c5がこれに対応する)。
【0039】さて、一つのドキュメント部分集合に属す
るすべてのドキュメントについて特徴の抽出が行われた
ならば、ステップS14からステップS17に移ること
になる。
【0040】ステップS17においては、概念時系列デ
ータ生成部5は、当該一つのドキュメント部分集合にお
ける時間的に最後のドキュメントを除いたドキュメント
の集合に対して生成された特徴の集合と、ドキュメント
に割り当てられている「時間」とを利用して、時系列デ
ータを生成する。なお、ドキュメントに割り当てられて
いる「時間」は、ドキュメント時間抽出部4により与え
られる。
【0041】なお、ここでは、一例として、1日を基準
として時系列データを生成するものとする。
【0042】例えば、図4のドキュメントの部分集合の
各ドキュメントに対して図10に例示する特徴量の集合
が生成されているとすると、最後の特徴量の集合(c
5)を除いた特徴量に対して、時系列データが生成され
る。すなわち、最初のドキュメントの時間を基準とし、
特徴量の与えられている日には、特徴量の集合を与え、
特徴量が与えられていない日には、特徴量が与えられて
いないことを示すデータ(例えば「しない」)を与える
ことにより、時系列データを生成する。
【0043】この場合、図4のドキュメントの部分集合
に対しては、図11(w1〜w4は、時系列データと分
類クラスを組とした訓練事例の通し番号である)に例示
する番号w1に対応する時系列データが生成される。こ
の時系列データにおいて、特徴量の後に書かれている数
値(例えば、(売り込み,良好)/1における1)が、
当該特徴量が連続する回数を表している。
【0044】ステップS18においては、概念時系列デ
ータ生成部5は、当該ドキュメントの部分集合における
時間的に最後のドキュメントを利用して、ステップS1
7にて生成された時系列データに対応する分類クラスを
生成する。なお、ドキュメントに割り当てられている
「時間」は、ドキュメント時間抽出部4により与えられ
る。
【0045】例えば、図4のドキュメントの部分集合か
ら生成された図10の特徴量の集合において、番号c5
の特徴量が最後の特徴量となるので、「受注成功」が分
類クラスとなる。この場合、図11に例示する番号w1
に対応する分類クラスが生成される。
【0046】なお、これまでと同様の手順が、図5〜図
7のドキュメントの部分集合に対しても実行され、ステ
ップS13で処理ループを抜けた時点で、図11の時系
列データと分類クラスの組が完成することになる(図1
1において番号w2〜w4の時系列データと分類クラス
の組がそれぞれ図5〜図7に対応する)。
【0047】ところで、上記の手順例では、時系列デー
タとその分類クラスを生成する際に、時間的に最後のド
キュメントから分類クラスを生成していたが、時間的に
一連のドキュメントに対して、ユーザが分類クラスを指
定するよう構成することも可能である。このような場合
には、最後のドキュメントに対しても時系列データが生
成されるようにして構わない。
【0048】さて、ステップS19においては、概念時
系列モデル学習部6は、図11に例示したような時系列
データと分類クラスの組をもとに、モデルの自己組織化
を行う。モデルの自己組織化が終了したら、当該モデル
を概念時系列モデル格納部7に格納して、本モデル化処
理を終了する。
【0049】モデルの自己組織化の手法としては、ここ
では、文献「対話タスクモデルのサンプル単語時系列か
らの自己組織化」、電子情報通信学会J83−D−I
I、No.2、 p.827−839(2000年)に
開示されている拡張画像オートマトンの自己組織化法を
利用することができる。この手法は、6つの基本ルール
と時系列データ間の関係に関する2種類の背景知識を利
用することにより、モデルを自己組織化するものであ
る。この手法を、時系列データとその分類クラスからな
るデータに適用することによって、ネットワーク構造を
持つモデルを自己組織化することができる。
【0050】例えば、図11の4種類の時系列データと
分類クラスの組が順に与えられるとすると、図12のモ
デルを得ることができる。ここで、Aa1〜Aa13
は、概念時系列モデル格納部7に格納されるモデルを構
成する通常アーク(意味的に類似した複数の単語を格納
するアーク)を示す番号であり、Ab1,Ab2は、概
念時系列モデル格納部7に格納されるモデルを構成する
ナル遷移アーク(単語を格納しないアーク)を示す番号
であり、Na1〜Na6は、概念時系列モデル格納部7
に格納されるモデルを構成する途中ノード(複数のアー
クの入力及び出力を可能としたノード)を示す番号であ
り、Nb1〜Nb3は、概念時系列モデル格納部7に格
納されるモデルを構成する終了ノード(複数のアークの
入力及び単語時系列に対応した応答の格納を可能とした
ノード)を示す番号である。
【0051】ここで、上記文献に開示された拡張画像オ
ートマトンの自己組織化法について簡単に説明する(詳
しくは上記の文献に開示されている)。
【0052】拡張画像オートマトンは、ネットワーク表
現をもった知識表現であり、有向アークとノードから構
成される。有向アークには、通常アーク及びナル遷移ア
ークと呼ばれる2種類の有向アークが存在し、通常アー
クが意味的に類似した複数の単語を格納するのに対し
て、ナル遷移アークは単語を格納しない。また、通常ア
ークを経由することにより、1単位時刻が経過するのに
対して、ナル遷移アークを経由したとしても、時刻は経
過しない。ここで、1単位時刻は、単語時系列における
1単語の入力に対応する。このナル遷移アークを利用す
ることにより、単語時系列に存在する複数種類の連続し
たノイズを表現することができる。
【0053】一方、ノードには、途中ノード及び終了ノ
ードと呼ばれる2種類のノードが存在する。途中ノード
は、複数のアークの入力及び出力を可能としたノードで
あり、終了ノードは、複数のアークの入力及び単語時系
列に対応した応答の格納を可能としたノードである。こ
のようなノードに対して、ノードとノードとの間に多数
のアークが存在すると、多数の単語の組合せを表現する
ことができる。ただし、同一方向をもった複数のアーク
がノード間に存在すると、どのアークを利用したかが不
明確になり、単語時系列の識別が困難になるため、単語
時系列に対して、適切な応答を推論することが難しくな
る。したがって、任意のノード間の同一方向に対して
は、各アークの種類ごとに、せいぜい一つのアークしか
設定しないものとしている。
【0054】ここで、本手法においては、6つの基本ル
ールと時系列データ間の関係に関する2種類の背景知識
を利用することにより、モデルを自己組織化する。
【0055】まず、6つの基本ルールについて簡単に説
明する。
【0056】(1)アーク利用ルール:現在の状態に対
応するノードを起点とする通常のアークに、入力された
単語と同一の単語が割り当てられ、単語のタイプとアー
クの終点となるノードのタイプが同一ならば、当該アー
クを利用して、終点となるノードに状態を遷移する。
【0057】(2)ナル遷移アーク利用ルール:現在の
状態に対応するノードを起点とするナル遷移アークの終
点となるノードを起点とする通常のアークに、入力され
た単語と同一の単語が割り当てられ、単語のタイプと到
達するノードのタイプが同一ならば、これらのアークを
利用して、通常のアークの終点となるノードに状態を遷
移する。
【0058】(3)自己ループ生成ルール:終端にない
連続する二つの単語が同一であり、現在の状態に対応す
るノードに自己ループを生成可能であれば、当該ノード
を起点かつ終点とする通常のアークを生成して、当該ア
ークに一つの単語を割り当てる。このとき、状態の遷移
は行われない。
【0059】(4)先読みアーク利用ルール:現在の単
語の次の単語と同一の単語が割り当てられたアークで、
当該アークの終点となるノードのタイプが次の単語のタ
イプと一致し、現在のノードから当該アークの起点とな
るノードに通常のアークが生成可能ならば、現在のノー
ドと当該アークの起点となるノードの間にアークを生成
し、生成したアークに現在の単語を割り当て、当該アー
クの終点となるノードに状態を遷移する。
【0060】(5)ナル遷移アーク生成ルール:現在の
単語と同一の単語が割り当てられたアークで、当該アー
クの終点となるノードのタイプが次の単語のタイプと一
致し、現在のノードから当該アークの起点となるノード
にナル遷移アークが生成可能ならば、現在のノードと当
該アークの起点となるノード間にナル遷移アークを生成
し、当該アークの終点となるノードに状態を遷移する。
【0061】(6)新規ノード生成ルール:新たにノー
ドを一つ生成し、現在のノードとそのノードの間に現在
の単語を割り当てた通常アークを生成し、生成したノー
ドに状態を遷移する。
【0062】次に、2種類の背景知識について簡単に説
明する。
【0063】(1)同一視可能知識:単語時系列の識別
能力を保持しつつ、コンパクトなネットワーク表現を獲
得するためには、同一のアークに割り当てられる単語を
制限する必要がある。そこで、同一のアークに割当て可
能な単語の組合せを同一視可能知識として記述する。こ
のような単語に隣接する単語集合は、類似したものにな
ると期待できるので、単語時系列の識別能力を保持しつ
つ、コンパクトなネットワーク表現を獲得することがで
きる。また、同一視可能な単語と隣接する単語とのすべ
ての組合せを入力しなくても、単語の組合せを表現する
ことができるので、少ない単語時系列とその応答からネ
ットワーク表現を自己組織化することができる。
【0064】(2)交換可能知識:単語の出現順序を入
れ替えた場合に、その応答が同じとなる単語時系列であ
ったとしても、基本ルールを適用するだけでは、すべて
の出現順序の組合せを入力しないと、対応するネットワ
ーク表現を自己組織化することができない。しかしなが
ら、同じ応答に対応する類似した単語時系列を、個々に
入力しなければならないとすれば、多くの単語時系列の
入力が必要となる。そこで、単語の出現順序を入れ替え
てもその応答が同じとなる単語を交換可能な単語として
記述し、交換可能な単語の組合せが単語時系列内に出現
した場合に、与えられている出現順序ばかりか、入れ替
えた出現順序をも表現するネットワーク表現を自己組織
化する。このとき、既存のネットワーク表現の中に交換
可能な単語を格納する通常アークが存在する場合には、
できるだけそのアークを利用するような自己組織化を行
う。
【0065】次に、自己組織化フローについて簡単に説
明する。
【0066】先の6つの基本ルールと2種類の背景知識
を利用することにより、単語時系列とその応答からネッ
トワーク表現を下記の手順にしたがって自己組織化す
る。 (ステップ1)単語時系列を入力する。 (ステップ2)単語時系列の中から次の単語を取り出
し、現在の単語とする。取り出せない場合には、現在の
ノードを終了ノードとして、単語時系列とその応答を割
当て、自己組織化を終了する。 (ステップ3)現在の単語が直前に適用した先読みアー
ク利用ルールにより、既に利用されている場合には、ス
テップ6に進む。また、直前に適用した自己ループ生成
ルールにより、既に利用されている場合には、ステップ
2に戻る。 (ステップ4)同一視可能知識を考慮して、基本ルール
を評価する。 (ステップ5)条件が成立した最も上位の基本ルールを
実行する。 (ステップ6)単語時系列における前出の単語を一つ取
り出す。 (ステップ7)取り出す単語がない場合には、ステップ
2に戻る。 (ステップ8)取り出した単語と現在の単語との間に交
換可能性が成立しない場合には、ステップ6に戻る。 (ステップ9)取り出した単語と現在の単語との間で、
交換可能知識による自己組織化を行い、ステップ6に戻
る。
【0067】この手順においては、基本ルールの判定に
同一視可能知識を適用し、単語が一致するかどうかの判
定の代わりに、単語が同一視可能かどうかの判定を行っ
ている。また、単語時系列の最初の単語に対しては、起
点となるノードを同時に決定する必要があるため、ナル
遷移に関連する基本ルールが成立する場合には、アーク
利用ルールが必ず成立する。したがって、最初の単語の
場合には、ナル遷移に関連する基本ルールを判定する必
要がない。最後に、交換可能知識に関しては、単語時系
列に現れるすべての単語の組合せに対して、検討する必
要があるので、現在の単語とそれ以前に出現しているす
べての単語との間に交換可能性が成立するかどうかを判
定し、交換可能性が成立する場合に、対応する自己組織
化を行っている。
【0068】以上が、拡張画像オートマトンの自己組織
化法についての簡単な説明である。
【0069】(第2の実施形態)図13に、本発明の第
2の実施形態に係る時系列テキストデータ分析装置の構
成例を示す。図13に示されるように、本時系列テキス
トデータ分析装置は、ドキュメント格納部1、キー概念
辞書格納部2、概念抽出部3、ドキュメント時間抽出部
4、概念時系列データ生成部5、概念時系列モデル学習
部6、概念時系列モデル格納部7、概念時系列予測部8
を備えている。
【0070】本時系列テキストデータ分析装置は、第1
の実施形態の構成に、新たなドキュメントの系列に対し
て次に発生する状況を予測する処理等を行うための概念
時系列予測部8を付加したものである。
【0071】本実施形態においては、モデルの自己組織
化を行う機能の部分は、第1の実施形態と同様であるの
で、以下では、第2の実施形態で付加した予測する処理
等の機能の部分について説明する。
【0072】図14に、本時系列テキストデータ分析装
置の処理手順の一例を示す。
【0073】ここで、第1の実施形態で説明したような
処理によって、図12に例示したモデルが得られ、概念
時系列モデル格納部7に格納されているものとする。
【0074】また、予測のもとになる新たなドキュメン
ト(評価対象のドキュメント)の系列として、図15に
例示する関連するドキュメントが、ドキュメント格納部
1に与えられているものとする。なお、e1,e2は、
評価対象のドキュメントの通し番号である。
【0075】まず、ステップS21においては、概念抽
出部3により、評価対象となる関連するドキュメントに
付随する時間に従って、ドキュメントを時間順に並べ
る。図15の例においては、既に時間順にドキュメント
が与えられているので、本ステップにおいては特に何も
行われない。
【0076】ステップS22においては、概念抽出部3
により、評価対象となる関連するドキュメントの中から
ドキュメントを一つ取り出す。このとき、取り出すドキ
ュメントがなければ、ステップS25に処理を進める。
また、取り出すドキュメントがあれば、ステップS23
に処理を進める。
【0077】ステップS23においては、概念抽出部3
により、図2の処理手順のステップS15と同様の処理
を行い、ドキュメントに対応する形態素の集合を生成す
る。
【0078】ステップS24においては、概念抽出部3
により、図2の処理手順のステップS16と同様の処理
を行い、ドキュメントに対応する特徴を抽出し、ステッ
プS22に処理を戻す。
【0079】ステップS25においては、概念時系列デ
ータ生成部5(とドキュメント時間抽出部4)により、
図2の処理手順のステップS17と同様の処理を行い、
ドキュメントに対応する特徴と時間から時系列データを
生成する。ただし、図2のステップS17においては、
時間的に最後のドキュメントを処理対象としなかった
が、このステップS25においては、最後のドキュメン
トも処理対象とする。従って、ここでは、図15の関連
するドキュメントに対して、図16に示す時系列データ
が生成される。なお、x1は、評価対象のドキュメント
から生成される時系列データの通し番号である。
【0080】さて、ステップS26においては、概念時
系列予測部8は、概念時系列モデル格納部7に格納され
ている自己組織化されたモデル(図12参照)と、ステ
ップS25で得られた時系列データ(図16参照)をも
とにして、推論を行う。
【0081】推論の手法としては、文献「対話タスクモ
デルのサンプル単語時系列からの自己組織化」、電子情
報通信学会J83−D−II、 No.2、 p.82
7−839(2000年)に開示されている拡張画像オ
ートマトンの推論法に従った推論を利用することができ
る。この手法では、各時系列データを一つずつモデルに
適用することにより、各ノードが保持する時系列データ
及び時系列データに対応する評価値を更新する。
【0082】例えば、図16の時系列データを図12の
モデルに順次適用していくと、すべての時系列データを
適用した段階で、ノードNa6にこの時系列データが伝
播し、その評価値が1.0(最大値)となる。
【0083】ステップS27においては、概念時系列予
測部8は、時系列データが何もないという特別なデータ
をモデルに適用することにより、拡張画像オートマトン
の推論法に従って、モデル内の時間を進める。また、末
端ノードにおいて、到達した時系列データ及び評価値を
評価し、評価値が高い場合に、当該末端ノードに対応す
る応答を出力する。また、概念時系列予測部8は、応答
が出力される様子を観測することにより、発生しやすい
状況を予測する。例えば、図16の時系列データをすべ
て図12に適用し、時間を進めると、本時系列データ
は、すべての末端ノードNb1〜Nb3に到達する。こ
のとき、末端ノードNb2には、末端ノードNb1,N
b3よりも速い時間で、時系列データが到達する。従っ
て、現状では、「受注失敗」に到達する可能性の方が高
いことがわかる。この結果、それらの予測結果をユーザ
に呈示することができる。
【0084】なお、上記の予測において、現在の時系列
データから生じる可能性を示すだけでなく、望ましい方
向あるいは目標とする方向に進むための方法をユーザに
提示することも可能である。すなわち、ステップS27
において、到達した末端ノードのうち、望ましい応答を
与える末端ノードから、隣接するアーク及びノードを辿
り、時間を遡っていくことにより、当該方向に進むため
の方法あるいは条件をユーザに提示することができる。
【0085】なお、以上の各機能は、ソフトウェアとし
て実現可能である。また、本実施形態は、コンピュータ
に所定の手段を実行させるための(あるいはコンピュー
タを所定の手段として機能させるための、あるいはコン
ピュータに所定の機能を実現させるための)プログラム
として実施することもでき、該プログラムを記録したコ
ンピュータ読取り可能な記録媒体として実施することも
できる。
【0086】なお、この発明の実施の形態で例示した構
成は一例であって、それ以外の構成を排除する趣旨のも
のではなく、例示した構成の一部を他のもので置き換え
たり、例示した構成の一部を省いたり、例示した構成に
別の機能あるいは要素を付加したり、それらを組み合わ
せたりすることなどによって得られる別の構成も可能で
ある。また、例示した構成と論理的に等価な別の構成、
例示した構成と論理的に等価な部分を含む別の構成、例
示した構成の要部と論理的に等価な別の構成なども可能
である。また、例示した構成と同一もしくは類似の目的
を達成する別の構成、例示した構成と同一もしくは類似
の効果を奏する別の構成なども可能である。また、この
発明の実施の形態で例示した各種構成部分についての各
種バリエーションは、適宜組み合わせて実施することが
可能である。また、この発明の実施の形態は、装置全体
としての発明、装置内部の構成部分についての発明、ま
たはそれらに対応する方法の発明等、種々の観点、段
階、概念またはカテゴリに係る発明を包含・内在するも
のである。従って、この発明の実施の形態に開示した内
容からは、例示した構成に限定されることなく発明を抽
出することができるものである。
【0087】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。
【0088】
【発明の効果】本発明によれば、蓄積されたテキストデ
ータ及び時間情報を含むドキュメントの集合から、規則
性をモデル化するためのもととなる、単語(概念)時系
列モデルを生成することが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る時系列テキストデー
タ分析装置の構成例を示す図
【図2】同実施形態に係る時系列テキストデータ分析装
置の処理手順の一例を示すフローチャート
【図3】ドキュメント格納部に格納されているドキュメ
ントの一例を示す図
【図4】ドキュメント格納部に格納されているドキュメ
ント集合から抽出されたC1社かつM1氏に関連するド
キュメント部分集合の一例を示す図
【図5】ドキュメント格納部に格納されているドキュメ
ント集合から抽出されたC2社かつM2氏に関連するド
キュメント部分集合の一例を示す図
【図6】ドキュメント格納部に格納されているドキュメ
ント集合から抽出されたC3社かつM1氏に関連するド
キュメント部分集合の一例を示す図
【図7】ドキュメント格納部に格納されているドキュメ
ント集合から抽出されたC4社かつM2氏に関連するド
キュメント部分集合の一例を示す図
【図8】図4のドキュメント部分集合に含まれる各ドキ
ュメントの本文を形態素解析した結果の一例を示す図
【図9】キー概念辞書格納部に格納されるキー概念辞書
の一例を示す図
【図10】図8の形態素解析結果を図9のキー概念定義
辞書に適用することにより生成される特徴量の集合の一
例を示す図
【図11】ドキュメント格納部に格納されるドキュメン
トに対して生成される時系列データと分類クラスの組の
一例を示す図
【図12】自己組織化されたモデルの一例を示す図
【図13】同実施形態に係る時系列テキストデータ分析
装置の他の構成例を示す図
【図14】同実施形態に係る時系列テキストデータ分析
装置の自己組織化されたモデルに基づいて一連の新たな
ドキュメントから生じる結果を予測する処理手順の一例
を示すフローチャート
【図15】評価対象となる関連するドキュメントの一例
を示す図
【図16】図15の関連するドキュメントから生成され
る時系列データの一例を示す図
【符号の説明】
1…ドキュメント格納部 2…キー概念辞書格納部 3…概念抽出部 4…ドキュメント時間抽出部 5…概念時系列データ生成部 6…概念時系列モデル学習部 7…概念時系列モデル格納部 8…概念時系列予測部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】テキストデータ及び時間情報を含むドキュ
    メントの集合を格納するためのドキュメント格納手段
    と、 前記ドキュメントのテキストデータが有する可能性のあ
    るキー概念を含むキー概念辞書を格納するためのキー概
    念辞書格納手段と、 所定の基準に従って、前記ドキュメント格納手段に蓄積
    された前記ドキュメントの集合から、互いに関連する複
    数のドキュメントからなる部分集合を選択するための選
    択手段と、 前記キー概念辞書に基づいて、選択された前記部分集合
    に属する複数のドキュメントの各々から、キー概念の集
    合を抽出するための第1の抽出手段と、 選択された前記部分集合に属する複数のドキュメントの
    各々から、前記時間情報を抽出するための第2の抽出手
    段と、 前記部分集合に属する複数のドキュメントの各々から抽
    出された前記キー概念の集合及び該複数のドキュメント
    の各々に含まれる前記時間情報に基づいて、キー概念を
    時系列的に並べた概念時系列データを生成するための概
    念時系列データ生成手段とを備えたことを特徴とするデ
    ータ分析装置。
  2. 【請求項2】前記キー概念辞書は、表層表現とキー概念
    との対応を示す情報を含み、 前記第1の抽出手段は、前記ドキュメントの形態素解析
    結果と、前記キー概念辞書の表層表現を比較して、該表
    層表現に対応する前記キー概念を抽出することを特徴と
    する請求項1に記載のデータ分析装置。
  3. 【請求項3】前記ドキュメントは、時間情報以外の1又
    は複数の属性情報を含み、 前記選択手段は、外部から指定された1又は複数の前記
    属性情報に基づいて、前記ドキュメント格納手段に蓄積
    された前記ドキュメントの集合から、互いに関連する複
    数のドキュメントからなる部分集合を選択することを特
    徴とする請求項1に記載のデータ分析装置。
  4. 【請求項4】前記ドキュメントは、時間情報以外の1又
    は複数の属性情報を含み、 前記選択手段は、前記属性情報の全部又は一部にクラス
    タリングを適用した結果に基づいて、前記ドキュメント
    格納手段に蓄積された前記ドキュメントの集合から、互
    いに関連する複数のドキュメントからなる部分集合を選
    択することを特徴とする請求項1に記載のデータ分析装
    置。
  5. 【請求項5】前記概念時系列データは、そのもととなっ
    た前記部分集合において時間的に最も遅い時間情報を持
    つ前記ドキュメントから抽出された前記キー概念を、該
    概念時系列データに対応する分類クラスとして保持する
    ものであることを特徴とする請求項1に記載のデータ分
    析装置。
  6. 【請求項6】前記時間情報は、前記ドキュメントが作成
    された日付又は日付及び時刻を示すものであることを特
    徴とする請求項1ないし5のいずれか1項に記載のデー
    タ分析装置。
  7. 【請求項7】前記時間情報は、前記ドキュメントに含ま
    れる前記テキストデータの内容に関係する日付又は日付
    及び時刻を示すものであることを特徴とする請求項1な
    いし5のいずれか1項に記載のデータ分析装置。
  8. 【請求項8】複数の前記ドキュメントから抽出された、
    複数の前記概念時系列データをもとにして、少なくとも
    キー概念間の遷移関係を示すモデルを生成するためのモ
    デル生成手段を更に備えたことを特徴とする請求項1な
    いし7のいずれか1項に記載のデータ分析装置。
  9. 【請求項9】予測対象とする複数の前記ドキュメントか
    ら生成した前記概念時系列データに前記モデルを適用し
    て、該概念時系列データの持つ時間情報より後に発生す
    ると予測されるキー概念を抽出するための予測手段を更
    に備えたことを特徴とする請求項8に記載のデータ分析
    装置。
  10. 【請求項10】前記予測手段は、前記発生すると予測さ
    れるキー概念が複数存在し、そのうちに目標とするキー
    概念と、それ以外のキー概念とが存在する場合に、目標
    とするキー概念に到達するための条件を抽出することを
    特徴とする請求項9に記載のデータ分析装置。
  11. 【請求項11】テキストデータ及び時間情報を含むドキ
    ュメントの集合をドキュメント格納手段に格納し、 所定の基準に従って、前記ドキュメント格納手段に蓄積
    された前記ドキュメントの集合から、互いに関連する複
    数のドキュメントからなる部分集合を選択し、 選択された前記部分集合に属する複数のドキュメントの
    各々から、ドキュメントのテキストデータが有する可能
    性のあるキー概念を含むキー概念辞書に基づいて、キー
    概念の集合を抽出するとともに、該ドキュメントに含ま
    れる前記時間情報をそれぞれ抽出し、 前記部分集合に属する複数のドキュメントの各々から抽
    出された前記キー概念の集合及び該複数のドキュメント
    の各々に含まれる前記時間情報に基づいて、キー概念を
    時系列的に並べた概念時系列データを生成することを特
    徴とするデータ分析方法。
  12. 【請求項12】テキストデータ及び時間情報を含むドキ
    ュメントの集合を格納するためのドキュメント格納機能
    と、 前記ドキュメントのテキストデータが有する可能性のあ
    るキー概念を含むキー概念辞書を格納するためのキー概
    念辞書格納機能と、 所定の基準に従って、前記ドキュメント格納機能に蓄積
    された前記ドキュメントの集合から、互いに関連する複
    数のドキュメントからなる部分集合を選択するための選
    択機能と、 前記キー概念辞書に基づいて、選択された前記部分集合
    に属する複数のドキュメントの各々から、キー概念の集
    合を抽出するための第1の抽出機能と、 選択された前記部分集合に属する複数のドキュメントの
    各々から、前記時間情報を抽出するための第2の抽出機
    能と、 前記部分集合に属する複数のドキュメントの各々から抽
    出された前記キー概念の集合及び該複数のドキュメント
    の各々に含まれる前記時間情報に基づいて、キー概念を
    時系列的に並べた概念時系列データを生成するための概
    念時系列データ生成機能とをコンピュータに実現させる
    ためのプログラム。
JP2001157198A 2001-05-25 2001-05-25 データ分析装置及びデータ分析方法並びにプログラム Expired - Fee Related JP3813837B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001157198A JP3813837B2 (ja) 2001-05-25 2001-05-25 データ分析装置及びデータ分析方法並びにプログラム
US10/151,965 US20020178155A1 (en) 2001-05-25 2002-05-22 Data analyzer apparatus and data analytical method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001157198A JP3813837B2 (ja) 2001-05-25 2001-05-25 データ分析装置及びデータ分析方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2002351899A true JP2002351899A (ja) 2002-12-06
JP3813837B2 JP3813837B2 (ja) 2006-08-23

Family

ID=19001093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001157198A Expired - Fee Related JP3813837B2 (ja) 2001-05-25 2001-05-25 データ分析装置及びデータ分析方法並びにプログラム

Country Status (2)

Country Link
US (1) US20020178155A1 (ja)
JP (1) JP3813837B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7200584B2 (en) * 2003-03-20 2007-04-03 Kabushiki Kaisha Toshiba Time series pattern extraction apparatus and method
JP2008243126A (ja) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd 入力情報分析装置
WO2010097945A1 (ja) * 2009-02-27 2010-09-02 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8874561B2 (en) * 2003-03-31 2014-10-28 Sap Se Time series data management
JP4398777B2 (ja) * 2004-04-28 2010-01-13 株式会社東芝 時系列データ分析装置および方法
US7630987B1 (en) * 2004-11-24 2009-12-08 Bank Of America Corporation System and method for detecting phishers by analyzing website referrals
JP2007041683A (ja) * 2005-08-01 2007-02-15 Toshiba Corp 系列パターン抽出装置、系列パターン抽出方法、および系列パターン抽出プログラム
JP2007157058A (ja) * 2005-12-08 2007-06-21 Toshiba Corp 分類モデル学習装置、分類モデル学習方法、及び分類モデルを学習するためのプログラム
WO2008055034A2 (en) * 2006-10-30 2008-05-08 Noblis, Inc. Method and system for personal information extraction and modeling with fully generalized extraction contexts
US8793264B2 (en) * 2007-07-18 2014-07-29 Hewlett-Packard Development Company, L. P. Determining a subset of documents from which a particular document was derived
JP5048852B2 (ja) * 2011-02-25 2012-10-17 楽天株式会社 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
CN103582881B (zh) * 2012-05-31 2017-05-03 株式会社东芝 见解抽出装置、见解更新装置及程序
US9400999B2 (en) 2013-03-15 2016-07-26 Proofpoint, Inc. Detecting, classifying, and enforcing policies on social networking activity
US10169353B1 (en) * 2014-10-30 2019-01-01 United Services Automobile Association (Usaa) Grouping documents based on document concepts
JP7343311B2 (ja) * 2019-06-11 2023-09-12 ファナック株式会社 文書検索装置及び文書検索方法
US11551024B1 (en) * 2019-11-22 2023-01-10 Mastercard International Incorporated Hybrid clustered prediction computer modeling

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7200584B2 (en) * 2003-03-20 2007-04-03 Kabushiki Kaisha Toshiba Time series pattern extraction apparatus and method
JP2008243126A (ja) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd 入力情報分析装置
WO2010097945A1 (ja) * 2009-02-27 2010-09-02 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム
CN102317940A (zh) * 2009-02-27 2012-01-11 三菱电机株式会社 信息处理装置、信息处理方法以及程序
JP5318190B2 (ja) * 2009-02-27 2013-10-16 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP3813837B2 (ja) 2006-08-23
US20020178155A1 (en) 2002-11-28

Similar Documents

Publication Publication Date Title
JP3813837B2 (ja) データ分析装置及びデータ分析方法並びにプログラム
CN113935434A (zh) 一种数据分析处理***及自动建模方法
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
US20030200191A1 (en) Viewing multi-dimensional data through hierarchical visualization
JPH0877010A (ja) データ分析方法および装置
JP2012014291A (ja) 業務プロセス解析方法、システム及びプログラム
CN108229527A (zh) 训练及视频分析方法和装置、电子设备、存储介质、程序
JP2012053716A (ja) 思考モデルの作成方法、思考モデルの作成装置及び思考モデルの作成プログラム
KR101625124B1 (ko) 특허 정량분석을 이용한 기술평가 방법
Tomiyama A classification of design theories and methodologies
Dakiche et al. Tailored network splitting for community evolution prediction in dynamic social networks
JP2003099442A (ja) キー概念抽出規則作成方法、キー概念抽出方法、キー概念抽出規則作成装置、キー概念抽出装置、そのためのプログラム及び記録媒体
Nikiforova et al. Mapping of Source and Target Data for Application to Machine Learning Driven Discovery of IS Usability Problems.
Chen et al. A new efficient approach for data clustering in electronic library using ant colony clustering algorithm
KR102466559B1 (ko) 동적 텍스트 소스를 활용한 ai 기반 의사결정지원 시스템
CN114298023A (zh) 一种基于任务主题词驱动的用户决策需求生成方法及应用
JP6296610B2 (ja) 予測モデル構築装置及び予測装置
Azzopardi et al. Advances in Information Retrieval
JP2005149489A (ja) プログラム及び営業活動支援システム並びに方法
Johansson et al. Customer segmentation using machine learning
Kaur et al. A novel approach for providing the customer churn prediction model using enhanced boosted trees technique in cloud computing
Rath et al. Role of artificial intelligence and machine learning in product design and manufacturing
Srinivas et al. Strategic decision-making processes: network-based representation and stochastic simulation
Farjoo et al. Design of a recommender system for online shopping using decision tree and Apriori algorithm
Shidaganti et al. A Comprehensive Framework for Big Data Analytics in Education

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060314

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060601

LAPS Cancellation because of no payment of annual fees