WO2004053735A1

WO2004053735A1 - 情報処理装置および情報処理方法、並びに情報処理プログラム

Info

Publication number: WO2004053735A1
Application number: PCT/JP2003/015865
Authority: WO
Inventors: Masaharu Suzuki; Sadanobu Takane
Original assignee: Honda Motor Co., Ltd.
Priority date: 2002-12-12
Filing date: 2003-12-11
Publication date: 2004-06-24
Also published as: US20050060141A1; US7398202B2; JP2004192398A; EP1574968A1; JP3600611B2; EP1574968A4; CN1723457A; BR0317260A

Abstract

　テキストデータの特徴を検出し、テキストデータに隠れている潜在的な意味を類推することができるようにする。　入力部１から入力されたテキストデータに対して、ワードカッティング部３がワードカッティング処理し、構文解析部４が構文解析し、その結果からシソーラス作成部５がシソーラスを作成し、再ワードカッティング・構文解析後、シソーラス仕分け部７が仕分けし、出現頻度算出部がシソーラスの出現頻度を算出し、相関係数算出部１１がシソーラス間の相関係数を算出し、シソーラス毎の相関係数合計算出部１３がシソーラス毎の相関係数の合計を算出し、グラフ作成表示部１５が出現頻度とシソーラス毎の相関係数の合計に基づいてグラフを作成する。

Description

明細書情報処理装置および情報処理方法、並びに情報処理プログラム技術分野

本発明は、情報処理装置および情報処理方法、並びに情報処理プログラムに関し、特に、テキストデ一夕を元にシソーラスを作成し、シソ一ラス間の相関を求める情報処理装置および情報処理方法、並びに情報処理プログラムに関する。背景技術

各単語の出現回数の集計結果を参照して、切り出した単語から出現頻度が規定値以上の単語を抽出し、その抽出した各単語間の関連性を評価して、関連度が規定値以上の共起単語のクラス夕を生成する。このとき、予め、分析対象のテキストに合わせてカテゴリ辞書を作成すれば、そのテキストの分析結果を提示することができるというものがある（例えば、特開 2 0 0 1— 1 0 1 1 9 4号公報（図 1 ) 参照）。

しかしながら、テキストデ一夕から抽出したキーワード同士の相関に基づいて、テキストデ一夕の特徴を検出することができないという問題があった。

本発明はこのような状況に鑑みてなされたものであり、テキストデ一夕から抽出したキ一ワード同士の相関に基づいて、テキストデ一夕の特徴を検出することができるようにするものである。発明の開示

請求の範囲第 1項に記載の情報処理装置は、テキストデータを入力する入力手段と、テキストデ一夕を記憶するテキストデータ記憶手段と、テキストデータに対してヮ一ドカツティング処理を実行するヮ一ドカヅティング手段と、ヮ一ドカツティング処理が行われたテキストデ一夕に対して構文解析処理を行う構文解析手段と、構文解析処理が行われたテキストデ一夕からシソ一ラスを作成するシソ一ラス作成手段と、シソ一ラス作成手段によって作成されたシソ一ラスを記憶するシソーラス記憶手段と、ヮードカツティングおよび構文解析が行われたテキストデータに対して仕分け処理を行うシソーラス仕分け手段と、シソーラス仕分け手段による仕分け結果を記憶する仕分け結果記憶手段と、仕分け結果記憶手段によって記憶されている仕分け結果に基づいて、各シソーラス毎に出現頻度を算出する出現頻度算出手段と、出現頻度算出手段によって算出された結果を記憶する出現頻度記憶手段と、シソーラス間の相関係数を算出する相関係数算出手段と、相関係数算出手段によって算出されたシソ一ラス間の相関係数を記憶する相関係数記憶手段と、シソーラス毎の相関係数の合計を算出するシソーラス毎の相関係数合計算出手段と、シソーラス毎の相関係数合計算出手段によって算出されたシソーラス毎の相関係数の合計を記憶するシソーラス毎の相関係数合計記憶手段と、出現頻度記憶手段によって記憶されている出現頻度と、シソーラス毎の相関係数合計記憶手段によって記憶されているシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するグラフ作成表示手段とを備え、ワードカッティング手段および構文解析手段は、シソーラス作成手段によって作成されたシソーラスに基づいて再度ヮ一ドカツティング処理および構文解析処理を行うことを特徴とする。

請求の範囲第 2項に記載の情報処理方法は、テキストデータを入力する入力ステップと、テキストデータを記憶するテキストデ一夕記憶ステヅプと、テキストデータに対してヮードカヅティング処理を実行するヮードカツティングステツプと、ヮ一ドカツティング処理が行われたテキストデータに対して構文解析処理を行う構文解析ステップと、構文解析処理が行われたテキストデ一夕からシソーラスを作成するシソーラス作成ステヅプと、シソーラス作成ステツプにおいて作成されたシソーラスを記憶するシソーラス記憶ステップと、シソーラス記憶ステップにおいて記憶されたシソーラスに基づいて、再度ヮ一ドカツティング処理および構文解析処理を行うワードカッテイングぉよび構文解析ステップと、ヮ一ドカツティングおよび構文解析が行われたテキストデ一夕に対して仕分け処理を行うシソーラス仕分けステツプと、シソーラス仕分けステップにおける仕分け結果を記憶する仕分け結果記憶ステップと、仕分け結果記憶ステツプにおいて記憶された仕分け結果に基づいて、各シソ一ラス毎に出現頻度を算出する出現頻度算出ステップと、出現頻度算出ステツプにおいて算出された結果を記憶する出現頻度記憶ステツプと、シソーラス間の相関係数を算出する相関係数算出ステップと、相関係数算出ステツプにおいて算出されたシソーラス間の相関係数を記憶する相関係数記憶ステツプと、シソーラス毎の相関係数の合計を算出するシソーラス毎の相関係数合計算出ステップと、シソ一ラス毎の相関係数合計算出ステップにおいて算出されたシソーラス毎の相関係数の合計を記憶するシソ一ラス毎の相関係数合計記憶ステツプと、出現頻度記憶ステツプにおいて記憶された出現頻度と、シソーラス毎の相関係数合計記憶ステップにおいて記憶されたシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するグラフ作成表示ステップとを備えることを特徴とする。

請求の範囲第 3項に記載の情報処理プログラムは、テキストデ一夕を入力する入力ステップと、テキストデータを記憶するテキストデ一夕記憶ステップと、テキストデ一夕に対してワードカツティング処理を実行するヮ一ドカヅティングステヅプと、ヮードカッティング処理が行われたテキストデ一夕に対して構文解析処理を行う構文解析ステップと、構文解析処理が行われたテキストデータからシソーラスを作成するシソーラス作成ステツプと、シソーラス作成ステツプにおいて作成されたシソ一ラスを記憶するシソーラス記憶ステップと、シソーラス記憶ステップにおいて記憶されたシソーラスに基づいて、再度ヮードカツティング処理および構文解析処理を行うワードカッティングおよび構文解析ステップと、ワードカツティングおよび構文解析が行われたテキストデ一夕に対して仕分け処理を行うシソーラス仕分けステツプと、シソーラス仕分けステップにおける仕分け結果を記憶する仕分け結果記憶ステップと、仕分け結果記憶ステップにおいて記憶された仕分け結果に基づいて、各シソーラス毎に出現頻度を算出する出現頻度算出ステップと、出現頻度算出ステップにおいて算出された結果を記憶する出現頻度記憶ステップと、シソーラス間の相関係数を算出する相関係数算出ステップと、相関係数算出ステップにおいて算出されたシソーラス間の相関係数を記憶する相関係数記憶ステップと、シソーラス毎の相関係数の合計を算出するシソーラス毎の相関係数合計算出ステップと、シソーラス毎の相関係数合計算出ステツプにおいて算出されたシソーラス毎の相関係数の合計を記憶するシソーラス毎の相関係数合計記憶ステップと、出現頻度記憶ステツプにおいて記憶された出現頻度と、シソーラス毎の相関係数合計記憶ステップにおいて記憶されたシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するグラフ作成表示ステヅプとをコンビユー夕に実行させることを特徴とする。図面の簡単な説明

第 1図は本発明の情報処理装置の一実施の形態の機能プロック図である。第 2図は本実施の形態の処理手順を説明するためのフローチヤ一トである。

第 3図は類義語を集約したシソーラスの例を示す図である。

第 4図はシソーラス毎の仕分け結果を示す図である。

第 5図はシソーラス毎の相関係数を示す図である。

第 6図は各シソーラス毎の出現頻度を示す図である。

第 7図は各シソーラスの出現頻度と相関係数との関係を示すグラフである。発明を実施するための最良の形態

第 1図は、本発明の情報処理装置の一実施の形態の機能プロック図である。本実施の形態は、パーソナルコンピュータ等で構成されている。同図に示すように、本実施の形態は、機能的に次のようなブロックで構成される。各ブロックの処理は、実際には所定のアプリケーションプログラムによって実行され、各記憶部は、図示せぬハードディスクによつて実現される。

各ブロックの機能を簡単に説明する。入力部 1は、テキストデータを入力し、テキスト記憶部 2に記憶させるようになつている。ワードカヅティング部 3は、テキスト記憶部 2に記憶されているテキストデ一夕に対して、ワードカヅティング処理を実行するようになっている。構文解析部 4は、ヮ一ドカヅティング処理されたテキストデ一夕に対して構文解析を行うようになつている。

シソーラス作成部 5は、テキスト記憶部 2に記憶されているテキストデータからシソーラスを作成するようになっている。シソーラス記憶部 6は、作成されたシソーラスを記憶するようになっている。シソーラス仕分け部 7は、全サンプルについて、シソーラス毎に仕分け処理を行うようになつている。仕分け結果記憶部 8は、仕分け結果を記憶するようになっている。出現頻度算出部 9は、仕分け結果記憶部 8に記憶されているデータに基づいて、各シソーラス毎に出現頻度を算出するようになつている。出現頻度記憶部 1 0は、出現頻度算出部 9によって算出された結果を記憶するようになっている。

相関係数算出部 1 1は、シソーラス間の相関係数を算出するようになつている。相関係数記憶部 1 2は、相関係数算出部 1 1において算出された相関係数を記憶するようになっている。シソーラス毎の相関係数合計算出部 1 3は、求めた相関係数をシソーラス毎に合計するようになつている。シソーラス毎の相関係数合計記憶部 1 4は、シソーラス毎の相関係数合計算出部 1 3において算出されたシソーラス毎の相関係数の合計を記憶するようになっている。グラフ作成表示部 1 5は、出現頻度記憶部 1 0に記憶されている出現頻度と、シソーラス毎の相関係数合計記憶部 1 4に記憶されているシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するようになっている。

次に、第 2図のフローチャートを参照して、本実施の形態の処理手順について説明する。ここでは、顧客から寄せられる苦情や要望等のテキストデ一夕を分析する場合について説明する。まず最初に、ステップ S 1において、入力部 1より顧客毎にテキストデータが入力される。例えば、ある顧客から「先週、部品を注文したのだが、まだ納入されない。」が入力されたものとする。入力されたテキストデ一夕は、テキスト記憶部 2に記憶される。

次に、ステップ S 2において、ワードカッティング部 3により、所定のテキストマイニングヅ一ル (アプリケーションソフトウエア）によるワードカッティング処理が行われる。例えば、上記テキストは、「先週、部品 ¾. 注—文したのだが、まだ納入されない。」となる。

次に、ステップ S 3において、構文解析部 4により、テキストマイニングヅ一ルによる構文解析処理が行われる。例えば、上記テキストは、「先週、部品を注文したのだが、まだ納入されない。」となる。次に、ステップ S 4において、シソーラス作成部 5により、類義語（キ —ワード）を集約したシソーラスの作成が行われる。例えば、第 3図に示すように、「先週」というシソーラスに、「一週間」等の類義語のキーワードを集約する。また、「注文する」というシソーラスに、「オーダーしたが」等のキ一ワードを集約する。また、「納入する」というシソ一ラスに、「搬入する」等のキーワードを集約する。また、「部品」というシソ一ラスに、「パ一ヅ」等のキーワードを集約する。また、「連絡が」というシソーラスに、「情報を」等のキーワードを集約する。作成されたシソーラスは、シソーラス記憶部 6に記憶される。

次に、ステップ S 5において、いま作成され、シソーラス記憶部 6に記憶されたシソーラスに基づいて、ワードカッティング部 3により、再度、ワードカッティング処理が行われ、構文解析部 4により、再度、構文解析処理が行われる。

次に、ステップ S 6において、シソーラス仕分け部 7により、全顧客からのテキストデータに対して、その内容について、各シソーラス毎に仕分けが行われる。例えば、各顧客毎に、その顧客の苦情等のテキストデータに含まれるシソーラスには「 1」を、含まれないシソーラスには「0」をセットする。仕分け結果は仕分け結果記憶部 8に記憶される。第 4図は、仕分け結果記憶部 8に記憶されている仕分け結果を示している。図中、「K— 1」、「Κ— 2」、「Κ— 3」、 · · ·「Κ一 η」は、顧客を識別する識別番号を示している。この例では、例えば、顧客 Κ一 1により、「注文する」、「部品」というシソーラスに含まれるキーワードを含むテキストデータが入力されたことがわかる。

次に、ステップ S 7において、相関係数算出部 1 1により、シソ一ラス間の相関係数が求められる。例えば、「注文する」と、「納入する」の相関係数は、次式で表される。

ネ曰¾係 r注文— *内入 = ( o注文一糸内入) Z 、注文 ' S糸内入) ただし、 S注文—納入は、共分散、 S注文、 S納入は、それそれ標準偏差である。

共分散 s注文—納入二（（注文一注文）（納入 i—納入） + (注文 ₂—注文）（納入 ₂—納入） + · · · + (注文 _n—注文）（納入 _n— 納入）） / ( n - 1 )

標準偏差 S 注文 = ( (注文 i—注文） ² + (注文 ₂—注文） ²

+ · · · + (注文 _n—注文） ² ) / ( n— 1 )

標準偏差 S納入二 ( (納入丄 —納入） ² + (納入 ₂—納入） ²

+ · · · + (納入 _n—納入） ² ) / ( n - 1 )

以下、同様にして、全シソーラス間の相関係数を求め、相関係数記憶部 1 2に記憶させる。第 5図は、シソーラス間の相関係数を示している。例えば、シソーラス「先週」とシソーラス「注文する」の間の相関係数は 0 . 0 2 5となっている。同一のシソーラス間の相関係数は 1となる。次に、ステップ S 8において、シソーラス毎の相関係数合計算出部 1 3により、ステップ S 7で求められ、相関係数記憶部 1 2に記憶された相関係数を、各シソーラス毎に合計する。例えば、シソーラス「先週」の場合、 1 + 0 . 0 2 5 + 0 . 0 3 8 + 0 . 0 0 1 + · · ' となる。このとき、同一のシソーラス間の相関係数 1を除く。以下同様にして、シソ一ラス「注文する」、「納入する」、「部品」等の他のシソーラスについても、相関係数の合計を求める。求められた各シソーラス毎の相関係数の合計は、シソーラス毎の相関係数合計記憶部 1 4に記憶される。次に、ステップ S 9において、出現頻度算出部 9により、各シソ一ラスの出現頻度が求められる。即ち、第 6図に示すように、シソーラス毎の仕分け結果（第 4図）に基づいて、各シソーラス毎の出現頻度が求められる。第 6図の例では、例えば、シソーラス「先週」については、顧客 Κ— 2、 Κ— 3、 · · · Κ— ηの苦情等のテキストデ一夕の中に、そのシソーラス「先週」が含まれていることがわかる。シソーラス「先週」についての各顧客毎の値を合計することにより、出現数 Αが算出される。同様に、シソーラス「注文」の出現数は B、シソ一ラス「納入する」の出現数は C、シソーラス「部品」の出現数は「D」となる。全シソ一ラスの出現数の合計∑ (A+B + C + D+ - · · ) を求め、各シソーラスの出現頻度をパーセンテージで表す。

例えば、シソーラス「先週」の出現頻度は、（Α/Σ (A + B + C + D + · · · )) * 100 (%) となる。算出された各シソーラス毎の出現頻度は、出現頻度記憶部 10に記憶される。

次に、ステップ S 10において、グラフ作成表示部 15により、各シソ一ラスの出現頻度（％) を X軸、シソーラス毎の相関係数の合計を y 軸にとり、プロットして、グラブが作成される。第 7図は、作成されたグラフを示している。

第 7図に示すように、各顧客が苦情等で発言した中で、出現回数は多くはないが、他のシソーラスとの結びつき（何らかの意味上の関連性）が強いシソーラスが第 1のグループに現れる。

また、他のシソーラスとの結びつきはそれほど強くないが、出現回数が多いもの。即ち、頻繁に発言されるので見逃せないシソーラスが第 3 のグループに現れる。

ここでは、相関係数の数値の大小に意味を求めるのではなく、ある一定レベルに基準を定め、その基準レベルを超えたものは結びつきが強く、下回ったものは結びつきが弱いものと判断する。

y座標の数値がある一定レベルを超えたか否かが重要であり、一定のレベルを超えたシソーラスは、他のキ一ヮ一ドと結びついて何らかの意味を構成している可能性が高いとした。このケースの場合、テキストは顧客の部品に関する苦情であるので、「何らかの意味」とは苦情、即ち「潜在的な不満」を示すものであると類推できる。

なお、上記実施の形態の構成及び動作は例であって、本発明の趣旨を逸脱しない範囲で適宜変更することができることは言うまでもない。産業上の利用可能性

以上の如く、本発明に係る情報処理装置および情報処理方法、並びに情報処理プログラムによれば、テキストデータを入力する入力ステップと、テキストデ一夕を記憶するテキストデータ記憶ステップと、テキストデ一夕に対してヮ一ドカヅティング処理を実行するヮードカッテイングステップと、ワードカッティング処理が行われたテキストデータに対して構文解析処理を行う構文解析ステツプと、構文解析処理が行われたテキストデ一夕からシソーラスを作成するシソーラス作成ステヅプと、シソーラス作成ステヅプにおいて作成されたシソーラスを記憶するシソ一ラス記憶ステツプと、シソ一ラス記憶ステヅプにおいて記憶されたシソーラスに基づいて、再度ワードカッティング処理および構文解析処理を行うワードカヅティングぉよび構文解析ステヅプと、ワードカツティングおよび構文解析が行われたテキストデータに対して仕分け処理を行うシソーラス仕分けステツプと、シソーラス仕分けステヅプにおける仕分け結果を記憶する仕分け結果記憶ステップと、仕分け結果記憶ステツプにおいて記憶された仕分け結果に基づいて、各シソーラス毎に出現頻度を算出する出現頻度算出ステップと、出現頻度算出ステップにおいて算出された結果を記憶する出現頻度記憶ステップと、シソーラス間の相関係数を算出する相関係数算出ステップと、相関係数算出ステップにおいて算出されたシソーラス間の相関係数を記憶する相関係数記憶ステツプと、シソーラス毎の相関係数の合計を算出するシソーラス毎の相関係数合計算出ステップと、シソーラス毎の相関係数合計算出ステップにおいて算出されたシソ一ラス毎の相関係数の合計を記憶するシソーラス毎の相関係数合計記憶ステップと、出現頻度記憶ステップにおいて記憶された出現頻度と、シソーラス毎の相関係数合計記憶ステツプにおいて記憶されたシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するようにしたので、テキストデ一夕から抽出したキ一ワードから作成したシソーラス同士の相関おょぴ出現頻度に基づいて、テキストデ —夕の特徴を検出し、テキストデータに隠れている潜在的な意味を類推することが可能となる。

Claims

請求の範囲

1 . テキストデータを入力する入力手段と、

前記テキストデータを記憶するテキストデ一夕記憶手段と、

前記テキストデ一夕に対してヮードカヅティング処理を実行するヮードカツティング手段と、

前記ヮードカツティング処理が行われた前記テキストデータに対して構文解析処理を行う構文解析手段と、

前記構文解析処理が行われた前記テキストデ一夕からシソーラスを作成するシソーラス作成手段と、

前記シソーラス作成手段によって作成された前記シソーラスを記憶するシソーラス記憶手段と、

前記ワードカツティングおよび前記構文解析が行われた前記テキストデータに対して仕分け処理を行うシソーラス仕分け手段と、前記シソーラス仕分け手段による仕分け結果を記憶する仕分け結果記憶手段と、

前記仕分け結果記憶手段によって記憶されている前記仕分け結果に基づいて、

各シソーラス毎に出現頻度を算出する出現頻度算出手段と、

前記出現頻度算出手段によつて算出された結果を記憶する出現頻度記憶手段と、

シソーラス間の相関係数を算出する相関係数算出手段と、

相関係数算出手段によって算出されたシソーラス間の相関係数を記憶する相関係数記憶手段と、

シゾーラス毎の相関係数の合計を算出するシソーラス毎の相関係数合計算出手段と、シソーラス毎の相関係数合計算出手段によって算出されたシソーラス毎の相関係数の合計を記憶するシソーラス毎の相関係数合計記憶手段と、出現頻度記憶手段によって記憶されている出現頻度と、シソーラス毎の相関係数合計記憶手段によって記憶されているシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するグラフ作成表示手段とを備え、

前記ヮ一ドカツティング手段および前記構文解析手段は、前記シソ一ラス作成手段によって作成された前記シソーラスに基づいて再度ヮードカツティング処理および構文解析処理を行う

ことを特徴とする情報処理装置。

2 . テキストデ一夕を入力する入力ステップと、

前記テキストデ一夕を記憶するテキストデータ記憶ステップと、前記テキストデ一夕に対してワード力ッティング処理を実行するヮ一ドカヅティングステップと、

前記ワードカヅティング処理が行われた前記テキストデ一夕に対して構文解析処理を行う構文解析ステップと、

前記構文解析処理が行われた前記テキストデータからシソーラスを作成するシソーラス作成ステツプと、

前記シソーラス作成ステツプにおいて作成された前記シソーラスを記憶するシソーラス記憶ステップと、

前記シソーラス記憶ステツプにおいて記憶された前記シソーラスに基づいて、

再度ヮ一ドカツティング処理および構文解析処理を行うヮ一ドカツティングおよび構文解析ステップと、

前記ヮードカツティングおよび前記構文解析が行われた前記テキストデータに対して仕分け処理を行うシソーラス仕分けステツプと、前記シソーラス仕分けステツプにおける仕分け結果を記憶する仕分け結果記憶ステツプと、

前記仕分け結果記憶ステップにおいて記憶された前記仕分け結果に基づいて、

各シソーラス毎に出現頻度を算出する出現頻度算出ステップと、前記出現頻度算出ステップにおいて算出された結果を記憶する出現頻度記憶ステツプと、

シソーラス間の相関係数を算出する相関係数算出ステップと、相関係数算出ステップにおいて算出されたシソーラス間の相関係数を記憶する相関係数記憶ステツプと、

シソーラス毎の相関係数の合計を算出するシソーラス毎の相関係数合計算出ステップと、

シソーラス毎の相関係数合計算出ステップにおいて算出されたシソーラス毎の相関係数の合計を記憶するシソーラス毎の相関係数合計記憶ステヅプと、

出現頻度記憶ステップにおいて記憶された出現頻度と、シソーラス毎の相関係数合計記憶ステップにおいて記憶されたシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するグラフ作成表示ステヅプと

を備えることを特徴とする情報処理方法。

3 . テキストデ一夕を入力する入力ステップと、

前記テキストデ一夕を記憶するテキストデ一夕記憶ステップと、前記テキストデ一夕に対してヮードカッティング処理を実行するヮ一ドカッティングステップと、

前記ヮ一ドカツティング処理が行われた前記テキストデ一夕に対して構文解析処理を行う構文解析ステップと、前記構文解析処理が行われた前記テキストデータからシソーラスを作成するシソ―ラス作成ステヅプと、

前記シソーラス作成ステップにおいて作成された前記シソーラスを記憶するシソーラス記憶ステップと、

前記シソーラス記憶ステップにおいて記憶された前記シソーラスに基づいて、

再度ヮ一ドカツティング処理および構文解析処理を行うヮ一ドカツティングぉよび構文解析ステップと、

前記ヮードカツティングおよび前記構文解析が行われた前記テキストデータに対して仕分け処理を行うシソーラス仕分けステヅプと、前記シソーラス仕分けステップにおける仕分け結果を記憶する仕分け結果記憶ステツプと、

シソーラス間の相関係数を算出する相関係数算出ステップと、相関係数算出ステツプにおいて算出されたシソーラス間の相関係数を記憶する相関係数記憶ステップと、

シソーラス毎の相関係数合計算出ステツプにおいて算出されたシソーラス毎の相関係数の合計を記憶するシソーラス毎の相関係数合計記憶ステツプと、

出現頻度記憶ステップにおいて記憶された出現頻度と、シソーラス毎の相関係数合計記憶ステップにおいて記憶されたシソーラス毎の相関係数合計とに基づいて、グラフを作成し、表示するグラフ作成表示ステツプと

をコンピュータに実行させることを特徴とする情報処理プログラム。