JP2001147937A - 業務支援システム - Google Patents

業務支援システム

Info

Publication number
JP2001147937A
JP2001147937A JP33211499A JP33211499A JP2001147937A JP 2001147937 A JP2001147937 A JP 2001147937A JP 33211499 A JP33211499 A JP 33211499A JP 33211499 A JP33211499 A JP 33211499A JP 2001147937 A JP2001147937 A JP 2001147937A
Authority
JP
Japan
Prior art keywords
concept
document
classification
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP33211499A
Other languages
English (en)
Inventor
Yumi Ichimura
由美 市村
Yasuko Nakayama
康子 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP33211499A priority Critical patent/JP2001147937A/ja
Publication of JP2001147937A publication Critical patent/JP2001147937A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】本発明は、文章形式で記述されたデータを自動
的に分類し、分類されたデータの概要を示す表題を生成
することにより、効率的な文書処理を行い業務を支援す
る業務支援システムを提供することを目的とする。 【解決手段】文書入力部101と、アクションと結果を含
む複数の分類軸を設定して各分類軸に属す概念とその概
念を表す表現とを対応づけた概念定義辞書107と、概念
定義辞書を用いて文書入力部より入力された各文書中に
含まれる概念を抽出する概念抽出部102と、概念抽出部
により抽出された概念のうち、異なる分類軸に属す概念
同士を組み合わせた複合概念を用いて入力文書を分類す
る文書分類部103と、文書分類部によって分類された結
果を表示する表示部105とで構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、営業報告書など文
章形式で記述されたデータを自動的に分類し、分類され
たデータの概要を示す表題を生成することにより、効率
的な文書処理を行い業務を支援する業務支援システムに
関する。
【0002】
【従来の技術】さまざまな場所で日々多様な情報が蓄積
されているが、そのデータの8割以上が文章データであ
ると言われている。このような文章データから情報を引
き出すためには、基本的には人間が読むしかないのが現
状である。
【0003】たとえば、大量の営業報告書を分析するこ
とを考えると、目的に応じて必要なデータだけを形式を
決めて記述しておけば、その分析は比較的容易である。
しかし、そのような制限を設けると、設定された形式で
は記述できない情報は捨てられることになる。一方、営
業活動における危機警告情報やノウハウ情報などをうま
く捉える項目を予め用意することは困難である。そのた
め、報告書は文章記述を中心に作成されることになり、
そのように作成された大量の文章から目的とする情報や
知識を読み取るには、大変な労力が必要となる。
【0004】その結果、管理者が業務上の意志決定をす
るために重要となる営業活動における危機警告情報やノ
ウハウ情報は大量の書類の中に埋もれてしまい、営業報
告書が十分に活用されているとはいえないのが実状であ
る。
【0005】そこで、第57回情報処理学会全国大会3
-75および3-76にて、テキストマイニング技術によ
って文書を分析する手法が提案されている。
【0006】この手法では、意図を含んだ情報を抽出す
るために、モダリティと構文情報を利用している。ま
ず、予め「要望」「質問」「好評」「問題」といったモ
ダリティに対応する評価ラベルを用意する。そして、構
文情報として係り受け関係を想定した2語組を抽出し、
重要語ラベルと述語・評価ラベルとの組合せパターンを
用意して、情報抽出を行う。すなわち、重要語ラベルと
呼ぶ名詞表現と評価ラベルを含んだ述語表現との組合せ
によって、情報抽出を行っている。
【0007】
【発明が解決しようとする課題】従来のテキストマイニ
ング技術に基づいた方法によると、抽出される概念は、
「○が□した」(ただし、□は評価ラベルつき)という複
合概念である。つまり抽出される内容は、「○を□した
い」「○を□したくない」「○は○であった」といった
ような、いわば断片的な情報である。
【0008】これに対して、業務上の意志決定に有効な
情報とは、例えば「プロジェクトの進行状況はどうなっ
ているか?」「あるアクションの結果はどうなっている
のか?」「ある事例に遭遇した場合どういう行動をとれ
ばよいのか?」といった情報であり、そのためにはさら
に高度なテキストマイニング技術が求められる。
【0009】そこで、本発明は、少なくともアクション
と結果を含む複数の分類軸を設定して概念の抽出を行
い、抽出された概念を用いて文章形式で記述されたデー
タを自動的に分類するとともに、分類されたデータの概
要を示す表題を生成することにより、管理者の業務上の
意志決定を支援する情報を生成する業務支援システムを
提供することを目的とする。
【0010】
【課題を解決するための手段】本発明は、複数の文書を
入力する入力手段と、少なくともアクションと結果を含
む複数の分類軸を設定し、各分類軸に属する概念と該概
念を表す表現とを対応づけた概念定義辞書と、前記概念
定義辞書を用いて前記入力手段より入力された各文書に
含まれる概念を抽出する概念抽出手段と、前記概念抽出
手段により抽出された概念のうち、異なる分類に属す概
念同土を組み合わせた複合概念を用いて前記入力された
文書を分類する文書分類手段と、前記文書分類手段によ
って分類された結果を表示する表示手段とを具備したこ
とを特徴とする業務支援システムを提供する。
【0011】即ち、アクションおよび結果に属する概念
とこれら概念をそれぞれ表す表現とを対応付けた概念定
義辞書を用い、例えば、“販促活動を行う(アクショ
ン)”を表す概念と“売れ行きが良いまたは売れ行きが
悪い(結果)”を表す概念とを抽出し、これら概念を組
み合わせて複合概念を作り、この複合概念を用いて文書
分類を行なう。
【0012】このような構成によれば、アクションに属
する概念と結果に属する概念とを組み合わせて複合概念
を作り、この複合概念を用いて文書を分類することによ
り活動報告書のような書類について「アクションとその
結果」という意志決定に有効な視点に基づいた文書分類
を行うことができる。
【0013】本発明は、複数の文書を入力する入力手段
と、少なくともアクションと結果を含む複数の分類軸を
設定し、各分類軸に属す概念と、該概念を表す表現と、
該概念の与える情報種別とを対応づけた概念定義辞書
と、前記概念定義辞書を用いて前記入力手段より入力さ
れた各文書中に含まれる概念を抽出する概念抽出手段
と、前記概念抽出手段により抽出された概念のうち、異
なる分類軸に属す概念同士を組み合わせた複合概念を用
いて、前記入力された文書を分類する文書分類手段と、
前記複合概念を用いて、前記分類された文書群の与える
情報種別を判定する情報種別判定手段と、前記判定され
た情報種別と共に前記分類結果を表示する表示手段とを
具備したことを特徴とする業務支援システムを提供す
る。
【0014】即ち、概念定義辞書に概念とともにその概
念の与える情報種別を記述しておき、分類された文書群
に対して、例えば、報告を促す情報であるとか、見習う
べき事例情報であるとかの情報種別を付与することによ
り、業務上の意志決定に一層有効な情報を提供すること
ができる。具体的には、“販促活動を行った”というア
クション概念と“売れ行きが良くなった”という結果概
念とを組み合わせた複合概念が“良好事例”と定義でき
る場合、この“良好事例”が情報種別となる。
【0015】本発明は、複数の文書を入力する入力手段
と、少なくともアクションと結果を含む複数の分類軸を
設定し、各分類軸に属す概念と該概念を表す表現とを対
応づけた該概念定義辞書と、概念同士の因果関係を記述
した因果関係定義辞書と、前記概念定義辞書を用いて前
記入力手段より入力された各文書中に含まれる概念を抽
出する概念抽出手段と、前記概念抽出手段により抽出さ
れた概念のうち、異なる分類軸に属す概念同士を組み合
わせた複合概念を用いて、前記入力された文書を分類す
る文書分類手段と、前記概念抽出手段により抽出された
概念と前記因果関係定義辞書を用いて、前記分類された
文書群の概要を示す表題を生成する表題生成手段と、前
記生成された表題と共に前記分類された結果を表示する
表示手段とを具備したことを特徴とする業務支援システ
ムを提供する。
【0016】これによると、概念同士の因果関係を記述
した因果関係定義辞書を持ち、抽出された概念と上記因
果関係定義辞書を用いて、分類された文書群の概要を示
す表題を生成することにより、より一層可能性が向上す
る。従って、これは、処理対象となる文章が、箇条書き
やメモ書きのような文章を多数含んでいる場合に有効で
ある。例えば、“販促活動を行った”が“売れ行きが良
くない”と言うアクションと結果の関係において“見本
が無い”との状況が加わった場合に見本が無い状況と売
れ行きが悪いとの結果とが因果関係がある場合、このよ
うな因果関係と概念を用いて表題を生成する。
【0017】本発明は、複数の文書を入力する入力手段
と、少なくともアクションと結果を含む複数の分類軸を
設定し、各分類軸に属す概念と該概念を表す表現とを対
応づけた概念定義辞書と、概念同士の因果関係および該
概念と該因果関係の組合せが与える情報種別とを記述し
た因果関係定義辞書と、前記概念定義辞書を用いて、前
記入力手段より入力された各文書中に含まれる概念を抽
出する概念抽出手段と、前記概念抽出手段により抽出さ
れた概念のうち、異なる分類軸に属す概念同士を組み合
わせた複合概念を用いて、前記入力された文書を分類す
る文書分類手段と、前記概念抽出手段により抽出された
概念と前記因果関係定義辞書を用いて、前記分類された
文書群の概要を示す表題を生成する表題生成手段と、前
記概念抽出手段により抽出された概念と前記因果関係定
義辞書を用いて、前記分類された文書群の与える情報種
別を判定する情報種別判定手段と、前記生成された表題
および前記判定された情報種別とともに前記分類された
結果を表示する表示手段とを具備したことを特徴とする
業務支援システムを提供する。
【0018】これによると、概念との関係の組合せを与
える情報種別を因果関係定義辞書に記述しておき、分類
された文書群に対して情報種別を付与することにより、
業務上の意志決定に一層有効な情報を提供することがで
きる。
【0019】本発明は、複数の文書を入力する入力手段
と、少なくともアクションと結果を含む複数の分類軸を
設定し、各分類軸に属する概念と該概念を表す表現とを
対応づけた概念定義辞書と、前記概念定義辞書を用い
て、前記入力手段より入力された各文書中に含まれる概
念を抽出する概念抽出手段と、前記入力手段により入力
された各文書中に含まれる接続関係とこの接続関係を表
す表現とを対応付けた接続関係定義辞書と、前記接続関
係定義辞書を用いて、前記入力手段より入力された各文
書中に含まれる接続関係を抽出する接続関係抽出手段
と、前記概念抽出手段により抽出された概念のうち、異
なる分類軸に属す概念同士と前記接続関係抽出手段によ
り抽出された接続関係とを組み合わせた複合概念を用い
て、前記入力された文書を分類する文書分類手段と、前
記文書分類手段によって分類された結果を表示する表示
手段とを具備したことを特徴とする業務支援システムを
提供する。
【0020】これによると、接続関係とその接続関係を
表す表現とを対応づけた接続関係定義辞書を持ち、接続
関係定義辞書を用いて入力された文書中に含まれる接続
関係を抽出し、抽出された概念のうち異なる分類軸に属
す概念同士と抽出された接続関係とを組み合わせた複合
概念を用いて分類することにより、概念同士の関係を考
慮した分類を行うことができる。これは、処理対象とな
る文書が箇条書きやメモ書きのような文章ではなく、接
続助詞や接続詞を含むなどアクションと結果の因果関係
を明確にした文章で書かれている場合に有効である。
【0021】本発明は、複数の文書を入力する入力手段
と、少なくともアクションと結果を含む複数の分類軸を
設定し、各分類軸に属す概念と該概念を表す表現とを対
応づけた概念定義辞書と、前記入力手段により入力され
た各文書中に含まれる接続関係とこの接続関係を表す表
現とを対応付けた接続関係定義辞書と、前記接続関係定
義辞書を用いて、前記入力手段より入力された各文書中
に含まれる接続関係を抽出する接続関係抽出手段と、前
記概念抽出手段により抽出された概念のうち、異なる分
類軸に属す概念同士と前記接続関係抽出手段により抽出
された接続関係とを組み合わせた複合概念を用いて、前
記入力された文書を分類する文書分類手段と、前記概念
抽出手段により抽出された概念のうち、異なる分類軸に
属す概念同士と前記接続関係抽出手段により抽出された
接続関係とを用いて、前記分類された文書群の概要を示
す表題を生成する表題生成手段と、前記生成された表題
と共に前記分類された結果を表示する表示手段とを具備
したことを特徴とする業務支援システムを提供する。
【0022】この場合、抽出された概念と接続関係を用
いて、分類された文書群の概要を示す表題を生成するこ
とにより、より一層可読性が向上する。
【0023】本発明は、複数の文書を入力する入力手段
と、少なくともアクションと結果を含む複数の分類軸を
設定し、各分類軸に属す概念と該概念を表す表現とを対
応づけた概念定義辞書と、前記入力手段より入力された
各文書中に含まれる接続関係と該関係を表す表現とを対
応づけた接続関係定義辞書と、前記概念定義辞書を用い
て、前記入力手段より入力された各文書中に含まれる概
念と該出現位置を抽出する概念抽出手段と、前記接続関
係定義辞書を用いて各文書中に含まれる接続関係と該出
現位置を抽出する接続関係抽出手段と、前記概念抽出手
段により抽出された概念のうち、異なる分類軸に属す概
念同士と前記関係表現抽出手段により抽出された接続関
係とを出現位置を参照して組み合わせた複合概念を用い
て前記入力された文書を分類する文書分類手段と、前記
概念抽出手段により抽出された概念と該出現位置および
前記接続関係抽出手段により抽出された接続関係と該出
現位置を用いて、前記分類された文書群の概要を示す表
題を生成する表題生成手段と、前記生成された表題と共
に前記分類された結果を表示する表示手段とを具備した
ことを特徴とする業務支援システムを提供する。
【0024】これによると、概念や接続関係の文書中に
おける出現位置を考慮することにより、より精度の高い
分類や表題生成を行うことができる。
【0025】本発明は、複数の文書を入力する入力手段
と、少なくともアクションと結果を含む複数の分類軸を
設定し、各分類軸に属す概念と該概念を表す表現とを対
応づけた概念定義辞書と、前記概念定義辞書を用いて、
前記入力手段より入力された各文書中に含まれる概念を
抽出する概念抽出手段と、前記概念抽出手段により抽出
された概念のうち、異なる分類軸に属す概念同士を組み
合わせた複合概念を用いて、前記文書の概要を示す表題
を生成する表現生成手段と、前記表題生成手段によって
生成された表題を表示する表示手段とを具備したことを
特徴とする業務支援システムを提供する。
【0026】これによると、表題生成部が、分類された
文書群の概要を示す表題を生成するので、文書群の概要
が分かりやすくなる。また、営業日報のような文書は、
報告日付、報告者名、天候などの属性情報が付与されて
いる場合が一般的であるので、このような属性情報ごと
に文類すれば、文章で記述された内容以外の観点からも
分類結果を提示することが可能である。
【0027】本発明は、複数の文書を入力する入力手段
と、少なくともアクションと結果を含む複数の分類軸を
設定し、各分類軸に属する概念と該概念を表す表現とを
対応づけた概念定義辞書と、前記概念定義辞書を用い
て、前記入力手段より時間的な流れで入力された各文書
に含まれる概念を抽出する概念抽出手段と、前記概念抽
出手段により抽出された概念のうち、時間的な流れで異
なる分類に属す概念同士を組み合わせた複合概念を用い
て前記入力された文書を分類する文書分類手段と、前記
文書分類手段によって分類された結果を表示する表示手
段とを具備したことを特徴とする業務支援システムを提
供する。
【0028】これによると、複数の文章の中で時間的な
流れで存在するアクションと結果を抽出し、分類するこ
とにより時間的流れでのアクションと結果の因果関係を
明確にできる。
【0029】
【発明の実施の形態】以下、図面を参照して本発例に係
る第一の実施形態を説明する。
【0030】図1は本発明の第1の実施形態に係る業務
支援システムの構成を示すブロック図である。なお、本
実施形態における業務支援システムは、例えば磁気ディ
スク等の記録媒体に記録されたプログラムを組み込み、
このプログラムによって動作が制御されるコンピュータ
によって実現される。
【0031】図1において、入力手段としての文書入力
部101は、処理対象となる文書を例えばメモリや磁気
ディスク、光ディスクなどから取り込む。文書入力部1
01から取り込まれた文書情報は概念抽出部102に送
られる。概念抽出部102は、概念定義辞書107に記
憶される情報を用いて、受け取った文書に含まれる概念
を抽出し、その結果を処理結果保持部106に記憶す
る。
【0032】処理結果保持部106は、各処理部の結果
を一時的に保持するための記憶装置であり、例えばRA
Mや磁気ディスクなどからなる。この処理結果保持部1
06には、概念抽出結果リスト106a、分類結果リス
ト106bなどが設けられている。各リストに記憶され
る情報については、各処理部の詳細な説明の中で詳述す
る。
【0033】文書分類部103は、概念抽出部102の
処理結果を受け取り、異なった分類軸に属す概念同士を
組み合わせた複合概念を用いて文章を分類し、その結果
を処理結果保持部106に記憶する。
【0034】表題生成部104までの処理が終了する
と、処理結果保持部106に記憶される情報は出力部1
05を介して、例えばディスプレイやプリンタに出力さ
れる。
【0035】以上が本システムの概要である。次に、各
処理都の詳細についてフローチャートを用いて説明す
る。
【0036】概念抽出部102の処理動作 まず、概念抽出部102の処理動作について説明する。
【0037】図2は概念抽出部102の処理動作を示す
フローチャートである。まず、ステップS201で、概
念抽出結果リスト106aを初期化し、ステップS20
2に進む。ステップS202で概念定義辞書107を読
み込み、ステップS203に進む。このステップS20
3の処理により、概念定義辞書107のうち処理に必要
な情報が、変数DIC_id_DIC_hyogen,DIC_info, midasi_s
uにセットされる。すなわち、概念定義辞書107のi行
目の概念IDがDIC_id[i]に、表現がDIC_hyogen[i]に、情
報種別がDIC_info[i]にセットされ、概念定義辞書10
7の行数がmidasi_suにセットされる。
【0038】ここで、図6に概念定義辞書107に記憶
される情報の一例を示す。概念IDを示す記号、概念見出
し、概念を表す表現、概念の与える情報種別から形成さ
れる。ここでは、概念を表す表現を正規表現で記述して
いるが、例えば、形態素解折や構文解折の処理結果にア
クセスするようにしてもよい。情報種別の欄にある
「W」はWarning Case情報であることを、「G」はGood
Case情報であることを示している。
【0039】図2の説明に戻り、ステップS203で処
理中の文書を示す変数iに初期値1をセットし、ステップ
S204に進む。ステップS204で、未処理の文章が残
っているかを判定する。残っていない場合は処理を終了
する。残っている場合はステップS205に進む。
【0040】ステップS206でi番目の文章を読み込
み、ステップS206に進む。ステップS2で概念抽出
結果リスト106aに、処理中の文書の文書IDを追加
し、ステップS207に進む。ステップS207で処理
中の概念定義辞書107の行を示す変数jに初期値1を
セットし、ステップS208に進む。ステップS208
でj<=midasi_suであるかを判定する。jがmidasi_suに等
しいか小さい場合は、ステップS209に進む。そうで
ない場合はステップS212に進む。
【0041】ステップS209で、i番目の文章がDIC_hy
ogen[j]に適合する部分文字列を含んでいるかどうかを
判定する。そうである場合はステップS210に進み、
そうでない場合はステップS211に進む。ステップS
210で概念抽出結果リスト106aにDIC_id[j]、文書
中でのDIC_hyogen[j]の出現位置、DIC_info[j]を追加す
る。
【0042】ステップS211でjを1インクリメント
し、ステップS208に戻る。ステップS208からス
テップS211の繰り返しにより、概念定義辞書107
のすべての概念に対する照合を終えると、ステップS2
12に進む。ステップS212でiを1インクリメントし、
次の文書の処理に移る。
【0043】図8は、入力される文章群の例を示してい
る。この例では、7つの文章を対象としており、各文書
は文章ID、日付、本文からなっている。例えば、図8に
示す文章群が概念抽出部102に送られると、図9に示
す概念抽出結果リスト106aが作成される。ここで、
概念抽出結果リスト106a は、番号、文書ID、抽出さ
れた概念IDとその出現位置から構成されている。概念ID
と出現位置はコロンで区切って記述されている。また、
1文章内に複数の概念が抽出された場合には、カンマで
区切って記述されている。
【0044】以上のようにして、概念抽出部102は、
概念定義辞書107に記憶される情報を用いて、文書入
力部101から受け取った各文章に含まれる概念を抽出
し、その結果を処理結果保持部106に記憶する。
【0045】文書分類部103の処理動作 次に、文書分類部103の処理動作を図3のフローチャ
ートを参照して説明するまず、ステップS301で、分
類結果リスト106bを初期化し、ステップS302に
進む。ステップS302で概念抽出結果リスト106a
を読み込み、ステップS303に進む。ステップS303
で概念抽出結果リスト106aに記憶される文章数を変
数bunsho_suにセットし、ステップS304に進む。ステ
ップS304で分類定義辞書108を読み込み、ステッ
プS305に進む。このステップS305の処理により、
分類定義辞書108の内容が、変数GainenID,GainenInf
o,gainen_su,jiku_suにセットされる。すなわち、分類
定義辞書108のi行目の分類軸のj番目の概念IDがGain
enID[i,j]にセットされ、概念定義辞書107を参照し
ながらその概念IDに対応する情報種別がGainenInfo[i,
j]にセットされる。また、i行目の分類軸に属す概念数
がgainen_su[i]に、分類定義辞書108の行数がjiku_s
uにセットされる。
【0046】ここで、図7に分類定義辞書108に記憶
される情報の一例を示す。これは、分類軸、その分類軸
に属す概念IDから構成される。ここでは、分類軸は、
「アクション」、「状況」、「結果」の3つからなって
いる。1つの分類軸に属する概念が複数ある場合には、
カンマで区切って記述されている。
【0047】図3の説明に戻り、ステップS305で分
類項目を作成し、ステップS306に進む。この処理に
より、分類すべき項目一覧が、変数BunruiID, BunruiIn
fo,bunrui_suにセットされる。この分類項目作成処理に
ついては後述する。
【0048】ステップS306で処理中の文書を示す変
数iに初期値1をセットし、ステップS307に進む。ス
テップS307でi<=bunsho_suであるかどうかを判定す
る。iがbunsho_suに等しいか小さい場合は、ステップS
308に進み、そうでない場合は処理を終了する。
【0049】ステップS308で処理中の分類を示す変
数jに初期値1をセットし、ステップS309に進む。ス
テップS309でj<=bunrui_suであるかどうを判定す
る。jがbunrui_suに等しいか小さい場合は、ステップ
S310に進み、そうでない場合はステップS315に
進む。
【0050】ステップS310で、i番目の文書はBunru
iID[j]に含まれる概念のすべてを含むかどうかを判定す
る。BunruiID[j]に含まれるすべての概念を含む場合に
はステップS311に進む。そうでない場合はステップ
S314に進む。
【0051】ステップS311で分類結果リスト106
bにBunruiID[j]が存在するかどうかを判定する。在在し
ない場合はステップS312に進み、存在する場合はス
テップS313に進む。ステップS312で分類結果リ
スト106bにBunruiID[j]とBunruiInfo[j]を追加し、
ステップS313に進む。ステップS313で分類結果リ
スト106bのBunruiID[j]の欄に、i番目の文書の文書I
Dを追加し、ステップS314に進む。
【0052】ステップS314でjを1インクリメント
し、ステップS309に戻る。ステップS309からステ
ップS314の繰り返しにより、すべての分類項目との
照合を終えると、ステップS315に進む。
【0053】ステップS315でiを1インクリメント
し、ステップS307に戻る。ステップS307からステ
ップS315の繰り返しにより、すべての文書のチェッ
クを終えると、処理を終了する。
【0054】次に、分類項目作成処理を図4のフローチ
ャートを参照して説明する。
【0055】ステップS401で処理中の分類項目を示
す変数mに初期値1をセットし、ステップS402に進
む。ステップS402で変数sに初期値1をセットし、
ステップS403に進む。
【0056】ステップS403でs<=jiku_suであるか
どうかを判定する。Sがjiku_suに等しいか小さい場合
はステップS403−1に進み、そうでない場合はステ
ップS417に進む。
【0057】ステップS403−1で変数tに初期値1を
セットし、ステップS404に進む。ステップS404で
t<=gainen_su[s]であるかどうかを判定する。tがgaine
n_su[s]に等しいか小さい場合はステップS405に進
み、そうでない場合はステップS416に進む。
【0058】ステップS405で変数uに初期値をセット
し、ステップS406に進む。ステップS406でu<=jik
u_suであるかどうかを判定する。uがjiku_suに等しいか
小さい場合はステップS407に進み、そうでない場合
はステップS415に進む。
【0059】ステップS407で変数wに初期値1をセッ
トし、ステップS408に進む。ステップS408でw<
=gainen_su[u]であるかどうかを判定する。wがw<=gain
en_su[u]に等しいか小さい場合はステップS409に進
み、そうでない場合はステップS414に進む。
【0060】ステップS409でs!=uであるかどうかを
判定する。sがuに等しくない場合はステップS410
に進み、等しい場合はステップS413に進む。
【0061】ステップS410で、変数BunruiID[m]にG
ainenID[s:t]とGainenID[u,w]の「和」をセットす
る。ここで「和」と述べているのは、倫理演算の和であ
る。すなわち、BunruiID[m]には、BunruiID[s:t]と Bun
ruiID[u.w]の両方の情報がセットされる。続いて、ステ
ップS411に進み、ステップS411で、変数Bunrui
Info[m]にGainenInfo[s,t]とGainenInfo[u,w]の
「和」をセットする。即ち、BunruiInfo[m]には、Gaine
nInfo[s,t]とGainenInfo[u,w]の両方の情報がセット
される。
【0062】続いて、ステップS412に進み、ステッ
プS412でmを1インクリメントし、ステップS413
に進む。ステップS413でwを1インクリメントし、
ステップS408に戻る。ステップS414でuを1イン
クリメントし、ステップS406に戻る。ステップS4
15でtを1インクリメントし、ステップS404に戻
る。ステップS416でsを1インクリントし、ステップ
S403に戻る。
【0063】ステップS403からステップS416の
繰り返しにより、異なる軸に属す概念同士の組合せを作
成し、ステップS417に進む。ステップS417で変数
bunrui_suに分類項目数であるm-1をセットし、処理を終
える。ここでは、2つの軸について組合せを作成してい
るが、3つ以上の軸について組み合わせを作成するよう
にしてもよい。
【0064】例えば、図9に示す概念抽出結果リスト1
06aが文書分類部103に送られると、図10(a)に
示す分類結果リスト106bが作成される。ここで、分
類結果リスト106bは、番号、分類、文書ID、表題、
情報種別から構成されている。1つの分類に対して複数
の文書が該当する場合には、カンマで区切って記述され
ている。なお、この時点では表題欄は空欄である。
【0065】以上のようにして文書分類部103は分類
定義辞書108に記憶される情報を用いて、概念抽出部
102の処理結果を受け取り、異なった分類軸に属す概
念同士を組み合わせた複合概念を用いて文章を分類し、
その結果を処理結果保持部106に記憶する。
【0066】(c)表題生成部104の処理動作 次に、表題作成部104の処理動作を図5のフローチャ
ートを参照して説明する。
【0067】まず、ステップS501で分類結果リスト
106bを読み込み、ステップS502に進む。このス
テップS502で分類結果リスト106bに記憶される
リスト件数を変数1ist_suにセットし、ステップS503
に進む。ステップS503で処理中のリストを示す変数
iに初期値1をセットし、ステップS504に進む。ステ
ップS504でi<=list_suであるかどうかを判定する。i
がlist_suに等しいか小さい場合はステップS505に進
みそうでない場合は処理を終了する。
【0068】ステップS505で、分類結果リスト10
6bのi番目の分類を、構成要素である概念IDに分割し、
分割された各要素を変数IDに要素数を変数id_suにセッ
トし、ステップS506に進む。ステップS506で、処
理中の要素を示すjに初期値1をセットし、ステップS5
07に進む。ステップS507で、j<=id_suであるかどう
かを判定する。jがid_suに等しいか小さい場合はステ
ップS508に進み、そうでない場合はステップS51
2に進む。
【0069】ステップS508でj=1であるかどうかを
判定する。jが1である場合はステップS510に進
み、1でない場合はステップS509に進む。ステップS
509で文字列「AND」をi番目の表題欄に追加し、ス
テップS510に進む。ステップS510でID[j]に対
する概念見出しをi番目の表題欄に追加し、ステップS
511に進む。ステップS511でjを1インクリンメン
トし、ステップS507に戻る。ステップS507からス
テップS511の繰り返しにより、すべての構成要素に
付する処理を終えると、ステップS712に進む。
【0070】ステップS512でiを1インクリメント
し、ステップS504に戻る。ステップS504からステ
ップS512の繰り返しにより、分類結果リスト106b
のすべてについて表題を生成すると、処理を終える。
【0071】例えば、図10(a)に示す概念抽出結果リ
スト106bが表題生成部104に送られると、分類結
果りスト106bの表題欄には、図10bに示すような情
報が追加加される。
【0072】以上のようにして、表題生成部104は、
hの処理結果を受け取り、分類された文書群の概要を示
す表題を生成し、その結果を処理結果保持部106に記
憶する。
【0073】表題生成部104までの処理により処理結
果保持部106に記憶されている分類結果リスト106
b(図10(b))は、出力部105を介して、例えば、
図11に示すように画面表示される。ここでは、情報種
別として「WarningCase」と「GoodCase」を設け、各情
報種別ごとに文書群の表題と件数が示されている。ここ
で、下線のついた表題部分をクリックすると、図12に
示すように文書本体を参照することもできる。
【0074】次に、本発明に係る第2の実施形態を説明
する。
【0075】図13は本発明の第2の実施形態に係る業
務支援システムの構成を示す。なお、図13において、
図1と同一部分には同一符号を付し、異なる部分につい
てのみ説明する。すなわち、図13においては、分類定
義辞書108の代わりに因果関係定義辞書1303が追加
され、また図1における文書分類部103が文書分類部1
301に、表題生成部104が表題生成部1302に置
き換えられている。
【0076】概念抽出部102の処理は第1の実施形態
の場合と同じであるので、以下、文書分類部1301と
表題生成部1302の詳細についてフローチャートを用
いて説明する。
【0077】(d)文書分類部1301の処理動作 まず、文書分類部1301の処理動作を図14のフロー
チャートを参照して説明する。
【0078】まず、ステップS1401で、分類結果リ
スト106bを初期化し、ステップS1402に進む。ス
テップS1402で概念抽出結果リスト106aを読み込
み、ステップS1403に進む。ステップS1403で概
念抽出結果リスト106aに記憶される文書数を変数bun
sho_suにセットし、ステップS1404に進む。ステップ
S1404で因果関係定義辞書1303を読み込み、ステッ
プS1405に進む。このステップS1405の処理によ
り、因果関係定義辞書1303の内容が、変数IngaBunrui
ID, IngaID1,IngaD2,IngaKankei,IngaInfo,inga_suにセ
ットされる。すなわち、因果関係定義辞書1303のi行
目の分類IDがIngaBunruiID[i]に、概念ID1がIngaID1[i]
に、概念ID2がIngaID2[i]に、関係ラベルがIngaKankei
[i]、情報種別がIngaInfo[i]に各々セットされ、また、
因果関係定義辞書1303の行数がinga_suにセットされ
る。
【0079】ここで、図19に因果関係定義辞書1303
に記憶される情報の一例を示す。この情報は、分類ID、
概念ID1、概念ID2、概念1と概念2の関係を示す関係ラ
ベル、概念1と概念2の複合概念の与える情報種別から
構成されている。関係ラベル欄の「が」は逆接の関係、
「ので」は順接の関係を示している。
【0080】図14の説明に戻り、ステップS1405で
処理中の文書を示す変数iに初期値1をセットし、ステッ
プS1406に進む。ステップS1406でi<=bunsho_suで
あるかどうかを判定する。iがbunsho_suに等しいか小さ
い場合は、ステップS1407に進み、そうでない場合は
処理を終了する。
【0081】ステップS1407で処理中の因果関係定義
辞書1303の行を示す変数jに初期値1をセットし、ステ
ップS1408に進む。ステップS1408でj<=inga_su
であるかどうかを判定する。jがinga_suに等しいか小さ
い場合は、ステップS1409に進みそうでない場合はス
テップS1415に進む。
【0082】ステップS1409で、i番目の文書はIn
gaID1[j]とIngaID2[j]の両方を含むかどうかを判定す
る。両方とも含む場合はステップS1410に進む。そ
うでない場合はフテッブS1414に進む。
【0083】ステップS1410でIngaID1[j]の出現位
置<IngaID2[j]の出現位置であるかどうかを判定する。
この条件に合う場合はステップS1411に進む。そう
でない場合はステップS1414に進む、ステップS14
11で、分類結果リスト106bにIngaBunruiID[j]が存
在するかどうかを判定する。存在する場合はステップS
1413に進み、存在しない場合はステップS1412に
進む。
【0084】ステップS1412で分類結果リスト106
bにIngaBunruiID[j], IngaID1[j],IngaID2[j],IngaKank
ei[j],IngaInfo[j]を追加し、ステップS1413に進
む。ステップS1413で分類結果リスト106bのIngaB
unruiID[j]の欄に、i番目の文書の文書IDを追加し、ス
テップS1414に進む。
【0085】ステップS1414でjを1インクリメント
し、ステップS1408に戻る。ステップS1408から
ステップS1414の繰り返しにより、因果関係定義辞書
1303のすべて行との照合を終えると、ステップS141
5に進む。
【0086】ステップS1415でiを1インクリメント
し、ステップS1406に戻る。ステップS1406からス
テップS1415の繰り返しにより、すべての文書のチェ
ックを終えると、処理を終了する。
【0087】例えば、図9に示す概念抽出結果リスト1
06aが文書分類部1301に送られると、図20(a)に示
す分類結果リスト106bが作成される。ここで、分類
結果リスト106bは、番号、分類ID、文書ID、概念ID
1、概念ID2、関係ラベル、情報種別、表題から構成され
ている。1つの分類IDに対して複数の文書が該当する場
合には、カンマで区切って記述されている。なお、この
時点では表題欄は空欄である。
【0088】以上のようにして、文書分類部1301
は、因果関係定義辞書1303に記憶される情報を用い
て、概念抽出部102の処理結果を受け取り、異なった
分類軸に属す概念同士を組み合わせた複合概念を用いて
文書を分類し、その結果を処理結果持部106に記憶す
る。
【0089】(e)表題生成部1302の処理動作 次に、表題作成部1302の処理動作を図15のフローチ
ャートを参照して説明する。
【0090】まず、ステップS1501で分類結果リス
ト106bを読み込み、ステップS1502に進む。ステ
ップS1502で分類桔果リスト106bに記憶されるリ
スト件数を変数list_suにセットし、ステップS1503
に進む。ステップS1503で処理中のリストを示す変数
iに初期値1をセットし、ステップS1504に進む。ス
テップS1504でi<=list_suであるかどうかを判定す
る。iがlist_suに等しいか小さい場合はステップS150
5に進み、そうでない場合は処理を終了する。
【0091】ステップS1505で分類結果リスト106
bのi番目の概念ID1に対応する概念見出しを変数STR1
に、概念ID2に対応する概念見出しを変数STR2に、関係
ラベルをSTRBにセットし、ステップS1506に進む。ス
テップS1506でSTR1の語尾処理をい、ステップS150
7に進む。この語尾処理については後述する。ステップ
S15で変数STRにSTR1をコピーし、ステップS1508
に進む。ステップS1508で変数SにSTRBを追加し、
ステップS1509に進む。ステップS1509で変数STR
にSTR2を追加し、ステップS1510に進む。ステップ
S1510で分類詰果リスト106bのi番目の表題欄に
変数STRの内容を追加し、ステップS1511に進む。
【0092】ステップS1511でiを1インクリメント
し、ステップS1504に戻る。ステップS1504からス
テップS1511の繰り返しにより、分類結果リスト1
06bのすべてについて表題を生成すると、処理を終え
る。
【0093】ここで、STR1の語尾処理を図16のフロー
チャートを参照して説明する。
【0094】ステップS1601でSTR1の最後の文節が
名詞であるかどうかを判定する。名詞である場合はステ
ップS1602に進み、そうでない場合はステップS16
03に進む。ステップS1602で名詞の語尾処理を行
い、処理を終了する。
【0095】ステップS1603でSTR1の最後の文節が動
詞であるかどうかを判定する。動詞である場合はステッ
プS1604に進み、そうでない場合は処理を終了する。
ステップS1604で動詞の語尾処理を行い、処理を終了
する。
【0096】次に、名詞の語尾処理を図17のフロ一チ
ャートを参照して説明する。
【0097】ステップS1701でSTRBは文字「が」で
あるかを判定する。「が」である場合はステップS170
3に進み、そうでない場合はステップS1702に進
む。
【0098】ステップS1702でSTRBは文字列「の
で」であるかを判定する。「ので」である場合はステッ
プS1704に進み、そうでない場合は処理を終了する。
【0099】ステップS1703でSTR1に文字「だ」を追
加し、処理を終了する。ステップS1704でSTR1に文字
「な」を追加し、処理を終了する。
【0100】次に、動詞の語尾処理を図18のフローチャ
ートを参照して説明する。
【0101】ステップS1801からステップS1804
において、動詞の活用の種類を判定する。すなわち、ス
テップS1801でSTRの最後の文節が一段動詞であるか
どうかを測定する。一段動詞である場合にはステップS
1805に進み、そうでない場合にはステップS1802
に進む。ステップS1802でSTR1の最後の文節がサ変
動詞であるかどうかを判定する。サ変動詞である場合に
はステップS1806に進み、そうでない場合にはステ
ップS1803に進む。
【0102】ステップS1803でSTR1の最後の文節が
カ変動詞であるかどうかを判定する。カ変動詞である場
合にはステップS1805に進み、そうでない場合には
ステップS1804に進む。
【0103】ステップS1804てSTR1の最後の文章節
が五段動詞であるかどうかを判定する。五段動詞である
場合にはステップS1808に進み、そうでない場合に
は処理を終了する。
【0104】動詞が一段動詞である場合には、ステップ
S1805でSTR1の最後尾の文字「る」を「た」に置換
し、処理を終了する。
【0105】動詞がサ変動詞である場合には、ステップ
S1806でSTR1の最後尾の文字列「する」を「した」
に置換し、処理を終了する。
【0106】動詞がカ変動詞である場合には、ステップ
S1807でSTR1の最後尾の文字列「くる」を「きた」
に置換し、処理を終了する。
【0107】動詞が五段動詞である場合には、ステップ
S1808からステップS1811において、活用の行を判
定する。すなわち、ステップS1808で、活用行がカ
行またはガ行であるかどうかを判定する。そうである場
合はステップS1812に進み、そうでない場合はステ
ップS1809に進む。
【0108】ステップS1809で、活用行がサ行であ
るかどうかを判定する。そうである場合はステップS18
13に進み、そうでない場合はステップS1810に進
む。
【0109】ステップS1810で、活用行がタ行また
はラ行またはワ行であるかどうかを判定する。そうであ
る場合はステップS1814に進み、そうでない場合はス
テップS1811に進む。
【0110】ステップS1811で、活用行がナ行また
はマ行であるかどうかを判定する。そうである場合はス
テップS1815に進み、そうでない場合は処理を終了
する。
【0111】ステップS1812で最後尾の1文字を
「いた」に置換し、処理を終了する。
【0112】ステップS1813で最後尾の1文字を
「した」に置換し、処理を終了する。
【0113】ステップS1814で最後尾の1文字を
「った」に置換し、処理を終了する。
【0114】ステップS1815で最後尾の1文字を
「んだ」に置換し、処理を終了する。
【0115】例えば、図20(a)に示す分類結果リス
ト106a が表題生成部1302に送られると、分類結
果リスト106bの表題欄には、図20(b)に示すよう
な情報が追加される。
【0116】このように、第2の実施形態によると適切
な接続詞を含んだ表現を生成することができる。さら
に、第1の実施形態では分類「A001&R001」に
まとめられていた内容が、第2の実施形態によると、分
類ID「BR001」すなわち「A001&が&R00
1」と、分類ID「BR008」すなわち「R001&
ので&A001」に分離される。つまリ、「あるアクシ
ョンに対する結果」と「ある結果に対するアクション」
の2つが区別されるようになり、より精度の高い分類を
行うことができる。
【0117】以上のようにして、表題生成部1302
は、分書分類部1301の処理結果を受け取り、分類さ
れた文書群の概要を示す表題を生成し、その結果を処理
結果保持部106に記憶する。
【0118】表題生成部1002までの処理により処理
結果保持部106に記憶されている分類結果リスト10
6b(図20(b))は、出力部105を介して、例えば、
図21に示すように画面表示される。
【0119】次に、本発明に係る第3の実施形態を説明
する。
【0120】図22は本発明の第3の実施形態に係る業
務支援システムの構成を示す。なお、図22において、
図1および図13と同一部分には同一符号を付し、異なる
部分についてのみ説明する。すなわち、図22において
は、図1における分類定義辞書108あるいは図13おけ
る因果関係定義辞書1303の代わりに、接続関係定義辞
書2203が追加され、また図1における概念抽出部1
02が概念抽出部2201に、文書分類部103が文書
分類部2202に置き換わっている。
【0121】第1および第2の実施形態と異なる部分、
すなわち、概念抽出部2201と文書分類部2202の
詳細についてフローチャートを用いて説明する。
【0122】(f)概念抽出部2201の処理動作 概念抽出部2201の処理動作を図23のフローチャー
トを参照して説明する。
【0123】まず、ステップS2301で、概念抽出結
果リスト106aを初期化しステップS2302に進
む。ステップS2302で概念定義辞書107を読み込
み、ステップS2303に進む。このステップS230
3の処理により、概念定義辞書107のうち処理に必要
な情報が、変数DIC_id, DIC_hyogen,DIC_info,midasi_s
uにセットされる。すなわち、概念定義辞書107のi行
目の概念IDがDIC_id[i]に、表現がDIC_hyogen[i]に、情
報種別がDIC_info [i]にセットされ、概念定義辞書10
7の行数がmidasi_suにセットされる。
【0124】ステップS2303で接続関係定義辞書2
203を読み込み、ステップS2304に進む。この処理
により、接続関係定義辞書2203のうち処理に必要な
情報が、変数REL_id,REL_hyogen.rel_suにセットされ
る。すなわち、接続関係定義辞書2203のi行目の概念
IDがREL_id[i]に、表現がREL_hyogen[i]にセットされ、
接続種別2203の行数がrel_suにセットされる。
【0125】ここで、図25に接続関係定義辞書220
3に記憶される情報の一例を示す。この情報は、関係ID
を示す記号、関係見出し、関係を表す表現から構成され
る。ここでは関係を表す表現を正規表現で記述している
が、例えば、形態素解析や構文解析の処理結果にアクセ
スするようにしてもよい。
【0126】図23の説明に戻り、ステップS2304
で処理中の文書を示す変数iに初期値1をセットし、ステ
ップS2305に進む。ステップS2305で、未処理の
文書が残っているかを判定する。残っていない場合は処
理を終了する。残っている場合はステップS2306に
進む。ステップS2306でi番目の文書を読み込み、
ステップS2307に進む。ステップS2307で概念抽
出結果リスト106aに、処理中の文書の文書IDを追加
し、ステップS2308に進む。
【0127】ステップS2308で処理中の概念定義辞
書107の行を示す変数jに初期値1をセットし、ステッ
プS2309に進む。ステップS2309でjがj<=midasi
_suであるかどうかを判定する。jがmidasi_su に等しい
か小さい場合は、ステップS2310に進む。そうでな
い場合はステップS2313に進む。
【0128】ステップS2310で、i番目の文章がDI
C_hyogen[j]に適合する部分文字列を含んでいるかどう
かを判定する。そうである場合はステップS2311に
進み、そうでない場合はステップS2312に進む。ス
テップS2311で概念抽出結果リスト106aにDIC_i
d[j],文書中でのDIC_hyogen[j]の出現位置、DIC_info
[j]を追加し、ステップS2312に進む。
【0129】ステップS2312でjを1インクリメント
し、ステップS2309に戻る。ステップS2309から
ステップS2312の繰り返しにより、i番目の文書に
ついて概念定義辞書107のすべての概念に対する照合
を行うと、ステップS2312に進む。
【0130】ステップS2313で処理中の接続関係定
義辞書2203の行を示す変数kに初期値1をセットし、
ステップS2314に進む。ステップS2314でk<=rel
_suであるかどうかを判定する。kがrel_suに等しいか小
さい場合は、ステップS2315に進む。そうでない場
合はステップS2318に進む。
【0131】ステップS2315で、i番目の文書がREL
_hyogen[k]に適合する部分文字列を含んでいるかどうか
を判定する。そうである場合はステップS2316に進
み、そうでない場合はステップS2317に進む。ステ
ップS2316で、概念抽出結果リスト106aの同じ文
書IDの欄に、REL_id[k]と文書中でのREL_hyogen[k]の出
現位置を追加し、ステップS2317に進む。
【0132】ステップS2317でkを1インクリメント
し、ステップS2314に戻る。ステップS2314から
ステップS2317の操り返しにより、i番目の文書につ
いて接続関係定義辞書2203のすべての関係に対する
照合を行うと、ステップS2318に進む。ステップS
2318でiを1インクリメントし、次の文書の処理に移
る。
【0133】例えば、図8に示す文書群が概念抽出部2
201に送られると、図26に示す概念抽出結果リスト
106aが作成される。ここで、概念抽出結果リスト1
06aは、番号、文書ID、抽出された概念IDとその出現
位置、および関係IDとその出現位置から構成されてい
る。概念IDとその出現位置、および関係IDとその出現位
置は、各々コロンで区切って記述されている。また、1
文書内に複数の概念が抽出された場合には、カンマで区
切って記述されている。
【0134】以上のようにして、概念抽出部2201は
概念定義辞書107と接続関係定義辞書2203に記憶
される情報を用いて、文書入力部101から受け取った
各文書に含まれる概念と接続関係を抽出し、その結果を
処理結果保持部106に記憶する。
【0135】(g)文書分類部2202の処理動作 次に、文書分類部2202の処理動作を図24のフロ一
チャートを参照して説明する。
【0136】まず、ステップS2401で、分類結果リ
スト106bを初期化し、ステップS2402に進む。
ステップS2402で概念抽出結果リスト106aを読
み込みステップS2403に進む。ステップS2403で
概念抽出結果リスト106aに記憶される文書数を変数b
unsho_suにセットし、ステップS2404に進む。ステ
ップS2404で処理中の文書を示す変数iに初期値1を
セットし、ステップS2405に進む。ステップS240
5でi<=bunsho_suであるかどうかを判定する。iかbunsh
o_suに等しいか小さい場合は、ステップS2406に進
み、そうでない場合は処理を終了する。
【0137】ステップS2406でi番目の文書から抽出
された関係IDの数を変数numにセットし、ステップS2
407に進む。ステップS2407で処理中の関係を示す
変数jに初期値1をセットし、ステップS2408に進
む。ステップS2408でj<=numであるかどうかを判定
する、jがnumに等しいか小さい場合は、ステップS24
09に進み、そうでない場合はステップS2420に進
む。
【0138】ステップS2409で、i番目の文書の関
係IDを変数RELにセットし、ステップS2410に進
む。このステップS2410で、i番目の文書にRELの
出現位置より前側に出現する概念IDが存在するかどうか
を判定する。存在する場合はステップS2411に進
み、存在しない場合はステップS2419に進む。
【0139】ステップS2411でI番目の文書にREL
の出現位置より後側に出現する概念IDが存在するかどう
かを判定する。存在する場合はステップS2412に進
み、存在しない場合はステップS2419に進む。
【0140】ステップS2412でRELの出現位置に最も
近い前側の概念IDを変数id1に、その概念IDに対応する
情報種別を変数infolにセットし、ステップS2413に
進む。ステップS2413でRELの出現位置に最も近い後
側の概念IDを変数ID2に、その概念IDに応する情報種別
を変数info2にセットし、ステップS2414に進む。
【0141】ステップS2414で変数BunruiNowにID1
とRELとid2との「和」をセットする。ここで「和」と述
べているのは、倫理演算の和である。すなわち、Bunrui
Nowには、id1とRELとid2のすべての情報がセットされ
る。続いて、ステップS2415に進み、変数infoNowに
infolとinfo2の「和」をセットする。すなわち、infoNo
wには、info1とinfo2の両方の情報がセットされる。
【0142】続いて、ステップS2416に進み、ステ
ップS2416で、分類結果リスト106bにBunruiNow
が存在するかどうかを判定する。存在する場合はステッ
プS2418に進み、存在しない場合はステップS24
17に進む。ステップS2417で分類結果リスト106
bにBunruiNow, id1,id2,RELを追加し、ステップS24
18に進む。ステップS2418で分類結果リスト106
bのBunruiNowの欄に、i番目の文書の文書IDを追加し、
ステップS2419に進む。
【0143】ステップS2419でjを1インクリメント
し、ステップS2408に戻る。ステップS2408か
らステップS2419の繰り返しにより、1つの文書中の
すべての関係について処理を終えると、ステップS24
20に進む。ステップS2420でiを1インクリメント
し、次の文書の処理に移り、ステップS2405に戻
る。ステップS2405からステップS2420の繰り返
しにより、すべての文書のチェックを終えると、処理を
終了する。
【0144】例えば、図26に示す概念抽出結果リスト
106aが文書分類部2202に送られると、図27
(a)に示す分類結果リスト106bが作成される。ここ
で、分類結果リスト106bは、番号、分類、文書ID、
概念ID1、概念ID2、関係ID、情報種別、表題から構成さ
れている。1つの分類IDに対して、複数の文書が該当す
る場合には、カンマで区切って記述されている。なお、
この時点では表題欄は空欄である。
【0145】以上のようにして、文書分類部2202
は、概念抽出部2201の処理結果を受け取り、異なっ
た分類軸に属す概念同士を組み合わせた概念を用いて文
書を分類し、その結果を処理結果保持部106に記憶す
る。
【0146】文書分類部1301により作成された分類
結果リスト、106b(図20(a))と、文書分類部2
202により作成された分類結果リスト106b(図2
7(a))との違いは、図20(a)における「関係ラベ
ル」が、図27(a)における「関係ID」に置き換わっ
ている点である。したがって、接続関係定義辞書220
3を参照して、関係IDから対応する関係ラベルを取り出
すことにより、表題生成部1302と同じ処理を適用で
きる。その結果、分類結果リスト106bの表題欄に
は、図27(b)に示すような情報が追加される。
【0147】さらに、処理対象の文書が報告日付のよう
な属性情報を保持している場合に、以上説明したような
文書分類および表題生成の結果とともに、図28に示す
ように属性情報を提示することもできる。
【0148】次に、本発明に係る第4の実施形態を説明
する。
【0149】本発明の第4の実施形態も図1に示される
業務支援システムが用いられる。第4の実施形態では、
第一の実施形態とは概念抽出部103の処理動作が異る
ので、これについて説明するが、第1の実施形態と処理
が同じ処理部の動作については省略する。
【0150】図29はシステムに入力される文書群の例
を示す。この例では、5つの文書が含まれており、各文
書は文書ID、日付、担当者、本文から成る。この文書で
は、本文から抽出される概念が一つである記述が見ら
れ、単独に文書について処理しただけでは、アクション
と結果の組合わせを抽出できないため、情報種別が収得
できない。このようなケースでは、文書を日付順に見る
ことによって、アクションと結果の組合せを読み取る。
図29の例では、中村洋子が1999/9/1にサンプルを
つけるアクションを起こしているが、ここにはその結果
は記述されておらず、1999/9/15によってある結果
を示す記述が見られる。これらを組み合わせることによ
って、あるアクションによってある結果が得られたとい
う情報種別を取得することができる。
【0151】このような複数文書から概念、情報種別を
取得する処理の流れを説明する。図29のような文書が
入力されると概念抽出部102で図2に示すような概念
抽出を行なう。その後、さらに異なる文書IDの抽出結果
を概念のセットにまとめる処理を行なう。図32は概念
抽出部103の図2の処理以降の処理を示すフローチャ
ートである。まず、図2の処理で生成された概念抽出結
果を日付順にソートし、一つずつ結果(番号==I)を取り
出す。抽出された概念が単独であり、かつ分類軸が「ア
クション」であれば、その結果と同じ担当者IDを持つ結
果(番号)を取り出す。番号Jの抽出された概念の分類
軸が「結果」であれば、文書ID同士を“+”で結合し、
新しい文書IDとし、番号==Iの抽出結果の「文書ID」を
差し替える。また、番号==Iの抽出結果の「概念ID:出
現位置」に、番号Jのデータを追加する。その結果、図
30に示す概念抽出結果リストが作成される。図30
は、番号、文書ID、概念ID、出現位置から成る。文書ID
は、複数文書の組合せである場合はもとの文書IDを
「+」で結合したIDになっている。たとえば、番号1
は、担当者が中村洋子である文書FILE001とFILE004を結
合した概念である。また、概念ID:出現位置は、最初の
文書における抽出概念の出現蝪所と2番目の文書におけ
る抽出概念の出現位置をコンマで区切って登録してい
る。
【0152】この結果に対して、文書分類部103の処
理を施した結果を図31に示す。図31に示すように、図
29において各々中村洋子と山田花子が記述した2つの
文書が各々番号1と番号3の分類にまとめられている。
【0153】なお、本発明は、上記実施形態に限定され
ず、要旨を変更しない範囲で適宜変更して実施可能であ
る。また、上述した実施形態において記憶した手法は、
コンピュータに実行させるプログラムとして、例えば、
磁気ディスク(フロッピーディスク、ハードディスク
等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記
録媒体に書き込んで各種装置に適用したり、通信媒体に
より伝送して各種装置に適用することも可能である。本
装置を実現するコンピュータは、記録媒体に記録された
プログラムを読み込み、このプログラムによって動作が
制御されることにより、上述した処理を実行する。
【0154】
【発明の効果】本発明によれば、少なくともアクション
と結果を含む複数の分類軸を設定して概念の抽出を行
い、抽出された概念を用いて文章形式で記述されたデー
タを自動的に分類するとともに、分類されたデータの概
要を示す表題を生成することにより、管理者の業務上の
意志決定を支援する情報を提供することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係わる業務支援シス
テムの概略構成を示すブロック図。
【図2】同実施形態における概念抽出部102の処理動
作を示すフロ一チャート。
【図3】同実施形態における文書分類部103の処理動
作を示すフローチャート。
【図4】同実施形態における分類項目作成処理を示すフ
ロ一チャート。
【図5】同実施形態における表題作成部104の処理動
作を示すフローチャート。
【図6】概念定義辞書107に記憶される情報の一例。
【図7】分類定義辞書108に記憶される情報の一例。
【図8】入力される文書群の例。
【図9】同実施形態における概念抽出結果リスト106
aに記憶される情報の一例。
【図10】同実施形態における分類結果リスト106b
に記憶される情報の一例。
【図11】同実施形態における画面表示の例。
【図12】同実施形態における画面表示の例。
【図13】本発明の第2の実施形態に係る業務支援シス
テムの構成を示すブロック図。
【図14】同実施形態における文書分類部1301の処
理動作を示すフローチャート。
【図15】同実施形態における表題作成部1302の処
理動作を示すフローチャート。
【図16】同実施形態におけるSTR1の語尾処理を示すフ
ローチャート。
【図17】同実施形態における名詞の語尾処理を示すフ
ローチャート。
【図18】同実施形態における動詞の語尾処理を示すフ
ローチャート。
【図19】因果関係定義辞書1303に記憶される情報の
一例。
【図20】同実施形態における分類結果リスト106b
に記憶される情報の一例。
【図21】同実施形態における画面表示の例。
【図22】本発明の第3の実施形態に係る業務支援シス
テムの構成を示すブロック図。
【図23】同実施形態における概念抽出部2201の処
理動作を示すフローチャート。
【図24】同実施形態における文書分類部2202の処
理動作を示すフローチャート。
【図25】接続関係定義辞書2203に記憶される情報
の一例。
【図26】同実施形態における概念抽出結果リスト10
6aに記憶される情報の一例。
【図27】同実施形態における分類結果リスト106b
に記憶される情報の一例。
【図28】画面表示の例。
【図29】第4の実施形態において入力される文書群の
例。
【図30】同実施形態における概念抽出結果リスト10
6aに記憶される情報の一例。
【図31】同実施形態における分類結果リスト106b
に記憶される情報の一例。
【図32】同実施形態における概念抽出部102の処理
動作を示すフローチャート。
【符号の説明】
101…文書入力部 102…概念抽出部 103…文書分類部 104…表題生成部 105…出力部 106…処理絡果保持部 107…概念定義辞書 108…分類定義辞書 1301…文書分類部 1302…表題生成部 1303…因果関係定義辞書 2201…概念抽出部 2202…文書分類部 2203…接続関係定義辞書
フロントページの続き Fターム(参考) 5B009 ME21 QA05 QA09 5B049 EE02 FF01 5B075 ND03 NK32 NR12 NS01 PQ02 QM07 UU05

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属する概念と該概念を表す表現とを対応
    づけた概念定義辞書と、 前記概念定義辞書を用いて前記入力手段より入力された
    各文書に含まれる概念を抽出する概念抽出手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類に属す概念同土を組み合わせた複合概念を用いて前
    記入力された文書を分類する文書分類手段と、 前記文書分類手段によって分類された結果を表示する表
    示手段と、 を具備したことを特徴とする業務支援システム。
  2. 【請求項2】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属す概念と、該概念を表す表現と、該概
    念の与える情報種別とを対応づけた概念定義辞書と、 前記概念定義辞書を用いて前記入力手段より入力された
    各文書中に含まれる概念を抽出する概念抽出手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類軸に属す概念同士を組み合わせた複合概念を用い
    て、前記入力された文書を分類する文書分類手段と、 前記複合概念を用いて、前記分類された文書群の与える
    情報種別を判定する情報種別判定手段と、 前記判定された情報種別と共に前記分類結果を表示する
    表示手段と、 を具備したことを特徴とする業務支援システム。
  3. 【請求項3】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属す概念と該概念を表す表現とを対応づ
    けた該概念定義辞書と、 概念同士の因果関係を記述した因果関係定義辞書と、 前記概念定義辞書を用いて前記入力手段より入力された
    各文書中に含まれる概念を抽出する概念抽出手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類軸に属す概念同士を組み合わせた複合概念を用い
    て、前記入力された文書を分類する文書分類手段と、 前記概念抽出手段により抽出された概念と前記因果関係
    定義辞書を用いて、前記分類された文書群の概要を示す
    表題を生成する表題生成手段と、 前記生成された表題と共に前記分類された結果を表示す
    る表示手段と、 を具備したことを特徴とする業務支援システム。
  4. 【請求項4】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属す概念と該概念を表す表現とを対応づ
    けた概念定義辞書と、 概念同士の因果関係および該概念と該因果関係の組合せ
    が与える情報種別とを記述した因果関係定義辞書と、 前記概念定義辞書を用いて、前記入力手段より入力され
    た各文書中に含まれる概念を抽出する概念抽出手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類軸に属す概念同士を組み合わせた複合概念を用い
    て、前記入力された文書を分類する文書分類手段と、 前記概念抽出手段により抽出された概念と前記因果関係
    定義辞書を用いて、前記分類された文書群の概要を示す
    表題を生成する表題生成手段と、 前記概念抽出手段により抽出された概念と前記因果関係
    定義辞書を用いて、前記分類された文書群の与える情報
    種別を判定する情報種別判定手段と、 前記生成された表題および前記判定された情報種別とと
    もに前記分類された結果を表示する表示手段と、 を具備したことを特徴とする業務支援システム。
  5. 【請求項5】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属する概念と該概念を表す表現とを対応
    づけた概念定義辞書と、 前記概念定義辞書を用いて、前記入力手段より入力され
    た各文書中に含まれる概念を抽出する概念抽出手段と、 前記入力手段により入力された各文書中に含まれる接続
    関係とこの接続関係を表す表現とを対応付けた接続関係
    定義辞書と、 前記接続関係定義辞書を用いて、前記入力手段より入力
    された各文書中に含まれる接続関係を抽出する接続関係
    抽出手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類軸に属す概念同士と前記接続関係抽出手段により抽
    出された接続関係とを組み合わせた複合概念を用いて、
    前記入力された文書を分類する文書分類手段と、 前記文書分類手段によって分類された結果を表示する表
    示手段と、 を具備したことを特徴とする業務支援システム。
  6. 【請求項6】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属す概念と該概念を表す表現とを対応づ
    けた概念定義辞書と、 前記入力手段により入力された各文書中に含まれる接続
    関係とこの接続関係を表す表現とを対応付けた接続関係
    定義辞書と、 前記接続関係定義辞書を用いて、前記入力手段より入力
    された各文書中に含まれる接続関係を抽出する接続関係
    抽出手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類軸に属す概念同士と前記接続関係抽出手段により抽
    出された接続関係とを組み合わせた複合概念を用いて、
    前記入力された文書を分類する文書分類手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類軸に属す概念同士と前記接続関係抽出手段により抽
    出された接続関係とを用いて、前記分類された文書群の
    概要を示す表題を生成する表題生成手段と、 前記生成された表題と共に前記分類された結果を表示す
    る表示手段と、 を具備したことを特徴とする業務支援システム。
  7. 【請求項7】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属す概念と該概念を表す表現とを対応づ
    けた概念定義辞書と、 前記入力手段より入力された各文書中に含まれる接続関
    係と該関係を表す表現とを対応づけた接続関係定義辞書
    と、 前記概念定義辞書を用いて、前記入力手段より入力され
    た各文書中に含まれる概念と該出現位置を抽出する概念
    抽出手段と、 前記接続関係定義辞書を用いて各文書中に含まれる接続
    関係と該出現位置を抽出する接続関係抽出手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類軸に属す概念同士と前記関係表現抽出手段により抽
    出された接続関係とを出現位置を参照して組み合わせた
    複合概念を用いて前記入力された文書を分類する文書分
    類手段と、 前記概念抽出手段により抽出された概念と該出現位置お
    よび前記接続関係抽出手段により抽出された接続関係と
    該出現位置を用いて、前記分類された文書群の概要を示
    す表題を生成する表題生成手段と、 前記生成された表題と共に前記分類された結果を表示す
    る表示手段と、 を具備したことを特徴とする業務支援システム。
  8. 【請求項8】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属す概念と該概念を表す表現とを対応づ
    けた概念定義辞書と、 前記概念定義辞書を用いて、前記入力手段より入力され
    た各文書中に含まれる概念を抽出する概念抽出手段と、 前記概念抽出手段により抽出された概念のうち、異なる
    分類軸に属す概念同士を組み合わせた複合概念を用い
    て、前記文書の概要を示す表題を生成する表現生成手段
    と、 前記表題生成手段によって生成された表題を表示する表
    示手段と、 を具備したことを特徴とする業務支援システム。
  9. 【請求項9】 複数の文書を入力する入力手段と、 少なくともアクションと結果を含む複数の分類軸を設定
    し、各分類軸に属する概念と該概念を表す表現とを対応
    づけた概念定義辞書と、 前記概念定義辞書を用いて、前記入力手段より時間的な
    流れで入力された各文書に含まれる概念を抽出する概念
    抽出手段と、 前記概念抽出手段により抽出された概念のうち、時間的
    な流れで異なる分類に属す概念同士を組み合わせた複合
    概念を用いて前記入力された文書を分類する文書分類手
    段と、 前記文書分類手段によって分類された結果を表示する表
    示手段と、 を具備したことを特徴とする業務支援システム。
JP33211499A 1999-11-22 1999-11-22 業務支援システム Pending JP2001147937A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33211499A JP2001147937A (ja) 1999-11-22 1999-11-22 業務支援システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33211499A JP2001147937A (ja) 1999-11-22 1999-11-22 業務支援システム

Publications (1)

Publication Number Publication Date
JP2001147937A true JP2001147937A (ja) 2001-05-29

Family

ID=18251321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33211499A Pending JP2001147937A (ja) 1999-11-22 1999-11-22 業務支援システム

Country Status (1)

Country Link
JP (1) JP2001147937A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007257149A (ja) * 2006-03-22 2007-10-04 Ricoh Co Ltd 文書処理装置及び文書処理方法
JP2008524712A (ja) * 2004-12-17 2008-07-10 ゼネラル・エレクトリック・カンパニイ ドメイン特定のデータ・エンティティ・マッピング方法及びシステム
WO2015064713A1 (ja) * 2013-10-31 2015-05-07 富士通株式会社 情報提示方法、装置、及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02254566A (ja) * 1989-03-29 1990-10-15 Nippon Telegr & Teleph Corp <Ntt> 自動抄録生成装置
JPH0934719A (ja) * 1995-07-21 1997-02-07 Hitachi Ltd データ分析装置
JPH0944497A (ja) * 1995-07-28 1997-02-14 Maruzen Kk タイトル文作成装置
JPH0991314A (ja) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd 情報探索装置
JPH09218878A (ja) * 1996-02-14 1997-08-19 Fuji Xerox Co Ltd 情報提示装置
JPH11184698A (ja) * 1997-12-25 1999-07-09 Hitachi Ltd 改良ルール生成方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02254566A (ja) * 1989-03-29 1990-10-15 Nippon Telegr & Teleph Corp <Ntt> 自動抄録生成装置
JPH0991314A (ja) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd 情報探索装置
JPH0934719A (ja) * 1995-07-21 1997-02-07 Hitachi Ltd データ分析装置
JPH0944497A (ja) * 1995-07-28 1997-02-14 Maruzen Kk タイトル文作成装置
JPH09218878A (ja) * 1996-02-14 1997-08-19 Fuji Xerox Co Ltd 情報提示装置
JPH11184698A (ja) * 1997-12-25 1999-07-09 Hitachi Ltd 改良ルール生成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"大量のテキストからの知識マイニング", 情報処理学会研究報告, vol. 99, no. 86, CSNG200100186002, 15 October 1999 (1999-10-15), ISSN: 0000741171 *
那須川哲哉,諸橋正幸,長野徹: "フィールドを広げる自然言語処理", 情報処理 第40巻 第4号 第358−364頁, CSNG200001213002, 5 April 1999 (1999-04-05), JP, ISSN: 0000741170 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008524712A (ja) * 2004-12-17 2008-07-10 ゼネラル・エレクトリック・カンパニイ ドメイン特定のデータ・エンティティ・マッピング方法及びシステム
JP2007257149A (ja) * 2006-03-22 2007-10-04 Ricoh Co Ltd 文書処理装置及び文書処理方法
WO2015064713A1 (ja) * 2013-10-31 2015-05-07 富士通株式会社 情報提示方法、装置、及びプログラム
JPWO2015064713A1 (ja) * 2013-10-31 2017-03-09 富士通株式会社 情報提示方法、装置、及びプログラム
US10692008B2 (en) 2013-10-31 2020-06-23 Fujitsu Limited Assessing and selecting decision making entities for acquiring and presenting information

Similar Documents

Publication Publication Date Title
CN102640145B (zh) 可信查询***和方法
Hockey The history of humanities computing
JP7400334B2 (ja) 生成装置、及び生成プログラム
CN104584005A (zh) 文档分类装置及文档分类方法
CN110807091A (zh) 一种酒店智能问答推荐与决策支持分析方法及***
CA2360067A1 (en) Any-to-any component computing system
CN109947897B (zh) 司法案件事件树构建方法
US20190213208A1 (en) Interactive patent visualization systems and methods
Barbaresi Ad hoc and general-purpose corpus construction from web sources
JP2006091994A (ja) 文書情報処理装置および方法、文書情報処理プログラム
US20210240334A1 (en) Interactive patent visualization systems and methods
JP2001147937A (ja) 業務支援システム
Scheuch et al. The general inquirer approach to an international retrieval system for survey archives
Roberts-Witt Practical taxonomies
Venezky Storage, retrieval, and editing of information for a dictionary
Yoshioka et al. HUKB at COLIEE2018 information retrieval task
Stanley-Baker et al. Mapping drugs across epistemic and geographic domains: A case study for early medieval China
Reisenbichler et al. Supporting content marketing with natural language generation
Poulter The ‘Europeanisation’of cataloguing codes: an analysis of the evolution of RDA
Mathis Techniques for the evaluation and improvement of computer-produced abstracts
Vasiliev et al. Application of text mining technology to solve project management problems
Gontarski Still at Issue after All These Years: The Beckettian Text, Printed and Performed
JP3764618B2 (ja) 文書情報抽出装置および文書分類装置
Kurian A review on the progress of natural language processing in India
JP5555483B2 (ja) ドキュメント分析システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060724

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060822