JPH08255172A - 文書検索システム - Google Patents

文書検索システム

Info

Publication number
JPH08255172A
JPH08255172A JP7083458A JP8345895A JPH08255172A JP H08255172 A JPH08255172 A JP H08255172A JP 7083458 A JP7083458 A JP 7083458A JP 8345895 A JP8345895 A JP 8345895A JP H08255172 A JPH08255172 A JP H08255172A
Authority
JP
Japan
Prior art keywords
sentence
excerpt
data
document
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7083458A
Other languages
English (en)
Inventor
Tetsuya Sakai
哲也 酒井
Seiji Miike
誠司 三池
Kazuo Sumita
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7083458A priority Critical patent/JPH08255172A/ja
Priority to US08/610,631 priority patent/US5761666A/en
Publication of JPH08255172A publication Critical patent/JPH08255172A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 (修正有) 【目的】検索された文書の全文から所望の抜粋文や情報
のみを抽出して表示できるようにして、利用者の文書検
索作業に要する負荷の軽減化を図ることにある。 【構成】文書を構成する原文データを格納した原文デー
タベース6から、例えば意見、提言等のように文章の内
容を識別するための複数種類の文の型を設定し、この各
文の型に分類した文単位の抜粋文データを作成し、抜粋
文データベース5として格納する原文加工部20を備え
た文書検索システムである。原文加工部20は、指定さ
れた文の型に対応する抜粋文データを抽出する型判定部
と、抜粋文データを例えば接続詞を除去したような所定
の形式に整形する整形部とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、特に文書単位に文書情
報を検索するシステムにおいて、文書の原文を加工処理
して得られた抜粋文または抜粋情報を検索する機能を備
えた文書検索システムに関する。
【0002】
【従来の技術】従来、フルテキストサーチ方式の文書検
索システムは、文書データベースから必要な文書や情報
を検索する場合に、文書を構成する文字または単語の全
てを検索対象とするため、例えばキーワード検索方式と
比較して、キーワードを付与する作業を必要せず、また
利用者がそのキーワードに精通している必要がないなど
の利点を備えている。
【0003】しかしながら、フルテキストサーチ方式で
は入力した単語や文章等の検索要求に対して、その検索
要求に合致する文書数と文書データ量は膨大である。こ
の方式では、検索処理により検索要求に合致する各文書
の全文が、そのままの状態で表示画面上に表示される。
利用者は、表示画面上で検索された各文書の全文を確認
し、この中から必要な文書または情報(文章や単語から
なる)を取出すことになる。
【0004】したがって、利用者は、検索された膨大な
量の文書の原文に目を通す必要があるため、必要な文書
や情報を得るまでに多大な時間と労力が必要となる。こ
のような問題点を解消するためには、検索された文書の
原文から必要な文や情報のみを抽出して、見易い形式で
表示画面上に表示するシステムが望ましい。
【0005】近年、文書から自動的に抄録や要約を作成
する技術を開発されており、この技術を利用して検索さ
れた文書中から重要文のみを抽出して表示するシステム
が実現されている。また、文書中から例えば結論に相当
する章または項の文章を抽出して表示するシステムも開
発されている。
【0006】このようなシステムにおいても、同一文書
の中でどれが重要文または重要情報であるかは、観点の
相違や個人差に左右されるので、必ずしも利用者にとっ
て適切な文や情報が抽出されるとは限らない。また、例
えば結論に相当する章または項の文章が抽出されても、
その中に必要な文や情報が含まれているとは限らない。
さらに、重要文のみを抄録として表示するシステムで
は、接続詞などによる文間の関係が壊され、誤解を生む
ような文等が表示される可能性がある。
【0007】
【発明が解決しようとする課題】前述したように、従来
の文書検索システムでは、膨大な量の検索結果から必要
な文書や情報を取出すため、利用者には多大な時間と労
力が必要となり、負担が大きい。また、文書中から抄録
や要約を作成したり、指定の章または項の部分を抽出す
る技術を利用して、検索された文書から抜粋部分を表示
するシステムが開発されている。しかし、表示された抜
粋部分が、利用者にとって必ずしも適切であるとは限ら
ず、結果的に利用者の必要な抜粋文や情報が得られない
場合も多い。
【0008】本発明の第1の目的は、検索された文書の
全文から所望の抜粋文や情報のみを抽出して表示できる
ようにして、利用者の文書検索作業に要する負荷の軽減
化を図ることにある。
【0009】本発明の第2の目的は、同一文書に対して
様々な観点や基準に基づいて抜粋文や情報を抽出して表
示できるようにして、多様な検索目的に応じた検索処理
を実現することにある。
【0010】本発明の第3の目的は、検索された文書の
全文から所定の基準に基づいて抜粋文や情報のみを抽出
して表示する場合に、優先度の順序に従って表示する抜
粋文や情報の量を調整できる検索処理を実現することに
ある。
【0011】
【課題を解決するための手段】本発明は、文書を構成す
る原文データを格納した原文データベースから、例えば
意見、提言等のように文章の内容を識別するための複数
種類の文の型を設定し、この各文の型に分類した文単位
の抜粋文データを作成し、抜粋文データベースとして格
納する手段を備えた文書検索システムである。さらに、
本システムは、抜粋文データを例えば接続詞を除去した
ような所定の形式に整形する整形手段と、指定された文
の型に対応する抜粋文データを抽出する抽出手段と、抽
出された全ての抜粋文データを一覧的に表示する表示手
段とを備えている。
【0012】
【作用】本発明では、利用者が予め設定されている複数
の文の型から所望の型を選択すると、抽出手段は抜粋文
データベースから文の型に対応する抜粋文データを抽出
する。例えば意見、提言の文の型を選択すると、検索さ
れた文書からその型に分類された全ての抜粋文データが
抽出される。表示手段は、抽出された全ての抜粋文デー
タを一覧的に表示する。これにより、利用者は、表示画
面上において、例えば意見、提言の文の型に含まれる抜
粋文データのみを確認するだけで、必要な文章や情報を
得ることができる。また、利用者は文の型を変更するだ
けで、変更した文の型に含まれる抜粋文データを表示画
面上で得ることができる。したがって、文の型を指定す
るだけで、利用者の必要な文、情報、およびそれらを含
む文書を簡単に検索することができることになる。
【0013】
【実施例】以下図面を参照して本発明の実施例を説明す
る。 (システムの構成)図1は本実施例に係わる文書検索シ
ステムの要部を示すブロック図である。
【0014】本システムは概略的に、本実施例の文書検
索処理に関係する各種処理及びシステム全体の制御を行
なう中央処理部(CPU)1、表示コントローラ2、表
示部3、記憶部4、入力コントローラ10および入力部
11からなる。
【0015】表示部3は例えば液晶ディスプレイからな
り、表示コントローラ2の制御により検索結果や文書等
を表示する表示画面を有する。入力部11は入力コント
ローラ10の制御により、検索命令や各種の選択、指定
等の入力を行なうキーボード11aとマウス11bを有
する。
【0016】記憶部4は、CPU1の各種処理を行なう
ためのメインメモリ(RAM)、及びハードディスク装
置等のファイル装置からなり、後述する本実施例に関係
する抜粋文データベース5、原文データベース6、単語
インデックス7、型判定用辞書8及び接続詞辞書9を格
納している。 (第1の実施例)前記のシステムにおいて、第1の実施
例として図2に示すような機能ブロック図を示す。図2
において、原文加工部20、検索部21、抜粋部22、
インターフェース部23および抜粋インターフェース2
3aは、CPU1が実行するプログラムに対応してい
る。
【0017】インターフェース部23は、利用者の検索
要求をキーワード、あるいは自然言語からなる文または
文章の形式で受付け、これを検索部21に渡す。検索部
21は、原文データベース6及び単語インデックス7を
参照し、該当する文書のリストやその内容を検索結果と
してインタフェース部23に渡す。インタフェース部2
3はその検索結果を表示部3の表示画面上で、利用者に
提示する。
【0018】インターフェース部23に組込まれている
抜粋インターフェース23aは、検索結果として提示さ
れる個々の文書の全文の中から、利用者の指定した文の
型に対応する文のみを抜粋して表示画面上に表示する機
能を有する。
【0019】利用者が文の型を選択すると、抜粋インタ
フェース23aは選択された型を抜粋部22に渡す。抜
粋部22は、原文データベース6及び抜粋文データベー
ス5を参照し、全文の中から該当する型の文のみを抜粋
し、文中の接続詞を除去して抜粋インタフェース23a
に渡す。抜粋インタフェース23aはこれらの抜粋文を
原文と対比させながら表示画面上に表示する。
【0020】原文加工部20は、図3に示すように、大
別して型判定部20aおよび整形部20bからなり、原
文データベース6から抜粋文データベース5を作成す
る。
【0021】型判定部20aは、型判定用辞書8を参照
し、与えられた文書の各文がどの型に当てはまるかを判
定する。換言すれば、予め設定された複数の型に、文書
の各文を分類するための判定処理を実行する。一方、整
形部20bは、接続詞辞書9を参照し、与えられた文書
の各文を所定の形式、即ち本実施例では接続詞を除去し
た形式に整形処理する。
【0022】原文加工部20は、利用者が型の選択をす
る度にリアルタイムに実行して、抜粋文データベース5
を作成する方式でもよいし、またはシステムの使用前
(検索処理前)にバッチ処理的に抜粋文データベース5
を作成する方式でもよい。本実施例では、高速処理の可
能な後者の方式を想定して説明する。
【0023】なお、図2において、破線で描かれた矢印
はシステム使用前のデータの流れを意味し、実線で書か
れた矢印はシステム使用時のデータの流れを意味する。 (原文加工処理)前記のような原文加工部20の具体的
動作を図3乃至図5を参照して説明する。
【0024】まず、原文加工部20は、原文データベー
ス6から文書単位に文書を構成する各文(原データ)を
読み込む(ステップS1)。原文データは、図3に示す
ように、例えば「日本的な雇用は、…と言われてい
る。」や「その背景には…と言う事実がある。」等の各
文である。
【0025】次に、型判定部20aは型判定用辞書8を
参照し、各文に該当する型を判定し、その型を示すタグ
を付与する(ステップS2)。ここで、型判定用辞書8
は、例えば図5(A)に示すように、予め設定された文
の型とその型に対応する複数のパターンとを組とする各
項目からなる。パターンは、例えばその文の型を的確に
表現する文節からなる。
【0026】具体例として、図5(A)に示すように、
例えば文の型として「意見・提言」、「問題提起」、
「「予想・推定」等が設定されている。「意見・提言」
の型には、例えば「…だと考えられる」や「…べきでは
ないだろうか」等のパターンがある。この具体例では、
パターン「…であると思う」は「意見・提言」の型と
「予想・推定」の型の両方に割り当てられている。即
ち、このパターンを含む文は、「意見・提言」型の文を
表現するし、また「予想・推定」型の文も表現する。こ
のように、複数の型に合致する文もあるため、各型は必
ずしも相互に排他的ではない。
【0027】また、型判定用辞書8に用意する型の種類
は、例えば取り扱う文書の種類に応じて設定する方式で
もよい。例えば新聞記事の検索処理では「事実」、「発
言」等の型を用意し、技術論文の検索処理では「方法」
や「結論」などの型を用意する。
【0028】さらに、整形部20bは接続詞辞書9を参
照し、各文を所定の形式、本実施例では接続詞を除去し
た形式に整形処理する(ステップS3)。具体例とし
て、図3に示すように、例えば「ところが、企業は…変
化した。」と言う文から接続司「ところが、」を除去す
る。
【0029】原文加工部20は、前記のように加工処理
した抜粋文データを抜粋文データベース5に蓄積する
(ステップS4)。即ち、原文加工部20は、図3に示
すように、原文データ6から判定された型に分類し、接
続詞を除去した抜粋文データ5aを作成する。例えば
「ところが、企業は…変化した。」という原文は、「…
した。」というパターンにマッチする「過去」という型
のタグが付与され、さらに接続詞「ところが、」を除去
された抜粋文に変換される。
【0030】本実施例では、利用者は、後述するよう
に、検索結果の個々の文書からどのような型の文を抜粋
して表示するかを指定することができる。この場合、全
文の中から「意見・提言」の型の文のみを抜粋表示した
り、「結論」の型の文のみを抜粋表示したりしたりし
て、型を切替えることが可能である。また、図5(B)
に示すように、例えば「意見・提言」と「予想・推定」
という二つの型を同時に選択してもよい。前述したよう
に、文書の全文において、複数の型に関係する文が存在
するため、図中のベン図のように、斜線部分の範囲の文
が抜粋されるとになる。なお、全文の中で、設定した型
に含まれない文も当然ながら存在する。 (抜粋処理)次に、抜粋インタフェース23aによる抜
粋文の表示処理について、図6と図7を参照して説明す
る。
【0031】まず、利用者は、図6(A)に示すよう
に、表示部3の表示画面上に表示された抜粋文の型を選
択するためのメニュー画面から、所望の型を入力部11
のマウス11bを操作して選択する。ここで、抜粋イン
タフェース23aは、抜粋部22を介して抜粋文データ
ベース5から文書に対応する抜粋文データを取り出す
(ステップS10)。
【0032】抜粋インタフェース23aは、抜粋文デー
タから両者が選択した型のタグが付与された抜粋文の全
てを抽出する(ステップS11)。この抽出した抜粋文
の文番号を記憶する(ステップS12)。そして、表示
画面上に抜粋画面に例えば箇条書き形式で、抽出した全
ての抜粋文を表示する(ステップS13)。
【0033】具体例として、図6(A)に示すように、
型として「意見・提言」が選択された場合に、その型に
合致する抜粋文(b,e,h,i)を表示する。
【0034】ここで、表示画面上において、抜粋インタ
フェース23aは、抜粋画面と原文画面を並べて表示す
る。抜粋インタフェース23aは、抜粋部22を介して
原文データベース6から該当する文書の原文データを取
り出す(ステップS14)。そして、原文画面上に取り
出した原文データを表示する。このとき、抜粋インタフ
ェース23aは、記憶した抜粋文の文番号に対応する原
文(b,e,h,i)を例えばカラー表示やアンダーラ
イン表示等による強調表示する(ステップS15)。
【0035】即ち、原文画面上において、「意見・提
言」型に合致して、接続詞「しかし、」を除去した抜粋
文bに対応する文番号2の原文が強調表示される。ま
た、抜粋文画面上に抜粋文iが表示されているが、これ
は原文画面中に収まりきらなかった文のうち「意見・提
言」の型に該当した文である。
【0036】ここで、同一文書において、図6(B)に
示すように、利用者が型を「予想・推定」に切替えたと
き、原文画面中の文番号4,5の原文は「予想・推定」
の型に該当するため抜粋されている。この場合、文番号
5に対応する抜粋文データeは、「意見・提言」の型と
「予想・推定」の型の両方に該当している。 (パターン表示処理)以上のように、利用者が抜粋文の
型を選択するには、選択肢として表示されている各型の
意味を利用者にわかりやすく表示することが望ましい。
例えば、「意見・提言」という型を選択すると、実際に
は「…だと考えられる」や「…べきではないだろうか」
のようなパターンの文が抜粋されるということを利用者
が知っていれば、所望の情報を得やすいと考えられる。
【0037】そこで、図8(A)に示すように、利用者
が型を選択すると、抜粋部22が型判定用辞書8から選
択した型に対応する全てのパターンを取出して抜粋イン
タフェース23aに出力する(ステップS20,S2
1)。抜粋インタフェース23aは、同図(B)に示す
ように、例えば選択した「意見・提言」の型に対応する
パターンを列挙した一覧表示を行なう(ステップS2
2)。
【0038】この機能により、利用者は、どの型を選択
すると、どのような表現を含む文が抜粋されるかを予め
知ることができる。 (選択表示処理)これまでの説明では、抜粋文データに
おいて選択中の型のタグがつけられている文はすべて抜
粋文として表示するものとしていた。この変形例とし
て、選択中の型のタグがついている文をとりだした後、
この中からある尺度に基づいて一つ以上の重要文を選択
し、それを表示する方式を説明する。
【0039】まず、図9に示すように、選択した型のタ
グが付与された抜粋文の全てを抽出するまでの処理は、
これまでの処理と同様である(ステップS30,S3
1)。
【0040】次に、検索要求に含まれる検索キーワード
を最も多く含む文が重要文であるとし、この尺度に基づ
いて該当する抜粋文を抜粋画面上に箇条書き形式で表示
する(ステップS32,S33)。
【0041】具体例として、図10に示すように、選択
した例えば型「目的・ねらい」に対して、全文6文の中
で、該当する文である文番号2,4の各文が抜粋文とし
て抽出される。この2文の中で、文番号2の文は「分散
型」と「アーキテクチャ」という2つの検索キーワード
を含むが、文番号4の文はひとつも含んでいない。した
がって、文番号2の文の方が文番号4よりも重要な文で
あるとし、この文番号2の文のみを抜粋文として表示す
る。
【0042】これにより、利用者は、選択した型と共
に、検索要求の検索キーワードを含む最も適切な抜粋文
を参照できる可能性が高くなる。 (特定文表示処理)これまでの説明では、利用者は型の
選択権のみをもち、ある型が選択された場合、その型に
対応する全てのパターンにマッチする文が抜粋されるこ
とになっていた。この変形例として、特定のパターンに
マッチする文のみを抜粋するように利用者に指定させる
方式を説明する。
【0043】まず、図11に示すように、選択した型に
対応するパターンを、型判定辞書8から取り出すまでの
処理は、これまでのパターン表示処理と同様である(ス
テップS40,S41)。
【0044】ここでは、図12(A)に示すように、例
えば「意見・提言」の型に該当するパターンを取り出し
ている。このとき、抜粋文画面に各パターンと共に、各
パターンにマッチする文の数を表示する(ステップS4
2)。この例では、「…だと考えられる」のパターンの
文は5文、「…であると思う」のパターンの文は3文で
あることが表示されているので、この二つのパターンを
選択すると抜粋文画面には合計8文が表示されることが
事前にわかる。同様に、各パターンにマッチした文の長
さや行数などの情報を表示すれば、利用者は画面にちょ
うど収まるくらいの分量の文を抜粋表示させることもで
きる。
【0045】この表示されたパターンの中から、利用者
が例えば「…だと考えられる」と「…であると思う」の
各パターンを選択すると、抜粋部22は抜粋文データベ
ース5から該当する抜粋文データを取出して抜粋インタ
フェース23aに返す(ステップS44)。
【0046】抜粋インタフェース23aは、図12
(A)に示すように、利用者が選択した型に該当し、か
つ選択した特定パターンにマッチする抜粋文のみを抜粋
文画面に表示する(ステップS45)。この場合、前述
のパターンにマッチした抜粋文の中から重要文のみを表
示する処理を適用してもよい。
【0047】以上のように、型の選択に加えてパターン
の選択も利用者に行わせると、利用者は抜粋文の分量を
ある程度制御することができる。 (抜粋文の分量制御)次に、前記の変形例として、型判
定辞書8に用意したパターンに予め優先順位を設定し、
パターンの優先順位に基づいて表示する文の分量を制御
する方式について説明する。
【0048】この変形例では、図14(A)に示すよう
に、型判定辞書8の構造として、型とパターンとの項目
以外に、パターン間の優先順位を示す情報が含まれてい
る。具体例として、「意見・提言」という型に対応する
パターンの中では、「…だと考えられる」というパター
ンの優先順位が一番高いことが示されている。
【0049】ここで、現在選択中の文書について、「意
見・提言」の型に対応する各パターンにマッチする文の
数をカウントすると、図14(B)に示すような文数情
報が得られると想定する。即ち、「…だと考えられる」
と「…べきではないだろうか」のパターンの文のみ表示
すれば合計3文、さらに次に優先度の高い「…を提案す
る」のパターンの文まで表示すれば合計6文が表示され
ることになる。
【0050】この変形例では利用者が、図13に示すよ
うに、表示画面上において抜粋表示する文の数(表示文
数)nを指定する(ステップS50)。ここでは、例え
ば図14(C)に示すように、利用者が表示文数nを5
文以内に制限したと想定する。
【0051】抜粋部22は優先順位が記述されている型
判定辞書8を参照し、利用者の指定した分量nと優先順
位iまでのパターンにマッチする文の分量mとを比較す
る(ステップS51,S52)。そして、優先順位の高
いパターンにマッチする抜粋文を、指定分量nの範囲内
で段階的に選択していく(ステップS54〜S55)。
最終的に、指定分量nの範囲内でかつ優先順位の高いパ
ターンにマッチする抜粋文を抜粋インタフェース23a
に出力する。
【0052】抜粋インタフェース23aは、図14
(C)に示すように、利用者が指定した表示文数(5
文)の範囲内の抜粋文(ここでは3文)を抜粋画面に表
示する(ステップS56)。ここでは、優先順位が1位
と2の「…だと考えられる」と「…べきではないだろう
か」の各パターンにマッチする抜粋文のみを表示する。
【0053】なお、ここでは文の分量の例として文数で
説明したが、文の長さ、行数などをもとに表示の制御を
することも可能である。また、利用者に文の分量を指定
させるかわりに、優先順位何番目までのパターンにマッ
チする文を表示させるかを指定させてもよい。 (型判定辞書の更新処理)これまでの説明では、型判定
辞書8は事前に用意された固定的なものを想定してい
た。この変形例では、型判定辞書8に新たなパターンを
追加登録したり、または逆に不適切と思われるパターン
を削除する方式を説明する。
【0054】まず、利用者の入力に応じて、型判定辞書
8の更新用画面を表示する(ステップS60)。次に、
更新対象の型とパターンを入力する(ステップS6
1)。具体例としては、例えば図17(A)に示すよう
に、利用者が原文画面上で、パターンとして登録したい
範囲(ここでは、すべきだ)をマウス11bにより指定
する。そして、同図(B)に示すように、登録対象の型
を指定する。ここでは、「意見・提言」の型に「…すべ
きだ」という表現のパターンを追加する場合である。
【0055】これらの入力に応じて、抜粋部22は型判
定辞書8の該当する型に関するエントリを検索する(ス
テップS62)。そして、該当する型のエントリとし
て、入力した追加パターンを型判定辞書8に登録して更
新する(ステップS63)。
【0056】具体例として、図16(B)に示すよう
に、「意見・提言」の型のパターンのひとつとして、
「…すべきだ」という表現を追加する。
【0057】一方、追加だけでなく、逆に指定のパター
ンを削除する更新処理もある。具体例として、図16
(A)に示すように、例えば、「意見・提言」の型に対
応するエントリとして「…べきではないだろうか」とい
う記述があった場合、利用者がこれを好ましくないと思
う場合もあると考えられる。このような場合には、更新
処理として削除を指定し、「…べきではないだろうか」
という表現のパターンを削除する。
【0058】このような機能により、利用者にとって、
予め設定されている型判定辞書8に不備があり、用意さ
れている型に対応するパターンの中に必要と思われるパ
ターンが登録されていない場合には、そのパターンを登
録することができる。また、逆に型の表現としては不適
切と思われるパターンが存在する場合には、そのパター
ンを削除することができる。型判定辞書の各エントリ
は、型とパターンの対という単純な構造をしているの
で、利用者がこれらの追加あるいは削除を行うことは容
易である。したがって、利用者にとって有効な型判定辞
書8を再構築することが可能となる。 (優先度修正処理)前述の分量制御処理において、型判
定辞書8のパターン間に優先順位を付加する方式につい
て説明したが(図13と図14を参照)、この優先順位
を利用者に適応するように修正する方式について説明す
る。
【0059】まず、図19(B)に示すように、選択し
た型に対応する抜粋文データを抜粋画面上に表示する
(ステップS70)。ここで、抜粋文データを選択する
ための型判定辞書8には、図19(A)に示すように、
各パターンには優先順位を示す情報が付加されている。
【0060】次に、利用者がマウス11bにより、抜粋
画面上において重要だと思われる抜粋文を指定する(ス
テップS71)。ここでは、図19(B)に示すよう
に、具体例として、「…だと考えられる」というパター
ンの文と「…すべきではないか」というパターンの文が
表示されているが、利用者は、内容的にみて「…すべき
ではないか」の文が重要であると判断し、マウス11b
により指定したと想定する。
【0061】抜粋部22は指定された抜粋文データか
ら、その型に含まれるパターンを抽出し、型判定用辞書
8においてそのパターンの優先順位を高い方に修正する
処理を行なう(ステップS72,S73)。
【0062】具体例として、図19(A)に示すよう
に、「意見・提言」の型のパターンとして、当初の型判
定用辞書8では、「…だと考えられる」のパターンの優
先順位が第1位で、「…べきではないだろうか」のパタ
ーンの優先順位が第2位である。ここで利用者の「…べ
きではないだろうか」のパターンの優先度の修正を指定
したことにより、図19(A)に示すように、両者の優
先順位が逆転するように、型判定用辞書8の内容が更新
される。
【0063】これにより、以後の分量制御処理を伴う抜
粋処理において、更新した型判定用辞書8を使用するこ
とにより、利用者に適応した抜粋文を抽出して表示する
ことになる。 (複数文書の表示処理)これまでの説明では、検索結果
の中の一文書を選択した時の処理が中心であった。この
変形例では、検索結果の中の複数の文書に対して同一の
型やパターンにより、抜粋処理を行なう方式について説
明する。
【0064】ここで、一般的に、検索結果は、検索要求
に近いものから順に提示されることが多いが、選択した
型やパターンに該当する抜粋文が多い順に文書を提示す
る方法も考えられる。このようにすれば、あとの方に提
示される文書ほど抜粋される情報が少ないことがわかる
ので、複数の文書から効率的に情報を得ることが可能と
なる。
【0065】まず、図20に示すように、利用者の入力
に応じて型とパターンが選択されると、検索されている
複数の文書(ここではA,B,Cの3文書)をソートす
る処理を行なう(ステップS80〜S82)。そして、
ソートした順序で各文書を表示する(ステップS8
3)。
【0066】ここで、図21(A)に示すように、検索
された各文書A,B,Cの抜粋文データには、各型やパ
ターンに該当する文がいくつあったかという情報が記述
されている。例えば、文書Aの抜粋文データには、「意
見・提言」の型に該当する文が10文、「問題提起」の
型に該当する文が0文、「予想・推定」の型に該当する
文が4文含まれることなどが記されている。
【0067】利用者の選択している型が「意見・提言」
である場合、この型に該当する文の数はA,B,Cの順
で多いので、図21(B)に示すように、この順序で文
書のリストを表示する。利用者の選択している型が「予
想・推定」である場合、この型に該当する文の数はB,
C,Aの順で多いので、図21(C)に示すように、こ
の順序でリストを表示する。 (第2の実施例)次に、本発明の第2の実施例を、図2
2に示す機能ブロック図を参照して説明する。本実施例
は、前述した第1の実施例との相違点は、抜粋インタフ
ェース23bが原文表示専用の画面をもたないというこ
とである。以下、第1の実施例と異なる点について説明
する。したがって、異なる点以外の機能は第1の実施例
と同様である。 (全文選択処理)本実施例は、図24に示すように、予
め設定される複数の抜粋文の型の中に、「全文」という
項目を含む。この項目を選択すると、抜粋画面上に、加
工処理されていない原文の全文を直接表示する。
【0068】即ち、図23のフローチャートに示すよう
に、両者が型を選択する場合に、「全文」の項目を選択
すると、抜粋部22は原文データベース5から原文デー
タからなる全文を取り出し、抜粋インタフェース23b
に出力する(ステップS90,S91,S95)。抜粋
インタフェース23bは、その原文データを抜粋文デー
タとして抜粋画面上に表示する(ステップS96)。
【0069】一方、「全文」以外の型を選択した場合に
は、前述の第1の実施例と同様に、抜粋文データベース
5から選択した型のタグが付与された抜粋文を全て取り
出して、抜粋画面上に箇条書き形式で表示する(ステッ
プS91のNO,S92〜S94)。具体例として、図
24に示すように、「意見・提言」の型が選択される
と、その型に対応する抜粋画面上に表示する。
【0070】本実施例によれば、原文画面を用意するこ
となく、「全文」という型を用意するだけで、原文デー
タを抜粋画面上で直接参照することが可能となる。した
がって、利用者は、必要に応じて抜粋文データまたは原
文データを簡単に選択して参照することが可能である。 (第3の実施例)次に、本発明の第3の実施例を、図2
5に示す機能ブロック図を参照して説明する。本実施例
の特徴は、文の型を判定するためのパターンとして、前
述の第1と第2の実施例とは異なり、言語解析処理によ
り得られる言語情報を利用する点にある。
【0071】即ち、前述の第1と第2の実施例では、文
の型を判定するためのパターンは、例えば「…だと考え
られる」のような表層文字列である。即ち、「…だと考
えられる」のような表層文字列を含む抜粋文は、例えば
「意見・提言」の型に相当すると判定する。
【0072】これに対して、本実施例は、原文の言語解
析により得られる形態素情報(品詞、活用形等)や構文
情報(主語、述語、係り受け等)の高度な言語情報を利
用したパターンマッチング処理を実行して、最適な抜粋
文を表示する。
【0073】以下、前述の第1と第2の実施例との相違
点のみについて説明する。したがって、異なる点以外の
機能は第1と第2の実施例と同様である。 (原文加工処理)図26のフローチャートに示すよう
に、まず、原文加工部20は、原文データベース6から
文書を構成する各文(原文データ)を読み込む(ステッ
プS100)。原文データは、図27に示すように、例
えば「日本的な雇用は、…である。」や「おそらく、そ
の背景には…であろう。」等の各文である。
【0074】ここで、図27に示すように、原文加工部
20の解析部20cは、予め用意された解析辞書24を
参照して言語解析処理を実行し、形態素情報や構文情報
等の言語情報を抽出する(ステップS101)。
【0075】型判定部20aは型判定用辞書8を参照
し、各文に該当する型を判定し、その型を示すタグを付
与する(ステップS102)。そして、接続司辞書9を
参照した整形処理の後に、抜粋文データを抜粋文データ
ベース5に格納する(ステップS103,S104)。
このとき、抜粋文データには、型のタグと共に形態素情
報、構文情報などの言語情報が付与されている。
【0076】具体例として、図27に示すように、例え
ば「日本的な雇用は、…である。」という抜粋文データ
には、「事実」の型を示すタグと形態素情報として「断
定の助動詞」の言語情報が付与されている。
【0077】このような言語情報を利用して、利用者が
選択した型に対応するパターンマッチング処理を行なう
場合に、型判定用辞書8には各型に対応するパターンと
して前記の言語情報が用意されている。
【0078】具体的には、図28に示すように、パター
ンとして表層文字列を列挙する代わりに、例えば言語情
報として品詞の種類に関する情報が設定されている。さ
らに、この言語情報と表層文字列を組合わせたパターン
を用意するのが望ましい。 (第4の実施例)さらに、本発明の第4の実施例を、図
29に示す機能ブロック図を参照して説明する。本実施
例の特徴は、前述の第1乃至第3の実施例とは異なり、
型の判定処理と抜粋処理を文単位に限定せずに、文の様
々な構成要素を単位とする点にある。即ち、句や節、特
定の意味内容を表す表現など、文の様々な構成要素を抽
出して表示する。
【0079】本実施例では、抜粋処理により得られるデ
ータを抜粋情報データと称し、原文加工部20の加工処
理により得られた抜粋情報データは抜粋情報データベー
ス25に格納される。 (原文加工処理)以下、図31と図32を参照して本実
施例の原文加工処理について説明する。
【0080】まず、原文加工部20は、原文データベー
ス6から文書を構成する各文を読み込む(ステップS1
10)。原文データは、例えば図32(B)に示すよう
に、「…首相は、昨夜の首相官邸における…」等の文で
ある。
【0081】ここで、原文加工部20の解析部20c
は、予め用意された解析辞書24を参照して既存の言語
解析処理を実行し、重文や複文から単文を抽出したり、
主語や固有名詞、時間などを表現形態等の構成要素(構
成単位)の表現を抽出する(ステップS111)。
【0082】型判定部20aは型判定用辞書8を参照
し、各構成単位に対して型を判定し、その型を示すタグ
を付与する(ステップS112)。整形部20bは、ま
ず接続詞辞書9に記述されている接続詞や接続助詞など
を文や節から除去し、次に時間を表す型「when」に
マッチした文の構成単位の正規化などを行う(ステップ
S113)。そして、原文加工部20は型や言語情報を
付与された抜粋文と共に、時間や主語等の構成単位を出
力する(ステップS114)。
【0083】具体例として、図30に示すような抜粋情
報データが作成されて、抜粋情報データベース25に格
納される。この具体例では、第一文の前半である「日本
の政治は、…であるが、」という部分は、「事実」とい
う型に該当し、一方、後半の「この背景には、…という
事実がある。」という部分は、「背景」という型に該当
している。このようにひとつの文に複数の種類の情報が
含まれる場合にも対処できる。また、前半の「日本の政
治は、…であるが、」という節末尾には接続助詞や読点
がついているが、整形部はこれらを除去して「…であ
る」という終止形にしている。
【0084】さらに、図30に示すように、第2文から
は、「when」という時間に関する情報と「who」
という動作主体を表現する情報が抽出されている。ここ
で、原文中の「平成6年7月」という表現が、整形部2
0bにより「1994.7」という形式に正規化されて
いる。
【0085】本実施例では、図32(D)に示すよう
に、型判定用辞書8には例えば5W1Hのような抜粋情
報の型とそれに対応するパターンが用意されている。こ
の場合、図28に示すように、品詞情報などの言語情報
を用いてパターンを記述してもよい。
【0086】このような型判定用辞書8を利用して、図
32(A)に示すように、予め用意された5W1Hの抜
粋情報の型から、利用者が例えば「who」という動作
主体を表現する型が選択されると、原文から例えば「首
相」、「前首相」、「科学技術庁長官」等のなんらかの
動作の主体となっている人物の名前が抽出されて抜粋情
報画面に表示される。同様に、利用者が例えば「whe
re」という場所を表現する型が選択されると、同一原
文中から例えば「首相官邸」、「国内の原子力発電所」
等の場所を表現する言葉が抽出されて抜粋情報画面に表
示される。
【0087】
【発明の効果】以上詳述したように本発明によれば、フ
ルテキストの文書を検索する文書検索システムにおい
て、第1に、検索された文書の全文から所望の抜粋文や
情報のみを抽出して表示できるようにして、利用者の文
書検索作業に要する負荷の軽減化を図ることができる。
第2に、同一文書に対して様々な観点や基準に基づいて
抜粋文や情報を抽出して表示できるようにして、多様な
検索目的に応じた検索処理を実現することができる。第
3に、検索された文書の全文から所定の基準に基づいて
抜粋文や情報のみを抽出して表示する場合に、優先度の
順序に従って表示する抜粋文や情報の量を調整できる検
索処理を実現することができる。
【0088】換言すれば、利用者の望む型の文や文の構
成要素のみを抜粋して表示することにより、大量の検索
結果のブラウジングを効率化することができる。さら
に、抜粋情報のみをコンパクトに表示することにより、
文書全体を直観的にかつ総括的にとらえることを可能に
し、画面のスクロールなどに関する労力及び負荷を軽減
することができる。さらに、原文中でどの文が重要かは
観点によっても変わるし個人差もあるが、抜粋情報の型
の切替により、様々な観点から重要な箇所を抜粋するこ
とが可能である。
【図面の簡単な説明】
【図1】本発明の実施例に係わる文書検索システムの要
部を示すブロック図。
【図2】第1の実施例に係わる機能ブロック図。
【図3】第1の実施例の動作を説明するための概念図。
【図4】第1の実施例の動作を説明するためのフローチ
ャート。
【図5】第1の実施例の動作を説明するための概念図。
【図6】第1の実施例の動作を説明するための概念図。
【図7】第1の実施例の抜粋処理に関する動作を説明す
るためのフローチャート。
【図8】第1の実施例のパターン処理に関する動作を説
明するための図。
【図9】第1の実施例の選択表示処理に関する動作を説
明するためのフローチャート。
【図10】第1の実施例の選択表示処理に関する動作を
説明するための図。
【図11】第1の実施例の特定文表示処理に関する動作
を説明するためのフローチャート。
【図12】第1の実施例の分量制御に関する動作を説明
するための図。
【図13】第1の実施例の分量制御に関する動作を説明
するためのフローチャート。
【図14】第1の実施例の分量制御に関する動作を説明
するための図。
【図15】第1の実施例の更新処理に関する動作を説明
するためのフローチャート。
【図16】第1の実施例の更新処理に関する動作を説明
するための図。
【図17】第1の実施例の更新処理に関する動作を説明
するための図。
【図18】第1の実施例の優先度修正処理に関する動作
を説明するためのフローチャート。
【図19】第1の実施例の優先度修正処理に関する動作
を説明するための図。
【図20】第1の実施例の複数文書の検索処理に関する
動作を説明するためのフローチャート。
【図21】第1の実施例の複数文書の検索処理に関する
動作を説明するための図。
【図22】第2の実施例に係わる機能ブロック図。
【図23】第2の実施例の動作を説明するためのフロー
チャート。
【図24】第2の実施例の動作を説明するための図。
【図25】第3の実施例に係わる機能ブロック図。
【図26】第3の実施例の動作を説明するためのフロー
チャート。
【図27】第3の実施例の動作を説明するための図。
【図28】第3の実施例の型判定用辞書の構造を説明す
るための図。
【図29】第4の実施例に係わる機能ブロック図。
【図30】第4の実施例の動作を説明するための図。
【図31】第4の実施例の動作を説明するためのフロー
チャート。
【図32】第4の実施例の動作を説明するための図。
【符号の説明】
1…中央処理部(CPU)、2…表示コントローラ、3
…表示部、4…記憶部、5…抜粋文データベース、6…
原文データベース、7…単語インデックス、8…型判定
用辞書、9…接続司辞書、10…入力コントローラ、1
1…入力部、20…原文加工部、21…検索部、22…
抜粋部、23…インターフェース部、23a…抜粋イン
ターフェース。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 検索要求に応じた文書を検索する文書検
    索システムにおいて、 検索対象の文書を構成する原文データを格納した原文デ
    ータベース手段と、 前記原文データから予め設定した複数種の文の型に分類
    した文単位の抜粋文データを格納した抜粋文データベー
    ス手段と、 前記複数種の文の型から所望の文の型を選択する選択手
    段と、 この選択手段により選択された文の型に対応する抜粋文
    データを前記抜粋文データベース手段から抽出する抽出
    手段と、 この抽出手段により抽出された全ての抜粋文データを一
    覧的に表示する表示手段とを具備したことを特徴とする
    文書検索システム。
  2. 【請求項2】 検索要求に応じた文書を検索する文書検
    索システムにおいて、 検索対象の文書を構成する原文データを格納した原文デ
    ータベース手段と、 前記原文データから予め設定した複数種の文の型に分類
    した文単位の抜粋文データを作成する作成手段と、 この作成手段により作成された各抜粋文データを所定の
    形式に整形する整形手段と、 この整形手段により整形された各抜粋文データを格納し
    た抜粋文データベース手段と、 前記複数種の文の型から所望の文の型を選択する選択手
    段と、 この選択手段により選択された文の型に対応する抜粋文
    データを前記抜粋文データベース手段から抽出する抽出
    手段と、 この抽出手段により抽出された全ての抜粋文データを一
    覧的に表示し、かつ抽出された前記各抜粋文データに対
    応する前記原文データを強調的に表示する表示手段とを
    具備したことを特徴とする文書検索システム。
  3. 【請求項3】 検索要求に応じた文書を検索する文書検
    索システムにおいて、 検索対象の文書を構成する原文データを格納した原文デ
    ータベース手段と、 前記原文データから予め設定した複数種の文の型に分類
    した文単位の抜粋文データを作成する作成手段と、 この作成手段により作成された各抜粋文データを所定の
    形式に整形する整形手段と、 この整形手段により整形された各抜粋文データを格納し
    た抜粋文データベース手段と、 前記複数種の文の型から所望の文の型または全文表示モ
    ードを選択する選択手段と、 この選択手段により選択された文の型に対応する抜粋文
    データを前記抜粋文データベース手段から抽出する抽出
    手段と、 前記選択手段により前記全文表示モードを選択された場
    合には、前記原文データベース手段から検索対象の文書
    の全文に対応する原文データを取出して出力する全文出
    力手段と、 前記抽出手段により抽出された全ての抜粋文データまた
    は前記全文出力手段により出力された原文データを表示
    する表示手段とを具備したことを特徴とする文書検索シ
    ステム。
  4. 【請求項4】 検索要求に応じた文書を検索する文書検
    索システムにおいて、 検索対象の文書を構成する原文データを格納した原文デ
    ータベース手段と、 前記原文データから予め設定した複数種の文の型に分類
    した文単位の抜粋文データを作成する作成手段と、 この作成手段により作成された各抜粋文データを所定の
    形式に整形する整形手段と、 この整形手段により整形された各抜粋文データを格納し
    た抜粋文データベース手段と、 前記複数種の文の型から所望の文の型を選択する選択手
    段と、 この選択手段により選択された文の型に対応する抜粋文
    データを前記抜粋文データベース手段から抽出する抽出
    手段と、 予め指定したキーワードに基づいて、前記抽出手段が抽
    出された抜粋文データの中で前記キーワードを含む特定
    の抜粋文データのみを選択して表示する表示手段とを具
    備したことを特徴とする文書検索システム。
  5. 【請求項5】 検索要求に応じた文書を検索する文書検
    索システムにおいて、 検索対象の文書を構成する原文データを格納した原文デ
    ータベース手段と、 前記原文データに対して文単位の言語解析処理を実行
    し、この言語解析処理により得られた言語情報を生成す
    る言語情報生成手段と、 前記原文データから予め設定した複数種の文の型に分類
    した文単位の抜粋文データであって、前記言語情報を付
    加した抜粋文データを格納した抜粋文データベース手段
    と、 前記複数種の文の型から所望の文の型を選択する選択手
    段と、 この選択手段により選択された文の型に対応する抜粋文
    データを前記抜粋文データベース手段から抽出する抽出
    手段と、 この抽出手段により抽出された全ての抜粋文データを前
    記言語情報を伴って一覧的に表示する表示手段とを具備
    したことを特徴とする文書検索システム。
  6. 【請求項6】 検索要求に応じた文書を検索する文書検
    索システムにおいて、 検索対象の文書を構成する原文データを格納した原文デ
    ータベース手段と、 前記原文データに対して言語解析処理を実行し、この言
    語解析処理により得られた言語情報に基づいた文の所定
    の構成要素を前記原文データから抽出する言語解析処理
    手段と、 この言語解析処理手段により抽出された前記所定の構成
    要素毎に予め設定した複数種の情報の型に分類した抜粋
    情報データを格納した抜粋情報データベース手段と、 前記複数種の情報の型から所望の情報の型を選択する選
    択手段と、 この選択手段により選択された情報の型に対応する抜粋
    情報データを前記抜粋情報データベース手段から抽出す
    る抽出手段と、 この抽出手段により抽出された全ての抜粋情報データを
    一覧的に表示する表示手段とを具備したことを特徴とす
    る文書検索システム。
JP7083458A 1995-03-16 1995-03-16 文書検索システム Pending JPH08255172A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7083458A JPH08255172A (ja) 1995-03-16 1995-03-16 文書検索システム
US08/610,631 US5761666A (en) 1995-03-16 1996-03-04 Document retrieval system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7083458A JPH08255172A (ja) 1995-03-16 1995-03-16 文書検索システム

Publications (1)

Publication Number Publication Date
JPH08255172A true JPH08255172A (ja) 1996-10-01

Family

ID=13803025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7083458A Pending JPH08255172A (ja) 1995-03-16 1995-03-16 文書検索システム

Country Status (2)

Country Link
US (1) US5761666A (ja)
JP (1) JPH08255172A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272686A (ja) * 1998-03-19 1999-10-08 Nippon Telegr & Teleph Corp <Ntt> 文書重要文抽出方法、文書重要文抽出装置及び文書重要文抽出プログラムを記録した記録媒体
JPH11282881A (ja) * 1998-01-27 1999-10-15 Fuji Xerox Co Ltd 文書要約装置および記録媒体
JP2002366576A (ja) * 2001-04-05 2002-12-20 Internatl Business Mach Corp <Ibm> データ検索の方法、システム、およびプログラム製品
JP2003533769A (ja) * 2000-05-09 2003-11-11 株式会社ジャストシステム 文書要約および文書ブラウジング・エイドを迅速に生成する方法および装置
JP2003535407A (ja) * 2000-05-31 2003-11-25 レキシス ネクシス 文章中の法の支配を見つけるためのコンピュータ・ベース・システム及び方法
JP2004118545A (ja) * 2002-09-26 2004-04-15 Nec Corp テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
JP2006209649A (ja) * 2005-01-31 2006-08-10 Nec Corp 機密文書検索システム、機密文書検索方法、および機密文書検索プログラム
JP2009146447A (ja) * 2009-03-23 2009-07-02 Nec Corp テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
JP2009146446A (ja) * 2009-03-23 2009-07-02 Nec Corp テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
US7587420B2 (en) 2003-10-24 2009-09-08 Kabushiki Kaisha Toshiba System and method for question answering document retrieval
JP2012208728A (ja) * 2011-03-30 2012-10-25 National Institute Of Information & Communication Technology 専門家検索装置、および専門家検索方法
WO2019087593A1 (ja) * 2017-11-06 2019-05-09 アズビル株式会社 文書検索装置および方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5899989A (en) * 1996-05-14 1999-05-04 Sharp Kabushiki Kaisha On-demand interface device
US6339774B1 (en) * 1997-01-29 2002-01-15 Kabushiki Kaisha Toshiba Information sharing system and computer program product for causing computer to support the information sharing system
JP3270351B2 (ja) 1997-01-31 2002-04-02 株式会社東芝 電子化文書処理装置
JP3001460B2 (ja) * 1997-05-21 2000-01-24 株式会社エヌイーシー情報システムズ 文書分類装置
US6202061B1 (en) * 1997-10-24 2001-03-13 Pictra, Inc. Methods and apparatuses for creating a collection of media
US6598046B1 (en) 1998-09-29 2003-07-22 Qwest Communications International Inc. System and method for retrieving documents responsive to a given user's role and scenario
JP2002283301A (ja) * 2001-03-26 2002-10-03 Makita Corp 際切りマルノコ
US8200477B2 (en) * 2003-10-22 2012-06-12 International Business Machines Corporation Method and system for extracting opinions from text documents
JP3962382B2 (ja) * 2004-02-20 2007-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現抽出装置、表現抽出方法、プログラム及び記録媒体
JP4148522B2 (ja) * 2004-11-19 2008-09-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現検出システム、表現検出方法、及びプログラム
US7917841B2 (en) * 2005-08-29 2011-03-29 Edgar Online, Inc. System and method for rendering data
US20080244373A1 (en) * 2007-03-26 2008-10-02 Morris Robert P Methods, systems, and computer program products for automatically creating a media presentation entity using media objects from a plurality of devices

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03191475A (ja) * 1989-12-20 1991-08-21 Nec Corp 文書要約方式
JPH04281566A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置
JPH0635971A (ja) * 1992-07-16 1994-02-10 Toshiba Corp 文書検索装置
JPH0765005A (ja) * 1993-08-24 1995-03-10 Ricoh Co Ltd 文書速読支援表示装置並びに文書処理装置及びディジタル複写装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1588827A (en) * 1978-05-31 1981-04-29 System Dev Corp Data processor method and means for determining degree of match between two data arrays
US4382277A (en) * 1979-05-14 1983-05-03 System Development Corp. Method and means utilizing multiple processing means for determining degree of match between two data arrays
US5123103A (en) * 1986-10-17 1992-06-16 Hitachi, Ltd. Method and system of retrieving program specification and linking the specification by concept to retrieval request for reusing program parts

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03191475A (ja) * 1989-12-20 1991-08-21 Nec Corp 文書要約方式
JPH04281566A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置
JPH0635971A (ja) * 1992-07-16 1994-02-10 Toshiba Corp 文書検索装置
JPH0765005A (ja) * 1993-08-24 1995-03-10 Ricoh Co Ltd 文書速読支援表示装置並びに文書処理装置及びディジタル複写装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282881A (ja) * 1998-01-27 1999-10-15 Fuji Xerox Co Ltd 文書要約装置および記録媒体
JPH11272686A (ja) * 1998-03-19 1999-10-08 Nippon Telegr & Teleph Corp <Ntt> 文書重要文抽出方法、文書重要文抽出装置及び文書重要文抽出プログラムを記録した記録媒体
JP2003533769A (ja) * 2000-05-09 2003-11-11 株式会社ジャストシステム 文書要約および文書ブラウジング・エイドを迅速に生成する方法および装置
JP2003535407A (ja) * 2000-05-31 2003-11-25 レキシス ネクシス 文章中の法の支配を見つけるためのコンピュータ・ベース・システム及び方法
JP4773672B2 (ja) * 2000-05-31 2011-09-14 レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド 文章中の法の支配を見つけるためのコンピュータ・ベース・システム及び方法
JP2002366576A (ja) * 2001-04-05 2002-12-20 Internatl Business Mach Corp <Ibm> データ検索の方法、システム、およびプログラム製品
JP2004118545A (ja) * 2002-09-26 2004-04-15 Nec Corp テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
US7587420B2 (en) 2003-10-24 2009-09-08 Kabushiki Kaisha Toshiba System and method for question answering document retrieval
JP2006209649A (ja) * 2005-01-31 2006-08-10 Nec Corp 機密文書検索システム、機密文書検索方法、および機密文書検索プログラム
JP2009146446A (ja) * 2009-03-23 2009-07-02 Nec Corp テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
JP2009146447A (ja) * 2009-03-23 2009-07-02 Nec Corp テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
JP2012208728A (ja) * 2011-03-30 2012-10-25 National Institute Of Information & Communication Technology 専門家検索装置、および専門家検索方法
WO2019087593A1 (ja) * 2017-11-06 2019-05-09 アズビル株式会社 文書検索装置および方法
JP2019086934A (ja) * 2017-11-06 2019-06-06 アズビル株式会社 文書検索装置および方法

Also Published As

Publication number Publication date
US5761666A (en) 1998-06-02

Similar Documents

Publication Publication Date Title
JPH08255172A (ja) 文書検索システム
US6442540B2 (en) Information retrieval apparatus and information retrieval method
JPH0991314A (ja) 情報探索装置
KR100593561B1 (ko) 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을기록한 컴퓨터를 읽을 수 있는 기록매체
JP3178421B2 (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3612769B2 (ja) 情報検索装置および情報検索方法
JP4967037B2 (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
EP3432161A1 (en) Information processing system and information processing method
JP2003162531A (ja) 文書検索システムおよび文書検索方法
JP3617096B2 (ja) 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法
JPH1145261A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH09259139A (ja) 文書資料知的検索システム
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JPH11272709A (ja) ファイル検索方式
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP2004220226A (ja) 検索文書のための文書分類方法及び装置
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3627445B2 (ja) 文書検索装置及び文書検索プログラムを記録した記憶媒体
JPH08305726A (ja) 情報検索装置
JPH07325826A (ja) 日本語処理システム
JPH09231233A (ja) ネットワーク検索装置
JPH1145238A (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010266970A (ja) 情報検索装置、情報検索方法、辞書作成装置、およびプログラム
JP2004118877A (ja) 情報フィルタリング装置
JPH1027125A (ja) 文書分類装置