JPH07129605A - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JPH07129605A
JPH07129605A JP5349529A JP34952993A JPH07129605A JP H07129605 A JPH07129605 A JP H07129605A JP 5349529 A JP5349529 A JP 5349529A JP 34952993 A JP34952993 A JP 34952993A JP H07129605 A JPH07129605 A JP H07129605A
Authority
JP
Japan
Prior art keywords
document
sentence
unit
chapter
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5349529A
Other languages
English (en)
Other versions
JP3383049B2 (ja
Inventor
Kazuo Sumita
一男 住田
Seiji Miike
誠司 三池
Etsuo Ito
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP34952993A priority Critical patent/JP3383049B2/ja
Publication of JPH07129605A publication Critical patent/JPH07129605A/ja
Application granted granted Critical
Publication of JP3383049B2 publication Critical patent/JP3383049B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明は、検索結果の一覧をタイトルだけで
表示するのではなく、要約文章を併せて表示することに
より、利用者が概要の把握を容易にし、さらに、利用者
の指定に応じて表示された要約文章の詳細度を変更して
表示することによりより詳しい情報も簡単に表示でき
る。 【構成】 文章のタイトル情報から章立ての構造を解析
する書式解析部13と、可変長の要約文章を生成する要
約生成部14と、検索結果で得られた複数の文書につい
ての要約を同時に提示する検索結果提示部17と、検索
結果提示部で提示された要約文章の1つを選択すること
により詳しい要約を提示するよう要約文章提示部18か
らなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の文書を格納した
文章データベースから所望の文書を検索提示する文書検
索装置に関する。
【0002】
【従来の技術】近年、ワープロや計算機の普及、電子ニ
ュースや電子メールの普及、従来紙の上でしか得られな
かった情報のCDROMによる出版(辞書、百科事典な
ど)など、文書の電子化が進みつつある。今後、このよ
うな文書の電子化は加速的に進んでいくと予測される。
【0003】これにともない、蓄積した文書を有効利用
するため、大量の文書から所望の文書を検索する情報検
索システムの需要が増加しつつある。
【0004】従来型の文書情報検索システムにあって
は、キーワードなどの検索命令の指定に従って、一定の
順序(例えば、キーワードと類似する文書の順)で検索
結果の文書のタイトルを並べて表示するだけであった。
このため、検索した文書間の相対的な関係や、検索命令
との類似性の度合が利用者に実感できず、検索結果の妥
当性を利用者が直感することが難しかった。
【0005】従来型の文書情報検索システムにあって
は、検索した結果が所望の文書であるか否かを利用者が
判定するために、個々の文書の全文を詳細に読むという
作業を行わなければならず、所望の文書を得るまでに多
大な時間を要していた。
【0006】検索した結果の一部だけを表示すること
で、全文を読まなければならない手間を軽減することが
できる。しかし、その表示した一部分が文書において他
の部分とどのような関係にあるかが明らかでなければ、
その文書が所望の文書であるかどうかが判定できない。
例えば、ある文書について背景情報を述べている部分が
表示され、また他の文書について結論を述べている部分
が表示された場合、統一した視点で見渡すことができな
いため、いずれの文書が必要であるかを判定することが
困難である。したがって、表示した部分が全文に対して
どのような位置付けにあるかを理解するためには、全文
を読まなければならず、結果的に手間の軽減にならな
い。
【0007】また、格納されている個々の文書の要約文
章を人手で作成し、これを原文書に対応づけて格納して
おくことができる。検索結果の表示において、この要約
文章を表示することで、利用者の検証の手間を軽減する
ことが可能である。しかるに、要約文章を人手で作成す
るには多大な時間を要し、よほど利用規模の大きいデー
タベースでなければ、到底用意できないものである。ま
た、これまで個々の文書についての要約が準備されてい
ないようなデータベースも存在しており、それらについ
て人手で要約を作成することは多大な費用と労力を要す
る。
【0008】さらに、人手で作成した要約文章は、ごく
一般向けに作成されるため、利用者の目的に合った視点
で要約されているとは限らない。このため、利用者にと
っては、ピント外れの文章となっている場合があり、所
望の文書であるかどうかを判定する時に、必要な文書を
見過ごしてしまうことがあるという問題点もあった。ま
た、人手で作成した要約文章は、利用者の必要に応じて
その長さを変えるということができない。このため、利
用者が要約文章を読んでいる際に、その部分をより詳し
く読みたいと思っても、対応する原文やより詳しい要約
を提示することができず、全文を提示したりプリントア
ウトするなどして全文を読まなければならず、このよう
な場合については検索した文書を読む手間は軽減されな
いという問題点がある。
【0009】例えば、PATOLISでは検索結果の複
数の要約を同時にリストアップすることができるもの
の、利用者が検索結果のより詳しい内容を知りたい場合
は、新たにその文書をプリントアウトしなければならな
い。その結果、検索行為に関わる手間が軽減される度合
が低かった。
【0010】
【発明が解決しようとする課題】本発明は、上述のよう
な事情を考慮してなされたもので、利用者の要求に応じ
て詳細度の変化させた要約文章を対話的に提示すること
のできる文書検索装置を提供することを目的とするもの
である。
【0011】
【課題を解決するための手段】本発明の文書検索装置に
おいては、文書のタイトル情報から章立ての構造を解析
する書式解析手段と、該書式解析手段で得られた各章の
文章について可変長の要約文章を生成する要約生成手段
と、検索結果で得られた複数の文書についての要約を同
時に提示する検索結果提示手段と、該検索結果提示手段
で提示された要約文章の一つを選択することをきっかけ
としてさらに詳しい要約文章あるいは原文書を提示する
とともに、提示されているその要約文章上の章や節のタ
イトル、段落、文を指定する手段を有し、指定した部分
に対応する要約文章あるいは原文を表示中の要約文章に
挿入する要約文章提示手段を有する。
【0012】書式解析手段では、文書における各章や節
に付与されているタイトルやヘディング、改行と空白文
字の出現の関係から、原文書の章立ての構造を解析す
る。
【0013】要約生成手段は、書式解析手段が解析して
得た章立ての構造に基づいて、各章に含まれる文章の要
約文章を生成する。この要約生成では生成する要約文章
の長さを可変にすることが可能である。
【0014】検索結果提示手段では、検索結果として得
られた複数の文書について、それぞれタイトル、著者
名、要約を提示する機能を有する。また、提示された複
数の文書のうち1つを選択する機能を有し、要約文書提
示手段を起動して選択された文書のより詳しい要約文章
を提示する。
【0015】要約文書提示手段では、少なくとも検索結
果提示部で提示されている要約文章より詳しい要約文章
を提示するとともに、提示されている要約文章中のヘデ
ィングや段落、文の一部を指定する機能を有する。利用
者が適宜この指定を行うことにより、対応する部分のさ
らに詳しい要約(原文も含む)を、提示している要約文
章中に挿入する。
【0016】
【作用】簡単なタイトルと要約が検索結果の複数の文書
に同時に表示されるので、読む必要のない文書まで読ま
なければならないと言う手間が大幅に削減される。ま
た、提示されている要約文章の詳しさでは十分でない場
合、対応箇所を詳細に表示することを動的に指定できる
ので、必要最少限の労力で検索結果で得られた文書の内
容を利用者は理解できるようになる。これにより検索行
為の効率を向上させることが可能になる。
【0017】
【実施例】本発明の実施例を図面に基づいて説明する。
【0018】図1は、実施例を構成する上で必要となる
機器の構成を示す構成図である。中央処理手段1、半導
体メモリや磁気ディスク、光ディスクなどの記憶手段
2、CRTディスプレイや液晶ディスプレイ、プラズマ
ディスプレイなどのディスプレイなどの表示手段4、表
示を制御する表示コントローラ3、キーボードやマウ
ス、ペンなどの入力手段6、入力を制御する入力コント
ローラ5からなる。
【0019】図2は、実施例における機能構成を示した
ブロック図である。入力部11、検索処理部12、書式
解析部13、要約生成部14、文書構造記憶部15、要
約文章記憶部16、検索結果提示部17、要約文章提示
部18、全体システムを制御するシステム制御部19か
らなる。テキストデータベース20には検索の対象とな
るテキストデータが格納される。
【0020】図3は、実施例の文書検索装置の全体を制
御するシステム制御部19の処理の流れを図示してい
る。
【0021】入力部11は、検索命令となるキーワー
ド、および自然言語文の入力を受け付ける。
【0022】まず始めに、システム制御部19は、入力
部への検索命令入力を検知して、検索処理部12を起動
する。検索処理部12は、検索命令に従ってテキストデ
ータベース20から対応する文書を検索する(ステップ
31)。
【0023】次に、システム制御部19は、検索処理部
12の処理の終了を検知して、書式解析部13を起動す
る(ステップ32)。書式解析部13は、検索結果の各
文書の章構成を解析し、文書構造記憶部15に格納す
る。
【0024】次に、システム制御部19は、書式解析部
13の処理の終了を検知して、要約生成部14を起動す
る。要約生成部14は、検索結果の文書の各章の要約を
生成し、要約文章記憶部16に格納する(ステップ3
3)。
【0025】次に、システム制御部19は、要約生成部
14の処理の終了を検知して、検索結果提示部17を起
動する(ステップ34)。検索結果提示部17は、文書
構造記憶部15に格納された検索結果の各文書の文書構
造および要約文書記憶部16に格納された要約文章に従
って図1に図示する表示手段4に検索結果のリストアッ
プを行う(ステップ35)。
【0026】表示された検索結果のリストアップから1
つの文書が選択された場合、システム制御部19は、要
約文章提示部18を起動する。要約文章提示部18は、
前記検索結果提示部17で選択された文書の要約文章を
提示するとともに、利用者の指示に従って指示された文
書位置に対応する部分の要約の詳細度を変えて、その位
置に挿入し表示する。
【0027】検索処理部12は、本願の発明の主旨では
なく、全文検索システムなどですでに実施されている手
法を利用することにより実現される。
【0028】図4乃至図6に書式解析部13の処理の流
れを図示する。
【0029】処理は、タイトル検出パタンに基づいて解
析を行う。検出パタンの一例を図5に示す。パタンは、
レベル0として文書の章タイトルを検出するパタン、レ
ベル1として章を構成する節タイトルを検出するパタ
ン、さらには、より下位のレベルの節のタイトルを検出
するパタンをあらかじめ設定しておく。
【0030】図7において、記号“^”は行の先頭と、
“Snumber ”は数字と、“Sstring”は任意の文字列
と、“\n ”は改行と、それぞれ照合することを意味し
ている。例えば、レベル0の検出パタン“^[Snumber
]Sstring \n ”は、行の先頭に“[1]はじめに”
という文字列が存在した場合、その行と照合が成功する
ことになる。また、解析した結果は、例えば図8に示す
形式の図2に図示する文書構造記憶部15に格納する。
【0031】書式解析部13では、まず始めに、文書が
格納されているバッファの先頭アドレスへのポインタを
P、文字数をN、タイトルの検出レベルをOとして処理
を始める。章カウンタをOと設定するとともに、Pなら
びにNをそれぞれ、文書構造記憶部15のタイトルポイ
ンタおよび文字数に格納する。
【0032】検出パタンと照合する文字列が存在する位
置を探す。最初に、検出パタンと照合した文字列の先頭
アドレスを本文ポインタとして本文ポインタ(章カウン
タ+1)に格納する。そして、章カウンタの値を1だけ
増やす。順次、この処理を繰り返すことにより、本文ポ
インタ1、本文ポインタ2、本文ポインタ3へ、それぞ
れ章の先頭アドレスを格納していく。文書が格納されて
いるバッファも字数Nに対して処理が終了すると、文書
構造記憶部15に章の数が章カウンタ、それぞれの章へ
の先頭アドレスが、本文ポインタ1から本文ポインタn
へ格納されている。本文ポインタ1の指す最初の章か
ら、処理を行う。本文ポインタTの値をタイトルポイン
タTに格納する。さらに、本文ポインタT+1との差か
らも字数を求め、文字数Tに格納する。その後、タイト
ルポインタTのアドレスを本文ポインタTに格納する。
章カウンタTの値はOと設定する。
【0033】レベル1の検出パタンに照合する文字列が
存在する位置を探す。検出パタンと照合する文字列の先
頭アドレスを本文ポインタ(T,章カウンタ+1)に格
納し、章カウンタTを1増やす。これを繰り返すことに
より、節構造を得る。章Tに対して、章カウンタTの値
が0であった場合は、節が存在しなかったことを意味し
ている。そこで、その場合は、章のタイトルの次の文字
のアドレスを本文ポインタ(T,1)に格納する。すべ
ての章について以上の処理を行うことにより、章−節構
造を得る。
【0034】図4は、節の下位構成まで解析する場合の
流れを示している(例えば、“2.3.4”というよう
な章番号のタイトルを持つレベルまでの解析処理)。
【0035】書式解析部13で解析した文書構造は、文
書構造記憶部15に格納される。例えば、図9に示すよ
うな文書の場合、処理の結果、文書構造記憶部15に
は、図10に示すような値がそれぞれ設定される。
【0036】図11に、要約生成部14の構成を図示す
る。
【0037】本実施例における要約生成部14は、文脈
構造解析部41、ペナルティ計算部42、文章再構成部
43からなる。文脈構造解析部41は、文書中で用いら
れている修辞的な表現を抽出し、各章あるいは節の文章
部分の論理的な構造を解析する。ペナルティ計算部42
は、解析した文脈構造に基づいて各文の重用度について
のペナルティの計算を行う。
【0038】文脈構造解析部41における処理自体は、
本願の発明の主旨ではない。例えば文献(A Discourse
Structure Analyzer for Japanese Text,K.Sumita,Int.
Conf.on Fifth Generation Computer ´92)で開示さ
れている方法を用いることができる。この処理により、
図12の(b)に示す文章に対して、図12の(a)に
示す文脈構造を得ることができる。図示した文脈構造
は、第2文が第1文に対して「展開」という関係にあ
り、さらに第3文が第1文と第2文に対して「予定」と
いう関係にあることを表している。
【0039】文脈構造は、図13に示すデータ構造で要
約文章記憶部15に記憶する。データ構造は、そのノー
ドの持つ関係(文脈構造.Rel)と、左右のノードへ
のリンク(文脈構造.L、文脈構造.R)を表現してい
る。ただし、終端ノードの場合、文脈構造.Relには
対応する文へのポインタを、また文脈構造.Lと文脈構
造.Rには−1をそれぞれ格納する。
【0040】図14にペナルティ計算部42の処理の流
れを示す。ペナルティ計算部42は、ペナルティ計算を
再帰的に行うことにより処理を進める。処理が終わった
段階でペナルティの小さい終端ノードが、より重要であ
ることになる。
【0041】ペナルティ計算は、文脈構造解析部41で
解析した文脈構造、ならびにペナルティの初期値を入力
とする。始めに、文脈構造が終端ノードか否かを判定す
る。文脈構造.Lに格納されている値が−1である場
合、終端ノードであるので、入力されたペナルティを文
脈構造.Pに設定する。
【0042】一方、文脈構造.Lに格納されている値が
−1でなければ、終端ノードではなく、非終端ノードで
ある。この場合、文脈構造.Relに格納されている関
係が右重点型か左重点型か、あるいはそのいずれでもな
いかの判定を行う。この判定は、予め記憶しておいた関
係テーブルに基づいて行う。関係テーブルの一例を下に
示す。 順接 右重点型 予定 左重点型 例示 左重点型 上記のテーブルは、「順接」という関係が右重点型であ
ることを表している。
【0043】文脈構造.Relに格納されている関係が
右重点型である場合、右ノードの方が重要であるから、
ペナルティPにペナルティP1を足し合わせた値を左ノ
ードの側のペナルティ計算に与え、ペナルティPを右ノ
ードの側のペナルティ計算に与える。
【0044】逆に、文脈構造.Relに格納されている
関係が左重点型である場合、左ノードが重要であるの
で、ペナルティPを左ノードの側のペナルティ計算に与
え、ペナルティPにペナルティP1を足し合わせた値を
右ノードの側のペナルティ計算に与える。
【0045】また、文脈構造.Relに格納されている
関係が右重点型でも左重点型でもない場合、左右のノー
ドそれぞれについてのペナルティ計算には、ペナルティ
Pがそのまま引き渡される。
【0046】以上の再帰的な処理により、重用度の高い
文のペナルティには小さい値が、一方、重用度の低い文
のペナルティには大きい値が設定されることになる。そ
して、各文についてのペナルティが、要約文書記憶部1
5に格納される。
【0047】文章再構成部43の処理の流れを図15に
示す。文章再構成部43では、ペナルティ計算部42で
求めた全ての文のペナルティを参照し、予め定めたペナ
ルティ以下の文を取り出す。そして、接続表現の変更を
行い要約文を生成する。例えば、次のような文章を仮定
する。(ここで1、2、3は文を表現する)。 1 “よい建築物を作るためにはよい材料が必要であ
る。” 2 “しかし、よい道具も必要である。” 3 “つまり、材料だけではダメである。” そして、この文章に対応する文脈構造が次のような構造
であること。 (1 <逆接> (2 <重複> 3)) さらに、ペナルティ計算部により文1と文3がより小さ
いペナルティを与えられていると仮定する。
【0048】文1と文3を単純につなげた場合、原文と
論理的に異なる次のような文章が生成される。“よい建
築物を作るためにはよい材料が必要である。”“つま
り、材料だけではダメである。”そこで、接続表現の変
更では、キーセンテンスと判定された文間の最も上位の
関係に対応する接続表現に付け代える。上記の例では、
文1と文3の間の最も上位の関係は、<逆接>であるの
で、この関係に対応する接続表現「しかし」に置き換え
ることにより、次のような文章を生成する。“よい建築
物を作るためにはよい材料が必要である。”“しかし、
材料だけではダメである。”文章再構成部43により、
原文と論理的に整合性のある要約文が生成される。ま
た、文章再構成部43におけるペナルティP2の値を変
化させることにより、要約文として生成する文の量を制
御することができる。したがって、利用者がこのペナル
ティP2を設定し直すことにより、表示される要約文の
量を制御することが可能である。
【0049】図16に検索結果提示部17の処理の流れ
を図示する。
【0050】まず始めに、検索結果の各文書に対して、
文書構造記憶部15に格納されている文書からタイトル
と著者名を取り出す。例えば、図9に図示した文書例に
対しては、「文書の自動レイアウトシステム」というタ
イトルと「山田太郎、佐藤花子」という著者名が取り出
される。
【0051】次に、前記のステップに対応して要約文章
記憶部16から「概要」部分に対応する文脈構造を取り
出す。そして、図15に図示した文章再構成処理43を
起動し、「概要」部分の要約文章を生成する。そして、
図1に図示した表示手段4に対して、図17に示すよう
な検索結果のリストアップ表示を行う。例えば、図9に
図示した文書に対しては、次のように一番上に図示され
ているという表示が行われる。 「文章の自動レイアウトシステム 山田太郎、佐藤花子 本稿では、その技術的な詳細について解説する。」 表示を行った後、検索結果提示部17はマウスなどポイ
ンティングデバイスからの入力イベントを待つ。利用者
がマウスによってリストアップされている一つの文書を
選択した場合、選択された文書に対して要約文章提示部
18を起動する。図18に要約文章提示部18の処理の
流れを図示する。また、図19から図22に要約文章提
示部18における表示例を図示する。
【0052】まず始めに、要約文章提示部18では、検
索結果提示部17で選択された文書の要約文章を表示す
る。この表示では、検索結果提示部17と同様にタイト
ル、著者名、概要部分を表示するとともに、文書構造記
憶部15を参照して文書の各章の見出しも表示する。図
19は、図17に図示したリストアップから最初の文書
を選択した場合の表示例を図示したものである。
【0053】次に、利用者により表示の入力が行われ、
それが詳細度変更のコマンドであった場合、指定された
位置から章番号を求めるとともに、図20に図示するよ
うに詳細度入力メニューを表示する。そして、利用者が
詳細度を入力することにより、例えば、以下の式によっ
て文章再構成部43が生成する際のペナルティP2を決
定し、対応する章の要約文章を生成する。 P2=C×(詳細度) ここで、Cは予め定められた定数である。
【0054】次に、要約文章提示部16は、改めて生成
した要約文章を始めに表示した要約文章に挿入して表示
する。この様子を図21に図示している。図21に斜線
で囲んだ部分は、新たに生成した要約文章のうちの追加
部分である。
【0055】図21では、概要部分を指定して、その部
分の要約文章の詳細度を変更して表示したが、図22に
図示したように各章の見出し部分が指定された場合は、
その指定された章の要約を新たに表示することになる。
【0056】要約文章提示部18は、以上の処理を繰り
返し行う。これにより、利用者は所望の章の要約文章の
詳細度を変更することができる。詳細度を100%にし
た場合、原文が表示されることになる。
【0057】実施例の要約生成部14では、文脈構造を
解析することにより要約文章を生成したが、その他の従
来より開示されている手法(例えば、使われている単語
の頻度を求めて、頻度の高い単語を含む文を取り出す手
法、あるいは、単純に文章の前方から順に文を切り取っ
て来る手法など)など利用するように変形することは容
易である。
【0058】また、実施例の検索結果提示部17は、文
章再編成部43で生成した要約文章をそのまま表示して
いる。このため、図17に図示したように第3番目の文
書については、要約文章が3行に亘って表示されてい
る。しかし、これを、次に示すように要約文章の部分を
一定の長さに制限して提示するようにすることも可能で
ある。 「DSIのCAD 田中一夫 各種のLSIのCADの中で、EAの代表として、 カスタムVLSICADとアナログレイアウトCAD」 実施例の要約文章提示部18では、起動時点では、タイ
トル、著者名、概要部分の要約文章、各章の見出しを表
示したが、これを例えば、後書きの部分についての要約
文書を提示するように変形することは容易である。同様
に様々な形態での表示を行えるように利用者がカスタマ
イズできるようにすることも可能である。また、実施例
では、図20に図示したように逐一詳細度を設定するよ
うにしているが、詳細度を一定の比率で増加させるよう
にすることにより、逐一設定することを省略することも
可能である。
【0059】実施例の検索処理部12は、検索装置内に
もちローカルなテキストデータベースを対象にして検索
処理を行っているが、これをオンラインでアクセスする
形態のデータベースに変更することも容易である。
【0060】又、複数の要約文の提示を同時に行ったが
順々に提示してもよいし、所定個ずつ分割して提示して
もよい。又さらに上述した利用者の要求に応じた詳細度
は外部から指定することも可能である。
【0061】次に、図23ないし図26を参照して他の
実施例を説明する。
【0062】この実施例は、図2の要約文書提示部18
の処理内容以外は先の実施例と同じであり、同一部分に
ついては詳細な説明を省く。
【0063】図23は、この実施例に従った要約文書提
示部18の処理の流れを示している。この処理の流れに
よると、スタートで、まず、レベル0からレベルMまで
の章あるいは節などのタイトルを図25の(a)に示す
ように表示する。その後、入力イベントを待つ。入力が
あると、入力が詳細度変更コマンドか否かを判定する。
この判定がYESであれば、レベルMはレベルの最大値
であるかを判定するステップに進み、NOであれば、終
了コマンドか否かを判定するステップに進む。
【0064】レベルMの判定結果がNOであれば、Mを
1つインクリメントし、最初のステップに戻り、YES
ならカーソルの位置が含まれる章あるいは節などのレベ
ルLと章番号Qを求める。この後、詳細度入力メニュー
を表示し、詳細度の入力を待つ。詳細度コマンドが指定
されると、図24の(b)に示すように節の見出しが追
加表示される。さらに、図25の(a)に示すように、
3.2節の(1)と(2)の見出しが表示される。
【0065】さらに、詳細度コマンドが指定されると、
カーソルにより指示されている2.1節の抄録文章が図
25の(b)に示すように表示される。このとき、カー
ソルが第2章の見出しの位置に置かれていた場合には、
図26に示すように第2章の見出しの直後に、2.1節
および2.2節の文章の抄録文が表示される。
【0066】次に、入力された詳細度に従って文書再構
成処理を行う。この文書再構成処理により生成された要
約文書を表示中のテキストに挿入する。この後、章番号
Qがインクリメントされ、章番号の章あるいは節などの
レベルがLより小さいか否かが判定される。この判定が
YESであれば、文書再構成処理のステップに戻り、N
Oであれば、入力イベント待ちのステップに戻る。
【0067】入力が詳細変更コマンドか否かを判定する
上述した判定ステップにおいて、判定がNOであれば、
入力が終了コマンドか否かが判定され、終了コマンドで
あれば、ウィンドウを消去し、動作が終了するが、この
判定がNOであれば、入力イベント待ちのステップに戻
る。
【0068】以上に説明したように、上記実施例による
と、詳細度コマンドの指定に従って抄録文章を表示し、
入力された詳細度に従って文書再構成処理を行うことに
よって要約文書を作成し、この要約文書を検索に適用し
ているので、文書検索において、必要最小限の労力で検
索対象の文章の内容を利用者に理解させることができ
る。
【0069】本発明は、上記実施例に限定されず、発明
の主旨を逸脱しない範囲において様々な変形を行うこと
ができる。
【0070】
【発明の効果】以上説明したように、本発明の文書検索
装置では、指定する章や節を個別に詳細度の異なる要約
文章として動的に提示することが可能になる。これによ
り、利用者は必要最少限の労力で検索結果の個々の文書
に書かれた内容を理解することができるようになり、効
率的な検索行為が実現できる。
【図面の簡単な説明】
【図1】機器構成図。
【図2】機能構成図。
【図3】システム制御部の処理の流れを示す図。
【図4】書式解析部の処理の流れを示す図。
【図5】書式解析部の処理の流れを示す図。
【図6】書式解析部の処理の流れを示す図。
【図7】タイトル検出パターンを示す図。
【図8】文書構造記録部の形式を示す図。
【図9】文書例を示す図。
【図10】文書構造記録部の内容例を示す図。
【図11】要約生成部の処理の流れを示す図。
【図12】文書例と文脈構造を示す図。
【図13】要約文章記憶部に格納される文脈構造の例を
示す図。
【図14】ペナルティ計算部の処理の流れを示す図。
【図15】文章再構成部の処理の流れを示す図。
【図16】検索結果提示部の処理の流れを示す図。
【図17】検索結果提示部における表示例を示す図。
【図18】要約文章提示部の処理の流れを示す図。
【図19】要約文章提示部における表示例を示す図。
【図20】要約文章提示部における表示例を示す図。
【図21】要約文章提示部における表示例を示す図。
【図22】要約文章提示部における表示例を示す図。
【図23】他の実施例に従った要約文書提示部の処理内
容を示す流れ図。
【図24】図24の実施例に基づいた要約文章提示部に
おける表示の一例を示す図。
【図25】図24の実施例に基づいた要約文章提示部に
おける表示の他の例を示す図。
【図26】図24の実施例に基づいた要約文章提示部に
おける表示の他の例を示す図。
【符号の説明】
1…中央処理手段 2…記憶手段 3…表示コ
ントローラ 4…表示手段 5…入力コントローラ 6…入力手

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 複数の文書が記憶された記憶手段と、こ
    の記憶手段に記憶された文書に対し検索を行う検索手段
    と、この検索手段によって得られた文書の構造を解析す
    る解析手段と、この解析手段で得られた文書構造に基づ
    いて要約文章を生成する要約生成手段と、この要約生成
    手段によって得られた文書についての要約文章が複数存
    在する場合にこれらを同時あるいは順次提示する検索結
    果提示手段と、この検索結果提示手段で提示された要約
    文章の1つを選択する選択手段と、この選択手段によっ
    て選択された要約文章に対して、より詳しい要約文章あ
    るいは原の文書そのものを提示することを特徴とする文
    書検索装置。
JP34952993A 1993-09-13 1993-12-28 文書検索装置 Expired - Fee Related JP3383049B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34952993A JP3383049B2 (ja) 1993-09-13 1993-12-28 文書検索装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP22681593 1993-09-13
JP5-226815 1993-09-13
JP34952993A JP3383049B2 (ja) 1993-09-13 1993-12-28 文書検索装置

Publications (2)

Publication Number Publication Date
JPH07129605A true JPH07129605A (ja) 1995-05-19
JP3383049B2 JP3383049B2 (ja) 2003-03-04

Family

ID=26527356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34952993A Expired - Fee Related JP3383049B2 (ja) 1993-09-13 1993-12-28 文書検索装置

Country Status (1)

Country Link
JP (1) JP3383049B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101990A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
EP0855660A2 (en) * 1997-01-17 1998-07-29 Fujitsu Limited Summarization apparatus and method
JPH10222520A (ja) * 1997-01-31 1998-08-21 Toshiba Corp 電子化文書処理装置
JPH11219361A (ja) * 1998-02-02 1999-08-10 Fujitsu Ltd 文書閲覧装置およびそのプログラムを格納した記憶媒体
JP2000242656A (ja) * 1999-02-19 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> 話題抽出方法、装置、および話題抽出プログラムを記録した記録媒体
KR100319756B1 (ko) * 2000-01-21 2002-01-09 오길록 논문 문서영상 구조 분석 방법
JP2003281165A (ja) * 2001-11-13 2003-10-03 Posco 文書要約方法及びシステム
JP2005258676A (ja) * 2004-03-10 2005-09-22 Seiko Epson Corp 文書出力装置及びその制御方法
JP2008192294A (ja) * 1995-07-26 2008-08-21 Sony Electronics Inc 情報取得装置及び情報取得方法
JP2011138270A (ja) * 2009-12-28 2011-07-14 Rakuten Inc 情報検索装置、情報提供方法、情報検索プログラム及び情報検索システム
US9367605B2 (en) 2009-09-23 2016-06-14 Alibaba Group Holding Limited Abstract generating search method and system
KR20200077126A (ko) * 2018-12-20 2020-06-30 주식회사 로지스랩 화물 운송을 위한 운송료 결제 시스템 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02224069A (ja) * 1988-11-21 1990-09-06 Hitachi Ltd 情報検索方法
JPH044467A (ja) * 1990-04-23 1992-01-08 Oki Electric Ind Co Ltd 文書構造解析装置
JPH04175966A (ja) * 1990-11-09 1992-06-23 Hitachi Ltd 文書論理構造生成方法
JPH04281566A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02224069A (ja) * 1988-11-21 1990-09-06 Hitachi Ltd 情報検索方法
JPH044467A (ja) * 1990-04-23 1992-01-08 Oki Electric Ind Co Ltd 文書構造解析装置
JPH04175966A (ja) * 1990-11-09 1992-06-23 Hitachi Ltd 文書論理構造生成方法
JPH04281566A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4660565B2 (ja) * 1995-07-26 2011-03-30 ソニー エレクトロニクス インク 情報取得装置及び情報取得方法
JP2008192294A (ja) * 1995-07-26 2008-08-21 Sony Electronics Inc 情報取得装置及び情報取得方法
JPH09101990A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
EP1338983A3 (en) * 1997-01-17 2003-12-17 Fujitsu Limited Summarization apparatus and method
EP0855660A2 (en) * 1997-01-17 1998-07-29 Fujitsu Limited Summarization apparatus and method
EP0855660A3 (en) * 1997-01-17 1998-08-19 Fujitsu Limited Summarization apparatus and method
EP1338983A2 (en) * 1997-01-17 2003-08-27 Fujitsu Limited Summarization apparatus and method
JPH10222520A (ja) * 1997-01-31 1998-08-21 Toshiba Corp 電子化文書処理装置
JPH11219361A (ja) * 1998-02-02 1999-08-10 Fujitsu Ltd 文書閲覧装置およびそのプログラムを格納した記憶媒体
JP2000242656A (ja) * 1999-02-19 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> 話題抽出方法、装置、および話題抽出プログラムを記録した記録媒体
KR100319756B1 (ko) * 2000-01-21 2002-01-09 오길록 논문 문서영상 구조 분석 방법
JP2003281165A (ja) * 2001-11-13 2003-10-03 Posco 文書要約方法及びシステム
KR100435442B1 (ko) * 2001-11-13 2004-06-10 주식회사 포스코 문서 요약 방법 및 시스템
JP2005258676A (ja) * 2004-03-10 2005-09-22 Seiko Epson Corp 文書出力装置及びその制御方法
JP4572321B2 (ja) * 2004-03-10 2010-11-04 セイコーエプソン株式会社 文書出力装置及びその制御方法
US9367605B2 (en) 2009-09-23 2016-06-14 Alibaba Group Holding Limited Abstract generating search method and system
JP2011138270A (ja) * 2009-12-28 2011-07-14 Rakuten Inc 情報検索装置、情報提供方法、情報検索プログラム及び情報検索システム
KR20200077126A (ko) * 2018-12-20 2020-06-30 주식회사 로지스랩 화물 운송을 위한 운송료 결제 시스템 및 방법

Also Published As

Publication number Publication date
JP3383049B2 (ja) 2003-03-04

Similar Documents

Publication Publication Date Title
JP3691844B2 (ja) 文書処理方法
US6411924B1 (en) System and method for linguistic filter and interactive display
US8359550B2 (en) Method for dynamically generating a “table of contents” view of the HTML-based information system
JP2783558B2 (ja) 要約生成方法および要約生成装置
US20050268227A1 (en) Method and system for mapping content between a starting template and a target template
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
JP3383049B2 (ja) 文書検索装置
JP2002197104A (ja) 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
JP3143345B2 (ja) 文字列検索装置
JPH11184865A (ja) 文書要約装置
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JP3937741B2 (ja) 文書の標準化
JPH08287088A (ja) 情報検索方法及びその装置
JP2785692B2 (ja) 辞書検索表示装置
JPH06231178A (ja) 文書検索装置
JPH05113964A (ja) 電子辞書
JPH08212230A (ja) 文書検索方法及び文書検索装置
JPH10340271A (ja) 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体
JPH06195386A (ja) データ検索装置
JP3022079B2 (ja) 全文データベースシステム
JPH0969087A (ja) 文書作成装置及び文書作成方法
JPH01214963A (ja) 辞書引き装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JPH09305623A (ja) 文書表示システム
JPH09218872A (ja) 文書処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081220

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111220

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121220

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131220

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees