JP3647283B2 - 文書情報抽出装置 - Google Patents

文書情報抽出装置 Download PDF

Info

Publication number
JP3647283B2
JP3647283B2 JP26610598A JP26610598A JP3647283B2 JP 3647283 B2 JP3647283 B2 JP 3647283B2 JP 26610598 A JP26610598 A JP 26610598A JP 26610598 A JP26610598 A JP 26610598A JP 3647283 B2 JP3647283 B2 JP 3647283B2
Authority
JP
Japan
Prior art keywords
display
document data
document
extraction
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26610598A
Other languages
English (en)
Other versions
JP2000099526A (ja
Inventor
一夫 西浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP26610598A priority Critical patent/JP3647283B2/ja
Publication of JP2000099526A publication Critical patent/JP2000099526A/ja
Application granted granted Critical
Publication of JP3647283B2 publication Critical patent/JP3647283B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、1つの、あるいは複数の文書データから特定の情報、例えば要約情報を抽出してユーザに提示する文書情報抽出装置において、特にユーザインタフェースに着目した文書情報抽出装置である。
【0002】
【従来の技術】
従来、電子化された文書データから情報を抽出する技術として、最も単純な例の一つにKWICを挙げることができる。KWICとは key word in context の略で、ある特定の単語、あるいは単語に限らず任意の文字列に関して、その文字列を含む前後の一定長の文字列を抽出し、表示を行う技術である。図7はKWICの実行結果例であるが、この図では文書データ中に出現する指定単語「文書データ」を中心としてその前後の文章の表示が行われている。KWICは特定の単語に関して、その単語が使用される前後の文脈の把握が容易であるため、情報検索装置におけるキーワード検索機能などにおいて非常に頻繁に利用される技術である。
【0003】
文書データから情報抽出を行うもう少し複雑な例としては、文書中の重要文抽出技術や文書要約技術を挙げることができる。
重要文抽出技術とは文字どおり、文書中で重要度が高いと思われる文を抽出し、表示を行う技術である。この技術は文書データ、特にサイズの大きい文書データに対して、重要度が高いと判定された文のみを抜き出して表示を行うことにより、装置の使用者がより少ない労力で文書データの概略把握を行えるような手段を提供することを目的とするものである。文の重要度の判定には、自然言語処理と呼ばれる技術に属する構文解析技術や意味解析技術が使用されることが多い。
【0004】
文書要約技術は、単純に文書データから抽出した情報をそのまま表示するのではなく、抽出した情報をさらに加工し、再構成してから表示する点に特徴がある。例えば文書データから重要と思われる単語や文、あるいは段落といった情報の抽出を行うのであるが、抽出した情報をそのまま並べて表示するのではなく、人間にとって読みやすい文となるような処理を加えてから表示する。
【0005】
このような抽出情報に対する加工、再構成の処理にも自然言語処理技術が頻繁に使用される。例えば抽出した文間への接続詞の挿入、文脈処理による主語や目的語の補完、文の態の変換などである。
このように文書要約技術は、正確には情報抽出にとどまる技術ではなく、抽出した情報を更に加工、再構成する技術をも含んでいるが、一般にはこの両者をあわせて情報抽出と呼ぶことも多く、本発明においてもこのような意味で情報抽出という言葉を用いることにする。
【0006】
重要文抽出技術や文書要約技術に関する実現手段としてはすでにいくつもの方法が提案されており、例えば言語処理学会第4回年次大会ワークショップなどにおいても効率的、高精度な方法の提案が行われている。
重要文抽出技術については、商用のシステムにおいてもワードプロセッサの1機能等として使用されている。
またこれらの他にも、固有名詞を含む文の抽出や、日付表現を含む文の抽出など、様々な形での情報抽出装置が提案、実現されている。
【0007】
このような情報抽出技術は、近年のワードプロセッサやパーソナルコンピュータ、あるいはインターネットの普及によって益々増大する傾向にある大量、大容量の電子化文書データの中から、ユーザにとって必要な情報をすばやく探し出すという情報検索の目的、あるいは文書の概略をユーザがすばやく理解できるような手段を提供するという速読支援の目的で使用されるのがこれまで一般的である。
【0008】
そのためこのような技術を備えた文書情報抽出装置においては、抽出結果をユーザに提示する際の表示の形態として、抽出結果の一覧性に重点が置かれることが多い。すなわち、大量の文書データの中から何らかの情報を取り出す必要に迫られているユーザを前提とし、ユーザがその目的をより効率よく、より短時間で達成できるような手段を提供するための表示形態である。
【0009】
このような表示形態は大量、大容量の文書データを取り扱う際の労力を減少させ、作業の能率を向上させたいという欲求から生まれた実利的な方法であるが、近年のインターネットの普及による電子メール、電子掲示板、あるいはWWW(World Wide Web)と呼ばれるハイパーテキスト形式での文書データの流通は一方で、大量、大容量の文書データの閲覧、編集、管理を好み、それ自体に娯楽性を感じるユーザをも生み出している。
【0010】
【発明が解決しようとする課題】
このようなユーザにとっては情報抽出技術自体が有用であり、インターネット上の検索エンジンなどのように情報抽出技術が搭載された装置が頻繁に使用されることに変わりはないが、一覧性を重視した従来の表示形態は必ずしもユーザの嗜好を満たすものではなかった。
【0011】
またこれとは別に、例えば現在のパーソナルコンピュータにおいて主流となっているような、複数のプログラムモジュールを同時に実行可能であるマルチタスクオペレーティングシステム上で実現された文書情報抽出装置について考えてみると、ユーザは装置が備える情報抽出の機能を利用する一方で、装置が備える別の機能、例えば文書作成のためのワードプロセッサ機能や、あるいはゲームの機能などを同時に実行するといった、いわゆる「ながら作業」となるような利用状況が頻繁に発生する。
【0012】
このような利用状況において一覧性を重視した従来の表示形態では、表示手段において相当部分の表示領域を占有して結果の表示を行う必要があり、ユーザが別の作業のために使用できる表示領域が限られたものになってしまうという問題があった。
本発明は、上記問題点に鑑み、文書データから抽出された情報を限られた表示領域に表示する際に、ユーザにとって読み取りやすいスクロール速度となるように制御する文書情報抽出装置を提供することを目的とする。
【0013】
【課題を解決するための手段】
本発明の文書情報抽出装置は、文書データから固有名詞又は日付表現を含む文を重要文として抽出する文書情報抽出手段と、文書データを表示する表示手段とを備える文書情報抽出装置において、前記表示手段に前記文書データをスクロール表示させる表示制御手段と、前記文書情報抽出手段で抽出された重要文をスクロールさせる時にスクロール速度を遅くするスクロール速度自動調節手段とを備えるものである。
【0014】
また、前記表示手段が表示している重要文の表示属性を制御する表示属性自動調節手段を備える。また、抽出の対象とする複数の文書データを管理する抽出対象文書管理手段と、複数の重要文を1つにまとめる抽出情報結合手段とを備える。また、前記複数の文書データの抽出の順序を決定する処理順序決定手段を備える。また、前記複数の文書データの重要文の表示順序を決定する表示順序決定手段を備える。
【0015】
また、抽出対象である文書データとその重要文との対応を管理する抽出結果対応管理手段と、ユーザからの入力指示を受けて、その時点で表示手段が表示している重要文に対し、前記抽出結果対応管理手段が管理している対応する元の文書データを表示手段に表示させる元文書データ表示指示手段とを備える。
【0016】
本発明のコンピュータ読み取り可能な記録媒体は、コンピュータを上述の文書情報抽出装置として機能させるためのプログラムを記録している。
【0020】
【発明の実施の形態】
以下添付図面を参照しながら本発明の好適な実施の形態について詳細に説明する。
図1は本発明の一実施の形態による表示の一例であり、時間経過にともなって徐々に表示がスクロールされる様子を表している。表示領域に表示しきれない分量の情報を表示するときに、先頭部分から徐々に表示を行って、表示領域がいっぱいになった時点で先頭部分の情報の表示を消去し、消去した部分を詰めるようにして現在の表示位置を移動、再表示させ、それによって新しく利用可能となった表示領域に続きの情報を表示するという手順を繰り返して順に全情報を出力する手法がスクロール表示であり、このようなスクロール表示は、表示領域の限られた表示装置を持つおおかたの情報処理装置一般で非常に頻繁に用いられる手法である。表示を書き換えて続きの情報を表示するタイミングとしては、表示すべき情報が装置によって生成・用意された時点、あるいはユーザが何らかの指示手段によって指示を行った時点で行われるのが通常である。
【0021】
図2は、本発明の一実施の形態の構成を示すブロック図である。
記憶装置1は、磁気ディスク等の磁気記憶装置、CD−ROM等の光記憶装置、RAM等の半導体記憶装置など、一般の計算機において使用される記憶装置1でよく、文書データはこの記憶装置1のファイルシステム上に格納される。
【0022】
文書情報抽出手段8は、文書データから何らかの情報を抽出するための手段であり、例えば文書データから特定の情報を抽出するためのアルゴリズムを記述したソフトウェア、およびそのソフトウェアを実行するCPUにより実現可能である。
表示手段14にはCRTやLCDなど、リアルタイムで表示の更新が可能な一般の表示装置を使用することができる。
表示制御手段13は、表示手段14に対して表示情報を送出するための手段であり、例えば表示手段に対するドライバーソフトウェアとして実現可能である。このドライバーソフトウェアは、表示手段における表示内容を一定期間毎に更新できるように設計された通常のドラバーソフトウェアでよい。
【0023】
スクロール速度制御手段15は、表示情報のスクロールが所定の速度となるよう表示制御手段13に対してタイミング信号を送出するための手段であり、例えば一定期間毎に割り込み信号を発生させるタイマー装置と、その割り込み信号をもとにして表示装置14における表示更新のタイミングを制御するソフトウェアとして実現可能である。このソフトウェアは、割り込み信号をカウントし、一定カウント毎に表示制御手段13に対してタイミング信号を送るといったアルゴリズムのものでよい。
【0024】
文書情報抽出手段8のアルゴリズムとしては様々なものが考えられるが、文書データ中から例えば重要度の高い文を抽出するアルゴリズムによって実現することができる。
特開平6−215049号公報において文書中の要約を抽出する手順が説明されており、例えばこのようなアルゴリズムを用いることで、実現することが可能である。
文書情報抽出手段8を、文書データ中から固有名詞を含む文を抽出するアルゴリズムにより実現することもできる。
【0025】
特公平7−7419号公報において、文書中の固有名詞をより高い精度で検出する手順が説明されており、例えばこのようなアルゴリズムを用いることで、実現することが可能である。
文書情報抽出手段8を、文書データ中から日付表現を含む文を抽出するアルゴリズムにより実現することもできる。
特開平5−158971号公報において、文書中の日付表現を柔軟に検出するための手順が説明されており、例えばこのようなアルゴリズムを用いることで、実現することができる。
【0026】
スクロール速度ユーザ設定手段17は、ユーザの好みにスクロール速度を設定するための手段であり、これはキーボードなどユーザが設定を指示するための手段と、その設定内容を記憶するメモリーにより実現可能である。メモリーの内容をスクロール速度制御手段15が参照することにより、スクロール速度が調節される。
【0027】
スクロール速度自動調節手段16は、文書情報抽出手段8による情報抽出時の情報をもとにしてスクロール速度を決定する。これは、例えば文書情報抽出手段8について考えると、情報抽出時に計算される各文の重要度をもとにし、重要度とスクロール速度を対応付けるアルゴリズムによりスクロール速度を決定するソフトウェアとして実現が可能である。
【0028】
このアルゴリズムは、例えばスクロール速度を各文の重要度の逆数に比例する値として計算すれば、重要度の低い文については速い速度でスクロールが行われるため表示が一瞬で過ぎ去り、また重要度の高い文についてはゆっくりとした速度でスクロールが行われるためユーザはその情報をじっくりと読むことが可能となる。
【0029】
表示属性自動調節手段18は、文書情報抽出手段による情報抽出時の情報をもとにして表示色や表示サイズ、表示フォントを変更したり、点滅表示させるなどの表示属性を決定し、その内容を表示制御手段13に送出する。これは、情報抽出時に計算される各文の重要度をもとにし、重要度の高い文のみ表示色を変更するといったアルゴリズムのソフトウェアとして実現が可能である。
【0030】
言語判別手段9と翻訳処理手段10を備えることで、情報抽出結果を常に日本語で表示することが可能となる。
言語判別手段9は、対象となる文または文書の文字コードや出現単語を調べるソフトウェアにより実現可能である。
翻訳処理手段10は、構文解析処理部、格解析処理部、生成処理部などを備えた通常の翻訳処理ソフトウェアなどとして実現可能である。
【0031】
これら言語判別手段9、翻訳処理手段10は図2中に示されるように、文書情報抽出手段8と表示順序決定手段11(後述)の間に挿入することで、文書情報抽出結果に対して翻訳処理を行ってもよいし、あるいは処理順序決定手段7と文書情報抽出手段8の間に挿入することで、文書情報抽出処理を行う前に翻訳処理を行っても構わない。あるいは抽出情報結合手段12と表示制御手段13の間に挿入するといったことも可能である。言語判別手段9、翻訳処理手段10の挿入位置は自由度が高い。
【0032】
情報抽出対象文書管理手段6は、情報抽出の対象とする複数の文書データを管理するための手段であり、それぞれの文書データへのファイルアクセスを制御するファイルポインタを管理するためのソフトウェアとして実現可能である。これにより、複数の文書に対して続けて情報抽出処理を行うことを可能とする。
抽出情報結合手段12は、複数の文書データからの情報抽出結果を1つにまとめて表示制御手段13に送るための手段であるが、これは各文書データからの情報抽出結果を順番に続けてメモリーに書き込み、書き込まれたメモリーの内容を表示制御手段13へと受け渡すアルゴリズムを持ったソフトウェアとして実現可能である。これにより、一括して結果を表示することが可能になる。
【0033】
処理順序決定手段7は、情報抽出対象文書管理手段6において管理されている文書データに対して、その処理順序を決定するための手段である。これは、例えば情報抽出対象文書管理手段6において管理されている文書データについて、文書データ作成日時をもとにソートを行うようなソフトウェアにより、作成日時の新しい順番で文書情報抽出手段8に文書データの内容を送出することで実現可能である。
【0034】
表示順序決定手段11は、複数の文書データから文書情報抽出手段8によって抽出されたそれぞれの情報抽出結果に対して、その表示順序を決定する手段であるが、これは例えば文書情報抽出手段8において情報抽出時に中間的に作成される抽出結果の重要度などをもとにして、重要度の高かった抽出結果から順に抽出情報結合手段12へと送信する、といったソフトウェアにより実現可能である。
【0035】
抽出結果対応管理手段20は、複数文書データ処理時に、それぞれの文書データからの情報抽出結果と、その元文書データとの対応を保持するための手段である。これは、各文書データからの情報抽出結果と、その元文書のファイルポインタの対応関係をメモリー上に記憶させることで実現可能である。
元文書データ表示指示手段19は、キーボードやマウスなど、一般の入力装置により実現される。
【0036】
元文書データ表示指示手段19よりユーザからの指示を受けたときには、抽出結果対応管理手段20が管理する対応情報をもとにして現在表示装置に表示中の情報抽出結果に対応する元文書データのファイルポインタを取得し、この文書データの内容を表示制御手段13に対して送出することで元文書データを閲覧することが可能となる。これによりユーザは複数の文書データの抽出情報をスクロール表示で次々と眺めながら、必要な情報が出現した時点で即座に元の文書データを閲覧することが可能となる。
【0037】
文書データフィルタリング手段5は、記憶装置1中に格納されている文書データのうち特定条件に従うものだけを情報抽出の対象とするための手段である。これは、例えば記憶装置1中に格納されている各文書データに対して文書データ作成日時を取得するソフトウェアにより、特定期間に作成された文書データのみを情報抽出対象文書管理手段6での管理対象とすることで実現可能である。あるいは、文書データの内容を検索して特定のキーワードを含む文書データを検出するソフトウェアにより、キーワードを含む文書データのみを情報抽出の対象とすることも可能である。
通信手段2は、ネットワーク上に接続された他の計算機と通信を行う手段であるが、これにはイーサネットなど通常のネットワーク環境において使用されるハードウェア、およびそのドライバソフトウェアでよい。
【0038】
ネットワーク文書取得手段3は、通信手段2によりアクセス可能となったネットワーク上の文書データに対して、その内容を読み出すソフトウェアとして実現可能である。
通信手段2、ネットワーク文書取得手段3を備えることにより、他の計算機の記憶装置中に格納されている文書データであってもネットワークを介して本発明の装置が備える記憶装置1中に存在する文書データと全く同様に情報抽出処理を行うことが可能となる。
【0039】
ハイパーテキスト自動探索手段4は、ネットワーク文書取得手段3により取得された文書データがハイパーテキスト形式である文書データである場合に、この文書内のリンク情報を解析することで、ネットワーク文書取得手段3で更に次々と文書データを取得するための手段である。これは、例えばインターネットにおいて頻繁に用いられるHTML形式のハイパーテキスト文書であればHTMLタグを解析し、解析したリンク情報をネットワーク文書取得手段3へと受け渡すソフトウェアとして実現可能である。これにより、ネットワーク上の計算機の記憶装置中に散在する大量の文書データに対して一括で情報抽出処理を行うことが可能となる。
【0040】
図3、図4、図5、図6は、以上に述べた図2の構成を持つ情報抽出装置全体において、例えば1ヶ月以内に作成された文書データから情報抽出処理を行い、重要度順に結果の表示を行うような場合の処理フロー図である。
ステップS1では本発明が備える記憶装置1、あるいは本発明と接続されたネットワーク上の文書データから1ヶ月以内に作成された文書データのみを選択して取得する。これは図2においては記憶装置1、通信手段2、ネットワーク文書取得手段3、ハイパーテキスト自動探索手段4、文書データフィルタリング手段5、情報抽出対象文書管理手段6により行われる。
【0041】
ステップS2では、情報抽出処理を行う順序を決定するために、文書データの作成日時順にソートを行う。この処理は文書データを処理順序決定手段7により行われる。
ステップS3では、各文書データから情報抽出処理を行い。それぞれの抽出結果に対して重要度を算出する。この処理は文書情報抽出手段8により行われる。ステップS4では、ステップS3で処理が行われた抽出結果に対して、これが英文であるときには日本語へと翻訳処理を行う。この処理は言語判別手段9、翻訳処理手段10により行われる。
【0042】
ステップS5では、各文書データからの抽出結果をステップS3で計算された重要度をもとにしてソートする。この処理は表示順序決定手段11により行われる。
ステップS6では抽出結果を順に出力する。この処理は抽出情報結合手段12、表示制御手段13、表示手段14により行われる。
抽出結果の表示中にユーザによって元文書表示指示が行われた場合(ステップS11)には、抽出結果対応管理手段20によって表示中の抽出結果に対応する元文書データが表示制御手段13へと送出される(ステップS12)。
【0043】
抽出結果の表示がすべて終了した時(ステップS13)には、ユーザからの指示の検出を終了する。
抽出結果の表示中、スクロール速度ユーザ設定手段17によってスクロール速度の設定の変更が行われた場合(ステップS21)には、基本スクロール速度を変更し(ステップS22)、スクロール速度制御手段15でその速度に応じたタイミング信号を表示制御手段13に送出する。
【0044】
表示中の抽出結果の重要度が変化した場合(ステップS23)には、スクロール速度自動調節手段16において重要度をもとに基本スクロール速度に対するスクロール速度係数を計算し(ステップS24)、スクロール速度を基本スクロール速度とスクロール速度係数の積としてスクロール速度制御手段15はタイミング信号を表示制御手段13に対して送出する。
この際、例えば、非重要文から重要文にスクロールしていくとき、重要文が表示に占める割合に応じてスクロールを徐々に遅くしたり、重要文が表示に占める割合が所定値に達したときにスクロールを遅くしたりすることができる。
【0045】
抽出結果の表示がすべて完了した時(ステップS25)には、スクロール速度の制御を終了する。
また、表示中の抽出結果の重要度が変化した場合(ステップS31)には、表示属性自動調節手段18において重要度をもとに表示文字サイズ等の表示属性を変更する(ステップS32)。変更された表示属性情報は、表示制御手段に送出される。
抽出結果の表示がすべて完了した時(ステップS33)には、表示属性の制御を終了する。
なお、本発明は上記実施の形態に限定されるものではない。
【0046】
【発明の効果】
請求項1に係る発明により、文書情報抽出装置において、抽出結果を読みやすい速度でスクロール表示し、動きのある結果表示によってユーザの注意を引き付けやすい、魅力的な表示形態とすることが可能となる。
また例えばある文書の要約結果を、限られた表示領域の中でもユーザにとって読み取りやすい自然な速度となるようスクロール速度を制御しながら表示を行うことによって、マルチタスクオペレーティングシステム上での「ながら」作業の中でも、別の作業を行いながら快適に対象文書のすばやい内容把握が可能となるような文書情報抽出装置を構成することも可能となる。
【0047】
請求項2に係る発明により、文書データ中の重要文を抽出する文書情報抽出装置において、抽出結果を読みやすい速度でスクロール表示する、新しい表示形態を提供することができる。
請求項3に係る発明により、文書データ中の固有名詞を含む文を抽出する文書情報抽出装置において、抽出結果を読みやすい速度でスクロール表示する、新しい表示形態を提供することができる。
請求項4に係る発明により、文書データ中の日付表現を含む文を抽出する文書情報抽出装置において、抽出結果を読みやすい速度でスクロール表示する、新しい表示形態を提供することができる。
【0048】
請求項5に係る発明により、スクロール表示の速度をユーザ設定可能とすることができる。
請求項6に係る発明により、スクロール速度を抽出内容に応じて自動的に調節することができる。
請求項7に係る発明により、文字色、文字サイズ、文字フォントなどの表示属性を抽出内容に応じて自動的に調節することができる。
【0049】
請求項8に係る発明により、外国語で記述された文書データに対しても母国語で抽出結果を表示することができる。
請求項9に係る発明により、複数の文書データに対しても一度に情報抽出処理を行うことができる。
請求項10に係る発明により、複数の文書データに対して情報抽出処理を行う際に、有用な順番で各文書データの情報抽出処理を行うことができる。
【0050】
請求項11に係る発明により、複数の文書データに対して情報抽出処理を行った際に、有用な順番で各文書データからの情報抽出結果を表示することができる。
請求項12に係る発明により、ユーザが指示した時点で表示されている情報抽出結果に対応する元の文書データを表示することが可能となる。
請求項13に係る発明により、特定の条件を満たす文書データのみを情報抽出処理の対象とすることができる。
【0051】
請求項14に係る発明により、ネットワーク上に存在する文書データに対しても情報抽出処理を行うことができる。
請求項15に係る発明により、ネットワーク上に存在するハイパーテキスト形式の文書データに関連する文書データについて一括して情報抽出処理を行うことができる。
請求項16に係る発明により、上記の文書情報抽出装置を記録媒体として実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態による表示の一例を示す図である。
【図2】本発明の一実施の形態の構成を示すブロック図である。
【図3】本発明における、複数の文書データから情報抽出する処理フロー図である。
【図4】本発明における、表示中の抽出情報に対応する元文書を表示する処理フロー図である。
【図5】本発明における、スクロール速度を調節する処理フロー図である。
【図6】本発明における、表示属性を調節する処理フロー図である。
【図7】KWIC形式による情報抽出結果の表示形態の一例を示す図である。

Claims (7)

  1. 文書データから固有名詞又は日付表現を含む文を重要文として抽出する文書情報抽出手段と、文書データを表示する表示手段とを備える文書情報抽出装置において、前記表示手段に前記文書データをスクロール表示させる表示制御手段と、前記文書情報抽出手段で抽出された重要文をスクロールさせる時にスクロール速度を遅くするスクロール速度自動調節手段とを備えることを特徴とする文書情報抽出装置。
  2. 前記表示手段が表示している重要文の表示属性を制御する表示属性自動調節手段を備えることを特徴とする請求項1記載の文書情報抽出装置。
  3. 抽出の対象とする複数の文書データを管理する抽出対象文書管理手段と、複数の重要文を1つにまとめる抽出情報結合手段とを備えることを特徴とする請求項1記載の文書情報抽出装置。
  4. 前記複数の文書データの抽出の順序を決定する処理順序決定手段を備えることを特徴とする請求項記載の文書情報抽出装置。
  5. 前記複数の文書データの重要文の表示順序を決定する表示順序決定手段を備えることを特徴とする請求項記載の文書情報抽出装置。
  6. 抽出対象である文書データとその重要文との対応を管理する抽出結果対応管理手段と、ユーザからの入力指示を受けて、その時点で表示手段が表示している重要文に対し、前記抽出結果対応管理手段が管理している対応する元の文書データを表示手段に表示させる元文書データ表示指示手段とを備えることを特徴とする請求項1記載の文書情報抽出装置。
  7. コンピュータを請求項1〜6のいずれかに記載の文書情報抽出装置として機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP26610598A 1998-09-21 1998-09-21 文書情報抽出装置 Expired - Fee Related JP3647283B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26610598A JP3647283B2 (ja) 1998-09-21 1998-09-21 文書情報抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26610598A JP3647283B2 (ja) 1998-09-21 1998-09-21 文書情報抽出装置

Publications (2)

Publication Number Publication Date
JP2000099526A JP2000099526A (ja) 2000-04-07
JP3647283B2 true JP3647283B2 (ja) 2005-05-11

Family

ID=17426394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26610598A Expired - Fee Related JP3647283B2 (ja) 1998-09-21 1998-09-21 文書情報抽出装置

Country Status (1)

Country Link
JP (1) JP3647283B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015620A (ja) 2001-06-29 2003-01-17 Seiko Epson Corp 表示制御システム、表示機器及び表示制御プログラム、並びに表示制御方法
US8671359B2 (en) 2003-03-07 2014-03-11 Nec Corporation Scroll display control
JP2008170544A (ja) * 2007-01-09 2008-07-24 Sharp Corp テロップ表示制御装置およびテロップ表示制御方法
JP2009020159A (ja) * 2007-07-10 2009-01-29 Sharp Corp 文字列表示装置および文字列表示方法
JP5494100B2 (ja) * 2010-03-25 2014-05-14 富士通モバイルコミュニケーションズ株式会社 情報処理装置
JP5757567B2 (ja) * 2011-08-25 2015-07-29 国立研究開発法人情報通信研究機構 コンテンツ提示装置、コンテンツ提示プログラムおよびコンテンツ提示方法
JP6717046B2 (ja) 2016-05-17 2020-07-01 富士通株式会社 関心度評価装置,方法及びプログラム
WO2018061174A1 (ja) * 2016-09-30 2018-04-05 株式会社オプティム 電子書籍作成システム、電子書籍作成法及びプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2589362B2 (ja) * 1989-01-30 1997-03-12 日本電信電話株式会社 プログラム形情報出力制御方式
JPH02297274A (ja) * 1989-04-10 1990-12-07 Nippon Telegr & Teleph Corp <Ntt> 文書出力制御方法
JPH077419B2 (ja) * 1989-06-30 1995-01-30 シャープ株式会社 機械翻訳装置における略称付き固有名詞処理方法
JPH03252860A (ja) * 1990-03-02 1991-11-12 Nippon Telegr & Teleph Corp <Ntt> 情報表示制御方法
JPH05158971A (ja) * 1991-05-30 1993-06-25 Sharp Corp 機械翻訳装置
JPH05158401A (ja) * 1991-12-06 1993-06-25 Ricoh Co Ltd 文書速読支援表示方式並びに文書処理装置及び文書検索装置
JPH06187380A (ja) * 1992-12-21 1994-07-08 Nippon Telegr & Teleph Corp <Ntt> 画像検索装置
JP2944346B2 (ja) * 1993-01-20 1999-09-06 シャープ株式会社 文書要約装置
JPH07104873B2 (ja) * 1993-02-08 1995-11-13 日本電気株式会社 自動ページめくり機能付き電子書籍装置
JP2576401B2 (ja) * 1993-12-15 1997-01-29 日本電気株式会社 電子ブック
JPH0850471A (ja) * 1994-08-05 1996-02-20 Koito Ind Ltd 情報表示装置およびこれを用いた表示方法
US5740549A (en) * 1995-06-12 1998-04-14 Pointcast, Inc. Information and advertising distribution system and method

Also Published As

Publication number Publication date
JP2000099526A (ja) 2000-04-07

Similar Documents

Publication Publication Date Title
US10706091B2 (en) User driven computerized selection, categorization, and layout of live content components
US7747611B1 (en) Systems and methods for enhancing search query results
US6968332B1 (en) Facility for highlighting documents accessed through search or browsing
US7085999B2 (en) Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus
KR100452569B1 (ko) 웹 브라우저 내에 그래픽 인쇄 기술의 통합 방법 및 시스템
US9075873B2 (en) Generation of context-informative co-citation graphs
KR100287093B1 (ko) 음성 합성 방법, 음성 합성 장치, 하이퍼 텍스트의 제어 방법 및 제어 장치
US5724595A (en) Simple method for creating hypertext links
US8826121B2 (en) Magnifying the text of a link while still retaining browser function in the magnified display
JPH10124413A (ja) 埋め込みウェブオブジェクトの優先順位づけダウンローディングの方法と装置
US7496831B2 (en) Method to reformat regions with cluttered hyperlinks
US20040080531A1 (en) Method, system and program product for automatically modifying a display view during presentation of a web page
US20080028292A1 (en) Techniques to facilitate reading of a document
US20040205514A1 (en) Hyperlink preview utility and method
JPH04127370A (ja) 情報収集システム
JP3647283B2 (ja) 文書情報抽出装置
US6745227B1 (en) Method, article of manufacture and apparatus for providing browsing information
US7310627B2 (en) Method of searching for text in browser frames
Wattenberg et al. Conversation thumbnails for large-scale discussions
JP2806867B2 (ja) ドキュメントデータベースの構築方法、表示方法、及び表示装置
JPH02121058A (ja) データファイル装置とデータ連想記憶検索方法及び検索装置
JPH11219361A (ja) 文書閲覧装置およびそのプログラムを格納した記憶媒体
JP3347047B2 (ja) 電子カルテ作成装置および電子カルテ作成プログラム記憶媒体
JP2003196194A (ja) リンク処理方法及び装置
JP2008191879A (ja) 情報表示装置、情報表示装置の表示方法、情報表示プログラム、および情報表示プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050208

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees