JP2004070376A - 文書表示装置および方法 - Google Patents

文書表示装置および方法 Download PDF

Info

Publication number
JP2004070376A
JP2004070376A JP2002169129A JP2002169129A JP2004070376A JP 2004070376 A JP2004070376 A JP 2004070376A JP 2002169129 A JP2002169129 A JP 2002169129A JP 2002169129 A JP2002169129 A JP 2002169129A JP 2004070376 A JP2004070376 A JP 2004070376A
Authority
JP
Japan
Prior art keywords
document
attribute
phrase
displaying
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002169129A
Other languages
English (en)
Inventor
Akio Yamashita
山下 明男
Takeshi Nagamine
永峯 猛志
Katsunori Yoshiji
芳地 克典
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2002169129A priority Critical patent/JP2004070376A/ja
Publication of JP2004070376A publication Critical patent/JP2004070376A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】文書中の重要語句をカテゴリに応じた表示属性で表示する。
【解決手段】文書格納部11は、読解対象の文書を記憶する。テキスト抽出部12は、読解対象の文書中の各ページから内容テキストを抽出する。抽出されたテキストはページごとに1つのファイルとしてテキスト格納部13に記憶される。固有表現抽出部14は、ページ毎のテキストファイルをテキスト格納部13から受け取ってその中に含まれる固有表現を抽出し、そのカテゴリ、固有表現文字列、位置情報等を含む固有表現情報を出力し、固有表現格納部15に記憶する。表示制御データ格納部17は、カテゴリ毎に表示する色を記憶する。表示データ生成部16は、表示制御部18の制御の下で、表示部19において表示する色分け情報を伴う表示データを生成する。表示部19は、文書をページ毎に表示し、カテゴリに応じた固有表現出現箇所の色分けを行う。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
この発明は、文章の読解を支援する技術に関し、とくに重要な語句をカテゴリ分けし、カテゴリごとに表示属性を変えて表示するようにしたものである。
【0002】
【背景技術】
大量の文書が電子化されるにともない膨大な量の文書が利用可能になってきている。利用者は、このような膨大な量の文書が有用なものかどうか、目的に合致したものかどうか等を、判断する必要がある。文書自体を読むか要約を作成してそれを読むかは別にして、最終的には、人間が、文書やその要約を読解して、その価値を判断する必要がある。そのような読解作業を容易に行えるようにすることが望まれる。
【0003】
本発明者らは、鋭意研究を重ね、大量の電子文書を比較的容易かつ高速に読解する支援技術を開発するに至った。
【0004】
すなわち、利用者が文書を読む際に、5W1H(誰が、何を、何時、どこで、なぜ、どのように)の語句または同様に重要な語句の出現箇所が強調表示されていると、大量の文書があっても、比較的容易に関連する文書かどうか判断できるという知見に到達した。なお、以下では、人名、地名、組織名等の固有名詞や、日時、価格(通貨)等の、5W1Hに相当する語句を固有表現と呼ぶこともある。本発明者らはこのような固有表現をカテゴリに分け表示分けすることが決めて有効であるという知見に到達した。Whoに相当するカテゴリの固有表現としては、人名や組織名(企業名)があり、Whereに相当するカテゴリの固有表現としては、地名があり、Whenに相当するカテゴリの固有表現としては日時表現がある。
【0005】
文章を表示する際に、重要語句(固有表現)の出現箇所をカテゴリに応じて色分けし、カテゴリ一覧表示からヒット箇所を表示することが望まれる。
【0006】
なお、この発明と関連する先行技術としてはつぎのものが知られている。
(1)検索キーの出現箇所を同じ色で表示する検索システム(Namazu。Namazuプロジェクトにより開発されている全文検索システム)や、検索キーごとに色を変えて表示する検索システム(Google。商標)が知られている。
(2)特開2000−99526公報には、文書データから抽出された情報を限られた表示領域に表示する際に、ユーザにとって読みやすいスクロール速度となるようにする装置が開示されており、抽出する対象として固有名詞を含む文書に言及している。
【0007】
従来技術(1)のように、検索キーの出現箇所の色を変えて表示させる場合には、どのようなカテゴリの語句かは一瞥して識別できず、人間が注意深く読んで判断する必要がある。
【0008】
また、従来技術(2)のように、固有名詞を含む文書を抽出して表示する場合にも、カテゴリに応じた表示の識別までは言及されておらず、どのような語句かはやはり人間が判断する必要があった。
【0009】
なお、関連する文書かどうかを判断する際に、文書全体を通読するのは効率的が悪い。従来の検索エンジンで検索されるのは文書であり、文書が複数ページからなる場合には全部のページに目を通す必要があった。より限定された範囲を読解するのみでよいようにすることも望まれる。
【0010】
【発明が解決する課題】
この発明は、以上の事情を考慮してなされたものであり、文書に含まれる重要語句(固有表現)の出現箇所をカテゴリに応じた表示属性で表示する技術を提供することを目的としている。また、この発明は、読解する範囲を限定する技術を提供することも目的としている。なお、この発明は、上述の目的のみに限定されない。この発明の他の目的は以下の説明から理解される。
【0011】
【課題を解決するための手段】
この発明によれば、上述の目的を達成するために、特許請求の範囲に記載のとおりの構成を採用している。ここでは、発明を詳細に説明するのに先だって、特許請求の範囲の記載について補充的に説明を行なっておく。
【0012】
すなわち、この発明の一側面によれば、上述の目的を達成するために、文書表示装置に:複数の所定の属性のグループに含まれる任意の属性を有する語句を文書から抽出する手段と;抽出した語句に、それぞれの属性に応じて対応する表示属性を関連づける手段と;上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれる上記語句を対応する表示属性で表示する文書表示手段とを設けるようにしている。
【0013】
この構成においては、語句の属性に応じた表示属性で語句の出現箇所をハイライトできるので、利用者はその部分のみを即座に理解して大凡の内容を理解し、さらに熟読する必要があるかどうかを判別し、熟読の価値がない文書については読解をスキップすることができる。
【0014】
所定の属性のグループとは、固有名詞等の文脈を理解する上で重要な語句(5W1Hのカテゴリ)あるいは同等に重要な語句である。どのような語句が該当するかは文書処理等の内容、目的に依存し、限定されない。
【0015】
また、この発明の他の側面によれば、文書表示装置に:複数の所定の属性のグループに含まれる任意の属性を有する語句を文書から抽出する手段と;抽出された語句を上記属性毎に分類して表示する語句表示手段と;利用者の操作に基づいて、抽出された語句または抽出された語句が有する属性を選択する手段と;上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれ、選択された上記語句または選択された上記属性を有する語句を、対応する表示属性で表示する文書表示手段とを設けるようにしている。
【0016】
この構成においては、抽出された語句をその属性に応じて分類して表示しているので、その表示内容から文書の大凡の骨格を把握でき、また、必要に応じて、その骨格中の語句等を選択して文書中でハイライト表示して詳細な文脈中でその語句の内容を確認できる。
【0017】
また、この発明のさらに他の側面によれば、文書検索装置に:複数の文書を記憶する手段と;文書を文書セグメントに分割する手段と;上記文書セグメントの各々について、索引を抽出する手段と;上記文書セグメントと上記索引との関連づけを記憶する索引格納手段と;文書セグメント単位で上記索引格納手段を参照してキーワード検索を行う検索手段と;上記検索手段による検索結果を表示する手段とを設けている。
【0018】
この構成においては、文書単位でなく、文書セグメント単位で検索を行えるので、キーワードに合致した文脈を絞り込んでレビューすることができ、従来のように、ヒットした文書の全部のページに目を通すという煩わしさがなくなる。
【0019】
文書セグメントは、例えばページである。その他、章や、節等の任意の文書構成要素でよい。
【0020】
複数の所定の属性のグループに含まれる任意の属性を有する語句を文書セグメントから抽出して索引としてもよい。ヒットした文書セグメントを表示する際に抽出した語句を属性に応じた表示属性でハイライトして表示してもよい。
【0021】
なお、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。
【0022】
この発明の上述の側面およびこの発明の他の側面は特許請求の範囲に記載され、以下実施例を用いて詳細に説明される。
【0023】
【発明の実施の形態】
以下、この発明の実施例について説明する。
【0024】
[第1の実施例]
図1は、ファイルサーバ等の記憶部に記憶されている多数の文書を閲覧して読解するのに適した文書処理装置に、この発明を適用した第1の実施例を示しており、この図において、文書処理装置は、文書格納部11、テキスト抽出部12、テキスト格納部13、固有表現抽出部14、固有表現格納部15、表示データ生成部16、表示制御データ格納部17、表示制御部18および表示部19等を含んで構成されている。
【0025】
文書格納部11は、読解対象の文書を記憶するものである。文書格納部11は逐次に1つの文書を指定して取り出せればよく、複数の文書を記憶していてもよい。テキスト抽出部12は、読解対象の文書中の各ページから内容テキストを抽出する。抽出されたテキストはページごとに1つのファイルとしてテキスト格納部13に記憶される。後に説明するように文書名に、ページ番号を表すサフィックスを付して、どの文書のどのページかがわかるようにすることが好ましい(例えば「foo_01」)。
【0026】
固有表現抽出部14は、ページ毎のテキストファイルをテキスト格納部13から受け取ってその中に含まれる固有表現を抽出する。この例では、形態素解析と所定の抽出ルールを用いる。これについては後に一例を挙げて説明する。固有表現抽出部14は、固有表現を抽出し、そのカテゴリ、固有表現文字列、位置情報等を含む固有表現情報を出力する。固有表現情報は固有表現格納部15に記憶される。
【0027】
表示制御データ格納部17は、カテゴリ毎に表示する色を記憶する。表示制御部18は、表示に関する種々の制御を行う。例えば、どのカテゴリについて色分けをイネーブルにするか、どのような表示形態で表示するかを制御する。表示データ生成部16は、表示制御部18の制御の下で、表示部19において表示する表示データを生成する。例えば、色制御、ページ選択、フレームを含むHTML(XML等でもよい)形式のデータを生成する。
【0028】
表示部19は、文書のページ等を表示する。この際、カテゴリに応じた固有表現出現箇所の色分けを行ったりする。表示部19は、例えば、HTMLファイル等をラスタライズするいわゆるウェブブラウザである。
【0029】
つぎに具体例を挙げてこの実施例の動作を説明する。
【0030】
テキスト抽出部12により抽出された1ページ分のテキストは例えば図2に示すようなものである。固有表現抽出部14は、このテキストから図3に示すような固有表現情報を抽出する。抽出結果は例えばXMLで記述されるが、これに限定されない。固有表現情報はそれぞれ「entity」のタグを用いて記述され、文字列、カテゴリ、位置情報(テキストの最初からのオフセットおよび語句の長さ)を含む。文字列は、例えば、「富士ゼロックス」(商標)、「山田」、「100ドル」等である。カテゴリは「COMPANY」、「PERSON」、「CURRENCY」等である。位置情報はバイト数で表される。
【0031】
表示データ生成部16は、テキストを用いてHTMLファイルを生成し、また、固有表現情報を用いて固有表現の出現位置に色分けするためにタグを付ける。例えば、「<FONT COLOR=”色コード”>」と「</FONT>」とで色分けする固有表現部分を囲む。固有表現の色分けはカテゴリ毎に決められており、その情報が表示制御データ格納部17に記憶されている。表示制御データ格納部17に記憶されている表示制御データは例えば図4に示すようなものである。表示データ生成部16は、表示制御部18の制御の下で、表示制御データ格納部17の表示制御データを参照して色分け用のタグをHTMLファイルに付加する。
【0032】
このように生成された表示データに基づいて表示部19に図5に示すような表示が行われる。図5の例では、「COMPANY」(企業名)のカテゴリの固有表現が「赤」(矢印Aで示す)で表示され、「PERSON」(人名)のカテゴリの固有表現が「青」(矢印Bで示す)で表示され、「CURRENCY」(通貨)のカテゴリの固有表現が「紫」(矢印Cで示す)で表示され、「DATE」(日時)のカテゴリの固有表現が「緑」(矢印Dで示す)で表示される。表示画面(右側の主たるフレーム)の上部には、各カテゴリのボタンが表示され、これによりカテゴリ毎の色分けのオンオフを制御していもよい。
【0033】
なお、図5の左側のフレームの「ツリー表示」のボタンは後に詳述するように固有表現の階層を表現するためのものであり、「要約表示」は、要約を表示するためのものである。テキストから自動的に要約を生成してもよい。「ダウンロード」ボタンは、文書やテキストを利用者の端末等にダウンロードするためのものである。
【0034】
図5の状態で、左側の「ツリー表示」のボタンを操作すると、図6に示すように、固有表現のツリーが表示される。このツリー構造は、一番上の階層(ルートの次。ルートは表示しない)は、「COMPANY」等の各カテゴリの名前であるである。次の階層が各カテゴリに属する個別の固有表現、例えば「富士ゼロックス」(商標)である。次の階層(最後の階層)は、その固有表現が出現したページ番号である。図6の例では1ページのみの文書であったのでページ番号は現れないが、文書に複数のページがある場合には、固有表現の「+」を操作すれば、対応するページ番号がその次の階層として現れる。
【0035】
ツリー構造の情報は、図3に示したような固有表現情報から生成できる。例えば、各エンティティにページ番号の情報を付加すればよい。
【0036】
図6の例では、左側のフレーム中のツリー構造内の個々のカテゴリ名や、個々の固有表現を操作することにより、色分け対象を指定できる。例えば、これらカテゴリ名や個々の固有表現にそれらの色分けを択一的にイネーブルするための記号を埋め込んでおき、クリック等の操作により、ウェブサーバ側のCGIやサーブレットに記号を送り、色分けのイネーブルを切り換えるようにしてもよい。ウェブページにオブジェクトを組み込んでもよい。
【0037】
図7は、文書が複数ページある場合の表示例を示している。この場合、右下のフレームのページ選択部のページ番号をクリック操作等してページの切り替えを行うようにできる。
【0038】
つぎに、固有表現抽出部14の詳細な動作について説明する。この例では、テキストなす入力文字列に対して形態素解析を行い、その結果に対して固有表現抽出ルールを適用して、固有表現を抽出する。
【0039】
例えば、図8に示すような入力例を考える。形態素解析に用いる辞書は例えば図9に示すようなものである。形態素解析では、単語の接続の可否を規定する接続可否テーブルを用いて、連続する単語を品詞情報から切り出していく。ここでは、接続可否テーブルの説明は省略する。形態素解析の解析結果を図10に示す。「/」は形態素間の区切りを示す。「<>」の中には形態素解析から得た品詞情報が記述される。各形態素の開始位置、長さも記述されるが、図では省略されている。
【0040】
固有表現抽出ルールは図11に示すようなものである。このルールを適用して図12に示すような固有表現情報を取得する。
【0041】
この実施例では、固有表現をカテゴリ毎に色分けして表示するので一瞥して文書やその一部の内容の大凡を把握でき、必要に応じて熟読すればよい。また、出現している固有表現をカテゴリ毎に階層表示しているので、出現する固有表現はツリー表示だけで把握でき、しかも、色分けしたい項目(ツリー構造のノード、個々のカテゴリや個々の固有表現)をクリック等操作して注目しているもののみ色分け表示することができ、大変に便利である。また、ページについても階層表示され、また、ページ選択を行うこともできるので、注目したい項目があれば、直ちにその項目がページを表示でき、しかも、注目項目のみ色分け表示できるので、適切な箇所に直ちに到達して、内容を即座に把握できる。
【0042】
[第2の実施例]
つぎに、第2の実施例について説明する。この実施例は第1の実施例に関連文書検索機能を付加したものである。
【0043】
図13は第2の実施例の文書処理装置を示しており、この図において、図1と対応する箇所には対応する符号を付した。図13において、索引生成部20は、テキスト格納部13のページ毎のテキストに関して関連文書検索用の索引データを作成する。ページ毎のテキストは、先に述べたように文書名とページを表すサフィックスとを連結したファイル名を有する。索引は、例えば、固有表現抽出部14により抽出した固有表現から構成する。索引名とページファイルとが関連づけられる。索引データは索引格納部21に格納される。検索部22は、利用者からのキーワードを受け取って索引格納部21を参照して検索を行い、検索結果を表示制御部18に渡し、この結果、検索結果の表示データが図14に示すように表示データ生成部16により生成され、表示部19に表示される。検索結果はページ単位である。したがって該当するページを選択すると図5や図6のような表示が行われる。ページ単位で検索結果が表示されるので目的の箇所を直ちに把握できる。
【0044】
他の構成は第1の実施例と同様であるので説明を省略する。
【0045】
なお、この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば、固有表現をどのようなものに選定するかを文書処理の内容に依存し、この実施例で説明したものに限定されない。要するに文書を把握する上で重要な語句であればよい。また固有表現抽出も上述の実施例の例に限定されない。また、固有表現等をハイライトするために色分けを行ったが、ブリンク属性としたり、下線表示としたり、種々の表示属性を用いることができる。
【0046】
【発明の効果】
以上説明したように、この発明によれば、文書または文書セグメント中の重要な語句をカテゴリごとの色分け等により即座に把握できるようにしたので、文書または文書セグメントの大凡を簡易に確認できる。また、文書セグメント単位で検索を行うようにすれば確認する範囲を絞り込むことができる。
【図面の簡単な説明】
【図1】この発明の第1の実施例の構成を示すブロック図である。
【図2】上述実施例の入力テキストの例を説明する図である。
【図3】上述実施例の固有表現抽出結果の例を説明する図である。
【図4】上述実施例の表示制御データの例を説明する図である。
【図5】上述実施例の文書の表示例を説明する図である。
【図6】上述実施例のツリー表示の例を説明する図である。
【図7】上述実施例の複数ページの文書を表示する例を説明する図である。
【図8】上述実施例の固有表現抽出の動作を説明する図である。
【図9】上述実施例の固有表現抽出の動作を説明する図である。
【図10】上述実施例の固有表現抽出の動作を説明する図である。
【図11】上述実施例の固有表現抽出の動作を説明する図である。
【図12】上述実施例の固有表現抽出の動作を説明する図である。
【図13】この発明の第2の実施例の構成を示すブロック図である。
【図14】第2の実施例の検索結果の表示例を示す図である。
【符号の説明】
11   文書格納部
12   テキスト抽出部
13   テキスト格納部
14   固有表現抽出部
15   固有表現格納部
16   表示データ生成部
17   表示制御データ格納部
18   表示制御部
19   表示部
20   索引生成部
21   索引格納部
22   検索部

Claims (12)

  1. 複数の所定の属性のグループに含まれる任意の属性を有する語句を文書から抽出する手段と、
    抽出した語句に、それぞれの属性に応じて対応する表示属性を関連づける手段と、
    上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれる上記語句を対応する表示属性で表示する文書表示手段とを有することを特徴とする文書表示装置。
  2. 文書を文書セグメントに分割する手段と、
    上記文書セグメントの各々について、当該文書セグメントから、複数の所定の属性のグループに含まれる任意の属性を有する語句を抽出する手段と、
    上記文書セグメントの少なくとも一部を表示し、かつ、上記文書セグメントの少なくとも一部に含まれる上記語句を対応する表示属性で表示する文書セグメント表示手段とを有することを特徴とする文書表示装置。
  3. 上記文書セグメントは文書を構成するページである請求項2記載の文書表示装置。
  4. 抽出された語句を上記属性毎に分類して表示する抽出語句手段と、
    利用者の操作に基づいて、抽出された語句または抽出された語句が有する属性を選択する手段とをさらに有し、
    上記表示手段は、上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれ、選択された上記語句または選択された上記属性を有する語句を、対応する表示属性で表示する請求項1記載の文書表示装置。
  5. 複数の所定の属性のグループに含まれる任意の属性を有する語句を文書から抽出する手段と、
    抽出された語句を上記属性毎に分類して表示する語句表示手段と、
    利用者の操作に基づいて、抽出された語句または抽出された語句が有する属性を選択する手段と、
    上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれ、選択された上記語句または選択された上記属性を有する語句を、対応する表示属性で表示する文書表示手段とを有することを特徴とする文書表示装置。
  6. 文書を文書セグメントに分割する手段と、
    上記文書セグメントの各々について、当該文書セグメントから、複数の所定の属性のグループに含まれる任意の属性を有する語句を抽出する手段と、
    抽出された語句を上記属性毎に分類して表示する語句表示手段と、
    利用者の操作に基づいて、抽出された語句または抽出された語句が有する属性を選択する手段と、
    上記文書セグメントの少なくとも一部を表示し、かつ、上記文書セグメントの少なくとも一部に含まれ、選択された上記語句または選択された上記属性を有する語句を、対応する表示属性で表示する文書セグメント表示手段とを有することを特徴とする文書表示装置。
  7. 複数の文書を記憶する手段と、
    文書を文書セグメントに分割する手段と、
    上記文書セグメントの各々について、索引を抽出する手段と、
    上記文書セグメントと上記索引との関連づけを記憶する索引格納手段と、
    文書セグメント単位で上記索引格納手段を参照してキーワード検索を行う検索手段と、
    上記検索手段による検索結果を表示する手段とを有することを特徴とする検索装置。
  8. 上記文書セグメントの各々について、当該文書セグメントから、複数の所定の属性のグループに含まれる任意の属性を有する語句を抽出する手段と、
    上記文書セグメントの少なくとも一部を表示し、かつ、上記文書セグメントの少なくとも一部に含まれる上記語句を対応する表示属性で表示する文書セグメント表示手段とをさらに有する請求項7記載の検索装置。
  9. 複数の所定の属性のグループに含まれる任意の属性を有する語句を文書から抽出するステップと、
    抽出した語句に、それぞれの属性に応じて対応する表示属性を関連づけるステップと、
    上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれる上記語句を対応する表示属性で表示する表示ステップとを有することを特徴とする文書表示方法。
  10. 複数の所定の属性のグループに含まれる任意の属性を有する語句を文書から抽出するステップと、
    抽出した語句に、それぞれの属性に応じて対応する表示属性を関連づけるステップと、
    上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれる上記語句を対応する表示属性で表示する表示ステップとをコンピュータに実行させるために用いられることを特徴とする文書表示用コンピュータプログラム。
  11. 複数の所定の属性のグループに含まれる任意の属性を有する語句を文書から抽出するステップと、
    抽出された語句を上記属性毎に分類して表示する語句表示ステップと、
    利用者の操作に基づいて、抽出された語句または抽出された語句が有する属性を選択するステップと、
    上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれ、選択された上記語句または選択された上記属性を有する語句を、対応する表示属性で表示する文書表示ステップとを有することを特徴とする文書表示方法。
  12. 複数の所定の属性のグループに含まれる任意の属性を有する語句を文書から抽出するステップと、
    抽出された語句を上記属性毎に分類して表示する語句表示ステップと、
    利用者の操作に基づいて、抽出された語句または抽出された語句が有する属性を選択するステップと、
    上記文書の少なくとも一部を表示し、かつ、上記文書の少なくとも一部に含まれ、選択された上記語句または選択された上記属性を有する語句を、対応する表示属性で表示する文書表示ステップとををコンピュータに実行させるために用いられることを特徴とする文書表示用コンピュータプログラム。
JP2002169129A 2002-06-10 2002-06-10 文書表示装置および方法 Pending JP2004070376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002169129A JP2004070376A (ja) 2002-06-10 2002-06-10 文書表示装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002169129A JP2004070376A (ja) 2002-06-10 2002-06-10 文書表示装置および方法

Publications (1)

Publication Number Publication Date
JP2004070376A true JP2004070376A (ja) 2004-03-04

Family

ID=32012273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002169129A Pending JP2004070376A (ja) 2002-06-10 2002-06-10 文書表示装置および方法

Country Status (1)

Country Link
JP (1) JP2004070376A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006301712A (ja) * 2005-04-15 2006-11-02 Sharp Corp 情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP2011034583A (ja) * 2004-06-30 2011-02-17 Google Inc ユーザ情報及びコンテキストに基づいて自動的に生成されるリンクを用いる高品質なドキュメント・ブラウジング
JP2011146059A (ja) * 2005-03-04 2011-07-28 Chutnoon Inc 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法
KR101462458B1 (ko) * 2014-03-28 2014-11-18 주식회사 한글과컴퓨터 전자 문서 검색 보조를 위한 데이터 저장 장치 및 방법
JP2018195305A (ja) * 2017-05-12 2018-12-06 アクセラテクノロジ株式会社 情報処理システムおよびプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034583A (ja) * 2004-06-30 2011-02-17 Google Inc ユーザ情報及びコンテキストに基づいて自動的に生成されるリンクを用いる高品質なドキュメント・ブラウジング
US8386914B2 (en) 2004-06-30 2013-02-26 Google Inc. Enhanced document browsing with automatically generated links to relevant information
US9697205B2 (en) 2004-06-30 2017-07-04 Google Inc. Enhanced document browsing with automatically generated links to relevant information
JP2011146059A (ja) * 2005-03-04 2011-07-28 Chutnoon Inc 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法
JP2006301712A (ja) * 2005-04-15 2006-11-02 Sharp Corp 情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP4642534B2 (ja) * 2005-04-15 2011-03-02 シャープ株式会社 情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
KR101462458B1 (ko) * 2014-03-28 2014-11-18 주식회사 한글과컴퓨터 전자 문서 검색 보조를 위한 데이터 저장 장치 및 방법
JP2018195305A (ja) * 2017-05-12 2018-12-06 アクセラテクノロジ株式会社 情報処理システムおよびプログラム

Similar Documents

Publication Publication Date Title
US11048882B2 (en) Automatic semantic rating and abstraction of literature
US7234942B2 (en) Summarisation representation apparatus
US8983965B2 (en) Document rating calculation system, document rating calculation method and program
JPH07325827A (ja) ハイパーテキスト自動生成装置
JP2011513810A (ja) 用語識別方法および装置
WO2008041367A1 (fr) Dispositif de recherche de document, procédé de recherche de document et programme de recherche de document
JP3195252B2 (ja) 文書ブラウズ支援方法及びシステム
JP5151368B2 (ja) 情報処理装置および情報処理プログラム
JPH09198395A (ja) 文書検索装置
JP2017117021A (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
JP4719921B2 (ja) データ表示装置およびデータ表示プログラム
JP2004070376A (ja) 文書表示装置および方法
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP2007257369A (ja) 情報検索装置
JP4428703B2 (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
JP2007220144A (ja) 特許検索装置、特許検索装置の制御方法および制御プログラム
JP2007323238A (ja) 強調表示装置及びプログラム
JP2022178243A (ja) 画像生成装置、画像生成方法およびプログラム
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP2004213309A (ja) 情報表示制御装置及びプログラム
JP2005011301A (ja) 文書処理装置及び文書処理プログラム
JP4899128B2 (ja) 関連語統合システム
Huet et al. Translation of Idiomatic Expressions Across Different Languages: A Study of the Effectiveness of TransSearch
JPH11134363A (ja) 特許情報処理方法及び特許情報処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081104

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090203