JP2015035223A

JP2015035223A - 制御プログラムおよびコンピュータ

Info

Publication number: JP2015035223A
Application number: JP2014210325A
Authority: JP
Inventors: 杉山　岳文; Takefumi Sugiyama; 岳文杉山; 徹史小林; Tetsushi Kobayashi; 晶子岩橋; Akiko Iwahashi; 義文難波; Yoshibumi Nanba; 絢子須藤; Ayako Sudo; 飯伏　勝俊; Katsutoshi Iifushi; 勝俊飯伏
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2014-10-14
Filing date: 2014-10-14
Publication date: 2015-02-19

Abstract

【課題】文書中の固有名詞を抽出して提示し，ユーザの新たな気付きを支援する。【解決手段】クライアント端末１は，文書提供サーバ３Ａから文書データを取得し表示すると，表示処理と並行して文書データに含まれるテキストデータを抽出し，固有名詞抽出サーバ２へ送信する。固有名詞抽出サーバ２の固有名詞抽出部２６は，固有名詞ＤＢ２１からテキストデータに含まれる固有名詞を抽出する。付加情報取得部２７は，抽出された固有名詞に基づいて，文書データと関連する文書データの所在を特定する付加情報を抽出し，文書データの表示領域に被らずに文書データとあわせて表示される構成要素の、リンク先の設定に供される関連する文書データの所在をクライアント端末１に提供する。クライアント端末１は，固有名詞抽出サーバ２から，抽出された固有名詞と付加情報を受信し，付加情報と文書データとを表示する。【選択図】図１

Description

本発明は，コンピュータに組み込まれたプログラムにより実行される，文書データ表示処理技術に関する。本発明は，特に，コンピュータによって表示された文書データから固有名詞を抽出し，固有名詞または固有名詞に付加された情報を文書データとともに表示させるようにする制御プログラムおよびコンピュータに関する。

ここで，固有名詞とは，人名，地名，商品名などの事物または事象に唯一的に与えられた名称を表すものだけでなく，所定の辞書データベースに定義されている名詞を含むものとする。

コンピュータで文書が表示されている場合に，文書中の固有名詞を抽出し，固有名詞に紐づけられた別の文書へのハイパーリンクを設定したり，その固有名詞を用いた検索処理を提案したりするなどして，文書閲覧中のユーザの新たな気付きを支援する仕組みが提案されている。

従来の第１の手法では，文書の提供者は，ユーザから文書閲覧が要求される前に，文書中に含まれる固有名詞を抽出し，必要なリンク情報を設定していた。例えば，百科事典のように，見出し語の意味内容を説明した文書を提供するＷｅｂサイトでは，表示された説明文中に含まれた固有名詞に，予めハイパーリンクを設定しておき，ユーザの選択によって，その固有名詞を見出し語とする別の説明文のＷｅｂページを参照できるようにしている（非特許文献１参照）。

また，従来の第２の手法として，文書中に抽出するべき固有名詞が増加する傾向に対処するため，ユーザが文書を閲覧要求した時点で，対象文書から固有名詞を抽出する手法が提案されていた。
Wikipedia，http://ja.wikipedia.org/wiki/，2007年1月23日

しかし，従来の第１の手法では，文書の提供側は，ユーザが閲覧する可能性のあるすべての文書に対して予め固有名詞抽出処理を行っておく必要があった。固有名詞は，常にその語彙が増加し続けているため，過去に固有名詞抽出処理を実施した文書データに対しても，語彙の増加にあわせて固有名詞抽出処理をやり直す必要が生じていた。そのため，予め固有名詞抽出処理を実行しておく手法では，処理コストに無駄が大きいという問題があった。

また，従来の第２の手法では，増加する固有名詞への対処として，文書データがユーザの閲覧要求時点で固有名詞抽出処理を行うが，文書データ送信前に固有名詞抽出処理を行う必要があった。しかし，ユーザの第一目的は文書閲覧であり，固有名詞を抽出してユーザに気付きを与えるというサービスは，補助的なものにすぎない。第２の手法では，ユーザが文書を閲覧する前に固有名詞抽出の処理時間が発生し，ユーザの閲覧要求に対するレスポンスタイムが悪化するという問題があった。

また，上記の２つの従来の手法においては，文書を提供するシステムごとに，固有名詞抽出処理機能を持つ必要があった。このため，固有名詞抽出処理で用いる語彙データベースのメンテナンスを文書提供システムごとに行う必要があり，トータルのメンテナンスコストがかかるという問題点があった。

本発明の目的は，文書閲覧というユーザの主目的に対する応答性能を犠牲にすることなく，文書中の固有名詞を抽出し，固有名詞または固有名詞に付加された付加情報をユーザに提示することによって，ユーザの新たな気付きを支援するデータ処理技術を提供することである。

本発明は，コンピュータに以下の処理を実行させるためのプログラムである。

本発明に係る制御プログラムを実施するコンピュータは，例えば，文書データを蓄積する文書データ提供装置と固有名詞抽出処理装置との間にクライアントとして介在する。そして，コンピュータに，他のコンピュータでの表示対象となる文書情報から，該文書情報に含まれる語句を抽出し，抽出された前記語句に基づいて，前記文書情報と関連する関連文書情報の所在を特定し，前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の，リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する。

これにより，ユーザが文書データを閲覧するたびに，固有名詞抽出処理が実行されるため，予め全ての文書データに固有名詞抽出処理を実施したり，固有名詞抽出処理をやり直したりする必要がなくなり，処理コストを軽減することができる。

また，ユーザが文書データを閲覧しているのと並行して固有名詞抽出処理が行われるので，ユーザに対する文書データ表示のレスポンスタイムを悪化させることがない。

さらに，本発明が実行されるコンピュータが，クライアントとして，文書提供装置と固有名詞抽出処理装置とを介する構成の場合に，複数の文書提供装置から提供される文書データに対する固有名詞抽出処理を，一つの固有名詞抽出処理装置によって処理することができる。このため，固有名詞抽出処理に用いる辞書データベースの語彙のメンテナンスを一箇所で行えばよいため，文書提供者ごとに固有名詞抽出処理機能を保持および維持するコストをなくすことができる。

また，本発明は，前記固有名詞抽出処理において，テキストデータから抽出した固有名詞を，テキストデータに付与されている文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存する。また，前記固有名詞抽出処理に先だって，受信したテキストデータの文書識別情報と一致する文書識別情報が固有名詞抽出履歴記憶部に保存されているかを判定し，一致する文書識別情報がある場合に，文書識別情報に対応付けられた固有名詞を，固有名詞抽出処理で抽出した固有名詞とすることができる。

これにより，文書データの一意性を確認して，固有名詞抽出処理結果のキャッシュ処理を実現する。同一の文書データに対して重複して固有名詞抽出処理を行う必要がなくなり，処理コストをより一層削減することができる。

また，本発明は，固有名詞抽出履歴保存処理において，受信したテキストデータに文書識別情報が付与されていない場合に，テキストデータの特徴値を算出し，算出した特徴値にもとづく文書識別情報を付与し，固有名詞抽出処理で抽出した固有名詞をこの文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存することができる。

例えば，文書データのサイズ，ハッシュ関数によるハッシュ値などの算出処理，チェックサムの算出処理など複数の手法を組み合わせて，文書データの特徴値を算出し，この特徴値を用いて，固有名詞抽出処理装置側で文書識別情報を割り当て，固有名詞抽出処理の処理結果のキャッシュ処理を実現する。

これにより，文書提供者が文書データごとに文書識別情報を管理する管理コストを削減することができる。また，文書データに文書識別情報を付け忘れた場合でも文書データの識別が可能となり，重複して固有名詞抽出処理を行う必要がなくなり，処理コストを削減することができる。

また，本発明は，固有名詞表示処理において，抽出された固有名詞を，ユーザ操作を誘導するような所定の態様（誘導態様）による表示となるような構成に変換し，変換した固有名詞を表示することができる。

これにより，抽出された固有名詞を，ユーザに新たな気付きを提示するような状態で表示することができる。例えば，抽出された固有名詞を，ハイパーリンクが設定された構成に変換した場合に，ユーザに対し，固有名詞に設定されたリンク情報のクリックを促し，よって固有名詞の詳細情報などを確認させることができる。

また，抽出された固有名詞を，検索キーとする検索処理の実行が設定された構成に変換した場合に，ユーザに対し，固有名詞を検索キーとして直ちに検索処理が実行できる機会を与えて，固有名詞の関連情報を確認させることができる。

さらに，本発明は，前記固有名詞抽出処理において，固有名詞が見出し語として定義された当該固有名詞の付加情報を記憶する前記辞書データベースを用いて，テキストデータから見出し語として存在する固有名詞およびその付加情報を抽出する処理が実行される場合に，前記固有名詞表示処理において，抽出された固有名詞および付加情報を受信し，固有名詞と付加情報，または付加情報をもとに構成した情報を，表示装置に表示することができる。

単に固有名詞を表示するだけでなく，固有名詞に紐づけられた付加情報を提示することによって，より多くの情報をユーザに提示することができるようになる。

例えば，固有名詞の付加情報として，その分類情報（企業名・人名・商品名）などを紐づけることによって，ユーザに有益な情報を知らせることができる。例えば，固有名詞が企業名である場合に，その株価，企業ロゴマーク，企業所在地を示す地図情報などを表示することができ，ユーザに有益な情報を提供することができる。

また，本発明は，文書データを蓄積する文書提供サーバと，所定の固有名詞を記憶する辞書データベースを備える固有名詞抽出処理サーバと，表示装置を備えるクライアント端末とで構成される文書データ表示処理システムである。

クライアント端末では，文書提供サーバから，表示対象の文書データを取得し，文書データを表示装置に表示し，文書データに含まれる全てまたは一部のテキストデータを抽出し，テキストデータを固有名詞抽出処理サーバへ送信する。そして，固有名詞抽出処理サーバから受信した，テキストデータから抽出された固有名詞を，前記文書データと並べて表示装置に表示する。また，固有名詞抽出処理サーバでは，テキストデータから，辞書データベースに存在する固有名詞を抽出し，抽出した固有名詞を前記クライアント端末に送信する。

なお，本発明にかかるプログラムは，コンピュータが読み取り可能な可搬媒体メモリ，半導体メモリ，ハードディスクなどの適当な記録媒体に格納することができ，これらの記録媒体に記録して提供され，または，通信インタフェースを介して種々の通信網を利用した送受信により提供される。

本発明によれば，ユーザが文書データを閲覧するたびに，文書データから固有名詞が抽出されるため，予め全文書データから固有名詞を抽出しておく必要がなく，処理コストを軽減することができる。

また，文書データの表示処理と並行して，固有名詞抽出処理が行われるので，表示処理でのレスポンスタイムを悪化させずに，表示の都度，固有名詞を抽出することができる。

さらに，複数の文書提供装置で提供される文書データに対し，一つの固有名詞抽出処理装置で処理することができるため，辞書データベースのメンテナンスコストを軽減することができる。

よって，文書データの表示処理の応答を損なわずに，閲覧要求ごとの固有名詞抽出処理を実現し，有意な情報によるユーザの気付きを支援することができる。

本発明の実施の形態における構成例を示す図である。本発明の処理の流れを示す図である。文書ＩＤによる文書データの管理の例を示す図である。見出し一覧画面の例を示す図である。見出しと本文の表示画面の例を示す図である。固有名詞抽出履歴データベースのデータ構成例を示す図である。固有名詞データベースのデータ構成例を示す図である。文書データに組み込まれた固有名詞と付加情報の表示例を示す図である。文書管理データベースのデータ構成例を示す図である。文書データがブログページの場合の文書データと固有名詞およびその付加情報の表示例を示す図である。文書データがニュースサイトの場合の文書データと固有名詞およびその付加情報の表示例を示す図である。

図１は，本発明の実施の形態における構成例を示す図である。

文書データ表示処理システムは，それぞれネットワークＮを介してデータを送受信する，クライアント端末１，固有名詞抽出サーバ２，一または複数の文書提供サーバ３（３Ａ，３Ｂ，３Ｃ）で構成される。

クライアント端末１は，ＣＰＵおよびメモリからなるコンピュータであり，ソフトウェアプログラムなどによって構成される，文書表示処理部１１，テキスト抽出部１２，固有名詞取得部１３，および固有名詞表示処理部１４を備える。

文書表示処理部１１は，文書提供サーバ３から表示対象の文書データを取得し，文書データを表示装置（図示しない）に表示する。

テキスト抽出部１２は，文書データに含まれる，全てまたは一部のテキストデータを抽出し，このテキストデータを固有名詞抽出サーバ２へ送信する。なお，文書提供サーバ３から取得した文書データに文書識別情報（文書ＩＤ）が付与されている場合に，文書ＩＤとテキストデータとを固有名詞抽出サーバ２へ送信する。

固有名詞取得部１３は，固有名詞抽出サーバ２から，文書データから抽出された固有名詞，または，固有名詞とその付加情報とを受信する。

固有名詞表示処理部１４は，固有名詞抽出サーバ２から受信した固有名詞を文書データと並べて表示装置に表示する。

また，固有名詞表示処理部１４は，固有名詞を，ユーザが操作を誘導されるような所定の誘導態様の表示の構成に変換し，変換した固有名詞を表示装置に表示する。例えば，固有名詞を，所定の参照先へのリンク情報を設定した構成要素に変換し，固有名詞にリンクが設定されていることを示す誘導態様で表示する。または，固有名詞を，この固有名詞を検索条件とする検索処理と関連付けた構成要素に変換し，固有名詞により検索できることを示す誘導態様で表示する。

さらに，固有名詞表示処理部１４は，固有名詞の付加情報，または，付加情報をもとに所定の手順によって構成した情報を表示装置に表示する。

固有名詞抽出サーバ２は，ＣＰＵおよびメモリからなるコンピュータであり，ソフトウェアプログラムなどによって構成される，固有名詞データベース２１，文書管理データベース２２，固有名詞抽出履歴データベース２３，処理要否判定部２４，文書ＩＤ生成部２５，固有名詞抽出部２６，および付加情報取得部２７を備える。

固有名詞データベース２１は，所定の固有名詞を記憶するデータベースである。

または，固有名詞データベース２１は，固有名詞が見出し語として定義され，その固有名詞の付加情報を記憶するデータベースである。

文書管理データベース２２は，文書ＩＤ生成部２５で算出された，受信したテキストデータの特徴値と，この特徴値にもとづいて付与された仮の文書ＩＤを登録するデータベースである。

固有名詞抽出履歴データベース２３は，テキストデータから抽出された固有名詞とその文書ＩＤと対応付けて保存するデータベースである。

処理要否判定部２４は，受信したテキストデータに付与された文書ＩＤ，または，文書ＩＤ生成部によって発行された仮の文書ＩＤと一致する文書ＩＤ／仮文書ＩＤが固有名詞抽出履歴データベース２３に保存されているかを判定し，一致する文書ＩＤ／仮文書ＩＤがある場合に，対応付けられた固有名詞を，固有名詞抽出処理で抽出した固有名詞とする。

文書ＩＤ生成部２５は，受信したテキストデータに文書ＩＤが付与されていない場合に，テキストデータの特徴値を算出し，算出した特徴値にもとづいて仮文書ＩＤを発行し，文書管理データベース２２に，算出した特徴値と仮文書ＩＤとを登録する。

また，文書ＩＤ生成部２５は，受信したテキストデータの特徴値を算出し，文書管理データベース２２に，算出した特徴値に対応する仮文書ＩＤが登録されていれば，仮文書ＩＤを処理要否判定部２４へ通知する。

固有名詞抽出部２６は，テキストデータに所定の言語解析処理を施して語単位に分析し，分析した語のうち，固有名詞データベース２１に存在する語を固有名詞として抽出し，この固有名詞をクライアント端末１に送信する。

また，固有名詞抽出部２６は，テキストデータの語から抽出した固有名詞と文書ＩＤとを対応付けて，固有名詞抽出履歴データベース２３に保存する。

付加情報取得部２７は，固有名詞抽出部２６によって，テキストデータから抽出された固有名詞について，固有名詞を見出し語として付加情報を記憶する固有名詞データベース２１から，該当する付加情報を抽出し，抽出した固有名詞およびその付加情報をクライアント端末１に送信する。

文書提供サーバ３（３Ａ，３Ｂ，３Ｃ）は，ＣＰＵおよびメモリからなるコンピュータであり，蓄積した文書データを，クライアント端末１からの閲覧要求に応じて提供する。

図２は，本発明の処理の流れを示す図である。

文書提供サーバ３Ａは，文書データとして，見出しデータおよび本文データからなる新聞記事を蓄積している。文書提供サーバ３Ａは，図３に示すように，見出しおよび本文データに文書ＩＤを付与して文書を管理している。

ステップＳ１：文書提供サーバ３Ａは，閲覧要求を発したクライアント端末１に，該当する文書データ（見出し）を送信する。図４に示す見出し一覧画面がクライアント端末１の文書表示処理部１１で表示され，見出しｈ１が選択される。

ステップＳ２：文書提供サーバ３Ａは，見出しｈ１に対応する本文データｂ１および文書ＩＤ（０００００１）を出力する。

ステップＳ３：文書表示処理部１１では，図５に示すように，見出しｈ１と本文ｂ１を表示する。

ステップＳ４：ステップＳ２の表示処理と並行して，テキスト抽出部１２は，本文ｂ１からテキストデータ（この場合は，本文データ全て）を取得し，テキストデータと文書ＩＤを，固有名詞抽出サーバ２へ送信する。

ステップＳ５：固有名詞抽出サーバ２は，文書ＩＤとテキストデータを受信する。

ステップＳ６：固有名詞抽出サーバ２の処理要否判定部２４は，固有名詞抽出履歴データベース２３を参照して，文書ＩＤが一致する固有名詞が保存されているかを調べる。

図６に，固有名詞抽出履歴データベース２３のデータ構成例を示す。固有名詞抽出履歴データベース２３には，既に固有名詞抽出処理を行った文書データの文書ＩＤ，処理実行日時（抽出日時），抽出された固有名詞（抽出固有名詞）が保存される。なお，文書ＩＤの代わりに，文書データの格納情報（ＵＲＬ）を用いてもよい。

ステップＳ７：ステップＳ６の判定処理で，文書ＩＤが一致する固有名詞が保存されていなければ（ＮＯ），固有名詞抽出部２６は，言語解析処理によりテキストデータから語を抽出し，抽出した語が固有名詞データベース２１に存在すれば，その語を固有名詞とする。

ステップＳ８：ステップＳ６の判定処理で，文書ＩＤが一致する固有名詞が保存されていれば（ＹＥＳ），固有名詞抽出履歴データベース２３から文書ＩＤが一致する固有名詞を取り出す。さらに，付加情報取得部２７は，この固有名詞をもとに，固有名詞データベース２１から該当する付加情報を取得する。そして，抽出した固有名詞およびその付加情報を出力する。

ステップＳ９：付加情報取得部２７は，その固有名詞に対応する付加情報を固有名詞データベース２１から取得する。そして，固有名詞と付加情報とを出力する。

図７に，固有名詞データベース２１のデータ構成例を示す。

固有名詞データベース２１には，抽出対象となる固有名詞，その品詞，付加情報が定義されている。例えば，固有名詞ｐｎ１は，品詞＝人名であり，付加情報として，その人物の別名，プロフィール，生年月日，出身地などの情報が登録されている。また，固有名詞ｐｎ２は，品詞＝企業名であり，付加情報として，所在地，資本金，経営者名，企業ホームページＵＲＬなどの情報が登録されている。

ステップＳ１０：クライアント端末１の固有名詞取得部１３は，固有名詞抽出サーバ２から，固有名詞（ｐｎ１，ｐｎ２）とその付加情報とを取得する。固有名詞表示処理部１４は，図８に示すように，文書表示処理部１１によって表示された文書データに，固有名詞と付加情報とを組み込んで表示する。

なお，ステップＳ４の処理において，テキストデータのみが固有名詞抽出サーバ２へ送信された場合，文書ＩＤ生成部２５は，テキストデータのサイズ，ハッシュ関数により算出されたハッシュ値，チェックサムから，テキストデータ独自の特徴値を算出する。そして，この特徴値をもとに，仮文書ＩＤを生成し，文書管理データベース２２に，特徴値と仮文書ＩＤとを登録する。

また，ステップＳ１の代わりに，ステップＳ１’として，クライアント端末１のローカルな領域に保存された文書データから，表示対象の文書データが選択されてもよい。

図９に，文書管理データベース２２のデータ構成例を示す。文書管理データベース２２には，生成した仮文書ＩＤとともに，特徴値算出に用いた各値，データサイズ，ハッシュ値，チェックサムが保存される。

図１０および図１１に，文書データと固有名詞およびその付加情報の表示画面例を示す。

図１０は，文書データがブログページの場合の表示画面例である。ブログページが本文を表示するメインページと関連情報やリンクを表示するサイドバーで構成されている場合に，メインページに表示された本文データ（テキストデータ）が固有名詞抽出サーバ２へ送信される。そして，本文データに含まれる固有名詞，例えば，人名（□□□），企業名（■■■），地名（▽▽県○○市）などが抽出される。さらに，固有名詞の付加情報として，人名「□□□」の役職名，企業「■■■」の業種，株価，ホームページのＵＲＬ，地名「▽▽県○○市」の地図情報などが取得される。これらの固有名詞とその付加情報は，サイドバーの表示に組み込まれて表示される。

図１１は，文書データがニュースサイトの場合の記事表示画面例である。ニュースサイトの記事ページに表示された記事データ（テキストデータ）が固有名詞抽出サーバ２へ送信され，記事データに含まれる固有名詞が抽出される。これらの固有名詞とその付加情報は，記事データのページ上に生成されたポップアップ枠で表示される。

以上，本発明をその実施の形態により説明したが，本発明はその主旨の範囲において種々の変形が可能であることは当然である。

本発明の形態および実施例の特徴を列記すると以下のとおりである。

（付記１）表示装置を備えるコンピュータに，
表示対象の文書データを取得する文書データ取得処理と，
前記文書データを表示装置に表示する文書データ表示処理と，
前記文書データに含まれる全てまたは一部のテキストデータを抽出し，当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理と，
前記固有名詞抽出処理装置において，所定の固有名詞を記憶する辞書データベースを用いて，前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理によって，前記テキストデータから抽出された固有名詞を受信し，当該抽出された固有名詞を前記文書データと並べて表示する固有名詞表示処理とを，
実行させるための文書データ表示処理プログラム。

（付記２）前記固有名詞抽出処理において，
前記テキストデータから抽出した固有名詞を，前記受信したテキストデータに付与されている文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存する固有名詞抽出履歴保存処理と，
前記固有名詞抽出処理に先だって，前記受信したテキストデータの文書識別情報と一致する文書識別情報が前記固有名詞抽出履歴記憶部に保存されているかを判定し，一致する文書識別情報がある場合に，当該文書識別情報に対応付けられた固有名詞を，前記固有名詞抽出処理で抽出した固有名詞とする処理要否判定処理とを，
実行させることを特徴とする前記付記１に記載の文書データ表示処理プログラム。

（付記３）前記固有名詞抽出履歴保存処理において，前記受信したテキストデータに文書識別情報が付与されていない場合に，前記テキストデータの特徴値を算出し，算出した特徴値にもとづく文書識別情報を付与し，前記固有名詞抽出処理で抽出した固有名詞を当該文書識別情報と対応付けて前記固有名詞抽出履歴記憶部に保存する処理を，
実行させることを特徴とする前記付記２に記載の文書データ表示処理プログラム。

（付記４）
固有名詞表示処理において，前記抽出された固有名詞を，ユーザ操作を誘導する所定の態様で表示される構成に変換して表示する処理を，
実行させることを特徴とする前記付記１〜３のいずれか一項に記載の文書データ表示処理プログラム。

（付記５）前記固有名詞抽出処理において，前記固有名詞が見出し語として定義された当該固有名詞の付加情報を記憶する前記辞書データベースを用いて，前記テキストデータから前記見出し語として存在する固有名詞および当該固有名詞の付加情報を抽出する処理が実行される場合に，前記固有名詞表示処理において，前記固有名詞抽出処理装置から，前記テキストデータから抽出された固有名詞および付加情報を受信し，前記付加情報または当該付加情報をもとに構成した情報を前記表示装置に表示する処理を，
実行させることを特徴とする前記付記１〜４のいずれか一項に記載の文書データ表示処理プログラム。

（付記６）表示装置を備えるコンピュータに，
表示対象の文書データを取得する文書データ取得処理過程と，
前記文書データを表示装置に表示する文書データ表示処理過程と，
前記文書データに含まれる全てまたは一部のテキストデータを抽出し，当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理過程と，
前記固有名詞抽出処理装置において，所定の固有名詞を記憶する辞書データベースを用いて，前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理過程と，
前記固有名詞抽出処理装置から，前記テキストデータから抽出された固有名詞を受信し，当該抽出された固有名詞を，前記文書データと並べて表示する固有名詞表示処理過程とを，
実行させる文書データ表示処理方法。

（付記７）表示対象の文書データを取得する文書データ取得処理部と，
前記文書データを表示装置に表示する文書データ表示処理部と，
前記文書データに含まれる全てまたは一部のテキストデータを抽出し，当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理部と，
前記固有名詞抽出処理装置において，所定の固有名詞を記憶する辞書データベースを用いて，前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理過程によって，前記テキストデータから抽出された固有名詞を受信し，当該抽出された固有名詞を前記文書データと並べて表示する固有名詞表示処理部とを，
備える文書データ表示処理装置。

（付記８）所定の固有名詞を記憶する辞書データベースと，
クライアント端末で表示された文書データに含まれるテキストデータの全部または一部を受信するテキストデータ取得処理部と，
前記テキストデータから，前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理部と，
前記抽出した固有名詞を前記クライアント端末に送信する処理結果送信処理部とを備える
ことを特徴とする固有名詞抽出処理装置。

（付記９）文書データを蓄積する文書提供サーバと，所定の固有名詞を記憶する辞書データベースを備える固有名詞抽出処理サーバと，表示装置を備えるクライアント端末とで構成される文書データ表示処理システムであって，
前記クライアント端末に，
前記文書提供サーバから，表示対象の文書データを取得する文書データ取得処理部と，
前記文書データを表示装置に表示する文書データ表示処理部と，
前記文書データに含まれる全てまたは一部のテキストデータを抽出し，当該テキストデータを前記固有名詞抽出処理サーバへ送信するテキストデータ送信処理部と，
前記固有名詞抽出処理サーバから受信した，前記テキストデータから抽出された固有名詞を，前記文書データと並べて表示する固有名詞表示処理部とを備え，
前記固有名詞抽出処理サーバに，
前記テキストデータから，前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理部と，
前記抽出した固有名詞を前記クライアント端末に送信する処理結果送信処理部とを備える
ことを特徴とする文書データ表示処理システム。

１クライアント端末
１１文書表示処理部
１２テキスト抽出部
１３固有名詞取得部
１４固有名詞表示処理部
２固有名詞抽出サーバ
２１固有名詞データベース
２２文書管理データベース
２３固有名詞抽出履歴データベース
２４処理要否判定部
２５文書ＩＤ生成部
２６固有名詞抽出部
２７付加情報取得部
３（３Ａ，３Ｂ，３Ｃ）文書提供サーバ
Ｎネットワーク

Claims

コンピュータに，
他のコンピュータでの表示対象となる文書情報から，該文書情報に含まれる語句を抽出し，
抽出された前記語句に基づいて，前記文書情報と関連する関連文書情報の所在を特定し，
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の，リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する，
処理を実行させることを特徴とする制御プログラム。
コンピュータが，
他のコンピュータでの表示対象となる文書情報から，該文書情報に含まれる語句を抽出し，
抽出された前記語句に基づいて，前記文書情報と関連する関連文書情報の所在を特定し，
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の，リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する，
処理を実行することを特徴とする制御プログラム。
他のコンピュータでの表示対象となる文書情報から，該文書情報に含まれる語句を抽出する抽出部と，
抽出された前記語句に基づいて，前記文書情報と関連する関連文書情報の所在を特定する特定部と，
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の，リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する提供部と，
を備えることを特徴とするコンピュータ。