JP2015035223A - 制御プログラムおよびコンピュータ - Google Patents
制御プログラムおよびコンピュータ Download PDFInfo
- Publication number
- JP2015035223A JP2015035223A JP2014210325A JP2014210325A JP2015035223A JP 2015035223 A JP2015035223 A JP 2015035223A JP 2014210325 A JP2014210325 A JP 2014210325A JP 2014210325 A JP2014210325 A JP 2014210325A JP 2015035223 A JP2015035223 A JP 2015035223A
- Authority
- JP
- Japan
- Prior art keywords
- proper noun
- document
- data
- proper
- document data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 文書中の固有名詞を抽出して提示し,ユーザの新たな気付きを支援する。【解決手段】 クライアント端末1は,文書提供サーバ3Aから文書データを取得し表示すると,表示処理と並行して文書データに含まれるテキストデータを抽出し,固有名詞抽出サーバ2へ送信する。固有名詞抽出サーバ2の固有名詞抽出部26は,固有名詞DB21からテキストデータに含まれる固有名詞を抽出する。付加情報取得部27は,抽出された固有名詞に基づいて,文書データと関連する文書データの所在を特定する付加情報を抽出し,文書データの表示領域に被らずに文書データとあわせて表示される構成要素の、リンク先の設定に供される関連する文書データの所在をクライアント端末1に提供する。クライアント端末1は,固有名詞抽出サーバ2から,抽出された固有名詞と付加情報を受信し,付加情報と文書データとを表示する。【選択図】 図1
Description
本発明は,コンピュータに組み込まれたプログラムにより実行される,文書データ表示処理技術に関する。本発明は,特に,コンピュータによって表示された文書データから固有名詞を抽出し,固有名詞または固有名詞に付加された情報を文書データとともに表示させるようにする制御プログラムおよびコンピュータに関する。
ここで,固有名詞とは,人名,地名,商品名などの事物または事象に唯一的に与えられた名称を表すものだけでなく,所定の辞書データベースに定義されている名詞を含むものとする。
コンピュータで文書が表示されている場合に,文書中の固有名詞を抽出し,固有名詞に紐づけられた別の文書へのハイパーリンクを設定したり,その固有名詞を用いた検索処理を提案したりするなどして,文書閲覧中のユーザの新たな気付きを支援する仕組みが提案されている。
従来の第1の手法では,文書の提供者は,ユーザから文書閲覧が要求される前に,文書中に含まれる固有名詞を抽出し,必要なリンク情報を設定していた。例えば,百科事典のように,見出し語の意味内容を説明した文書を提供するWebサイトでは,表示された説明文中に含まれた固有名詞に,予めハイパーリンクを設定しておき,ユーザの選択によって,その固有名詞を見出し語とする別の説明文のWebページを参照できるようにしている(非特許文献1参照)。
また,従来の第2の手法として,文書中に抽出するべき固有名詞が増加する傾向に対処するため,ユーザが文書を閲覧要求した時点で,対象文書から固有名詞を抽出する手法が提案されていた。
Wikipedia,http://ja.wikipedia.org/wiki/,2007年1月23日
Wikipedia,http://ja.wikipedia.org/wiki/,2007年1月23日
しかし,従来の第1の手法では,文書の提供側は,ユーザが閲覧する可能性のあるすべての文書に対して予め固有名詞抽出処理を行っておく必要があった。固有名詞は,常にその語彙が増加し続けているため,過去に固有名詞抽出処理を実施した文書データに対しても,語彙の増加にあわせて固有名詞抽出処理をやり直す必要が生じていた。そのため,予め固有名詞抽出処理を実行しておく手法では,処理コストに無駄が大きいという問題があった。
また,従来の第2の手法では,増加する固有名詞への対処として,文書データがユーザの閲覧要求時点で固有名詞抽出処理を行うが,文書データ送信前に固有名詞抽出処理を行う必要があった。しかし,ユーザの第一目的は文書閲覧であり,固有名詞を抽出してユーザに気付きを与えるというサービスは,補助的なものにすぎない。第2の手法では,ユーザが文書を閲覧する前に固有名詞抽出の処理時間が発生し,ユーザの閲覧要求に対するレスポンスタイムが悪化するという問題があった。
また,上記の2つの従来の手法においては,文書を提供するシステムごとに,固有名詞抽出処理機能を持つ必要があった。このため,固有名詞抽出処理で用いる語彙データベースのメンテナンスを文書提供システムごとに行う必要があり,トータルのメンテナンスコストがかかるという問題点があった。
本発明の目的は,文書閲覧というユーザの主目的に対する応答性能を犠牲にすることなく,文書中の固有名詞を抽出し,固有名詞または固有名詞に付加された付加情報をユーザに提示することによって,ユーザの新たな気付きを支援するデータ処理技術を提供することである。
本発明は,コンピュータに以下の処理を実行させるためのプログラムである。
本発明に係る制御プログラムを実施するコンピュータは,例えば,文書データを蓄積する文書データ提供装置と固有名詞抽出処理装置との間にクライアントとして介在する。そして,コンピュータに,他のコンピュータでの表示対象となる文書情報から,該文書情報に含まれる語句を抽出し,抽出された前記語句に基づいて,前記文書情報と関連する関連文書情報の所在を特定し,前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の,リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する。
これにより,ユーザが文書データを閲覧するたびに,固有名詞抽出処理が実行されるため,予め全ての文書データに固有名詞抽出処理を実施したり,固有名詞抽出処理をやり直したりする必要がなくなり,処理コストを軽減することができる。
また,ユーザが文書データを閲覧しているのと並行して固有名詞抽出処理が行われるので,ユーザに対する文書データ表示のレスポンスタイムを悪化させることがない。
さらに,本発明が実行されるコンピュータが,クライアントとして,文書提供装置と固有名詞抽出処理装置とを介する構成の場合に,複数の文書提供装置から提供される文書データに対する固有名詞抽出処理を,一つの固有名詞抽出処理装置によって処理することができる。このため,固有名詞抽出処理に用いる辞書データベースの語彙のメンテナンスを一箇所で行えばよいため,文書提供者ごとに固有名詞抽出処理機能を保持および維持するコストをなくすことができる。
また,本発明は,前記固有名詞抽出処理において,テキストデータから抽出した固有名詞を,テキストデータに付与されている文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存する。また,前記固有名詞抽出処理に先だって,受信したテキストデータの文書識別情報と一致する文書識別情報が固有名詞抽出履歴記憶部に保存されているかを判定し,一致する文書識別情報がある場合に,文書識別情報に対応付けられた固有名詞を,固有名詞抽出処理で抽出した固有名詞とすることができる。
これにより,文書データの一意性を確認して,固有名詞抽出処理結果のキャッシュ処理を実現する。同一の文書データに対して重複して固有名詞抽出処理を行う必要がなくなり,処理コストをより一層削減することができる。
また,本発明は,固有名詞抽出履歴保存処理において,受信したテキストデータに文書識別情報が付与されていない場合に,テキストデータの特徴値を算出し,算出した特徴値にもとづく文書識別情報を付与し,固有名詞抽出処理で抽出した固有名詞をこの文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存することができる。
例えば,文書データのサイズ,ハッシュ関数によるハッシュ値などの算出処理,チェックサムの算出処理など複数の手法を組み合わせて,文書データの特徴値を算出し,この特徴値を用いて,固有名詞抽出処理装置側で文書識別情報を割り当て,固有名詞抽出処理の処理結果のキャッシュ処理を実現する。
これにより,文書提供者が文書データごとに文書識別情報を管理する管理コストを削減することができる。また,文書データに文書識別情報を付け忘れた場合でも文書データの識別が可能となり,重複して固有名詞抽出処理を行う必要がなくなり,処理コストを削減することができる。
また,本発明は,固有名詞表示処理において,抽出された固有名詞を,ユーザ操作を誘導するような所定の態様(誘導態様)による表示となるような構成に変換し,変換した固有名詞を表示することができる。
これにより,抽出された固有名詞を,ユーザに新たな気付きを提示するような状態で表示することができる。例えば,抽出された固有名詞を,ハイパーリンクが設定された構成に変換した場合に,ユーザに対し,固有名詞に設定されたリンク情報のクリックを促し,よって固有名詞の詳細情報などを確認させることができる。
また,抽出された固有名詞を,検索キーとする検索処理の実行が設定された構成に変換した場合に,ユーザに対し,固有名詞を検索キーとして直ちに検索処理が実行できる機会を与えて,固有名詞の関連情報を確認させることができる。
さらに,本発明は,前記固有名詞抽出処理において,固有名詞が見出し語として定義された当該固有名詞の付加情報を記憶する前記辞書データベースを用いて,テキストデータから見出し語として存在する固有名詞およびその付加情報を抽出する処理が実行される場合に,前記固有名詞表示処理において,抽出された固有名詞および付加情報を受信し,固有名詞と付加情報,または付加情報をもとに構成した情報を,表示装置に表示することができる。
単に固有名詞を表示するだけでなく,固有名詞に紐づけられた付加情報を提示することによって,より多くの情報をユーザに提示することができるようになる。
例えば,固有名詞の付加情報として,その分類情報(企業名・人名・商品名)などを紐づけることによって,ユーザに有益な情報を知らせることができる。例えば,固有名詞が企業名である場合に,その株価,企業ロゴマーク,企業所在地を示す地図情報などを表示することができ,ユーザに有益な情報を提供することができる。
また,本発明は,文書データを蓄積する文書提供サーバと,所定の固有名詞を記憶する辞書データベースを備える固有名詞抽出処理サーバと,表示装置を備えるクライアント端末とで構成される文書データ表示処理システムである。
クライアント端末では,文書提供サーバから,表示対象の文書データを取得し,文書データを表示装置に表示し,文書データに含まれる全てまたは一部のテキストデータを抽出し,テキストデータを固有名詞抽出処理サーバへ送信する。そして,固有名詞抽出処理サーバから受信した,テキストデータから抽出された固有名詞を,前記文書データと並べて表示装置に表示する。また,固有名詞抽出処理サーバでは,テキストデータから,辞書データベースに存在する固有名詞を抽出し,抽出した固有名詞を前記クライアント端末に送信する。
なお,本発明にかかるプログラムは,コンピュータが読み取り可能な可搬媒体メモリ,半導体メモリ,ハードディスクなどの適当な記録媒体に格納することができ,これらの記録媒体に記録して提供され,または,通信インタフェースを介して種々の通信網を利用した送受信により提供される。
本発明によれば,ユーザが文書データを閲覧するたびに,文書データから固有名詞が抽出されるため,予め全文書データから固有名詞を抽出しておく必要がなく,処理コストを軽減することができる。
また,文書データの表示処理と並行して,固有名詞抽出処理が行われるので,表示処理でのレスポンスタイムを悪化させずに,表示の都度,固有名詞を抽出することができる。
さらに,複数の文書提供装置で提供される文書データに対し,一つの固有名詞抽出処理装置で処理することができるため,辞書データベースのメンテナンスコストを軽減することができる。
よって,文書データの表示処理の応答を損なわずに,閲覧要求ごとの固有名詞抽出処理を実現し,有意な情報によるユーザの気付きを支援することができる。
図1は,本発明の実施の形態における構成例を示す図である。
文書データ表示処理システムは,それぞれネットワークNを介してデータを送受信する,クライアント端末1,固有名詞抽出サーバ2,一または複数の文書提供サーバ3(3A,3B,3C)で構成される。
クライアント端末1は,CPUおよびメモリからなるコンピュータであり,ソフトウェアプログラムなどによって構成される,文書表示処理部11,テキスト抽出部12,固有名詞取得部13,および固有名詞表示処理部14を備える。
文書表示処理部11は,文書提供サーバ3から表示対象の文書データを取得し,文書データを表示装置(図示しない)に表示する。
テキスト抽出部12は,文書データに含まれる,全てまたは一部のテキストデータを抽出し,このテキストデータを固有名詞抽出サーバ2へ送信する。なお,文書提供サーバ3から取得した文書データに文書識別情報(文書ID)が付与されている場合に,文書IDとテキストデータとを固有名詞抽出サーバ2へ送信する。
固有名詞取得部13は,固有名詞抽出サーバ2から,文書データから抽出された固有名詞,または,固有名詞とその付加情報とを受信する。
固有名詞表示処理部14は,固有名詞抽出サーバ2から受信した固有名詞を文書データと並べて表示装置に表示する。
また,固有名詞表示処理部14は,固有名詞を,ユーザが操作を誘導されるような所定の誘導態様の表示の構成に変換し,変換した固有名詞を表示装置に表示する。例えば,固有名詞を,所定の参照先へのリンク情報を設定した構成要素に変換し,固有名詞にリンクが設定されていることを示す誘導態様で表示する。または,固有名詞を,この固有名詞を検索条件とする検索処理と関連付けた構成要素に変換し,固有名詞により検索できることを示す誘導態様で表示する。
さらに,固有名詞表示処理部14は,固有名詞の付加情報,または,付加情報をもとに所定の手順によって構成した情報を表示装置に表示する。
固有名詞抽出サーバ2は,CPUおよびメモリからなるコンピュータであり,ソフトウェアプログラムなどによって構成される,固有名詞データベース21,文書管理データベース22,固有名詞抽出履歴データベース23,処理要否判定部24,文書ID生成部25,固有名詞抽出部26,および付加情報取得部27を備える。
固有名詞データベース21は,所定の固有名詞を記憶するデータベースである。
または,固有名詞データベース21は,固有名詞が見出し語として定義され,その固有名詞の付加情報を記憶するデータベースである。
文書管理データベース22は,文書ID生成部25で算出された,受信したテキストデータの特徴値と,この特徴値にもとづいて付与された仮の文書IDを登録するデータベースである。
固有名詞抽出履歴データベース23は,テキストデータから抽出された固有名詞とその文書IDと対応付けて保存するデータベースである。
処理要否判定部24は,受信したテキストデータに付与された文書ID,または,文書ID生成部によって発行された仮の文書IDと一致する文書ID/仮文書IDが固有名詞抽出履歴データベース23に保存されているかを判定し,一致する文書ID/仮文書IDがある場合に,対応付けられた固有名詞を,固有名詞抽出処理で抽出した固有名詞とする。
文書ID生成部25は,受信したテキストデータに文書IDが付与されていない場合に,テキストデータの特徴値を算出し,算出した特徴値にもとづいて仮文書IDを発行し,文書管理データベース22に,算出した特徴値と仮文書IDとを登録する。
また,文書ID生成部25は,受信したテキストデータの特徴値を算出し,文書管理データベース22に,算出した特徴値に対応する仮文書IDが登録されていれば,仮文書IDを処理要否判定部24へ通知する。
固有名詞抽出部26は,テキストデータに所定の言語解析処理を施して語単位に分析し,分析した語のうち,固有名詞データベース21に存在する語を固有名詞として抽出し,この固有名詞をクライアント端末1に送信する。
また,固有名詞抽出部26は,テキストデータの語から抽出した固有名詞と文書IDとを対応付けて,固有名詞抽出履歴データベース23に保存する。
付加情報取得部27は,固有名詞抽出部26によって,テキストデータから抽出された固有名詞について,固有名詞を見出し語として付加情報を記憶する固有名詞データベース21から,該当する付加情報を抽出し,抽出した固有名詞およびその付加情報をクライアント端末1に送信する。
文書提供サーバ3(3A,3B,3C)は,CPUおよびメモリからなるコンピュータであり,蓄積した文書データを,クライアント端末1からの閲覧要求に応じて提供する。
図2は,本発明の処理の流れを示す図である。
文書提供サーバ3Aは,文書データとして,見出しデータおよび本文データからなる新聞記事を蓄積している。文書提供サーバ3Aは,図3に示すように,見出しおよび本文データに文書IDを付与して文書を管理している。
ステップS1: 文書提供サーバ3Aは,閲覧要求を発したクライアント端末1に,該当する文書データ(見出し)を送信する。図4に示す見出し一覧画面がクライアント端末1の文書表示処理部11で表示され,見出しh1が選択される。
ステップS2: 文書提供サーバ3Aは,見出しh1に対応する本文データb1および文書ID(000001)を出力する。
ステップS3: 文書表示処理部11では,図5に示すように,見出しh1と本文b1を表示する。
ステップS4: ステップS2の表示処理と並行して,テキスト抽出部12は,本文b1からテキストデータ(この場合は,本文データ全て)を取得し,テキストデータと文書IDを,固有名詞抽出サーバ2へ送信する。
ステップS5: 固有名詞抽出サーバ2は,文書IDとテキストデータを受信する。
ステップS6: 固有名詞抽出サーバ2の処理要否判定部24は,固有名詞抽出履歴データベース23を参照して,文書IDが一致する固有名詞が保存されているかを調べる。
図6に,固有名詞抽出履歴データベース23のデータ構成例を示す。固有名詞抽出履歴データベース23には,既に固有名詞抽出処理を行った文書データの文書ID,処理実行日時(抽出日時),抽出された固有名詞(抽出固有名詞)が保存される。なお,文書IDの代わりに,文書データの格納情報(URL)を用いてもよい。
ステップS7: ステップS6の判定処理で,文書IDが一致する固有名詞が保存されていなければ(NO),固有名詞抽出部26は,言語解析処理によりテキストデータから語を抽出し,抽出した語が固有名詞データベース21に存在すれば,その語を固有名詞とする。
ステップS8: ステップS6の判定処理で,文書IDが一致する固有名詞が保存されていれば(YES),固有名詞抽出履歴データベース23から文書IDが一致する固有名詞を取り出す。さらに,付加情報取得部27は,この固有名詞をもとに,固有名詞データベース21から該当する付加情報を取得する。そして,抽出した固有名詞およびその付加情報を出力する。
ステップS9: 付加情報取得部27は,その固有名詞に対応する付加情報を固有名詞データベース21から取得する。そして,固有名詞と付加情報とを出力する。
図7に,固有名詞データベース21のデータ構成例を示す。
固有名詞データベース21には,抽出対象となる固有名詞,その品詞,付加情報が定義されている。例えば,固有名詞pn1は,品詞=人名であり,付加情報として,その人物の別名,プロフィール,生年月日,出身地などの情報が登録されている。また,固有名詞pn2は,品詞=企業名であり,付加情報として,所在地,資本金,経営者名,企業ホームページURLなどの情報が登録されている。
ステップS10: クライアント端末1の固有名詞取得部13は,固有名詞抽出サーバ2から,固有名詞(pn1,pn2)とその付加情報とを取得する。固有名詞表示処理部14は,図8に示すように,文書表示処理部11によって表示された文書データに,固有名詞と付加情報とを組み込んで表示する。
なお,ステップS4の処理において,テキストデータのみが固有名詞抽出サーバ2へ送信された場合,文書ID生成部25は,テキストデータのサイズ,ハッシュ関数により算出されたハッシュ値,チェックサムから,テキストデータ独自の特徴値を算出する。そして,この特徴値をもとに,仮文書IDを生成し,文書管理データベース22に,特徴値と仮文書IDとを登録する。
また,ステップS1の代わりに,ステップS1’として,クライアント端末1のローカルな領域に保存された文書データから,表示対象の文書データが選択されてもよい。
図9に,文書管理データベース22のデータ構成例を示す。文書管理データベース22には,生成した仮文書IDとともに,特徴値算出に用いた各値,データサイズ,ハッシュ値,チェックサムが保存される。
図10および図11に,文書データと固有名詞およびその付加情報の表示画面例を示す。
図10は,文書データがブログページの場合の表示画面例である。ブログページが本文を表示するメインページと関連情報やリンクを表示するサイドバーで構成されている場合に,メインページに表示された本文データ(テキストデータ)が固有名詞抽出サーバ2へ送信される。そして,本文データに含まれる固有名詞,例えば,人名(□□□),企業名(■■■),地名(▽▽県○○市)などが抽出される。さらに,固有名詞の付加情報として,人名「□□□」の役職名,企業「■■■」の業種,株価,ホームページのURL,地名「▽▽県○○市」の地図情報などが取得される。これらの固有名詞とその付加情報は,サイドバーの表示に組み込まれて表示される。
図11は,文書データがニュースサイトの場合の記事表示画面例である。ニュースサイトの記事ページに表示された記事データ(テキストデータ)が固有名詞抽出サーバ2へ送信され,記事データに含まれる固有名詞が抽出される。これらの固有名詞とその付加情報は,記事データのページ上に生成されたポップアップ枠で表示される。
以上,本発明をその実施の形態により説明したが,本発明はその主旨の範囲において種々の変形が可能であることは当然である。
本発明の形態および実施例の特徴を列記すると以下のとおりである。
(付記1) 表示装置を備えるコンピュータに,
表示対象の文書データを取得する文書データ取得処理と,
前記文書データを表示装置に表示する文書データ表示処理と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理によって,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を前記文書データと並べて表示する固有名詞表示処理とを,
実行させるための文書データ表示処理プログラム。
表示対象の文書データを取得する文書データ取得処理と,
前記文書データを表示装置に表示する文書データ表示処理と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理によって,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を前記文書データと並べて表示する固有名詞表示処理とを,
実行させるための文書データ表示処理プログラム。
(付記2) 前記固有名詞抽出処理において,
前記テキストデータから抽出した固有名詞を,前記受信したテキストデータに付与されている文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存する固有名詞抽出履歴保存処理と,
前記固有名詞抽出処理に先だって,前記受信したテキストデータの文書識別情報と一致する文書識別情報が前記固有名詞抽出履歴記憶部に保存されているかを判定し,一致する文書識別情報がある場合に,当該文書識別情報に対応付けられた固有名詞を,前記固有名詞抽出処理で抽出した固有名詞とする処理要否判定処理とを,
実行させることを特徴とする前記付記1に記載の文書データ表示処理プログラム。
前記テキストデータから抽出した固有名詞を,前記受信したテキストデータに付与されている文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存する固有名詞抽出履歴保存処理と,
前記固有名詞抽出処理に先だって,前記受信したテキストデータの文書識別情報と一致する文書識別情報が前記固有名詞抽出履歴記憶部に保存されているかを判定し,一致する文書識別情報がある場合に,当該文書識別情報に対応付けられた固有名詞を,前記固有名詞抽出処理で抽出した固有名詞とする処理要否判定処理とを,
実行させることを特徴とする前記付記1に記載の文書データ表示処理プログラム。
(付記3) 前記固有名詞抽出履歴保存処理において,前記受信したテキストデータに文書識別情報が付与されていない場合に,前記テキストデータの特徴値を算出し,算出した特徴値にもとづく文書識別情報を付与し,前記固有名詞抽出処理で抽出した固有名詞を当該文書識別情報と対応付けて前記固有名詞抽出履歴記憶部に保存する処理を,
実行させることを特徴とする前記付記2に記載の文書データ表示処理プログラム。
実行させることを特徴とする前記付記2に記載の文書データ表示処理プログラム。
(付記4)
固有名詞表示処理において,前記抽出された固有名詞を,ユーザ操作を誘導する所定の態様で表示される構成に変換して表示する処理を,
実行させることを特徴とする前記付記1〜3のいずれか一項に記載の文書データ表示処理プログラム。
固有名詞表示処理において,前記抽出された固有名詞を,ユーザ操作を誘導する所定の態様で表示される構成に変換して表示する処理を,
実行させることを特徴とする前記付記1〜3のいずれか一項に記載の文書データ表示処理プログラム。
(付記5) 前記固有名詞抽出処理において,前記固有名詞が見出し語として定義された当該固有名詞の付加情報を記憶する前記辞書データベースを用いて,前記テキストデータから前記見出し語として存在する固有名詞および当該固有名詞の付加情報を抽出する処理が実行される場合に,前記固有名詞表示処理において,前記固有名詞抽出処理装置から,前記テキストデータから抽出された固有名詞および付加情報を受信し,前記付加情報または当該付加情報をもとに構成した情報を前記表示装置に表示する処理を,
実行させることを特徴とする前記付記1〜4のいずれか一項に記載の文書データ表示処理プログラム。
実行させることを特徴とする前記付記1〜4のいずれか一項に記載の文書データ表示処理プログラム。
(付記6) 表示装置を備えるコンピュータに,
表示対象の文書データを取得する文書データ取得処理過程と,
前記文書データを表示装置に表示する文書データ表示処理過程と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理過程と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理過程と,
前記固有名詞抽出処理装置から,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を,前記文書データと並べて表示する固有名詞表示処理過程とを,
実行させる文書データ表示処理方法。
表示対象の文書データを取得する文書データ取得処理過程と,
前記文書データを表示装置に表示する文書データ表示処理過程と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理過程と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理過程と,
前記固有名詞抽出処理装置から,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を,前記文書データと並べて表示する固有名詞表示処理過程とを,
実行させる文書データ表示処理方法。
(付記7) 表示対象の文書データを取得する文書データ取得処理部と,
前記文書データを表示装置に表示する文書データ表示処理部と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理部と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理過程によって,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を前記文書データと並べて表示する固有名詞表示処理部とを,
備える文書データ表示処理装置。
前記文書データを表示装置に表示する文書データ表示処理部と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理部と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理過程によって,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を前記文書データと並べて表示する固有名詞表示処理部とを,
備える文書データ表示処理装置。
(付記8) 所定の固有名詞を記憶する辞書データベースと,
クライアント端末で表示された文書データに含まれるテキストデータの全部または一部を受信するテキストデータ取得処理部と,
前記テキストデータから,前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理部と,
前記抽出した固有名詞を前記クライアント端末に送信する処理結果送信処理部とを備える
ことを特徴とする固有名詞抽出処理装置。
クライアント端末で表示された文書データに含まれるテキストデータの全部または一部を受信するテキストデータ取得処理部と,
前記テキストデータから,前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理部と,
前記抽出した固有名詞を前記クライアント端末に送信する処理結果送信処理部とを備える
ことを特徴とする固有名詞抽出処理装置。
(付記9) 文書データを蓄積する文書提供サーバと,所定の固有名詞を記憶する辞書データベースを備える固有名詞抽出処理サーバと,表示装置を備えるクライアント端末とで構成される文書データ表示処理システムであって,
前記クライアント端末に,
前記文書提供サーバから,表示対象の文書データを取得する文書データ取得処理部と,
前記文書データを表示装置に表示する文書データ表示処理部と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを前記固有名詞抽出処理サーバへ送信するテキストデータ送信処理部と,
前記固有名詞抽出処理サーバから受信した,前記テキストデータから抽出された固有名詞を,前記文書データと並べて表示する固有名詞表示処理部とを備え,
前記固有名詞抽出処理サーバに,
前記テキストデータから,前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理部と,
前記抽出した固有名詞を前記クライアント端末に送信する処理結果送信処理部とを備える
ことを特徴とする文書データ表示処理システム。
前記クライアント端末に,
前記文書提供サーバから,表示対象の文書データを取得する文書データ取得処理部と,
前記文書データを表示装置に表示する文書データ表示処理部と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを前記固有名詞抽出処理サーバへ送信するテキストデータ送信処理部と,
前記固有名詞抽出処理サーバから受信した,前記テキストデータから抽出された固有名詞を,前記文書データと並べて表示する固有名詞表示処理部とを備え,
前記固有名詞抽出処理サーバに,
前記テキストデータから,前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理部と,
前記抽出した固有名詞を前記クライアント端末に送信する処理結果送信処理部とを備える
ことを特徴とする文書データ表示処理システム。
1 クライアント端末
11 文書表示処理部
12 テキスト抽出部
13 固有名詞取得部
14 固有名詞表示処理部
2 固有名詞抽出サーバ
21 固有名詞データベース
22 文書管理データベース
23 固有名詞抽出履歴データベース
24 処理要否判定部
25 文書ID生成部
26 固有名詞抽出部
27 付加情報取得部
3(3A,3B,3C) 文書提供サーバ
N ネットワーク
11 文書表示処理部
12 テキスト抽出部
13 固有名詞取得部
14 固有名詞表示処理部
2 固有名詞抽出サーバ
21 固有名詞データベース
22 文書管理データベース
23 固有名詞抽出履歴データベース
24 処理要否判定部
25 文書ID生成部
26 固有名詞抽出部
27 付加情報取得部
3(3A,3B,3C) 文書提供サーバ
N ネットワーク
Claims (3)
- コンピュータに,
他のコンピュータでの表示対象となる文書情報から,該文書情報に含まれる語句を抽出し,
抽出された前記語句に基づいて,前記文書情報と関連する関連文書情報の所在を特定し,
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の,リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する,
処理を実行させることを特徴とする制御プログラム。 - コンピュータが,
他のコンピュータでの表示対象となる文書情報から,該文書情報に含まれる語句を抽出し,
抽出された前記語句に基づいて,前記文書情報と関連する関連文書情報の所在を特定し,
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の,リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する,
処理を実行することを特徴とする制御プログラム。 - 他のコンピュータでの表示対象となる文書情報から,該文書情報に含まれる語句を抽出する抽出部と,
抽出された前記語句に基づいて,前記文書情報と関連する関連文書情報の所在を特定する特定部と,
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の,リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する提供部と,
を備えることを特徴とするコンピュータ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014210325A JP2015035223A (ja) | 2014-10-14 | 2014-10-14 | 制御プログラムおよびコンピュータ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014210325A JP2015035223A (ja) | 2014-10-14 | 2014-10-14 | 制御プログラムおよびコンピュータ |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007104464A Division JP5657851B2 (ja) | 2007-04-12 | 2007-04-12 | 文書データ表示処理プログラム,固有名詞抽出処理プログラム,文書データ表示処理方法,文書データ表示処理装置,文書データ表示処理システム,表示制御プログラム,および表示制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015035223A true JP2015035223A (ja) | 2015-02-19 |
Family
ID=52543654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014210325A Pending JP2015035223A (ja) | 2014-10-14 | 2014-10-14 | 制御プログラムおよびコンピュータ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015035223A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002175299A (ja) * | 2000-09-29 | 2002-06-21 | Ricoh Co Ltd | 情報提供方法、情報提供装置及び情報提供プログラムを格納する記憶媒体 |
JP2006302024A (ja) * | 2005-04-21 | 2006-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 関連文書表示方法及びプログラム |
-
2014
- 2014-10-14 JP JP2014210325A patent/JP2015035223A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002175299A (ja) * | 2000-09-29 | 2002-06-21 | Ricoh Co Ltd | 情報提供方法、情報提供装置及び情報提供プログラムを格納する記憶媒体 |
JP2006302024A (ja) * | 2005-04-21 | 2006-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 関連文書表示方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8869019B1 (en) | Method and apparatus for automatic website optimization | |
US20140280295A1 (en) | Multi-language information retrieval and advertising | |
JP5013065B2 (ja) | 風説監視システム、風説監視方法及びプログラム | |
US11403271B2 (en) | Native application content verification | |
JP2008186452A (ja) | 検索システム及び検索方法 | |
US9378272B1 (en) | Determining correction of queries with potentially inaccurate terms | |
JP5830581B1 (ja) | 入力支援サーバ、入力支援方法及び入力支援プログラム | |
US20180285444A1 (en) | Rewriting contextual queries | |
US10262063B2 (en) | Method and system for providing alternative result for an online search previously with no result | |
JP5657851B2 (ja) | 文書データ表示処理プログラム,固有名詞抽出処理プログラム,文書データ表示処理方法,文書データ表示処理装置,文書データ表示処理システム,表示制御プログラム,および表示制御方法 | |
KR20100117335A (ko) | 검색어가 포함된 텍스트를 기초로 검색 사이트를 특정하여 검색 결과를 요청하는 검색 중계 서버 및 그 제어방법 | |
JP5321777B2 (ja) | 参考キーワードを提示する機能を備えた商品検索装置および商品検索方法 | |
US9208232B1 (en) | Generating synthetic descriptive text | |
US9208233B1 (en) | Using synthetic descriptive text to rank search results | |
KR101308821B1 (ko) | 검색엔진용 키워드 추출 시스템 및 추출 방법 | |
JP4869311B2 (ja) | 広告入札用語句提案装置、広告入札用語句提案システムおよび広告入札用語句提案方法 | |
US20110072038A1 (en) | Web site with content based on referring link information | |
JP2015035223A (ja) | 制御プログラムおよびコンピュータ | |
US9607087B1 (en) | Providing answer boxes based on query results | |
JP2014146257A (ja) | 情報処理装置、情報処理方法、及び、情報処理プログラム | |
US20150363487A1 (en) | Extracting and mining of quote data across multiple languages | |
JP5777663B2 (ja) | 検索支援装置及び検索支援プログラム | |
KR101402339B1 (ko) | 문서 관리 시스템 및 문서 관리 방법 | |
JP4550939B1 (ja) | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム | |
JP2017188021A (ja) | 求職支援システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150914 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160216 |