JP4251804B2 - 情報表示方法、情報表示プログラム及び情報表示装置 - Google Patents

情報表示方法、情報表示プログラム及び情報表示装置 Download PDF

Info

Publication number
JP4251804B2
JP4251804B2 JP2001370102A JP2001370102A JP4251804B2 JP 4251804 B2 JP4251804 B2 JP 4251804B2 JP 2001370102 A JP2001370102 A JP 2001370102A JP 2001370102 A JP2001370102 A JP 2001370102A JP 4251804 B2 JP4251804 B2 JP 4251804B2
Authority
JP
Japan
Prior art keywords
tag
information
display
displayed
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001370102A
Other languages
English (en)
Other versions
JP2003167879A (ja
Inventor
佳則 片山
文人 西野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001370102A priority Critical patent/JP4251804B2/ja
Publication of JP2003167879A publication Critical patent/JP2003167879A/ja
Application granted granted Critical
Publication of JP4251804B2 publication Critical patent/JP4251804B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、タグ付き情報からオペレータに必要な情報を抽出して表示するためのタグ付き情報表示方法,タグ付き情報表示プログラム,及びタグ付き情報表示装置に、関する。
【0002】
【従来の技術】
近年、インターネットやイントラネットの発展により、WEB上のハイパーテキスト,データベース,新聞,書籍等の印刷,出版物を含め、莫大な情報が簡単に入手可能となっている。これらの情報は様々な形式で記述されているので、オペレータに必要な情報を含む文書がヒットしたとしても、ヒットした莫大な文書中からオペレータに必要な情報を探し出して、これを目的にあった型に整理しなおさなければ、その利用は難しい。
【0003】
そのため、検索対象となる文書から情報を抽出して整理するための技術開発が進められているが、このような技術においては、検索対象となる文書には、それに含まれる個々の情報の意味を明らかにするためのXML(Extensible Markup Languate)やSGML(Standard Generalized Markup Language)等による情報タグが付与され、文書を検索するツールや整理保存するツールには、これら情報タグを手懸かりに必要な情報を知識として抽出する機能が備えられている。
【0004】
【発明が解決しようとする課題】
しかしながら、これらのツールは、情報の検索や整理等の処理目的に依って夫々事前に用意されるものであるので、その処理結果の表示形式も、ツール毎に異なった画一的なものであった。一方、情報の使用目的は個々の利用者毎に異なる。例えば、利用者の職制(管理職,一般職等)や対象業務(営業,サービスエンジニア,開発)毎に、必要とする情報の内容は異なり、出力結果の利用方法(詳細である必要があるか概要で足りるか,内部資料として利用されるか外部資料として利用されるか)や表示方法(リスト形式,カード形式)によっても、表示すべき情報の範囲は異なってくる。
【0005】
本発明は、このような問題点に鑑みてなされたものであり、その課題は、利用者の要求に応じて、任意の種類の情報をタグ付き情報から抽出して表示することができるタグ付き情報表示方法,タグ付き情報表示プログラム,及びタグ付き情報表示装置を、提供することである。
【0006】
【課題を解決するための手段】
上記課題を解決するために案出された本発明によるタグ付き情報表示方法は、予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出ステップと、抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成ステップと、表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出ステップと、抽出された情報を表示する表示ステップとを、順次行うことを特徴とする。
【0007】
また、本発明によるタグ付き情報表示プログラムは、コンピュータに対して、利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出ステップと、抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成ステップと、表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出ステップと、抽出された情報を表示する表示ステップとを、順次実行させることを特徴とする。
【0008】
また、本発明によるタグ付き情報表示装置は、予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成手段と、サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出手段と、抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成手段と、表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出手段と、抽出された情報を表示する表示手段とを、備えたことを特徴とする。
【0009】
以上のように構成されると、サンプルとなる一つ又は複数のタグ付き情報から、そのタグ付き情報に含まれるタグが抽出される。そして、このように抽出されたタグの中から、予め利用者が必要としている情報の種類を示すプロファイル中のキーワードに相当するタグのみが、変換規則情報として抽出される。そして、上述したようにして得られた変換規則に含まれるタグに相当する情報が、表示対象タグ付き情報から抽出されて、表示される。従って、個々の利用者が真に必要とする情報のみが自動的に表示対象タグ付き情報から抽出されて表示されるので、これらの情報を手作業で探し出す手間が省ける。また、表示は、変換規則に従った統一的形式でなされるので、種々雑多なタグ付き情報から必要な情報を得ることが可能になる。
【0010】
なお、本発明においてタグ付き情報には、XML文書の他、SGML文書やHTML文書等、あらゆる種類のタグ付き文書が含まれる。
【0011】
【発明の実施の形態】
以下、図面に基づいて、本発明の実施の形態を説明する。
(実施形態の原理)
図1は、本発明の実施形態の原理を示す概念図である。この図1に示されたように、本実施形態においては、インターネット上で拡布された印刷物,出版物,データベース等から、XMLタグ付き情報が、抽出,検索,分析等によって得られると、それら全てのXMLタグ付き情報のタグ構造情報を統合した(足し合わせた)タグ構造情報が得られる。一方、情報利用者が必要とする情報を示すキーワードを列挙したプロファイルが、手動又は自動で生成される。そして、統合後のタグ情報情報から、プロファイルに含まれるキーワードと同一又は同義のタグのみがその階層構造を示す態様で抽出され、更に、情報利用者によって編集がなされ、変換規則として記憶される。そして、この変換規則によって指定されたタグを付された情報が、表示対象XMLテキストから抽出されて、表示される。
(実施形態のハードウェア構成)
図2は、本発明によるタグ付き情報表示方法を実施するためのプログラム(タグ付き情報表示プログラム)を実行するコンピュータシステム(タグ付き情報表示装置)を概略的に示すブロック図である。このコンピュータシステムは、ネットワーク(インターネット等)に接続して情報を収集する機能を有するコンピュータとして、構成されている。
【0012】
図2に示すように、このコンピュータは、互いにバスBを介して接続されたCPU1,ハードディスク2,RAM3,通信デバイス4,表示装置5及び入力装置6から、構成されている。
【0013】
CPU1は、ハードディスク2に格納されている各種プログラムを実行することによって、コンピュータ全体の制御を行い、情報処理を行う。
【0014】
ハードディスク2には、前記各種プログラムとともに、各種データが格納されている。このハードディスク2に格納されている各種プログラムには、通信機能を備えたオペレーションシステム20,インターネットやイントラネットを介してWEB上のコンテンツを閲覧するためのブラウザプログラム21及びWEB上のデータベースから情報を検査するための検索ツール22が、含まれている。更に、各種プログラムには、ブラウザプログラム21や検索ツール22によって収集された文書(XMLテキスト)から必要な情報を抽出して表示するためのタグ付き情報表示プログラム23が、含まれる。なお、このタグ付き情報表示プログラム23は、CPU1に対して、図3のフローチャートに示されたプロファイル生成処理プロセス,図4及び図5のフローチャートに示された事前処理プロセス,及び、図6のフローチャートに示された表示処理プロセスを、実行させる。
【0015】
また、ハードディスク2に格納されている各種データには、業種別オントロジー24,プロファイル25及び変換規則26が含まれている。この業種別オントロジー24は、各業種毎に、その業種において一般的に使われている同義語をまとめてリスト化したものである。また、プロファイル25は、このタグ付き情報表示方法によって表示される情報を利用する各利用者毎に用意されており、図9に示すように、夫々、そのユーザが必要とする情報の種類(即ち、XMLタグとして定義され得る情報種類)をリストアップしたものである。また、変換規則26は、CPU1が上記ハイパーテキスト表示プログラム23による事前処理プロセスを実行することによって各利用者毎に生成されたデータであり、図15に示すように、表示対象XMLテキストから抽出すべき情報の種類とその階層構造を定義するものである。
【0016】
RAM3は、CPU1が上述した各種プログラムを実行するに際して作業領域として利用されるランダムアクセスメモリであり、各種プログラムによって生成された情報を一時的に記憶する。
【0017】
通信デバイス4は、通信回線との間のインターフェースであり、通信回線がアナログ電話回線であればモデム(ADSLモデムを含む)が用いられ、デジタル回線であればTAが用いら、ローカルエリアネットワークであればLANカードが用いられる。
【0018】
表示装置5は、CPU1によって生成された各種表示データに従った画面表示を行うCRT(Cathode-Ray-Tube),液晶表示パネル等である。
【0019】
入力装置6は、オペレータがコマンド,データ等の情報を手入力するためのキーボード,ポインティングデバイス等である。
(実施形態の処理内容)
次に、CPU1が上述したタグ付文書表示プログラム23に従って実行する各種プロセスの内容を、説明する。
<プロファイル生成処理プロセス>
図3に示すプロファイル生成処理プロセスは、このコンピュータのオペレータがデータ利用者である場合に、実行される。
【0020】
このプロファイル生成処理がスタートして最初のS001では、CPU1は、オペレータ(データ利用者)によるプロファイル情報入力を受け付ける。即ち、CPU1は、オペレータ(データ利用者)が必要とする情報の種類を示す一又は複数のキーワードを入力するための所定フォーマットの入力画面を、表示装置5のスクリーン上に表示し、この入力画面に一つ又は複数個のキーワードが入力されるのを待つ。そして、1又は複数個のキーワードが入力されると、CPU1は、処理をS002へ進める。
【0021】
S002では、CPU1は、S001にて入力された全キーワード(即ち、プロファイル情報)に基づいて、そのオペレータ(データ利用者)についてのプロファイル25を生成し、ハードディスク2に格納する。これととともに、検索キーワードのランキング順位(初期状態においては、検索キーワードが未登録)を表すランキング表をも、同時に、ハードディスク2に格納する。
【0022】
続くS003以降の処理は、他のプログラムが実行されている裏で、並行実行される処理であり、一旦、コンピュータの電源を落とした後であっても、電源再投入後に、オペレーションシステム20の機能により再スタートする。
【0023】
S003では、CPU1は、オペレータ(データ利用者)によって情報検索が実行されるのを待つ。そして、情報検索が実行されると、CPU1は、処理をS004へ進め、その情報検索において指定された検索キーワードと同一又は同義のキーワードを、当該オペレータ(データ利用者)専用にハードディスク2に格納されているプロファイル25から探し出す。そして、探し出されたキーワードについてのランキング表でのランキング順位を一つアップさせる。なお、検索キーワードがランキング表に掲載されていない場合には、CPU1は、検索キーワードをランキング表に追加する(登録時においては10位とする)。
【0024】
次のS005では、S004でのランクアップ後のランキング順位が1位となったか否かをチェックする。そして、1位でなければ処理をS003に戻し、1位であれば、S006にて当該検索キーワードを、当該オペレータ(データ利用者)専用にハードディスク2に格納されているプロファイル25に追加した後に、処理をS003に戻す。
【0025】
以上のプロファイル生成処理が継続的に実行されることにより、データ利用者であるオペレータが必要としているデータを表示させるためのプロファイル25が、先ず、オペレータによって手動生成され、その後で、オペレータの情報収集履歴に応じて自動更新される(プロファイル作成ステップ、プロファイル作成手段に相当)。従って、オペレータの役職や職種に適合したキーワードを、任意に取捨選択して、プロファイル25に含めることができるとともに、実際に必要な情報の種類を示すキーワードが、自動的にプロファイル25に追加される。
<事前処理プロセス>
図4及び図5に示す事前処理プロセスは、情報利用者がデータ使用の目的を新たに設定した時に、オペレータによって任意に実行される。例えば、任意の検索キーワードを指定した検索(XML検索等)を実行することによって多数のXMLテキスト(タグ付文書)が得られた時に、実行される。この事前処理は、表示対象となる一群のXMLテキストの全て、もしくは、その中から無作為に抽出した複数のXMLテキストに対して実行される。この事前処理の対象となるXMLテキストを、以下、サンプルテキストという。
【0026】
この事前処理のスタート後、最初のS101では、CPU1は、サンプルテキストを一つ読み込む。次のS102では、CPU1は、S101にて読み込んだサンプルテキストからXMLタグ構造を抽出する(タグ構造抽出ステップ、タグ構造抽出手段に相当)。図8の例に示すように、このXMLタグ構造は、サンプルテキストに付されたタグの名称(通常、そのタグによって囲まれる情報の種類を示す文言が充てられる)のみを、タグ相互間の階層構造を反映して抽出したデータである。次のS103では、CPU1は、S102にて抽出したXMLタグ構造を、「XMLタグ構造情報」としてRAM3に一次記憶する。
【0027】
続いて、CPU1は、S104乃至S110のループ処理を実行する。このループ処理に入って最初のS104では、CPU1は、未読込のサンプルテキストがあるか否かをチェックする。そして、未読込のサンプルテキストがある場合には、CPU1は、S105において、次のサンプルテキストを読み込む。
【0028】
次のS106では、CPU1は、S105にて読み込んだサンプルテキストのXMLタグ構造を抽出する(タグ構造抽出ステップ、タグ構造抽出手段に相当)。次のS107では、CPU1は、S106にて抽出したXMLタグ構造を構成するタグを一つ特定する。次のS108では、CPU1は、S107にて特定したタグと同一又は同義のタグがRAM3上のXMLタグ構造情報に含まれているか否かを、チェックする。なお、処理対象タグと同義のタグの範囲を調べるために、CPU1は、上述した業種別オントロジー24を参照する。そして、同一又は同義のタグがあった場合には、CPU1は、処理をそのままS110へ進める。これに対して、同一又は同義のタグが無かった場合には、CPU1は、S109において処理対象タグ(S107にて特定されたタグ)をRAM3上のXMLタグ構造情報に統合(処理対象タグの上層タグと同一又は同義のタグがあれば当該タグの下層に追加,処理対象タブの上層タグと同一又は同義のタグがなければ最上層に追加)した後に、処理をS110へ進める。S110では、CPU1は、S106にて抽出したXMLタグ構造中に未特定のタグが残っているか否かをチェックし、残っていれば処理をS107に戻し、残っていなければ処理をS104に戻す。
【0029】
以上に説明したS104乃至S110のループ処理を繰り返した結果、未処理のサンプルテキストが無くなったとS104にて判定した場合には、CPU1は、処理をS104からS111へ進める。S111では、CPU1は、指定された情報利用者専用のプロファイル25を、ハードディスク2から読み込む。
【0030】
次のS112では、CPU1は、RAM3上に最終的に残されたXMLタグ構造情報から、S111にて読み込んだプロファイルに列挙されたキーワードと同一又は同義のタグ及びその上位タグを抽出する。この場合も、同義のタグの範囲を調べるために、CPU1は、業種別オントロジー24を参照する。
【0031】
次のS113では、CPU1は、図10に示されるように、S112にて抽出した各タグに、その階層構造を表すID(下位階層のタグのID=上位階層のタグのID×10+α)を付与する。
【0032】
次のS114では、CPU1は、S113にて付与したIDが示す階層構造通りにS112にて抽出した各タグを表す変換規則作成画面を、表示装置5のスクリーン上に表示する。この変換規則作成画面には、図12の画面例に示されるように、最終的に表示する際における各項目毎に、その項目の名称を書き込む欄(「フィールド名称」欄),その項目に表示されるべき情報に対応するタグ(XMLテキスト中で情報を直接囲む最下位階層のタグ)のIDを指定する欄(「タグ対応」欄),その項目に表示されるべき情報を表示するためのフォントの大きさを指定する欄(「フォントサイズ」欄),そのフォントの色を指定する欄(「フォント色」欄),及び、その項目を削除するためのチェックボックスが、備えられている。初期状態においては、これら各項目は、夫々、個々の最下位階層のタグ毎に用意され、「フィールド名称」欄及び「タグ対応」欄には、夫々、そのタグについてのデータ(タグの文言,ID)が、初期設定されている。オペレータは、「フィールド名称」欄の内容を任意に書き換えることによって、その項目の名称(フィールド名称)を変更したり、「タグ対応」欄に他のIDを追記することによって、その項目に複数種類の情報が表示されるようにしたり、「フォントサイズ」欄及び「フォント色」欄に任意にデータを記述することによって、その項目に表示される文字を任意に設定することができる。なお、上述したように或る項目の「タグ対応」欄に複数のIDを指定した場合には、追記されたIDが元々「タグ対応」欄に記述されていた項目は不要になるので、その項目を削除するためのチェックボックスがチェックされる。また、この変換規則作成画面には、各項目の上位階層の項目のフィールド名称(即ち、上位階層のタグの文言)が変更不能な態様で記述されているとともに、その上位階層の項目を削除するためのチェックボックスも備えられている。更に、この変換規則作成画面には、各種ボタン(「タグ構造表示」ボタン31,「画面更新」ボタン32,「リセット」ボタン33,「スタイルシート作成」ボタン34及び「終了」ボタン35)が、含まれている。なお、この変換規則作成画面は、表計算プログラムによる編集画面であっても良い。
【0033】
次のS115では、CPU1は、この変換規則作成画面に対する入力を待つ。そして、「終了」ボタン35が押下(入力装置6に含まれるポインティングデバイスによってカーソルが当該ボタン上に重ねられた状態で、そのポインティングデバイスのクリックボタンが押下される事、以下同じ)された場合には、この事前処理プロセスを終了し、「タグ構造表示」ボタンが押下された場合には、処理をS116へ進め、「スタイルシート作成」ボタン34が押下された場合には、処理をS117へ進め、その他の入力(即ち、他のボタンの押下,各欄へのデータ記入又は変更,各チェックボックスへのクリック)があった場合には、処理をS120へ進める。
【0034】
S116では、CPU1は、図13に示すようなXMLタグ構造画面を、表示装置5のスクリーン上に表示する。図13に示されるように、このXMLタグ構造画面には、S112にて抽出されたタグが、S113にて付与されたIDとともに、一覧表示されている。S116を完了すると、CPU1は、処理をS115に戻す。
【0035】
また、S110では、CPU1は、入力の内容に従った処理を実行する。例えば、各欄にデータ記入があった場合(即ち、ポインティングデバイスによって記入対象欄がアクティブにされた状態でキーボードによって文字が入力されること)には、CPU1は、入力された文字を記入対象欄に表示する。また、チェックマークが付されていないチェックボックスがクリックされた場合にはそのチェックボックスにチェックマークを表示し、チェックマークが付されているチェックボックスがクリックされた場合にはそのチェックボックスからチェックマークを消去する。また、「画面更新」ボタン32が押下された場合には、その時点でチェックボックスにチェックマークが付されている項目を消去する。また、「リセット」ボタン33が押下された場合には、変換規則作成画面の内容を初期状態に戻す。
【0036】
また、S117では、その時点で変換規則作成画面に設定されている各データの内容に従って、図14に示すような変換規則確認画面を、表示装置5のスクリーン上に表示する。図14に示されるように、この変換規則確認画面には、変換規則作成画面に設定されていた各項目毎の「フィールド名称」欄の内容,「タグ対応」欄の内容,「フォントサイズ」欄の内容及び「フォント色」欄の内容が、一覧表示されている。更に、この変換規則確認画面には、「作成」ボタン36及び「戻る」ボタン37が含まれている。
【0037】
次のS118では、CPU1は、変換規則確認画面中の「作成」ボタン36又は「戻る」ボタン37が押下されるのを待つ。そして、「戻る」ボタン37が押下された場合には、処理をS115に戻し、「作成」ボタン36が押下された場合には、処理をS119に進める。
【0038】
S119では、変換規則確認画面に一覧表示されていた各項目毎の情報をコード化することにょって、図15に示されるような変換規則26を作成し、この変換規則26をハードディスク2に格納する。S119を完了すると、CPU1は、この事前処理を完了する。S111乃至S119の処理が、変換規則生成ステップ及び変換規則生成手段に相当する。
【0039】
以上のようにしてハードディスク2内に格納された変換規則は、サンプルテキストの抽出元となったXMLテキスト群に対する表示処理のために使用可能である他、同種のXMLテキスト群(同じ検索キーワードを用いて他のデータベース等から検索されたXMLテキスト群,類似の検索キーワードを用いて同じデータベース等から検索されたXMLテキスト群,等)に対する表示処理のために使用可能である。
【0040】
更に、複数人が必要とする情報の種類が共通している事情がある場合には、これら複数人に共通するプロファイル25に基づいて変換規則26が生成されても良いし、或る一人に固有のプロファイル25に基づいて生成された変換規則26が、他の者に情報を提示するために用いられても良い。
<表示処理>
図6に示す表示処理は、上述した事前処理の完了後において、サンプルテキストの抽出元となったXMLテキスト群に対して、また、その後において同種のXMLテキスト群が得られた後に当該XMLテキスト群に対して、実行される。即ち、何れかのデータ利用者専用の変換規則26及びXMLテキスト群を指定したコマンドが入力されることによって、スタートする。
【0041】
このプロファイル精製処理のスタート後における最初のS201では、CPU1は、コマンドにおいて指定された変換規則26を読み込む。
【0042】
次のS202では、CPU1は、コマンドにおいて指定された表示対象XMLテキストを一つ読み込む。
【0043】
次のS203では、CPU1は、S201にて読み込まれた変換規則26中の各タグについて、夫々、そのタグと同一又は同義のタグが付された記述(変換規則26中のタグに上位タグがある場合には、その上位タグと同一又は同義の上位タグを有するタグが付された記述)を、抽出する(情報抽出ステップ、情報抽出手段に相当)。
【0044】
次のS204では、CPU1は、全ての表示対象XMLテキストについて、S202及びS203の処理を完了したか否かを、チェックする。そして、未だ表示対象XMLテキストが残っている場合には、処理をS202に戻し、次の表示対象XMLテキストに対する処理を実行する。
【0045】
これに対して、表示対象XMLテキストが残っていない場合には、CPU1は、処理をS204からS205へ進める。このS205では、CPU1は、全表示対象XMLテキストに対してS203にて抽出された情報を、表示装置5のスクリーン上にリスト形式で表示する(表示ステップ、表示手段に相当)。図16は、このリスト表示のためのリスト画面例を示す。図16に示すように、このリスト画面には、S203にて抽出された各記述に対応した項目のうちリスト表示すべき項目を指定するための項目指定欄38,この項目指定欄38に指定された項目について、各表示対象XMLテキストから抽出された情報を一覧表示するためのリスト欄39,及び、「カード表示」ボタン40が、含まれている。
【0046】
次のS206では、CPU1は、リスト画面への入力を待ち、「カード表示」ボタン40が押下された場合には、処理をS207へ進め、それ以外の入力があった場合には、処理をS209へ進める。このS209では、CPU1は、入力内容に応じた処理を実行する。例えば、項目指定欄38に表示されている項目が変更された場合には、リスト欄39に一覧表示される内容を、変更後の項目について各表示対象XMLテキストから抽出された情報に変更する。S209の完了後、CPU1は、処理をS206に戻す。
【0047】
一方、S207では、CPU1は、リスト欄39中でアクティブにされていた(押下されていた)項目を含むXMLテキストについて、S203にて抽出された情報を、表示装置5のスクリーン上にカード形式で表示する(表示ステップ、表示手段に相当)。図17は、このカード表示のためのカード画面例を示す。図17に示すように、このカード画面には、カード表示対象のXMLテキストから抽出された全情報を一覧表示するカード欄41,及び、「リスト表示」ボタン42が、含まれている。
【0048】
次のS708では、CPU1は、「リスト表示」ボタン42が押下されるのを待つ。そして、「リスト表示」ボタン42が押下されると、CPU1は、処理をS205へ戻す。
【0049】
この表示処理が実行されることにより、オペレータは、リスト画面のリスト欄39に一覧表示されている情報に基づいて、カード表示すべきXMLテキストを選択する。そして、選択されたXMLテキストに対するカード表示画面によって、そのXMLテキストから自己が必要とするものとして絞り込んだ情報を、一目で見ることができる。このように、オペレータは、表示形式を任意に切り替えることができる。このように切り替えがなされても、既に情報は表示対象XMLテキストから抽出されているので、直ぐに表示がなされる。
(付記1)
タグ付き情報から利用者に必要な情報を抽出して表示するためのタグ付き情報表示方法であって、
予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成ステップと、
表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出ステップと、
抽出された情報を表示する表示ステップとを、
順次行うことを特徴とするタグ付き情報表示方法。(1)
(付記2)
前記変換規則生成ステップでは、更に、抽出したタグを操作者に提示し、変換規則に含めるタグ操作者からの要求に従って制限する
ことを特徴とする付記1記載のタグ付き情報表示方法。(2)
(付記3)
前記プロファイル生成ステップでは、前記利用者の情報収集履歴を考慮し、情報収集に多用されたキーワードを前記プロファイルに含める
ことを特徴とする付記1記載のタグ付き情報表示方法。(3)
(付記4)
前記変換規則生成ステップでは、更に、変換規則に含められるタグに対応した項目名を設定し、
前記表示ステップでは、前記情報抽出ステップにおいて前記変換規則に含まれたタグによって特定されているものとして前記表示対象のタグ付き情報から抽出された情報を、そのタグに対応した項目名を付して表示する
ことを特徴とする付記1記載のタグ付き情報表示方法。
(付記5)
前記タグ構造抽出ステップでは、サンプルとなる複数のタグ付き情報から夫々抽出された複数のタグを統合する
ことを特徴とする付記1記載のタグ付き情報表示方法。
(付記6)
前記統合を行う際には、同義語同士を正規化する
ことを特徴とする付記5記載のタグ付き情報表示方法。
(付記7)
前記表示ステップでは、前記情報抽出ステップにおいて複数のタグ付き情報から夫々抽出された情報をリスト形式で表示する
ことを特徴とする付記1記載のタグ付き情報表示方法。
(付記8)
前記表示ステップでは、前記情報抽出ステップにおいて単一のタグ付き情報から抽出された複数の情報をカード形式で表示する
ことを特徴とする付記1記載のタグ付き情報表示方法。
(付記7)
コンピュータに対して、
利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成ステップと、
表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出ステップと、
抽出された情報を表示する表示ステップとを、
順次実行させることを特徴とするタグ付き情報表示プログラム。(4)
(付記8)
タグ付き情報から利用者に必要な情報を抽出して表示するためのタグ付き情報表示装置であって、
予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成手段と、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを抽出するタグ構造抽出手段と、
抽出された複数のタグから、更に、前記キーワードに相当するタグのみを抽出し、変換規則情報として生成する変換規則生成手段と、
表示対象のタグ付き情報から、前記変換規則に含まれるタグと同じタグによって特定されている情報を抽出する情報抽出手段と、
抽出された情報を表示する表示手段とを
備えたことを特徴とするタグ付き情報表示装置。(5)
(付記9)
タグ付き情報から利用者に必要な情報を抽出して表示するためのタグ付き情報表示方法であって、
予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを、その階層構造を表す形態で抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相当する下位階層のタグのみを、その下位階層のタグの上位階層に当たるタグと組み合わせて抽出し、変換規則情報として生成する変換規則生成ステップと、
表示対象のタグ付き情報から、前記変換規則に含まれる下位階層のタグ及び上位階層のタグの組合せと同じタグの組み合わせによって特定されている情報を抽出する情報抽出ステップと、
抽出された情報を表示する表示ステップとを、
順次行うことを特徴とするタグ付き情報表示方法。
(付記10)
コンピュータに対して、
利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを、その階層構造を表す形態で抽出するタグ構造抽出ステップと、
抽出された複数のタグから、更に、前記キーワードに相当する下位階層のタグのみを、その下位階層のタグの上位階層に当たるタグと組み合わせて抽出し、変換規則情報として生成する変換規則生成ステップと、
表示対象のタグ付き情報から、前記変換規則に含まれる下位階層のタグ及び上位階層のタグの組合せと同じタグの組み合わせによって特定されている情報を抽出する情報抽出ステップと、
抽出された情報を表示する表示ステップとを、
順次実行させることを特徴とするタグ付き情報表示プログラム。
(付記11)
タグ付き情報から利用者に必要な情報を抽出して表示するためのタグ付き情報表示装置であって、
予め、前記利用者が必要とする情報の種類を示す一又は複数のキーワードを含むプロファイルを生成するプロファイル生成手段と、
サンプルとなるタグ付き情報から、そのタグ付き情報に含まれる複数のタグを、その階層構造を表す形態で抽出するタグ構造抽出手段と、
抽出された複数のタグから、更に、前記キーワードに相当する下位階層のタグのみを、その下位階層のタグの上位階層に当たるタグと組み合わせて抽出し、変換規則情報として生成する変換規則生成手段と、
表示対象のタグ付き情報から、前記変換規則に含まれる下位階層のタグ及び上位階層のタグの組合せと同じタグの組み合わせによって特定されている情報を抽出する情報抽出手段と、
抽出された情報を表示する表示手段とを
備えたことを特徴とするタグ付き情報表示装置。
【0050】
【発明の効果】
以上のように構成された本発明の情報表示方法によれば、利用者の要求に応じて、任意の種類の情報を、タグ付き文書から抽出して表示することができる。
【図面の簡単な説明】
【図1】 本発明の一実施形態による情報表示システムの概念図
【図2】 情報表示システムのハードウェア構成を示すブロック図
【図3】 タグ付き文書表示プログラムに従って実行されるプロファイル生成処理プロセスを示すフローチャート
【図4】 タグ付き文書表示プログラムに従って実行される事前処理プロセスを示すフローチャート
【図5】 タグ付き文書表示プログラムに従って実行される事前処理プロセスを示すフローチャート
【図6】 タグ付き文書表示プログラムに従って実行される表示処理プロセスを示すフローチャート
【図7】 XMLテキストの一例を示す図
【図8】 XMLタグ構造情報の一例を示す図
【図9】 プロファイルの一例を示す図
【図10】 XMLタグ構造情報からプロファイルに従って抽出されてIDが付されたタグの一例を示す図
【図11】 フィールド名称とIDとの関係を示す表
【図12】 変換規則作成画面を示す図
【図13】 タグ構造画面を示す図
【図14】 変換規則確認画面を示す図
【図15】 変換規則の一例を示す図
【図16】 リスト表示画面を示す図
【図17】 カード表示画面を示す図
【符号の説明】
1 CPU
2 ハードディスク
5 表示装置
6 入力装置
23 タグ付き文書表示プログラム
25 プロファイル
26 変換規則

Claims (3)

  1. タグを用いて文書構造が規定されたタグ付き文書から利用者に必要な情報を抽出して表示する情報表示方法であって、
    コンピュータが、
    予め、前記利用者が必要とする一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
    表示対象となる複数の前記タグ付き文書から抽出したサンプルとなるタグ付き文書から、そのタグ付き文書に含まれる複数のタグを抽出するタグ構造抽出ステップと、
    抽出された複数のタグから、更に、前記キーワードと同一のタグを複数抽出し表示装置に表示し該表示された複数のタグに基づき、タグで囲まれた情報を表示する際における該タグ間の階層構造、該タグに対応して表示する表示名称、該タグに囲まれた情報を表示する際の表示属性のいずれかに関する表示処理規則を、前記利用者から受け付ける変換規則生成ステップと、
    表示対象のタグ付き文書から、前記表示処理則に含まれるタグと同じタグで囲まれた情報を抽出する情報抽出ステップと、
    抽出された前記タグで囲まれた情報を、前記表示処理規則に定められた前記タグ間の階層構造、前記タグに対応して表示する表示名称、前記タグに囲まれた情報の表示属性のいずれかに基づいて、表示装置に表示する表示ステップとを
    実行する
    ことを特徴とする情報表示方法。
  2. コンピュータに対して、
    予め、利用者が必要とする一又は複数のキーワードを含むプロファイルを生成するプロファイル生成ステップと、
    表示対象である、タグを用いて文書構造が規定されたタグ付き文書の複数から抽出したサンプルとなるタグ付き文書から、そのタグ付き文書に含まれる複数のタグを抽出するタグ構造抽出ステップと、
    抽出された複数のタグから、更に、前記キーワードと同一のタグを複数抽出し表示装置に表示し該表示された複数のタグに基づき、タグで囲まれた情報を表示する際における該タグ間の階層構造、該タグに対応して表示する表示名称、該タグに囲まれた情報を表示する際の表示属性のいずれかに関する表示処理規則を、前記利用者から受け付ける変換規則生成ステップと、
    表示対象のタグ付き文書から、前記表示処理則に含まれるタグと同じタグで囲まれた情報を抽出する情報抽出ステップと、
    抽出された前記タグで囲まれた情報を、前記表示処理規則に定められた前記タグ間の階層構造、前記タグに対応して表示する表示名称、前記タグに囲まれた情報の表示属性のいずれかに基づいて、表示装置に表示する表示ステップとを
    実行させる
    ことを特徴とする情報表示プログラム。
  3. タグを用いて文書構造が規定されたタグ付き文書から利用者に必要な情報を抽出して表示する情報表示装置であって、
    予め、前記利用者が必要とする一又は複数のキーワードを含むプロファイルを生成するプロファイル生成手段と、
    表示対象となる複数の前記タグ付き文書から抽出したサンプルとなるタグ付き文書から、そのタグ付き文書に含まれる複数のタグを抽出するタグ構造抽出手段と、
    抽出された複数のタグから、更に、前記キーワードと同一のタグを複数抽出し表示装置に表示し該表示された複数のタグに基づき、タグで囲まれた情報を表示する際における該タグ間の階層構造、該タグに対応して表示する表示名称、該タグに囲まれた情報を表示 する際の表示属性のいずれかに関する表示処理規則を、前記利用者から受け付ける変換規則生成手段と、
    表示対象のタグ付き文書から、前記表示処理則に含まれるタグと同じタグで囲まれた情報を抽出する情報抽出手段と、
    抽出された前記タグで囲まれた情報を、前記表示処理規則に定められた前記タグ間の階層構造、前記タグに対応して表示する表示名称、前記タグに囲まれた情報の表示属性のいずれかに基づいて、表示装置に表示する表示手段と
    を備えたことを特徴とする情報表示装置。
JP2001370102A 2001-12-04 2001-12-04 情報表示方法、情報表示プログラム及び情報表示装置 Expired - Fee Related JP4251804B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001370102A JP4251804B2 (ja) 2001-12-04 2001-12-04 情報表示方法、情報表示プログラム及び情報表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001370102A JP4251804B2 (ja) 2001-12-04 2001-12-04 情報表示方法、情報表示プログラム及び情報表示装置

Publications (2)

Publication Number Publication Date
JP2003167879A JP2003167879A (ja) 2003-06-13
JP4251804B2 true JP4251804B2 (ja) 2009-04-08

Family

ID=19179380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001370102A Expired - Fee Related JP4251804B2 (ja) 2001-12-04 2001-12-04 情報表示方法、情報表示プログラム及び情報表示装置

Country Status (1)

Country Link
JP (1) JP4251804B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4637113B2 (ja) * 2003-11-28 2011-02-23 キヤノン株式会社 階層データの好ましいビューを構築するための方法
JP4923413B2 (ja) * 2005-02-28 2012-04-25 富士通株式会社 情報抽出プロブラム及び方法
JPWO2006137564A1 (ja) * 2005-06-24 2009-01-22 株式会社ジャストシステム 文書処理装置
JP4843656B2 (ja) * 2008-09-29 2011-12-21 株式会社東芝 構造化データ検索プログラム及び構造化データ検索装置
CN101794282B (zh) * 2009-02-03 2013-11-06 日电(中国)有限公司 知识标注结果检查方法和***

Also Published As

Publication number Publication date
JP2003167879A (ja) 2003-06-13

Similar Documents

Publication Publication Date Title
US6658408B2 (en) Document information management system
US9348871B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US8978033B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
JP4509366B2 (ja) 文書上の情報をスキャンしてフォーマット化するシステム
US20020065852A1 (en) Online guided resume creation system that allows dynamic style formatting
US20030229631A1 (en) Database access mechanisms for a computer user interface
JP2001527246A (ja) 出版物ファイルの変換と表示
JPH11250105A (ja) 多言語情報検索方法およびシステム
US20060190483A1 (en) Data registration/search support device using a keyword
US6035338A (en) Document browse support system and document processing system
JP4251804B2 (ja) 情報表示方法、情報表示プログラム及び情報表示装置
JP2000231570A (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004192355A (ja) 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
JP2003196294A (ja) 知識分析システムおよび知識分析方法
JP3154992B2 (ja) 情報検索装置、及び情報検索プログラムが記憶された記憶媒体
US7386794B2 (en) Apparatus and method for performing the management of operation history
JP3450598B2 (ja) 専門用語辞書選択装置
JPH10162011A (ja) 情報検索方法、情報検索システム、情報検索端末装置および情報検索装置
JP2004070376A (ja) 文書表示装置および方法
JP3243949B2 (ja) 文書作成支援装置
JP2000099543A (ja) 情報検索装置
JPH04241673A (ja) 文書検索システム
JP2023125592A (ja) 情報処理システム、情報処理方法、プログラム
JP2746198B2 (ja) 全文対象データベース検索方法
JP2007122270A (ja) 情報検索表示システム、情報検索表示方法及び情報検索表示プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041202

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071116

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080924

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090120

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees