JP3939477B2 - データベース検索システムおよび方法、記録媒体 - Google Patents

データベース検索システムおよび方法、記録媒体 Download PDF

Info

Publication number
JP3939477B2
JP3939477B2 JP33170399A JP33170399A JP3939477B2 JP 3939477 B2 JP3939477 B2 JP 3939477B2 JP 33170399 A JP33170399 A JP 33170399A JP 33170399 A JP33170399 A JP 33170399A JP 3939477 B2 JP3939477 B2 JP 3939477B2
Authority
JP
Japan
Prior art keywords
data
metadata
information
user terminal
provided data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33170399A
Other languages
English (en)
Other versions
JP2001147941A (ja
Inventor
一仁 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Original Assignee
NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp filed Critical NS Solutions Corp
Priority to JP33170399A priority Critical patent/JP3939477B2/ja
Publication of JP2001147941A publication Critical patent/JP2001147941A/ja
Application granted granted Critical
Publication of JP3939477B2 publication Critical patent/JP3939477B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はデータベース検索システムおよび方法、更にはこれらをソフトウェアの機能で実現するためのプログラムを格納した記録媒体に関し、特に、分散化された複数のデータベースから所望のデータを探し出す検索システムに用いて好適なものである。
【0002】
【従来の技術】
近年、コンピュータネットワークが急速に発達し、それに伴ってデータベースも分散化されることが多く見られるようになってきた。例えば、インターネットでは、それぞれデータを保持する複数のコンピュータがサーバあるいはクライアントとして世界中に分散され、言うなれば分散型のデータベースとして構成されている。このようなインターネットに限らず、膨大なデータを扱うシステムではデータベースが分散化される傾向にある。
【0003】
このように分散化されたデータベースから所望の情報を読み出そうとする場合に、ユーザは読み出そうとする情報が分散化しているデータベースのどこに格納されているか分からないことが多いので、それぞれのデータベース毎に対応して設けられたデータサービスサーバを順にアクセスし、所望の情報が見つかるまで検索を繰り返し行わなければならない。このように、各データベースを個々に管理する全てのデータサービスサーバに対して検索を順次行うのは、非常に多くの時間と多くの労力とを必要とする。
【0004】
また、ユーザがデータサービスサーバの在り処(インターネットのURL(Uniform Resource Locator)等のようなアドレス情報)を全て把握していなければ、全てのデータサービスサーバに対して検索を行うことは不可能である。しかしながら、分散化されたデータサービスサーバは、絶えずデータの登録や削除を行う可能性があり、また、サーバ自体のネットワークへの接続・切断も絶えず行われる可能性がある。したがって、これらのことをユーザが全て把握することは極めて困難であり、正確な情報の検索を行うことは困難となる。
【0005】
このような不便さを解消するために、例えばインターネットでは検索エンジンと呼ばれるアドレス検索サービスが存在する。この検索エンジンには、大きく分けて、メタデータとして登録したホームページのタイトル、URL、コメント等の検索用情報をもとにこれと合致するホームページを検索するタイプと、インターネット上の各ホームページにあるテキスト全文を対象として合致するホームページを検索するタイプとがある。
【0006】
前者のタイプは更に、人手によって検索用情報を登録するタイプの手動型検索エンジンと、自動的にリンクを辿ってそれぞれのデータサービスサーバから必要な情報を収集し、それを検索用情報として登録するタイプのいわゆるロボット型検索エンジンとに分けられる。
【0007】
上記ロボット型、手動型の何れのタイプの検索エンジンも、自動的あるいは手動で収集した検索用情報をもとに、例えばキーワードの入力によって必要なURLの検索を行うことができる。例を挙げると、「特許」というキーワードについて検索を行うと、そのキーワードを含む検索用情報が登録されているデータサービスサーバのURLが検索結果として出力される。ユーザは、この検索結果に含まれるURLにアクセスすることで、所望の情報を探し出すことができる。
【0008】
図6は、上記ロボット型検索エンジンを用いた従来のデータベース検索システムの構成例を示すブロック図である。図6において、データソース51は、テキストデータ、画像データ、音声データ等の各種生データを格納したデータベースである。データ加工部52は、上記データソース51の生データに様々な加工を加え、インターネット上への提供データを生成するものである。
【0009】
上記データ加工部52は、例えば、テキストデータ、画像データ、音声データを融合したホームページのデータを生成する場合は、ウェブサイトを表現するための代表的な形式であるHTMLフォーマットに従って提供データを生成する。すなわち、このHTMLフォーマットのデータ中には、テキストデータのみが記述され、画像データや音声データは、そのファイル名などがテキストデータの形で埋め込まれ、そこから生データに対してハイパーリンクが引かれる。
【0010】
また、データ加工部52は、生データとして与えられた統計データを加工してグラフ化することにより、グラフデータをインターネット上への提供データとして生成することもある。データ加工部52は、ここに挙げた例以外にも、生データであるデータソース51に対して様々な加工を施し、提供データを生成する。生成された提供データは、データサービスサーバ53に登録される。
【0011】
データサービスサーバ53は、上記データ加工部52により生成された提供データやアプリケーションをインターネット上のユーザ端末58に提供するものである。すなわち、データサービスサーバ53は、ユーザ端末58からのアクセスに応じて、要求された提供データまたはサービス等をユーザに提供する。なお、データ加工部52を備えるユーザ端末自体が、データまたはサービスを受けるユーザ端末58にもなり得る。
【0012】
なお、ここではデータソース51、データ加工部52、データサービスサーバ53およびユーザ端末58を1つずつ示しているが、インターネット上にはこれらが多数存在している。
【0013】
メタデータサーバ(検索エンジン)54は、メタデータ生成部55と、メタDB56と、検索部57とを備えている。メタデータ生成部55は、データサービスサーバ53に登録された提供データ中に張られたリンクを辿りながら、複数のデータサービスサーバ53から必要な情報(ホームページのタイトル、URL、単語、コメント文、日付等の情報)を収集し、それを検索用情報(メタデータ)としてメタDB56に登録するものである。
【0014】
検索部57は、ユーザ端末58からの検索要求に応じてメタDB56内のメタデータを検索し、その結果をユーザ端末58に返すものである。例えば、検索部57は、ユーザ端末58から検索条件として与えられたキーワードを含むメタデータをメタDB56上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ53のURLを検索結果としてユーザ端末58に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ53の中から、所望の情報が含まれると思われるデータサービスサーバ53のURLを検索結果として得ることができる。
【0015】
【発明が解決しようとする課題】
しかしながら、上記図6に示した従来のデータベース検索システムでは、検索エンジン54は、データソース51の生データをもとに生成された提供データを管理しているデータサービスサーバ53から検索用情報(メタデータ)を収集していた。このとき、ロボット型の検索エンジン54は、データサービスサーバ53に登録されているコンテンツ内のURL情報を次々に辿って、提供データ中からメタデータを取り出しているだけであった。
【0016】
例えば、提供データが上述のHTMLフォーマットのデータとして登録されている場合は、ロボット型検索エンジン54は、このテキストデータ内に存在する単語やコメント文、日付などを読み取ってメタデータとして自分のメタDB56に登録したり、他ファイルへのリンクタグが存在すればそのファイル内の所在を自分のメタDB56に登録したりしているだけである。
【0017】
したがって、提供データが通常のテキストデータやHTMLフォーマットのデータであればそこからメタデータを取り出すことが可能であるが、これ以外の画像データ、音声データ、グラフデータ、CGデータ等の様々な形式のデータについてはメタデータを取り出すことができなかった。また、提供データがテキストデータの形式であっても、それがデータソース51の生データそのものではなく、例えば生データの内容を要約したような加工データである場合には、その加工データの中からしかメタデータの抽出は行うことができなかった。
【0018】
そのため、所望の画像データ、音声データ、グラフデータあるいはCGデータ等を含む情報を探し出したい場合でも、それに対応するメタデータがメタDB56上に登録されていないため、検索部57による検索によって該当するデータサービスサーバ53を見つけることはできなかった。また、生データ中には含まれていた単語であっても、要約された加工データ中にその単語が含まれていないと、その単語をキーワードとして検索した場合に、本来は該当するデータサービスサーバ53が検索結果から洩れてしまうことがあった。
【0019】
本発明は、このような問題を解決するために成されたものであり、様々な形式の生データを表したきめ細かなメタデータを登録できるようにすることにより、ユーザが要求する情報により近い回答を与えることが可能な検索エンジン(データベース検索システム)を提供することを目的とする。
【0020】
【課題を解決するための手段】
本発明のデータベース検索システムは、少なくとも1つの生データをデータソースから読み出して提供データを生成する提供データ生成手段と、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成するメタデータ生成手段と、上記メタデータを保持するメタデータ保持手段と、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する提供データ管理手段と、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す検索手段とを備えたことを特徴とする。
【0021】
本発明の他の態様では、上記メタデータ生成手段と上記メタデータ保持手段との間をつなぐ通信インタフェースを、上記メタデータに関する標準仕様に基づくインタフェースにより構成したことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により上記データソースの生データから上記メタデータを抽出する対象を指定するための生成対象指定手段を備えたことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データの公開に関する時限情報を付加する時限情報設定手段を備えたことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データへのアクセスに関するセキュリティ情報を付加するセキュリティ情報設定手段を備えたことを特徴とする。
【0022】
また、本発明のデータベース検索方法は、ユーザ端末とネットワークで接続され、提供データ生成手段、メタデータ生成手段、メタデータ保持手段、提供データ管理手段及び検索手段を有したデータベース検索システムにおいて前記ユーザ端末からの要求に応じてデータを検索するデータベース検索方法であって、上記提供データ生成手段が、少なくとも1つの生データをデータソースから読み出して提供データを生成する工程と、上記メタデータ生成手段が、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成する工程と、上記メタデータ保持手段が、上記メタデータを保持する工程と、上記提供データ管理手段が、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する工程と、上記検索手段が、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す工程と、を有することを特徴とする。
【0023】
本発明の他の態様では、上記データソースの生データから上記メタデータを抽出する対象を指定可能としたことを特徴とする。
本発明のその他の態様では、上記生成されるメタデータに対して、上記提供データの公開に関する時限情報を付加することを可能としたことを特徴とする。
本発明のその他の態様では、上記生成されるメタデータに対して、上記提供データへのアクセスに関するセキュリティ情報を付加することを可能としたことを特徴とする。
【0024】
また、本発明のコンピュータ読み取り可能な記録媒体は、請求項1〜5の何れか1項に記載の各手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とする。
本発明の他の態様では、請求項6〜9の何れか1項に記載のデータベース検索方法の処理手順をコンピュータに実行させるためのプログラムを記録したことを特徴とする。
【0025】
【発明の実施の形態】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、ロボット型検索エンジンを用いた本実施形態によるデータベース検索システムの構成例を示すブロック図である。
【0026】
図1において、データソース1は、テキストデータ、画像データ、音声データ、CGデータ等の各種生データを格納したデータベースである。データ生成部2は、上記データソース1の生データからインターネット上への提供データおよび検索用情報としてのメタデータを生成するものである。このデータ生成部2は、提供データ生成部21、メタデータ生成部22、データ生成制御部23、提供データ用I/F部24およびメタデータ用I/F部25を備えている。
【0027】
上記提供データ生成部21は、データソース1の生データに様々な加工を加え、インターネット上への提供データを生成する。例えば、テキストデータ、画像データ、音声データを融合したホームページのデータを生成する場合、提供データ生成部21は、ウェブサイトを表現するための代表的な形式であるHTMLフォーマットに従って提供データを生成する。
【0028】
また、提供データ生成部21は、生データとして与えられた統計データを加工してグラフ化することにより、グラフデータを上記提供データとして生成することもある。提供データ生成部21は、ここに挙げた例以外にも、生データであるデータソース1に対して様々な加工を施し、提供データを生成する。生成された提供データは、提供データ用I/F部24を介してデータサービスサーバ3に与えられ、登録される。
【0029】
メタデータ生成部22は、データソース1の生データそのもの、および提供データ生成部21により生成される提供データから必要な情報を抽出し、それをメタデータとして生成するものである。上述したように、データソース1中には、テキストデータだけでなく、画像データ、音声データ、CGデータ等の様々な形式の生データを含んでいる。本実施形態のメタデータ生成部22は、これらのテキストデータ以外の生データからもメタデータを抽出して生成する。
【0030】
例えば、メタデータの生成対象とするデータソース1がテキストデータの場合、メタデータ生成部22は、そのテキストデータの中から単語やコメント文を抽出し、あるいはそのテキストデータの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0031】
また、メタデータの生成対象とするデータソース1が画像データ、音声データ、CGデータ等のテキスト以外のデータの場合、メタデータ生成部22は、それらのデータの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0032】
また、写真やイラスト等と共にその解説文が記述された図書などがデータソース1となる場合には、それをイメージスキャナを用いて取り込み、その解説文をOCR(Optical Character Reader)によりテキストデータ化する。そして、その解説文のテキストデータ中から単語やコメント文を抽出してそれをメタデータとして生成することも可能である。
【0033】
さらに、提供データ生成部21によりテキストデータ、画像データ、音声データ、CGデータ等の各種データを融合したホームページのデータをHTML形式で生成した場合、メタデータ生成部22は、そのHTML形式のテキストデータ中から単語やコメント文を抽出し、あるいはそのテキストデータの作成日付、作者名、ファイル名、ホームページのタイトル、URL等の情報を抽出してそれをメタデータとして生成する。
【0034】
また、データソース1の中から複数の画像データを集めてそれぞれをサムネイル化した画像一覧のデータを提供データ生成部21で生成したような場合、メタデータ生成部22は、画像一覧データの作成日付、作者名、ファイル名等の情報や、上記画像一覧データの生成元となった複数の画像データの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0035】
なお、以上に説明した各メタデータは、あくまでも一例を示したに過ぎないものであり、データソース1の生データあるいは提供データ中からテキストデータとして抽出可能な情報であれば、他の情報をメタデータとして生成するようにしても良い。このようにして生成されたメタデータは、メタデータ用I/F部25を介してメタデータサーバ4に与えられ、登録される。
【0036】
データ生成制御部23は、上記提供データ生成部21による提供データの生成処理、および上記メタデータ生成部22によるメタデータの生成処理を制御するものである。このデータ生成制御部23は、生成対象指定部26、時限情報付加部27およびセキュリティ情報付加部28を備えている。
【0037】
上記生成対象指定部26は、データソース1の生データ上で提供データを生成する対象、あるいはメタデータを生成する対象をユーザが任意に指定するためのものである。例えば、提供データ生成部21により提供データを生成する場合、複数ある生データのうちどれを用いて提供データを生成するか、あるいは生データ内のどの部分を用いて提供データを生成するか等について、ユーザは生成対象指定部26を用いて任意に指定することが可能である。
【0038】
また、メタデータ生成部22によりメタデータを生成する場合、複数ある生データのうちどれを用いてメタデータを生成するか、生データ中に含まれるテキストデータのどの部分から単語やコメント文を抽出するか、あるいはその生データの作成日付、作者名、ファイル名等の各種情報のうちどの情報をメタデータとして抽出するかなどについて、ユーザは生成対象指定部26を用いて任意に指定することが可能である。また、OCRを用いて取り込んだ画像とその解説文とから成るデータのうち、どの部分をメタデータとして抽出するかについても任意に指定することが可能である。
【0039】
時限情報付加部27は、メタデータ生成部22により生成されるメタデータに対して、提供データの公開時期を制限する時限情報を付加するものである。例えば、「○○○まで公開」あるいは「○○○から公開」などの提供データの公開有効期限をメタデータに設定することが可能である。ここで、インターネットは世界中を繋ぐ広域なネットワークであるので、メタデータを生成あるいは利用する場所で時差が生じることがある。そこで、時限情報としては、グリニッジ標準時で標記すると良い。また、そのメタデータに対応する生データが時限到達前に消去された場合に、当該メタデータを自動的に消去するようにしても良い。
【0040】
セキュリティ情報付加部28は、メタデータ生成部22により生成されるメタデータに対して、提供データの提供先を制限するセキュリティ情報を付加するものである。例えば、「○○○のみアクセスを可能にする」などのアクセス権情報をメタデータに設定することが可能である。これにより、提供データを見せる範囲を、データソース1の提供側で任意に設定することが可能である。
【0041】
次いで、データサービスサーバ3は、上記提供データ生成部21により生成された提供データを登録して管理し、それをインターネット上のユーザ端末5に提供するものである。このデータサービスサーバ3は、本発明の提供データ管理手段に対応する。このデータサービスサーバ3は、データ生成部2とのI/F部31と、与えられた提供データを保持する提供データDB32とを備えている。そして、ユーザ端末5からのアクセスに応じて、要求された提供データを提供データDB32から取り出してユーザに提供し、あるいは提供データを用いて所定のサービスをユーザに提供する。
【0042】
また、メタデータサーバ(検索エンジン)4は、上記メタデータ生成部22により生成されたメタデータを登録して管理するものであり、本発明のメタデータ保持手段と検索手段とを備えている。すなわち、このメタデータサーバ4は、データ生成部2とのI/F部41、メタDB42および検索部43とを備えている。このメタデータサーバ4が備えるI/F部41とデータ生成部2が備えるメタデータ用I/F部25は、従来はメタデータ生成部が検索エンジン内に備えられていたのを(図6参照)検索エンジンの外部に出し、データソース1に近いところに設けたために必要となったものである。
【0043】
上記I/F部25,41は、メタデータに関して今最も注目されている標準仕様であるXML(eXtensible Markup Language)&RDF(Resource Description Framework)のフォーマットであれば受け入れるオープンなI/Fである。このようなI/Fを用いることにより、従来のようにテキストの提供データから生成されるメタデータだけでなく、本実施形態のメタデータ生成部22により様々な形式のデータから生成されるメタデータを全てメタDB42に登録することが可能となる。
【0044】
検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その結果をユーザ端末5に返すものである。例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0045】
本実施形態の検索部43は、上述のようなメタデータの検索処理を実行する際に、メタデータ中に時限情報やセキュリティ情報が含まれているかどうかを判定し、含まれている場合にはその時限情報やセキュリティ情報に従って検索を実行する。例えば、時限情報として「○○○まで公開」あるいは「○○○から公開」などの情報がメタデータ中に含まれていた場合は、そのメタデータが検索条件に合致していても、時限情報により許容されていない時期においては、対応するデータサービスサーバ3のURLを検索結果の中に含ませないようにする。
【0046】
また、「○○○のみアクセスを可能にする」などのアクセス権情報がメタデータ中に含まれていた場合は、ユーザ端末5から送られてくる検索要求中に含まれるユーザ情報とそのアクセス権情報とを照らし合わせる。そして、情報を公開する者として許可されたユーザ以外には、メタデータが検索条件に合致しても、それに対応するデータサービスサーバ3のURLを検索結果の中に含ませないようにする。
【0047】
なお、以上説明した図1の構成では、データソース1、データ生成部2、データサービスサーバ3、メタデータサーバ4およびユーザ端末5を1つずつ示しているが、インターネット上にはこれらが多数存在している。このとき、データソース1は、他の構成要素とネットワーク的に繋がっていても良いし、繋がっていなくても良い。
【0048】
次に、上記図1のように構成した本実施形態によるデータベース検索システムの動作を、以下に示す様々な具体例に沿って説明する。
まず最初に、簡単な例として、テキストデータのみから成るファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0049】
図2は、テキストデータのみから成るデータソース1を提供データ生成部21により加工して提供データを生成する様子を示す図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。図2(a)に示すように、データソース1は、複数のテキストファイルa1 〜an を含んでいる。それぞれのテキストファイルa1 〜an は、毎日の天気、気温、湿度をテキストデータの形で記述したものであるとする。
【0050】
提供データ生成部21は、これら複数のテキストファイルa1 〜an を用いて加工を施し、例えば図2(b)に示すように、気温や湿度の1ヵ月間の推移を表したグラフデータを生成する。このとき、この1ヵ月間の天候を要約したコメント文として、例えば「1月は晴れが多く、気温の平均は8℃」のようなテキストデータを追加するようにしても良い。このようにして生成された提供データファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0051】
一方、メタデータ生成部22は、データソース1から図2(a)に示すような複数のテキストファイルa1 〜an を読み取り、それぞれのテキストファイルa1 〜an 中にタグが含まれていれば(テキストファイルa1 〜an がHTML形式の場合)、そのタグを除去する。そして、各テキストファイルa1 〜an 中からメタデータを抽出する。例えば、図2(a)に示した例の場合、“晴”“曇”“雨”などの単語、“10℃”“6℃”“7℃”などの気温、“60%”“50%”“70%”などの湿度をメタデータとして抽出することが可能である。
【0052】
さらに、メタデータ生成部22は、各テキストファイルa1 〜an の付加情報をメタデータとして抽出することも可能である。付加情報とは、各テキストファイルa1 〜an のファイル名、作成日、サイズ、拡張子等の属性情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などを示す。例えば、あるテキストファイルai が元々複数のファイルai-1 ,ai-2 ,ai-3 ,…から作られたものである場合には、その元のファイルファイルai-1 ,ai-2 ,ai-3 ,…の情報をもメタデータとして抽出することが可能である。
【0053】
上記メタデータ生成部22は、データソース1である各テキストファイルa1 〜an の他に、提供データ生成部21により生成された図2(b)のような提供データファイルAを読み取り、その中からもメタデータを抽出する。例えば、図2(b)に示した例の場合、“1月”“晴れ”などの単語、“8℃”などの気温、「1月は晴れが多く、気温の平均は8℃」のようなコメント文そのものをメタデータとして抽出することが可能である。提供データファイルAのファイル名や作成日などをメタデータとして抽出することも可能である。
【0054】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。例えば、どの生データからメタデータを抽出するか、生データに含まれるテキストデータのどの部分からメタデータを抽出するか、あるいはその生データのファイル名、作成日、作者名等の属性情報のうちどの情報をメタデータとして抽出するかなどについて、ユーザは生成対象指定部26を用いて任意に指定することが可能である。
【0055】
また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して、提供データの公開に関する時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対して、提供データへのアクセスに関するセキュリティ情報を付加することも可能である。
【0056】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0057】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0058】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図2(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0059】
以上のように、本実施形態のデータベース検索システムにおいては、データソース1の提供者とは別の場所で運営されることが多いメタデータサーバ4からメタデータ生成部22を分離し、これをデータソース1の提供者側に設けているので、従来のように提供データからだけでなく、その提供データを生成する元となった生データからもメタデータを生成することができる。
【0060】
また、本実施形態によれば、生データに対する付加情報もメタデータとして抽出することができる。この生データやその付加情報は、データソース1を作成したユーザが知り得る情報である。したがって、本実施形態のようにメタデータ生成部22をデータソース1の提供者側に設けることで、データソース提供者が生成対象指定部26を用いて抽出条件を適当に設定することにより、生データとの関連性が高い情報をメタデータに含ませることができる。
【0061】
これにより、例えば所望の単語を含む情報を探し出したい場合に、加工された提供データ中には含まれていない単語であっても、生データ中に含まれていた単語がメタデータとして抽出されていれば、その単語をキーワードとして検索した場合に該当するデータサービスサーバ3のURLを確実に得ることができ、検索結果内にユーザが望む情報をより的確に反映することができる。
【0062】
例えば図2の例で、従来であれば“1月”“晴れ”などの単語、“8℃”などの気温、“A”などのファイル名、“990201”などの提供データファイルAの作成日をキーワードとした場合にのみメタデータの検索条件が合致していた。これに対して本実施形態によれば、これ以外にも、“曇”“雨”などの単語、“10℃”“6℃”“7℃”などの気温、“60%”“50%”“70%”などの湿度、各テキストファイルa1 〜an のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。
【0063】
この場合、例えば“10℃”の気温をキーワードとして検索を行い、その検索結果として得られたURLを頼りにデータサービスサーバ3にアクセスした場合に、その要求に対する応答としてユーザ端末5の表示画面に表示されるのは、図2(b)のような提供データである。この図2(b)の画面上には“10℃”という文字は見当たらないが、気温が“10℃”に当たる部分がグラフ中に含まれており、これもユーザがキーワードとして与えた情報を含んだ情報である。このように本実施形態によれば、提供データだけからは得られないメタデータの抽出によって、一見すると見逃しがちなデータサービスサーバ3のURLも確実に検索結果として得ることができ、検索洩れを少なくすることができる。
【0064】
また、本実施形態では、生成対象指定部26を用いてメタデータを抽出する対象部分をユーザが任意に指定できるようにしているので、メタデータの生成対象をデータソース1の提供者側で任意に設定することが可能となり、ユーザから与えられる検索条件に合致させるあるいは合致させないメタデータをデータソース1の提供者側で自由に決めることができるようになる。また、メタデータを生成する際に、生データ等から不要な情報を無闇に取得しなくても済むようになる。
【0065】
また、本実施形態では、時限情報付加部27を用いてメタデータに対して時限情報を付加することができるようにしているので、データソース1から生成される提供データを公開する時期や期間をデータソース1の提供者が任意に設定することができる。また、本実施形態では、セキュリティ情報付加部28を用いてメタデータに対してセキュリティ情報を付加することができるようにしているので、データソース1から生成される提供データを公開する相手をデータソース1の提供者が任意に設定することができる。
【0066】
次に、別の例として、画像データのみから成るファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0067】
図3は、あるテーマについての画像ファイルがデータソース1としてn枚存在し、提供データ生成部21がこれらn枚の画像をそれぞれ縮小して1画面中にタイル状に配置した一覧表示ファイルAを提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。
【0068】
図3(a)に示すように、データソース1は、複数の画像ファイルa1 〜an を含んでおり、それぞれにファイル名、作成日などの属性情報が与えられている。提供データ生成部21は、データソース1からこれら複数の画像ファイルa1 〜an を読み取り、図3(b)に示すように、各画像を縮小してタイル状に並べた一覧表示ファイル(サムネイル)Aを提供データとして生成する。このようにして生成された一覧表示ファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0069】
一方、メタデータ生成部22は、データソース1から複数の画像ファイルa1 〜an を読み取る。そして、読み取った各画像ファイルa1 〜an のファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などをメタデータとして抽出する。
【0070】
上記メタデータ生成部22は、データソース1である各画像ファイルa1 〜an の他に、提供データ生成部21により生成された提供データである図3(b)のような一覧表示ファイルAを読み取り、その中からもメタデータを抽出する。例えば、図3(b)に示した例の場合、一覧表示ファイルAのファイル名や作成日などの属性情報、各画像を集めたテーマ名が与えられていればそのテーマ名などをメタデータとして抽出する。
【0071】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0072】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0073】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0074】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図3(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0075】
従来であれば、提供データ生成部21により提供データとして生成された一覧表示ファイルAの“A”というファイル名、“991105”という一覧表示ファイルAの作成日、あるいはテーマ名などを検索条件としたときのみメタデータが検索条件にヒットしていた。
【0076】
これに対して本実施形態によれば、これ以外にも、元画像ファイルa1 〜an のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。これにより、複数の画像ファイルa1 〜an をまとめて生成した一覧表示ファイルAだけが提供データとして公開されている場合に、個々の画像データa1 〜an に関する情報を検索条件として検索を行っても該当する情報を確実に得ることができる。つまり、検索結果内にユーザが望む情報をより的確に反映することができ、検索洩れを少なくすることができる。
【0077】
次に、さらに別の例として、画像データとテキストデータとが混在したファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0078】
図4は、n個の画像データa1 〜an に対してそれぞれコメント文がテキストデータb1 〜bn の形で付されたファイルをもとに、画像データa1 〜an の部分をそれぞれ縮小して1画面中にタイル状に配置した一覧表示ファイルAを提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。コメント文は、例えば画像の作者名、その画像の分野、解説などである。
【0079】
提供データ生成部21は、図4(a)に示すデータソース1から複数の画像テキスト混合ファイルa1 +b1 〜an +bn を読み取り、図4(b)に示すように、その中に含まれる各画像データa1 〜an を縮小してタイル状に並べた一覧表示ファイル(サムネイル)Aを提供データとして生成する。このようにして生成された一覧表示ファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0080】
一方、メタデータ生成部22は、データソース1から複数の画像テキスト混合ファイルa1 +b1 〜an +bn を読み取る。そして、読み取った各ファイルa1 +b1 〜an +bn 中に含まれるテキストデータb1 〜bn からメタデータを抽出する。さらに、メタデータ生成部22は、各ファイルa1 +b1 〜an +bn のファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などもメタデータとして抽出する。
【0081】
上記メタデータ生成部22は、データソース1である各画像テキスト混合ファイルa1 +b1 〜an +bn の他に、提供データ生成部21により生成された提供データである図4(b)のような一覧表示ファイルAを読み取り、その中からもメタデータを抽出する。例えば、図4(b)に示した例の場合、一覧表示ファイルAのファイル名や作成日などの属性情報、各画像を集めたテーマ名が与えられていればそのテーマ名などをメタデータとして抽出する。
【0082】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0083】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0084】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0085】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図4(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0086】
従来であれば、提供データ生成部21により提供データとして生成された一覧表示ファイルAの“A”というファイル名、“991105”という一覧表示ファイルAの作成日、あるいはテーマ名などを検索条件としたときのみメタデータが検索条件にヒットしていた。
【0087】
これに対して本実施形態によれば、これ以外にも、画像の作者名、分野、解説などのコメント文に含まれる単語、あるいは元ファイルa1 +b1 〜an +bn のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。これにより、一覧表示ファイルAだけが提供データとして公開されている場合に、個々の画像データa1 〜an に関する情報や、それに対応して付されたテキストデータb1 〜bn に関する情報を検索条件として検索を行っても該当する情報を確実に得ることができる。つまり、検索結果内にユーザが望む情報をより的確に反映することができ、検索洩れを少なくすることができる。
【0088】
以上図2〜図4に示した例では、提供データ生成部21により、データソース1として存在する複数の生データファイルから1つの提供データファイルを生成する場合を例にとって説明した。以下に示す図5の例では、これとは逆に、テキストデータとして様々な情報を含む1つのファイルがデータソース1として与えられ、この1つの生データファイルから複数の提供データファイルを生成する場合のメタデータの生成について説明する。
【0089】
図5は、複数の情報x11,x12,x21,x30,…を含む1つのテキストファイルxをもとに、提供データ生成部21が必要な情報を取り出して2つのテキストファイルX1 ,X2 を提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。
【0090】
この場合、提供データ生成部21は、図5(a)に示すデータソース1から1つのテキストファイルxを読み取り、図5(b)に示すように、その中に含まれる各情報を適宜取り出して2つの提供データファイルX1 ,X2 を提供データとして生成する。図5の例では、テキストファイルxから情報x11,x12,x30,…を取り出して提供データファイルX1 を生成し、テキストファイルxから情報x21,x30,…を取り出して提供データファイルX2 を生成している。
【0091】
このようにして生成された提供データファイルX1 ,X2 は、それぞれI/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。このとき、上記2つの提供データファイルX1 ,X2 は、異なるデータサービスサーバ3上に登録されることもある。
【0092】
一方、メタデータ生成部22は、データソース1から1つテキストファイルxを読み取る。そして、読み取ったテキストファイルx中に含まれる情報からメタデータを抽出する。この場合、x11,x12,x21,x30,…などの個々の情報をメタデータとして抽出することが可能である。さらに、メタデータ生成部22は、上記テキストファイルxのファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などもメタデータとして抽出する。
【0093】
上記メタデータ生成部22は、データソース1であるテキストファイルxの他に、提供データ生成部21により生成された図5(b)のような提供データファイルX1 ,X2 を読み取り、その中からもメタデータを抽出する。例えば、図5(b)に示した例の場合、一方の提供データファイルX1 からx11,x12,x30,…などの情報をファイルX1 用のメタデータとして抽出する。また、他方の提供データファイルX2 からx21,x30,…などの情報をファイルX2 用のメタデータとして抽出する。さらに、メタデータ生成部22は、各提供データファイルX1 ,X2 のファイル名や作成日などの属性情報などもメタデータとして抽出する。
【0094】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0095】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0096】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0097】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図5(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0098】
このとき、例えば“x11”の情報をキーワードとして検索をかけると、メタDB42内には“x11”というメタデータが登録されているので検索条件にヒットする。この場合は、その“x11”の情報を含む提供データファイルX1 を管理しているデータサービスサーバ3のURLが検索結果として返される。また、“x30”の情報をキーワードとして検索をかけた場合も検索条件にヒットするが、この場合は、その“x30”の情報は2つの提供データファイルX1 ,X2 の双方に含まれている。
【0099】
この場合は、例えばセキュリティ情報付加部28によりメタデータに付加されたセキュリティ情報によって検索者へのアクセスが許可されている方の提供データファイルを管理しているデータサービスサーバ3のURLを検索結果として返すようにすることが可能である。また、両方ともアクセスが許可されている場合は、提供データファイルX1 ,X2 を管理しているデータサービスサーバ3のURLを共に検索結果として返すようにする。
【0100】
このように、本実施形態のデータベース検索システムによれば、図2〜図4のようにデータソースと提供データとがn:1の関係にあるときだけでなく、図5のようにデータソースと提供データとが1:mの関係にあるときにも、生データからメタデータを生成することができる。もちろん、データソースと提供データとがn:mの関係にあるときにも、生データからメタデータを生成することが可能である。すなわち、従来は1つのデータソースからは1つの体系のメタデータしか生成できなかったが、本実施形態によれば、複数個のデータソースから複数個のメタデータ体系を生成することができるようになる。
【0101】
なお、以上の説明では、データソース1がテキストデータ、画像データあるいはその混合データである場合について説明したが、データソース1は音声データ、CGデータ等の他の形式のデータであっても良い。
【0102】
また、1つのトップページから階層的に複数のサブページを持たせたホームページにおいては、実際のサービスの内容はトップページよりもサブページの方に記述されていることが多い。そこで、各サブページの生データ中からメタデータを抽出し、それをホームページ全体のメタデータとしてメタDB42に登録しておくようにしても良い。
【0103】
このようにすれば、検索ロボットがトップページよりも下の階層のサブページには入れないようにセキュリティが設定されていても、サブページに記述された内容をキーワードとした検索によって該当するページのURLを得ることができる。この場合、提供データとしてトップページや所望のサブページを設定しておけば、検索条件に合致したキーワードが含まれるサブページがどれであるかに関わらず、最初は提供データとして指定したページを必ず開くような仕組みを提供することができる。
【0104】
また、本実施形態では、特定のアプリケーションで作成されたデータの中身をメタデータとして抽出するようにしても良い。例えば、URLが“http://www.ei.nsc.co.jp/...../991101.doc”である場合、従来であればこのファイルの中身までは検索できないが、メタデータの登録時にこのファイルの中身の文書からメタデータを抽出して登録しておくことにより、ファイルの中身の情報をキーワードとして検索することができる。
【0105】
また、上記図1の構成において、メタデータ生成部22をメタデータサーバ4内に設けることも可能であるが、この場合にはデータ生成部2からメタデータサーバ4に対して生データそのものを送る必要がある。これに対して、図1に示したようにメタデータ生成部22をデータ生成部2内に設ければ、生データ自体をメタデータサーバ4に送る必要がなく、通信トラフィックを小さく抑えることができる。また、データソース1にアクセスして提供データ生成部21により提供データを生成する際にメタデータも生成することができ、提供データの生成とメタデータ生成とを効率的に行うことができる。
【0106】
以上に説明した本実施形態のデータベース検索システムは、コンピュータのCPUあるいはMPU、RAM、ROMなどで構成されるものであり、RAMやROMに記憶されたプログラムが動作することによって実現できる。したがって、コンピュータが上記機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものである。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フロッピーディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
【0107】
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。
【0108】
上記に説明した実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその精神、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0109】
【発明の効果】
本発明は上述したように、メタデータ保持手段(メタデータサーバ)からメタデータ生成手段を分離し、これをデータソースの近くに設けてメタデータをデータソースの生データ自体から生成するようにしたので、従来のように提供データからだけでなく、その提供データを生成する元となった生データからもメタデータを得ることができる。これにより、生データとの関連性が高い情報をメタデータに含ませることができ、このメタデータを用いた検索結果の中にユーザが望む情報をより的確に反映させることができる。したがって、所望の情報を含む提供データ管理手段(データサービスサーバ)の所在情報をより確実に検索結果として得ることができるようになり、検索洩れを少なくすることができる。
【0110】
また、本発明の他の特徴によれば、データソースの生データからメタデータを抽出する対象を指定するための生成対象指定手段を設けたので、メタデータの生成対象をデータソースの提供者側で任意に設定することが可能となり、ユーザから与えられる検索条件に合致させるあるいは合致させないメタデータをデータソース提供者側で自由に決めることができるようになる。
【0111】
また、本発明のその他の特徴によれば、提供データの公開に関する時限情報をメタデータに付加する時限情報設定手段を設けたので、提供データの公開を許可する時期や期間以外では、与えられた検索条件自体には合致していても、提供データ管理手段(データサービスサーバ)の所在情報を検索結果として出力しないようにすることができ、提供データを公開する時期や期間をデータソースの提供者が任意に設定することができる。
【0112】
また、本発明のその他の特徴によれば、提供データへのアクセスに関するセキュリティ情報をメタデータに付加するセキュリティ情報設定手段を設けたので、提供データへのアクセスを許可するユーザ以外には提供データ管理手段(データサービスサーバ)の所在情報を検索結果として出力しないようにすることができ、提供データを公開するユーザをデータソースの提供者が任意に設定することができる。
【図面の簡単な説明】
【図1】ロボット型検索エンジンを用いた本実施形態によるデータベース検索システムの構成例を示すブロック図である。
【図2】テキストデータのみから成るデータソースを加工して提供データを生成する様子を示す図である。
【図3】画像データのみから成るデータソースを加工して提供データを生成する様子を示す図である。
【図4】テキストデータと画像データとが混在したデータソースを加工して提供データを生成する様子を示す図である。
【図5】複数の情報を含む1つのテキストファイルを加工して複数の提供データを生成する様子を示す図である。
【図6】ロボット型検索エンジンを用いた従来のデータベース検索システムの構成例を示すブロック図である。
【符号の説明】
1 データソース
2 データ生成部
3 データサービスサーバ
4 メタデータサーバ(検索エンジン)
5 ユーザ端末
21 提供データ生成部
22 メタデータ生成部
23 データ生成制御部
24 提供データ用I/F部
25 メタデータ用I/F部
26 生成対象指定部
27 時限情報付加部
28 セキュリティ情報付加部
31 提供データ用I/F部
32 提供データDB
41 メタデータ用I/F部
42 メタDB
43 検索部

Claims (11)

  1. 少なくとも1つの生データをデータソースから読み出して提供データを生成する提供データ生成手段と、
    上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成するメタデータ生成手段と、
    上記メタデータを保持するメタデータ保持手段と、
    上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する提供データ管理手段と、
    ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す検索手段と
    を備えたことを特徴とするデータベース検索システム。
  2. 上記メタデータ生成手段と上記メタデータ保持手段との間をつなぐ通信インタフェースを、上記メタデータに関する標準仕様に基づくインタフェースにより構成したことを特徴とする請求項1に記載のデータベース検索システム。
  3. 上記メタデータ生成手段により上記データソースの生データから上記メタデータを抽出する対象を指定するための生成対象指定手段を備えたことを特徴とする請求項1または2に記載のデータベース検索システム。
  4. 上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データの公開に関する時限情報を付加する時限情報設定手段を備えたことを特徴とする請求項1〜3の何れか1項に記載のデータベース検索システム。
  5. 上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データへのアクセスに関するセキュリティ情報を付加するセキュリティ情報設定手段を備えたことを特徴とする請求項1〜4の何れか1項に記載のデータベース検索システム。
  6. ユーザ端末とネットワークで接続され、提供データ生成手段、メタデータ生成手段、メタデータ保持手段、提供データ管理手段及び検索手段を有したデータベース検索システムにおいて前記ユーザ端末からの要求に応じてデータを検索するデータベース検索方法であって、
    上記提供データ生成手段が、少なくとも1つの生データをデータソースから読み出して提供データを生成する工程と、
    上記メタデータ生成手段が、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成する工程と、
    上記メタデータ保持手段が、上記メタデータを保持する工程と、
    上記提供データ管理手段が、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する工程と、
    上記検索手段が、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す工程と、
    を有することを特徴とするデータベース検索方法。
  7. 上記データソースの生データから上記メタデータを抽出する対象を指定可能としたことを特徴とする請求項6に記載のデータベース検索方法。
  8. 上記生成されるメタデータに対して、上記提供データの公開に関する時限情報を付加することを可能としたことを特徴とする請求項6または7に記載のデータベース検索方法。
  9. 上記生成されるメタデータに対して、上記提供データへのアクセスに関するセキュリティ情報を付加することを可能としたことを特徴とする請求項6〜8の何れか1項に記載のデータベース検索方法。
  10. 請求項1〜5の何れか1項に記載のデータベース検索システムの各手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
  11. 請求項6〜9の何れか1項に記載のデータベース検索方法の処理手順をコンピュータに実行させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP33170399A 1999-11-22 1999-11-22 データベース検索システムおよび方法、記録媒体 Expired - Fee Related JP3939477B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33170399A JP3939477B2 (ja) 1999-11-22 1999-11-22 データベース検索システムおよび方法、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33170399A JP3939477B2 (ja) 1999-11-22 1999-11-22 データベース検索システムおよび方法、記録媒体

Publications (2)

Publication Number Publication Date
JP2001147941A JP2001147941A (ja) 2001-05-29
JP3939477B2 true JP3939477B2 (ja) 2007-07-04

Family

ID=18246653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33170399A Expired - Fee Related JP3939477B2 (ja) 1999-11-22 1999-11-22 データベース検索システムおよび方法、記録媒体

Country Status (1)

Country Link
JP (1) JP3939477B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4496672B2 (ja) * 2001-06-06 2010-07-07 日本ビクター株式会社 画像情報記録装置及び画像情報記録システム
JP4168606B2 (ja) * 2001-06-28 2008-10-22 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
JP2003036333A (ja) * 2001-07-24 2003-02-07 Japan Science & Technology Corp 国間の災害情報提供システム
JP4002150B2 (ja) * 2002-07-30 2007-10-31 ソニー株式会社 情報通信装置及び情報通信方法、情報交流・人間関係形成支援システム及び情報交流・人間関係形成支援方法、並びにコンピュータ・プログラム
US7603620B2 (en) * 2004-12-20 2009-10-13 Ricoh Co., Ltd. Creating visualizations of documents

Also Published As

Publication number Publication date
JP2001147941A (ja) 2001-05-29

Similar Documents

Publication Publication Date Title
US7725451B2 (en) Generating clusters of images for search results
US6883001B2 (en) Document information search apparatus and method and recording medium storing document information search program therein
US7072983B1 (en) Scheme for systemically registering meta-data with respect to various types of data
CN101452470B (zh) 摘要式网络搜索引擎***及其搜索方法与应用
JP5105802B2 (ja) 情報処理装置
US7617195B2 (en) Optimizing the performance of duplicate identification by content
US6401118B1 (en) Method and computer program product for an online monitoring search engine
US7401078B2 (en) Information processing apparatus, document search method, program, and storage medium
KR101653268B1 (ko) 태그 정보의 처리방법 및 이를 구현하는 클라이언트-서버시스템
US20060218245A1 (en) Method, system, and computer program product for distributing a stored URL and web document set
JP5121194B2 (ja) 組織内情報検索システム及び組織内情報検索プログラム
JP2009500719A (ja) 画像によるクエリ探索(query−by−imagesearch)及び検索システム
WO2002101588A1 (fr) Systeme de gestion de contenus
US20080068651A1 (en) Methods and apparatuses for publication of unconsciously captured documents
JP2006309515A (ja) 情報配信方法および情報配信サーバ
JP2003519844A (ja) スタイルシートに基づいて構造化されたドキュメントのインデックスを作成する方法および装置
US20110252313A1 (en) Document information selection method and computer program product
US20060143242A1 (en) Content management device
JP5447484B2 (ja) 情報処理装置
JP3939477B2 (ja) データベース検索システムおよび方法、記録媒体
US20060116992A1 (en) Internet search environment number system
JPH11143885A (ja) 情報検索方法及び装置及び情報検索プログラムを格納した記憶媒体及び情報発信方法及び装置及び情報発信プログラムを格納した記憶媒体
JP2008102790A (ja) 検索システム
JP2008234403A (ja) データ検索方法、プログラム及び装置
Shen et al. Publishing distributed files as Linked Data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060919

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070328

R150 Certificate of patent or registration of utility model

Ref document number: 3939477

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110406

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120406

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140406

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees