JP3693958B2 - 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 - Google Patents

分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP3693958B2
JP3693958B2 JP2002002669A JP2002002669A JP3693958B2 JP 3693958 B2 JP3693958 B2 JP 3693958B2 JP 2002002669 A JP2002002669 A JP 2002002669A JP 2002002669 A JP2002002669 A JP 2002002669A JP 3693958 B2 JP3693958 B2 JP 3693958B2
Authority
JP
Japan
Prior art keywords
search
integrated
search server
version
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002002669A
Other languages
English (en)
Other versions
JP2002366547A (ja
Inventor
光昭 稲葉
祐司 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2002002669A priority Critical patent/JP3693958B2/ja
Priority to EP02006903A priority patent/EP1248208A3/en
Priority to US10/115,261 priority patent/US20020161753A1/en
Priority to CNB021060347A priority patent/CN100489842C/zh
Publication of JP2002366547A publication Critical patent/JP2002366547A/ja
Application granted granted Critical
Publication of JP3693958B2 publication Critical patent/JP3693958B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は分散型文書検索方法及び装置、とりわけ文書検索を効率良く且つ高速で行なうことができる分散型文書検索方法及び装置に関するものである。
【0002】
【従来の技術】
従来の文書検索装置としては、例えば特開平9−319757号公報或いは特開平10−21250号公報に記載されたものがある。特開平9−319757号公報の文書検索装置は、各検索サーバで閉じたスコア計算とランキングを行い、各々上位M件を返すようにしたものである。
【0003】
また、特開平10−21250号公報の文書検索装置は、1つ以上のサーチエンジンを用いて、1つ以上のサーバから利用可能な複数個のデータベースを使用する文献検索の方法を提供するものである。
【0004】
【発明が解決しようとする課題】
しかしながら、上記のような従来の技術においては、特開平9−319757号公報の文書検索装置の技術ではランキング結果が不正確である不具合がある。また、特開平10−21250号公報の文書検索装置の技術では、スコア計算、ランキング結果は正確だが、各検索サーバがヒットした全レコードの情報を返すので効率が悪く、非現実的であるという不具合がある。
【0005】
本発明は、上記従来の問題点に鑑みてなされたもので、その目的は、文書検索を行なうに当たって効率的かつ正確な検索文書間のランキングを行ない、文書検索の品質を向上させることのできる文章検索方法及びそれを用いた分散型文書検索方法及び装置を提供することである。
【0006】
【課題を解決するための手段】
本発明は上記目的を達成するため、複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索を行なう分散型文書検索方法として、各検索サーバは、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付し、統合検索サーバでは、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基にスコアを計算し、各々検索条件に合致した検索結果を統合検索サーバに返送し、前記検索サーバは、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、統合検索サーバでは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するようにしたものである。これにより文書検索に際してより確実で効率的な文書検索を行なうことができるものである。
【0007】
本発明はまた、分散型文書検索装置として、複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとから成り、前記検索サーバは、データベースに対して検索動作を行なう検索手段と、検索の結果得られた中間結果を保持する手段と、中間結果から統計情報を作成出力する統計情報出力手段と、検索した各文書に対してスコアを付けるスコア算出手段とを備え、また、前記統合検索サーバは、複数の検索サーバから送付された統計情報を集計する統計情報集計手段を備え、前記統合検索サーバで大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基に正確なスコアを計算し、各々検索条件に合致した検索結果を統合検索サーバに返送し、前記統合検索サーバは、前記統計情報集計手段によって集計した統計情報を基に統合版を作成する手段と、前記統合版の更新を行なう統合版更新手段と、前記統合版の管理を行なう統合版管理手段とを備え、前記検索サーバは、前記データベースの版の更新を行なう版更新手段と、版の管理を行なう版管理手段とを備え、前記版管理手段は、検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、前記統合検索サーバは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付する構成とした。これにより動作が簡潔且つ高速にでき、文書検索に際してより確実で効率的な文書検索を行なうことができるものである。
【0008】
本発明はさらに、複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索を実行させるために、各検索サーバに、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付させるステップと、統合検索サーバに、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付させるステップと、各検索サーバに前記大域的な統計情報を基にスコアを計算させ、各々検索条件に合致した検索結果を統合検索サーバに返送させるステップと、前記検索サーバに、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付するステップと、統合検索サーバに、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するステップと、を含む処理を実行させるようにした分散型文書検索プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体とした。これにより文書検索に際してより確実で効率的な文書検索を行なうことができるものである。
【0009】
(実施の形態1)
以下、本発明の実施の形態について図面を参照して説明する。図1は本発明の第1の実施の形態に係る分散型文書検索装置の構成を示すブロック図である。図1において、1は統合検索サーバ、2は検索サーバであり、この実施の形態においては複数の検索サーバ2a、2bが設けられている。3はクライアントであり、文書検索の要求を出力し、また文書検索の結果を受け取る。統合検索サーバ1と検索サーバ2とは互いに通信接続されて文書検索のデータの送受を行なうようになっている。検索サーバ2a、2bは、個々に、大量の文書を格納するデータベースを備えており、それぞれのデータベースに格納されている文書に対して文書検索を実行する。統合検索サーバ1は複数の検索サーバ2から送付されてきた文書検索結果を集計し全体的な文書検索結果をクライアント(ユーザ)に対して提示するようになっている。
【0010】
図1の統合検索サーバ1において、11はクライアント3からのコマンドを受け取って検索条件を入力する検索条件入力手段、12は入力された検索条件を検索サーバ2へ送出する検索条件送信手段、13は検索サーバ2から送付されてきた統計情報を受け取って集計する統計情報集計手段、14は検索サーバ2から送付されてきた検索結果を所定の規則にしたがって並べ替える検索結果並べ替え手段、15は検索結果をクライアント3に対して送付する検索結果出力手段である。また、16は統計集計手段13において得られた集計結果から検索結果の統合版を更新する統合版更新手段、17は統合版を管理する統合版管理テーブル、18は統合版を参照してその結果を検索条件送信手段12に出力する統合版参照手段である。なお、統合版管理テーブル17は、統合検索サーバ1におけるメモリのデータ格納領域である。
【0011】
また、図1の検索サーバ2(2aを代表させるが、2bにおいても同じ構成である)において21は統合検索サーバ1からの検索条件を受け取って自己の検索条件を入力する検索条件入力手段、22は入力された検索条件にしたがって文書検索動作を実行する検索手段、23は大量の文書を格納するデータベース、24は検索手段22によって検索を行なった結果得られた文書検索の途中の結果である中間結果、25は中間結果24に基づいて各検索された文書に対してスコアを計算するスコア算出手段、26はスコア算出手段25によるスコア計算の結果に基づいて検索結果を並べ替える検索結果並べ替え手段、27は検索結果を統合検索サーバ1に対して送付する検索結果出力手段である。また、28は中間結果24から統計情報を作成しこの統計情報を統計検索サーバ1に対して送付する統計情報出力手段、29は検索サーバ2aにおける検索結果の版を管理する版管理テーブル、30は版を参照してその結果を検索手段22に出力する版参照手段、31は版管理テーブル29の内容を更新する版更新手段、32は中間結果が変更されたときに変更前の中間結果を解放する中間結果解放手段である。なお、中間結果24および版管理テーブル29は、それぞれ検索サーバ2aにおけるメモリのデータ格納領域である。
【0012】
以下、本発明実施の形態にかかる構成を有する分散型文書検索装置による文書検索動作について説明する。
【0013】
図2は文書検索処理動作を行なうに当たってのクライアント3、統合検索サーバ1、検索サーバ2aおよび検索サーバ2b間における動作手順を表すシーケンス図である。先ずクライアント3から統合検索サーバ1に対して検索要求41aが出力される。この実施の形態において、上記検索要求はこの分散型文書検索装置のシステムにおいては統合データベースCに対する最初の検索要求である。また、統合データベースCは検索サーバ2a上のデータベースA23aと検索サーバ2b上のデータベースB23bを仮想的につなげたもので、実際のデータベースがあるわけではない。図3は本実施の形態における検索要求41a〜41cのデータ構成を示す図である。このデータ構成図から明らかなように、検索要求41aの内容は、
検索対象:統合データベースC
検索式:携帯or電話or液晶
取得件数:20件
統合版名:−−
である。ここで、「検索対象:統合データベースC」とは、ユーザが統合データベースCを検索対象にしていることを示す。「検索式:携帯or電話or液晶」とは、この表記による検索式で検索を行なうことの要求である。また、「取得件数:20件」とは、文書スコアの高い順にランキングした上位20件を取得したいという要求である。また「統合版名」についてはこの検索要求41aでは指定されていない。
【0014】
上記検索要求41aを受け取った統合検索サーバ1は、検索条件入力手段11において検索条件を入力し、統合版参照手段18により統合版管理テーブル17の統合版データを参照した後、検索条件送信手段12によりさらなる検索要求41a、41cを検索サーバ2aおよび検索サーバ2bに送付する。このとき、統合検索サーバ1における統合データベースCへの検索要求はまだ一度も来ていないので統合版データは存在していない。したがって検索サーバ2aおよび2bには版名を指定しない検査要求41b、41cのデータが送信される。具体的には、検索サーバ2aへ送付される検索要求41bのデータは、図3から明らかなように、
検索対象:データベースA
検索式:携帯or電話or液晶
取得件数:20件
版名:−−
であり、また、検索サーバ2bへ送付される検索要求41cのデータは、図3から明らかなように、
検索対象:データベースB
検索式:携帯or電話or液晶
取得件数:20件
版名:−−
である。
【0015】
検索サーバ2aおよび2bにおいては、上記検索条件を検索条件入力手段21において入力し、検索動作42として、検索手段22によりデータベースA(検索サーバ2aの場合)およびデータベースB(検索サーバ2bの場合)に対する検索を実行する。検索サーバ2aと2bは並列処理により検索動作42を実行する。検索サーバ2aでは、この検索動作42に際して、版参照手段30が版管理テーブル29を参照して、データベースA23aの最新版の版名が0315であり、また総文書数が30000であることを知る。次に、検索手段22がこの版のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。
【0016】
図4は上記中間結果24のデータ内容の一例を示す図である。この図から、検索サーバ2aでは上記検索条件の下で検索した結果、検索された文書として、文書番号が3,5,24,・・・・,29230の文書がヒットしたことが分かる。ここで、文書番号が「3」の文書についてみると、この文書中では、「携帯」の語句が1箇所存在し、「電話」の語句が2箇所存在し、「液晶」の語句が0箇所存在することが分かる。文書番号が「5」以下の文書についても同様の内容が示されている。この中間結果を基に統計情報出力手段28が各検索語についての出現文書数を集計し統計情報を作成する。図5は、上記統計情報出力手段28が集計して求めた各検索語の出現文書数を表す図である。この図から明らかなように、上記中間結果として集められた文書のうち、「携帯」の語句が出現する文書数は125であり、「電話」の語句が出現する文書数は893であり、「液晶」の語句が出現する文書数は650である。ここで、出現文書の「数」とは、各検索語についてその語句が1回でも出現した文書の数を意味し、その文書中での出現回数が1回でも複数回でもカウントは「1」である。
【0017】
次に、統計情報出力手段28は、上記統計情報を、検索に使用した最新版の情報(版名が0315、総文書数が30000)とともに、統合検索サーバ1に返す。その後、検索サーバ2aにおいては、統合検索サーバ1で求められた大域的な統計情報が送られてくるまで待つ。
【0018】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行される。図2に示すように、検索サーバ2bは、検索サーバ2aの場合と同様の検索条件の下で検索した結果、検索サーバ2bはデータベースB(23bとする)の最新版の版名が0628であり、また総文書数が40000であることを知る。また、検索動作42により検索された文書を基に作成した中間結果から、「携帯」の語句が出現する文書数は164であり、「電話」の語句が出現する文書数は320であり、「液晶」の語句が出現する文書数は220であることが分かる。
【0019】
統合検索サーバ1は、検索サーバ2aおよび2bから統計情報を受け取ると、統計情報集計動作43を行なう。この動作では、統計情報集計手段13が検索サーバ2a、検索サーバ2bから返った各検索語の出現文書数を加算(すなわち、集計)し、統合データベースCにおける各検索語の出現文書数を算出する。次に、統合検索サーバ1は、上記集計結果に基づいて統合版管理テーブル更新動作44を行なう。この統合版管理テーブル更新動作44においては、統合版更新手段16が、統合版管理テーブル17に統合データベースCの統合版0001を登録する。上述したように、検索開始時点では統合検索サーバ1の統合データベースCの統合版データは存在していなかった。したがってこの時点で統合版管理テーブル17に統合データベースCの統合版0001が初めて登録される。
【0020】
この登録処理により、統合版管理テーブル17には、統合データベースCの統合版0001を構成するデータベースA23aの版名0315とデータベースB23bの版名0628、およびそれぞれの総文書数の情報が格納される。図6はその上段に、上記のようにして統合版管理テーブル17に登録された統合版0001のデータを示す図である(下段のデータは後の処理により作成されるデータである)。統合検索サーバ1は、このようにして求めた、統合データベースCの統合版0001の総文書数と、各検索語の出現文書数を、検索サーバ2a、検索サーバ2bに送信する。この統合データベースCの統合版0001の総文書数と、各検索語の出現文書数はすべての検索サーバ2から送られた文書数をカバーするものであるから、大域的な統計情報ということができる。ちなみに、上述の処理動作において得られた大域的な統計情報について図2を用いて明らかにすると、検索に使用された統合版の総文書数は70000(30000+40000=70000)である。また、「携帯」の語句が出現する文書数は289であり、「電話」の語句が出現する文書数は1213であり、「液晶」の語句が出現する文書数は870である。
【0021】
統合データベースCの統合版0001の総文書数と、各検索語の出現文書数を受け取った検索サーバ2aは文書スコアの算出動作45を行なう。この文書スコアの算出動作45では、統合検索サーバ1から送られた大域的な統計情報、すなわち、統合データベースCの統合版0001の総文書数と各検索語の出現文書数を用いて、中間結果24の領域に保存しておいた中間結果の各文書について、スコア算出手段25が文書スコアSを、
S=Σ(tf*idf)
ここで、 tfは検索語の文書内出現頻度
idf=log(検索語の出現文書数/総文書数)
の演算によって求める。
なお、前記文書スコアSの計算式は代表的な例であり、これに限ったわけではない。
【0022】
その結果を基に、検索結果並べ替え手段26が、文書スコアの昇順に文書番号を並べ替える。さらに、検索結果出力手段27が、上位20件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0023】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行され、この検索サーバ2bからも検索結果出力手段27が、上位20件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0024】
統合検索サーバ1では、検索結果並べ替え手段14が、検索サーバ2aおよび検索サーバ2bから返った合計40件の文書番号を文書スコアの昇順に並べ替える。次いで、検索結果出力手段15が、文書スコアの上位20件の結果と、検索に使用した統合データベースCの版名0001を、クライアントに返す。
なお、同じ検索条件で文書スコアの上位21位以下の検索結果を求めたり、検索結果の中から選んだ文書の実体を取得したい場合には、クライアントから統合検索サーバ1に、統合版名0001を指定した検索要求(もしくは実体取得要求)を送る。これにより、検索サーバ2aでは対応するデータベースA23aの版0315に固定し、また検索サーバ2bでは対応するデータベースB23bの版0628に固定して検索(もしくは実体取得)を行なうことで整合性のとれた結果を得ることが可能となる。
【0025】
図7は検索要求、検索実行、統計情報作成、集計、などの処理動作が行なわれるデータベースA23aおよびデータベースB23bにおける版の変遷の一例を経時的に示す図である。上述の動作は図7中の時刻T1において、ユーザが統合データベースCを検索対象にして、「携帯or電話or液晶」という検索式で検索を行い、文書スコアの高い順にランキングした上位20件を取得しようとした場合の動作に相当するものである。したがって、その時刻T1においては、データベースA23aの最新版の版名が0315であり、またデータベースB23bの最新版の版名が0628であり、これは上述した説明と合致する。
【0026】
(実施の形態2)
次に、本発明の第2の実施の形態について説明する。図7中の時刻T2において、ユーザが統合データベースCを検索対象にして別の検索式「テレビ or デジタル」で検索を行い、文書スコアの上位20件を取得しようとしたとする。図8は上記のような文書検索処理動作を行なうに当たってのクライアント3、統合検索サーバ1、検索サーバ2aおよび検索サーバ2b間における動作手順を表すシーケンス図である。先ずクライアント3から統合検索サーバ1に対して検索要求51aが出力される。この検索要求51aは、統合データベースCに対する、統合版名を指定しない検索要求である。
【0027】
図9は本実施の形態における検索要求51a〜51cのデータ構成を示す図である。このデータ構成図から明らかなように、検索要求51aの内容は、
検索対象:統合データベースC
検索式:テレビorデジタル
取得件数:20件
統合版名:−−
である。
【0028】
上記検索要求51aを受け取った統合検索サーバ1は、検索条件入力手段11において検索条件を入力し、統合版参照手段18により統合版管理テーブル17の統合版データを参照して統合データベースCの最新の統合版を求める。この時点での最新の統合版は「0001」である(図8)。その後、統合検索サーバ1は、検索条件送信手段12によりさらなる検索要求51b、51cを検索サーバ2aおよび検索サーバ2bに送付する。このとき、上記のように最新の統合版は「0001」であるから、検索サーバ2aに対してはデータベースA23aの版0315を指定して検索要求51bを出し、また、検索サーバ2bに対してはデータベースB23bの版0628を指定して検索要求51cを出す。その際、版モードとして「最新」という要求を一緒に送る。版モード「最新」は、送った版名よりもさらに新しい版があればその版で検索を行ない、真の最新版の情報を一緒に返し、送った版名が最新版であればその版は返す必要がないという指示を意味している。
【0029】
具体的には、検索サーバ2aへ送付される検索要求51bのデータは、図9から明らかなように、
検索対象:データベースA
検索式:テレビorデジタル
取得件数:20件
版名:0315
版モード:最新
であり、また、検索サーバ2bへ送付される検索要求51cのデータは、図9から明らかなように、
検索対象:データベースB
検索式:テレビorデジタル
取得件数:20件
版名:0628
版モード:最新
である。
【0030】
検索サーバ2aおよび2bにおいては、上記検索条件を検索条件入力手段21において入力し、検索動作52として、検索手段22によりデータベースA(検索サーバ2aの場合)およびデータベースB(検索サーバ2bの場合)に対する検索を実行する。検索サーバ2aと2bは並列処理により検索動作52を実行する。検索サーバ2aでは、この検索動作52に際して、版参照手段30が版管理テーブル29を参照して、データベースA23aの最新版の版名が0315ではなく0316であり、また総文書数が30100であることを知る(図7)。次に、検索手段22が最新版0316のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。
【0031】
なお、本実施の形態における中間結果24については、図4に示された第1の実施の形態における中間結果24と同様の形で表現できるので図に表すのは省略した。また、図5に示されているような、統計情報出力手段28が集計して求めた各検索語の出現文書数もまた、これと同様の形で表現できるので図に表すのは省略した。
【0032】
次に、統計情報出力手段28は、統計情報を、検索に使用した最新版の情報(版名が0316、総文書数が30100)とともに、統合検索サーバ1に返す。その後、検索サーバ2aにおいては、統合検索サーバ1で求められた大域的な統計情報が送られてくるまで待つ。
【0033】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行される。図7及び図8に示すように、検索サーバ2bは、検索サーバ2aの場合と同様にして検索要求51cの検索条件の下で検索した結果、データベースB23bの最新版の版名は0628のままであり、総文書数もまた40000のままであることを知る。そこで、検索手段22が最新版0628のデータベースB23bに対して検索を行い、また、検索動作52により検索された文書を基に作成した中間結果24を中間結果領域に格納する。そして、この中間結果24から、検索語が出現する文書数を求め、これを統計情報出力手段28が統合検索サーバ1に返す。しかし、検索に使用した版0628の情報は返さない。
【0034】
統合検索サーバ1は、検索サーバ2aおよび2bから統計情報を受け取ると、統計情報集計動作53を行なう。この動作では、統計情報集計手段13が検索サーバ2a、検索サーバ2bから返った各検索語の出現文書数を加算(すなわち、集計)し、統合データベースCにおける各検索語の出現文書数を算出する。次に、統合検索サーバ1は、上記集計結果に基づいて統合版管理テーブル更新動作54を行なう。この統合版管理テーブル更新動作54においては、統合版更新手段16が、統合版管理テーブル17に登録されている統合版の個数が一定値を超えているか否かをチェックし、一定値を超えている場合は古い統合版から削除する。統合版更新手段16はまた、統合版管理テーブル17に統合データベースCの統合版0002を登録する。これにより、統合版管理テーブル17には、統合データベースCの統合版0002を構成するデータベースA23aの版名0316と、データベースB23bの版名0628、およびそれぞれの総文書数の情報が格納される。
【0035】
図6の下段には、上記のようにして統合版管理テーブル17に登録された統合版0002のデータが示される。統合検索サーバ1は、このようにして求めた、統合データベースCの統合版0002の総文書数と、各検索語の出現文書数を、検索サーバ2aおよび検索サーバ2bに送信する。この統合データベースCの統合版0002の総文書数と、各検索語の出現文書数はすべての検索サーバ2から送られた文書数をカバーするものであるから、大域的な統計情報ということができる。ちなみに、上述の処理動作において得られた大域的な統計情報について明らかにすると、検索に使用された統合版の総文書数は70100(30100+40000=70100)である(図8)。
【0036】
統合データベースCの統合版0002の総文書数と、各検索語の出現文書数を受け取った検索サーバ2aは文書スコアの算出動作55を行なう。この文書スコアの算出動作55では、統合検索サーバ1から送られた大域的な統計情報、すなわち、統合データベースCの統合版0002の総文書数と各検索語の出現文書数を用いて、中間結果24の領域に保存しておいた中間結果の各文書について、スコア算出手段25が文書スコアSを、
S=Σ(tf*idf)
ここで、 tfは検索語の文書内出現頻度
idf=log(検索語の出現文書数/総文書数)
の演算によって求める。
なお、前記文書スコアSの計算式は代表的な例であり、これに限ったわけではない。
【0037】
その結果を基に、検索結果並べ替え手段26が、文書スコアの昇順に文書番号を並べ替える。さらに、検索結果出力手段27が、上位20件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0038】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行され、この検索サーバ2bからも検索結果出力手段27が、上位20件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0039】
統合検索サーバ1では、検索結果並べ替え手段14が、検索サーバ2aおよび検索サーバ2bから返った合計40件の文書番号を文書スコアの昇順に並べ替える。次いで、検索結果出力手段15が、文書スコアの上位20件の結果と、検索に使用した統合データベースCの版名0002を、クライアントに返す。
【0040】
なお、同じ検索条件で文書スコアの上位21以下の検索結果を求めたり、検索結果の中から選んだ文書の実体を取得したい場合には、クライアントから統合検索サーバ1に、統合版名0002を指定した検索要求(もしくは実体取得要求)を送る。これにより、検索サーバ2aでは対応するデータベースA23aの版0316に固定し、また検索サーバ2bでは対応するデータベースB23bの版0628に固定して検索(もしくは実体取得)を行なうことで整合性のとれた結果を得ることが可能となる。
【0041】
なお本実施の形態において、アンロード情報を基に統合版を削除する動作を組み込むことも可能である。
すなわち、検索サーバ2aおよび2bにおいては、統合検索サーバ1から受け取った検索条件を検索条件入力手段21において入力し、検索手段22によりデータベースA(検索サーバ2aの場合)およびデータベースB(検索サーバ2bの場合)に対する検索動作52を実行する。このとき、検索サーバ2aは、この検索動作52に際して、版参照手段30が版管理テーブル29を参照して、データベースA23aの最新版の版名が0315ではなく0316であり、また総文書数が30100であることを知る(図7)。また、このときすでに版0315はアンロードされていることを知る(同図)。このような場合、検索手段22が最新版0316のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。
【0042】
次に、統計情報出力手段28は、各検索語の出現文書数を含む統計情報を、検索に使用した最新版の情報(版名が0316、総文書数が30100)と、版0315が利用できなくなっている(アンロードされている)という情報とともに総合検索サーバ1に返す。その後、検索サーバ2aにおいては、統合検索サーバ1で求められた大域的な統計情報が送られてくるまで待つ。
【0043】
検索サーバ2bについては、本実施の形態で上述したのと同じ動作を行なう。
【0044】
次に統合検索サーバ1では、検索サーバ2aおよび2bから統計情報を受け取ると、統計情報集計動作53を行なう。この動作では、統計情報集計手段13が検索サーバ2a、検索サーバ2bから返った各検索語の出現文書数を加算(すなわち、集計)し、統合データベースCにおける各検索語の出現文書数を算出する。次に、統合検索サーバ1は、上記集計結果に基づいて統合版管理テーブル更新動作54を行なう。この統合版管理テーブル更新動作54においては、統合版更新手段16が、統合版管理テーブル17から、利用できなくなったデータベースA23aの版0315を含む統合版0001を削除する。また、統合版更新手段16が統合版管理テーブル17に統合データベースCの統合版0002を登録する。これにより、統合版管理テーブル17には、統合データベースCの統合版0002を構成するデータベースA23aの版名0316と、データベースB23bの版名0628、およびそれぞれの総文書数の情報が格納される。
【0045】
その後、統合検索サーバ1は統合データベースCの統合版0002の総文書数と各検索語の出現文書数を検索サーバ2aおよび2bに送信する。
【0046】
(文書検索動作の変更態様)
文書検索動作を行なうに当たっては、通常、検索サーバ(2aとする)では版参照手段30が版管理テーブル29を参照して、データベースA23aの最新版の情報を求める。時系列の最初の段階(すなわち図7中の時刻T1)では、最新版の版名は0315で、総文書数が30000であることがわかる。この場合は、検索手段22がこの版のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。次いで、統計情報出力手段28が検索に使用した最新版の情報(版名が0315、総文書数が30000)とともに、各検索語の出現文書数を、文書スコアの計算に使用する統計情報として統合検索サーバ1に返す。検索サーバ2aは、その後統合検索サーバ1で求められた大域的な統計情報が送られてくるのを制限時間付きで待つ。その制限時間が経過したら、この検索要求についての処理を中止し、別の検索要求の処理に移る。
【0047】
(複数の中間結果の保持)
検索サーバ2aでは、版参照手段30が、版管理テーブル29を参照して、データベースAの最新版の情報を求める。時系列の最初の段階(すなわち図7中の時刻T1)では、最新版の版名は0315で、総文書数が30000であることがわかる。この場合は、検索手段22がこの版のデータベースA23aに対して検索を行い、検索条件にヒットする文書番号と各検索語の文書内出現頻度を求め、中間結果24の領域に格納する。その際、この中間結果24に固有のIDを割り振っておく。次いで、統計情報出力手段28が検索に使用した最新版の情報(版名が0315、総文書数が30000)とともに、各検索語の出現文書数を、文書スコアの計算に使用する統計情報として統合検索サーバ1に返す。その際、中間結果に割り振られたIDも一緒に返す。検索サーバ2aは、その後中間結果の数が一定個数を超えていたら、統合検索サーバ1で求められた大域的な統計情報が送られてくるのを待つ。しかし、中間結果の数が一定個数を超えていなかったら、統合検索サーバ1で求められた大域的な統計情報が送られてくるのを待たずに別の検索要求の処理に移る。
【0048】
統合検索サーバ1は、検索サーバ2aおよび2bから統計情報を受け取ると、統計情報集計動作を行なう。この動作では、統計情報集計手段13が検索サーバ2a、検索サーバ2bから返った各検索語の出現文書数を加算(すなわち、集計)し、統合データベースCにおける各検索語の出現文書数を算出する。次に、統合検索サーバ1は、上記集計結果に基づいて統合版管理テーブル更新動作を行なう。この統合版管理テーブル更新動作においては、統合版更新手段16が、統合版管理テーブル17に統合データベースCの統合版0001を登録する。
【0049】
この登録処理により、統合版管理テーブル17には、統合データベースCの統合版0001を構成するデータベースA23aの版名0315とデータベースB23bの版名0628、およびそれぞれの総文書数の情報が格納される。統合検索サーバ1は、このようにして求めた、統合データベースCの統合版0001の総文書数と、各検索語の出現文書数を、検索サーバ2a、検索サーバ2bに送信する。その際、検索サーバ2aおよび2bから出現文書数と一緒に送られてきたIDを一緒に送り返す。
【0050】
統合データベースCの統合版0001の総文書数と、各検索語の出現文書数を受け取った検索サーバ2aは文書スコアの算出動作(第1の実施の形態の動作45と同じ)を行なう。この文書スコアの算出動作では、統合検索サーバ1から送られた大域的な統計情報、すなわち、統合データベースCの統合版0001の総文書数と各検索語の出現文書数を用いて、中間結果24の領域に保存され、且つ該当するIDを持つ中間結果の各文書について、スコア算出手段25が文書スコアSを、
S=Σ(tf*idf)
ここで、 tfは検索語の文書内出現頻度
idf=log(検索語の出現文書数/総文書数)
の演算によって求める。
【0051】
その結果を基に、検索結果並べ替え手段26が、文書スコアの昇順に文書番号を並べ替える。さらに、検索結果出力手段27が、上位M件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0052】
以上のような検索サーバ2aの一連の動作は検索サーバ2bにおいても並列的に実行され、この検索サーバ2bからも検索結果出職手段27が、上位M件の文書番号と文書スコアを、統合検索サーバ1に返す。
【0053】
統合検索サーバ1では、検索結果並べ替え手段14が、検索サーバ2aおよび検索サーバ2bから返った合計2M件の文書番号を文書スコアの昇順に並べ替える。次いで、検索結果出力手段15が、文書スコアの上位M件の結果と、検索に使用した統合データベースCの版名0001を、クライアントに返す。
【0054】
なお、同じ検索条件で文書スコアの上位(M+1)位以下の検索結果を求めたり、検索結果の中から選んだ文書の実体を取得したい場合には、クライアントから統合検索サーバ1に、統合版名0001を指定した検索要求(もしくは実体取得要求)を送る。これにより、検索サーバ2aでは対応するデータベースA23aの版0315に固定し、また検索サーバ2bでは対応するデータベースB23bの版0628に固定して検索(もしくは実体取得)を行なうことで整合性のとれた結果を得ることが可能となる。
【0055】
(処理フローについて)
図10〜図16は、本発明の上記各実施の形態における分散型文書検索処理の動作手順を総括的に説明するための、クライアント端末(以下、上記各実施の形態におけるクライアントをクライアント端末とそれを利用するユーザとに分けて説明する)、統合検索サーバ及び検索サーバごとに用意したフローチャートである。すなわち、図10〜図12において統合検索サーバが実行する処理フローを示し、図13〜図15において各検索サーバが実行する処理フローを示し、図16においてクライアント端末が実行する処理フローを示している。以下、これらの図を用いて、統合検索サーバ、検索サーバ、クライアント端末の順にそれぞれの動作手順について説明する。
【0056】
(統合検索サーバの処理)
図10のフローチャートに示すように、統合検索サーバは、クライアント端末から検索要求が送られてきたのを確認すると(ステップ101)、検索条件入力手段がその検索要求から自己の検索条件を入力する(ステップ102)。この検索条件の入力を合図にして各検索サーバに対する検索指示処理の実行が開始されることになる。
【0057】
すなわち、図11の検索指示処理フローチャートに示すように、検索条件入力手段により入力された検索条件において、統合版名が指定されているかどうかをチェックする(ステップ103)。
統合版名が指定されていない場合(ステップ103・No)、統合版参照手段は、統合版管理テーブルを参照し(ステップ104)、統合版データの有無を確認する(ステップ105)。統合版データが存在すれば(ステップ105・Yes)、検索条件送信手段は、最新の統合版データから版名を取得し(ステップ106)、その版名を指定してかつ版モード「最新」を含めた検索要求を各検索サーバに送信する(ステップ107)。他方、統合版データが存在しなければ(ステップ105・No)、検索条件送信手段は、検索条件送信手段版名を指定しない検索要求を各検索サーバに送信する(ステップ108)。
これに対して、統合版名が指定されている場合(ステップ103・Yes)、統合版参照手段は、統合版管理テーブルを参照し(ステップ104)、指定された統合版データの有無を確認する(ステップ109)。指定された統合版データが存在すれば(ステップ109・Yes)、検索条件送信手段は、指定された統合版データから版名を取得し(ステップ110)、その版名を指定した検索要求を各検索サーバに送信する(ステップ111)。他方、指定された統合版データが存在しなければ(ステップ109・No)、上記統合版名が指定されていない場合と同様な処理(ステップ105〜108)を行なう。
【0058】
上記検索指示処理が終了すると、図10のフローチャートに示すように、統合検索サーバは、検索指示を行った各検索サーバから送られてくる局所的な統計情報が全て揃うまで待つことになる(ステップ112・No)。
【0059】
そして、統合検索サーバは、検索指示を行った検索サーバから送られてくる局所的な統計情報が全て揃ったことを確認すると(ステップ112・Yes)、統計情報集計手段及び統計情報更新手段による集計・更新処理に移行する。
【0060】
すなわち、図12の集計・更新処理フローチャートに示すように、統計情報集計手段は、各検索サーバからの局所的な統計情報に基づいて集計処理を行い、各検索語の出現文書数を算出する(ステップ113)。
つぎに、検索サーバからの局所的な統計情報に当該検索サーバの最新版情報が添付されているときはその最新版情報に基づいて、他方、最新版情報は添付されていないときは統合版管理テーブルを参照して、総文書数を算出する(ステップ114)。
【0061】
つづいて、統合版更新手段は、算出した総文書数と各検索語の出現文書数とに基づいて、統合版管理テーブルの更新・登録を行なう(ステップ115)。
この更新・登録の際、前記最新版情報にアンロード情報が含まれている場合(ステップ116・Yes)、統合版更新手段は、そのアンロード情報に基づいて該当する統合版データを削除する(ステップ117)。
また、前記更新・登録の際、統合版のデータの個数が一定値を超えている場合(ステップ118・Yes)、統合版更新手段は、古いものから順に(又は検索頻度が少ない順に)統合版データを削除する(ステップ119)。
なお、上記ステップ115〜119の処理は、検索サーバから最新版情報が送られてくる時ではなく、適宜なタイミングで行ってもよい。
【0062】
つづいて、統計情報集計手段は、このように算出した総文書数と出現文書数、すなわち大域的な統計情報を、中間結果の固有IDとともに各検索サーバに送信する(ステップ120)。
【0063】
上記集計・更新処理が終了すると、図10のフローチャートに示すように、統合検索サーバは、当該大域的統計情報を送信した各検索サーバからの返信データ(文書番号及び文書スコア)が送られてくるのを待つことになる(ステップ121・No)。
【0064】
そして、統合検索サーバは、各検索サーバからの返信データが全て揃ったのを確認すると(ステップ121・Yes)、検索結果並べ替え手段は、当該全ての文書番号を文書スコアの昇順に並べ替える(ステップ122)。
つぎに、検索結果出力手段が、上位M件(クライアント端末からの検索要求において指定された件数)のランキング結果と、当該検索に使用した統合版名とを最終的な検索結果としてクライアント端末に送信する(ステップ123)。
【0065】
以上の処理動作が終了すると、つぎの検索処理に移行するか(ステップ124・Yes)又は処理全体を終了する(ステップ124・No)。
【0066】
(検索サーバの処理)
図13のフローチャートに示すように、検索サーバは、統合検索サーバからの検索指示データが送られてきたのを確認すると(ステップ201・Yes)、その検索指示データの種類を判別する。具体的には、検索指示データの種類が、検索条件であるか、それとも大域的統計情報であるかを判別する(ステップ202)。
大域的統計情報である場合、基本的に、スコア算出手順に移行することになるので、その説明は後述する。
他方、検索条件である場合、検索条件入力手段がその検索条件を入力し(ステップ203)、以下に説明するような検索・統計処理に移行する。
【0067】
すなわち、図14の検索・統計処理フローチャートに示すように、まず版参照手段は、検索条件に版名・版モード「最新」が含まれているかを確認する(ステップ204、205)。
【0068】
検索条件に版名が指定されていない場合(ステップ204・No)、版参照手段が版管理テーブルを参照して最新版の情報(最新版名及びその総文書数)を取得し(ステップ206)、その後、当該最新版名のデータベースに対して検索手段が行なう検索動作(ステップ207)に移行する。
【0069】
検索条件に版名が指定されていて(ステップ204・Yes)、かつ版モード「最新」が含まれていない場合(ステップ205・No)、継続した検索動作ということになるので、版参照手段が版管理テーブルを参照することなく、指定版名のデータベースに対して検索手段が行なう検索動作(ステップ208)に移行する。
【0070】
検索条件に版名が指定されていて(ステップ204・Yes)、かつ版モード「最新」が含まれている場合(ステップ205・Yes)は、版参照手段が版管理テーブルを参照して前記最新版の情報を取得し(ステップ206)、当該最新版名と検索条件で指定された版名とが同じかどうかを判断する(ステップ209)。
最新版名と指定版名とが同じ場合(ステップ209・Yes)、指定版名のデータベースに対して検索手段が行なう検索動作(ステップ208)に移行する。これに対して、最新版名と指定版名とが異なる場合(ステップ209・No)、さらに指定版名はアンロードされているかどうかを確認し(ステップ210)、アンロードされていなければ(ステップ210・No)、当該指定版名のデータベースに対して検索手段が行なう検索動作(ステップ207)に移行する。他方、指定版名がアンロードされている場合は(ステップ210・Yes)、最新版名のデータベースに対して検索手段が行なう検索動作(ステップ208)に移行するか、又はエラーメッセージを統合検索サーバに送信する。
【0071】
上記検索動作が終了すると、上記全ての場合に共通して、検索手段は、中間結果(検索の途中として検索によって得られた文書番号と文書内出現頻度)を、当該中間結果に割り当てた固有IDとともに中間結果のデータ領域に格納する(ステップ211)。
【0072】
そして、統計情報出力手段は、各検索語の出現文書数を集計して局所的な統計情報を作成し(ステップ212)、つぎの統計情報出力の処理に移行する。
すなわち、統計情報出力手段は、作成した局所的な統計情報を固有IDとともに統合検索サーバに送信する(ステップ213、214、又は215)。ここで、版名が指定されていなかった場合(ステップ204・No)、又は版名は指定されていたが当該指定版が最新版と異なっていた場合(ステップ204・Yes、ステップ209・No)は、前記局所的な統計情報に前記最新版の情報も添付して送信する(ステップ213)。なお、指定版名と最新版名とが異なっていた場合(ステップ204・No)において、指定版名がアンロードされていた場合(ステップ210・Yes)は、さらにアンロード情報を前記最新版の情報に含めて送信する(ステップ214)。
【0073】
上記検索処理が終了すると、図13のフローチャートに示すように、検索サーバは、統合検索サーバからの大域的統計情報が送られてくるまで待つか、それとも次の検索処理に移行するかを自動的に選択する。
すなわち、制限時間が経過したかどうかを判断し(ステップ216)、制限時間を経過した場合(ステップ216・Yes)には、中間結果の個数が一定個数を超えたかどうかを判断する(ステップ217)。そして、中間結果の個数が一定個数を超えていない場合(ステップ217・No)は、大域的統計情報が送られてくるのを待たずに次の検索処理(ステップ201〜215)に移行する。
これに対して、制限時間が経過しない間(ステップ216・No)、又は、制限時間が経過しても中間結果の個数が一定個数を超えている場合(ステップ216・Yes、ステップ218・Yes)は、次の検索処理(ステップ201〜215)に移行することなく、大域的統計情報が送られてくるのを待つ(ステップ218・No)。
上記いずれの場合も、統合検索サーバから大域的統計情報が送られてくるのを合図にして、直ぐに又は所定の処理後に、スコア算出処理に移行することになる。
【0074】
すなわち、図15のスコア算出処理フローチャートに示すように、検索サーバのスコア算出手段は、統合検索サーバから送られてきた大域的な統計情報を用いて、かつ該当する中間IDをもつ中間結果の各文書についてスコアを算出する(ステップ219)。
つぎに、検索結果並べ替え手段が文書スコアの昇順に文書番号を並べ替える(ステップ220)。なお、文書スコア並べ替え方はこれに限定されるものではない。
つぎに、検索結果出力手段が、上位M件(クライアント端末からの検索要求において指定された件数)の文書番号と文書スコアとを統合検索サーバに送信する。
【0075】
以上のスコア算出処理が終了すると、図13のフローチャートに示すように、検索サーバは、つぎの検索処理に移行するか(ステップ222・Yes)又は処理全体を終了する(ステップ222・No)。
【0076】
(クライアント端末の処理)
上記の統合検索サーバ及び検索サーバの処理動作により、ユーザは、より確実で効率的な文書検索を実行できる。
【0077】
すなわち、図16のフローチャートに示すように、情報検索元であるユーザは、まず、検索画面を表示させる(ステップ301)。つぎに、ユーザは、検索式や検索頻度などの検索条件を検索画面に入力し(ステップ302)、文書検索を要求する。このとき、統合版名を指定して過去の検索と整合性がある検索をしたいときは、その統合版名を指定した上で文書検索を要求する(ステップ303・Yes)。他方、最新のデータベースに対して文書検索を行いたいときは、統合版名を指定しないで文書検索を要求する(ステップ303・No)。前者の場合、クライアント端末は、統合版名を指定した検索要求を統合検索サーバに送信し(ステップ304)、後者の場合、統合版名を指定しない検索要求を統合検索サーバに送信する(ステップ305)。
当該検索条件の送信後、検索結果が統合検索サーバから送られて来るのを待つことになる(ステップ306・No)。
【0078】
そして、クライアント端末は、統合検索サーバから検索結果が送られてきたのを確認すると(ステップ306・Yes)、検索結果を表示する(ステップ307)。
【0079】
次の検索を実行する場合(ステップ308・Yes)は、上記の動作(ステップ302〜307)を繰り返す。他方、次の検索を実行しない場合(ステップ308・No)は、ユーザは、検索画面を閉じる(ステップ309)。これによりクライアント端末の検索に係る処理が全て終了する。
【0080】
【発明の効果】
以上説明したように、本発明によれば、複数の検索サーバと、これらの複数の検索サーバを統合する統合検索サーバとにより文書検索を行なうにあたり、各検索サーバは、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付し、統合検索サーバでは、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基に正確なスコアを計算し、各々検索条件に合致した検索結果を統合検索サーバに返送し、前記検索サーバは、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、統合検索サーバでは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するようにしたため、文書検索に際してより確実で効率的な文書検索を行なうことができるものである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る分散型文書検索装置の構成を示すブロック図
【図2】前記実施の形態で文書検索処理動作を行なうに当たってのクライアント、統合検索サーバ、検索サーバ間における動作手順を表すシーケンス図
【図3】前記実施の形態における検索要求のデータ構成を示す図
【図4】前記実施の形態における中間結果のデータ内容の一例を示す図
【図5】前記実施の形態における統計情報出力手段が集計して求めた各検索語の出現文書数を表す図
【図6】前記実施の形態における統合版管理テーブルに登録された統合版のデータの例を示す図
【図7】前記実施の形態における検索要求、検索実行、統計情報作成、集計、などの処理動作が行なわれるデータベースにおける版の変遷の一例を経時的に示す図
【図8】本発明の第2の実施の形態において文書検索処理動作を行なうに当たってのクライアント、統合検索サーバ、検索サーバ間における動作手順を表すシーケンス図
【図9】前記実施の形態における検索要求のデータ構成を示す図
【図10】本発明の上記各実施の形態における分散型文書検索処理の動作手順を総括的に説明するための、統合検索サーバによる処理全体のフローチャート図
【図11】前記統合検索サーバによる検索指示処理のフローチャート図
【図12】前記統合検索サーバによる集計・更新処理のフローチャート図
【図13】本発明の上記各実施の形態における分散型文書検索処理の動作手順を総括的に説明するための、検索サーバによる処理全体のフローチャート図
【図14】前記検索サーバによる検索・統計処理のフローチャート図
【図15】前記検索サーバによるスコア算出処理のフローチャート図
【図16】本発明の上記各実施の形態における分散型文書検索処理の動作手順を総括的に説明するための、クライアント端末による処理全体のフローチャート図
【符号の説明】
1 統合検索サーバ
2 検索サーバ
3 クライアント
11 検索条件入力手段
12 検索条件送信手段
13 統計情報集計手段
14 検索結果並べ替え手段
15 検索結果出力手段
16 統合版更新手段
17 統合版管理テーブル
18 統合版参照手段
21 検索条件入力手段
22 検索手段
23 データベース
24 中間結果
25 スコア算出手段
26 検索結果並べ替え手段
27 検索結果出力手段
28 統計情報出力手段
29 版管理テーブル
30 版参照手段
31 版更新手段
32 中間結果解放手段

Claims (7)

  1. 複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索を行なう方法であって、
    各検索サーバは、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付し、統合検索サーバでは、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基にスコアを計算し、各々検索条件に合致した検索結果を統合検索サーバに返送し、
    前記検索サーバは、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、
    統合検索サーバでは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付することを特徴とする分散型文書検索方法。
  2. 前記検索サーバは、前記データベースの版の更新を行なったときは、この検索サーバで、新しい版がロードされてから、一定時間後に古い版をアンロードすることを特徴とする請求項1記載の分散型文書検索方法。
  3. 前記統合検索サーバは、統合版の個数が所定の個数を超えたときに統合版を所定の規則にしたがって削除することを特徴とする請求項1記載の分散型文書検索方法。
  4. 前記検索サーバは、検索要求を受けた時に前記データベースの版がアンロードされていた場合は、その旨を伝えるアンロード情報を統計情報とともに統合検索サーバへ送付し、統合検索サーバは、前記アンロード情報が送られてきた時又は必要に応じて、前記アンロード情報を基に関係する統合版を削除することを特徴とする請求項1記載の分散型文書検索方法。
  5. 複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとから成り、
    前記検索サーバは、データベースに対して検索動作を行なう検索手段と、前記検索動作の結果得られた中間結果を保持する手段と、前記中間結果から統計情報を作成出力する統計情報出力手段と、検索した各文書に対してスコアを付けるスコア算出手段とを備え、また、前記統合検索サーバは、複数の検索サーバから送付された統計情報を集計する統計情報集計手段を備え、前記統合検索サーバで大域的な統計情報を作成して各検索サーバへ送付し、各検索サーバは前記大域的な統計情報を基にスコアを計算し、各々検索条件に合致した検索結果を前記統合検索サーバに返送し、
    前記統合検索サーバは、前記統計情報集計手段によって集計した統計情報を基に統合版を作成する手段と、前記統合版の更新を行なう統合版更新手段と、前記統合版の管理を行なう統合版管理手段とを備え、
    前記検索サーバは、前記データベースの版の更新を行なう版更新手段と、版の管理を行なう版管理手段とを備え、前記版管理手段は、検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付し、
    前記統合検索サーバは、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付することを特徴とする分散型文書検索装置。
  6. 複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    各検索サーバに、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付させるステップと、統合検索サーバに、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付させるステップと、各検索サーバに前記大域的な統計情報を基にスコアを計算させ、各々検索条件に合致した検索結果を統合検索サーバに返送させるステップと、
    前記検索サーバに、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付するステップと、
    統合検索サーバに、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するステップと、を含む処理を実行させるための分散型文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体。
  7. 複数の文書を格納するデータベースに対して文書検索を行なう複数の検索サーバと、これらの複数の検索サーバに通信接続され、各検索サーバに対して検索指示を行なう統合検索サーバとにより文書検索をコンピュータに実行させるためのプログラムであって、
    各検索サーバに、検索動作によって得られた中間結果を基に作成した統計情報を統合検索サーバへ送付させるステップと、統合検索サーバに、前記統計情報を集計し、大域的な統計情報を作成して各検索サーバへ送付させるステップと、各検索サーバに前記大域的な統計情報を基にスコアを計算させ、各々検索条件に合致した検索結果を統合検索サーバに返送させるステップと、
    前記検索サーバに、前記データベースの版の更新を各検索サーバで独立に行い、この版の更新は統合検索サーバに対して更新の都度報告せず、その後の検索要求に対する検索動作を行なった時に版情報を統計情報とともに統合検索サーバに送付するステップと、
    統合検索サーバに、前記版情報が送られてきた時又は必要に応じて、各検索サーバのデータベースの最新版を組み合わせた統合版を自動的に生成して各検索サーバへ送付するステップと、を含む処理をコンピュータに実行させるための分散型文書検索プログラム。
JP2002002669A 2001-04-05 2002-01-09 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 Expired - Fee Related JP3693958B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002002669A JP3693958B2 (ja) 2001-04-05 2002-01-09 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体
EP02006903A EP1248208A3 (en) 2001-04-05 2002-03-26 Distributed document retrieval method and device, and distributed document retrieval program and recording medium recording the program
US10/115,261 US20020161753A1 (en) 2001-04-05 2002-04-04 Distributed document retrieval method and device, and distributed document retrieval program and recording medium recording the program
CNB021060347A CN100489842C (zh) 2001-04-05 2002-04-05 分布式文件检索方法、装置、程序及记录该程序的记录介质

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001-107629 2001-04-05
JP2001107629 2001-04-05
JP2002002669A JP3693958B2 (ja) 2001-04-05 2002-01-09 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2002366547A JP2002366547A (ja) 2002-12-20
JP3693958B2 true JP3693958B2 (ja) 2005-09-14

Family

ID=26613163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002002669A Expired - Fee Related JP3693958B2 (ja) 2001-04-05 2002-01-09 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体

Country Status (4)

Country Link
US (1) US20020161753A1 (ja)
EP (1) EP1248208A3 (ja)
JP (1) JP3693958B2 (ja)
CN (1) CN100489842C (ja)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7035880B1 (en) 1999-07-14 2006-04-25 Commvault Systems, Inc. Modular backup and retrieval system used in conjunction with a storage area network
US7395282B1 (en) 1999-07-15 2008-07-01 Commvault Systems, Inc. Hierarchical backup and retrieval system
US7389311B1 (en) 1999-07-15 2008-06-17 Commvault Systems, Inc. Modular backup and retrieval system
US7003641B2 (en) 2000-01-31 2006-02-21 Commvault Systems, Inc. Logical view with granular access to exchange data managed by a modular data and storage management system
US6658436B2 (en) 2000-01-31 2003-12-02 Commvault Systems, Inc. Logical view and access to data managed by a modular data and storage management system
US7155481B2 (en) 2000-01-31 2006-12-26 Commvault Systems, Inc. Email attachment management in a computer system
US7346493B2 (en) 2003-03-25 2008-03-18 Microsoft Corporation Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system
US7454569B2 (en) 2003-06-25 2008-11-18 Commvault Systems, Inc. Hierarchical system and method for performing storage operations in a computer network
CN100407636C (zh) * 2003-10-14 2008-07-30 华为技术有限公司 一种提高通信设备可接入性的方法
US7546324B2 (en) 2003-11-13 2009-06-09 Commvault Systems, Inc. Systems and methods for performing storage operations using network attached storage
CA2546304A1 (en) 2003-11-13 2005-05-26 Commvault Systems, Inc. System and method for performing an image level snapshot and for restoring partial volume data
US7765549B1 (en) * 2004-06-30 2010-07-27 Affiliated Computer Services, Inc. Distributing batches of items in a workflow
US7660800B2 (en) 2005-11-28 2010-02-09 Commvault Systems, Inc. Systems and methods for classifying and transferring information in a storage network
US7651593B2 (en) 2005-12-19 2010-01-26 Commvault Systems, Inc. Systems and methods for performing data replication
US7962709B2 (en) 2005-12-19 2011-06-14 Commvault Systems, Inc. Network redirector systems and methods for performing data replication
US7636743B2 (en) 2005-12-19 2009-12-22 Commvault Systems, Inc. Pathname translation in a data replication system
US7606844B2 (en) 2005-12-19 2009-10-20 Commvault Systems, Inc. System and method for performing replication copy storage operations
US20200257596A1 (en) 2005-12-19 2020-08-13 Commvault Systems, Inc. Systems and methods of unified reconstruction in storage systems
CA2632935C (en) 2005-12-19 2014-02-04 Commvault Systems, Inc. Systems and methods for performing data replication
US8661216B2 (en) 2005-12-19 2014-02-25 Commvault Systems, Inc. Systems and methods for migrating components in a hierarchical storage network
US8930496B2 (en) 2005-12-19 2015-01-06 Commvault Systems, Inc. Systems and methods of unified reconstruction in storage systems
US7617262B2 (en) 2005-12-19 2009-11-10 Commvault Systems, Inc. Systems and methods for monitoring application data in a data replication system
US7725461B2 (en) * 2006-03-14 2010-05-25 International Business Machines Corporation Management of statistical views in a database system
US20070233679A1 (en) * 2006-04-03 2007-10-04 Microsoft Corporation Learning a document ranking function using query-level error measurements
US8726242B2 (en) 2006-07-27 2014-05-13 Commvault Systems, Inc. Systems and methods for continuous data replication
US7593934B2 (en) 2006-07-28 2009-09-22 Microsoft Corporation Learning a document ranking using a loss function with a rank pair or a query parameter
US7882077B2 (en) 2006-10-17 2011-02-01 Commvault Systems, Inc. Method and system for offline indexing of content and classifying stored data
US8370442B2 (en) 2008-08-29 2013-02-05 Commvault Systems, Inc. Method and system for leveraging identified changes to a mail server
US20080228771A1 (en) 2006-12-22 2008-09-18 Commvault Systems, Inc. Method and system for searching stored data
US7593931B2 (en) * 2007-01-12 2009-09-22 International Business Machines Corporation Apparatus, system, and method for performing fast approximate computation of statistics on query expressions
US8290808B2 (en) 2007-03-09 2012-10-16 Commvault Systems, Inc. System and method for automating customer-validated statement of work for a data storage environment
US7836174B2 (en) 2008-01-30 2010-11-16 Commvault Systems, Inc. Systems and methods for grid-based data scanning
JP5135060B2 (ja) * 2008-05-21 2013-01-30 日本電信電話株式会社 分散型情報検索システム、分散型情報検索方法、分散型情報検索プログラムおよびそのプログラムを記録した記録媒体
US8204859B2 (en) 2008-12-10 2012-06-19 Commvault Systems, Inc. Systems and methods for managing replicated database data
US9495382B2 (en) 2008-12-10 2016-11-15 Commvault Systems, Inc. Systems and methods for performing discrete data replication
WO2011082113A1 (en) 2009-12-31 2011-07-07 Commvault Systems, Inc. Asynchronous methods of data classification using change journals and other data structures
JP5483561B2 (ja) * 2010-02-25 2014-05-07 楽天株式会社 ストレージ装置、サーバ装置、ストレージシステム、データベース装置、データの提供方法、及び、プログラム
US8504517B2 (en) 2010-03-29 2013-08-06 Commvault Systems, Inc. Systems and methods for selective data replication
US8352422B2 (en) 2010-03-30 2013-01-08 Commvault Systems, Inc. Data restore systems and methods in a replication environment
US8504515B2 (en) 2010-03-30 2013-08-06 Commvault Systems, Inc. Stubbing systems and methods in a data replication environment
US8725698B2 (en) 2010-03-30 2014-05-13 Commvault Systems, Inc. Stub file prioritization in a data replication system
US8346780B2 (en) 2010-04-16 2013-01-01 Hitachi, Ltd. Integrated search server and integrated search method
WO2011150391A1 (en) 2010-05-28 2011-12-01 Commvault Systems, Inc. Systems and methods for performing data replication
JP5656563B2 (ja) * 2010-11-02 2015-01-21 キヤノン株式会社 文書管理システム、文書管理システムの制御方法、プログラム
US9021198B1 (en) 2011-01-20 2015-04-28 Commvault Systems, Inc. System and method for sharing SAN storage
US8719264B2 (en) 2011-03-31 2014-05-06 Commvault Systems, Inc. Creating secondary copies of data based on searches for content
US8706756B2 (en) 2011-05-11 2014-04-22 Futurewei Technologies, Inc. Method, system and apparatus of hybrid federated search
US8914382B2 (en) * 2011-10-03 2014-12-16 Yahoo! Inc. System and method for generation of a dynamic social page
US9298715B2 (en) 2012-03-07 2016-03-29 Commvault Systems, Inc. Data storage system utilizing proxy device for storage operations
US9471578B2 (en) 2012-03-07 2016-10-18 Commvault Systems, Inc. Data storage system utilizing proxy device for storage operations
US8595235B1 (en) * 2012-03-28 2013-11-26 Emc Corporation Method and system for using OCR data for grouping and classifying documents
US9396540B1 (en) 2012-03-28 2016-07-19 Emc Corporation Method and system for identifying anchors for fields using optical character recognition data
US9069768B1 (en) * 2012-03-28 2015-06-30 Emc Corporation Method and system for creating subgroups of documents using optical character recognition data
US8832108B1 (en) * 2012-03-28 2014-09-09 Emc Corporation Method and system for classifying documents that have different scales
US8843494B1 (en) * 2012-03-28 2014-09-23 Emc Corporation Method and system for using keywords to merge document clusters
US9342537B2 (en) 2012-04-23 2016-05-17 Commvault Systems, Inc. Integrated snapshot interface for a data storage system
US8892523B2 (en) 2012-06-08 2014-11-18 Commvault Systems, Inc. Auto summarization of content
US9336226B2 (en) 2013-01-11 2016-05-10 Commvault Systems, Inc. Criteria-based data synchronization management
US9886346B2 (en) 2013-01-11 2018-02-06 Commvault Systems, Inc. Single snapshot for multiple agents
KR101496179B1 (ko) * 2013-05-24 2015-02-26 삼성에스디에스 주식회사 데이터 부재 태깅 기반의 정보 검색 시스템 및 방법
US9753812B2 (en) 2014-01-24 2017-09-05 Commvault Systems, Inc. Generating mapping information for single snapshot for multiple applications
US9639426B2 (en) 2014-01-24 2017-05-02 Commvault Systems, Inc. Single snapshot for multiple applications
US9495251B2 (en) 2014-01-24 2016-11-15 Commvault Systems, Inc. Snapshot readiness checking and reporting
US9632874B2 (en) 2014-01-24 2017-04-25 Commvault Systems, Inc. Database application backup in single snapshot for multiple applications
US9774672B2 (en) 2014-09-03 2017-09-26 Commvault Systems, Inc. Consolidated processing of storage-array commands by a snapshot-control media agent
US10042716B2 (en) 2014-09-03 2018-08-07 Commvault Systems, Inc. Consolidated processing of storage-array commands using a forwarder media agent in conjunction with a snapshot-control media agent
US9448731B2 (en) 2014-11-14 2016-09-20 Commvault Systems, Inc. Unified snapshot storage management
US9648105B2 (en) 2014-11-14 2017-05-09 Commvault Systems, Inc. Unified snapshot storage management, using an enhanced storage manager and enhanced media agents
US10503753B2 (en) 2016-03-10 2019-12-10 Commvault Systems, Inc. Snapshot replication operations based on incremental block change tracking
CN106021527B (zh) * 2016-05-24 2019-06-28 努比亚技术有限公司 一种数据处理方法及搜索服务器、同步服务器
US10540516B2 (en) 2016-10-13 2020-01-21 Commvault Systems, Inc. Data protection within an unsecured storage environment
US10922189B2 (en) 2016-11-02 2021-02-16 Commvault Systems, Inc. Historical network data-based scanning thread generation
US10389810B2 (en) 2016-11-02 2019-08-20 Commvault Systems, Inc. Multi-threaded scanning of distributed file systems
US10984041B2 (en) 2017-05-11 2021-04-20 Commvault Systems, Inc. Natural language processing integrated with database and data storage management
JP6556799B2 (ja) * 2017-09-26 2019-08-07 株式会社東芝 検索装置、プログラム、データベースシステム、および検索方法
US20190251204A1 (en) 2018-02-14 2019-08-15 Commvault Systems, Inc. Targeted search of backup data using calendar event data
US10642886B2 (en) 2018-02-14 2020-05-05 Commvault Systems, Inc. Targeted search of backup data using facial recognition
US10732885B2 (en) 2018-02-14 2020-08-04 Commvault Systems, Inc. Block-level live browsing and private writable snapshots using an ISCSI server
US11159469B2 (en) 2018-09-12 2021-10-26 Commvault Systems, Inc. Using machine learning to modify presentation of mailbox objects
US11042318B2 (en) 2019-07-29 2021-06-22 Commvault Systems, Inc. Block-level data replication
US11494417B2 (en) 2020-08-07 2022-11-08 Commvault Systems, Inc. Automated email classification in an information management system
US11809285B2 (en) 2022-02-09 2023-11-07 Commvault Systems, Inc. Protecting a management database of a data storage management system to meet a recovery point objective (RPO)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5659732A (en) * 1995-05-17 1997-08-19 Infoseek Corporation Document retrieval over networks wherein ranking and relevance scores are computed at the client for multiple database documents
US5826261A (en) * 1996-05-10 1998-10-20 Spencer; Graham System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query
US6163782A (en) * 1997-11-19 2000-12-19 At&T Corp. Efficient and effective distributed information management
AU1347100A (en) * 1998-11-13 2000-06-05 Chase Manhattan Bank, The A system and method for managing information retrievals from distributed archives
EP1006458A1 (en) * 1998-12-01 2000-06-07 BRITISH TELECOMMUNICATIONS public limited company Methods and apparatus for information retrieval
CA2296285A1 (en) * 1999-02-03 2000-08-03 At&T Corp. Information access system and method for providing a personal portal
EP1074925B8 (en) * 1999-08-06 2011-09-14 Ricoh Company, Ltd. Document management system, information processing apparatus, document management method and computer-readable recording medium

Also Published As

Publication number Publication date
EP1248208A3 (en) 2004-12-15
JP2002366547A (ja) 2002-12-20
CN1379350A (zh) 2002-11-13
EP1248208A2 (en) 2002-10-09
CN100489842C (zh) 2009-05-20
US20020161753A1 (en) 2002-10-31

Similar Documents

Publication Publication Date Title
JP3693958B2 (ja) 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体
US8402052B2 (en) Search device, search method, and computer-readable recording medium storing search program
US8140541B2 (en) Time-weighted scoring system and method
KR100971863B1 (ko) 네트워크 문서의 배치화된 인텍싱을 위한 시스템 및 방법
JP4318741B2 (ja) データベースシステム、データベース検索方法及び記録媒体
US6938043B2 (en) Database processing method, apparatus for implementing same, and medium containing processing program therefor
CN113377289A (zh) 一种缓存管理方法、***、计算设备及可读存储介质
CN110717073B (zh) 云流程平台中结合业务数据实现流程查询处理的***及其方法
CN110263060B (zh) 一种erp电子附件管理方法及计算机设备
JP6084700B2 (ja) 検索システム及び検索方法
CN111932076B (zh) 一种规则配置和发布方法、装置及计算设备
CN114647659A (zh) 数据处理方法、装置、电子设备、存储介质
JP5211180B2 (ja) データベース管理装置、データベース管理プログラム、データベース管理方法、データベース管理システム
CN116028514A (zh) 数据更新方法及装置
JP2002140366A (ja) 関連語選出装置、その方法および記録媒体、並びに文書検索装置、その方法および記録媒体
US9147011B2 (en) Searching method, searching apparatus, and recording medium of searching program
JP3984208B2 (ja) 検索サーバ及び検索プログラム
JP3558267B2 (ja) 文書検索装置
KR101061201B1 (ko) 검색 랭킹 모델 시뮬레이션 시스템 및 그 방법
CN112527900A (zh) 一种数据库读多副本一致性的方法、装置、设备及介质
JP2009037359A (ja) データ登録検索方法、データ登録検索プログラムおよびデータベースシステム
JP3699267B2 (ja) 検索方法及び検索装置並びにデータベース方法及びデータベース装置
CN114138798B (zh) 查询结果命中概率估计***、方法、电子设备及介质
JP6801195B2 (ja) 検索処理方法、検索処理装置及び検索処理プログラム
JP2005018430A (ja) データベース管理システム及び問い合わせ最適化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041005

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050622

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3693958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090701

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100701

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110701

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110701

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120701

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120701

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130701

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees