JPH0991304A - 情報検索方法、情報検索システム及び情報検索用記憶媒体 - Google Patents

情報検索方法、情報検索システム及び情報検索用記憶媒体

Info

Publication number
JPH0991304A
JPH0991304A JP7247326A JP24732695A JPH0991304A JP H0991304 A JPH0991304 A JP H0991304A JP 7247326 A JP7247326 A JP 7247326A JP 24732695 A JP24732695 A JP 24732695A JP H0991304 A JPH0991304 A JP H0991304A
Authority
JP
Japan
Prior art keywords
file
search
storage medium
information
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7247326A
Other languages
English (en)
Other versions
JP3720882B2 (ja
Inventor
Takuya Ichikawa
卓哉 市川
Yoshifumi Sakai
良文 坂井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP24732695A priority Critical patent/JP3720882B2/ja
Publication of JPH0991304A publication Critical patent/JPH0991304A/ja
Application granted granted Critical
Publication of JP3720882B2 publication Critical patent/JP3720882B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】CD−ROMなどのデータ転送速度が比較的遅
い記憶媒体に格納された情報を対象として、十分な容量
の作業用メモリが得られない場合であっても、多様な検
索方法での情報検索を高速で実行できるようにする。 【解決手段】CD−ROM20での物件の格納位置を表
わす情報を要素とするレコードを有する検索用倒置ファ
イル32と、検索用倒置ファイル32の各レコードへの
ポインタを格納する検索用指示ファイル31とをCD−
ROM20に格納しておく。情報検索処理を実行する場
合には、CD−ROM20から検索用指示ファイル31
を処理装置10に予め転送しておき、入力した検索キー
にしたがって処理装置10内の検索用指示ファイル31
を検索し、その検索結果に応じてCD−ROM20内の
検索用倒置ファイル32にアクセスして、検索キーに該
当する物件をCD−ROM20内の辞書データ本体格納
部23から獲得する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索方法及び
情報検索システムに関し、特に、CD−ROMなどの記
憶媒体に格納されている情報を高速に検索でき、かつ、
あいまい検索や部分一致検索を実行可能な情報検索方法
及び情報検索システムに関する。
【0002】
【従来の技術】国語辞書や英和辞書、百科事典類などは
これまで紙媒体によって刊行されてきたが、近年、コン
ピュータ可読型の記憶媒体、特にCD−ROMなどの読
み出し専用記憶媒体に格納された形態でこれら辞書、事
典類が流通するようになってきている。CD−ROM版
の辞書を引く場合には、専用の読み出し表示装置あるい
はパーソナルコンピュータに付属のCD−ROM装置に
当該CD−ROMを装着し、引きたい単語を特定して検
索コマンドを入力する。その結果、入力した単語と一致
する見出し語がそのCD−ROM内において検索され、
読み出し表示装置の表示部やパーソナルコンピュータの
ディスプレイに、入力した単語と一致する見出し語に対
応する説明文が表示される。
【0003】こういったCD−ROM版の辞書・事典で
は、検索時間の短縮を目的として、インデックスファイ
ルを設けるのが一般的である。インデックスファイル
は、検索対象となる語(見出し語ないし索引語)ごと
に、その語に対応する物件(辞書などであれば説明文)
がCD−ROM中のどこに所在するかの情報(いわゆる
ポインタ)を記述したファイルであり、検索キーに応じ
てインデックスファイル内を検索することによって、検
索対象の物件に短時間でアクセスすることが可能にな
る。なお、国語辞書の場合には、見出し語とその見出し
語に対する物件(説明文)が1対1で対応すると考える
ことができるが、百科事典などの場合には、1つの索引
語に複数の物件(説明文)が対応することがありうる。
また、特許文献などの全文データベースを格納したCD
−ROMにおいても、検索に使用されるキーワードに基
づいてインデックスファイルを予め構成しておくことに
より、インデックスファイルに登録されているキーワー
ドについては短時間で全文検索を行うことが可能にな
る。
【0004】
【発明が解決しようとする課題】ところで、辞書を引く
場合、検索対象として入力された文字列と完全に一致す
る見出し項目のみが検索されるのでは(完全一致検
索)、利用者の検索要求に対して不十分であることがあ
る。例えば、表記のゆれがあって辞書での見出し項目と
入力された文字列が一致しない場合や正確に単語の綴り
を覚えていない場合、さらには、類似の単語を網羅的に
検索したい場合には、完全一致の項目のみを検索したの
では目的とする項目に達することはできず、あいまい検
索を行う必要がある。また、ある部分文字列で始まる全
ての単語、ある部分文字列で終る全ての単語、ある部分
文字列を含む全ての単語を検索したい場合には、それぞ
れ、先頭一致検索、後方一致検索、部分一致検索を行う
必要がある。なお、以下の説明において、完全一致検
索、先頭一致検索、後方一致検索、部分一致検索を総称
して一致検索とする。
【0005】インデックスファイル内で索引語や見出し
語が例えば50音順あるいはアルファベット順で並んで
いるとすると、完全一致検索あるいは先頭一致検索の場
合には、検索の対象となる索引語や見出し語のインデッ
クスファイル内での位置がある程度予想がつくので、イ
ンデックスファイルの一部を検索すれば十分である。し
かしながら、あいまい検索を行う場合、あるいは、後方
一致検索や部分一致検索を行う場合には、インデックス
ファイルの全体を検索対象としなければならない。
【0006】CD−ROMはハードディスクに比べて読
み出し速度が格段に遅いから、CD−ROMに格納され
ているインデックスファイルの全体の検索には多大な時
間を要して検索の応答性が低下する。また、インデック
スファイルの一部を検索する場合であっても、そのイン
デックスファイルにアクセスする回数が多ければ、結果
として検索に要する時間が長くなる。
【0007】このような問題点を解決するために、一連
の検索処理の実行に先立って、CD−ROMに格納され
ているインデックスファイルを作業用のハードディスク
や半導体メモリ上に転送し、ハードディスクや半導体メ
モリを対象として検索処理を行うことも可能である。し
かしながら、CD−ROM版の辞書を検索するためのハ
ードウェアがハードディスクを備えていたり十分な容量
の半導体メモリを備えているとは限らない。例えば、携
帯情報端末や家庭用ゲーム機などを用いて検索を行おう
とする場合には、ハードディスクを備えていない場合が
多く、またインデックスファイルの全体を格納するだけ
の十分なメモリが得られない場合が多く、結局、検索の
高速化を実現できないことになる。
【0008】本発明の目的は、CD−ROMなどのデー
タ転送速度が比較的遅い記憶媒体に格納された情報を対
象として、十分な容量の作業用の半導体メモリなどが得
られない場合であっても、完全一致検索やあいまい検索
などの多様な検索方法での情報検索を高速で実行できる
情報検索方法と情報検索システムを提供することにあ
る。さらに本発明は、これらの情報検索方法及び情報検
索システムに適した検索用情報記憶媒体を提供すること
も目的とする。
【0009】
【課題を解決するための手段】本発明の情報検索方法
は、多数の物件を格納した記憶媒体を対象とし、前記記
憶媒体を処理装置に装着して前記記憶媒体から検索条件
に該当する物件を検索する情報検索方法において、前記
記憶媒体における各物件の格納位置を表わす情報を要素
とするレコードを有しインバーテッドファイルである第
1のファイルと、前記第1のファイルでの各レコードの
格納位置を表わす情報を要素とする第2のファイルとを
生成して前記記憶媒体に予め格納し、前記記憶媒体に格
納された物件に対する情報検索処理を実行する場合に、
前記記憶媒体から前記第2のファイルを前記処理装置に
転送し、前記処理装置に入力した前記検索条件にしたが
って前記処理装置内の前記第2のファイルを検索し、前
記第2のファイルに対する検索結果に応じて前記記憶媒
体内の前記第1のファイルにアクセスして前記検索条件
に該当する物件に到達することを特徴とする。
【0010】本発明の情報検索システムは、多数の物件
を格納した記憶媒体と、入力する検索条件に応じて当該
検索条件に該当する物件を前記記憶媒体から検索する処
理装置と、からなる情報検索システムにおいて、前記記
憶媒体が、当該記憶媒体における各物件の格納位置を表
わす情報を要素とするレコードを有しインバーテッドフ
ァイルである第1のファイルと、前記第1のファイルで
の各レコードの格納位置を表わす情報を要素とする第2
のファイルとを保持し、前記処理装置が、前記記憶媒体
が装着され前記記憶媒体からデータを読み出すドライブ
手段と、前記記憶媒体から読み出された前記第2のファ
イルを格納するメモリ手段と、前記検索条件が入力する
入力手段とを有し、情報検索処理に際し、前記記憶媒体
から前記第2のファイルが前記メモリ手段に転送され、
前記入力手段に入力した前記検索条件にしたがって前記
メモリ手段内の前記第2のファイルが検索され、前記第
2のファイルに対する検索結果に応じて前記記憶媒体内
の前記第1のファイルがアクセスされることにより、前
記検索条件に該当する物件が検索されることを特徴とす
る。
【0011】本発明の情報検索システムにおいては、前
記第2のファイルにおける各レコードに対するインデッ
クスとなる第3のファイルを前記記憶媒体にさらに保持
させ、前記第3のファイルが前記第2のファイルととも
に前記メモリ手段内に転送され、前記検索条件に応じて
前記第3のファイルをまず検索することによって物件の
検索が行われるようにすることが好ましい。
【0012】本発明の情報検索用記憶媒体は、情報検索
の対象となる多数の物件を格納した情報検索用記憶媒体
において、当該情報検索用記憶媒体における各物件の格
納位置を表わす情報を要素とするレコードを有しインバ
ーテッドファイルである第1のファイルと、前記第1の
ファイルでの各レコードの格納位置を表わす情報を要素
とする第2のファイルと、を格納したことを特徴とす
る。
【0013】本発明の情報検索用記憶媒体としては、処
理装置に装着され前記処理装置によって情報検索が行わ
れる構成のものであって、前記処理装置に読み込まれる
ことにより、前記処理装置が、前記情報検索用記憶媒体
から前記第2のファイルを前記処理装置に転送し、前記
処理装置に入力した前記検索条件にしたがって前記処理
装置内の前記第2のファイルを検索し、前記第2のファ
イルに対する検索結果に応じて前記情報検索用記憶媒体
内の前記第1のファイルにアクセスするように、前記処
理装置を制御するプログラムをさらに格納するものとす
ることが好ましい。
【0014】
【発明の実施の形態】次に、本発明の望ましい実施の形
態について、図面を参照して説明する。図1は、本発明
の実施の一形態の情報検索システムを説明するブロック
図である。
【0015】この情報検索システムは、辞書や事典類を
内容とするCD−ROM20と、利用者の入力した検索
文字列(検索キー)に応じてCD−ROM20を検索し
検索結果を表示する処理装置10とによって、構成され
ている。処理装置10には、CD−ROM20を装着し
て必要なデータを読み出すためのCD−ROMドライブ
11と、CPUなどで構成され検索処理やCD−ROM
ドライブ11の動作の制御などを行うための処理部12
と、検索処理に必要なファイルを一時的に格納するため
のファイル格納用メモリ13と、タッチパネルやキーボ
ードなどからなり利用者からの検索要求、検索文字列な
どが入力する入力部14と、液晶パネルなどからなり検
索結果を利用者に対して表示するための表示部15とが
設けられている。表示部15は、外部のテレビジョン受
像機に対し、検索結果をテレビジョン画像として表示す
るための映像信号を出力するものであってもよい。
【0016】一方、CD−ROM20の記憶領域の構成
が図2に示されている。ここでは、CD−ROM20が
CD−ROM版の辞書である例が示されているが、別に
辞書に限定される必要はなく、百科事典類、写真集、旅
行ガイドブック、各種ハンドブック・規格書、論文集、
特許公報類など、検索を行って所望のデータにアクセス
することを目的とするものであれば、どのようなもので
あってもよい。
【0017】CD−ROM20の格納領域は、検索処理
プログラムが格納される処理プログラム格納部21と、
インデックスファイル等が格納されるインデックスファ
イル格納部22と、辞書の説明文(物件)が格納される
辞書データ本体格納部23とに分けられている。本実施
の形態では、処理装置10として典型的には各種の家庭
用ゲーム機あるいは携帯情報端末が想定されており、本
発明の方法に基づく検索処理プログラムが予め処理装置
10側に準備されていることが期待できないとしてい
る。そこで、処理装置10の処理部12で走らせるため
の検索処理プログラム自体を検索対象のCD−ROM2
0内に格納し、CD−ROM20がCD−ROMドライ
ブ11に装着された時点で、検索処理プログラムが処理
装置10の処理部12に読み込まれるようにしている。
【0018】インデックスファイルは、一般に、索引語
(見出し語)やキーワードと、その索引語やキーワード
に対する物件(辞書、事典類の場合であるば説明文)の
格納位置を表わす情報とからなるファイルである。本実
施の形態では、説明文ごとに連続番号でインデックス番
号を付与し、索引語やキーワードとこのインデックス番
号とを関連付けるとともに、CD−ROM20中での対
応する説明文の格納場所に対して、このインデックス番
号から即座にアクセスすることができるようにしてい
る。見出し語の50音順に対してインデックス番号が昇
順で並ぶようになっている。また、複数のファイル、少
なくとも検索用倒置ファイル32と検索用指示ファイル
31(いずれも図4参照)が、インデックスファイル格
納部22に格納されるようにしている。検索用倒置ファ
イル32は本発明における第1のファイルに相当し、検
索用指示ファイル31は第2のファイルに相当する。
【0019】検索用倒置ファイル32は、いわゆる倒置
(インバーテッド)ファイルとして構成されたインデッ
クスファイルであり、あいまい検索などを実現するため
に、索引語(キーワード)を1文字あるいは2文字の連
語(例えば、「あ」、「い」、「ああ」、「山」)に分
解し、連語をキーとしてその連語を含む項目のインデッ
クス番号が参照できるように構成されている。連語とは
本来は2文字以上の文字列を指すが、本明細書において
は、1文字のものも連語と呼ぶことにする。索引語を連
語に分解しているので、1つの索引語に1つの説明文し
か対応しない場合(国語辞書などの場合)であっても1
つの連語には複数のインデックス番号が対応し、したが
って、連語ごとにレコードを構成するとすれば、検索用
倒置ファイル32は可変長レコードのファイルであると
いえる。以下、検索用倒置ファイルにおける連語ごとの
インデックス番号の並びを(連語の)レコードと呼ぶ。
なお、検索用指示ファイル31が設けられているので、
検索用倒置ファイル32には、連語そのものを格納して
おく必要はない。一方、検索用指示ファイル31は、連
語をキーとして、検索用倒置ファイルにおいてその連語
のレコードがどこにあるかを指示するファイルである。
したがって、連語ごとにレコードを構成するとするすれ
ば、検索用指示ファイルは固定長のファイルであるとい
える。後述するように、実際に検索を行う場合には、そ
れに先立って検索用指示ファイル31がCD−ROM2
0から処理装置10側に読み出される。
【0020】次に、情報検索処理について、図3及び図
4を用いて説明する。
【0021】CD−ROM20が処理装置10に装着さ
れると、まず、検索処理プログラムがCD−ROM20
から読み出されて処理装置10の処理部12にロードさ
れ、この検索処理プログラムの実行が開始する(ステッ
プ101)。検索処理プログラムのロードは、例えばC
D−ROM装置を備えた家庭用ゲーム機でCD−ROM
からゲームプログラムが自動的にロードされるのと同様
の手順で行われる。続いて、CD−ROM20から検索
用指示ファイル31が読み出され、処理装置10のファ
イル格納用メモリ13に格納される(ステップ10
2)。
【0022】利用者が検索条件として検索キーを入力す
ると(ステップ103)、入力された検索キーに応じて
ファイル格納用メモリ13内の検索用指示ファイル31
が検索され(ステップ104)、その検索結果によって
CD−ROM20内の検索用倒置ファイル32が検索さ
れ(ステップ105)、後処理が実行される(ステップ
106)。すなわち、図4に示すように、検索キーが連
語に分解され、分解された連語によって検索用指示ファ
イル31が検索され、検索用倒置ファイル32における
検索すべきレコードの位置が求められる。そして、該当
する連語のレコードが検索用倒置ファイルから検索され
て処理装置10側に読み込まれる。そして、一致検索の
場合であれば、検索用倒置ファイル32から読み込まれ
た連語のレコードの中で全レコードに共通して存在する
インデックス番号を求め、このインデックス番号に基づ
いて、辞書データ本体格納部23から該当する説明文が
処理装置10に読み込まれる。一方、あいまい検索の場
合であれば、読み込まれた連語のレコードの数に対して
あるインデックス番号が出現するレコードの数の割合が
所定の値(一致度)を上回っていれば、そのインデック
ス番号に基づいて説明文を読み込むようにする。
【0023】そして、上述のように読み込まれた説明文
すなわち検索結果の説明文を表示部15に表示し(ステ
ップ106)、利用者に対して次の検索を行うかどうか
を問い合わせる(ステップ107)。次の検索を行う場
合にはステップ103に戻って次の検索キーの入力を受
け付け、次の検索を行わない場合にはそのまま処理を終
了する。
【0024】この実施の形態では、インバーテッドファ
イルであってデータ量が多い検索用倒置ファイル32は
CD−ROM20内に残しておき、データ量が小さくか
つ検索用倒置ファイル32に対するポインタとして使用
される検索用指示ファイル31は処理装置10内のファ
イル格納用メモリ13にロードし、検索キーに基づく検
索をまず検索用指示ファイル31に対して実行すること
により、十分なメモリを備えていないような場合であっ
ても、高速で検索を行うことが可能になる。すなわち、
最終的には検索用倒置ファイル32からの処理装置10
へのデータの読み込みが必要になるが、検索用指示ファ
イル31を用いて対象となる連語のレコードを絞ってい
るので、検索用倒置ファイル32から読み込まれるレコ
ードの数を必要最小限にし、CD−ROM20からの読
み込みに要する時間を縮減することが可能になってい
る。検索用指示ファイル31はファイル格納用メモリ1
3に常駐させておくことが可能なので、繰り返して検索
を行う場合に大幅に検索時間を減らすことが可能にな
る。
【0025】次に、本発明の別の実施の形態として、検
索用指示ファイル31及び検索用倒置ファイル32のほ
かにいくつかの補助的なファイルを使用し、さらにペー
ジングを導入することによって、さらに検索時間の短縮
を図った例について説明する。図5は、検索処理のため
にここで使用する各ファイルの概要を説明する図であ
る。この実施の形態では、学習工程によってインデック
スデータファイル30から検索用指示ファイル31、検
索用倒置ファイル32、補助インデックスファイル3
3、ページ情報ファイル34及び先頭文字位置ファイル
35を予め生成してこれらファイル30〜35をCD−
ROM20のインデックスファイル格納部22に格納し
ておき、実際に検索を行う場合には検索用指示ファイル
31、補助インデックスファイル33、ページ情報ファ
イル34及び先頭文字位置ファイル35を処理装置20
のファイル格納用メモリ13内に予めロードする。以
下、各ファイル30〜35の構成について説明する。
【0026】インデックスデータファイル30は、CD
−ROM20内の説明文(物件)にアクセスするため基
本となるファイルであって、説明文ごとに、その説明文
に対するインデックス番号と見出し語(索引語)とCD
−ROM20内での格納位置とを記述したものである。
説明文は見出し語の50音順で配置されており、各説明
文に対して0から始まる連続番号であるインデックス番
号が、重複しないように付与されている。各見出し語は
「読み」と「実体」とに分かれており、「読み」にはそ
の見出し語の読みが格納され、「実体」にはその見出し
語の実際の表記(漢字やアルファベット)が格納されて
いる。なお、この実施の形態ではひらがなとかたかなの
区別、清音と濁音、半濁音の区別は行っておらず、ま
た、ひらがなのみで表記される見出し語については、
「実体」には何も格納していない。
【0027】上述のようなインデックスデータファイル
に対し、図6に示すような処理を行うことによって、検
索用指示ファイル31以下の各ファイル31〜35が生
成される。まず、各見出し語から1文字の連語としての
構成文字を抽出する。「読み」の部分については、2文
字の連語(構成文字列)も抽出する。例えば、見出し語
「(読み)あそさん、(実体)阿蘇山」からは、「あ」,
「そ」,「さ」,「ん」,「あそ」,「そさ」,「さん」,「阿」,「蘇」,「山」
が抽出される。そして、これら各構成文字がどのインデ
ックス番号の見出し語に含まれているかを求め、そのイ
ンデックス番号を保存する。つまり、構成文字(列)を
キーとしインデックス番号を並びとするインバーテッド
ファイルを生成する。そして、ページング処理を実行
し、インデックス番号の代りにページング後のインデッ
クス番号が記録されるようにする。ページングとは、検
索速度の向上を目的として、一連のインデックス番号を
複数のページに分けることである。例えば、インデック
ス番号を65536(=216)で除算したとして、商を
ページの番号、余りをページング後のインデックス番号
とする。このようにページングを定義すると、ページン
グの結果、インデックス番号23210は第0ページの
23210と、65537は第1ページの1と表わされ
ることになる。
【0028】図8は検索用指示ファイル31の構成例を
示している。ここでは、各構成文字の各ページごとに、
その構成文字が出現した見出し語の数(該当するインデ
ックス番号の数)が格納されている。検索用指示ファイ
ル31での構成文字の順は検索用倒置ファイル32での
構成文字の順と同じとなっており、検索用指示ファイル
31において注目する構成文字の直前の構成文字までに
出現回数として格納された数の総和を求めれば、その総
和は、検索用倒置ファイル32でのその注目する構成文
字に対するポインタとして扱うことができる。あるい
は、検索用指示ファイル31には、各構成文字の各ペー
ジごとに、検索用倒置ファイル32における当該構成文
字の当該ページの先頭のアドレスを直接記録するように
してもよく、このように構成すれば、検索用指示ファイ
ル31での値を検索用倒置ファイル32のレコードに対
するポインタとしてそのまま使用することが可能にな
る。
【0029】図9は検索用倒置ファイル32の構成例を
示している。この検索用倒置ファイル32では、各構成
文字の各ページを単位としてレコードが構成され、各レ
コードは、可変長であって、該当する構成文字の該当す
るページに出現するインデックス番号を並びとして格納
している。各レコードには、構成文字やページを表わす
データは格納されていない。インデックス番号自体は、
所定の整数型データとして表わされている。検索用指示
ファイル31に格納されているデータが図8に示すよう
であれば、各レコードの要素数(格納されているインデ
ックス番号の数)は、図9において要素数として表わさ
れた数となる。上述したように検索用指示ファイル31
と検索用倒置ファイル32では構成文字の出現順が同じ
になっているが、この出現順は例えば50音順である必
要はなく、例えば、構成文字ごとの出現回数の多い順に
並べてもよい。特に、検索用指示ファイル31に格納さ
れている値が出現回数である場合には、ポインタの算出
を短時間で行うために、出現回数の多い順で配置するこ
とが好ましい。
【0030】上述したように検索用指示ファイル31、
検索用倒置ファイル32が生成したら、次に、補助イン
デックスファイル33を生成する。補助インデックスフ
ァイル33は、検索用指示ファイル31に対するインデ
ックスファイルであり、検索用指示ファイル31におい
て各構成文字のデータがどの辺りに位置するかを示すフ
ァイルである。検索用指示ファイル33において構成文
字が例えば文字コードの順に配置され、かつ、連続した
数値によって文字コード体系が設計されている場合に
は、補助インデックスファイル33を設けなくても検索
用指示ファイル31の所望の構成文字の欄に即座にアク
セスすることができる。しかしながら、現在、計算機内
部で日本語文字を表わすのに一般的に使用されている文
字コード、特にいわゆるシフトJISコードでは、飛び
飛びの値に文字が割り振られているので、ある構成文字
が文字コードとして渡された場合に、その構成文字の欄
が検索用指示ファイル31中でどの辺りにあるのかを即
座に知ることができない。そこで本実施の形態では、補
助インデックスファイル33を設け、例えば構成文字の
500個を単位として、ある構成文字が与えられた場合
にその構成文字のデータがどの辺にあるかが分かるよう
にしている。
【0031】次に、完全一致検索や先頭一致検索をより
高速に行うためのページングについて説明する。上述し
たページングでは、例えばインデックス番号を6553
6で除算したときの商をページ番号とし、余りをページ
ング後のインデックス番号としているので、各ページの
要素数は65536で固定されている。ここで、図10
の(a)に示すように、同音異義語があってインデックス
番号の65535と65536の読みがともに「しょう
じょう」である場合、これら2つの「しょうじょう」は
図10の(b)に示すように、異なるページにページング
されることになる。ところで本実施の形態では、後述す
るように、レコード単位で検索用倒置ファイル32から
データを読み込んでくるから、先頭文字が同じであるイ
ンデックス番号が2つのページにまたがってページング
されると、その2つのページのレコードをそれぞれ読み
込んでくることとなり、検索時間が余計にかかることに
なる。先頭文字が変化する完全一致や先頭一致検索の場
合、先頭文字が異なるものは全く検索する必要がないこ
とに留意すると、図10(c)に示すように先頭文字が変
化する切れ目の位置にページ境界を設定することによ
り、先頭文字以外の文字についても該当するページのみ
を読み込めばよいから、検索用倒置ファイル32から読
み込むべきデータ量が大幅に減って、検索時間の短縮を
図ることができる。図10(c)に示した例では、先頭文
字「さ」と先頭文字「し」の切れ目となる位置で、第0
ページと第1ページが分けられている。なお、先頭文字
ごとのインデックス番号の数(説明文の数)を考慮し
て、このようなページングは、構成文字がひらがなであ
る部分について実行する。
【0032】ところで実際にCD−ROM20の辞書デ
ータ本体格納部23に格納された説明文を読み出す場
合、インデックスデータファイル30に記録されている
インデックス番号はページング前のものであるから、ペ
ージング前のインデックス番号を用いる必要がある。上
述したようにページングを行って各ページの要素数が異
なる場合には、ページング前のインデックス番号を得る
ためには、各ページごとの要素数を保存しておく必要が
ある。そこで、ページ情報ファイル34を設け、図11
に示すように各ページの要素数(インデックスの数)を
保存している。ページング後のインデックス番号が第2
ページの12345であれば、ページング前のインデッ
クス番号は、第0ページと第1ページの要素数の和に1
2345を加算した値(図11の例では58721+62310+12
345=133376)で表わされる。
【0033】さらに本実施の形態では、完全一致検索、
先頭一致検索の高速化のために、先頭文字位置ファイル
35を設けている。先頭文字位置ファイル35は、図1
2に示すように、「読み」の部分に関して先頭文字ごと
にその先頭文字が始まるページング後のインデックス番
号を格納している。これにより、例えば、「読み」にお
いて先頭文字が「う」であるものは、インデックス番号
が2369から3955の範囲にあるものと即座に分か
り、検索対象を絞り込むのに役立つ。
【0034】次に、上述のようにインデックスデータフ
ァイル30から各ファイル31〜35が生成して格納さ
れたCD−ROM20を対象とし、このCD−ROM2
0から検索処理プログラムが処理装置10の処理部12
に読み込まれ、さらに検索用指示ファイル31と補助イ
ンデックスファイル33とページ情報ファイル34と先
頭文字位置ファイル35と処理装置10のファイル格納
用メモリ13に読み込まれたとして、どのように情報検
索処理が実行されるかを説明する。図13及び図14は
この情報検索処理の具体的手順を表わすフローチャート
である。
【0035】利用者によって、検索条件として、検索方
法(完全一致検索、部分一致検索、先頭一致検索、後方
一致検索あるいはあいまい検索の別)と検索文字列(検
索キー)とが入力されると(ステップ111)、まず、
あいまい検索かそうでないかの判断がなされる(ステッ
プ112)。あいまい検索の場合には、利用者からの一
致度xの入力を受け(ステップ113)、入力された検
索文字列から、漢字1文字で構成された検索実行文字と
ひらがな1文字で構成された検索実行文字を順次抽出す
る(ステップ114)。本実施の態様では、上述したよ
うに、1文字あるいは2文字からなる連語に検索文字列
を分解し、分解して得た連語に基づいて検索を行うが、
この分解して得た連語のことを検索実行文字という。例
えば検索文字列「あそ山」からは「あ」,「そ」,「山」が検索
実行文字として抽出される。なお、同一の検索検索文字
が重複しては抽出されないようにする。そして、抽出さ
れた検索実行文字により、ファイル格納用メモリ13に
既に格納されている検索用指示ファイル31を検索する
(ステップ115)。その際、補助インデックスファイ
ル33を使用することによって、検索用指示ファイル3
1をその先頭から走査することなく、検索用指示ファイ
ル31の目的とする場所に素早くアクセスすることが可
能になる。検索文字列「あそ山」の例でいえば、検索用
指示ファイル31での構成文字「あ」,「そ」,「山」の内容が
それぞれ読み出され、「あ」,「そ」,「山」に関する検索用倒
置ファイル32へのポインタがそれぞれ算出される。そ
して、ステップ125に移行する。
【0036】一方、ステップ112であいまい検索でな
い場合、すなわち一致検索の場合には、一致度xを10
0%に設定し(ステップ116)、入力された検索文字
列が全てかな文字からなるあるいは全て漢字からなるか
どうかを判定する(ステップ117)。全てかな文字あ
るいは全て漢字ではない場合(典型的にはかなと漢字が
混在する場合)には、上述のステップ114とステップ
115を順次実行してステップ125に移行し、全てか
な文字あるいは全て漢字の場合には、検索文字列が全て
かな文字であるかを判定する(ステップ118)。ステ
ップ118で全てかな文字の場合には、検索文字列か
ら、ひらがな2文字で構成された検索実行文字を順次抽
出する(ステップ119)。例えば、検索文字列が「あ
そさん」であれば、検索実行文字として「あそ」,「そさ」,
「さん」が抽出される。一方、ステップ118で全てかな
でない場合、すなわち全て漢字の場合には、検索文字列
から、漢字1文字で構成された検索実行文字を順次抽出
する(ステップ120)。例えば、検索文字列「阿蘇
山」からは検索実行文字として「阿」,「蘇」,「山」が抽出さ
れる。そして、ステップ119を実行した場合もステッ
プ120を実行した場合も、このようにして抽出された
検索実行文字により、上述と同様に、ファイル格納用メ
モリ13に既に格納されている検索用指示ファイル31
を検索する(ステップ121)。
【0037】ところで、後述するように検索実行文字に
基づいて最終的にはCD−ROM20内の検索用倒置フ
ァイル32が検索されることになっており、その際、検
索実行文字が多数あると、それだけCD−ROM20へ
のアクセス回数が増えることになる。そこで、ステップ
121の実行後、検索実行文字がN個以上見つかったか
どうかを判断し、検索実行文字がN個以上であれば、出
現回数が多い方の検索実行文字から削って検索実行文字
の数をN−1にする(ステップ122)。検索実行文字
の出現回数は検索用指示ファイル31に記述されてい
る。Nは例えば7に設定する。ここで出現回数の多い方
から削るのは、出現回数の多い検索実行文字は多くの見
出し語に含まれていて、入力された検索文字列を特定す
るのに余り役立たないと考えられるからである。ステッ
プ122の実行後、検索方法が完全一致検索あるいは
先頭一致検索であって、かつ、先頭文字がかなであ
る、が満たされているかどうかを判断する(ステップ1
23)。満たされていない場合にはそのままステップ1
25に移行し、満たされている場合には、上述のように
構成文字の先頭文字が変化する切れ目にページ境界が設
定されていることから、検索実行文字の先頭のかな文字
に基づいて、検索すべき対象のページを決定し(ステッ
プ124)、その後、ステップ126に移行する。
【0038】ステップ125では、検索方法があいまい
検索であるかを判定し、あいまい検索であればそのまま
ステップ126に移行し、あいまい検索でない場合には
ステップ123に移行する。
【0039】ステップ126では、ステップ115ある
いはステップ121での検索用指示ファイル31の検索
結果に応じ、CD−ROM20内の検索用倒置ファイル
32から未処理の1ページ分のレコードを読み込む。検
索文字列「あそ山」の例では、「あ」,「そ」,「山」のそれぞ
れについてのレコードが読み出される。後述するよう
に、ステップ124で対象ページが設定される場合を除
いてステップ125は繰り返して実行されるが、例え
ば、第0ページに属するレコードがまず読み出され、次
にステップ125が実行されるときに第1ページに属す
るレコードが読み出される。また、ステップ124で対
象ページが設定されている場合には、その対象ページに
属するレコードが読み出される。上述したようにステッ
プ115あるいはステップ121では、各検索実行文字
ごとに検索用倒置ファイル32でのその検索実行文字の
レコードへのポインタ(格納位置に関する情報)が求め
られているから、このポインタを用いて検索用倒置ファ
イル32にアクセスし、その検索実行文字のレコードを
読み出せばよい。すなわち、検索用倒置ファイル32の
全体を走査する必要はなく、検索用倒置ファイル32の
必要な場所に直接アクセスすることが可能になってい
る。
【0040】そして、検索実行文字に対する各インデッ
クス番号の出現頻度を求める(ステップ127)。図1
5は出現頻度の集計を説明する図である。すなわち、検
索用倒置ファイル32から読み出されたレコードについ
て、各インデックス番号ごとに出現回数をカウントす
る。図15において○印はそのレコードにおいてそのイ
ンデックス番号が記録されていたことを示している。こ
の例では、検索文字列「あそ山」から抽出された各検索
実行文字「あ」,「そ」,「山」のレコードについて、それぞれ
どのインデックス番号が出現したかが示されており、例
えば検索実行文字「あ」のレコードには、インデックス番
号0,3,8,9,13,15が記録されていることが示さ
れている。そして、検索実行文字の数(この例では3)
で出現回数を除算することにより、各インデックス文字
ごとに出現頻度が求められている。この例では、検索実
行文字の各レコードに共通にインデックス番号13が含
まれ(出現回数が3)、インデックス番号13に対する
出現頻度が100%であることが示されている。
【0041】出現頻度の集計が終了したら、検索方法
が完全一致か先頭一致検索であり、かつ、検索文字列
の先頭がかなである、という条件を満足するかどうかを
判定する(ステップ128)。この条件を満足しない場
合にはそのままステップ130に移行し、満足する場合
には、検索文字列の先頭文字に応じて先頭文字位置ファ
イル35を参照し、評価対象となるインデックス番号の
範囲を求め(ステップ129)、以後の処理ではその範
囲内のインデックス番号のみを対象とするようにして、
ステップ130に移行する。このように先頭文字に応じ
てインデックス番号の範囲を絞るのは、インデックス番
号の出現頻度のみに着目すると検索文字列「あそ山」に
対して見出し語「山あそ」もヒットすることになるの
で、このような検索ノイズの発生を防ぎ、CD−ROM
20への不要なアクセスを減らすためである。先頭文字
「あ」で範囲を限定すれば、検索文字列「あそ山」に対
し、「あ山そ」はヒットするが、「山あそ」などのヒッ
トは防ぐことができる。
【0042】ステップ130では、出現頻度が一致度x
以上となっているインデックス番号を求める。一致検索
に対してはステップ116でx=100%としているの
で、出現頻度が100%のインデックス番号のみが求め
られる。一方、あいまい検索の場合には、ステップ11
3で入力した一致度xに応じてインデックス番号が求め
られる。そして、求められたインデックス番号に基づい
てCD−ROM20内のインデックスデータファイル3
0を参照し、それらのインデックス番号に対応する見出
し語を求める(ステップ131)。その際、それらのイ
ンデックス番号に対応する説明文の辞書データ本体格納
部23での格納位置も求めておく。
【0043】続いて、検索方法があいまい検索であるか
どうかを判断し(ステップ132)、あいまい検索であ
ればそのままステップ134に移行し、あいまい検索で
ない場合すなわち一致検索である場合には、求められた
見出し語が検索条件と合致しているかを判定する(ステ
ップ133)。ステップ133において検索条件と合致
している場合にはステップ134に移行し、検索条件に
合致していない場合にはステップ135に移行する。こ
こで検索条件と合致しているかを判断するのは、本実施
の形態の手順によれば、検索文字列「あそ山」に対して
「あそ山」と「あ山そ」の両方が見出し語として検出さ
れるので、ノイズである「あ山そ」を排除するためであ
る。なお、あいまい検索の場合には、利用者の意図する
検索対象に「あ山そ」も含まれている可能性があるの
で、検索条件に合致しているかどうかのステップ133
でのチェックは行わない。
【0044】あいまい検索である場合とステップ133
で検索条件に合致している場合にはステップ134に移
行するが、ステップ134では、該当するインデックス
番号に対応する説明文をCD−ROM20の辞書データ
本体格納部23から読み出し、検索された見出し語と対
応する説明文とを表示部15に表示し、ステップ135
に移行する。辞書データ本体格納部23にアクセスする
場合には、ステップ131においてインデックスデータ
ファイル30にアクセスした際に既に求めてある格納位
置の情報を使用する。
【0045】ステップ135では、全ページの処理が終
了したかどうかを判断し、未処理のページが残っている
のであればステップ126に戻り、全ページの処理が終
了しているのであれば、入力された検索文字列に対する
情報検索処理を終了する。ステップ124で対象ページ
が定められている場合には、未処理のページが存在しな
いので、そのまま処理を終了する。
【0046】以上、本発明の実施の形態についてCD−
ROM版の辞書の場合を例に挙げて説明したが、本発明
はこれに限定されるものではなく、記憶媒体としてCD
−ROM以外のもの、例えばリムーバブルハードディス
クも使用可能であり、また、記憶媒体に格納される内容
も辞書や事典に限られず、例えば、各種の論文集、特許
公報類であってもよい。
【0047】
【発明の効果】以上説明したように本発明の情報検索方
法は、典型的にはCD−ROMである記憶媒体に、物件
のデータとともに、記憶媒体における各物件の格納位置
を表わす情報を要素とするレコードを有しインバーテッ
ドファイルである第1のファイルと、第1のファイルで
の各レコードの格納位置を表わす情報を要素とする第2
のファイルとを格納し、情報検索処理を実行する場合に
は、第2のファイルを処理装置側に転送し、検索条件に
したがって処理装置内の第2のファイルを検索すること
により、相対的にアクセス速度の遅い記憶媒体へのアク
セス量が減って、処理装置のメモリ容量が小さい場合で
あっても、検索時間の大幅な短縮を図ることができると
いう効果がある。
【0048】本発明の情報検索システムは、物件のデー
タを格納する記憶媒体として、物件のデータとともに、
その記憶媒体における各物件の格納位置を表わす情報を
要素とするレコードを有しインバーテッドファイルであ
る第1のファイルと、第1のファイルでの各レコードの
格納位置を表わす情報を要素とする第2のファイルとを
格納した記憶媒体を使用し、処理装置として、第2のフ
ァイルを読み込んで保持するためのメモリ手段を有する
ものを使用し、検索条件にしたがってメモリ手段内の第
2のファイルをまず検索することにより、相対的にアク
セス速度が遅い記憶媒体へのアクセス量が減って、メモ
リ手段の容量が小さい場合であっても検索時間の大幅な
短縮を図ることができるという効果がある。このとき、
第2のファイルにおける各レコードに対するインデック
スとなる第3のファイルを記憶媒体が保持し、第3のフ
ァイルが第2のファイルとともにメモリ手段内に転送さ
れて第3のファイルがまず検索の対象となるようにする
ことによって、さらに検索時間の短縮を図ることができ
る。
【0049】本発明の情報検索用記憶媒体は、物件のデ
ータとともに、各物件の格納位置を表わす情報を要素と
するレコードを有しインバーテッドファイルである第1
のファイルと、第1のファイルでの各レコードの格納位
置を表わす情報を要素とする第2のファイルとを格納す
ることにより、第2のファイルを相対的にアクセス速度
が早いメモリなどに転送して、転送後の第2のファイル
を対象として検索条件に応じた検索をまず実行すること
によって、相対的にアクセス速度の遅い情報検索用記憶
媒体へのアクセス量を減らすことができ、十分なメモリ
を確保できない場合であっても、検索時間を短縮できる
ようになるという効果がある。また、情報検索のための
処理プログラム自体を情報検索用記憶媒体に格納してお
くことにより、処理装置側でプログラムを用意する必要
がなくなるとともに、物件の性質や物件に対する見出し
語(索引語)、検索方法に応じて最適の検索アルゴリズ
ムを利用者に提供できるようになる。
【図面の簡単な説明】
【図1】本発明の実施の一形態の情報検索システムを説
明するブロック図である。
【図2】CD−ROM内でのデータの配置を示す図であ
る。
【図3】図1の情報検索システムにおける情報検索処理
の概要を示すフローチャートである。
【図4】図1の情報検索システムにおける情報検索処理
時のデータの流れの概略を示す図である。
【図5】情報検索処理に使用される各種ファイル間の関
係を示す図である。
【図6】インデックスデータファイルの内容の一例を示
す図である。
【図7】インデックスデータファイルから各種ファイル
を生成するための学習過程を示す図である。
【図8】検索用指示ファイルの内容の一例を示す図であ
る。
【図9】検索用倒置ファイルの内容の一例を示す図であ
る。
【図10】ページングを説明する図である。
【図11】ページ情報ファイルの内容の一例を示す図で
ある。
【図12】先頭文字位置ファイルの内容の一例を示す図
である。
【図13】情報検索処理の具体的処理手順を示すフロー
チャートである。
【図14】情報検索処理の具体的処理手順を示すフロー
チャートである。
【図15】出現頻度の集計を説明する図である。
【符号の説明】
10 処理装置 11 CD−ROMドライブ 12 処理部 13 ファイル格納用メモリ 14 入力部 15 表示部 20 CD−ROM 21 処理プログラム格納部 22 インデックスファイル格納部 23 辞書データ本体格納部 30 インデックスデータファイル 31 検索用指示ファイル 32 検索用倒置ファイル 33 補助インデックスファイル 34 ページ情報ファイル 35 先頭文字位置ファイル 101〜107,111〜135 ステップ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 多数の物件を格納した記憶媒体を対象と
    し、前記記憶媒体を処理装置に装着して前記記憶媒体か
    ら検索条件に該当する物件を検索する情報検索方法にお
    いて、 前記記憶媒体における各物件の格納位置を表わす情報を
    要素とするレコードを有しインバーテッドファイルであ
    る第1のファイルと、前記第1のファイルでの各レコー
    ドの格納位置を表わす情報を要素とする第2のファイル
    とを生成して前記記憶媒体に予め格納し、 前記記憶媒体に格納された物件に対する情報検索処理を
    実行する場合に、前記記憶媒体から前記第2のファイル
    を前記処理装置に転送し、前記処理装置に入力した前記
    検索条件にしたがって前記処理装置内の前記第2のファ
    イルを検索し、前記第2のファイルに対する検索結果に
    応じて前記記憶媒体内の前記第1のファイルにアクセス
    して前記検索条件に該当する物件に到達することを特徴
    とする情報検索方法。
  2. 【請求項2】 多数の物件を格納した記憶媒体と、入力
    する検索条件に応じて当該検索条件に該当する物件を前
    記記憶媒体から検索する処理装置と、からなる情報検索
    システムにおいて、 前記記憶媒体が、当該記憶媒体における各物件の格納位
    置を表わす情報を要素とするレコードを有しインバーテ
    ッドファイルである第1のファイルと、前記第1のファ
    イルでの各レコードの格納位置を表わす情報を要素とす
    る第2のファイルとを保持し、 前記処理装置が、前記記憶媒体が装着され前記記憶媒体
    からデータを読み出すドライブ手段と、前記記憶媒体か
    ら読み出された前記第2のファイルを格納するメモリ手
    段と、前記検索条件が入力する入力手段とを有し、 情報検索処理に際し、前記記憶媒体から前記第2のファ
    イルが前記メモリ手段に転送され、前記入力手段に入力
    した前記検索条件にしたがって前記メモリ手段内の前記
    第2のファイルが検索され、前記第2のファイルに対す
    る検索結果に応じて前記記憶媒体内の前記第1のファイ
    ルがアクセスされることにより、前記検索条件に該当す
    る物件が検索されることを特徴とする情報検索システ
    ム。
  3. 【請求項3】 前記第2のファイルにおける各レコード
    に対するインデックスとなる第3のファイルを前記記憶
    媒体が保持し、前記第3のファイルが前記第2のファイ
    ルとともに前記メモリ手段内に転送され、前記検索条件
    に応じて前記第3のファイルをまず検索することによっ
    て物件の検索が行われる請求項2に記載の情報検索シス
    テム。
  4. 【請求項4】 情報検索の対象となる多数の物件を格納
    した情報検索用記憶媒体において、 当該情報検索用記憶媒体における各物件の格納位置を表
    わす情報を要素とするレコードを有しインバーテッドフ
    ァイルである第1のファイルと、前記第1のファイルで
    の各レコードの格納位置を表わす情報を要素とする第2
    のファイルと、を格納したことを特徴とする情報検索用
    記憶媒体。
  5. 【請求項5】 処理装置に装着され前記処理装置によっ
    て情報検索が行われる請求項4に記載の情報検索用記憶
    媒体であって、 前記処理装置に読み込まれることにより、前記処理装置
    が、前記情報検索用記憶媒体から前記第2のファイルを
    前記処理装置に転送し、前記処理装置に入力した前記検
    索条件にしたがって前記処理装置内の前記第2のファイ
    ルを検索し、前記第2のファイルに対する検索結果に応
    じて前記情報検索用記憶媒体内の前記第1のファイルに
    アクセスするように、前記処理装置を制御するプログラ
    ムをさらに格納した情報検索用記憶媒体。
JP24732695A 1995-09-26 1995-09-26 情報検索方法、情報検索システム及び情報検索装置 Expired - Fee Related JP3720882B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24732695A JP3720882B2 (ja) 1995-09-26 1995-09-26 情報検索方法、情報検索システム及び情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24732695A JP3720882B2 (ja) 1995-09-26 1995-09-26 情報検索方法、情報検索システム及び情報検索装置

Publications (2)

Publication Number Publication Date
JPH0991304A true JPH0991304A (ja) 1997-04-04
JP3720882B2 JP3720882B2 (ja) 2005-11-30

Family

ID=17161741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24732695A Expired - Fee Related JP3720882B2 (ja) 1995-09-26 1995-09-26 情報検索方法、情報検索システム及び情報検索装置

Country Status (1)

Country Link
JP (1) JP3720882B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1173426A (ja) * 1997-08-29 1999-03-16 Tokkyo Joho Shuppan:Kk 文章照合装置
WO2008090606A1 (ja) * 2007-01-24 2008-07-31 Fujitsu Limited 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6458018A (en) * 1987-08-28 1989-03-06 Hitachi Ltd Method and device for retrieving data
JPH0239224A (ja) * 1988-07-28 1990-02-08 Seiko Epson Corp Cd−rom検索装置
JPH03282678A (ja) * 1990-01-12 1991-12-12 Sony Corp 記録媒体の再生装置及び再生方法並びに検索方法
JPH04123171A (ja) * 1990-12-25 1992-04-23 Sony Corp データ検索方法
JPH05257774A (ja) * 1992-03-10 1993-10-08 Fujitsu Ltd インデックス・レコード番号を圧縮・格納した情報検索装置
JPH05266067A (ja) * 1992-03-24 1993-10-15 Matsushita Electric Ind Co Ltd データ検索装置
JPH06187376A (ja) * 1992-12-22 1994-07-08 Matsushita Electric Ind Co Ltd 文字列検索装置
JPH06266772A (ja) * 1993-03-11 1994-09-22 Matsushita Electric Ind Co Ltd 検索装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6458018A (en) * 1987-08-28 1989-03-06 Hitachi Ltd Method and device for retrieving data
JPH0239224A (ja) * 1988-07-28 1990-02-08 Seiko Epson Corp Cd−rom検索装置
JPH03282678A (ja) * 1990-01-12 1991-12-12 Sony Corp 記録媒体の再生装置及び再生方法並びに検索方法
JPH04123171A (ja) * 1990-12-25 1992-04-23 Sony Corp データ検索方法
JPH05257774A (ja) * 1992-03-10 1993-10-08 Fujitsu Ltd インデックス・レコード番号を圧縮・格納した情報検索装置
JPH05266067A (ja) * 1992-03-24 1993-10-15 Matsushita Electric Ind Co Ltd データ検索装置
JPH06187376A (ja) * 1992-12-22 1994-07-08 Matsushita Electric Ind Co Ltd 文字列検索装置
JPH06266772A (ja) * 1993-03-11 1994-09-22 Matsushita Electric Ind Co Ltd 検索装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1173426A (ja) * 1997-08-29 1999-03-16 Tokkyo Joho Shuppan:Kk 文章照合装置
WO2008090606A1 (ja) * 2007-01-24 2008-07-31 Fujitsu Limited 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法
US9087118B2 (en) 2007-01-24 2015-07-21 Fujitsu Limited Information search apparatus, and information search method, and computer product

Also Published As

Publication number Publication date
JP3720882B2 (ja) 2005-11-30

Similar Documents

Publication Publication Date Title
US5544049A (en) Method for performing a search of a plurality of documents for similarity to a plurality of query words
US6523030B1 (en) Sort system for merging database entries
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
JPH0525138B2 (ja)
JPH0944523A (ja) 関連語提示装置
US5682543A (en) Dictionary editing apparatus
JPH05101102A (ja) 検索装置
JP3720882B2 (ja) 情報検索方法、情報検索システム及び情報検索装置
JP3665112B2 (ja) 文字列検索方法及び装置
JP2000207404A (ja) 文書検索方法及び装置並びに記録媒体
JP4024906B2 (ja) タグ付文書検索システム
JP3848014B2 (ja) 文書検索方法および文書検索装置
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
JP3187671B2 (ja) 電子辞書表示装置
JP2831837B2 (ja) 文書検索装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JPH09212523A (ja) 全文検索方法
JPH03118661A (ja) 単語検索装置
JPH08249341A (ja) 文書データベースの文書格納・検索装置
JPH07262198A (ja) 文書検索装置
JPH0462664A (ja) データ検索装置
JPH06215038A (ja) データベース検索装置
JPH0746353B2 (ja) 日本語文章入力装置
JPH0973454A (ja) 文書作成装置及び文書作成方法
JPH0721212A (ja) 文書処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041102

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050316

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050622

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080916

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090916

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090916

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100916

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100916

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110916

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120916

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130916

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees