JPH06187374A - 検索方式 - Google Patents

検索方式

Info

Publication number
JPH06187374A
JPH06187374A JP4333950A JP33395092A JPH06187374A JP H06187374 A JPH06187374 A JP H06187374A JP 4333950 A JP4333950 A JP 4333950A JP 33395092 A JP33395092 A JP 33395092A JP H06187374 A JPH06187374 A JP H06187374A
Authority
JP
Japan
Prior art keywords
text
keyword
record
attribute
index file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4333950A
Other languages
English (en)
Inventor
正哉 ▲高▼島田
Masaya Takashimada
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HOKKAIDO NIPPON DENKI SOFTWARE KK
NEC Solution Innovators Ltd
Original Assignee
HOKKAIDO NIPPON DENKI SOFTWARE KK
NEC Software Hokkaido Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HOKKAIDO NIPPON DENKI SOFTWARE KK, NEC Software Hokkaido Ltd filed Critical HOKKAIDO NIPPON DENKI SOFTWARE KK
Priority to JP4333950A priority Critical patent/JPH06187374A/ja
Publication of JPH06187374A publication Critical patent/JPH06187374A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 予め決められたキーワードだけでなく、類似
したキーワードからも目的とするテキストを検索できる
ようにする。 【構成】 登録時には、テキスト入力手段111でテキ
ストを受取り、テキスト格納番号取得手段112でテキ
ストファイルに格納する。キーワード・属性入力手段1
13で検索のキーワードとその属性とを受取り、テキス
ト格納番号とキーワードと属性との関連をインデックス
ファイル13に格納する。検索時には、キーワード入力
手段121でキーワードを受取ると、キーワード検索手
段122,および全該当テキスト格納番号取得手段12
3で、キーワードから属性,属性から類似キーワードを
捜し、該当するテキスト格納番号をビットマップ生成手
段124を介して決定し、該当テキスト取得手段15に
よりテキストを得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は検索方式、特に検索しよ
うとするテキストのキーワードが不明であっても類似し
たキーワードを与えることにより目的とするテキストを
検索する検索方式に関する。
【0002】
【従来の技術】従来の検索方式は図2(a)にテキスト
登録時の構成図を示すように、テキストとそれを検索す
るためのキーワードとを入力装置21から受取るテキス
ト・キーワード入力手段211と、テキストをテキスト
格納ファイル22に格納し、そのテキストを一意に決定
する番号を取得するテキスト格納番号取得手段212
と、インデックスファイル23に存在する同一のキーワ
ードを有するインデックスレコードに、テキスト格納番
号取得手段212で得られた番号を追加し、インデック
スファイル23を更新するインデックスファイル更新手
段213とを有し、図2(b)にテキスト検索時の構成
図を示すように、検索対象となるキーワードを入力装置
21から受取るキーワード入力手段221と、受取った
キーワードをインデックスファイル23から捜し出し、
そのキーワードを含むテキストの格納番号をもとにテキ
スト格納ファイル22から該当テキストを取得する該当
テキスト取得手段223とを有して構成されている。
【0003】この従来の検索方式では、登録時において
は、テキスト・キーワード入力手段211により、入力
装置21から格納すべきテキストおよび検索時にキーと
して使用されるキーワードを入力する。次に、テキスト
格納番号取得手段212では、受取ったテキストをテキ
スト格納ファイル22に格納し、そのテキストをファイ
ル中で一意に決定する格納番号を取得する。次に、イン
デックスファイル更新手段213では受取ったキーワー
ドと同一のキーワードをもつインデックスレコードをイ
ンデックスファイル23から捜し出し、そのレコードに
テキスト格納番号取得手段212で得られた格納番号を
追加し、インデックスファイル23を更新する。検索時
においては、キーワード入力手段221により、検索の
ためのキーとなるキーワードを入力装置21から受取
る。次に、テキスト格納番号取得手段222では、受取
ったキーワードと同一のキーワードをもつレコードをイ
ンデックスファイル23から捜し出し、そのレコード中
に存在するこのキーワードをキーとするテキストの格納
番号を取得する。次に、該当テキスト取得手段223で
は、テキスト格納番号取得手段222で得られた格納番
号をもとに、テキスト格納ファイル22から該当するテ
キストを取得するようにしている。
【0004】
【発明が解決しようとする課題】上述した従来の検索方
式は、テキスト登録時にテキストをテキスト格納ファイ
ル中で一意に決定する格納番号と、検索のためのキーワ
ードとを直接対応させてインデックスファイルに登録す
るために、検索時には、そのキーワードと完全に一致し
た文字列を検索用のキーとして与えない限り、目的とす
るテキストに付けられた格納番号が得られず、その結
果、目的のテキストを取出すことができないという欠点
を有している。
【0005】
【課題を解決するための手段】本発明の検索方式は、キ
ーワードを与えることにより文字列で構成されるテキス
トを検索する検索方式において、入力装置から文字列で
構成されるテキストを受取るテキスト入力手段と、受取
ったテキストをテキスト格納ファイルに格納し、そのテ
キストを一意に決定する番号を取得するテキスト格納番
号取得手段と、入力装置から前記テキストを構成するキ
ーワードとその属性とを受取るキーワード・属性入力手
段と、このキーワード・属性入力手段が受取ったキーワ
ードと同じ属性を有するレコードをインデックスファイ
ルから捜し出し、そのレコードからリンクされているキ
ーワードのレコード群の最後に新たにレコードを追加
し、インデックスファイルを更新するインデックスファ
イル更新手段と、入力装置から検索の対象となるキーワ
ードを受取るキーワード入力手段と、このキーワード入
力手段が受取ったキーワードを構成要素とするレコード
を前記インデックスファイルから捜し出し、そのレコー
ドからリンクされている属性を構成要素とするレコード
を取出し、属性を取得するキーワード検索手段と、この
キーワード検索手段で得られた属性をもとに、再度前記
インデックスファイルを検索し、同一属性をもつレコー
ドからリンクされている全てのキーワードレコードを捜
し出し、その各キーワードレコードから更にリンクされ
ている該当テキストの格納番号を構成要素とするレコー
ドから、テキストの格納番号の全てを取得する全該当テ
キスト番号取得手段と、この全該当テキスト番号取得手
段が取得した全ての格納番号をビット列により表現し、
論理和をとることにより該当テキストの格納番号を得る
ビットマップ生成手段と、このビットマップ生成手段で
得られたテキスト格納番号をもとに前記テキスト格納フ
ァイルを検索してテキストを取得する該当テキスト取得
手段とを有することにより構成される。
【0006】
【実施例】次に、本発明について図面を参照して説明す
る。
【0007】図1は本発明の一実施例の構成図である。
図1(a)はテキスト登録時の構成図で、テキストを入
力装置11から受取るテキスト入力手段111と、テキ
ストをテキスト格納ファイル12に格納し、そのテキス
トをファイル内で一意に決定するテキスト格納番号を取
得するテキスト格納番号取得手段112と、入力装置1
1からテキストを検索するためのキーワードと属性とを
受取るキーワード・属性入力手段113と、キーワード
属性入力手段113で受取った属性と同じ属性をもつ属
性レコードをインデックスファイルから捜し出し、キー
ワードとテキストとの格納番号をそのインデックスレコ
ードからリンクされているレコード群の最後に追加し、
インデックスファイルを更新するインデックスファイル
更新手段114とから構成される。図1(b)はテキス
ト検索時の構成図で、検索のためのキーワードを入力装
置11から受取るキーワード入力手段121と、キーワ
ード入力手段121が受取ったキーワードを含むキーワ
ードレコードをインデックスファイル13から捜し出
し、該当レコードにリンクされている属性を構成要素と
してもつレコードを取出すキーワード検索手段122
と、キーワード検索手段122で得られた属性をもとに
インデックスファイル13を検索し、同一の属性を構成
要素としているレコードからリンクされている各キーワ
ードのレコードを順次取出し、そのレコードから更にリ
ンクされている該当するテキストの格納番号を構成要素
とするレコードを取出す全該当テキスト格納番号取得手
段123と、全該当テキスト格納番号取得手段123で
取出された該当する全てのテキスト格納番号からビット
マップを生成し、論理演算を施すことにより、取出すテ
キストの格納番号を入手するビットマップ生成手段12
4と、ビットマップ生成手段124で入手した該当する
テキストの格納番号をもとに、テキスト格納ファイル1
2からテキストを取出す該当テキスト取得手段125と
から構成される。
【0008】図3〜図9は図1の実施例の動作を説明す
るための図で、以下図3〜図9を参照して図1の動作に
ついて説明を進める。まず図3(a)に示すように、テ
キスト入力手段111は入力装置11からテキストを受
取る。テキスト格納番号取得手段112は受取ったテキ
ストをテキスト格納ファイル12に格納し、ファイル中
でそのテキストが一意に決まるように格納された順番に
付けられている番号を取得する。図3(a)の例では、
初めての格納であるため“1”を格納番号として得てい
る。次に、図3(b)に示すように、キーワード・属性
入力手段113は入力装置11からテキストの検索キー
ワードとなる文字列とその属性とを受取る。図3(b)
の例では“桜”という文字をキーワードとし、その属性
には“植物”を採用している場合を示している。なお、
ここでいう属性とは、キーワードがもつ意味を広い意味
で解釈した場合に、それが属するカテゴリに付けられる
名称である。つまり、この例では“植物”の一種として
“桜”があることを示し、また“桜”は“植物”という
属性をもつことを示している。インデックスファイル更
新手段114は、先きにテキスト格納番号取得手段11
2で得られた格納番号と、キーワード・属性入力手段1
13で得られたキーワードおよび属性とからインデック
スファイル13を更新する。
【0009】インデックスファイル13の更新には、ま
ず図4(a)に示すように、属性を構成要素とする属性
レコードへのポインタを有する検索レコードがインデッ
クスファイル13中に存在していないために、新たに
“植物”をデータとしてもつ属性レコードを生成する。
その後、属性レコードへのポインタをデータとする検索
レコードを生成する。なお、各レコードの“/”はレコ
ードの終端を示す。次に図4(b)に示すように、
“桜”をデータとしてもつキーワードレコードを生成
し、その後属性レコードにキーワードレコードへのポイ
ンタを格納する。キーワードレコードには、自分自身が
リンクされている先のレコードへのポインタも格納す
る。次に図3(b)のインデックスファイル13に示す
ように、格納番号“1”をデータとしてもつ格納番号レ
コードを生成し、その後、キーワードレコードに格納番
号レコードへのポインタを格納する。これで1件目のテ
キストの登録が完了する。
【0010】図5は2件目のテキストの登録によるイン
デックスファイル13の更新の結果の例を示している。
図5(a)は2件目のテキストである“北海道では桜と
梅がほど同時に開花します”を登録した場合のテキスト
格納ファイル12の内容を、図5(b)は図2(a)に
対応するインデックスファイル13の状態を示してい
る。ここでキーワードは“桜”および“梅”とし、その
属性は共に“植物”としている。2件目のテキストには
格納番号として“2”が与えられ、テキスト格納ファイ
ル12に格納する。インデックスファイル13では、
“桜”をデータとしてもつキーワードレコードからリン
クされている格納番号レコードに“2”を追加し、更に
“梅”をデータとしてもつキーワードレコードおよびそ
の格納番号レコードを生成し、リンクする。
【0011】図6はテキストの登録を繰返し、8種類の
テキストを登録した場合のテキスト格納ファイル12の
状態例を示している。なおテキスト中のアンダーライン
で示した語彙はキーワードを示している。図7は図6の
テキストの登録におけるインデックスファイル13の状
態を示している。
【0012】図8および図9は図6および図7において
登録されたテキストから任意のテキストを検索する動作
を説明するための図である。まず図8に示すように、キ
ーワード入力手段121において入力装置11から検索
のためのキーワードとして“天気”を受取ったとする。
キーワード検索手段122では、受取った“天気”をイ
ンデックスファイル13から捜し出し、該当するキーワ
ードレコードとリンクされている属性レコードから“気
象”という属性を取得する。次に図9に示すように全該
当テキスト格納番号取得手段123において、再びイン
デックスファイル7からキーワード検索手段122で取
得した属性をデータとしてもつ属性レコードを捜し出
し、そのレコードからリンクされている全てのキーワー
ドレコードを順次辿り、各キーワードレコードからリン
クされている格納番号レコードのデータを取得する。図
7に示したインデックスファイル13では“気象”とい
う属性をもつキーワードである“天候”、“天気”、
“通り雨”、“雨天”が選択さ、その各キーワードレコ
ードから格納番号“3”、“8”、“5”、“7”、
“8”が得られる。次に、ビットマップ生成手段124
では、各キーワードレコード単位に全テキスト数分のビ
ット数の記憶領域確保し、そのキーワードレコードから
リンクされている格納番号レコード中の番号に対応する
ビットを“1”にするビットマップを生成し、各キーワ
ードレコード単位にとられたビット列については全体で
論理和をとって、重複している番号を一つにまとめる。
図7のインデックスファイル13の属性レコード“気
象”に基づいて作られた図9に示すビットマップでは
“8”が重複しているが、論理和を施すことによって
“3”、“5”、“7”、“8”の各ビットが“1”と
なっている。次に、該当テキスト取得手段125では、
各ビットの“1”になっている番号のテキストをテキス
ト格納ファイル12から取出す。
【0013】
【発明の効果】以上説明したように本発明の検索方式
は、キーワードに属性を付加することによって、“天
気”、“天候”のように同一の意味をもちながら、従来
キーワードが異なると検索できなかった問題を回避する
ことができるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成図である。
【図2】従来の代表的な検索方式の構成図である。
【図3】図1の実施例を説明するための図である。
【図4】図1の実施例を説明するための図である。
【図5】図1の実施例を説明するための図である。
【図6】図1の実施例を説明するための図である。
【図7】図1の実施例を説明するための図である。
【図8】図1の実施例を説明するための図である。
【図9】図1の実施例を説明するための図である。
【符号の説明】
11,21 入力装置 12,22 テキスト格納ファイル 13,23 インデックスファイル 111 テキスト入力手段 112,212,222 テキスト格納番号取得手段 113 キーワード・属性入力手段 114,213 インデックスファイル更新手段 121,221 キーワード入力手段 122 キーワード検索手段 123 全該当テキスト格納番号取得手段 124 ビットマップ生成手段 125,223 該当テキスト取得手段 211 テキスト・キーワード入力手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 キーワードを与えることにより文字列で
    構成されるテキストを検索する検索方式において、入力
    装置から文字列で構成されるテキストを受取るテキスト
    入力手段と、受取ったテキストをテキスト格納ファイル
    に格納し、そのテキストを一意に決定する番号を取得す
    るテキスト格納番号取得手段と、入力装置から前記テキ
    ストを構成するキーワードとその属性とを受取るキーワ
    ード・属性入力手段と、このキーワード・属性入力手段
    が受取ったキーワードと同じ属性を有するレコードをイ
    ンデックスファイルから捜し出し、そのレコードからリ
    ンクされているキーワードのレコード群の最後に新たに
    レコードを追加し、インデックスファイルを更新するイ
    ンデックスファイル更新手段と、入力装置から検索の対
    象となるキーワードを受取るキーワード入力手段と、こ
    のキーワード入力手段が受取ったキーワードを構成要素
    とするレコードを前記インデックスファイルから捜し出
    し、そのレコードからリンクされている属性を構成要素
    とするレコードを取出し、属性を取得するキーワード検
    索手段と、このキーワード検索手段で得られた属性をも
    とに、再度前記インデックスファイルを検索し、同一属
    性をもつレコードからリンクされている全てのキーワー
    ドレコードを捜し出し、その各キーワードレコードから
    更にリンクされている該当テキストの格納番号を構成要
    素とするレコードから、テキストの格納番号の全てを取
    得する全該当テキスト番号取得手段と、この全該当テキ
    スト番号取得手段が取得した全ての格納番号をビット列
    により表現し、論理和をとることにより該当テキストの
    格納番号を得るビットマップ生成手段と、このビットマ
    ップ生成手段で得られたテキスト格納番号をもとに前記
    テキスト格納ファイルを検索してテキストを取得する該
    当テキスト取得手段とを有することを特徴とする検索方
    式。
JP4333950A 1992-12-15 1992-12-15 検索方式 Withdrawn JPH06187374A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4333950A JPH06187374A (ja) 1992-12-15 1992-12-15 検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4333950A JPH06187374A (ja) 1992-12-15 1992-12-15 検索方式

Publications (1)

Publication Number Publication Date
JPH06187374A true JPH06187374A (ja) 1994-07-08

Family

ID=18271796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4333950A Withdrawn JPH06187374A (ja) 1992-12-15 1992-12-15 検索方式

Country Status (1)

Country Link
JP (1) JPH06187374A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008251008A (ja) * 2007-03-29 2008-10-16 Nhn Corp 露出用広告情報を提供する方法及びそのシステム
WO2009154153A1 (ja) 2008-06-18 2009-12-23 日立ソフトウエアエンジニアリング株式会社 文書検索システム
JP2018508885A (ja) * 2015-07-29 2018-03-29 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 情報プッシュ方法及び装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008251008A (ja) * 2007-03-29 2008-10-16 Nhn Corp 露出用広告情報を提供する方法及びそのシステム
WO2009154153A1 (ja) 2008-06-18 2009-12-23 日立ソフトウエアエンジニアリング株式会社 文書検索システム
US8407232B2 (en) 2008-06-18 2013-03-26 Hitachi Solutions, Ltd. Document search system
JP2018508885A (ja) * 2015-07-29 2018-03-29 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 情報プッシュ方法及び装置

Similar Documents

Publication Publication Date Title
US7143086B2 (en) File search method and apparatus, and index file creation method and device
JP2001014329A (ja) データベース処理方法及び実施装置並びにその処理プログラムを記憶した媒体
CN110060472A (zh) 道路交通事件定位方法、***、可读存储介质和设备
JPH06187374A (ja) 検索方式
JPH0869476A (ja) 検索システム
JPH0773197A (ja) 異表記語辞書作成支援装置
JPH07234879A (ja) 情報処理装置及びデータベース検索方法
JPH07210569A (ja) 情報検索方法および情報検索装置
JPH09305622A (ja) 文書検索機能を有するデータベース管理方法およびシステム
JP3825829B2 (ja) 登録情報検索装置及びその方法
JP3627850B2 (ja) 文書検索装置
JP2003316792A (ja) 知識構造型データ検索システム
JPH08115340A (ja) 文書検索装置およびそれに用いるインデックスファイルの作成装置
JPH07200622A (ja) 情報管理システム
JP2003122794A (ja) 全文検索装置、全文検索方法、プログラム、及び記録媒体
JP2003316794A (ja) データ収集格納方式
JPH09305619A (ja) 階層インデックス検索装置、及び文書検索方法
JP2548119B2 (ja) 情報検索装置
JPH06309368A (ja) 文書検索装置
JPH05181719A (ja) 可変長データの格納および参照システム
CN113886650A (zh) 地址查询方法、***、设备及存储介质
JPH05158984A (ja) 文字列抽出装置
KR100210634B1 (ko) 윈도우모드를 위한 검색레코드 연결방법
JP2000331011A (ja) データ管理装置、データ検索方法及び記録媒体
JPH0659950A (ja) データベースシステム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000307