JPWO2008090606A1 - 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法 - Google Patents
情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法 Download PDFInfo
- Publication number
- JPWO2008090606A1 JPWO2008090606A1 JP2008554930A JP2008554930A JPWO2008090606A1 JP WO2008090606 A1 JPWO2008090606 A1 JP WO2008090606A1 JP 2008554930 A JP2008554930 A JP 2008554930A JP 2008554930 A JP2008554930 A JP 2008554930A JP WO2008090606 A1 JPWO2008090606 A1 JP WO2008090606A1
- Authority
- JP
- Japan
- Prior art keywords
- search
- keyword
- index file
- character
- notation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
102 文字出現マップ
103 非ソート型インデックスファイル群
104 非ソート型インデックスファイル
105 見出し語候補リスト
500 情報検索装置
501 入力部
502 検出部
503 検索部
504 特定部
505 出力部
506 選択部
507 本文抽出部
510 本文ファイル群
1200 先頭文字出現マップ
1300 末尾文字出現マップ
(情報検索処理の概要)
まず、この発明の実施の形態1にかかる情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法に関する情報検索処理の概要について説明する。図1は、この発明の実施の形態1にかかる情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法に関する情報検索処理の概要を示す説明図である。
つぎに、この発明の実施の形態1にかかる情報検索装置のハードウェア構成について説明する。図2は、この発明の実施の形態1にかかる情報検索装置のハードウェア構成を示すブロック図である。図2において、情報検索装置は、CPU201と、ROM202と、RAM203と、HDD(ハードディスクドライブ)204と、HD(ハードディスク)205と、FDD(フレキシブルディスクドライブ)206と、着脱可能な記録媒体の一例としてのFD(フレキシブルディスク)207と、ディスプレイ208と、I/F(インターフェース)209と、キーボード210と、マウス211と、スキャナ212と、プリンタ213と、を備えている。また、各構成部はバス200によってそれぞれ接続されている。
つぎに、図1に示した文字出現マップ102について説明する。図3は、図1に示した文字出現マップ102を示す説明図である。図3において、文字出現マップ102は、文字ごとにフラグ列を有する。フラグ列を構成するフラグは、非ソート型インデックスファイルのファイルID(i=0〜n)が昇順で配列されており、「1」である場合、その文字がそのファイルIDの非ソート型インデックスファイルに存在することを示している。
つぎに、図1に示した非ソート型インデックスファイル群103について説明する。図4は、図1に示した非ソート型インデックスファイル群103を示す説明図である。図4において、非ソート型インデックスファイル群103は、n+1個の非ソート型インデックスファイルF0〜Fnの集合である。
つぎに、この発明の実施の形態1にかかる情報検索装置の機能的構成について説明する。図5は、この発明の実施の形態1にかかる情報検索装置の機能的構成を示すブロック図である。図5において、情報検索装置500は、本文ファイル群510と、入力部501と、検出部502と、検索部503と、特定部504と、選択部506と、出力部505と、本文抽出部507と、から構成されている。
つぎに、この発明の実施の形態1にかかる情報検索処理手順について説明する。図10は、この発明の実施の形態1にかかる情報検索処理手順を示すフローチャートである。図10において、まず、入力部501により、K個(K≧1)の検索キーワードの入力を受け付け(ステップS1001)、検索開始入力を待ち受ける(ステップS1002:No)。
つぎに、図10に示した見出し語検索処理(ステップS1004)の処理手順について説明する。図11は、図10に示した見出し語検索処理(ステップS1004)の処理手順を示すフローチャートである。まず、インデックスファイル群103のファイルID:iをi=0、表記キーワード等番号jをj=1、検索キーワード番号kをk=1とする。(ステップS1101)。
つぎに、この発明の実施の形態2にかかる情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法に関する情報検索処理の概要について説明する。実施の形態1では、文字出現マップ102を用いて見出し語の絞込み検索をおこなうこととしているため、絞込み検索には有効であるが、実施の形態2では、さらに、前方一致検索、後方一致検索、および完全一致検索の高速化を実現する。たとえば、検索キーワードが一文字(特に、かな一文字)で始まったり終わったりする場合に実施の形態1よりも高速化を実現することができる。なお、この実施の形態2の説明では、実施の形態1との重複部分については説明を省略する。
つぎに、この発明の実施の形態2にかかる情報検索処理手順について説明する。図14は、この発明の実施の形態2にかかる情報検索処理手順(前半)を示すフローチャートである。
(情報検索処理の概要)
まず、この発明の実施の形態1にかかる情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法に関する情報検索処理の概要について説明する。図1は、この発明の実施の形態1にかかる情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法に関する情報検索処理の概要を示す説明図である。
つぎに、この発明の実施の形態1にかかる情報検索装置のハードウェア構成について説明する。図2は、この発明の実施の形態1にかかる情報検索装置のハードウェア構成を示すブロック図である。図2において、情報検索装置は、CPU201と、ROM202と、RAM203と、HDD(ハードディスクドライブ)204と、HD(ハードディスク)205と、FDD(フレキシブルディスクドライブ)206と、着脱可能な記録媒体の一例としてのFD(フレキシブルディスク)207と、ディスプレイ208と、I/F(インターフェース)209と、キーボード210と、マウス211と、スキャナ212と、プリンタ213と、を備えている。また、各構成部はバス200によってそれぞれ接続されている。
つぎに、図1に示した文字出現マップ102について説明する。図3は、図1に示した文字出現マップ102を示す説明図である。図3において、文字出現マップ102は、文字ごとにフラグ列を有する。フラグ列を構成するフラグは、非ソート型インデックスファイルのファイルID(i=0〜n)が昇順で配列されており、「1」である場合、その文字がそのファイルIDの非ソート型インデックスファイルに存在することを示している。
つぎに、図1に示した非ソート型インデックスファイル群103について説明する。図4は、図1に示した非ソート型インデックスファイル群103を示す説明図である。図4において、非ソート型インデックスファイル群103は、n+1個の非ソート型インデックスファイルF0〜Fnの集合である。
つぎに、この発明の実施の形態1にかかる情報検索装置の機能的構成について説明する。図5は、この発明の実施の形態1にかかる情報検索装置の機能的構成を示すブロック図である。図5において、情報検索装置500は、本文ファイル群510と、入力部501と、検出部502と、検索部503と、特定部504と、選択部506と、出力部505と、本文抽出部507と、から構成されている。
つぎに、この発明の実施の形態1にかかる情報検索処理手順について説明する。図10は、この発明の実施の形態1にかかる情報検索処理手順を示すフローチャートである。図10において、まず、入力部501により、K個(K≧1)の検索キーワードの入力を受け付け(ステップS1001)、検索開始入力を待ち受ける(ステップS1002:No)。
つぎに、図10に示した見出し語検索処理(ステップS1004)の処理手順について説明する。図11は、図10に示した見出し語検索処理(ステップS1004)の処理手順を示すフローチャートである。まず、インデックスファイル群103のファイルID:iをi=0、表記キーワード等番号jをj=1、検索キーワード番号kをk=1とする。(ステップS1101)。
つぎに、この発明の実施の形態2にかかる情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法に関する情報検索処理の概要について説明する。実施の形態1では、文字出現マップ102を用いて見出し語の絞込み検索をおこなうこととしているため、絞込み検索には有効であるが、実施の形態2では、さらに、前方一致検索、後方一致検索、および完全一致検索の高速化を実現する。たとえば、検索キーワードが一文字(特に、かな一文字)で始まったり終わったりする場合に実施の形態1よりも高速化を実現することができる。なお、この実施の形態2の説明では、実施の形態1との重複部分については説明を省略する。
つぎに、この発明の実施の形態2にかかる情報検索処理手順について説明する。図14は、この発明の実施の形態2にかかる情報検索処理手順(前半)を示すフローチャートである。
検索キーワードの入力を受け付けさせる入力工程と、
前記本文の項目順にしたがって見出し語の表記キーワードが前記見出し語ごとに記述されたインデックスファイルの中から、前記入力工程によって入力された検索キーワードを含む表記キーワードを検索させる検索工程と、
前記検索工程によって検索された表記キーワードに対応する見出し語を特定させる特定工程と、
前記特定工程によって特定された見出し語を出力させる出力工程と、
を前記コンピュータに実行させることを特徴とする情報検索プログラム。
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする付記1または2に記載の情報検索プログラム。
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする付記1または2に記載の情報検索プログラム。
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする付記5に記載の情報検索プログラム。
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする付記1または2に記載の情報検索プログラム。
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする付記7に記載の情報検索プログラム。
文字列中の末尾文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記末尾文字ごとに有する末尾文字出現マップに基づいて、前記検索キーワードを構成する末尾文字が存在するインデックスファイルを検出させる第2の検出工程とを、前記コンピュータに実行させ、
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする付記1または2に記載の情報検索プログラム。
前記検索工程は、
前記第1〜第3のいずれの検出工程によっても検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする付記9に記載の情報検索プログラム。
前記検索キーワードが複数存在する場合、前記インデックスファイルの中から一の検索キーワードを含む表記キーワードを検出させる第1のキーワード検出工程と、
前記第1のキーワード検出工程によって検出された表記キーワードの中から前記一の検索キーワード以外の他の検索キーワードを検出させる第2のキーワード検出工程と、を含み、
前記特定工程は、
前記第1および第2のキーワード検出工程によって検出された検出結果により、前記第1のキーワード検出工程によって検出された表記キーワードにすべての検索キーワードが含まれている場合、当該表記キーワードに対応する見出し語を特定させることを特徴とする付記1または2に記載の情報検索プログラム。
前記検索工程は、
前記インデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させ、
前記特定工程は、
前記検索工程によって検索された表記キーワード等に対応する見出し語を特定させることを特徴とする付記1または2に記載の情報検索プログラム。
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする付記12に記載の情報検索プログラム。
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする付記12に記載の情報検索プログラム。
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする付記14に記載の情報検索プログラム。
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする付記12に記載の情報検索プログラム。
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする付記16に記載の情報検索プログラム。
文字列中の末尾文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記末尾文字ごとに有する末尾文字出現マップに基づいて、前記検索キーワードを構成する末尾文字が存在するインデックスファイルを検出させる第2の検出工程とを、前記コンピュータに実行させ、
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする付記12に記載の情報検索プログラム。
前記検索工程は、
前記第1〜第3のいずれの検出工程によっても検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする付記18に記載の情報検索プログラム。
前記検索キーワードが複数存在する場合、前記検出工程によって検出されたインデックスファイルの中から一の検索キーワードを含む表記キーワード等を検出させる第1のキーワード検出工程と、
前記第1のキーワード検出工程によって検出された表記キーワード等の中から前記一の検索キーワード以外の他の検索キーワードを検出させる第2のキーワード検出工程と、を含み、
前記特定工程は、
前記第1および第2のキーワード検出工程によって検出された検出結果により、前記第1のキーワード検出工程によって検出された表記キーワード等にすべての検索キーワードが含まれている場合、当該表記キーワード等に対応する見出し語を特定させることを特徴とする付記12に記載の情報検索プログラム。
検索キーワードの入力を受け付ける入力手段と、
前記本文の項目順にしたがって見出し語の表記キーワードが前記見出し語ごとに記述されたインデックスファイルの中から、前記入力手段によって入力された検索キーワードを含む表記キーワードを検索する検索手段と、
前記検索手段によって検索された表記キーワードに対応する見出し語を特定する特定手段と、
前記特定手段によって特定された見出し語を出力する出力手段と、
を備えることを特徴とする情報検索装置。
検索キーワードの入力を受け付ける入力工程と、
前記本文の項目順にしたがって見出し語の表記キーワードが前記見出し語ごとに記述されたインデックスファイルの中から、前記入力工程によって入力された検索キーワードを含む表記キーワードを検索する検索工程と、
前記検索工程によって検索された表記キーワードに対応する見出し語を特定する特定工程と、
前記特定工程によって特定された見出し語を出力する出力工程と、
を含んだことを特徴とする情報検索方法。
102 文字出現マップ
103 非ソート型インデックスファイル群
104 非ソート型インデックスファイル
105 見出し語候補リスト
500 情報検索装置
501 入力部
502 検出部
503 検索部
504 特定部
505 出力部
506 選択部
507 本文抽出部
510 本文ファイル群
1200 先頭文字出現マップ
1300 末尾文字出現マップ
Claims (23)
- 本文ファイル内に項目順に記述されている本文の検索をコンピュータに実行させる情報検索プログラムにおいて、
検索キーワードの入力を受け付けさせる入力工程と、
前記本文の項目順にしたがって見出し語の表記キーワードが前記見出し語ごとに記述されたインデックスファイルの中から、前記入力工程によって入力された検索キーワードを含む表記キーワードを検索させる検索工程と、
前記検索工程によって検索された表記キーワードに対応する見出し語を特定させる特定工程と、
前記特定工程によって特定された見出し語を出力させる出力工程と、
を前記コンピュータに実行させることを特徴とする情報検索プログラム。 - 前記インデックスファイルは、前記表記キーワードが文字コード順にソートされていない非ソート型インデックスファイルであることを特徴とする請求項1に記載の情報検索プログラム。
- 前記インデックスファイルは、当該インデックスファイル間に階層関係がない非階層型インデックスファイルであることを特徴とする請求項1または2に記載の情報検索プログラム。
- 文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記文字ごとに有する文字出現マップに基づいて、前記検索キーワードを構成する文字がすべて存在するインデックスファイルを検出させる検出工程を前記コンピュータに実行させ、
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする請求項1または2に記載の情報検索プログラム。 - 前記検索キーワードとの前方一致検索を前記コンピュータに実行させる場合、文字列中の先頭文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記先頭文字ごとに有する先頭文字出現マップに基づいて、前記検索キーワードを構成する先頭文字が存在するインデックスファイルを検出させる検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする請求項1または2に記載の情報検索プログラム。 - 前記検出工程(以下、「第1の検出工程」という)のほか、文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記文字ごとに有する文字出現マップに基づいて、前記検索キーワードを構成する前記先頭文字以外の残余の文字がすべて存在するインデックスファイルを検出させる第2の検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする請求項5に記載の情報検索プログラム。 - 前記検索キーワードとの後方一致検索を前記コンピュータに実行させる場合、文字列中の末尾文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記末尾文字ごとに有する末尾文字出現マップに基づいて、前記検索キーワードを構成する末尾文字が存在するインデックスファイルを検出させる検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする請求項1または2に記載の情報検索プログラム。 - 前記検出工程(以下、「第1の検出工程」という)のほか、文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記文字ごとに有する文字出現マップに基づいて、前記検索キーワードを構成する前記末尾文字以外の残余の文字がすべて存在するインデックスファイルを検出させる第2の検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする請求項7に記載の情報検索プログラム。 - 前記検索キーワードとの完全一致検索を前記コンピュータに実行させる場合、文字列中の先頭文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記先頭文字ごとに有する先頭文字出現マップに基づいて、前記検索キーワードを構成する先頭文字が存在するインデックスファイルを検出させる第1の検出工程と、
文字列中の末尾文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記末尾文字ごとに有する末尾文字出現マップに基づいて、前記検索キーワードを構成する末尾文字が存在するインデックスファイルを検出させる第2の検出工程とを、前記コンピュータに実行させ、
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする請求項1または2に記載の情報検索プログラム。 - 文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記文字ごとに有する文字出現マップに基づいて、前記検索キーワードを構成する前記先頭文字および前記末尾文字以外の残余の文字がすべて存在するインデックスファイルを検出させる第3の検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記第1〜第3のいずれの検出工程によっても検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワードを検索させることを特徴とする請求項9に記載の情報検索プログラム。 - 前記検索工程は、
前記検索キーワードが複数存在する場合、前記インデックスファイルの中から一の検索キーワードを含む表記キーワードを検出させる第1のキーワード検出工程と、
前記第1のキーワード検出工程によって検出された表記キーワードの中から前記一の検索キーワード以外の他の検索キーワードを検出させる第2のキーワード検出工程と、を含み、
前記特定工程は、
前記第1および第2のキーワード検出工程によって検出された検出結果により、前記第1のキーワード検出工程によって検出された表記キーワードにすべての検索キーワードが含まれている場合、当該表記キーワードに対応する見出し語を特定させることを特徴とする請求項1または2に記載の情報検索プログラム。 - 前記インデックスファイルには、前記見出し語の表記キーワードとともに、当該見出し語の読みに関するキーワード(以下、「表記キーワード等」という)が記述されており、
前記検索工程は、
前記インデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させ、
前記特定工程は、
前記検索工程によって検索された表記キーワード等に対応する見出し語を特定させることを特徴とする請求項1または2に記載の情報検索プログラム。 - 文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記文字ごとに有する文字出現マップに基づいて、前記検索キーワードを構成する文字がすべて存在するインデックスファイルを検出させる検出工程を前記コンピュータに実行させ、
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする請求項12に記載の情報検索プログラム。 - 前記検索キーワードとの前方一致検索を前記コンピュータに実行させる場合、文字列中の先頭文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記先頭文字ごとに有する先頭文字出現マップに基づいて、前記検索キーワードを構成する先頭文字が存在するインデックスファイルを検出させる検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする請求項12に記載の情報検索プログラム。 - 前記検出工程(以下、「第1の検出工程」という)のほか、文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記文字ごとに有する文字出現マップに基づいて、前記検索キーワードを構成する前記先頭文字以外の残余の文字がすべて存在するインデックスファイルを検出させる第2の検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする請求項14に記載の情報検索プログラム。 - 前記検索キーワードとの後方一致検索を前記コンピュータに実行させる場合、文字列中の末尾文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記末尾文字ごとに有する末尾文字出現マップに基づいて、前記検索キーワードを構成する末尾文字が存在するインデックスファイルを検出させる検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする請求項12に記載の情報検索プログラム。 - 前記検出工程(以下、「第1の検出工程」という)のほか、文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記文字ごとに有する文字出現マップに基づいて、前記検索キーワードを構成する前記末尾文字以外の残余の文字がすべて存在するインデックスファイルを検出させる第2の検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする請求項16に記載の情報検索プログラム。 - 前記検索キーワードとの完全一致検索を前記コンピュータに実行させる場合、文字列中の先頭文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記先頭文字ごとに有する先頭文字出現マップに基づいて、前記検索キーワードを構成する先頭文字が存在するインデックスファイルを検出させる第1の検出工程と、
文字列中の末尾文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記末尾文字ごとに有する末尾文字出現マップに基づいて、前記検索キーワードを構成する末尾文字が存在するインデックスファイルを検出させる第2の検出工程とを、前記コンピュータに実行させ、
前記検索工程は、
前記第1の検出工程によって検出され、かつ前記第2の検出工程によって検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする請求項12に記載の情報検索プログラム。 - 文字の存否を前記インデックスファイルごとにあらわすフラグ列を前記文字ごとに有する文字出現マップに基づいて、前記検索キーワードを構成する前記先頭文字および前記末尾文字以外の残余の文字がすべて存在するインデックスファイルを検出させる第3の検出工程を、前記コンピュータに実行させ、
前記検索工程は、
前記第1〜第3のいずれの検出工程によっても検出されたインデックスファイルの中から、前記検索キーワードを含む表記キーワード等を検索させることを特徴とする請求項18に記載の情報検索プログラム。 - 前記検索工程は、
前記検索キーワードが複数存在する場合、前記検出工程によって検出されたインデックスファイルの中から一の検索キーワードを含む表記キーワード等を検出させる第1のキーワード検出工程と、
前記第1のキーワード検出工程によって検出された表記キーワード等の中から前記一の検索キーワード以外の他の検索キーワードを検出させる第2のキーワード検出工程と、を含み、
前記特定工程は、
前記第1および第2のキーワード検出工程によって検出された検出結果により、前記第1のキーワード検出工程によって検出された表記キーワード等にすべての検索キーワードが含まれている場合、当該表記キーワード等に対応する見出し語を特定させることを特徴とする請求項12に記載の情報検索プログラム。 - 請求項1〜請求項20のいずれか一つに記載の情報検索プログラムを記録した前記コンピュータに読み取り可能な記録媒体。
- 本文ファイル内に項目順に記述されている本文の検索を実行する情報検索装置において、
検索キーワードの入力を受け付ける入力手段と、
前記本文の項目順にしたがって見出し語の表記キーワードが前記見出し語ごとに記述されたインデックスファイルの中から、前記入力手段によって入力された検索キーワードを含む表記キーワードを検索する検索手段と、
前記検索手段によって検索された表記キーワードに対応する見出し語を特定する特定手段と、
前記特定手段によって特定された見出し語を出力する出力手段と、
を備えることを特徴とする情報検索装置。 - 本文ファイル内に項目順に記述されている本文の検索を実行する情報検索方法において、
検索キーワードの入力を受け付ける入力工程と、
前記本文の項目順にしたがって見出し語の表記キーワードが前記見出し語ごとに記述されたインデックスファイルの中から、前記入力工程によって入力された検索キーワードを含む表記キーワードを検索する検索工程と、
前記検索工程によって検索された表記キーワードに対応する見出し語を特定する特定工程と、
前記特定工程によって特定された見出し語を出力する出力工程と、
を含んだことを特徴とする情報検索方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/051069 WO2008090606A1 (ja) | 2007-01-24 | 2007-01-24 | 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008090606A1 true JPWO2008090606A1 (ja) | 2010-05-13 |
JP5141560B2 JP5141560B2 (ja) | 2013-02-13 |
Family
ID=39644188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008554930A Expired - Fee Related JP5141560B2 (ja) | 2007-01-24 | 2007-01-24 | 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9087118B2 (ja) |
JP (1) | JP5141560B2 (ja) |
WO (1) | WO2008090606A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102053993B (zh) | 2009-11-10 | 2014-04-09 | 阿里巴巴集团控股有限公司 | 一种文本过滤方法及文本过滤*** |
JP5577809B2 (ja) * | 2010-04-14 | 2014-08-27 | アイシン・エィ・ダブリュ株式会社 | 施設検索装置及びプログラム |
JP6028392B2 (ja) * | 2012-05-24 | 2016-11-16 | 富士通株式会社 | 生成プログラム、生成方法、生成装置、検索プログラム、検索方法および検索装置 |
JP6065914B2 (ja) * | 2012-09-21 | 2017-01-25 | 富士通株式会社 | 制御プログラム、制御方法および制御装置 |
WO2015025467A1 (ja) * | 2013-08-21 | 2015-02-26 | Necソリューションイノベータ株式会社 | 文字列検索装置、文字列検索方法および文字列検索プログラム |
JP6677415B2 (ja) * | 2016-03-03 | 2020-04-08 | 富士通コネクテッドテクノロジーズ株式会社 | 文字入力装置及び文字入力プログラム |
US10909166B1 (en) * | 2017-11-03 | 2021-02-02 | Shutterstock, Inc. | Reverse search with manual composition |
JP7087537B2 (ja) | 2018-03-26 | 2022-06-21 | 日本電産トーソク株式会社 | 電磁弁、および流路装置 |
JP7293941B2 (ja) | 2019-07-22 | 2023-06-20 | ニデックパワートレインシステムズ株式会社 | 電磁弁、および流路装置 |
JP7293940B2 (ja) | 2019-07-22 | 2023-06-20 | ニデックパワートレインシステムズ株式会社 | 電磁弁、および流路装置 |
CN112527949B (zh) * | 2020-12-15 | 2023-01-13 | 建信金融科技有限责任公司 | 数据存储与检索方法、装置、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0931304A (ja) * | 1995-07-19 | 1997-02-04 | Alps Electric Co Ltd | 導電性樹脂 |
JPH0991297A (ja) * | 1995-09-26 | 1997-04-04 | Nippon Steel Corp | 文字列検索方法及び装置 |
JP2000231563A (ja) * | 1999-02-09 | 2000-08-22 | Hitachi Ltd | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2005158044A (ja) * | 2003-10-30 | 2005-06-16 | Fujitsu Ltd | 情報検索プログラム、当該プログラムを格納するコンピュータ読み取り可能な記録媒体、情報検索方法、および情報検索装置 |
WO2006123448A1 (ja) * | 2005-05-20 | 2006-11-23 | Fujitsu Limited | 情報検索プログラム |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5551049A (en) * | 1987-05-26 | 1996-08-27 | Xerox Corporation | Thesaurus with compactly stored word groups |
US4888730A (en) * | 1988-01-05 | 1989-12-19 | Smith Corona Corporation | Memory typewriter with count of overused words |
US5263174A (en) * | 1988-04-01 | 1993-11-16 | Symantec Corporation | Methods for quick selection of desired items from hierarchical computer menus |
US5008810A (en) * | 1988-09-29 | 1991-04-16 | Process Modeling Investment Corp. | System for displaying different subsets of screen views, entering different amount of information, and determining correctness of input dependent upon current user input |
JP2790466B2 (ja) * | 1988-10-18 | 1998-08-27 | 株式会社日立製作所 | 文字列検索方法及び装置 |
US5148366A (en) * | 1989-10-16 | 1992-09-15 | Medical Documenting Systems, Inc. | Computer-assisted documentation system for enhancing or replacing the process of dictating and transcribing |
JPH03185561A (ja) * | 1989-12-15 | 1991-08-13 | Ricoh Co Ltd | 欧文単語入力方法 |
US5305205A (en) * | 1990-10-23 | 1994-04-19 | Weber Maria L | Computer-assisted transcription apparatus |
US5235654A (en) * | 1992-04-30 | 1993-08-10 | International Business Machines Corporation | Advanced data capture architecture data processing system and method for scanned images of document forms |
US5530644A (en) * | 1992-05-20 | 1996-06-25 | Fuji Xerox Co., Ltd. | Data processing device |
DE69432575T2 (de) * | 1993-01-28 | 2004-03-18 | Kabushiki Kaisha Toshiba, Kawasaki | Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung |
JPH0877155A (ja) * | 1994-07-07 | 1996-03-22 | Sanyo Electric Co Ltd | 情報処理装置及び情報処理方法 |
JP3720882B2 (ja) * | 1995-09-26 | 2005-11-30 | 新日鉄ソリューションズ株式会社 | 情報検索方法、情報検索システム及び情報検索装置 |
US6064383A (en) * | 1996-10-04 | 2000-05-16 | Microsoft Corporation | Method and system for selecting an emotional appearance and prosody for a graphical character |
JP3622503B2 (ja) * | 1998-05-29 | 2005-02-23 | 株式会社日立製作所 | 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体 |
JP4253152B2 (ja) * | 2000-01-05 | 2009-04-08 | 三菱電機株式会社 | キーワード抽出装置 |
JP4006239B2 (ja) * | 2002-02-21 | 2007-11-14 | 株式会社日立製作所 | 文書の検索方法および検索システム |
JP2003323457A (ja) * | 2002-02-28 | 2003-11-14 | Ricoh Co Ltd | 文書検索装置、文書検索方法、プログラム及び記録媒体 |
JP4005425B2 (ja) * | 2002-06-28 | 2007-11-07 | 富士通株式会社 | 検索結果ランキング変更処理プログラム、検索結果ランキング変更処理プログラム記録媒体、およびコンテンツ検索処理方法 |
US7379928B2 (en) * | 2003-02-13 | 2008-05-27 | Microsoft Corporation | Method and system for searching within annotated computer documents |
JP4247026B2 (ja) * | 2003-03-28 | 2009-04-02 | 日立ソフトウエアエンジニアリング株式会社 | キーワード頻度算出方法及びそれを実行するプログラム |
JP2004348706A (ja) * | 2003-04-30 | 2004-12-09 | Canon Inc | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
US7149748B1 (en) * | 2003-05-06 | 2006-12-12 | Sap Ag | Expanded inverted index |
JP2005006120A (ja) * | 2003-06-12 | 2005-01-06 | Nec Saitama Ltd | 操作機能の検索手段を有する携帯電話機及び該携帯電話機の操作機能の検索方法 |
US7644076B1 (en) * | 2003-09-12 | 2010-01-05 | Teradata Us, Inc. | Clustering strings using N-grams |
JP2006134191A (ja) * | 2004-11-09 | 2006-05-25 | Hitachi Ltd | 文書検索方法およびそのシステム |
JP5309480B2 (ja) * | 2007-06-14 | 2013-10-09 | 沖電気工業株式会社 | 文字列入力装置、文字列入力方法およびプログラム |
-
2007
- 2007-01-24 JP JP2008554930A patent/JP5141560B2/ja not_active Expired - Fee Related
- 2007-01-24 WO PCT/JP2007/051069 patent/WO2008090606A1/ja active Application Filing
-
2009
- 2009-07-22 US US12/507,680 patent/US9087118B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0931304A (ja) * | 1995-07-19 | 1997-02-04 | Alps Electric Co Ltd | 導電性樹脂 |
JPH0991297A (ja) * | 1995-09-26 | 1997-04-04 | Nippon Steel Corp | 文字列検索方法及び装置 |
JP2000231563A (ja) * | 1999-02-09 | 2000-08-22 | Hitachi Ltd | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2005158044A (ja) * | 2003-10-30 | 2005-06-16 | Fujitsu Ltd | 情報検索プログラム、当該プログラムを格納するコンピュータ読み取り可能な記録媒体、情報検索方法、および情報検索装置 |
WO2006123448A1 (ja) * | 2005-05-20 | 2006-11-23 | Fujitsu Limited | 情報検索プログラム |
WO2006123429A1 (ja) * | 2005-05-20 | 2006-11-23 | Fujitsu Limited | 情報検索方法、装置、プログラム、該プログラムを記録した記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20090327284A1 (en) | 2009-12-31 |
US9087118B2 (en) | 2015-07-21 |
JP5141560B2 (ja) | 2013-02-13 |
WO2008090606A1 (ja) | 2008-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5141560B2 (ja) | 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法 | |
CN101369216B (zh) | 文字输入方法和文字输入*** | |
JP5241828B2 (ja) | 辞書の単語及び熟語の判定 | |
US20160026630A1 (en) | Character sequence map generating apparatus, information searching apparatus, character sequence map generating method, information searching method, and computer product | |
US9501557B2 (en) | Information generating computer product, apparatus, and method; and information search computer product, apparatus, and method | |
JP2007122719A (ja) | 複数の言語を連動する自動完成推薦語提供システムおよび方法 | |
CN103430172A (zh) | 检索装置、检索方法及程序 | |
CN1758211A (zh) | 把输入提供给计算设备的有效多方式的方法 | |
JP2007122403A (ja) | 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP3689954B2 (ja) | 異種コード文字列転記装置および電子辞書 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
CN101655846A (zh) | 中文输入法标点关联方法及装置 | |
JP2007025939A (ja) | 多言語文書検索装置および多言語文書検索方法、並びに、多言語文書を検索するプログラム | |
JP4491389B2 (ja) | 電子機器、プログラム、及びプログラムを記録した記録媒体 | |
CN1755589A (zh) | 基于按键和语音识别的文字输入方法及装置 | |
JP4783563B2 (ja) | インデックス生成プログラム、検索プログラム、インデックス生成方法、検索方法、インデックス生成装置および検索装置 | |
JP4682627B2 (ja) | 文書検索装置および方法 | |
JP4362492B2 (ja) | 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム | |
JP5184987B2 (ja) | 索引情報作成装置、索引情報作成方法及びプログラム | |
US7418442B1 (en) | Ink alternates and plain text search | |
JPH08115330A (ja) | 類似文書検索方法および装置 | |
JP4248828B2 (ja) | 文書処理装置、文書処理方法及び記録媒体 | |
JP2007087197A (ja) | 文書処理装置、文書処理方法およびプログラム | |
CN118170263A (zh) | 一种基于汉语拼音的藏文快速智能输入***及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111107 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120919 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121023 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121105 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5141560 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |