JPH0934903A - ファイル検索装置 - Google Patents

ファイル検索装置

Info

Publication number
JPH0934903A
JPH0934903A JP7181850A JP18185095A JPH0934903A JP H0934903 A JPH0934903 A JP H0934903A JP 7181850 A JP7181850 A JP 7181850A JP 18185095 A JP18185095 A JP 18185095A JP H0934903 A JPH0934903 A JP H0934903A
Authority
JP
Japan
Prior art keywords
character
character string
similar
image data
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7181850A
Other languages
English (en)
Inventor
Norihisa Kojima
島 紀 久 児
Makoto Okazaki
崎 誠 岡
Toshifumi Shintani
谷 敏 文 新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP7181850A priority Critical patent/JPH0934903A/ja
Priority to CN96190752A priority patent/CN1165571A/zh
Priority to PCT/JP1996/001954 priority patent/WO1997004409A1/ja
Publication of JPH0934903A publication Critical patent/JPH0934903A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 書類等に記載した情報を容易に格納でき、か
つ、検索が容易・確実なファイル検索装置を提供する。 【解決手段】 文字、記号、および図形をイメージデー
タとして入力するイメージ入力手段1と、イメージ入力
手段1によって読み込まれたイメージデータを、イメー
ジデータのまま記憶する記憶手段2と、イメージデータ
を、1ページに1イメージデータを表示する見出し付き
のファイルの形式で表示する表示手段3と、表示手段3
によって表示されたイメージデータの所定部分を範囲と
して指定する範囲指定手段4と、範囲指定手段4によっ
て指定された範囲内の画素の配列を文字データに変換す
る文字認識手段5と、文字認識手段5によって変換され
た文字データを文字データとして編集する編集手段7
と、を備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、書類等に記載され
た情報をコンピュータのデータとしてコンピュータに取
り込み、コンピュータの機能を利用してそれらの情報を
整理および活用するファイル検索装置に関する。
【0002】
【従来の技術】近年のコンピュータ技術の発達により、
書類等に記載された情報をコンピュータのデータとして
コンピュータに取り込み、書類等の保管場所を減少させ
るとともに、情報の有効活用を図る技術の開発が行われ
ている。
【0003】上記技術開発の結果として、イメージスキ
ャナを内蔵し、書類等に記載した情報をイメージデータ
として入力して格納しておくファイル検索装置が既に提
案されている。この従来のファイル検索装置は、イメー
ジスキャナによって書類をスキャンし、一回のスキャン
によって得られたイメージデータを1イメージデータと
し、各イメージデータごとに、あるいは所定数のイメー
ジデータ群ごとに検索用のキーワードをユーザに入力さ
せ、各イメージデータを検索用のキーワードとともに格
納するものであった。
【0004】この従来のファイル検索装置によれば、所
定の書類のイメージデータを検索するときは、ユーザが
検索したいキーワードを入力し、ファイル検索装置に備
えた検索手段によって検索したいキーワードと同一また
は部分的に同一の検索用キーワードを有するイメージデ
ータを検索することによって、所望のイメージデータを
探し出すようにしていた。
【0005】部分的に同一の検索用キーワードを検索す
るとは、たとえば、イメージデータ格納時に「〇〇株式
会社」と入力した検索用キーワードは、部分的に同一の
「〇〇」なるキーワードによっても検索されるというよ
うなものであった。
【0006】また、これに関連して類似のキーワードを
検索する技術も多数提案されている。たとえば、「AB
C株式会社」なるキーワードが入力された場合、「エー
ビーシー株式会社」、「株式会社 ABC」、「(株)
ABC」等の一般的な表現方法を考慮した類似の検索用
キーワードも検索される技術が提案されていた。
【0007】さらに上記ファイル検索装置の改良装置と
して、格納するデータの量を圧縮する目的で、文字認識
装置を内蔵したファイル検索装置も提案されていた。
【0008】この文字認識装置を内蔵したファイル検索
装置は、書類等に記載された情報を取り込むときに、書
面の文章部分と写真、図面等の部分を自動判別し、文章
部分については文字認識装置によって文字データに変換
し、写真、図面等の部分はイメージデータとして取り込
み、文章部分を文字データに変換することによって、少
ない記憶容量で書類等の情報を格納するようにしたもの
であった。このファイル検索装置においても、イメージ
データと文字データを格納するときに、将来それを検索
する場合の検索用キーワードを入力するようにしてい
た。
【0009】
【発明が解決しようとする課題】しかしながら、上記従
来のファイル検索装置は、イメージデータ等を格納する
際に検索用キーワードを入力しなければならなかった
が、この検索用キーワードの入力作業は人手と時間がか
かるため、迅速な情報の格納の妨げとなっていた。
【0010】また、部分的に同一の検索用キーワード
や、表現上類似のキーワード等が検索可能とは言え、ユ
ーザは、将来の検索時のキーワードの可能性を考慮しつ
つ、各イメージデータにもっとも相応しい検索用キーワ
ードを入力しなければならなかったため、情報を格納す
る時のユーザの負担が大きかった。また、キーワードの
設定の巧拙によっても、検索が困難に、あるいは容易に
なった。
【0011】また、上記キーワードの設定の巧拙の問題
を除いても、従来のファイル検索装置では、予想しなか
ったキーワードによって検索したい要望に応えることが
できなかった。このため、すでに格納した情報の柔軟な
活用を図ることが困難であった。
【0012】一方、上記一部文字データに変換して格納
する従来のファイル検索装置は、情報を取り込むとき
に、文字認識装置による変換の結果をユーザによって確
認または修正しなければならなかった。この文字認識の
確認および修正のために、情報を格納するのに時間と労
力がかかっていた。また、万一誤った文字認識のまま情
報が格納された場合には、元の情報が失われる危険性も
あった。
【0013】上記種々の点から、従来のファイル検索装
置では、情報の格納が容易ではなく、また、所望の情報
を的確かつ迅速に探し出すことができないという課題が
あった。
【0014】そこで、本発明が解決しようとする課題
は、書類等に記載した情報を容易に格納でき、かつ、検
索が容易・確実なファイル検索装置を提供することにあ
る。
【0015】
【課題を解決するための手段】上記課題を解決するため
に、本願請求項1に係るファイル検索装置は、文字、記
号、および図形をイメージデータとして入力するイメー
ジ入力手段と、前記イメージ入力手段によって読み込ま
れたイメージデータを、イメージデータのまま記憶する
記憶手段と、前記イメージデータを、1ページに1イメ
ージデータを表示する見出し付きのファイルの形式で表
示する表示手段と、前記表示手段によって表示されたイ
メージデータの所定部分を範囲として指定する範囲指定
手段と、前記範囲指定手段によって指定された範囲内の
画素の配列を文字データに変換する文字認識手段と、前
記文字認識手段によって変換された文字データを文字デ
ータとして編集する編集手段と、を有していることを特
徴とするものである。
【0016】本願請求項2に係るファイル検索装置は、
請求項1のファイル検索装置において、所定の文字列に
類似する文字列を生成する類似文字列生成部を有し、ユ
ーザに検索しようとする文字列を入力させ、入力された
文字列と、この入力された文字列に対して前記類似文字
列生成手段によって生成された類似文字列とを検索対象
として、前記範囲指定手段と文字認識手段とによって範
囲指定および文字変換された文字データから、前記検索
対象の文字列を検索する検索手段を備えたことを特徴と
するものである。
【0017】本願請求項3に係るファイル検索装置は、
請求項2のファイル検索装置において、前記類似文字列
生成部は、所定の文字列に類似する文字列に類似の確率
に応じて順位を付し、前記検索手段は、前記ユーザによ
って入力された文字列を第一候補とし、前記類似文字列
生成部によって生成された類似文字列を順位付きの候補
として、候補の順位に文字列を検索することを特徴とす
るものである。
【0018】本願請求項4に係るファイル検索装置は、
請求項2のファイル検索装置において、前記類似文字列
生成部は、所定の文字とそれに類似する文字の対応ファ
イルを参照して類似文字列を生成することを特徴とする
ものである。
【0019】本願請求項5に係るファイル検索装置は、
請求項2のファイル検索装置において、前記類似文字列
生成部は、形状類似のルールにより、入力された文字と
形状が類似する文字を検索して類似文字列を生成するこ
とを特徴とするものである。
【0020】本願請求項6に係るファイル検索装置は、
請求項2のファイル検索装置において、前記類似文字列
生成部は、印刷・読み取りによる文字変形ルールによ
り、入力された文字に類似する文字を検索して類似文字
列を生成することを特徴とするものである。
【0021】本願請求項7に係るファイル検索装置は、
請求項1のファイル検索装置において、前記範囲指定手
段によって指定した範囲のイメージを前記文字認識手段
によって文字列に変換し、この変換した文字列を検索対
象として、前記範囲指定手段と文字認識手段とによって
範囲指定および文字変換された文字データから、前記検
索対象の文字列を検索する検索手段を備えたことを特徴
とするものである。
【0022】本願請求項8に係るファイル検索装置は、
請求項1ないし7のいずれかのファイル検索装置におい
て、前記範囲指定手段は、一つのイメージデータの範囲
を指定することにより、すべてのイメージデータの同一
の範囲を指定することを特徴とするものである。
【0023】
【発明の実施の形態】次に本発明の実施の形態について
添付の図面を用いて以下に説明する。図1は、本発明の
一実施形態によるファイル検索装置の構成とその処理の
流れを示している。
【0024】本実施形態のファイル検索装置は、イメー
ジ入力手段1と、記憶手段2と、表示手段3と、範囲指
定手段4と、文字認識手段5と、検索手段6と、編集手
段7と、を有している。イメージ入力手段1は、種々の
構成が可能であり、書類等に記載した情報をイメージデ
ータとして入力可能なものなら、イメージスキャナ1
a、他のコンピュータやネットワークに接続したケーブ
ル1b、図示しないファックスとコピー機の複合機等の
いずれでもよい。
【0025】本実施形態の表示手段3は、モニター等の
表示装置8と別個独立のものであって、表示装置8に画
像データを送って表示制御を行う制御手段として以下に
説明するが、表示手段としては表示装置を含むものであ
ってもよい。
【0026】また同様に、本実施形態の範囲指定手段4
と検索手段6と編集手段7は、キーボードやマウス等の
入力装置9と独立のものであって、それぞれ範囲指定、
検索、編集を行う制御手段として以下に説明するが、そ
れぞれキーボード等の入力手段を含むものであってもよ
い。
【0027】次に上記構成のファイル検索装置の処理の
流れについて、以下に説明する。本実施形態のファイル
検索装置では、書類等に記載した情報をすべてイメージ
データとして取り込む。具体的には、書類等をイメージ
スキャナ1a等のスキャニング面に載せ、イメージスキ
ャナ1aの光学的な読み取りによって書類等に記載され
た文字、図形、写真等をすべてイメージデータ(画素の
配列を記録したデータ)として記憶手段2のイメージデ
ータファイル10に格納する。この場合、イメージスキ
ャナ1aの1回のスキャニングによって取得するイメー
ジデータを1イメージデータとして格納する。イメージ
スキャナ1aによらない場合、すでにイメージデータ化
した情報をケーブル1bを介してイメージデータファイ
ル10に入力してもよい。
【0028】ここで、注目すべきこととしては、本実施
形態のファイル検索装置によれば、情報を取り込むとき
に、将来イメージデータを検索するための検索用キーワ
ードを入力しなくてもよいことが挙げられる。これによ
り、ユーザは大量の書類を機械的に素早く格納すること
ができる。なお、このようにして格納した情報の検索に
ついては後述する。
【0029】表示手段3は、イメージデータファイル1
0からイメージデータを取り出し、表示装置8によって
これを表示する。この表示手段3による表示は、図2に
例示するように、1イメージデータを1ページとして表
示し、所定の分類に従って見出しを付したファイル形式
で表示する。このファイル形式の表示は、見出しをマウ
ス等でクリックすることにより、素早く所望のイメージ
データの部分を開くことができる。
【0030】また、好ましくは、表示手段3は、「高速
ページめくり」、「拡大縮小・回転・ブラウジング」、
「マーキング」、「コメント」等の諸機能を備えるよう
にする。
【0031】次に所定の情報、すなわち、所定のイメー
ジデータを検索する方法について以下に説明する。本実
施形態のファイル検索装置による検索では、最初に範囲
指定手段4によってイメージデータの検索される部分を
指定する。実際には、ユーザが表示装置8を見ながら、
マウス等の入力手段を用いて、イメージデータ上に図2
に示すような検索範囲の枠11を指定する。これは、帳
票等の定型的な書類では、たとえばタイトルは所定の位
置に記載されており、タイトルに検索しようとするキー
ワードが含まれている場合は、その部分のみを検索範囲
の枠11によって囲めば、少ない検索量によって効率的
に検索を行うことができる。
【0032】求めるキーワードが決まった部分(位置)
に記載されていない場合には、範囲指定手段4によって
イメージデータの全体を検索範囲の枠11によって囲む
ようにすれば、各イメージデータのすべての部分につい
て検索を行うことができる。
【0033】なお、本実施形態による範囲指定手段4
は、一つのイメージデータの範囲を指定することによ
り、すべてのイメージデータの同一の範囲を指定するこ
とができる。この機能を利用することにより、上記した
帳票の場合、一つの帳票のタイトル部分を検索範囲の枠
11によって囲むことにより、すべての帳票のタイトル
部分を検索することができる。この機能は、定型の書類
のイメージデータのみを格納しているイメージデータフ
ァイル10を検索するときに特に有効である。このよう
にして、指定された検索範囲は、記憶手段2の範囲指定
ファイル12に格納される。
【0034】次に、範囲指定手段4によって範囲指定さ
れた部分の画素の配列を、文字認識手段5によって文字
データに変換する。文字認識手段5は、範囲指定ファイ
ル12を参照して、イメージデータファイル10からイ
メージデータを取り出し、指定された検索範囲内の画素
の配列を、辞書ファイル13を参照しながら文字データ
に変換する。変換された文字データは、文字データファ
イル14に格納される。これらの変換された文字データ
は、検索される文字列の集合となる。
【0035】次に、検索手段6によって、検索しようと
する文字列をユーザに入力させ、上記文字データファイ
ル14の文字列の集合から、入力された文字列、および
入力された文字列に類似する文字列を検索する。
【0036】図3は、検索手段6による検索の流れを示
している。本実施形態の検索手段6は、入力された文字
列のみならず、入力された文字列に類似する文字列も検
索する点に特徴がある。このことを具体的な例を示して
以下に説明する。
【0037】たとえば、「中間決算」という文字列を含
むイメージデータを検索しようとする場合、「中間決
算」なる文字列は、上記文字認識手段5によって誤って
認識されて文字データファイル14に格納されている可
能性がある。たとえば、「中」は「牛」、「午」、
「甲」等に、「間」は「問」、「関」、「門」等に、
「決」は「法」、「沫」、「洟」等に、「算」は
「筧」、「箟」等に認識される可能性がある。
【0038】したがって、「中間決算」なる文字列は上
記文字の組合せとして文字データファイル14に格納さ
れている可能性がある。これら誤って認識されている文
字列は、「中間決算」という文字列によって検索されな
い。
【0039】これに対して、本装置の検索手段6は、入
力された文字列に類似する文字列を生成する類似文字列
生成部15を有している。この類似文字列生成部15
は、たとえば「中」の文字が入力されたとすると、これ
に類似する「牛」、「午」、「甲」等を選出し、類似文
字列を構成する要素とする。
【0040】上記類似文字を選出する方法として、ここ
では3つの方法がある。第1の類似文字選出方法は、所
定の文字とそれに類似する文字の対応ファイルを予め用
意しておき、この対応ファイルを参照して類似文字を選
出する。たとえば、「中」に対しては「午」、「牛」、
「甲」等を予め誤認される文字として対応ファイルに格
納しておき、「中」なる文字が入力された場合に、
「午」、「牛」、「甲」等の文字を選出する。この対応
ファイルは、文字認識手段5と共用できる場合は、これ
を共用する。
【0041】第2の類似文字選出方法は、文字の輪郭、
線密度等によって文字を確定する文字形状のルールを使
って、入力された文字に形状が類似する文字を選出す
る。たとえば、「中」なる文字が入力された場合に、こ
れに形状が類似する「午」、「牛」、「甲」等を形状類
似のルールによって選出する。この文字判読のルール
も、文字認識手段5と共用できる場合は、これを共用す
る。
【0042】第3の類似文字選出方法は、印刷・読み取
りによる文字変形例を多数用意した文字変形ルールによ
り、入力された文字に類似する文字を選出する。たとえ
ば、「1」なる文字は、印刷・読み取りの具合によって
「i」、「l(エル)」、「(」等に誤認されることが
あるので、「1」が入力された場合は「i」、「l(エ
ル)」、「(」を類似文字として選出する。
【0043】このようにして、「中間決算」なる文字列
が検索対象の文字列として入力された場合は、本装置の
検索手段6は、「中間決算」の他に、類似の「牛間決
算」、「中問決算」、「中間法算」、…をも検索対象の
文字列とする。これら検索対象の文字列については、逐
一文字データファイル14の文字列と照合し、同一文字
列を検索する。
【0044】この場合、検索手段6は好ましくは、所定
の文字の誤認の可能性を確率値として有し、類似文字列
に順位を付しておく。これにより、最も誤認される可能
性が高い類似文字列から検索し、結果を表示する際にも
誤認の可能性について何らかの表示をする。
【0045】検索結果は、図3に示すように、該当する
文字列が含まれるイメージデータn1 ,n2 ,n3 …を
表示し、該当する文字列の部分を強調表示する。これら
の検索された結果は、記憶手段2の検索データファイル
16(図1参照)に格納される。
【0046】上記検索方法によれば、イメージデータの
検索キーワードが含まれる部分のみを文字認識し、か
つ、文字認識の結果の正否を検討することなく、検索の
ために入力した文字列と、これに類似文字列とを検索対
象として、該当する文字列を含むイメージデータを検出
する。これにより、第一に文字認識の処理量を少なく
し、第二に文字認識の結果を検討する労力を省き、第三
に検索しようとする文字列を含むイメージデータを漏れ
なく検出することができる。
【0047】なお、上記説明では、検索手段6は検索し
ようとする文字列の全体に類似する類似文字列を検索し
ているが、本発明はこれに限られず、検索手段6は、検
索のために入力した文字列の一部分について検索対象や
類似文字列を生成するようにすることもできる。
【0048】すなわち、たとえば検索しようとするキー
ワードが「ABC株式会社」だとすると、「AB」や
「ABC」や「A****会社」や「A」のみの入力文
字によって「ABC株式会社」検索するようにすること
ができる。
【0049】また、類似文字列についても、たとえば検
索しようとするキーワードが「中間決算」だとすると、
「中間決算」の「中」を指定し、「中」に類似する
「午」、「牛」、「甲」を含む文字列「午間決算」、
「牛間決算」、「甲間決算」等を類似文字列として検索
するようにすることができる。むろん、上記文字の指定
は、ユーザの指定によって任意の2文字あるいは3文字
を類似文字に置き換えるようにすることができる。
【0050】また、本ファイル検索装置によれば、異な
る方法の検索も可能である。この検索方法は、所定のイ
メージデータ中の所定の文字列に注目し、この文字列と
同一の文字列を有するイメージデータを検索する方法で
ある。以下に、その異なる検索方法について説明する。
【0051】この検索では、検索される文字列の集合1
4を形成するところまでは、上記文字列を入力する検索
と全く同様である。次に、検索しようとする文字列を範
囲指定手段4および文字認識手段5によって文字データ
に変換する。この場合、文字認識手段5によって認識さ
れた文字列をそのまま、誤って認識された場合も含めて
そのまま検索対象の文字列とする。
【0052】たとえば、「中間決算」なる文字列を検索
しようとする場合、「中間決算」が文字認識手段5によ
って「牛間決算」に認識されたとすると、「牛間決算」
のまま検索対象の文字列とする。これは、検索される方
の文字列の集合14においても「中間決算」は同一の文
字認識手段5によって「牛間決算」と誤認されている確
率が極めて高く、「牛間決算」を検索すれば所望のイメ
ージデータを探し当てることができるからである。検索
結果の表示と格納は上記文字列を入力する検索と全く同
様に行う。
【0053】以上が本ファイル検索装置による検索であ
る。ところで、本ファイル検索装置は、文字認識手段5
によってイメージデータ中の所定の画素の配列を文字デ
ータ変換し、これを利用して、ワープロの文中にコピー
するなど編集を行うことができる。
【0054】図1に示すように、本装置の編集手段7
は、表示手段3によって表示されたイメージデータを参
照しながら、範囲指定手段4によって所定範囲を指定
し、これを文字認識手段5によって文字データに変換す
る。この文字データは編集データファイル17に格納さ
れ、ワープロ等の文章の編集に使用することができる。
また、範囲指定手段4によってイメージデータの所定範
囲を切り取り、これをそのまま編集データファイル17
に格納し、ワープロ等の文章への編入に供することもで
きる。
【0055】これにより、イメージデータとして格納さ
れた各種書類上の情報を活用でき、必要に応じて、従来
の情報から新しい情報を作成することができる。
【0056】
【発明の効果】以上の説明から明らかなように、本発明
によるファイル検索装置は、イメージ入力手段によって
各種の書類の情報をそのままイメージデータの形で格納
でき、従来のように情報格納時に検索用キーワードを付
したり、文字認識を行ったりする必要がない。このた
め、機械的に書類の情報を格納でき、大量の情報を素早
く格納することができる。
【0057】また、本発明によるファイル検索装置は、
範囲指定手段によって検索される範囲を指定し、その範
囲内の画素の配列について文字認識手段によって文字認
識を行う。文字認識の結果は、その正否を検査・修正す
ることなく、検索される文字列とする。一方、検索手段
によって検索用に入力された文字列と、これに類似する
文字列とを検索対象の文字列とし、これらに相当する文
字列を前記検索される文字列の中から検出する。これに
より、文字認識の処理量を少なくし、かつ、文字認識の
結果を検査する労力を省き、さらに検索しようとする文
字列を含むイメージデータをすべて漏れなく検出するこ
とができる。
【0058】また、イメージデータ中の文字列を指定
し、これと同一の文字列を含むイメージデータを検索す
る検索によれば、印刷や読み取りの具合による文字認識
の誤りをそのまま利用し、少ない処理量によって確実に
求めるイメージデータを探し当てることができる。
【0059】さらに、本ファイル検索装置によれば、必
要に応じてイメージデータの所定部分を切り取り、その
部分をイメージデータとしてのみでなく、文字認識手段
によって文字データに変換し、編集手段によってこれを
容易に活用することができる。
【図面の簡単な説明】
【図1】本発明によるファイル検索装置の一構成例とそ
の処理の流れを示したブロック図。
【図2】本発明のファイル検索装置の表示手段3による
一画面例を示した図。
【図3】本発明のファイル検索装置の検索手段6による
検索の処理を示した説明図。
【符号の説明】
1 イメージ入力手段 1a イメージスキャナ 1b ケーブル 2 記憶手段 3 表示手段 4 範囲指定手段 5 文字認識手段 6 検索手段 7 編集手段 8 表示装置 9 入力装置 10 イメージデータファイル 11 検索範囲の枠 12 範囲指定ファイル 13 辞書ファイル 14 文字データファイル 15 類似文字列生成部 16 検索データファイル 17 編集データファイル
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/62 330A

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】文字、記号、および図形をイメージデータ
    として入力するイメージ入力手段と、 前記イメージ入力手段によって読み込まれたイメージデ
    ータを、イメージデータのまま記憶する記憶手段と、 前記イメージデータを、1ページに1イメージデータを
    表示する見出し付きのファイルの形式で表示する表示手
    段と、 前記表示手段によって表示されたイメージデータの所定
    部分を範囲として指定する範囲指定手段と、 前記範囲指定手段によって指定された範囲内の画素の配
    列を文字データに変換する文字認識手段と、 前記文字認識手段によって変換された文字データを文字
    データとして編集する編集手段と、を有していることを
    特徴とするファイル検索装置。
  2. 【請求項2】所定の文字列に類似する文字列を生成する
    類似文字列生成部を有し、 ユーザに検索しようとする文字列を入力させ、入力され
    た文字列と、この入力された文字列に対して前記類似文
    字列生成手段によって生成された類似文字列とを検索対
    象として、前記範囲指定手段と文字認識手段とによって
    範囲指定および文字変換された文字データから、前記検
    索対象の文字列を検索する検索手段を備えたことを特徴
    とする請求項1に記載のファイル検索装置。
  3. 【請求項3】前記類似文字列生成部は、所定の文字列に
    類似する文字列に類似の確率に応じて順位を付し、 前記検索手段は、前記ユーザによって入力された文字列
    を第一候補とし、前記類似文字列生成部によって生成さ
    れた類似文字列を順位付きの候補として、候補の順位に
    文字列を検索することを特徴とする請求項2に記載のフ
    ァイル検索装置。
  4. 【請求項4】前記類似文字列生成部は、所定の文字とそ
    れに類似する文字の対応ファイルを参照して類似文字列
    を生成することを特徴とする請求項2に記載のファイル
    検索装置。
  5. 【請求項5】前記類似文字列生成部は、形状類似のルー
    ルにより、入力された文字と形状が類似する文字を検索
    して類似文字列を生成することを特徴とする請求項2に
    記載のファイル検索装置。
  6. 【請求項6】前記類似文字列生成部は、印刷・読み取り
    による文字変形ルールにより、入力された文字に類似す
    る文字を検索して類似文字列を生成することを特徴とす
    る請求項2に記載のファイル検索装置。
  7. 【請求項7】前記範囲指定手段によって指定した範囲の
    イメージを前記文字認識手段によって文字列に変換し、
    この変換した文字列を検索対象として、前記範囲指定手
    段と文字認識手段とによって範囲指定および文字変換さ
    れた文字データから、前記検索対象の文字列を検索する
    検索手段を備えたことを特徴とする請求項1に記載のフ
    ァイル検索装置。
  8. 【請求項8】前記範囲指定手段は、一つのイメージデー
    タの範囲を指定することにより、すべてのイメージデー
    タの同一の範囲を指定することを特徴とする請求項1な
    いし7のいずれかに記載のファイル検索装置。
JP7181850A 1995-07-18 1995-07-18 ファイル検索装置 Pending JPH0934903A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP7181850A JPH0934903A (ja) 1995-07-18 1995-07-18 ファイル検索装置
CN96190752A CN1165571A (zh) 1995-07-18 1996-07-12 文件检索装置
PCT/JP1996/001954 WO1997004409A1 (fr) 1995-07-18 1996-07-12 Dispositif de recherche de fichiers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7181850A JPH0934903A (ja) 1995-07-18 1995-07-18 ファイル検索装置

Publications (1)

Publication Number Publication Date
JPH0934903A true JPH0934903A (ja) 1997-02-07

Family

ID=16107922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7181850A Pending JPH0934903A (ja) 1995-07-18 1995-07-18 ファイル検索装置

Country Status (3)

Country Link
JP (1) JPH0934903A (ja)
CN (1) CN1165571A (ja)
WO (1) WO1997004409A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11191112A (ja) * 1997-12-25 1999-07-13 Ebara Corp テンプレートによる文字抽出方法
JP2001034627A (ja) * 1999-07-19 2001-02-09 Hitachi Ltd レセプト点検方法およびシステム並びにレセプト点検プログラムを格納した記憶媒体
JP2002063197A (ja) * 2000-06-06 2002-02-28 Matsushita Electric Ind Co Ltd 検索装置、記録媒体およびプログラム
US6944344B2 (en) 2000-06-06 2005-09-13 Matsushita Electric Industrial Co., Ltd. Document search and retrieval apparatus, recording medium and program
JP2014026660A (ja) * 2013-09-12 2014-02-06 Toppan Printing Co Ltd データ生成装置およびデータ生成方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643641B1 (en) 2000-04-27 2003-11-04 Russell Snyder Web search engine with graphic snapshots
CN100370459C (zh) * 2005-12-08 2008-02-20 华为技术有限公司 一种减少分页数据检索时间的方法及装置
KR20150006740A (ko) * 2013-07-09 2015-01-19 류중하 문자에 대한 기호 이미지 구성 방법, 및 기호 이미지에 대한 대응되는 문자의 분석 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2550068B2 (ja) * 1987-05-13 1996-10-30 株式会社日立製作所 情報の検索・表示方法
JPH0512345A (ja) * 1991-06-28 1993-01-22 Toshiba Corp 画像記憶装置
JP3025724B2 (ja) * 1992-11-24 2000-03-27 富士通株式会社 類義語生成処理方法
JPH07121547A (ja) * 1993-10-21 1995-05-12 Matsushita Electric Ind Co Ltd 情報検索装置
JPH07152774A (ja) * 1993-11-30 1995-06-16 Hitachi Ltd 文書検索方法および装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11191112A (ja) * 1997-12-25 1999-07-13 Ebara Corp テンプレートによる文字抽出方法
JP2001034627A (ja) * 1999-07-19 2001-02-09 Hitachi Ltd レセプト点検方法およびシステム並びにレセプト点検プログラムを格納した記憶媒体
JP2002063197A (ja) * 2000-06-06 2002-02-28 Matsushita Electric Ind Co Ltd 検索装置、記録媒体およびプログラム
US6944344B2 (en) 2000-06-06 2005-09-13 Matsushita Electric Industrial Co., Ltd. Document search and retrieval apparatus, recording medium and program
JP2014026660A (ja) * 2013-09-12 2014-02-06 Toppan Printing Co Ltd データ生成装置およびデータ生成方法

Also Published As

Publication number Publication date
CN1165571A (zh) 1997-11-19
WO1997004409A1 (fr) 1997-02-06

Similar Documents

Publication Publication Date Title
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
US6671684B1 (en) Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
US7552381B2 (en) Check boxes for identifying and processing stored documents
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
EP1473641B1 (en) Information processing apparatus, method, storage medium and program
US6766069B1 (en) Text selection from images of documents using auto-completion
CN101178725B (zh) 用于信息检索的设备和方法
JP2006085733A (ja) ファイリング・検索装置およびファイリング・検索方法
US20050160115A1 (en) Document imaging and indexing system
JP2006146954A (ja) 情報処理装置および文書の探索方法
JPH05250408A (ja) 取り込んだ情報で文書画像を復号することなく選択した文書の重要な部分を補完するための方法
US20040034832A1 (en) Method and apparatus for foward annotating documents
JP4261988B2 (ja) 画像処理装置及び方法
JP2006202081A (ja) メタデータ生成装置
JPH0934903A (ja) ファイル検索装置
JP2008040753A (ja) 画像処理装置、方法、プログラムおよび記録媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH0793336A (ja) 画像記憶装置および画像記憶検索装置
JPH08180068A (ja) 電子ファイリング装置
JPH11238072A (ja) 文書保管装置
JP2022185874A (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP4480109B2 (ja) 画像管理装置および画像管理方法
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP3486168B2 (ja) 検索システム、ファイリングシステム、記録媒体