JPH08147314A - 認識型文書ファイリング装置及びその制御方法 - Google Patents

認識型文書ファイリング装置及びその制御方法

Info

Publication number
JPH08147314A
JPH08147314A JP6283257A JP28325794A JPH08147314A JP H08147314 A JPH08147314 A JP H08147314A JP 6283257 A JP6283257 A JP 6283257A JP 28325794 A JP28325794 A JP 28325794A JP H08147314 A JPH08147314 A JP H08147314A
Authority
JP
Japan
Prior art keywords
character
candidate
recognition
type
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6283257A
Other languages
English (en)
Inventor
Masami Hisagai
正己 久貝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6283257A priority Critical patent/JPH08147314A/ja
Publication of JPH08147314A publication Critical patent/JPH08147314A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 認識結果が疑わしい文字については特徴ベク
トルが保存することで、後で精度のよい識別計算を行え
るようにする。 【構成】 イメージスキャナ3で読み取った文書画像は
RAM4に格納され、文字の切り出し、特徴ベクトルの
抽出が行われる。抽出された特徴ベクトルは平均特徴ベ
クトルとのユークリッド距離を計算し、近い順に所定個
の候補文字群を得、それを大分類部11に格納する。
この後、各候補につき、書体毎の疑似ベイズ識別式を演
算し、各候補の上位の所定個を出力する。そして、その
中の第1の候補の疑似ベイズ識別式の値と、第2候補の
値との差を判定し、それが所定以上ある場合には、第1
候補は正しいものとして判定し、そうでなければ不確か
であるとして判定する。不確かであると判定された文字
については、その文字に関する特徴ベクトルを記憶す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原稿文書から文書を読
取って文字を認識し、当該原稿文書を記憶蓄積する認識
型文書ファイリング装置及びその制御方法に関する。
【0002】
【従来の技術】従来、文書ファイリング装置において
は、文書をイメージスキャナで読取り、ビットマップの
イメージデータにして記憶蓄積していた。この場合、文
書画像を圧縮したとしても、その量は大きく、多量の文
書画像を記憶するには膨大な容量を持つ記憶媒体を要す
る。また、記憶される情報は、テキストデータでないの
で文書の中の単語をキーワードにして検索ができないと
いう問題もある。
【0003】そこで、文字認識装置(OCR)で文書の
文字を認識してテキストデータの形式にして記憶蓄積す
る認識型文書ファイリング装置が提案されていた。
【0004】
【発明が解決しようとする課題】しかしながら、OCR
はその認識率が向上したといっても、100%正確に文
字を認識するには残念ながら至っていない。従って、従
来の認識型文書ファイリング装置ではテキストデータに
誤って認識した文字が含まれてしまう問題がある。ま
た、OCRの後処理機能として通常認識結果を修正する
手段が使用されることが可能であるが、その場合は修正
の手間が多く発生する問題がある。
【0005】
【課題を解決するための手段】及び
【作用】本発明は上記問題点に鑑みなされたものであ
り、認識結果が疑わしい文字については特徴ベクトルが
保存することで、後で精度のよい識別計算を行えるよう
にした認識型文書ファイリング装置及びその制御方法を
提供しようとするものである。
【0006】この課題を解決するため、例えば本発明の
認識型文書ファイリング装置は、以下の構成を備える。
すなわち、入力した画像データから切り出した文字画像
を認識し、ファイリングする認識型文書ファイリング装
置であって、文字画像の標準的特徴データを、文字種毎
に文字コードと対応させて記憶している識別辞書と、切
り出した文字画像の特徴ベクトルと前記標準的特徴デー
タとから、文字種ごとに相違度を演算し、相違度の小さ
い順から複数個の候補文字種を選出する識別手段と、認
識精度の不確かさを判定するチェック候補判定手段と、
前記識別手段により選出された候補文字種の情報からテ
キストデータを生成するテキストデータ生成手段と、チ
ェック候補判定手段によりチェック候補となった候補文
字種に対応する特徴ベクトルを抽出するチェック候補文
字特徴抽出手段とを備え、前記テキストデータ生成手段
は、チェック候補の特徴ベクトルをテキストデータの候
補文字種と対応させてテキストデータに持たせ、該テキ
ストデータを記憶する。
【0007】また、本発明の好適な実施態様に従えば、
前記チェック候補判定手段は、切り出された文字画像と
認識候補文字に対する疑似ベイズ識別式を算出し、第1
の候補と第2の候補の文字に対する疑似ベイズ識別式の
値が所定の閾値を越えるか否かで不確かさを判定するこ
とが望ましい。
【0008】
【実施例】以下、添付図面に従って本発明に係る実姉例
を詳細に説明する。
【0009】図1は、本発明を表す実施例のハードウェ
アブロック図である。図中、1は全体の制御・識別計算
・文字切出し等を行うCPU、2はアドレス/データバ
ス、3は文書を読み込み光電変換を行いイメージとして
取り込むためのイメージスキャナ、4はイメージスキャ
ナで読み込まれた文書イメージを記憶したり、CPU1
の作業領域となるメモリとしてのRAM(Random Access
Memory)である。5は文字画像から特徴を抽出する特徴
抽出部、6および7は詳細識別に使われる標準パターン
を記憶している詳細辞書A,B、8は文書イメージや認
識結果等を表示するディスプレイの表示部、9は表示部
8の任意の位置を指定するポインティングデバイス、1
0はブートプログラムや文字フォントを格納しているR
OM(Read Only Memory)、11は大まかに候補文字を絞
り込む処理を行う大分類部、12は大分類で使用される
標準パターンを記憶している大分類辞書、13は文書イ
メージや認識結果等を保存したり、OS及び後述する処
理手順(プログラム)を記憶している外部記憶部、14
はCPUに指示を与えるコマンドや種々のデータを入力
するためのキーボード、15は文書イメージや認識結果
等を印刷するプリンタである。
【0010】<処理説明> ・前処理 次に図2のフローチャートに従って説明する。まず、ス
テップS210ではイメージスキャナ3にセットされた
文書を読取り、光電変換・2値化を行ってビットマップ
のイメージデータ(文書イメージと呼ぶ)にしてRAM
4に記憶させる。
【0011】ステップS220では読み込まれた文書イ
メージを表示部8に表示する。ステップS230ではデ
ィスプレイ8を見ながらキーボード14とポインティン
グデバイス(以下PDと呼ぶ)を使って位置を指定し、
ノイズ等文書イメージの不要な部分を消去する。ステッ
プS240では文字認識を行う領域・画像処理を行う領
域のブロックを指定する。指定はPDを使って所望のブ
ロック(矩形領域)をPDのドラッグ操作により囲んで
行う。
【0012】ステップS250では領域ごとに処理モー
ドの設定を行う。処理モードとは、領域をどう処理する
か(文字認識か画像圧縮かなど)等の処理する条件の情
報である。処理条件は、文字認識の場合、縦組/横組,
改行コードの入れ方(各行に入れるか・段落ごとに入れ
るか・全く入れないか),認識対象字種(日本語か英数
字か),詳細辞書(どの辞書を使用するか)、の指定及
び選択が可能である。また画像圧縮であれば、その圧縮
手法の選択(MMR,MH,MR、それ以外か)が可能
になっている。ステップS260では画像圧縮のモード
を設定された領域について、圧縮処理を行いイメージを
符号化して符号化データをRAM4に一時記憶する。
【0013】・文字切出し ステップS270では文字認識のモードの領域(イメー
ジデータ)について文字切出し処理を行う。その方法
は、行方向の黒画素のヒストグラムをとってヒストグラ
ムの谷間で行の切れ目とし、各行について行と垂直方向
に黒画素のヒストグラムをとってヒストグラムの谷間で
文字の切れ目とするとよく使われている公知の方法であ
る。
【0014】本実施例では、まずすべての行切り出し処
理を行ってしまい、そして一つの行について文字切りを
行う。文字切りされた文字についての文字切り枠の座標
データはRAM4に記憶される。文字切り枠の座標デー
タとは一つの文字を囲む矩形の左上の頂点座標(x,y
座標)と横辺の長さ・縦辺の長さである。文字切り枠の
座標データは、ある行についての文字切り出しが終わっ
て次の行の文字切出しを行っても消去しないで順次残し
ておくものとする。文字のシーケンス番号をrとする
と、文字切り枠の座標データの構造体配列をH[r]と
して、C言語で以下のように定義する。ただし、文字の
シーケンス番号rは、第一行目,第二行目,…,と文字
切出しを行った順番に文字に番号付けをしたものとす
る。 #define MAX_NUMS 100000 /* H[r]の最大サイズ */ struct H_DATA{ int Point_x; /* 左上頂点のx座標 */ int Point_y; /* 左上頂点のy座標 */ int Side_x; /* 横辺の長さ */ int Side_y; /* 縦辺の長さ */ } H[MAX_NUMS]; ・特徴抽出 次にステップS280では、文字画像から特徴抽出を行
い特徴ベクトルを求める。これは、CPU1がRAM4
にある文書イメージからステップS270で求められた
文字切り枠の座標データを基にして文字画像1個を取り
出して特徴抽出部5の中にある不図示の文字バッファに
転送し、特許公平2−59507で開示されている方法
で加重方向ヒストグラムなる特徴ベクトルを特徴抽出部
5が求め前記文字バッファに一担格納した後、CPU1
に制御を渡し、CPU1がRAM4に特徴ベクトルを記
憶する。ここで、特徴抽出部5の内部については詳細を
述べないが、例えばマイクロプロセッサで処理する方法
を取れば良い。得られた特徴ベクトルをXi(i=1,
2,…,n)とする。ベクトルの次元数nは特許公報平
2−59507では72となる。
【0015】・大分類 特徴抽出処理が終わったら次のステップS290へ進
む。
【0016】ところで、大分類辞書12には各文字ごと
に一定数個(十分大きな数、例えば500個)のサンプ
ル文字画像から求められた特徴ベクトルの平均値(平均
特徴ベクトルと呼ぶ)があらかじめ文字コードと対応さ
せられて記憶されている。文字sに対する文字コードを
c(s)、平均特徴ベクトルをmi(s)(i=1,
2,…,n)とすると、c(s)とmi(s)(i=
1,2,…,n)の対応テーブルが大分類辞書12に記
憶されている。ここでsは文字につけられたシーケンシ
ャルな番号で、s=1,2,…,Nとして、これらのs
個の文字の集合を認識対象文字セットと呼ぶ。Nは例え
ばJIS第一水準漢字と非漢字を含む規模の3500で
ある。
【0017】さて、ステップS290では、ステップS
270の処理で文字切りされた文字画像と認識対象文字
セットの内のすべての文字との間で、特徴ベクトルXi
と平均特徴ベクトルmi(s)の次式で定義されるユー
クリッド距離D(s)を計算する。
【0018】
【数1】
【0019】D(s)が昇順になるように認識対象文字
セットをソートして上位50個の文字について文字番号
sと文字コードc(s)と距離値D(s)をRAM4に
記憶する。これらの50個の文字を候補文字セットと呼
ぶ。
【0020】・詳細識別 詳細辞書Aと詳細辞書Bは、それぞれ後続して処理され
る詳細識別A,詳細識別Bで使用される識別辞書で、そ
れぞれ認識対象文字セットすべての文字について文字コ
ードc(s)と標準パターンΨ(s)の対応テーブルを
含む。ここでは詳細辞書Aは明朝体用の、詳細辞書Bは
ゴシック用の詳細辞書である。
【0021】標準パターンΨ(s)は、平均特徴ベクト
ルmi(s),固有ベクトルφij(s),固有値λj(j
=1,2,…,k)のすべての総称である。固有ベクト
ルφij(s),固有値λj(j=1,2,…,k)は、
特許公平2−59507号で定義されているものであ
る。ただし、詳細辞書Aは明朝体の学習サンプルからも
とめられた標準パターンを、詳細辞書Bはゴシック体の
学習サンプルからもとめられた標準パターンを記憶して
いる。また、ここでkは3とする。
【0022】さて、ステップS300ではステップS2
70で文字切りされた文字と候補文字セットのすべてに
対して、詳細辞書Aの各データを用い疑似ベイズ識別式
B1(s)を計算し、B1(s)の値に昇順にソートし、
上位10個の文字の文字番号sと文字コードc1(s)
と識別値B1(s)をRAM4に記憶し、後で使用する
チェック候補フラグ領域および書体コード領域を確保す
る。
【0023】同様にステップS310でもステップS2
70で文字切りされた文字と、候補文字セットのすべて
に対して、詳細辞書Bの各データを用いて疑似ベイス識
別式B2(s)を計算し、B2(s)値の昇順にソートし
て、その上位10個の文字の文字番号s、文字コードc
2(s)、識別値B2(s)をRAM4に記憶し、後で
使用するチェック候補フラグ領域および書体コード領域
を確保する。
【0024】図3は1文字についてのこれらの識別結果
のデータのRAM4におけるデータ形式を説明してい
る。詳細識別Aと詳細識別Bについてそれぞれ図3のデ
ータを別々に持っている。
【0025】・書体判別 ステップS320では、それぞれの書体(明朝体・ゴシ
ック体)に対して求められた疑似ベイズ識別式Bi
(s)(i=1,2)を第一候補のものについて比較
し、疑似ベイズ識別式の値の小さい書体の方を書体判別
の結果とし、判別されて正しいとした書体に対応する詳
細識別の識別結果データをRAM4の別領域にコピー
し、かつその書体コードに明朝体ならば0をセット、ゴ
シック体ならば1をセットする。このコピーされた識別
結果データを認識データと以後呼ぶことにする。
【0026】・チェック候補判定 詳細識別辞書A,Bは、認識対象文字セットの各文字に
ついて前記の文字コードc(s)と標準パターンΨ
(s)のほかに、信頼度判定閾値Wi(s)(i=1,
2)を対応させて含んでいるものとする。信頼度判定し
きい値Wi(s)は、次のことが成り立つようにあらか
じめ実験的に定めることが可能である。
【0027】文字sが第一位候補となった場合、文字s
の識別値Bi(s)と、第二位候補の文字pの識別値Bi
(p)との差を、 δi(s)=Bi(p)−Bi(s) …(式−2) とし、これを候補識別値差と呼ぶとき、候補識別値差δ
i(s)が信頼度判定閾値Wi(s)より大きければ第一
位候補が確率的に正しいとみなし、候補識別値差δi
(s)が信頼度判定閾値Wi(s)より大きくなければ
第一位候補は信頼性に乏しいとみなし、あとで何かの手
段で認識結果の正当性を再チェックすべきものとする
「チェック候補」だと判定する。ステップS330では
このことを判定し、前記RAM4に確保したチェック候
補フラグ領域に、チェック候補ならば1をセットし、チ
ェック候補でなければ0をセットする。
【0028】ステップS280からS330までの処理
をステップS270で文字切りした一行分の文字画像に
ついて行う。そして、ステップS270へ戻り次の行に
ついて文字切出しを行ってステップS280からS33
0までの処理を繰り返し、文字切出し・文字認識を行っ
ていない行がなくなれば、つまり、全ての行について上
記処理が終了していればステップS340へ進む。
【0029】・テキストデータ作成/保存/表示 次にステップS340ではRAM4に記憶してある認識
データ(図3)から第一位候補のみを取り出し、構造体
型配列Z[r](r=1,2,…,u;uは文字の個
数)を創り出す。このとき第一位候補の文字コードおよ
びその文字コードに対応する認識データを指し示すアド
レスポインタおよびシーケンス番号v(後述する)の3
個の要素を一つの配列データとする構造体型配列Z
[r]を生成する。したがって、第一位候補に付随する
識別値・チェック候補フラグ・書体コードのほか第二位
以下の候補についてのそれらの情報も入力文字のシーケ
ンス番号rが決まれば容易に求めることができる。ただ
し、文字のシーケンス番号rは、第一行目,第二行目,
…,と文字切出しを行った順番に文字に番号付けをした
ものとする。
【0030】また、認識したすべての文字のうちチェッ
ク候補フラグが1の文字について、ステップS270で
求めた文字切り枠の座標データの構造体配列H[r]を
使って、元の文書イメージ(RAM4に記憶してある)
より個々の文字画像を抽出し特徴ベクトルを求め、RA
M4に特徴ベクトルを連続して記憶する。これらの特徴
ベクトル指すシーケンス番号をv(=1,2,…)で表
し、これらの特徴ベクトルをチェック候補文字特徴と呼
ぶ。
【0031】そして、上述の構造体型配列Z[r]にそ
の文字に対応する特徴ベクトルを指し示す上記のシーケ
ンス番号vを構造体要素として持たせる。ただし、チェ
ック候補フラグが0のときはv=0としておく。
【0032】上述の構造体型配列Z[r]から、文字コ
ード,シーケンス番号v,RAM4に記憶したチェック
候補文字の特徴ベクトルをすべてのrについて外部記憶
装置13に出力する。
【0033】このようにして認識結果の文字コードと、
チェック候補の文字については特徴ベクトルを対応させ
て記憶蓄積したことになる。
【0034】次にステップS350では、Z[r]から
文字コードを参照して対応する文字のフォントを不図示
のキャラクタジェネレータから生成して、表示部8に順
番に表示する。このとき、Z[r]のアドレスポインタ
から認識データのチェック候補フラグをみてフラグが1
ならば文字の色を赤色にて表示し、フラグが0ならば白
色で表示する。なお、表示部の背景色は黒色であり、認
識結果のテキスト表示部分は表示部全体の概ね半分の面
積を占める。あとの半分の表示部にはS230で表示し
た文書イメージの表示が残っている。そして、ステップ
S270で求めた文字切り枠の座標データより文字枠を
文書イメージに重ねて線描画する。
【0035】・候補入れ替え/文書保存 次にステップS360では、正当性のチェックはチェッ
ク候補が他と区別し安いので容易に行われて、オペレー
タが誤認識した文字を発見したならば、PDでその部分
をクリックする。CPU1はこれを検出すると、Z
[r]のアドレスポインタから認識データの情報から候
補文字を並べて表示部に表示し、オペレータにその候補
文字のなかから正して文字をPDで選択させる。この結
果、CPU1は、表示されていた認識結果の文字が選択
された候補文字と入れ替る処理を行う。
【0036】ステップS370では、以上のようにチェ
ックが終了したならば、表示されている認識結果のデー
タを文字コード列として外部記憶部13へ出力する。な
お、ここで記憶した認識結果のデータはステップS34
0で保存したものとは別の領域に記憶するものとする。
【0037】
【他の実施例】上の実施例では、テキストデータの保存
を「候補入れ替え」の前に行い、すべてのチェック候補
文字について特徴ベクトルを保存したが、テキストデー
タの保存を「候補入れ替え」の後に行って、候補入れ替
えをしたチェック候補文字についてはv=0として特徴
ベクトルを保存しないようにしてもよい。そうすれば、
文字修正を行って極力文字コードは正しくしても良い
し、文字修正を行わず極力手間を煩わすことをさけるこ
とも自由となる。
【0038】以上説明したように本実施例によれば、認
識結果が疑わしい文字(チェック候補文字)については
特徴ベクトルが保存されるので、後で精度のよい識別計
算をすれば正確な文字認識結果が得られる。したがっ
て、記憶量の効率が良くなり、かつ情報の間違いのない
便利な認識型文書ファイリング装置が実現可能となる。
【0039】尚、本発明は、上記の如く、複数の機器か
ら構成されるシステムに適用しても、1つの機器から成
る装置に適用しても良い。また、本発明はシステム或は
装置にプログラムを供給することによって達成される場
合にも適用できることは言うまでもない。
【0040】
【発明の効果】以上説明したように本発明によれば、認
識結果が疑わしい文字については特徴ベクトルが保存す
ることで、後で精度のよい識別計算を行えるようにする
ことが可能になる。
【0041】
【図面の簡単な説明】
【図1】実施例の認識型ファイリング装置のブロック構
成図である。
【図2】実施例の動作を説明するフローチャートであ
る。
【図3】認識結果のデータの記憶形式を説明する図であ
る。
【符号の説明】
1 CPU 2 アドレス/データバス 3 イメージスキャナ 4 RAM(Random Access Memory) 5 特徴抽出部 6,7 詳細辞書1・2 8 表示部 9 ポインティングデバイス 10 ROM(Read Only Memory) 11 大分類 12 大分類辞書 13 外部記憶部 14 キーボード 15 プリンタ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 9194−5L G06F 15/403 350 Z

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力した画像データから切り出した文字
    画像を認識し、ファイリングする認識型文書ファイリン
    グ装置であって、 文字画像の標準的特徴データを、文字種毎に文字コード
    と対応させて記憶している識別辞書と、 切り出した文字画像の特徴ベクトルと前記標準的特徴デ
    ータとから、文字種ごとに相違度を演算し、相違度の小
    さい順から複数個の候補文字種を選出する識別手段と、 認識精度の不確かさを判定するチェック候補判定手段
    と、 前記識別手段により選出された候補文字種の情報からテ
    キストデータを生成するテキストデータ生成手段と、 チェック候補判定手段によりチェック候補となった候補
    文字種に対応する特徴ベクトルを抽出するチェック候補
    文字特徴抽出手段とを備え、 前記テキストデータ生成手段は、チェック候補の特徴ベ
    クトルをテキストデータの候補文字種と対応させてテキ
    ストデータに持たせ、該テキストデータを記憶すること
    を特徴とする認識型文書ファイリング装置。
  2. 【請求項2】 前記チェック候補判定手段は、切り出さ
    れた文字画像と認識候補文字に対する疑似ベイズ識別式
    を算出し、第1の候補と第2の候補の文字に対する疑似
    ベイズ識別式の値が所定の閾値を越えるか否かで不確か
    さを判定することを特徴とする請求項第1項に記載の認
    識型文書ファイリング装置。
  3. 【請求項3】 入力した画像データから切り出した文字
    画像を認識し、ファイリングする認識型文書ファイリン
    グ装置の制御方法であって、 文字画像の標準的特徴データを、文字種毎に文字コード
    と対応させて予め記憶している識別辞書を参照し、切り
    出した文字画像の特徴ベクトルと前記標準的特徴データ
    とから、文字種ごとに相違度を演算し、相違度の小さい
    順から複数個の候補文字種を選出する識別工程と、 認識精度の不確かさを判定するチェック候補判定工程
    と、 前記識別工程により選出された候補文字種の情報からテ
    キストデータを生成するテキストデータ生成工程と、 チェック候補判定手段によりチェック候補となった候補
    文字種に対応する特徴ベクトルを抽出するチェック候補
    文字特徴抽出工程とを備え、 前記テキストデータ生成工程は、チェック候補の特徴ベ
    クトルをテキストデータの候補文字種と対応させてテキ
    ストデータに持たせ、該テキストデータを記憶すること
    を特徴とする認識形文書ファイリング装置の制御方法。
  4. 【請求項4】 前記チェック候補判定工程は、切り出さ
    れた文字画像と認識候補文字に対する疑似ベイズ識別式
    を算出し、第1の候補と第2の候補の文字に対する疑似
    ベイズ識別式の値が所定の閾値を越えるか否かで不確か
    さを判定することを特徴とする請求項第3項に記載の認
    識型文書ファイリング装置の制御方法。
JP6283257A 1994-11-17 1994-11-17 認識型文書ファイリング装置及びその制御方法 Withdrawn JPH08147314A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6283257A JPH08147314A (ja) 1994-11-17 1994-11-17 認識型文書ファイリング装置及びその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6283257A JPH08147314A (ja) 1994-11-17 1994-11-17 認識型文書ファイリング装置及びその制御方法

Publications (1)

Publication Number Publication Date
JPH08147314A true JPH08147314A (ja) 1996-06-07

Family

ID=17663117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6283257A Withdrawn JPH08147314A (ja) 1994-11-17 1994-11-17 認識型文書ファイリング装置及びその制御方法

Country Status (1)

Country Link
JP (1) JPH08147314A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057315A (ja) * 1998-08-06 2000-02-25 Mitsubishi Electric Corp 文書ファイリング装置及び文書ファイリング方法
JP2000181931A (ja) * 1998-12-18 2000-06-30 Sharp Corp 自動オーサリング装置および記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057315A (ja) * 1998-08-06 2000-02-25 Mitsubishi Electric Corp 文書ファイリング装置及び文書ファイリング方法
JP2000181931A (ja) * 1998-12-18 2000-06-30 Sharp Corp 自動オーサリング装置および記録媒体

Similar Documents

Publication Publication Date Title
US6385350B1 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
US6366695B1 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
EP0439951B1 (en) Data processing
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
KR100412317B1 (ko) 문자인식/수정방법및장치
US6763137B1 (en) Recognition and clustering of connected components in bi-level images
US8103100B2 (en) System of implementing user handwriting and method thereof
US5812696A (en) Character recognizing method and apparatus
US5150425A (en) Character recognition method using correlation search
US6947596B2 (en) Character recognition method, program and recording medium
US5625710A (en) Character recognition apparatus using modification of a characteristic quantity
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JPH08147314A (ja) 認識型文書ファイリング装置及びその制御方法
US11361529B2 (en) Information processing apparatus and non-transitory computer readable medium
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP3623992B2 (ja) 文字認識装置及び方法
JPH0830725A (ja) 画像処理装置及び方法
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JP3060248B2 (ja) 表認識装置
JP4697387B2 (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム
JP2906758B2 (ja) 文字読取装置
JP3157530B2 (ja) 文字切り出し方法
JPH0816719A (ja) 文字切り出し方法とこれを用いた文字認識方法及び装置
JPH06208652A (ja) 画像処理方法及び装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020205