JPH0394393A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0394393A
JPH0394393A JP1230415A JP23041589A JPH0394393A JP H0394393 A JPH0394393 A JP H0394393A JP 1230415 A JP1230415 A JP 1230415A JP 23041589 A JP23041589 A JP 23041589A JP H0394393 A JPH0394393 A JP H0394393A
Authority
JP
Japan
Prior art keywords
character
image data
resolution
image
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1230415A
Other languages
English (en)
Inventor
Mitsumasa Sugiyama
杉山 光正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1230415A priority Critical patent/JPH0394393A/ja
Publication of JPH0394393A publication Critical patent/JPH0394393A/ja
Priority to US08/173,861 priority patent/US5361309A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識装置、詳しくは1文字分の文字イメー
ジデータを切り出し、その切り出した文字のイメージデ
ータから文字認識する文字認識装置に関するものである
[従来の技術] 従来より光学的に原稿画像を読取り、その文字を認識す
る装置がある。
通常、認識対象である原稿画像には、多数の文字がある
わけであるから、文字認識の際には先ず、個々の文字の
切り出し処理(1文字の存在する領域位置の検出)を行
なう必要がある。
そして、切り出したl文字分のイメージデータに基づい
て文字認識が行なわれる。
ところで認識率を向上させるためには、切り出した文字
を構成するドット数は多ければ多い程良い。すなわち、
スキャナ等で原稿画像を読み取り、そして認識処理する
場合には、そのスキャナの解像度は高い方が良い。
[発明が可決しようとする課題] しかし、一方では、解像度が高ければ高い程、文字切り
出し処理及び文字認識処理に要する時間は大きなものと
なる。
本発明はかかる課題に鑑みなされたものであり、少なく
とも文字切り出し処理を高速にして、文字認識処理に係
る全体の処理時間の短縮を図る文字認識装置を提供しよ
うとするものである。
[課題を解決するための手段]及び[作用]この課題を
解決するため、本発明の文字認識装置は以下に示す構成
を備える。すなわち、1文字分の文字イメージデータを
切り出し、その切り出した文字のイメージデータから文
字認識する文字認識装置において、認識対象文字群のイ
メージデータの低解像度データを記憶する第1の記憶手
段と、前記認識対象文字群のイメージデータの高解像度
データを記憶する第2の記憶手段と、前記第1の記憶手
段に記憶された個々の文字のイメージデータの存在位置
に基づいて前記第2の記憶手段に記憶された対応文字の
イメージデータを切り出す文字切り出し手段とを備え、
該文字切り出し手段で切り出された文字のイメージデー
タな基にして文字認識処理を行なう。
[実施例] 以下、添付図面に従って本発明に係る実施例を詳細に説
明する。
第1図は本実施例における文字認識装置のブロック構成
図である。
図中、1は原稿画像(実施例では横書きの原稿画像)を
記憶している画像データベース、2は画像伸張回路、3
は低解像画像記憶部、4は高解像画像記憶部、5は文字
切り出し処理部、6は文字認識処理部である。尚、低解
像画像記憶部3及び高解像画像記憶部4は共にRAMよ
り構成されていて、各々の解像度に対応してl原稿画像
1ページ分記憶可能な容量を有するものとする。
画像データベースlには階層的圧縮画像が保存されてお
り、画像伸張回路2により低解像画像から高解像画像ま
で段階的に伸張することができる。実施例では、50d
pi,100dpL,200dpi,400dpiの解
像度の画像データを得ることができる。画像伸張回路2
は画像データベース1から画像データを入力して伸張し
、50dpiの解像度の画像データを低解像画記憶部3
に格納し、400dpiの解像度の画像データを高解像
画像記憶部4に格納する。
これら低解像画像記録部3及び高解像画像記憶部4への
画像データの展開を終えると、文字切り出し処理部5は
、個々の文字毎の切り出し位置を検出する。
具体的には、低解像画像記憶部3内に展開された原稿画
像に対して、横方向にスキャンし、黒ドットの頻度を取
る。そして、縦(Y)方向を変移とする黒ドットの分布
を取ることで、各行の位置(縦方向の座標位置)を検出
する。ここで検出される座標位置は、文字が横方向に並
んでいる各行の上辺の座標と下辺の座標である。
この後、注目行における各文字毎の横方向の座標位置を
検出する。この検出も先の行検出と同様である。すなわ
ち、注目行における縦方向の黒ドットの頻度を取り、そ
れを横(X)方向に変移する分布をとる。そして、黒ド
ットの存在を検出された位置からそれが消失した位置ま
で(その間が文字幅となる)を1文字の横方向の座標位
置とする。
こうして、低解像画像記憶部3における各文字の左上の
点と右下の点の座標位置が求められることになる。
第3図で示すと、文字「の」の左上点は、右方向にi画
素目、下方向にjライン目であるのでの座標位置(i.
j)、右下点はm画素目nライン目であるから座標位置
(m,n)である。
文字切り出し処理部5は低解像画像記憶部3に記憶され
た注目文字画像の左上点及び右下点の座標を検出した後
、高解像画像記憶部4内の対応する文字画像の左上点と
右下点の座標を算出する。
実施例の場合、低解像画像記憶部3には50dpiの画
像が、高解像画像記憶部4はその8倍の400dpiの
画像が記憶されていることは先に説明した。すなわち、
高解像画像記憶部4は低解像画像記憶部3の縦横とも8
倍の大きさを有するものである。
従って、高解像画像記憶部4内の対応する文字画像の左
上点の座標は(8i.8j).右下点の座標は(8m,
8n)となるが、低解像画像データにおける切り出し位
置を高解像画像データが確実に含むようにするため、実
施例では高解像画像記憶部4の左上点の座標を(8i−
k,8j一k)、右下点の座標を(8m+k.8n+k
)とした。ここで、k=o〜7の適当な値である。
文字切り出し処理部5は、この得られた高解像画像記憶
部4内における座標位置でもって規定される矩形領域の
画像を切り出し、文字認識処理部6に引き渡す。これに
よって、文字認識処理部は高解像画像記憶部4より切り
出された文字画像の認識処理を実行し、認識結果である
文字コードを生成する。
第2図は文字切り出し位置検出に係るフローチャートで
あり、文字切り出し処理部5の処理内容の一部を成すも
のである。
先ず、ステップS1において、低解像画像データ(低解
像画像記憶部3に記憶されている)での1文字の文字画
像の左上の点をi画素jラインとし、右下の点をm画素
nラインする。低解像画像記憶部3には50dpiの解
像度の画素データが格納されており、高解像画像記憶部
にはその8倍の400dp iの解像度の画像データが
格納されているので、ステップS2では、高解像画像デ
ー夕における左上点を(8i−k)画素(8j−k)ラ
イン、右下点を(8m+k)画素(8n十k)ラインと
する。
そして、次のステップS3において、得られた座標位置
(8i−k,8j−k)及び(8m十k,8n+k)で
規定される矩形内の画像を高解像画像記憶部4より切り
出し(読み出し)、それを文字認識処理部6に出力する
以上説明したように本実施例によれば、文字切り出し位
置を、低解像度のデータを基にしても検出するので、そ
の検出に要する処理時間を短縮することが可能となる。
従って、文字認識に要する全体での処理時間も短縮する
ことが可能となる。
尚,上述した実施例では、低解像画像記憶に50dpi
、高解像画像記憶部に400dp iの解像度の画像デ
ータを格納した場合を説明したが、必ずしも50dpi
や400dp iである必要はない。例えば、低解像画
像記憶部に100dpiの解像度の画像データを格納し
てもよい。この場合には、解像度の差は4倍となるから
、文字切り出し位置の座標は(4i−k,4j−k),
(4m十k,4n+k)となる。但し、k=O〜3の適
当な値である。
また、画像データベース1から、50dpi,100d
pi,200dpi,400dpiの画像データを得て
いるが、画像データにより、他の解像度の画像データ、
例えば、75dpi,150dpi,300dpiでも
よいことは勿論である。
更には、実施例では、認識対象の文字画像を画像データ
ベース1から取り出す例を説明したが、装置にスキャナ
やビデオカメラ等の画像入力装置が接続されている場合
には、それらから入力した画像(或いは一旦外部記憶装
置に記憶させた画像)を基に処理しても良い。但し、画
像入力手段としては認識率向上ため、高解像度のもので
ある必要がある。
例えば、画像入力装置の解像度が400dpiである場
合には、それでもって読み取った画像をそのまま高解像
画像記憶部4に展開する。そして、低解像画像記憶3に
は縦横とも8画素おきに(或いは8画素全ての論理和や
平均値を算出することで)1画素データを生成すること
でsoctpiの画像を生成する。
また、実施例では、画像データは画像データベース1か
ら取り出していたが、装置にモデムやFAX等電話回線
等によって画像データを受信する装置が接続されている
場合には、階層的に圧縮された画像データを受信して一
時記憶回路に保存し、一時記憶回路から画像データを取
り出してもよい。
更には、前実施例では画像データベース1には階層的に
圧縮された画像データが保存するものとして説明した。
しかしながら、画像データベース1に階層的に圧縮され
た画像データと、圧縮されていない画像データが混在し
て保存する場合には、階層的に圧縮されている画像デー
タに対しては上記実施例に従い、圧縮されていない画像
データに対しては、高解像画像データのみを用いる従来
の方法を行うようにしてもよい。
[発明の効果] 以上説明したように、本発明によれば、認識対象の文字
切り出し処理が高速に行なわれるので、文字認識処理全
体に係る時間の短縮化が可能となる。
【図面の簡単な説明】
第1図は本実施例における文字認識装置のブロック構成
図、 第2図は文字切り出し処理部の動作を示すフローチャー
ト、 第3図は文字と文字切り出し位置の関係を示す図である
。 図中、■・・・画像データベース、2・・・画像伸張回
路、3・・・低解像画像記憶部、4・・・高解像画像記
憶部、5・・・文字切り出し処理一部、6・・・文字認
識処理部である。

Claims (1)

  1. 【特許請求の範囲】  1文字分の文字イメージデータを切り出し、その切り
    出した文字のイメージデータから文字認識する文字認識
    装置において、 認識対象文字群のイメージデータの低解像度データを記
    憶する第1の記憶手段と、 前記認識対象文字群のイメージデータの高解像度データ
    を記憶する第2の記憶手段と、 前記第1の記憶手段に記憶された個々の文字のイメージ
    データの存在位置に基づいて前記第2の記憶手段に記憶
    された対応文字のイメージデータを切り出す文字切り出
    し手段とを備え、該文字切り出し手段で切り出された文
    字のイメージデータを基にして文字認識処理を行なうこ
    とを特徴とする文字認識装置。
JP1230415A 1989-09-07 1989-09-07 文字認識装置 Pending JPH0394393A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1230415A JPH0394393A (ja) 1989-09-07 1989-09-07 文字認識装置
US08/173,861 US5361309A (en) 1989-09-07 1993-12-23 Character recognition apparatus and method with low-resolution storage for character extraction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1230415A JPH0394393A (ja) 1989-09-07 1989-09-07 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0394393A true JPH0394393A (ja) 1991-04-19

Family

ID=16907528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1230415A Pending JPH0394393A (ja) 1989-09-07 1989-09-07 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0394393A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006228232A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd 文字分割プログラム、文字分割装置および文字分割方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006228232A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd 文字分割プログラム、文字分割装置および文字分割方法

Similar Documents

Publication Publication Date Title
JP3338537B2 (ja) 画像傾き検出装置
JP2940936B2 (ja) 表領域識別方法
US7227557B2 (en) Method, system and record medium for generating wide-area high-resolution image
US20070237394A1 (en) Image processor for character recognition
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH03122773A (ja) 画像形成装置
JP2001203876A (ja) 文書修飾装置及び画像処理装置
JP5294798B2 (ja) 画像処理装置及び画像処理方法
US5467410A (en) Identification of a blank page in an image processing system
US5361309A (en) Character recognition apparatus and method with low-resolution storage for character extraction
JPH10513284A (ja) 二進イメージに対する空白ページ及び文字枠の自動決定
JPH04303278A (ja) 圧縮映像の文字列分離方式
JPH0394393A (ja) 文字認識装置
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JPH03142691A (ja) 表形式文書認識方式
JPS63304387A (ja) 文書読取装置
JPH04255080A (ja) 画像入力装置
JP2007249580A (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP3337592B2 (ja) マーク位置検出装置およびマーク位置検出方法
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP2926842B2 (ja) 文字切出し回路
JPH05151350A (ja) 画像データの位置歪み補正方法
JP2577276B2 (ja) 線切れ部検出方法
JPH1049602A (ja) 帳票認識方法