JP4164976B2 - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP4164976B2
JP4164976B2 JP2000025918A JP2000025918A JP4164976B2 JP 4164976 B2 JP4164976 B2 JP 4164976B2 JP 2000025918 A JP2000025918 A JP 2000025918A JP 2000025918 A JP2000025918 A JP 2000025918A JP 4164976 B2 JP4164976 B2 JP 4164976B2
Authority
JP
Japan
Prior art keywords
unit
character
image
point
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000025918A
Other languages
English (en)
Other versions
JP2001216468A (ja
Inventor
欣也 赤羽目
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000025918A priority Critical patent/JP4164976B2/ja
Publication of JP2001216468A publication Critical patent/JP2001216468A/ja
Application granted granted Critical
Publication of JP4164976B2 publication Critical patent/JP4164976B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識装置において認識対象領域を指定する技術に関するものである。
【0002】
【従来の技術】
従来、このような分野の技術としては、例えば次のような文献に記載されるものがあった。
文献:特許第2661898号明細書
【0003】
図2は、前記文献に記載された従来の文字認識装置における認識対象領域の指定方法の説明図である。
この文字認識装置では、表示部に表示された画像上で、罫線で囲まれた認識対象の領域Qを指定する場合に、カーソルをこの領域Q内の任意の1点qに移動させて指定する方法が採られている。カーソルによって1点qの座標が入力されると、この1点qを中心として上下左右の4方向に向かって罫線のサーチが行われる。そして、上下方向のサーチで最初に検出された2本の横罫線と、左右方向のサーチで最初に検出された2本の縦罫線で囲まれた領域が指定された認識対象の領域Qとして特定されるようになっていた。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の文字認識装置では、例えば、それぞれ罫線で囲まれた隣接する2つの領域を、1つの認識対象領域として指定することができないという課題があった。
本発明は、前記従来技術が持っていた課題を解決し、それぞれ罫線で囲まれた複数の領域を、1つの認識対象領域として指定することができる文字認識装置を提供するものである。
【0005】
【課題を解決するための手段】
前記課題を解決するために、本発明は文字認識装置において、罫線で区分された複数の領域内に認識対象の文字が記載された文書を画像イメージとして入力する画像入力部と、前記画像入力部で入力された画像イメージ上の認識対象領域を前記罫線で区分された同一領域内または異なる領域内の第1及び第2の点で指定する領域指定部と、次のような領域決定部と、文字切出部と、文字認識部とを備えている。
【0006】
領域決定部は、前記第1の点を起点として前記第2の点の反対側を横方向及び縦方向に探索して第1の縦罫線及び横罫線を抽出すると共に、該第2の点を起点として該第1の点の反対側を横方向及び縦方向に探索して第2の縦罫線及び横罫線を抽出し、これらの第1及び第2の縦罫線及び横罫線で囲まれた範囲を前記認識対象領域として決定するものである。また、文字切出部は、前記領域決定部で決定された認識対象領域から認識対象の文字イメージを切り出すものであり、文字認識部は、前記文字イメージを文字辞書と照合して該当する文字コードを出力するものである。
【0007】
本発明によれば、以上のように文字認識装置を構成したので、次のような作用が行われる。
画像入力部で入力された文書の画像イメージ上で、領域指定部によって第1及び第2の点が指定されると、領域決定部によって、この第1の点を起点として画像イメージが探索され、第1の縦罫線及び横罫線が抽出される。更に、第2の点を起点として画像イメージが探索され、第2の縦罫線及び横罫線が抽出される。抽出された第1及び第2の縦罫線及び横罫線で囲まれた範囲が、認識対象領域と決定されて文字切出部に与えられる。文字切出部では、与えられた認識対象領域に基づいて認識対象の文字イメージの切り出しが行われ、文字認識部に出力される。文字認識部では、与えられた文字イメージが文字辞書と照合され、該当する文字コードが選択されて出力される。
【0008】
【発明の実施の形態】
(第1の実施形態)
図1は、本発明の第1の実施形態を示す文字認識装置の構成図である。
この文字認識装置は、記載面を複数の領域に区分するための罫線とこれらの領域内に文字が記載された文書を、画素に分解して画像イメージとして読み取るイメージスキャナ等の画像入力部1を備えている。画像入力部1の出力側には、読み取った画像イメージを、例えば白黒2値の画素データとして記憶する画像メモリ2が接続されている。画像メモリ2には、この画像メモリ2に記憶された画像イメージを表示すると共に、領域を指定する操作のための情報等をこの画像イメージに重畳して表示する表示部3が接続されている。
【0009】
また、この文字認識装置は、認識対象領域を特定するための領域指定部4及び領域決定部5を備えている。領域指定部4は、キーボードやマウス等の入力装置を有し、表示部3に表示された画像イメージ上で、認識対象領域を特定するための2点(例えば、点a,b)を指定して入力するものである。領域指定部4の出力側は、領域決定部5に接続されている。領域決定部5は、領域指定部4で指定された点a,bの座標に基づいて画像メモリ2をサーチし、認識対象領域Zの境界線となる罫線を抽出するものである。即ち、点aを起点として点bの反対側をサーチして第1の縦罫線と横罫線を抽出し、点bを起点として点aの反対側をサーチして第2の縦罫線と横罫線を抽出するようになっている。領域決定部5は、これらの第1及び第2の縦罫線及び横罫線で囲まれた範囲を、認識対象領域Zとして決定するものである。
【0010】
領域決定部5には、決定された認識対象領域Zから文字イメージを切り出す文字切出部6が接続されている。文字切出部6の出力側には、パターン化された文字のデータが記憶された文字辞書7を参照して、切り出された文字イメージの特徴データに従って文字の認識を行う文字認識部8が接続されている。そして、文字認識部8から認識結果である候補文字の文字コードが出力されるようになっている。
【0011】
図3は、図1中の領域指定部4と領域決定部5における処理の説明図である。図3には、画像メモリ2に記憶されて表示部3に表示された認識対象画像と、領域指定部4で指定された点a,bと、これらの2点で特定される認識対象領域Zが例示されている。以下、この図3を参照しつつ、図1の動作を、本発明の特徴である認識対象領域の特定処理を中心に説明する。
読み取り対象の文書が画像入力部1にセットされて読み取られると、読み取られた画像イメージが、白黒2値の画素データとして画像メモリ2に記憶される。画像メモリ2に記憶された画像イメージは、更に表示部3に表示される。
【0012】
オペレータは、認識対象領域を指定するため、入力装置を用いて入力を行う。領域指定部4の入力装置として例えばマウスを使用する場合、マウスカーソルを、図3に示すように表示部3の認識対象領域イメージ上に表示し、2つの点a,bをそれぞれクリックして指定する。このようにして指定された点aの座標a(Xa,Ya)、及び点bの座標b(Xb,Yb)は、領域指定部4から領域決定部5へ与えられる。
【0013】
領域決定部5では、2つの点a,bの座標と、画像メモリ2に記憶された画像イメージに基づき、下記のような手順で認識対象領域Zの決定が行われる。
まず、点a,bのX座標の値を比較することにより、左側にある点を決定する。ここでは、点aが左側であるとする。また、点a,bのY座標の値を比較することにより、上側にある点を決定する。ここでは、点bが上側であるとする。
【0014】
次に、左側にある点aを起点として、その左側の最初の縦罫線LLをサーチする。縦罫線のサーチは、縦方向に所定の数だけ黒画素が連続している箇所を罫線として検出する。同様に、右側ある点bを起点として、その右側の最初の縦罫線LRをサーチする。また、上側にある点bを起点として、その上側の最初の横罫線LUをサーチする。横罫線のサーチは、横方向に所定の数だけ黒画素が連続している箇所を罫線として検出する。同様に、下側ある点aを起点として、その下側の最初の横罫線LDをサーチする。
【0015】
そして、2本の縦罫線LL,LRと、2本の横罫線LU,LDとで囲まれた長方形の範囲を認識対象領域Zとして決定する。
このように決定された認識対象領域Zの情報は、領域決定部5から文字切出部6へ与えられる。文字切出部6によって、認識対象領域Z内の文字イメージが画像メモリ2から順次切り出され、文字認識部8へ与えられる。文字認識部8では、与えられた文字イメージの特徴データが抽出され、文字辞書7が参照されて該当する候補文字の文字コードが出力される
【0016】
以上のように、この第1の実施形態の文字認識装置は、指定された2点a,bに従って、これらの2点a,bを含んで罫線で囲まれた範囲を認識対象領域Zとして決定するための領域指定部4及び領域決定部5を有している。これにより、罫線で仕切られた2つ以上の領域でも、連続する1つの認識対象領域Zとして指定することができるという利点がある。
【0017】
(第2の実施形態)
図4は、本発明の第2の実施形態を示す文字認識装置の構成図であり、図1中の要素と共通の要素には共通の符号が付されている。
この実施形態の文字認識装置では、図1の文字認識装置の画像メモリ2と領域決定部5の間、及び領域決定部5と文字切出部6の間に、それぞれ切替部9,10を設け、これらの切替部9,10の間に、第2の領域指定部11及び領域決定部12を設けている。更に、表示部3に対するカーソル記憶部13を追加した構成になっている。
【0018】
切替部9、10は、選択信号SELに従って領域決定部5,12のいずれか一方を選択するものである。また、第2の領域指定部11及び領域決定部12は、例えば図2に示した従来の方法で認識対象領域を決定するものである。更に、カーソル記憶部13は、2つの領域決定部5,12の認識対象領域決定方法に対応して、表示部3に表示するそれぞれのカーソルの目盛りの形や色を記憶しておき、選択信号SELで選択された方法に対応したカーソル表示を行うものである。その他の構成は、図1と同様である。
【0019】
このような文字認識装置では、選択信号SELによって領域決定部5が選択されると、第1の実施形態と同様の動作が行われる。また、選択信号SELによって領域決定部12が選択されると、従来と同様の動作が行われる。この時、選択信号SELで選択された領域決定部(5または12)に対応して、表示部3に表示されるカーソル表示が異なり、どちらの方法で認識領域の指定及び決定を行うかが明確に区別されて表示される。
【0020】
以上のように、この第2の実施形態の文字認識装置は、第2の領域指定部11及び領域決定部12を備えているので、2種類の認識対象領域指定方法を切り替えて使用することが可能になる。更に、選択された方法に対応してカーソル表示を切り替えるためのカーソル記憶部13を備えているので、認識対象領域を指定する際に、適した方法を間違いなく選択することができる。
【0021】
なお、本発明は、上記実施形態に限定されず、種々の変形が可能である。この変形例としては、例えば、次の(a)〜(d)のようなものがある。
(a) 図1では、領域指定部4や領域決定部5等の各部を、個別の処理部として構成しているが、マイクロプロセッサ等を用いてプログラム制御で処理するようにしても良い。
(b) 図3において、2つの点a,bがそれぞれ別の領域内に指定された場合の処理を説明したが、同一領域内の2点を指定しても良い。
【0022】
(c) 図3において、横方向に並んだ3つの領域を認識対象領域Zとしてして指定した場合を例示したが、横方向及び縦方向に並んだm×nの領域を認識対象領域として指定することもできる。その場合、例えば、左上の領域内の点aと、右下の領域内の点bの2点を指定すれば良い。
(d) 画像イメージは白黒として処理しているが、カラーイメージに対しても同様に適用できる。
【0023】
【発明の効果】
以上詳細に説明したように、本発明によれば、認識対象領域を特定するために異なる領域内の2点を指定することができる領域指定部と、指定された2点を囲む罫線を抽出して認識対象領域を決定する領域決定部を備えている。これにより、それぞれ罫線で区分された複数の領域を1つの認識対象領域として指定することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示す文字認識装置の構成図である。
【図2】従来の文字認識装置における認識対象領域の指定方法の説明図である。
【図3】図1中の領域指定部4と領域決定部5における処理の説明図である。
【図4】本発明の第2の実施形態を示す文字認識装置の構成図である。
【符号の説明】
1 画像入力部
2 画像メモリ
3 表示部
4 領域指定部
5 領域決定部
6 文字切出部
7 文字辞書
8 文字認識部

Claims (1)

  1. 罫線で区分された複数の領域内に認識対象の文字が記載された文書を画像イメージとして入力する画像入力部と、
    前記画像入力部で入力された画像イメージ上の認識対象領域を前記罫線で区分された同一領域内または異なる領域内の第1及び第2の点で指定する領域指定部と、
    前記第1の点を起点として前記第2の点の反対側を横方向及び縦方向に探索して第1の縦罫線及び横罫線を抽出すると共に、該第2の点を起点として該第1の点の反対側を横方向及び縦方向にしてして第2の縦罫線及び横罫線を抽出し、これらの第1及び第2の縦罫線及び横罫線で囲まれた範囲を前記認識対象領域として決定する領域決定部と、
    前記領域決定部で決定された認識対象領域から認識対象の文字イメージを切り出す文字切出部と、
    前記文字イメージを文字辞書と照合して該当する文字コードを出力する文字認識部とを、
    備えたことを特徴とする文字認識装置。
JP2000025918A 2000-02-03 2000-02-03 文字認識装置 Expired - Fee Related JP4164976B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000025918A JP4164976B2 (ja) 2000-02-03 2000-02-03 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000025918A JP4164976B2 (ja) 2000-02-03 2000-02-03 文字認識装置

Publications (2)

Publication Number Publication Date
JP2001216468A JP2001216468A (ja) 2001-08-10
JP4164976B2 true JP4164976B2 (ja) 2008-10-15

Family

ID=18551708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000025918A Expired - Fee Related JP4164976B2 (ja) 2000-02-03 2000-02-03 文字認識装置

Country Status (1)

Country Link
JP (1) JP4164976B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4974367B2 (ja) * 2007-09-14 2012-07-11 株式会社リコー 領域分割方法及び装置、並びにプログラム
JP2013250927A (ja) * 2012-06-04 2013-12-12 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
CN107742355B (zh) * 2017-11-13 2023-08-18 江苏海洋大学 自动传送分拣硬币的装置

Also Published As

Publication number Publication date
JP2001216468A (ja) 2001-08-10

Similar Documents

Publication Publication Date Title
EP1136938B1 (en) A method of recognizing and indexing documents
JP2865210B2 (ja) 文字認識装置
KR960002079A (ko) 이미지 인식장치 및 방법
JP6754120B2 (ja) プログラム、情報記憶媒体及び文字分割装置
JP3795238B2 (ja) 文書画像処理装置及び文書画像処理方法
JP4164976B2 (ja) 文字認識装置
US5563964A (en) Method and apparatus for processing a plurality of designated areas of an image
JPH1049688A (ja) 画像データの部分消去および部分検出方法
US6212294B1 (en) Image processing method and apparatus therefor
JPS6337487A (ja) 文字認識装置
EP0585610B1 (en) Method and apparatus for inputting handwritten alphanumeric characters and for displaying the input character
JPH01126717A (ja) 線図形入力装置および線図形入力方法
JPH07193716A (ja) エッジ強調装置
US8768060B2 (en) Image processing apparatus, image processing method and computer-readable medium
JPH0744656A (ja) 手書文字認識装置
KR100332752B1 (ko) 문자인식방법
JPH07249098A (ja) 情報処理装置および情報処理方法
JP2562498B2 (ja) 指定図形の座標検出方式
JPH053631B2 (ja)
JPH0388086A (ja) 文書読取装置
JPH08263588A (ja) 文字認識装置
JPS6041176A (ja) パタ−ンマツチング方法
JPH10143606A (ja) 文字認識装置および文字認識方法
JPH06162106A (ja) 電子ファイリングシステム
JP2008305248A (ja) 検索装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080708

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080721

R150 Certificate of patent or registration of utility model

Ref document number: 4164976

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110808

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120808

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130808

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees