JP2001266070A - 文字認識装置、文字認識方法および記憶媒体 - Google Patents

文字認識装置、文字認識方法および記憶媒体

Info

Publication number
JP2001266070A
JP2001266070A JP2000076508A JP2000076508A JP2001266070A JP 2001266070 A JP2001266070 A JP 2001266070A JP 2000076508 A JP2000076508 A JP 2000076508A JP 2000076508 A JP2000076508 A JP 2000076508A JP 2001266070 A JP2001266070 A JP 2001266070A
Authority
JP
Japan
Prior art keywords
character
line
extracting
extracted
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000076508A
Other languages
English (en)
Other versions
JP4136257B2 (ja
Inventor
Toshio Miyazawa
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000076508A priority Critical patent/JP4136257B2/ja
Publication of JP2001266070A publication Critical patent/JP2001266070A/ja
Application granted granted Critical
Publication of JP4136257B2 publication Critical patent/JP4136257B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字切り出しで殊に問題となる文字間の接触
の多い入力文書から、正しく文字を切り出して認識する
ことができる文字認識装置および文字認識方法を実現す
る。 【解決手段】 文書画像から文字行を切り出し、この切
り出された文字行からさらに文字を切り出して文字認識
を行う文字認識装置において、切り出された文字行の画
像データをこの文字行に平行に、行の高さの1/n(こ
こではn=3)に分割して抽出する文字分割抽出手段
と、この文字分割抽出手段が抽出した文字行の部分を用
いて、文字を切り出すための切り出し位置を決定する文
字位置決定手段とを設ける。この文字位置決定手段は、
分離部分の最後位置X1eと最前位置X2sから切り出
し位置を決定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置およ
び文字認識方法と、文字認識プログラムを記憶した記憶
媒体に関し、特に文字切り出し方法を改良した文字認識
装置および文字認識方法ならびに記憶媒体に関する。
【0002】
【従来の技術】文字データを読み取って入力する装置と
して、文字認識装置がある。文字認識装置での文字認識
に際して、帳票など、文字の種類や大きさ、文字の位置
などが予め定まっている場合は、比較的容易に文字を切
り出して認識することができる。しかし、一般の印刷文
書などから文字を認識して入力する場合には、文字の種
類や大きさ、文字位置などを予め予測することができな
いために認識作業に困難が生まれる。例えば、漢字にお
いては、構成要素が分離している場合があるため、どの
部分を一文字として認識するかが問題になる。また、文
字サイズの異なる文字が混在したり、漢字、仮名混じり
文に英数字が挿入されたり、文字が相互に接触していた
り、文字の印刷がかすれていたりする場合などにおいて
は、認識に先立って一文字ずつを切り出すことに困難を
伴う場合が多い。
【0003】今、図3に示すような文字画像が入力され
た場合を考える。この図に示すように、1行内の文字の
大半(この場合は全て)が、接触している場合には、1
文字、1文字を切り出すことは大変難しかった。たとえ
ば、行高さを基に1文字幅とするという方法もあるが、
半角文字である場合など、縦横比が1対1でない場合
は、行高さを基に切り出すことも不可能になる。接触し
ている文字を正しく切り出して認識する方法として、特
開平5−128307号公報では、平均的な文字幅や文
字ピッチを算出し、これらの値から、文字切り出しを行
っている。しかしこの方法でも、英数字などで、行内の
文字の大半が接触している場合に、平均文字幅や平均文
字ピッチを正しく算出することができないという間題が
あった。
【0004】
【発明が解決しようとする課題】上述のごとく、従来の
文字認識装置および文字認識方法では、一般の文書から
文字を切り出して認識するに際し、文字の切り出しに困
難を伴い、これらが解決できないために文字の切り出し
が正確に行われず、文字が正しく認識できないという問
題があった。ことに、英数字などで文字が相互に接触し
ている場合は問題が多い。本発明は、比較的簡単な方法
でこの問題を解決して、文字切り出しで殊に問題となる
文字間の接触の多い入力文書から、正しく文字を切り出
して認識することができる文字認識装置および文字認識
方法の実現を課題とする。
【0005】
【課題を解決するための手段】上記課題を達成するた
め、本発明は、文書画像から文字行を切り出し、この切
り出された文字行から文字を切り出して文字認識を行う
文字認識装置において、切り出された文字行の画像デー
タを分割して抽出する文字分割抽出手段と、この文字分
割抽出手段が抽出した文字行の部分を用いて文字を切り
出すための切り出し位置を決定する文字位置決定手段と
を具備することを特徴とする。これにより、行内の文字
が相互に接触しているような場合においても正確に文字
を切り出すことが可能な、文字の認識精度の高い文字認
識装置を実現することができる。
【0006】また、文書画像から文字行を切り出し、こ
の切り出された文字行から文字を切り出して文字認識を
行う文字認識方法において、切り出された文字行の一部
分の画像データを分割して抽出する文字分割抽出過程
と、この文字分割抽出過程で抽出した文字行の部分を用
いて文字を切り出すための切り出し位置を決定する文字
位置決定過程とを具備することを特徴とする。これによ
り、行内の文字が相互に接触しているような場合におい
ても正確に文字を切り出すことができ、文字の認識精度
の高い文字認識方法を実現することができる。
【0007】さらにまた、文書画像から文字行を切り出
し、この切り出された文字行から文字を切り出して文字
認識を行う文字認識方法をコンピュータに実行させるプ
ログラムを記憶し、このコンピュータから読取り可能な
記憶媒体であって、切り出された文字行の一部分の画像
データを分割して抽出する文字分割抽出過程と、この文
字分割抽出過程で抽出した文字行の部分を用いて文字を
切り出すための切り出し位置を決定する文字位置決定過
程とを有するプログラムを記憶することを特徴とする。
これにより、コンピュータを用いて、行内の文字が相互
に接触しているような場合においても正確に文字を切り
出すことができ、文字の認識精度の高い文字認識システ
ムを実現することができる。
【0008】
【発明の実施の形態】以下、本発明にかかる文字認識装
置を添付図面を参照にして詳細に説明することにする。
【0009】図1は、本発明の文字認識装置をソフトウ
ェアで実現する場合の回路構成を示すブロック図であ
る。図1において、符号1はCPU、符号2はメモリ、
符号3は通信装置、符号4は表示装置、符号5はハード
ディスク、符号6はキーボード、符号7はCD−ROM
ドライブ、符号8はFDドライブである。
【0010】図1に沿って、この装置の動作を説明す
る。図示しないスキャナなどの走査入力装置で、原稿の
文字画像を読み取って得られた画像信号データが、例え
ば、通信装置3を介して装置に入力されると、一旦、ハ
ードディスク5などに記憶された後、CPU1によりメ
モリ2に記憶されているソフトウェアによって認識作業
が行われる。認識作業は、まず、文字行を切り出し、次
に切り出した文字行中の各文字を切り出し、切り出した
各文字についてハードディスク5などに記憶された辞書
と比較して文字認識が行われる。認識結果は、例えば、
FDドライブ8などを介してFDなどに記録されて出力
されるか、または通信装置3を介して出力される。
【0011】図2は、文字認識装置を通信回線を介して
構成する場合のブロック図である。図2において、符号
11、符号12、符号13はそれぞれ装置1、装置2、
装置3であり、符号14はインターネットなどの通信回
線である。装置1(11)、装置2(12)、装置3
(13)はいずれかが原稿の文字画像を読み取る操作入
力装置であって、他のものが図1に示したような装置で
あっても、いずれもが相互に協同して文字認識を行う図
1に示した装置であって、画像信号データの入力が別な
方法で行われてもよい。
【0012】次に、このような装置内で行われる処理に
ついて説明する。今、図3に示すような文字画像が切り
出されて入力される場合を考える。この図に示すよう
に、この文字行では1行内の文字の大半が接触してい
る。このような文字行を、図4に示すように行方向に平
行(水平)に文字高さをn(ここでは3)分割する。n
の値は任意で、あまり多くならない範囲で2分割でも4
分割でもよい。
【0013】このように分割することによって、図5に
示すように、ある領域では分割された文字が接触してい
るが、他の領域では、文字が接触せず分離されていると
いうことが起こる。すなわち、図の例では、3分割する
ことによって、「2」と「0」との間では上部と中央部
分とで接触が残っているが下部では分離され、「0」と
「0」との接触は中央部分では残っているが、上下の部
分ではなくなって分離されている。
【0014】これを基にして、図6に示すように接触部
分の切り出し位置を求める。すなわち、分離された文字
行部分の、1つめの連結成分のX座標の最大値をX1
e、2つめの連結成分のX座標の最小値をX2sとする
と、切り出し候補位置のX座標として、この中間値であ
るX1mをとる。
【0015】X1m=(X1e+X2s)/2
【0016】ここでは、切り出し候補位置のX座標とし
て、隣り合う黒連結成分のX座標の中間値を用いたが、
黒連結成分のX座標のどちらか(すなわちX1eかX2
sのいずれか)をそのまま用いても構わないし、黒連結
成分の座標値から計算して求めても構わない。
【0017】さらに、複数の分割部分からそれぞれに切
り出し候補位置のX座標を求めて、それらの平均を最終
的に切り出し候補のX座標とすることでさらに精度をあ
げることもできる。これにより、文字間に接触部分があ
るような場合においても、文字の切り出しを精度よく行
うことができ、それにともなって、文字の認識精度を向
上することができる。
【0018】なお、以上の説明は、文字認識装置につい
て行ったが、この文字認識装置に用いられた文字認識方
法、およびこの文字認識方法を実行するプログラムを記
憶した記憶媒体をも本発明の対象とするものである。
【0019】
【発明の効果】以上説明したように本発明の請求項1の
発明は、文書画像から文字行を切り出し、この切り出さ
れた文字行からさらに文字を切り出して文字認識を行う
文字認識装置において、切り出された文字行の画像デー
タを分割して抽出する文字分割抽出手段と、この文字分
割抽出手段が抽出した文字行の部分を用いて文字を切り
出すための切り出し位置を決定する文字位置決定手段と
を具備することを特徴とする。このように、切り出され
た行の中をさらに分割して、分割された画像データをも
とに文字切り出し候補位置を推定することで、より精度
の高い文字切り出しが可能な文字認識装置を実現するこ
とができる。
【0020】本発明の請求項2の発明は、文字分割抽出
手段は、文字行をこの文字行方向に平行に行の高さの1
/nの複数の領域に分割して抽出することを特徴とす
る。これにより、文字間に接触があっても、n分割のい
ずれかの部分で分離が見られるので、これを基に精度の
高い文字切り出しを行うことができる。
【0021】本発明の請求項3の発明は、文字位置決定
手段が、文字分割抽出手段によって分割された文字行の
複数の領域の各々から求められた切り出し位置の候補に
基づいて、文字の切り出し位置を決定することを特徴と
する。これにより、複数の切り出し位置の候補を基に精
度の高い文字切り出しを行うことができる。
【0022】本発明の請求項4の発明は、文書画像から
文字行を切り出し、この切り出された文字行から文字を
切り出して文字認識を行う文字認識方法において、切り
出された文字行の一部分の画像データを分割して抽出す
る文字分割抽出過程と、この文字分割抽出過程で抽出し
た文字行の部分を用いて文字を切り出すための切り出し
位置を決定する文字位置決定過程とを具備することを特
徴とする。これにより、切り出された行の中をさらに分
割して、分割された画像データをもとに文字切り出し候
補位置を推定して、より精度の高い文字切り出しを行え
る文字認識方法が得られる。
【0023】本発明の請求項5の発明は、文書画像から
文字行を切り出し、この切り出された文字行から文字を
切り出して文字認識を行う文字認識方法をコンピュータ
に実行させるプログラムを記憶し、このコンピュータか
ら読取り可能な記憶媒体であって、切り出された文字行
の一部分の画像データを分割して抽出する文字分割抽出
過程と、この文字分割抽出過程で抽出した文字行の部分
を用いて文字を切り出すための切り出し位置を決定する
文字位置決定過程とを有するプログラムを記憶すること
を特徴とする。これにより、切り出された行の中をさら
に分割して、分割された画像データをもとに文字切り出
し候補位置を推定して、より精度の高い文字切り出しを
行えるプログラムを記憶した記憶媒体が得られる。
【図面の簡単な説明】
【図1】本発明の文字認識装置をソフトウェアで実現す
る場合の回路構成を示すブロック図。
【図2】文字認識装置を通信回線を介して構成する場合
のブロック図。
【図3】入力文字画像の一例。
【図4】図3に示す入力文字画像の分割例。
【図5】図4の分割例にしたがった分離位置の検出の説
明図。
【図6】図4の分割例にしたがった切り出し候補位置の
求め方の説明図。
【符号の説明】
1 CPU 2 メモリ 3 通信装置 4 表示装置 5 ハードディスク 6 キーボード 7 CD−ROMドライブ 8 FDドライブ 11 装置1 12 装置2 13 装置3 14 通信回線

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文書画像から文字行を切り出し、この切
    り出された文字行から文字を切り出して文字認識を行う
    文字認識装置において、 切り出された文字行の画像データを分割して抽出する文
    字分割抽出手段と、 この文字分割抽出手段が抽出した文字行の部分を用いて
    文字を切り出すための切り出し位置を決定する文字位置
    決定手段とを具備することを特徴とする文字認識装置。
  2. 【請求項2】 前記文字分割抽出手段は、文字行を、こ
    の文字行方向に平行に行の高さの1/nの複数の領域に
    分割して抽出することを特徴とする請求項1に記載の文
    字認識装置。
  3. 【請求項3】 前記文字位置決定手段は、前記文字分割
    抽出手段によって分割された文字行の複数の領域の各々
    から求められた切り出し位置の候補に基づいて、文字の
    切り出し位置を決定することを特徴とする請求項2に記
    載の文字認識装置。
  4. 【請求項4】 文書画像から文字行を切り出し、この切
    り出された文字行から文字を切り出して文字認識を行う
    文字認識方法において、 切り出された文字行の一部分の画像データを分割して抽
    出する文字分割抽出過程と、 この文字分割抽出過程で抽出した文字行の部分を用いて
    文字を切り出すための切り出し位置を決定する文字位置
    決定過程とを具備することを特徴とする文字認識方法。
  5. 【請求項5】 文書画像から文字行を切り出し、この切
    り出された文字行から文字を切り出して文字認識を行う
    文字認識方法をコンピュータに実行させるプログラムを
    記憶し、このコンピュータから読取り可能な記憶媒体で
    あって、 切り出された文字行の一部分の画像データを分割して抽
    出する文字分割抽出過程と、 この文字分割抽出過程で抽出した文字行の部分を用いて
    文字を切り出すための切り出し位置を決定する文字位置
    決定過程とを有するプログラムを記憶することを特徴と
    する記憶媒体。
JP2000076508A 2000-03-17 2000-03-17 文字認識装置、文字認識方法および記憶媒体 Expired - Fee Related JP4136257B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000076508A JP4136257B2 (ja) 2000-03-17 2000-03-17 文字認識装置、文字認識方法および記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000076508A JP4136257B2 (ja) 2000-03-17 2000-03-17 文字認識装置、文字認識方法および記憶媒体

Publications (2)

Publication Number Publication Date
JP2001266070A true JP2001266070A (ja) 2001-09-28
JP4136257B2 JP4136257B2 (ja) 2008-08-20

Family

ID=18594235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000076508A Expired - Fee Related JP4136257B2 (ja) 2000-03-17 2000-03-17 文字認識装置、文字認識方法および記憶媒体

Country Status (1)

Country Link
JP (1) JP4136257B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107437294A (zh) * 2017-08-01 2017-12-05 深圳怡化电脑股份有限公司 一种字符分割方法、装置、设备及存储介质
CN108510636A (zh) * 2018-03-27 2018-09-07 深圳怡化电脑股份有限公司 图像分割方法、图像分割装置及终端设备
CN108717744A (zh) * 2018-04-27 2018-10-30 深圳怡化电脑股份有限公司 识别金融单据上的***序号的方法、装置及终端设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107437294A (zh) * 2017-08-01 2017-12-05 深圳怡化电脑股份有限公司 一种字符分割方法、装置、设备及存储介质
CN108510636A (zh) * 2018-03-27 2018-09-07 深圳怡化电脑股份有限公司 图像分割方法、图像分割装置及终端设备
CN108717744A (zh) * 2018-04-27 2018-10-30 深圳怡化电脑股份有限公司 识别金融单据上的***序号的方法、装置及终端设备

Also Published As

Publication number Publication date
JP4136257B2 (ja) 2008-08-20

Similar Documents

Publication Publication Date Title
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US8041113B2 (en) Image processing device, image processing method, and computer program product
US7796817B2 (en) Character recognition method, character recognition device, and computer product
US7519226B2 (en) Form search apparatus and method
JP5508359B2 (ja) 文字認識装置、文字認識方法及びプログラム
JPH09179937A (ja) 文書画像のセンテンスの境界の自動識別方法
JP5600723B2 (ja) 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
JP7244223B2 (ja) 電子文書における強調テキストの識別
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
US7680329B2 (en) Character recognition apparatus and character recognition method
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体
JP3798179B2 (ja) パターン抽出装置及び文字切り出し装置
JP2001283157A (ja) 単語認識方法および単語認識プログラム
JPH09274645A (ja) 文字認識方法および装置
JP2728086B2 (ja) 文字切り出し方法
JP3133797B2 (ja) 文字認識方法及びその装置
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JP3897999B2 (ja) 手書き文字認識方法
JP2982221B2 (ja) 文字読み取り装置
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05114047A (ja) 文字切り出し装置
JP2022051198A (ja) Ocr処理装置、ocr処理方法、及びプログラム
JP4141217B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP2003030585A (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP2993533B2 (ja) 情報処理装置及び文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050121

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080603

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees