JPH06215183A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06215183A
JPH06215183A JP5005718A JP571893A JPH06215183A JP H06215183 A JPH06215183 A JP H06215183A JP 5005718 A JP5005718 A JP 5005718A JP 571893 A JP571893 A JP 571893A JP H06215183 A JPH06215183 A JP H06215183A
Authority
JP
Japan
Prior art keywords
character
pattern
width
standard
cut out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5005718A
Other languages
English (en)
Inventor
Akihiro Matsumoto
昭浩 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5005718A priority Critical patent/JPH06215183A/ja
Publication of JPH06215183A publication Critical patent/JPH06215183A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 隣接文字のオーバーラップや接触に対して、
文字の切り出し処理の結合ミスや分離ミスを極力減らす
ことで、全体としての文字認識率の向上を図ること。 【構成】 本発明では、スキャナ4等から入力した文字
画像のイメージから切り出された文字パターンの標準的
な文字幅Wを求め(S2)、切り出された文字パターン
の文字幅w(i)が標準文字幅Wよりも顕著に異なる文
字パターンが存在する場合は(S3)、その文字パター
ンより前後N個分の切り出された文字パターンのヒスト
グラムを求め(S4)、標準文字幅Wとそのヒストグラ
ムに基いてN個分の文字パターンに対して新たに文字の
切り出し処理を行う(S6)。この切り出された文字パ
ターンに対して文字認識を行う(S7)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書画像を入力して、こ
の文書画像の文字等を認識する文字認識装置に関するも
のである。
【0002】
【従来の技術】従来の文字認識装置は、文書画像を入力
し、この文書画像の文字行の方向を判定し、判定された
行方向に文字パターンを切り出し、切り出された文字パ
ターンの特徴を認識用辞書に格納された標準パターンと
照合して文字認識を行う装置であって、その文字パター
ンの切り出しは、文書画像の水平方向及び垂直方向のイ
メージデータの有無によって、1文字分の文字パターン
を切り出すものであった。
【0003】
【発明が解決しようとする課題】しかしながら上記のよ
うな従来装置においては、文書画像の隣り合う文字にお
いて、入力画像のシミやつぶれのために文字同士の接触
及びオーバーラップ等があると、隣りの文字と結合して
切り出されたり、1文字の文字パターンが途中で分離さ
れて切り出されてしまうなどの欠点があった。
【0004】そこで、本発明の目的は、入力画像のシミ
やつぶれのために生ずる隣接文字のオーバーラップや接
触に対して、文字の切り出し処理の結合ミスや分離ミス
を極力減らすことができ、全体としての文字認識率を向
上させることができる文字認識装置を提供することにあ
る。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、文書画像を入力する入力手段と、該入力
手段から入力した前記文書画像の水平方向または垂直方
向のイメージデータの有無により文書画像の文字行方向
を判定する文字行判定手段と、該文字行判定手段によっ
て判定された文字行の垂直方向または水平方向のイメー
ジデータの有無によって、その行における1文字分の文
字パターンを切り出す文字切り出し手段と、前記文字行
判定手段で判定された文字行において、前記文字切り出
し手段で切り出された文字パターンの標準的な文字幅を
求める手段と、前記切り出された文字パターンの文字幅
が前記求めた標準的な文字幅よりも顕著に異なる文字パ
ターンが存在する場合に、その文字パターンより前後N
個分の切り出された文字パターンに対して、垂直方向ま
たは水平方向にイメージデータのヒストグラムを求める
手段と、前記標準的な文字幅と該ヒストグラムにより当
該N個分の文字パターンに対して新たに文字の切り出し
処理を行う手段と切り出された文字パターンの特徴を認
識用辞書に格納された標準パターンと照合して文字認識
を行う認識手段とを有することを特徴とする。
【0006】
【作用】本発明では、今注目している行に対する文字の
切り出しにおいて、標準幅よりも顕著に異なる文字幅を
もつ文字パターンが存在する場合は、その文字パターン
を中心に前後N個の文字パターンを含めた部分の垂直方
向または水平方向への射影をとりヒストグラムを作り、
そのヒストグラムデータと標準文字幅とにより切り出す
ための正しいポイントを探し出し、探し出したそのポイ
ントで新たに文字の切り出し処理を行う。これによって
文字切り処理の結合及び分離ミスを減少させることがで
きる。
【0007】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
【0008】図1は本発明の一実施例の文字認識装置の
システム構成を示す。図1において、1は文字認識処理
に関する各種指示を与えるための入力装置で、キーボー
ド及びマウス等のポインティングデバイスからなる。2
は入力画像1から1文字ずつのイメージ(文字パター
ン)を切り出して文字認識を行う文字認識装置で、文字
認識処理に使われる辞書を内蔵している。3は装置全体
の制御及び文字認識処理を実行するCPU(中央演算処
理ユニット)、4は文字が描かれた原稿画像を光学的に
読み取るスキャナ、5はCPU3が実行する制御プログ
ラム(後述する図2のフローチャートのようなプログラ
ム等)を記憶しているメモリである。尚、このメモリ5
はROM(リードオンリメモリ)とRAM(ランダムア
クセスメモリ)から構成され、前者には上述したプログ
ラムの他、文字フォントも格納されており、後者はCP
U3のワークエリアとして使用される。6は表示用のイ
メージ(文字パターン等)を展開するビデオRAM(V
RAM)、7はそのVRAM6に展開されたイメージを
表示するディスプレイ(CRT)である。上記構成にお
いて、まず、スキャナ4から原稿画像を読み取り、文字
認識装置2により認識する。そして、その認識結果の表
示すべき文字パターンをVRAM6に展開し、CRT7
に表示する。
【0009】図2のフローチャートは本発明の実施例の
動作原理を示す。以下このフローチャートの流れに沿っ
て説明して行く。ここでは例として縦書きの文書画像で
あるとする。
【0010】入力画像から垂直方向のイメージの有無に
よって、文書画像の文字行方向を判定し、その行幅hを
求める(ステップS0)。
【0011】次に求めた行ごとに水平方向のイメージの
有無によって、文字パターンを切り出して行き、各文字
パターンの文字幅w(i)及び位置座標x(i)を記憶
しておく(ステップS1)。
【0012】ここで切り出された文字パターンの文字幅
w(i)が
【0013】
【数1】h−△a≦w(i)≦h+△a …(1) (但し、△a:行幅hからの許容範囲値,i:文字パタ
ーン番号)である文字パターンだけを拾い出し、それら
の平均をとることにより標準文字幅Wをもとめる(ステ
ップS2)。
【0014】次にその求めた標準文字幅Wと切り出され
た各文字パターンの文字幅w(i)とを比較して、文字
幅w(i)が標準文字幅Wよりも著しく大きい場合、す
なわち、
【0015】
【数2】W+△b<w(i) …(2) (但し、△b:標準文字幅からの許容範囲)を満たす文
字パターンを探す(ステップS3)。
【0016】このステップS3の条件を満たす文字パタ
ーンが存在した場合には、その文字パターンより前後に
標準文字幅を持つ文字パターンまで、すなわち、この条
件を満たす文字パターンを含み、且つこれに最も近い場
所の標準文字幅を持つ文字パターンにはさまれた間の文
字パターンについて水平方向に射影をとり、ヒストグラ
ムを作成する(ステップS4)。
【0017】具体的な例として図3に代表的な文字の切
り出しミスの例と本発明実施例による文字切りの例を示
す。
【0018】横軸の位置をx,縦軸のドット数をyと
し、値yに対して所定のしきい値£を設けて、文字パタ
ーン番号iの最も小さなものの位置を基準に(x=
0)、標準文字幅付近で、且つしきい値£より小さな位
置xを求めて行く(ステップS5)。
【0019】ここで射影をとった長さをLとすると、x
を求める途中がほぼ標準文字幅Wで切れて、且つ最後の
切れ幅がほぼWであれば、求めたxにおいて新たに文字
切り処理を実行する(ステップS6)。
【0020】しかしそれ以外、すなわち、xを求める途
中標準文字幅W付近で切れ目が見つからなかった場合
や、最後まで切れたとしても、最後の文字パターンの文
字幅が著しくWに満たない場合は新たな文字切り処理は
実行しない(ステップS5→S7)。
【0021】最後に切り出された文字パターンについて
文字認識処理を実行する(ステップS7)。
【0022】(他の実施例)文字の切り出し処理の精度
を上げるために上記図2のステップS5の過程で新たに
文字が切り出せなかった場合、こんどは文字パターン番
号iの最も大きなものの位置を基準にして、上記同様の
処理過程をさらに加えてもよい。
【0023】
【発明の効果】以上説明したように、本発明によれば、
入力画像のシミやつぶれのために生ずる隣接文字のオー
バーラップや接触に対して、文字の切り出し処理の結合
ミスや分離ミスを極力減らすことができ、全体としての
文字認識率を向上させることができる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の文字認識装置の構成を示す
ブロック図である。
【図2】図1に示す装置が実行する本発明実施例の文字
認識処理の手順を示すフローチャートである。
【図3】文字の切り出しミスの例と本発明実施例による
文字切り出しの例を示す説明図である。
【符号の説明】
1 入力装置 2 文字認識装置 3 CPU 4 スキャナ 5 メモリ 6 VRAM 7 CRT

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文書画像を入力する入力手段と、 該入力手段から入力した前記文書画像の水平方向または
    垂直方向のイメージデ ータの有無により文書画像の文字行方向を判定する文字
    行判定手段と、該文字行判定手段によって判定された文
    字行の垂直方向または水平方向のイメージデータの有無
    によって、その行における1文字分の文字パターンを切
    り出す文字切り出し手段と、 前記文字行判定手段で判定された文字行において、前記
    文字切り出し手段で切り出された文字パターンの標準的
    な文字幅を求める手段と、 前記切り出された文字パターンの文字幅が前記求めた標
    準的な文字幅よりも顕著に異なる文字パターンが存在す
    る場合に、その文字パターンより前後N個分の切り出さ
    れた文字パターンに対して、垂直方向または水平方向に
    イメージデータのヒストグラムを求める手段と、 前記標準的な文字幅と該ヒストグラムにより当該N個分
    の文字パターンに対して新たに文字の切り出し処理を行
    う手段と切り出された文字パターンの特徴を認識用辞書
    に格納された標準パターンと照合して文字認識を行う認
    識手段とを有することを特徴とする文字認識装置。
JP5005718A 1993-01-18 1993-01-18 文字認識装置 Pending JPH06215183A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5005718A JPH06215183A (ja) 1993-01-18 1993-01-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5005718A JPH06215183A (ja) 1993-01-18 1993-01-18 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06215183A true JPH06215183A (ja) 1994-08-05

Family

ID=11618906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5005718A Pending JPH06215183A (ja) 1993-01-18 1993-01-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06215183A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990025455A (ko) * 1997-09-12 1999-04-06 구자홍 히스토그램 기울기를 이용한 문자영역 내의 줄 분리 방법
KR100458941B1 (ko) * 1997-08-27 2005-01-17 엘지전자 주식회사 히스토그램 기울기를 이용한 문자영역 내의 줄 분리 방법
JP2013101616A (ja) * 2011-11-09 2013-05-23 Canon Inc 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100458941B1 (ko) * 1997-08-27 2005-01-17 엘지전자 주식회사 히스토그램 기울기를 이용한 문자영역 내의 줄 분리 방법
KR19990025455A (ko) * 1997-09-12 1999-04-06 구자홍 히스토그램 기울기를 이용한 문자영역 내의 줄 분리 방법
JP2013101616A (ja) * 2011-11-09 2013-05-23 Canon Inc 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US4680804A (en) Method for designating a recognition mode in a hand-written character/graphic recognizer
GB2244886A (en) Apparatus for extracting a text region in a document image
US5197107A (en) Character recognition apparatus
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US5625710A (en) Character recognition apparatus using modification of a characteristic quantity
US6266444B1 (en) Character processing apparatus and method therefor
JPH06215183A (ja) 文字認識装置
JP3548234B2 (ja) 文字認識方法及び装置
JP3133797B2 (ja) 文字認識方法及びその装置
JPH05282493A (ja) 英文字認識装置
JPH08161426A (ja) 手書き文字ストローク切出し装置
JP2925303B2 (ja) 画像処理方法及び装置
JPH0644406A (ja) 画像処理方法及び装置
JPH04156694A (ja) 文字認識方式
JP2612383B2 (ja) 文字認識処理方式
JPH09237321A (ja) 手書き文字認識装置
JPS62257583A (ja) 文字認識方式
JPH0573718A (ja) 領域属性識別方式
JPH05128300A (ja) 文字認識方法及びその装置
JPH06295356A (ja) オンライン文字認識装置
JP2974396B2 (ja) 画像処理方法及び装置
JPH05114047A (ja) 文字切り出し装置
JPH05108880A (ja) 英文字認識装置
JPH01124082A (ja) 文字認識装置