JPH07192085A - 文書画像傾き検出装置 - Google Patents

文書画像傾き検出装置

Info

Publication number
JPH07192085A
JPH07192085A JP5329368A JP32936893A JPH07192085A JP H07192085 A JPH07192085 A JP H07192085A JP 5329368 A JP5329368 A JP 5329368A JP 32936893 A JP32936893 A JP 32936893A JP H07192085 A JPH07192085 A JP H07192085A
Authority
JP
Japan
Prior art keywords
character line
character
inclination angle
document
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5329368A
Other languages
English (en)
Other versions
JP2778437B2 (ja
Inventor
Masaaki Mizuno
昌昭 水野
Takeshi Kamimura
健 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5329368A priority Critical patent/JP2778437B2/ja
Publication of JPH07192085A publication Critical patent/JPH07192085A/ja
Application granted granted Critical
Publication of JP2778437B2 publication Critical patent/JP2778437B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】文書画像の傾き角度を検出にあたり、その精度
を低下させることなく処理手数を低減する。 【構成】画像入力手段1と、入力された文書画像データ
を参照し画素の連結成分を検出する手段2と、抽出され
た画素の連結成分のうち文字を構成する連結成分を抽出
する手段3と、抽出された連結成分のうち近接する連結
成分同士を結合し仮の文字行として出力する手段4と、
推定された仮の文字行に対して水平方向及び垂直方向か
らそれぞれ所定の角度だけ傾いた直線に接する最も外側
の輪郭点を検出する手段5と、検出された角点の位置関
係から仮の文字行の傾きを算出する手段6と、各々の仮
の文字行から傾き角度を参照し文書画像データの傾き角
を求める手段7とから構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書画像の傾きを検出
する装置に関するものである。
【0002】
【従来の技術】一般の印刷文書を読み取るためには、ま
ず、イメージスキャナなどの画像入力装置を用いて量子
化された文書画像として取り込む必要があるが、通常は
原稿設置の際に多少傾きが生じる。そのために、投影を
用いた文字行抽出手法では、文字行間隔の狭い文書など
で文字行の検出ができなくなるなどの問題が生じてお
り、入力された画像の傾きを検出する処理が必要とされ
ている。
【0003】従来このような文書画像では、その主要な
構成要素である文書領域では文字が規則正しく並んでい
ることを利用して傾き検出が行われる。
【0004】例えば、秋山らは「書式指定情報に依らな
い紙面構成要素抽出法」と題して電子情報通信学界論文
誌D,vol.J66−D,No.1,pp.111−
118に記載されているように、傾き角度θを順次変更
しながら、角度θ方向にヒストグラムを作成し、ヒスト
グラム上の山と谷が顕著に出現する角度θを傾き角度と
して求める第1の方式を提案されている。
【0005】また、中野らは「文書画像の傾き補正のた
めの一方式」と題して電子情報通信学界論文誌D,vo
l.J69−D,No.1,pp.1833−1834
に記載されているように、文字列の基準線がほぼ一定に
存在することに着目し、文字ブロックの下端座標値をハ
フ変換しハフ空間上でのピーク値を検出することによっ
て文字列の傾きを推定する第2の方式を提案している。
【0006】
【発明が解決しようとする課題】しかしながら、上記第
1の方式では、各々の画素に対してヒストグラムを計算
することが必要であり、処理時間の点で問題がある。ま
た、上記第2の方式では、すべての文字の下端が基準線
上に存在するとは限らないため、誤差が含まれることが
避けられない。またハフ変換処理はヒストグラムを計算
する処理と同等かそれ以上の処理手数を要する。
【0007】本発明の目的は、これらの課題を解決する
ために、精度を落とさないで処理手数が少なくてすむ傾
き検出装置を提案するものである。
【0008】
【課題を解決するための手段】本発明は、上記の課題を
解決するために、文書を光学的に走査し、文書画像デー
タを得る画像入力手段と、前記画像入力手段によって入
力された文書画像データを参照し画素の連結成分を検出
する連結成分抽出手段と、前記連結成分抽出手段によっ
て抽出された画素の連結成分のうち、文字を構成する連
結成分を抽出する、文字成分抽出手段と、前記文字成分
抽出手段によって抽出された連結成分のうち、近接する
連結成分同士を統合し仮の文字行として出力する、文字
行推定手段と、前記文字行推定手段によって推定された
仮の文字行に対して、水平方向及び垂直方向からそれぞ
れ所定の角度だけ傾いた直線に接する、最も外側の輪郭
点を検出する、角点検出手段と、前記角点検出手段によ
って検出された角点の位置関係から、前記仮の文字行の
傾きを算出する、文字行傾き角度算出手段と、前記文字
行推定手段から得られた各々の仮の文字行から、前記文
字行傾き角度算出手段によって得られた傾き角度を参照
し、前記文書画像データの傾き角度を求める、文書画像
傾き角度検出手段と、を具備する。
【0009】
【作用】本発明においては、個々の文字から得られる座
標値を用いるという処理を行わない。まず図1(a)に
示すように、個々の文字を構成する連結画素成分を抽出
する。次に図1(b)に示すように、位置が近接するな
どの条件により同一行を構成すると判断される連結画素
成分を統合し、統合した文字によって得られる文字行の
包絡線を考える。包絡線の角座標を求めるために、図1
(c)に示すように統合された文字行の輪郭における角
点の座標を本願発明で提案する手法で抽出し、この角点
の位置関係から図1(d)に示すように文字行の傾き角
度を推定する。この処理方式を用いることにより、従来
と比べてより少ない手数で傾き角度検出処理を行うこと
ができる。
【0010】
【実施例】以下に本願発明の実施例を図面を参照しなが
ら説明する。
【0011】図3は、本発明の実現する装置における処
理の概略を示したものである。
【0012】図3において、1は画像入力手段であり、
光学的その他の手段により文書画像を読み込むものであ
る。あるいはあらかじめ磁気的その他の形態にて記録媒
体に電子化されて記憶されている画像を読み込む処理も
含む。
【0013】2は連結成分抽出手段であり、前記画像入
力手段1によって入力された文書画像データを参照し黒
画素の連結成分を検出する。具体的な処理手法として
は、ラベリングを用いる手法や輪郭追跡処理を用いる手
法などの公知の手法を挙げることができる。
【0014】3は文字成分抽出手段であり、前記連結成
分抽出手段2によって求められた黒画素の連結成分のう
ち、文字を構成すると判断される連結成分を選択する。
選択基準としては、連結成分の大きさ、連結成分の外接
矩形の面積に対する黒画素数(すなわち黒画素の密
度)、その他のテクスチャ特徴を用いることができる。
例えば、連結成分の大きさが所定の範囲内にある場合
に、該連結成分は文字であるなどと判断することができ
る。
【0015】4は文字行推定手段であり、前記文字成分
抽出手段3によって抽出された文字を構成する連結成分
から、位置的に近接する、大きさが似通っている、など
の理由により同一行を構成すると思われる文字要素を統
合し仮の文字行を推定する。
【0016】5は角点検出手段であり、前記文字行推定
手段4によって得られた仮の文字行を構成する連結黒画
素成分の角点を検出する手段であり、本発明のポイント
である。
【0017】6は文字行傾き角度算出手段であり、前記
角点検出手段5によって得られた角点の座標の位置関係
から、前記仮の文字行の傾き角度を算出するものであ
る。
【0018】7は文書画像傾き角度検出手段であり、各
々の前記仮の文字行の傾き角度の算出値から最も適切で
あると思われる値を、文書画像の傾き角度として出力す
るものである。
【0019】以下それぞれの手段について詳しく説明す
る。
【0020】画像入力手段1は、光学的画像取り込み装
置、その他の画像取り込み装置を用いて文書画像を2値
(ビットイメージ)形式で取り込む。磁気的その他の記
録方式によって記録を行う画像格納装置から読み込む処
理も含む。
【0021】連結成分抽出手段2は、前記画像入力手段
1によって入力された文書画像データを参照し連結する
黒画素の抽出を行う。連結性の判定方法は近傍4方向へ
の連結性や8方向への連結性などの公知の定義を用いる
ことが出来る。この連結性の定義に基づいて、連結する
画素の抽出を行う。連結画素の抽出には、一般の画像処
理において用いられるラベリング処理や輪郭追跡処理な
どの公知の技術を用いて行うことが可能である。
【0022】文字成分抽出手段3は、前記連結成分抽出
手段2によって求められた黒画素の連結成分のうち、文
字を構成する連結成分を選択する。選択基準としては、
連結成分の大きさ、連結成分の外接矩形の面積に対する
黒画素数(すなわち黒画素の密度)、その他のテクスチ
ャ特徴を用いることができる。一例を挙げると、印刷文
書では本文領域の文字の大きさは一定であるので、大体
の目安をつけてその値で判定することができる。典型的
な印刷文書では文字の大きさは大体5mm四方であり、
これを400dpi(約16本/mm)の解像度で取り
込むと文字60dot四方ぐらいになる。したがってこ
れよりも極端に大きな連結成分は本文文字ではないと判
定することが出来る。同様にあまりにも小さな連結成分
はノイズであるなどの判断を下すことが出来る。
【0023】文字行推定手段4は、前記文字成分抽出手
段3によって抽出された文字を構成する連結成分から、
位置的に近接する、大きさが似通っている、などの理由
により同一行を構成すると思われる文字要素を統合し仮
の文字行を推定する。本文が横書きである場合には、水
平方向にほぼ同じ座標に位置し、かつ水平方向の間隔が
十分小さい連結成分は同一行を構成すると考えられる。
同じ座標に位置するか否かの判定には、端点・重心点な
どの特徴点の位置関係から判定することが可能である。
この外にも連結成分の高さとその水平方向への重なり度
合いから判定する手法も考えられる。また、本文が縦書
きの場合には水平方向と垂直方向を交換して考えれば同
様に処理できる。十分近接するか否かの判定には、やは
り端点・重心点などの特徴点の位置関係から判定するこ
とが可能である。
【0024】角点検出手段5は、前記文字行推定手段4
によって得られた仮の文字行を構成する連結黒画素成分
の角点を検出する手段であり、本発明のポイントであ
る。
【0025】角点検出のアルゴリズムを図面を参照しな
がら以下に記す。
【0026】角点検出のアルゴリズムは、図2に示すよ
うに±θの直線で外側から押さえた場合に仮の文字行に
接する個所を角点として検出することにより角点検出を
行う。検出された角点のうち、垂直方向から±θだけ傾
けた直線に接する角点同士、水平方向から±θだけ傾け
た直線に接する角点同士、をそれぞれペアにする。しか
しながら、隣接する辺の角点は一致することが多いの
で、この場合は適宜同一の辺上に存在する角点座標をペ
アにして、次の文字行傾き角度検出手段に送り込む。
【0027】具体的な処理手順の例を記す。前記文字行
抽出手段4において統合抽出された文字行に対して輪郭
追跡処理を行う。この時に、追跡された座標毎に、該座
標を±θ度の直線が通ると仮定した場合の切片の値をそ
れぞれ計算しておく。そして、その切片の値が最大もし
くは最小になる時の輪郭座標を記憶する。輪郭追跡処理
が終了すれば、前記の角点の座標値を得ることが出来
る。
【0028】ある一つの直線に複数の接点が生じ角点座
標が一意に定まらないこともある。この場合には、角点
間の距離が最も大きくなるように選択する。
【0029】文字行傾き角度算出手段6は、前記角点検
出手段5によって得られた角点の座標の位置関係から、
前記仮の文字行の傾き角度を検出するものである。傾き
角度の算出法は、前記角点の座標から文字行の外接枠を
検出して、その枠線の方向から傾き角度を算出する。枠
線は4本得ることができるが、行方向への距離が遠いほ
ど精度はよくなるため、最も行方向での距離が遠い2つ
の角点から角度を推定する方式を例として挙げることが
出来る。上下2本の枠線両方を用いて平均化してもよ
い。
【0030】文書画像傾き角度検出手段7は、各々の前
記仮の文字行の傾き角度の算出値から最も適切であると
思われる値を、文書画像の傾き角度として出力する。最
も適切な角度の推定手法には、最尤推定や平均化などの
手法を用いることができる。
【0031】
【発明の効果】本発明では、仮の文字行の両端点の座標
のみを検出するため、従来のハフ変換などを用いた手法
と比べて、特に直線近似などの段階の処理において処理
手数を低減することができる。一文字行分の傾き角度の
検出処理が少ない処理手数で行えるため、従来手法では
1行分に対する処理時間内で、本発明は複数の行に対し
て傾き角度を求めることができ、このため傾き角度の推
定値の精度を低下させることなく全体としての処理手数
を低減することが出来る。
【図面の簡単な説明】
【図1】本発明の処理の概略を示した図面であり、
(a)は、連結画素成分を抽出した段階を示し、(b)
は、近接する連結画素成分を統合し文字行を生成した段
階を示し、(c)は、文字行の角点を抽出した段階を示
し、(d)は、角点から傾き角度θを推定した結果を示
す。
【図2】本発明における角点検出方式を説明する図面で
ある。
【図3】本発明の一実施例を示す図面である。
【符号の説明】
1 画像入力手段 2 連結成分抽出手段 3 文字成分抽出手段 4 文字行推定手段 5 角点検出手段 6 文字行傾き角度算出手段 7 文書画像傾き角度検出手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文書を光学的に走査し、文書画像データ
    を得る画像入力手段と、 前記画像入力手段によって入力された文書画像データを
    参照し画素の連結成分を検出する連結成分抽出手段と、 前記連結成分抽出手段によって抽出された画素の連結成
    分のうち、文字を構成する連結成分を抽出する、文字成
    分抽出手段と、 前記文字成分抽出手段によって抽出された連結成分のう
    ち、近接する連結成分同士を統合し仮の文字行として出
    力する、文字行推定手段と、 前記文字行推定手段によって推定された仮の文字行に対
    して、水平方向及び垂直方向からそれぞれ所定の角度だ
    け傾いた直線に接する、最も外側の輪郭点を検出する、
    角点検出手段と、 前記角点検出手段によって検出された角点の位置関係か
    ら、前記仮の文字行の傾きを算出する、文字行傾き角度
    算出手段と、 前記文字行推定手段から得られた各々の仮の文字行か
    ら、前記文字行傾き角度算出手段によって得られた傾き
    角度を参照し、前記文書画像データの傾き角度を求め
    る、文書画像傾き角度検出手段と、 を具備することを特徴とする文書画像傾き検出装置。
JP5329368A 1993-12-27 1993-12-27 文書画像傾き検出装置 Expired - Fee Related JP2778437B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5329368A JP2778437B2 (ja) 1993-12-27 1993-12-27 文書画像傾き検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5329368A JP2778437B2 (ja) 1993-12-27 1993-12-27 文書画像傾き検出装置

Publications (2)

Publication Number Publication Date
JPH07192085A true JPH07192085A (ja) 1995-07-28
JP2778437B2 JP2778437B2 (ja) 1998-07-23

Family

ID=18220677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5329368A Expired - Fee Related JP2778437B2 (ja) 1993-12-27 1993-12-27 文書画像傾き検出装置

Country Status (1)

Country Link
JP (1) JP2778437B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6332046B1 (en) 1997-11-28 2001-12-18 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program
JP2005309771A (ja) * 2004-04-21 2005-11-04 Omron Corp 文字列領域抽出装置
JP2011003181A (ja) * 2009-06-17 2011-01-06 Kyocera Mita Corp 原稿傾斜角検出方法及び原稿傾斜角検出装置
KR101878256B1 (ko) * 2016-12-15 2018-07-13 서울대학교산학협력단 문자를 포함하는 영상의 평활화 방법 및 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01205287A (ja) * 1988-02-10 1989-08-17 Oki Electric Ind Co Ltd 文字行傾き検出装置
JPH0362284A (ja) * 1989-07-31 1991-03-18 Nec Corp 文字行抽出装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01205287A (ja) * 1988-02-10 1989-08-17 Oki Electric Ind Co Ltd 文字行傾き検出装置
JPH0362284A (ja) * 1989-07-31 1991-03-18 Nec Corp 文字行抽出装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6332046B1 (en) 1997-11-28 2001-12-18 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program
US6577763B2 (en) 1997-11-28 2003-06-10 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program
JP2005309771A (ja) * 2004-04-21 2005-11-04 Omron Corp 文字列領域抽出装置
JP2011003181A (ja) * 2009-06-17 2011-01-06 Kyocera Mita Corp 原稿傾斜角検出方法及び原稿傾斜角検出装置
KR101878256B1 (ko) * 2016-12-15 2018-07-13 서울대학교산학협력단 문자를 포함하는 영상의 평활화 방법 및 장치

Also Published As

Publication number Publication date
JP2778437B2 (ja) 1998-07-23

Similar Documents

Publication Publication Date Title
US9805281B2 (en) Model-based dewarping method and apparatus
US7301564B2 (en) Systems and methods for processing a digital captured image
US20020051575A1 (en) Method and apparatus for recognizing text in an image sequence of scene imagery
US5892854A (en) Automatic image registration using binary moments
JPH0973511A (ja) 情報再生装置及び情報記録媒体
JP2012243307A (ja) 入力画像における歪を検出する方法、入力画像における歪を検出する装置およびコンピューター読み取り可能な媒体
US5243668A (en) Method and unit for binary processing in image processing unit and method and unit for recognizing characters
JP4419269B2 (ja) 二次元コード抽出方法
JP2002199206A (ja) メッセージ埋込並びに抽出方法、装置および媒体
JP2778437B2 (ja) 文書画像傾き検出装置
JP3303246B2 (ja) 画像処理装置
Lehal et al. A range free skew detection technique for digitized Gurmukhi script documents
JP4314148B2 (ja) 2次元コード読取装置
KR100603618B1 (ko) 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정장치 및 방법
JP2868134B2 (ja) 画像処理方法及び装置
JPH1153539A (ja) 円形パターン判定方法および記録媒体
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム
JP2003196588A (ja) 情報再生装置及び情報再生方法
JP3240280B2 (ja) 帳票読み取り方法および帳票読み取りプログラムを格納したコンピュータ読み取り可能な記録媒体
JP2003317107A (ja) 罫線抽出方法及び装置
JPH03250280A (ja) 文字認識方法及び装置並びに情報処理装置
Kim et al. Document capturing method with a camera using robust feature points detection
Da Xu A computer vision based whiteboard capture system
JPH06259531A (ja) ドットパターンの傾き補正方法
JPH04276888A (ja) 文字読取装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980407

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090508

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100508

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110508

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110508

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120508

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120508

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130508

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees