JPH07192085A - 文書画像傾き検出装置 - Google Patents
文書画像傾き検出装置Info
- Publication number
- JPH07192085A JPH07192085A JP5329368A JP32936893A JPH07192085A JP H07192085 A JPH07192085 A JP H07192085A JP 5329368 A JP5329368 A JP 5329368A JP 32936893 A JP32936893 A JP 32936893A JP H07192085 A JPH07192085 A JP H07192085A
- Authority
- JP
- Japan
- Prior art keywords
- character line
- character
- inclination angle
- document
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
を低下させることなく処理手数を低減する。 【構成】画像入力手段1と、入力された文書画像データ
を参照し画素の連結成分を検出する手段2と、抽出され
た画素の連結成分のうち文字を構成する連結成分を抽出
する手段3と、抽出された連結成分のうち近接する連結
成分同士を結合し仮の文字行として出力する手段4と、
推定された仮の文字行に対して水平方向及び垂直方向か
らそれぞれ所定の角度だけ傾いた直線に接する最も外側
の輪郭点を検出する手段5と、検出された角点の位置関
係から仮の文字行の傾きを算出する手段6と、各々の仮
の文字行から傾き角度を参照し文書画像データの傾き角
を求める手段7とから構成される。
Description
する装置に関するものである。
ず、イメージスキャナなどの画像入力装置を用いて量子
化された文書画像として取り込む必要があるが、通常は
原稿設置の際に多少傾きが生じる。そのために、投影を
用いた文字行抽出手法では、文字行間隔の狭い文書など
で文字行の検出ができなくなるなどの問題が生じてお
り、入力された画像の傾きを検出する処理が必要とされ
ている。
構成要素である文書領域では文字が規則正しく並んでい
ることを利用して傾き検出が行われる。
い紙面構成要素抽出法」と題して電子情報通信学界論文
誌D,vol.J66−D,No.1,pp.111−
118に記載されているように、傾き角度θを順次変更
しながら、角度θ方向にヒストグラムを作成し、ヒスト
グラム上の山と谷が顕著に出現する角度θを傾き角度と
して求める第1の方式を提案されている。
めの一方式」と題して電子情報通信学界論文誌D,vo
l.J69−D,No.1,pp.1833−1834
に記載されているように、文字列の基準線がほぼ一定に
存在することに着目し、文字ブロックの下端座標値をハ
フ変換しハフ空間上でのピーク値を検出することによっ
て文字列の傾きを推定する第2の方式を提案している。
1の方式では、各々の画素に対してヒストグラムを計算
することが必要であり、処理時間の点で問題がある。ま
た、上記第2の方式では、すべての文字の下端が基準線
上に存在するとは限らないため、誤差が含まれることが
避けられない。またハフ変換処理はヒストグラムを計算
する処理と同等かそれ以上の処理手数を要する。
ために、精度を落とさないで処理手数が少なくてすむ傾
き検出装置を提案するものである。
解決するために、文書を光学的に走査し、文書画像デー
タを得る画像入力手段と、前記画像入力手段によって入
力された文書画像データを参照し画素の連結成分を検出
する連結成分抽出手段と、前記連結成分抽出手段によっ
て抽出された画素の連結成分のうち、文字を構成する連
結成分を抽出する、文字成分抽出手段と、前記文字成分
抽出手段によって抽出された連結成分のうち、近接する
連結成分同士を統合し仮の文字行として出力する、文字
行推定手段と、前記文字行推定手段によって推定された
仮の文字行に対して、水平方向及び垂直方向からそれぞ
れ所定の角度だけ傾いた直線に接する、最も外側の輪郭
点を検出する、角点検出手段と、前記角点検出手段によ
って検出された角点の位置関係から、前記仮の文字行の
傾きを算出する、文字行傾き角度算出手段と、前記文字
行推定手段から得られた各々の仮の文字行から、前記文
字行傾き角度算出手段によって得られた傾き角度を参照
し、前記文書画像データの傾き角度を求める、文書画像
傾き角度検出手段と、を具備する。
標値を用いるという処理を行わない。まず図1(a)に
示すように、個々の文字を構成する連結画素成分を抽出
する。次に図1(b)に示すように、位置が近接するな
どの条件により同一行を構成すると判断される連結画素
成分を統合し、統合した文字によって得られる文字行の
包絡線を考える。包絡線の角座標を求めるために、図1
(c)に示すように統合された文字行の輪郭における角
点の座標を本願発明で提案する手法で抽出し、この角点
の位置関係から図1(d)に示すように文字行の傾き角
度を推定する。この処理方式を用いることにより、従来
と比べてより少ない手数で傾き角度検出処理を行うこと
ができる。
ら説明する。
理の概略を示したものである。
光学的その他の手段により文書画像を読み込むものであ
る。あるいはあらかじめ磁気的その他の形態にて記録媒
体に電子化されて記憶されている画像を読み込む処理も
含む。
力手段1によって入力された文書画像データを参照し黒
画素の連結成分を検出する。具体的な処理手法として
は、ラベリングを用いる手法や輪郭追跡処理を用いる手
法などの公知の手法を挙げることができる。
分抽出手段2によって求められた黒画素の連結成分のう
ち、文字を構成すると判断される連結成分を選択する。
選択基準としては、連結成分の大きさ、連結成分の外接
矩形の面積に対する黒画素数(すなわち黒画素の密
度)、その他のテクスチャ特徴を用いることができる。
例えば、連結成分の大きさが所定の範囲内にある場合
に、該連結成分は文字であるなどと判断することができ
る。
抽出手段3によって抽出された文字を構成する連結成分
から、位置的に近接する、大きさが似通っている、など
の理由により同一行を構成すると思われる文字要素を統
合し仮の文字行を推定する。
手段4によって得られた仮の文字行を構成する連結黒画
素成分の角点を検出する手段であり、本発明のポイント
である。
角点検出手段5によって得られた角点の座標の位置関係
から、前記仮の文字行の傾き角度を算出するものであ
る。
々の前記仮の文字行の傾き角度の算出値から最も適切で
あると思われる値を、文書画像の傾き角度として出力す
るものである。
る。
置、その他の画像取り込み装置を用いて文書画像を2値
(ビットイメージ)形式で取り込む。磁気的その他の記
録方式によって記録を行う画像格納装置から読み込む処
理も含む。
1によって入力された文書画像データを参照し連結する
黒画素の抽出を行う。連結性の判定方法は近傍4方向へ
の連結性や8方向への連結性などの公知の定義を用いる
ことが出来る。この連結性の定義に基づいて、連結する
画素の抽出を行う。連結画素の抽出には、一般の画像処
理において用いられるラベリング処理や輪郭追跡処理な
どの公知の技術を用いて行うことが可能である。
手段2によって求められた黒画素の連結成分のうち、文
字を構成する連結成分を選択する。選択基準としては、
連結成分の大きさ、連結成分の外接矩形の面積に対する
黒画素数(すなわち黒画素の密度)、その他のテクスチ
ャ特徴を用いることができる。一例を挙げると、印刷文
書では本文領域の文字の大きさは一定であるので、大体
の目安をつけてその値で判定することができる。典型的
な印刷文書では文字の大きさは大体5mm四方であり、
これを400dpi(約16本/mm)の解像度で取り
込むと文字60dot四方ぐらいになる。したがってこ
れよりも極端に大きな連結成分は本文文字ではないと判
定することが出来る。同様にあまりにも小さな連結成分
はノイズであるなどの判断を下すことが出来る。
段3によって抽出された文字を構成する連結成分から、
位置的に近接する、大きさが似通っている、などの理由
により同一行を構成すると思われる文字要素を統合し仮
の文字行を推定する。本文が横書きである場合には、水
平方向にほぼ同じ座標に位置し、かつ水平方向の間隔が
十分小さい連結成分は同一行を構成すると考えられる。
同じ座標に位置するか否かの判定には、端点・重心点な
どの特徴点の位置関係から判定することが可能である。
この外にも連結成分の高さとその水平方向への重なり度
合いから判定する手法も考えられる。また、本文が縦書
きの場合には水平方向と垂直方向を交換して考えれば同
様に処理できる。十分近接するか否かの判定には、やは
り端点・重心点などの特徴点の位置関係から判定するこ
とが可能である。
によって得られた仮の文字行を構成する連結黒画素成分
の角点を検出する手段であり、本発明のポイントであ
る。
がら以下に記す。
うに±θの直線で外側から押さえた場合に仮の文字行に
接する個所を角点として検出することにより角点検出を
行う。検出された角点のうち、垂直方向から±θだけ傾
けた直線に接する角点同士、水平方向から±θだけ傾け
た直線に接する角点同士、をそれぞれペアにする。しか
しながら、隣接する辺の角点は一致することが多いの
で、この場合は適宜同一の辺上に存在する角点座標をペ
アにして、次の文字行傾き角度検出手段に送り込む。
抽出手段4において統合抽出された文字行に対して輪郭
追跡処理を行う。この時に、追跡された座標毎に、該座
標を±θ度の直線が通ると仮定した場合の切片の値をそ
れぞれ計算しておく。そして、その切片の値が最大もし
くは最小になる時の輪郭座標を記憶する。輪郭追跡処理
が終了すれば、前記の角点の座標値を得ることが出来
る。
標が一意に定まらないこともある。この場合には、角点
間の距離が最も大きくなるように選択する。
出手段5によって得られた角点の座標の位置関係から、
前記仮の文字行の傾き角度を検出するものである。傾き
角度の算出法は、前記角点の座標から文字行の外接枠を
検出して、その枠線の方向から傾き角度を算出する。枠
線は4本得ることができるが、行方向への距離が遠いほ
ど精度はよくなるため、最も行方向での距離が遠い2つ
の角点から角度を推定する方式を例として挙げることが
出来る。上下2本の枠線両方を用いて平均化してもよ
い。
記仮の文字行の傾き角度の算出値から最も適切であると
思われる値を、文書画像の傾き角度として出力する。最
も適切な角度の推定手法には、最尤推定や平均化などの
手法を用いることができる。
のみを検出するため、従来のハフ変換などを用いた手法
と比べて、特に直線近似などの段階の処理において処理
手数を低減することができる。一文字行分の傾き角度の
検出処理が少ない処理手数で行えるため、従来手法では
1行分に対する処理時間内で、本発明は複数の行に対し
て傾き角度を求めることができ、このため傾き角度の推
定値の精度を低下させることなく全体としての処理手数
を低減することが出来る。
(a)は、連結画素成分を抽出した段階を示し、(b)
は、近接する連結画素成分を統合し文字行を生成した段
階を示し、(c)は、文字行の角点を抽出した段階を示
し、(d)は、角点から傾き角度θを推定した結果を示
す。
ある。
Claims (1)
- 【請求項1】 文書を光学的に走査し、文書画像データ
を得る画像入力手段と、 前記画像入力手段によって入力された文書画像データを
参照し画素の連結成分を検出する連結成分抽出手段と、 前記連結成分抽出手段によって抽出された画素の連結成
分のうち、文字を構成する連結成分を抽出する、文字成
分抽出手段と、 前記文字成分抽出手段によって抽出された連結成分のう
ち、近接する連結成分同士を統合し仮の文字行として出
力する、文字行推定手段と、 前記文字行推定手段によって推定された仮の文字行に対
して、水平方向及び垂直方向からそれぞれ所定の角度だ
け傾いた直線に接する、最も外側の輪郭点を検出する、
角点検出手段と、 前記角点検出手段によって検出された角点の位置関係か
ら、前記仮の文字行の傾きを算出する、文字行傾き角度
算出手段と、 前記文字行推定手段から得られた各々の仮の文字行か
ら、前記文字行傾き角度算出手段によって得られた傾き
角度を参照し、前記文書画像データの傾き角度を求め
る、文書画像傾き角度検出手段と、 を具備することを特徴とする文書画像傾き検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5329368A JP2778437B2 (ja) | 1993-12-27 | 1993-12-27 | 文書画像傾き検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5329368A JP2778437B2 (ja) | 1993-12-27 | 1993-12-27 | 文書画像傾き検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07192085A true JPH07192085A (ja) | 1995-07-28 |
JP2778437B2 JP2778437B2 (ja) | 1998-07-23 |
Family
ID=18220677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5329368A Expired - Fee Related JP2778437B2 (ja) | 1993-12-27 | 1993-12-27 | 文書画像傾き検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2778437B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6332046B1 (en) | 1997-11-28 | 2001-12-18 | Fujitsu Limited | Document image recognition apparatus and computer-readable storage medium storing document image recognition program |
JP2005309771A (ja) * | 2004-04-21 | 2005-11-04 | Omron Corp | 文字列領域抽出装置 |
JP2011003181A (ja) * | 2009-06-17 | 2011-01-06 | Kyocera Mita Corp | 原稿傾斜角検出方法及び原稿傾斜角検出装置 |
KR101878256B1 (ko) * | 2016-12-15 | 2018-07-13 | 서울대학교산학협력단 | 문자를 포함하는 영상의 평활화 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01205287A (ja) * | 1988-02-10 | 1989-08-17 | Oki Electric Ind Co Ltd | 文字行傾き検出装置 |
JPH0362284A (ja) * | 1989-07-31 | 1991-03-18 | Nec Corp | 文字行抽出装置 |
-
1993
- 1993-12-27 JP JP5329368A patent/JP2778437B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01205287A (ja) * | 1988-02-10 | 1989-08-17 | Oki Electric Ind Co Ltd | 文字行傾き検出装置 |
JPH0362284A (ja) * | 1989-07-31 | 1991-03-18 | Nec Corp | 文字行抽出装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6332046B1 (en) | 1997-11-28 | 2001-12-18 | Fujitsu Limited | Document image recognition apparatus and computer-readable storage medium storing document image recognition program |
US6577763B2 (en) | 1997-11-28 | 2003-06-10 | Fujitsu Limited | Document image recognition apparatus and computer-readable storage medium storing document image recognition program |
JP2005309771A (ja) * | 2004-04-21 | 2005-11-04 | Omron Corp | 文字列領域抽出装置 |
JP2011003181A (ja) * | 2009-06-17 | 2011-01-06 | Kyocera Mita Corp | 原稿傾斜角検出方法及び原稿傾斜角検出装置 |
KR101878256B1 (ko) * | 2016-12-15 | 2018-07-13 | 서울대학교산학협력단 | 문자를 포함하는 영상의 평활화 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP2778437B2 (ja) | 1998-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9805281B2 (en) | Model-based dewarping method and apparatus | |
US7301564B2 (en) | Systems and methods for processing a digital captured image | |
US20020051575A1 (en) | Method and apparatus for recognizing text in an image sequence of scene imagery | |
US5892854A (en) | Automatic image registration using binary moments | |
JPH0973511A (ja) | 情報再生装置及び情報記録媒体 | |
JP2012243307A (ja) | 入力画像における歪を検出する方法、入力画像における歪を検出する装置およびコンピューター読み取り可能な媒体 | |
US5243668A (en) | Method and unit for binary processing in image processing unit and method and unit for recognizing characters | |
JP4419269B2 (ja) | 二次元コード抽出方法 | |
JP2002199206A (ja) | メッセージ埋込並びに抽出方法、装置および媒体 | |
JP2778437B2 (ja) | 文書画像傾き検出装置 | |
JP3303246B2 (ja) | 画像処理装置 | |
Lehal et al. | A range free skew detection technique for digitized Gurmukhi script documents | |
JP4314148B2 (ja) | 2次元コード読取装置 | |
KR100603618B1 (ko) | 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정장치 및 방법 | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
JPH1153539A (ja) | 円形パターン判定方法および記録媒体 | |
JPH11288453A (ja) | 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム | |
JP2003196588A (ja) | 情報再生装置及び情報再生方法 | |
JP3240280B2 (ja) | 帳票読み取り方法および帳票読み取りプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 | |
JPH03250280A (ja) | 文字認識方法及び装置並びに情報処理装置 | |
Kim et al. | Document capturing method with a camera using robust feature points detection | |
Da Xu | A computer vision based whiteboard capture system | |
JPH06259531A (ja) | ドットパターンの傾き補正方法 | |
JPH04276888A (ja) | 文字読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980407 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090508 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100508 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110508 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110508 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120508 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120508 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130508 Year of fee payment: 15 |
|
LAPS | Cancellation because of no payment of annual fees |