JPH0250513B2 - - Google Patents

Info

Publication number
JPH0250513B2
JPH0250513B2 JP56171042A JP17104281A JPH0250513B2 JP H0250513 B2 JPH0250513 B2 JP H0250513B2 JP 56171042 A JP56171042 A JP 56171042A JP 17104281 A JP17104281 A JP 17104281A JP H0250513 B2 JPH0250513 B2 JP H0250513B2
Authority
JP
Japan
Prior art keywords
density value
phase difference
image data
screen
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56171042A
Other languages
English (en)
Other versions
JPS5872275A (ja
Inventor
Teruo Akyama
Isao Masuda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP56171042A priority Critical patent/JPS5872275A/ja
Publication of JPS5872275A publication Critical patent/JPS5872275A/ja
Publication of JPH0250513B2 publication Critical patent/JPH0250513B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は、文書傾き補正装置、特にたとえば紙
面上の文字を読み取る光学的文字読取装置
(OCR)において、文字列方向等の事前情報が全
く与えられない自由な書式の文書画面に対しても
画面の傾きを自動的に補正出来る様にした文書傾
き補正装置に関する。
OCR等を用いて文字を読み取る場合、まず始
めに画面の傾きを補正しておく必要がある。従
来、用紙の傾きを補正する手法として、予め用紙
に文字の方向を示すガイドマークを印刷してお
き、そのガイドマークを基準にするもの、また用
紙枠を検出してそれを基準にするもの等があつ
た。しかし前者の場合には予め用紙にガイドマー
クを印刷しておかなければならず、また後者の場
合には切り抜きや、傾いて複写されたものに対し
ては傾き補正が出来ないという欠点があつた。ま
たこれらの欠点を解決するものとして特願昭55−
143238号で述べた画面の投影を用いる手法は画面
がどんな方向で入力されていても正確な傾き補正
が出来るが、実際に画面を回転させるか、あるい
はそれと同等の操作を行い、それぞれの画面ごと
に投影量を求める必要があつた。すなわち画面が
正しい方向で入力されたか否かは判かるが、その
傾き量を1回の走査で検出するのが困難であると
いう欠点があつた。
また、特願昭55−131875、「文書に印刷された
記号を走査する方法」では文書中の文字列の位置
を濃度累積ヒストグラム又は手動によつて抽出
し、次に該文字列の部分的な濃度累積ヒストグラ
ムを用いることにより、該文字列の基線の傾きを
検出する方法が記載されているが、この手法では
基線の傾きを検出するにあたつて文書中の文字列
の位置を何等かの方法で予め抽出しておかなけれ
ばならず、特開昭55−131875に記載された濃度ヒ
ストグラムによる投影を用いた手法では文字列の
位置が正確に求めることのできない、段組を持つ
新聞などの極めて文字列数が多い文書や、図表が
含まれている文書などに対しては、手法の適用が
困難であり、この場合は手動による文字列位置の
指定をせざる得ないという問題点があつた。
本発明は、これらの欠点を解決するために、新
聞などの段組があり、かつ図表を含む文書に対し
ても、文字例位置を手動で入力したりガイドマー
ク等を用いることなく文書の傾きを正確に検出
し、文書の傾きを補正することを目的としてお
り、以下図面に従つて詳細に説明する。
第1図は傾き補正の原理を示す図である。第1
図Aにおいて、1は傾き補正を行うべき文書デー
タの一例、2は見出しの部分、3は本文中の1つ
の文字列を示す。ここで文書データはθだけ時計
方向に傾いて入力されている。ここで文書データ
を4a〜4gに示されるたんざく状の領域に分割
し、たんざくごとの画素投影量を求めると第1図
B図示の様になる。たんざく4a〜4g各々の領
域に含まれる画素の濃度値を垂直方向に加えた投
影値、即ち濃度値累積ヒストグラムはそれぞれ5
a〜5gに示されている。ここで、ヒストグラム
5a〜5gは入力画像のX軸方向の座標Xをもち
いて関数f(x)で表現することができる。例え
ば第1図A図示の領域4bに含まれる上段の最も
左の文字列6の部分領域6aは投影により第1図
B図示の7aとなる。6b,7bについても同様
である。この様に文書中の本文の文字列は周期性
を持つので、たんざく状領域4a〜4gにおける
上下方向の投影量を求めると第1図B図示の5a
〜5gに示される様な「山」が現れる。ここで第
1図B図示の7a,7bの両者は同じ文字列を投
影しているにもかかわらず、入力した画面が傾い
ていたために位相のずれ8を生じている。本装置
は各たんざくごとの平均的な投影量の位相ずれを
用いて、式 tan-1位相のずれ/たんざくの幅 により画面の傾きを求める。第1図B図示の平行
線9a〜9cの傾きは、平均的な位相ずれを示し
たものである。
第2図は本発明の一実施例を示したものであ
る。光電変換部20では文書に対してラスター走
査を行い画面の濃度に応じて電気信号をA/D変
換部21へ出力する。A/D変換部21は、光電
変換部20から送られて来る電気信号を量子化
し、量子化データを濃度累積部22と画像データ
記憶部(1)23に転送する。画像データ記憶部(1)2
3はA/D変換部21から送られて来る画像デー
タを記憶する2次元メモリーである。濃度累積部
22ではA/D変換部21から送られて来る画像
のラスター毎の量子化データを累積する。複数回
のラスター走査の濃度値を累積することによつて
第1図Bに示される濃度値累積ヒストグラムを得
ることが出来る。また第3図A図示の11a,1
1b,11cの様にお互いに重ない合うたんざく
状領域の濃度値累積ヒストグラムを求めておく
と、後に濃度値累積ヒストグラムの位相差を計算
する時の精度を上げることが出来る。ここで、図
示の区間11a,11b,11cの濃度累積ヒス
トグラムを求めたのが第3図C11a′,11b′,
11c′である。この場合、濃度値累積ヒストグラ
ムを求める位相差を求め複数個のたんざく状の領
域は、全ての領域が一致するものでなければ文書
のどの様な部分から取つてきても有効に作用する
ことは明らかである。
濃度累積値記憶部24は濃度累積部部22から
出力される濃度値累積ヒストグラムを記憶する部
分である。位相差検出部25は濃度値累積ヒスト
グラム記憶部24内の2つの濃度値累積ヒストグ
ラムの位相差を検出する。位相差を求める累積濃
度値対をそれぞれf(x),g(x)とした時、相
関値C=f(x)g(x−n)を求め、Cが最大に
なるnを求めれば良い。ここで、Xはヒストグラ
ムを求める時の水平方向、即ちX軸方向の座標で
ある(第1図B)。第4図はその様子を示したも
ので、ここでは累積濃度値g(x)をNだけ右に
シフトして相関を求めた時に相関値が最大にな
る。
この方法によれば、文書全体を短冊状の領域に
分割した各領域での濃度累積ヒストグラムを基
に、その相関値を求め位相差を計算しているた
め、文書の傾きを求めるにあたつて文字列の位置
を予め抽出しておく必要が全くないという効果が
ある。累積濃度値対としては互いに隣接するたん
ざく状領域の累積濃度値を用いるのが効果的であ
る。ただし、隣接していない、互いに離れている
領域の累積濃度値を用いても位相差の検出が可能
であることは明らかである。第1図Bにおいて具
体的に示すと、たとえば(5a,5b),(5b,
5c),(5c,5d),(5d,5e),(5e,5
f),(5f,5g)またたんざく状領域として重
複したものを採用する場合には(5a+5b+5
c,5d+5e+5f),(5b+5c+5d,5
e+5f+5g)などを累積濃度値対として選択
し、平均位相差を求めれば良い。
傾き補正部26は位相差検出部25で計算され
た平均位相差をもとに画面の傾きを tan-1平均位相差/たんざく幅 で計算し、画像データ記憶部(1)23に格納された
原画像に対し傾き補正を行い画像データ記憶部(2)
27に補正結果を格納する。傾きを補正するため
にはたとえば式 x1=xcosθ−ysinθ y1=xsinθ+ycosθ …(1) を用いることが出来る。式(1)においてθは補正す
る角度、x,yは画像データ記憶部(1)の中の画像
データの座標、x1,y1は傾き補正後の画像データ
記憶部(2)における座標である。
以上説明した様に、本発明によれば、OCR等
を用いて文字を読み取る場合において、用いられ
る用紙の中に傾き補正用のガイドマークがなくて
も、またさらには傾いて複写されたものであつて
も、画面を1回ラスター走査するだけで画面の傾
きを検出することが出来、その傾きを補正するこ
とが出来る。
本発明は文書全体を複数個に分割した領域の濃
度累積値を基に位相差を求めているため、文書中
での個々の文字列の位置を予め検出する必要がな
いという利点がある。さらに、本発明の場合、主
に印刷文書に対して大きな効果を持つが、手書き
の文書や、文字以外に表やグラフ等をも含む画面
に対しても有効である。また濃度値累積ヒストグ
ラムの位相差が検出出来ない位に大きく傾いて入
力された画面に対しては上述の特願昭55−143238
号で述べた傾き補正手法を用いて大まかな傾き補
正を行つてから、本発明を用いて細かい傾き補正
を行えば効率の良い傾き補正が出来る。
【図面の簡単な説明】
第1図は本発明装置の原理を説明する図、第2
図は本発明の一実施例構成、第3図は濃度値累積
ヒストグラムを重複したたんざく状領域で求める
様子を示す図、第4図は濃度値累積ヒストグラム
による位相差検出を説明する図である。 1…傾き補正を行うデータの一例、2…見出し
の部分、3…本文中の1つの文字列、4a〜4g
…累積濃度値を求める領域(たんざく領域)、5
a〜5g…4a〜4gの濃度値累積ヒストグラ
ム、b…本文中の1つの文字列、6a,6b…累
積濃度値を求める領域で仕切られた文字列6の部
分領域、7a,7b…6a,6bの累積濃度値、
8…7a,7bの位相差、9a〜9e…傾きが平
均的な位相のずれを示す平行線群、10a〜10
c…文字列、11a〜11c…基本領域、12a
〜12eを複数個合わせて作られる濃度値累積ヒ
ストグラム計算領域、11a′〜11c′…11a〜
11cの濃度値累積ヒストグラム、12a〜12
e…領域を重複して濃度値累積ヒストグラムを求
める場合の基本領域、、12a′〜12e′…12a
〜12eの濃度値累積ヒストグラム、20…光電
変換部、21…A/D変換部、22…濃度累積
部、24…濃度値累積ヒストグラム記憶部、25
…位相差検出部、26…傾き補正部、23,27
…画像データ記憶部。

Claims (1)

    【特許請求の範囲】
  1. 1 文書等の画面に対してラスター走査を行う画
    面読取装置において、当該各ラスター走査線毎に
    画面の濃度に対応した電気信号を出力する光電変
    換部と、該光電変換部から出力される電気信号を
    量子化するA/D変換部と、量子化された画像デ
    ータを記憶する第1の画像データ記憶部と、上記
    A/D変換部から出力される量子化データを累積
    し、濃度値累積ヒストグラムを作成する濃度累積
    部と、一定数走査ごとの濃度値累積ヒストグラム
    を記憶する濃度値累積ヒストグラム記憶部と、画
    面の互いに共有部分のない、あるいは1部を共有
    する複数個の領域における濃度差累積ヒストグラ
    ムを相対的に移動させることにより、両者の積和
    の値が最大になる場所を求める相関演算を行い、
    それをもとに両濃度値累積ヒストグラムの位相の
    差を検出する位相差検出部と、該位相差検出部に
    よつて検出された位相差をもとに画面の中の文字
    の傾きを求め第1の画像データ記憶部に記憶され
    ている画像データに傾き補正を行いかつその結果
    を第2のの画像データ記憶部に格納する傾き補正
    部とを有することを特徴とする文書傾き補正装
    置。
JP56171042A 1981-10-26 1981-10-26 文書傾き補正装置 Granted JPS5872275A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56171042A JPS5872275A (ja) 1981-10-26 1981-10-26 文書傾き補正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56171042A JPS5872275A (ja) 1981-10-26 1981-10-26 文書傾き補正装置

Publications (2)

Publication Number Publication Date
JPS5872275A JPS5872275A (ja) 1983-04-30
JPH0250513B2 true JPH0250513B2 (ja) 1990-11-02

Family

ID=15916006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56171042A Granted JPS5872275A (ja) 1981-10-26 1981-10-26 文書傾き補正装置

Country Status (1)

Country Link
JP (1) JPS5872275A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010190652A (ja) * 2009-02-17 2010-09-02 Mitsui Eng & Shipbuild Co Ltd 蛍光検出方法、蛍光検出装置及びプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60229178A (ja) * 1984-04-25 1985-11-14 Matsushita Electric Ind Co Ltd ナンバ−プレ−ト位置検出装置
DE3681054D1 (de) * 1985-03-29 1991-10-02 Siemens Ag Einrichtung zur detektion von kanten.
JPH01100685A (ja) * 1987-10-14 1989-04-18 Teremateiiku Kokusai Kenkyusho:Kk 文字認識装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55131875A (en) * 1979-03-30 1980-10-14 Ibm Method of scanning symbols printed on documents

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55131875A (en) * 1979-03-30 1980-10-14 Ibm Method of scanning symbols printed on documents

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010190652A (ja) * 2009-02-17 2010-09-02 Mitsui Eng & Shipbuild Co Ltd 蛍光検出方法、蛍光検出装置及びプログラム
US8405049B2 (en) 2009-02-17 2013-03-26 Mitsui Engineering & Shipbuilding Co., Ltd. Fluorescence detection method, fluorescence detecting device and program

Also Published As

Publication number Publication date
JPS5872275A (ja) 1983-04-30

Similar Documents

Publication Publication Date Title
US9509884B2 (en) Skew detection
US7477426B2 (en) Image correcting apparatus and method, program, storage medium, image reading apparatus, and image forming apparatus
US7684646B2 (en) System and method of determining image skew using connected components
US8213687B2 (en) Image processing methods, image processing systems, and articles of manufacture
JP4170441B2 (ja) 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
US20050196070A1 (en) Image combine apparatus and image combining method
US20120093434A1 (en) Edge detection
EP1033864A2 (en) Document-inclination detector
US7545535B2 (en) Robust automatic page size detection algorithm for scan application
JPH0250513B2 (ja)
JPS6325391B2 (ja)
Lehal et al. A range free skew detection technique for digitized Gurmukhi script documents
US8238659B2 (en) Image processing apparatus and method of determining a region of an input image and adjusting pixel values of the region
JP2893747B2 (ja) 文書画像傾き検出方法及びその装置
JPH03263282A (ja) 文字読取装置の文字切出し方法
JP7510602B2 (ja) 画像読取装置
JP3350596B2 (ja) 傾き検出方法
JPS6252337B2 (ja)
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP3381803B2 (ja) 傾き角検出装置
JP2536205B2 (ja) 文書画像傾き検出方法及び装置
JPS6327751B2 (ja)
JPH103517A (ja) 文書画像傾き角検出装置
JP3236898B2 (ja) 画像処理装置およびその処理方法