JP2001043310A - 文書画像補正装置および補正方法 - Google Patents

文書画像補正装置および補正方法

Info

Publication number
JP2001043310A
JP2001043310A JP11216050A JP21605099A JP2001043310A JP 2001043310 A JP2001043310 A JP 2001043310A JP 11216050 A JP11216050 A JP 11216050A JP 21605099 A JP21605099 A JP 21605099A JP 2001043310 A JP2001043310 A JP 2001043310A
Authority
JP
Japan
Prior art keywords
image
character
document image
correcting
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11216050A
Other languages
English (en)
Inventor
Kenichiro Sakai
憲一郎 酒井
Tsuguo Noda
嗣男 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP11216050A priority Critical patent/JP2001043310A/ja
Priority to US09/612,288 priority patent/US7151860B1/en
Priority to EP00305796A priority patent/EP1073001A3/en
Publication of JP2001043310A publication Critical patent/JP2001043310A/ja
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H29/00Delivering or advancing articles from machines; Advancing articles to or into piles
    • B65H29/52Stationary guides or smoothers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42CBOOKBINDING
    • B42C1/00Collating or gathering sheets combined with processes for permanently attaching together sheets or signatures or for interposing inserts
    • B42C1/12Machines for both collating or gathering and permanently attaching together the sheets or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H2301/00Handling processes for sheets or webs
    • B65H2301/10Selective handling processes
    • B65H2301/16Selective handling processes of discharge in bins, stacking, collating or gathering
    • B65H2301/163Bound or non bound, e.g. stapled or non stapled stacking mode
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H2301/00Handling processes for sheets or webs
    • B65H2301/30Orientation, displacement, position of the handled material
    • B65H2301/36Positioning; Changing position
    • B65H2301/362Positioning; Changing position of stationary material
    • B65H2301/3621Positioning; Changing position of stationary material perpendicularly to a first direction in which the material is already in registered position
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H2301/00Handling processes for sheets or webs
    • B65H2301/40Type of handling process
    • B65H2301/42Piling, depiling, handling piles
    • B65H2301/422Handling piles, sets or stacks of articles
    • B65H2301/4222Squaring-up piles
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H2511/00Dimensions; Position; Numbers; Identification; Occurrences
    • B65H2511/20Location in space
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H2511/00Dimensions; Position; Numbers; Identification; Occurrences
    • B65H2511/40Identification
    • B65H2511/414Identification of mode of operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 【課題】 行方向が、例えば横方向に限られる英語文書
を、例えばハンドヘルドスキャナによって上下左右、い
ずれの方向にスキャンしても、スキャンされた画像を正
立方向に自動補正する。 【解決手段】 入力文書画像の行方向が横か縦かを判定
する手段1と、入力文書画像から文字画像を抽出する手
段2と、手段1の判定結果に対応して、抽出された文字
画像を正立方向に補正するための回転角度、および鏡像
反転の必要性の有無を検出する手段3と、手段3の検出
結果に基づいて入力文書画像を正立方向に補正する手段
4とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像などの入力方式
に係り、更に詳しくはスキャナなどの画像入力装置を用
いて入力された英語の文書画像を、正立した文書画像に
自動的に補正する装置であって、特に回転や鏡像反転の
後に入力された文書画像からその画像を正立方向に補正
するための回転角度、および鏡像反転の必要性の有無を
文書補正方法として検出して、正立した文書画像を得る
文書画像補正装置に関する。
【0002】
【従来の技術】近年、据え置き型のフラットベッドスキ
ャナに加え、持ち運びが容易な手動操作型の小型ハンデ
ィタイプスキャナが開発・製品化されている。ハンドヘ
ルドスキャナはユーザが任意の方向にスキャンすること
が可能であり自由度が高い反面、スキャンする方向によ
っては、回転したり鏡像反転した画像として読み込まれ
ることがあり、スキャンした後に回転や鏡像変換して補
正する必要があった。
【0003】特開平8−212298号など、従来の文
書画像補正装置では、スキャンした文書画像から文字画
像を切出し、0度、90度、180度、270度の4方
向から文字認識を行い、認識の確からしさ(認識確度)
が最も大きい方向を文書方向として判別し、判別した文
書方向が正方向でなければ文書画像を回転して正立(文
書として正しく読める方向)した画像になるように補正
していた。
【0004】
【発明が解決しようとする課題】従って、従来の文書画
像の補正方法では、ハンドヘルドスキャナでスキャンし
て得られた鏡像反転した文書画像に対しては、文書画像
から切り出した文字画像を0度、90度、180度、2
70度のいずれの角度に回転しても文字認識できないた
め、正立方向が判別できずに補正できないという問題が
あった。
【0005】本発明の課題は、鏡像反転された画像を含
んで、文書画像を正立方向に自動補正するとともに、例
えばアルファベットで表現される英語の文書画像のよう
に、文書が基本的に横書きに限定される場合に、文字画
像の回転等の処理の負荷を低減できる文書画像補正装置
および補正方法を提供することである。
【0006】
【課題を解決するための手段】図1は本発明の原理構成
ブロック図である。同図は例えばハンドヘルドスキャナ
などによって、文書画像が回転されたり、鏡像反転され
たりして入力された入力文書画像を正立画像に補正する
文書画像補正装置の原理構成ブロック図である。
【0007】図1において、行方向判定手段1は入力文
書画像の行方向が縦であるか、横であるかを判定するも
のであり、文字画像抽出手段2は入力文書画像から文字
画像を、例えば一文字単位に抽出するものである。
【0008】文字方向検出手段3は、行方向判定手段1
の判定結果に対応して、例えば行方向が横である場合に
はそのままで、また縦である場合には文字画像抽出手段
2によって抽出された文字画像を90度回転させた後
に、その文字画像を正立方向に補正するための回転角
度、および鏡像反転の必要性の有無を検出するものであ
り、文書画像補正手段4は文字方向検出手段3の検出結
果に基づいて、入力文書画像を正立文書画像に補正する
ものである。
【0009】本発明の実施の形態においては、文字方向
検出手段3が画像変換手段と、文字認識手段とをさらに
備えることもできる。画像変換手段は、行方向判定手段
1の判定結果に対応して、文字画像抽出手段2によって
抽出された文字画像を回転、および/または鏡像反転し
た画像に変換する。また文字認識手段は、変換された文
字画像を文字認識して、文字コードと認識の確信度とを
出力する。そして文字方向検出手段3は、文字認識手段
の認識結果に基づいて、文字画像を正立方向に補正する
ための回転角度、鏡像反転の必要性の有無を検出する。
【0010】また本発明の実施形態においては、文字画
像補正装置が入力文書画像の言語を識別する言語識別手
段を更に備えることもでき、文書画像補正装置は言語識
別手段の判定結果に対応して、入力文書画像を正立画像
に補正することもできる。
【0011】本発明の実施形態においては、文字方向検
出手段が行方向判定手段の判定結果に対応して、入力文
書画像内の文字画像を回転、および/または鏡像反転し
た複数のパターン、入力画像内そのままのパターンを含
み例えば8つのパターンのうちの一部のパターン、例え
ば半数のパターンを除外し、残ったパターンのみを用い
て、文字画像抽出手段によって抽出された文字画像を正
立方向に補正するための回転角度、および鏡像反転の必
要性の有無を検出することもできる。
【0012】本発明の異なる実施形態においては、文書
画像補正装置は行方向判定手段、行画像抽出手段、文字
方向検出手段、および画像補正手段を備えることもでき
る。行方向判定手段、および文書画像補正手段の作用は
基本的に図1におけると同様である。
【0013】行画像抽出手段は、入力文書画像から1行
の全体、またはその一部分を行画像として抽出する。ま
た文字方向検出手段は、行方向判定手段の判定結果に対
応して、抽出された行画像内の文字画像を正立方向に補
正するための回転角度、および鏡像反転の必要性の有無
を検出する。
【0014】この異なる実施形態においても、文字方向
検出手段が画像変換手段と文字認識手段とを更に備える
こともできる。画像変換手段は、行方向判定手段の判定
結果に対応して、抽出された行画像内の文字画像を回
転、および/または鏡像反転するものであり、文字認識
手段は変換された文字画像を文字認識して、行画像内の
各文字画像毎に対応する文字コードと認識の確信度とを
出力するものであり、文字方向検出手段はその認識結果
に基づき、抽出された行画像内の文字画像を正立方向に
補正するための回転角度と、鏡像反転の必要性の有無を
検出する。
【0015】本発明の実施の形態においては、文字方向
検出手段が、行画像内の文字画像に対して画像変換手段
によって異なる変換方法を用いて変換された複数種類の
画像のうちで、文字認識手段による認識の確信度の行画
像内の文字画像に対する平均値が最大になる種類であっ
てかつ行画像内の文字画像に対応する文字コードの中に
あらかじめ定められた文字コードが所定の個数以上含ま
れていない場合にその種類の画像を、正立方向の画像と
して検出することもできる。
【0016】また本発明の実施形態としての文書画像補
正方法においては、入力された文書画像の行方向が縦で
あるか、横であるかを判定し、次にその判定結果に対応
して、入力文書画像から抽出した文字画像を正立方向に
補正するための回転角度、および鏡像反転の必要性の有
無を検出し、更にその検出結果に基づいて、入力文書画
像を正立文書画像に補正することができる。
【0017】更に本発明の実施形態として、文書画像補
正装置において使用される記憶媒体であって、入力文書
画像の行方向が縦であるか、横であるかを判定するステ
ップと、その判定結果に対応して入力文書画像から抽出
した文字画像を正立方向に補正するための回転角度、お
よび鏡像反転の必要性の有無を検出するステップと、そ
の検出結果に基づいて、入力文書画像を正立文書画像に
補正するステップとを計算機に実行させるためのプログ
ラムを格納した計算機読出し可能記憶媒体を用いること
もできる。
【0018】本発明においては、以上のようにまず入力
文書画像の行方向が縦であるか、横であるかを判定した
後に、入力文書画像に対する補正処理が実行される。本
発明においては、通常の文章では縦書きが存在しない文
書、例えば英語の文書画像が対象の文書画像である。入
力された文書画像の行方向が縦であると判定された時に
は、その入力文書画像内の文字を90度回転させて、行
方向が横である場合の画像に変換した後に、正立方向へ
の補正処理が行われる。
【0019】一般に、例えばハンドヘルドスキャナによ
って、上下左右任意の方向に文書画像をスキャンした場
合には、ヘッドの方向がどちらを向いているかによって
回転、および/または鏡像反転された8種類のパターン
の画像が得られる。例えば漢字とかなとによって表現さ
れる日本語のように縦書きの文書が存在する場合には、
この8種類のパターンの画像に対応して正立文書画像へ
の補正処理を行う必要があるが、英語文書の場合には、
行方向が縦であると判定された時に、あからじめ入力文
字画像を90度回転した後に正立文書画像への補正処理
を行うことによって、処理対象パターンを4種類に減ら
すことができ、処理時間を短縮することが可能となる。
【0020】
【発明の実施の形態】本発明の実施の形態について、例
えばアルファベットで表現される英語、またはドイツ語
やロシア語のように、基本的に横書きであって、縦書き
されるケースがほとんどない言語の文書画像に対する補
正を中心として説明する。このように縦書きされるケー
スがほとんどない言語の文書画像の場合には、入力画像
の行方向と文字の向きの相関性が高くなる。
【0021】本実施形態においては、文書画像が例えば
英語の文書画像の場合には、この性質を利用して文字方
向判別時の文字回転方向などを限定する。すなわち入力
画像の行方向が縦方向である場合には、その入力画像を
あらかじめ90度回転させた後に、文字方向判別処理を
行うことによって、文字認識を行うパターンの数を減少
させることができる。これが本発明の基本的な前提であ
る。
【0022】図2は本発明の実施形態における文書画像
補正装置の全体構成ブロック図である。本発明の実施形
態においては、前述のように英語の文書画像を対象とし
て入力文書画像の行方向を検出し、その検出結果に対応
して文字画像の方向を検出し、その方向によって画像を
補正する動作が実行される。なお、ここで文字画像とは
文字に外接する矩形領域を抽出した画像を指す。
【0023】図2において、画像格納部11はスキャナ
入力された文書画像を格納するものであり、英語識別部
12は文書画像の文書が英語であるか否かを識別するも
のであり、行方向検出部13は入力画像の行方向が縦で
あるか、横であるかを検出するものである。
【0024】文書方向検出部14は、英語識別部12に
よって入力画像の文書が英語であると識別された場合
に、行方向検出部13の検出結果に対応して文字の方
向、すなわち入力画像内の文字を正立方向に補正するた
めの回転角度、および鏡像反転の必要性の有無を検出す
る。この時、行方向検出部13によって検出された行方
向が縦であった場合には、入力画像を90度回転した後
に文字方向の検出を行う。画像補正部15は、文書方向
検出部14の検出結果、すなわち入力画像内の文字を補
正するための回転角度と、鏡像反転の必要性の有無の検
出結果に対応して、画像格納部11に格納されている画
像を補正して、正立画像として出力するものである。
【0025】ここでハンドヘルドスキャナによるスキャ
ンの方向と、入力画像について図3、および図4を用い
て説明する。図3の〜に示すように、ハンドヘルド
スキャナを用いると、文書画像を上下左右どの方向から
もスキャンすることができる。このため図3の以外の
方向のスキャンを行った場合には、スキャン方向によっ
て文字画像が回転されたり、鏡像反転された画像として
読み込まれる。
【0026】例えば文書上に正立した“a”という文字
があった場合、これを図3の〜の方向にスキャンす
る時、取り込まれる画像は図4の〜に示される。例
えばのようなスキャンを行うと、文字画像の上側はそ
のまま上側に取り込まれるが、スキャナの先頭(スキャ
ナヘッド)が右側にあるため右側の部分が先に取り込ま
れて入力画像の左側になるために、左右に鏡像反転され
た画像が取り込まれる。
【0027】スキャナ入力された画像からそのまま抽出
された文字画像、その文字画像を90度、180度、2
70度回転させた画像、抽出された文字画像と3つの回
転画像とのそれぞれが鏡像反転された画像の合計8個の
画像(パターン)の中には、スキャナの操作方向とも関
係するが、正立画像が含まれる可能性が非常に高く、こ
の8個のパターンから正立画像の検出を行うことができ
る。
【0028】スキャナ入力された画像そのものについて
言えば、その文字の画像の状態としては、例えば英語の
文書画像であっても、図4の〜の8通りが存在す
る。しかしながら、英語の通常の文章では縦書きは存在
せず、図3の上部に矢印で示すように行方向は横方向で
あり、図4の〜の画像は英語文書としては本来存在
する可能性が非常に低い文字画像である。入力画像の行
方向が縦であればその画像中の文字は〜のいずれか
になるが、文書の行方向が縦というのは英語の通常の文
章では存在しない状態であり、入力画像の行方向が縦と
分かった時点で画像が90度回転された後に、入力画像
の補正が行われる。行方向が横の場合には90度の回転
は行われない。その結果文字画像の状態としては図4の
〜の4つのみとなり、文字方向の検出もこの4つの
パターンに対してのみ行えばよいことになる。
【0029】本発明の実施形態においては、図2で説明
したように例えば英語の文書画像の補正に先立って行方
向の検出が行われる。検出された行方向が縦方向である
場合には、文字認識の処理の都合上、あらかじめ入力画
像を90度回転してから、画像の補正が行われる。これ
によって画像の回転と鏡像反転の有無を検出するパター
ンを、図4に示した8つのパターンから4つのパターン
に減らすことができ、例えばかなと漢字によって表現さ
れる日本語の文書画像の場合に比べて、補正のための処
理時間も半減できることになる。
【0030】スキャナ入力された画像の行方向が縦とな
るのは、スキャナを行と垂直方向にスキャンした場合で
ある。すなわちオペレータがスキャンする英語文書に正
対した位置にいるとして、図3の〜のようにスキャ
ナを右から左、または左から右に動かす場合である。こ
の時スキャナヘッドが上下いずれの方向を向いているか
によって、入力画像の状態は〜の4通りとなる。
【0031】一方スキャナ入力された画像の行方向が横
になるのは、オペレータが同じ位置にいるとしてスキャ
ナを上から下、または下から上に図3の〜に示すよ
うにスキャンした場合である。この時スキャナヘッドが
左右いずれの方向を向いているかにより、スキャナ入力
画像の行方向が横になる画像のパターンは〜に示す
4通りとなる。
【0032】このように本発明の実施形態においては、
入力文書画像に対してまず最初に行方向が縦であるか横
であるかの行方向検出が行われるが、その検出方法は公
知であり、ここではその説明を省略する。その方法とし
ては特定の方法を用いる必要はなく、例えば特開平11
−25213号公報、特開平11−25217号公報、
特開平3−4386号公報などで開示されている方法に
よって行方向検出を行うことが可能である。
【0033】本発明の実施形態における入力画像の行方
向が縦である場合と、横である場合の文字画像の方向検
出について、図5、および図6を用いて説明する。図5
は行方向が縦の場合の文字画像の方向検出の説明図であ
る。同図(A)はスキャナ入力によって得られた画像の
一部であり、入力された画像の行方向は縦のものであ
る。この場合には入力画像から切出された文字画像
(B)はまず90度回転させられて、(C)が得られ
る。そしてこの(C)の文字画像を基準として、その左
右方向の鏡像反転画像(D),180度回転画像
(E)、および180度回転+鏡像反転(左右方向)の
画像(F)が得られ、文字認識対象としての4個の画像
が得られる。
【0034】この4つの画像(C)〜(F)の中には、
スキャナの操作方向にもよるが、正立画像が含まれる可
能性が非常に大きく、図5の場合には(D)が正立画像
である。この4つの画像に対して文字認識が行われ、認
識結果の文字と認識の確信度が求められる。この確信度
の最大値は、本発明の実施形態では999とする。認識
の結果、(D)の文字画像は“a”と認識され、その確
信度は998となっている。
【0035】図6は入力画像の行方向が横の場合の文字
画像の方向検出の説明図である。行方向が横の場合に
は、図5と異なって切出された文字画像がそのまま基準
の文字画像(B)とされ、その左右方向の鏡像反転画像
(C),180度回転画像(D)、および180度回転
+鏡像反転の画像(E)が得られ、この4つの文字画像
を対象として文字認識が行われ、ここでは(E)が正立
画像として得られることになる。
【0036】このように本実施形態においては英語文書
では縦書きが存在しないことを前提として、入力画像の
行方向が縦の場合には入力画像を90度回転させた後に
方向検出を行う。
【0037】続いて本発明の実施形態における文書画像
補正処理について更に詳細に説明する。図7は英語文書
画像の自動補正処理の全体フローチャートである。同図
において、まずステップS1で入力画像が英語文書であ
るか否かが判別され、その判別結果に対応してステップ
S2で英語でない場合にはそのまま処理を終了するが、
この時他の補正処理を行わせるようにしてもよい。英語
の文書である場合には、ステップS2の判定処理の後
に、ステップS3で英語文書画像用の文書方向自動補正
が実行されて、処理を終了する。
【0038】図8は、図2の英語識別部12による英語
識別処理のフローチャートである。同図において処理が
開始されると、まずステップS11で入力画像から切出
される文字の数を示すiの値が0に初期化され、ステッ
プS12で入力画像中のi番目の文字画像の矩形領域が
検出され、ステップS13でその矩形領域の文字画像の
黒画素率Bi,文字幅Wi,および次の文字画像との文
字間隔Siが求められ、ステップS14でiの値がイン
クリメントされ、ステップS15でiの値がMに達した
か否かが判定される。ここでMは英語か否かを識別する
ために使用する文字画像の数であり、Mに達していない
場合にはステップS12以降の処理が繰り返される。
【0039】本実施形態においては、文書画像の文書が
英語か否かを識別するためにステップS13で求められ
る文字画像の黒画素率,文字幅、および次の文字画像と
の文字間隔の値が用いられる。図9はこの文字間隔と、
文字幅を示している。
【0040】図10は、例えば400dpi(ドット/
インチ)の解像度で文書のスキャナ入力を行った場合、
英語と日本語の文書画像の文字間隔と、文字幅、および
黒画素率の平均値を示す。黒画素率は文字画像の総画素
数に占める文字を構成する画素の割合である。英語と日
本語を識別するための閾値として文字間隔、文字幅、お
よび黒画素率について、日本語と英語のものの平均をと
るものとすれば、閾値として図10の最下行の値を用い
ることができる。この閾値との比較を行うことによっ
て、文書画像の文書が英語であるか、日本語であるかの
識別が可能となる。
【0041】図8に戻り、ステップS15で入力画像か
ら切出された文字の数iが英語の識別に使用される文字
の数Mに等しくなったと判定されると、ステップS16
でこのM個の文字画像に対して黒画素率Bi,文字幅W
i、および文字間隔Siの平均値Ba,Wa、およびS
aが算出され、ステップS17で黒画素率,文字幅、お
よび文字間隔にそれぞれ対応する3つの識別条件の中
で、英語に適合すると判定された条件の個数を表すnの
値が0に初期化される。
【0042】続いてステップS18で黒画素率の平均値
Baが閾値TH_B以上であるか否かが判定され、以上
である場合にはステップS19でnの値がインクリメン
トされた後に、以上でない場合には直ちにステップS2
0の処理に移行する。
【0043】ステップS20では、文字幅の平均値Wa
が閾値TH_W以下であるか否かが判定され、以下の時
にはステップS21でnの値がインクリメントされた後
に、また以下でない場合には直ちにステップ22の処理
に移行する。ステップS22では文字間隔の平均値Sa
が閾値TH_S以下であるか否かが判定され、閾値以下
である場合にはステップS23でnの値がインクリメン
トされた後に、また閾値以下でない場合には直ちにステ
ップS24の処理に移行する。
【0044】そしてステップS24で、3つの識別条件
の中で英語であると判別された条件の数nが2以上であ
るか否かが判定され、以上である場合にはステップS2
5で言語が英語と判定され、また2以上でない場合には
ステップS26で言語が英語でないと判定されて処理を
終了する。なお黒画素率,文字幅、および文字間隔の閾
値は図10の例ではそれぞれ42%、33画素、および
4画素である。
【0045】一般的に日本語と英語の文書で文字の配列
を比較すると、日本語の文書では各文字がほぼ一定の間
隔で並ぶのに対して、英語の文書では複数の文字からな
る単語によって文書が構成されているため、単語間と単
語内の文字間で文字間隔が異なる配列となる。日本語の
文書画像の場合には、先頭の文字から順に文字間隔を見
ていくと、3〜15画素程度の文字間隔が連続して検出
されるのに対して、英語の文書画像では1〜5画素程度
の小さい文字間隔が単語内の文字から連続して検出さ
れ、その後に単語の最後の文字と次の単語の先頭の文字
との間隔を示す11画素程度以上の大きな文字間隔が現
われる。なおここで示した文字間隔の画素数は、スキャ
ナによって文書を400dpiで読み取った場合の一例
である。
【0046】このような文字間隔の相違を利用して英語
の識別処理を実行することもできる。図11は、このよ
うな場合の英語識別処理のフローチャートである。同図
において処理が開始されると、まずステップS31で図
8のステップS11におけると同様にiの値が0に初期
化され、ステップS32でステップS12と同様に文字
画像の矩形領域が検出され、ステップS33で次の文字
画像との文字間隔Siが求められ、ステップS34でi
の値がインクリメントされ、ステップS35でiの値が
前述のMの値に達したか否かが判定され、達していない
場合にはステップS32以降の処理が繰り返される。
【0047】ステップS35でiの値がMに達したと判
定されると、ステップS36で文字間隔S1〜SMの分
散Vが算出され、ステップS37でその分散の値が閾値
TH_V以上であるか否かが判定され、閾値以上である
場合にはステップS38で言語が英語と判定され、閾値
以上でない場合にはステップS39で言語が英語でない
と判定されて処理を終了する。
【0048】なお英語か否かの識別のために、図11で
は文字間隔の分散が用いられている。分散を求める元の
数値のバラつきが大きければ分散も大きくなり、数値の
バラつきが小さければ分散の値も小さくなるという性質
があるため、日本語のように文字間隔のバラつきが少な
い場合には分散が小さくなり、英語のように文字間隔が
単語内と単語間とで大きく異なるような場合には分散が
大きくなることを利用しており、あらかじめ定められる
分散の閾値と比較することによって英語の識別が行われ
る。
【0049】図12は、英語の文書画像から一文字単位
に文字画像を切出して、文書画像を正立方向に補正する
ための回転角度と鏡像反転の必要性の有無を検出し、正
立画像に自動補正する文書画像補正処理のフローチャー
トである。主として図2の文書方向検出部14、画像補
正部15による処理、および図7のステップS3におけ
る処理に対応する。
【0050】同図において処理が開始されると、まずス
テップS41で入力画像の行方向が検出され、ステップ
S42で方向検出に使用するために切出された文字の個
数を示すjの値と、図5、または図6で説明したそれぞ
れ4つの画像の中で、正立方向として検出された文字を
カウントするための変数としてのD1〜D4の値が0に
初期化される。ある文字画像からE1(への変換方法)
が正立方向への補正方向として検出された場合にはD1
がインクリメントされ、E2,E3、またはE4への変
換方法が正立方向への補正方法として検出された場合に
は、それぞれD2,D3、またはD4がインクリメント
される。
【0051】そしてステップS43で入力画像から1つ
の文字の文字画像E1が抽出される。この文字画像抽出
の処理はすでに例えば図8のステップS12で行われた
ものであり、この結果を用いることにより、ステップS
43では実際の文字抽出処理を行わなくてもすむ。
【0052】ステップS44では、ステップS41での
行方向の検出結果に対応して行方向が縦であるか否かが
判定され、縦である場合にはステップS45で文字画像
E1が90度回転された後に、縦でない場合には直ちに
ステップS46の処理に移行する。
【0053】ステップS46では、文字画像E1(ここ
では簡単のため90度回転された文字画像も記号E1の
ままとする。)の長辺と短辺の比が2未満であるか否か
が判定される。この長辺対短辺比、すなわち文字画像の
長い辺の長さを短い辺の長さで割った値が所定の値、こ
こでは2未満の文字画像だけを方向検出対象として選択
することによって、2個の文字がつながって抽出された
画像や、図の一部を文字画像として誤って抽出すること
を防ぐことができる。従ってステップS46で2未満で
ないと判定された場合には、その文字画像から文字画像
の方向を検出することは行われず、ステップS57でj
の値がインクリメントされ、ステップS58でjの値が
文字画像補正処理を打ち切るべき切出し画像の個数を示
すNに達していない場合には、ステップS43以降の処
理が繰り返される。
【0054】ステップS46で長辺対短辺比が2未満で
ある場合には、ステップS47で黒画素率が42〜80
%の範囲内にあるかが判定され、範囲外のときにはステ
ップS57の処理に移行する。ここで42%は図10で
説明した閾値である。また黒すぎる画像は画像上のゴミ
や図面の一部の可能性があるため、80%以上の文字画
像からの方向検出は行われない。
【0055】42〜80%の範囲内にあるときにはステ
ップS48で文字画像E1が鏡像反転された画像E2,
180度回転された画像E3、および180度回転+鏡
像反転された画像E4が生成され、ステップS49では
E1〜E4を対象として文字認識が行われ、認識結果と
しての文字コードC1〜C4,認識の確信度K1〜K4
が求められる。
【0056】ここで文字認識結果としての文字コードと
確信度について、図13によって説明する。図13にお
いて入力された一文字の文字画像、またはその90度回
転結果としての画像E1が鏡像反転されて画像E2が、
180度回転されて画像E3が得られ、また180度回
転+鏡像反転されて画像E4が得られる。そしてそれぞ
れの画像の文字認識結果として文字コードC1〜C4
と、確信度K1〜K4が得られる。
【0057】図12に戻り、ステップS50で4つの確
信度K1〜K4のうち、2個以上があらかじめ設定され
た確信度の閾値TH_K以上であるか否かが判定され
る。本実施形態では抽出された文字画像自体が歪んでい
たり、文字ではなく、画像の一部であった場合など、そ
もそも文字認識できない画像である場合も考えられる。
【0058】このような画像からは回転角度の検出な
ど、文字方向の検出はできないため、回転や鏡像反転に
よって得られた4つの文字画像の文字認識の結果として
の4つの確信度のいずれもがあらかじめ設定された閾値
を下回る場合には、文字認識ができないと判断し、その
入力画像からは方向検出を行わないようにすることで方
向検出精度を向上させることにしている。
【0059】またAやTのように対称な形の文字画像の
場合には、鏡像反転しても同じ文字として認識されるた
めに、そのような画像に対応する4個の画像のうちで、
2個の画像の認識結果の確信度は同程度に高くなること
が考えられる。そこで入力画像から抽出された文字画像
を回転、あるいは鏡像反転して得られた4個の文字画像
の中で、2個以上の画像に対する文字認識結果の確信度
が閾値以上である場合には、その入力画像からは方向検
出を行わないようにすることによって方向検出精度を向
上させることができる。
【0060】そこでステップS50で2個以上が閾値以
上である場合には、ステップS57の処理に移行し、ス
テップS58で切出された文字画像の数がNに達してい
ない場合には、ステップS43以降の処理が繰り返され
る。
【0061】ステップS50でK1〜K4のうちで2個
以上が閾値以上でない場合、すなわち閾値以上のものが
0個か1個である場合には、ステップS51でK1〜K
4の最大値が検出されてそれがKm(mは1〜4のいず
れか)とされ、ステップS52でそのKmの値が閾値以
上であるか否かが判定され、閾値以上でない場合には4
個の確信度のいずれもが閾値を下回ることになるため、
ステップS57以降の処理に移行する。
【0062】ステップS52でKmが閾値以上である場
合には、閾値以上のものはKmのみとなり、ステップS
53でKmに対応する文字コードCmが英字に対応する
文字コードであるか否かが判定され、英字に対応する文
字コードでない場合には英語文書画像の自動補正を行っ
ていることから、この文字画像から方向を検出すること
は適当でないため、ステップS57以降の処理に移行す
る。
【0063】ステップS53で英字に対応するコードで
ある場合には、ステップS54でCmが特定の文字に対
応するコードであるか否かが判定される。ここで特定の
文字としては、例えばAやTなど方向検出できない可能
性のある文字を指定することができ、これによって方向
検出精度を向上させることができる。そしてこのような
特定の文字のコードに一致する場合には、ステップS5
7以降の処理に移行する。
【0064】ステップS54で特定の文字コードでない
場合には、ステップS55で前述の補正方法をカウント
するための変数D1〜D4のうちで、K1〜K4の最大
値としてのKmに対応するDmの値がインクリメントさ
れ、ステップS56でその値が2に達しているか否かが
判定される。Dmが2であるということは、切出された
入力画像のうちで2個の入力画像に対する回転、または
鏡像反転の結果(E1を含む)としての4つの補正方法
のうちでDmに対応する方法が正立画像を得るために行
われるべき補正方法として判断されたことを意味し、D
1〜D4の中で最初に2に達したものが、補正のための
変換方法として他の全ての画像内の文字に対して採用さ
れることになる。ステップS56でDmが2に達してい
ない場合には、ステップS57以降の処理が繰り返され
る。
【0065】ステップS56でDmが2に達していると
判定されると、ステップS59で入力画像E1を画像E
mに変換する場合と同じ変換、すなわち回転および、ま
たは鏡像反転が入力画像に対して実行されて、処理を終
了する。ここでDmに対する条件を2としたのは、1に
すると間違った方向が検出される可能性があるためであ
り、3以上にすると処理時間が増大するためである。し
かし処理時間よりも検出精度を優先させる場合には、3
以上に設定することも可能である。
【0066】ステップS59で、画像E1を画像Emに
変換したのと同じ変換方法を入力画像に適用することに
よって、正立画像として補正された文書画像が得られ
る。すなわちm=2の場合に画像E2は画像E1を鏡像
反転したものであり、入力画像を鏡像反転することによ
り正立画像が得られる。またm=3ならば、画像E3は
画像E1を180度回転したものであるため、入力画像
を180度回転し、m=4であれば画像E4は画像E1
を180度回転し、更に鏡像反転したものであるため、
入力画像を180度回転し、更に鏡像反転することで正
立画像が得られる。m=1の場合には入力画像、または
その90度回転後の画像が正立画像であることになり、
補正のための変換は不必要となる。但し行方向が縦の場
合には、ステップS45で文字画像E1に対する90度
の回転が行われているため、ステップS59ではmに関
係なく、この回転角分の90度余分に回転する必要があ
る。
【0067】ステップS58でjとNが等しくなった場
合には、検出処理を終了する。これは文字画像からその
正立方向がなかなか検出されない場合に、処理時間がか
かりすぎないように途中で処理を打ち切ることを意味す
る。以上の処理によって、入力された英語文書画像が正
立画像に自動補正される。
【0068】図14は英語の文書画像から行全体、また
はその一部を行画像として切出し、文書画像を正立方向
に補正するための回転角度と鏡像反転の必要性の有無を
検出し、正立画像に自動補正する、行画像単位の文書画
像補正処理のフローチャートであり、主として図2の文
書方向検出部14、画像補正部15によって行われる処
理であり、図7のステップS3に相当する。
【0069】このフローチャートにおいて、jは方向検
出に使用するために切出された行画像の個数を示し、E
1〜E4はE1が入力画像から抽出された行画像、E
2,E3,E4はE1をそれぞれ鏡像反転、180度回
転、180度回転+鏡像反転した行画像である。K1〜
K4は、行画像E1〜E4内のそれぞれ複数個の文字を
文字認識して得られたE1〜E4毎の確信度の平均値で
ある。Lは純粋に行画像を文字認識した結果得られた文
字の個数であり、画像E1〜E4内の文字を文字認識し
て得られた文字コードを画像毎にそれぞれC1,1〜C
1,L, C2,1〜C2,L, C3,1〜C3,
L, C4,1〜C4,Lで示す。D1〜D4は図12
におけると同じである。またNは検出処理を打ち切るべ
き、切出された行画像の個数を示す。
【0070】基本的な処理の流れは図12と同じである
が、図12では文字画像1つずつを単位として方向検出
処理を行うのに対して、ここでは行画像を単位として処
理を行う点が異なる。以下図12と内容が異なる処理ス
テップの内容について説明する。
【0071】ステップS63では入力された文書画像か
ら1行全体、または行の一部が行画像として抽出され、
抽出された行画像がE1とされる。またステップS65
では行方向が縦の場合に、行画像E1の90度回転が行
われる。
【0072】ステップS66では入力行画像、またはそ
れを90度回転した画像E1を基にして、鏡像反転され
た画像E2,180度回転された画像E3,180度回
転および鏡像反転された画像E4が生成される。
【0073】ステップS67では、行画像E1〜E4内
の文字に対する文字認識が行われる。各行画像には複数
個の文字画像が含まれるため、各行画像E1〜E4毎に
平均確信度K1〜K4が求められ、また各行画像毎に文
字コードC1,1〜C1,L, C2,1〜C2,L,
C3,1〜C3,L, C4,1〜C4,Lが求めら
れる。
【0074】以下の処理は図12におけると同様である
が、例えばステップS71では平均確信度が最大となる
行画像Emの文字コードCm,1〜Cm,Lの中に、あ
らかじめ定められた文字、例えばAやTなどに対応する
文字コードが2個以上含まれるか否かが検出され、含ま
れる場合にはステップS75、含まれない場合にはステ
ップS72の処理に移行する。このような処理を続ける
ことによって、入力された英語文書画像の正立画像への
自動補正が行われる。
【0075】なお、入力行画像を回転や鏡像反転した画
像に対する平均確信度が低い場合には正しく文字認識で
きなかった文字が多く含まれていると考えられ、正しい
文字方向の検出ができない可能性が高い。このため画像
E1〜E4毎の平均確信度のいずれもが所定の閾値より
小さい場合には、対応する入力行画像からの方向検出は
行われない。
【0076】またこれらの平均確信度のうち、所定の閾
値を超えるものが複数個存在する場合にも、対応する入
力行画像からの方向検出は行われない。これらは図12
におけると同様である。
【0077】以上の説明では、例えば英語のように通常
の場合縦書きが存在しない文書画像を対象として本発明
の実施形態を説明したが、例えばユーザが手動で文書画
像補正装置の切り替えを行い、英語などの文書画像を対
象とする場合には、図4の8つのパターンのうち4つの
パターンのみを対象として回転/文字認識の処理を実行
し、縦書きも行われる言語、例えばかなと漢字によって
表現される日本語の文書画像などを対象とする場合に
は、図4の8つのパターンの全てを対象として回転/文
字認識処理を行うことも可能である。
【0078】最後に本発明の実施形態において、コンピ
ュータシステムとして文書画像補正装置を実現するため
のコンピュータへの、プログラムのローディングについ
て説明する。本発明のクレーム16,17や、図7,
8,11,12、および14のフローチャートに示され
るプログラムは、例えばコンピュータ21のRAM/ハ
ードディスクなどのメモリ25に格納され、そのプログ
ラムが本体24によって実行されることによって、本発
明の文書画像補正装置が実現される。
【0079】本発明の文書画像補正装置を実現するため
のプログラムは、プログラム提供者側から回線23を介
してコンピュータ21にロードされることによって、ま
た一般に流通している可搬型記憶媒体22に格納され
て、その記憶媒体22がコンピュータ21にロードされ
ることによって、実行されることも可能である。
【0080】メモリ25としては、例えばROM,磁気
ディスク、光ディスク、および光磁気ディスクなどを用
いることも可能であり、また可搬型記憶媒体22として
はメモリカード、フロッピィディスク、CD−ROM,
光ディスク、光磁気ディスクなど、任意のコンピュータ
読取り可能な記憶媒体を使用することができる。
【0081】本発明の異なる特徴は以下の通りである。 (1)本発明の文字画像抽出手段は、文字画像内の黒画
素率があらかじめ定められた範囲内にある文字画像を選
択して、抽出する。 (2)文字画像抽出手段は、文字画像の長辺と短辺の長
さの比率があらかじめ定められた範囲内にある文字画像
を選択して、抽出する。 (3)文字方向検出手段は、抽出された文字画像に対し
て画像変換手段によって異なる変換方法を用いて変換さ
れた複数の画像のうちで、文字認識手段による認識の確
信度が最大になる画像を正立文字画像として検出し、そ
の正立文字画像の入力画像に対する回転角度と鏡像反転
の有無を検出する。 (4)文字方向検出手段は、抽出された文字画像に対し
て画像変換手段によって異なる変換方法を用いて変換さ
れた複数の画像のうちで、文字認識手段による認識の確
信度があらかじめ定められた値を越えるものが1つのみ
である時、その1つのみの画像を正立画像として検出
し、その正立画像の入力画像に対する回転角度と鏡像反
転の有無を検出する。 (5)文字方向検出手段は、抽出された文字画像に対し
て画像変換手段によって異なる変換方法を用いて変換さ
れた複数の画像のうちで、文字認識手段による認識の確
信度が最大になる画像であって、かつその画像に対応す
る文字コードがあらかじめ定められた文字コードでない
時にその画像を正立画像として検出し、その正立画像の
入力画像に対する回転角度と鏡像反転の有無を検出す
る。 (6)文字方向検出手段は、行画像内の文字画像に対し
て画像変換手段によって異なる変換方法を用いて変換さ
れた複数種類の画像のうちで、文字認識手段による認識
の確信度の行画像内の文字画像に対する平均値が最大に
なる種類の画像を正立画像として検出し、その正立画像
の入力文書画像に対する回転角度と鏡像反転の有無を検
出する。 (7)文字方向検出手段は、行画像内の文字画像に対し
て画像変換手段によって異なる変換方法を用いて変換さ
れた複数種類の画像のうちで、文字認識手段による認識
の確信度の行画像内の文字画像に対する平均値があらか
じめ定められた値を越えるものが1種類のみである時、
その1種類のみの画像を正立画像として検出し、その正
立画像の入力文書画像に対する回転角度と鏡像反転の有
無を検出する。
【0082】
【発明の効果】以上詳細に説明したように、本発明によ
れば、例えば英語では行方向が横だけであることを利用
して、文字方向の検出方向を日本語の場合の半分に絞り
込み、文字画像の特徴から英語の文字画像を抽出し、文
字認識を利用して、文書画像の方向を高精度で検出する
ことができる。このため、ハンドヘルドスキャナを用い
て英語の文書を上下左右いずれの方向からスキャンして
も、文書画像の方向を正確に検出して、自動的に入力画
像を正立画像に補正することができ、文書画像補正装置
の操作性、およびユーザインタフェースの改善に寄与す
るところが大きい。
【図面の簡単な説明】
【図1】本発明の原理構成ブロック図である。
【図2】本発明の文書画像補正装置の全体構成を示すブ
ロック図である。
【図3】ハンドヘルドスキャナによる文書画像のスキャ
ン方向の説明図である。
【図4】図3のスキャン方向に対応して取り込まれる画
像を示す例である。
【図5】入力画像の行方向が縦の場合の文字画像の方向
検出を説明する図である。
【図6】入力画像の行方向が横の場合の文字画像の方向
検出を説明する図である。
【図7】英語文書画像の自動補正処理の全体フローチャ
ートである。
【図8】英語識別処理の詳細フローチャートである。
【図9】英語文字画像の文字間隔と文字幅とを説明する
図である。
【図10】英語と日本語の文書画像の文字間隔と文字
幅、および黒画素率の平均値を示す図である。
【図11】文字間隔の相違を利用して英語の識別処理を
行うためのフローチャートである。
【図12】一文字単位に文字画像を切出して自動補正を
行う文書画像補正処理の詳細フローチャートである。
【図13】文字認識結果としての文字コードと、認識の
確信度を説明する図である。
【図14】行画像を切出して正立画像に自動補正する文
書画像補正処理の詳細フローチャートである。
【図15】本発明の文書画像補正装置をコンピュータシ
ステムしとて実現するためのプログラムのコンピュータ
へのローディングを説明する図である。
【符号の説明】
1 行方向判定手段 2 文字画像抽出指弾 3 文字方向検出手段 4 文書画像補正手段 11 画像格納部 12 英語識別部 13 行方向検出部 14 文書方向検出部 15 画像補正部
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B029 AA01 BB02 BB15 CC20 CC21 CC28 EE04 EE08 5C076 AA24

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書画像を正立画像に補正す
    る文書画像補正装置であって、 入力文書画像の行方向が縦であるか、横であるかを判定
    する行方向判定手段と、 該入力文書画像から文字画像を抽出する文字画像抽出手
    段と、 該行方向判定手段の判定結果に対応して、該文字画像抽
    出手段によって抽出された文字画像を正立方向に補正す
    るための回転角度、および鏡像反転の必要性の有無を検
    出する文字方向検出手段と、 該文字方向検出手段の検出結果に基づいて、該入力文書
    画像を正立文書画像に補正する文書画像補正手段とを備
    えることを特徴とする文書画像補正装置。
  2. 【請求項2】 前記文字方向検出手段が、 前記行方向判定手段の判定結果に対応して、前記文字画
    像抽出手段によって抽出された文字画像を回転および/
    または鏡像反転した画像に変換する画像変換手段と、 該画像変換手段によって変換された文字画像を文字認識
    して、文字コードと認識の確信度とを出力する文字認識
    手段とを更に備え、 該文字認識手段の認識結果に基づいて、該抽出された文
    字画像を正立方向に補正するための回転角度と鏡像反転
    の必要性の有無を検出することを特徴とする請求項1記
    載の文書画像補正装置。
  3. 【請求項3】 前記文字画像補正装置であって、 前記入力された文書画像の言語を識別する言語識別手段
    を更に備え、 該言語識別手段の判別結果に対応して、該入力された文
    書画像を正立画像に補正することを特徴とする請求項1
    記載の文書画像補正装置。
  4. 【請求項4】 入力された文書画像を正立画像に補正す
    る文書画像補正装置であって、 入力文書画像の行方向が縦であるか、横であるかを判定
    する行方向判定手段と、 該入力文書画像から1行の全体、またはその一部分を行
    画像として抽出する行画像抽出手段と、 該行方向判定手段の判定結果に対応して、該行画像抽出
    手段によって抽出された行画像内の文字画像を正立方向
    に補正するための回転角度、および鏡像反転の必要性の
    有無を検出する文字方向検出手段と、 該文字方向検出手段の検出結果に基づいて、該入力文書
    画像を正立文書画像に補正する文書画像補正手段とを備
    えることを特徴とする文書画像補正装置。
  5. 【請求項5】 前記文字方向検出手段が、前記行方向判
    定手段の判定結果に対応して、前記行画像抽出手段によ
    って抽出された行画像内の文字画像を回転および/また
    は鏡像反転する画像変換手段と、 該画像変換手段によって変換された文書画像を文字認識
    して、該行画像内の各文字画像毎に対応する文字コード
    と認識の確信度とを出力する文字認識手段とを更に備
    え、 該文字認識手段の認識結果に基づき、前記行画像抽出手
    段によって抽出された行画像内の文字画像を正立方向に
    補正するための回転角度と鏡像反転の必要性の有無を検
    出することを特徴とする請求項4記載の文書画像補正装
    置。
  6. 【請求項6】 前記文字方向検出手段が、前記行画像内
    の文字画像に対して前記画像変換手段によって異なる変
    換方法を用いて変換された複数種類の画像のうちで、前
    記文字認識手段による認識の確信度の該行画像内の文字
    画像に対する平均値が最大になる種類の画像であって、
    かつ該行画像内の文字画像に対応する文字コードの中に
    あらかじめ定められた文字コードが所定の個数以上含ま
    れていない場合に、該種類の画像を正立画像として検出
    し、該正立画像の前記入力文書画像に対する回転角度と
    鏡像反転の有無を検出することを特徴とする請求項5記
    載の文書画像補正装置。
  7. 【請求項7】 入力された文書画像を正立画像に補正す
    る文書画像補正装置であって、 入力文書画像の行方向が縦であるか、横であるかを判定
    する行方向判定手段と、該入力文書画像から文字画像を
    抽出する文字画像抽出手段と、 該行方向判定手段の判定結果に対応して、該入力文書画
    像内の文字画像のパターンと、該文字画像を回転、およ
    び/または鏡像反転したパターンとを含む複数のパター
    ンのうちで一部のパターンを除外し、残ったパターンの
    みを用いて該文字画像抽出手段によって抽出された文字
    画像を正立方向に補正するための回転角度、および鏡像
    反転の必要性の有無を検出する文字方向検出手段と、 該文字方向検出手段の検出結果に基づいて、該入力文書
    画像を正立文書画像に補正する文書画像補正手段とを備
    えることを特徴とする文書画像補正装置。
  8. 【請求項8】 入力された文書画像を正立画像に補正す
    る文書画像補正方法であって、 入力文書画像の行方向が縦であるか、横であるかを判定
    し、 該判定結果に対応して、該入力文書画像から抽出した文
    字画像を正立方向に補正するための回転角度、および鏡
    像反転の必要性の有無を検出し、 該検出結果に基づいて、該入力文書画像を正立文書画像
    に補正することを特徴とする文書画像補正方法。
  9. 【請求項9】 入力された文書画像を正立画像に補正す
    る文書画像補正装置において使用される記憶媒体であっ
    て、 入力文書画像の行方向が縦あるか、横であるかを判定す
    るステップと、 該判定結果に対応して、該入力文書画像から抽出した文
    字画像を正立方向に補正するための回転角度、および鏡
    像反転の必要性の有無を検出するステップと、 該検出結果に基づいて、該入力文書画像を正立文書画像
    に補正するステップとを計算機に実行させるためのプロ
    グラムを格納した計算機読出し可能記憶媒体。
JP11216050A 1999-07-30 1999-07-30 文書画像補正装置および補正方法 Pending JP2001043310A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP11216050A JP2001043310A (ja) 1999-07-30 1999-07-30 文書画像補正装置および補正方法
US09/612,288 US7151860B1 (en) 1999-07-30 2000-07-07 Document image correcting device and a correcting method
EP00305796A EP1073001A3 (en) 1999-07-30 2000-07-10 Document image correcting device and correcting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11216050A JP2001043310A (ja) 1999-07-30 1999-07-30 文書画像補正装置および補正方法

Publications (1)

Publication Number Publication Date
JP2001043310A true JP2001043310A (ja) 2001-02-16

Family

ID=16682507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11216050A Pending JP2001043310A (ja) 1999-07-30 1999-07-30 文書画像補正装置および補正方法

Country Status (3)

Country Link
US (1) US7151860B1 (ja)
EP (1) EP1073001A3 (ja)
JP (1) JP2001043310A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009100232A (ja) * 2007-10-16 2009-05-07 Canon Inc 画像処理装置
US8203763B2 (en) 2008-02-15 2012-06-19 Kabushiki Kaisha Toshiba Image scanning apparatus and method for aligning a stack of scanned images using the stack orientation indicated by a user and an automatically determined image orientation
KR101272445B1 (ko) 2011-07-20 2013-06-07 후지쯔 가부시끼가이샤 이미지 블록 내 문자들의 방향을 식별하는 방법 및 장치

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6567628B1 (en) * 2001-11-07 2003-05-20 Hewlett-Packard Development Company L.P. Methods and apparatus to determine page orientation for post imaging finishing
US20110188759A1 (en) * 2003-06-26 2011-08-04 Irina Filimonova Method and System of Pre-Analysis and Automated Classification of Documents
RU2003108433A (ru) * 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
JP4350414B2 (ja) * 2003-04-30 2009-10-21 キヤノン株式会社 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
RU2635259C1 (ru) * 2016-06-22 2017-11-09 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения типа цифрового документа
KR100579044B1 (ko) * 2004-06-29 2006-05-12 삼성전자주식회사 회전된 영상을 압축하기 위한 장치, 시스템 및 방법
JP4607633B2 (ja) * 2005-03-17 2011-01-05 株式会社リコー 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
TWI332635B (en) * 2007-01-05 2010-11-01 Compal Electronics Inc Method for determing oriention of chinese words
US20080225340A1 (en) * 2007-03-14 2008-09-18 Ricoh Company, Limited Image processing apparatus, image processing method, and computer program product
US8630491B2 (en) * 2007-05-03 2014-01-14 Andrew Longacre, Jr. System and method to manipulate an image
US8144989B2 (en) * 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8208725B2 (en) * 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8200043B2 (en) * 2008-05-01 2012-06-12 Xerox Corporation Page orientation detection based on selective character recognition
US8023741B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8023770B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US20090310189A1 (en) 2008-06-11 2009-12-17 Gallagher Andrew C Determining the orientation of scanned hardcopy medium
JP4572248B2 (ja) 2008-06-23 2010-11-04 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、制御プログラム、記録媒体
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8103099B2 (en) * 2008-07-15 2012-01-24 Lockheed Martin Corporation Method and system for recognizing characters and character groups in electronically represented text
US9087337B2 (en) * 2008-10-03 2015-07-21 Google Inc. Displaying vertical content on small display devices
JP4625861B2 (ja) * 2008-11-17 2011-02-02 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、制御プログラム、および記録媒体
JP4927122B2 (ja) * 2009-06-15 2012-05-09 シャープ株式会社 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体
KR20120017670A (ko) * 2010-08-19 2012-02-29 삼성전자주식회사 화상 통신 방법 및 장치
KR20130020072A (ko) * 2011-08-18 2013-02-27 삼성전자주식회사 화상형성장치 및 제어 방법
CN103455806B (zh) * 2012-05-31 2017-06-13 富士通株式会社 文档处理装置、文档处理方法以及扫描仪
US9076058B2 (en) 2013-01-29 2015-07-07 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for determining orientation in a document image
KR20150044697A (ko) * 2013-10-17 2015-04-27 삼성전자주식회사 문서 보정 방법 및 그 전자 장치
CN103714327B (zh) * 2013-12-30 2017-02-01 上海合合信息科技发展有限公司 一种图像方向校正方法及***
RU2640322C2 (ru) 2014-01-30 2017-12-27 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы эффективного автоматического распознавания символов
JP6116531B2 (ja) * 2014-08-08 2017-04-19 京セラドキュメントソリューションズ株式会社 画像処理装置
US9589185B2 (en) 2014-12-10 2017-03-07 Abbyy Development Llc Symbol recognition using decision forests
US9552527B1 (en) 2015-08-27 2017-01-24 Lead Technologies, Inc. Apparatus, method, and computer-readable storage medium for determining a rotation angle of text
JP2017151493A (ja) * 2016-02-22 2017-08-31 富士ゼロックス株式会社 画像処理装置、画像読み取り装置及びプログラム
US10223607B2 (en) * 2017-04-14 2019-03-05 International Business Machines Corporation Physical and digital bookmark syncing
CN107194397A (zh) * 2017-05-09 2017-09-22 珠海赛纳打印科技股份有限公司 卡片放置方向的识别方法、装置以及图像处理装置
CN112818983A (zh) * 2021-01-22 2021-05-18 常州友志自动化科技有限公司 一种利用图片相识度判断字符倒置的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62224870A (ja) * 1986-03-26 1987-10-02 Hitachi Ltd 文書画像処理方法
JPS6432396A (en) * 1987-07-29 1989-02-02 Fujitsu Ltd Character recognizing device
JPH0728945A (ja) * 1993-02-19 1995-01-31 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0944593A (ja) * 1995-08-01 1997-02-14 Casio Comput Co Ltd 文字認識制御装置
JPH10191027A (ja) * 1996-12-26 1998-07-21 Canon Inc 画像処理装置及び該装置における画像処理方法
JPH11316798A (ja) * 1998-05-01 1999-11-16 Fujitsu Ltd 画像状態検出装置及びそれを利用した文書画像補正装置
JPH11338973A (ja) * 1998-05-22 1999-12-10 Fujitsu Ltd 文書画像補正装置および文書画像補正方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1252902A (en) * 1985-10-31 1989-04-18 David R. Pruett Method for rotating a binary image
JPS6432396U (ja) 1987-08-21 1989-02-28
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
JP2716980B2 (ja) * 1988-09-16 1998-02-18 株式会社日立製作所 画像情報装置の正常画像判定方法
JPH034386A (ja) 1989-05-31 1991-01-10 Toshiba Corp 光学的文字読取装置
US5381163A (en) * 1990-06-13 1995-01-10 Canon Kabushiki Kaisha Image processing apparatus
US5235651A (en) * 1991-08-06 1993-08-10 Caere Corporation Rotation of images for optical character recognition
JP3251959B2 (ja) 1991-10-17 2002-01-28 株式会社リコー 画像形成装置
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
JP3320759B2 (ja) * 1991-12-26 2002-09-03 株式会社東芝 文書画像傾き検出装置およびその方法
US5513304A (en) * 1993-04-19 1996-04-30 Xerox Corporation Method and apparatus for enhanced automatic determination of text line dependent parameters
US5311607A (en) * 1993-08-25 1994-05-10 Crosby Peter A Facsimile machine for printing documents all with corresponding edges aligned but without requiring scanning
US5506908A (en) * 1994-06-30 1996-04-09 At&T Corp. Directional microphone system
JP3534128B2 (ja) * 1995-01-24 2004-06-07 オムロン株式会社 書類の上下方向検知方法及び装置
JP3727971B2 (ja) 1995-02-01 2005-12-21 キヤノン株式会社 文書処理装置、及び文書処理方法
JPH08324902A (ja) 1995-06-07 1996-12-10 Mitsubishi Denki Bill Techno Service Kk かごの着床位置補正装置
US6137905A (en) * 1995-08-31 2000-10-24 Canon Kabushiki Kaisha System for discriminating document orientation
JP3728040B2 (ja) * 1996-12-27 2005-12-21 キヤノン株式会社 画像形成装置及び方法
JP3684036B2 (ja) * 1997-07-03 2005-08-17 キヤノン株式会社 画像処理装置及び画像処理方法
JPH1125213A (ja) 1997-07-07 1999-01-29 Oki Electric Ind Co Ltd 行方向判定方法および行方向判定装置
JPH1125217A (ja) 1997-07-09 1999-01-29 Oki Electric Ind Co Ltd 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置
US6064767A (en) * 1998-01-16 2000-05-16 Regents Of The University Of California Automatic language identification by stroke geometry analysis
US6151423A (en) * 1998-03-04 2000-11-21 Canon Kabushiki Kaisha Character recognition with document orientation determination
US6804414B1 (en) * 1998-05-01 2004-10-12 Fujitsu Limited Image status detecting apparatus and document image correcting apparatus

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62224870A (ja) * 1986-03-26 1987-10-02 Hitachi Ltd 文書画像処理方法
JPS6432396A (en) * 1987-07-29 1989-02-02 Fujitsu Ltd Character recognizing device
JPH0728945A (ja) * 1993-02-19 1995-01-31 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0944593A (ja) * 1995-08-01 1997-02-14 Casio Comput Co Ltd 文字認識制御装置
JPH10191027A (ja) * 1996-12-26 1998-07-21 Canon Inc 画像処理装置及び該装置における画像処理方法
JPH11316798A (ja) * 1998-05-01 1999-11-16 Fujitsu Ltd 画像状態検出装置及びそれを利用した文書画像補正装置
JPH11338973A (ja) * 1998-05-22 1999-12-10 Fujitsu Ltd 文書画像補正装置および文書画像補正方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009100232A (ja) * 2007-10-16 2009-05-07 Canon Inc 画像処理装置
US8203763B2 (en) 2008-02-15 2012-06-19 Kabushiki Kaisha Toshiba Image scanning apparatus and method for aligning a stack of scanned images using the stack orientation indicated by a user and an automatically determined image orientation
KR101272445B1 (ko) 2011-07-20 2013-06-07 후지쯔 가부시끼가이샤 이미지 블록 내 문자들의 방향을 식별하는 방법 및 장치
US8737743B2 (en) 2011-07-20 2014-05-27 Fujitsu Limited Method of and device for identifying direction of characters in image block

Also Published As

Publication number Publication date
US7151860B1 (en) 2006-12-19
EP1073001A2 (en) 2001-01-31
EP1073001A3 (en) 2006-05-03

Similar Documents

Publication Publication Date Title
JP2001043310A (ja) 文書画像補正装置および補正方法
US6804414B1 (en) Image status detecting apparatus and document image correcting apparatus
KR100247970B1 (ko) 문서 영상의 방향 교정방법
EP1598770B1 (en) Low resolution optical character recognition for camera acquired documents
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
JP4553241B2 (ja) 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
US5081690A (en) Row-by-row segmentation and thresholding for optical character recognition
RU2454718C2 (ru) Способ анализа изображения, в частности, для мобильного устройства
JP2010061471A (ja) 文字認識装置およびプログラム
JP2644041B2 (ja) 文字認識装置
JPH11338973A (ja) 文書画像補正装置および文書画像補正方法
JPH0291789A (ja) 文字認識方法
JP2674475B2 (ja) 文字読取装置
KR20230062240A (ko) 문서 인식 방법 및 장치
JPH04276888A (ja) 文字読取装置
JPH1021336A (ja) 文字列種別判定方法及び装置
JPH0119193B2 (ja)
JP2002042138A (ja) 画像照合装置、画像照合方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11161739A (ja) 文字認識装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JPH03218567A (ja) 電子辞書
JP2646642B2 (ja) 画像の内外領域判定システム
KR100200802B1 (ko) 개선된 문자 분리 기능을 갖는 문자인식장치 및 그 방법
JPS63143684A (ja) 文字認識装置における認識結果修正方法
JP2001067480A (ja) 画像検出装置、画像検出方法および記録媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040330