JP4694613B2 - 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 - Google Patents
原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 Download PDFInfo
- Publication number
- JP4694613B2 JP4694613B2 JP2008324396A JP2008324396A JP4694613B2 JP 4694613 B2 JP4694613 B2 JP 4694613B2 JP 2008324396 A JP2008324396 A JP 2008324396A JP 2008324396 A JP2008324396 A JP 2008324396A JP 4694613 B2 JP4694613 B2 JP 4694613B2
- Authority
- JP
- Japan
- Prior art keywords
- region
- document
- image
- stroke
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
A.L.Spitzによる「Determination of the Script and Language Content of Document Image」(IEEE Trans PAMI,19(3),235〜245頁,1997年3月)
同様に、原稿の向きが画像データの天地方向に対して逆である場合(つまり、原稿の上下方向が画像データの上下方向に対して180°回転している場合)、文字の右半分にはストロークが確認されず左半分に確認される。これは、原稿の天地方向が逆の状態における文字の左半分および右半分は、原稿の向きが正しい場合の文字の右半分および左半分に該当するからである。
まず、ステップS101では、二値化処理部31が、画像読取装置20が原稿を読み取って取得した原稿画像データ二値画像に変換する。この二値画像は多数の画素データからなり、各画素データは2つの値のうちのいずれか1つを有している。原稿の画像データが2以上の色成分を有する場合、この画像データはグレースケールに変換してから二値化処理を行うようにすればよい。また、グレースケール画像を平滑化フィルタによって平滑化してから二値化処理を行ってもよい。最終的には、グレースケール画像における各画素データは、例えば閾値との比較結果に基づいて二値データに変換される。
20 画像読取装置
30 原稿方向判定部
31 二値化処理部
32 文字領域検出部
33 ストローク検出部
34 ストローク位置判定部
35 原稿方向判定部
36 記憶部
37 原稿方向補正部
38 画像データ出力処理装置
CL 左カウンタ
CR 右カウンタ
CT 上カウンタ
CB 下カウンタ
Claims (13)
- ハングル文字を含む原稿から読み取った原稿画像の画像データに基づいて、上記画像データの基準方向に対する上記原稿画像の90度単位の向きである原稿方向を判定する原稿方向判定装置であって、
上記画像データの各画素を黒画素または白画素に分類した二値化画像データを生成する二値化処理部と、
上記二値化画像データに基づいて黒画素が連続する部分である連結部分を抽出するとともに、この連結部分を含む矩形領域を1つの文字に対応する文字領域として検出する文字領域検出部と、
上記矩形領域内において当該矩形領域の幅方向または高さ方向に所定値以上の長さで延伸する上記連結部分からなる画像であるストローク画像を検出するストローク検出部と、
上記ストローク検出部の検出したストローク画像が当該ストローク画像に対応する上記矩形領域における左半分の領域である第1領域、右半分の領域である第2領域、上半分の領域である第3領域、および下半分の領域である第4領域のうちのいずれの領域に存在するかを上記矩形領域毎に判定し、上記第1〜第4領域毎にストローク画像が存在すると判定された回数を計数するストローク位置判定部と、
上記第1〜第4領域のそれぞれに対する上記回数の計数値の比較結果に基づいて上記原稿方向を判定する原稿方向判定部とを備えていることを特徴とする原稿方向判定装置。 - 上記文字領域検出部は、上記矩形領域を、予め定められた寸法、形状、およびアスペクト比に設定することを特徴とする請求項1に記載の原稿方向判定装置。
- 上記文字領域検出部は、上記連結部分同士の間隔に基づいて上記原稿に含まれる文章における各行、および各行内における文字同士の間隔または各文字の幅を検出し、この検出結果に基づいて各文字をそれぞれ囲むように上記矩形領域を設定することを特徴とする請求項1に記載の原稿方向判定装置。
- 上記原稿方向判定部は、
上記第1領域に対する上記回数の計数値をCL、上記第2領域に対する上記回数の計数値をCR、上記第3領域に対する上記回数の計数値をCT、上記第4領域に対する上記回数の計数値をCBとしたときに、CR>CLであり、かつABS(CR−CL)>ABS(CB−CT)である場合に、上記画像データの基準方向に対する上記原稿画像の方向を0度と判定することを特徴とする請求項1から3のいずれか1項に記載の原稿方向判定装置。 - 上記原稿方向判定部は、
上記第1領域に対する上記回数の計数値をCL、上記第2領域に対する上記回数の計数値をCR、上記第3領域に対する上記回数の計数値をCT、上記第4領域に対する上記回数の計数値をCBとしたときに、CR≦CLであり、かつABS(CR−CL)>ABS(CB−CT)である場合に、上記画像データの基準方向に対する上記原稿画像の方向を180度と判定することを特徴とする請求項1から4のいずれか1項に記載の原稿方向判定装置。 - 上記原稿方向判定部は、
上記第1領域に対する上記回数の計数値をCL、上記第2領域に対する上記回数の計数値をCR、上記第3領域に対する上記回数の計数値をCT、上記第4領域に対する上記回数の計数値をCBとしたときに、CB>CTであり、かつABS(CR−CL)≦ABS(CB−CT)である場合に、上記画像データの基準方向に対する上記原稿画像の方向を270度と判定することを特徴とする請求項1から5のいずれか1項に記載の原稿方向判定装置。 - 上記原稿方向判定部は、
上記第1領域に対する上記回数の計数値をCL、上記第2領域に対する上記回数の計数値をCR、上記第3領域に対する上記回数の計数値をCT、上記第4領域に対する上記回数の計数値をCBとしたときに、CB≦CTであり、かつABS(CR−CL)≦ABS(CB−CT)である場合に、上記画像データの基準方向に対する上記原稿画像の方向を90度と判定することを特徴とする請求項1から5のいずれか1項に記載の原稿方向判定装置。 - 上記文字領域検出部は、上記連結部分の一部が上記矩形領域の外側にはみ出す場合に、当該矩形領域を上記ストローク検出部による上記ストローク画像の検出処理から除外することを特徴とする請求項2に記載の原稿方向判定装置。
- 上記ストローク位置判定部は、
上記各矩形領域における各行および各列のうち、黒画素の数が所定数以上である行または列を上記ストローク画像が存在する位置として検出することを特徴とする請求項1から8のいずれか1項に記載の原稿方向判定装置。 - 上記ストローク位置判定部は、
上記各矩形領域の画像における各行の黒画素の数を示す水平投影ヒストグラムと、各列の黒画素の数を示す垂直投影ヒストグラムとを生成し、これら両ヒストグラムに基づいて上記ストローク画像が存在する位置を検出することを特徴とする請求項9に記載の原稿方向判定装置。 - ハングル文字を含む原稿から読み取った原稿画像の画像データに基づいて、上記画像データの基準方向に対する上記原稿画像の90度単位の向きである原稿方向を判定する原稿方向判定方法であって、
上記画像データの各画素を黒画素または白画素に分類した二値化画像データを生成する二値化工程と、
上記二値化画像データに基づいて黒画素が連続する部分である連結部分を抽出するとともに、この連結部分を含む矩形領域を1つの文字に対応する文字領域として検出する文字領域検出工程と、
上記矩形領域内において当該矩形領域の幅方向または高さ方向に所定値以上の長さで延伸する上記連結部分からなる画像であるストローク画像を検出するストローク検出工程と、
上記ストローク検出工程で検出したストローク画像が当該ストローク画像に対応する上記矩形領域における左半分の領域である第1領域、右半分の領域である第2領域、上半分の領域である第3領域、および下半分の領域である第4領域のうちのいずれの領域に存在するかを上記矩形領域毎に判定し、上記第1〜第4領域毎にストローク画像が存在すると判定された回数を計数するストローク位置判定工程と、
上記第1〜第4領域のそれぞれに対する上記回数の計数値の比較結果に基づいて上記原稿方向を判定する原稿方向判定工程とを含むことを特徴とする原稿方向判定方法。 - 請求項1から10のいずれか1項に記載の原稿方向判定装置を動作させるプログラムであって、コンピュータを上記各部として機能させるためのプログラム。
- 請求項12に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/007,524 US8027539B2 (en) | 2008-01-11 | 2008-01-11 | Method and apparatus for determining an orientation of a document including Korean characters |
US12/007,524 | 2008-01-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009169948A JP2009169948A (ja) | 2009-07-30 |
JP4694613B2 true JP4694613B2 (ja) | 2011-06-08 |
Family
ID=40850680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008324396A Expired - Fee Related JP4694613B2 (ja) | 2008-01-11 | 2008-12-19 | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8027539B2 (ja) |
JP (1) | JP4694613B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9547799B2 (en) * | 2008-07-17 | 2017-01-17 | Sharp Laboratories Of America, Inc. | Methods and systems for content-boundary detection |
US9087337B2 (en) * | 2008-10-03 | 2015-07-21 | Google Inc. | Displaying vertical content on small display devices |
US8873864B2 (en) * | 2009-12-16 | 2014-10-28 | Sharp Laboratories Of America, Inc. | Methods and systems for automatic content-boundary detection |
US8218875B2 (en) | 2010-06-12 | 2012-07-10 | Hussein Khalid Al-Omari | Method and system for preprocessing an image for optical character recognition |
CN101996390B (zh) * | 2010-10-20 | 2013-11-06 | 中兴通讯股份有限公司 | 一种图像拷贝的方法和装置 |
JP6161484B2 (ja) * | 2013-09-19 | 2017-07-12 | 株式会社Pfu | 画像処理装置、画像処理方法及びコンピュータプログラム |
RU2613847C2 (ru) | 2013-12-20 | 2017-03-21 | ООО "Аби Девелопмент" | Выявление китайской, японской и корейской письменности |
RU2648638C2 (ru) | 2014-01-30 | 2018-03-26 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы эффективного автоматического распознавания символов, использующие множество кластеров эталонов символов |
RU2640322C2 (ru) | 2014-01-30 | 2017-12-27 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы эффективного автоматического распознавания символов |
US9589185B2 (en) | 2014-12-10 | 2017-03-07 | Abbyy Development Llc | Symbol recognition using decision forests |
US9552527B1 (en) | 2015-08-27 | 2017-01-24 | Lead Technologies, Inc. | Apparatus, method, and computer-readable storage medium for determining a rotation angle of text |
US10956730B2 (en) * | 2019-02-15 | 2021-03-23 | Wipro Limited | Method and system for identifying bold text in a digital document |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11338974A (ja) * | 1998-05-28 | 1999-12-10 | Canon Inc | 文書処理方法及び装置、記憶媒体 |
JP2006260274A (ja) * | 2005-03-17 | 2006-09-28 | Ricoh Co Ltd | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5592572A (en) * | 1993-11-05 | 1997-01-07 | The United States Of America As Represented By The Department Of Health And Human Services | Automated portrait/landscape mode detection on a binary image |
-
2008
- 2008-01-11 US US12/007,524 patent/US8027539B2/en not_active Expired - Fee Related
- 2008-12-19 JP JP2008324396A patent/JP4694613B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11338974A (ja) * | 1998-05-28 | 1999-12-10 | Canon Inc | 文書処理方法及び装置、記憶媒体 |
JP2006260274A (ja) * | 2005-03-17 | 2006-09-28 | Ricoh Co Ltd | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 |
Also Published As
Publication number | Publication date |
---|---|
US20090180694A1 (en) | 2009-07-16 |
JP2009169948A (ja) | 2009-07-30 |
US8027539B2 (en) | 2011-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4694613B2 (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
CN110942074B (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
TWI606406B (zh) | 從成像檔案擷取正文之方法、設備以及有形電腦可讀儲存媒體 | |
JP4758461B2 (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
JP2017516204A (ja) | 美的要素を備える機械読み取り可能な光学式コードの生成および復号化 | |
RU2621601C1 (ru) | Устранение искривлений изображения документа | |
WO2014160433A2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
JP4738469B2 (ja) | 画像処理装置、画像処理プログラムおよび画像処理方法 | |
JP2008217347A (ja) | ナンバープレート認識装置、その制御方法、コンピュータプログラム | |
CN105303156B (zh) | 字符检测装置、方法及程序 | |
JP2009003937A (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
JP6000992B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
JP2010218420A (ja) | 文字認識装置、画像読取装置、およびプログラム | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
US9224065B2 (en) | Character-recognition method and character-recognition device and program using said method | |
JP2016162420A (ja) | 注目領域検出装置、注目領域検出方法及びプログラム | |
JP5906788B2 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
JP5347793B2 (ja) | 文字認識装置、文字認識プログラムおよび文字認識方法 | |
KR20160053544A (ko) | 후보 문자의 추출 방법 | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP2004086436A (ja) | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 | |
Tian et al. | Self-verifiable paper documents and automatic content verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110201 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110223 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140304 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4694613 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |