JP3711186B2 - サイズ識別方法および装置 - Google Patents

サイズ識別方法および装置 Download PDF

Info

Publication number
JP3711186B2
JP3711186B2 JP06038097A JP6038097A JP3711186B2 JP 3711186 B2 JP3711186 B2 JP 3711186B2 JP 06038097 A JP06038097 A JP 06038097A JP 6038097 A JP6038097 A JP 6038097A JP 3711186 B2 JP3711186 B2 JP 3711186B2
Authority
JP
Japan
Prior art keywords
line
size
character
rectangle
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06038097A
Other languages
English (en)
Other versions
JPH10254994A (ja
Inventor
悌 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP06038097A priority Critical patent/JP3711186B2/ja
Publication of JPH10254994A publication Critical patent/JPH10254994A/ja
Application granted granted Critical
Publication of JP3711186B2 publication Critical patent/JP3711186B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識することなく、行毎にフォントサイズを精度よく識別するサイズ識別方法および装置に関する。
【0002】
【従来の技術】
高度化する文書画像処理においては、文字画像の認識処理によって単に文字コードを求めるにとどまらず、そのサイズやフォント等の属性を求めることが要求される。ところで、従来の文字認識装置は入力画像中の文字パターンを認識し、その文字コードを出力するもので、文字属性の一つであるサイズを識別してその識別結果を出力することが困難であった。
【0003】
そこで、文字サイズを識別する方法として、例えば特開平4−306783号公報に記載された第1の技術、特開平6−176188号公報に記載された第2の技術が提案されている。
【0004】
【発明が解決しようとする課題】
上記した第1の技術は、外接矩形の幅と高さを用いて文字サイズを識別する手法を採っているが、これは一文字毎に文字サイズを求める方法であるので、一文字毎に、その大きさに相当のばらつきが出てしまうという問題点があった。また、文書画像を画像入力装置から入力したときの解像度情報を用いていないので、文書中の相対的なサイズしか検出されず、絶対的なサイズ(つまり、ポイント数や級数など)が得られないという問題点もあった。
【0005】
また、上記した第2の技術も基本的には一文字毎に文字サイズを求める方法であるが、この方法では文字毎に基準となるサイズのテーブルを保持し、そのテーブルを参照することによって文字サイズを算出している。しかし、この方法では文字毎のテーブルを作成するのに多大な労力を要すると共に、文字認識処理を必要とし、さらに、プログラムサイズが増大するという問題点があった。
【0006】
このように、従来の方法では、サイズ識別結果が一行内で一文字毎にばらつきが生じると共に、相対的なサイズしか得られず、しかもプログラムサイズが増大してしまう。
【0007】
本発明は上記した事情を考慮してなされたもので、
本発明の目的は、文字認識することなくフォントサイズの識別を行うことにより、プログラムサイズが小さく、かつ高速、高精度にフォントサイズを識別するもので、行毎に行に属する全文字の外接矩形の高さの最大値または行に属する全文字の外接矩形に対する回帰直線から得られる情報と、画像入力時の解像度情報を基に行毎にフォントサイズを識別するサイズ識別方法および装置を提供することにある。
【0008】
【課題を解決するための手段】
前記目的を達成するために、請求項1記載の発明では、入力された文書画像から行毎に、行に属する全矩形の左の辺(横書きの場合)または上の辺(縦書きの場合)の中点に対して回帰直線を求め、該回帰直線を少なくとも一つの矩形と交わる範囲において上下または左右に最大限に平行移動し、上または右に平行移動した第1の直線と下または左に平行移動した第2の直線との距離を求め、前記文書画像を入力したときの解像度と前記距離とを基に行のフォントサイズを算出することを特徴としている。
【0009】
請求項記載の発明では、前記回帰直線を求める矩形は、行に属する全文字の外接矩形の高さの平均値に所定の定数を乗じた値よりも大きい高さで、かつ、全文字の外接矩形の幅の平均値に所定の定数を乗じた値よりも大きい幅の矩形であることを特徴としている。
【0010】
請求項3記載の発明では、入力された文書画像から行毎に、行に属する全矩形の左の辺(横書きの場合)または上の辺(縦書きの場合)の中点に対して回帰直線を求める手段と、該回帰直線を少なくとも一つの矩形と交わる範囲において上下または左右に最大限に平行移動し、上または右に平行移動した第1の直線と下または左に平行移動した第2の直線との距離を求める手段と、前記文書画像を入力したときの解像度と前記距離とを基に行のフォントサイズを算出する手段を備えたことを特徴としている。
【0011】
【発明の実施の形態】
以下、本発明の一実施例を図面を用いて具体的に説明する。
〈実施例1〉
図1は、本発明の実施例1の構成を示す。実施例1のサイズ識別装置は、文書を2値画像として読む込む画像入力部1と、画像データなどを蓄えるメモリ2と、文書画像から文字画像のみを行単位に抽出する行切り出し部3と、行切り出し部3で抽出された行の画像から文字画像のみを抽出し、その外接矩形を求める文字切り出し部4と、サイズ識別をするサイズ識別部5と、全体を制御する制御部6と、識別結果を出力する結果出力部7から構成されている。
【0012】
また、サイズ識別部5は、行に属する全矩形の幅、高さを求める矩形幅、高さ抽出部51と、矩形の幅、高さの平均を算出する平均算出部52と、矩形の高さの最大値と文書画像の解像度からサイズを算出するサイズ算出部53から構成されている。
【0013】
図2は、実施例1の処理フローチャートを示す。図2を参照しながら、実施例1の動作を説明する。
【0014】
処理ステップS101では、画像入力部1により、識別対象である原稿を画像情報として本装置内のメモリ2に取り込む。処理ステップS102では、行切り出し部3は、文書画像から文字画像のみを行単位に抽出する行切り出し処理を行う。処理ステップS103では、文字切り出し部4は、行切り出し部3で抽出された行の画像から文字画像のみを抽出し、その外接矩形を求める文字切り出し処理を行う。
【0015】
処理ステップS104では、メモリ2内の行カウンタiを1にセットする。処理ステップS105では、サイズ識別部5の矩形幅、高さ抽出部51は、行に属する矩形の幅、高さを抽出し、平均算出部52は、行に属する全矩形の高さの平均(meanH)を求める。処理ステップSl06では、平均算出部52は、行に属する全矩形の幅の平均(meanW)を求める。
【0016】
処理ステップS107では、メモリ2内の矩形の高さの最大値Hを0に初期化する。処理ステップS108では、メモリ2内の文字カウンタjを0にリセツトする。
【0017】
処理ステップSl09では、サイズ算出部53は、矩形の幅、高さが以下の条件を全て満たすか否かを判定し、満たせば処理ステップS110に進み、満たさなければ処理ステップS111に進む。
【0018】
h>meanH*const
w>meanW*const
h>H
ここで、constは予め決めた値(0<const<1)であり、例えば0.5である。
【0019】
処理ステップS110では、矩形の高さの最大値Hをhに更新する。処理ステップS111では、文字カウンタjを1だけインクリメントする。処理ステップS112では、注目行に他に文字矩形があるか否かを判定し、ある場合には処理ステップS109に進み、ない場合には処理ステップS113に進む。
【0020】
処理ステップS113では、サイズ算出部53は、Hと文書画像の解像度から以下の式によって文字サイズを算出する。すなわち、ポイント数と実際の大きさ(インチ)は、
1[point]=1[inch]/72
の関係があるので、求めるポイント数は
Sline[point]=H[pixel]×72/r[dpi]
となる。ここで、
Sline:各行のポイント数
H:外接矩形の高さの最大値
r:解像度[dpi]
処理ステップS114では、未処理の行があるか否かを判定する。未処理の行があれば処理ステップS105に進み、なければ処理を終了する。
【0021】
〈実施例2〉
図3は、本発明の実施例2の構成を示す。実施例2のサイズ識別装置は、実施例1と同様に、文書を2値画像として読む込む画像入力部21と、画像データなどを蓄えるメモリ22と、文書画像から文字画像のみを行単位に抽出する行切り出し部23と、行切り出し部23で抽出された行の画像から文字画像のみを抽出し、その外接矩形を求める文字切り出し部24と、サイズ識別をするサイズ識別部25と、全体を制御する制御部26と、識別結果を出力する結果出力部27から構成されている。
【0022】
実施例2のサイズ識別部25は、行に属する全矩形の高さの平均、全矩形の幅の平均を算出する平均算出部251と、行内の文字矩形から回帰直線を求める回帰直線算出部252と、回帰直線を基に行の高さを算出する行高さ算出部253と、行の高さと文書画像の解像度からサイズを算出するサイズ算出部254から構成されている。
【0023】
図5は、実施例2の処理フローチャートを示す。図5を用いて実施例2の処理動作を説明する。
【0024】
処理ステップS201では、画像入力部21により、識別対象である原稿を画像情報として本装置内のメモリ22に取り込む。処理ステップS202では、行切り出し部23は、文書画像から文字画像のみを行単位に抽出する行切り出し処理を行う。
【0025】
処理ステップS203では、文字切り出し部24は、行切り出し部23で抽出された行の画像から文字画像のみを抽出し、その外接矩形を求める文字切り出し処理を行う。処理ステップS204では、メモリ22内の行カウンタiを0にリセットする。
【0026】
処理ステップS205では、サイズ識別部25内の平均算出部251は、行に属する全矩形の高さの平均(meanH)を求める。処理ステップS206では、平均算出部251は行に属する全矩形の幅の平均(meanW)を求める。処理ステツプS207では、メモリ22内の文字カウンタjを0にリセツトする。
【0027】
処理ステップS208では、回帰直線算出部252は、矩形の幅、高さが以下の条件を全て満たすか否かを判定し、満たせば処理ステップS209に進み、満たさなければ処理ステップS210に進む。
【0028】
h>meanH*const
w>meanW*const
ここで、constは予め決めた値(0<const<1)であり、例えば0.5である。
【0029】
処理ステップS209では、上記した条件を満たす矩形に「適フラグ」を立てる。処理ステップS210では、メモリ22内の文字カウンタjを1だけインクリメントする。処理ステップS211では、注目行に他に文字矩形があるか否かを判定し、ある場合にはステップS208に進み、ない場合にはステップS212に進む。
【0030】
処理ステップS212では、回帰直線算出部252は、「適フラグ」の立っている全矩形に対して回帰直線を求める。処理ステップS213では、行高さ算出部253は、回帰直線を少なくとも一つの適フラグの立っている矩形と交わる範囲で最も外側まで平行移動することによって得られる2直線を求め、2直線の距離を求める。この距離が行の高さHaとなる。
【0031】
図4(a)、(b)は、横書きの場合の行の高さを説明する図である。すなわち、ステップS208の条件を満たす全ての外接矩形について((a)は、全ての矩形が条件を満たす場合、(b)では条件を満たさない矩形を除く場合)、矩形の左の辺の中点に対して回帰直線を求める。この回帰直線を上下方向に、最も外側の矩形と交差するまで平行移動させ、交差したときの2直線間の距離を行の高さとする。なお、縦書きの場合は、矩形の上の辺の中点に対して回帰直線を求め、この回帰直線を左右方向に平行移動させる。
【0032】
処理ステップS214では、サイズ算出部254は、行の高さHaと文書画像の解像度から以下の式によって文字サイズを算出する。すなわち、ポイント数と実際の大きさ(インチ)は、
1[point]=1[inch]/72
の関係があるので、求めるポイント数は
Sline[point]=Ha[pixel]×72/r[dpi]
となる。ここで、
Sline:各行のポイント数
Ha:行の高さ
r:解像度
処理ステップS215では、未処理の行があるか否かを判定する。未処理の行があれば処理ステップS205に進み、なければ処理を終了する。
【0033】
〈実施例3〉
本発明は上記したものに限定されず、ソフトウェアによっても実現することができる。本発明をソフトウェアによって実現する場合には、図6に示すように、CPU、ROM、RAM、表示装置、ハードディスク、キーボード、CD−ROMドライブ、スキャナなどからなる汎用の処理装置を用意し、CD−ROMなどのコンピュータ記憶媒体には、本発明のサイズ識別機能を実現するプログラムが記録されている。また、識別対象となる原稿はスキャナから取り込む。
【0034】
【発明の効果】
以上、説明したように、本発明によれば、文書画像の文字のサイズを精度良く識別することが可能となり、文書画像を再現するときに特に有効である。また、文字認識処理や辞書を必要としないので、高速かつサイズの小さいプログラムによって装置を構成することができる。
【図面の簡単な説明】
【図1】 本発明の実施例1の構成を示す。
【図2】 実施例1の処理フローチャートを示す。
【図3】 本発明の実施例2の構成を示す。
【図4】 (a)、(b)は、横書きの場合の行の高さを説明する図である。
【図5】 実施例2の処理フローチャートを示す。
【図6】 本発明の実施例3の構成を示す。
【符号の説明】
1 画像入力部
2 メモリ
3 行切り出し部
4 文字切り出し部
5 サイズ識別部
6 制御部
7 結果出力部

Claims (3)

  1. 入力された文書画像から行毎に、行に属する全矩形の左の辺(横書きの場合)または上の辺(縦書きの場合)の中点に対して回帰直線を求め、該回帰直線を少なくとも一つの矩形と交わる範囲において上下または左右に最大限に平行移動し、上または右に平行移動した第1の直線と下または左に平行移動した第2の直線との距離を求め、前記文書画像を入力したときの解像度と前記距離とを基に行のフォントサイズを算出することを特徴とするサイズ識別方法。
  2. 前記回帰直線を求める矩形は、行に属する全文字の外接矩形の高さの平均値に所定の定数を乗じた値よりも大きい高さで、かつ、全文字の外接矩形の幅の平均値に所定の定数を乗じた値よりも大きい幅の矩形であることを特徴とする請求項記載のサイズ識別方法。
  3. 入力された文書画像から行毎に、行に属する全矩形の左の辺(横書きの場合)または上の辺(縦書きの場合)の中点に対して回帰直線を求める手段と、該回帰直線を少なくとも一つの矩形と交わる範囲において上下または左右に最大限に平行移動し、上または右に平行移動した第1の直線と下または左に平行移動した第2の直線との距離を求める手段と、前記文書画像を入力したときの解像度と前記距離とを基に行のフォントサイズを算出する手段を備えたことを特徴とするサイズ識別装置。
JP06038097A 1997-03-14 1997-03-14 サイズ識別方法および装置 Expired - Fee Related JP3711186B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06038097A JP3711186B2 (ja) 1997-03-14 1997-03-14 サイズ識別方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06038097A JP3711186B2 (ja) 1997-03-14 1997-03-14 サイズ識別方法および装置

Publications (2)

Publication Number Publication Date
JPH10254994A JPH10254994A (ja) 1998-09-25
JP3711186B2 true JP3711186B2 (ja) 2005-10-26

Family

ID=13140490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06038097A Expired - Fee Related JP3711186B2 (ja) 1997-03-14 1997-03-14 サイズ識別方法および装置

Country Status (1)

Country Link
JP (1) JP3711186B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4162633B2 (ja) * 2004-06-30 2008-10-08 株式会社リコー 画像歪み補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体
JP6387761B2 (ja) * 2014-09-19 2018-09-12 コニカミノルタ株式会社 画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム

Also Published As

Publication number Publication date
JPH10254994A (ja) 1998-09-25

Similar Documents

Publication Publication Date Title
US6917706B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US7054485B2 (en) Image processing method, apparatus and system
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
JP4011646B2 (ja) 行検出方法および文字認識装置
JP4049560B2 (ja) 網点除去方法及びシステム
JP3711186B2 (ja) サイズ識別方法および装置
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP2957729B2 (ja) 行方向判定装置
JP3019897B2 (ja) 行切出し方法
JP3077929B2 (ja) 文字切出し方式
JP4738645B2 (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JP4204185B2 (ja) 文字認識装置、文字認識方法、および記録媒体
JP2982221B2 (ja) 文字読み取り装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP2000040122A (ja) 文字切り出し方法
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JP3193573B2 (ja) かぎかっこ付文字認識装置
JP3411795B2 (ja) 文字認識装置
JP3127413B2 (ja) 文字認識装置
JPH03217993A (ja) 文字サイズ認識装置
JPH10162104A (ja) 文字認識装置
JP2974396B2 (ja) 画像処理方法及び装置
JPH01124082A (ja) 文字認識装置
JPH05174178A (ja) 文字認識方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050812

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080819

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090819

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090819

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100819

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100819

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110819

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110819

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120819

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120819

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130819

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees