JP2843638B2 - 文字画像整列方法 - Google Patents

文字画像整列方法

Info

Publication number
JP2843638B2
JP2843638B2 JP7823190A JP7823190A JP2843638B2 JP 2843638 B2 JP2843638 B2 JP 2843638B2 JP 7823190 A JP7823190 A JP 7823190A JP 7823190 A JP7823190 A JP 7823190A JP 2843638 B2 JP2843638 B2 JP 2843638B2
Authority
JP
Japan
Prior art keywords
character image
character
output
line
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7823190A
Other languages
English (en)
Other versions
JPH03278186A (ja
Inventor
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP7823190A priority Critical patent/JP2843638B2/ja
Publication of JPH03278186A publication Critical patent/JPH03278186A/ja
Application granted granted Critical
Publication of JP2843638B2 publication Critical patent/JP2843638B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字画像整列方法に係り、詳しくは、原稿上
の文字画像をスキャナにより読み取り、各文字画像を整
列して出力する装置において、各々の文字画像の出力位
置を可変とする方法に関する。
〔従来の技術〕
一般に画像処理では、スキャナにより読み込んだ文字
画像に対して、その傾きや大きさ等を整えて出力する方
法がとられる。この場合、従来はスキャナによって読み
取った文字画像の最下座標をベースラインに揃えるか、
あるいは中心線に揃えるかしていた。第6図(a)は、
第2図の原稿の2行目の文字列にについて、文字切出し
後、文字画像の最下座標をベースラインに揃えた場合の
出力文字列を示し、第6図(b)は同じく中心座標を揃
えた場合の出力文字列を示している。
なお、読み込んだ文字画像に対して、傾きや大きさ等
を整えて出力する場合の基本的な考え方は例えば特開昭
54−67425号公報に記載されている。
〔発明が解決しようとする課題〕
上記従来のスキャナによって読み取った文字画像の最
下座標をベースラインに揃えるか、あるいは中心線を揃
えるのみでは、拗音の“ゃ",“ょ",句読点
の“。",“、”、カギカッコの“「",“」”のように、
本来偏った位置(上,下)に印刷される文字、記号等が
極めて不自然に出力されてしまう問題があった。
本発明の目的は、文字画像を整列して出力する際に、
特定の文字(記号も含む)が不自然な位置に出力される
ことのない文字画像整列方法を提供することにある。
〔課題を解決するための手段〕
上記目的を達成するために、本発明では、原稿上の文
字画像を読み取り、各文字画像を整列して出力する際、
各々の文字画像の出力位置を、当該文字画像の大きさお
よび原稿上での位置に基づいて決定することを基本とす
る。
そして、請求項(1)は、文字中心線を基準として出
力位置を決定し、文字画像の小さいものほど基準中心線
から原画像での位置方向へのオフセットが大きくなるよ
うに当該文字画像の出力位置を定めることを特徴とす
る。
また、請求項(2)は、行画像の上下の基準線を用
い、文字画像の大きさがある一定値より大きいものはそ
の最下座標が下基準線に接するように文字画像を出力
し、それ以外の文字画像については、原稿上での位置か
ら、文字画像上端が上基準線に接するように出力する、
文字画像中心が上下基準線の中心に一致するように出力
する、あるいは文字画像下端が下基準線に接するように
出力する、のいずれかを選択することを特徴とする。
〔作 用〕
一般に小さい文字は、拗音の“ゃ",“ょ",“っ”句読
点の“。",“、”、カギカッコの“「",“」”などのよ
うに、偏った位置(上,下)に印字されることが多い。
また、それ以外の文字については、出来る限り原画像の
乱れを整列し、スキューや文字画像の上下への変動がな
いように出力することが好ましい。そこで、本発明にお
いては、出力位置を決定する際に、文字画像の大きさを
考慮に入れる。これにより、出来る限り原画像の乱れを
整列しつつ、“。”や“' "のように、本来偏った位置
に出力される文字が不自然な位置に出力されることを防
ぐことができる。
〔実施例〕
以下、本発明の一実施例について図面により説明す
る。第1図は本発明の一実施例の構成図を示す。スキャ
ナ11は原稿をスキャンし、電気信号として文字画像を読
み取る。行切出し部12は、スキャナ11によって読み取ら
れた文字画像を1行分ずつ切り出し、整列の際に基準と
なる座標を決定する。文字切出し部13は、1行分の文字
画像について、順次、1文字分の文字画像を切り出す。
文字画像サイズ検出部14は、切り出された文字画像の大
きさを検出する。文字画像配列決定部15は、切り出され
た文字画像の出力位置を、該文字画像の大きさおよび原
稿上の位置に基づいて決定する。整列画像出力部16は、
文字画像配列部15で決定された位置に、正規化された文
字画像を配置し出力する。文字画像サイズ検出部14、文
字画像配列決定部15及び整列画像出力部16での処理は、
行切出し部12、文字切出し部13で切出された原稿の各
行、各行内の文字数分繰返される。以下に、請求項
(1)及び(2)に対応する各実施例について、具体例
で詳述する。
実施例1 原稿としては第2図に示すものを想定する。本実施例
では文字中心線を基準として文字出力位置を決定するた
め、行切出し部12では、1行の画像を切り出し、該切り
出した行画像の上端と下端の中心を基準線として文字切
出し部13に送る。行切出しには一般的にX方向の射影を
用いるが、切出し方法としてはいかなる方法を用いても
かまわない。また、基準となる中心線も、例えば行内で
最も高い文字の中心座標を用いるなど、他の適当な方法
を用いてもかまわない。第2図に示した原稿の2行目に
ついて行切出しされた文字画像列を第3図に示す。第3
図中、30は文字“1"の高さ、−13は句点“。”の基準線
(中心線)からのオフセット、+11は記号“「”の同じ
くオフセットを表わしている。
文字切出し部13では、行切出しされた文字画像列から
1文字分の文字画像を切出し、文字画像サイズ検出部14
に送る。文字切出し方法としては、行内でY軸方向の射
影を用いて切り出す方法が一般的であるが、他のいかな
る方法を用いてもかわない。
文字画像サイズ検出部14では、切出された文字画像の
高さHを求め、該文字画像高さHを文字サイズSとして
文字画像配列決定部15に送る。本実施例においては、文
字画像高さを文字サイズとして用いたが、これは、例え
ば文字画像外接矩形の面積など他の適当なパラメータを
用いても構わない。
文字画像配列決定部15においては、原稿中での基準線
(中心線)からのオフセットをfとする時、例えば以下
の式によって出力位置の基準線からのオフセットFを求
める。
F=(f・α)/S (1) 上記式(1)はFを求める方法の一例であり、他に小
さい文字ほどFが大きくなるような適当な変換式を用い
ても構わない。第2図の原稿の2行目に関して式(1)
を用いた場合の各文字画像の出力位置を示すと、第1表
のようになる。なお、第1表では後編の“方法につい
て。”は省略してある。
整列画像出力部16では、文字画像配列決定部15で決定
された位置に文字画像を配置して出力する。第2図の2
行目の各切出し文字について、第1表のオフセットFに
従って整列させると、第4図のようになる。
実施例2 ここでも原稿としては第2図に示すものを想定し、実
施例1と異なる部分のみについて説明する。本実施例で
は行ごとに上下基準線を用いるため、行切出し部12で
は、1行の画像を切り出し、該切り出した行画像の上端
と下端の座標をそれぞれ上下基準線として文字切出し部
13に送る。上下基準線は、例えば行内で最も高い文字の
上下座標を用いるなど、他の適当な方法を用いて設定し
てもよい。
文字画像サイズ検出部14では、切出された文字画像の
高さHを求め、該文字画像高さHを文字サイズとして文
字画像配列決定部15に送る。本実施例においては、文字
画像高さを文字サイズとして用いているが、これは例え
ば文字画像外接矩形の面積など他の適当なパラメータを
用いても構わない。
文字画像配列決定部15においては、次の処理により、
文字画像の出力位置を決定する。
文字画像の高さがしきい値Tよりも大きい場合に
は、文字画像の下端を、下基準線に揃えるように出力す
る。
文字画像の高さがしきい値Tよりも小さく、文字画
像のオフセットが+tよりも大きい場合には、文字画像
の上端を上基準線に揃える。
文字画像の高さがしきい値Tよりも小さく、文字画
像のオフセットが−tよりも小さい場合には、文字画像
の下端を下基準線に揃える。
〜以外の場合には、文字画像の中心を、上基準
線とした基準線の中心に合わせる。
第2図に示した原稿の2行目に関して本実施例を用い
た場合の各文字画像の出力位置決定例を示すと、第2表
のようになる。
整列画像出力部16では、文字画像配列決定部15で決定
された位置〜のいずれかに文字画像を配置して出力
する。第2図の2行目の各切出し文字について、第2表
に従って整列させると、第5図のようになる。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、原
稿上の文字画像をスキャナにより読み取り、行切出し、
文字切出しなどを行い、各文字画像を整列して出力する
際、原画像の乱れを整列しつつ、本来偏った位置にある
特定の文字が不自然な位置に出力されるのを防止するこ
とができる。
【図面の簡単な説明】
第1図は本発明方法を達成する一実施例の構成図、第2
図は原稿の一例を示す図、第3図は切り出された行画像
を示す図、第4図及び第5図は本発明による出力画像例
を示す図、第6図は従来の出力画像例を示す図である。 11……スキャナ、12……行切出し部、 13……文字切出し部、 14……文字画像サイズ検出部、 15……文字画像配列決定部、 16……文字画像出力部。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】原稿上の文字画像を読み取り、各文字画像
    を整列して出力する装置において、各々の文字画像の出
    力位置を、当該文字画像の大きさおよび原稿上での位置
    に基づいて決定する文字画像整列方法であって、 文字中心線を基準として出力位置を決定し、文字画像の
    小さいものほど基準中心線から原画像での位置方向への
    オフセットが大きくなるように当該文字画像の出力位置
    を定めることを特徴とする文字画像整列方法。
  2. 【請求項2】原稿上の文字画像を読み取り、各文字画像
    を整列して出力する装置において、各々の文字画像の出
    力位置を、当該文字画像の大きさおよび原稿上での位置
    に基づいて決定する文字画像整列方法であって、 行画像の上下の基準線を用い、文字画像の大きさがある
    一定値より大きいものはその最下座標が下基準線に接す
    るように文字画像を出力し、それ以外の文字画像につい
    ては、原稿上での位置から、文字画像上端が上基準線に
    接するように出力する、文字画像中心が上下基準線の中
    心に一致するように出力する、あるいは文字画像下端が
    下基準線に接するように出力する、のいずれかを選択す
    ることを特徴とする文字画像整列方法。
JP7823190A 1990-03-27 1990-03-27 文字画像整列方法 Expired - Fee Related JP2843638B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7823190A JP2843638B2 (ja) 1990-03-27 1990-03-27 文字画像整列方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7823190A JP2843638B2 (ja) 1990-03-27 1990-03-27 文字画像整列方法

Publications (2)

Publication Number Publication Date
JPH03278186A JPH03278186A (ja) 1991-12-09
JP2843638B2 true JP2843638B2 (ja) 1999-01-06

Family

ID=13656273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7823190A Expired - Fee Related JP2843638B2 (ja) 1990-03-27 1990-03-27 文字画像整列方法

Country Status (1)

Country Link
JP (1) JP2843638B2 (ja)

Also Published As

Publication number Publication date
JPH03278186A (ja) 1991-12-09

Similar Documents

Publication Publication Date Title
US7697776B2 (en) Model-based dewarping method and apparatus
JP2812982B2 (ja) 表認識方法
JP6200040B1 (ja) 画像処理装置、画像処理方法、および、プログラム
US7965293B2 (en) Image processing device, image processing method, and image processing program for reconstructing data
JP2843638B2 (ja) 文字画像整列方法
US8533590B2 (en) Information processing apparatus and layout processing method
Lehal et al. A range free skew detection technique for digitized Gurmukhi script documents
JP2005354654A (ja) 写真イメージ領域抽出装置およびコピー装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JPS6325391B2 (ja)
JP3604909B2 (ja) 画像間位置合わせ方法
JPH0373915B2 (ja)
JP2000113106A (ja) 文書画像処理装置
JPH04352295A (ja) 文字列方向判別装置
JPS61175875A (ja) 文書読取り装置
JP3122476B2 (ja) 自動文書清書装置
JPH05151388A (ja) 処理領域及び処理条件の指定方式
JPS6254380A (ja) 文字認識装置
JPS6327751B2 (ja)
JPH0250513B2 (ja)
JP3400154B2 (ja) 文書画像の領域抽出方法および装置
JPS62200486A (ja) 文字読取装置
JPH103517A (ja) 文書画像傾き角検出装置
JPS60254284A (ja) 文字認識装置
JP3157534B2 (ja) 表認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees