JP2000040122A - 文字切り出し方法 - Google Patents

文字切り出し方法

Info

Publication number
JP2000040122A
JP2000040122A JP10207606A JP20760698A JP2000040122A JP 2000040122 A JP2000040122 A JP 2000040122A JP 10207606 A JP10207606 A JP 10207606A JP 20760698 A JP20760698 A JP 20760698A JP 2000040122 A JP2000040122 A JP 2000040122A
Authority
JP
Japan
Prior art keywords
character
width
rectangle
histogram
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10207606A
Other languages
English (en)
Inventor
Toshio Miyazawa
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10207606A priority Critical patent/JP2000040122A/ja
Publication of JP2000040122A publication Critical patent/JP2000040122A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】任意の縦横の比率で記載された文字を正確に切
り出して、文字の認識率を高める。 【解決手段】同一文字サイズ行の矩形幅の出現度数を示
すヒストグラムを作成し、作成した矩形幅のヒストグラ
ムの幅の大きい度数値を重視し、小さい度数値を軽く評
価する重み付け平均操作を行って矩形幅のヒストグラム
を補正する。補正した矩形幅のヒストグラムの度数値の
最大値を参照して標準文字幅を算出し、算出した標準文
字幅と各矩形幅の上限や矩形間の間隔などを基準にして
各矩形を組み合わせて文字塊を生成する。生成した文字
塊から1文字とみなせる文字パターンを生成し特徴を抽
出して文字を認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、光学的文字読取
装置などのように文字,図形等の画像を読み取る画像読
取装置の文字切り出し方法に関するものである。
【0002】
【従来の技術】光学的文字読取装置などで日本語の文字
を認識する方法としては、例えば特開平9−29781
7号公報に示されているように、文字を示す矩形の縦横
比とあらかじめ定めた縦横比を基に変倍文字であるか否
の判定を行い、変倍文字の変倍率に応じて文字塊を生成
する条件を変更するようにしている。
【0003】
【発明が解決しようとする課題】上記のようにあらかじ
め定めた矩形の縦横比を基準にして変倍文字であるか否
を判定していると、あらかじめ定めた矩形の縦横比を基
準にして作成された原稿の文字を適切に切り出すことは
できるが、原稿に任意の縦横の比率で記載された文字を
正確に切り出すことはできなかった。
【0004】この発明はかかる短所を改善し、複数行に
含まれる文字塊のヒストグラムを作成し、標準文字幅を
決めて文字塊の生成を行うことにより、任意の縦横の比
率で記載された文字を正確に切り出して、文字の認識率
を高めることができる文字切り出し方法を提供すること
を目的とするものである。
【0005】
【課題を解決するための手段】この発明に係る文字切り
出し方法は、行画像から黒画素の連結部分を包含する外
接矩形を抽出し、外接矩形に含まれる矩形を組み合わせ
て文字塊を生成し、各文字塊から文字パターンの候補を
認識して文字パターンを選択する文字切り出し方法にお
いて、同一文字サイズ行内の外接矩形に含まれる矩形の
幅のヒストグラム情報から標準文字幅を決定し、決定し
た標準文字幅を用いて文字塊を生成し、生成した文字塊
から文字パターン候補を生成することを特徴とする。
【0006】この発明に係る第2の文字切り出し方法
は、行画像から黒画素の連結部分を包含する外接矩形を
抽出し、外接矩形に含まれる矩形を組み合わせて文字塊
を生成し、各文字塊から文字パターンの候補を認識して
文字パターンを選択する文字切り出し方法において、同
一文字サイズ行内の外接矩形に含まれる矩形の幅のヒス
トグラム情報から標準文字幅を決定し、決定した標準文
字幅を用いて文字パターン候補を生成することを特徴と
する。
【0007】上記ヒストグラムは行内の矩形の幅と高さ
を参照して横長と縦長び小さな矩形を除去して補正する
ことが望ましい。
【0008】また、上記標準文字幅は、矩形幅のヒスト
グラムの値が最大となる値を用いて決定すると良い。
【0009】
【発明の実施の形態】この発明の文字切り出し方法は、
原稿を読み取り、読み取った2値画像の各行を切り出
し、切り出した各行の行データに対して各行毎に黒画素
を連結して連結部分を全て包含する外接矩形を抽出す
る。この抽出した矩形データの中から同一文字サイズ行
を抽出し、ノイズ矩形やアンダライン矩形などを除去し
て、同一文字サイズ行の矩形幅の出現度数を示すヒスト
グラムを作成する。この作成した矩形幅のヒストグラム
の幅の大きい度数値を重視し、小さい度数値を軽く評価
する重み付け平均操作を行って矩形幅のヒストグラムを
補正する。この補正した矩形幅のヒストグラムの度数値
の最大値を参照して標準文字幅を算出し、算出した標準
文字幅と各矩形幅の上限や矩形間の間隔などを基準にし
て各矩形を組み合わせて文字塊を生成する。この生成し
た文字塊から1文字とみなせる文字パターンを生成し特
徴を抽出して文字を認識する。
【0010】
【実施例】図1はこの発明の一実施例の構成を示すブロ
ック図である。図に示すように、画像読取装置の文字認
識装置は、装置全体の動作を制御する制御部1と記憶部
2と2値画像入力部3と文字切り出し部4と文字認識部
5及び出力部6を有する。記憶部2は2値画像メモリ2
1と行データメモリ22と矩形メモリ23と文字塊メモ
リ24及び文字パターンメモリ25を有する。2値画像
入力部3はスキャナ等からなり、原稿を読み取り、読み
取った2値画像を2値画像メモリ21に格納する。文字
切り出し部4は行切り出し部7と矩形抽出部8とヒスト
グラム作成部9とヒストグラム補正部10と標準文字幅
算出部11と文字塊生成部12及び文字パターン生成部
13を有する。行切り出し部7は2値画像メモリ21内
の2値画像から各行を切り出して行データメモリ22に
格納する。矩形抽出部8は行データメモリ22に格納さ
れた各行の行データに対して黒画素の連結部分を全て包
含する外接矩形を抽出して矩形メモリ23に格納する。
ヒストグラム作成部9は矩形メモリ23に格納された矩
形データの中から同一文字サイズ行を抽出し、ノイズ矩
形やアンダライン矩形などを除去して同一文字サイズ行
の矩形幅の出現度数を示すヒストグラムを作成する。ヒ
ストグラム補正部11は作成した矩形幅のヒストグラム
の幅の大きい度数値を重視し、小さい度数値を軽く評価
する重み付け平均操作を行って矩形幅のヒストグラムを
補正する。標準文字サイズ算出部11は補正した矩形幅
のヒストグラムの度数値の最大値を参照して標準文字幅
を算出する。文字塊生成部12は標準文字幅と各矩形幅
の上限や矩形間の間隔などを基準にして各矩形を組み合
わせて文字塊を生成し文字塊メモリ24に格納する。文
字パターン生成部13は文字塊メモリ24に格納された
文字塊から1文字とみなせる文字パターンを生成して文
字パターンメモリ25に格納する。文字認識部5は文字
パターンメモリ25に格納された文字パターンの特徴を
抽出して文字を認識する。出力部6は文字認識部5で認
識した文字を出力する。
【0011】上記のように構成された文字認識装置によ
り、図2に示す原稿14を読み取って文字を認識すると
きの動作を、図3のフローチャートを参照して説明す
る。
【0012】2値画像入力部3で、図2(a)に示す原
稿15の読取対象フィールド15を読み取り、図2
(b)に示すように、読み取った読取対象フィールド1
5の2値画像を2値画像メモリ21に格納する(ステッ
プS1)。文字切り出し部4の行切り出し部7は2値画
像メモリ21内の2値画像から、各行L1〜L6を切り
出して行データメモリ22に格納する(ステップS
2)。各行L1〜L6が切り出されると、矩形抽出部8
は行データメモリ22に格納された各行L1〜L2の行
データに対して、図4に示すように、各行毎に黒画素を
連結して連結部分を全て包含する外接矩形16を抽出し
て矩形メモリ23に格納する(ステップS3)。ヒスト
グラム作成部9は矩形メモリ23に格納された矩形デー
タの中から、図4に示すように同一文字サイズ行L2〜
L6を抽出し、図4の斜線で示すノイズ矩形やアンダラ
イン矩形17などを除去して、図5(a)に示すように
同一文字サイズ行の矩形幅Wの出現度数を示すヒストグ
ラムを作成する(ステップS4)。一般に、日本語の文
章中にはひらがなやカタカナが出現する場合が多く、ひ
らがなやカタカナは漢字より矩形幅Wが小さくなり、矩
形幅Wの出現度数を示すヒストグラムを作成した場合、
図5(a)に示すように、小さい矩形幅の出現頻度が多
くなり、漢字を示す矩形幅のピーク値P1よりひらがな
やカタカナを示す矩形幅のピーク値P2が大きくなる。
そこでヒストグラム補正部11は、漢字を示す矩形幅の
ピーク値P1とひらがなやカタカナを示す矩形幅のピー
ク値P2を使用してヒストグラム作成部9で作成した矩
形幅のヒストグラムの幅の大きい度数値を重視し、小さ
い度数値を軽く評価する重み付け平均操作を行って、図
5(b)に示すように、矩形幅のヒストグラムを補正す
る(ステップS5)。このように矩形幅のヒストグラム
を補正することにより、漢字を示す矩形幅のピーク値P
1を正しく検出することができる。標準文字サイズ算出
部11は、図5(b)に示す補正した矩形幅のヒストグ
ラムの度数値の最大値P1を参照して標準文字幅を算出
する(ステップS6)。この標準文字幅を算出するとき
に、重み付けをして補正した矩形幅のヒストグラムの各
度数値の隣接している3種類の矩形幅の度数値を平均
し、その最大値を示す矩形幅を標準文字幅としても良
い。文字塊生成部12は標準文字幅と各矩形幅の上限や
矩形間の間隔などを基準にして各矩形を組み合わせて文
字塊を生成し文字塊メモリ24に格納する(ステップS
7)。例えば、図6に示すように、文字の偏を示す矩形
18aと旁を示す矩形18bを組み合わせて文字塊19
を生成する。文字パターン生成部13は文字塊メモリ2
4に格納された文字塊19から1文字とみなせる文字パ
ターンを生成して文字パターンメモリ25に格納する
(ステップS8)。文字認識部5は文字パターンメモリ
25に格納された文字パターンの特徴を抽出して文字を
認識し、出力部6から認識した文字を出力する(ステッ
プS9)。
【0013】このように同一文字サイズ行における矩形
幅の出現度数を示すヒストグラムを作成し、そのピーク
値から標準文字幅を決定し、決定した標準文字幅を用い
て文字塊を生成するから、任意の縦横の比率で作成され
た文字を正確に切り出すことができる。また、矩形幅の
出現度数を示すヒストグラムを補正して漢字を示す矩形
幅のピーク値P1を検出して標準文字幅を算出すること
により、文字の認識率を高めることができる。
【0014】上記実施例は標準文字幅と各矩形幅の上限
や矩形間の間隔などを基準にして各矩形を組み合わせて
文字塊を生成し、生成した文字塊から1文字とみなせる
文字パターンを生成した場合について説明したが、標準
文字幅と各矩形幅の上限や矩形間の間隔などを基準にし
て1文字とみなせる文字パターンを直接生成しても良
い。
【0015】また、上記実施例は原稿の種別に係らず同
一文字サイズ行の矩形幅の出現度数を示すヒストグラム
のピーク値から標準文字幅を決定する場合について説明
したが、読み取る原稿の種別を判断して、縦書きの原稿
のときに、同一文字サイズ行における矩形幅の出現度数
を示すヒストグラムのピーク値から標準文字幅を決定
し、横書きの原稿のときは同一文字サイズ行の高さから
標準文字幅を直接決定しても良い。すなわち新聞等の縦
書き原稿では、一般に変倍フォントが使われることが多
いが、横書き原稿の場合には横倍角文字が使われたりす
る以外に変倍フォントはあまり用いられないからであ
る。
【0016】
【発明の効果】この発明は以上説明したように、同一文
字サイズ行の矩形幅の出現度数を示すヒストグラムを作
成し、そのピーク値から標準文字幅を決定し、決定した
標準文字幅を用いて文字塊を生成するから、任意の縦横
の比率で作成された文字を正確に切り出すことができ
る。
【0017】また、矩形幅の出現度数を示すヒストグラ
ムを補正して漢字を示す矩形幅のピーク値を検出して標
準文字幅を算出することにより、文字の認識率を高める
ことができる。
【0018】さらに、標準文字幅と各矩形幅の上限や矩
形間の間隔などを基準にして1文字とみなせる文字パタ
ーンを直接生成することにより、任意の縦横の比率で作
成された文字を簡単に切り出すことができる。
【図面の簡単な説明】
【図1】この発明の実施例の構成を示すブロック図であ
る。
【図2】原稿と読み取った領域の画像を示す説明図であ
る。
【図3】上記実施例の動作を示すフローチャートであ
る。
【図4】黒画素と抽出した外接矩形を示す説明図であ
る。
【図5】矩形幅の度数分布図である。
【図6】文字塊の生成を示す説明図である。
【符号の説明】
1 制御部 2 記憶部 3 2値画像入力部 4 文字切り出し部 5 文字認識部 6 出力部 7 行切り出し部 8 矩形抽出部 9 ヒストグラム作成部 10 ヒストグラム補正部 11 標準文字幅算出部 12 文字塊生成部 13 文字パターン生成部 14 原稿 21 2値画像メモリ 22 行データメモリ 23 矩形メモリ 24 文字塊メモリ 25 文字パターンメモリ

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 行画像から黒画素の連結部分を包含する
    外接矩形を抽出し、外接矩形に含まれる矩形を組み合わ
    せて文字塊を生成し、各文字塊から文字パターンの候補
    を認識して文字パターンを選択する文字切り出し方法に
    おいて、 同一文字サイズ行内の外接矩形に含まれる矩形の幅のヒ
    ストグラム情報から標準文字幅を決定し、決定した標準
    文字幅を用いて文字塊を生成し、生成した文字塊から文
    字パターン候補を生成することを特徴とする文字切り出
    し方法。
  2. 【請求項2】 行画像から黒画素の連結部分を包含する
    外接矩形を抽出し、外接矩形に含まれる矩形を組み合わ
    せて文字塊を生成し、各文字塊から文字パターンの候補
    を認識して文字パターンを選択する文字切り出し方法に
    おいて、 同一文字サイズ行内の外接矩形に含まれる矩形の幅のヒ
    ストグラム情報から標準文字幅を決定し、決定した標準
    文字幅を用いて文字パターン候補を生成することを特徴
    とする文字切り出し方法。
  3. 【請求項3】 上記ヒストグラムは行内の矩形の幅と高
    さを参照して横長と縦長び小さな矩形を除去して補正す
    る請求項1又は2記載の文字切り出し方法。
  4. 【請求項4】 上記標準文字幅は、矩形幅のヒストグラ
    ムの値が最大となる値を用いて決定する請求項3記載の
    文字切り出し方法。
JP10207606A 1998-07-23 1998-07-23 文字切り出し方法 Pending JP2000040122A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10207606A JP2000040122A (ja) 1998-07-23 1998-07-23 文字切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10207606A JP2000040122A (ja) 1998-07-23 1998-07-23 文字切り出し方法

Publications (1)

Publication Number Publication Date
JP2000040122A true JP2000040122A (ja) 2000-02-08

Family

ID=16542573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10207606A Pending JP2000040122A (ja) 1998-07-23 1998-07-23 文字切り出し方法

Country Status (1)

Country Link
JP (1) JP2000040122A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6920246B2 (en) 2001-12-26 2005-07-19 Electronics And Telecommunication Research Institute Method for segmentation-based recognizing handwritten touching numeral strings
US8139897B2 (en) 2007-03-15 2012-03-20 Ricoh Company, Limited Detecting tilt in an image having different resolutions in different directions
CN103093224A (zh) * 2011-11-08 2013-05-08 佳能株式会社 确定平均字符宽度的方法和装置及字符切分方法和设备
CN103400132A (zh) * 2013-07-02 2013-11-20 Tcl集团股份有限公司 一种字符分割方法及装置
CN106339704A (zh) * 2015-07-14 2017-01-18 富士通株式会社 字符识别方法和字符识别设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6920246B2 (en) 2001-12-26 2005-07-19 Electronics And Telecommunication Research Institute Method for segmentation-based recognizing handwritten touching numeral strings
US8139897B2 (en) 2007-03-15 2012-03-20 Ricoh Company, Limited Detecting tilt in an image having different resolutions in different directions
CN103093224A (zh) * 2011-11-08 2013-05-08 佳能株式会社 确定平均字符宽度的方法和装置及字符切分方法和设备
CN103400132A (zh) * 2013-07-02 2013-11-20 Tcl集团股份有限公司 一种字符分割方法及装置
CN103400132B (zh) * 2013-07-02 2017-08-25 Tcl集团股份有限公司 一种字符分割方法及装置
CN106339704A (zh) * 2015-07-14 2017-01-18 富士通株式会社 字符识别方法和字符识别设备

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7054485B2 (en) Image processing method, apparatus and system
JP3278471B2 (ja) 領域分割方法
JP2002298085A (ja) 文字認識装置、文字認識方法、及び記録媒体
JP4613397B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
EP1296283A2 (en) Half-tone dot elimination method and system thereof
JP2000040122A (ja) 文字切り出し方法
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2868134B2 (ja) 画像処理方法及び装置
JP3763954B2 (ja) 文字認識用の学習データ作成方法および記録媒体
JP3019897B2 (ja) 行切出し方法
JP4004189B2 (ja) 文字切り出し方法
JP3711186B2 (ja) サイズ識別方法および装置
JP2003317107A (ja) 罫線抽出方法及び装置
JP3734614B2 (ja) 画像処理方法、装置および記録媒体
JP2000331118A (ja) 画像処理装置及び記録媒体
JPH09297817A (ja) 文字切り出し方法
JP2000040153A (ja) 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置
JPH0540848A (ja) 文書画像の領域抽出方法
JPH0417086A (ja) 文字切り出し方法
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JP3210224B2 (ja) 文字認識装置
JPH04130979A (ja) 文字画像切出し方法
JPH06215181A (ja) 文字・文字列切り出し方法および文字認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060509