JPH03188587A - 2値化方式 - Google Patents

2値化方式

Info

Publication number
JPH03188587A
JPH03188587A JP1327230A JP32723089A JPH03188587A JP H03188587 A JPH03188587 A JP H03188587A JP 1327230 A JP1327230 A JP 1327230A JP 32723089 A JP32723089 A JP 32723089A JP H03188587 A JPH03188587 A JP H03188587A
Authority
JP
Japan
Prior art keywords
image
histogram
binarized
labeling
density level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1327230A
Other languages
English (en)
Other versions
JP2670372B2 (ja
Inventor
Akio Sano
佐野 明生
Akira Kasano
笠野 章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1327230A priority Critical patent/JP2670372B2/ja
Publication of JPH03188587A publication Critical patent/JPH03188587A/ja
Application granted granted Critical
Publication of JP2670372B2 publication Critical patent/JP2670372B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、濃淡画像を2値化画像に変換するための2
値化方式に関する。
(従来の技術) ITVカメラ等の画像入力装置により取込まれた濃淡画
像(濃淡ディジタルデータで表現される画像)に含まれ
る文字を認識して読取る文字認識装置では、濃淡画像を
2値化画像に変換し、この2値化画像上で面積(独立し
た領域の画素数)が所定値以上の図形を切出して、文字
認識対象とするのが一般的であった。この具体例を、第
4図を参照して以下に説明する。
■2値化処理 まず、ITVカメラ等により取込まれた濃淡画像をデー
タ変換機能を用いて2値化画像に変換する。この際、低
い濃度レベルで2値化すると(即ち低濃度レベルを閾値
として2値化すると)、第4図において符号41で示さ
れるように、文字がほぼ完全に抽出されると同時にノイ
ズ(雑音)も抽出された2値化画像が得られる。一方、
高い濃度レベルで2値化すると、第4図において符号4
2で示されるように、ノイズは除去されるものの、文字
がかすれたり一部が消えてしまう2値化画像が得られる
。このような2値化画像42では文字認識は不可能であ
るため、従来は、低い濃度レベルで2値化することで文
字がくっきりと浮び上った2値化画@!4Iが用いられ
る。
■ラベリング処理 低い濃度レベルで21i!化することで得られる2値化
画像41には、上記したようにノイズが含まれている。
そこで、このノイズを、抽出された文字に影響を及ぼさ
ずに除去するための第1ステツプとして、ラベリング処
理、即ち2値化画像41内で真値を持つ画素(値が@1
”の画素)が連結した各々の領域毎に独立のラベル値(
番号)を各画素に付すラベリング処理を行い、第4図に
おいて符号43で示されるようなラベリング画像を求め
る。
なお、第4図のラベリング画像43において、符号L2
.L3・・・L30はそれぞれラベル値2,3・・・3
0を持つ独立の画像領域(ここでは文字、ノイズの領域
)を示す。
■ヒストグラム処理 ノイズ除去の第2ステツプとして、■で求めたラベリン
グ画像43のヒストグラム、即ちラベリング画像のラベ
ル値毎の画素数(面積)を表す第4図において符号44
で示すようなヒストグラムを作成する。ここでは、ヒス
トグラム値がある一定値、例えば10より低い小領域(
画素数が10以下の領域)の画像は、次に述べるように
ノイズと見なされる。
■データ変換処理 ノイズ除去の最終ステップとして、■で求めたヒストグ
ラム44上で、ヒストグラム値(画素数)が一定値以上
(ここでは10)となる領域の画像(ここでは、図から
明らかなように、ラベル値が6の領域の画像のみ)を“
1”とするように、ラベリング画像43を対象にデータ
変換(2値化)する。この結果、第4図において符号4
5で示されるように、一定値(10)より低いヒストグ
ラム値となる領域の画像(ノイズ)が除去された2値化
画像が求められる。この2値化画像45が、文字認識等
に用いられる。
(発明が解決しようとする課題) 上記したように従来の2値化方式では、目的画像(図形
)を完全に抽出するために濃淡画像を低濃度レベルで2
値化することで、ノイズも抽出されてしまっても、その
ノイズ(を構成する連結画素の領域)が小さい場合には
、上記の■〜■のラベリング、ヒストグラムおよびデー
タ変換の各処理によりノイズを除去することができる。
しかし、上記■の2値化処理で第5図に示す2値化画像
51のように大きいノイズ52が残った場合には、その
ノイズ52の画素数が一定値(閾値)以上となることか
ら、そのノイズ52は除去できず、第5図に示すように
、最終的に求められる2値化画像53中に残ってしまう
。この結果、2値化画像53に残ったノイズ52は、例
えば文字認識の場合には、文字の一部として誤判断され
てしまう。
この発明は上記事情に鑑みてなされたものでその目的は
、目的画像(図形)を確実に2値化して抽出するために
濃淡画像を低濃度レベルで2値化した際に、大きなノイ
ズ(ノイズ領域)が抽出されても確実に除去できる2値
化方式を提供することにある。
[発明の構成] (課題を解決するための手段) この発明は、濃淡画像を低濃度レベルで2値化すること
で得られた2値化画像(第1の2値化画像)を対象とす
るラベリング処理を行ってラベリング画像を得、しかる
後に、このラベリング画像のヒストグラムを作成する際
に、上記の濃淡画像を高濃度レベルで2値化することで
得られる2値化画像(第2の2値化画像)をマスクとし
て用い、上記ラベリング画像のうち、高濃度レベルの濃
淡画像部分に対応する画像部分に対してのみヒストグラ
ムが作成される構成とし、このヒストグラム上で所定値
以上のヒストグラム値(画素数)を持つ領域のラベル値
を検出し、この検出したラベル値を持つ領域の画像のみ
を上記ラベリング画像から抽出して2値化することで、
求める2値化画像(第3の2値化画像)を得るようにし
たことを特徴とするものである。
(作用) 上記の構成において、第1の2値化画像は濃淡画像を低
濃度レベルで2値化することで求められる。このため第
1の2値化画像には、文字等の目的画像(図形)がほぼ
完全に抽出されるばかりでなく、ノイズも抽出されて含
まれる。このため、上記した第1の2値化画像を対象と
してラベリング処理を行ってラベリング画像を得、この
ラベリング画像のヒストグラムを作成した場合、このヒ
ストグラム中にはノイズ部分のヒストグラムデータも含
まれしまう。そこで、ラベリング画像のヒストグラムを
作成する際に、上記のように濃淡画像を高濃度レベルで
2値化することで得られる第2の2値化画像をラベリン
グ画像に対するマスクとして用い、ラベリング画像全体
でなく、第2の2値化画像が有効な部分(“1”の部分
)、即ち高濃度レベルの濃淡画像部分に対応する画像部
分だけを対象としてヒストグラムを作成することで、ノ
イズ部分をヒストグラムデータに含まないようにするこ
と(含むとしても低いヒストグラム値とすること)が可
能となる。したがって、このようなヒストグラム上で所
定値以上のヒストグラム値を持つ領域のラベル値を検出
し、この検出したラベル値を持つ領域の画像のみを上記
ラベリング画像から抽出して2値化することで、ノイズ
が除去された2値化画像を得ることが可能となる。
(実施例) 第1図はこの発明を適用する2値化装置の一実施例を示
すブロック構成図である。同図において、11は画像入
力装置(図示せず)によって入力された濃淡(多値)デ
ィジタルデータ表現の濃淡画像が格納される入力画像メ
モリ、12は入力画像メモリ11に格納されている濃淡
画像を一定の濃度レベルで2値化するデータ変換器であ
る。本実施例において、データ変換器12は上記濃淡数
画像を第1の濃度レベル(ここでは低い濃度レベル)で
2値化する第1の2値化機能と、第2の濃度レベル(こ
こでは高い濃度レベル)で2値化する第2の2値化機能
とを有している。13はデータ変換器12により低い濃
度レベルで2値化された画像を格納するための2値化画
像メモリ、14はデータ変換器12により高い濃度レベ
ルで2値化された画像を格納するための2値化画像メモ
リである。15は2値化画像メモリ13内の2値化画像
を対象にラベリング処理を行ってラベリング画像を得る
ラベリング器、1Bはラベリング器I5によって得られ
たラベリング画像を格納するためのラベリング画像メモ
リである。
17はラベリング画像メモリ16内のラベリング画像に
2値化画像メモリ14内の2値化画像をマスクしてラベ
リング値毎のヒストグラムを求めるヒストグラム器、1
8はヒストグラム器17で求められたラベリング画像の
ヒストグラムを格納するためのヒストグラムテーブルで
ある。19はヒストグラムテーブル18上で所定値以上
の画素数(ヒストグラム値)を持つラベル値を検出し、
この検出したラベル値を持つ画像のみを上記ラベリング
画像から抽出して2値化して最終的な2値化画像を求め
るデータ変換器、20はデータ変換器19によって求め
られた2値化画像を格納するための2値化画像メモリで
ある。なお、第1図の各要素、即ち入力画像メモリ11
.データ変換器12.2値化画像メモリ13.2値化画
像メモリ14、ラベリング器15、ラベリング画像メモ
リ16、ヒストグラム器17、ヒストグラムテーブル1
8、データ変換器19および2値化画像メモリ20を画
像データバスにより相互接続したシステムにより、2値
化装置を構成することも可能である。
第2図は第1図の2値化装置における2値化処理の流れ
を説明するための図、第3図は第1図に示すヒストグラ
ム器17の動作を説明するための図である。
次に、第1図の構成の動作を、文字認識等のための文字
切出しに必要な濃淡画像の2値化処理を例に、第2図お
よび第3図を適宜参照して説明する。
■濃淡画像人力処理 まず、図示せぬITVカメラ等の画像入力装置により、
濃淡ディジタルデータに変換された2値化対象濃淡画像
21(第2図参照)が人力され、入力画像メモリ11に
格納される。
■低レベルベルでの2値化処理 データ変換器12は、入力画像メモリ11に格納された
濃淡画像21を予め定められた第1の閾値レベル(低濃
度レベル)で2値化し、2値化画像22(第2図参照)
を得る。この2値化画像22は、低濃度レベルで2値化
されたものであることから、文字(図ではj)が完全に
抽出されているものの、ノイズも抽出されている。2値
化画像22は2値化画像メモリ13に格納される。
■高レベルベルでの2値化処理 またデータ変換器12は、上記濃淡画像21を予め定め
られた第2の閾値レベル(高濃度レベル)で2値化し、
2値化画像23(第2図および第3図参照)を得る。こ
の2値化画像23は、高濃度レベルで2値化されたもの
であることから、ノイズが除去されているものの、文字
がかすれたり、一部が消えている。2値化画像23は2
値化画像メモリ14に格納される。なお、■および■の
2値化処理は並列に行うことが可能である。
■ラベリング処理 2値化画像メモリ14に格納された2値化画像(低濃度
レベルで2値化された2値化画像)22はラベリング器
15に供給される。ラベリング器15は、この2値化画
像22を対象として、同画像22内で真値を持つ画素(
値が“1”の画素)が連結した各々の領域毎に独立のラ
ベル値(番号)を各画素に付すラベリング処理を行い、
ラベリング画像24(第2図および第3図参照)を求め
る。このラベリング画像24はラベリング画像メモリ1
Bに格納される。なお、第2図および第3図に示すラベ
リング画像24において、符号L2.L3・・・L20
はそれぞれラベル値2,3・・・20を持つ独立の画像
領域(ここでは文字、ノイズの領域)を示す。
■ヒストグラム処理 上記■でラベリング画像24に格納されたラベリング画
像24はヒストグラム器17に供給される。このヒスト
グラム器17には、2値化画像メモリ14内の2値化画
像(高濃度レベルで2値化された2値化画像)23も供
給される。ヒストグラム器17は、ラベリング画像24
に2値化画像23をマスクし、第3図に示すようにマス
ク画像(2値化画像23)が有効な部分(“1″の部分
)に対応するラベリング画像24の部分、即ち濃淡画像
の高濃度部分(ここでは文字部分)に対応するラベリン
グ画像24の部分についてのみ、ラベル値毎の画素数(
面積)を表すヒストグラムを求める。この結果、本実施
例では、文字部分(ラベル値が5と8の各文字部分)に
ついてのみのヒストグラム25(第2図および第3図参
照)が求められる。このヒストグラム25には、ノイズ
部分(ラベル値が3や4などの小領域のノイズ部分だけ
でなく、ラベル値が7や20などの大領域のノイズ部分
)のヒストグラムデータが含まれていない(含まれてい
てもヒストグラム値は小さい)ことに注意されたい。ヒ
ストグラム25は、ヒストグラムテーブル18に格納さ
れる。
■データ変換処理 ヒストグラム器17によってヒストグラムテーブル18
にヒストグラム25が求められると、ラベリング画像メ
モリ16内のラベリング画像を2値化画像に変換するデ
ータ変換器19が起動される。データ変換器19は、ヒ
ストグラムテーブル18上のヒストグラム25により、
予め定められた値以上のヒストグラム値(画素数、面積
)となっているラベル値(ここでは5と8)を検出し、
この検出したラベル値を持つラベリング画像24内の画
像部分のみを抽出して2値化する。この結果、文字だけ
が確実に抽出された2値化画像2B、即ち文字j (を
構成するラベル値が5と8の各文字部分)だけが抽出さ
れ、ラベル値が3や4などの小領域のノイズ部分は勿論
、ラベル値が7や20などの大領域のノイズ部分が除去
された2値化画像2Bが求められる。
この2値化画像2Bは2値化画像メモリ20に格納され
、文字認識装置による認識処理に供される。
以上は、文字認識等のための文字切出しに必要な濃淡画
像の2値化処理について説明したが、本発明は正しい2
値化画像をノイズを含まずに抽出することが要求される
2値化処理全般に応用可能である。
[発明の効果] 以上詳述したようにこの発明によれば、目的画像(図形
)を確実に2値化して抽出するために濃淡画像を低濃度
レベルで2値化し、そのラベリング画像のヒストグラム
を作成する際に、濃淡画像を高濃度レベルで2値化する
ことで得られる2値化画像をマスク画像として用い、こ
のマスク画像の有効部分に対応するラベリング画像部分
だけを対象としてヒストグラムを作成することで、ノイ
ズ部分のヒストグラム値を零、或は極めて小さい値とす
ることが可能となり、このようなヒストグラム上で所定
値以上のヒストグラム値を持つ領域のラベル値を検出し
て、この検出したラベル値を持つ領域の画像のみをラベ
リング画像から抽出して2値化することで、目的画像を
正しく残しながら、小領域のノイズは勿論のこと、大領
域のノイズが除去された2値化画像を得ることができる
【図面の簡単な説明】
第1図はこの発明を適用する2値化装置の一実施例を示
すブロック構成図、第2図は第1図の2値化装置におけ
る2値化処理の流れを説明するための図、第3図は第1
図に示すヒストグラム器17の動作を説明するための図
、第4図は従来の2値化処理Q流れを説明するための図
、第5図は従来の2値化処理の問題を説明するための図
である。 11・・・入力画像メモリ、12.19・・・データ変
換器、13、14.20・・・2値化画像メモリ、15
・・・ラベリング器、1B・・・ラベリング画像メモリ
、17・・・ヒストグラム器、18・・・ヒストグラム
テーブル。

Claims (1)

  1. 【特許請求の範囲】 濃淡ディジタルデータで表現される濃淡画像を第1の濃
    度レベルで2値化して第1の2値化画像を得、上記濃淡
    画像を上記第1の濃度レベルより高い第2の濃度レベル
    で2値化して第2の2値化画像を得る第1の2値化手段
    と、 上記第1の2値化画像内の独立した各領域毎に独立のラ
    ベル値を付すラベリング処理を行ってラベリング画像を
    得るラベリング手段と、 上記第2の2値化画像をマスクとして、上記ラベリング
    画像のラベル値毎の画素数を示すヒストグラムを求める
    ヒストグラム手段と、 上記ヒストグラム上で所定値以上の画素数を持つラベル
    値を検出し、この検出したラベル値を持つ画像のみを上
    記ラベリング画像から抽出して2値化して目的とする第
    3の2値化画像を得る第2の2値化手段と、 を具備することを特徴とする2値化方式。
JP1327230A 1989-12-19 1989-12-19 2値化方式 Expired - Lifetime JP2670372B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1327230A JP2670372B2 (ja) 1989-12-19 1989-12-19 2値化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1327230A JP2670372B2 (ja) 1989-12-19 1989-12-19 2値化方式

Publications (2)

Publication Number Publication Date
JPH03188587A true JPH03188587A (ja) 1991-08-16
JP2670372B2 JP2670372B2 (ja) 1997-10-29

Family

ID=18196773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1327230A Expired - Lifetime JP2670372B2 (ja) 1989-12-19 1989-12-19 2値化方式

Country Status (1)

Country Link
JP (1) JP2670372B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004297701A (ja) * 2003-03-28 2004-10-21 Matsushita Electric Ind Co Ltd 映像処理装置および撮像システム
US7738696B2 (en) 2005-09-06 2010-06-15 Canon Kabushiki Kaisha Image processing apparatus and method for extracting a document area

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004297701A (ja) * 2003-03-28 2004-10-21 Matsushita Electric Ind Co Ltd 映像処理装置および撮像システム
US7738696B2 (en) 2005-09-06 2010-06-15 Canon Kabushiki Kaisha Image processing apparatus and method for extracting a document area

Also Published As

Publication number Publication date
JP2670372B2 (ja) 1997-10-29

Similar Documents

Publication Publication Date Title
JP2696211B2 (ja) 濃淡画像からのパターン認識方法及び装置
JP2006067585A (ja) デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置
EP1510963A3 (en) Image processing apparatus, image processing method, program and storage medium
CN111931769A (zh) 结合rpa及ai的***处理、装置、计算设备及存储介质
CN111209865A (zh) 文件内容提取方法、装置、电子设备及存储介质
Saddami et al. Improvement of binarization performance using local otsu thresholding.
JP2004280334A (ja) 画像読み取り装置
JPH03188587A (ja) 2値化方式
JPS61141087A (ja) 画像処理方法及び装置
CN113627442A (zh) 医疗信息的录入方法、装置、设备及存储介质
JPS63115279A (ja) 領域抽出装置
CN110889401A (zh) 一种基于opencv库的文本版面识别方法
CN117314951B (zh) 一种二维码识别预处理方法及***
JP3462727B2 (ja) 文字列2値化装置
KR940004476A (ko) 화상대조방법
CN101789081B (zh) 模糊文档图像的二值化方法及其设备
JP2960468B2 (ja) 濃淡画像の2値化方法及び装置
JP2001291056A (ja) 文書画像認識装置及び記録媒体
JPS62247473A (ja) 画像処理装置
JPH10105647A (ja) コンテナ番号読取り装置及びコンテナ番号読取り方法
JPS63184886A (ja) 画像処理における2値化方式
JPH07160815A (ja) 輪郭強調による画像二値化処理方法及び装置
JP2773871B2 (ja) 画像データの2値化方式
JPH04142676A (ja) 2値画像変換方法
CN112785508A (zh) 一种电子文档图片去噪的方法和装置