JP2010219857A - ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 - Google Patents

ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 Download PDF

Info

Publication number
JP2010219857A
JP2010219857A JP2009064023A JP2009064023A JP2010219857A JP 2010219857 A JP2010219857 A JP 2010219857A JP 2009064023 A JP2009064023 A JP 2009064023A JP 2009064023 A JP2009064023 A JP 2009064023A JP 2010219857 A JP2010219857 A JP 2010219857A
Authority
JP
Japan
Prior art keywords
noise component
threshold
threshold value
background
show
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009064023A
Other languages
English (en)
Other versions
JP5262877B2 (ja
Inventor
Taira Obara
平 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2009064023A priority Critical patent/JP5262877B2/ja
Publication of JP2010219857A publication Critical patent/JP2010219857A/ja
Application granted granted Critical
Publication of JP5262877B2 publication Critical patent/JP5262877B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】 画像データから裏写りや下地のノイズ成分を効率よく除去することができなかった。
【解決手段】 文字の画像を含む画像データを入力し、文字を含む可能性が高い矩形領域を検出する(S1)。検出された矩形領域の情報を入力し、同矩形領域以外の領域にある各画素の階調値についてヒストグラム(度数分布)を作成する(S2)。矩形領域外のヒストグラムの情報を入力し、同情報に基づいて下地の有無の判定を行う(S3)。下地がないと判定された場合に裏写りを除去するための閾値を設定し(S4)、下地があると判定されたときに白抜きの文字の有無を判定する(S6)。白抜きの文字がないと判定された場合に、裏写りを除去するための閾値を設定し(S4)、白文字があると判定された場合には、下地を残して白文字を判読可能とするための閾値を設定する(S7)。
【選択図】 図1

Description

本発明は、ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体に関する。
特許文献1に開示される従来技術では、原稿の表面と裏面の画像を読取り、裏面の画像を反転して表面の画像に加えることにより、裏写り部分を相殺する画像処理装置が開示されている。
特許文献2に開示される従来技術では、原稿の画像濃度分布情報を基にして裏写りレベルを判定し、予め設定しておいた閾値を選択して二値化処理を行う。
特開平10−304204 特開2005−277886
上述した特許文献1の技術においては、原稿の表面と裏面の画像の両方を読取る必要があるので、装置の構成が複雑となり価格も高価になるという課題があった。
上述した特許文献2の技術においては、 裏写りレベルを画像濃度分布情報の中間調のピークを基に判定しているが、写真等の中間調部分に多くの画素が分布している画像については裏写りのレベルを判定することは難しい。
また、裏写りの割合が多くない場合は画像濃度分布情報の中間調のピークとして現われないので、裏写りのレベルを判定することは難しいという課題があった。
本発明の目的は、画像データから裏写りや下地のノイズ成分を効率よく除去することにある。
上記課題を解決するため、本発明においては、上記画像データにおける所定の領域を処理対象として設定する処理対象設定手段と、
上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の度数分布を求める度数分布取得手段と、
同求められた度数分布に基づいて上記閾値を算出する閾値算出手段と、
上記閾値を利用して上記領域の画像データからノイズ成分を除去するノイズ成分除去手段とを具備する構成としてある。
上記のように構成した本発明においては、処理対象設定手段が上記画像データにおける所定の領域を処理対象として設定すると、度数分布取得手段は上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の度数分布を求める。そして、閾値算出手段が同求められた度数分布に基づいて上記閾値を算出すると、ノイズ成分除去手段は上記閾値を利用して上記領域の画像データからノイズ成分を除去する。
本発明の他の態様においては、上記閾値算出手段は、上記度数分布が階調値の明るい側に、広く、偏って存在している場合に裏写りのノイズがある場合の閾値を算出する構成としてある。
上記のように構成した本態様においては、裏写りは一般的に薄く現れるため、文字以外の領域の度数分布では、階調値の明るい側に、広く、偏って存在しがちであり、このような場合に、裏写りのノイズ成分があると判定し、これに適した閾値を算出する。
本発明の他の態様においては、上記閾値算出手段は、上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の平均に相当する対象領域外平均値を求めるとともに、同対象領域外平均値と所定の第二の閾値とを比較し、同対象領域外平均値が第二の閾値よりも明るい側にあるときに、裏写りのノイズ成分がある場合の閾値を算出する構成としてある。
上記のように構成した本態様においては、閾値算出手段は、上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の平均に相当する対象領域外平均値を求め、同対象領域外平均値と所定の第二の閾値とを比較する。そして、同対象領域外平均値が第二の閾値よりも明るい側にあるときに、裏写りのノイズ成分がある場合の閾値を算出する。
本発明の他の態様においては、上記閾値算出手段は、裏写りのノイズ成分がある場合の閾値として上記度数分布にもとづいて暗い側の裾野の階調値を利用する構成としてある。
上記のように構成した本態様においては、閾値算出手段は、裏写りのノイズ成分がある場合の閾値として上記度数分布にもとづいて暗い側の裾野の階調値を利用する。
本発明の他の態様においては、上記閾値算出手段は、上記度数分布が、所定の階調値を中心とする所定幅の範囲に集中して存在している場合に下地のノイズ成分がある場合の閾値を算出する構成としてある。
上記のように構成した本態様においては、下地は意図的に印刷され、かつ、文字などは判読できる程度の濃さとなっている。このため、閾値算出手段は、上記度数分布が所定の階調値を中心とする所定幅の範囲に集中して存在している場合に下地のノイズ成分があると判定する。
本発明の他の態様においては、上記閾値算出手段は、上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の平均に相当する対象領域外平均値を求めるとともに、同対象領域外平均値と所定の第三の閾値とを比較し、同対象領域外平均値が同第三の閾値よりも暗い側にあるときに、下地のノイズ成分がある場合の閾値を算出する構成としてある。
上記のように構成した本態様においては、閾値算出手段は、上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の平均に相当する対象領域外平均値を求め、同対象領域外平均値と所定の第三の閾値とを比較する。そして、同対象領域外平均値が同第三の閾値よりも暗い側にあるときに、下地のノイズ成分がある場合の閾値を算出する。
本発明の他の態様においては、上記閾値算出手段は、上記処理対象として設定された領域の中で階調値が暗い側から明るい側へ大きく変化する境界領域における明るい側の画素を検出するとともに、同階調値の平均である境界領域平均値を求め、同境界領域平均値が上記対象領域外平均値よりも明るい側にあるときに下地を残す場合の閾値を算出する構成としてある。
上記のように構成した本態様においては、濃いめの下地に白抜きで文字を記載する場合がある。文字の輪郭部分は階調値が暗い側から明るい側へと大きく変化する境界領域となり、この境界領域での明るい側の画素は、白エッジと呼ばれる。白抜きの文字があれば、白エッジの階調値は明るい側の画素となり、白エッジの階調値の度数分布は明るい側に偏る。反対に、通常の黒文字があれば白エッジは下地の画素となり、白エッジの階調値の度数分布は暗い側に偏る。白抜きの文字がある時に下地を消してしまうと白抜きの文字が判別できなくなる。このことより、閾値算出手段は、上記処理対象として設定された領域の中で階調値が暗い側から明るい側へ大きく変化する境界領域における明るい側の画素を検出するとともに、同階調値の平均である境界領域平均値を求め、同境界領域平均値が上記対象領域外平均値よりも明るい側にあるときに下地を残す場合の閾値を算出する。
本発明の他の態様においては、上記閾値算出手段は、下地を残す場合の閾値として上記度数分布にもとづいて明るい側の裾野の階調値を利用する構成としてある。
上記のように構成した本態様においては、閾値算出手段は下地を残す場合の閾値として上記度数分布にもとづいて明るい側の裾野の階調値を利用する。
本発明の他の態様においては、上記閾値算出手段は、下地を消す場合の閾値として上記度数分布にもとづいて暗い側の裾野の階調値を利用する構成としてある。
上記のように構成した本態様においては、閾値算出手段は下地を消す場合の閾値として上記度数分布にもとづいて暗い側の裾野の階調値を利用する。
本発明の他の態様においては、上記画像データにおける所定の領域を処理対象として設定する処理対象設定ステップと、
上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の度数分布を求める度数分布取得ステップと、
同求められた度数分布に基づいて上記閾値を算出する閾値算出ステップと、
上記閾値を利用して上記領域の画像データからノイズ成分を除去するノイズ成分除去ステップとを具備する構成としてある。
上記のように構成した本態様においては、処理対象設定ステップが上記画像データにおける所定の領域を処理対象として設定すると、度数分布取得ステップは上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の度数分布を求める。そして、閾値算出ステップが同求められた度数分布に基づいて上記閾値を算出すると、ノイズ成分除去ステップは上記閾値を利用して上記領域の画像データからノイズ成分を除去する。
むろん、その記録媒体は、磁気記録媒体であってもよいし光磁気記録媒体であってもよいし、今後開発されるいかなる記録媒体においても全く同様に考えることができる。また、一次複製品、二次複製品などの複製段階については全く問う余地無く同等である。
さらに、一部がソフトウェアであって、一部がハードウェアで実現されている場合においても発明の思想において全く異なるものではなく、一部を記録媒体上に記憶しておいて必要に応じて適宜読み込まれるような形態のものとしてあってもよい。
本発明をソフトウェアで実現する場合、ハードウェアやオペレーティングシステムを利用する構成とすることも可能であるし、これらと切り離して実現することもできる。例えば、各種の演算処理といっても、その実現方法はオペレーティングシステムにおける所定の関数を呼び出して処理することも可能であれば、このような関数を呼び出すことなくハードウェアから入力することも可能である。そして、実際にはオペレーティングシステムの介在のもとで実現するとしても、プログラムが媒体に記録されて流通される過程においては、このプログラムだけで本発明を実施できるものと理解することができる。
また、本発明をソフトウェアで実施する場合、発明がプログラムを記録した媒体として実現されるのみならず、本発明がプログラム自体として実現されるのは当然であり、プログラム自体も本発明に含まれる。
上記のように構成した本発明によれば、画像に文字が含まれている画像データを対象とし、文字が含まれる領域を処理対象として設定した場合、このような文字が含まれる領域を除いた領域を対象として各画素の階調値の度数分布を求める。通常、スキャニングを行なって文字認識をしようとする場合、文字以外の領域の裏写りや下地などがノイズ成分として残ると、文字認識の効率が下がる。しかし、文字以外の領域を対象とした度数分布を利用することで、より適切にノイズ成分を分析でき、適切な閾値を算出することが可能となり、効果的にノイズ成分を除去することができる。
また、原稿の片面の画像のみで裏写りを除去することができるので、簡単な構成で実現できる。さらに、中間調に裏写りのピークがない場合にも、精度よく裏写りを除去することができる。
また、請求項2の発明によれば、正確に裏写りを判定できる。
また、請求項3の発明によれば、より具体的に裏写りのノイズ成分の有無を判定できる。
また、請求項4の発明によれば、求められた度数分布にもとづいて暗い側の裾野の階調値を閾値とすれば、裏写りは閾値よりも暗い側にあることになり、裏写りは消されることになる。
また、請求項5の発明によれば、正確に下地を判定できる。単に裏写り除去を用いて二値化を行った場合、下地濃度が濃く文字が白文字で書かれている原稿については、下地が白くなり白文字が読めなくなってしまう。
そこで、このようにして「下地濃さ判定」を行うことにより、下地と文字の濃度の関係から原稿の下地を消すべきか、残すべきかを判断することができる。
また、請求項6の発明によれば、より具体的に下地のノイズ成分の有無を判定できる。
また、請求項7の発明によれば、白抜きの文字がある場合には下地を残すことにより、文字を判別不能とさせなくできる。
また、請求項8の発明によれば、求められた度数分布にもとづいて明るい側の裾野の階調値を閾値とすれば、下地は閾値よりも暗い側にあることになり、下地を残すことになる。そして、この処理を行うことにより、「下地が白くなり白文字が読めなくなってしまう」といった問題も解決できる。
また、請求項9の発明によれば、求められた度数分布にもとづいて暗い側の裾野の階調値を閾値とすれば、下地は閾値よりも明るい側にあることになり、下地を消すことになる。
また、請求項10の発明によれば、画像に文字が含まれている画像データを対象とし、文字が含まれる領域を処理対象として設定した場合、このような文字が含まれる領域を除いた領域を対象として各画素の階調値の度数分布を求める。通常、スキャニングを行なって文字認識をしようとする場合、文字以外の領域の裏写りや下地などがノイズ成分として残ると、文字認識の効率が下がる。しかし、文字以外の領域を対象とした度数分布を利用することで、より適切にノイズ成分を分析でき、適切な閾値を算出することが可能となり、効果的にノイズ成分を除去することができる。
また、原稿の片面の画像のみで裏写りを除去することができるので、簡単な構成で実現できる。さらに、中間調に裏写りのピークがない場合にも、精度よく裏写りを除去することができる。
ノイズ成分除去処理のフローチャートである。 矩形領域の検出を説明する図である。 矩形領域外のヒストグラムを説明する図である。 下地有無判定のフローチャートである。 矩形領域外のヒストグラムを説明する図である。 白いエッジのヒストグラムを説明する図である。 白文字判定を説明する図である。 設定する閾値と矩形領域外のヒストグラムを説明する図である。 裏写り除去の結果を説明する図である。 下地消しの結果を説明する図である。 下地残しの結果を説明する図である。 カラー画像に応用した結果を説明する図である。
以下、図面を参照しながら、本発明の実施の形態について、詳細に説明する。
図1は、ノイズ成分除去処理のフローチャートである。
同図は、メインルーチンとして、矩形領域の検出(S1)、矩形領域外のヒストグラム作成(S2)、下地濃さ判定(S3)、裏写り除去閾値設定処理(S4)、裏写り除去処理(S5)、白文字判定(S6)、下地残し閾値設定処理(S7)、下地残し処理(S8)を示している。
次に、これらについて説明する。
矩形領域の検出(S1)は、画像データの中で文字や絵柄が含まれている領域を検出する処理である。矩形領域外のヒストグラム作成(S2)は、検出された領域以外の領域の画素の階調値について度数分布を作成する処理である。下地濃さ判定(S3)は、作成された度数分布に基づいて下地の有無を判定する処理である。裏写り除去閾値設定処理(S4)は、裏写りがあると判定された時に裏写り除去のための閾値を設定する処理である。裏写り除去処理(S5)は、設定された閾値を利用して裏写りを除去する処理である。白文字判定(S6)は、作成された度数分布に基づいて白文字の有無を判定する処理である。下地残し閾値設定処理(S7)は、白文字があると判定された時に下地を残すための閾値を設定する処理である。下地残し処理(S8)は、設定された閾値を利用して下地を残しつつノイズ成分を除去する処理である。
次に、これらの関係について説明する。
矩形領域の検出(S1)では、文字の画像を含む画像データを入力し、文字を含む可能性が高い矩形領域を検出する。矩形領域外のヒストグラム作成(S2)では、矩形領域の検出(S1)にて検出された矩形領域の情報を入力し、同矩形領域以外の領域にある各画素の階調値についてヒストグラム(度数分布)を作成する。下地濃さ判定(S3)では、矩形領域外のヒストグラム作成(S2)にて作成した矩形領域外のヒストグラムの情報を入力し、同情報に基づいて下地の有無の判定を行う。裏写り除去閾値設定処理(S4)では、下地濃さ判定(S3)にて下地の有無の判定の結果、下地がないと判定された場合に裏写りを除去するための閾値を設定する。白文字判定(S6)では、下地濃さ判定(S3)にて下地の有無の判定の結果、下地があると判定されれば白抜きの文字の有無を判定する。裏写り除去処理(S5)では、裏写り除去閾値設定処理(S4)にて設定された裏写りを除去するための閾値を利用し、画像データから裏写りを除去する。裏写り除去閾値設定処理(S4)では、白文字判定(S6)にて白抜きの文字がないと判定された場合に、裏写りを除去するための閾値を設定する。下地残し閾値設定処理(S7)では、白文字判定(S6)にて白文字があると判定された場合に、下地を残して白文字を判読可能とするための閾値を設定する。下地残し処理(S8)では、下地残し閾値設定処理(S7)にて下地を残す閾値を設定したら、同閾値を利用して画像データから下地を残してノイズ成分を除去する。
本実施例全体の原理は、入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域以外の輝度分布の裾野を計測して裏写りを除去する閾値を求める。そして、求めた閾値以上の濃度画素を白とする。
むろん、ここで領域を矩形とする必然性はない。入力画像の文字や絵柄といった重要部分が含まれる領域を矩形の単位で抽出する技術は公知となっている。従って、かかる技術を適用すれば矩形領域の抽出は容易である。
しかし、原理からすれば、この領域の形状が矩形である必要はなく、例えば、文字や絵柄といった重要部分を中心とする円形や楕円形といった形状でもよい。
また、本発明は、文字認識のための前処理という位置づけにある。例えば、文字を印刷した書類などをスキャナーなどで多値画像で読み込んだり、風景の中に文字が含まれる写真の画像データなどを処理対象とする。入力が直にスキャナーやデジタルスチルカメラなどである必要はなく、他の機器で取得された画像データを通信によって取得する場合でも全く同様である。文字認識には、いわゆる文字だけでなく、記号等の認識も当然に含まれる。
このような文字認識では処理対象とする画像データが文字部分と背景とに明確に分離されているほど認識効率が良いため、文字以外の成分をノイズ成分として除去する本発明の処理が利用される。
図2は、矩形領域の検出を説明する図である。
矩形領域の検出の手法として、ある一定の閾値で二値化した画像またはエッジ画像(エッジとそれ以外の画素とを二値で示した画像)についてラベリングまたは輪郭追跡を行うことにより検出された領域の外接矩形を取る方法が知られている。
従って、本実施例でもエッジ画像について輪郭追跡を行い、各矩形領域を作成する。
本図では、矩形領域の検出(S1)を行った場合の模式図を示している。
なお、同図は上下方向に三段に図を並べており、上段には「裏写り除去対象画像」を示し、中段には「下地消し対象画像」を示し、下段には「下地残し対象画像」を示している。
また、左右方向には三列に図を並べており、左列には入力画像のイメージを示し、中央列にはエッジ検出した時点でのエッジの様子をイメージ化して示しており、右列には外接矩形で取得した矩形領域を設定した領域分離結果を示している。
図3は、矩形領域外のヒストグラムを説明する図である。
矩形領域検出S1では矩形領域を検出しているが、これは、矩形領域以外の領域を検出することでもある。そして、このようにして求められた矩形領域以外の画像を用いて、各画素の階調値についてヒストグラム(度数分布)を作成する。より具体的には、対象となる領域に含まれる各画素の階調値を参照し、階調値ごとに画素の度数を求めていく。
本図では、得られたヒストグラムの模式図を示している。なお、「0〜255」の階調はデータを8bitで扱った場合を想定している。また、階調値と明るさは、階調値「0」は暗く「255」に近づくほど画像が明るくなっていく関係にある。
同図でも上下方向に三段に図を並べており、上段には「裏写り除去対象画像」を示し、中段には「下地消し対象画像」を示し、下段には「下地残し対象画像」を示している。
また、左右方向には二列に図を並べており、左列には矩形領域以外の領域に残された入力画像のイメージを示し、右列には求められた矩形領域外のヒストグラムの結果を示している。
図4は、下地有無判定のフローチャートである。
同図は、下地有無判定ルーチンとして、矩形領域外ヒストグラムの平均値と任意の閾値との比較(S21)、白いエッジのヒストグラム作成(S22)、矩形領域外ヒストグラムの平均値と白いエッジのヒストグラムの平均値との比較(S23)、下地残し閾値設定処理フラグをオンにする処理(S24)、裏写り除去閾値設定処理フラグをオンにする処理(S25)を示している。
次に、これらについて説明する。
矩形領域外ヒストグラムの平均値と任意の閾値との比較(S21)は、矩形領域外の画素の階調値の平均値と予め設定された閾値とを比較する処理である。白いエッジのヒストグラム作成(S22)は、画像の中で白いエッジの画素を検出し、同画素の階調値について度数分布を作成する処理である。矩形領域外ヒストグラムの平均値と白いエッジのヒストグラムの平均値との比較(S23)は、矩形領域外の画素の階調値の平均値と、白いエッジとされた画素の階調値の平均値とを比較する処理である。下地残し閾値設定処理フラグをオン(S24)は、下地があると判定された場合に後で下地残し閾値設定処理を実行するためにフラグをオンにする処理である。裏写り除去閾値設定処理フラグをオン(S25)は、裏写りがあると判定された場合に後で裏写り除去閾値設定処理を実行するためにフラグをオンにする処理である。
次に、これらの関係について説明する。
矩形領域外ヒストグラムの平均値と任意の閾値との比較(S21)の結果、矩形領域外ヒストグラムの平均値が任意の閾値よりも小さい場合には、白いエッジのヒストグラム作成(S22)にて、画像全体について白いエッジを検出し、その階調値についてヒストグラム(度数分布)を作成する。矩形領域外ヒストグラムの平均値と任意の閾値との比較(S21)の結果、矩形領域外ヒストグラムの平均値が任意の閾値よりも大きい場合は、下地がないため、裏写り除去閾値設定処理フラグをオン(S25)にて、裏写りの処理を実行するように裏写り除去閾値設定処理フラグをオン(S25)にする。白いエッジのヒストグラム作成(S22)にて、白いエッジのヒストグラムを求めたら、それを利用して階調値の平均値を求める。その後、矩形領域外ヒストグラムの平均値と白いエッジのヒストグラムの平均値との比較(S23)にて、同平均値と先に求めた領域外の平均値とを比較し、白文字の有無を判定する。矩形領域外ヒストグラムの平均値と白いエッジのヒストグラムの平均値との比較(S23)の結果、白いエッジの平均値が、領域外の平均値よりも明るい側にある時は、白文字があると判定でき、下地を残す処理を実施するために下地残し閾値設定処理フラグをオン(S24)にする。矩形領域外ヒストグラムの平均値と白いエッジのヒストグラムの平均値との比較(S23)の結果、白いエッジの平均値が、領域外の平均値よりも暗い側にある時は、白文字がないと判定でき、下地の有無にかかわらず裏写りを除去するために裏写り除去閾値設定処理フラグをオン(S25)にする。
上記図4においては、下地有無判定(S3,S6)について説明する。この下地有無判定では、大きな意味で「下地濃さ判定(S3)」と「白文字判定(S6)」を行う。
まず「下地濃さ判定(S3)」では「矩形領域外のヒストグラム検出(S2)」で求めたヒストグラムから平均値を求め、同平均値と任意の閾値(例えば「160」など)の比較を行なう(S21)。ヒストグラムから得られた平均値が同閾値以上であれば後の処理で「裏写り除去閾値設定処理(S4)」を行なうため、裏写り除去閾値設定処理フラグをオンにしておく(S25)。
一方、ヒストグラムから得られた平均値が同閾値以下であれば、「白文字判定(S6)」を行う。
「白文字判定(S6)」では、入力画像中の白いエッジのヒストグラムを作成する(S22)。エッジとは隣接あるいは近隣の範囲の画素間で階調値が大きく変化する境界領域と定義づけることができ、さらに白いエッジとは境界領域における明るい側の画素を指す。このようにして判定される白いエッジの画素の階調値について、階調値ごとに画素の度数を求める。なお、白いエッジを求める対象となるのは矩形領域と矩形領域外を含めた入力画像全体である。
次に、矩形領域外のヒストグラムから得られる平均値と白いエッジのヒストグラムから得られる平均値とを比較する(S23)。矩形領域外のヒストグラムの平均値が白いエッジのヒストグラムの平均値より大きい(暗い側にある)場合は、後の処理で「裏写り除去閾値設定処理(S4)」を行なうため、裏写り除去閾値設定処理フラグをオンにする(S25)。一方、矩形領域外のヒストグラムの平均値が白いエッジのヒストグラムの平均値より小さい(明るい側にある)場合は、後の処理で「下地残し閾値設定処理(S7)」を行なうため、下地残し閾値設定処理フラグをオンにする(S24)。
入力画像中に濃いめの下地があるときには白文字(白抜き文字とも言う)が記載されている可能性がある。この場合に白いエッジは白文字の内側の領域が抽出されるため、かなり明るい画素が抽出されやすく、平均値は大きくなりがちである。これに対して黒文字で記載されている場合は白いエッジは下地自身の領域が抽出されるため、白文字ほど平均値は大きくならない。
この性質を利用することで、下地がある場合に、白いエッジの階調値の平均値が所定の閾値(矩形領域外のヒストグラムから得られる平均値)よりも大きい場合には白文字があると判定することができる。
図5は、矩形領域外のヒストグラムを説明する図である。
同図でも上下方向に三段に図を並べており、上段には「裏写り除去対象画像」を示し、中段には「下地消し対象画像」を示し、下段には「下地残し対象画像」を示している。ここで、「下地消し対象画像」は処理としては「裏写り除去対象画像」と同じ処理なので、上段と中段とで裏写り除去対象画像とを一つのグループとしている。以下においても同じである。
裏写りは裏面の画像がわずかに表面に現れている状態であり、全体的に見れば階調値はかなり明るい側に偏って広く分布する。上段の裏写り除去対象画像の場合にもこのことがよく現れており、矩形領域外のヒストグラムは160に設定された閾値(第二の閾値に相当する)よりも明るい側に広く偏って存在している。
より具体的な判定手法としては、矩形領域外のヒストグラムから得られた平均値(この例では、236)が、上記第二の閾値よりも大きい(明るい側にある)場合に、裏写り除去の対象とするべく、裏写り除去閾値設定処理フラグをオンにする(S25)。
一方、裏写りではなく、下地が入力画像中に含まれることがあるが、下地の場合は意図的に加えているものであり、裏写りほど明るくはない。これを判定するために経験的に得られる閾値(第三の閾値に相当する)と、矩形領域外のヒストグラムから得られた平均値とを比較し、後者の値が小さい(暗い側にある)ときに下地があると判定する。この処理自体を下地の濃さの判定と呼んでいる。
濃い下地がある場合には、白文字がある可能性があり、次の白文字判定(S6)のために白いエッジのヒストグラム作成(S22)へと続く。
図6は、白いエッジのヒストグラムを説明する図である。
同図では上下方向に二段に図を並べており、上段には「裏写り除去対象画像」を示し、下段には「下地残し対象画像」を示している。
また、左右方向には二列に図を並べており、左列には白いエッジ部分を示す画素のイメージを示し、右列にはこのような画素の階調値について作成される白いエッジのヒストグラムを示している。
上段の入力画像には黒い文字が記載されており、黒い文字の場合は白いエッジの画素は下地であり、分布範囲は暗い側に偏っている。
一方、下段の入力画像には白い文字が記載されており、白い文字の場合は白いエッジの画素は文字の内側であり、分布範囲は明るい側に偏っている。
図7は、白文字判定を説明する図である。
同図では上下方向に二段に図を並べており、上段には「裏写り除去対象画像」を示し、下段には「下地残し対象画像」を示している。
上段の入力画像には黒い文字が記載されており、ヒストグラムのの分布は暗い側に偏っている。また、同ヒストグラムから得られる階調値の平均値(この例では91)は、矩形領域外のヒストグラムから得られた平均値(この例では、123)よりも小さい(暗い側にある)。
この場合には、下地と裏写りを除去する対象とするべく、裏写り除去閾値設定処理フラグをオンにする(S23,S25)。
一方、下段の入力画像には白い文字が記載されており、ヒストグラムのの分布は明るい側に偏っている。また、同ヒストグラムから得られる階調値の平均値(この例では193)は、矩形領域外のヒストグラムから得られた平均値(この例では、123)よりも大きい(明るい側にある)。
この場合には、白文字を判読可能に保持するために下地を残す対象とするべく、下地残し閾値設定処理フラグをオンにする(S23,S24)。
白い文字の場合は白いエッジの画素は文字の内側であり、分布範囲は明るい側に偏っている。
図8は、設定する閾値と矩形領域外のヒストグラムを説明する図である。
同図では上下方向に三段に図を並べており、上段には「裏写り除去対象画像」を示し、中段には「下地消し対象画像」を示し、下段には「下地残し対象画像」を示している。
また、左右方向には二列に図を並べており、左列には矩形領域以外の領域に残された入力画像のイメージを示し、右列には求められた矩形領域外のヒストグラムの結果を示している。
下地残し閾値設定処理(S7)と裏写り除去閾値設定処理(S4)では、図4に示す下地有無判定の中(S24,S25)で設定されたフラグに基づき、矩形領域外のヒストグラムを用いて下地を残す場合の閾値と裏写りを消す場合の閾値を設定する。
裏写り除去閾値設定処理(S4)では、矩形領域外のヒストグラム作成(S2)で求めたヒストグラムにおける暗い側の裾野を求め、その求めた裾野部分の階調値を裏写り除去閾値とする。
また、下地残し閾値設定処理(S7)では、矩形領域外のヒストグラムにおける明るい側の裾野を求め、その求めた裾野部分の階調値を下地残し閾値とする。
裾野は、それ以上またはそれ以下の階調値のノイズ成分を除去するために、ヒストグラムの分布範囲における上端または下端の階調値を指している。
より、具体的な裾野の検出方法は、ヒストグラムの階調値「0(暗い側」から度数を検出していき度数が「0」を超えた階調値を裾野とすることが考えられる。但し、誤差成分が含まれる場合があるので、度数が「0」を超えるだけではなく、予め試行錯誤を経て取得しておいた経験値(任意に設定した値)以上またはヒストグラムの全体に占める任意のパーセント以上となった階調値を裾野として検出することとしても良い。このような経験値として、固定値を採用しても良いし、全画素数の1%というような割合値を採用しても良い。
同図に示す例では、誤差成分を0.1%と仮定して閾値を設定している。
図9は、裏写り除去の結果を説明する図である。
同図では、左右方向には図を並べており、左方にはノイズ成分の除去前の画像を示しており、右方にはノイズ成分を除去した二値化画像を示している。
裏写り除去処理(S5)では、裏写り除去閾値設定処理(S4)で求めた閾値で二値化を行う。ここでいう二値化では、閾値以下の階調値の画素については「0」を、閾値を超える階調値の画素については「1」を設定する。閾値を超える成分をノイズ成分とするか否かが重要であり、結果として二値とする必要はなく、元の階調数のまま閾値を超える階調値を最大階調値に設定することも広義の二値化と呼ぶ。
図10は、下地消しの結果を説明する図である。
同図では、左右方向には図を並べており、左方にはノイズ成分の除去前の画像を示しており、右方にはノイズ成分を除去した二値化画像を示している。
この例では、下地があるが、白文字はない場合であり、下地自身がノイズ成分として除去の対象となる。二値化の内容については図9に示すものと同様である。
図11は、下地残しの結果を説明する図である。
本図はノイズ成分として下地があるものの、白文字もある場合におけるノイズ成分が除去される前後の過程を示している。
同図では、左右方向には図を並べており、左方にはノイズ成分の除去前の画像を示しており、右方にはノイズ成分を除去した二値化画像を示している。
下地残し処理(S8)では、下地残し閾値設定処理(S7)で求めた閾値で二値化を行う。二値化の内容については図9に示すものと同様である。
下地を残すように閾値が設定される結果、同閾値を超える画素は全て「1」に設定され、下地を含めて同閾値を超えない画素は「0」に設定される。
図12は、カラー画像に応用した結果を説明する図である。
カラー・グレー画像において下地有無判定だけで裏写り画像の判断を行い、裏写り除去画像と判定された場合は求めた裏写り除去閾値以上の画素の階調値を「255」で置き換え、それ以外の場合は何もしないことで裏写り除去処理の機能としても使用できる。
なお、この例では裏写り除去閾値以上の画素を「255」で置き換えたが入出力変換テーブルなどによる補正により裏写り除去を行ってもかまわない。
以上、説明したように、本実施例では、以下の作用と効果を有する。
入力画像の文字や絵柄を矩形領域として検出し、検出した矩形領域以外のヒストグラムから下地の有無の判定を行い、その判定結果に応じてヒストグラムの暗い側の裾野または明るい側の裾野を計測して求める。
裏写りを除去し、下地とそれ以外を分離するような適切な二値化閾値を算出できる。
前記のヒストグラムを用いて原稿の下地の有無を判定する。
これにより、原稿の下地を消すべきか、残すべきか簡単に判定できる。
下地の有無を判定する方法として下地の濃さと白文字の有無について判定する。
これにより、下地の有無の判定に下地の濃さと白文字の有無の判定を用いることで、下地が濃い原稿に対して白文字で書かれている原稿か黒文字で書かれている原稿かを判断できる。
判定結果が下地有りの場合は、先に作成したヒストグラムの明るい側の裾野を検出し、それ以外の場合は同ヒストグラムの暗い側の裾野を検出する。
これにより、下地が濃い原稿に対して白文字で書かれている原稿の下地を残す閾値と裏写りを除去する閾値が精度良く求まる。
次に、特許請求の範囲の記載と実施例の各構成部品との対応を示す。
特許請求の範囲に記載した処理対象設定手段は、矩形領域の検出(S1)とによって構成されている。
特許請求の範囲に記載した度数分布取得手段は、矩形領域外のヒストグラム作成(S2)とによって構成されている。
特許請求の範囲に記載した閾値算出手段は、下地濃さ判定(S3)と、裏写り除去閾値設定処理(S4)と、白文字判定(S6)と、下地残し閾値設定処理(S7)と、矩形領域外ヒストグラムの平均値と任意の閾値との比較(S21)と、白いエッジのヒストグラム作成(S22)と、矩形領域外ヒストグラムの平均値と白いエッジのヒストグラムの平均値との比較(S23)と、下地残し閾値設定処理フラグをオンにする処理(S24)と、裏写り除去閾値設定処理フラグをオンにする処理(S25)とによって構成されている。
特許請求の範囲に記載したノイズ成分除去手段は、裏写り除去処理(S5)と、下地残し処理(S8)とによって構成されている。
特許請求の範囲に記載した処理対象設定ステップは、矩形領域の検出(S1)とによって構成されている。
特許請求の範囲に記載した閾値算出ステップは、下地濃さ判定(S3)と、裏写り除去閾値設定処理(S4)と、白文字判定(S6)と、下地残し閾値設定処理(S7)と、矩形領域外ヒストグラムの平均値と任意の閾値との比較(S21)と、白いエッジのヒストグラム作成(S22)と、矩形領域外ヒストグラムの平均値と白いエッジのヒストグラムの平均値との比較(S23)と、下地残し閾値設定処理フラグをオンにする処理(S24)と、裏写り除去閾値設定処理フラグをオンにする処理(S25)とによって構成されている。
特許請求の範囲に記載したノイズ成分除去ステップは、裏写り除去処理(S5)と、下地残し処理(S8)とによって構成されている。
なお、本発明はソフトウェアを利用して各構成手段を実現しているが、ハードウェア、例えばアナログ回路やデジタル回路で実現することもできるし、ASICのような論理的作用をなすICなどで実現することも可能である。
なお、本発明は上記実施例に限られるものでないことは言うまでもない。当業者であれば言うまでもないことであるが、
・上記実施例の中で開示した相互に置換可能な部材および構成等を適宜その組み合わせを変更して適用すること
・上記実施例の中で開示されていないが、公知技術であって上記実施例の中で開示した部材および構成等と相互に置換可能な部材および構成等を適宜置換し、またその組み合わせを変更して適用すること
・上記実施例の中で開示されていないが、公知技術等に基づいて当業者が上記実施例の中で開示した部材および構成等の代用として想定し得る部材および構成等と適宜置換し、またその組み合わせを変更して適用すること
は本発明の一実施例として開示されるものである。
本発明は、、ノイズ成分除去プログラムを記録した媒体に利用することができる。
S1…矩形領域の検出、S2…矩形領域外のヒストグラム作成、S3…下地濃さ判定、S4…裏写り除去閾値設定処理、S5…裏写り除去処理、S6…白文字判定、S7…下地残し閾値設定処理、S8…下地残し処理、S21…矩形領域外ヒストグラムの平均値と任意の閾値との比較、S22…白いエッジのヒストグラム作成、S23…矩形領域外ヒストグラムの平均値と白いエッジのヒストグラムの平均値との比較、S24…下地残し閾値設定処理フラグをオンにする処理、S25…裏写り除去閾値設定処理フラグをオンにする処理

Claims (10)

  1. 多数の画素からなる画像における多値の画像データを入力し、所定の閾値を設定してノイズ成分を除去するノイズ成分除去装置において、
    上記画像データにおける所定の領域を処理対象として設定する処理対象設定手段と、
    上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の度数分布を求める度数分布取得手段と、
    同求められた度数分布に基づいて上記閾値を算出する閾値算出手段と、
    上記閾値を利用して上記領域の画像データからノイズ成分を除去するノイズ成分除去手段とを具備することを特徴とするノイズ成分除去装置。
  2. 上記閾値算出手段は、上記度数分布が階調値の明るい側に、広く、偏って存在している場合に裏写りのノイズがある場合の閾値を算出することを特徴とする請求項1に記載のノイズ成分除去装置。
  3. 上記閾値算出手段は、上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の平均に相当する対象領域外平均値を求めるとともに、同対象領域外平均値と所定の第二の閾値とを比較し、同対象領域外平均値が第二の閾値よりも明るい側にあるときに、裏写りのノイズ成分がある場合の閾値を算出することを特徴とする請求項2に記載のノイズ成分除去装置。
  4. 上記閾値算出手段は、裏写りのノイズ成分がある場合の閾値として上記度数分布にもとづいて暗い側の裾野の階調値を利用することを特徴とする請求項2または請求項3のいずれかに記載のノイズ成分除去装置。
  5. 上記閾値算出手段は、上記度数分布が、所定の階調値を中心とする所定幅の範囲に集中して存在している場合に下地のノイズ成分がある場合の閾値を算出することを特徴とする請求項1〜請求項4のいずれかに記載のノイズ成分除去装置。
  6. 上記閾値算出手段は、上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の平均に相当する対象領域外平均値を求めるとともに、同対象領域外平均値と所定の第三の閾値とを比較し、同対象領域外平均値が同第三の閾値よりも暗い側にあるときに、下地のノイズ成分がある場合の閾値を算出することを特徴とする請求項5に記載のノイズ成分除去装置。
  7. 上記閾値算出手段は、上記処理対象として設定された領域の中で階調値が暗い側から明るい側へ大きく変化する境界領域における明るい側の画素を検出するとともに、同階調値の平均である境界領域平均値を求め、同境界領域平均値が上記対象領域外平均値よりも明るい側にあるときに下地を残す場合の閾値を算出することを特徴とする請求項6に記載のノイズ成分除去装置。
  8. 上記閾値算出手段は、下地を残す場合の閾値として上記度数分布にもとづいて明るい側の裾野の階調値を利用することを特徴とする請求項5〜請求項7のいずれかに記載のノイズ成分除去装置。
  9. 上記閾値算出手段は、下地を消す場合の閾値として上記度数分布にもとづいて暗い側の裾野の階調値を利用することを特徴とする請求項5または請求項6のいずれかに記載のノイズ成分除去装置。
  10. 多数の画素からなる画像における多値の画像データを入力し、所定の閾値を設定してノイズ成分を除去するノイズ成分除去プログラムを記録した媒体において、
    上記画像データにおける所定の領域を処理対象として設定する処理対象設定ステップと、
    上記画像データにおける上記設定された領域を除いた領域を対象として各画素の階調値の度数分布を求める度数分布取得ステップと、
    同求められた度数分布に基づいて上記閾値を算出する閾値算出ステップと、
    上記閾値を利用して上記領域の画像データからノイズ成分を除去するノイズ成分除去ステップとを具備することを特徴とするノイズ成分除去プログラムを記録した媒体。
JP2009064023A 2009-03-17 2009-03-17 ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体 Expired - Fee Related JP5262877B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009064023A JP5262877B2 (ja) 2009-03-17 2009-03-17 ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009064023A JP5262877B2 (ja) 2009-03-17 2009-03-17 ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体

Publications (2)

Publication Number Publication Date
JP2010219857A true JP2010219857A (ja) 2010-09-30
JP5262877B2 JP5262877B2 (ja) 2013-08-14

Family

ID=42978203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009064023A Expired - Fee Related JP5262877B2 (ja) 2009-03-17 2009-03-17 ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体

Country Status (1)

Country Link
JP (1) JP5262877B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013115612A (ja) * 2011-11-29 2013-06-10 Brother Ind Ltd 画像読取装置及び地色補正プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000253250A (ja) * 1999-03-02 2000-09-14 Seiko Epson Corp 画像データ下地判定方法、画像データ下地判定装置および画像データ下地判定制御プログラムを記録した媒体
JP2002027252A (ja) * 2000-07-10 2002-01-25 Ricoh Co Ltd 画像処理装置
JP2003051946A (ja) * 2001-05-28 2003-02-21 Sharp Corp 画像処理方法、画像処理装置、画像処理装置を備えた画像形成装置、画像処理プログラム、およびこれを記録したコンピュータ読み取り可能な記録媒体
JP2004336282A (ja) * 2003-05-06 2004-11-25 Ricoh Co Ltd 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
JP2006279096A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、画像処理方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000253250A (ja) * 1999-03-02 2000-09-14 Seiko Epson Corp 画像データ下地判定方法、画像データ下地判定装置および画像データ下地判定制御プログラムを記録した媒体
JP2002027252A (ja) * 2000-07-10 2002-01-25 Ricoh Co Ltd 画像処理装置
JP2003051946A (ja) * 2001-05-28 2003-02-21 Sharp Corp 画像処理方法、画像処理装置、画像処理装置を備えた画像形成装置、画像処理プログラム、およびこれを記録したコンピュータ読み取り可能な記録媒体
JP2004336282A (ja) * 2003-05-06 2004-11-25 Ricoh Co Ltd 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
JP2006279096A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、画像処理方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013115612A (ja) * 2011-11-29 2013-06-10 Brother Ind Ltd 画像読取装置及び地色補正プログラム

Also Published As

Publication number Publication date
JP5262877B2 (ja) 2013-08-14

Similar Documents

Publication Publication Date Title
US8923612B2 (en) Image processing apparatus and method, and program
KR100927528B1 (ko) 전자 워터마크 매립 장치 및 검출 장치
JP6890427B2 (ja) 車番認識装置
JP2004265264A (ja) 画像処理装置
JP5847062B2 (ja) 画像処理装置
JP4853560B2 (ja) 画像処理方法、画像処理装置およびコンピュータプログラム
JP2010232795A (ja) 階調数低減装置、階調数低減方法
JP2010225047A (ja) ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体
JP5262877B2 (ja) ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体
US10846863B2 (en) Pixel binarization apparatus, method, and storage medium
JP3906221B2 (ja) 画像処理方法及び画像処理装置
JP2010219858A (ja) ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体
JP4010440B2 (ja) 影検出を伴う画像処理装置
JP5264956B2 (ja) 2次元コード読取装置及びその方法
JP2009140244A (ja) 画像処理プログラム及び画像処理装置
Jain et al. Shadow removal for umbrageous information recovery in aerial images
JP3830350B2 (ja) カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体
JP6317413B1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JPH0624014B2 (ja) 濃淡画像の処理方法
JP5272841B2 (ja) ノイズ成分除去装置、ノイズ成分除去方法
JP3966448B2 (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JP2006215964A (ja) 文字認識装置
JP2005311992A (ja) 画像処理装置および画像処理方法ならびに記憶媒体、プログラム
KR20230020448A (ko) 자동화 아티팩트 검출
TWI382359B (zh) 影像處理裝置及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130415

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees