JPH10233693A - 画像処理方法及び装置並びに記憶媒体 - Google Patents

画像処理方法及び装置並びに記憶媒体

Info

Publication number
JPH10233693A
JPH10233693A JP9328167A JP32816797A JPH10233693A JP H10233693 A JPH10233693 A JP H10233693A JP 9328167 A JP9328167 A JP 9328167A JP 32816797 A JP32816797 A JP 32816797A JP H10233693 A JPH10233693 A JP H10233693A
Authority
JP
Japan
Prior art keywords
area
image processing
module
image
storage medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9328167A
Other languages
English (en)
Inventor
Shinichi Sunakawa
伸一 砂川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP9328167A priority Critical patent/JPH10233693A/ja
Priority to US08/991,636 priority patent/US5995657A/en
Publication of JPH10233693A publication Critical patent/JPH10233693A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 領域抽出率の向上を図った画像処理方法及び
装置を提供する。 【解決手段】 差分値計算部23により画像ブロック内
で隣接している係数同士の差分値を計算し、その差分値
データの平均値と分散値を分布状況計算部24により計
算し、これら平均値と分散値をしきい値判定部25によ
りあらかじめ設定されたしきい値と比較し、当該ブロッ
クが文字パターン領域であるか否かを判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像に直交変換処
理を施して所望の領域を抽出する画像処理方法及び装置
並びにこれら画像処理方法及び装置に使用する記憶媒体
に関する。
【0002】
【従来の技術】従来より、複写機やOCR(光学式文字
読取装置)等の機器において、画像を空間周波数軸上の
データに変換し、写真画像領域や網点画像領域或いは文
字画像領域を分離する方法が提案されている。
【0003】(1)画像電子学会研究会予稿93−01
−02においては、文字画像と網点画像の周波数特性の
違いに着目して画像領域を分離する方法(以下、第1の
従来技術と記述する)が開示されている。この方法で
は、まず、画像データを8×8サイズの小ブロックに分
割し、離散コサイン変換(Discrete Cosi
ne Transform:DCT)処理を行なう。こ
のDCTは、JPEG(Joint Photographic Experts G
roup)標準等の画像符号化方式に広く利用されており、
画像データを周波数軸上のデータに変換するものであ
る。この結果として、各ブロックの係数は、1行1列が
ブロックの直流成分、列方向は水平方向の周波数、行方
向は垂直方向の周波数を表わすようになる。各方向と
も、行(列)の番号が増えるに従って、より高い周波数
を示している。
【0004】上記DCTに続いて、ジグザグスキャン処
理を行ない、2次元のブロックデータを1次元に変換す
る。このジグザグスキャン処理も上記JPEG標準等で
用いられている処理方法であり、図11に示すように、
低周波部分から高周波部分へ斜め方向にスキャンを行な
う。次のステップとして下記式(1)に従って「ジグザ
グレート」を計算する。
【0005】 ZigZag_Rate〔i〕=ZigZag〔i〕×2-ZigZag〔i-1〕-ZigZag〔i+1〕 …(1) (但し、iは1〜63)
【0006】続いて、ジグザグレートの低周波部分と高
周波部分での積算を行ない、それぞれZZ_Rate_moji、
ZZ_Rate_HTとする。そして、下記式(2)の判定条件
が成立するときは文字画像、下記式(3)の判定条件が
成立するときは網点画像と判定する。これは、ジグザグ
レートについての、文字画像は低周波部分の値が大き
く、網点画像は高周波部分の値が大きいという性質を利
用したものである。
【0007】ZZ_Rate_moji+Key≧定数1 …(2) ZZ_Rate_HT +Key≧定数2 …(3) ここで、定数1,2は実験的に設定し、Keyは周囲4ブロッ
クの判定結果を下記式(4)に従って計算したものを用
いる。更に、下記式(4)中のflagは、判定結果が文字
画像ならば負、網点画像ならば正の値をとる。
【0008】 Key=0.25(flag(上)+flag(左))+0.125(flag(二つ左)+flag(斜め上)) …式(4)
【0009】(2)次に、画像電子学会誌第20巻5号
の「適応的量子化を用いたDCT符号化法」における処
理について説明する。これは、文字画像と網点画像を分
離して画像圧縮の量子化テーブルを切り換えることで、
文字画像の劣化防止と網点画像部分の圧縮率向上を図る
ことを目的とする方式(以下、第2の従来技術と記述す
る)である。
【0010】同方式においても、初めに画像データを8
×8サイズのブロックに分割し、DCT変換を行なう。
次に、図12(a)〜(e)に示す領域90〜94に含
まれる係数の絶対値の和をそれぞれ算出する。そして、
領域90〜94の係数和の最大値が90より大きく且つ
領域91〜94の係数和の最大値が所定のしきい値Aよ
り大きい場合に、ブロックを網点画像であると判定す
る。また、図12(f)において、領域95に含まれる
係数の絶対値の和がしきい値Bより大きく且つ網点画像
ブロックと判定されなかった場合に、文字画像ブロック
であると判定する。
【0011】(3)次に、特開平2−202771号の
「ファクシミリ装置」における処理を説明する。これ
は、2値画像領域と中間調画像領域の分離の明確化を目
的とする方式である(以下、第3の従来技術と記述す
る)。同方式における画像領域分離パラメータ決定部で
は、画像データを4×4サイズのブロックに分割し、2
次元アダマール変換処理を行なう。画像領域分離パラメ
ータは、Yijをアダマール(Hadamard)変換の
係数要素とすると、下記式(5)で計算する。
【0012】 L=ΣΣyij2(i+j=3、4、5、6) …(5)
【0013】そして、Lの値に従って、2値化のスライ
スレベルが決定している。これは、「2値画像領域に仮
定した変換結果の方が空間周波数の高域に対してエネル
ギーが大」であることによっている。即ち、2値画像の
領域はLが大きな値に、中間調画像の領域はLが小さな
値になることを示している。
【0014】
【発明が解決しようとする課題】しかしながら、上記従
来例においては、文字と中間調画像が混在した場合の抽
出率が低かった。第1及び第2の従来技術は網点画像を
検出する技術であり、中間調画像からの抽出に対応して
いないという問題点があった。また、第3の従来技術に
おいて、画像パターンによっては円滑に抽出することが
できない場合があるという問題点があった。特に、一度
でも非可逆圧縮された画像は、高域部分の係数(高域係
数)が低い値になる。そこで、高域係数の二乗和がしき
い値に達せず、文字として検出されない場合があった。
また、太い線の文字パターンを含む場合は、係数が低い
周波数にも分散されてしまうため、検出できない場合が
生じる。
【0015】本発明は上述した従来の技術の有するこの
ような問題点に鑑みてなされたものであり、その第1の
目的とするところは、文字パターンの背景が中間画像で
あるか否かに拘らず、高い抽出率で領域の切り出しを行
なうことができる画像処理方法及び装置を提供しようと
するものである。
【0016】また、本発明の第2の目的とするところ
は、本発明の画像処理方法及び装置を円滑に制御するこ
とができる記憶媒体を提供しようとするものである。
【0017】
【課題を解決するための手段】上記第1の目的を達成す
るために本発明に係る画像処理方法は、画像を分割して
直交変換を行なう直交変換ステップと、ブロック内で隣
接する係数間の差異を検出する係数間差異検出ステップ
と、該係数間差異検出ステップでの検出結果からブロッ
ク内での分布状況を計算する分布状況計算ステップと、
該分布状況計算ステップでの検出結果に応じて領域の切
り出しを行なう領域切り出しステップとを具備したこと
を特徴とする。
【0018】また、上記第1の目的を達成するために本
発明に係る画像処理装置は、画像を分割して直交変換を
行なう直交変換手段と、ブロック内で隣接する係数間の
差異を検出する係数間差異検出手段と、該係数間差異検
出手段による検出結果からブロック内での分布状況を計
算する分布状況計算手段と、該分布状況計算手段による
検出結果に応じて領域の切り出しを行なう領域切り出し
手段とを具備したことを特徴とする。
【0019】また、上記第2の目的を達成するために本
発明に係る記憶媒体は、画像に直交変換処理を施して所
望の領域を抽出する画像処理装置を制御するプログラム
を格納した記憶媒体であって、画像を分割して直交変換
を行なう直交変換モジュールと、ブロック内で隣接する
係数間の差異を検出する係数間差異検出モジュールと、
該係数間差異検出モジュールによる検出結果からブロッ
ク内での分布状況を計算する分布状況計算モジュール
と、該分布状況計算モジュールによる検出結果に応じて
領域の切り出しを行なう領域切り出しモジュールとを有
するプログラムを格納したことを特徴とする。
【0020】
【発明の実施の形態】以下、本発明の各実施の形態を図
面に基づき説明する。
【0021】(第1の実施の形態)まず、本発明の第1
の実施の形態を図1〜図5に基づき説明する。本実施の
形態は、まず、画像を小ブロックに分割し、DCT処理
によって空間周波数分布に変換する。次に、ブロック内
の隣接係数間の差分値を計算し、該差分値の平均と分散
を求める。続いて、平均値と分散値をしきい値と比較す
ることで、当該ブロックが文字領域であるか否かを判定
するという処理を行なうようにしたものである。
【0022】図1は、本発明の第1の実施の形態に係る
画像処理装置の構成を示すブロック図であり、この画像
処理装置は、外部から画像を入力するための通信ユニッ
ト13と、入力画像を蓄積するメモリ部3を有するパー
ソナルコンピュータであり、入力画像から文字領域を切
り出して保存しておき、これを用いて画像検索を行なう
機能を備えている。
【0023】図1中、1は本装置全体の制御を行なうC
PU(中央演算処理装置)で、後述するメモリ部3に格
納されたプログラムに従って演算、I/O(入出力)制
御等の処理を実行する。2は周辺機器コントローラで、
CPU1とセットで用いられ、周辺機器を制御するのに
必要なI/O(シリアル通信、パラレル通信、リアルタ
イムクロック、タイマー、割り込み制御、DMA(ダイ
レクトメモリーアクセス)制御等)の制御を行なう。3
はメモリ部で、CPU1の主記憶手段としてDRAM
(ダイナミックランダムアクセスメモリ)、キャッシュ
RAM(ランダムアクセスメモリ)、ROM(リードオ
ンリーメモリ)等のメモリを含む。また、メモリ部3
は、画像領域検出処理におけるワークエリアも兼ねる。
【0024】4はハードディスクドライブ(HDD)
で、ユーザーデータや装置の設定及び画像データの記憶
を行なうものである。5はFDD制御部で、フロッピー
ディスクドライブ(FDD)6を制御するものである。
7はキーボード制御部で、キーボード8を制御するもの
である。9は表示ユニットで、表示制御部10、VRA
M(ビデオランダムアクセスメモリ)11及び液晶表示
パネル(LCD)12を有している。表示制御部10
は、VRAM11から示データを順次読み出し、階調変
換処理等を行ないながら液晶表示パネル12へデータを
転送する。また、表示制御部10は、CPU1からVR
AM11へのアクセスと、VRAM11から液晶表示パ
ネル12へのデータ転送の調停を行なう。本実施の形態
においては、液晶表示パネル12は、各種ファイルの情
報を表示すると共に、画像データを表示する。
【0025】13は通信ユニットで、通信制御部14及
び通信インターフェース15を有している。通信規格
は、RS−232C、イーサネット等のシリアル通信、
セントロニクス、SCSI(Small Comput
er System Interface)等のパラレ
ル通信のインターフェースであり、テキスト等の各種デ
ータや画像データの入出力を行なう。また、NTSC
(National Television Syst
em Committee)方式等のテレビ信号を入力
するインターフェースを備えている。16は画像領域検
出部で、画像データから文字画像領域を抽出するもので
ある。
【0026】図2は、第1の本実施の形態における文字
切り出しの様子を説明する図である。本実施の形態で
は、写真の混在する文字画像を入力し、その中から文字
画像領域を抽出する処理を行なう。図2(a)は、文字
画像の一例を示す図であり、文字80〜82、写真83
の3つの要素で構成されている。同図中のマス目は、後
述する小ブロックの境界を表わしており、文字画像には
表示されていない。また、図2(b)は、文字画像領域
抽出結果を示す図であり、文字画像領域81、82のみ
が切り出されている。本実施の形態における処理は、図
2(a)に示す入力画像から図2(b)に示す画像を作
成することである。
【0027】次に、画像領域検出部16について図3及
び図4を用いて説明する。図3は、画像領域検出部16
の概略構成を示すブロック図であり、同図中、20はブ
ロック分割部で、画像データを8×8の小ブロックに分
割するものである。21はDCT変換部で、ブロック分
割部20により分割された小ブロックに対してDCT処
理部21によりDCT処理を行ない、空間周波数軸上の
係数データに変換する。これらブロック分割部20及び
DCT処理部21は、JPEGやMPEG(Moving Pic
ture Experts Group)方式等の標準規格で使用されてい
る公知の技術と同様であるから、その詳細な説明は省略
する。
【0028】22は属性判定部で、差分値計算部23、
分布状況計算部24及びしきい値判定部25を有してい
る。そして、属性判定部22は、以下に述べる演算によ
って文字パターンを含むブロックの抽出処理を行なうも
のである。本実施の形態では、ブロック内の隣接する係
数間の差異を計算し、該差異の平均値と分散値を求め
る。次に、これら平均値と分散値をしきい値と比較し
て、当該ブロックが文字領域であるか否かを判定する。
【0029】差分値計算部23は、ブロック内で隣接し
ている係数同士の差分値を計算する。図4は、差分値計
算部23における差分値計算の手順を説明する図であ
り、同図(a)は、小ブロック内の係数分布状況の一例
を示す。同図において、水平方向にi、垂直方向にj個
目の係数をxijで表わせば、本実施の形態における差分
値データdijは下記式(6)に従って計算できる。
【0030】dij=|xij|−|xi-1,j| …(6) (但し、i=1〜7、j=0〜7)
【0031】図4(a)のブロックの差分値データを計
算した結果を図4(b)に示す。同図における数値は、
ijの値のさらに絶対値をとったものを記入してある。
【0032】分布状況計算部24は、差分値計算部23
で求めた差分値データの分布状況を計算する。本実施の
形態においては、分布状況として差分値データの平均値
と分散値を用いる。差分係数dの個数をnとすると、平
均値μと分散値s2は、下記式(7)及び式(8)に従
って計算する。計算に用いる差分値データは、直流成分
との差分であるd00を除いたものを用いる。
【0033】μ=1/n×Σdij …(7) s2=1/(n−1)×Σ(dij−μ) …(8)
【0034】しきい値判定部25は、分布状況計算部2
4で求めた平均値μと分散値s2を予め設定されたしき
い値と比較し、その比較結果によって当該ブロックが文
字パターン領域であるか否かを判定し、文字領域である
と判定されたブロックをファイルに出力する。平均値μ
のしきい値をμth、分散値s2のしきい値をs2 thとする
と、下記式(9)を満足するブロックが文字パターン領
域であると判定される。
【0035】μ>μth且つs2<s2 th …(9)
【0036】次に、文字領域検出動作について、図5を
用いて説明する。図5(a)は、中間調の画像ブロック
の差分値データを示す図であり、同図において、横軸は
空間周波数であり、縦軸は差分値である。50は差分値
データの分布であり、51は差分値データの平均値であ
る。画像パターンは、一般にエッジ形状が鈍く、コント
ラストもさほど高くないという性質を持つ。この性質に
より、周波数係数は、低域で高い値を持ち、高域で急激
に減衰する。従って、差分値データと同様な傾向を表わ
し、低域での大きな値と高域での小さな値となる。ま
た、平均値51は、低域部分と高域部分の中間程度の値
を持つ。
【0037】また、図5(b)は、文字パターンを含む
ブロックの差分値データを示す図であり、同図中、52
は差分値データの分布状況を示し、53は差分値データ
の平均値を示す。文字パターンは、鋭いエッジ形状が鋭
く、コントラストが高いという性質を持つ。これによっ
て、周波数係数と差分値データは全域で高い値を持つ。
また、平均値53は、差分値データ52近辺の高い値を
持つ。
【0038】更に、図5(c)は、図5(a)、(b)
の差分値データの分散値を求めた結果を示す図であり、
同図中、54は画像ブロック、55は文字ブロック、5
6はしきい値をそれぞれ示す。画像ブロック54は、平
均値と差分値との差が大きいために、分散値が高いもの
となる。一方の文字ブロック55の差分値は、全周波数
領域でほぼ平均値と同じような値をとるため、分散値が
低い値となる。従って、しきい値56で判定すること
で、画像ブロック54と文字ブロック55の判定を行な
うことができる。
【0039】なお、画像全体のコントラストが低い場合
には、周波数係数の絶対値が低くなる。この場合は、画
像ブロックであっても、分散値が小さな値となって誤抽
出を招く恐れがある。そこで、上記式(9)のしきい値
比較条件の中では、平均値が設定値57以上であるか否
かを判定基準に加えることで、正確な結果を得ている。
【0040】以上説明したように本実施の形態によれ
ば、小ブロック内の隣接係数の差異の分散値をしきい値
と比較することで、圧縮履歴や文字パータン幅の影響を
除去することが可能となり、文字抽出率を向上させるこ
とができる。
【0041】(第2の実施の形態)次に、本発明の第2
の実施の形態について図6及び図7を用いて説明する。
【0042】上述した第1の実施の形態においては、ブ
ロック内の隣接係数の差異検出方法として、差分値を用
いた例について説明したが、本実施の形態は、隣接係数
の符号変化を用いて領域判定を行なうようにしたもので
ある。
【0043】図6は、本発明の第2の実施の形態に係る
画像処理装置における画像領域検出部の概略構成を示す
ブロック図であり、同図において、第1の実施の形態に
おける図3と同一部分には同一符号が付してある。図6
において、図3と異なる点は、図3の構成の差分値検出
部23に代えて、符号変化検出部26を設けたことであ
る。この符号変化検出部26は、ブロック内の隣接係数
間で符号が変化しているものを検出するものである。
【0044】DCT処理を行なったブロックの係数は、
ほぼ全面で隣接係数との符号変化が生じる。また、上述
した第1の実施の形態において説明したように、文字ブ
ロックは全周波数領域で係数値と差分値が高いという性
質がある。従って、上述した第1の実施の形態のように
ブロック全面で計算せずに、符号変化部分の差分値を代
表としてサンプリングすることでも同様な傾向を検出す
ることができる。
【0045】本実施の形態における符号変化検出部26
では、隣接係数間で符号が変化しているものを検出し、
符号変化した係数間の差分値のみを計算する。この符号
変化検出部26の後段にある分布状況計算部24では、
この差分値の平均値と分散値を計算することで文字ブロ
ックの判定を行なう。本実施の形態における差分値計算
は、下記式(10)によって行ない、差分値の平均値と
分散値を計算するときのデータ数nは符号変化のあった
個数を用いる。
【0046】 dij=|xij|−|xi-1,j| (if xij×xi-1,j<0)、 dij=0 (if xij×xi-1,j≧0) …(10)
【0047】図7(a)は、上述した第1の実施の形態
における画像ブロック例である図4(a)において、隣
接係数間で符号変化のあったものを検出した結果を示す
図である。同図におけるマス内の「1」が符号変化のあ
った部分、「0」が符号変化のなかった部分である。同
図においては、ブロックのほぼ全域で均一に符号変化が
生じていることが分かる。
【0048】また、図7(b)は、図4(a)において
符号変化のあった係数間の差分値を計算した結果を示す
図である。この計算結果の値を用いて差分値の平均値と
分散値を求め、その値をしきい値と比較することで文字
ブロックを抽出することができる。
【0049】以上詳述したように、本実施の形態によれ
ば、上述した第1の実施の形態と同様な抽出結果を得る
ことができる。加えて、計算点数が減少するので抽出処
理の高速化を図ることができる。
【0050】本実施の形態におけるその他の構成及び動
作は、上述した第1の実施の形態と同一であるから、そ
の説明を省略する。
【0051】なお、本発明は、上述した実施の形態だけ
に限られるものではなく、幅広く応用することができる
ものである。例えば、上述した実施の形態では、直交変
換の方法としてDCT変換を使用したが、これに代えて
フーリエ(Fourier)変換やアダマール(Had
amard)変換であってもよい。また、上述した実施
の形態では、差分値データの計算方法として係数の絶対
値の差分を計算する場合を例示したが、これに限られる
ものではなく、符号を含めた差分値を計算するようにし
てもよい。また、上述した実施の形態では、水平方向の
差分を用いた例について説明したが、これに限られるも
のではなく、垂直方向或いは水平方向と垂直方向の双方
を用いるようにしてもよい。また、分布状況の計算に用
いる差分値データの数も任意のものを用いることができ
る。例えば、極低周波のd00、d01、d10を取り除いた
ものを用いるようにしてもよい。また、上述した実施の
形態では、分布状態検出方法として、差分値の平均値と
分散値を使用した場合を例示したが、これに限られるも
のではなく、任意の統計的、非統計的手法であってもよ
い。また、上述した実施の形態では、ハードウェアで構
成した場合を例示したが、これに限られるものではな
く、ソフトウェアにより構成してもよい。この場合、図
1の構成要素をソフトウェアのステップで置き換えるこ
とにより容易に実現することができる。更に、差分値デ
ータのサンプリング方法も、上述した実施の形態に例示
したものに限られるものではなく、例えば、偶数番目の
差分値やランダムなサンプリング等、任意の方法を採用
することができる。
【0052】(第3の実施の形態)次に、本発明の画像
処理装置に使用する記憶媒体について図8に基づき説明
する。画像処理装置を制御するための制御プログラムを
格納する記憶媒体には、図8に示すように、少なくと
も、「直交変換モジュール」、「係数間差異検出モジュ
ール」、「分布状況計算モジュール」、「領域切り出し
モジュール」の各モジュールのプログラムコードを格納
すればよい。
【0053】ここで、「直交変換モジュール」は、画像
を分割して直交変換を行なうためのプログラムモジュー
ルである。また、「係数間差異検出モジュール」は、ブ
ロック内で隣接する係数間の差異を検出するためのプロ
グラムモジュールである。また、「分布状況計算モジュ
ール」は、前記係数間差異検出モジュールの検出結果か
らブロック内での分布状況を計算するためのプログラム
モジュールである。また、「領域切り出しモジュール」
は、前記分布状況計算モジュールの検出結果に応じて領
域の切り出しを行なうためのプログラムモジュールであ
る。
【0054】(第4の実施の形態)次に、第1または第
2の実施形態で説明した文字領域抽出方法を、文字認識
に応用した例について説明を行なう。本第4の実施形態
に係る画像処理装置は、図9のブロック図のように構成
されており、図1のブロック図とは、文字認識装置とし
てのOCR17が加わった点のみが異なる。本第4の実
施形態では、第1または第2の実施形態と同様の手法で
入力画像から文字領域を抽出し、抽出されてメモリ部3
に格納された文字領域に対してOCR17によりOCR
認識を行ない、結果を表示ユニット9に表示出力する、
という処理を行なう。
【0055】図10は、入力画像から文字認識を行なう
処理の流れを示すフローチャートであり、同図を用いて
説明を行なう。
【0056】まず、ステップS101では、通信回線を
介して、通信ユニット13より画像の入力を行なう。ま
たは、イメージスキャナによる入力や、本体内に格納し
てある画像データを取り出すようにしてもよい。ステッ
プS102では、第1または第2の実施形態の手順に従
って、画像中から文字領域の抽出を行なう。
【0057】ステップS103では、ステップS103
の文字領域抽出処理で使用したデータから、文字認識処
理で用いるパラメータを抽出する。例えば、領域内での
文字の中心位置、文字の色といったパラメータを取出
す。文字の色は、特に分散値の高いブロックの色相を候
補とする。
【0058】ステップS104では、抽出領域から背景
の除去を行なう。ステップS102の処理で得た、文字
ブロック−画像ブロック間の色やコントラスト差を用い
て閾値を設定する。この閾値の値を文字領域のデータか
ら差し引くことで、背景画像を消去する。または、公知
の背景消去のアルゴリズムを用いてもよい。
【0059】ステップS105では、OCR17により
文字認識処理を行なう。同ステップの処理は、一般のO
CRなどで用いられている公知の文字認識技術が使用で
きるので、ここでの説明は省略する。必要に応じて、ス
テップS103で抽出した候補パラメータを使用する。
ステップS106では、文字認識結果の表示ユニット9
への表示やHDD4への出力を行ない、処理を終了す
る。
【0060】以上、説明したように、本第4の実施形態
によれば、第1または第2の実施形態で説明した文字領
域抽出方法を文字認識に応用することができる。これに
より、画像の上に文字が重ね合わされているような場合
であっても、文字認識を行なうことが可能となる。さら
に、文字領域抽出処理で使用した各種のパラメータを元
に認識処理を行なうことで、認識性能を向上させること
ができる。
【0061】また、本第4の実施形態で説明した処理の
プログラムを、第3の実施形態で示したように、記憶媒
体に格納することもできる。この場合、コンピュータ等
の情報処理装置に記憶媒体を挿入することにより、格納
されたプログラムが読み出されて実行される。
【0062】
【発明の効果】以上詳述したように本発明の画像処理方
法及装置によれば、画像ブロック内の隣接係数間の差異
の分布値を算出することで、文字パターンが中間調画像
と混在した場合にも安定した領域の切り出しが可能とな
り、領域抽出率が向上するという効果を奏する。
【0063】また、本発明の記憶媒体によれば、上述し
た画像処理装置を円滑に制御することができるという効
果を奏する。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る画像処理装置
の構成を示すブロック図である。
【図2】同装置における文字抽出処理を説明する画像例
を示す図である。
【図3】同装置における画像領域検出部の構成を示すブ
ロック図である。
【図4】同装置における差分値計算処理を説明する画像
例を示す図である。
【図5】同装置おける属性判定処理の原理を説明する図
である。
【図6】本発明の第1の実施の形態に係る画像処理装置
における画像領域検出部の構成を示すブロック図であ
る。
【図7】同装置における符号変化検出処理を説明する画
像例を示す図である。
【図8】本発明の記憶媒体に格納する各モジュールのプ
ログラムコードを示す図である。
【図9】第4の実施形態における画像処理装置の構成を
示すブロック図である。
【図10】第4の実施形態における文字認識処理の流れ
を示すフローチャートである。
【図11】従来の画像処理装置におけるジグザクスキャ
ン処理の順序を説明する図である。
【図12】同従来の画像処理装置における係数の積算領
域を説明する図である。
【符号の説明】
1 CPU(中央演算処理装置) 2 周辺コントローラ 3 メモリ部 4 HDD(ハードディスクドライブ) 5 FDD(フロッピーディスクドライブ)制御部 6 FDD(フロッピーディスクドライブ) 7 キーボード制御部 8 キーボード 9 表示ユニット 10 表示制御部 11 VRAM(ビデオランダムアクセスメモリ) 12 LCD(液晶ディスプレイ) 13 通信ユニット 14 通信制御部 15 通信インターフェース 16 画像領域検出部 17 OCR(オプティカルキャラクタリーダ) 20 ブロック分割部 21 DCT(離散コサイン変換)処理部 22 属性判定部 23 差分値計算部 24 分布状況計算部 25 しきい値判定部 26 符号変化検出部

Claims (36)

    【特許請求の範囲】
  1. 【請求項1】 画像を分割して直交変換を行なう直交変
    換ステップと、ブロック内で隣接する係数間の差異を検
    出する係数間差異検出ステップと、該係数間差異検出ス
    テップでの検出結果からブロック内での分布状況を計算
    する分布状況計算ステップと、該分布状況計算ステップ
    での検出結果に応じて領域の切り出しを行なう領域切り
    出しステップとを具備したことを特徴とする画像処理方
    法。
  2. 【請求項2】 前記直交変換ステップにおいて離散コサ
    イン変換を用いて直交変換を行なうことを特徴とする請
    求項1記載の画像処理方法。
  3. 【請求項3】 前記直交変換ステップにおいてアダマー
    ル変換を用いて直交変換を行なうことを特徴とする請求
    項1記載の画像処理方法。
  4. 【請求項4】 前記直交変換ステップにおいて、フーリ
    エ変換を用いて直交変換を行なうことを特徴とする請求
    項1記載の画像処理方法。
  5. 【請求項5】 前記領域切り出しステップにおいて文字
    パターンを含む領域を検出することを特徴とする請求項
    1記載の画像処理方法。
  6. 【請求項6】 前記係数間差異検出ステップにおいて隣
    接係数間の差分を検出することを特徴とする請求項1記
    載の画像処理方法。
  7. 【請求項7】 前記係数間差異検出ステップにおいて隣
    接係数間の符号変化を検出することを特徴とする請求項
    1記載の画像処理方法。
  8. 【請求項8】 前記分布状況計算ステップにおいて前記
    係数間差異検出ステップでの検出結果の分散値を計算す
    ることを特徴とする請求項1記載の画像処理方法。
  9. 【請求項9】 前記分布状況計算ステップにおいて前記
    係数間差異検出ステップでの検出結果の平均値を計算す
    ることを特徴とする請求項1記載の画像処理方法。
  10. 【請求項10】 前記領域切り出しステップにおいて前
    記分布状況計算ステップで計算された分散値が予め設定
    されたしきい値より小さい領域を文字パターンを含む領
    域として切り出すことを特徴とする請求項1記載の画像
    処理方法。
  11. 【請求項11】 前記領域切り出しステップにおいて、
    前記分布状況計算ステップで計算された平均値が予め設
    定されたしきい値より大きい領域を文字パターンを含む
    領域として切り出すことを特徴とする請求項9記載の画
    像処理方法。
  12. 【請求項12】 画像を分割して直交変換を行なう直交
    変換手段と、ブロック内で隣接する係数間の差異を検出
    する係数間差異検出手段と、該係数間差異検出手段の検
    出結果からブロック内での分布状況を計算する分布状況
    計算手段と、該分布状況計算手段による検出結果に応じ
    て領域の切り出しを行なう領域切り出し手段とを具備し
    たことを特徴とする画像処理装置。
  13. 【請求項13】 前記直交変換手段は離散コサイン変換
    を用いて直交変換を行なうことを特徴とする請求項12
    記載の画像処理装置。
  14. 【請求項14】 前記直交変換手段はアダマール変換を
    用いて直交変換を行なうことを特徴とする請求項12記
    載の画像処理装置。
  15. 【請求項15】 前記直交変換手段はフーリエ変換を用
    いて直交変換を行なうことを特徴とする請求項12記載
    の画像処理装置。
  16. 【請求項16】 前記領域切り出し手段は文字パターン
    を含む領域を検出することを特徴とする請求項12記載
    の画像処理装置。
  17. 【請求項17】 前記係数間差異検出手段は隣接係数間
    の差分を検出することを特徴とする請求項12記載の画
    像処理装置。
  18. 【請求項18】 前記係数間差異検出手段は隣接係数間
    の符号変化を検出することを特徴とする請求項12記載
    の画像処理装置。
  19. 【請求項19】 前記分布状況計算手段は前記係数間差
    異検出手段による検出結果の分散値を計算することを特
    徴とする請求項12記載の画像処理装置。
  20. 【請求項20】 前記分布状況計算手段は前記係数間差
    異検出手段による検出結果の平均値を計算することを特
    徴とする請求項12記載の画像処理装置。
  21. 【請求項21】 前記領域切り出し手段は前記分布状況
    計算手段により計算された分散値が予め設定されたしき
    い値より小さい領域を文字パターンを含む領域として切
    り出すことを特徴とする請求項19記載の画像処理装
    置。
  22. 【請求項22】 前記領域切り出し手段は前記分布状況
    計算手段により計算された平均値が予め設定されたしき
    い値より大きい領域を文字パターンを含む領域として切
    り出すことを特徴とする請求項20記載の画像処理装
    置。
  23. 【請求項23】 画像に直交変換処理を施して所望の領
    域を抽出する画像処理装置を制御するプログラムを格納
    した記憶媒体であって、画像を分割して直交変換を行な
    う直交変換モジュールと、ブロック内で隣接する係数間
    の差異を検出する係数間差異検出モジュールと、該係数
    間差異検出モジュールによる検出結果からブロック内で
    の分布状況を計算する分布状況計算モジュールと、該分
    布状況計算モジュールによる検出結果に応じて領域の切
    り出しを行なう領域切り出しモジュールとを有するプロ
    グラムを格納したことを特徴とする記憶媒体。
  24. 【請求項24】 前記直交変換モジュールは離散コサイ
    ン変換を用いて直交変換を行なうことを特徴とする請求
    項23記載の記憶媒体。
  25. 【請求項25】 前記直交変換モジュールはアダマール
    変換を用いて直交変換を行なうことを特徴とする請求項
    23記載の記憶媒体。
  26. 【請求項26】 前記直交変換モジュールはフーリエ変
    換を用いて直交変換を行なうことを特徴とする請求項2
    3記載の記憶媒体。
  27. 【請求項27】 前記領域切り出しモジュールは文字パ
    ターンを含む領域を検出することを特徴とする請求項2
    3記載の記憶媒体。
  28. 【請求項28】 前記係数間差異検出モジュールは隣接
    係数間の差分を検出することを特徴とする請求項23記
    載の記憶媒体。
  29. 【請求項29】 前記係数間検出モジュールは隣接間の
    符号変化を検出することを特徴とする請求項23記載の
    記憶媒体。
  30. 【請求項30】 前記分布状況計算モジュールは前記係
    数間差異検出モジュールによる検出結果の分散値を計算
    することを特徴とする請求項23記載の記憶媒体。
  31. 【請求項31】 前記分布状況計算モジュールは前記係
    数間差異検出モジュールによる検出結果の平均値を計算
    することを特徴とする請求項23記載の記憶媒体。
  32. 【請求項32】 前記領域切り出しモジュールは前記分
    布状況計算モジュールにより計算された分散値が予め設
    定されたしきい値より小さい領域を文字パターンを含む
    領域として切り出すことを特徴とする請求項30記載の
    記憶媒体。
  33. 【請求項33】 前記領域切り出しモジュールは前記分
    布状況計算モジュールにより計算された平均値が予め設
    定されたしきい値より大きい領域を文字パターンを含む
    領域として切り出すことを特徴とする請求項31記載の
    記憶媒体。
  34. 【請求項34】 前記領域切り出しステップでの切り出
    し結果を用いて該領域内の文字認識を行なう文字認識ス
    テップをさらに加えたことを特徴とする請求項1記載の
    画像処理方法。
  35. 【請求項35】 前記領域切り出し手段による切り出し
    結果を用いて該領域内の文字認識を行なう文字認識手段
    をさらに加えたことを特徴とする請求項12記載の画像
    処理装置。
  36. 【請求項36】 前記領域切り出しモジュールによる切
    り出し結果を用いて該領域内の文字認識を行なう文字認
    識モジュールをさらに加えたことを特徴とする請求項2
    3記載の記憶媒体。
JP9328167A 1996-12-16 1997-11-28 画像処理方法及び装置並びに記憶媒体 Withdrawn JPH10233693A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9328167A JPH10233693A (ja) 1996-12-16 1997-11-28 画像処理方法及び装置並びに記憶媒体
US08/991,636 US5995657A (en) 1996-12-16 1997-12-16 Image processing method and apparatus

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP35259596 1996-12-16
JP8-352595 1996-12-16
JP9328167A JPH10233693A (ja) 1996-12-16 1997-11-28 画像処理方法及び装置並びに記憶媒体

Publications (1)

Publication Number Publication Date
JPH10233693A true JPH10233693A (ja) 1998-09-02

Family

ID=26572772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9328167A Withdrawn JPH10233693A (ja) 1996-12-16 1997-11-28 画像処理方法及び装置並びに記憶媒体

Country Status (2)

Country Link
US (1) US5995657A (ja)
JP (1) JPH10233693A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100908856B1 (ko) 2006-02-02 2009-07-21 후지쯔 가부시끼가이샤 화상 처리 방법 및 화상 처리기

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001136527A (ja) * 1999-11-08 2001-05-18 Matsushita Electric Ind Co Ltd 直交変換画像の解像度変換装置及び方法
FR2827977B1 (fr) * 2001-07-30 2003-10-03 Inst Nat Rech Inf Automat Procede de traitement d'images numeriques, notamment d'images satellitaires
KR100943595B1 (ko) * 2003-01-30 2010-02-24 삼성전자주식회사 영상신호의 블러링 판단장치 및 방법
KR20040069865A (ko) * 2003-01-30 2004-08-06 삼성전자주식회사 영상화면 내의 글자영역 확장장치 및 방법
KR100946888B1 (ko) * 2003-01-30 2010-03-09 삼성전자주식회사 영상화면 내의 피사체의 기울기 보정 장치 및 방법
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
US7239748B2 (en) * 2003-08-12 2007-07-03 International Business Machines Corporation System and method for segmenting an electronic image
US20090143676A1 (en) * 2005-10-19 2009-06-04 Takeshi Matsumura Ultrasonograph for Creating Elastic Image
KR20120058763A (ko) * 2010-11-30 2012-06-08 삼성전자주식회사 영상 장치에서 영상 데이터를 송신하기 위한 장치 및 방법
US9753577B2 (en) * 2011-12-30 2017-09-05 Parade Technologies, Ltd. Methods and apparatus to perform a detection operation

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02202771A (ja) * 1989-01-31 1990-08-10 Nec Corp ファクシミリ装置
US5101438A (en) * 1990-02-02 1992-03-31 Ricoh Company, Ltd. Method of discriminating different kinds of image areas, involving two-dimensional orthogonal transforms
JP3733161B2 (ja) * 1995-08-01 2006-01-11 キヤノン株式会社 画像処理装置および方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100908856B1 (ko) 2006-02-02 2009-07-21 후지쯔 가부시끼가이샤 화상 처리 방법 및 화상 처리기

Also Published As

Publication number Publication date
US5995657A (en) 1999-11-30

Similar Documents

Publication Publication Date Title
JP3733161B2 (ja) 画像処理装置および方法
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
US6347156B1 (en) Device, method and storage medium for recognizing a document image
JP4219542B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
EP1173003B1 (en) Image processing method and image processing apparatus
US7917518B2 (en) Compositional balance and color driven content retrieval
US20080240618A1 (en) Image-document retrieving apparatus, method of retrieving image document, program, and recording medium
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JPH10233693A (ja) 画像処理方法及び装置並びに記憶媒体
US20010050785A1 (en) Image processing device, method and program product
US8064707B2 (en) Image recognition method and image recognition apparatus
JP2005275854A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2000013605A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JPH09186858A (ja) 画像処理方法及び装置、及びコンピュータ制御装置
JP2002199179A (ja) 傾き検出装置
JP3792762B2 (ja) 画像処理装置および画像処理方法
JP2008123245A (ja) 画像処理装置及び画像処理プログラム
JPH05174182A (ja) 文書傾き角検出方法および文書傾き角検出装置
JP3774498B2 (ja) 画像処理方法とその装置
JPH04307668A (ja) 概略画像作成方法および装置
JPH0927904A (ja) 画像処理方法及びその装置
KR20030027572A (ko) 디지털 영상신호의 텍스트 추출방법
JP2000333022A (ja) 画像の二値化方法及び装置並びに記憶媒体
JP2007328652A (ja) 画像処理装置および画像処理プログラム
JP2001291056A (ja) 文書画像認識装置及び記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050201