JP2015225559A - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP2015225559A JP2015225559A JP2014110750A JP2014110750A JP2015225559A JP 2015225559 A JP2015225559 A JP 2015225559A JP 2014110750 A JP2014110750 A JP 2014110750A JP 2014110750 A JP2014110750 A JP 2014110750A JP 2015225559 A JP2015225559 A JP 2015225559A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- character recognition
- character
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【課題】 原稿画像内の文字に色ずれが発生していても原稿画像から文字が検出されやすくなるようにする。【解決手段】 画像処理部3は、原稿画像の文字認識用画像データを取得する。OCR処理部4は、画像処理部3により取得された原稿画像の文字認識用画像データに対して文字認識処理を行う。画像処理部3は、(a)原稿画像の色ずれ量を特定し、(b)特定した色ずれ量に応じて、文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとする。【選択図】 図1
Description
本発明は、画像処理装置に関するものである。
ある装置では、原稿画像内のモノクロ画像を分離し、分離したモノクロ画像を2値化して得られるモノクロ2値画像に対して文字認識(OCR:Optical Character Recognition)処理で、原稿画像内の文字を検出している(例えば特許文献1参照)。
また、一般的に、原稿画像内には、様々な言語で様々なサイズの文字が含まれている可能性があるため、文字認識率を高くするために、良好な画質の原稿画像に対してOCR処理を行うことが望ましい。
しかしながら、上述の装置の場合、原稿画像内の文字に色ずれが発生していると、文字部分がモノクロ画像として正確に分離されなくなるため、OCR処理において文字として正確に検出されなくなる可能性がある。
また、一般的に、文字(特に、小さい文字)に色ずれが発生しているカラー原稿画像に対してOCR処理を行うと、文字部分のエッジが有彩色を伴ってぼやけるため、写真などの多階調画像に近くなり、文字部分がOCR処理において文字として正確に検出されなくなる可能性がある。
そのような原稿画像内の文字の色ずれは、カラー原稿印刷時に発生していたり、原稿のカラースキャン時に発生したりする。
本発明は、上記の問題に鑑みてなされたものであり、原稿画像内の文字に色ずれが発生していても原稿画像から文字が検出されやすい画像処理装置を得ることを目的とする。
本発明に係る画像処理装置は、原稿画像の文字認識用画像データを取得する文字認識画像取得部と、前記文字認識画像取得部により取得された前記文字認識用画像データに対して文字認識処理を行う文字認識処理部とを備える。そして、前記文字認識画像取得部は、(a)前記原稿画像の色ずれ量を特定し、(b)前記色ずれ量に応じて、前記文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとする。
本発明によれば、原稿画像内の文字に色ずれが発生していても原稿画像から文字が検出されやすい画像処理装置を得ることができる。
以下、図に基づいて本発明の実施の形態を説明する。
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。
図1に示す画像処理装置は、複合機であって、画像読取装置1、画像入力部2、画像処理部3、OCR処理部4、表示部5、操作部6、印刷制御部7、印刷装置8、状態記憶部9、ファイル作成部10、データ通信部11、およびシステム制御部12を備える。
画像読取装置1は、原稿から原稿画像を光学的に読み取り、原稿画像の画像データを生成する。画像読取装置1は、複数の色成分(ここでは、RGB)に対してそれぞれ設けられている複数のラインセンサーを有し、複数のラインセンサーで原稿をスキャンし、カラー画像データとして原稿画像の画像データを生成する。
画像入力部2は、画像読取装置1により生成された原稿画像の画像データまたはデータ通信部11により受信された原稿画像の画像データを取得する。
画像処理部3は、原稿画像の文字認識用画像データを取得する。具体的には、画像入力部2により取得された原稿画像の画像データから、原稿画像の1ページごとに文字認識用画像データを生成したり、その原稿画像の画像データを文字認識用画像データとして使用したりする。
OCR処理部4は、画像処理部3により取得された文字認識用画像データに対してOCR処理を行い、原稿画像内の文字を検出する。
画像処理部3は、(a)原稿画像の色ずれ量を特定し、(b)特定した色ずれ量に応じて、文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとする。なお、モノクロ画像データとしては、グレイスケール画像データまたはモノクロ2値画像データが使用される。
図2は、図1に示す画像処理装置で使用される色ずれ量について説明する図である。
例えば図2に示すように、主走査方向および副走査方向においてRGB(あるいはCMY)の色成分の画像31〜33がずれている場合、主走査方向における中央の画像32から両側の画像31,33までのそれぞれの距離(あるいは画素数)をDp1,Dp2とし、副走査方向における中央の画像32から両側の画像31,33までのそれぞれの距離(あるいは画素数)をDs1,Ds2とすると、主走査方向の色ずれ量は、Dp1とDp2の大きい方とされ、副走査方向の色ずれ量は、Ds1とDs2の大きい方とされる。そして、原稿画像の色ずれ量としては、例えば、主走査方向の色ずれ量、副走査方向の色ずれ量、および両者のうちの大きい方のいずれかが使用される。
なお、例えば、Dp1とDp2との和を主走査方向の色ずれ量とし、Ds1とDs2との和を副走査方向の色ずれ量としてもよい。
また、1色の画像だけがずれている場合、その1色の画像と残りの2色の画像との距離(あるいは画素数)が色ずれ量とされる。
この実施の形態では、原稿画像として画像読取装置1によるスキャンで得られた画像を使用する場合、画像処理部3は、画像読取装置1からラインセンサー間のスキャンタイミングのずれを示す色ずれ情報を取得し、取得した色ずれ情報から原稿画像の色ずれ量を特定する。
また、画像処理部3は、文字認証用画像データをモノクロ画像データとする場合、複数のラインセンサーのうちの1つだけを使用して画像読取装置1にスキャンさせ、画像読取装置1によるスキャンで得られたモノクロ画像データを文字認証用画像データとして使用するようにしてもよいし、複数のラインセンサーを使用して画像読取装置1にスキャンさせ、画像読取装置1によるスキャンで得られたカラー画像データから変換されたモノクロ画像データを文字認証用画像データとして使用するようにしてもよい。
なお、その際、画像処理部3および文字認識処理部4は、複数ページの原稿画像に対して、文字認識用画像データの生成および文字認識処理を順番に行っていき、画像処理部3は、文字認証用画像データをモノクロ画像データとするページについて、複数のラインセンサーのうちの1つだけを使用して画像読取装置1にスキャンさせ、画像読取装置1によるスキャンで得られたモノクロ画像データを文字認証用画像データとして使用してもよい。その場合、使用されるラインセンサーに対応して使用される光源には、白色光源が使用される。
あるいは、画像処理部3は、文字認証用画像データをモノクロ画像データとするページについては、複数のラインセンサーを使用した画像読取装置1によるスキャンで得られたカラー画像データから変換されたモノクロ画像データを文字認証用画像データとして使用し、次ページ以降の各ページについては、複数のラインセンサーのうちの1つだけを使用して画像読取装置1にスキャンさせ、画像読取装置1によるスキャンで得られたモノクロ画像データを文字認証用画像データとして使用してもよい。
表示部5は、例えば液晶ディスプレイ、インジケーターなどを含み、当該画像処理装置の状態、OCR処理の画質設定の変更などを表示する。操作部6は、例えばタッチパネル、ハードキーなどを含み、ユーザー操作を受け付け、電気信号として出力する。
印刷制御部7は、印刷装置8を制御して原稿画像などの印刷を印刷装置8に実行させる。印刷装置8は、例えば電子写真方式で原稿画像を印刷用紙に印刷する。
状態記憶部9は、当該画像処理装置の状態、各種設定などを記憶する記憶装置である。
ファイル作成部10は、原稿画像のラスターイメージデータと、OCR処理部4の文字認識により得られたテキストとを含むファイルを作成する。例えば、ファイル作成部10は、原稿画像のラスターイメージデータのレイヤーと、OCR処理部4の文字認識により得られたテキストのレイヤーとを含むPDF(Portable Document Format)ファイルを作成する。
データ通信部11は、例えばネットワークインターフェイスなどであって、パーソナルコンピューターなどの端末装置とデータ通信し、原稿画像の画像データを端末装置から受信したり、ファイル作成部10により作成されたファイルを所定のプロトコルで端末装置へ送信したりする。
システム制御部12は、画像読取装置1、画像入力部2、画像処理部3、OCR処理部4、表示部5、操作部6、印刷制御部7、印刷装置8、状態記憶部9、ファイル作成部10、およびデータ通信部11を制御して各種ジョブを実行する。
なお、上述の画像入力部2、画像処理部3、OCR処理部4、印刷制御部7、ファイル作成部10、およびシステム制御部12は、所定のプログラムを実行するコンピューター、ASIC(Application Specific Integrated Circuit)などで実現される。
次に、上記画像処理装置の動作について説明する。図3は、図1に示す画像処理装置の動作を説明するフローチャートである。
ユーザーは、原稿を画像読取装置1の原稿台または自動原稿搬送装置に載置し、所定のジョブ(例えば、スキャントゥセンド)の実行指示のための操作(例えばスタートボタンの押下)を操作部6に対して行う。システム制御部12は、操作部6からその所定のジョブの実行指示を受け付けると、画像入力部2を使用して、画像読取装置1に、原稿画像を1ページずつ読み取らせ、画像処理部3およびOCR処理部4に以下の処理を実行させる。
画像処理部3は、画像入力部2を介して、例えば1ページ分の原稿画像の元画像データ(カラー原稿画像データ)および色ずれ情報を画像読取装置1から取得し(ステップS1)、色ずれ情報から色ずれ量を特定する(ステップS2)。
そして、画像処理部3は、特定した色ずれ量が所定の閾値以上であるか否かを判定する(ステップS3)。
特定した色ずれ量が所定の閾値以上である場合、画像処理部3は、原稿画像の元画像データを(グレイスケールまたはモノクロ2値の)モノクロ画像データに変換し、そのモノクロ画像データを文字認識用画像データとするか、画像入力部2を介して、1つのラインセンサーを使用したグレイスキャンで同一のページのスキャンを画像読取装置1に実行させてモノクロ画像データを文字認識用画像データとして取得する(ステップS4)。このように、文字認識用画像データとしてモノクロ画像データを使用することで、文字部分のエッジの彩度や色相のばらつきが無くなるため、文字認識率が向上する。
一方、特定した色ずれ量が所定の閾値未満である場合、画像処理部3は、原稿画像の元画像データ、あるいは原稿画像の元画像データに対して所定の画像処理を施して得られるカラー画像データを、文字認識用画像データとする(ステップS5)。
そして、OCR処理部4は、画像処理部3により生成された文字認識用画像データに対してOCR処理を実行し、原稿画像内の文字を検出する(ステップS6)。
以上のように、上記実施の形態によれば、OCR処理部4は、画像処理部3により取得された原稿画像の文字認識用画像データに対して文字認識処理を行う。画像処理部3は、(a)原稿画像の色ずれ量を特定し、(b)特定した色ずれ量に応じて、文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとする。
これにより、原稿画像内の文字に色ずれが発生していても原稿画像から文字が検出されやすくなる。
なお、上述の実施の形態は、本発明の好適な例であるが、本発明は、これらに限定されるものではなく、本発明の要旨を逸脱しない範囲において、種々の変形、変更が可能である。
例えば、上記実施の形態における色ずれ量の閾値は、ユーザーによる操作部6に対する入力値、または外部の端末装置からデータ通信部11により受信される入力値で設定可能としてもよい。
また、上記実施の形態において、画像処理部3は、原稿画像の元画像データを取得し、元画像データに基づいて原稿画像の色ずれ量を特定するようにしてもよい。その場合、例えば、画像処理部3は、原稿画像内で所定の複数の色成分(例えばRGBまたはCMY)のエッジが並行している箇所を色ずれ箇所として検出し、その箇所の色ずれ量を特定する。
本発明は、例えば、スキャナー、複合機などの画像形成装置に適用可能である。
3 画像処理部(文字認識画像取得部の一例)
4 OCR処理部(文字認識処理部の一例)
4 OCR処理部(文字認識処理部の一例)
Claims (6)
- 原稿画像の文字認識用画像データを取得する文字認識画像取得部と、
前記文字認識画像取得部により取得された前記文字認識用画像データに対して文字認識処理を行う文字認識処理部とを備え、
前記文字認識画像取得部は、(a)前記原稿画像の色ずれ量を特定し、(b)前記色ずれ量に応じて、前記文字認識用画像データをカラー画像データおよびモノクロ画像データのいずれかとすること、
を特徴とする画像処理装置。 - 複数の色成分に対してそれぞれ設けられている複数のラインセンサーを有し、前記複数のラインセンサーで原稿をスキャンする画像読取装置をさらに備え、
前記文字認識画像取得部は、前記画像読取装置から前記ラインセンサー間のスキャンタイミングのずれを示す色ずれ情報を取得し、前記色ずれ情報から前記原稿画像の色ずれ量を特定すること、
を特徴とする請求項1記載の画像処理装置。 - 前記文字認識画像取得部は、前記文字認証用画像データをモノクロ画像データとする場合、前記複数のラインセンサーのうちの1つだけを使用して前記画像読取装置にスキャンさせ、前記画像読取装置によるスキャンで得られたモノクロ画像データを前記文字認証用画像データとして使用することを特徴とする請求項2記載の画像処理装置。
- 前記文字認識画像取得部および前記文字認識処理部は、複数ページの前記原稿画像に対して、文字認識用画像データの生成および文字認識処理を順番に行っていき、
前記文字認識画像取得部は、前記文字認証用画像データをモノクロ画像データとするページについて、前記複数のラインセンサーのうちの1つだけを使用して前記画像読取装置に再スキャンさせ、前記画像読取装置によるスキャンで得られたモノクロ画像データを前記文字認証用画像データとして使用すること、
を特徴とする請求項3記載の画像処理装置。 - 前記文字認識画像取得部および前記文字認識処理部は、複数ページの前記原稿画像に対して、文字認識用画像データの生成および文字認識処理を順番に行っていき、
前記文字認識画像取得部は、前記文字認証用画像データをモノクロ画像データとするページについて、前記複数のラインセンサーを使用した前記画像読取装置によるスキャンで得られたカラー画像データから変換されたモノクロ画像データを文字認証用画像データとして使用し、次ページ以降の各ページについては、前記複数のラインセンサーのうちの1つだけを使用して前記画像読取装置にスキャンさせ、前記画像読取装置によるスキャンで得られたモノクロ画像データを前記文字認証用画像データとして使用すること、
を特徴とする請求項3記載の画像処理装置。 - 前記文字認識画像取得部は、前記原稿画像の元画像データを取得し、前記元画像データに基づいて前記原稿画像の色ずれ量を特定することを特徴とする請求項1記載の画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014110750A JP2015225559A (ja) | 2014-05-29 | 2014-05-29 | 画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014110750A JP2015225559A (ja) | 2014-05-29 | 2014-05-29 | 画像処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015225559A true JP2015225559A (ja) | 2015-12-14 |
Family
ID=54842238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014110750A Pending JP2015225559A (ja) | 2014-05-29 | 2014-05-29 | 画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015225559A (ja) |
-
2014
- 2014-05-29 JP JP2014110750A patent/JP2015225559A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9917970B2 (en) | Image reading apparatus, method for controlling the same, and storage medium | |
US9485368B2 (en) | Electronic document generation apparatus, recording medium, and electronic document generation system | |
US10291794B2 (en) | Implementation of distributed processing using device, information processing apparatus, information processing system, and information processing method to reduce network lag | |
US10070001B2 (en) | Document reading apparatus, method for controlling document reading apparatus, and storage medium | |
US20150146224A1 (en) | Image processing apparatus and image processing method | |
EP2602987B1 (en) | Display control apparatus and computer program | |
JP5407627B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
US9055251B2 (en) | Image processing based on automatic image-type detection | |
JP2014232946A (ja) | 情報処理装置、情報処理方法、システムおよびプログラム | |
JP2016184914A (ja) | 画像処理装置 | |
JP4420058B2 (ja) | 画像処理装置及び画像処理方法 | |
JP5955822B2 (ja) | 色変換装置、画像形成装置、色変換方法、及び色変換プログラム | |
US9906654B1 (en) | White area defect detection for image based controls applications | |
JP2016103749A (ja) | 画像処理装置及び画像形成装置 | |
JP2015123598A (ja) | 画像形成装置、画像形成装置の制御方法、およびプログラム。 | |
JP2013074314A (ja) | 画像処理方法、画像読取装置、および画像処理プログラム | |
US20160072966A1 (en) | Non-transitory computer readable medium and image processing device | |
JP2015225559A (ja) | 画像処理装置 | |
JP5992956B2 (ja) | 画像処理装置 | |
JP2015177265A (ja) | 画像処理装置、画像処理システム、情報記憶方法およびプログラム | |
US9639791B2 (en) | Color registration error compensation in color printing | |
US10484557B2 (en) | Image processing apparatus and non-transitory computer readable medium for addition of different image data to acquired image data | |
US10587775B2 (en) | Image processing apparatus, image processing method, and storage medium for edge enhancement based on plural conditions | |
US9876937B1 (en) | Saving marking material using threshold arrays and toner reduction mask | |
JP6002618B2 (ja) | 画像処理装置、画像形成装置、及び画像処理プログラム |