JP2007141159A - 画像処理装置、画像処理方法、及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法、及び画像処理プログラム Download PDF

Info

Publication number
JP2007141159A
JP2007141159A JP2005337308A JP2005337308A JP2007141159A JP 2007141159 A JP2007141159 A JP 2007141159A JP 2005337308 A JP2005337308 A JP 2005337308A JP 2005337308 A JP2005337308 A JP 2005337308A JP 2007141159 A JP2007141159 A JP 2007141159A
Authority
JP
Japan
Prior art keywords
area
reading
image
ocr
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005337308A
Other languages
English (en)
Inventor
Hiroshi Iida
博史 飯田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005337308A priority Critical patent/JP2007141159A/ja
Priority to US11/448,943 priority patent/US20070116363A1/en
Priority to CNB2006101002692A priority patent/CN100430957C/zh
Priority to AU2006235826A priority patent/AU2006235826B2/en
Publication of JP2007141159A publication Critical patent/JP2007141159A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

【課題】OCR処理する領域の指定を容易に行なうことを目的とする。
【解決手段】各種アプリケーションで指定した領域情報を読み込むための各種読込プラグイン28によって、各種アプリケーションでOCR処理する領域を指定した領域指定用ドキュメントを読み込んで、認識領域指定読込部30によってOCR処理する領域を認識領域として抽出して、認識領域データ格納部20によってインデックス情報と関連づけて認識領域データベース22に格納する。そして、OCR処理するイメージを取り込む際に、認識領域データ取得部24によってインデックス情報に対応する認識領域を認識領域データベース22から検索して取得し、OCR認識モジュール26によってOCR処理するイメージと、検索して取得した認識領域に基づいてOCR処理する。
【選択図】図1

Description

本発明は、画像処理装置、画像処理方法、及び画像処理プログラムにかかり、特に、指定した領域をOCR(Optical Character Recognition)処理する画像処理装置、画像処理方法、及び画像処理プログラムに関する。
文書画像などが記録された用紙に対して、領域を指定してOCR処理を行なう場合には、GUI(Graphical User Interface)などを用いてマウス等で矩形領域を指定して指示する方法や、OCR処理する領域を予め設定しておいて、テンプレートとして使用する方法などがある。
また、上述の領域指定に類似する技術としては、例えば、特許文献1や特許文献2に記載の技術が提案されている。
特許文献1に記載の技術では、撮影者の視線情報に基づいて文字領域を設定して、撮像手段の撮像によって得られる画像信号のうち該文字領域に相当する画像信号について、文字認識処理を行なうことにより、文字認識の高精度化及び高速化を図ることが提案されている。
また、特許文献2に記載の技術では、帳票作成の際に、認識対象文字枠の印刷精度を緩和して、電子複写等の簡易印刷で帳票を作成可能にすることが提案されており、電子複写等の場合、各帳票において帳票外辺から文字認識領域までのずれは大きいが、印刷相互間のずれ、すなわち印刷の相対的なずれは少ないので、帳票画像において、文字認識領域を上線と右線とから構成される基準印刷からの相対位置によって指定することにより、帳票のエッジや外辺から文字認識領域までの距離を正確に印刷する必要性をなくして、帳票の印刷精度を緩和する。従って、従来、印刷によって作成するしか方法がなかった文字認識装置用の帳票を、ワープロや電子複写等の簡易印刷によって作成することが可能となる。
特開平7−282192号公報 特開平5−159099号公報
しかしながら、特許文献1に記載の技術では、領域指定に視線情報を使用するが、視線を検出するための構成が高価であり、通常の文書の領域指定に利用するには、領域している精度に問題がある。
また、特許文献2に記載の技術では、予め外枠などを定めて相対的な位置で領域を指定するが、システムが認識できる基準となるマーク(外枠など)が必要となり、様々な文書の認識への適用が困難である、という問題がある。
本発明は、上記問題を解決すべく成されたもので、OCR処理する領域の指定を容易に行なうことを目的とする。
上記目的を達成するために請求項1に記載の画像処理装置は、所定の処理を行なうために予め指定された領域を表す領域情報を含む電子化された領域指定用文書データを、自装置内で処理可能な形式に変換して入力する入力手段と、前記入力手段によって入力された前記領域指定用文書データから前記領域情報を抽出する抽出手段と、所定の処理を行なうための原稿画像を読み取る読取手段と、前記読取手段によって読み取られた原稿画像から前記抽出手段によって抽出された前記領域情報に対応する領域を抽出して所定の処理を行なう処理手段と、を備えることを特徴としている。
請求項1に記載の発明によれば、入力手段では、所定の処理を行なうために予め指定された領域を表す領域情報を含む電子化された領域指定用文書データが、自装置内で処理可能な形式に変換して入力され、抽出手段では、入力手段によって入力された領域指定用文書データから領域情報が抽出される。
例えば、各種アプリケーションソフトウエアを用いて所定の処理を行なうための領域が指定された領域指定用文書データを入力手段によって画像処理装置に入力することができ、抽出手段によってこの領域情報を抽出することができる。
そして、読取手段では、所定の処理を行なうための原稿画像が読み取られ、処理手段では、読取手段によって読み取られた原稿画像から抽出手段によって抽出された領域情報に対応する領域が抽出されて所定の処理(例えば、OCR処理)が行なわれる。
すなわち、ユーザが使い慣れているアプリケーションソフトウエア等によって所定の処理を行なう領域を指定して、所定の処理を行なう際に、指定した領域に対して所定の処理を自動的に行なうことができるので、OCR処理などの所定の処理を行なう領域の指定を容易に行なうことができる。
なお、請求項2に記載の発明のように、抽出手段によって抽出された領域情報を読取手段の読取先に関連するインデックス情報と関連づけて格納する格納手段と、読取手段によって原稿画像を読み取る際に読取手段の読取先からインデックス情報を取得する取得手段と、取得手段によって取得したインデックス情報に対応する領域情報を格納手段から検索する検索手段と、を更に備え、処理手段が読取手段によって読み取られた原稿画像から検索手段によって検索された領域情報に対応する領域を抽出して所定の処理を行なうようにしてもよい。
また、領域指定用文書データは、請求項3に記載の発明のように、予め定めた枠及び色(例えば、カラーマーカーなど)の少なくとも一方によって指定された領域情報を含むようにしてもよいし、請求項4に記載の発明のように、所定のアプリケーションソフトウエアで指定された領域情報を含むようにしてもよい。
請求項5に記載の画像処理方法は、所定の処理を行なうために予め指定された領域を表す領域情報を含む電子化された領域指定用文書データを、自装置内で処理可能な形式に変換して入力する入力ステップと、前記入力ステップで入力した前記領域指定用文書データから前記領域情報を抽出する抽出ステップと、所定の処理を行なうための原稿画像を読み取る読取ステップと、前記読取ステップで読み取った原稿画像から前記抽出ステップで抽出した前記領域情報に対応する領域を抽出して所定の処理を行なう処理ステップと、を含むことを特徴としている。
請求項5に記載の発明によれば、入力ステップでは、所定の処理を行なうために予め指定された領域を表す領域情報を含む電子化された領域指定用文書データを、自装置内で処理可能な形式に変換して入力し、抽出手段では、入力ステップで入力した領域指定用文書データから領域情報を抽出する。
例えば、各種アプリケーションソフトウエアを用いて所定の処理を行なうための領域が指定された領域指定用文書データを入力ステップによって入力することができ、抽出ステップによってこの領域情報を抽出することができる。
そして、読取ステップでは、所定の処理を行なうための原稿画像を読み取って、処理ステップでは、読取ステップで読み取った原稿画像から抽出ステップで抽出した領域情報に対応する領域を抽出して所定の処理(例えば、OCR処理)を行う。
すなわち、ユーザが使い慣れているアプリケーションソフトウエア等によって所定の処理を行なう領域を指定して、所定の処理を行なう際に、指定した領域に対して所定の処理を自動的に行なうことができるので、OCR処理などの所定の処理を行なう領域の指定を容易に行なうことができる。
なお、請求項6に記載の発明のように、抽出ステップで抽出した領域情報を読取ステップの読取先に関連するインデックス情報と関連づけて格納する格納ステップと、読取ステップで原稿画像を読み取る際に読取ステップの読取先からインデックス情報を取得する取得ステップと、取得ステップで取得したインデックス情報に対応する領域情報を格納ステップで格納した中から検索する検索ステップと、を更に備え、処理ステップが読取ステップで読み取った原稿画像から検索ステップで検索した領域情報に対応する領域を抽出して所定の処理を行なうようにしてもよい。
また、領域指定用文書データは、請求項7に記載の発明のように、予め定めた枠及び色の少なくとも一方によって指定された領域情報を含むようにしてもよいし、請求項8に記載の発明のように、所定のアプリケーションソフトウエアで指定された領域情報を含むようにしてもよい。
なお、請求項5乃至請求項8の何れか1項に記載の画像処理方法は、請求項9に記載の発明のように、コンピュータに実行させる画像処理プログラムとしてもよい。
以上説明したように本発明によれば、OCR処理する領域の指定を容易に行なうことができる、という効果がある。
以下、図面を参照して本発明の実施の形態の一例を詳細に説明する。図1は、本発明の実施の形態に係わる画像処理装置の構成を示す図である。
図1に示すように、本発明の実施の形態に係わる画像処理装置10は、イメージ読込部12、領域指定読込モジュール14、領域指定方法設定UI(User Interface)16、OCR UI18、認識領域データ格納部20、認識領域データベース22、認識領域データ取得部24、及びOCR認識モジュール26、を備えている。
イメージ読込部12は、OCR処理する紙文書(例えば帳票などの定型文書など)をスキャナやファックス等を用いて電子化して生成したイメージデータを読み込む。
領域指定読込モジュール14は、紙文書などを電子化した領域指定用ドキュメントや、各種アプリケーションソフトウエアで作成した領域指定用ドキュメントを取得する。また、領域指定用ドキュメントは、各種アプリケーションソフトウエアを用いて指定したOCR処理する対象となる領域情報(例えば、アプリケーションソフトウエアで使用可能な枠、色、カラーマーカ等で領域指定した情報)を含み、領域指定読込モジュール14は、領域指定用ドキュメントから各種アプリケーションソフトウエアで指定したOCR処理する対象となる領域を抽出する。なお、領域指定読込モジュール14は、手書き等(例えば、枠やカラーマーカーなど)で指定されたOCR処理する対象となる領域が指定された紙文書などを電子化した領域指定用ドキュメントを取得して、OCR処理する対象となる領域を抽出するようにしてもよい。
領域指定読込モジュール14は、各種読込プラグイン28及び認識領域指定読込部30で構成されている。
各種読込プラグイン28は、各種アプリケーションソフトウエア等で使用する形式のデータを画像処理装置10で処理可能な形式に変換して画像処理装置10内に入力する。例えば、OCR処理する対象となる領域を手書き等で指定(例えば、矩形枠やカラーマーカーなどで手書きしてOCR対象領域を指定)した紙文書を電子化したイメージデータ(領域指定用ドキュメント)として読み込んだり、紙文書を電子化してOCR処理する対象となる領域を各種イメージエディタ等で指定したイメージデータ(領域指定用ドキュメント)を読み込んだりするイメージ読込プラグインモジュール、マイクロソフト社製ソフトウエアのパワーポインタ(PPT)でOCR処理する対象となる領域を指定したPPT文書を読み込むプラグインモジュール、マイクロソフト社製ソフトウエアのワード(Word)でOCR処理する対象となる領域を指定したWord文書を読み込むプラグインモジュール、富士ゼロックス社製ソフトウエアのドキュワークス(XDW)でOCR処理する対象となる領域を指定したXDW文書を読み込むプラグインモジュールなどを含んで構成されている。なお、各種プラグイン28は、上述のプラグインモジュールに限るものではなく、その他のプラグインモジュールを適用するようにしてもよい。
認識領域指定読込部30は、各種プラグイン28から領域指定方法設定UI16で指定された設定に従って領域指定用の文書を読み込んでOCR処理する対象となる領域を抽出する。
領域指定方法設定UI16は、各種読込プラグイン28から領域を読み込むときの処理方法を設定する。設定する処理方法としては、例えば、矩形枠、塗り潰し領域、色指定、自動などの設定を有し、各設定に応じてOCR処理対象となる領域を抽出するための処理方法を指定する。なお、読み込む文書タイプの設定などを行なうようにしてもよい。
OCR UI18は、認識領域指定読込部30によって抽出されたOCR処理する対象となる領域に対するインデックス情報(例えば、あるデバイスから取得したイメージデータについて適用するルール等)を入力すると共に、領域指定方法設定UI16で設定する処理方法の選択を行なうための入力等を行なう。
認識領域データ格納部20は、OCR UI18によって入力されたインデックス情報と認識領域指定読込部30によって抽出されたOCR処理する対象となる領域(認識領域)を表す領域情報とを関連づけして認識領域データベース22に格納する。なお、認識領域データベース22に格納する認識領域は領域情報ではなく、認識領域データそのものをインデックス情報と関連付けて認識領域データベース22に格納するようにしてもよい。
認識領域データベース22は、例えば、ApeosWareFlowService(富士ゼロックス社製ソフトウエア)を適用することもでき、この場合には、該ソフトウエアが管理するルール情報にこの領域データを格納して管理することが可能である。
認識領域データ取得部24は、外部のUIやシステムから入力される領域選択情報(例えば、OCRするイメージを読み取るデバイス情報)等からインデックスデータを生成して、認識領域データベース22に格納されたデータからインデックスデータに対応する領域情報を選択して取得する。
OCR認識モジュール26は、OCR処理する紙文書(例えば帳票などの定型文書など)が電子化されたイメージデータをイメージ読込部12から取得すると共に、認識領域データ取得部24が取得した領域情報を取得して、イメージ読込部12から取得したイメージデータから領域情報に対応する領域に対してOCR処理を実行する。
続いて、上述のように構成された本発明の実施の形態に係わる画像処理装置10で行なわれる処理について説明する。
まず、上述のように構成された画像処理装置10に対してOCR処理する対象を登録する際の領域指定処理について説明する。なお、以下では、画像処理装置10とは別のコンピュータ等にインストールされた各種アプリケーションソフトウエアを用いてOCR処理する領域を指定する場合について説明する。
図2は、本発明の実施の形態に係わる画像処理装置10に対して外部のコンピュータ等からOCRする領域を設定する領域指定処理の流れの一例を示すフローチャートである。
まず、ステップ100では、OCR処理する紙文書から電子化したイメージデータを生成してステップ102へ移行する。すなわち、スキャナ等によってOCR処理する紙文書を読み込んで電子化してイメージデータを生成する。
ステップ102では、生成したイメージデータを各種アプリケーションソフトウエア(例えば、上述したPPT、Word、XDW等)に取り込んでステップ104へ移行する。
ステップ104では、各種アプリケーションソフトウエアを用いてイメージデータに対してOCR処理する領域の指定が終了したか否かを判定する。該判定は、各種アプリケーションソフトウエアでOCRする領域の指定が終了して画像処理装置10へ指定した領域の登録が指示されたか否か等を判定し、該判定が否定された場合には肯定されるまで待機してステップ106へ移行する。すなわち、各種アプリケーションソフトウエアでOCR処理する領域を指定するので、ユーザが使い慣れたアプリケーションソフトウエアを使用した領域指定が可能となる。なお、アプリケーションソフトウエアでの領域指定は、例えば、各種アプリケーションソフトウエアで使用可能な枠、色、カラーマーカ等を用いて領域を指定することができる。
ステップ106では、各種アプリケーションソフトウエアで領域指定されたイメージデータ(領域指定用ドキュメント)を画像処理装置10に出力して一連の処理を終了する。
なお、上述のように外部のコンピュータにインストールされた各種アプリケーションソフトウエアを使用してOCR処理する領域を指定する他に、矩形やカラーマーカ等で手書き指定した紙文書を電子化して領域指定用ドキュメントを生成するようにしてもよい。
図3は、本発明の実施の形態に係わる画像処理装置10で行なわれるOCR処理する領域を登録する領域登録処理の流れの一例を示すフローチャートである。
ステップ200では、上述のようにして各種アプリケーションソフトウエアでOCR処理する領域が指定された領域指定用ドキュメントを入力してステップ202へ移行する。例えば、領域指定方法設定UI16で指定された設定に従って認識領域指定読込部30が各種読込プラグイン28を介してコンピュータ等から出力された領域指定用ドキュメントを画像処理装置10内に取り込む。この時、領域指定方法設定UI16で文書タイプが指定されていない場合には、指定された文書の拡張子などから文書タイプを判断して、各種読込プラグイン28を介して読み込む。
ステップ202では、領域指定方法設定UI16による設定に応じて領域を抽出してステップ204へ移行する。すなわち、領域指定処理で指定された領域を抽出するように、領域指定方法設定UI16で設定することで、領域指定用ドキュメントから領域指定処理で指定された領域(以下、領域指定処理で指定された領域を認識領域という)を認識領域指定読込部30が抽出する。
ステップ204では、抽出された認識領域を特定するためのインデックスデータを取得してステップ206へ移行する。インデックスデータの取得は、認識領域データ格納部20がOCR UI18から取得する。例えば、ユーザがOCR UI18を用いて所定のデバイスからOCRするイメージがイメージ読込部12によって読み込まれた場合に、所定の認識領域を選択するルールをインデックスデータとして作成し、これを認識領域データ格納部20が取得する。
次にステップ206では、抽出された認識領域をインデックスデータと関連付けして認識領域データベース22に格納して一連の領域登録処理を終了する。これによって、所定のデバイスからOCRするイメージがイメージ読込部12によって読み込まれた場合に、対応するインデックスデータを検索することで、自動的に対応する認識領域を選択することが可能となる。
続いて、本発明の実施の形態に係わる画像処理装置10でOCR処理する場合の処理について説明する。図4は、本発明の実施の形態に係わる画像処理装置10で行なわれるOCR処理の流れの一例を示すフローチャートである。
ステップ300では、OCRイメージを取得してステップ302へ移行する。すなわち、OCR処理する紙文書(例えば帳票などの定型文書など)をスキャナやファックス等を読み込んで生成した電子化したイメージデータをイメージ読込部12を介してOCR認識モジュール26が取得する。
ステップ302では、OCRイメージの取得先のデバイス情報に基づいて認識領域を取得してステップ304へ移行する。すなわち、デバイス情報に対応するインデックス情報が関連づけされた認識領域を認識領域データ取得部24が認識領域データベース22から検索して取得する。
ステップ304では、OCR認識モジュール26が取得したOCRイメージを表すイメージデータと、認識領域データ取得部24が取得した認識領域を基にOCR処理を実行して一連のOCR処理を終了する。すなわち、OCRイメージから認識領域に対応する部分を抽出し、該抽出部分に対して所定のOCR処理を実行する。
このように、本実施の形態では、OCR処理を行なう領域を指定する際には、普段ユーザが使い慣れているアプリケーションソフトウエア(例えば、Word、PPT、XDW、イメージ編集ソフトウエア等のエディタ)を用いて領域を指定することでOCR領域を簡単に指定して、OCR処理を行なう際に、指定した領域に対してOCR処理を自動的に行なうことができるので、OCR処理する領域の指定を容易に行なうことができる。
例えば、イメージ上で領域を矩形枠で指定できるので、通常ファックスやスキャナなどによって読み込みが想定できるドキュメントを読み込んで認識領域をそのイメージ上に記載すればよく、認識すべき領域を明確に指定することができる。
また、領域指定にマーカなどの色指定も可能であるので、表などの矩形枠が多数あるドキュメントでもどの領域を指定したか否かを容易に判断することができる。
また、領域指定に利用した文書には、文書には、編集を一切加えないようにすることができるので、領域指定のためのドキュメントをユーザ独自の管理方法で管理することができ、領域指定に利用した文書の再利用も可能となる。また、定型処理の変更などで、指定領域を変更する時にも、この領域指定に利用した文書を再利用することができるので、領域の再指定が容易となる。
さらに、認識領域データベース格納部20に可能されるデータは、各種アプリケーションソフトウエアで指定された認識領域であるため、画像処理装置10や該画像処理装置10内のソフトウエア等が変更されても流用することができる。
なお、上記の実施の形態において、OCRするイメージは、ApeosWareFlowServiceから読み込むことようにしてもよい。また、認識領域データ格納部20は、認識領域をApeosWareFlowServiceに格納するようにしてもよい。そして、OCR処理を行なう際には、認識領域データ取得部24がApeosWareFlowServiceから得られる領域選択情報に基づいて認識領域を取得するようにしてもよい。
また、上記の実施の形態における、イメージ読込部12、領域指定読込モジュール14、領域指定方法設定UI16、認識データ格納部20、認識領域データ取得部24、及びOCR認識モジュール26は、ハードウエア構成としてもよいし、ソフトウエア構成としてもよい。すなわち、画像処理装置10で行なわれる上述の領域登録処理及びOCR処理はハードウエアで行なわれる処理としてもよいし、ソフトウエアで行なわれる処理としてもよい。
本発明の実施の形態に係わる画像処理装置の構成を示す図である。 本発明の実施の形態に係わる画像処理装置に対して外部のコンピュータ等からOCRする領域を設定する領域指定処理の流れの一例を示すフローチャートである。 本発明の実施の形態に係わる画像処理装置で行なわれるOCR処理する領域を登録する領域登録処理の流れの一例を示すフローチャートである。 本発明の実施の形態に係わる画像処理装置で行なわれるOCR処理の流れの一例を示すフローチャートである。
符号の説明
10 画像処理装置
12 イメージ読込部
14 領域指定読込モジュール
16 領域指定方法設定UI
20 認識領域データ格納部
22 認識領域データベース
24 認識領域データ取得部
26 OCR認識モジュール
28 各種読込プラグイン
30 認識領域指定読込部

Claims (9)

  1. 所定の処理を行なうために予め指定された領域を表す領域情報を含む電子化された領域指定用文書データを、自装置内で処理可能な形式に変換して入力する入力手段と、
    前記入力手段によって入力された前記領域指定用文書データから前記領域情報を抽出する抽出手段と、
    所定の処理を行なうための原稿画像を読み取る読取手段と、
    前記読取手段によって読み取られた原稿画像から前記抽出手段によって抽出された前記領域情報に対応する領域を抽出して所定の処理を行なう処理手段と、
    を備えた画像処理装置。
  2. 前記抽出手段によって抽出された前記領域情報を前記読取手段の読取先に関連するインデックス情報と関連づけて格納する格納手段と、
    前記読取手段によって原稿画像を読み取る際に前記読取手段の読取先から前記インデックス情報を取得する取得手段と、
    前記取得手段によって取得した前記インデックス情報に対応する前記領域情報を前記格納手段から検索する検索手段と、
    を更に備え、
    前記処理手段が前記読取手段によって読み取られた原稿画像から前記検索手段によって検索された前記領域情報に対応する領域を抽出して所定の処理を行なうことを特徴とする請求項1に記載の画像処理装置。
  3. 前記領域指定用文書データは、予め定めた枠及び色の少なくとも一方によって指定された領域情報を含むことを特徴とする請求項1又は請求項2に記載の画像処理装置。
  4. 前記領域指定用文書データは、所定のアプリケーションソフトウエアで指定された領域情報を含むことを特徴とする請求項1乃至請求項3の何れか1項に記載の画像処理装置。
  5. 所定の処理を行なうために予め指定された領域を表す領域情報を含む電子化された領域指定用文書データを、自装置内で処理可能な形式に変換して入力する入力ステップと、
    前記入力ステップで入力した前記領域指定用文書データから前記領域情報を抽出する抽出ステップと、
    所定の処理を行なうための原稿画像を読み取る読取ステップと、
    前記読取ステップで読み取った原稿画像から前記抽出ステップで抽出した前記領域情報に対応する領域を抽出して所定の処理を行なう処理ステップと、
    を含む画像処理方法。
  6. 前記抽出ステップで抽出した前記領域情報を前記読取ステップの読取先に関連するインデックス情報と関連づけて格納する格納ステップと、
    前記読取ステップで原稿画像を読み取る際に前記読取ステップの読取先から前記インデックス情報を取得する取得ステップと、
    前記取得ステップで取得した前記インデックス情報に対応する前記領域情報を前記格納ステップで格納した中から検索する検索ステップと、
    を更に備え、
    前記処理ステップが前記読取ステップで読み取った原稿画像から前記検索ステップで検索した前記領域情報に対応する領域を抽出して所定の処理を行なうことを特徴とする請求項5に記載の画像処理方法。
  7. 前記領域指定用文書データは、予め定めた枠及び色の少なくとも一方によって指定された領域情報を含むことを特徴とする請求項5又は請求項6に記載の画像処理方法。
  8. 前記領域指定用文書データは、所定のアプリケーションソフトウエアで指定された領域情報を含むことを特徴とする請求項5乃至請求項7の何れか1項に記載の画像処理方法。
  9. 請求項5乃至請求項8の何れか1項に記載の画像処理方法をコンピュータに実行させることを特徴とする画像処理プログラム。
JP2005337308A 2005-11-22 2005-11-22 画像処理装置、画像処理方法、及び画像処理プログラム Pending JP2007141159A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005337308A JP2007141159A (ja) 2005-11-22 2005-11-22 画像処理装置、画像処理方法、及び画像処理プログラム
US11/448,943 US20070116363A1 (en) 2005-11-22 2006-06-08 Image processing device, image processing method, and storage medium storing image processing program
CNB2006101002692A CN100430957C (zh) 2005-11-22 2006-07-06 图像处理装置、方法
AU2006235826A AU2006235826B2 (en) 2005-11-22 2006-11-02 Image processing device, image processing method, and storage medium storing image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005337308A JP2007141159A (ja) 2005-11-22 2005-11-22 画像処理装置、画像処理方法、及び画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2007141159A true JP2007141159A (ja) 2007-06-07

Family

ID=38053608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005337308A Pending JP2007141159A (ja) 2005-11-22 2005-11-22 画像処理装置、画像処理方法、及び画像処理プログラム

Country Status (4)

Country Link
US (1) US20070116363A1 (ja)
JP (1) JP2007141159A (ja)
CN (1) CN100430957C (ja)
AU (1) AU2006235826B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8300944B2 (en) 2008-02-08 2012-10-30 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, image processing system, and storage medium

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080002084A (ko) * 2006-06-30 2008-01-04 삼성전자주식회사 광학 문자 판독을 위한 시스템 및 광학 문자 판독방법
CN102576409A (zh) * 2009-09-17 2012-07-11 日本电气株式会社 图像处理设备、图像处理方法、分类器和程序
WO2013190479A2 (en) * 2012-06-19 2013-12-27 Lau Tak Wai Composite device and application process and apparatus thereof
JP2014067303A (ja) * 2012-09-26 2014-04-17 Toshiba Corp 文字認識装置、方法およびプログラム
CN103121324B (zh) * 2013-02-06 2015-09-16 心医国际数字医疗***(大连)有限公司 一种医疗影像集中打印的***
JP6129759B2 (ja) * 2014-02-03 2017-05-17 満男 江口 Simd型超並列演算処理装置向け超解像処理方法、装置、プログラム及び記憶媒体
JP2017151493A (ja) * 2016-02-22 2017-08-31 富士ゼロックス株式会社 画像処理装置、画像読み取り装置及びプログラム
US10423828B2 (en) * 2017-12-15 2019-09-24 Adobe Inc. Using deep learning techniques to determine the contextual reading order in a form document
US20200104586A1 (en) * 2018-09-28 2020-04-02 Konica Minolta Laboratory U.S.A., Inc. Method and system for manual editing of character recognition results

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844827A (ja) * 1994-07-27 1996-02-16 Ricoh Co Ltd デジタル複写機
JP2003303315A (ja) * 2002-04-12 2003-10-24 Hitachi Ltd 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
JP2005122682A (ja) * 2003-07-16 2005-05-12 Ricoh Co Ltd 文書処理システム、文書処理方法、文書処理プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5048109A (en) * 1989-12-08 1991-09-10 Xerox Corporation Detection of highlighted regions
JPH07168910A (ja) * 1993-10-19 1995-07-04 N T T Data Tsushin Kk 文書レイアウト解析装置及び文書フォ−マット識別装置
JPH08221510A (ja) * 1995-02-16 1996-08-30 Toshiba Corp 帳票文書処理装置および帳票文書処理方法
MY120211A (en) * 1996-05-01 2005-09-30 Casio Computer Co Ltd Document output device
DE19744743A1 (de) * 1997-10-10 1999-04-15 Daimler Chrysler Ag Verfahren zur automatischen Datenerfassung und Archivierung
GB9809679D0 (en) * 1998-05-06 1998-07-01 Xerox Corp Portable text capturing method and device therefor
JP4047090B2 (ja) * 2002-07-31 2008-02-13 キヤノン株式会社 画像処理方法及び画像処理装置
US20050196070A1 (en) * 2003-02-28 2005-09-08 Fujitsu Limited Image combine apparatus and image combining method
JP2004341656A (ja) * 2003-05-14 2004-12-02 Fujitsu Ltd 画像処理装置および画像処理プログラム
JP4405831B2 (ja) * 2003-05-20 2010-01-27 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4574313B2 (ja) * 2004-10-04 2010-11-04 キヤノン株式会社 画像処理装置および方法
JP4443443B2 (ja) * 2005-03-04 2010-03-31 富士通株式会社 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844827A (ja) * 1994-07-27 1996-02-16 Ricoh Co Ltd デジタル複写機
JP2003303315A (ja) * 2002-04-12 2003-10-24 Hitachi Ltd 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
JP2005122682A (ja) * 2003-07-16 2005-05-12 Ricoh Co Ltd 文書処理システム、文書処理方法、文書処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8300944B2 (en) 2008-02-08 2012-10-30 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, image processing system, and storage medium

Also Published As

Publication number Publication date
AU2006235826B2 (en) 2010-01-28
US20070116363A1 (en) 2007-05-24
CN100430957C (zh) 2008-11-05
AU2006235826A1 (en) 2007-06-07
CN1971585A (zh) 2007-05-30

Similar Documents

Publication Publication Date Title
JP2007141159A (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP5223284B2 (ja) 情報検索装置、方法およびプログラム
JP4181892B2 (ja) 画像処理方法
US8155444B2 (en) Image text to character information conversion
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4920928B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2007102545A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP2004334334A (ja) 文書検索装置、文書検索方法及び記憶媒体
JP2004334338A (ja) 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2009122760A (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP2008146605A (ja) 画像処理装置及びその制御方法
JP2008059157A (ja) 書類確認支援システム、書類確認支援装置およびプログラム
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2004363786A (ja) 画像処理装置
JP4811133B2 (ja) 画像形成装置及び画像処理装置
JP2006093917A (ja) 画像読取装置および画像処理装置、画像形成装置
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2021149439A (ja) 情報処理装置及び情報処理プログラム
JP2007052613A (ja) 翻訳装置、翻訳システムおよび翻訳方法
JP2007048061A (ja) 文字処理装置、文字処理方法及び記録媒体
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2007323415A (ja) 情報検索装置、情報検索システム、情報検索装置の制御方法、及び制御プログラムを提供する媒体
JP2007048057A (ja) 画像処理装置
JP2008181223A (ja) 電子文書管理システム、電子文書管理方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120508