JP2020160553A - 画像処理プログラム、及び画像処理装置 - Google Patents

画像処理プログラム、及び画像処理装置 Download PDF

Info

Publication number
JP2020160553A
JP2020160553A JP2019056523A JP2019056523A JP2020160553A JP 2020160553 A JP2020160553 A JP 2020160553A JP 2019056523 A JP2019056523 A JP 2019056523A JP 2019056523 A JP2019056523 A JP 2019056523A JP 2020160553 A JP2020160553 A JP 2020160553A
Authority
JP
Japan
Prior art keywords
color
character string
image
image processing
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019056523A
Other languages
English (en)
Inventor
正俊 篠原
Masatoshi Shinohara
正俊 篠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2019056523A priority Critical patent/JP2020160553A/ja
Priority to US16/576,679 priority patent/US11328448B2/en
Priority to EP19209980.2A priority patent/EP3716147A1/en
Priority to CN201911136226.3A priority patent/CN111738901A/zh
Publication of JP2020160553A publication Critical patent/JP2020160553A/ja
Priority to US17/474,308 priority patent/US20210407137A1/en
Priority to US17/701,932 priority patent/US20220215589A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0007Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】OCR処理によって取得した文字列に対する操作の煩雑さを軽減する画像処理プログラム及び画像処理装置を提供することである。【解決手段】実施形態の画像処理プログラムは、取得部と、制御部とを備える画像処理装置としてコンピュータを機能させる。取得部は、画像データを取得する。制御部は、画像データに含まれる各色の文字列を検出し、色に対応付けられた制御処理を、当該色の文字列を用いて実行する。【選択図】図5

Description

本発明の実施形態は、画像処理プログラム、及び画像処理装置に関する。
従来、画像処理装置は、画像データの全領域または指定した領域を対象として、光学文字認識(OCR:Optical character recognition)処理を行い、文字列を取得する。OCR処理によって取得した文字列に対して、さらに、複写や保存等の操作が行われる。
しかしながら、OCR処理後に、取得した文字列に対して操作を行う必要があり、操作が煩雑であるという課題がある。
特開2010-72826号公報 特開2011-76581号公報 特開平1−150974号公報
本発明が解決しようとする課題は、OCR処理によって取得した文字列に対する操作の煩雑さを軽減する画像処理プログラム及び画像処理装置を提供することである。
実施形態の画像処理プログラムは、取得部と制御部とを持つ画像処理装置としてコンピュータを機能させる。取得部は、画像データを取得する。制御部は、画像データに含まれる各色の文字列を検出し、色に対応付けられた制御処理を、当該色の文字列を用いて実行する。
実施形態の画像処理装置のハードウェア構成例を示すブロック図。 第一実施形態の画像処理装置の機能構成例を示す概略ブロック図。 第一実施形態の原稿画像の一例を示す図。 第一実施形態のパラメータの第1の例を示す図。 第一実施形態の画像処理装置の処理フローを示す図。 第一実施形態のパラメータの第2の例を示す図。 第一実施形態の画像処理装置が出力するデータの一例を示す図。 第二実施形態の画像処理システムの処理フローを示す図。
以下、実施形態の画像処理プログラム及び画像処理装置を、図面を参照して説明する。
図1は、実施形態に係る画像処理装置100を含む画像処理システムの装置構成例を示す図である。図1に示す画像処理システムは、画像処理装置100、画像形成装置200、及び情報処理装置300を有する。画像処理装置100は、通信ケーブルによって画像形成装置200と接続されている。
画像形成装置200は、例えば複合機である。画像形成装置200は、画像読み取り部201を有する。画像読み取り部201は、読み取り対象の原稿画像を光学的に読み取り、色情報を有する画像データを生成する。画像読み取り部201は、CCD(Charge Coupled Device)やCOMS(Complementary Metal Oxide Semiconductor)センサ等のイメージセンサを用いて構成される。画像読み取り部201は、生成した画像データを画像処理装置100へ出力する。
画像処理装置100は、画像読み取り部201が出力した画像データを取得する。画像処理装置100は、画像データに含まれる各色の文字列を検出し、色ごとに対応付けられた制御処理を、当該色の文字列を用いて実行する。画像データは、色情報を有する。画像データは、文字列の画像を含む。換言すると、画像データは、例えば、文字列が記述された原稿画像の画像データである。なお、画像データは、ホワイトボードの画面の画像データであってもよい。または、画像データは、撮像装置による撮像によって生成された画像データであってもよい。
画像処理装置100は、CPU(Central Processing Unit)101、通信モジュール102、インタフェース(Interface)103等を備えるコンピュータである。画像処理装置100は、さらに、RAM(Random Access Memory)104、ROM(Read Only Memory)105、HDD(Hard Disk Drive)106等を備える。通信モジュール102は、画像形成装置200及び情報処理装置300の各々との間で無線通信を行うものであってもよいし、有線通信を行うものであってもよい。RAM104は、画像処理プログラム107及びパラメータテーブル108を記憶する。
<第一実施形態>
図2は、第一実施形態に係る画像処理装置100の機能構成を示す概略ブロック図である。
CPU101(図1)は、RAM104等に記憶された画像処理プログラム107(図1)を読み出して実行する。これにより、画像処理装置100は、取得部110、領域判定部111、文字認識部112、及び制御処理部113の各機能を実現する。なお、これらの機能110〜113のうちの一部は、電子回路によって画像処理装置100に実現されてもよい。
取得部110は、原稿画像の画像データを取得する。領域判定部111は、画像データから、色ごとの色領域を検出する。色領域は、画像データにおいて同様の色で文字列が記載された範囲を示す。換言すると、色領域は、画像データにおいて、同様の色の文字列の纏まりを含む領域を示す。また、色領域は、画像データにおいて、文字列が同様の色で装飾された範囲であってもよい。装飾は、例えば、蛍光ペンやマーカー等によって、文字列に重ねてラインを引くことや文字列を囲むことを示す。本実施の形態において、同様の色は、ある色であるとみなすことができる色の範囲を含む。または、同様の色は、「赤」「青」のように、色の呼称によって特定される当該色の範囲を含む。
文字認識部112は、OCR処理を利用して、領域判定部111が検出した各色領域について、当該色領域に含まれる文字列(テキストデータ)を検出する。具体的には、文字認識部112は、各色領域における文字を認識し、各文字が何の文字であるかを特定する。文字認識部112は、特定した文字が構成する文字列を検出する。なお、文字列は、1つの文字のみを含んでいてもよい。文字は、数値や数式、記号等を含んでいてもよい。
制御処理部113は、パラメータテーブル108を参照し、各色に対応付けられた制御処理を取得する。制御処理部113は、各色に対応付けられた制御処理を、当該色の色領域で文字認識された文字列を用いて実行する。パラメータテーブル108の例については、図4にしたがって後述する。
図3は、本実施の形態における原稿画像10の一例を示す図である。画像処理装置100は、図3に示すような原稿画像10の画像データを入力として処理を行う。図3に示す原稿画像10は、文字列、及びグラフ等の図を含む。原稿画像10に含まれる文字列は、例えば、文書名、日付、部署名、及び文章等である。
具体的には、図3に示す原稿画像10では、文字列の纏まりごとに異なる色で記載されている。例えば、原稿画像10の色領域11aには、文書名「ABC文書」が赤字で記述されている。色領域11bには、日付「YYYY/MM/DD」が黒字で記述され、その上に黄色の蛍光マーカーによってラインが引かれている。色領域11cには、部署名「DDD事業部」が青字で記述されている。色領域11d、11fには、各文書が黒字でそれぞれ記述されている。色領域11e、11gには、各文書が黒字でそれぞれ記述され、緑色のマーカーによって文書が囲まれている。例えば、色領域11e、11gでは、楕円や矩形等によって文書が囲まれる。
このように、図3の原稿画像10は、複数の色の文字列の画像を含む。図3に示す原稿画像10は五色の文字列を含む。ただし、原稿画像10が含む文字列の色の数は、この例に限定されるものではない。本実施の形態における原稿画像10は、二色以上の文字列の画像を含んでいればよい。
図4は、本実施の形態におけるパラメータテーブル108の一例を示す図である。パラメータテーブル108は、色と制御処理との対応関係を有する。
図4に示すパラメータテーブル108によると、色「黒」には、制御処理「ファイル1の内容として格納」が対応付けられている。色「赤」には、制御処理「ファイル1のファイル名に指定」が対応付けられている。色「青」には、制御処理「フォルダ名に指定」が対応付けられている。また、色「緑」には、制御処理「ファイル2の内容として格納」が対応付けられている。色「黄」には、制御処理「ファイル2のファイル名に指定」が対応付けられている。
すなわち、図4に示すパラメータテーブル108では、黒の色領域の文字列を格納するファイル1を、赤の色領域の文字列をファイル名として生成することが指定される。さらに、緑の色領域の文字列を格納するファイル2を、黄の色領域の文字列をファイル名として生成することが指定される。また、ファイル1、2を、青の色領域の文字列のフォルダ名のフォルダ配下に生成することが指定される。
なお、本実施の形態では、パラメータテーブル108が画像処理装置100に予め格納される場合を例示するが、この例に限定されるものではない。パラメータテーブル108は、画像データとともに、画像処理装置100に入力されてもよい。パラメータテーブル108は、画像データごとに異なってもよいし、複数の画像データの間で共通に用いられてもよい。なお、パラメータテーブル108の情報が、制御処理の際に、ユーザによって入力されてもよい。
なお、図3に示すパラメータテーブル108では、各色について制御処理の内容が対応付けられているが、この例に限定されるものではない。パラメータテーブル108では、複数の色のうち一部の色についてのみ、制御処理の内容が対応付けられていてもよい。
図5は本実施形態における画像処理装置100の処理フローを示す図である。画像処理装置100の取得部110は、画像データを取得する(ACT11)。具体的には、取得部110は、通信モジュール102を介して、画像読み取り部201が出力した画像データを取得する。または、取得部110は、HDD106等の記憶装置に格納された画像データを取得してもよい。
領域判定部111は、取得部110によって取得された画像データにおける、色ごとの色領域を抽出する(ACT12)。領域判定部111は、画像データにおいて、同様の色で文字列が記述されている範囲を色領域として抽出する。また、領域判定部111は、画像データにおいて、文字列が同様の色で装飾された範囲を色領域として抽出する。領域判定部111は、画像データから、色ごとに、当該色で文字列が記述された色領域を検出する。
図3の原稿画像の例によると、領域判定部111は、原稿画像10の画像データから、色領域11a〜11gをそれぞれ検出する。以下、色領域11a〜11gを区別しない場合には、色領域11とも称する。
具体的には、領域判定部111は、例えば、次のように各色領域11を抽出する。領域判定部111は、画像データを所定の大きさのタイルに分割し、各タイルの色情報の平均値を取得する。タイルは、隣接する複数の画素を含む。色情報は、例えば、RGB値である。領域判定部111は、隣接するタイルとの平均値の差分値が所定の範囲に収まる、隣接する複数のタイルを検出する。領域判定部111は、検出した複数のタイルを含む領域を色領域11として検出する。領域判定部111は、画像データに基づいて、検出した色領域11の色を検出する。
または、領域判定部111は、別の方法にしたがって、各色領域11を検出してもよい。同様にして、領域判定部111は、画像データを所定の大きさのタイルに分割し、各タイルの色情報の平均値を取得する。領域判定部111は、各色(例えば、黒、赤、青、緑、黄等)それぞれの色情報のサンプル値を予め保持する。領域判定部111は、各色の色情報のサンプル値と平均値との差分が所定の範囲に収まる、隣接する複数のタイルを検出する。領域判定部111は、検出した複数のタイルを含む領域を色領域11として検出する。
また、領域判定部111は、次のようにマーカー等で囲まれた色領域11を検出してもよい。領域判定部111は、画像データの各画素を左上端から順に走査しながら、各画素の色情報を取得する。領域判定部111は、走査順が前後の画素の色情報の差分が所定の範囲内に収まる場合、同様の色情報の画素が連続していると判定する。この場合、領域判定部111は、同様の色情報の画素が連続している画素の周辺画素が同様の色情報を有するか否かを判定する。領域判定部111は、同様の色情報を有する周辺画素の位置に基づいて、同様の色情報を有する矩形や楕円等を画定する画素群を検出する。領域判定部111は、検出した画素群に基づいて色領域11を検出する。
なお、色領域11の検出方法は上述する例に限定されるものではない。領域判定部111は、画像処理の一般的に知られる種々の技術にしたがって、画像データにおける各色領域11を検出することができる。
文字認識部112は、領域判定部111によって検出された各色領域11に対してOCR処理を行う。これにより、文字認識部112は、各色領域11に含まれる文字列をテキストデータとして検出する(ACT13)。図3の原稿画像の例によると、文字認識部112は、画像データの各色領域11a〜11gに含まれる文字列をそれぞれ検出する。具体的には、文字認識部12は、色領域11aのOCR処理を実行して、文字列「ABC文書」を検出する。文字認識部12は、他の色領域についても同様に、文字列を検出する。これにより、画像データにおける各色の文字列が検出される。前述したとおり、各色の文字列は、所定の色で記述された文字列、及び、所定の色によって装飾された文字列を含む。
なお、図5の処理フローでは、色領域11の検出処理(ACT12)の後に、文字認識処理(ACT13)を行う場合を例示する。ただし、この例に限定されるものではない。例えば、文字認識処理(ACT13)の後に、色領域11の検出処理(ACT12)を行うことによって、画像データから各色の文字列が検出されてもよい。
この場合、例えば、文字認識部112は、画像データの全体に対してOCR処理を実行し、文字列を検出する。領域判定部111は、画像データに基づいて、それぞれの文字列及び文字列の周辺画素の色情報を取得する。領域判定部111は、連続する文字列のうち、同様の色情報を有する文字列を検出する。または、領域判定部111は、連続する文字列のうち、同様の色情報で囲まれた文字列を検出する。これにより、画像データに含まれる各色の文字列を検出することができる。
制御処理部113は、パラメータテーブル108を参照し、色ごとに対応付けられた制御処理を、当該色の文字列を用いて実行する(ACT14)。具体的には、制御処理部113は、パラメータテーブル108を参照し、各色に対応付けられた制御処理の内容を取得する。制御処理部113は、文字認識部112によって検出された、各色の文字列を取得する。制御処理部113は、取得した文字列の色に対応付けられた制御処理を、当該文字列を用いて実行する。
ここで、制御処理部113の処理(ACT14)の例を、図3の原稿画像10及び図4のパラメータテーブル108にしたがって説明する。
前述したとおり、図3の原稿画像10では、色領域11aには文書名「ABC文書」が赤字で記述されている。色領域11cには部署名「DDD事業部」が青字で記述されている。色領域11d、11fには、文書が黒字で記述される。制御処理部113は、パラメータテーブル108を参照し、色「赤」「青」「黒」に対応付けられた制御処理の内容を取得する。前述したとおり、色「黒」には、制御処理「ファイル1の内容として格納」が対応付けられる。色「赤」には、制御処理「ファイル1のファイル名に指定」が対応付けられ、色「青」には制御処理「フォルダ名に指定」が対応付けられる。
したがって、制御処理部113は、色領域11d、11fの文書を格納するファイルを生成する。また、制御処理部113は、生成したファイルのファイル名を、文字列「ABC文書」に設定する。制御処理部113は、生成したファイルを、フォルダ名「DDD事業部」のフォルダ配下に格納する。なお、フォルダ「DDD事業部」は、既存のフォルダであってもよいし、新たに生成されたフォルダであってもよい。
なお、本実施の形態ではフォルダ名としてフォルダの名前(DDD事業部)を指定する場合を例示するが、この例に限定されるものではない。フォルダ名として、フォルダの名前と階層とを示すフルパス名が指定されてもよい。
同様にして、色領域11cには、日付「YYYY/MM/DD」の上に黄色の蛍光マーカーによってラインが引かれ、色領域11e、11gの文書は緑字色のマーカーによって囲まれている。制御処理部113は、色領域11e、11gの文字列を格納するファイルを生成し、生成したファイルのファイル名を文字列「YYYY/MM/DD」に設定する。制御処理部113は、生成したファイルを、フォルダ「DDD事業部」の配下に格納する。
このように、本実施形態では、第1の色に文字列をファイル名として用いる制御処理が、第2の色に文字列をファイルに格納する制御処理が対応付けられる。画像処理装置100は、第2の色の文字列を格納するとともに第1の色の前記文字列を前記ファイル名とするファイルを生成するユーザは、例えば、ファイル名やフォルダ名として所望する文字列が所定の色にしたがって記述または装飾された原稿画像10を生成する。ユーザは、例えば、印刷された原稿画像10に、所定の色にしたがって文字列を書き込んでもよい。ユーザは、印刷された原稿画像10の文字列に対して、所定の色にしたがって装飾を行ってもよい。これにより、画像処理装置100は、画像データに含まれる文字列を格納する、所望の名前のファイルを生成することができる。
原稿画像10は、手書きの文字列や装飾を含んでいてもよい。例えば、原稿画像10に基づいて打合せを行うような場合、原稿画像10に対して、赤字や青字のペンにしたがって情報を書き込む場合がある。例えば、ユーザは、ファイル名として指定したい文字列を赤ペン等で原稿画像10に書き込む。または、ユーザは、別ファイルとして保存したい原稿画像10内の文字列を、緑色のマーカー等で囲む。これにより、画像処理装置100は、原稿画像10に予め記述された文書を内容とする、赤字で指定したファイル名のファイルを生成できる。また、画像処理装置100は、原稿画像10に緑字で記述された文字列を、別のファイルに格納することができる。
前述したとおり、画像データは、ホワイトボードの印刷画像の画像データであってもよい。ホワイトボードには、複数の色のマーカーによって、文字列が書き込まれる。例えば、重要な情報は赤いマーカーによって書き込まれる。この場合、例えば、画像処理装置100は、赤字の文字列に所定の制御処理に対応付けることで、重要な情報を有効活用することができる。
<変形例1>
変形例1は、制御処理の別の例を説明する。変形例1は、第1の実施形態と組み合わせて用いられてもよい。
図6は、変形例1におけるパラメータテーブル108−1の一例を示す図である。図4で説明したとおり、パラメータテーブル108−1は、色と制御処理の内容と対応関係を有する。図6に示すパラメータテーブル108−1によると、色ごとに、文字列に所定の識別情報を関連付ける処理が対応付けられている。具体的には、色「黒」には、識別情報「ID01」を関連付けることが対応付けられている。また、色「赤」には識別情報「ID02」を関連付けることが対応付けられ、色「青」には識別情報「ID03」を関連付けることが対応付けられている。
制御処理部113は、OCR処理によって取得した文字列に、色に応じた識別情報を関連付けて出力する。したがって、制御処理部113は、色領域11d、11fの文書に識別情報「ID01」を関連付けるとともに、文字列「ABC文書」に識別情報「ID02」を関連付ける。また、制御処理部113は、文字列「DDD事業部」に識別情報「ID03」を関連付ける。
変形例1では、制御処理部113が、識別情報を関連付けた各文字列を、同一のファイルに出力する場合を例示する。
図7は、変形例1における出力ファイルの一例を示す図である。図7に示す出力ファイル20によると、色領域11d、11fの文書の先頭に識別情報「ID01」が付与されている。同様にして、文字列「ABC文書」の先頭に識別情報「ID02」が、文字列「DDD事業部」の先頭に識別情報「ID03」が付与されている。
このように、文字列に識別情報が付与される。これにより、例えば、ユーザは、出力ファイル20を参照することで、識別情報に基づいて各文字列の種別を識別することができる。また、他のアプリケーションは、出力ファイル20を読み出し、識別情報に基づいてデータベースに文字列を登録することができる。例えば、他のアプリケーションは、出力ファイル20の各文字列を、データベースの識別情報に応じた項目にデータとして登録する。
なお、識別情報は、図6に示す例に限定されるものではない。例えば、識別情報は、マークアップ言語のタグ等であってもよい。この場合、例えば、文字列の先頭に付与される情報、及び、文字列の末尾に付与される情報を含む識別情報が指定される。これにより、制御処理部113は、OCR処理後の各文字列に所定のタグを付与したファイルを生成できる。
このように、変形例1では、第3の色に、文字列に所定の識別情報を付加して出力する制御処理が対応付けられる。画像処理装置100は、画像データにおける第3の色の文字列を検出し、当該文字列に所定の識別情報を付加して出力する。すなわち、画像処理装置100は、所定の識別情報を関連付けることが対応付けられた色の文字列に、当該所定の識別情報を付加して出力する。ユーザは、例えば、所望の識別情報を関連付ける文字列が、当該識別情報に対応する色にしたがって記述または装飾された原稿画像10を生成する。これにより、画像処理装置100は、原稿画像10の画像データに基づくことにより、文字列に対して色に応じた所定の識別情報を付与することができる。
<変形例2>
変形例2は、制御処理の別の例を説明する。変形例2は、第1の実施形態、変形例1のいずれかまたは両方と組み合わせて用いられてもよい。
図示していないが、変形例2では、パラメータテーブル108には、制御処理の内容として、色ごとに、文字列を所定の出力先に出力することが対応付けられる。出力先は、例えば、画像処理装置100上で動作する他のアプリケーションである。また、出力先は、画像処理装置100上で動作するプロセスやスレッド等であってもよい。また、出力先は、既存のファイルであってもよい。
パラメータテーブル108では、例えば、色「黒」に、アプリケーションのプロセスAに出力することが対応付けられる。また、色「赤」には、アプリケーションのプロセスBに出力することが対応付けられる。したがって、制御処理部113は、色領域11d、11fの文書を、アプリケーションのプロセスAに出力する。また、制御処理部113は、文字列「ABC文書」を、アプリケーションのプロセスBに出力する。制御処理部113は、例えば、プロセス間通信を利用して、文字列を出力先のプロセスに出力する。
このように、変形例2では、第3の色に、文字列を所定の出力先に出力する制御処理が対応付けられる。画像処理装置100は、画像データにおける第3の色の文字列を検出し、当該文字列を所定の出力先に出力する。すなわち、画像処理装置100は、所定の出力先に出力することが対応付けられた色の文字列を、当該所定の出力先に出力する。ユーザは、例えば、所望の出力先に出力したい文字列が、当該出力先に対応する色にしたがって記述または装飾された原稿画像10を生成する。これにより、画像処理装置100は、原稿画像10の画像データに基づくことにより、文字列を対応する出力先に出力させることができる。
以上のように、第一実施形態における画像処理装置100は、画像データを取得する取得部110と、制御部(111〜113)とを有する。制御部は、画像データに含まれる各色の文字列を検出し、色に対応付けられた制御処理を、当該色の文字列を用いて実行する。
これにより、原稿画像10の画像データのOCR処理によって取得された文字列の制御処理を、予め指定することができる。換言すると、OCR処理によって取得される文字列の制御処理を、色にしたがって指定することができる。画像処理装置100は、画像データに含まれる文字列の色に基づいて、各色の文字列を用いた当該色に対応付けられた制御処理を実行できる。したがって、ユーザは、原稿画像10に所定の色の文字列を含めるだけで、OCR処理後に操作を要することなく、色に応じた処理を実行させることができる。これにより、OCR処理によって取得した文字列に対する操作の煩雑さを軽減することができる。
また、画像処理装置100は、文字列に対応する色ごとに、OCR処理後の制御処理を異ならせることができる。これにより、色ごとに、任意の制御処理を指定することができる。また、画像データごとにパラメータテーブル108を生成することで、画像データに応じて制御処理を異ならせることができる。
なお、本実施形態では、画像処理装置100と画像形成装置200が別である場合を例示したが、画像処理装置100は画像形成装置200に備えられていてもよい。この場合、画像読み取り部201による原稿画像10の読み取り処理に続いて、本実施の形態における画像処理装置100の処理が実行される。すなわち、原稿画像の読み取り後、画像データに含まれる文字列を用いて当該文字列の色に対応する制御処理を実行することができる。これにより、画像データの文字列に対する操作の煩雑さを軽減することができる。
<第二実施形態>
第二実施形態における画像処理装置100は、他の装置と連携する制御処理を実行する。第二実施形態における画像処理システムの構成例は、第一実施形態(図1)と同様である。第二実施形態における画像処理装置100の機能構成についても、第一実施形態(図2)と同様である。第二実施形態における制御処理部113の処理内容については、第一実施形態と異なる。以下、第二実施形態における制御処理部113の処理内容を処理フローにしたがって説明する。
図8は、本実施形態における画像処理システムの処理フローを示す図である。本実施形態における情報処理装置300では、画像処理プログラム107と連携して処理を行う連携プログラム(図示なし)が稼働する。連携プログラムは、例えば、データを収集し、管理するとともに、データの分類や分析を行うプログラムである。連携プログラムは、例えば、種々のデータをデータベース(図示なし)に記憶する。
ユーザは、画像形成装置200にログインする(ACT21)。具体的には、画像形成装置200は、ID及びパスワードの入力を受け付ける画面を表示する。ユーザがID及びパスワードを入力すると、画像形成装置200は、認証処理を行う。認証に成功すると、画像形成装置200は、画像処理装置100の画像処理プログラム107の起動指示を行う。
画像処理装置100の画像処理プログラム107は、起動処理を行う(ACT22)。画像形成装置200は、入力されたID及びパスワードを、起動した画像処理プログラム107へ通知する。画像処理プログラム107は、画像形成装置200から通知されたID及びパスワードを、情報処理装置300へ通知する。情報処理装置300で動作する連携プログラムは、画像処理装置100から通知されたID及びパスワードに基づいて認証処理を行う(ACT23)。認証に成功すると、連携プログラムは、画像形成装置200へ認証の成功を示す情報を通知する。
画像形成装置200は、通知を受信すると、画像読み取り部201に原稿画像10の読み取りを指示する。画像読み取り部201は、原稿画像10を読み取って画像データを生成する(ACT24)。画像読み取り部201は、生成した画像データを画像処理装置100に送信する。
画像処理装置100は、画像形成装置200から送信された画像データを取得する(ACT25)。処理ACT25、ACT26は、図5で説明した処理ACT12、ACT13と同様である。制御処理部113は、パラメータテーブル108を参照し、色に対応付けられた制御処理を、当該色の文字列を用いて実行する(ACT28)。
本実施形態では、パラメータテーブル108に制御処理の内容として、呼び出すAPI(Application Programming Interface)が色ごとに対応付けられる。APIは、連携プログラムのAPIである。画像処理プログラム107は、連携プログラムのAPIを呼び出すことによって、連携プログラムの各機能や管理するデータ等を利用することができる。
連携プログラムのAPIは、例えば、データの登録、更新や、データの取得等を実行する命令である。具体的には、例えば、第1のAPIは、連携プログラムが管理する項目Xへデータを入力する命令である。また、第2のAPIは、連携プログラムが管理する項目Yへデータを入力する命令である。パラメータテーブル108では、例えば、色「黒」には、第1のAPIを呼び出すことが対応付けられている。また、色「緑」には、第2のAPIを呼び出すことが対応付けられている。
制御処理部113が、文字列を用いて当該文字列の色に対応付けられたAPIを呼び出すことにより、連携プログラムがその文字列の入力処理を行う(ACT29)。図3の原稿画像10の例で説明すると、制御処理部113は、色領域11d、11fの文字列を用いて、第1のAPIを呼び出す。また、制御処理部113は、色領域11e、11gの文字列を用いて、第2のAPIを呼び出す。これにより、連携プログラムのデータの項目Xに色領域11d、11fの文字列が入力され、項目Yに色領域11e、11gの文字列が入力される。
このように、ユーザは、例えば、連携プログラムの各項目に入力したい文字列を、項目に応じた色によって記述した原稿画像10を生成する。これにより、画像処理装置100は、連携プログラムが管理する各項目のデータとして、OCR処理後の文字列を入力することができる。
前述したとおり、原稿画像10を用いて打合せを行うような場合、原稿画像10に対して、ユーザが赤字や青字のペンにしたがって情報を書き込む場合がある。画像処理装置100は、ユーザによって書き込みが行われた原稿画像10の画像データを取得する。これにより、画像処理装置100は、ユーザが赤字や青字で書き込んだ文字列を、連携プログラムのデータの所定の項目に効率的に入力することができる。
なお、APIは、上述した内容に限定されるものではない。APIは、例えば、電子メールを送信する命令であってもよい。また、APIは、連携プログラムの所定のプロセスやスレッドに、文字列を出力する命令であってもよい。この場合、制御処理部113は、所定の色で記述された文字列を、当該色に対応付けられた連携プログラムのプロセスに出力することができる。
以上のように、第二実施形態において、第4の色に文字列を用いて所定のAPIを呼び出す制御処理が対応付けられる。画像処理装置100は、画像データを取得する取得部110と、制御部(111〜113)とを有する。制御部は、画像データに含まれる各色の文字列を検出し、第4の色の文字列を用いて所定のAPIを呼び出す。すなわち、画像処理装置100は、所定の色に対応付けられたAPIを当該所定色の文字列を用いて実行する。
これにより、画像処理装置100は、画像データに含まれる文字列の色に基づいて、各色の文字列を用いて当該色に対応付けられたAPIを実行することができる。ユーザは、所望のAPIを呼び出す際に用いる文字列が、所望のAPIに対応する色によって記述または装飾された原稿画像10を生成する。これにより、画像処理装置100は、原稿画像10の画像データに基づくことにより、OCR処理後に操作を要することなく、所望のAPIを所望の文字列を用いて実行させることができる。これにより、OCR処理によって取得した文字列に対する操作の煩雑さを軽減することができる。
なお、第二実施形態は、第一実施形態、及び、変形例1、2と組み合わせて用いられてもよい。組み合わせ用いることによって、画像データの各文字列を用いた制御処理をより適切に実現できる。
以上、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
100…画像処理装置、200…画像形成装置、300…情報処理装置、101…CPU、102…通信モジュール、103…インタフェース、104…RAM、105…ROM、106…HDD、107…画像処理プログラム、108…パラメータテーブル、110…取得部、111…領域判定部、112…文字認識部、113…制御処理部

Claims (5)

  1. 画像データを取得する取得部と、
    前記画像データに含まれる各色の文字列を検出し、前記色に対応付けられた制御処理を、当該色の前記文字列を用いて実行する制御部と、
    を備える画像処理装置としてコンピュータを機能させるための画像処理プログラム。
  2. 第1の色に前記文字列をファイル名として用いる制御処理が対応付けられ、第2の色に前記文字列をファイルに格納する制御処理が対応付けられ、
    前記制御部は、前記第2の色の前記文字列を格納するとともに前記第1の色の前記文字列を前記ファイル名とする前記ファイルを生成する、
    請求項1に記載の画像処理プログラム。
  3. 第3の色に、前記文字列に所定の識別情報を付加して出力する制御処理、または前記文字列を所定の出力先に出力する制御処理が対応付けられ、
    前記制御部は、前記第3の色の前記文字列に前記所定の識別情報を付加して出力する、または、前記第3の色の前記文字列を前記所定の出力先に出力する、
    請求項1または請求項2に記載の画像処理プログラム。
  4. 第4の色に前記文字列を用いて所定のAPIを呼び出す制御処理が対応付けられ、
    前記制御部は、前記第4の色の前記文字列を用いて前記所定のAPIを呼び出す、
    請求項1から請求項3のいずれか一項に記載の画像処理プログラム。
  5. 画像データを取得する取得部と、
    前記画像データに含まれる各色の文字列を検出し、前記色に対応付けられた制御処理を、当該色の前記文字列を用いて実行する制御部と、
    を有する画像処理装置。
JP2019056523A 2019-03-25 2019-03-25 画像処理プログラム、及び画像処理装置 Pending JP2020160553A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2019056523A JP2020160553A (ja) 2019-03-25 2019-03-25 画像処理プログラム、及び画像処理装置
US16/576,679 US11328448B2 (en) 2019-03-25 2019-09-19 Image processing method and image processing apparatus
EP19209980.2A EP3716147A1 (en) 2019-03-25 2019-11-19 Image processing method and image processing apparatus
CN201911136226.3A CN111738901A (zh) 2019-03-25 2019-11-19 存储介质以及图像处理装置
US17/474,308 US20210407137A1 (en) 2019-03-25 2021-09-14 Image processing method and image processing apparatus
US17/701,932 US20220215589A1 (en) 2019-03-25 2022-03-23 Image processing method and image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019056523A JP2020160553A (ja) 2019-03-25 2019-03-25 画像処理プログラム、及び画像処理装置

Publications (1)

Publication Number Publication Date
JP2020160553A true JP2020160553A (ja) 2020-10-01

Family

ID=68732658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019056523A Pending JP2020160553A (ja) 2019-03-25 2019-03-25 画像処理プログラム、及び画像処理装置

Country Status (4)

Country Link
US (3) US11328448B2 (ja)
EP (1) EP3716147A1 (ja)
JP (1) JP2020160553A (ja)
CN (1) CN111738901A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160553A (ja) * 2019-03-25 2020-10-01 東芝テック株式会社 画像処理プログラム、及び画像処理装置
JP2021189952A (ja) * 2020-06-03 2021-12-13 株式会社リコー 画像処理装置、方法およびプログラム
JP2022047839A (ja) * 2020-09-14 2022-03-25 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11191136A (ja) * 1997-12-25 1999-07-13 Canon Inc 画像処理装置及びその方法
JP2007233900A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2012080225A (ja) * 2010-09-30 2012-04-19 Kyocera Mita Corp 画像形成装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903269A (en) * 1995-10-10 1999-05-11 Anysoft Ltd. Apparatus for and method of acquiring processing and routing data contained in a GUI window
TWI228913B (en) * 2003-05-16 2005-03-01 Benq Corp Editing and display controller used in portable digital image capture device and method of the same
JP2005056315A (ja) * 2003-08-07 2005-03-03 Ricoh Co Ltd 情報処理装置、プログラム及び記憶媒体
JP2007088782A (ja) * 2005-09-21 2007-04-05 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP4914185B2 (ja) * 2006-11-20 2012-04-11 株式会社Pfu 画像読取処理装置および画像読取処理方法
US8285047B2 (en) * 2007-10-03 2012-10-09 Xerox Corporation Automated method and system for naming documents from a scanned source based on manually marked text
WO2009063329A1 (en) 2007-11-16 2009-05-22 Tamar Giloh A color-based computerized method for automatic document indexing
JP5262493B2 (ja) 2008-09-17 2013-08-14 株式会社リコー 画像処理装置、画像処理方法、プログラムおよびコンピュータ読み取り可能な記憶媒体
EP2337331B1 (en) * 2008-09-30 2015-06-24 Brother Kogyo Kabushiki Kaisha Printer having web server function
JP4772888B2 (ja) * 2009-03-27 2011-09-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5075997B2 (ja) * 2011-03-30 2012-11-21 株式会社東芝 電子機器、プログラムおよび文字列認識方法
US9570050B2 (en) * 2012-03-13 2017-02-14 Assima Switzerland Sa System and method for enhanced screen copy
JP5761237B2 (ja) * 2013-03-15 2015-08-12 コニカミノルタ株式会社 情報表示装置及び情報編集方法並びに情報編集プログラム
US9356977B2 (en) * 2013-08-30 2016-05-31 Citrix Systems, Inc. Acquiring online meeting data relating to an online meeting
JP6107756B2 (ja) * 2014-07-11 2017-04-05 コニカミノルタ株式会社 電子文書生成システム、電子文書生成装置およびプログラム
JP6477585B2 (ja) * 2016-04-28 2019-03-06 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像処理システム
JP6801544B2 (ja) * 2017-03-22 2020-12-16 株式会社リコー 情報処理装置、情報処理方法及びプログラム
CN108733640A (zh) * 2017-04-24 2018-11-02 珠海金山办公软件有限公司 一种文档配色方案生成方法及装置
JP6950320B2 (ja) * 2017-07-18 2021-10-13 京セラドキュメントソリューションズ株式会社 画像処理装置
JP6953230B2 (ja) * 2017-08-22 2021-10-27 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
US10198436B1 (en) * 2017-11-17 2019-02-05 Adobe Inc. Highlighting key portions of text within a document
US10602019B2 (en) * 2018-07-19 2020-03-24 Xerox Corporation Methods and systems for enhancing image quality for documents with highlighted content
US10606576B1 (en) * 2018-10-26 2020-03-31 Salesforce.Com, Inc. Developer experience for live applications in a cloud collaboration platform
JP2020160553A (ja) * 2019-03-25 2020-10-01 東芝テック株式会社 画像処理プログラム、及び画像処理装置
KR20210020611A (ko) * 2019-08-16 2021-02-24 삼성전자주식회사 전자 장치 및 전자 장치에서 서비스 제공 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11191136A (ja) * 1997-12-25 1999-07-13 Canon Inc 画像処理装置及びその方法
JP2007233900A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2012080225A (ja) * 2010-09-30 2012-04-19 Kyocera Mita Corp 画像形成装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RICARDO DA SILVA BARBOZA, ET AL.: "Using Readers' Highlighting on Monochromatic Documents for Automatic Text Transcription and Summariz", 2011 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION, JPN6022039382, 2011, ISSN: 0004876685 *

Also Published As

Publication number Publication date
US20210407137A1 (en) 2021-12-30
US11328448B2 (en) 2022-05-10
CN111738901A (zh) 2020-10-02
US20220215589A1 (en) 2022-07-07
US20200311980A1 (en) 2020-10-01
EP3716147A1 (en) 2020-09-30

Similar Documents

Publication Publication Date Title
US8610929B2 (en) Image processing apparatus, control method therefor, and program
US20210407137A1 (en) Image processing method and image processing apparatus
US7236653B2 (en) System and method for locating document areas using markup symbols
JP2017090974A (ja) 画像処理装置及びプログラム
JP2007004621A (ja) 文書管理支援装置、文書管理支援方法およびプログラム
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
US7920742B2 (en) Image processing apparatus, program and recording medium for document registration
JP5089524B2 (ja) 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
JP4347256B2 (ja) 画像処理装置,画像処理方法,画像処理プログラム及びそれが記録されたコンピュータ読み取り可能な記録媒体
JP7302175B2 (ja) 情報処理装置、及び情報処理プログラム
JP2010028738A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2020099031A (ja) 情報処理装置、及び情報処理方法
JP2020099030A (ja) 情報処理装置、及び情報処理方法
US11606469B2 (en) Image processing system that computerizes document, control method thereof, and storage medium
JP2012190357A (ja) 画像処理装置、画像処理方法、およびプログラム
JP5742612B2 (ja) 画像処理プログラム、画像処理装置および画像処理方法
US10171696B2 (en) Image processing apparatus and image processing method for recognizing characters in character string regions and table regions on a medium
US20210264099A1 (en) Information processing device and computer readable medium
US20240127615A1 (en) Image processing apparatus and non-transitory computer-readable storage medium storing image processing program
JP2011022896A (ja) 文書管理システム
JP6667112B2 (ja) 画像読取装置
JP2010219720A (ja) ファクシミリ制御装置およびファクシミリ制御プログラム
US20180278777A1 (en) Image processing apparatus and non-transitory computer readable medium
JP2021034813A (ja) 画像処理装置及び画像処理プログラム
JP2022140208A (ja) データ出力システム、情報処理システム、処理方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210901

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221121

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221220