JP5277750B2 - 画像処理プログラム、画像処理装置及び画像処理システム - Google Patents

画像処理プログラム、画像処理装置及び画像処理システム Download PDF

Info

Publication number
JP5277750B2
JP5277750B2 JP2008165892A JP2008165892A JP5277750B2 JP 5277750 B2 JP5277750 B2 JP 5277750B2 JP 2008165892 A JP2008165892 A JP 2008165892A JP 2008165892 A JP2008165892 A JP 2008165892A JP 5277750 B2 JP5277750 B2 JP 5277750B2
Authority
JP
Japan
Prior art keywords
unit
image
unit image
image data
image element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008165892A
Other languages
English (en)
Other versions
JP2010009199A (ja
Inventor
武 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008165892A priority Critical patent/JP5277750B2/ja
Priority to US12/419,858 priority patent/US8340434B2/en
Publication of JP2010009199A publication Critical patent/JP2010009199A/ja
Application granted granted Critical
Publication of JP5277750B2 publication Critical patent/JP5277750B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/001Industrial image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、画像処理プログラム、画像処理装置及び画像処理システムに関する。
従来、修正前後の画像データを比較して、正確に修正が行われたかの検版作業を補助するデジタル検版装置が知られている(例えば、特許文献1参照。)。
このデジタル検版装置は、修正前のビットマップ形式の画像データを保存する保存手段と、修正後のビットマップ形式の画像データと、保存手段により保存された修正前のビットマップ形式とをビット単位で比較することにより、その差異点を検出するデータ比較手段と、データ比較手段により検出された差異点を表示する表示手段とを備える。
特開平7−219202号公報
本発明の目的は、文字の挿入や削除等の編集により画像データにおける文字の位置がずれた場合でも、編集対象外の文字を差異として検出することがない画像処理プログラム、画像処理装置及び画像処理システムを提供することにある。
本発明の一態様は、上記目的を達成するため、以下の画像処理プログラム、画像処理装置及び画像処理システムを提供する。
[1]基準となる第1の画像データと、前記第1の画像データとの比較の対象となる第2の画像データとを入力する入力ステップと、前記第1の画像データの異なる位置から複数の第1の単位画像要素列を選択する選択ステップと、前記複数の第1の単位画像要素列との間で形状の並びに同一性を有する第2の単位画像要素列が前記第2の画像データに存在するか否かの判断を前記第1及び第2の単位画像要素列に含まれる単位画像要素について単位画像要素毎に特徴情報を抽出することにより行う判断ステップと、前記第2の単位画像要素列の中から前記第1の単位画像要素列に対して差異のある単位画像要素を前記判断の結果に基づいて検出する検出ステップとをコンピュータに実行させるための画像処理プログラム。
[2]前記判断ステップは、前記複数の第1の単位画像要素列と前記第2の単位画像要素列との間の複数の評価情報を前記特徴情報を用いてそれぞれ算出し、その算出した複数の評価情報を代表する代表評価情報と閾値情報とを比較することにより前記判断を行う前記[1]に記載の画像処理プログラム。
[3]前記判断ステップは、前記第1及び第2の単位画像要素列内で同じ位置同士の単位画像要素の前記特徴情報を比較することにより前記判断を行う前記[1]に記載の画像処理プログラム。
[4]前記判断ステップは、前記第1及び第2の単位画像要素列に含まれる単位画像要素間の関連性をそれぞれ示す第1及び第2の関連性情報を前記特徴情報を用いて算出し、その算出した前記第1及び第2の関連性情報を比較することにより前記判断を行う前記[1]に記載の画像処理プログラム
[5]基準となる第1の画像データと、前記第1の画像データとの比較の対象となる第2の画像データとを入力する入力手段と、前記第1の画像データの異なる位置から複数の第1の単位画像要素列を選択する選択手段と、前記複数の第1の単位画像要素列との間で形状の並びに同一性を有する第2の単位画像要素列が前記第2の画像データに存在するか否かの判断を前記第1及び第2の単位画像要素列に含まれる単位画像要素について単位画像要素毎に特徴情報を抽出することにより行う判断手段と、前記第2の単位画像要素列の中から前記第1の単位画像要素列に対して差異のある単位画像要素を前記判断の結果に基づいて検出する検出手段とを備えた画像処理装置。
[6]基準となる第1の画像データと、前記第1の画像データとの比較の対象となる第2の画像データとを入力する入力手段と、前記第1の画像データの異なる位置から複数の第1の単位画像要素列を選択する選択手段と、前記複数の第1の単位画像要素列との間で形状の並びに同一性を有する第2の単位画像要素列が前記第2の画像データに存在するか否かの判断を前記第1及び第2の単位画像要素列に含まれる単位画像要素について単位画像要素毎に特徴情報を抽出することにより行う判断手段と、前記第2の単位画像要素列の中から前記第1の単位画像要素列に対して差異のある単位画像要素を前記判断の結果に基づいて検出する検出手段と、前記検出手段により検出された前記単位画像要素を、前記第2の画像データに含まれる他の単位画像要素と比較が可能な状態で出力する出力手段とを備えた画像処理システム。
請求項1、5、6に係る発明によれば、文字の挿入や削除等の編集により画像データにおける文字の位置がずれた場合でも、編集対象外の文字を差異として検出することがない。
請求項2、3、4に係る発明によれば、特徴情報の比較によって差異があるか否か判断することができ、画像データに対してOCR(光学文字認識)処理を行う場合に比べて、より簡便に差異を検出することができる。
本発明の実施の形態に係る画像処理プログラムは、基準となる第1の画像データと、前記第1の画像データとの比較の対象となる第2の画像データとを入力する入力ステップと、前記第1の画像データの異なる位置から複数の第1の単位画像要素列を選択する選択ステップと、前記複数の第1の単位画像要素列との間で形状の並びに同一性を有する第2の単位画像要素列が前記第2の画像データに存在するか否かの判断を行う判断ステップと、前記判断ステップにおいて前記第2の画像データに存在しないと判断された前記第2の単位画像要素列を、前記第2の画像データのうち前記第1の画像データに対して前記形状の並びに同一性を有していない単位画像要素として検出する検出ステップとをコンピュータに実行させるためのプログラムである。
ここで、「単位画像要素」は、画像データにおいて所定の領域を占める画像であり、例えば、文字像を含むものである。単位画像要素が占める領域の形状は、矩形、円形、楕円及びその他多角形等でもよいし、これらに限られない。なお、第1及び第2の実施の形態は、単位画像要素の形状を外接矩形としてものである。また、単位画像要素は、同一のサイズを有する領域でもよいし、単位画像要素毎にサイズが異なる領域でもよい。また、単位画像要素は、文字像自体を示すものでもよい。
「画像データ」は、単位画像要素と、その単位画像要素の形状に関する情報が取得可能なデータであればよく、例えば、BMP、TIFF、PNG、JPEG、GIF等のラスタ形式のデータでもよいし、ページ記述言語(PDL)等で記述されたベクタ形式のデータでもよいし、独自の形式でもよい。なお、画像データは、文字の他に、例えば、図表、写真等を含んでいてもよい。また、画像データは、原稿を光学的に走査して生成された画像データでもよい。
「文字」は、画像データに文字像として含まれており、点や線等の組み合わせで構成されている。文字は、ある言語において所定の意味・内容を示す、例えば、数字、漢字等の表意文字でもよいし、仮名・アルファベット等の表音文字でもよい。文字には、絵文字、装飾記号、製図記号、電気回路記号、地図記号及び天気記号等も含まれる。また、文字は、活字でもよいし、手書きでもよい。
「形状の並びに同一性を有する」とは、比較される第1及び第2の単位画像要素列が、その形状、外観等の並びにおいて完全に同一の場合だけでなく、相似形や類似性の高い場合を含む。また、単位画像要素列に含まれるパターンが同一又は類似する場合も含む。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る画像処理装置の構成例を示す概略図である。この画像処理装置1は、オリジナル画像2及びターゲット画像3の2つの画像データを入力する画像入力部10と、それら2つの画像データからオリジナル文章及びターゲット文章をそれぞれ取得する文章取得部11と、オリジナル文章に対してターゲット文章を比較して差異のある文字を取得する差異取得部12と、差異取得部12により取得された差異のある文字を出力する出力手段としての差異出力部13と、文章取得部11によりオリジナル画像2及びターゲット画像3から取得される特徴量をそれぞれ記憶する第1及び第2の記憶部14A,14Bとから構成されている。
オリジナル画像2は、基準となるオリジナル文章を含む画像データである。ターゲット画像3は、そのオリジナル文章との比較の対象となるターゲット文章を含む画像データである。
オリジナル文章及びターゲット文章は、複数の文字列からなる。文字列は、複数の文字からなる。オリジナル文章及びターゲット文章は、その一方が活字による文章、他方が手書きによる文章でもよく、両方が活字又は手書きによる文章でもよい。また、文章は、活字と手書きからなる文章でもよい。
ここで、「差異のある文字」とは、オリジナル文章とターゲット文章との間で形状の並びに同一性を有していない文字であり、例えば、修正、挿入、削除等によって変更された文字である。
(画像入力部)
画像入力部10は、ユーザにより指定された画像データとして、オリジナル画像2及びターゲット画像3を入力する。なお、画像入力部10は、例えば、スキャナ、デジタルカメラ、複合機等の画像読取装置に接続し、画像データを入力してもよい。また、画像入力部10は、光ディスク、半導体メモリ等の外部記録メディアから画像データを取り込んでもよい。
(文章取得部)
文章取得部11は、画像入力部10を介して入力されたオリジナル画像2及びターゲット画像3の2つの画像データに対して一連の画像処理を行い、オリジナル文章及びターゲット文章を取得する。
すなわち、文章取得部11は、2つの画像データにおいて文字像が含まれる外接矩形を抽出する外接矩形抽出部110と、抽出された外接矩形に対して外接矩形特徴量を算出する外接矩形特徴量算出部111と、複数の外接矩形からなる文字列候補を抽出する文字列候補抽出部112と、抽出された文字列候補に対して画像認識処理により文字列特徴量を算出する文字列特徴量算出部113と、抽出された文字列特徴量から文字列候補が文字列であるか否かを判定する文字列判定部114と、文字列と判定された文字列候補を連結することによりオリジナル文章及びターゲット文章を算出する文章算出部115とを備える。
ここで、「画像認識処理」とは、OCR処理に比べて処理量が少ない処理であり、例えば、文字列候補を構成する外接矩形毎に、その外接矩形に含まれる文字像に関する特徴情報を取得する処理である。具体的には、画像認識処理は、ノイズ除去等の前処理を行ってから、外接矩形に含まれる画素の平均輝度、文字像の面積や幅、及びエッジ(文字像の輪郭)方向の分布や曲率等を特徴情報として取得する。
外接矩形特徴量は、例えば、画像認識処理により取得される特徴情報や、画像データにおける外接矩形の位置及びサイズ等の情報である。また、文字列特徴量は、文字列候補を構成する各外接矩形の特徴情報や、画像データにおける文字列候補が配置された領域の位置、サイズ、色及び向き(縦書き、横書き)等の情報である。
(差異取得部)
差異取得部12は、距離算出部120、距離判断部121及び差異検出部122を備える。
距離算出部120は、オリジナル文章の異なる位置から複数の第1の文字列を選択し、その選択した複数の第1の文字列との間で形状の並びに同一性を有する第2の文字列が、ターゲット文章に存在するか否かを判断するための判断基準値(代表評価情報)を算出する。
本実施の形態では、距離算出部120は、第1の文字列及び第2の文字列をそれぞれ構成する外接矩形の外接矩形特徴量を用いて、文字空間上の距離を算出することにより、判断基準値を算出する。ここで、文字空間上の距離(以下、「距離」という)とは、文字同士を比較したときに、それらの文字の形状の並びに同一性があるか否かを示す指標であり、同一の文字と判定される場合には相対的に小さな値となる。なお、距離算出部120は、ユークリッド距離、シティブロック距離等の各種の距離算出方法を用いることができる。
距離判断部121は、距離算出部120により算出された判断基準値に基づいて第2の文字列がターゲット文章に存在するか否かを判断し、その判断結果を差異検出部122に送る。
差異検出部122は、距離判断部121の判断結果に基づいて、ターゲット文章のうちオリジナル文章に対して形状の並びに同一性を有していない文字を差異のある文字として検出する。
(差異出力部)
差異出力部13は、例えば、液晶ディスプレイ等により構成され、差異取得部12により取得された差異のある文字を、ターゲット文章と比較が可能な状態で画面上に表示出力する。なお、差異出力部13は、表示出力する他に、例えば、プリンタによる印刷出力、記憶装置への書き込み等により出力するようにしてもよい。
(第1及び第2の記憶部)
第1及び第2の記憶部14A,14Bは、例えば、ROM,RAM,ハードディスク等により構成されている。
第1の記憶部14Aは、オリジナル画像2から外接矩形特徴量算出部111により算出された外接矩形特徴量140Aと、文字列特徴量算出部113により算出された文字列特徴量141Aとを記憶する。また、第2の記憶部14Bは、ターゲット画像3から同様にして算出された外接矩形特徴量140Bと、文字列特徴量141Bとを記憶する。なお、第1及び第2の記憶部14A,14Bは、1つの記憶部であってもよい。
このような画像処理装置1は、例えば、パーソナルコンピュータ(PC)、携帯情報端末(PDA)、携帯電話機等により構成することができる。
なお、差異取得部12の各部は、画像処理装置1に設けられたCPU等を備えた制御部(図示せず)が、例えば、記憶部に記憶された画像処理プログラムに従って動作することにより機能する。また、文章取得部11の各部は、同様に、制御部が文章取得プログラムに従って動作することにより機能する。なお、画像処理プログラムと文章取得プログラムは、1つのプログラムであってもよい。
(第1の実施の形態の動作)
次に、本実施の形態に係る画像処理装置1の動作の一例を図2〜図7を用いて説明する。
(1)画像データの入力
まず、ユーザは、オリジナル画像2及びターゲット画像3を指定して、それら2つの画像データを画像入力部10に入力すると、画像入力部10は、指定されたオリジナル画像2及びターゲット画像3を外接矩形抽出部110に送る。
図2(a)は、オリジナル画像の一例を示す図である。オリジナル画像2は、例えば、任意の文字列であるタイトル部100、図表や写真等の図形部101、オリジナル文章が含まれるオリジナル文章部102等から構成されている。オリジナル文章部102は、複数の行に配置された複数の文字からなる。なお、オリジナル画像2は、図形部101及びオリジナル文章部102を複数含んでいてもよい。
図2(b)は、ターゲット画像の一例を示す図である。ターゲット画像3は、図2(a)に例示するオリジナル画像2のオリジナル文章部102が部分的に変更された画像データである。すなわち、ターゲット画像3は、オリジナル画像2と同様のタイトル部100及び図形部101の他に、オリジナル文章に対してユーザにより部分的に変更されたターゲット文章が含まれるターゲット文章部103等から構成されている。
(2)文章の取得
文章取得部11の外接矩形抽出部110は、入力された2つの画像データに対して画像処理をそれぞれ行って、オリジナル文章部102及びターゲット文章部103において文字と認識される領域を含む複数の外接矩形を抽出する。
図3(a)は、外接矩形抽出部110により抽出された外接矩形の一例を示す図である。外接矩形抽出部110は、オリジナル文章部102内のオリジナル文章を構成する各文字に対して外接矩形104を抽出する。なお、外接矩形抽出部110は、ターゲット文章部103においても同様に外接矩形104を抽出する。
次に、外接矩形特徴量算出部111は、2つの画像データから抽出された外接矩形104の各々に対して外接矩形特徴量140A,140Bを算出する。外接矩形特徴量算出部111は、その算出した外接矩形特徴量140A,140Bを算出元の外接矩形104と関連付けて、2つの画像データにそれぞれ対応する第1及び第2の記憶部14A,14Bに記憶する。なお、この段階では外接矩形特徴量の特徴情報は算出されていない。
次に、文字列候補抽出部112は、外接矩形抽出部110により抽出された複数の外接矩形104を連結することにより、複数の外接矩形104からなる文字列候補を抽出する。例えば、文字列候補抽出部112は、2つの外接矩形104を取り出して、それら外接矩形104の間隔を外接矩形特徴量から算出し、その間隔が所定値以下の場合には、それら2つの外接矩形104を連結して1つの文字列候補を抽出する。そして、文字列候補抽出部112は、その文字列候補との間隔が所定値以下の他の外接矩形104がある場合には、その外接矩形104をさらにその文字列候補に連結する。
図3(b)は、文字列候補抽出部112により抽出された文字列候補の一例を示す図である。文字列候補抽出部112は、オリジナル文章部102を構成する各行毎に複数の外接矩形104を連結し、複数の文字列候補105を抽出する。なお、文字列候補抽出部112は、ターゲット画像3においても同様に文字列候補105を抽出する。
次に、文字列特徴量算出部113は、文字列候補抽出部112により抽出された文字列候補105の各々に対して、画像認識処理を行って文字列特徴量141A,141Bを算出する。そして、文字列特徴量算出部113は、その算出した文字列特徴量を算出元の文字列候補105と関連付けて、2つの画像データにそれぞれ対応する第1及び第2の記憶部14A,14Bに記憶する。
次に、文字列特徴量算出部113は、その算出した文字列特徴量141A,141Bを外接矩形104毎に分解し、その分解して得られた各特徴情報を、各外接矩形104と関連付けて、外接矩形特徴量140A,140Bの特徴情報として第1及び第2の記憶部14A,14Bに記憶する。
そして、文字列判定部114は、文字列特徴量算出部113により抽出された文字列特徴量から、文字列候補105に文字列が含まれているか否かを判定する。
次に、文章算出部115は、文字列が含まれていると判定された文字列候補105同士を連結して、オリジナル文章及びターゲット文章を算出する。文章算出部115は、例えば、文字列特徴量における文字列候補が配置された領域の位置、サイズ、色及び向き等を用いて文字列候補を連結するか否かを判断し、オリジナル文章及びターゲット文章を算出する。そして、文章算出部115は、算出したオリジナル文章及びターゲット文章を差異取得部12に送る。
図3(c)は、文章算出部115により算出されたオリジナル文章の一例を示す図である。文章算出部115は、各行毎の文字列候補105を連結することにより、オリジナル文章106を算出する。なお、文章算出部115は、ターゲット画像3においても同様にターゲット文章を算出する。
(3)差異のある文字の取得
差異取得部12の距離算出部120は、文章算出部115により算出されたオリジナル文章及びターゲット文章を受け取ると、それらを構成する各外接矩形104の外接矩形特徴量140A,140Bを第1及び第2の記憶部14A,14Bから読み出す。
そして、距離算出部120は、外接矩形単位で順次処理を行うべく、その外接矩形特徴量140A,140Bを、オリジナル線形リストRo(i)(ただし、i=1,2,…,M、Mはオリジナル文章の文字数)、及びターゲット線形リストRt(j)(ただし、j=1,2,…,N、Nはターゲット文章の文字数)の各要素にそれぞれ格納する。
次に、距離算出部120は、ターゲット文章を構成する各外接矩形の判断基準値S(j=1,2,…,N)を、図6のフローチャートに従って算出する。
まず、距離算出部120は、ターゲット線形リストRt(j)において注目する1つの要素を示す第1の注目外接矩形を順次選択するためのターゲットカウンタjを「1」に初期化する(S1)。
次に、距離算出部120は、同様に、オリジナル線形リストRo(i)において注目する1つの要素を示す第2の注目外接矩形を順次選択するためのオリジナルカウンタiを「1」に初期化する(S10)。
次に、距離算出部120は、オリジナルカウンタiにより選択した第1の注目外接矩形及びその前後k個の外接矩形と、ターゲットカウンタjにより選択した第2の注目外接矩形及びその前後k個の外接矩形との外接矩形間距離Dijを外接矩形特徴量140A,140Bを用いて算出する(S11)。この算出方法は、以下の計算式により表すことができる。
Figure 0005277750
図4は、外接矩形間距離の算出方法の一例を説明する図である。図4では、第1及び第2の注目外接矩形107A,107Bは、文字「こ」の外接矩形であり、距離算出文字数kは「2」であるものとする。また、第1の注目外接矩形107Aとその前後2個の外接矩形104とを第1の外接矩形列(第1の単位画像要素列)108Aとし、第2の注目外接矩形107Bとその前後2個の外接矩形104を第2の外接矩形列(第2の単位画像要素列)108Bとする。
このとき、距離算出部120は、第1の外接矩形列108Aと、第2の外接矩形列108Bとの距離を、外接矩形の外接矩形特徴量140A,140Bを用いて算出する。すなわち、距離算出部120は、Ro(i−2)とRt(j−2)、Ro(i−1)とRt(j−1)、Ro(i)とRt(j)、Ro(i+1)とRt(j+1)、Ro(i+2)とRt(j+2)の計5組の外接矩形特徴量から距離をそれぞれ算出し、それら5つの距離の総和として、外接矩形間距離200を算出する。
次に、距離算出部120は、第1及び第2の外接矩形列108A,108Bに含まれる外接矩形間の関連性をそれぞれ示す第1及び第2の関連性情報を算出する。そして、距離算出部120は、それら第1及び第2の関連性情報を比較することにより、外接矩形関連性間距離Eijを算出する(S12)。この算出方法は、以下の計算式により表すことができる。
Figure 0005277750
図5は、外接矩形関連性間距離の算出方法の一例を説明する図である。図5における注目外接矩形、及び距離算出文字数kは、図4と同様である。
このとき、距離算出部120は、第1の外接矩形列108Aにおいて、第1の注目外接矩形107Aと、その前後2個の外接矩形との間の各距離を外接矩形特徴量を用いて算出する。すなわち、距離算出部120は、Ro(i−2)とRo(i)、Ro(i−1)とRo(i)、Ro(i+1)とRo(i)、Ro(i+2)とRo(i)の計4組の外接矩形の特徴量から距離をそれぞれ算出し、それら4つの距離の総和として、第1の関連性情報を算出する。なお、その他の外接矩形の組み合わせ、例えば、Ro(i−2)とRo(i+2)による距離を第1の関連性情報に加算してもよい。
次に、距離算出部120は、第2の外接矩形列108Bにおいても同様に、第2の注目外接矩形107Bと、その前後2個の外接矩形との間の各距離を外接矩形特徴量を用いて算出し、それら4つの距離の総和として、第2の関連性情報を算出する。そして、距離算出部120は、それら第1及び第2の関連性情報の差を演算し、外接矩形関連性間距離201を算出する。
そして、距離算出部120は、オリジナルカウンタiをインクリメントし(S22)、オリジナル線形リストRo(i)における第1の注目外接矩形107Aを1つ分シフトする。その結果、オリジナルカウンタiがオリジナル文章の文字数Mを超えていない場合には(S23:No)、上記ステップS20に戻る。
一方、オリジナルカウンタiがオリジナル文章の文字数Mを超えている場合には(S23:Yes)、距離算出部120は、上記で算出した外接矩形間距離Dijと、外接矩形関連性間距離Eijとを加算した評価値(評価情報)が最小となるターゲットカウントjを検索する。そして、距離算出部120は、その検索した最小値としての判断基準値Sを算出する(S30)。この算出方法は、以下の計算式により表すことができる。
Figure 0005277750
そして、距離算出部120は、ターゲットカウンタjをインクリメントし(S31)、ターゲット線形リストRt(j)における第2の注目外接矩形107Bを1つ分シフトする。その結果、ターゲットカウンタjがターゲット文章の文字数Nを超えていない場合には(S32:No)、上記ステップS10に戻り、超えている場合には(S32:Yes)、処理を終了する。
上記のようにして、距離算出部120は、ターゲット文章を構成する外接矩形毎に、判断基準値Sを算出する。そして、距離判断部121は、その外接矩形毎に算出された判断基準値Sと、所定の閾値(閾値情報)とをそれぞれ比較し、各判断基準値が所定の閾値を越えているか否かを判断し、その判断結果を差異検出部122に送る。
次に、差異検出部122は、距離判断部121から判断結果を受け取り、判断基準値が所定の閾値を越えていると判断されたときは、その判断基準値に対応する外接矩形に含まれる文字を差異のある文字として検出する。
(4)差異出力画面の表示
差異出力部13は、差異検出部122により検出された差異のある文字を差異出力画面に表示する。
図7は、差異出力画面の一例を示す図である。この差異出力画面15には、ターゲット画像3を表示するターゲット画像表示領域150が設けられている。ターゲット画像表示領域150には、差異のある文字として検出された外接矩形が、例えば、枠線151A,151Bで囲まれた状態で表示される。
第1の枠線151Aは、オリジナル文章に対して文字「さ」が挿入されたことを表示する。また、第2の枠線151Bは、オリジナル文章において文字「ちて」の間に存在した文字「つ」が削除されたことを表示する。なお、枠線151A,151Bの枠外の部分を、例えば、ぼかし処理を施した状態で表示するようにしてもよい。また、差異出力画面15には、拡大、縮小、移動等のターゲット画像表示領域150を操作する機能が付加されていてもよいし、ターゲット画像表示領域150を印刷する機能が設けられていてもよい。
そして、ユーザは、この差異出力画面15を目視確認して、オリジナル画像2に対する変更箇所、すなわち、第1及び第2の枠線151A,151B内の文字を確認し、意図した通りに変更が行われているか、意図しない変更が含まれていないか等を検査する。
以上のようにして、文字列同士を比較することで文字の並びが加味された状態で差異のある文字だけが検出され、差異出力画面15に表示される。
[第2の実施の形態]
図8は、本発明の第2の実施の形態に係る画像処理システムの概略構成の一例を示す全体図である。第1の実施の形態では、画像処理装置1が、オリジナル画像2及びターゲット画像3の入力機能、入力された2つの画像データに対する差異検出機能、及び検出された差異のある文字を表示する表示出力機能の3つの機能を備えていた。これに対し、本実施の形態に係る画像処理システム300は、差異検出機能を備えた画像処理装置1と、入力機能及び表示出力機能を備えた端末装置4と、画像処理装置1及び端末装置4を相互に接続するネットワーク5とから構成されている。なお、ネットワーク5は、LAN(ローカルエリアネットワーク)、インターネット等の通信網である。
端末装置4は、入力されたオリジナル画像2及びターゲット画像3を、ネットワーク5を介して画像処理装置1に送信し、その返信として画像処理装置1から画面情報を受信する。そして、端末装置4は、その画面情報に基づいて、図7に例示する差異出力画面を表示する。このような端末装置4は、例えば、コンピュータ、携帯情報端末(PDA)、携帯電話機等により構成することができる。
画像処理装置1は、端末装置4からネットワーク5を介してオリジナル画像2及びターゲット画像3を受信する画像入力部と、差異取得部により取得された差異のある文字を表示するための画面情報を作成し、その画面情報を端末装置4に送信する差異出力部とを備える。なお、文章取得部、差異取得部及び第1及び第2の記憶部は、第1の実施の形態と同様に構成されている。
以上のようにして、画像処理装置1は、異なる場所に設置された端末装置4にネットワーク5を介して差異検出機能を提供する。
[第3の実施の形態]
第1の実施の形態では、オリジナル画像2及びターゲット画像3の2つの画像データを画像処理装置1に入力したが、本実施の形態では、2つのテキストデータを画像処理装置1に入力するものである。
ここで、「テキストデータ」は、文字列と、各文字の位置、フォント、フォントサイズ等が指定されたデータであり、例えば、ワープロソフト、プレゼンテーションソフト等のアプリケーションにより作成されるデータである。従って、テキストデータには、文章がデータとして記録されており、画像データのように画像認識処理を行って文章データを取得する必要がないデータである。
本実施の形態に係る画像処理装置1について、図1を参照して第1の実施の形態と異なる構成を以下に説明する。
画像処理装置1の画像入力部10は、2つのテキストデータとして、オリジナルテキスト及びターゲットテキストを入力する。それらオリジナルテキスト及びターゲットテキストは、オリジナル文章及びターゲット文章が取得可能なデータであるため、文章取得部11を介することなく、差異取得部12に送られる。
差異取得部12は、オリジナルテキスト及びターゲットテキストからオリジナル文章及びターゲット文章を取得し、第1の実施の形態と同様の処理を行って差異のある文字を取得する。
なお、画像入力部10は、1つの画像データと1つのテキストデータを入力してもよい。その場合には、画像データは、文章取得部11に送られ、テキストデータは、差異取得部12に送られる。差異取得部12は、文章取得部11により画像データから取得された文章データと、テキストデータに含まれる文章データとを比較して、差異のある文字を取得する。
[他の実施の形態]
なお、本発明は、上記各実施の形態に限定されず、本発明の趣旨を逸脱しない範囲内で種々に変形してもよい。例えば、上記各実施の形態では、画像処理装置が有する各部を、制御部と画像処理プログラムとによって実現したが、それらの一部または全部をハードウェアによって実現してもよい。
また、上記各実施の形態で使用されるプログラムは、CD−ROM等の記録媒体から装置内の記憶部に読み込んでもよく、インターネット等のネットワークに接続されているサーバ等から装置内の記憶部にダウンロードしてもよい。
また、上記各実施の形態では、オリジナル文章及びターゲット文章は、日本語で作成されたものを対象としたが、同一の言語であれば、他の言語で作成されていてもよい。
また、上記各実施の形態では、文字の形状の同一性を判断する際に画像認識処理により取得された特徴情報を用いたが、比較対象の文字を含む切り出し画像の差画像を取って、その差画像において差異があるとされる画素の総和と閾値との比較に基づいて、形状の同一性を判断してもよい。
図1は、本発明の第1の実施の形態に係る画像処理装置の概略構成の一例を示す全体図である。 図2(a)は、オリジナル画像の一例を示し、図2(b)は、ターゲット画像の一例を示す図である。 図3(a)は、外接矩形抽出部により抽出された外接矩形の一例を示し、図3(b)は、文字列候補抽出部により抽出された文字列候補の一例を示し、図3(c)は、文章算出部により算出されたオリジナル文章の一例を示す図である。 図4は、外接矩形間距離の算出方法の一例を説明する図である。 図5は、外接矩形関連性間距離の算出方法の一例を説明する図である。 図6は、判断基準値を算出する動作の一例を示すフローチャートである。 図7は、差異出力画面の一例を示す図である。 図8は、本発明の第2の実施の形態に係る画像処理システムの概略構成の一例を示す全体図である。
符号の説明
1…画像処理装置、2…オリジナル画像、3…ターゲット画像、4…端末装置、5…ネットワーク、10…画像入力部10…文章取得部、12…差異取得部、13…差異出力部、14A,14B…記憶部、15…差異出力画面、100…タイトル部、101…図形部、102…オリジナル文章部、103…ターゲット文章部、104…外接矩形、105…文字列候補、106…オリジナル文章、107A,107B…注目外接矩形、108A…外接矩形列、108B…外接矩形列、110…外接矩形抽出部、111…外接矩形特徴量算出部、112…文字列候補抽出部、113…文字列特徴量算出部、114…文字列判定部、115…文章算出部、120…距離算出部、121…距離判断部、122…差異検出部、140A,140B…外接矩形特徴量、141A,141B…文字列特徴量、150…ターゲット画像表示領域、151A,151B…枠線、200…接矩形間距離、201…外接矩形関連性間距離、300…画像処理システム

Claims (6)

  1. 基準となる第1の画像データと、前記第1の画像データとの比較の対象となる第2の画像データとを入力する入力ステップと、
    前記第1の画像データの異なる位置から複数の第1の単位画像要素列を選択する選択ステップと、
    前記複数の第1の単位画像要素列との間で形状の並びに同一性を有する第2の単位画像要素列が前記第2の画像データに存在するか否かの判断を前記第1及び第2の単位画像要素列に含まれる単位画像要素について単位画像要素毎に特徴情報を抽出することにより行う判断ステップと、
    記第2の単位画像要素列の中から前記第1の単位画像要素列に対して差異のある単位画像要素を前記判断の結果に基づいて検出する検出ステップとをコンピュータに実行させるための画像処理プログラム。
  2. 前記判断ステップは、前記複数の第1の単位画像要素列と前記第2の単位画像要素列との間の複数の評価情報を前記特徴情報を用いてそれぞれ算出し、その算出した複数の評価情報を代表する代表評価情報と閾値情報とを比較することにより前記判断を行う請求項1に記載の画像処理プログラム。
  3. 前記判断ステップは、前記第1及び第2の単位画像要素列内で同じ位置同士の単位画像要素の前記特徴情報を比較することにより前記判断を行う請求項1に記載の画像処理プログラム。
  4. 前記判断ステップは、前記第1及び第2の単位画像要素列に含まれる単位画像要素間の関連性をそれぞれ示す第1及び第2の関連性情報を前記特徴情報を用いて算出し、その算出した前記第1及び第2の関連性情報を比較することにより前記判断を行う請求項1に記載の画像処理プログラム
  5. 基準となる第1の画像データと、前記第1の画像データとの比較の対象となる第2の画像データとを入力する入力手段と、
    前記第1の画像データの異なる位置から複数の第1の単位画像要素列を選択する選択手段と、
    前記複数の第1の単位画像要素列との間で形状の並びに同一性を有する第2の単位画像要素列が前記第2の画像データに存在するか否かの判断を前記第1及び第2の単位画像要素列に含まれる単位画像要素について単位画像要素毎に特徴情報を抽出することにより行う判断手段と、
    記第2の単位画像要素列の中から前記第1の単位画像要素列に対して差異のある単位画像要素を前記判断の結果に基づいて検出する検出手段とを備えた画像処理装置。
  6. 基準となる第1の画像データと、前記第1の画像データとの比較の対象となる第2の画像データとを入力する入力手段と、
    前記第1の画像データの異なる位置から複数の第1の単位画像要素列を選択する選択手段と、
    前記複数の第1の単位画像要素列との間で形状の並びに同一性を有する第2の単位画像要素列が前記第2の画像データに存在するか否かの判断を前記第1及び第2の単位画像要素列に含まれる単位画像要素について単位画像要素毎に特徴情報を抽出することにより行う判断手段と、
    記第2の単位画像要素列の中から前記第1の単位画像要素列に対して差異のある単位画像要素を前記判断の結果に基づいて検出する検出手段と、
    前記検出手段により検出された前記単位画像要素を、前記第2の画像データに含まれる他の単位画像要素と比較が可能な状態で出力する出力手段とを備えた画像処理システム。
JP2008165892A 2008-06-25 2008-06-25 画像処理プログラム、画像処理装置及び画像処理システム Expired - Fee Related JP5277750B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008165892A JP5277750B2 (ja) 2008-06-25 2008-06-25 画像処理プログラム、画像処理装置及び画像処理システム
US12/419,858 US8340434B2 (en) 2008-06-25 2009-04-07 Image processing apparatus, image processing system and computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008165892A JP5277750B2 (ja) 2008-06-25 2008-06-25 画像処理プログラム、画像処理装置及び画像処理システム

Publications (2)

Publication Number Publication Date
JP2010009199A JP2010009199A (ja) 2010-01-14
JP5277750B2 true JP5277750B2 (ja) 2013-08-28

Family

ID=41447531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008165892A Expired - Fee Related JP5277750B2 (ja) 2008-06-25 2008-06-25 画像処理プログラム、画像処理装置及び画像処理システム

Country Status (2)

Country Link
US (1) US8340434B2 (ja)
JP (1) JP5277750B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688889B (zh) * 2019-08-06 2023-04-18 珠海格力电器股份有限公司 一种图文内容比对方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0561856A (ja) * 1991-09-05 1993-03-12 Hitachi Ltd 文書作成装置
JP2531882B2 (ja) * 1991-12-11 1996-09-04 インターナショナル・ビジネス・マシーンズ・コーポレイション オンライン手書き文字認識
JP2816091B2 (ja) 1994-01-31 1998-10-27 大日本スクリーン製造株式会社 デジタル検版装置
US5659765A (en) * 1994-03-15 1997-08-19 Toppan Printing Co., Ltd. Machine translation system
JP4631133B2 (ja) * 2000-06-09 2011-02-16 コニカミノルタビジネステクノロジーズ株式会社 文字認識処理のための装置、方法及び記録媒体
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
US7295965B2 (en) * 2001-06-29 2007-11-13 Honeywell International Inc. Method and apparatus for determining a measure of similarity between natural language sentences
JP2003179738A (ja) * 2001-12-11 2003-06-27 Minolta Co Ltd 画像処理装置
JP2003208568A (ja) 2002-01-10 2003-07-25 Ricoh Co Ltd 画像処理装置、画像処理方法、及び同方法に用いるプログラム
US7177452B2 (en) * 2002-04-10 2007-02-13 Battelle Memorial Institute Visualization of information with an established order
JP2004246110A (ja) 2003-02-14 2004-09-02 Dainippon Screen Mfg Co Ltd 検版装置、印刷システム、印刷データの検版方法、およびプログラム
JP4420459B2 (ja) * 2005-06-14 2010-02-24 キヤノン株式会社 画像処理装置およびその方法
JP2007317033A (ja) 2006-05-26 2007-12-06 Sharp Manufacturing System Corp 文字画像の照合方法および照合装置ならびにプログラム
US8139897B2 (en) * 2007-03-15 2012-03-20 Ricoh Company, Limited Detecting tilt in an image having different resolutions in different directions

Also Published As

Publication number Publication date
JP2010009199A (ja) 2010-01-14
US8340434B2 (en) 2012-12-25
US20090324094A1 (en) 2009-12-31

Similar Documents

Publication Publication Date Title
US20200065601A1 (en) Method and system for transforming handwritten text to digital ink
JP4271878B2 (ja) 映像中の文字検索方法及び装置並びに文字検索処理プログラム
US6351559B1 (en) User-enclosed region extraction from scanned document images
JP2019505872A (ja) 動的な効果を有する2次元コード画像を生成するための方法および装置
EP2608104A1 (en) Image processing device, image processing method, and image processing program
US9396389B2 (en) Techniques for detecting user-entered check marks
JP2019016350A (ja) 電子文書における強調テキストの識別
JP2008234291A (ja) 文字認識装置及び文字認識方法
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP2008028716A (ja) 画像処理方法及び装置
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP4474231B2 (ja) 文書リンク情報取得システム
JP2014078168A (ja) 文字認識装置及びプログラム
JP2018067096A (ja) 文字認識装置及び文字認識方法
JP2008004116A (ja) 映像中の文字検索方法及び装置
JP6575116B2 (ja) 文字認識装置、文字認識処理システム、およびプログラム
JP2011170450A (ja) 画像処理プログラム及び画像処理装置
JP2020030722A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP5105440B2 (ja) 情報処理装置、文字認識方法、文字認識プログラム、および、文字認識プログラムを記録した、コンピュータ読取り可能な記録媒体
JP6127685B2 (ja) 情報処理装置、プログラム、及び形状認識方法
JP2020194491A (ja) 情報処理装置、制御方法、及びプログラム
JP2022051198A (ja) Ocr処理装置、ocr処理方法、及びプログラム
CN116959004A (zh) 手写签名识别方法、装置、电子设备及计算机程序产品
Ahmed Comprehensive collection for Arabic characters and numbers written by hand

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110520

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130506

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5277750

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees