JP6210013B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP6210013B2 JP6210013B2 JP2014071041A JP2014071041A JP6210013B2 JP 6210013 B2 JP6210013 B2 JP 6210013B2 JP 2014071041 A JP2014071041 A JP 2014071041A JP 2014071041 A JP2014071041 A JP 2014071041A JP 6210013 B2 JP6210013 B2 JP 6210013B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- straight line
- image data
- data
- original image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 118
- 238000000034 method Methods 0.000 claims description 91
- 230000008569 process Effects 0.000 claims description 77
- 238000001514 detection method Methods 0.000 claims description 62
- 238000009826 distribution Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 description 61
- 238000006243 chemical reaction Methods 0.000 description 29
- 230000004048 modification Effects 0.000 description 28
- 238000012986 modification Methods 0.000 description 28
- 230000003287 optical effect Effects 0.000 description 12
- 230000000052 comparative effect Effects 0.000 description 11
- 101100420171 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rti1 gene Proteins 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 101150042828 csa1 gene Proteins 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 101100476722 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SBA1 gene Proteins 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 101100222017 Candida albicans (strain SC5314 / ATCC MYA-2876) CSA2 gene Proteins 0.000 description 1
- 101000804821 Homo sapiens WD repeat and SOCS box-containing protein 2 Proteins 0.000 description 1
- 102100035329 WD repeat and SOCS box-containing protein 2 Human genes 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3877—Image rotation
- H04N1/3878—Skew detection or correction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3876—Recombination of partial images to recreate the original image
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
Description
(通信システム2の構成)
図1に示されるように、通信システム2は、スキャナSCと端末装置TEとを備える。スキャナSCと端末装置TEとは、LAN(Local Area Networkの略)4を介して、相互に通信可能である。
端末装置TEは、例えば、公知のPC(Personal Computerの略)であり、ネットワークインターフェース10と、操作部12と、表示部14と、制御部20と、を備える。ネットワークインターフェース10は、LAN4に接続される。操作部12は、マウス、キーボード等である。ユーザは、操作部12を操作することによって、様々な指示を端末装置TEに入力することができる。表示部14は、様々な情報を表示するためのディスプレイである。
スキャナSCは、スキャン対象物をスキャンしてスキャン画像データを生成するスキャン機能を実行可能な周辺機器(即ち、端末装置TEの周辺機器)である。例えば、スキャナSCは、スキャン画像データをスキャナSC自身のメモリに記憶させることができる。また、スキャナSCは、スキャン画像データを端末装置TEに送信して、当該スキャン画像データを端末装置TEに格納させたり、当該スキャン画像データに対する画像処理を端末装置TEに実行させたりすることができる。
続いて、図2を参照して、各スキャン画像の内容を説明する。例えば、レシート原稿RDの縦方向の長さが大きいと、レシート原稿RDをうまく折り返せないことがある。即ち、図2に示されるように、レシート原稿RDの左上の頂点と左下の頂点とが一致しないように(換言すると、レシート原稿RDの右上の頂点と右下の頂点とが一致しないように)、レシート原稿RDが折り返されることがある。本実施例では、このような状態のレシート原稿RDを収容しているキャリアシートCSがスキャンされる状況を想定している。キャリアシートCSの表面には、レシート原稿RDの表面の前半部分(即ち、「FFF Shop」〜「HHH $80」)が透けており、キャリアシートCSの裏面には、レシート原稿RDの表面の後半部分(即ち、「III $500」〜「KKK $10」)が透けている。
続いて、図3を参照して、端末装置TEのドライバプログラム26によって実行される処理の内容を説明する。上述したように、端末装置TEのCPU22は、レシート原稿RDのスキャンのための指示がユーザによって入力される場合に、スキャン指示をスキャナSCに供給する。これにより、S10において、CPU22は、スキャナSCから表面スキャン画像データと裏面スキャン画像データとを取得する。
続いて、図4を参照して、図3のS40の直線検出処理の内容を説明する。S42では、CPU22は、図3のS34で生成された二値画像データに対するOFF変換処理を実行する。具体的には、CPU22は、二値画像データを構成する複数個のOFF画素データのそれぞれについて、当該OFF画素データを中心とする9個の画素データ(即ち、横方向3個×縦方向3個の画素データ)に含まれる全てのON画素データをOFF画素データに変更する。これにより、「1」又は「0」を示す複数個の画素データによって構成されるOFF変換画像データが生成される。
続いて、図5を参照して、図4の直線検出処理の具体的な内容を説明する。図5は、図3のS34で生成される二値画像データBIDと、図4のS42で生成されるOFF変換画像データOFIDと、S44で生成されるON変換画像データONIDと、S46で生成される検出用画像データFDIDと、を示す。これらの各画像データでは、全ての画素データが示されているのではなく、一部の画素データ(即ち、横方向7個×縦方向7個=49個の画素データ)のみが示されている。
続いて、図6を参照して、図5の続きを説明する。図4のS48では、CPU22は、S46で生成される検出用画像データFDIDを利用して、射影ヒストグラムH48を生成する。射影ヒストグラムH48は、検出用画像データを構成する複数個の画素データを縦方向に沿って射影する場合におけるON画素データの出現頻度の分布を表わす。
続いて、図7を参照して、図3のS60の評価値算出処理の内容を説明する。S62では、CPU22は、図3のS34で生成された二値画像データに対する行間除去処理を実行する。具体的には、CPU22は、二値画像データを構成する複数個の画素データのうち、各文字列の行間を表わす画素データを除去する。これにより、「1」又は「0」を示す複数個の画素データによって構成される除去画像データが生成される。
続いて、図8を参照して、図7の評価値算出処理の具体的な内容を説明する。図7のS62では、CPU22は、まず、二値画像BIを表わす二値画像データを利用して、射影ヒストグラムH62を生成する。射影ヒストグラムH62は、二値画像データを構成する複数個の画素データを横方向に沿って射影する場合におけるON画素データの出現頻度の分布を表わす。次いで、CPU22は、射影ヒストグラムH62において、ON画素データの出現頻度が予め決められている閾値Th2(Th2はゼロより大きい値)以下である各射影ライン(即ち、縦方向の各領域)を除去対象として決定する。当該各領域は、各文字列の行間に対応する領域である。そして、CPU22は、二値画像データを構成する複数個の画素データのうち、除去対象の各領域を表わす各画素データを除去する。これにより、除去画像DIを表わす除去画像データが生成される。なお、図8では、除去画像DIにおいて、レシート原稿RDを示すレシート原稿領域の端に対応する直線が図示省略されている。
続いて、図9を参照して、図3のS100の出力処理の内容を説明する。S102では、CPU22は、図3のS20で生成された表面対象画像データと、図7のS80又はS82で選択された表面の直線が伸びる方向と、を利用して、第1の回転対象画像データを生成する。具体的には、CPU22は、上記の表面の直線が伸びる方向と縦方向とが一致するように、表面対象画像データによって表わされる表面対象画像FTIを回転させて得られる第1の回転対象画像を表わす第1の回転対象画像データを生成する。これにより、RGB値を示す複数個の画素データによって構成される第1の回転対象画像データが生成される。
続いて、図10を参照して、図9の出力処理の具体例を説明する。図9のS102では、CPU22は、表面の直線LL1が伸びる方向と縦方向とが一致するように、表面対象画像FTIを回転させて得られる第1の回転対象画像RTI1を表わす第1の回転対象画像データを生成する。即ち、図6の角度αを回転角度として表面対象画像FTIを時計回り方向に回転させて得られる第1の回転対象画像RTI1を表わす第1の回転対象画像データが生成される。
続いて、図11を参照して、図10の続きを説明する。図9のS110では、CPU22は、裏面対象画像BTIを表わす裏面対象画像データを180度回転させて、回転画像RIを表わす回転画像データを生成する。
続いて、図12を参照して、図11の続きを説明する。図9のS120では、CPU22は、図10で決定される表面出力対象領域FOAを表わす表面部分画像データが上側に配置されると共に、図11で決定される裏面出力対象領域BOAを表わす裏面部分画像データが下側に配置されるように、表面部分画像データと裏面部分画像データとを結合して、結合画像CIを表わす結合画像データを生成する。この際に、CPU22は、表面部分画像データと裏面部分画像データとの間に、所定の長さを有する白色の余白を表わす画素データを挿入する。即ち、表面部分画像データと裏面部分画像データとは、余白を表わす画素データを介して結合される。ただし、変形例では、表面部分画像データと裏面部分画像データとは、余白を表わす画素データを介さずに結合されてもよい。また、CPU22は、表面出力対象領域FOAの横方向の中間位置と裏面出力対象領域BOAの横方向の中間位置とが、結合画像CIの横方向の同じ位置に存在するように、表面部分画像データと裏面部分画像データとを結合する。なお、表面部分画像データの横方向の長さ(即ち、画素数)と裏面部分画像データの横方向の長さとが異なる場合には、CPU22は、矩形形状を有する結合画像CIを表わす結合画像データが生成されるように、白色の余白を表わす画素データを補充する。
本実施例によると、端末装置TEは、図2の表面スキャン画像FSI内の2本の直線LL1,LR1を検出して(図6参照)、直線LL1と文字列オブジェクト画像との関係を示す評価値V1を特定すると共に、直線LR1と文字列オブジェクト画像との関係を示す評価値V2を特定する(図8参照)。そして、端末装置TEは、2個の評価値V1,V2に基づいて、表面の直線として直線LL1を選択する(図7のS80)。これにより、端末装置TEは、直線LL1が伸びる方向に基づいて、1行の文字列を構成する複数個の文字が横方向に沿って並ぶ第1の回転対象画像RTI1(図10参照)を生成することができる。また、端末装置TEは、裏面の直線として直線LR1を選択する(図7のS80)。これにより、端末装置TEは、直線LR1が伸びる方向に基づいて、1行の文字列を構成する複数個の文字が横方向に沿って並ぶ第2の回転対象画像RTI2(図11参照)を生成することができる。そして、端末装置TEは、それらの回転対象画像RTI1,RTI2を利用して、結合画像CIを生成する。このように、端末装置TEは、表面スキャン画像及び裏面スキャン画像の傾きを適切に補正することができ、この結果、適切な結合画像CIを出力することができる。
スキャン画像内の原稿画像の傾きを補正するための以下の第1の比較例の技術が知られている。即ち、第1の比較例の技術では、原稿画像に含まれる1行の文字列を構成する複数個の文字が並ぶ方向(即ち、いわゆる文字列のベースライン)が検出される。そして、文字列のベースラインが横方向に沿って伸びるように原稿画像が回転される。ただし、第1の比較例の技術では、文字列のベースラインを検出するために複雑な処理を要するので、処理時間が長くなり得る。これに対し、本実施例では、端末装置TEは、文字列のベースラインを検出せずに済むので、迅速に処理を実行し得る。また、第1の比較例の技術では、1行の文字列を構成する文字数が少ない場合に、ベースラインを適切に検出することができない可能性があり、この結果、原稿画像の傾きを適切に補正することができない可能性がある。これに対し、本実施例では、端末装置TEは、レシート原稿RDの端に対応する2本の直線LL1,LR1に基づいて結合画像CIを生成するので、1行の文字列を構成する文字数に関わらず、適切な結合画像CIを出力することができる。
スキャン画像内の原稿画像の傾きを補正するための以下の第2の比較例の技術が知られている。即ち、第2の比較例の技術では、スキャン画像に対する二値化処理等が実行され、原稿画像を構成する各部が値「1」で表現され、背景を構成する各部が値「0」で表現される。次いで、値「1」を含む各列の中から、最も左側に存在する値「1」と最も右側に存在する値「1」との間の距離が最も短い列と、全てが値「1」である列と、が検出される。そして、検出済みの2つの列に基づいて、原稿画像の傾きが補正される。ただし、第2の比較例の技術では、原稿画像が矩形形状を有することが前提となっている。従って、例えば、図2の表面スキャン画像FSIのように、レシート原稿領域RDA1が矩形形状を有さない状況では、原稿画像の傾きが適切に補正されない可能性がある。これに対し、本実施例では、端末装置TEは、レシート原稿RDの端に対応する2本の直線LL1,LR1に基づいて結合画像CIを生成するので、レシート原稿領域RDA1が矩形形状を有していなくても、適切な結合画像CIを出力することができる。
端末装置TEが、「画像処理装置」の一例である。図2において、表面スキャン画像FSI、裏面スキャン画像BSIが、それぞれ、「第1の原画像」、「第2の原画像」の一例である。表面スキャン画像FSIに含まれる文字列オブジェクト画像、裏面スキャン画像BSIに含まれる文字列オブジェクト画像が、それぞれ、「第1のオブジェクト画像」、「第2のオブジェクト画像」の一例である。レシート原稿RDにおいて、前半の3行の文字列「FFF Shop」〜「HHH $80」、後半の3行の文字列「III s$500」〜「KKK $10」が、それぞれ、「第1の部分オブジェクト」、「第2の部分オブジェクト」の一例である。表面スキャン画像FSI内の直線LL1,LR1が、「2本以上の直線」の一例である。直線LL1が、「第1の直線」及び「特定の直線」の一例である。直線LR1が、「第2の直線」及び「特定の直線とは異なる直線」の一例である。
本実施例では、図9のS120の処理が第1実施例とは異なる。図13に示されるように、CPU22は、図3のS34で生成された二値画像データを利用して、射影ヒストグラムH120を生成する。射影ヒストグラムH120は、二値画像データを構成する複数個の画素データを横方向に沿って射影する場合におけるON画素データの出現頻度の分布を表わす。次いで、CPU22は、射影ヒストグラムH120の下端から上側に向かう過程において、閾値Th1以上の頻度を最初に示す位置HLを特定する。そして、CPU22は、二値画像BI内において、直線LL1上の位置HLと、直線LR1上の位置HLと、の間の長さRW(即ち、画素数RW)を特定する。長さRWは、厳密に言うと、レシート原稿RDの短辺の長さよりも若干大きい長さに対応する。ただし、長さRWは、レシート原稿RDの短辺の長さに略等しい長さに対応する。従って、長さRWは、レシート原稿RDの短辺の長さに関係する長さである。
第1実施例では、図12に示されるように、結合画像CIのアスペクト比が、レシート原稿RDのアスペクト比とは大きく異なり得る。また、結合画像CI内の横方向において、前半の3行の文字列の左端の位置と、後半の3行の文字列の左端の位置と、が大きく異なり得る。即ち、結合画像CI内の各文字列のレイアウトが、レシート原稿RD内の各文字列のレイアウトとは大きく異なり得る。これに対し、本実施例では、結合画像CIの横方向に沿った長さは、レシート原稿RDの短辺の長さに関係する長さRWである。従って、レシート原稿RDのアスペクト比に略等しいアスペクト比を有する結合画像CIが出力される。また、本実施例では、結合画像CI内の横方向において、各文字列の左端の位置が略一致する。即ち、結合画像CI内の各文字列のレイアウトが、レシート原稿RD内の各文字列のレイアウトに略等しい。このように、本実施例によると、レシート原稿RDが適切に反映された結合画像CIを出力することができる。
以下に、本明細書に記載の技術の特徴を列挙する。
(項目1)
画像処理装置であって、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得部であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含む、前記取得部と、
前記第1の原画像の中から2本以上の直線を検出する検出部と、
前記2本以上の直線のうちの第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定部と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択部と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用して、出力データを生成する出力データ生成部と、
を備える、画像処理装置。
(項目2)
前記特定部は、さらに、前記2本以上の直線のうちの第2の直線であって、前記第1の直線とは異なる前記第2の直線と、前記第1のオブジェクト画像と、の関係である第2の関係を特定し、
前記選択部は、前記第1の関係と前記第2の関係とに基づいて、前記2本以上の直線の中から前記特定の直線を選択する、項目1に記載の画像処理装置。
(項目3)
前記第1の原画像データは、前記第1のオブジェクト画像を表わすオブジェクト画素データと、前記第1のオブジェクト画像の背景を表わす背景画素データと、を含み、
前記画像処理装置は、さらに、
前記第1の原画像データを用いて得られる第1の対象画像データを構成する複数個の対象画素データのうちのK個(前記Kは2以上の整数)の対象画素データを前記第1の直線に直交する方向に沿って射影して、前記オブジェクト画素データに関連する関連対象画素データの出現頻度の分布を表わす第1の射影ヒストグラムを生成する第1の射影ヒストグラム生成部を備え、
前記特定部は、前記第1の射影ヒストグラムを利用して、前記第1の関係を特定する、項目1又は2に記載の画像処理装置。
(項目4)
前記画像処理装置は、さらに、
前記第1の原画像データを構成する各原画素データを変換して、所定の閾値よりも高いエッジ強度を有する高強度画素データと、前記所定の閾値以下のエッジ強度を有する低強度画素データと、によって構成される前記第1の対象画像データを生成する対象画像データ生成部を備え、
前記第1の射影ヒストグラム生成部は、前記第1の対象画像データを構成する前記K個の対象画素データを前記第1の直線に直交する前記方向に沿って射影して、前記高強度画素データである前記関連画素データの出現頻度の分布を表わす前記第1の射影ヒストグラムを生成する、項目3に記載の画像処理装置。
(項目5)
前記第1の関係は、前記第1の射影ヒストグラムを生成するための全ての射影ラインのうち、前記関連対象画像データの出現頻度が第1の閾値以下である射影ラインの数である、項目3又は4に記載の画像処理装置。
(項目6)
前記第1の射影ヒストグラム生成部は、前記第1の対象画像データを構成する前記複数個の対象画素データのうちの一部である前記K個の対象画素データを前記第1の直線に直交する前記方向に沿って射影して、前記第1の射影ヒストグラムを生成する、項目3から5のいずれか一項に記載の画像処理装置。
(項目7)
前記画像処理装置は、さらに、
前記第1の原画像データを構成する各原画素データを変換して、所定の閾値よりも高いエッジ強度を有する高強度画素データと、前記所定の閾値以下のエッジ強度を有する低強度画素データと、によって構成される前記第1の対象画像データを生成する対象画像データ生成部を備え、
前記第1の射影ヒストグラム生成部は、前記第1の対象画像データを構成する前記K個の対象画素データを前記第1の直線に直交する前記方向に沿って射影して、前記高強度画素データである前記関連画素データの出現頻度の分布を表わす前記第1の射影ヒストグラムを生成し、
前記画像処理装置は、さらに、
前記第1の対象画像データを構成する前記複数個の対象画素データを予め決められている第1の方向に沿って射影して、前記高強度画素データの出現頻度の分布を表わす第2の射影ヒストグラムを生成する第2の射影ヒストグラム生成部を備え、
前記第1の射影ヒストグラム生成部は、
前記第2の射影ヒストグラムを利用して、前記第1の対象画像データを構成する前記複数個の対象画素データの中から、前記高強度画素データの出現頻度が第2の閾値以下である射影ライン上の各対象画素データを特定し、
前記第1の対象画像データを構成する前記複数個の対象画素データから特定済みの前記各対象画素データが除かれた前記K個の対象画素データを前記第1の直線に直交する前記方向に沿って射影して、前記第1の射影ヒストグラムを生成する、項目6に記載の画像処理装置。
(項目8)
前記検出部は、さらに、
前記第1の原画像データを用いて得られる第2の対象画像データの一部である第1の部分画像データを利用して、前記第1の部分画像データによって表わされる第1の部分画像の中から、前記2本以上の直線のうちの前記第1の直線を検出し、
前記第2の対象画像データの一部である第2の部分画像データであって、前記第1の部分画像データとは異なる前記第2の部分画像データを利用して、前記第2の部分画像データによって表わされる第2の部分画像の中から、前記2本以上の直線のうちの第2の直線であって、前記第1の直線とは異なる前記第2の直線を検出する、項目1から7のいずれか一項に記載の画像処理装置。
(項目9)
前記検出部は、さらに、
前記第1の部分画像データを利用して、前記第1の部分画像に含まれる最長の直線である前記第1の直線を検出し、
前記第2の部分画像データを利用して、前記第2の部分画像に含まれる最長の直線である前記第2の直線を検出する、項目8に記載の画像処理装置。
(項目10)
前記検出部は、前記第1の原画像に含まれる最長の直線と、前記第1の原画像に含まれる二番目に長い直線と、である2本の直線を検出することによって、前記2本以上の直線を検出し、
前記2本の直線は、直交の関係及び平行の関係ではなく、互いに対向する、項目1から9のいずれか一項に記載の画像処理装置。
(項目11)
前記検出部は、前記第1の原画像のうち、前記原稿を示す原稿領域の端に対応する2本の直線を検出することによって、前記2本以上の直線を検出し、
前記2本の直線は、直交の関係及び平行の関係ではなく、互いに対向する、項目1から10のいずれか一項に記載の画像処理装置。
(項目12)
前記特定部は、前記第1の直線が伸びる方向と予め決められている第2の方向との間の差分角度を回転角度として前記第1の原画像を回転させる場合における前記第1のオブジェクト画像の向きの関係である前記第1の関係を特定する、項目1から11のいずれか一項に記載の画像処理装置。
(項目13)
前記第1のオブジェクト画像は、1行以上の文字列を含む前記オブジェクトを示し、
前記特定部は、前記第1の直線が伸びる方向と、前記第1のオブジェクト画像によって示される前記1行以上の文字列のうちの1行の文字列を構成する複数個の文字が並ぶ方向と、の間の角度の関係である前記第1の関係を特定し、
前記選択部は、前記第1の関係に基づいて、前記2本以上の直線の中から、前記複数個の文字が並ぶ前記方向に直交する前記特定の直線を選択する、項目1から12のいずれか一項に記載の画像処理装置。
(項目14)
前記出力データ生成部は、
前記特定の直線が伸びる方向に基づく回転角度で前記第1の原画像が回転された回転済み画像を表わす回転済み画像データを生成し、
前記回転済み画像データを利用して、前記出力データを生成する、項目1から13のいずれか一項に記載の画像処理装置。
(項目15)
前記出力データ生成部は、
前記回転済み画像データを利用して、前記回転済み画像の中から、前記原稿を示す原稿領域を含む出力領域を決定し、
前記回転済み画像データを利用して、前記出力領域以外の領域が除外された除外済み画像を表わす除外済み画像データを生成し、
前記除外済み画像データを利用して、前記出力データを生成する、項目14に記載の画像処理装置。
(項目16)
前記出力データ生成部は、
前記第1の原画像内の特定の長さであって、矩形形状を有する前記原稿の特定の辺の長さに関係する前記特定の長さを決定し、
前記第1の原画像内の一部の領域である第1の出力対象領域であって、前記特定の直線に直交する方向に沿った前記特定の長さを有する前記第1の出力対象領域を決定し、
前記第1の出力対象領域に基づいて、前記出力データを生成する、項目1から15のいずれか一項に記載の画像処理装置。
(項目17)
前記第1の原画像は、前記オブジェクトの一部である第1の部分オブジェクトを示す前記第1のオブジェクト画像を含み、
前記取得部は、さらに、前記原稿のスキャンによって得られる第2の原画像データを取得し、
前記第2の原画像データによって表わされる第2の原画像は、前記オブジェクトの一部である第2の部分オブジェクトであって、前記第1の部分オブジェクトとは異なる前記第2の部分オブジェクトを示す第2のオブジェクト画像を含み、
前記出力データ生成部は、前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用し、かつ、前記2本以上の直線のうち、前記特定の直線とは異なる直線が伸びる方向に基づいて、前記第2の原画像データを利用して、前記出力データを生成する、項目1から16のいずれか一項に記載の画像処理装置。
(項目18)
前記出力データ生成部は、前記第1の原画像内の第1の出力対象領域と前記第2の原画像内の第2の出力対象領域とが結合された結合領域を含む出力画像を表わす前記出力データを生成する、項目17に記載の画像処理装置。
(項目19)
前記第1の部分オブジェクトを含む第1の部分領域と、前記第2の部分オブジェクトを含む第2の部分領域と、の間の境界で、前記原稿が折り返されている状態で、前記原稿の前記第1の部分領域と前記第2の部分領域とのそれぞれが別個にスキャンされる場合に、
前記第1の原画像は、前記第1の部分オブジェクトを示す前記第1のオブジェクト画像を含み、
前記第2の原画像は、前記第2の部分オブジェクトを示す前記第2のオブジェクト画像を含む、項目17又は18に記載の画像処理装置。
(項目20)
画像処理装置のためのコンピュータプログラムであって、
前記画像処理装置に搭載されるコンピュータに、以下の各処理、即ち、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得処理であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含む、前記取得処理と、
前記第1の原画像の中から2本以上の直線を検出する検出処理と、
前記2本以上の直線のうちの第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定処理と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択処理と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用して、出力データを生成する出力データ生成処理と、
を実行させるコンピュータプログラム。
Claims (19)
- 画像処理装置であって、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得部であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含み、前記第1の原画像データは、前記第1のオブジェクト画像を表わすオブジェクト画素データと、前記第1のオブジェクト画像の背景を表わす背景画素データと、を含む、前記取得部と、
前記第1の原画像の中から2本以上の直線を検出する検出部と、
前記第1の原画像データを用いて得られる第1の対象画像データを構成する複数個の対象画素データのうちのK個(前記Kは2以上の整数)の対象画素データを前記2本以上の直線のうちの第1の直線に直交する方向に沿って射影して、前記オブジェクト画素データに関連する関連対象画素データの出現頻度の分布を表わす第1の射影ヒストグラムを生成する第1の射影ヒストグラム生成部と、
前記第1の射影ヒストグラムを利用して、前記第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定部と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択部と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用して、出力データを生成する出力データ生成部と、
を備える、画像処理装置。 - 前記画像処理装置は、さらに、
前記第1の原画像データを構成する各原画素データを変換して、所定の閾値よりも高いエッジ強度を有する高強度画素データと、前記所定の閾値以下のエッジ強度を有する低強度画素データと、によって構成される前記第1の対象画像データを生成する対象画像データ生成部を備え、
前記第1の射影ヒストグラム生成部は、前記第1の対象画像データを構成する前記K個の対象画素データを前記第1の直線に直交する前記方向に沿って射影して、前記高強度画素データである前記関連対象画素データの出現頻度の分布を表わす前記第1の射影ヒストグラムを生成する、請求項1に記載の画像処理装置。 - 前記第1の関係は、前記第1の射影ヒストグラムを生成するための全ての射影ラインのうち、前記関連対象画素データの出現頻度が第1の閾値以下である射影ラインの数である、請求項1又は2に記載の画像処理装置。
- 前記第1の射影ヒストグラム生成部は、前記第1の対象画像データを構成する前記複数個の対象画素データのうちの一部である前記K個の対象画素データを前記第1の直線に直交する前記方向に沿って射影して、前記第1の射影ヒストグラムを生成する、請求項1から3のいずれか一項に記載の画像処理装置。
- 前記画像処理装置は、さらに、
前記第1の原画像データを構成する各原画素データを変換して、所定の閾値よりも高いエッジ強度を有する高強度画素データと、前記所定の閾値以下のエッジ強度を有する低強度画素データと、によって構成される前記第1の対象画像データを生成する対象画像データ生成部を備え、
前記第1の射影ヒストグラム生成部は、前記第1の対象画像データを構成する前記K個の対象画素データを前記第1の直線に直交する前記方向に沿って射影して、前記高強度画素データである前記関連対象画素データの出現頻度の分布を表わす前記第1の射影ヒストグラムを生成し、
前記画像処理装置は、さらに、
前記第1の対象画像データを構成する前記複数個の対象画素データを予め決められている第1の方向に沿って射影して、前記高強度画素データの出現頻度の分布を表わす第2の射影ヒストグラムを生成する第2の射影ヒストグラム生成部を備え、
前記第1の射影ヒストグラム生成部は、
前記第2の射影ヒストグラムを利用して、前記第1の対象画像データを構成する前記複数個の対象画素データの中から、前記高強度画素データの出現頻度が第2の閾値以下である射影ライン上の各対象画素データを特定し、
前記第1の対象画像データを構成する前記複数個の対象画素データから特定済みの前記各対象画素データが除かれた前記K個の対象画素データを前記第1の直線に直交する前記方向に沿って射影して、前記第1の射影ヒストグラムを生成する、請求項4に記載の画像処理装置。 - 画像処理装置であって、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得部であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含む、前記取得部と、
前記第1の原画像データを用いて得られる第2の対象画像データの一部である第1の部分画像データを利用して、前記第1の部分画像データによって表わされる第1の部分画像の中から、第1の直線を検出し、前記第2の対象画像データの一部である第2の部分画像データであって、前記第1の部分画像データとは異なる前記第2の部分画像データを利用して、前記第2の部分画像データによって表わされる第2の部分画像の中から、第2の直線であって、前記第1の直線とは異なる前記第2の直線を検出し、前記第1の原画像の中から前記第1の直線と前記第2の直線を含む2本以上の直線を検出する検出部と、
前記2本以上の直線のうちの前記第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定部と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択部と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用して、出力データを生成する出力データ生成部と、
を備える、画像処理装置。 - 前記検出部は、さらに、
前記第1の部分画像データを利用して、前記第1の部分画像に含まれる最長の直線である前記第1の直線を検出し、
前記第2の部分画像データを利用して、前記第2の部分画像に含まれる最長の直線である前記第2の直線を検出する、請求項6に記載の画像処理装置。 - 画像処理装置であって、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得部であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含む、前記取得部と、
前記第1の原画像の中から、前記第1の原画像に含まれる最長の直線と、前記第1の原画像に含まれる二番目に長い直線と、である2本の直線を含む2本以上の直線を検出する検出部であって、前記2本の直線は、直交の関係及び平行の関係ではなく、互いに対向する、前記検出部と、
前記2本以上の直線のうちの第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定部と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択部と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用して、出力データを生成する出力データ生成部と、
を備える、画像処理装置。 - 画像処理装置であって、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得部であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含む、前記取得部と、
前記第1の原画像のうち、前記原稿を示す原稿領域の端に対応する2本の直線を検出することによって、前記第1の原画像の中から2本以上の直線を検出する検出部であって、前記2本の直線は、直交の関係及び平行の関係ではなく、互いに対向する、前記検出部と、
前記2本以上の直線のうちの第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定部と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択部と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用して、出力データを生成する出力データ生成部と、
を備える、画像処理装置。 - 画像処理装置であって、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得部であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含む、前記取得部と、
前記第1の原画像の中から2本以上の直線を検出する検出部と、
前記2本以上の直線のうちの第1の直線が伸びる方向と予め決められている第2の方向との間の差分角度を回転角度として前記第1の原画像を回転させる場合における前記第1のオブジェクト画像の向きの関係である第1の関係を特定する特定部と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択部と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用して、出力データを生成する出力データ生成部と、
を備える、画像処理装置。 - 画像処理装置であって、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得部であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含む、前記取得部と、
前記第1の原画像の中から2本以上の直線を検出する検出部と、
前記2本以上の直線のうちの第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定部と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択部と、
前記第1の原画像内の特定の長さであって、矩形形状を有する前記原稿の特定の辺の長さに関係する前記特定の長さを決定し、前記第1の原画像内の一部の領域である第1の出力対象領域であって、前記特定の直線に直交する方向に沿った前記特定の長さを有する前記第1の出力対象領域を決定し、前記第1の出力対象領域に基づいて、出力データを生成する出力データ生成部と、
を備える、画像処理装置。 - 画像処理装置であって、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データと第2の原画像データとを取得する取得部であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトの一部である第1の部分オブジェクトを示す第1のオブジェクト画像を含み、前記第2の原画像データによって表わされる第2の原画像は、前記オブジェクトの一部である第2の部分オブジェクトであって、前記第1の部分オブジェクトとは異なる前記第2の部分オブジェクトを示す第2のオブジェクト画像を含む、前記取得部と、
前記第1の原画像の中から2本以上の直線を検出する検出部と、
前記2本以上の直線のうちの第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定部と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択部と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用し、かつ、前記2本以上の直線のうち、前記特定の直線とは異なる直線が伸びる方向に基づいて、前記第2の原画像データを利用して、出力データを生成する出力データ生成部と、
を備える、画像処理装置。 - 前記出力データ生成部は、前記第1の原画像内の第1の出力対象領域と前記第2の原画像内の第2の出力対象領域とが結合された結合領域を含む出力画像を表わす前記出力データを生成する、請求項12に記載の画像処理装置。
- 前記第1の部分オブジェクトを含む第1の部分領域と、前記第2の部分オブジェクトを含む第2の部分領域と、の間の境界で、前記原稿が折り返されている状態で、前記原稿の前記第1の部分領域と前記第2の部分領域とのそれぞれが別個にスキャンされる場合に、
前記第1の原画像は、前記第1の部分オブジェクトを示す前記第1のオブジェクト画像を含み、
前記第2の原画像は、前記第2の部分オブジェクトを示す前記第2のオブジェクト画像を含む、請求項12又は13に記載の画像処理装置。 - 前記特定部は、さらに、前記2本以上の直線のうちの第2の直線であって、前記第1の直線とは異なる前記第2の直線と、前記第1のオブジェクト画像と、の関係である第2の関係を特定し、
前記選択部は、前記第1の関係と前記第2の関係とに基づいて、前記2本以上の直線の中から前記特定の直線を選択する、請求項1〜14のいずれか一項に記載の画像処理装置。 - 前記第1のオブジェクト画像は、1行以上の文字列を含む前記オブジェクトを示し、
前記特定部は、前記第1の直線が伸びる方向と、前記第1のオブジェクト画像によって示される前記1行以上の文字列のうちの1行の文字列を構成する複数個の文字が並ぶ方向と、の間の角度の関係である前記第1の関係を特定し、
前記選択部は、前記第1の関係に基づいて、前記2本以上の直線の中から、前記複数個の文字が並ぶ前記方向に直交する前記特定の直線を選択する、請求項1から15のいずれか一項に記載の画像処理装置。 - 前記出力データ生成部は、
前記特定の直線が伸びる方向に基づく回転角度で前記第1の原画像が回転された回転済み画像を表わす回転済み画像データを生成し、
前記回転済み画像データを利用して、前記出力データを生成する、請求項1から16のいずれか一項に記載の画像処理装置。 - 前記出力データ生成部は、
前記回転済み画像データを利用して、前記回転済み画像の中から、前記原稿を示す原稿領域を含む出力領域を決定し、
前記回転済み画像データを利用して、前記出力領域以外の領域が除外された除外済み画像を表わす除外済み画像データを生成し、
前記除外済み画像データを利用して、前記出力データを生成する、請求項17に記載の画像処理装置。 - 画像処理装置のためのコンピュータプログラムであって、
前記画像処理装置に搭載されるコンピュータに、以下の各処理、即ち、
オブジェクトを含む原稿のスキャンによって得られる第1の原画像データを取得する取得処理であって、前記第1の原画像データによって表わされる第1の原画像は、前記オブジェクトを示す第1のオブジェクト画像を含み、前記第1の原画像データは、前記第1のオブジェクト画像を表わすオブジェクト画素データと、前記第1のオブジェクト画像の背景を表わす背景画素データと、を含む、前記取得処理と、
前記第1の原画像の中から2本以上の直線を検出する検出処理と、
前記第1の原画像データを用いて得られる第1の対象画像データを構成する複数個の対象画素データのうちのK個(前記Kは2以上の整数)の対象画素データを前記2本以上の直線のうちの第1の直線に直交する方向に沿って射影して、前記オブジェクト画素データに関連する関連対象画素データの出現頻度の分布を表わす第1の射影ヒストグラムを生成する射影ヒストグラム生成処理と、
前記第1の射影ヒストグラムを利用して、前記第1の直線と、前記第1のオブジェクト画像と、の関係である第1の関係を特定する特定処理と、
前記第1の関係に基づいて、前記2本以上の直線の中から特定の直線を選択する選択処理と、
前記特定の直線が伸びる方向に基づいて、前記第1の原画像データを利用して、出力データを生成する出力データ生成処理と、
を実行させるコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014071041A JP6210013B2 (ja) | 2014-03-31 | 2014-03-31 | 画像処理装置 |
US14/662,317 US9451126B2 (en) | 2014-03-31 | 2015-03-19 | Technique for image processing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014071041A JP6210013B2 (ja) | 2014-03-31 | 2014-03-31 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015195428A JP2015195428A (ja) | 2015-11-05 |
JP6210013B2 true JP6210013B2 (ja) | 2017-10-11 |
Family
ID=54192148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014071041A Active JP6210013B2 (ja) | 2014-03-31 | 2014-03-31 | 画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9451126B2 (ja) |
JP (1) | JP6210013B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5884560B2 (ja) * | 2012-03-05 | 2016-03-15 | オムロン株式会社 | 文字認識のための画像処理方法、およびこの方法を用いた文字認識装置およびプログラム |
JP6152821B2 (ja) * | 2014-03-31 | 2017-06-28 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
JP6575273B2 (ja) * | 2015-09-30 | 2019-09-18 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
WO2017187699A1 (ja) * | 2016-04-28 | 2017-11-02 | 京セラドキュメントソリューションズ株式会社 | データ送信システム及びデータ送信方法 |
JP2018029289A (ja) * | 2016-08-18 | 2018-02-22 | ブラザー工業株式会社 | 画像処理装置および画像処理方法 |
US11087448B2 (en) * | 2019-05-30 | 2021-08-10 | Kyocera Document Solutions Inc. | Apparatus, method, and non-transitory recording medium for a document fold determination based on the change point block detection |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3437249B2 (ja) | 1994-04-04 | 2003-08-18 | キヤノン株式会社 | 画像処理方法および画像処理装置 |
JP2000187705A (ja) | 1998-12-22 | 2000-07-04 | Toshiba Corp | 文書読取装置および方法および記憶媒体 |
JP3962891B2 (ja) * | 2000-08-09 | 2007-08-22 | 富士ゼロックス株式会社 | 文書画像処理装置、文書画像処理方法、及び記憶媒体 |
JP4186747B2 (ja) | 2003-08-06 | 2008-11-26 | 富士ゼロックス株式会社 | 画像処理装置、画像形成装置、画像処理方法及びプログラム |
JP5132438B2 (ja) * | 2008-06-19 | 2013-01-30 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
JP5477541B2 (ja) * | 2009-04-07 | 2014-04-23 | 村田機械株式会社 | 画像処理装置と処理方法、及び処理プログラム |
-
2014
- 2014-03-31 JP JP2014071041A patent/JP6210013B2/ja active Active
-
2015
- 2015-03-19 US US14/662,317 patent/US9451126B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9451126B2 (en) | 2016-09-20 |
US20150281513A1 (en) | 2015-10-01 |
JP2015195428A (ja) | 2015-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6210013B2 (ja) | 画像処理装置 | |
US8634659B2 (en) | Image processing apparatus, computer readable medium storing program, and image processing method | |
US9179035B2 (en) | Method of editing static digital combined images comprising images of multiple objects | |
JP2016536837A (ja) | 取込んだ画像データを3次元で幾何学的に再構成するためのシステムおよび方法 | |
US8811751B1 (en) | Method and system for correcting projective distortions with elimination steps on multiple levels | |
JP6642970B2 (ja) | 注目領域検出装置、注目領域検出方法及びプログラム | |
JP6288521B2 (ja) | 画像処理装置 | |
US9171218B2 (en) | Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input | |
JP2015056771A (ja) | 画像形成装置、印刷方法及びプログラム | |
EP2536123B1 (en) | Image processing method and image processing apparatus | |
US9582476B2 (en) | Image processing device | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
JP2018128825A (ja) | 画像処理装置及び画像処理プログラム | |
CN103905689B (zh) | 图像扫描装置、用于图像补偿的方法和计算机可读记录介质 | |
JP6984145B2 (ja) | 情報処理装置 | |
US10893167B2 (en) | Extracting a document page image from a electronically scanned image having a non-uniform background content | |
JP6494435B2 (ja) | 情報処理装置、その制御方法及びコンピュータプログラム | |
JP7311832B2 (ja) | 画像処理装置、読取装置、および、コンピュータプログラム | |
JP5683387B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体 | |
JP6645143B2 (ja) | 画像解析装置 | |
JP2009105541A (ja) | 画像処理装置、方法、および、プログラム | |
JP6160538B2 (ja) | 画像処理装置 | |
JP2014120832A (ja) | 画像処理装置及び画像処理プログラム | |
JP6876917B2 (ja) | 原稿サイズ検出装置、原稿サイズ検出プログラム及び画像処理システム | |
JP5454466B2 (ja) | 文字検出装置、文字検出方法、およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170502 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6210013 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |