JP2017208655A - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2017208655A
JP2017208655A JP2016098884A JP2016098884A JP2017208655A JP 2017208655 A JP2017208655 A JP 2017208655A JP 2016098884 A JP2016098884 A JP 2016098884A JP 2016098884 A JP2016098884 A JP 2016098884A JP 2017208655 A JP2017208655 A JP 2017208655A
Authority
JP
Japan
Prior art keywords
image
mask
character
corrected
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016098884A
Other languages
English (en)
Other versions
JP6540597B2 (ja
Inventor
龍太 土井
Ryuta Doi
龍太 土井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2016098884A priority Critical patent/JP6540597B2/ja
Publication of JP2017208655A publication Critical patent/JP2017208655A/ja
Application granted granted Critical
Publication of JP6540597B2 publication Critical patent/JP6540597B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】原稿を撮影して得られた画像を補正して出力する技術において、補正後の画像を、視覚的に認識しやすいものとする。【解決手段】情報処理装置は、原稿を撮影して得られた原稿撮影画像から、原稿の領域の画像である原稿領域画像を抽出する原稿領域抽出部と、抽出された原稿領域画像の歪みを補正して、補正原稿画像を生成する補正部と、補正原稿画像に含まれる補正文字画像を判別し、補正文字画像が示す文字を識別する判別部と、判別部が判別した補正文字画像を一対一でマスクする文字マスク領域を含むマスク画像を生成するマスク画像生成部と、マスク画像内の、文字マスク領域全てを包含する編集可能領域を算出する編集可能領域算出部と、マスク画像の編集可能領域から文字マスク領域を検出し、マスク画像の文字マスク領域に、文字マスク領域がマスクする補正文字画像が示す文字を示すテキストデータを配置して、合成画像を生成する配置部とを具備する。【選択図】図3

Description

本開示は、原稿を撮影して得られた画像を補正して出力することが可能な情報処理装置、情報処理方法及びプログラムに関する。
原稿を撮影して得られた画像を補正して出力することが可能な技術が知られている(例えば、特許文献1〜特許文献5)。
特開2004−062350号公報 特開2015−210749号公報 特開平11−243481号公報 特開2012−22413号公報 特開2012−14430号公報
補正後の画像は、益々ユーザーが視覚的に認識しやすいものであることが望ましい。
以上のような事情に鑑み、本開示の目的は、原稿を撮影して得られた画像を補正して出力する技術において、補正後の画像を、益々ユーザーが視覚的に認識しやすいものとすることにある。
本開示の一形態に係る情報処理装置は、
原稿を撮影して得られた原稿撮影画像から、前記原稿の領域の画像である原稿領域画像を抽出する原稿領域抽出部と、
前記抽出された原稿領域画像の歪みを補正して、補正原稿画像を生成する補正部と、
前記補正原稿画像に含まれる補正文字画像を判別し、前記補正文字画像が示す文字を識別する判別部と、
前記判別部が判別した補正文字画像を一対一でマスクする文字マスク領域を含むマスク画像を生成するマスク画像生成部と、
前記マスク画像内の、前記文字マスク領域全てを包含する編集可能領域を算出する編集可能領域算出部と、
前記マスク画像の前記編集可能領域から前記文字マスク領域を検出し、前記マスク画像の前記文字マスク領域に、前記文字マスク領域がマスクする前記補正文字画像が示す文字を示すテキストデータを配置して、合成画像を生成する配置部と
を具備する。
本形態によれば、原稿領域画像の歪みを補正してから補正文字画像を判別するので、文字識別の正確性が向上する。
前記判別部は、光学文字認識(Optical Character Recognition)により、前記補正原稿画像に含まれる補正文字画像を判別する。
前記マスク画像生成部は、前記生成したマスク画像のサイズを、前記合成画像のサイズと一致するように変更する。
前記判別部は、前記補正原稿画像に含まれる補正図画像をさらに判別する。
前記判別部は、前記補正図画像に含まれる文字を補正文字画像として判別しない。
本形態によれば、補正図画像に含まれる文字に対して、テキストデータは配置されない。
前記マスク画像生成部は、前記判別部が判別した補正図画像を一対一でマスクする図マスク領域をさらに含む前記マスク画像を生成し、
前記編集可能領域算出部は、前記マスク画像内の、前記図マスク領域全てをさらに包含する前記編集可能領域を算出し、
前記配置部は、前記マスク画像の前記編集可能領域から前記図マスク領域をさらに検出し、前記マスク画像の前記図マスク領域に、前記図マスク領域がマスクする前記補正図画像又は前記補正図画像と異なる画像をさらに配置して、前記合成画像を生成する。
本形態によれば、配置部は、典型的には、判別部が判別した補正図画像そのものを配置してもよいし、ユーザーの選択に基づき補正図画像と異なる画像を配置してもよいし、補正図画像を必要に応じて加工した画像を配置してもよい。
前記情報処理装置は、前記合成画像を用紙に形成する画像形成部をさらに具備する。
本形態によれば、情報処理装置は、例えば、プリンターなどの画像形成装置である。
前記情報処理装置は、前記原稿撮影画像を読み取る画像読取部をさらに具備する。
本形態によれば、情報処理装置は、例えば、スキャナー機能を有する画像形成装置である。
本開示の一形態に係る情報処理方法は、
原稿を撮影して得られた原稿撮影画像から、前記原稿の領域の画像である原稿領域画像を抽出し、
前記抽出された原稿領域画像の歪みを補正して、補正原稿画像を生成し、
前記補正原稿画像に含まれる補正文字画像を判別し、前記補正文字画像が示す文字を識別し、
前記判別された補正文字画像を一対一でマスクする文字マスク領域を含むマスク画像を生成し、
前記マスク画像内の、前記文字マスク領域全てを包含する編集可能領域を算出し、
前記マスク画像の前記編集可能領域から前記文字マスク領域を検出し、前記マスク画像の前記文字マスク領域に、前記文字マスク領域がマスクする前記補正文字画像が示す文字を示すテキストデータを配置して、合成画像を生成する。
本開示の一形態に係るプログラムは、
情報処理装置を、
原稿を撮影して得られた原稿撮影画像から、前記原稿の領域の画像である原稿領域画像を抽出する原稿領域抽出部、
前記抽出された原稿領域画像の歪みを補正して、補正原稿画像を生成する補正部と、
前記補正原稿画像に含まれる補正文字画像を判別し、前記補正文字画像が示す文字を識別する判別部、
前記判別部が判別した補正文字画像を一対一でマスクする文字マスク領域を含むマスク画像を生成するマスク画像生成部、
前記マスク画像内の、前記文字マスク領域全てを包含する編集可能領域を算出する編集可能領域算出部及び
前記マスク画像の前記編集可能領域から前記文字マスク領域を検出し、前記マスク画像の前記文字マスク領域に、前記文字マスク領域がマスクする前記補正文字画像が示す文字を示すテキストデータを配置して、合成画像を生成する配置部
として機能させる。
本開示によれば、原稿を撮影して得られた画像を補正して出力する技術において、補正後の画像を、益々ユーザーが視覚的に認識しやすいものとすることができる。
本開示の一実施形態に係る画像形成装置のハードウェア構成を示すブロック図である。 画像形成装置の機能的構成を示すブロック図である。 画像形成装置の動作を示すフローチャートである。 画像形成装置の動作を説明するための図である。
以下、図面を参照しながら、本開示の実施形態を説明する。
(1.画像形成装置のハードウェア構成)
図1は、本開示の一実施形態に係る画像形成装置のハードウェア構成を示すブロック図である。
本発明の各実施形態に係る情報処理装置は、画像形成装置(例えば、MFP、Multifunction Peripheral)であり、以下MFPと称する。
MFP1は、制御部11を備える。制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)及び専用のハードウェア回路等から構成され、MFP1の全体的な動作制御を司る。MFP1を各機能部(後述)として機能させるコンピュータプログラムは、ROM等の非一過性の記憶媒体に記憶される。
制御部11は、画像読取部12、画像処理部14、画像メモリー15、画像形成部16、操作部17、記憶部18、ネットワーク通信部13等と接続されている。制御部11は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。
制御部11は、ユーザーから、操作部17またはネッワーク接続されたパーソナルコンピュータ(図示せず)等を通じて入力されるジョブの実行指示に従って、スキャナー機能、印刷機能及びコピー機能機能などの各機能についての動作制御を実行するために必要な機構の駆動及び処理を制御する。
画像読取部12は、原稿から画像を読み取る。
画像処理部14は、画像読取部12で読み取られた画像の画像データを必要に応じて画像処理する。例えば、画像処理部14は、画像読取部12により読み取られた画像が画像形成された後の品質を向上させるために、シェーディング補正等の画像処理を行う。
画像メモリー15は、画像読取部12による読み取りで得られた原稿画像のデータを一時的に記憶したり、画像形成部16での印刷対象となるデータを一時的に記憶したりする領域を有する。
画像形成部16は、画像読取部12で読み取られた画像データ等の画像形成を行う。
操作部17は、MFP1が実行可能な各種動作及び処理についてユーザーからの指示を受け付けるタッチパネル部および操作キー部を備える。タッチパネル部は、タッチパネルが設けられたLCD(Liquid Crystal Display)等の表示部17aを備えている。
ネットワーク通信部13は、ネットワークに接続するためのインタフェースである。
記憶部18は、画像読取部12によって読み取られた原稿画像等を記憶する、HDD(Hard Disk Drive)などの大容量の記憶装置である。
(2.画像形成装置の機能的構成)
図2は、画像形成装置の機能的構成を示すブロック図である。
MFP1は、コンピューター読み取り可能な非一過性の記憶媒体の一例であるROMに記憶された情報処理プログラムをRAMにロードして実行することで、原稿領域抽出部101、補正部102、判別部103、マスク画像生成部104、編集可能領域算出部105及び配置部106として機能する。
原稿領域抽出部101は、画像メモリー15から、原稿撮影画像を読み出す。原稿領域抽出部101は、読み出した原稿撮影画像から、原稿領域画像I‐2を抽出する。
補正部102は、原稿領域抽出部101が抽出した原稿領域画像の歪みを補正して補正原稿画像を生成する。
判別部103は、補正原稿画像に含まれる補正図画像及び補正文字画像を判別する。判別部103は、文字認識用データベース111を参照し、抽出した複数の補正文字画像それぞれが示す文字を識別する。
マスク画像生成部104は、補正原稿画像に基づき、マスク画像を生成する。
編集可能領域算出部105は、マスク画像内の編集可能領域を算出する。
配置部106は、マスク画像内の編集可能領域内に、補正図画像と、補正文字画が示す文字を示すテキストデータとを配置することで、合成画像を生成する。
(3.画像形成装置の動作)
図3は、画像形成装置の動作を示すフローチャートである。図4は、画像形成装置の動作を説明するための図である。
画像入力部110としての画像読取部12は、用紙に形成(印刷)された原稿撮影画像I‐1をスキャンして読み取る。あるいは、画像入力部110としてのネットワーク通信部13は、ネットワークNに接続された情報処理装置(図示せず)から、原稿撮影画像I‐1を受信する。画像メモリー15に設定された画像メモリー15は、画像入力部110としての画像読取部12又はネットワーク通信部13が取得した原稿撮影画像I‐1を、記憶する(ステップS1)。
「原稿撮影画像I‐1」は、具体的には、原稿をデジタルカメラ等で撮影して得られた画像データである。「原稿」は、用紙等に文字や図が可視的に記録されたものである。「文字」は、典型的にはテキストデータの印字であるが、手書きの文字でもよい。「図」は、本開示では、用紙等への「文字」以外の記録対象を意味する。「図」の具体例は、写真、電子的に作図した図形や表等、手書きの絵等であるが、これらに限定されない。
原稿領域抽出部101は、画像メモリー15から、原稿撮影画像I‐1を読み出す。原稿領域抽出部101は、読み出した原稿撮影画像I‐1から、原稿領域画像I‐2を抽出する(ステップS2)。「原稿領域画像」は、原稿の領域の画像である。より具体的には、「原稿領域画像」は、原稿撮影画像I‐1全体のうち、原稿(用紙)の輪郭線により縁取られる領域であり、文字、図及び背景を内包する。具体的には、原稿領域抽出部101は、原稿撮影画像I‐1に含まれる原稿(用紙)の輪郭線を探索する。原稿領域抽出部101は、輪郭線上の1つの点Pを検出すると、点Pを始点として輪郭線をなぞることにより、輪郭線を探索する。原稿領域抽出部101は、探索の始点と終点が同一であり、外周が一定の距離以上ある輪郭線により囲まれる閉塞した領域を、原稿領域として判断する。原稿領域抽出部101は、判断した原稿領域の画像を、原稿領域画像I‐2として抽出する。
補正部102は、原稿領域抽出部101が抽出した原稿領域画像I‐2の歪みを補正する(ステップS3)。長方形の用紙等の原稿をデジタルカメラ等で撮影すると、原稿領域画像I‐2は、台形になる等少なからず歪んでいる可能性が高い。従って、補正部102は、公知の台形歪み補正技術等により、台形の原稿領域画像I‐2を長方形に補正して(図4の矢印及び点線を参照)、補正原稿画像I‐3を生成する。
判別部103は、公知の方法(エッジ検出等)により、補正原稿画像I‐3に含まれる補正図画像を判別する。例えば、判別部103は、連続するエッジで形成される図形(図形が矩形等の2次元の場合は、図形の輪郭線で囲まれる閉塞した領域(図形が特定サイズ以下であって、単一色で形成されている場合を除いてもよい。例えば、罫線や、黒丸やハイフン等の記号等。)を補正図画像として判別する。「補正図画像」は、補正原稿画像I‐3に含まれる図の画像である。そして、判別部103は、光学文字認識(OCR、Optical Character Recognition)により、補正原稿画像I‐3のうち補正図画像を除く領域(文字領域)に含まれる補正文字画像を判別する(ステップS4)。具体的には、判別部103は、補正原稿画像I‐3のうち補正図画像を除く文字領域から、複数の補正文字画像を抽出する。つまり、判別部103は、補正図画像に含まれる文字を補正文字画像として判別しない。「補正文字画像」は、補正原稿画像I‐3の文字領域に含まれる1文字1文字(言語によっては、1語1語としてもよい。)の画像である。判別部103は、文字認識用データベース111を参照し、抽出した複数の補正文字画像それぞれが示す文字を識別する。具体的には、文字認識用データベース111には、文字の画像パターンと文字コードとが対応付けられて1文字ずつ登録されている。判別部103は、抽出した補正文字画像の画像パターンを文字認識用データベース111から検索し、検索により得られた画像パターンが対応付けられた文字コードを取得する。
マスク画像生成部104は、補正原稿画像I‐3に基づき、マスク画像I‐4を生成する(ステップS5)。「マスク画像I‐4」は、補正原稿画像I‐3に含まれる補正図画像を一対一でマスクする図マスク領域と、補正文字画像を一対一でマスクする文字マスク領域とを含む。典型的には、マスク画像I‐4中、図マスク領域及び文字マスク領域のピクセルは黒(全ビットが1)であり、それ以外の背景領域のピクセルは白(全ビットが0)である。さらに、マスク画像生成部104は、マスク画像I‐4のサイズと出力すべき画像(後述の「合成画像I‐6」)のサイズとを比較し、その比率に基づき、マスク画像I‐4のサイズを、出力すべき画像のサイズと一致するように変更する。さらに、マスク画像生成部104は、マスク画像I‐4に含まれる図マスク領域及び文字マスク領域を、それぞれ、ラベリングする。「ラベリング」とは、マスク画像I‐4に含まれる図マスク領域及び文字マスク領域が、補正原稿画像I‐3に含まれる補正図画像及び補正文字画像と、それぞれ対応するように、一対一で識別番号を付すことである。
なお、背景領域のピクセルは原稿の地色等の白以外の色であっても良い。また、図マスク領域及び文字マスク領域のピクセルは、背景領域と異なる色であれば、白等の黒以外の色であっても良い。さらに、図マスク領域と文字マスク領域のピクセルは、互いに異なる色であっても良い。
編集可能領域算出部105は、マスク画像I‐4内の編集可能領域I‐5を算出する(ステップS6)。「編集可能領域I‐5」は、マスク画像I‐4内の文字マスク領域及び図マスク領域全てを包含する、1つの枠内の領域である。具体的には、「編集可能領域I‐5」は、マスク画像I‐4内の文字マスク領域及び図マスク領域全てを包含し得る、最小の枠内の領域である。
配置部106は、マスク画像I‐4内の編集可能領域I‐5から、図マスク領域を検出する。配置部106は、マスク画像I‐4内の図マスク領域に、この図マスク領域がマスクする補正図画像(言い換えれば、この図マスク領域にラベリングされた補正図画像)を配置する(ステップS7)。このとき、配置部106は、補正図画像のサイズが図マスク領域のサイズと一致するように、補正図画像を変形する。配置部106は、典型的には、判別部103が判別(ステップS4)した補正図画像そのものを配置する。あるいは、配置部106は、ユーザーの選択に基づき補正図画像と異なる画像を配置してもよいし、補正図画像を必要に応じて加工した画像を配置してもよい。
配置部106は、マスク画像I‐4内の編集可能領域I‐5から、文字マスク領域を検出する。配置部106は、マスク画像I‐4内の文字マスク領域に、この文字マスク領域がマスクする補正文字画像(言い換えれば、この文字マスク領域にラベリングされた補正文字画像)が示す文字を示すテキストデータを配置する(ステップS8)。具体的には、配置部106は、判別部103がOCRにより判別した文字コードのテキストデータを、マスク画像I‐4内の文字マスク領域に配置する。テキストデータのフォントは、判別部103が抽出した補正文字画像から推測されるフォントとしてもよい。各文字のサイズは、各文字マスク領域の輪郭線が包含し得る、最大のサイズとしてもよい(この場合、全ての文字のフォントサイズは、必ずしも同一とは限らない)。あるいは、全ての文字のフォントサイズを、同一としてもよい。
以上のように、配置部106は、マスク画像I‐4の図マスク領域に補正図画像又は別の画像を配置し、文字マスク領域にテキストデータを配置することで、合成画像I‐6を生成する。
表示部17aは、配置部106が生成した合成画像I‐6と、画像読取部12が読み取った原稿撮影画像I‐1(ステップS1)とを、ユーザーが視覚的に確認しやすいように、例えば並べて表示する。操作部17を介して、ユーザーにより、合成画像I‐6の出力方法(印刷、メール送信、BOX保存等)が選択される。画像出力部112は、選択された出力方法で合成画像I‐6を出力する(ステップS9)。例えば、出力方法として印刷が選択された場合、画像出力部112としての画像形成部16は、合成画像I‐6を用紙に形成(印刷)する。
(4.変形例)
情報処理装置の一実施形態として画像形成装置(MFP)を例に説明した。これに替えて、情報処理装置の一実施形態として、パーソナルコンピューター、タブレットコンピューター、スマートフォン、デジタルカメラ等の端末装置を用いてもよい。その場合、ステップS1(原稿撮影画像を入力)として、端末装置は、MFPがスキャンして読み取った原稿撮影画像を、ネットワークを通じて取得すればよい。あるいは、端末装置は、別の端末装置(例えば、デジタルカメラや、デジタルカメラを内蔵する端末装置)が撮影した画像を、原稿撮影画像としてネットワークを通じて取得してもよい。あるいは、端末装置は、端末装置自体に内蔵されたカメラが撮影した画像を、原稿撮影画像として取得してもよい。また、ステップS9(合成画像を出力)として、端末装置は、印刷データをネットワークを通じてMFPに出力したり、端末装置の表示部に出力(表示)すればよい。
あるいは、情報処理装置の一実施形態として、ネットワーク(クラウド)に接続されたサーバー装置としてのコンピューターを用いてもよい。その場合、ステップS1(原稿撮影画像を入力)として、サーバー装置は、MFPがスキャンして読み取った原稿撮影画像を、ネットワークを通じて取得すればよい。あるいは、サーバー装置は、端末装置(例えば、デジタルカメラや、デジタルカメラを内蔵する端末装置)が撮影した画像を、原稿撮影画像としてネットワークを通じて取得してもよい。また、ステップS9(合成画像を出力)として、サーバー装置は、印刷データをネットワークを通じてMFPに出力したり、ネットワークを通じて端末装置の表示部に出力(表示)すればよい。
(5.まとめ)
近年、デジタルカメラを内蔵するスマートフォンやタブレットコンピューター等の端末装置の普及や、デジタルカメラの画質の向上が目覚ましい。このため、ワードプロセッサーソフトで作成した文書データを保存したり印刷する代わりに、原稿を端末装置で撮影し、原稿を撮影した画像を保存したり印刷することもある。しかし、原稿を撮影した画像は、カメラの角度など様々な条件によって歪みが生じ得る。歪みが生じた画像に対して処理を施しては、正確性が低くなる可能性がある。
そこで、本実施形態によれば、原稿撮影画像I‐1から原稿領域画像I‐2を抽出し(ステップS2)、原稿領域画像I‐2の歪みを補正し(ステップS3)、OCRにより補正文字画像を判別し(ステップS4)、補正文字画像を示すテキストデータを配置する(ステップS8)。本実施形態によれば、原稿領域画像I‐2の歪みを補正してから(ステップS3)OCRにより補正文字画像を判別する(ステップS4)ので、OCRの正確性が向上する。また、原稿領域画像I‐2を抽出し(ステップS2)、原稿領域画像I‐2の歪みを補正する(ステップS3)ので、原稿以外の領域(背景。原稿が載置されている机等)が無くなりワードプロセッサーソフトで作成した文書データに近い出力結果を得ることができる。また、判別部103は、補正図画像に含まれる文字を補正文字画像として判別(ステップS4)しない。これにより、補正図画像に含まれる文字に対してテキストデータが配置されないので、配置(ステップS7)される補正図画像がユーザーにとって違和感なく自然なものとなる。また、補正原稿画像I‐3に含まれる補正図画像及び補正文字画像を一対一でマスクするマスク領域を含むマスク画像I‐4を生成し(ステップS5)、テキストデータを配置する(ステップS8)ので、ユーザーが配置先の位置を指定する等の手間が掛からない。以上より、ユーザーにとっては自動的に、原稿撮影画像I‐1を電子文書に変換することができる。
これに対して、特許文献1では、撮像対象となる文書(既存文書)を写真として読み込み、電子文書として再配置を行うが、ユーザーが座標を指定し、認識範囲、貼り付ける位置などを選択する必要があり、手間がかかる。
1…MFP
101…原稿領域抽出部
102…補正部
103…判別部
104…マスク画像生成部
105…編集可能領域算出部
106…配置部
110…画像入力部
111…文字認識用データベース
112…画像出力部

Claims (10)

  1. 原稿を撮影して得られた原稿撮影画像から、前記原稿の領域の画像である原稿領域画像を抽出する原稿領域抽出部と、
    前記抽出された原稿領域画像の歪みを補正して、補正原稿画像を生成する補正部と、
    前記補正原稿画像に含まれる補正文字画像を判別し、前記補正文字画像が示す文字を識別する判別部と、
    前記判別部が判別した補正文字画像を一対一でマスクする文字マスク領域を含むマスク画像を生成するマスク画像生成部と、
    前記マスク画像内の、前記文字マスク領域全てを包含する編集可能領域を算出する編集可能領域算出部と、
    前記マスク画像の前記編集可能領域から前記文字マスク領域を検出し、前記マスク画像の前記文字マスク領域に、前記文字マスク領域がマスクする前記補正文字画像が示す文字を示すテキストデータを配置して、合成画像を生成する配置部と
    を具備する情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記判別部は、光学文字認識(Optical Character Recognition)により、前記補正原稿画像に含まれる補正文字画像を判別する
    情報処理装置。
  3. 請求項1又は請求項2に記載の情報処理装置であって、
    前記マスク画像生成部は、前記生成したマスク画像のサイズを、前記合成画像のサイズと一致するように変更する
    情報処理装置。
  4. 請求項1乃至請求項3の何れか一項に記載の情報処理装置であって、
    前記判別部は、前記補正原稿画像に含まれる補正図画像をさらに判別する
    情報処理装置。
  5. 請求項4に記載の情報処理装置であって、
    前記判別部は、前記補正図画像に含まれる文字を補正文字画像として判別しない
    情報処理装置。
  6. 請求項4又は請求項5に記載の情報処理装置であって、
    前記マスク画像生成部は、前記判別部が判別した補正図画像を一対一でマスクする図マスク領域をさらに含む前記マスク画像を生成し、
    前記編集可能領域算出部は、前記マスク画像内の、前記図マスク領域全てをさらに包含する前記編集可能領域を算出し、
    前記配置部は、前記マスク画像の前記編集可能領域から前記図マスク領域をさらに検出し、前記マスク画像の前記図マスク領域に、前記図マスク領域がマスクする前記補正図画像又は前記補正図画像と異なる画像をさらに配置して、前記合成画像を生成する
    情報処理装置。
  7. 請求項1乃至請求項6の何れか一項に記載の情報処理装置であって、
    前記合成画像を用紙に形成する画像形成部をさらに具備する
    情報処理装置。
  8. 請求項1乃至請求項7の何れか一項に記載の情報処理装置であって、
    前記原稿撮影画像を読み取る画像読取部
    をさらに具備する情報処理装置。
  9. 原稿を撮影して得られた原稿撮影画像から、前記原稿の領域の画像である原稿領域画像を抽出し、
    前記抽出された原稿領域画像の歪みを補正して、補正原稿画像を生成し、
    前記補正原稿画像に含まれる補正文字画像を判別し、前記補正文字画像が示す文字を識別し、
    前記判別された補正文字画像を一対一でマスクする文字マスク領域を含むマスク画像を生成し、
    前記マスク画像内の、前記文字マスク領域全てを包含する編集可能領域を算出し、
    前記マスク画像の前記編集可能領域から前記文字マスク領域を検出し、前記マスク画像の前記文字マスク領域に、前記文字マスク領域がマスクする前記補正文字画像が示す文字を示すテキストデータを配置して、合成画像を生成する
    情報処理方法。
  10. 情報処理装置を、
    原稿を撮影して得られた原稿撮影画像から、前記原稿の領域の画像である原稿領域画像を抽出する原稿領域抽出部、
    前記抽出された原稿領域画像の歪みを補正して、補正原稿画像を生成する補正部と、
    前記補正原稿画像に含まれる補正文字画像を判別し、前記補正文字画像が示す文字を識別する判別部、
    前記判別部が判別した補正文字画像を一対一でマスクする文字マスク領域を含むマスク画像を生成するマスク画像生成部、
    前記マスク画像内の、前記文字マスク領域全てを包含する編集可能領域を算出する編集可能領域算出部及び
    前記マスク画像の前記編集可能領域から前記文字マスク領域を検出し、前記マスク画像の前記文字マスク領域に、前記文字マスク領域がマスクする前記補正文字画像が示す文字を示すテキストデータを配置して、合成画像を生成する配置部
    として機能させるプログラム。
JP2016098884A 2016-05-17 2016-05-17 情報処理装置、情報処理方法及びプログラム Expired - Fee Related JP6540597B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016098884A JP6540597B2 (ja) 2016-05-17 2016-05-17 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016098884A JP6540597B2 (ja) 2016-05-17 2016-05-17 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2017208655A true JP2017208655A (ja) 2017-11-24
JP6540597B2 JP6540597B2 (ja) 2019-07-10

Family

ID=60416642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016098884A Expired - Fee Related JP6540597B2 (ja) 2016-05-17 2016-05-17 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6540597B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020013217A (ja) * 2018-07-13 2020-01-23 株式会社リコー 情報処理システム、画像ログ検索方法、情報処理装置及びプログラム
CN113270088A (zh) * 2020-02-14 2021-08-17 阿里巴巴集团控股有限公司 文本处理、数据处理和语音处理方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000013596A (ja) * 1998-06-18 2000-01-14 Minolta Co Ltd 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP2000339402A (ja) * 1999-05-27 2000-12-08 Canon Inc 画像処理装置及びその方法、コンピュータ可読メモリ
JP2004062350A (ja) * 2002-07-26 2004-02-26 Fujitsu Ltd 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法
JP2006303678A (ja) * 2005-04-18 2006-11-02 Canon Inc 画像処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000013596A (ja) * 1998-06-18 2000-01-14 Minolta Co Ltd 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP2000339402A (ja) * 1999-05-27 2000-12-08 Canon Inc 画像処理装置及びその方法、コンピュータ可読メモリ
JP2004062350A (ja) * 2002-07-26 2004-02-26 Fujitsu Ltd 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法
JP2006303678A (ja) * 2005-04-18 2006-11-02 Canon Inc 画像処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020013217A (ja) * 2018-07-13 2020-01-23 株式会社リコー 情報処理システム、画像ログ検索方法、情報処理装置及びプログラム
CN113270088A (zh) * 2020-02-14 2021-08-17 阿里巴巴集团控股有限公司 文本处理、数据处理和语音处理方法、装置和电子设备
CN113270088B (zh) * 2020-02-14 2022-04-29 阿里巴巴集团控股有限公司 文本处理、数据处理和语音处理方法、装置和电子设备

Also Published As

Publication number Publication date
JP6540597B2 (ja) 2019-07-10

Similar Documents

Publication Publication Date Title
KR101292925B1 (ko) 촬상 대상물, 화상 처리 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록 매체 및 화상 처리 방법
JP7387339B2 (ja) 画像処理システム、画像処理方法、及びプログラム
JP4904426B1 (ja) 画像処理システムとそれに用いる撮像対象物
US10395131B2 (en) Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result
US9558433B2 (en) Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
CN111950557A (zh) 错题处理方法、图像形成装置及电子设备
US11470211B2 (en) Image processing apparatus for generating an electronic file of a document image from an optically captured image, and non-transitory computer readable recording medium that records image processing program for generating an electronic file of a document image from an optically captured image
US9818028B2 (en) Information processing apparatus for obtaining a degree of similarity between elements
JP6540597B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2017212575A (ja) 画像読込み装置及びプログラム
US11436733B2 (en) Image processing apparatus, image processing method and storage medium
JP2009027221A (ja) 情報管理システムおよびプログラム
US10645256B2 (en) Image forming apparatus and non-transitory computer-readable storage medium suitable for extracting areas in images specified by handwritten marker by line marker such as highlighter pen or the like, and electronic marker by digital pen
JP5651221B2 (ja) シンボル片、画像処理プログラム、及び画像処理方法
JP6058042B2 (ja) 画像処理装置
JP2018170653A (ja) 画像形成装置及びプログラム
JP7147544B2 (ja) 情報処理装置、及び情報処理方法
JP6639257B2 (ja) 情報処理装置及びその制御方法
JP2019220906A (ja) 画像処理システム、印刷指示装置、画像処理装置及びプログラム
US20220301326A1 (en) Ocr target area position acquisition system, computer-readable non-transitory recording medium storing ocr target area position acquisition program, hard copy, hard copy generation system, and computer-readable non-transitory recording medium storing hard copy generation program
JP5101740B2 (ja) 撮像対象物
WO2022097408A1 (ja) 画像処理装置及び画像形成装置
US20220277473A1 (en) Pose estimation apparatus, learning apparatus, pose estimation method, and non-transitory computer-readable recording medium
JP5602927B2 (ja) 撮像対象物、画像処理プログラム、及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190527

R150 Certificate of patent or registration of utility model

Ref document number: 6540597

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees