JP4758493B2 - 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体 - Google Patents

携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4758493B2
JP4758493B2 JP2009091530A JP2009091530A JP4758493B2 JP 4758493 B2 JP4758493 B2 JP 4758493B2 JP 2009091530 A JP2009091530 A JP 2009091530A JP 2009091530 A JP2009091530 A JP 2009091530A JP 4758493 B2 JP4758493 B2 JP 4758493B2
Authority
JP
Japan
Prior art keywords
image data
captured image
unit
resolution
imaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009091530A
Other languages
English (en)
Other versions
JP2010245787A (ja
Inventor
真 早崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2009091530A priority Critical patent/JP4758493B2/ja
Priority to US12/752,503 priority patent/US8310550B2/en
Priority to CN2010101513124A priority patent/CN101860708B/zh
Publication of JP2010245787A publication Critical patent/JP2010245787A/ja
Application granted granted Critical
Publication of JP4758493B2 publication Critical patent/JP4758493B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00281Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal
    • H04N1/00307Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal with a mobile telephone apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00347Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with another still picture apparatus, e.g. hybrid still picture apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2104Intermediate information storage for one or a few pictures
    • H04N1/2112Intermediate information storage for one or a few pictures using still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2104Intermediate information storage for one or a few pictures
    • H04N1/2112Intermediate information storage for one or a few pictures using still video cameras
    • H04N1/215Recording a sequence of still pictures, e.g. burst mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/393Enlarging or reducing
    • H04N1/3935Enlarging or reducing with modification of image resolution, i.e. determining the values of picture elements at new relative positions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/4406Restricting access, e.g. according to user identity
    • H04N1/4413Restricting access, e.g. according to user identity involving the use of passwords, ID codes or the like, e.g. PIN
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0034Details of the connection, e.g. connector, interface
    • H04N2201/0037Topological details of the connection
    • H04N2201/0041Point to point
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0034Details of the connection, e.g. connector, interface
    • H04N2201/0048Type of connection
    • H04N2201/0055By radio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0096Portable devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3204Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a user, sender, addressee, machine or electronic recording medium
    • H04N2201/3205Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a user, sender, addressee, machine or electronic recording medium of identification information, e.g. name or ID code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3226Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
    • H04N2201/3228Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information
    • H04N2201/3229Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information further additional information (metadata) being comprised in the file name (including path, e.g. directory or folder names at one or more higher hierarchical levels)
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3242Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of processing required or performed, e.g. for reproduction or before recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3278Transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)

Description

本発明は、携帯端末装置にて撮像した画像を画像出力装置により出力する撮像画像処理システムに関する。
インターネット技術とともに、携帯電話や有線、無線通信技術が発達し広く普及されている。この技術を用いて、外出先から携帯電話などの携帯端末装置から、インターネット上に接続された画像出力装置に画像を送り、印刷を行わせることがなされている。
例えば、特許文献1では、デジタルカメラや、カメラ付きPDA・携帯パソコン等のモバイル情報機器で収集したデジタル画像データを、ネットワークを介してサーバに送信する。サーバでは、受信したデジタル画像データに対して、明るさや色、サイズの調整などの画像処理を行い、複数保存されているドキュメント合成用のテンプレートの画像エリアにはめ込んでドキュメントの作成を行う。
また、特許文献2では、カメラ付き携帯電話において、印刷を所望する画像を選択し、各種の印刷条件を設定し、プリント動作の開始を指示するとともに、デバイスネームなどの識別情報をプリンタ側に送り、プリンタに識別情報の登録を行う。プリンタは、この情報を取得した後、プリンタのデバイスネームなどの識別情報を携帯電話側に送り、携帯電話はこの識別情報の登録を行う。
次に、携帯電話側からデータ通信に使用可能な通信速度のパラメータを転送すると、プリンタ側は、このパラメータを取得し、プリンタの使用可能な通信速度と比較し、最も転送効率の良いと判断した通信速度のパラメータを携帯電話側に転送する。そして、携帯電話はプリンタから受け取った値に通信速度を変更し、プリンタも送信した値の通信速度に変更を行う。その後、携帯電話は画像データをプリンタに転送し、プリンタ側は画像データを受け取って印刷データを生成し且つ印刷処理を行う。
特開2002−41502号公報(2002年2月8日公開) 特開2007−27839号公報(2007年2月1日公開)
しかしながら、携帯電話やデジタルカメラに用いられているRGBフィルタ、または、補色(CMY)フィルタは、各色に対するフィルタが2次元平面に配列されているため、スキャナ等で読み取られた画像データを比較すると、解像力が1/3〜2/3程度低下した画像となっており、特に、文字の判読性が悪いという問題がある。
具体的には、スキャナ等では、RGBラインセンサを用いているので、画素毎にそれぞれのカラーデータを読み取ることが可能であるが、携帯電話やデジタルカメラにおけるフィルタは、画素に対して、例えば、RGBRGB…、あるいは、ライン毎にRGRGRG…/GBGBGB…と配列されており、各画素でフィルタが設けられていない色成分が存在するため、解像力が低い。
本発明は、上記課題を解決するためになされたものであり、携帯端末装置にて撮像した画像を、文字の判読性などの解像度を向上させた状態で画像出力装置が出力可能な、携帯端末装置、画像出力装置、撮像画像処理システム、撮像画像処理方法、プログラムおよび記録媒体を提供することを目的とする。
上記目的を解決するために、本願の携帯端末装置は、複数の画像データから、当該複数の画像データの解像度よりも高解像度の画像データに補正する高解像度補正を行う補正処理部を備え、上記補正処理部によって補正された高解像度の画像データを出力する画像出力装置に対して画像データを送信する携帯端末装置であって、同一の撮像対象物に対して連続して複数回撮像する撮像部と、上記撮像部による連続した複数回撮像により得られた複数の撮像画像データが所定条件を満たすか否かを判定する撮像画像判定部と、上記撮像画像判定部により上記所定条件を満たす撮像画像データを上記画像出力装置に送信する送信部とを備え、上記所定条件は、少なくとも以下の条件Aを含み、
条件A:上記撮像部により連続して撮像された複数の撮像画像データの中に、上記補正処理部による高解像度補正に適した、所定量だけずれた所定数(2以上の整数)の撮像画像データの組合せが含まれる、
上記送信部は、上記撮像画像判定部により上記組合せとして判定された所定数の撮像画像データを送信することを特徴とする。
また、本発明の携帯端末装置の制御方法は、複数の画像データから、当該複数の画像データの解像度よりも高解像度の画像データに補正する高解像度補正を行う補正処理部を備え、上記補正処理部によって補正された高解像度の画像データを出力する画像出力装置に対して画像データを送信する携帯端末装置の制御方法であって、上記携帯端末装置は、同一の撮像対象物に対して連続して複数回撮像する撮像部を備え、上記撮像部による連続した複数回撮像により得られた複数の撮像画像データが所定条件を満たすか否かを判定する撮像画像判定ステップと、上記撮像画像判定ステップにおいて上記所定条件を満たす撮像画像データを上記画像出力装置に送信する送信ステップとを含み、上記所定条件は、少なくとも以下の条件Aを含み、
条件A:上記撮像部により連続して撮像された複数の撮像画像データの中に、上記補正処理部による高解像度補正に適した、所定量だけずれた所定数(2以上の整数)の撮像画像データの組合せが含まれる、
上記送信ステップにおいて、上記撮像画像判定ステップにおいて上記組合せとして判定された所定数の撮像画像データを送信することを特徴とする。
上記の構成によれば、携帯端末装置は、撮像部により連続して撮像された複数の撮像画像データの中に、高解像度補正に適した、所定量だけずれた所定数(2以上の整数)の撮像画像データの組合せが含まれるか否かを判断する。そして、含まれる場合に、携帯端末装置は、当該組合せとして判定された所定数の撮像画像データを画像出力装置に送信する。
これにより、携帯端末装置は、画像出力装置が高解像度補正を行うことが可能な所定数の撮像画像データのみを画像出力装置に送信することとなる。その結果、ユーザは、携帯端末装置で撮像した画像であり、かつ、携帯端末装置の撮像画像よりも高解像度の画像雄を、画像出力装置から容易に得ることができる。これにより、例えば文書画像を含む撮像対象物を撮像した場合であっても、画像出力装置から得た画像において、当該文書の文字の判読性が向上することとなる。
さらに、本発明の携帯端末装置は、上記撮像画像判定部により上記所定条件を満たさないと判定された場合、ユーザに対して再撮像を促す通知を行う通知部を備えることが好ましい。
上記の構成によれば、ユーザは、高解像度の画像を画像出力装置から得るためには、再撮像が必要であることを容易に把握することができる。その結果、即座に再撮像するという対応を行うことができる。
さらに、本発明の携帯端末装置において、上記撮像対象物は、文書画像が形成された矩形状の面を有しており、上記所定条件は、さらに以下の条件B、
条件B:上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる、撮像画像データにおける上記矩形状の面の歪みの度合いを示す特徴量が所定範囲内である、
を含むことが好ましい。
ここで、矩形状の撮像対象物とは、例えば、文書画像が形成された原稿用紙やポスター、プロジェクター等により表示された画面、ディスプレイ上の画面などである。
矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる、撮像画像データにおける上記矩形状の面の歪みを補正する方法として様々な方法が知られている。しかしながら、当該歪みが大きい場合、このような補正を行ったとしても、確実に歪みのない画像を得ることが困難である。しかしながら、上記の構成によれば、当該歪みの度合いを示す特徴量が所定範囲内にある場合にのみ、携帯端末装置が撮像画像データを送信する。そのため、画像出力装置に送信される撮像画像データは、上記歪みの度合いが所定範囲内であるため、歪みが相対的に小さいものとなる。その結果、画像出力装置において当該歪みを確実に補正することができる。
さらに、本発明の携帯端末装置において、上記撮像対象物は、文書画像が形成された矩形状の面を有しており、上記所定条件は、さらに以下の条件C、
条件C:撮像画像データにおける上記矩形状の面の傾き角度が所定範囲内である、
を含むことが好ましい。
撮像画像において矩形状の対象物が傾いている場合、画像出力装置から高解像度の画像を得たとしても、当該画像において文書までも傾いてしまう。しかしながら、上記の構成によれば、傾き角度が所定範囲内の場合にのみ、携帯端末装置が撮像画像データを送信する。ここで所定範囲とは、0°を含む範囲であり、例えば0±15°の範囲内である。このように設定することで、大きく傾いた画像を画像出力装置に送信することを防止することができる。
また、本発明の画像出力装置は、上記の携帯端末装置から上記所定数の撮像画像データを受信する受信部と、受信部が受信した所定数の撮像画像データに基づいて、当該撮像画像データの解像度よりも高解像度の高解像度画像データを生成する高解像度補正を行う補正処理部と、上記高解像度補正部により生成された高解像度画像データを出力する出力処理を実行する出力部とを備えることを特徴とする。
また、本発明の画像出力方法は、上記の記載の携帯端末装置から上記所定数の撮像画像データを受信する受信ステップと、受信した所定数の撮像画像データに基づいて、当該撮像画像データの解像度よりも高解像度の高解像度画像データを生成する高解像度補正を行う補正処理ステップと、生成された高解像度画像データを出力する出力処理を実行する出力ステップとを含むことを特徴とする。
上記の構成によれば、画像出力装置は、高解像度補正に適した所定数の撮像画像データを携帯端末装置から取得する。そのため、画像出力装置は、当該所定数の撮像画像データに基づいて、高解像度画像データを容易に生成することができる。また、高解像度画像データの品質も上げることができる。その結果、ユーザは、携帯端末装置で撮像した画像よりも高解像度の画像データを画像出力装置から容易に取得することができる。これにより、例えば、文書画像を含む撮像対象物を携帯端末装置で撮像しても、画像出力装置から当該文書画像の文字の判読性を向上させた画像を得ることができる。
さらに、本発明の画像出力装置において、上記撮像対象物は、文書画像が形成された矩形状の面を有しており、上記補正処理部は、上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる撮像画像データにおける上記矩形状の面の歪みを補正するとともに、上記高解像度補正を行うことが好ましい。
上記の構成によれば、ユーザは、撮像対象物に対して斜め方向から撮像した場合であっても、歪みのない画像を画像出力装置から容易に得ることができる。
さらに、本発明の画像出力装置において、上記撮像対象物は、文書画像が形成された矩形状の面を有しており、上記補正処理部は、上記撮像部による撮像画像データにおける上記矩形状の面のエッジが曲線状となるレンズ歪みを補正するとともに、上記高解像度補正を行うことが好ましい。
上記の構成によれば、ユーザは、レンズ歪みのない画像を画像出力装置から容易に得ることができる。
さらに、本発明の画像出力装置において、上記出力部は、上記高解像度画像データに対応する画像を記録用紙に形成する印刷処理を上記出力処理として実行することが好ましい。
上記の構成によれば、ユーザは、撮像画像よりも高解像度の画像の印刷物を画像出力装置から得ることができる。
さらに、本発明の画像出力装置において、上記出力部は、上記高解像度画像データを外部記憶装置に格納する格納処理を上記出力処理として実行することが好ましい。もしくは、上記出力部は、上記高解像度画像データを電子メールに添付して送信するメール送信処理を上記出力処理として実行することが好ましい。
上記の構成によれば、ユーザは、撮像画像よりも高解像度の画像データを画像出力装置から取得することができる。
さらに、本発明の画像出力装置において、上記撮像対象物は、文書画像を有しており、上記出力部は、上記高解像度画像データにおいて上記文書画像に対応する領域とそれ以外の領域とに分離し、各領域に対して異なる圧縮率で圧縮させた状態で上記高解像度画像データを出力することが好ましい。
上記の構成によれば、高解像度画像データのデータ容量を小さくすることができる。その結果、出力する際の通信に対する負荷を低減することができる。
さらに、本発明の画像出力装置において、上記撮像対象物は、文書画像を有しており、上記出力部は、上記高解像度画像データにおける上記文書画像に対応する領域の中から文字を抽出し、抽出した文字をテキストデータに変換し、当該テキストデータを上記高解像度画像データに付加して出力することが好ましい。
上記の構成によれば、ユーザは、テキストデータを用いることで、テキスト検索を容易に実行することができる。
また、本発明の撮像画像処理システムは、上記の携帯端末装置と、当該携帯端末装置から複数の画像データを受信する上記の画像出力装置とを備えることを特徴とする。
上記の構成によれば、ユーザは、携帯端末装置で撮像した撮像画像について、当該撮像画像の解像度よりも高解像度の画像を容易に画像出力装置から得ることができる。
なお、上記携帯端末装置および画像出力装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより携帯端末装置および画像出力装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明によれば、携帯端末装置にて撮像した画像を、文字の判読性などの解像度を向上させた状態で画像出力装置から出力させることができる。
図1は、本発明の撮像画像処理システムの撮像画像処理方法を示すフローチャートであって、(a)は携帯端末装置のフローを示し、(b)は画像出力装置のフローを示している。 図2は、本発明の撮像画像処理システムの構成を示す図である。 図3は、本発明の携帯端末装置の構成を示すブロック図である。 図4は、本発明の撮像画像処理方法における画像の傾き検出例を示している。 図5は、図4の傾き検出例における傾き角度θとその正接値を示している。 図6は、画像の幾何学的歪みの検出例を示している。 図7は、画像の対象物のエッジ検出処理例を示している。 図8は、画像のラスター方向のエッジ検出例を示している。 図9は、画像のズレ度合い検出例の1次微分フィルタ例を示している。 図10は、本発明の画像出力装置の構成を示すブロック図である。 図11は、画像のカラーバランス検出時のルックアップテーブルの一例を示している。 図12は、画像のレンズ歪みの補正例を示している。 図13は、画像の幾何学的歪みの補正例を示している。 図14は、画像の再構成画素値の決定例を示している。
以下、本発明の実施の形態について、詳細に説明する。
(1)撮像画像処理システムの全体構成
図2は、本発明に係る撮像画像処理システムの全体構成を示す図である。図2に示されるように、撮像画像処理システムは、カメラ付き携帯電話、デジタルスチルカメラなど、撮像手段を備えた携帯端末装置100、および、複合機、プリンタ(画像形成装置)などの画像出力装置200を備える。
携帯端末装置100は、ユーザによって携帯されるものである。ユーザは、様々な場面で携帯端末装置100により対象物を撮像することができる。ただし、携帯端末装置100で撮像された画像は上述したように解像度が低く、当該解像度で画像出力装置200により画像出力(例えば印刷)を行ったとしても細部まで認識できない場合がある。例えば、文書画像(文字など)が印刷された用紙やポスター、文書画像などが表示されている表示画面を撮像する場合において、文字が判別できないことが考えられる。本実施形態は、このような場合であっても、携帯端末装置100で撮像された画像の解像度よりも高い解像度を有する画像を得ることができるものである。
本実施形態において、携帯端末装置100は、撮像した画像の解像度よりも高い解像度を有する画像を画像出力装置200から得ることが可能な撮像モードである文書撮像モードの機能を有している。
なお、本実施形態では、文書画像が印刷された用紙やポスター、文書画像が表示されている表示画面(例えば、ディスプレイ画面やプロジェクターにより投影された画面)のような矩形状の撮像対象物を撮像し、撮像画像よりも高い解像度の画像を得ることを希望する場合に、ユーザが文書撮像モードを選択するものとする。
また、ユーザは、矩形状の撮像対象物である、文書画像が印刷された用紙やポスター、文書画像が表示されている表示画面などに対して、常に正面から撮像できるとは限らない。すなわち、ユーザは、撮像対象物における、文書画像が形成された平面の法線方向と、撮像手段の撮像方向とが一致しない状態で、斜め方向から撮像対象物を撮像する場合がある。この場合、撮像された画像において、撮像対象物に歪み(以下、幾何学的歪みという)が生じることになる。本実施形態では、上記文書撮像モードが選択された場合、このような幾何学的歪みも補正された状態で画像出力装置200が画像出力するように構成されている。
携帯端末装置100と画像出力装置200とは通信可能であり、携帯端末装置100は、撮像した画像データ(以下、撮像画像データという)を画像出力装置200に送信する。
画像出力装置200は、携帯端末装置100から受信した、同一の撮像対象物に対する複数の撮像画像データに基づいて、解像度を高める高解像度補正を行い、高解像度化された画像の出力処理を行うものである。複数の撮像画像データを用いて高解像度補正する手法としては、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008) に挙げられている方法を用いることができる。
画像出力装置200で実行される出力処理としては、高解像度化された撮像画像データに基づいた画像の印刷処理、サーバやUSBメモリなどの記憶装置へ高解像度化された撮像画像データを格納するファイリング処理、電子メールに高解像度化された撮像画像データを添付して送信するメール送信処理などがある。
なお、携帯端末装置100と画像出力装置200との通信方式としては、図2において符号Aで示されるように、IrSimpleなどの赤外線通信規格のいずれかに基づく無線通信方式や、符号Bで示されるように、Felica(登録商標)のような非接触無線通信により、携帯端末装置100から中継装置300に一旦撮像画像データを送り、その後、例えばBluetooth(登録商標)のような無線通信を用いて、当該中継装置300から画像出力装置200へデータを転送する方式がある。なお、携帯端末装置100と画像出力装置200との間の通信方式については、これらに限定されることなく、公知の通信方法を用いたものを適用することができる。
(2)携帯端末装置の構成
まず、図3〜9に基づいて、本実施形態に係る携帯端末装置100について説明する。
図3は、携帯端末装置100の構成を示すブロック図である。図3に示されるように、携帯端末装置100は、撮像部101、撮像画像判定部102、画像処理部103、通信部(送信部)104、表示部(通知部)105、入力部106、記憶媒体アクセス部107、記憶部108、制御部(送信部、通知部)109を備えている。
撮像部101は、CCDセンサ、CMOSセンサを用いて、撮像対象物の撮像を行うものである。撮像部101は、予め設定された解像度で撮像対象物の撮像を行う。また、撮像部101は、ユーザにより文書撮像モードが選択された場合、1回シャッターの押下により、撮像対象物について複数回(例えば、2〜15)連続して撮像する。通常、連続して撮像された画像は、ほぼ同じ画像であるが、手ぶれ等によって微少量だけずれることになる。
撮像画像判定部102は、文書撮像モードが選択されている際に、撮像部101で撮像された複数の撮像画像が、画像出力装置200において高解像度補正を実行するための条件を含む処理実行条件を満たしているか否かを判定するものである。撮像画像判定部102は、その判定結果を制御部109に出力する。撮像画像判定部102における具体的な処理については後述する。
画像処理部103は、撮像部101で撮像された画像のデータ(撮像画像データ)に対して、少なくともA/D変換処理を行うものである。
通信部104は、USB(Universal Serial Bus)1.1またはUSB2.0の規格に基づく、シリアル転送/パラレル転送、無線データ通信機能を有するものである。通信部104は、撮像部101により撮像され、画像処理部103にてA/D変換処理が施された複数の撮像画像データを画像出力装置200に送信する。ただし、通信部104は、撮像画像判定部102により処理実行条件を満たしていると判定された撮像画像データのみを送信する。
表示部105は、例えば液晶ディスプレイなどにより構成されるものである。また,入力部106は、複数のボタンを有しており、ユーザがデータの入力を行うためのものである。
記憶媒体アクセス部107は、携帯端末装置100の各処理を行うためのプログラムが記録された記録媒体から、プログラムを読み出すものである。
また、記憶部108は、携帯端末装置100の各処理を行うためのプログラム、携帯端末装置の機種情報、ユーザ情報や処理を行う際に必要なデータを格納するものである。なお、ユーザ情報とは、携帯端末装置のユーザを識別する情報であり、例えば、ユーザIDおよびパスワードなどである。
制御部109は、携帯端末装置100の各部の制御を行うものである。具体的には、制御部109は、入力部106に文書撮像モードを選択する旨の指示が入力された場合、解像度変換の倍率の入力を促す画面を表示部105に表示させる。そして、制御部109は、入力部106に入力された倍率(例えば、2倍、4倍)に応じて、撮像部101が連続撮像する回数、および、撮像画像判定部102で用いる処理実行条件の一部を決定する。なお、制御部109は、記憶部108に予め格納された、倍率と撮像回数および処理実行条件の一部とを対応付けた情報に基づいて決定する。
また、制御部109は、入力部106に文書撮像モードを選択する旨の指示が入力された場合、画像出力装置200での出力処理の種類(印刷処理、ファイリング処理、メール送信処理など)の選択指示、ならびに、選択した出力処理を実行するための設定条件(印刷枚数などの印刷条件、ファイリング先のサーバのアドレス、メールの送信先アドレスなど)の入力を促す画面を表示部105に表示する。そして、制御部109は、入力部106から、出力処理の種類および出力処理の設定条件を示す出力処理情報を取得する。
そして、制御部109は、撮像画像判定部102により処理実行条件を満たしていると判定された撮像画像データに、ファイルネーム、記憶部108に格納された携帯端末装置100の機種情報およびユーザ情報、ならびに、出力処理情報を付け、通信部104に対して画像出力装置200への送信処理を実行させる。
(3)撮像画像判定部の処理について
次に、携帯端末装置100の撮像画像判定部102における具体的な判定処理について説明する。
(3−1)傾きの判定
上述したように、用紙やポスター、表示画面のような矩形状の撮像対象物を撮像し、高い解像度の画像を得ることを希望する場合に、ユーザが文書撮像モードを選択する。そのため、撮像画像判定部102は、撮像対象物が矩形状であると仮定して、撮像画像データにおいて、撮像対象物のエッジを検出することで撮像画像データにおける撮像対象物の傾きを検出する。なお、撮像画像データの中の矩形状の撮像対象物のエッジ上の画素を検出する手法としては従来知られている手法を用いることができる。また、背景の中のエッジを撮像対象物のエッジとして誤判定することを防止するために、所定長さ以上のエッジのみを撮像対象物のエッジとして検出してもよい。この場合、所定長さとは、例えば、撮像画像データで示される画像の端の辺の長さの80%程度の長さを設定すればよい。または、このようにして検出されたエッジの中から、撮像対象物のエッジのものをユーザに選択してもらってもよい。このような検出方法としては、例えば、特開2006−237757に記載の技術を用いることができる。
そして、撮像画像判定部102は、検出された撮像対象物のエッジ上の2点を選択する。例えば、図4に示されるように、撮像画像データの中心から左右それぞれ横方向にw/2だけ離れた2点11・12を選択する。次に、選択された2点11・12の各々と、撮像画像データの端辺との距離d,dを求め、撮像画像における撮像対象物の傾きを求めることができる。図4のような場合、傾き角度をθとすると、 tanθ=(d−d)/wとなる。そこで、撮像画像判定部102は、(d−d)/wの値を算出し、この値に相当する角度θをあらかじめ作成済みのテーブル(図5参照)などより読み取る。
そして、撮像画像判定部102は、検出した角度θが所定範囲内(例えば、−30°〜+30°)であるか否かを判定し、その判定結果を制御部109に出力する。ここで、角度θが所定範囲内であることが処理実行条件の一つとなる。
(3−2)幾何学的歪みの判定
幾何学的歪みとは、上述したように、撮像対象物における文書画像が形成された平面の法線方向とは異なる斜め方向から撮像対象物を撮像した場合に、撮像画像の中で撮像対象物が矩形状から歪んだ形状を有することである。例えば、用紙の法線方向に対して用紙の左下方向から斜めに撮像した場合、図6に示されるように、撮像対象物は、歪んだ四角形となる。
本実施形態では、後述するように、画像出力装置200がこのような幾何学的歪みを補正する機能を有している。ただし、幾何学的歪みの度合いが大きい場合、補正したとしても、判読性がそれほど向上しない。そこで、本実施形態では、撮像画像判定部102は、幾何学的歪みの度合いを示す特徴量を検出し、当該特徴量が所定範囲内であるか否かを判定する。
本実施形態では、必ずしも画角の中心付近に撮像対象物の各辺のエッジが存在するとは限らないので、ある一定間隔ですべての辺からのエッジを抽出し、各エッジを表す線分を求めて、さらにこれらの交点を算出して、撮像対象物の領域とすれば良い。
まず、撮像画像判定部102は、撮像画像データについて、ラスター走査を行う。ここで、図6に示されるように、ラスター走査の順方向をX方向、X方向に垂直な方向をY方向とする。また、撮像画像において左上隅を原点とする。
1ライン分走査を行い、エッジが存在しなければ、撮像画像判定部102は、Y方向に所定量だけずらした次のラインについて走査する。なお、ライン間の間隔は一定であればよく、1画素である必要はない。
そして、撮像画像判定部102は、ラスター走査において、最初にエッジを検出したラインをL(1ライン目)とし、図7に示すように、順方向で最初のエッジと判定された点の座標を第1群に格納し、同じライン上で2つ目のエッジと判定された点の座標を第2群に分類する。引き続き次のラインの走査を行い、エッジ検知する。そして、それぞれのラインLについて、順方向で1番目に撮像対象物のエッジと判定された点と、2番目に撮像対象物のエッジと判定された点とのX座標値の差分(X座標の距離d)を求め下記のように判定を行う。
なお、ラインLにおける最初のエッジのX座標をXi1(第1群に分類されているX座標)、2つ目のエッジのX座標をXi2(第2群に分類されているX座標)とする。検出方法は以下のようである。
(a)1ライン(L)目の座標X11およびX12については変更しない。
(b)2ライン目以降のiライン目については、座標間の距離di1(=Xi1−X(i−1)1)およびdi2(同様)を算出する。以下、di1に関して述べるため添え字の1を省略するが、di2も同様である。
(c)3ライン目以降のiライン目は、dd=abs{(d)−di−1}を算出する。dd≦th(≒0に近い小さな数値)であれば、座標Xiは同じ群に分類する。そうでない場合(dd>th)は、別の群(第3群または第4群)に分類する。
(d)初期処理としてi=4のときのみ、Xの群を確定させるための処理を行う。以下のようにする。
i)dd≦th かつ dd≦th → X:同群
ii)dd>th かつ dd≦th → X:別群
iii)dd≦th かつ dd>th → X:同群
iv)dd>th かつ dd>th → X:同群
一度、別群(第3群または第4群)に遷移した場合は、増減の確認はする必要はない。
このような処理を画像全体に行って、各群に属するエッジ点を抽出する。そして、群ごとに、当該群に属するエッジ点の座標を最小2乗法などで直線近似し、当該群に属するエッジ点に近似した直線を求める。当該直線は、撮像対象物の辺に相当することとなる。
図8は、上記のような処理によって、ラスター走査によってエッジ点を抽出し、4つの群に分類したときの図である。図において、丸印が第1群に属するエッジ点、四角印が第2群に属するエッジ点、三角印が第3群に属するエッジ点、星印が第4群に属するエッジ点を示し、最小2乗法により求められた、各群に属するエッジ点の近似直線を点線で示す。
そして、4つの群について求めた直線の交点(図中、交点1〜4としている)を求め、4つの直線で囲まれた領域を撮像対象物の領域として特定することができる。
さらに、上記の分類処理を90度回転させた画像に対して行っても良い。こうすることで、理想的に画像内の水平方向・垂直方向に平行に配置されたような原稿のエッジも抽出することが可能となる。すなわち、ラスター走査することで、回転前の画像では、垂直方向のエッジが検出できる。一方、回転後の画像では、回転前に水平方向であったエッジ(回転後には水平方向であるエッジ)を検出することができる。これにより、垂直方向・水平方向に平行なエッジも抽出することができる。回転前で十分な情報量(各群で例えば3点以上の交点)があれば、回転前の情報のみを用いればよいし、いずれかの群の交点が1点未満の場合、当然直線の式は求められないため、回転後の交点を用いればよい。
あるいは、求まった交点座標のみを再度座標変換して元に戻し、それぞれの群の分布する領域から、対応する群を求めて、交点情報を統合し、直線の式を求めても良い。すなわち、回転前の画像から求められた交点座標と、回転後の画像から求められた交点を逆回転して得られた交点座標とから、同一の群に属する好転座標を統合して直線の方程式を求めればよい。
なお、エッジ点の抽出方法としては、少なくとも1以上の画素幅の小ウィンド内での、画素値をそのまま比較(2以上の幅の場合は和・平均値を比較)していき、隣接する値の差分が一定以上の場合、エッジ点であると判定すればよい。なお、背景や撮像対象物内のテキストのエッジなどを誤って検出することを防止するために、所定長さ以上のエッジのみを撮像対象物のエッジとして検出してもよい。この場合、所定長さとは、例えば、撮像画像データで示される画像の端の辺の長さの80%程度の長さを設定すればよい。または、このようにして検出されたエッジの中から、撮像対象物のエッジのものをユーザに選択してもらってもよい。このような検出方法としては、例えば、特開2006−237757に記載の技術を用いることができる。もしくは、それぞれの座標群の評価を行ったり、線分検知のための処理(ハフ変換など)を行ったりすることでも防止できる。さらに、縮小画像を用いた処理をプレ処理として行うことで、テキストや細かなテクスチャのエッジを誤って検出することを防止することができる。
そして、撮像画像判定部102は、以上のようにして4つの直線及びそれらの交点を求めると、当該4つの直線で形成される四角形の対辺の長さの比を計算する。当該長さの比は、上記交点の座標から容易に求まる。なお、対辺は2組あるので、撮像画像判定部102は、当該2組の各々について長さの比を求める。
ここで、対辺の長さの比は、矩形状の撮像対象物を正面から撮像した場合には撮像画像の中の撮像対象物も矩形状であるため、1となる。一方、斜め方向から撮像した場合には、撮像画像の中の撮像対象物の形状は歪んだ四角形となるため、1とは異なる値となる。そして、撮像方向と、撮像対象物の文書画像が形成された平面の法線方向とのなす角度が大きくなるほど、当該比の値と1との差が大きくなる。そのため、対辺の長さの比は、幾何学的歪みの度合いを示す特徴量の一つであるといえる。
その後、撮像画像判定部102は、求めた二つの比の両方が所定範囲内(例えば、0.5〜2)であるか否かを判定し、その判定結果を制御部109に出力する。ここで、所定範囲は、画像出力装置200において補正可能な範囲として予め定められたものであり、記憶部108に格納されている。また、二つの比の両方が所定範囲内(例えば、0.5〜2)であることが処理実行条件の一つとなる。
なお、撮像画像判定部102は、幾何学的歪みの度合いを示す別の特徴量として、上記のようにして検出された4つの交点を含む2つの直線のなす角度などを用いてもよい。
(3−3)複数枚の画像のズレ量の判定
上述したように、画像出力装置200は、同一の撮像対象物の複数の撮像画像データに基づいて、高解像度補正を実行する。当該高解像度補正を実行するためには、解像度変換の倍率に応じた所定数の画像データが、所定量だけずれている必要がある。そこで、本実施形態では、撮像画像判定部102は、撮像部101が撮像した複数の撮像画像データの中に、画像出力装置200で高解像度補正を実行するために必要な、所定量だけずれた所定数の撮像画像データが含まれるか否かを判定する。
なお、文字の判読性を挙げるような高解像度補正のために必要なズレとは、対象とする画像データの一画素未満(小数点)のズレを指す。すなわち、小数点以下(1画素未満)の値、例えば、0.3〜0.7などのズレが重要である。整数部分のズレは高解像度補正には考慮されない。例えば、1.3画素、2.3画素などの1画素未満のズレを含むような場合、複数の画像に基づいた高解像度補正を実行することができるが、1画素、2画素などの1画素未満のズレを含まない場合、高解像度補正を実行することができない。
例えば、変換倍率が2倍の場合、高解像度補正に必要な画像データの数は2であり、2つの画像データのずれ量としては画素単位で小数点以下0.3〜0.7であることが好ましい。そのため、記憶部108には、解像度変換の倍率「2倍」と、撮像回数「2」および処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」とを対応付けた情報が予め格納されており、制御部109は、当該情報に基づいて、撮像部101に対して2回連続して撮像させ、撮像画像判定部102に対して、処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」に従った判定を実行させるものとする。
また、変換倍率が4倍である場合、高解像度補正に必要な画像データの数は4であり、その内の一つの画像データを基準画像データとしたとき、当該基準画像データと残りの3つの画像データとのずれ量がそれぞれ画素単位で小数点以下0.2〜0.3、0.4〜0.6、0.7〜0.8であることが好ましい。そのため、記憶部108は、解像度変換の倍率「4倍」と、撮像回数「4」および処理実行条件「必要画像データ数:4、ずれ量:0.2〜0.3、0.4〜0.6、0.7〜0.8」とを対応付けた情報を記憶している。
なお、以下では、説明を簡略化するため、解像度変換の倍率として2倍が選択された場合について述べる。
まず、撮像画像判定部102は、撮像画像の任意の一つを選択し、当該撮像画像(以下、第1の撮像画像という)について、上記幾何学的歪みの判定の際に求めた撮像対象物の領域の中からズレ検出用部分領域を選択する。ここで、ズレ検出用部分領域は、第1の撮像画像と残りの撮像画像(以下、第2の撮像画像という)との間のズレ量を求めるために用いるものであるため、当該ズレ検出用部分領域内で画素値の変化が大きいもの(明確なパターンが存在するもの)が好ましい。そこで、撮像画像判定部102は、以下のような方法によってズレ検出用部分領域を抽出する。
撮像画像判定部102は、撮像対象物の領域の重心位置に存在する画素を特定し、当該画素を注目画素とする。そして、注目画素を含むn×n画素の領域を選定する。選定した領域について、以下の選定要件を満たすか否か判断し、満たす場合には、当該領域をズレ検出用部分領域とする。一方、満たさない場合には、所定のオフセット量に基づいて領域を移動させ、移動後の領域について同じ判断を行う。このようにして、ズレ検出用部分領域を抽出する。
ここで、選定要件としては、例えば、以下二つが挙げられる。
一つとしては、領域内の分散に準じた値を用いるものである。注目画素近傍のn×n画素の領域に対して画素値をP(x)とすると部分領域の分散値Variance(x)は、下記式(1)で表される。この分散値Variance(x)の値が所定閾値以上あることを選定要件とする。また簡易化のために本式の分子のみを考えても良い。
Figure 0004758493
また一つとしては、注目画素近傍のn×n画素の領域に対して、1次微分フィルタのようなエッジ抽出フィルタを掛けて、2値化し、総和を見る。図9は1次微分フィルタ例を示し、この場合も、総和がある所定閾値以上(例えば、部分領域画素数の5%以上など)あることを選定要件とすればよい。
次に、このようにして求められた、第1の撮像画像のズレ検出用部分画像A(n×n)に対し、第2の撮像画像の中から、中心がほぼ同じ位置のズレ検出用部分画像B(m×m)(m>n)として切り出す。この切り出し方法は、第1の撮像画像におけるズレ検出用部分画像Aの中心画素の座標と、第2の撮像画像におけるズレ検出用部分画像Bの中心画素の座標とが一致するように、切り出す。
その後、切り出されたズレ検出用部分画像B中においてズレ検出用部分画像Aに最も適合する領域をサブピクセル精度で求める。その手法としては、ズレ検出用部分画像Aをテンプレートとした正規化相関パターンマッチングが挙げられる。
正規化相関パターマッチングの例として、既知であるところの正規化相関式を用いて相関を算出する。一般的にN画素からなる2つのパターンInput(I)とTarget(T)の相関式は、下記式(2)と表すことができる。ここで、α、β、γはそれぞれ下記のように表せる。
Figure 0004758493
Figure 0004758493
例えば、n=5、m=7の場合、ズレ検出用部分画像B(m×m)のなかのズレ検出用部分画像Aと同サイズの領域(n×n)ごとに上記相関式を演算すると、結果として3×3の相関値Mapが生成される。この相関値Mapを用いて、フィットする2次曲面を求める。2次曲面の求め方としては、例えば、S(x,y)=a*x*x+b*x*y+c*y*y+d*x+e*y+fとして、9点のうち相関値の高い6点を選び、連立方程式を解いて各係数を求める。この関数の極値(=最大値)の座標値(x、yの両方)の小数点以下の値が所定範囲(ここでは、0.3〜0.7)であれば、処理実行条件「必要画像データ数:2、ずれ量:0.3〜0.7」を満たすものと判定する。
なお、極値の求め方は、上記2次式を偏微分し、それぞれが0である点の座標を求めればよい。このとき、実際には各係数(a〜f)を求める必要はないので、直接相関値(S〜S)を用いたほうが効率的である。求めるべき式(3)は以下のようになる。ここで、原点は着目するウィンド基準となる。
Figure 0004758493
なお、このようなサブピクセル精度の位置ズレ確認を少なくとも一か所にて行うが、数か所で行うことが望ましい。
そして、撮像画像判定部102は、処理実行条件を満たすか否かの判定結果を制御部109に出力する。
(4)ユーザへの通知に関して
撮像画像判定部102から判定結果を受けた制御部109は、その判定結果に応じて、再撮像を促すメッセージを表示部105に表示させる。
例えば、撮像画像判定部102から傾き角度θが所定範囲内でない旨の判定結果を受けた場合、制御部109は、撮像対象物が傾かないようにして再度撮像することを促すメッセージを表示部105に表示させる。
また、幾何学的歪みの度合いを示す特徴量(ここでは、撮像画像における撮像対象物の対辺の長さの比)が所定範囲内でない旨の判定結果を受けた場合、制御部109は、撮像対象物における文書画像が形成された平面の法線方向から再度撮像することを促すメッセージを表示部105に表示させる。
さらに、所定量だけずれた撮像画像が所定数ない旨の判定結果を受けた場合、制御部109は、例えば「この画像は処理できない可能性があります。もう一度撮影し直し下さい。」などの、再度撮像を促すメッセージを表示部105に表示し、新たに画像を得るようにする。その後、新たに撮像した複数の撮像画像について、撮像画像判定部102が再度判定処理を行い、全ての処理実行条件を満たすと判定されたときに、当該撮像画像を後段の処理に用いる。もしくは、前に撮像した撮像画像および再度撮像された撮像画像の組合せに対して、撮像画像判定部102が再度判定処理を行い、全ての処理実行条件を満たす撮像画像を後段の処理に用いてもよい。
(5)画像出力装置の構成
次に、図10〜13に基づいて、本実施形態に係る画像出力装置200の構成について説明する。本実施形態において、画像出力装置200は、スキャナ、プリンタ、複写機等の機能を備えた複合機である。
図10は、画像出力装置200の構成を示すブロック図である。画像出力装置200は、画像読取部201、画像処理部(補正処理部)202、認証部203、画像形成部(出力部)204、表示部205、入力部206、第1通信部(受信部)207、第2通信部(出力部)208、記録媒体アクセス部209、記憶部210、および制御部(出力部)212を備えている。
画像読取部201は、原稿を読み取るものであり、CCD(Charge Coupled Device)を備えたスキャナ部を有し、原稿から反射してきた光を、RGBに色分解された電気信号(アナログの画像信号)に変換し、この電気信号を出力するものである。
画像処理部202は、画像データに対して、所定の画像処理を行うものである。本実施形態では、画像処理部202は、携帯端末装置から送信された撮像画像データに対して、高解像度補正などを含む画像処理を行う。画像処理部202が撮像画像データに対して行う画像処理の詳細については後述する。
認証部203は、携帯端末装置100から受信した撮像画像データの出力処理を行う際に、ユーザ認証を行うものである。具体的には、認証部203は、携帯端末装置100から受信したユーザ情報と、入力部206に入力されたユーザ情報(ユーザIDおよびパスワード)とを照合してユーザ認証を行う。認証部203は、認証結果を制御部212に送る。
画像形成部204は、例えば電子写真方式やインクジェット方式を用いて、紙などの記録用紙上に画像を形成するものである。すなわち、画像形成部204は、出力処理の一つである印刷処理を実行するものである。
表示部205は、例えば液晶ディスプレイ等より構成される。また、入力部206は、例えば液晶ディスプレイのタッチパネルやボタンを押すことなどによりデータの入力を行うためのものである。
第1通信部207は、USB1.1またはUSB2.0の規格に基づく、シリアル転送やパラレル転送、無線データ通信機能を有するものである。第1通信部207は、携帯端末装置100から、ファイルネーム、携帯端末装置100の機種情報、ユーザ情報および出力処理情報が付加された撮像画像データを受信する。
第2通信部208は、(a)無線LANの規格である、IEEE802.11a、IEEE802.11bおよびIEEE802.11gのいずれかに基づく無線技術を利用したデータ通信、(b)イーサネット(登録商標)を利用した通信用インターフェースの機能を有し、LANケーブルを介した、ネットワークとのデータ通信、(c)無線通信規格である、IEEE802.15.1(いわゆるBluetooth(登録商標))やIrSimpleなどの赤外線通信規格、Felica(登録商標)などの通信方式のいずれかに基づく無線技術を利用したデータ通信、の機能を有するものである。
第2通信部208は、出力処理として、高解像度補正が施された撮像画像データをサーバに格納するファイリング処理、もしくは、高解像度補正が施された撮像画像データを添付したメールを送信するメール送信処理を実行する。
記録媒体アクセス部209は、プログラムが記録された記録媒体から、プログラムを読み出すものである。記憶部210は、上記各部が処理を実行するためのプログラムを記憶するためのものである。
制御部212は、画像出力装置200の各部の制御を行うものである。具体的には、制御部212は、第1通信部207が携帯端末装置100から複数の撮像画像データを受信すると、当該複数の撮像画像データを画像処理部202に出力し、画像処理を実行させる。また、制御部212は、画像データに付けられているユーザ情報を認証部203に出力し、認証部203に認証処理を実行させる。制御部212は、認証部203から認証成功の認証結果を受けると、撮像画像データに付けられていた出力処理情報に従って処理を実行させる。すなわち、出力処理情報が印刷処理を示している場合、制御部212は、画像処理部202によって画像処理が施された撮像画像データに基づいた印刷を画像形成部204に実行させる。また、出力処理情報がファイリング処理またはメール送信処理を示している場合、制御部212は、画像処理部202によって画像処理が施された撮像画像データに基づいたファイリング処理またはメール送信処理を第2通信部208に実行させる。
(6)画像処理部における画像処理について
次に、画像処理部202が実行する画像処理の詳細について説明する。なお、画像処理部202は、画像読取部201が読み取った画像データに対しても画像処理を行うが、ここでは、携帯端末装置100から受信した複数の撮像画像データに対する画像処理の内容について説明する。
本実施形態において、画像処理部202は、携帯端末装置100から送信されてきた撮像画像データに対して、幾何学的歪みの補正・レンズ歪みの補正、および、高解像度補正を行う。以下、各補正の処理について説明する。
(6−1)幾何学的歪みの補正・レンズ歪みの補正
画像処理部202は、撮像画像判定部102における処理と同様にして、撮像画像における撮像対象物のエッジ上の点をラスター走査によって順次検出する。そして、画像処理部202は、検出されたエッジ上の点を曲線近似し、その曲線の式からレンズひずみ補正を行う。
具体的には、図12の実線で示されるように、画像処理部202は、検出した撮像対象物のエッジ点を検出し、撮像画像判定部102と同様に、各エッジ点を撮像対象物の4辺に対応する4つの群に分類する。そして、各群に属するエッジ点に対して2次曲線近似を行う。このようにして4つの群に対して求めた2次曲線は、撮像対象物の4辺に対応する。また、画像処理部202は、4つの2次曲線で囲まれる領域の角部に相当する、4つの2次曲線の交点を求める。次に、画像処理部202は、各辺に対して求めた2次曲線に外接し、かつ、4つの交点を結んだ四角形(図12において点線で示される)と合同な外接四角形(図12において1点鎖線で示される)を求める。そして、画像処理部202は、このようにして求めた外接四角形が補正後の対象物のエッジ画素の位置となるように、撮像画像における撮像対象物の領域内の画素位置を変換する。この変換は、基準点(例えば撮像対象物の領域の重心点)からのベクトルを基に計算すればよい。これにより、携帯端末装置100の撮像部101によるレンズ歪みを補正することができる。
また、画像処理部202は、幾何学的歪みの補正を以下のようにして実行する。画像処理部202は、例えば、図13に示すように、上記のようにして求めた外接四角形を対象物のアスペクト比(例えば、ビジネス文書出用いられているA判B判なら7:10であるなど)に合わせ同様に写像変換すればよい。当該写像変換としては公知の技術を用いることができる。なお、画像処理部202は、予め記憶部210に記憶されているアスペクト比に合うように変換してもよいし、入力部206に入力されたアスペクト比に合うように変換してもよい。
なお、幾何学的歪みの補正およびレンズ歪みの補正の方法としては、上記の方法に限定されるものではなく公知の技術を用いることができる。
(6−2)複数の画像データを用いた高解像度補正
上述したように、画像出力装置200は、携帯端末装置100から、同一の撮像対象物に対して撮像された複数の撮像画像データを受信する。そして、画像処理部202は、当該複数の撮像画像データに基づいて高解像度補正を行う。
複数の画像データからの高解像度画像作成方法に関しては、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008)にいくつかの方法が紹介されている。一般的には、高解像度補正は、複数の画像の位置合わせ処理と再構成処理により成立する。本実施形態では、位置合わせ処理の例として、上記(3−3)記載の正規化相関パターマッチングの方法を適用する。すなわち、上記S(x,y)が極大値を示すズレ量だけずらすことにより、複数の画像の位置合せを行うことができる。
次に、画像処理部202は、再構成処理を行う。すなわち、画像処理部202は、解像度変換後の倍率に応じた画素数を有する再構成画像データを作成する。ただし、画像サイズは、撮像画像のサイズと同一とする。そして、画像処理部202は、再構成画像データの各画素の画素値を以下のようにして決定する。すなわち、画像処理部202は、再構成画像データにおける各画素(再構成画素)について、当該再構成画素の近傍となる撮像画像の画素(撮像画素)を複数の撮像画像の中から決定し、一般的な補間方法(線形補間やバイキュービック補間など)で補間を行う。
具体的には、図14に示されるように、着目する再構成画素近傍の撮像画素、例えば撮像画素の格子を結ぶ線(図の点線)が最も近距離である2点を横方向・縦方向のそれぞれで選択する。ここでは、横方向での最も近距離である2点は、1枚目の撮像画像の撮像画素1−2(画素値:Vi1−2:以下同様)および撮像画素1−4であり、縦方向での最も近距離である2点は、2枚目の撮像画像の撮像画素2−1および撮像画素2−2であったとする。なお、再構成画素近傍の撮像画素を選択する際には、上記幾何学的歪みの補正・レンズ歪みの補正が実行された複数の撮像画像データの中から選択するものとする。これにより、幾何学的歪み・レンズ歪みの補正がされた状態で高解像度補正を行うことができる。もしくは、補正後の座標の値を計算する際に、基となる複数の撮像画像の該当する幾何学補正・レンズ歪みの補正を考慮した座標の値を基に求めてもよい。つまり、幾何学補正・レンズ歪みの補正値のみ算出し、再構成処理を行った後に、当該補正値により座標変換を行ってよい。
そして、横方向および縦方向のそれぞれについて選択した2点を結ぶ線分に垂直であり、かつ着目する再構成画素の点を含む直線と当該線分との交点を求める。図14に示されるように、当該交点が2つの線分のぞれぞれについてt:1−t、u:1−uで内分している場合、画像処理部202は、着目する再構成画素の画素値Vを下記式4に基づいて求めればよい。この場合は、線形補間を行ったことになる。そして、全ての再構成画素について同様にして画素値を求め、高解像度化された再構成画像データを生成することができる。
Figure 0004758493
なお、補間方法として別の手法を用いても良い。また、映像情報メディア学会誌Vol.62、No.3、pp.337〜342(2008)に紹介されている別の方法を用いてもよい。例えば、MAP(Maximum A Posteriori)法のような、先ず推定に基づく事後確率に対応する評価関数を最小化することで求める手法を用いても良い。
(7)撮像画像処理システムの画像処理方法
以下、図1に基づいて、撮像画像処理システムの処理の流れについて説明する。なお、図1において、(a)は携帯端末装置100の処理フローを示し、(b)は画像出力装置200の処理フローを示している。
まず、携帯端末装置100は、撮像モードの選択受付を行う。ここで、ユーザは、文書画像を含む用紙や表示画面など矩形状の撮像対象物を撮像し、撮像画像を画像出力装置200により高解像度化して出力することを希望する場合、文書撮像モードを選択する。
文書撮像モードの選択入力を受け付けた携帯端末装置100では、制御部109は、高解像度補正を行う際の解像度変換の倍率の入力を促す画面を表示部105に表示し、当該倍率を入力部106から取得する。制御部109は、取得した倍率に応じて、撮像部101における撮像回数、撮像画像判定部102における処理実行条件の一部を決定する。また、制御部109は、出力処理の種類および出力処理のための設定条件の入力を促す画面を表示部105に表示し、入力部106から出力処理情報を取得する。
そして、撮像部101は、シャッターが押下されたことを検知すると、制御部109にて設定された撮像回数だけ連続して撮像する(S10)。
次に、画像処理部103は、撮像した画像のデータに対して少なくともA/D変換処理を行う。その後、A/D変換処理された複数の撮像画像データに対して、撮像画像判定部102は、処理実行条件を満たすか否かを判定する(S11)。なお、詳しい判定方法、判定項目などは、例えば上記(3−1)〜(3−3)で説明したとおりである。
撮像画像判定部102が処理実行条件を満たさないと判定した場合(S11でNO)、制御部109は、表示部105に再撮像の旨を示すメッセージなどを表示して、ユーザに通知する(S12)。再撮像した画像であっても、上述した判定項目などを満足しない場合、携帯端末装置100はステップS10〜S12を繰り返して行う。
一方、撮像画像判定部102が処理実行条件を満たすと判定した場合(S11でYES)、制御部109は、処理実行条件を満たす複数の撮像画像データにファイルネームを付ける(S13)。なお、制御部109は、例えば、撮像日時に従った連続番号など各撮像画像データについて異なるファイルネームを自動的に付けても良いし、入力部106に入力されたファイルネームを付けてもよい。その後、制御部109は、当該画像データを、記憶部108に格納されている携帯端末装置100の機種情報、ユーザ情報、および出力処理情報と一緒に通信部104に転送する。そして、通信部104は、これらの情報を画像出力装置200に送信する(S14)。
なお、制御部109は、ファイルネームがつけられた画像データを、記憶部108、あるいはメモリカードに一時保存して、ユーザの要求によって、上記携帯端末装置100の機種情報、ユーザ情報、および出力処理情報と一緒に通信部104に転送し、さらに画像出力装置200に送信してもよい。
次に、画像出力装置200の第1通信部207は、携帯端末装置100からの複数の撮像画像データ、機種情報、ユーザ情報および出力処理情報を受信する(S20)。受信後、画像処理部202は、例えば上記(6−1)に説明したとおり、幾何学的歪みの補正・レンズ歪みの補正を行う(S21)。さらに、画像処理部202は、例えば上記(6−2)に説明したとおり、複数の撮像画像データに基づいて高解像度補正を行う(S22)。その後、制御部212は、画像処理部202で処理された撮像画像データを、記憶部210に格納する(S23)。
次に、制御部212は、撮像画像データの出力指示が入力部206に入力されたか否かを判定する(S24)。出力指示の入力がない場合(S24でNO)、出力指示が入力されるまで待機する。
一方、出力指示がある場合(S24でYES)、認証部203は、ユーザ情報(例えばユーザIDおよびパスワード)の入力を促す画面を表示部205に表示させ、ユーザ情報を入力部206から取得する。そして、認証部203は、ユーザ認証を行う(S25)。なお、認証部203は、画像出力装置200に設けられた非接触ICカードのリーダ/ライターを用いて、ユーザが所持する非接触ICカードからユーザ情報を取得してもよい。。
ユーザ認証を行う際、認証部203は、入力されたユーザ情報と携帯端末装置100から受信したユーザ情報とを対照して、一致するユーザ情報が存在するか否か判定する(S26)。そして、入力されたユーザ情報と一致するユーザ情報を携帯端末装置100から受信している場合(S26でYES)、制御部212は、携帯端末装置100から受信したい出力処理情報に従って出力処理を実行させる(S27)。例えば、出力処理情報が印刷処理を示している場合、制御部212は、画像形成部204に対して処理実行指示を出力する。その後、処理を終了する。
一方、入力されたユーザ情報が、携帯端末装置100から受信したユーザ情報と一致していない場合(S26でNO)、認証部203は、認証回数が所定回数以上であるか判定する(S28)。そして、認証回数が所定回数以上でない場合(S28でNO)、S25,S26の処理を繰り返して行う。認証回数が所定回数以上である場合(S28でYES)、出力せずにフローを終了する。
以上のように、本実施形態によれば、携帯端末装置100で撮像した撮像画像を高解像度補正した状態で画像出力装置200で出力させることができる。その結果、文字の判読性を向上させることができる。そのため、原稿用紙を画像出力装置200まで持っていくことが困難な場合であっても、当該原稿用紙を撮像することで、当該原稿用紙の画像を高解像度で得ることができる。また、プロジェクターなどで表示された映像画面についても携帯端末装置100で撮像することで、後に画像出力装置200から高解像度の画像を得ることができる。
(8)変形例
本発明の撮像画像処理システムは、上記の実施形態に限定されることがなく、様々な変更が可能である。以下、変形形態の一例について説明する。
(8−1)撮像回数について
上記の説明では、携帯端末装置100において、制御部109は、高解像度補正のために必要な撮像画像の数だけ撮像部101に撮像させるものとした。すなわち、制御部109は、撮像回数と処理実行条件の中の撮像画像データの必要数とを同じ値に設定した。しかしながら、制御部109は、撮像回数として、高解像度補正のための必要数よりも大きな値を設定してもよい。例えば、解像度変換の倍率が2倍である場合、必要数「2」に対して撮像回数「3」を設定してもよい。
このように撮像回数が必要数よりも大きい場合、撮像画像判定部102は、撮像回数分の撮像画像データの中から、処理実行条件を満たす撮像画像データの組合せが存在するか否かを判断すればよい。例えば、必要数「2」に対して撮像回数「3」である場合、3つの撮像画像データの中で、必要数の撮像画像データの組合せが3つある。この場合、撮像画像判定部102は、各組合せについて処理実行条件を満たすか否か順次判定する。そして、処理実行条件を満たす組合せを確認できた時点で撮像画像判定部102は処理を終了し、当該組合せに含まれる撮像画像データを通信部104が画像出力装置200に送信すればよい。もしくは、撮像画像判定部102は、全ての組合せについて処理実行条件を満たすか否か判定してもよい。この場合、複数の組合せが処理実行条件を満たす場合、制御部109は、検出したズレ量が所定範囲の中央値に最も近い組合せを画像出力装置200に送信するものと決定してもよい。例えば、所定範囲が0.3〜0.7である場合、ズレ量が0.5に最も近い組合せを選択すればよい。
(8−2)撮像画像判定部の判定項目について
上記の説明では、文書撮像モードが選択されたときに、撮像画像判定部102は、撮像画像における撮像対象物の傾き、幾何学的歪み、複数の撮像画像間のズレ量を判定するものとした。しかしながら、撮像画像判定部102における判定項目はこれに限定されるものではない。以下にこの変形例を説明する。
(a)例えば、ユーザは、文書画像を含む用紙や表示画面のような矩形状の撮像対象物に限らず、風景や人物などの撮像画像についても高解像度化された状態で画像出力装置200で出力することを希望することが考えられる。そこで、携帯端末装置100は、文書撮像モードに代えて、もしくは、文書撮像モードとは別に、単に撮像画像を画像出力装置200において高解像度補正して出力する処理を行うための高解像出力モードを備えていてもよい。文書撮像モードとは別に高解像度出力モードを備える場合、携帯端末装置100は、選択されたモードを示す情報を付けて撮像画像データを出力すればよい。これにより、画像出力装置200はモードに応じた処理を行うことができる。
そして、高解像出力モードが選択された場合、携帯端末装置100では、撮像画像判定部102は、上記の(3−3)に記載されたズレ量の判定のみを行い、(3−1)(3−2)に記載された、撮像対象物の傾き、幾何学的歪みの判定を行わない。そして、高解像度出力モードである旨の通知を受けた画像出力装置200においても、画像処理部202は、(6−2)に記載された高解像度補正を行い、(6−1)に記載された幾何学的歪みの補正・レンズ歪みの補正を実行しない。これによっても、撮像した画像よりも高解像度の画像を得るという効果を奏することができる。
なお、この場合、撮像画像判定部102は、撮像画像の中心付近からズレ検出量部分画像を抽出すればよい。
(b)上記の判定項目に加えて、他の判定項目について判定してもよい。他の判定項目としては、明るさ、コントラスト、カラーバランス、ブレ(激しい手ぶれ)などがある。
明るさについては、例えば露出オーバー(明るすぎる)やアンダー(暗すぎる)の場合に再度の撮像が必要となるケースが考えられる。そこで、撮像画像判定部102は、例えば、撮像画像データの画素値のうち、最大のものと最小のものを求め、最大値がある閾値(例えば8ビットで100など)以下であれば、露出アンダーとし、最小値がある閾値(例えば8ビットで150など)以上であれば、露出オーバーとする判定結果を制御部109に出力する。そして、制御部109は、露出アンダーまたは露出オーバーの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。もしくは、制御部109は、露出アンダーの場合には、撮像部101における露光時間を長くするように設定変更し、露出オーバーの場合には、露光時間を短くするように設定変更する。その後、制御部109は、ユーザに再撮像を促す指示を通知してもよい。
コントラストについては、撮像画像判定部102は、撮像画像データの画素値のうちの最大・最小の差分値が所定閾値以下の場合、コントラスト不足と判定する。そして、制御部109は、コントラスト不足との判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
なお、明るさ・コントラストの判定において、撮像画像判定部102は、各色チャンネルに対して判定を行っても良いし、平均値(R+G+B/3)や明度値(0.299×R+0.587×G+0.114×B:NTSC準拠)を用いても良い。
カラーバランスについては、各色チャンネル(RGB)の平均値や最大・最小値の比較を行うことで、ある一つのチャンネルに過度の偏りが発生していることを把握できる。そこで、撮像画像判定部102は、例えば、撮像画像中の最大明度値付近の値(最大明度〜最大明度−5程度)を持つ画素値の各色チャンネルの値の平均値(Ra,Ga,Ba)を求め、その各色チャンネルの最大値と最小値の差分が値に応じた一定値以上[Max(Ra,Ga,Ba)−Min(Ra,Ga,Ba)>0.1×Max(Ra,Ga,Ba)]である場合に、カラーバランス不良であると判定する。そして、制御部109は、カラーバランス不良であるとの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
ブレ(激しい手ぶれ:いわゆるモーションブラー)については、発生時にエッジの先鋭性が低下することから、撮像画像判定部102は、図9に挙げたようなエッジ抽出フィルタを用いて、エッジ強度画像を作成してヒストグラムを取り、その標準偏差値(前記分散の二乗根)を求める。そして、とうがい標準偏差値が所定閾値(例えば5)以下の場合、ブレが発生していると判定する。そして、制御部109は、ブレが発生しているとの判定結果を受けると、その旨および再撮像を促す指示を表示部105に表示させる。
(8−3)画像出力装置の処理項目について
上記の説明では、画像出力装置200の画像処理部202は、携帯端末装置100から受信した複数の撮像画像データに対して、幾何学的歪みの補正、レンズ歪みの補正、高解像度補正を行うものとした。しかしながら、画像処理部202における処理内容はこれに限定されるものではない。例えば、画像処理部202は、上記の補正に加えて、カラーバランス、コントラストの補正や傾き補正を行ってもよい。
カラーバランスの補正方法としては、画像処理部202は、受信した撮像画像データについて、各色チャンネルの最大値・最小値を求め、これらを揃えるようなルックアップテーブルを作成し、各色チャンネルに適用すればよい。ルックアップテーブルの一例としては、図11に示すように、あるチャンネルの最大値がMX、最小値がMNである場合、データが8bitのとき、MNから(MX−MN)/255のステップで増加させていくようなテーブルを作成すればよい。
画像処理部202は、コントラストの補正についても同様の方法で実行することができる。なお、カラーバランスを特に変える必要がなければ、各色チャンネルに適用するルックアップテーブルを同一のものとすればよい。
なお、カラーバランス・コントラストの補正方法についてはその他の公知の技術を適用してもよい。
また、画像処理部202は、(3−1)で記載された方法により撮像対象物の傾きを検知し、当該傾きが0度になるように撮像画像データの回転処理を施せばよい。もしくは、携帯端末装置100は、撮像画像データとともに、(3−1)で検出された傾き角度を画像出力装置200に送信してもよい。そして、画像処理部202は、携帯端末装置100から受けた傾き角度に基づいて、撮像対象物の傾きが0度になるように撮像画像データの回転処理を施せばよい。
(8−4)撮像部について
上記の説明では、撮像部101が連続して複数回撮像するときの手ぶれによって、複数の撮像画像にズレが生じることを利用する形態とした。しかしながら、これに限らず、撮像部101は、連続して複数回撮像するときに、撮像素子(CCD・CMOS)またはレンズを微小にずらしてもよい。これにより、複数の撮像画像間においてズレが確実に生じることになる。
(8−5)出力処理情報について
上記の説明では、出力処理情報を携帯端末装置100が取得し、画像出力装置200に送信するものとした。しかしながら、これに限らず、画像出力装置200がユーザ認証のためにユーザ情報を取得する際に、出力処理情報(出力処理の種類、出力処理のための設定条件を示す情報)を取得してもよい。
(8−6)出力処理について
画像出力装置200において、制御部212は、ファイリング処理やメール送信処理を行う前に、画像処理部202によって処理された撮像画像データを高圧縮PDFに変換してもよい。なお、高圧縮PDFデータとは、画像データの中の背景部分と文字分とを分離し、ぞれぞれの部分に最適な圧縮処理を行ったPDFデータである。これにより、文字判読性が良好で、画像ファイルサイズも低減させることができる。
また、制御部212は、ファイリング処理やメール送信処理を行う前に、画像処理部202によって処理された撮像画像データに対してOCR処理を実行し、テキストデータを生成してもよい。そして、制御部212は、撮像画像データをPDFに変換し、生成したテキストデータを透明テキストとして付加してもよい。なお、透明テキストとは、認識された文字をテキスト情報として見掛け上は見えない形で画像データに重ね合わせる(あるいは埋め込む)ためのデータである。例えば、PDFファイルでは、画像データに透明テキストを付加した画像ファイルが一般に使用されている。そして、制御部212は、生成した透明テキスト付きPDFデータを出力させてもよい。これにより、テキスト検索可能なファイルのように活用しやすい電子化文書を出力することができる。
(8−7)画像出力装置が備える画像処理部について
上記の説明では、画像出力装置200が備える画像処理部202が高解像度補正などを行うものとして説明した。しかしながら、画像出力装置200は、撮像画像データに対する高解像度補正やその他の画像処理(幾何学的歪みの補正、レンズ歪みの補正、コントラスト補正、カラーバランス補正など)を、上記画像処理部202を備えたサーバに実行させてもよい。なお、この場合、当該サーバが、携帯端末装置100から受信した撮像画像データに対して高解像度補正を行い、補正後の撮像画像データを出力する画像出力装置であるといえる。
(9)プログラムおよび記録媒体
本発明はコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に、上記した携帯端末装置100で撮像した画像を画像出力装置200に送信し画像出力装置200より出力する方法を記録するものとすることもできる。
この結果、上記処理を行うプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録した記録媒体を持ち運び自在に提供することができる。
なお、本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるために図示していないメモリ、例えばROMのようなもの、そのものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであっても良い。
いずれの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であっても良いし、あるいは、いずれの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVDなどの光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムコードを担持する媒体であっても良い。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であっても良い。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであっても良い。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
上記記録媒体は、携帯端末装置100や画像出力装置200に備えられるプログラム読み取り装置により読み取られることで上述した画像処理方法が実行される。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、携帯端末装置と画像出力装置との間でデータ通信を行う撮像画像処理システムに適用することができる。
100 携帯端末装置
200 画像出力装置
101 撮像部
102 撮像画像判定部
103 画像処理部
104 通信部(送信部)
105 表示部(通知部)
106 入力部
109 制御部(送信部、通知部)
202 画像処理部(補正処理部)
204 画像形成部(出力部)
205 表示部
206 入力部
207 第1通信部(受信部)
208 第2通信部(出力部)
212 制御部(出力部)

Claims (16)

  1. 複数の画像データから、当該複数の画像データの解像度よりも高解像度の画像データに補正する高解像度補正を行う補正処理部を備え、上記補正処理部によって補正された高解像度の画像データを出力する画像出力装置に対して画像データを送信する携帯端末装置であって、
    同一の撮像対象物に対して連続して複数回撮像する撮像部と、
    上記撮像部による連続した複数回撮像により得られた複数の撮像画像データが所定条件を満たすか否かを判定する撮像画像判定部と、
    上記撮像画像判定部により上記所定条件を満たす撮像画像データを上記画像出力装置に送信する送信部とを備え、
    上記撮像対象物は、文書画像が形成された矩形状の面を有しており、
    上記所定条件は、少なくとも以下の条件Aおよび条件Bを含み、
    条件A:上記撮像部により連続して撮像された複数の撮像画像データの中に、上記補正処理部による高解像度補正に適した、所定量だけずれた所定数(2以上の整数)の撮像画像データの組合せが含まれる、
    条件B:上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる、撮像画像データにおける上記矩形状の面の歪みの度合いを示す特徴量が所定範囲内である、
    上記送信部は、上記撮像画像判定部により上記組合せとして判定された所定数の撮像画像データを送信することを特徴とする携帯端末装置。
  2. 複数の画像データから、当該複数の画像データの解像度よりも高解像度の画像データに補正する高解像度補正を行う補正処理部を備え、上記補正処理部によって補正された高解像度の画像データを出力する画像出力装置に対して画像データを送信する携帯端末装置であって、
    同一の撮像対象物に対して連続して複数回撮像する撮像部と、
    上記撮像部による連続した複数回撮像により得られた複数の撮像画像データが所定条件を満たすか否かを判定する撮像画像判定部と、
    上記撮像画像判定部により上記所定条件を満たす撮像画像データを上記画像出力装置に送信する送信部とを備え、
    上記撮像対象物は、文書画像が形成された矩形状の面を有しており、
    上記所定条件は、少なくとも以下の条件Aおよび条件Cを含み、
    条件A:上記撮像部により連続して撮像された複数の撮像画像データの中に、上記補正処理部による高解像度補正に適した、所定量だけずれた所定数(2以上の整数)の撮像画像データの組合せが含まれる、
    条件C:撮像画像データにおける上記矩形状の面の傾き角度が所定範囲内である、
    上記送信部は、上記撮像画像判定部により上記組合せとして判定された所定数の撮像画像データを送信することを特徴とする携帯端末装置。
  3. 上記撮像画像判定部により上記所定条件を満たさないと判定された場合、ユーザに対して再撮像を促す通知を行う通知部を備えることを特徴とする請求項1または2に記載の携帯端末装置。
  4. 請求項1からのいずれか1項に記載の携帯端末装置と、
    上記携帯端末装置から複数の画像データを受信する画像出力装置とを備えた撮像画像処理システムであって、
    上記画像出力装置は、
    上記携帯端末装置から上記所定数の撮像画像データを受信する受信部と、
    受信部が受信した所定数の撮像画像データに基づいて、当該撮像画像データの解像度よりも高解像度の高解像度画像データを生成する高解像度補正を行う補正処理部と、
    上記補正処理部により生成された高解像度画像データ、あるいは、当該高解像度画像データで示される画像を出力する出力処理を実行する出力部とを備えることを特徴とする撮像画像処理システム
  5. 上記撮像対象物は、文書画像が形成された矩形状の面を有しており、
    上記補正処理部は、上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる撮像画像データにおける上記矩形状の面の歪みを補正するとともに、上記高解像度補正を行うことを特徴とする請求項に記載の撮像画像処理システム
  6. 上記撮像対象物は、文書画像が形成された矩形状の面を有しており、
    上記補正処理部は、上記撮像部による撮像画像データにおける上記矩形状の面のエッジが曲線状となるレンズ歪みを補正するとともに、上記高解像度補正を行うことを特徴とする請求項4または5に記載の撮像画像処理システム
  7. 上記出力部は、上記高解像度画像データに対応する画像を記録用紙に形成する印刷処理を上記出力処理として実行することを特徴とする請求項4から6のいずれか1項に記載の撮像画像処理システム
  8. 上記出力部は、上記高解像度画像データを外部記憶装置に格納する格納処理を上記出力処理として実行することを特徴とする請求項4から6のいずれか1項に記載の撮像画像処理システム
  9. 上記出力部は、上記高解像度画像データを電子メールに添付して送信するメール送信処理を上記出力処理として実行することを特徴とする請求項4から6のいずれか1項に記載の撮像画像処理システム
  10. 上記撮像対象物は、文書画像を有しており、
    上記出力部は、上記高解像度画像データにおいて上記文書画像に対応する領域とそれ以外の領域とに分離し、各領域に対して異なる圧縮率で圧縮させた状態で上記高解像度画像データを出力することを特徴とする請求項8または9に記載の撮像画像処理システム
  11. 上記撮像対象物は、文書画像を有しており、
    上記出力部は、上記高解像度画像データにおける上記文書画像に対応する領域の中から文字を抽出し、抽出した文字をテキストデータに変換し、当該テキストデータを上記高解像度画像データに付加して出力することを特徴とする請求項8または9に記載の撮像画像処理システム
  12. 複数の画像データから、当該複数の画像データの解像度よりも高解像度の画像データに補正する高解像度補正を行う補正処理部を備え、上記補正処理部によって補正された高解像度の画像データを出力する画像出力装置に対して画像データを送信する携帯端末装置の制御方法であって、
    上記携帯端末装置は、同一の撮像対象物に対して連続して複数回撮像する撮像部を備え、
    上記撮像部による連続した複数回撮像により得られた複数の撮像画像データが所定条件を満たすか否かを判定する撮像画像判定ステップと、
    上記撮像画像判定ステップにおいて上記所定条件を満たす撮像画像データを上記画像出力装置に送信する送信ステップとを含み、
    上記撮像対象物は、文書画像が形成された矩形状の面を有しており、
    上記所定条件は、少なくとも以下の条件Aおよび条件Bを含み、
    条件A:上記撮像部により連続して撮像された複数の撮像画像データの中に、上記補正処理部による高解像度補正に適した、所定量だけずれた所定数(2以上の整数)の撮像画像データの組合せが含まれる、
    条件B:上記矩形状の面の法線方向とは異なる方向から上記撮像部が撮像することによる、撮像画像データにおける上記矩形状の面の歪みの度合いを示す特徴量が所定範囲内である、
    上記送信ステップにおいて、上記撮像画像判定ステップにおいて上記組合せとして判定された所定数の撮像画像データを送信することを特徴とする携帯端末装置の制御方法。
  13. 複数の画像データから、当該複数の画像データの解像度よりも高解像度の画像データに補正する高解像度補正を行う補正処理部を備え、上記補正処理部によって補正された高解像度の画像データを出力する画像出力装置に対して画像データを送信する携帯端末装置の制御方法であって、
    上記携帯端末装置は、同一の撮像対象物に対して連続して複数回撮像する撮像部を備え、
    上記撮像部による連続した複数回撮像により得られた複数の撮像画像データが所定条件を満たすか否かを判定する撮像画像判定ステップと、
    上記撮像画像判定ステップにおいて上記所定条件を満たす撮像画像データを上記画像出力装置に送信する送信ステップとを含み、
    上記撮像対象物は、文書画像が形成された矩形状の面を有しており、
    上記所定条件は、少なくとも以下の条件Aおよび条件Cを含み、
    条件A:上記撮像部により連続して撮像された複数の撮像画像データの中に、上記補正処理部による高解像度補正に適した、所定量だけずれた所定数(2以上の整数)の撮像画像データの組合せが含まれる、
    条件C:撮像画像データにおける上記矩形状の面の傾き角度が所定範囲内である、
    上記送信ステップにおいて、上記撮像画像判定ステップにおいて上記組合せとして判定された所定数の撮像画像データを送信することを特徴とする携帯端末装置の制御方法。
  14. 請求項1からのいずれか1項に記載の携帯端末装置を動作させるプログラムであって、コンピュータを上記各部として機能させるためのプログラム。
  15. 請求項から11のいずれか1項に記載の撮像画像処理システムの画像出力装置を動作させるプログラムであって、コンピュータを上記各部として機能させるためのプログラム。
  16. 請求項14または15に記載のプログラムを記録したコンピュータ読取り可能な記録媒体。
JP2009091530A 2009-04-03 2009-04-03 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体 Active JP4758493B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009091530A JP4758493B2 (ja) 2009-04-03 2009-04-03 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体
US12/752,503 US8310550B2 (en) 2009-04-03 2010-04-01 Portable terminal apparatus for capturing more than one image of identical object, and captured image processing system for obtaining high resolution image data based on the captured images and outputting high resolution image
CN2010101513124A CN101860708B (zh) 2009-04-03 2010-04-02 便携式终端装置及其控制方法、以及拍摄图像处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009091530A JP4758493B2 (ja) 2009-04-03 2009-04-03 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2010245787A JP2010245787A (ja) 2010-10-28
JP4758493B2 true JP4758493B2 (ja) 2011-08-31

Family

ID=42825866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009091530A Active JP4758493B2 (ja) 2009-04-03 2009-04-03 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体

Country Status (3)

Country Link
US (1) US8310550B2 (ja)
JP (1) JP4758493B2 (ja)
CN (1) CN101860708B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI516119B (zh) * 2011-01-25 2016-01-01 華晶科技股份有限公司 電子裝置、影像擷取裝置及其方法
CN102831578B (zh) 2011-06-15 2014-12-17 富士通株式会社 图像处理方法和图像处理设备
JP5906028B2 (ja) * 2011-06-22 2016-04-20 キヤノン株式会社 画像処理装置、画像処理方法
JP5532037B2 (ja) * 2011-09-30 2014-06-25 コニカミノルタ株式会社 連携システム、携帯情報装置、連携方法および連携プログラム
US9626740B2 (en) * 2013-03-29 2017-04-18 Konica Minolta, Inc. Image processing apparatus and image processing method
JP2015026914A (ja) * 2013-07-24 2015-02-05 株式会社リコー プログラム、情報処理装置、システム
CN103533276B (zh) * 2013-10-21 2017-01-18 北京理工大学 一种平面多投影快速拼接方法
JP5886265B2 (ja) 2013-11-28 2016-03-16 シャープ株式会社 携帯端末装置、プログラム、及び記録媒体
CN108629221B (zh) * 2018-05-11 2021-08-10 南京邮电大学 一种褶皱畸变qr二维码的校正方法
CN110062127B (zh) * 2019-05-27 2020-09-01 宜春宜联科技有限公司 一种作业图片处理方法及设备

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657402A (en) * 1991-11-01 1997-08-12 Massachusetts Institute Of Technology Method of creating a high resolution still image using a plurality of images and apparatus for practice of the method
JPH10307846A (ja) * 1997-03-03 1998-11-17 Toshiba Corp ドキュメント情報管理システム、ドキュメント情報管理方法、及びドキュメント検索方法
GB9711022D0 (en) * 1997-05-28 1997-07-23 Rank Xerox Ltd Text/image selection from document images
JP2000013596A (ja) 1998-06-18 2000-01-14 Minolta Co Ltd 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
US6735341B1 (en) * 1998-06-18 2004-05-11 Minolta Co., Ltd. Image processing device and method and recording medium for recording image processing program for same
US6400845B1 (en) * 1999-04-23 2002-06-04 Computer Services, Inc. System and method for data extraction from digital images
US7133068B2 (en) * 2000-03-06 2006-11-07 Sony Corporation System and method for creating still images by utilizing a video camera device
JP2002041502A (ja) * 2000-07-28 2002-02-08 Olympus Optical Co Ltd ドキュメント作成システム及びドキュメント作成方法
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
US6975352B2 (en) * 2000-12-18 2005-12-13 Xerox Corporation Apparatus and method for capturing a composite digital image with regions of varied focus and magnification
US7343049B2 (en) * 2002-03-07 2008-03-11 Marvell International Technology Ltd. Method and apparatus for performing optical character recognition (OCR) and text stitching
US7586655B1 (en) * 2003-06-30 2009-09-08 Google Inc. Acquiring and using three-dimensional information in a document scanning system
JP4196216B2 (ja) 2003-09-08 2008-12-17 日本電気株式会社 画像合成システム、画像合成方法及びプログラム
JP2005275787A (ja) 2004-03-24 2005-10-06 Fuji Photo Film Co Ltd 画像処理方法及び装置並びにプリンタ
US7352919B2 (en) * 2004-04-28 2008-04-01 Seiko Epson Corporation Method and system of generating a high-resolution image from a set of low-resolution images
JP2006025037A (ja) 2004-07-06 2006-01-26 Seiko Epson Corp 画像処理システム
JP4311668B2 (ja) * 2004-11-15 2009-08-12 オリンパス株式会社 撮像装置と撮像システムおよび画像の撮影方法
JP4548144B2 (ja) 2005-02-23 2010-09-22 カシオ計算機株式会社 デジタルカメラ装置、及びスルー画像表示方法
JP2007027839A (ja) 2005-07-12 2007-02-01 Canon Inc 画像形成システム、画像処理方法、撮像装置、プログラム及び記録媒体
JP2007306524A (ja) * 2006-05-15 2007-11-22 Nec Electronics Corp カメラ付き携帯機器及びその撮影支援方法
JP4270281B2 (ja) * 2007-01-16 2009-05-27 セイコーエプソン株式会社 画像処理のための装置、方法、および、プログラム
JP2008294950A (ja) * 2007-05-28 2008-12-04 Sanyo Electric Co Ltd 画像処理方法、画像処理装置、及びこの画像処理装置を備えた電子機器
US8068700B2 (en) * 2007-05-28 2011-11-29 Sanyo Electric Co., Ltd. Image processing apparatus, image processing method, and electronic appliance
JP2009044538A (ja) * 2007-08-09 2009-02-26 Hitachi Ltd 監視システムおよびこれに用いる撮像装置
US20090052804A1 (en) * 2007-08-22 2009-02-26 Prospect Technologies, Inc. Method process and apparatus for automated document scanning and management system
JP2008187750A (ja) * 2008-05-07 2008-08-14 Casio Comput Co Ltd 撮像装置及びそのプログラム
US20090323134A1 (en) * 2008-06-30 2009-12-31 Kabushiki Kaisha Toshiba Apparatus and method for generating segmentation data of a scanned image

Also Published As

Publication number Publication date
CN101860708A (zh) 2010-10-13
JP2010245787A (ja) 2010-10-28
CN101860708B (zh) 2012-09-26
US20100253789A1 (en) 2010-10-07
US8310550B2 (en) 2012-11-13

Similar Documents

Publication Publication Date Title
JP4758493B2 (ja) 携帯端末装置、撮像画像処理システム、携帯端末装置の制御方法、プログラムおよび記録媒体
JP4772894B2 (ja) 画像出力装置、携帯端末装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP4772889B2 (ja) 携帯端末装置、撮像画像処理システム、プログラムおよび記録媒体
JP4856263B2 (ja) 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
US10484610B2 (en) Image-capturing apparatus, captured image processing system, program, and recording medium
JP5026484B2 (ja) 携帯端末装置、画像出力装置、撮像画像処理システム、携帯端末装置の制御方法、画像出力方法、プログラム、および記録媒体
JP5547243B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP4991887B2 (ja) 撮像画像処理システム、撮像画像処理システムの制御方法、プログラムおよび記録媒体
JP5886265B2 (ja) 携帯端末装置、プログラム、及び記録媒体
US8165402B2 (en) Image processing method, image processing apparatus, image forming apparatus and storage medium
JP2011101338A (ja) 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP6426815B2 (ja) 画像処理装置および画像処理方法
JP7130436B2 (ja) マルチクロップ処理を行う画像処理装置、マルチクロップ処理によって原稿単位の画像を生成する方法、および、プログラム
JP4487000B2 (ja) 画像処理装置、画像形成装置、画像処理方法、画像処理システム、画像処理プログラムおよびその記録媒体
JP5819378B2 (ja) 画像判定装置、画像処理システム、プログラム及び記録媒体
JP2010273218A (ja) 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP2010130634A (ja) 画像処理装置、画像データ出力処理装置、画像処理方法、プログラムおよびその記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110602

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4758493

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140610

Year of fee payment: 3