JP4574235B2 - 画像処理装置、及びその制御方法、プログラム - Google Patents

画像処理装置、及びその制御方法、プログラム Download PDF

Info

Publication number
JP4574235B2
JP4574235B2 JP2004167672A JP2004167672A JP4574235B2 JP 4574235 B2 JP4574235 B2 JP 4574235B2 JP 2004167672 A JP2004167672 A JP 2004167672A JP 2004167672 A JP2004167672 A JP 2004167672A JP 4574235 B2 JP4574235 B2 JP 4574235B2
Authority
JP
Japan
Prior art keywords
block
image
correction
data
inclination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004167672A
Other languages
English (en)
Other versions
JP2005346586A5 (ja
JP2005346586A (ja
Inventor
博之 辻
勇志 松久保
博之 矢口
英一 西川
進一 加藤
正和 木虎
賢三 関口
廣義 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004167672A priority Critical patent/JP4574235B2/ja
Priority to US11/145,211 priority patent/US20050271296A1/en
Publication of JP2005346586A publication Critical patent/JP2005346586A/ja
Publication of JP2005346586A5 publication Critical patent/JP2005346586A5/ja
Application granted granted Critical
Publication of JP4574235B2 publication Critical patent/JP4574235B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00718Skew
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00729Detection means
    • H04N1/00734Optical detectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00763Action taken as a result of detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Record Information Processing For Printing (AREA)
  • Character Input (AREA)

Description

本発明は、入力された画像データに画像処理を施す画像処理装置及びその制御方法、プログラムに関するものである。
近年、環境問題が叫ばれる中、オフィスでのペーパーレス化が急速に進んでいる。このペーパレス化を実現する技術として、従来からバインダー等で蓄積された紙文書をスキャナで読み取り、その読み取った画像を、例えば、ポータブルドキュメントフォーマット(以下、PDFと示す)等の画像ファイルに変換して、画像記憶装置に蓄積して管理する文書管理システムが提案されている。
また、読取画像は、通常JPEG等の圧縮フォーマットにより圧縮され、得られる圧縮ファイルがハードディスク等の記録媒体に保存される。
一方、スキャン時に画像データの傾きを検知して、画像データを傾いた角度分だけ回転することにより傾き補正を行うことも可能である(例えば特許文献1、2)。この傾き補正は、例えば、スキャナの原稿台上に原稿を置いてスキャンする場合に斜めに置いてしまったり、ドキュメントフィーダー(自動原稿送り装置)を用いてスキャンする場合に原稿が斜めにずれて送られてしまう時に有効である。
特開平8−63548号公報 特開平4−98476号公報
しかしながら、JPEG等の圧縮では通常圧縮伸張した画像データは元の画像データとは異なり、圧縮率を高くするほど画像データは画像の劣化が大きくなる。特に、傾き補正を行う際に、圧縮された画像を一度伸張してから回転処理を行う場合は、画像の劣化が発生する場合がある。また、任意の角度の回転処理は実現する場合には、それを実現する回路の回路規模が大きくなり、もしくは処理時間がかかっていた。
また、複数の記事を切り貼りしてレイアウトした原稿をスキャンしたような場合、スキャンした原稿画像に含まれるそれぞれの記事画像データの傾き角度を検出して、それぞれの画像データを別々に方向に回転することが必要になると考えられる。
更に、複数の画像データを別々の方向に回転して補正する場合、各画像データの配置がユーザの意図した通りにレイアウトされなかったり、重なってしまったり、枠や原稿画像からはみ出してしまうこともありえる。
更に、正立するように傾き補正した画像データであっても、プリント出力時に出力用紙が斜めに搬送されることにより、出力用紙上に形成される画像が斜めに傾いた状態で出力してしまう場合も考えられ、簡単に修正することができなかった。
本発明は上記の課題を解決するためになされたものであり、画像中のオブジェクトに対して、精度の高い傾き補正を画像劣化がなく高速で処理可能な画像処理装置及びその制御方法、プログラムを提供することを目的とする。
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、 入力された画像データに画像処理を施す画像処理装置であって、
入力された画像データを複数のブロックに分割する分割手段と、
前記分割手段で分割された各ブロックの傾き角度を検出する検出手段と、
前記分割手段で分割されたブロック毎に、前記入力された画像データをベクトルデータに変換する変換手段と、
前記検出手段で検出された各ブロックの傾き角度に基づいて、前記変換手段で変換された各ブロックに対応するベクトルデータを傾き補正し、更に、当該傾き補正した後のブロックのうち第1ブロックが他の第2ブロックと重なる場合は、その重なりがなくなるように、前記第1ブロック及び前記第2ブロックの少なくともいずれか一方に対応する前記傾き補正後のベクトルデータに対して、縮小または平行移動の少なくともいずれかの補正を実行する補正手段と
を備える。
また、好ましくは、原稿を読み取る読取手段を更に備え、
前記入力された画像データは、前記読取手段で原稿を読み取ることにより生成される画像データである。
また、好ましくは、前記検出手段は、前記分割手段で分割されたブロックの内、所定の属性のブロックの傾き角度を検出し、
前記補正手段は、前記検出手段で検出された傾き角度に基づいて、前記所定の属性のブロックに対応するベクトルデータを傾き補正し、更に、当該傾き補正した後のブロックのうち第1ブロックが他の第2ブロックと重なる場合は、その重なりがなくなるように、前記第1ブロック及び前記第2ブロックの少なくともいずれか一方に対応する前記傾き補正後のベクトルデータに対して、縮小または平行移動の少なくともいずれかの補正を実行する
また、好ましくは、前記検出手段で検出された傾き角度が所定角度以上の場合、前記補正手段による補正の実行を禁止する禁止手段を更に備える。
上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
入力された画像データに画像処理を施す画像処理装置の制御方法であって、
分割手段が、入力された画像データを複数のブロックに分割する分割工程と、
検出手段が、前記分割工程で分割された各ブロックの傾き角度を検出する検出工程と、
変換手段が、前記分割工程で分割されたブロック毎に、前記入力された画像データをベクトルデータに変換する変換工程と、
補正手段が、前記検出工程で検出された各ブロックの傾き角度に基づいて、前記変換工程で変換された各ブロックに対応するベクトルデータを傾き補正し、更に、当該傾き補正した後のブロックのうち第1ブロックが他の第2ブロックと重なる場合は、その重なりがなくなるように、前記第1ブロック及び前記第2ブロックの少なくともいずれか一方に対応する前記傾き補正後のベクトルデータに対して、縮小または平行移動の少なくともいずれかの補正を実行する補正工程と
を備える。
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
コンピュータを、
入力された画像データを複数のブロックに分割する分割手段、
前記分割手段で分割された各ブロックの傾き角度を検出する検出手段、
前記分割手段で分割されたブロック毎に、前記入力された画像データをベクトルデータに変換する変換手段、
前記検出手段で検出された各ブロックの傾き角度に基づいて、前記変換手段で変換された各ブロックに対応するベクトルデータを傾き補正し、更に、当該傾き補正した後のブロックのうち第1ブロックが他の第2ブロックと重なる場合は、その重なりがなくなるように、前記第1ブロック及び前記第2ブロックの少なくともいずれか一方に対応する前記傾き補正後のベクトルデータに対して、縮小または平行移動の少なくともいずれかの補正を実行する補正手段、
として機能させる。
本発明によれば、画像中のオブジェクトに対して、精度の高い傾き補正を画像劣化がなく高速で処理可能な画像処理装置及びその制御方法、プログラムを提供できる。
以下、本発明の実施の形態について図面を用いて詳細に説明する。
<実施形態1>
図1は本発明の実施形態1の画像処理システムの構成を示すブロック図である。
図1において、オフィス10内に構築されたLAN107には、複数種類の機能(複写機能、印刷機能、送信(ファイル送信、ファックス送信)機能等)を実現する複合機であるMFP(Multi Function Peripheral)100、MFP100からの送信データを受信したり、MFP100が実現する機能を利用するクライアントPC102及びプロキシサーバ103が接続されている。LAN107は、プロキシサーバ103を介してネットワーク104に接続されている。
このクライアントPC102では、例えば、印刷データをMFP100へ送信することで、その印刷データに基づく印刷物をMFP100で印刷することが可能である。
尚、図1の構成は一例であり、オフィス10と同様の構成要素を有する、複数のオフィスがネットワーク104上に接続されていても良い。
また、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、またはこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
また、クライアントPC102及びプロキシサーバ103の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。
次に、MFP100の詳細構成について、図2を用いて説明する。
図2は本発明の実施形態1のMFPの詳細構成を示す図である。
図2において、画像読取部110は、例えば、スキャナやリーダで構成される画像読取部であり、特に、画像読取部110がスキャナやリーダで構成される場合には、オートドキュメントフィーダ(ADF)を更に備える。画像読取部110は、束状のあるいは1枚の原稿画像を光源(不図示)で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状のスキャン画像データを所定密度(600DPI等)のラスタ画像として得る。
尚、画像読取部110は、スキャナやリーダ以外に、デジタルカメラやデジタルビデオ等の撮像装置、PCやPDA等のCPUを有する情報処理装置、移動携帯通信端末やFAX等の通信装置等、ラスタ画像データを入力可能な装置であれば、どのようなものでも良い。
次に、MFP100の主要な機能群について、以下に説明する。
「複写(コピー)機能」
MFP100は、スキャン画像データに対応する画像を印刷部112で記録媒体に印刷する複写機能を有し、原稿画像を1つ複写する場合には、このスキャン画像データをデータ処理部115(CPU、RAM、ROM等から構成される)で各種の補正を行う画像処理を施して、印刷データを生成し、これを印刷部112によって記録媒体上に印刷させる。一方、原稿画像を複数複写する場合には、記憶部111に一旦一ページ分の印刷データを記憶保持させた後、これを印刷部112に順次出力して記録媒体上に印刷させる。
尚、記憶部111に印刷データを保持せずに、スキャン画像データをデータ処理部115にて各種の補正を行う画像処理を施して印刷データを生成して、直接印刷部112によって記録媒体上に印刷させることも可能である。
「保存機能」
MFP100は、画像読取部110からスキャン画像データあるいは画像処理が施されたスキャン画像データを記憶部111に保存する。
「送信機能」
ネットワークI/F114を介する送信機能においては、画像読取部110から得られるスキャン画像データあるいは保存機能で記憶部111に保存されたスキャン画像データを、TIFFやJPEG等の圧縮画像ファイル形式、あるいはPDF等のベクトルデータファイル形式の画像ファイルへと変換し、ネットワークI/F114から出力する。出力された画像ファイルは、LAN107を介してクライアント101へ送信されたり、更にネットワーク104経由でネットワーク上の外部端末(例えば、別のMFPやクライアントPC)に転送されたりする。
また、ここでは図示しないが、FAX I/Fを使用して、スキャン画像データを電話回線を使用してファクシミリ送信する構成も可能である。また、記憶部111にスキャン画像データを保存せずに、そのスキャン画像データをデータ処理部115にて各種の送信に関する画像処理を施した後に、直接送信することも可能である。
「印刷機能」
印刷部112による印刷機能においては、例えば、クライアントPC102から出力された印刷データをネットワークI/F114経由でデータ処理部115が受信し、データ処理部115は、その印刷データを印刷部112で印刷可能なラスタデータに変換した後、印刷部112によって印刷媒体上に画像を形成する。
「ベクトルスキャン機能」
上述のコピー機能、保存機能、送信機能時等で、スキャン画像データを生成し、このスキャン画像データに対して、文字領域はTextコードに変換したり、細線や図形領域は関数化してコード化するベクトル化処理を施す一連の処理を実行する機能を、ベクトルスキャン機能と定義している。つまり、実施形態1では、原稿をスキャンして、それによって得られる入力画像データをベクトルデータに変換するまでの処理を、ベクトルスキャンと定義している。
このベクトルスキャン機能を使用することで、ベクトルイメージのスキャン画像データを容易に生成することができる。
このベクトルスキャン機能では、上述のように、スキャン画像データに対して、文字部分は文字コードやアウトライン化し、細線やイラスト等は、その直線、曲線を関数化し、表等は表データとして処理する。そのため、通常のラスタイメージのスキャン画像データとは異なり、原稿中のオブジェクト個々を再利用することが容易である。
例えば、コピー機能時にベクトルスキャン機能を実行すると、ラスタスキャンでコピーするよりも文字や細線再現で高画質とすることが可能になる。
また、保存機能時には、ラスタスキャン(画像読取部110からの入力)時ではラスタデータとして画像圧縮を行うため、容量が大きくなってしまうが、ベクトルスキャン機能によりコード化や関数化することで、そのファイル容量は非常に小さくなる。
更に、送信機能時においても、ベクトルスキャン機能を実行すると、得られるデータの容量が小さいために送信にかかる時間を短縮でき、さらには各オブジェクトがベクトル化されているので、送信先のクライアントPC102上等の外部端末で、個々のオブジェクトを部品として再利用することが可能になる。
以上、各種機能を実行するためのMFP100への操作者の指示は、MFP100に装備されたキー操作部やタッチパネルからなる入力部113及び表示部116から行われ、これら一連の動作はデータ処理部115内の制御部(不図示)で制御される。また、操作入力の状態表示及び処理中の画像データの表示は、表示部116で行われる。
記憶部111は、例えば、大容量のハードディスクで実現される。また、記憶部111は、画像読取部110で読み取った画像データや、クライアント101から送信された画像データを記憶管理するデータベースを構成している。
特に、本発明では、画像データのイメージデータと、そのイメージデータをベクトル化することによって得られるベクトルデータファイルを対応づけて管理することができる。また、用途や目的によっては、イメージデータ及びベクトルデータファイルの少なくとも一方を管理する構成としても良い。
また、記憶部111では、後述する処理によって得られる読取原稿画像に対応するベクトルデータをオリジナルベクトルデータとして記憶するオリジナル用バッファと、そのオリジナルベクトルデータに基づく画像編集を行う場合に、そのオリジナルベクトルデータをコピーしたデータを画像編集用データとして記憶する画像編集用バッファが確保されていても良い。
[処理概要]
次に、実施形態1の画像処理システムで実行する処理全体の概要を、図3を用いて説明する。
図3は本発明の実施形態1の画像処理システムが実行する処理全体の概要を示すフローチャートである。
まず、ステップS121で、MFP100の画像読取部110に原稿をセットし、入力部113に備わる機能選択キーにより、コピー機能、保存機能、送信機能等の各種機能の内、所望の機能の選択を受け付ける。そして、この選択に応じて、装置に対する初期設定を実行する。
また、実施形態1では、この機能の選択の1つとして、画像中のブロック(オブジェクト)の傾きを補正する「自動ブロック傾き補正」モードのON/OFF設定がある。
ステップS122で、入力部113に備わるベクトルスキャン選択キーによる操作に基づいて、ベクトルスキャンを選択する。
尚、ベクトルスキャンとは、上述した通り、読取原稿画像の入力画像データ(ラスタ画像データ)に対して、文字領域はTextコードに変換したり、細線や図形領域は関数化してコード化するベクトル化処理を施す一連の処理を意味する。つまり、原稿をスキャンして、それによって得られる入力画像データをベクトルデータに変換するまでの処理を、ベクトルスキャンと定義している。また、ベクトルスキャンで実行するベクトル化処理の詳細については、図5以降で説明する。
続けて、ステップS123で、ベクトルスキャンを動作させるためのスタートキーが操作されると、画像読取部110にセットされた原稿画像を読み取り、ベクトルスキャンを実行する。
ベクトルスキャンでは、まず、1枚の原稿をラスタ状に走査して読み取り、例えば、600DPI−8ビットの画像信号を得る。そして、ステップS124で、この画像信号を、データ処理部115で前処理を施し、記憶部111に1ページ分の画像データとして保存する。
データ処理部115のCPUは、記憶部111に保存された画像データに対して、ステップS125及びステップS127でベクトル化処理のための前処理を実行し、また、ステップS128でベクトル化処理を行う。
まず、ステップS125で、データ処理部115において、ブロックセレクション(BS)処理を行う。
具体的には、記憶部111に格納された処理対象の画像信号を、まず、文字/線画部分とハーフトーン画像部分とに領域分割し、文字/線画部分は更に段落で塊として纏まっているブロック毎に、あるいは線で構成された表、図形毎に分割する。
一方、ハーフトーン画像部分は、矩形に分離されたブロックの画像部分、背景部分等の、所謂ブロック毎に独立したオブジェクト(ブロック)に分割する。
次に、ステップS126で、ステップS125のブロックセレクション処理で得られた各ブロックの傾きを検出する傾き角度検出処理を実行する。
次に、ステップS127で、ステップS125のブロックセレクション処理で得られた文字ブロックに対してOCR処理を行う。
そして、OCR処理が施された文字ブロックに対しては、更に、ステップS128で、文字のサイズ、スタイル、字体(フォント)を認識し、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。一方、線で構成される表、図形ブロックに対しては、アウトライン化/関数近似化する。また、画像ブロックに対しては、イメージデータとして個別のJPEGファイルに変換する。
例えば、Text(文字)オブジェクトはフォントデータに変換される。Graphic(細線、図形)オブジェクトは、アウトライン化/関数近似化された関数としてベクトル化変換される。Table(表)オブジェクトは、表内の数値情報はフォントデータに変換し、表部はアウトライン化/関数近似化された関数としてベクトル変換され、各数値情報はセル情報として関連付けられ表オブジェクトとしてコード化される。
更に、Image(画像)オブジェクトは、画像読取部110の読取解像度600DPIのまま低圧縮(例えば、低圧縮JPEG圧縮)を実行して保存される。また、BackGround(背景)オブジェクトは、読取解像度600DPIから低解像度(例えば、解像度300DPI)へ解像度変換を施した後に高圧縮(例えば、高圧縮JPEG圧縮)を実行して保存される。
尚、低圧縮及び高圧縮の定義は、例えば、所定圧縮率(例えば、50%)より高い圧縮率での圧縮を高圧縮、所定圧縮率より低い圧縮率での圧縮を低圧縮とする。
ベクトル化処理の終了後、各オブジェクト(ブロック)のレイアウト情報を保存して、ベクトルデータファイルとして記憶部111に保存する。
次に、ステップS129で、ステップS128で得られたベクトルデータを、文書作成アプリケーションによって処理することが可能な、所定形式(例えば、RTF(Rich Text Format)形式やSVG(Scalable Vector Graphic)形式等)のアプリケーションデータ(アプリデータ)に変換するアプリデータ変換処理を実行する。
次に、ステップS130で、予め設定されたモードに応じて、ベクトルデータとなっている、各オブジェクトを回転する傾き補正処理を実行する。この傾き補正処理に応じて、各オブジェクトのレイアウト情報を補正する。
記憶部111に保存されたベクトルデータファイルは、その後、ステップS130で、ベクトルスキャンの目的毎に、後処理を実行する。
後処理としては、例えば、コピー機能の場合には、各オブジェクトに最適な色処理、空間周波数補正等の画像処理が施された後、印刷部112より印刷される。また、保存機能の場合には、記憶部111に記憶保持される。また、送信機能の場合には、汎用のファイル形式として、例えば、RTF(Rich Text Format)形式に変換したり、SVG形式に変換したりして、ファイル送信先で再利用可能なファイル形式にして変換して、ネットワークI/F114を介して送信先(例えば、クライアントPC102)へファイル送信する。
以上の処理によって得られたベクトルデータファイルは、読取原稿画像に可視的に非常に近い状態のベクトル情報が編集可能な形式で全て含まれており、それらを直接加工、再利用したり、あるいは蓄積、伝送、再印刷を行うことが可能になる。
これらの処理で生成されたベクトルデータファイルは、文字や細線等を記述コードで表現するため、単純にイメージデータ(ラスタビットマップデータ)を直接扱う場合と比較して情報量が削減され、蓄積効率が高まり、伝送時間が短縮され、また記録/表示する際には高品位なデータとして非常に優位となる。
[入力部113と表示部116の説明]
図4A〜図4Cは本発明の実施形態1の操作画面の一例を示す図である。
特に、この操作画面は、入力部113と表示部116によって構成される操作画面の一例である。
操作画面10000は、入力部113と表示部116が一体になっている操作画面構成であり、この例では、入力部113と表示部116は、LCDとタッチパネルから構成されるものとするが、もちろん入力部113としてのハードキーもしくはマウスポインタ、表示部116としてのCRT等で独立に構成されていても構わない。
図4Aの操作画面10000は、実施形態1のMFP100の基本操作画面である。実施形態1におけるベクトルスキャン機能の選択は、操作画面10000の例では、応用モードキー100000内に入っているものとする。
また、コピー機能を選択する際にはキー100001、送信機能(送信/ファックス機能)を選択する際にはキー100002、保存機能(ボックス機能)を選択する際にはキー100003を押下すると、操作画面10000は、選択された機能に応じた画面表示へと切り替わる。この例では、コピー機能を選択した場合の表示例を示している。
応用モードキー100000を押下すると、操作画面10000は、応用モードとしてMFP100で用意されている各種モードからなる、図4Bの応用モード画面10001に切り替わる。
図4Bの応用モード画面10001において、Vectorizeキー100010が、上述のベクトルスキャン機能を動作可能にする選択キーである(図3のステップS122)。このVectorizeキー100010を押下すると、図4Cの操作画面10002が表示される。
操作画面10002において、読込開始キー100020は、原稿読取のスキャン開始を指示するためのキーであり、このキーを押下すると原稿を読み取る。また、傾き補正キー100021は、ベクトルスキャン対象の原稿中のオブジェクトの傾き角度検出処理(ステップS126)の実行のON/OFFを設定するためのキーである。つまり、上述の「自動ブロック傾き補正」モードのON/OFFを設定することが可能である。
特に、傾き角度検出処理を実行する場合には、傾き補正キー100021を押下した後、読込開始キー100020を押してスキャン動作を開始する。
尚、傾き補正キー100021は、操作画面10002に構成されている必要はなく、別の専用画面で構成されたり、デフォルト設定として「自動ブロック傾き補正」モードをONに設定しても良い。
<ブロックセレクション処理>
次に、図3のステップS125のブロックセレクション処理の詳細について説明する。
ブロックセレクション処理とは、例えば、図5(a)のラスタ画像を、図5(b)のように、意味のあるブロック毎の塊として認識し、該ブロック各々の属性(Text/Graphic/Image/Table等)を判定し、異なる属性を持つブロックに分割する処理である。
ブロックセレクション処理の実施形態を以下に説明する。
まず、入力画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つブロックへ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のブロックは文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字ブロック、扁平な画素塊を線ブロック、一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表ブロック、不定形の画素塊が散在している領域を写真ブロック、それ以外の任意形状の画素塊を図画ブロックとする。
そして、ブロックセレクション処理では、各ブロックを特定するブロックIDを発行し、各ブロックの属性(画像、文字等)、サイズやオリジナル文書内の位置(座標)と各ブロックを関連付けて記憶部111にブロック情報として記憶する。また、これらのブロック情報は、以降に詳細を説明するステップS128のベクトル化処理で利用される。
ここで、ブロック情報の一例について、図6Aを用いて説明する。
図6Aは本発明の実施形態1のブロック情報の一例を示す図である。
図6Aに示すように、ブロック情報は、各ブロックの属性を示すブロック属性(1:TEXT、2:GRAPHIC、3:TABLE、4:LINE、5:IMAGE)、ブロックの4隅の位置座標(Xa,Ya)〜(Xd,Yd)、ブロックの幅W及び高さH、ブロックのOCR情報(テキストデータ)の有無で構成されている。
ここで、ブロックの位置座標(Xa,Ya)とは、例えば、原稿画像の左上角を原点(0,0)とした場合の左上角の位置座標であり、(Xb,Yb)が右上角、(Xc,Yc)が左下角、(Xd,Yd)が右下角の位置座標となる。また、幅W及び高さHは、例えば、画素数で表現される。また、このブロック情報に加えて、ブロックセレクション処理では、原稿画像(入力ファイル)に存在するブロック数Nを示す入力ファイル情報を生成する。図6Aの例の場合、入力ファイル情報はN=6となる。
<傾き角度検出処理>
次に、図3のステップS126び傾き角度検出処理の詳細について説明する。
この傾き角度検出処理は、図6Aのブロック情報中の各ブロックの座標情報を参照して、各ブロックの傾き角度を検出する。
例えば、図6Bのように、あるブロックの座標が(Xa,Ya)〜(Xd,Yd)で表されているとすると、所定方向(例えば、水平方向:正常の向きで読み取られた原稿画像の上辺と同一方向)に対して、ブロックの上辺の傾き角度θは、tan-1((Yb−Ya)/(Xb−Xa))で表される。同様に、ブロックの下辺、右辺、左辺についても傾きを算出することで、水平方向に対するブロックの傾き(角度)が検出可能である。
特に、ブロックが長方形の場合は各辺の傾きは同じになる。これら検出された4つの角度の内、いずれか1つまたはそれらの平均値をブロックの傾き角度として、記憶部111に一時記憶し、他のブロックについても同様の処理を行う。
尚、ブロックの傾き角度の検出方法は、各ブロック毎の傾き角度が検出できる方法であれば、上記の方法に限定されるものではない。
<OCR処理>
次に、図3のステップS127のOCR処理の詳細について説明する。
ここでは公知のOCR処理技術を使用して、文字認識処理を行う。
『文字認識処理』
文字認識処理では、文字ブロックから文字単位で切り出された文字画像に対し、パターンマッチの一手法を用いて文字認識を行い、対応する文字コードを取得する。特に、この文字認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とするものである。
特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュブロック内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
そして、文字ブロックに対して文字認識処理を行う場合は、まず、該当文字ブロックに対し、横書き/縦書きの判定を行い、各々対応する方向に文字列を切り出し、その後、文字列から文字を切り出して文字画像を取得する。
横書き/縦書きの判定は、該当文字ブロック内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き、垂直射影の分散が大きい場合は縦書きと判定する。文字列及び文字への分解は、横書きの文字ブロックである場合には、その水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。一方、縦書きの文字ブロックに対しては、水平と垂直を逆にすれば良い。
尚、この文字認識処理によって、文字のサイズを検出することができる。
<ベクトル化処理>
次に、図3のステップS128のベクトル化処理の詳細について説明する。
まず、ステップS127のOCR処理によって得られた文字ブロックの各文字に対してフォント認識処理を行う。
『フォント認識処理』
文字認識処理の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種、即ち、フォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントを認識することができる。
『文字のベクトル化処理』
以上の文字認識処理及びフォント認識処理によって得られた、文字コード及びフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。尚、原稿画像がカラー画像の場合は、そのカラー画像から各文字の色を抽出してベクトルデータとともに記録する。
以上の処理により、文字ブロックに属するイメージ情報を、ほぼ形状、大きさ、色が忠実なベクトルデータに変換できる。
『文字以外の部分のベクトル化処理』
次に、文字ブロック以外の図画あるいは線、表ブロックについては、そのブロック中で抽出された画素塊の輪郭をベクトルデータに変換する。
具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図7に示すように、任意点Piに対し左右k個の離れた点Pi−k、Pi+kの間に弦を引いたとき、この弦とPIの距離が極大となる点として求められる。
また、Pi−k、Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法等の計算式を用いて、また、曲線は3次スプライン関数等の関数を用いてベクトル化することができる。
また、対象が内輪郭を持つ場合、ブロックセレクション処理で抽出した白画素輪郭の点列を用いて、同様に部分的直線あるいは曲線で近似する。
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。尚、原稿画像がカラー画像の場合は、そのカラー画像から図形の色を抽出してベクトルデータとともに記録する。
また、図8に示すように、ある区間で外輪郭と、内輪郭あるいは別の外輪郭が近接している場合、2つの輪郭線をひとまとめにし、太さを持った線として表現することができる。
具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線あるいは曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、このような太さを持つ線の集合として効率よくベクトル表現することができる。
尚、先に文字ブロックに対する文字認識処理を用いたベクトル化を説明したが、該文字認識処理の結果、辞書からの距離が最も近い文字を認識結果として用いるが、この距離が所定値以上の場合は、必ずしも本来の文字に一致せず、形状が類似する文字に誤認識している場合が多い。
従って、実施形態1では、このような文字ブロックに対しては、一般的な線画と同じに扱い、その文字ブロックをアウトライン化する。即ち、従来の文字認識処理で誤認識を起こす文字に対しても誤った文字にベクトル化されず、可視的にイメージデータに忠実なアウトライン化によるベクトル化が行える。
また、画像ブロックに対しては、そのままイメージデータとして、ベクトル化は実行しない。
次に、ベクトル化処理によって得られたベクトルデータを図形ブロック毎にグループ化するグループ化処理について、図9を用いて説明する。
図9は本発明の実施形態1のベクトルデータのグループ化処理を示すフローチャートである。
特に、図9では、ベクトルデータを図形ブロック毎にグループ化する処理について説明する。
まず、ステップS700で、各ベクトルデータの始点、終点を算出する。次に、ステップS701で、各ベクトルデータの始点、終点情報を用いて、図形要素を検出する。
ここで、図形要素の検出とは、区分線が構成している閉図形を検出することである。検出に際しては、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用し、検出を行う。
次に、ステップS702で、図形要素内に存在する他の図形要素、もしくは区分線をグループ化し、一つの図形オブジェクトとする。また、図形要素内に他の図形要素、区分線が存在しない場合は図形要素を図形オブジェクトとする。
次に、図9のステップS701の処理の詳細について、図10を用いて説明する。
図10は本発明の実施形態1のステップS701の処理の詳細を示すフローチャートである。
まず、ステップS710で、ベクトルデータより両端に連結していない不要なベクトルを除去し、閉図形構成ベクトルを抽出する。
次に、ステップS711で、閉図形構成ベクトルの中から該ベクトルの始点を開始点とし、時計回りに順にベクトルを追跡する。そして、この追跡を、開始点に戻るまで行い、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する。また、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらにまだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。
最後に、ステップS712で、ステップS710で除去された不要ベクトルの内、ステップS711で閉図形としてグループ化されたベクトルに接合しているもの(閉図形連結ベクトル)を検出し、一つの図形要素としてグループ化する。
以上の処理によって、図形ブロックを個別に再利用可能な個別の図形オブジェクトとして扱うことが可能になる。
次に、上述の図3のステップS125のブロックセレクション処理、ステップS127のOCR処理、ステップS128のベクトル化処理によって得られるデータは、図11に示す中間データ形式のファイルとして変換されている。ここで、このようなデータ形式は、ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
ここで、DAOFのデータ構造について、図11を用いて説明する。
図11は本発明の実施形態1のDAOFのデータ構造を示す図である。
図11において、Header791では、処理対象の原稿画像に関する情報が保持される。レイアウト記述データ部792では、原稿画像中のText(文字)、Title(タイトル)、Caption(キャプション)、Lineart(線画)、Picture(自然画)、Frame(枠)、Table(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。
文字認識記述データ部793では、Text、Title、Caption等のTextブロックを文字認識して得られる文字認識結果を保持する。
表記述データ部794では、Tableブロックの構造の詳細を格納する。画像記述データ部795は、GraphicやImage等のブロックのイメージデータを画像データから切り出して保持する。
このようなDAOFは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクト(ブロック)を再利用することはできない。
そこで、実施形態1では、このDAOFから文書作成アプリケーションで利用可能なアプリデータに変換するアプリデータ変換処理を、図3のステップS128のベクトル化処理後に、あるいは図3のステップS130の後処理の一部として実行する。
<アプリデータ変換処理>
以下、このアプリデータ変換処理の詳細について、図12を用いて説明する。
図12は本発明の実施形態1のアプリデータ変換処理の詳細を示すフローチャートである。
まず、ステップS8000で、DAOFデータの入力を行う。次に、ステップS8002で、アプリデータの元となる文書構造ツリーを生成する。そして、ステップS8004で、文書構造ツリーを元に、DAOF内の実データを流し込み、実際のアプリデータを生成する。
次に、図12のステップS8002の処理の詳細について、図13を用いて説明する。
図13は本発明の実施形態1のステップS8002の処理の詳細を示すフローチャートである。また、図14は本発明の実施形態1の文書構造ツリーの説明図である。
尚、図13の処理において、全体制御の基本ルールとして、処理の流れは、ミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行する。
以後、ブロックとは、ミクロブロック及びマクロブロック全体を指す。
まず、ステップS8100で、ブロック単位で縦方向の関連性を元に再グループ化する。スタート直後は、ミクロブロック単位での判定となる。
ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどで定義することができる。また、距離、幅、高さなどの情報はDAOFを参照し、抽出する。
例えば、図14(a)は実際の原稿画像のページ構成、図14(b)はその文書構造ツリーである。ステップS8100の処理によって、ブロックT3、T4、T5が一つのグループV1、ブロックT6、T7が一つのグループV2が同階層グループとして、まず生成される。
ステップS8102で、縦方向のセパレータの有無をチェックする。セパレータとは、例えば、物理的にはDAOF中で線の属性を持つブロックである。また、論理的な意味としては、文書作成アプリケーション中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。
ステップS8104で、分割がこれ以上存在し得ないか否かを縦方向のグループ長を利用して判定する。具体的には、縦方向のグループ長が原稿画像のページ高さであるか否かを判定する。縦方向のグループ長がページ高さである場合(ステップS8104でYES)、処理を終了する。一方、縦方向のグループ長がページ高さでない場合(ステップS8104でNO)、ステップS8106に進む。
図14(a)の原稿画像の場合は、セパレータもなく、グループ長はページ高さではないので、ステップS8106に進む。
ステップS8106で、ブロック単位で横方向の関連性を元に再グループ化する。ここもスタート直後の第一回目はミクロブロック単位で判定を行うことになる。また、関連性、及びその判定情報の定義は、縦方向の場合と同じである。
図14(a)の原稿画像の場合は、ブロックT1、T2でグループH1、グループV1、V2でグループH2、グループV1、V2の階層の1つ上の同階層グループとして生成される。
ステップS8108で、横方向セパレータの有無をチェックする。図14(a)では、S1が横方向セパレータとなっているので、これを文書構造ツリーに登録し、H1、S1、H2という階層が生成される。
ステップS8110で、分割がこれ以上存在し得ないか否かを横方向のグループ長を利用して判定する。具体的には、横方向のグループ長がページ幅であるか否かを判定する。横方向のグループ長がページ幅である場合(ステップS8110でYES)、処理を終了する。一方、横方向のグループ長がページ幅でない場合(ステップS8110でNO)、ステップS8102に戻り、再びもう一段上の階層で、ステップS8100以降の処理を実行する。
図14の場合は、横方向のグループ長がページ幅となるので、ステップS8110で処理を終了し、最後に、ページ全体を表す最上位階層のV0が文書構造ツリーに付加される。
文書構造ツリーが完成した後、その文書構造ツリーに基づいて、図13のステップS8004で、アプリデータの生成を行う。
図14の場合は、具体的には、以下のようにして、アプリデータを生成する。
即ち、H1は横方向に2つのブロックT1とT2があるので、2カラムとして出力し、ブロックT1の内部情報(DAOFを参照、文字認識結果の文章、画像など)を出力し、その後、カラムを変え、ブロックT2の内部情報を出力、その後、S1を出力する。
次に、H2は横方向に2つのブロックV1とV2があるので、2カラムとして出力し、ブロックV1はT3、T4、T5の順にその内部情報を出力し、その後、カラムを変え、ブロックV2のT6、T7の内部情報を出力する。
以上のようにして、DAOFからアプリデータへの変換処理を実行する。
<傾き補正処理>
次に、図3のステップS130の傾き補正処理の詳細について説明する。
まず、「自動ブロック傾き補正」モードがONに設定されている場合には、以下の処理を行う。
ステップS126で検出された各ブロックの傾き角度を参照して、各ブロック毎に傾き方向とは逆に傾き角度分回転することにより、傾き補正を行う。このとき、傾き補正は、各ブロックの中心位置を変えないように回転処理を行うことにより、各ブロック間のレイアウトを変更せずに回転することができる。
また、実施形態1のように、各ブロックがベクトルデータで構成されている場合には、この回転処理を容易に実行することができる。
例えば、SVG形式のベクトルデータの図形ブロックを回転するには、rotateコマンドを使用して、回転角度angleのパラメータを指定すればよい。
また、傾き補正することにより、傾き補正後の各ブロックが重なる場合は、重なるブロックを縮小することにより、ブロック間の重複を避けることが可能となる。
例えば、図15(a)において、傾き補正処理前のブロックA及びBに対し、ブロックAが傾き補正処理によって、図15(b)のように、ブロックAとBが重なる場合には、図15(c)のように、ブロックAを縮小することにより、ブロックAとBの重なりをなくすことが可能となる。
例えば、SVG形式のベクトルデータでは、scaleコマンドを使用して、ブロックAのx,y方向の拡大縮小率をパラメータとして指定すれば良い。
また、ブロック間の重なりをなくすために、ブロックAを傾き補正処理後に平行移動することも可能である。この場合、他のブロックと重なったり、原稿枠からはみ出さない範囲で移動することが望ましい。
例えば、SVG形式のベクトルデータでは、translateコマンドを使用して、ブロックAのx,y方向の移動量をパラメータとして指定すれば良い。
同様にして、ブロックBも縮小することも可能である。そのため、原稿画像中の任意のブロックを所定の縮小率で縮小する場合には、残りのブロックも同じ縮小率で縮小して、全体的なレイアウトバランスをより好適に保つようにすることも可能である。
以上説明したように、実施形態1によれば、画像を属性毎に複数のオブジェクトに分割し、得られた各オブジェクトの傾きを検出するとともに、そのオブジェクトに対応するベクトルデータを生成する。そして、検出した傾きに基づいて、各オブジェクトを、そのベクトルデータを用いて傾き補正を実行する。
特に、ベクトルデータを用いて、傾き補正を実行することで、容易にかつ精度良く、高速に各オブジェクトの傾き補正を実行することができる。また、ベクトルデータの形式で画像を管理することで、画像劣化を発生せずに、その画像の再利用(再編集)を容易に実現することができる。
尚、オブジェクトの傾き検出は、ブロックセレクション処理によって得られた各オブジェクトのブロック情報に基づいて実行したが、ベクトル化処理後の各オブジェクトのベクトルデータに基づいて実行しても良い。
<実施形態2>
実施形態1では、「自動ブロック傾き補正」モードをONに設定して、ベクトルスキャンを実行した場合には、自動的に傾き補正処理が実行される構成について説明した。これに対し、実施形態2では、画像読取後に、その画像のブロックセレクション処理後の画像のプレビュー表示を行い、最終的なベクトルデータを生成する前に、ベクトル化処理の状況及び傾き補正処理の状況を予め確認することが可能な構成について説明する。
実施形態2では、図4Cの操作画面10002において、読込開始キー100020を押下すると、スキャン動作が開始され原稿を読み取る。原稿の読取が終了すると、図16の操作画面10003に表示が切り替わる。
尚、実施形態2では、図3のステップS123で入力した読取原稿画像に対して、図3のステップS125のブロックセレクション処理までの処理を実行して、その処理結果(オブジェクト化処理結果)を、例えば、記憶部111に一旦格納する。
そして、図16の操作画面10003では、この処理結果を含む画像100029が表示され、その画像100029を構成する各オブジェクトが単位(属性)別に矩形枠に囲まれて表示される。
各オブジェクトは、図3のステップS125のブロックセレクション処理で自動的に認識された属性毎に、異なる色の矩形枠で表現される。
例えば、TEXT(文字)は赤、IMAGE(写真)は黄色というように、各オブジェクトを囲む矩形枠を異なる色で表現することで、ブロックセレクション処理で分割された属性別のオブジェクトを容易に識別することができる。これにより、オペレータの視認性が向上する。もちろん異なる色ではなく、矩形枠を、その線の太さや形状(点線)等の他の表示形態で表現しても良い。また、各オブジェクト毎に、スクリーンをかけて表示しても構わない。
画像100029の初期の表示状態は、画像読取部110で読み取った際のイメージ(圧板イメージ)であるが、必要に応じて、拡大/縮小キー100036を用いることで画像サイズを拡大/縮小することが可能である。また、拡大することによって、画像100029の表示内容がその表示エリアを超えて視認できない場合には、スクロールキー10035を用いて画像100029を上下左右に移動することで、その視認できない部分を確認することが可能である。
図16では、画像100029の中央部の文字オブジェクト100030(文字列「We are always waiting YOU!」)が選択されている状態を示している。特に、図16では、選択状態のオブジェクトを、その属性を示す色(この場合、赤)の実線の矩形枠で、それ以外の非選択状態のオブジェクトはそれぞれの属性を示す色の破線の矩形枠で表示されている。このように、矩形枠の表示形態を選択状態と非選択状態に応じて異ならせることで、各オブジェクトの選択状態/非選択状態を容易に確認することができる。
この例では、文字オブジェクト100030が赤の実線の矩形枠で、グラフィックオブジェクト100037が青の破線の矩形枠で、画像オブジェクト100038が黄色の破線の矩形枠で、表オブジェクト100039a及びbが緑の破線の矩形枠で表示した場合の例を示しており、それ以外の残りの部分は背景オブジェクトとなる。
尚、背景オブジェクトは、画像100029を構成するオブジェクトを抽出した後の残りの画像部分であるので、特に、矩形枠を用いた表示を行っていない。しかしながら、背景指定という意味で、背景画像の外郭を他のオブジェクト同様に矩形枠で表示する構成としても良い。その際、他のオブジェクトを非表示にして、背景オブジェクトの視認性を向上させるようにしても良い。
編集(例えば、文字オブジェクトであれば、文字オブジェクト中の文字列の編集、グラフィックオブジェクトであれば、そのグラフィックオブジェクトの色調整)を行うためのオブジェクトの選択は、例えば、直接、文字オブジェクト100030内の領域をタッチして指定する方法と、オブジェクト選択キー100032を用いて指定する方法がある。どちらの方法を用いても、選択されたオブジェクトの矩形枠は実線になり、非選択のオブジェクトの矩形枠は破線になる。
また、それと同時に選択されているオブジェクトの属性に相当するオブジェクト属性キー100031(この場合、Text、それ以外に、Graphic、Table、Image、BachGroundの種類が存在する)が選択される。この場合、その選択状態を示すために、該当するオブジェクト属性キーはスクリーン表示される。もちろん、これ以外にも、選択状態/非選択状態を示すことができれば、網掛け表示、ブリンク表示等の他の表示形態を用いることができる。
尚、ADFを用いて、複数ページの原稿を読み込んだ場合は、操作画面10003の初期状態では、複数ページの先頭ページの画像が表示され、それ以降のページの画像については、ページ指定キー100033を用いることで、所望するページの画像に切り換えることが可能である。
選択されたオブジェクトのベクトル化の可否の設定(ベクトルデータとして確定(保存)するための設定)は、OKキー100034によって決定される。つまり、OKキー100034を押下すると、この表示されている画像100029に対し、選択されている1つ以上のオブジェクトに対応するベクトル化処理が実行されることになる。一方、設定取消キー100040を押下すると、この操作画面10003において実行された各種設定を破棄して、図4Aの基本画面10000に戻る。
また、傾き補正キー100041を押下すると、各ブロック(オブジェクト)の傾き角度を検出して、各ブロック毎に傾き補正処理を実行する。
この傾き補正キー100041を押下すると、図17の操作画面10004が表示される。
図17に示すように、操作画面10004では、図16の操作画面中の表オブジェクト100039a及びbが傾き補正されていることがわかる。ここで、OKキー100034を押下することにより、補正後のブロック(オブジェクト)に対応するベクトル化処理が実行されることになる。
また、図17の微調整キー10042は、傾き補正されたブロックの位置を微調整するための微調整画面(不図示)を呼び出すための画面であり、微調整画面では、ユーザが各ブロック毎に傾き補正されたブロックの位置や傾きを微調整することが可能である。
この微調整の方法としては、例えば、回転角度や移動量を直接数値で入力したり、微調整画面に構成される回転方向や移動方向用のキーを操作する方法がある。
尚、傾き補正処理前後の画像は、異なる操作画面で表示する構成としているが、同一画面上に対照表示する構成とすることも可能である。
[送信/ファックス操作仕様]
次に、ファイル送信/ファックスを行うための操作画面について、図18A〜図18Cを用いて説明する。
図18A〜図18Cは本発明の実施形態1の操作画面の一例を示す図である。
図18Aの操作画面10010は、ファイル送信/ファックスを行うための基本画面である。この操作画面10010による処理を実行する場合には、処理対象の原稿画像をMFP100に読み込む場合の読込設定を行う必要があり、読込設定プルダウンメニュー100100から設定が可能である。これを押下すると、図18Bの操作画面10011のように、プルダウンメニューが表示される。このプルダウンメニューでは、読込設定として、例えば、200×200dpi、300×300dpiを選択することが可能である。
次に、操作画面10011の詳細設定キー100110を押下すると、図18Cの操作画面10012(読込設定画面)が表示される。この操作画面10012の応用モードキー100120を押下すると、図4Bの操作画面10001が表示される。
[ボックス操作仕様]
次に、MFP100で読み取った画像データを内部の記憶部111に保存するため(ボックス機能)の操作画面について、図19A〜図19Dを用いて説明する。
図19A〜図19Dは本発明の実施形態1の操作画面の一例を示す図である。
図19Aの操作画面10020は、画像データを保存する(ボックス機能)ための基本画面である。現在、MFP100で管理されているボックス群(記憶単位)の内、ボックス00を示すボックスキー100200を押下すると、図19Bの操作画面10021が表示される。
操作画面10021において、原稿読込キー100211を押下すると、原稿読込設定画面が表示される。この原稿読込設定画面は、送信/ファクスの操作仕様と同様で、図18Cの操作画面10012が表示される。
この例では、ボックス00に既に1つのデータファイルが格納されている状態を示しており、このデータファイルの行100210を押下すると、そのデータファイルを選択して、そのデータファイルを処理対象とすることができる。
図19Cの操作画面10022は、データファイルを選択した場合の表示状態を示しており、この場合、選択された行10220が反転表示(網掛表示)される。データファイルを選択すると、そのデータファイルの内容を確認することができ、その場合には画像表示キー100222を押下することで、図16の操作画面10003が表示される。
同様に、図19Cの操作画面10022で、プリントキー100221を押下すると、図19Dの操作画面10023が表示され、プリント設定が可能になる。ここで、応用モードキー100230を押下すると、図4Bの画面10001が表示される。
以上説明したように、実施形態2によれば、実施形態1で説明した効果に加えて、傾き補正処理前後の画像の状態を表示して、最終的に傾き補正処理の実行の有無をユーザに確認させることができる。
このように、傾き補正処理の状態をユーザに確認させる機会を提供できるとともに、ユーザが意図しない傾き補正処理が実行されることを防止することができる。
<実施形態3>
実施形態1では、自動的に傾き補正を含めたベクトルデータを生成する構成について説明した。また、実施形態2では、画像読取後に、傾き補正処理前の読取画像のプレビュー表示を行い、また、操作に応じて、傾き補正処理の状況を予め確認することが可能な構成について説明した。
そして、実施形態1や2では、傾き補正処理の処理対象は、原稿画像中のすべての属性のオブジェクトとしているが、用途や目的に応じては、傾き補正処理の処理対象を所定の属性のオブジェクトのみとするようにしても良い。
一般的に、文字や線、表等のオブジェクトは傾きがあると、その傾きの状態が特に目立つことが多い。また、JPEG圧縮された写真オブジェクトは、傾き補正処理で実行する回転処理を実現するために複雑な大規模回路が必要であったり、処理に時間がかかる場合が多い。更に、写真オブジェクトは、そのデータ内容によっては、少し傾いていても目立たなかったり、その状態が気にならない場合が多い。
そこで、例えば、実施形態3では、所定属性(例えば、表)のオブジェクトのみ傾き補正処理を実行する。特に、表オブジェクトは通常斜めに配置することはないため、例えば、実施形態1や2の構成において、傾き補正処理の処理対象を、原稿画像中の表オブジェクトのみに設定して、傾き補正処理を実行する。
また、実施形態2の構成において、表オブジェクトについては、先に傾き補正処理を実行しておき、その傾き補正処理結果と、傾き補正処理を実行していないそれ以外の他の属性のオブジェクトからなる画像をプレビュー表示するようにしても良い。
以上説明したように、実施形態3によれば、実施形態1や2で説明した効果に加えて、最終的に傾き補正処理の実行の有無を画像中のオブジェクト単位で制御することができる。
このように、用途や目的に応じて、異なる属性のオブジェクトそれぞれに対して好適な傾き補正処理を実行することができる。
<実施形態4>
実施形態1〜3では、読取画像中のオブジェクトに対して、傾き補正処理を実行する構成を説明したが、印刷時に装置の搬送系の状態によっては、印刷用紙が斜行して、画像が印刷用紙に対して傾いた状態で印刷されるような場合がある。そこで、実施形態4では、印刷対象のベクトルデータ中のオブジェクトに対して傾き補正処理を適用することで、印刷用紙が傾いている場合でも、正常な位置で画像が印刷できる構成について説明する。
まず、印刷部112の構成例について、図20を用いて説明する。
図20は本発明の実施形態4の印刷部の構成例を示す図である。
図20は、印刷部112の一例として、4ドラムタイプのレーザビームプリンタを示している。
図20において、913はポリゴンミラーであり、4つの半導体レーザ発振器(不図示)より発光された4本のレーザ光を受ける。その内の1本は、ミラー914、915、916を経て感光ドラム917を走査する。次の1本は、ミラー918、919、920を経て感光ドラム921を走査する。更に、次の1本は、ミラー922、923、924を経て感光ドラム925を走査する。更に、次の1本は、ミラー926、927、928を経て感光ドラム929を走査する。
一方、930はイエロー(Y)のトナーを供給する現像器であり、レーザ光に従い、感光ドラム917上にイエローのトナー像を形成する。931はマゼンタ(M)のトナーを供給する現像器であり、レーザ光に従い、感光ドラム921上にマゼンタのトナー像を形成する。932はシアン(C)のトナーを供給する現像器であり、レーザ光に従い、感光ドラム925上にシアンのトナー像を形成する。933はブラック(K)のトナーを供給する現像器であり、レーザ光に従い、感光ドラム929上にブラックのトナー像を形成する。以上、4色(Y,M,C,K)のトナー像が印刷用紙に転写され、フルカラーの出力画像を得ることができる。
シートカセット934、935及び手差しトレイ936のいずれかより供給された印刷用紙は、レジストローラ937を経て、転写ベルト938上に吸着され、搬送される。給紙のタイミングと同期がとられて、予め感光ドラム917、921、925、929には各色のトナーが現像されており、印刷用紙の搬送とともに、各色トナーが印刷用紙に順次転写される。
各色のトナーが転写された印刷用紙は、分離され、搬送ベルト939により搬送され、定着器940によって、トナーが印刷用紙に定着される。定着器940を抜けた印刷用紙はフラッパ950によりいったん下方向へ導かれて印刷用紙の後端がフラッパ950を抜けた後、スイッチバックさせて排出する。これによりフェイスダウン状態で排出され、先頭頁から順にプリントしたときに正しい順となる。
尚、4つの感光ドラム917、921、925、929は、距離dをおいて、等間隔に配置されており、搬送ベルト939により、印刷用紙は一定速度vで搬送されており、このタイミング同期がなされて、4つの半導体レーザ発振器は駆動される。
また、レジストローラ937の下流側の印刷用紙の搬送路には、搬送方向に対する印刷用紙の斜行状態(傾き)を検出する光学センサ971及び972が配置されており、この光学センサ971及び972による検出結果によって、印刷用紙の斜行状態を検出することができる。
この印刷用紙の斜行状態(傾き)を検出する検出原理について、図21を用いて説明する。
図21は本発明の実施形態4の印刷用紙の斜行状態(傾き)を検出する検出原理を説明するための図である。
図21は、図20の印刷部118の光学センサ971及び972を上方から見た場合の配置図を示している。この光学センサ971及び972は、印刷用紙970が感光ドラム917の位置まで搬送される前の搬送路中に配置されている。
印刷用紙970が斜めに傾いたまま、搬送路を搬送された場合は、光学センサ971及び972それぞれが、印刷用紙を検知するタイミングが異なることになる。そこで、各光学センサの検知時間差を算出する。また、光学センサ971及び972間の距離及び印刷用紙の搬送速度vは既知であるため、これらの既知値と検知時間差によって、印刷用紙970の搬送方向に対する斜行状態(傾き角度)を算出することが可能である。
尚、この算出は、例えば、データ処理部115が実行する。
実施形態4では、印刷用紙が傾いている場合でも、正常な位置で画像が印刷できるように、印刷対象のベクトルデータの傾き補正処理を含む印刷処理を実行する。
以下、この時の傾き補正処理について、図22を用いて説明する。
図22は本発明の実施形態4の印刷処理を示すフローチャートである。
まず、ステップS1201で、初期設定として、用紙選択、プリント枚数等の印刷設定を実行する。この印刷設定は、例えば、図19Dの操作画面10023を介して実行する。印刷指示(プリント開始)が実行されると、印刷用紙が指定されたシートカセット(934、935あるいは936)から搬出され、光学センサ971及び972を経てレジストローラ937の位置まで搬送され、そこで、一旦印刷用紙の搬送を停止する。
ステップS1202で、光学センサ971及び972の検出結果に基づいて、印刷用紙の傾き角度を算出する。ステップS1203で、印刷用紙の傾きの有無を判定する。傾きがない場合(ステップS1203でNO)、ステップS1205に進み、印刷対象のベクトルデータに基づく印刷を実行する。一方、傾きがある場合(ステップS1203でYES)、ステップS1204に進む。
尚、この傾きの有無は、理想的には、算出された傾き角度が0度以外は、傾きがあると判定することになるが、ある程度の算出誤差を考慮して、算出された傾き角度が所定角度(例えば、2度)以上の場合に傾きがあると判定しても良い。
ステップS1204で、検出された傾き角度に基づいて、印刷対象のベクトルデータに対して、傾き方向の逆方向に回転する傾き補正処理を実行する。尚、印刷対象のベクトルデータが、複数ページ分のベクトルデータである場合には、各ページに対するベクトルデータに対して傾き補正処理を実行する。その後、ステップS1205で、傾き補正処理されたベクトルデータに基づく印刷を実行する。
以上のように、ベクトルデータは回転処理を容易に行うことが可能であるため、印刷時の傾き補正処理も、実施形態1〜3のベクトルスキャン時の傾き補正処理と同様に、容易に実行することが可能となる。
また、ベクトルスキャン後に続けて印刷を行うような場合には、ベクトルスキャン時の傾き補正処理と印刷時の傾き補正処理を同時に行うことも可能である。このとき、スキャン時の傾き補正角度と印刷時の傾き補正角度を合成することにより、一度の傾き補正処理(回転処理)で、スキャン時と印刷時で発生する傾きに対する傾き補正処理を実行することが可能となる。
また、印刷処理の速度向上を期待したい場合には、ステップS1201で、印刷用紙の搬送を停止せずに、ステップS1202で、傾き角度検出を実行する構成にしても良い。この場合、データ処理部115の処理能力にもよるが、1枚目の印刷用紙に印刷するベクトルデータに対して、時間的に、検出結果に基づく傾き補正処理を実行できない可能性がある。そのため、このような構成の場合は、2枚目以降の印刷用紙に対して傾き補正処理済のベクトルデータを印刷し、1枚目の印刷用紙に対しては傾き補正処理を施していないベクトルデータが印刷されることになる。
以上説明したように、実施形態4によれば、印刷時に、印刷用紙が斜行している状態でも、その状態に併せて、印刷対象のベクトルデータに傾き補正処理を実行することで、正常な位置で画像を印刷用紙に印刷することができる。
尚、上記実施形態1〜4では、傾き角度に関わらず、傾き補正処理を実行する構成としているが、予め設定された所定角度(例えば、20度)以上の傾きがあるオブジェクトに対しては、レイアウト上で予め意図的に斜め(傾けて)に配置されているオブジェクトと見なし、そのオブジェクトに対する傾き補正処理の実行を禁止する構成としても良い。
あるいは、所定のベクトルデータファイルのレイアウト情報を参照して、傾き補正処理の実行の有無を制御することも可能である。また、スキャン時に画像の特徴を検索することにより、サーバ上に別途保存してあるその画像のオリジナルファイルデータのレイアウトや傾き角度を参照して、傾き補正処理の実行の有無を制御することも可能である。
実施形態1〜4では、図1のMFP100内に、入力されたラスタ画像データをベクトルデータファイルに変換するベクトル化処理機能(傾き補正処理を含む)を搭載して、MFP100上の入力部113及び表示部116を介して、各種操作を実行する構成について説明したが、これに限定されるものではない。
例えば、MFP100を制御することが可能なマネージメントPCを構成し、このマネージメントPC上の操作部で各種操作を行い、かつMFP100で入力されたラスタ画像データをマネージメントPCに転送して、マネージメントPC上でベクトル化処理等の各種処理を実行する構成としても良い。
上記実施形態1〜3においては、処理対象の画像として、MFP100から読み取った画像に対して、図3の処理を実行する場合を例に挙げて説明したが、例えば、クライアントPC101から受信する印刷データや、ネットワーク104を介して受信した画像データ(例えば、デジタルカメラで撮影された画像データ)に対して、図3の処理を実行することも可能である。
上記実施形態1〜3においては、図1のオフィス10内で実現する場合を例に挙げて説明したが、ネットワーク104上の他のオフィス内のMFPや、ネットワーク104上のMFPで実現する構成としても良い。
画像処理システムとしては、MFPやマネージメントPCで実現する構成としているが、画像データを扱うことが可能な機器(例えば、デジタルカメラ、携帯端末(PDA、携帯電話等))であれば、その機器で実現する構成としても良い。
入力された画像データに対応するオリジナル画像が既にMFP100の記憶部もしくはネットワーク上のサーバで管理されている場合には、そのオリジナル画像に対して、図3の処理を実行する構成としても良い。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
また、以上の実施形態では、ベクトルモードの指定をMFPやマネージメントPCを操作して行うようにしたが、本発明はこれに限定されるものではない。例えば、原稿にマーカーペンで閉領域を書き込み、その閉領域で囲まれたオブジェクトを所望のベクトルモードに従ってベクトル化するようにするなど種々の変更が可能である。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の実施形態1の画像処理システムの構成を示すブロック図である。 本発明の実施形態1のMFPの詳細構成を示す図である。 本発明の実施形態1の画像処理システムが実行する処理全体の概要を示すフローチャートである。 本発明の実施形態1の操作画面の一例を示す図である。 本発明の実施形態1の操作画面の一例を示す図である。 本発明の実施形態1の操作画面の一例を示す図である。 本発明の実施形態1のブロックセレクション処理の概念を説明するための図である。 本発明の実施形態1のブロック情報の一例を示す図である。 本発明の実施形態1の傾き角度検出処理を説明するための図である。 本発明の実施形態1のベクトル化処理を説明するための図である。 本発明の実施形態1のベクトル化処理を説明するための図である。 本発明の実施形態1のベクトルデータのグループ化処理を示すフローチャートである。 本発明の実施形態1のステップS701の処理の詳細を示すフローチャートである。 本発明の実施形態1のDAOFのデータ構造を示す図である。 本発明の実施形態1のアプリデータ変換処理の詳細を示すフローチャートである。 本発明の実施形態1のステップS8002の処理の詳細を示すフローチャートである。 本発明の実施形態1の文書構造ツリーの説明図である。 本発明の実施形態1の傾き補正処理を説明するための図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態2の操作画面の一例を示す図である。 本発明の実施形態4の印刷部の構成例を示す図である。 本発明の実施形態4の印刷用紙の斜行状態(傾き)を検出する検出原理を説明するための図である。 本発明の実施形態4の印刷処理を示すフローチャートである。
符号の説明
100 MFP
102 クライアントPC
103 プロキシサーバ
104 ネットワーク
107 LAN
110 画像読取部
111 記憶部
112 印刷部
113 入力部
114 ネットワークI/F
115 データ処理部
116 表示部

Claims (6)

  1. 入力された画像データに画像処理を施す画像処理装置であって、
    入力された画像データを複数のブロックに分割する分割手段と、
    前記分割手段で分割された各ブロックの傾き角度を検出する検出手段と、
    前記分割手段で分割されたブロック毎に、前記入力された画像データをベクトルデータに変換する変換手段と、
    前記検出手段で検出された各ブロックの傾き角度に基づいて、前記変換手段で変換された各ブロックに対応するベクトルデータを傾き補正し、更に、当該傾き補正した後のブロックのうち第1ブロックが他の第2ブロックと重なる場合は、その重なりがなくなるように、前記第1ブロック及び前記第2ブロックの少なくともいずれか一方に対応する前記傾き補正後のベクトルデータに対して、縮小または平行移動の少なくともいずれかの補正を実行する補正手段と
    を備えることを特徴とする画像処理装置。
  2. 原稿を読み取る読取手段を更に備え、
    前記入力された画像データは、前記読取手段で原稿を読み取ることにより生成される画像データである
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記検出手段は、前記分割手段で分割されたブロックの内、所定の属性のブロックの傾き角度を検出し、
    前記補正手段は、前記検出手段で検出された傾き角度に基づいて、前記所定の属性のブロックに対応するベクトルデータを傾き補正し、更に、当該傾き補正した後のブロックのうち第1ブロックが他の第2ブロックと重なる場合は、その重なりがなくなるように、前記第1ブロック及び前記第2ブロックの少なくともいずれか一方に対応する前記傾き補正後のベクトルデータに対して、縮小または平行移動の少なくともいずれかの補正を実行する
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 前記検出手段で検出された傾き角度が所定角度以上の場合、前記補正手段による補正の実行を禁止する禁止手段を更に備える
    ことを特徴とする請求項1に記載の画像処理装置。
  5. 入力された画像データに画像処理を施す画像処理装置の制御方法であって、
    分割手段が、入力された画像データを複数のブロックに分割する分割工程と、
    検出手段が、前記分割工程で分割された各ブロックの傾き角度を検出する検出工程と、
    変換手段が、前記分割工程で分割されたブロック毎に、前記入力された画像データをベクトルデータに変換する変換工程と、
    補正手段が、前記検出工程で検出された各ブロックの傾き角度に基づいて、前記変換工程で変換された各ブロックに対応するベクトルデータを傾き補正し、更に、当該傾き補正した後のブロックのうち第1ブロックが他の第2ブロックと重なる場合は、その重なりがなくなるように、前記第1ブロック及び前記第2ブロックの少なくともいずれか一方に対応する前記傾き補正後のベクトルデータに対して、縮小または平行移動の少なくともいずれかの補正を実行する補正工程と
    を備えることを特徴とする画像処理装置の制御方法。
  6. コンピュータを、
    入力された画像データを複数のブロックに分割する分割手段、
    前記分割手段で分割された各ブロックの傾き角度を検出する検出手段、
    前記分割手段で分割されたブロック毎に、前記入力された画像データをベクトルデータに変換する変換手段、
    前記検出手段で検出された各ブロックの傾き角度に基づいて、前記変換手段で変換された各ブロックに対応するベクトルデータを傾き補正し、更に、当該傾き補正した後のブロックのうち第1ブロックが他の第2ブロックと重なる場合は、その重なりがなくなるように、前記第1ブロック及び前記第2ブロックの少なくともいずれか一方に対応する前記傾き補正後のベクトルデータに対して、縮小または平行移動の少なくともいずれかの補正を実行する補正手段、
    として機能させるためのプログラム。
JP2004167672A 2004-06-04 2004-06-04 画像処理装置、及びその制御方法、プログラム Expired - Fee Related JP4574235B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004167672A JP4574235B2 (ja) 2004-06-04 2004-06-04 画像処理装置、及びその制御方法、プログラム
US11/145,211 US20050271296A1 (en) 2004-06-04 2005-06-03 Image processing apparatus, information processing apparatus, control method therefor, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004167672A JP4574235B2 (ja) 2004-06-04 2004-06-04 画像処理装置、及びその制御方法、プログラム

Publications (3)

Publication Number Publication Date
JP2005346586A JP2005346586A (ja) 2005-12-15
JP2005346586A5 JP2005346586A5 (ja) 2007-07-12
JP4574235B2 true JP4574235B2 (ja) 2010-11-04

Family

ID=35448993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004167672A Expired - Fee Related JP4574235B2 (ja) 2004-06-04 2004-06-04 画像処理装置、及びその制御方法、プログラム

Country Status (2)

Country Link
US (1) US20050271296A1 (ja)
JP (1) JP4574235B2 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100580183B1 (ko) * 2004-01-09 2006-05-15 삼성전자주식회사 스캔영역의 좌우 위치 보정 방법 및 장치
JP4510535B2 (ja) * 2004-06-24 2010-07-28 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4227569B2 (ja) * 2004-07-07 2009-02-18 キヤノン株式会社 画像処理システム、画像処理装置の制御方法、プログラム及び記録媒体
JP2006023945A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP2006023944A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP4208780B2 (ja) * 2004-07-07 2009-01-14 キヤノン株式会社 画像処理システム及び画像処理装置の制御方法並びにプログラム
US20060203258A1 (en) * 2005-03-10 2006-09-14 Kabushiki Kaisha Toshiba File management apparatus
JP4408836B2 (ja) * 2005-05-30 2010-02-03 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7420719B2 (en) * 2005-06-30 2008-09-02 Xerox Corporation Skew correction
US7460710B2 (en) * 2006-03-29 2008-12-02 Amazon Technologies, Inc. Converting digital images containing text to token-based files for rendering
CN101663635B (zh) * 2007-03-30 2014-07-23 皇家飞利浦电子股份有限公司 用于***控制的方法和设备
JP5031448B2 (ja) * 2007-06-01 2012-09-19 キヤノン株式会社 画像処理装置及びその制御方法、並びに記憶媒体
JP5142858B2 (ja) * 2008-07-03 2013-02-13 キヤノン株式会社 画像処理装置および画像処理方法
JP2010028206A (ja) * 2008-07-15 2010-02-04 Canon Inc 画像形成システム、画像形成装置、画像処理装置および画像形成方法
JP2010026682A (ja) * 2008-07-17 2010-02-04 Seiko Epson Corp シート状媒体の読取制御方法およびシート状媒体処理装置
JP5043086B2 (ja) * 2008-10-22 2012-10-10 株式会社東芝 ドキュメント処理装置及びドキュメント処理方法
JP5153676B2 (ja) * 2009-02-10 2013-02-27 キヤノン株式会社 画像処理装置、画像処理方法、プログラムおよび記憶媒体
JP2011085402A (ja) * 2009-10-13 2011-04-28 Mitsutoyo Corp 表面性状測定機
US8650939B2 (en) 2009-10-13 2014-02-18 Mitutoyo Corporation Surface texture measuring machine and a surface texture measuring method
US9729755B2 (en) * 2011-08-31 2017-08-08 Xerox Corporation Intelligent image correction with preview
JP5780064B2 (ja) * 2011-08-31 2015-09-16 ブラザー工業株式会社 画像読取装置
US9355061B2 (en) 2014-01-28 2016-05-31 Arm Limited Data processing apparatus and method for performing scan operations
JP6520328B2 (ja) * 2015-04-09 2019-05-29 コニカミノルタ株式会社 画像形成装置および画像形成方法
JP2017170747A (ja) * 2016-03-23 2017-09-28 富士ゼロックス株式会社 画像形成装置、及び画像形成プログラム
KR20180019976A (ko) * 2016-08-17 2018-02-27 에스프린팅솔루션 주식회사 화상 형성 장치, 그의 스캔 이미지 보정 방법 및 비일시적 컴퓨터 판독가능 기록매체
US10013631B2 (en) * 2016-08-26 2018-07-03 Smart Technologies Ulc Collaboration system with raster-to-vector image conversion
JP6635057B2 (ja) * 2017-01-18 2020-01-22 京セラドキュメントソリューションズ株式会社 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
JP6448696B2 (ja) * 2017-03-22 2019-01-09 株式会社東芝 情報処理装置、方法及びプログラム
US11023745B2 (en) 2018-12-27 2021-06-01 Beijing Didi Infinity Technology And Development Co., Ltd. System for automated lane marking
WO2020139355A1 (en) * 2018-12-27 2020-07-02 Didi Research America, Llc System for automated lane marking
US10990815B2 (en) 2018-12-27 2021-04-27 Beijing Didi Infinity Technology And Development Co., Ltd. Image pre-processing in a lane marking determination system
US11087173B2 (en) 2018-12-27 2021-08-10 Beijing Didi Infinity Technology And Development Co., Ltd. Using image pre-processing to generate a machine learning model
JP7317561B2 (ja) * 2019-04-19 2023-07-31 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
US11803581B2 (en) * 2021-05-24 2023-10-31 Infrrd Inc System for identifying and linking entity relationships in documents

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000201273A (ja) * 1998-11-06 2000-07-18 Seiko Epson Corp 画像データ生成プログラムを記録した媒体、画像データ生成装置および画像データ生成方法
JP2000228722A (ja) * 1999-02-04 2000-08-15 Seiko Epson Corp 傾き調整及び写真配置のための方法、装置および記録媒体

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4723297A (en) * 1984-09-27 1988-02-02 Siemens Aktiengesellschaft Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results
US5101448A (en) * 1988-08-24 1992-03-31 Hitachi, Ltd. Method and apparatus for processing a document by utilizing an image
US5054098A (en) * 1990-05-21 1991-10-01 Eastman Kodak Company Method of detecting the skew angle of a printed business form
US5243418A (en) * 1990-11-27 1993-09-07 Kabushiki Kaisha Toshiba Display monitoring system for detecting and tracking an intruder in a monitor area
US5285504A (en) * 1991-09-27 1994-02-08 Research Foundation Of The State University Of New York Page segmentation with tilt compensation
US5644366A (en) * 1992-01-29 1997-07-01 Canon Kabushiki Kaisha Image reproduction involving enlargement or reduction of extracted contour vector data for binary regions in images having both binary and halftone regions
US6205259B1 (en) * 1992-04-09 2001-03-20 Olympus Optical Co., Ltd. Image processing apparatus
JPH06274680A (ja) * 1993-03-17 1994-09-30 Hitachi Ltd 文書認識方法およびシステム
CA2116600C (en) * 1993-04-10 1996-11-05 David Jack Ittner Methods and apparatus for inferring orientation of lines of text
US5513304A (en) * 1993-04-19 1996-04-30 Xerox Corporation Method and apparatus for enhanced automatic determination of text line dependent parameters
EP0677818B1 (en) * 1994-04-15 2000-05-10 Canon Kabushiki Kaisha Image pre-processor for character recognition system
US5517587A (en) * 1994-09-23 1996-05-14 International Business Machines Corporation Positioning method and apparatus for line scanned images
US5666503A (en) * 1994-11-14 1997-09-09 Xerox Corporation Structured image (SI) image editor and method for editing structured images
JP2761467B2 (ja) * 1995-03-29 1998-06-04 インターナショナル・ビジネス・マシーンズ・コーポレイション 画像切り出し装置及び文字認識装置
JPH08336165A (ja) * 1995-06-09 1996-12-17 Canon Inc 複眼撮像装置
JP3504054B2 (ja) * 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
US6549681B1 (en) * 1995-09-26 2003-04-15 Canon Kabushiki Kaisha Image synthesization method
JP4169462B2 (ja) * 1999-08-26 2008-10-22 株式会社リコー 画像処理方法及び装置、デジタルカメラ、画像処理システム、並びに、画像処理プログラムを記録した記録媒体
JP3840020B2 (ja) * 1999-12-14 2006-11-01 株式会社東芝 動画像符号化装置
KR100350854B1 (ko) * 2001-04-13 2002-09-05 주식회사옌트 이진 영상 회전 시스템 및 그 방법
US20030154201A1 (en) * 2002-02-13 2003-08-14 Canon Kabushiki Kaisha Data storage format for topography data
JP4169185B2 (ja) * 2002-02-25 2008-10-22 富士通株式会社 画像連結方法、プログラム及び装置
AU2003246268A1 (en) * 2002-08-09 2004-02-25 Sharp Kabushiki Kaisha Image combination device, image combination method, image combination program, and recording medium containing the image combination program
EP1398726B1 (en) * 2002-09-11 2008-07-30 Samsung Electronics Co., Ltd. Apparatus and method for recognizing character image from image screen
KR100946888B1 (ko) * 2003-01-30 2010-03-09 삼성전자주식회사 영상화면 내의 피사체의 기울기 보정 장치 및 방법
US6897444B1 (en) * 2003-03-10 2005-05-24 Kla-Tencor Technologies Corporation Multi-pixel electron emission die-to-die inspection
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
US7359563B1 (en) * 2004-04-05 2008-04-15 Louisiana Tech University Research Foundation Method to stabilize a moving image
US7930627B2 (en) * 2005-09-22 2011-04-19 Konica Minolta Systems Laboratory, Inc. Office document matching method and apparatus
US8180159B2 (en) * 2007-06-06 2012-05-15 Sharp Kabushiki Kaisha Image processing apparatus, image forming apparatus, image processing system, and image processing method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000201273A (ja) * 1998-11-06 2000-07-18 Seiko Epson Corp 画像データ生成プログラムを記録した媒体、画像データ生成装置および画像データ生成方法
JP2000228722A (ja) * 1999-02-04 2000-08-15 Seiko Epson Corp 傾き調整及び写真配置のための方法、装置および記録媒体

Also Published As

Publication number Publication date
US20050271296A1 (en) 2005-12-08
JP2005346586A (ja) 2005-12-15

Similar Documents

Publication Publication Date Title
JP4574235B2 (ja) 画像処理装置、及びその制御方法、プログラム
JP4012140B2 (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
US7692834B2 (en) Image processing system, image forming apparatus, control method for the same, and program for implementing the control method
US7545992B2 (en) Image processing system and image processing method
CN1874395B (zh) 图像处理装置和图像处理方法
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
US8224131B2 (en) Image processing apparatus and image processing method
US7876471B2 (en) Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document
US7746507B2 (en) Image processing apparatus for image retrieval and control method therefor
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
US7596271B2 (en) Image processing system and image processing method
US8223389B2 (en) Information processing apparatus, information processing method, and program and storage medium therefor
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US8818110B2 (en) Image processing apparatus that groups object images based on object attribute, and method for controlling the same
US8199967B2 (en) Image processing apparatus, image processing method, and storage medium
US8452045B2 (en) Image processing method for generating easily readable image
JP4960796B2 (ja) 画像処理装置、画像処理方法ならびにそのプログラム及び記憶媒体
JP4541770B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4405861B2 (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2008148263A (ja) 画像形成装置及びその制御方法
JP5100354B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2005151455A (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2006163470A (ja) 画像処理装置および画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
JP2002142070A (ja) 画像伝送システムおよび画像伝送装置ならびにそれらの方法
JP2007216434A (ja) 印刷装置および印刷制御方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070529

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070529

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100806

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100818

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees