JP2006202197A - 画像管理システム - Google Patents
画像管理システム Download PDFInfo
- Publication number
- JP2006202197A JP2006202197A JP2005015532A JP2005015532A JP2006202197A JP 2006202197 A JP2006202197 A JP 2006202197A JP 2005015532 A JP2005015532 A JP 2005015532A JP 2005015532 A JP2005015532 A JP 2005015532A JP 2006202197 A JP2006202197 A JP 2006202197A
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- input
- registered
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Storing Facsimile Image Data (AREA)
Abstract
【課題】 複写機のボックス内文書はスキャン文書もしくは展開後のビットマップ画像であり、その複写機でのプリントは速いものの、プリント以外にしようできないデータであり、再利用に適さないという問題があった。
【解決手段】 MFP内部のBOXのHDDフルを防ぐとともに、速度重視の場合はラスタデータをBOXに登録することをユーザが選択できるようにして、ベクトル化してサーバに残して、再利用可能な状態でデータを保持する。
【選択図】 図13
【解決手段】 MFP内部のBOXのHDDフルを防ぐとともに、速度重視の場合はラスタデータをBOXに登録することをユーザが選択できるようにして、ベクトル化してサーバに残して、再利用可能な状態でデータを保持する。
【選択図】 図13
Description
本発明は、画像を記憶しておけるデジタル複写機等において、本体に記憶した画像からサーバ上のベクトルデータを検索し、プリントするものに関する。
従来、スキャナから読み取った画像データや、ホストコンピュータからネットワークを介して送られたPDLデータをビットマップに展開した画像データをハードディスクなどのメモリに一旦記憶し、そのメモリから任意の原稿の画像データを繰り返し読み出してプリントアウトする機能を備えたデジタル複写機が知られている。
また、このハードディスクなどのメモリをプリント出力用のテンポラリ画像メモリとして使用するだけでなく、ユーザ毎、部署毎等、論理的にパーティションを切ることで、そこに機密文書やよく使用する文書を入れておき、必要なときに複写機の操作パネルからユーザパスワードを入力して出力したり、ネットワークに接続された別の複写機にボックス内の文書を転送したりすることができるボックス機能が実現されている。
さらに、ネットワーク上の共有文書や共有画像を管理し、ネットワーク上の複数のホストから共有文書等を参照、検索、プリントをすることができるデータベースサーバが知られている。最近ではこのデータベースサーバ用の共有文書管理を行う文書管理アプリケーションに、ネットワークに接続された複写機等のハードディスク上の画像も操作できるようにしたものも存在するようになった。
又、別の従来例としては、例えば特許文献1と特許文献2をあげることが出来る。
特開2002−281277号公報
特開2000−201078号公報
しかしながら、複写機のボックス内文書はスキャン文書もしくは展開後のビットマップ画像であり、その複写機でのプリントは速いものの、プリント以外にしようできないデータであり、再利用に適さないという問題があった。
また、複写機のボックスは複写機毎に存在し、各複写機でそれぞれ同じ文書を保持している可能性があり、非効率であるという問題もあった。
本発明は、上記従来例の問題点に鑑みてなされたものであり、その目的とするところは、複写機内部のハードディスクへの画像蓄積と、ネットワーク上の画像データベースサーバ上へベクトル化しての画像蓄積とを自由に選択できるようにすることにより、いつでもユーザの必要な画像を取り出せ、ホストコンピュータ上で画像を再利用可能な画像管理システムを提供することである。
ネットワークに接続され、ネットワーク上の共有文書や共有画像を管理することができる画像データベースサーバと、画像データを入力する画像入力手段、前記画像入力手段より入力された画像データを記憶する画像記憶手段、前記画像記憶手段に記憶された画像データをプリント出力する画像出力手段、前記記憶手段に記憶された画像をベクトルデータに変換するベクトル化手段を含む画像処理装置において、前記ベクトル化手段により前記画像入力手段により入力された画像をベクトル化し、前記画像データベースサーバに既に登録されている場合は、前記画像は保持せず、画像データベースサーバの登録場所情報のみを前記記憶手段に保持することを特徴とする画像管理システムである。
以上のように本発明によれば、複写機等の画像処理装置上のハードディスクに入力し、保持する場合に、ネットワーク上の画像データベースサーバ上に電子データを保持し、検索することにより、複数の複写機で同じ画像を保持することなく、必要なときにきれいな出力を得ることができる。
(第1の実施例)
本発明の実施例にかかわる画像入出力システムの全体構成を、図1を参照しながら説明する。
本発明の実施例にかかわる画像入出力システムの全体構成を、図1を参照しながら説明する。
リーダー部(画像入力装置)200は、原稿画像を光学的に読み取り、画像データに変換する。リーダー部200は、原稿を読取るための機能を持つスキャナユニット210と、原稿用紙を搬送するための機能を持つ原稿給紙ユニット250とで構成される。
プリンタ部(画像出力装置)300は、記録紙を搬送し、その上に画像データを可視画像として印字して装置外に排紙する。プリンタ部300は、複数種類の記録紙カセットを持つ給紙ユニット310と、画像データを記録紙に転写、定着させる機能を持つマーキングユニット320と、印字された記録紙をソート、ステイプルして機外へ出力する機能を持つ排紙ユニット330とで構成される。
制御装置110は、リーダー部200、プリンタ部300と電気的に接続され、さらにネットワーク400を介して、画像データベースサーバ107、ホストコンピュータ180と接続されている。
制御装置110は、リーダー部200を制御して、原稿の画像データを読込み、プリンタ部300を制御して画像データを記録用紙に出力してコピー機能を提供する。また、リーダー部200から読取った画像データを、コードデータに変換し、ネットワーク400を介してホストコンピュータへ送信するスキャナ機能、ホストコンピュータからネットワーク400を介して受信したコードデータを画像データに変換し、プリンタ部300に出力するプリンタ機能、を提供する。
操作部150は、制御装置110に接続され、液晶タッチパネルで構成され、画像入出力システムを操作するためのユーザI/Fを提供する。
画像データベースサーバ107は、ネットワーク400に接続されているホストコンピュータ180やその他のホストコンピュータからアクセス可能で、共有ファイルサーバとして共有文書、共有画像を大容量ハードディスク等に保持している。
図2はリーダー部200及びプリンタ部300の断面図である。リーダー部の原稿給送ユニット250は原稿を先頭順に1枚ずつプラテンガラス211上へ給送し、原稿の読み取り動作終了後、プラテンガラス211上の原稿を排出するものである。原稿がプラテンガラス211上に搬送されると、ランプ212を点灯し、そして光学ユニット213の移動を開始させて、原稿を露光走査する。この時の原稿からの反射光は、ミラー214、215、216及びレンズ217によってCCDイメージセンサ(以下CCDという)218へ導かれる。このように、走査された原稿の画像はCCD218によって読み取られる。CCD218から出力される画像データは、所定の処理が施された後、制御装置110へ転送される。
222は画像処理回路部であり、読みとられた画像情報を電気信号として処理し、プリント信号として出力するところである。
プリンタ部300のレーザドライバ317はレーザ発光部313、314、315、316を駆動するものであり、制御装置110から出力された画像データに応じたレーザ光をレーザ発光部313、314、315、316を発光させる。このレーザ光はミラー340、341、342、343、344、345、346、347、348、349、350、351によって感光ドラム325、326、327、328に照射され、感光ドラム325、326、327、328にはレーザ光に応じた潜像が形成される。321、322、323、324は、それぞれブラック(Bk)、イエロー(Y)、シアン(C)、マゼンダ(M)のトナーによって、潜像を現像するための現像器であり、現像された各色のトナーは、用紙に転写されフルカラーのプリントアウトがなされる。
用紙カセット329、330及び手差しトレイ332のいずれかより給紙された用紙は、レジストローラ333を経て、転写ベルト334上に吸着され、搬送される。
そして、レーザ光の照射開始と同期したタイミングで、カセット329及びカセット330のいずれかから記録紙を給紙して転写ベルト334へ搬送し、感光ドラム325、326、327、328に付着された現像剤を記録紙に転写する。現像剤の乗った記録紙は定着部335に搬送され、定着部335の熱と圧力により現像剤は記像紙に定着される。定着部335を通過した記録紙は排出ローラ336によって排出され、排紙ユニット339は排出された記録紙を束ねて記録紙の仕分けをしたり、仕分けされた記録紙のステイプルを行う。
また、両面記録が設定されている場合は、排出ローラ336のところまで記録紙を搬送した後、排出ローラ336の回転方向を逆転させ、フラッパ337によって再給紙搬送路338へ導く。再給紙搬送路338へ導かれた記録紙は上述したタイミングで転写ベルト334へ給紙される。
制御装置110の機能を、図3に示すブロック図をもとに説明する。
メインコントローラ111は、主にCPU112と、バスコントローラ113、各種I/Fコントローラ回路とから構成される。
CPU112とバスコントローラ113は制御装置110全体の動作を制御するものであり、CPU112はROM114からROM I/F115を経由して読込んだプログラムに基いて動作する。また、ホストコンピュータから受信したPDL(ページ記述言語)コードデータを解釈し、ラスターイメージデータに展開する動作も、このプログラムに記述されており、ソフトウェアによって処理される。バスコントローラ113は各I/Fから入出力されるデータ転送を制御するものであり、バス競合時の調停やDMAデータ転送の制御を行う。
DRAM116はDRAM I/F117によってメインコントローラ111と接続されており、CPU112が動作するためのワークエリアや、画像データを蓄積するためのエリアとして使用される。
Codec118は、DRAM116に蓄積されたラスターイメージデータをMH/MR/MMR/JBIG/JPEG等の方式で圧縮し、また逆に圧縮され蓄積されたコードデータをラスターイメージデータに伸長する。SRAM119はCodec118の一時的なワーク領域として使用される。Codec118はI/F120を介してメインコントローラ111と接続され、DRAM116との間のデータの転送は、バスコントローラ113によって制御されDMA転送される。
画像処理部135は、DRAM116に蓄積されたラスターイメージデータに対して、画像回転、画像変倍、色空間変換、二値化の処理をそれぞれ行う。SRAM136は画像処理部135の一時的なワーク領域として使用される。画像処理部135はI/F137を介してメインコントローラ111と接続され、DRAM116との間のデータの転送は、バスコントローラ113によって制御されDMA転送される。
Network Contorller121はI/F122によってメインコントローラ111と接続され、コネクタ122によって外部ネットワークと接続される。ネットワークとしては一般的にイーサネット(登録商標)があげられる。
汎用高速バス125には、拡張ボードを接続するための拡張コネクタ124とI/O制御部126とが接続される。汎用高速バスとしては、一般的にPCIバスがあげられる。
I/O制御部126には、リーダー部200、プリンタ部300の各CPUと制御コマンドを送受信するための調歩同期シリアル通信コントローラ127が2チャンネル装備されており、I/Oバス128によって外部I/F回路140,145に接続されている。
パネルI/F132は、LCDコントローラ131に接続され、操作部150上の液晶画面に表示を行うためのI/Fと、ハードキーやタッチパネルキーの入力を行うためのキー入力I/F130とから構成される。
操作部150は液晶表示部と液晶表示部上に張り付けられたタッチパネル入力装置と、複数個のハードキーを有する。タッチパネルまたはハードキーにより入力された信号は前述したパネルI/F132を介してCPU112に伝えられ、液晶表示部はパネルI/F520から送られてきた画像データを表示するものである。液晶表示部には、本画像形成装置の操作における機能表示や画像データ等を表示する。
リアルタイムクロックモジュール133は、機器内で管理する日付と時刻を更新/保存するためのもので、バックアップ電池134によってバックアップされている。
E−IDEインタフェース161は、外部記憶装置を接続するためのものである。本実施例においては、このI/Fを介してハードディスクドライブ160を接続し、ハードディスク162へ画像データを記憶させたり、ハードディスク162から画像データを読み込む動作を行う。
コネクタ142と147は、それぞれリーダー部200とプリンタ部300とに接続され、同調歩同期シリアルI/F(143,148)とビデオI/F(144,149)とから構成される。
スキャナI/F140は、コネクタ142を介してリーダー部200と接続され、また、スキャナバス141によってメインコントローラ111と接続されており、リーダー部200から受け取った画像に対して所定の処理を施す機能を有し、さらに、リーダー部200から送られたビデオ制御信号をもとに生成した制御信号を、スキャナバス141に出力する機能も有する。
スキャナバス141からDRAM116へのデータ転送は、バスコントローラ113によって制御される。
プリンタI/F145は、コネクタ147を介してプリンタ部300と接続され、また、プリンタバス146によってメインコントローラ111と接続されており、メインコントローラ111から出力された画像データに所定の処理を施して、プリンタ部300へ出力する機能を有し、さらに、プリンタ部300から送られたビデオ制御信号をもとに生成した制御信号を、プリンタバス146に出力する機能も有する。
DRAM116上に展開されたラスターイメージデータのプリンタ部への転送は、バスコントローラ113によって制御され、プリンタバス146、ビデオI/F149を経由して、プリンタ部300へDMA転送される。
図4は画像処理部135のブロック図である。画像処理部135は、画像回転、画像変倍、色空間変換、二値化の処理をそれぞれ行うモジュールを有する。SRAM136は画像処理部135の各々のモジュールの一時的なワーク領域として使用される。各々のモジュールが用いるSRAM136のワーク領域が競合しないよう、あらかじめ各々のモジュールごとにワーク領域が静的に割り当てられているものとする。画像処理部135はI/F137を介してメインコントローラ111と接続され、DRAM116との間のデータの転送は、バスコントローラ113によって制御されDMA転送される。
バスコントローラ113は、画像処理部135の各々のモジュールにモード等を設定する制御及び、各々のモジュールに画像データを転送するためのタイミング制御を行う。
以下、画像処理毎に詳細に各ブロックの役割を示す。
<画像回転部の説明>
以下に画像回転部401における処理手順を示す。
以下に画像回転部401における処理手順を示す。
I/F137を介して、CPU112からバスコントローラ113に画像回転制御のための設定を行う。この設定によりバスコントローラ113は画像回転部401に対して画像回転に必要な設定(たとえば画像サイズや回転方向・角度等)を行う。必要な設定を行った後に、再度CPU112からバスコントローラ113に対して画像データ転送の許可を行う。この許可に従い、バスコントローラ113はDRAM116もしくは各I/Fを介して接続されているデバイスから画像データの転送を開始する。
<画像変倍部の説明>
以下に画像変倍部402における処理手順を示す。
以下に画像変倍部402における処理手順を示す。
I/F137を介して、CPU112からバスコントローラ113に画像変倍制御のための設定を行う。この設定によりバスコントローラ113は画像変倍部402に対して画像変倍に必要な設定(主走査方向の変倍率、副走査方向の変倍率、変倍後の画像サイズ等)を行う。必要な設定を行った後に、再度CPU112からバスコントローラ113に対して画像データ転送の許可を行う。この許可に従い、バスコントローラ113はDRAM116もしくは各I/Fを介して接続されているデバイスから画像データの転送を開始する。
画像変倍部402は、受け取った画像データを一時SRAM136に格納し、これを入力バッファとして用いて、格納したデータに対して主走査、副走査の変倍率に応じて必要な画素数、ライン数の分の補間処理を行って変倍処理とする。変倍後のデータは再度SRAM136へ書き戻し、これを出力バッファとして画像変倍部402はSRAM136から上述した読み出し方法で画像データを読み出し、バスコントローラ113に転送する。
変倍処理された画像データを受け取ったバスコントローラ113は、DRAM116もしくはI/F上の各デバイスにデータを転送する。
<色空間変換部の説明>
以下に色空間変換部403における処理手順を示す。
以下に色空間変換部403における処理手順を示す。
I/F137を介して、CPU112からバスコントローラ113に色空間変換制御のための設定を行う。この設定によりバスコントローラ113は色空間変換部403およびLUT(ルック・アップ・テーブル)404に対して色空間変換処理に必要な設定(後述のマトリックス演算の係数、LUT404のテーブル値等)を行う。必要な設定を行った後に、再度CPU112からバスコントローラ113に対して画像データ転送の許可を行う。この許可に従い、バスコントローラ113はDRAM116もしくは各I/Fを介して接続されているデバイスから画像データの転送を開始する。
色空間変換部403は、受け取った画像データ1画素ごとに対して、まず下記の式で表される3×3のマトリックス演算を施す。
上式の演算によって、例えばRGB色空間からYuv色空間への変換など、各種の色空間変換を行うことができる。また、係数を変えることで白黒変換を行うことができる。例えば一般的な(R+2G+B)/4といった式になるよう係数を変えることで白黒変換を行う。
次に、マトリックス演算後のデータに対して、LUT404による変換を行う。これによって、非線形の変換をも行うことができるのである。当然、スルーのテーブルを設定することにより、実質的にLUT変換を行わないこともできる。
その後、色空間変換部403は色空間変換処理された画像データをバスコントローラ113に転送する。
色空間変換処理された画像データを受け取ったバスコントローラ113は、DRAM116もしくはI/F上の各デバイスにデータを転送する。
<画像二値化部の説明>
以下に画像二値化部405における処理手順を示す。
以下に画像二値化部405における処理手順を示す。
I/F137を介して、CPU112からバスコントローラ113に二値化制御のための設定を行う。この設定によりバスコントローラ113は画像二値化部405に対して二値化処理に必要な設定(変換方法に応じた各種パラメータ等)を行う。必要な設定を行った後に、再度CPU112からバスコントローラ113に対して画像データ転送の許可を行う。この許可に従い、バスコントローラ113はDRAM116もしくは各I/Fを介して接続されているデバイスから画像データの転送を開始する。
画像二値化部405は、受け取った画像データに対して二値化処理を施す。本実施例では、二値化の手法としては、画像データを所定の閾値と比較して単純に二値化するものとする。もちろん、ディザ法、誤差拡散法、誤差拡散法を改良したものなど、いずれの手法によってもかまわない。
その後、画像二値化部405は二値化処理された画像データをバスコントローラ113に転送する。
二値化処理された画像データを受け取ったバスコントローラ113は、DRAM116もしくはI/F上の各デバイスにデータを転送する。
図5は、デジタル複写機の操作部150のキー配列を示す。501は、電源スイッチであり、本体への通電を制御する。502は、予熱キーであり、予熱モードのON/OFFに使用する。503は、コピーAモードキーであり、複数の機能の中からコピーAモードを選択するときに使用する。504は、コピーBモードキーであり、複数の機能の中からコピーBモードを選択するときに使用する。コピーA及びコピーBとは、各々同じコピー機能であるが、片方のコピーのスキャナ読み込みが終了している場合は次のコピーの入力ができるため、敢えてユーザに分かりやすくするために二つのコピーに分けている。505は、ボックスキーであり、複数の機能の中からボックスモードを選択するときに使用する。ボックス機能とは、ユーザ個人や部署毎に複写機内のメモリに記憶領域を持ち、そこにPDLやスキャン画像を入れておき、好きなときに出力する機能である。506は、拡張キーであり、PDLに対する操作を行うときに使用する。503〜506は後述するLCD516の各々の機能画面を呼び出すときにも使用され、LCD516の表示により各々のジョブの状況を見ることができる。507は、コピースタートキーであり、コピーの開始を指示するときに用いるキーである。508は、ストップキーであり、コピーを中断したり、中止したりするときに用いるキーである。509は、リセットキーで、スタンバイ中は標準モードに復帰させるキーとして動作する。510は、ガイドキーであり、各機能を知りたいときに使用するキーである。511は、ユーザモードキーであり、ユーザがシステムの基本設定を変更するときに使用する。512は、割り込みキーであり、コピー中に割り込みしてコピーしたいときに用いる。513は、テンキーであり、数値の入力を行うときに使用する。514は、クリアキーであり、数値をクリアするときに用いる。515は、IDキーであり、複写機を使用する場合にIDの入力モードに移行するときに使用する。516は、液晶画面とタッチセンサの組合せからなるLCDタッチパネルであり、各モード毎に個別の設定画面が表示され、さらに、描画されたキーに触れることで、各種の詳細な設定を行うことが可能である。また、各々のジョブの動作状況表示なども行う。517は、ネットワークの通信状態を示すタリーランプであり、通常緑色で、通信しているときは緑色で点滅し、ネットワークエラーの場合には赤色になる。518は、ACS(オートカラーセレクト)キーであり、コピー原稿がカラーか白黒かを自動的に判別し、カラーならばカラーで、白黒ならば黒単色でスキャンするモードを設定する場合に使用する。519は、フルカラーモードキーであり、コピー原稿に関わらずフルカラーでスキャンするモードを設定する場合に使用する。520は、ブラックモードキーであり、コピー原稿に関わらず黒単色でスキャンするモードを設定する場合に使用する。518〜520はトグル動作し、必ずどれか一つが選択されており、選択されているキーが点灯している。
図6は、本実施例における操作パネル516のコピー標準画面を示した図である。本実施例の画像処理装置は、電源投入時にデフォルトとしてコピー標準画面で起動するようになっている。601は、メッセージラインであり、コピージョブの状態をメッセージで表示する。602は、倍率表示であり、設定された倍率やコピーモードによって自動的に決められる倍率をパーセントで表示する。603は、用紙サイズ表示であり、選択された出力用紙を表示し、自動用紙選択が設定されている場合にはオート用紙というメッセージを表示する。604は置数表示であり、何枚コピーするかを示す。605は、縮小キーであり、縮小コピーを行いたい場合に使用する。606は、等倍キーであり、縮小や拡大が設定されている場合に等倍に戻したいときに使用する。607は、拡大キーであり、拡大コピーを行いたい場合に使用する。608は、ズームキーであり、細かい単位で倍率を設定して縮小コピーや拡大コピーを行いたい場合に使用する。609は、用紙選択キーであり、出力用紙を指定する場合に使用する。610は、フィニッシャキーであり、ソートやステイプルのモードを設定する場合に使用する。611は両面キーであり、両面モードを設定する場合に使用する。612は、濃度表示で、現在の濃度が分かるようになっており、左側が濃度が薄く、右側が濃度が濃いことを示す。また、濃度表示612は、うすくキー613、こくキー615と連動して表示が変化するようになっている。613は、うすくキーであり、濃度を薄くしたい場合に使用する。614は自動キーであり、自動的に濃度を決定するモードを使用する場合に使用する。615は、こくキーであり、濃度を濃くしたい場合に使用する。616は、文字キーであり、文字原稿をコピーするのに適した濃度に自動的に設定する文字モードを設定する場合に使用する。617は、文字/写真キーであり、写真が混在した原稿をコピーするのに適した濃度に自動的に設定する文字/写真モードを設定する場合に使用する。618は、応用モードキーであり、コピー標準画面で設定できない様々なコピーモードを設定する場合に使用する。619は、システム状況キーであり、現在この画像入出力システム100で行われているプリントやスキャンの状況を見たい場合に使用する。システム状況キー619は、コピー標準画面だけではなく、常にこの位置に現れており、いつでもこのキーを押すことによりシステムの状況を見ることができるようになっている。この図では図示していないが、620の領域はメッセージライン601で表示する必要のない優先度の低いアラームや、他の機能の実行状態などをメッセージ表示するステータスラインである。
図7はハードディスク162の論理的な使用方法を示した図である。本実施例においては使用用途に応じてハードディスクの記憶領域をテンポラリ領域701とボックス領域702に論理的に分ける。テンポラリ領域701は、画像データの出力順序を変えたり、複数部出力においても一回のスキャンで出力ができるようにするために、PDLの展開データやスキャナからの画像データを一時的に記憶する記憶領域である。ボックス領域702はボックス機能を使用するための記憶領域であり、703〜707のように登録された数の小さな記憶領域に分割されている。ボックス703〜707は、各ユーザや会社などの部署毎に割り当てられ、各ボックスにはボックス名とパスワードを付けることができる。ユーザはボックスを指定することでPDLジョブやスキャンジョブを各ボックス入力することができ、パスワードを入力することで実際にボックスの中を見たり、設定変更やプリント出力を行う。
図8は、本実施例における従来のボックス登録の手順を示すフローチャートである。ボックスへの登録は、画像データベースサーバ170やホストコンピュータ180からのPDL画像と、スキャナからのスキャン画像の登録があり、それぞれ図8の(a)、(b)のフローとなる。なお、図中のS801〜S808は各ステップを示す。
PDL画像を登録する場合、S801では、PC180上でユーザがプリント設定を行いS802に進む。プリント設定内容は、部数、用紙サイズ、拡大縮小率、片面/両面、ページ出力順序、ソート出力、ステイプル止めの有無等である。
S802では、PC180上でボックス番号を設定することで、ハードディスク162のボックス領域702内の領域が指定され、S803に進む。例えば、ボックス番号が1と指定されると、ボックス領域702内のパーソナルボックス領域703が指定されることなる。
S803では、PC180上で印刷指示を与え、それと共にPC180上にインストールされているドライバソフトウェアが印刷対象となるコードデータをいわゆるPDLデータに変換して、S801で設定したプリント設定パラメータとともに、本画像入出力装置の制御装置110にPDLデータを転送し、S804に進む。
S804では、転送されたPDLデータを画像データに展開(ラスタライズ)する。画像データの展開が完了するとS805に進む。
S805では、展開された画像データがハードディスク162のボックス領域領域702に順次記録され、例えばボックス番号が1のときは、領域703内に記憶される。S801で設定したプリント設定パラメータも領域703に記録される。ボックス番号が2、3のときはそれぞれ領域704、領域705に記憶される。
スキャン画像を登録する場合は、まずS806で画像を入力するボックス番号を指定し、S807に進む。
S807では、画像処理等のスキャン設定を指定し、S808に進む。
S808では、スキャンスタートの指示を出すことで、リーダ部200で原稿を読み取りS809に進む。
S809では、S808で読み取った画像をS806で指定したボックス領域に格納する。
図9は、本実施例における操作パネルのボックスキー505を押下した場合のLCD516の表示である。この画面はボックスを選択する画面であり、901はそのボックス番号、ボックス名、ハードディスク162のボックス領域702に対してそのボックスがどれだけ容量をとっているかの情報を表示する。ボックス番号を押下すると、図10に示すパスワード入力画面に遷移する。902と903はそれぞれ上下スクロールキーであり、901の表示を越える数のボックスが登録されているときに、画面をスクロールする場合に使用する。
図10は、本実施例における操作パネルのパスワード入力画面である。この画面から各ボックスに設定されているパスワードを入力することで図11に示すボックス内画面に遷移し、各ボックスにアクセスできるようになる。パスワードが違う場合には、図示していない警告画面に遷移し、ボックスにはアクセスできない。1001は取消キーであり、図9の画面に戻る。1002はOKキーであり、このキーを押下することで入力したパスワードの確定となり、パスワードの検証が行われる。
図11は、本実施例における操作パネルのボックス内画面である。1101はボックス内のファイルリストであり、各ファイルの登録日時、ファイル名がリスト表示される。ファイルを選択するにはファイル名を押下し、現在選択されているファイルは反転表示される。1102はスキャンキーであり、現在開いているボックスにスキャナから画像を入力する場合に使用し、図示していないスキャンの設定画面に遷移する。1103はプリントキーであり、1101で選択しているファイルをプリントする場合に使用する。1104は詳細情報キーであり、1101で選択しているファイルの詳細情報、例えばページ数、ファイル容量、設定されているプリントモード等を確認したい場合に使用する。1105は消去キーであり、1101で選択しているファイルを消去する場合に使用する。1106と1107はそれぞれ上下スクロールキーであり、1101の表示を超える数のファイルが登録されているときに、画面をスクロールする場合に使用する。1108は閉じるキーであり、図9の画面に戻るときに使用する。
図12は、本実施例における画像データベースサーバ画面である。1201は画像データベースサーバのアプリケーション画面である。実際には、ネットワーク400に接続されているPCに画像データベースアクセス用のアプリケーションがインストールされていれば、どのPCからでもこのサーバ画面と同様の画面で画像データベースサーバ170にアクセスすることが可能である。また、この画像データベースサーバ170に保存されている文書は、ネットワーク400上の共有文書として扱われ、各PCにデータを持たなくとも、画像データベースサーバ170上の文書をネットワーク400上のPCから操作することができる。1202はディレクトリ構造表示画面である。ここには画像データベースサーバ170上のディレクトリ構造を判りやすくツリー構造で表示する。また、ネットワーク400上の複写機100も1203に示すようにディレクトリ構造上に表示されており、あたかも画像データベースサーバ上の1ディレクトリのようにボックス領域702を見ることができる。1204は、複写機100のボックス01が選択されていることを示しており、そのボックス01内に存在する文書が1205のウィンドウにリストで表示される。この文書を選択し、プリント、削除、複製、移動等の文書操作を行うことが可能である。
図13は、本実施例におけるスキャナからのボックス登録のフローチャートである。なお、図中のS1301〜S1318は各ステップを示す。
S1301では、画像を入力するボックス番号を指定し、S1302に進む。
S1302では、画像処理等のスキャン設定を指定し、S1303に進む。
S1303では、スキャンスタートの指示を出すことで、リーダ部200で原稿を読み取りS1304に進む。
S1304では、サーバ170を検索する設定かどうかを判断し、検索する設定だった場合にはS1305に進み、そうでなければS1318に進む。ここで、サーバを検索するかどうかのダイアログを液晶パネル516に表示し、ユーザに選択させてもよい。
S1305では、S1303で読み込まれた画像に対し、文字/線画部分とハーフトーンの画像部分とに領域を分離し、文字部は更に段落で塊として纏まっているブロック毎に、或いは、線で構成された表、図形に分離し各々セグメント化し、S1304に進む。一方ハーフトーンで表現される画像部分は、矩形に分離されたブロックの画像部分、背景部等、所謂ブロック毎に独立したオブジェクトに分割する。
S1306では、原稿画像中に付加情報として記録された2次元バーコード、或いはURLに該当するオブジェクトを検出し、URLはOCRで文字認識し、或いは2次元バーコードなら該マークを解読し、S1307に進む。
S1307では、S1306で認識した文字や2次元バーコードから原稿のオリジナル電子ファイルが格納されている記憶装置内のポインタ情報を検出し、S1308に進む。尚ポインタ情報を付加する手段は他に文字と文字の間隔に情報を埋め込む方法、ハーフトーンの画像に埋め込む方法等直接可視化されない電子透かしによる方法も有る。
S1308では、S1307でポインタ情報を検出できたかどうかを判断し、ポインタ情報が検出されていた場合はS1309に進み、検出されていなかった場合はS1310に進む。
S1309では、S1307で検出されたポインタ情報から画像データベースサーバ170を検索し、画像データベースサーバ170にS1303で読み込まれた画像のオリジナル電子ファイルがあるかどうかを判断し、オリジナル電子ファイルがあった場合はS1317に進み、なかった場合はS1310に進む。
S1310では、S1306で各文字ブロックに対して行ったOCRの結果から単語を抽出して全文検索、或いは各オブジェクトの配列と各オブジェクトの属性からレイアウト検索を行い、S1311に進む。
S1311では、S1310の結果、類似度の高い電子ファイルが見つかった場合、サムネイル等を表示し、複数の中から操作者の選択が必要なら操作者の入力操作よってファイルの特定を行い、S1312に進む。
S1312では、S1311の結果、電子ファイルが特定された場合はS1317に進み、特定されなかった場合はS1313に進む。
S1313では、サーバ170に電子データを新規に登録するかどうかの選択画面を表示し、操作者が選択する。サーバ170に登録する場合はS1314に進み、登録しない場合はS1318に進む。
S1314では、イメージデータからベクトルデータへの変換処理部であり、オリジナル電子ファイルに近い電子ファイルに変換し、S1315に進む。実際の処理としては、先ずS1306でOCRされた文字ブロックに対して、更に文字のサイズ、スタイル、字体を認識し、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。一方、線で構成される表、図形ブロックに対してはアウトライン化する。画像ブロックに対してはイメージデータとして個別のJPEGファイルとして処理する。これらのベクトル化処理は各オブジェクト毎に行う。
S1315では、ベクトル化されたデータをさらに各オブジェクトのレイアウト情報を保存し、例えばrtfに変換するなどしてアプリで扱えるデータとし、S1316に進む。
S1316では、アプリで扱えるデータとなったベクトルデータをサーバ170に新たな電子ファイルとして登録し、S1317に進む。このとき、インデックス情報を生成し検索用インデックスファイルに追加することで、この電子ファイルを検索対象とする。また、この電子ファイルをプリントアウトした出力結果をまた検索用に使用できるよう、電子ファイルにポインタ情報を付加するように構成してもよい。
S1317では、S1316で格納した電子ファイルのポインタ情報とファイル名等の文書情報をS1301のボックス文書情報として指定ボックスに保持する。ボックスに実画像はないが、ボックスリストにはファイル名が表示され、プリント時にはサーバから電子ファイルをプリントすることになる。
S1318では、S1303で読み込んだ画像をファイルとしてボックスに保存する。この文書は図8の(b)で示す従来のスキャンボックス文書と同じものとなる。
図14は、本実施例におけるホストからのボックス登録のフローチャートである。なお、図中のS1401〜S1409は各ステップを示す。
S1401では、PC170やPC180上でプリント設定を行い、S1402に進む。
S1402ではPCホスト上で指定文書を画像入出力システム100のどのボックスに格納するかを指定し、S1403に進む。
S1403では、ボックスに登録すると同時に画像データベースサーバ170にも文書を登録するかどうかを指定し、登録する場合はS1404に進み、登録しない場合はS1407に進む。
S1404では、サーバ170上に同一文書があるかどうかを判断し、同一文書がある場合にはS1406に進み、ない場合はS1405に進む。ここでは、ホスト180上からサーバ170を検索するようにしているため、スキャナからの読み込みと異なり、ファイル名検索等でもかまわない。また、画像入出力システム100から検索をかけるのであれば、一旦展開して、スキャン時と同様のベクトル化処理等を加えることで、同様の検索が可能となる。
S1405では、サーバ170に文書を登録し、S1406に進む。
S1406では、サーバ170上のファイルのポインタ情報とファイル名等を画像入出力システム100の指定ボックスに保存する。ボックスに実画像はないが、ボックス文書の出力指示により、サーバ170から画像を展開してプリントが可能となる。
S1407〜S1409は、サーバ170へ登録をしないため、通常のボックス格納となる。従って、S803〜S805と同じ動作である。こちらの場合はボックスに実画像が存在するため、速度重視でプリントする場合に有利である。
以下、特に図13に関わる各処理ブロックに対して詳細に説明する。
先ずS1305で示すブロックセレクション処理について説明する。
[ブロックセレクション処理]
ブロックセレクション処理とは、図20の右に示すS1303で読み取った一頁のイメージデータを左に示す様に、各オブジェクト毎の塊として認識し、該ブロック各々を文字/図画/写真/線/表等の属性に判定し、異なる属性を持つ領域に分割する処理である。
ブロックセレクション処理とは、図20の右に示すS1303で読み取った一頁のイメージデータを左に示す様に、各オブジェクト毎の塊として認識し、該ブロック各々を文字/図画/写真/線/表等の属性に判定し、異なる属性を持つ領域に分割する処理である。
ブロックセレクション処理の実施例を以下に説明する。
先ず、入力画像を白黒に二値化し、輪郭線追跡をおこなって黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡をおこない白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさおよび形状で分類し、異なる属性を持つ領域へ分類していく。たとえば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字領域、扁平な画素塊を線領域、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域、などとする。
ブロックセレクション処理で得られた各ブロックに対するブロック情報を図21に示す。
これらのブロック毎の情報は以降に説明するベクトル化、或いは検索の為の情報として用いる。
[ポインター情報の検出]
次に、S1306で示すファイルの格納位置をイメージ情報から抽出する為のOCR/OMR処理について説明する。
次に、S1306で示すファイルの格納位置をイメージ情報から抽出する為のOCR/OMR処理について説明する。
図30は原稿画像中に付加された2次元バーコード(QRコードシンボル)を復号して、データ文字列を出力する過程を示すフローチャートである。2次元バーコードの付加された原稿310の一例を図15に示す。
まず、制御装置110内のDRAM116に格納された原稿310を表すイメージ画像をCPU(不図示)で走査して、先に説明したブロックセレクション処理の結果から所定の2次元バーコードシンボル311の位置を検出する。QRコードの位置検出パターンは、シンボルの4隅のうちの3済みに配置される同一の位置検出要素パターンから構成される(ステップ300)。
次に、位置検出パターンに隣接する形式情報を復元し、シンボルに適用されている誤り訂正レベルおよびマスクパターンを得る(ステップ301)。
シンボルの型番を決定した(ステップ302)後、形式情報で得られたマスクパターンを使って符号化領域ビットパターンをXOR演算することによってマスク処理を解除する(ステップ303)。
尚、モデルに対応する配置規則に従い、シンボルキャラクタを読取り、メッセージのデータ及び誤り訂正コード語を復元する(ステップ304)。
復元されたコード上に、誤りがあるかどうかの検出を行い(ステップ305)、誤りが検出された場合、ステップ306に分岐し、これを訂正する。
誤り訂正されたデータより、モード指示子および文字数指示子に基づいて、データコード語をセグメントに分割する(ステップ307)。
最後に、仕様モードに基づいてデータ文字を復号し、結果を出力する(ステップ308)。
尚、2次元バーコード内に組み込まれたデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバー名およびファイル名からなるパス情報で構成される。或いは、対応するファイルへのURLで構成される。
本実施例ではポインター情報が2次元バーコードを用いて付与された原稿310について説明したが、直接文字列でポインター情報が記録される場合は所定のルールに従った文字列のブロックを先のブロックセレクション処理で検出し、該ポインター情報を示す文字列の各文字を文字認識する事で、直接元ファイルのアドレス情報を得る事が可能である。
又或いは図15の文書310の文字ブロック312、或いは313の文字列に対して隣接する文字と文字の間隔等に視認し難い程度の変調を加え、該文字間隔に情報を埋め込むことでもポインター情報を付与できる。該所謂透かし情報は後述する文字認識処理を行う際に各文字の間隔を検出すれば、ポインター情報が得られる。又自然画314の中に電子透かしとしてポインター情報を付加する事も可能である。
[ポインター情報によるファイル検索]
次に、図13で先に説明したS1309で示す、ポインター情報からの電子ファイルの検索について図16のフローチャートを使用して説明する。
次に、図13で先に説明したS1309で示す、ポインター情報からの電子ファイルの検索について図16のフローチャートを使用して説明する。
まず、ポインタ情報に含まれるアドレスに基づいて、ファイル・サーバーを特定する。(ステップ400)
ここでファイルサーバとは、クライアントPC180や、画像データベースサーバ170や、画像入出力システム100自身を指す。
ここでファイルサーバとは、クライアントPC180や、画像データベースサーバ170や、画像入出力システム100自身を指す。
ここでアドレスとは、URLや、サーバ名とファイル名からなるパス情報である。
ファイルサーバが特定できたら、ファイルサーバに対してアドレスを転送する。(ステップ401)ファイル・サーバーは、アドレスを受信すると、該当するファイルを検索する。(ステップ402)ファイルが存在しない場合(ステップ403−N)には、画像入出力システム100に対してその旨通知する。
ファイルが存在した場合(ステップ403−Y)には、図13で説明した様に、ファイルのアドレスを通知(ステップ134)すると共に、ユーザの希望する処理が画像ファイルデータの取得であれば、画像入出力システム100に対してファイルを転送する。(ステップ408)
[ファイル検索処理]
次に、図13のS1310で示すファイル検索処理の詳細について図21、図17を使用して説明を行う。
[ファイル検索処理]
次に、図13のS1310で示すファイル検索処理の詳細について図21、図17を使用して説明を行う。
S1310の処理は、前述したように、S1308で入力原稿(入力ファイル)にポインタ情報が存在しなかった場合、または、ポインタ情報は在るが電子ファイルが見つからなかった場合に行われる。
ここでは、S1306の結果、抽出された各ブロック及び入力ファイルが、図21に示す情報(ブロック情報、入力ファイル情報)を備えるものとする。情報内容として、属性、座標位置、幅と高さのサイズ、OCR情報有無を例としてあげる。属性は、文字、線、写真、絵、表その他に分類する。また簡単に説明を行うため、ブロックは座標Xの小さい順、即ち(例、X1<X2<X3<X4<X5<X6)にブロック1、ブロック2、ブロック3、ブロック4、ブロック5,ブロック6と名前をつけている。ブロック総数は、入力ファイル中の全ブロック数であり、図17の場合は、ブロック総数は6である。以下、これらの情報を使用して、データベース内から、入力ファイルに類似したファイルのレイアウト検索を行うフローチャートを図17に示す。ここで、データベースファイルは、図21と同様の情報を備えることを前提とする。
フローチャートの流れは、入力ファイルとデータベース中のファイルを順次比較するものである。まず、ステップ510にて、後述する類似率などの初期化を行う。次に、ステップ511にてブロック総数の比較を行い、ここで、真の場合、さらにファイル内のブロックの情報を順次比較する。ブロックの情報比較では、ステップ513,515,518にて、属性類似率、サイズ類似率、OCR類似率をそれぞれ算出し、ステップ522にてそれらをもとに総合類似率を算出する。各類似率の算出方法については、公知の技術が用いれるので説明を省略する。ステップ523にて総合類似率が、予め設定された閾値Thより高ければステップ524にてそのファイルを類似候補としてあげる。但し、図中のN、W、Hは、入力ファイルのブロック総数、各ブロック幅、各ブロック高さとし、ΔN、ΔW、ΔHは、入力ファイルのブロック情報を基準として誤差を考慮したものである。n、w、hは、データベースファイルのブロック総数、各ブロック幅、各ブロック高さとする。また、不図示ではあるが、ステップ514にてサイズ比較時に、位置情報XYの比較などを行ってもよい。
以上、検索の結果、類似度が閾値Thより高く、候補として保存されたデータベースファイル(ステップ524)をサムネイル等で表示(S1311)する。複数の中から操作者の選択が必要なら操作者の入力操作よってファイルの特定を行う。
[ベクトル化処理]
ファイルサーバーに元ファイルが存在しない場合は、図20に示すイメージデータを各ブロック毎にベクトル化する。次にS1314で示されるベクトル化について詳説する。まず文字ブロックに対しては各文字に対して文字認識処理を行う。
ファイルサーバーに元ファイルが存在しない場合は、図20に示すイメージデータを各ブロック毎にベクトル化する。次にS1314で示されるベクトル化について詳説する。まず文字ブロックに対しては各文字に対して文字認識処理を行う。
『文字認識』
文字認識部では、文字単位で切り出された画像に対し、パターンマッチの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。特徴ベクトルの抽出には種々の公知手法があり、たとえば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
文字認識部では、文字単位で切り出された画像に対し、パターンマッチの一手法を用いて認識を行い、対応する文字コードを得る。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルと比較し、最も距離の近い字種を認識結果とする処理である。特徴ベクトルの抽出には種々の公知手法があり、たとえば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
ブロックセレクション(S1305)で抽出された文字領域に対して文字認識を行う場合は、まず該当領域に対し横書き、縦書きの判定をおこない、各々対応する方向に行を切り出し、その後文字を切り出して文字画像を得る。横書き、縦書きの判定は、該当領域内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き領域、垂直射影の分散が大きい場合は縦書き領域と判断すればよい。文字列および文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことでおこなう。縦書きの文字領域に対しては、水平と垂直を逆にすればよい。尚この時文字のサイズが検出出来る。
『フォント認識』
文字認識の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントが認識出来る。
文字認識の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントが認識出来る。
『文字のベクトル化』
前記文字認識およびフォント認識よって得られた、文字コードおよびフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。なお、元原稿がカラーの場合は、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。
前記文字認識およびフォント認識よって得られた、文字コードおよびフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。なお、元原稿がカラーの場合は、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。
以上の処理により文字ブロックに属するイメージ情報をほぼ形状、大きさ、色が忠実なベクトルデータに変換出来る。
『文字以外の部分のベクトル化』
ブロックセレクション処理(S1305)で、図画あるいは線、表領域とされた領域を対象に、中で抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図18に図示するように、任意点Piに対し左右k個の離れた点Pi-k,Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、Pi-k,Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法など、曲線は3次スプライン関数などを用いてベクトル化することができる。
ブロックセレクション処理(S1305)で、図画あるいは線、表領域とされた領域を対象に、中で抽出された画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図18に図示するように、任意点Piに対し左右k個の離れた点Pi-k,Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、Pi-k,Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法など、曲線は3次スプライン関数などを用いてベクトル化することができる。
また、対象が内輪郭を持つ場合、ブロックセレクションで抽出した白画素輪郭の点列を用いて、同様に部分的直線あるいは曲線で近似する。
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。元原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
さらに、図19に示す様に、ある区間で外輪郭と、内輪郭あるいは別の外輪郭が近接している場合、2つの輪郭線をひとまとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線あるいは曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、前記のような太さを持つ線の集合として効率よくベクトル表現することができる。
尚先に文字ブロックに対する文字認識処理を用いたベクトル化を説明したが、該文字認識処理の結果辞書からの距離が最も近い文字を認識結果として用いるが、この距離が所定値以上の場合は、必ずしも本来の文字に一致せず、形状が類似する文字に誤認識している場合が多い。従って本発明では、この様な文字に対しては、上記した様に、一般的な線画と同じに扱い、該文字をアウトライン化する。即ち従来文字認識処理で誤認識を起こす文字に対しても誤った文字にベクトル化されず、可視的にイメージデータに忠実なアウトライン化によるベクトル化が行える。
又写真と判定されたブロックに対しては本発明では、ベクトル化出来ない為、イメージデータのままとする。
[図形認識]
上述したように任意形状の図形のアウトラインをベクトル化した後、これらベクトル化された区分線を図形オブジェクト毎にグループ化する処理について説明する。
上述したように任意形状の図形のアウトラインをベクトル化した後、これらベクトル化された区分線を図形オブジェクト毎にグループ化する処理について説明する。
図22は、ベクトルデータを図形オブジェクト毎にグループ化するまでのフローチャートを示している。まず、各ベクトルデータの始点、終点を算出する(700)。次に各ベクトルの始点、終点情報を用いて、図形要素を検出する(701)。図形要素の検出とは、区分線が構成している閉図形を検出することである。検出に際しては、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用し、検出を行う。次に図形要素内に存在する他の図形要素、もしくは区分線をグループ化し、一つの図形オブジェクトとする(702)。また、図形要素内に他の図形要素、区分線が存在しない場合は図形要素を図形オブジェクトとする。
図23は、図形要素を検出するフローチャートを示している。先ず、ベクトルデータより両端に連結していない不要なベクトルを除去し、閉図形構成ベクトルを抽出する(710)。次に閉図形構成ベクトルの中から該ベクトルの始点を開始点とし、時計回りに順にベクトルを追っていく。開始点に戻るまで行い、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する(711)。また、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらにまだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。最後に、710で除去された不要ベクトルのうち、711で閉図形としてグループ化されたベクトルに接合しているものを検出し一つの図形要素としてグループ化する(712)。
以上によって図形ブロックを個別に再利用可能な個別の図形オブジェクトとして扱う事が可能になる。
[アプリデータへの変換処理]
ところで、一頁分のイメージデータをブロックセレクション処理(S1305)し、ベクトル化処理(S1314)した結果は図24に示す様な中間データ形式のファイルとして変換されているが、このようなデータ形式はドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
ところで、一頁分のイメージデータをブロックセレクション処理(S1305)し、ベクトル化処理(S1314)した結果は図24に示す様な中間データ形式のファイルとして変換されているが、このようなデータ形式はドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
図24はDAOFのデータ構造を示す図である。
図24において、791はHeaderであり、処理対象の文書画像データに関する情報が保持される。レイアウト記述データ部792では、文書画像データ中のTEXT(文字)、TITLE(タイトル)、CAPTION(キャプション)、LINEART(線画)、EPICTURE(自然画)、FRAME(枠)、TABLE(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。文字認識記述データ部793では、TEXT、TITLE、CAPTION等のTEXTブロックを文字認識して得られる文字認識結果を保持する。表記述データ部794では、TABLEブロックの構造の詳細を格納する。画像記述データ部795は、PICTUREやLINEART等のブロックのイメージデータを文書画像データから切り出して保持する。
このようなDAOFは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクトを再利用する事は出来ない。そこで、次にこのDAOFからアプリデータに変換する処理130について詳説する。
図25は、全体の概略フローである。
8000は、DAOFデータの入力を行う。
8002は、アプリデータの元となる文書構造ツリー生成を行う。
8004は、文書構造ツリーを元に、DAOF内の実データを流し込み、実際のアプリデータを生成する。
図26は、8002文書構造ツリー生成部の詳細フロー、図27は、文書構造ツリーの説明図である。全体制御の基本ルールとして、処理の流れはミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行する。
以後ブロックとは、ミクロブロック、及びマクロブロック全体を指す。
8100は、ブロック単位で縦方向の関連性を元に再グループ化する。スタート直後はミクロブロック単位での判定となる。
ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどで定義することができる。
また、距離、幅、高さなどの情報はGAOFを参照し、抽出する。
図27(a)は実際のページ構成、(b)はその文書構造ツリーである。8100の結果、T3,T4,T5が一つのグループV1,T6,T7が一つのグループV2が同じ階層のグループとしてまず生成される。
8102は、縦方向のセパレータの有無をチェックする。セパレータは、例えば物理的にはDAOF中でライン属性を持つオブジェクトである。また論理的な意味としては、アプリ中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。
8104は、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。
ここで、縦方向のグループ長がページ高さとなっている場合は、文書構造ツリー生成は終了する。
図27の場合は、セパレータもなく、グループ高さはページ高さではないので、8106に進む。
8106は、ブロック単位で横方向の関連性を元に再グループ化する。ここもスタート直後の第一回目はミクロブロック単位で判定を行うことになる。
関連性、及びその判定情報の定義は、縦方向の場合と同じである。
図27の場合は、T1,T2でH1、V1,V2でH2、がV1,V2の1つ上の同じ階層のグループとして生成される。
8108は、横方向セパレータの有無をチェックする。
図27では、S1があるので、これをツリーに登録し、H1,S1,H2という階層が生成される。
8110は、分割がこれ以上存在し得ないか否かをグループ長を利用して判定する。
ここで、横方向のグループ長がページ幅となっている場合は、文書構造ツリー生成は終了する。
そうでない場合は、8102に戻り、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。
図27の場合は、分割幅がページ幅になっているので、ここで終了し、最後にページ全体を表す最上位階層のV0が文書構造ツリーに付加される。
文書構造ツリーが完成した後、その情報を元に8006においてアプリデータの生成を行う。
図27の場合は、具体的には、以下のようになる。
すなわち、H1は横方向に2つのブロックT1とT2があるので、2カラムとし、T1の内部情報(DAOFを参照、文字認識結果の文章、画像など)を出力後、カラムを変え、T2の内部情報出力、その後S1を出力となる。
H2は横方向に2つのブロックV1とV2があるので、2カラムとして出力、V1はT3,T4,T5の順にその内部情報を出力、その後カラムを変え、V2のT6,T7の内部情報を出力する。
以上によりアプリデータへの変換処理が行える。
[ポインター情報の付加]
次に、S1316でその電子データの位置情報を画像にポインタ情報として付加する場合のポインタ情報付加処理について説明する。
次に、S1316でその電子データの位置情報を画像にポインタ情報として付加する場合のポインタ情報付加処理について説明する。
今処理すべき文書が検索処理で特定された場合、あるいはベクトル化によって元ファイルが再生できた場合において、該文書を記録処理する場合においては、紙への記録の際にポインター情報を付与する事で、この文書を用いて再度各種処理を行う場合に簡単に元ファイルデータを取得できる。
図28はポインター情報としてのデータ文字列を2次元バーコード(QRコードシンボル:JIS X0510)311にて符号化して画像中に付加する過程を示すフローチャートである。
2次元バーコード内に組み込むデータは、対応するファイルのアドレス情報を表しており、例えばファイルサーバー名およびファイル名からなるパス情報で構成される。或いは、対応するファイルへのURLや、対応するファイルの格納されているデータベース105内あるいはMFP100自体が有する記憶装置内で管理されるファイルID等で構成される。
まず、符号化する種種の異なる文字を識別するため、入力データ列を分析する。また、誤り検出及び誤り訂正レベルを選択し、入力データが収容できる最小型番を選択する。(ステップ900)。
次に、入力データ列を所定のビット列に変換し、必要に応じてデータのモード(数字、英数字、8ビットバイト、漢字等)を表す指示子や、終端パターンを付加する。さらに所定のビットコード語に変換する。(ステップ901)。
この時、誤り訂正を行うため、コード語列を型番および誤り訂正レベルに応じて所定のブロック数に分割し、各ブロック毎に誤り訂正コード語を生成し、データコード語列の後に付加する(ステップ902)。
該ステップ902で得られた各ブロックのデータコード語を接続し、各ブロックの誤り訂正コード語、必要に応じて剰余コード語を後続する。(ステップ903)。
次に、マトリクスに位置検出パターン、分離パターン、タイミングパターンおよび位置合わせパターン等とともにコード語モジュールを配置する。(ステップ904)。
更に、シンボルの符号化領域に対して最適なマスクパターンを選択して、マスク処理パターンをステップ904で得られたモジュールにXOR演算により変換する。(ステップ905)。
最後に、ステップ905で得られたモジュールに形式情報および型番情報を生成して、2次元コードシンボルを完成する。(ステップ906)。
上記に説明した、アドレス情報の組み込まれた2次元バーコードは、例えば、クライアントPC180から電子ファイルをプリントデータとして画像形成する場合に、画像入出力システム100内で記録可能なラスターデータに変換された後にラスターデータ上の所定の個所に付加されて画像形成される。ここで画像形成された紙を配布されたユーザーは、リーダー部200で読み取ることにより、前述したS1307にてポインター情報からオリジナル電子ファイルの格納場所を検出することができる。
尚同様の目的で付加情報を付与する手段は、本実施例で説明した2次元バーコードの他に、例えば、ポインター情報を直接文字列で文書に付加する方法、文書内の文字列、特に文字と文字の間隔を変調して情報を埋め込む方法、文書中の中間調画像中に埋め込む方法等、一般に電子透かしと呼ばれる方法が適用出来る。
(第2の実施例)
第1の実施例では、ボックスに文書を登録する場合にサーバ170を検索し、サーバ170上に同一文書電子データを発見した場合に、サーバ170上の電子データの位置だけをボックスに格納する構成を説明した。第2の実施例は、既にボックスに格納されているラスターデータをプリントする際に、サーバ170を検索し、電子データが見つかった場合にその電子データをプリントするとともに、ボックス上にある文書を消去し、サーバ170上の電子データの位置だけをボックスに残す構成である。
第1の実施例では、ボックスに文書を登録する場合にサーバ170を検索し、サーバ170上に同一文書電子データを発見した場合に、サーバ170上の電子データの位置だけをボックスに格納する構成を説明した。第2の実施例は、既にボックスに格納されているラスターデータをプリントする際に、サーバ170を検索し、電子データが見つかった場合にその電子データをプリントするとともに、ボックス上にある文書を消去し、サーバ170上の電子データの位置だけをボックスに残す構成である。
図29は、本実施例におけるボックスのラスター文書プリント時にサーバの電子データを検索する場合のフローチャートである。なお、図中のS9101〜S9120は各ステップを示す。
S9101では、画像入出力システムのボックスを選択し、ボックスパスワードを入力し、ボックス内の文書リストを開き、S9102に進む。
S9102では、ボックス文書を選択し、プリント設定等を行い、S9103に進む。ここで、選択した文書がラスターデータでボックス内に実画像を保持している文書であった場合に、サーバ上の電子データを検索するかどうかを設定できる。
S9103では、S9102で選択した文書に対し、プリント指示を行い、S9104に進む。
S9104〜S9117は、サーバ170上の検索処理やベクトル化処理であり、元の画像がボックス内にあるだけで、図13のS1304〜S1317とまったく同じ処理である。
S9118では、サーバ170上の電子データをプリントし、S9119に進む。
S9119では、S9102で選択したボックス文書の実画像を消去する。
S9120では、S9102で選択したボックス文書の実画像をプリントする。
Claims (8)
- ネットワークに接続され、ネットワーク上の共有文書や共有画像を管理することができる画像データベースサーバと、画像データを入力する画像入力手段、前記画像入力手段より入力された画像データを記憶する画像記憶手段、前記画像記憶手段に記憶された画像データをプリント出力する画像出力手段、前記記憶手段に記憶された画像をベクトルデータに変換するベクトル化手段を含む画像処理装置において、前記ベクトル化手段により前記画像入力手段により入力された画像をベクトル化し、前記画像データベースサーバに既に登録されている場合は、前記画像は保持せず、画像データベースサーバの登録場所情報のみを前記記憶手段に保持することを特徴とする画像管理システム。
- 前記入力手段により入力された画像が前記画像データベースサーバに登録されていない場合は、そのまま前記画像を前記画像記憶手段に保持することを特徴とする請求項1の画像管理システム。
- 前記入力手段により入力された画像が前記画像データベースに登録されていない場合は、前記ベクトル化した画像を前記画像データベースサーバに新規に登録し、前記画像は保持せず画像データベースサーバの登録場所情報のみを前記記憶手段に保持するか、前記画像を前記記憶手段に保持するかを選択する選択手段を有することを特徴とする請求項1の画像管理システム。
- 前記入力手段により画像を入力開始するとき、入力する画像が前記データベースに登録されているかどうかをチェックするかどうかを設定できることを特徴とする請求項1の画像管理システム。
- ネットワークに接続され、ネットワーク上の共有文書や共有画像を管理することができる画像データベースサーバと、画像データを入力する画像入力手段、前記画像入力手段より入力された画像データを記憶する画像記憶手段、前記画像記憶手段に記憶された画像データをプリント出力する画像出力手段、前記記憶手段に記憶された画像をベクトルデータに変換するベクトル化手段を含む画像処理装置において、前記画像出力手段でプリント出力時に前記ベクトル化手段により前記画像入力手段により入力された画像をベクトル化し、前記画像データベースサーバに既に登録されている場合は、画像データベースサーバに登録されている画像をプリント出力することを特徴とする画像管理システム。
- 前記画像出力手段でプリント出力時に前記画像データベースに前記画像が既に登録されているかどうかを問い合わせるかどうかを選択する手段を有することを特徴とする請求項5の画像管理システム。
- 前記画像出力手段でプリント出力時に前記画像データベースに前記画像が登録されていなかった場合に、前記画像記憶手段に記憶されている画像をそのままプリント出力することを特徴とする請求項5の画像管理システム。
- 前記画像出力手段でプリント出力時に前記画像データベースに前記画像が登録されていなかった場合に、前記ベクトル化した画像を前記画像データベースサーバに新規に登録し、前記画像は保持せず画像データベースサーバの登録場所情報のみを前記記憶手段に保持するか、前記画像を前記記憶手段に保持するかを選択する選択手段を有することを特徴とする請求項5の画像管理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005015532A JP2006202197A (ja) | 2005-01-24 | 2005-01-24 | 画像管理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005015532A JP2006202197A (ja) | 2005-01-24 | 2005-01-24 | 画像管理システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006202197A true JP2006202197A (ja) | 2006-08-03 |
Family
ID=36960127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005015532A Withdrawn JP2006202197A (ja) | 2005-01-24 | 2005-01-24 | 画像管理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006202197A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009182429A (ja) * | 2008-01-29 | 2009-08-13 | Kyocera Mita Corp | 画像形成装置および画像情報保存方法 |
CN101242469B (zh) * | 2007-02-05 | 2010-09-22 | 株式会社理光 | 图像处理装置 |
US8259313B2 (en) | 2008-05-15 | 2012-09-04 | Canon Kabushiki Kaisha | Image processing apparatus, method, and computer-readable medium storing the program thereof |
-
2005
- 2005-01-24 JP JP2005015532A patent/JP2006202197A/ja not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101242469B (zh) * | 2007-02-05 | 2010-09-22 | 株式会社理光 | 图像处理装置 |
JP2009182429A (ja) * | 2008-01-29 | 2009-08-13 | Kyocera Mita Corp | 画像形成装置および画像情報保存方法 |
US8400667B2 (en) | 2008-01-29 | 2013-03-19 | Kyocera Document Solutions Inc. | Image forming apparatus and image information saving method |
US8259313B2 (en) | 2008-05-15 | 2012-09-04 | Canon Kabushiki Kaisha | Image processing apparatus, method, and computer-readable medium storing the program thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4181892B2 (ja) | 画像処理方法 | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
US7681121B2 (en) | Image processing apparatus, control method therefor, and program | |
US8520006B2 (en) | Image processing apparatus and method, and program | |
JP5247601B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
CN1859541B (zh) | 图像处理设备及其控制方法 | |
JP4502385B2 (ja) | 画像処理装置およびその制御方法 | |
US20120250048A1 (en) | Image processing apparatus and image processing method | |
US9710524B2 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
JP2007174270A (ja) | 画像処理装置、画像処理方法、記憶媒体、プログラム | |
JP2005149096A (ja) | 画像処理システム及び画像処理方法 | |
JP2005159517A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2006011714A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2006023940A (ja) | 画像処理システム及び画像処理方法 | |
JP4227432B2 (ja) | 画像処理方法 | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
US8289581B2 (en) | Image processing apparatus, transfer job managing method, program for implementing the method, and storage medium storing the program | |
JP2006202197A (ja) | 画像管理システム | |
JP2007129557A (ja) | 画像処理システム | |
JP2005149097A (ja) | 画像処理システム及び画像処理方法 | |
JP2006180044A (ja) | 画像処理装置 | |
JP2006134042A (ja) | 画像処理システム | |
JP2006163470A (ja) | 画像処理装置および画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム | |
JP2006146486A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080401 |