JP2005157905A - 画像処理装置、画像処理方法およびプログラム - Google Patents
画像処理装置、画像処理方法およびプログラム Download PDFInfo
- Publication number
- JP2005157905A JP2005157905A JP2003397990A JP2003397990A JP2005157905A JP 2005157905 A JP2005157905 A JP 2005157905A JP 2003397990 A JP2003397990 A JP 2003397990A JP 2003397990 A JP2003397990 A JP 2003397990A JP 2005157905 A JP2005157905 A JP 2005157905A
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- file
- format
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】 複合機100は、原稿から画像データを読み取り、読み取った画像データにポインタ情報が付加されている場合、ポインタ情報を基にオリジナル電子ファイルを取得するが、読み取った画像データにポインタ情報が付加されていない場合、画像データをベクトルデータに変換する。このベクトルデータへの変換の際、ユーザによって指定されたファイル形式、例えばワープロ形式、表形式、プレゼンテーション形式などに応じて、変換内容を変更する。
【選択図】 図4
Description
図1は第1の実施形態における画像処理システムの構成を示す図である。本実施形態の画像処理システムは、オフィス10内のネットワーク(LAN)107と、オフィス20内のネットワーク(LAN)108とが、インターネット104を介して接続された環境で実現される。
図5はブロック選択処理によって記憶部211に保存された画像データを、文字/線画部分とハーフトーンの画像部分とに領域を分離する例を示す図である。同図(A)はブロック選択処理を行う前の画像データを示し、同図(B)はブロック選択処理を行って分離された領域を示す。このブロック選択(セレクション)処理は、読み取った1頁分のイメージデータ(同図(A)参照)を、各オブジェクト毎の塊として認識し、文字(TEXT)、写真(Photo)、線(Line)、表(Table)など、各ブロックの属性を判定し、異なる属性を持つ領域に分割する処理である。
つぎに、ステップS3における電子ファイルの格納位置をイメージ情報から抽出するOCR/OMR処理を示す。図7は原稿画像中に付加された2次元バーコードシンボル(QRコード)を復号してデータ文字列を出力する処理手順を示すフローチャートである。図8は2次元バーコードが付加された原稿を示す図である。
図9はステップS6Aにおけるポインタ情報を基に電子ファイルを検索する処理手順を示すフローチャートである。まず、ポインタ情報に含まれるアドレスに基づき、ファイルサーバを特定する(ステップS31)。ここでは、ファイルサーバとして、クライアントPC102、データベース105を管理する文書管理サーバ106、あるいは記憶部211を有する複合機100が特定される。また、アドレスは、URL、あるいはサーバ名およびファイル名からなるパス情報である。
図10および図11はステップS7におけるファイル検索処理手順を示すフローチャートである。ステップS7の処理は、前述したように、ステップS5で入力された原稿のイメージ情報(入力ファイル)にポインタ情報が存在しなかった場合、あるいはステップS6でポインタ情報は存在しても、電子ファイルが見つからなかった場合に実行される。
ステップS42で数式(1)を満足する場合、さらにファイル内のブロック情報を順次比較する。このブロック情報の比較では、属性類似率、サイズ類似率、OCR類似率をそれぞれ算出し、これらの値を基に、総合類似率を算出する。すなわち、入力ファイルとデータベース内のファイルのブロック属性を比較し(ステップS43)、一致する場合、データベース内のファイルの属性類似率を更新する(ステップS44)。さらに、入力ファイルとデータベース内のファイルのサイズが数式(2)を満足するか否かの判別、つまりサイズ比較処理を行う(ステップS45)。ここで、Wは入力ファイルのブロック幅である。Hは入力ファイルのブロック高さである。ΔWは入力ファイルのブロック幅の誤差である。ΔHは入力ファイルのブロック高さである。wはデータベース内のファイルのブロック幅である。hはデータベース内のファイルのブロック高さである。
数式(2)を満足する場合、データベース内のファイルのサイズ類似率を更新する(ステップS46)。さらに、入力ファイルとデータベース内のファイルが共にOCR情報を有するか否かを判別する(ステップS47)。OCR情報を有する場合、OCR情報を比較し(ステップS48)、OCR類似率を更新する(ステップS49)。尚、属性、サイズ、OCR情報の各類似率の算出には、周知の技術が用いられるので、その説明を省略する。
つぎに、ステップS13におけるベクトル化処理を示す。この処理は、ステップS9で電子ファイルを特定できなかった場合、イメージ全体をベクトル化するものである。まず、文字ブロック内の各文字に対する文字認識処理を行う。
文字認識処理では、文字単位で切り出された画像に対し、パターンマッチングの手法を用いて認識処理を行い、対応する文字コードを取得する。この認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、予め字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とする処理である。特徴ベクトルの抽出には、種々の方法が知られており、例えば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントする、メッシュ数次元ベクトルを特徴とする方法が知られている。
文字認識の際に用いられる字種数分の辞書特徴ベクトルを、文字形状種(フォント種)に対して複数用意し、マッチングの際、文字コードとともにフォント種を出力することで、文字のフォントが認識可能である。
文字認識およびフォント認識によって得られた、文字コードおよびフォント情報を基に、予め用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。元の原稿がカラーである場合、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。これにより、文字ブロックに属するイメージ情報を、形状、大きさおよび色がほぼ忠実に再現されるベクトルデータに変換できる。
ブロック選択処理において、図形、画像、線、表領域として分離された領域を対象とし、その中で抽出された画素塊の輪郭をベクトルデータに変換する。具体的に、輪郭をなす画素の点列を角とみなされる点で区切り、各区間を部分的な直線あるいは曲線で近似する。図12は角を曲線で近似する様子を示す図である。ここで、角とは、曲率が極大となる点である。曲率が極大となる点は、任意点Piに対し、左右k個の離れた点Pi−k、Pi+kの間に弦を引いた場合、この弦と点Piとの距離が極大となる点として求められる。さらに、点Pi−k、点Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間では、直線を点列に対する最小二乗法などを用いてベクトル化し、曲線を3次スプライン関数などを用いてベクトル化する。また、対象が内輪郭を持つ場合、ブロック選択処理で抽出した白画素輪郭の点列を用いて、同様に部分的に直線あるいは曲線で内輪郭を近似する。
つぎに、任意形状の図形の輪郭(アウトライン)をベクトル化した後、これらベクトル化された区分線を図形オブジェクト毎にグループ化する処理を示す。図14はベクトルデータを図形オブジェクト毎にグループ化する処理手順を示すフローチャートである。まず、各ベクトルデータの始点および終点を算出する(ステップS61)。算出された各ベクトルデータの始点および終点情報を用いて、図形要素を検出する(ステップS62)。ここで、図形要素の検出とは、区分線が構成する閉図形を検出することである。この閉図形を検出する際、閉じた形状(閉図形)を構成する各ベクトルは、その両端にそれぞれ連結されるベクトルを有するという原理を応用する。そして、図形要素内に存在する他の図形要素あるいは区分線をグループ化し、1つの図形オブジェクトとし、一方、図形要素内に他の図形要素あいは区分線が存在しない場合、図形要素を図形オブジェクトとする(ステップS63)。この後、本処理を終了する。
前述したブロック選択処理(ステップS2参照)で、1頁分のイメージデータをブロック化し、ベクトル化処理(ステップS13参照)を行った結果、イメージデータは、中間データ形式のファイルに変換されている。この中間データ形式は、ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)形式と呼ばれる。図16はDAOF形式のデータ構造を示す図である。DAOF形式のデータ構造は、ヘッダ(header)791、レイアウト記述データ部792、文字認識記述データ部793、表記述データ部794および画像記述データ部795からなる。
つぎに、ステップS15におけるポインタ情報の付加処理を示す。処理すべき文書が検索処理で特定された場合、あるいはベクトル化によって元のファイルが再生できた場合、この文書を記録処理する(紙への記録)際、ポインタ情報を付与することで、この印刷文書を用いて再度、各種処理を行う際、簡単に元のファイルデータを取得できる。
上記処理により、オリジナル電子ファイルを特定できなかった場合であっても、あたかも元のアプリケーションで作成したのと同等な電子ファイルを得ることができる。ただし、ここで生成されるベクトル化された電子ファイルのファイル形式は、あくまで予め決められたフォーマットに限られる。実際に想定されるアプリケーションは種々様々であり、どのような形式で電子化するかによって、ユーザの利便性は大きく変わってくることになる。
(a)プレーンテキスト形式が指定された場合
この場合、ベクトル化の対象となるのは文字列だけである。図中、符号803、806、809、813で示される各文字列のオブジェクトだけがベクトル化の対象となり、OCR処理により文字コード化される。それ以外のオブジェクトは無視される。
(b)PowerPoint、WORDもしくはRTF形式が指定された場合
文字のコード化と基本図形への置き換え処理を行う。文字列は、上記(a)と同様、OCR処理により文字コードに変換される。楕円形のオブジェクト802、812は、図形のアウトライン情報に基づき、最適な長径/短径を持つ楕円図形に置き換えられる。長方形オブジェクト805およびひし形オブジェクト808も、同様に変換される。矢印804、807、811は、始点および終点の座標に基づき、直線ベクトルに置き換えられ、かつ先端に矢印が付加されていることから、終点に矢印を持つ直線図形として定義される。曲線810は、始点から終点までのアウトラインに基づき、短い直線の集合としてベクトル化され、かつ同様に終点に矢印マークが付与される。
文字列の処理は、上記(a)、(b)と同様であるが、ここではSVG特有の処理としてフォント形状のベクトル化処理が合わせて行われる。すなわち、文字列を1文字単位に分解し、各文字のアウトライン情報に基づき、SVGフォント定義を生成する。このフォント情報がOCRによる文字コード情報と一体として定義されるようにする。このような処理を行うと、文字列に特殊なフォント形式が使われているような文書であっても、その文字形状を保存したまま、ベクトル化処理することが可能になる。
扱われる文書ファイルの中には、第三者による再利用を制限すべきものがある。前記第1の実施形態では、ファイルサーバに蓄積されたファイルは、全て自由にアクセス可能であり、ファイル全体あるいはその一部のオブジェクトが全て再利用可能であることを前提とした。そこで、第2の実施形態では、ポインタ情報からファイルを検索した際、検索の結果、特定したファイルにアクセス権の制限が有る場合を示す。図23は第2の実施形態のステップS6Aにおけるポインタ情報を基に電子ファイルを検索する処理手順を示すフローチャートである。ステップS121〜S124までの処理は、前記第1の実施形態の図9におけるステップS31〜S34までの処理と同様であるので、その説明を省略する。
前記第1の実施形態では、ファイル検索処理で、元の電子ファイルを特定できなかった場合、イメージ画像全体に対してベクトル化処理を行うが、例えば、一般の文書の場合、文書中のオブジェクト全てが新規に作成されたものでなく、一部のオブジェクトは他のファイルから流用して作成されたものである場合がある。
101 マネジメントPC
102 クライアントPC
105、115 データベース
106、116 文書管理サーバ
210 画像読み取り部
211 記憶部
212 記録部
213 入力部
215 データ処理部
216 表示部
311 二次元バーコードシンボル(QRコード)
Claims (10)
- イメージデータを入力する入力手段から入力されたイメージデータからベクトルデータを生成するベクトル化手段と、
該生成されたベクトルデータを所定のファイル形式で出力する出力手段とを備えた画像処理装置。 - 前記所定のファイル形式を選択する選択手段を備え、
前記ベクトル化手段は、前記選択結果を基に、前記ベクトルデータを生成する際のベクトル化処理内容を変更することを特徴とする請求項1記載の画像処理装置。 - 前記入力手段は、原稿の画像を光学的に読み取って画像信号を生成し、該生成された画像信号をイメージデータに変換することを特徴とする請求項1記載の画像処理装置。
- 前記変換されたイメージデータに記述され、前記原稿元の電子ファイルの格納場所を示すポインタ情報を読み取る読取手段を備え、
該読み取られたポインタ情報を基に取得した電子ファイルがイメージデータである場合、前記ベクトル化手段は、前記変換されたイメージデータから前記ベクトルデータを生成することを特徴とする請求項3記載の画像処理装置。 - 前記入力手段は、前記イメージデータとして、2次元のデジタル画素データの配列を入力することを特徴とする請求項1記載の画像処理装置。
- 前記ベクトル化手段は、入力されたラスタ形式のイメージデータを、コード情報、図形情報、関数情報などのコマンド定義形式のデータに変換することを特徴とする請求項1記載の画像処理装置。
- 前記ベクトル化手段は、前記ベクトルデータに変換された前記イメージデータのオブジェクトを所定のアプリケーションソフトウェアで扱える所定のフォーマットに変換するフォーマット変換手段を備えたことを特徴とする請求項1記載の画像処理装置。
- 前記所定のフォーマットは、指定されたファイル形式、もしくは該ファイル形式を生成するソフトウェアによって定義される文書構造フォーマットであることを特徴とする請求項7記載の画像処理装置。
- イメージデータを入力する入力ステップと、
該入力されたイメージデータからベクトルデータを生成するベクトル化ステップと、
該生成されたベクトルデータを所定のファイル形式で出力する出力ステップとを有する画像処理方法。 - 画像処理装置内のCPUによって実行されるプログラムであって、
イメージデータを入力する入力ステップと、
該入力されたイメージデータからベクトルデータを生成するベクトル化ステップと、
該生成されたベクトルデータを所定のファイル形式で出力する出力ステップとを含むことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003397990A JP4310176B2 (ja) | 2003-11-27 | 2003-11-27 | 画像処理装置、画像処理方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003397990A JP4310176B2 (ja) | 2003-11-27 | 2003-11-27 | 画像処理装置、画像処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005157905A true JP2005157905A (ja) | 2005-06-16 |
JP4310176B2 JP4310176B2 (ja) | 2009-08-05 |
Family
ID=34722985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003397990A Expired - Fee Related JP4310176B2 (ja) | 2003-11-27 | 2003-11-27 | 画像処理装置、画像処理方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4310176B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008065573A (ja) * | 2006-09-07 | 2008-03-21 | Asuka Corporation:Kk | 注文カードのocr読み取り結果自動訂正システム |
US20120099158A1 (en) * | 2010-10-25 | 2012-04-26 | Konica Minolta Business Technologies, Inc. | Data processing device and data processing method |
JP2013130997A (ja) * | 2011-12-21 | 2013-07-04 | Kyocera Document Solutions Inc | 画像形成装置 |
US9277094B2 (en) | 2012-02-17 | 2016-03-01 | Konica Minolta Business Technologies, Inc. | Image processing apparatus and recording medium |
-
2003
- 2003-11-27 JP JP2003397990A patent/JP4310176B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008065573A (ja) * | 2006-09-07 | 2008-03-21 | Asuka Corporation:Kk | 注文カードのocr読み取り結果自動訂正システム |
US20120099158A1 (en) * | 2010-10-25 | 2012-04-26 | Konica Minolta Business Technologies, Inc. | Data processing device and data processing method |
CN102457643A (zh) * | 2010-10-25 | 2012-05-16 | 柯尼卡美能达商用科技株式会社 | 数据处理装置及数据处理方法 |
US9049324B2 (en) | 2010-10-25 | 2015-06-02 | Konica Minolta Business Technologies, Inc. | Data processing device and data processing method for creating a file in a specified format or outputting a file in a determined format |
JP2013130997A (ja) * | 2011-12-21 | 2013-07-04 | Kyocera Document Solutions Inc | 画像形成装置 |
US9277094B2 (en) | 2012-02-17 | 2016-03-01 | Konica Minolta Business Technologies, Inc. | Image processing apparatus and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP4310176B2 (ja) | 2009-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7681121B2 (en) | Image processing apparatus, control method therefor, and program | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
US8339619B2 (en) | System and image processing method and apparatus for re-using and re-editing images | |
US8520006B2 (en) | Image processing apparatus and method, and program | |
EP1455284B1 (en) | Image processing method and image processing system | |
US7391917B2 (en) | Image processing method | |
US7542605B2 (en) | Image processing apparatus, control method therefor, and program | |
JP4393161B2 (ja) | 画像処理装置及び画像処理方法 | |
JP3862694B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4227432B2 (ja) | 画像処理方法 | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
JP2007129557A (ja) | 画像処理システム | |
JP4310176B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2005149097A (ja) | 画像処理システム及び画像処理方法 | |
JP4185858B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2006134042A (ja) | 画像処理システム | |
JP2006146486A (ja) | 画像処理装置 | |
JP2005208872A (ja) | 画像処理システム | |
JP2008084127A (ja) | 画像形成装置 | |
JP2005136729A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 | |
JP2006195886A (ja) | 画像処理システム | |
JP2005165674A (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
JP2005157447A (ja) | 画像処理システム及び画像処理方法 | |
JP2005149098A (ja) | 画像処理システム及び画像処理装置並びに画像処理方法 | |
JP2006148663A (ja) | 画像処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051209 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051209 |
|
RD05 | Notification of revocation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7425 Effective date: 20070626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090428 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090511 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4310176 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120515 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120515 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130515 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140515 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |