JP2007328196A - 画像処理装置、画像処理方法および画像処理プログラム - Google Patents

画像処理装置、画像処理方法および画像処理プログラム Download PDF

Info

Publication number
JP2007328196A
JP2007328196A JP2006160193A JP2006160193A JP2007328196A JP 2007328196 A JP2007328196 A JP 2007328196A JP 2006160193 A JP2006160193 A JP 2006160193A JP 2006160193 A JP2006160193 A JP 2006160193A JP 2007328196 A JP2007328196 A JP 2007328196A
Authority
JP
Japan
Prior art keywords
document
image
unit
image data
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006160193A
Other languages
English (en)
Inventor
Masanori Onda
昌徳 恩田
Shunsuke Kodaira
俊輔 小平
Yuzuru Suzuki
譲 鈴木
Hiroyuki Kono
裕之 河野
Kunikazu Ueno
邦和 上野
Koichi Fujii
晃一 藤井
Atsushi Ito
篤 伊藤
Natsumi Miyazawa
なつみ 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006160193A priority Critical patent/JP2007328196A/ja
Publication of JP2007328196A publication Critical patent/JP2007328196A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Transmission Control (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】文書中の情報を効率的に秘匿化するための画像処理技術を提供する。
【解決手段】領域認識部100は、スキャナ部14により生成された文書画像データからテキスト画像データと画像データを生成する。文字認識部101は、テキスト画像データに対して文字認識を行い、テキストデータを生成する。秘匿対象情報特定部102は、画像データにより表される画像とテキストデータにより表されるテキストから、秘匿対象として指定されたオブジェクトを特定し、秘匿情報テーブルTB1に記憶する。テキスト検索部103は、テキストデータにより表されるテキストから、秘匿情報テーブルTB1に記憶されている文字列を検索する。画像検索部104は、画像データにより表される画像から、秘匿情報テーブルTB1に記憶されているオブジェクトを検索する。暗号化部105は、検索されたオブジェクトを暗号化する。
【選択図】図2

Description

本発明は、文書中の情報を秘匿化するための画像処理技術に関する。
昨今の個人情報意識の高まりを背景に、文書中に含まれる顧客名や連絡先等の個人情報を秘匿化するための技術が提案されている。例えば、特許文献1では、送信原稿の指定領域のみを暗号画像に符号化して送信するファクシミリ装置が提案されている。このファクシミリ装置によれば、マーカー等により予め指定された領域が暗号化画像により置換されるため、指定された領域の機密を保持することができる。また、特許文献2では、画像全体のうちの所望の領域の複写を抑制する画像処理装置が提案されている。この画像処理装置によれば、予めディスプレイ上で指定された複写禁止領域にタイル状のパターンやバツ印のパターンが合成されるため、複写禁止領域の複写が抑制される。
特開昭63−212275号公報 特開2005−79628号公報
しかし、上記の技術はいずれも、ユーザにより指定された領域のみを秘匿化するための技術であるため、秘匿すべき情報が繰り返し登場する文書をファックス送信または複写する場合には、当該文書中に登場するすべての秘匿すべき情報を対象領域として指定しなければならないという問題がある。
本発明は、このような課題を解決するためになされたものであり、文書中の情報を効率的に秘匿化するための画像処理技術を提供することを目的とする。
上記の課題を解決するために本発明は、複数のオブジェクトを含む文書を読み取り、当該文書の画像を表す文書画像データを生成する画像読取手段と、文書において秘匿すべきオブジェクトを特定する特定手段と、前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定手段により特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出手段と、前記画像読取手段により生成された文書画像データのうち、前記抽出手段により抽出されたオブジェクトを表すデータを当該データとは異なるデータにより置換する置換手段とを備えることを特徴とする画像処理装置を提供する。
また、本発明は、複数のオブジェクトを含む文書から当該文書の画像を表す文書画像データを生成する画像読取手段と、文書において秘匿すべきオブジェクトを特定する特定手段と、前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定手段により特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出手段と、前記抽出手段によりオブジェクトが抽出された場合に、前記画像読取手段により生成された文書画像データの出力を禁止する出力制御手段とを備えることを特徴とする画像処理装置を提供する。
また、本発明は、複数のオブジェクトを含む文書を読み取り、当該文書の画像を表す文書画像データを生成する画像読取ステップと、文書において秘匿すべきオブジェクトを特定する特定ステップと、前記画像読取ステップにおいて生成された文書画像データにより表される文書画像から、前記特定ステップにおいて特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出ステップと、前記画像読取ステップにより生成された文書画像データのうち、前記抽出ステップにより抽出されたオブジェクトを表すデータを当該データとは異なるデータにより置換する置換ステップとを備えることを特徴とする画像処理方法を提供する。
また、本発明は、複数のオブジェクトを含む文書から当該文書の画像を表す文書画像データを生成する画像読取ステップと、文書において秘匿すべきオブジェクトを特定する特定ステップと、前記画像読取ステップにおいて生成された文書画像データにより表される文書画像から、前記特定ステップにおいて特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出ステップと、前記抽出ステップにおいてオブジェクトが抽出された場合に、前記画像読取ステップにおいて生成された文書画像データの出力を禁止する出力制御ステップとを備えることを特徴とする画像処理方法を提供する。
また、本発明は、コンピュータを、複数のオブジェクトを含む文書を読み取り、当該文書の画像を表す文書画像データを生成する画像読取手段と、文書において秘匿すべきオブジェクトを特定する特定手段と、前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定手段により特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出手段と、前記画像読取手段により生成された文書画像データのうち、前記抽出手段により抽出されたオブジェクトを表すデータを当該データとは別のデータにより置換する置換手段として機能させるための画像処理プログラムを提供する。
また、本発明は、コンピュータを、複数のオブジェクトを含む文書を読み取り、当該文書の画像を表す文書画像データを生成する画像読取手段と、文書において秘匿すべきオブジェクトを特定する特定手段と、前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定手段により特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出手段と、前記抽出手段によりオブジェクトが抽出された場合に、前記画像読取手段により生成された文書画像データの出力を禁止する出力制御手段として機能させるための画像処理プログラムを提供する。
以下、図面を参照して本発明の実施形態について説明する。
(1)第1実施形態
(1−1)構成
図1は、本実施形態に係る画像処理装置1のハードウェア構成を示すブロック図である。同図に示されるように、画像処理装置1は、制御部10、記憶部11、表示部12、指示入力部13およびスキャナ部14により構成されている。
制御部10は、CPU(Central Processing Unit)、ROM(Read Only Memory)およびRAM(Random Access Memory)により構成されている。CPUは、ROMに記憶されている画像処理プログラムを読み出して実行することにより、後述する画像処理を画像処理装置1に実行させる。RAMは、CPUがプログラムを実行するためのワークエリアとして利用される。
記憶部11は、HDD(Hard Disk Drive)等の記憶装置であり、後述する画像処理の際に参照される標準文字特徴量辞書D1と秘匿情報テーブルTB1を記憶する。
標準文字特徴量辞書D1には、日常一般的に使用される文字の文字パターンの特徴量が登録されている。ここで、文字パターンの特徴量とは、文字の濃度、縦横比、輝度、色の分布状態、エッジの分布状態等に基づいて算出される値である。
秘匿情報テーブルTB1には、秘匿すべき文字列および画像(以下では、文字列および画像を総称してオブジェクトと称する)が記憶される。秘匿されるべき文字列としては、例えば、顧客の氏名、住所、電話番号等の個人情報が考えられる。一方、秘匿すべき画像としては、例えば、取引先企業のトレードマークやロゴマーク等の特定の自然人又は法人を特定しうる画像が考えられる。
秘匿情報テーブルTB1に画像が登録される際には、登録する画像の特徴量も当該画像と関連づけて登録される。この画像の特徴量とは、画像の濃度、縦横比、輝度、色の分布状態、エッジの分布状態等に基づいて算出される値である。このように秘匿すべき画像とともに当該画像の特徴量が記憶されることで、特徴量に基づいた秘匿対象の検索が可能となる。すなわち、秘匿情報テーブルTB1に記録されている画像の特徴量と比較した場合に、その類似度が、予め設定された値以上となる特徴量を有する画像を秘匿対象として検索することが可能となる。従って、仮に、要求する類似度の値を低めに設定した場合には、秘匿情報テーブルTB1に記録された画像に類似する画像を広く秘匿対象とすることができる。
表示部12は、液晶ディスプレイ等の表示装置であり、画像処理装置1を操作するための操作画面の表示や、文書画像の表示を行う。
指示入力部13は、マウスやキーボード等の入力装置であり、操作者の指示に対応する指示データを制御部10へ送る。
スキャナ部14は、文書が載置されるプラテンガラスと、載置された文書に光を照射する光学機構と、文書から反射された光を受け取って電気信号に変換する光電変換素子と、電気信号から画像データを生成する変換部等により構成され、制御部10の制御に従って文書の画像データを生成する。
図2は、画像処理プログラム実行時の制御部10の機能構成を示す機能ブロック図である。制御部10のROMに記憶されている画像処理プログラムがCPUにより実行されると、領域認識部100、文字認識部101、秘匿対象情報特定部102、テキスト検索部103、画像検索部104および暗号化部105の各機能が実現される。
領域認識部100は、スキャナ部14により生成された文書画像データに対してレイアウト解析等を行い、当該文書画像データにより表される文書画像を所定の領域に分割し、文書画像内のテキスト領域の画像を表すテキスト画像データと、文書画像内における当該テキスト領域の位置を表す位置データを生成する。また、領域認識部100は、上記の文書画像データから、テキスト以外の画像領域を表す画像データと、文書画像内における当該画像領域の位置を表す位置データを生成する。
文字認識部101は、領域認識部100により生成されたテキスト画像データに対して文字認識処理を行う。具体的には、生成されたテキスト画像データを文字単位で分割し、分割された各文字の特徴量を算出する。そして、算出した特徴量と、標準文字特徴量辞書D1に登録されている特徴量とを比較して文字を推定することにより、テキスト画像内のテキストを表すテキストデータを生成する。
秘匿対象情報特定部102は、領域認識部100により生成された画像データにより表される画像と、文字認識部101により生成されたテキストデータにより表されるテキストから、画像処理装置1のユーザにより秘匿対象として指定されたオブジェクトを特定する。秘匿対象の指定は、画像処理装置1のユーザが、表示部12に表示された文書画像を参照しつつ指示入力部13を用いて行う。秘匿対象情報特定部102は、特定したオブジェクトを記憶部11の秘匿情報テーブルTB1に記憶する。この際、文書画像中の画像が秘匿対象として指定された場合には、当該画像の特徴量を算出して、当該特徴量も秘匿情報テーブルTB1に記憶する。
尚、秘匿対象情報特定部102は、指示入力手段13を介したユーザからの指示を通じて秘匿対象を特定するのではなく、領域認識部100により生成された画像データにより表される画像と、文字認識部101により生成されたテキストデータにより表されるテキストに直接施されたレイアウト表現上の特徴に基づいて秘匿対象を特定してもよい。ここで、レイアウト上の特徴とは、例えば、オブジェクトのフォント、色、下線や囲み枠の有無により判断される視覚的な特徴である。
テキスト検索部103は、文字認識部101により生成されたテキストデータにより表されるテキストから、秘匿情報テーブルTB1に記憶されている文字列を検索する。
画像検索部104は、領域認識部100により生成された画像データにより表される画像から、秘匿情報テーブルTB1に記憶されているオブジェクトを検索する。より具体的には、秘匿情報テーブルTB1に記録されているオブジェクトの特徴量と比較した場合に、その類似度が、予め設定された値以上となる特徴量を有するオブジェクトを検索する。ここで設定される類似度の値は、指示入力部13を用いて任意に設定可能である。
暗号化部105は、テキスト検索部103または画像検索部104により検索されたオブジェクトを暗号化する。具体的には、検索されたオブジェクトを表すデータを所定の暗号化キーにより暗号化し、当該暗号化されたデータにより、オブジェクトを表すデータを置換する。
(1−2)動作
次に、本実施形態に係る画像処理装置1により実行される画像処理について図3のフローチャートを参照して説明する。
画像処理装置1のユーザが、スキャナ部14のプラテンガラスに文書を載置し、指示入力部13を用いて当該文書の読み取りを指示すると、画像処理装置1の制御部10は、当該文書の読み取りをスキャナ部14に指示する。スキャナ部14は、この指示に従って文書を光学的に読み取り、当該文書を表す文書画像データを制御部10へ送る(ステップS1)。
制御部10は、スキャナ部14から受け取った文書画像データに対してレイアウト解析等を行い、当該文書画像データにより表される文書画像を所定の領域に分割し、文書画像内のテキスト領域を表すテキスト画像データと、文書画像内における当該テキスト領域の位置を表す位置データを生成する。また、領域認識部100は、上記の文書画像データから、テキスト以外の画像領域を表す画像データと、文書画像内における当該画像領域の位置を表す位置データを生成する(ステップS2)。図4は、当該処理の結果得られる文書画像の一例である。パラグラフA〜Dはテキスト領域であると判定され、画像AおよびBは画像領域であると判定されている。テキスト画像データに対しては、標準文字特徴量辞書D1を用いて文字認識を行い、テキスト領域内のテキストを表すテキストデータを生成する(ステップS3)。
次に、制御部10は、生成された画像データとテキストデータに基づいて、表示部12に文書画像を表示させる(ステップS4)。この文書画像を参照して、画像処理装置1のユーザが秘匿対象を指定する操作を行うと、制御部10は、指定されたオブジェクトを特定し、当該オブジェクトを秘匿情報テーブルTB1に記憶する(ステップS5)。図5に示される例では、文字列「ABC」と画像Aが秘匿対象として指定されているため、これらのオブジェクトが秘匿情報テーブルTB1に記憶される。
尚、文書画像中の画像が秘匿対象として指定された場合には、当該画像の特徴量を算出して、当該特徴量も秘匿情報テーブルTB1に記憶する。
次に、制御部10は、上記のテキストデータにより表されるテキストから、秘匿情報テーブルTB1に記憶されている文字列に完全に一致する文字列を検索する(ステップS6)。この検索の結果、完全に一致する文字列が抽出された場合には(ステップS6;YES)、抽出された文字列を暗号化キーにより暗号化し、当該暗号化データにより、抽出された文字列を表すデータを置換する(ステップS7)。
例えば、図5に示される例では、文字列「ABC」が秘匿対象として指定されているため、パラグラフA中の左端の文字列「ABC」と、パラグラフD中の左端の文字列「ABC」が検索され、暗号化されることになる。
一方、上記の検索の結果、秘匿情報テーブルTB1に記憶されている文字列と完全に一致する文字列が抽出されなかった場合には(ステップS6;NO)、制御部10は、上記テキストから、秘匿情報テーブルTB1に記憶されている文字列と部分的に一致する文字列を検索する(ステップS8)。この検索の結果、部分的に一致する文字列が抽出された場合には(ステップS8;YES)、制御部10は、秘匿情報テーブルTB1に記憶されている文字列を構成する文字のうち、抽出された文字列に含まれない文字を検索する(ステップS9)。この際、制御部10は、抽出された文字列と隣接する画像中から、抽出された文字列に含まれない文字を検索する。
具体的には、制御部10は、まず、抽出された文字列と隣接する画像を、上述の位置データを参照して特定する。次に、制御部10は、この画像を表す画像データにより表される画像の特徴量を算出し、抽出された文字列に含まれない文字の特徴量と比較する。この結果、両者の類似度が所定の値以上である場合には、前記画像中に、抽出された文字列に含まれなかった文字が含まれていると判定し、所定の値未満である場合には、含まれていないと判定する。
例えば、図5に示される例において、パラグラフD中の右端に位置する文字「A」が部分的に一致する文字として検索された場合には、このパラグラフDの右側に隣接する画像B内において、文字列「BC」が検索されることになる。
上記の検索の結果、抽出された文字列に含まれない文字が抽出された場合には(ステップS9;YES)、抽出された文字列、すなわち、ステップS8においてテキスト領域から抽出された文字列とステップS9においてグラフィク領域から抽出された文字列とを暗号化キーにより暗号化し、当該暗号化データにより、抽出された文字列を表すデータを置換する(ステップS7)。
一方、ステップS8の検索の結果、部分的に一致する文字列が抽出されなかった場合や(ステップS8;NO)、ステップS9の検索の結果、抽出された文字列に含まれない文字が抽出されなかった場合には(ステップS9;NO)、制御部10は、テキスト領域の検索を終了する。
また、制御部10は、テキスト全体に対する文字列の検索および暗号化が完了した場合も(ステップS10;YES)、テキスト領域の検索を終了する。
次に、制御部10は、スキャナ部14から受け取った文書画像データから生成された画像データにより表される画像領域から、秘匿情報テーブルTB1に記憶されているオブジェクトと一致するオブジェクト、すなわち、秘匿情報テーブルTB1に記憶されているオブジェクトの特徴量と比較した場合に、その類似度が、所定の値以上となる特徴量を有するオブジェクトを検索する(ステップS11)。
この検索の結果、秘匿情報テーブルTB1に記憶されているオブジェクトと一致するオブジェクトが抽出された場合には(ステップS11;YES)、制御部10は、抽出されたオブジェクトを暗号化キーにより暗号化し、当該暗号化データにより、抽出されたオブジェクトを表すデータを置換する(ステップS12)。
例えば、図5に示される例では、画像Aが秘匿対象として指定されているため、当該画像Aのみが検索され、暗号化されることになる。
一方、上記の検索の結果、秘匿情報テーブルTB1に記憶されているオブジェクトと一致するオブジェクトが抽出されなかった場合には(ステップS11;NO)、制御部10は、画像領域の検索を終了する。
また、制御部10は、画像領域に対するオブジェクトの検索および暗号化が完了した場合も(ステップS13;YES)、画像領域の検索を終了する。
制御部10は、テキスト領域の検索および暗号化の結果得られたテキストデータと、画像領域の検索および暗号化の結果得られた画像データを合成して文書ファイルを作成し(ステップS14)、記憶部11に記憶する(ステップS15)。
以上説明したように、本実施形態に係る画像処理装置1では、秘匿対象として指定されたオブジェクトが秘匿情報テーブルTB1に一旦記憶され、この秘匿情報テーブルTB1に記憶されたオブジェクトと一致するオブジェクトが文書画像から検索される構成となっている。従って、画像処理装置1のユーザは、たとえ秘匿すべき情報が繰り返し登場する文書を暗号化する場合でも、秘匿すべきオブジェクトを1つだけ指定するだけで文書画像に含まれるすべての秘匿すべきオブジェクトを暗号化することができる。
また、本実施形態に係る画像処理装置1では、秘匿情報テーブルTB1に記憶されている文字列と部分的に一致する文字列が検索された場合に、当該文字列に隣接する画像から残りの文字列が検索される構成となっている。従って、図4および5に示される例のように文書画像の領域分離が不完全な場合であっても、秘匿すべき文字列を確実に暗号化することができる。
さらに、本実施形態に係る画像処理装置1では、秘匿すべき画像とともに当該画像の特徴量も秘匿情報テーブルTB1に記憶され、特徴量に基づいて秘匿対象が検索される構成となっている。従って、要求する類似度の値を低めに設定することにより、秘匿情報テーブルTB1に記憶されている画像に類似する画像を広く秘匿対象とすることができる。
(2)第2実施形態
(2−1)構成
図6は、本実施形態に係る画像処理装置2のハードウェア構成を示すブロック図である。同図に示されるように、画像処理装置2は、制御部10、記憶部11、表示部12、指示入力部13、スキャナ部14およびプリンタ部20により構成されている。このハードウェア構成は、プリンタ部20を備えている点を除くと第1実施形態に係る画像処理装置1のハードウェア構成と同じである。従って、プリンタ部20以外の構成要素の説明については省略し、その符号については画像処理装置1の構成要素と同一の符号を用いる。
プリンタ部20は、紙やOHPシート等の記録媒体を格納するカセットと、記録媒体に文字や図形を印刷する印刷機構と、印刷機構に記録媒体を搬送する搬送機構等により構成され、制御部10の制御に従って記録媒体に対する印刷を行う。
本実施形態に係る画像処理装置2では、秘匿すべきオブジェクトが予め秘匿情報テーブルTB1に記憶されている。すなわち、画像処理装置2では、スキャナ部14により読み取られた文書から秘匿すべきオブジェクトを特定するのではなく、画像処理装置2のユーザが秘匿したいオブジェクトが予め秘匿情報テーブルTB1に記憶されているのである。
秘匿情報テーブルTB1に画像が登録される際には、第1実施形態と同様に、登録する画像の特徴量も当該画像と関連づけて登録される。
秘匿情報テーブルTB1に文字列を登録する際には、登録する文字列に関連する画像を当該文字列と関連づけて登録してもよい。また、逆に、秘匿情報テーブルTB1に画像を登録する際に、登録する画像に関連する文字列を当該画像と関連づけて登録してもよい。このような例としては、取引先企業の名称と、当該企業のトレードマークとを関連づけて登録する場合が考えられる。
図7は、画像処理プログラム実行時の制御部10の機能構成を示す機能ブロック図である。制御部10のROMに記憶されている画像処理プログラムがCPUにより実行されると、領域認識部100、文字認識部101、テキスト検索部103、画像検索部104および置換部200の各機能が実現される。この機能構成のうち、領域認識部100、文字認識部101、テキスト検索部103および画像検索部104の各機能は第1実施形態に係る画像処理装置1と共通している。従って、置換部200以外の各機能の説明については省略し、その符号については画像処理装置1の各機能と同一の符号を用いる。
置換部200は、テキスト検索部103または画像検索部104により検索されたオブジェクトについて、当該オブジェクトを表すデータを単色によるベタ塗り画像を表すデータにより置換する。尚、オブジェクトを置換する画像は、空白画像でもよい。
(2−2)動作
次に、本実施形態に係る画像処理装置1により実行される画像処理について図8を参照して説明する。図8は、本画像処理のフローチャートである。
本実施形態に係る画像処理装置2では、上述のように、スキャナ部14により読み取られた文書から秘匿すべきオブジェクトを特定するのではなく、画像処理装置2のユーザが秘匿したいオブジェクトが予め秘匿情報テーブルTB1に記憶される。従って、本画像処理では、第1実施形態に係る画像処理における秘匿すべき情報を特定する処理(ステップS4およびS5)は実行されない。
また、本実施形態に係る画像処理装置2では、上述のように、第1実施形態に係る暗号化部105に代えて置換部200が実現される。従って、本画像処理では、これに伴い、第1実施形態に係る画像処理におけるオブジェクトデータを暗号化する処理(ステップS7およびS12)に代えて、オブジェクトデータをベタ塗り画像データに置換する処理(ステップS20およびS21)が実行される。
また、本実施形態に係る画像処理装置2では、上述のように、第1実施形態に係る画像処理装置1が備えるハードウェアに加えて新たにプリンタ部20を備えている。第1実施形態に係る画像処理では、オブジェクトの検索および暗号化の結果得られた文書ファイルが記憶部11に記憶されていたが(ステップS15)、本実施形態に係る画像処理では、当該文書ファイルにより表される画像がプリンタ部20により記録用紙に印刷される(ステップS22)。
本画像処理を構成するその他の処理(ステップ1〜3、6、8〜11、13および14)は、すべて第1実施形態の画像処理と共通している。従って、これらの処理の説明については省略し、その符号については第1実施形態の画像処理と同一の符号を用いる。
以上説明したように、本実施形態に係る画像処理装置2では、当該装置のユーザが秘匿したいオブジェクトが予め秘匿情報テーブルTB1に記憶され、この秘匿情報テーブルTB1に記憶されたオブジェクトと一致するオブジェクトが文書画像から検索される構成となっている。従って、画像処理装置2のユーザは、たとえ秘匿すべき情報が繰り返し登場する文書を暗号化する場合でも、秘匿すべきオブジェクトを秘匿情報テーブルTB1に記憶させておくことで、文書画像に含まれるすべての秘匿すべきオブジェクトをベタ塗り画像に置換することができる。
(3)変形例
上述の実施形態では、スキャナ部14により文書画像を読み取って当該文書画像を表す文書画像データを作成しているが、ネットワーク経由で文書画像データを直接取得してもよい。
上述の実施形態では、画像処理装置1または2の記憶部11に類義語辞書を記憶させ、この類義語辞書を用いたテキスト検索をテキスト検索部103に実行させてもよい。この場合、テキスト検索部103は、秘匿情報テーブルTB1に記憶されている文字列に加えて、当該文字列に意味が類似する文字列を検索する。
上述の実施形態では、オブジェクトの一致/不一致を判定する際の基準となる類似度の値が固定的に設定されているが、この類似度の値は、画像処理装置1または2のユーザごとに設定されてもよい。文書の秘匿化の範囲は、類似度の値が低くなるにつれて広くなるため、例えば、役職の低いユーザに対して類似度の値を低く設定した場合には、当該ユーザが画像処理する文書の秘匿化の範囲をより広くすることができる。すなわち、秘匿化すべき情報の漏洩をより確実に防止することができる。
尚、ユーザを識別する方法としては、画像形成装置1または2にログインする際に入力するユーザIDに基づいて識別する方法がある。また、画像識別装置1または2がネットワークに接続され、ネットワーク経由で文書画像データを取得する場合であれば、当該文書画像データの送信元アドレスに基づいてユーザを識別することも可能である。
上述の実施形態では、秘匿情報テーブルTB1に記憶されているオブジェクトと一致するオブジェクトが検索されるごとに当該オブジェクトの秘匿化が行われているが、秘匿すべきオブジェクトが繰り返し登場する文書を画像処理する場合には、最初に登場するオブジェクトのみを暗号化処理し、それ以降に登場する同一のオブジェクトについては、最初のオブジェクトを暗号化することにより得られた暗号化データによりそのデータを置換してもよい。具体的な方法としては、最初に登場するオブジェクトを暗号化した際に、当該オブジェクトと当該オブジェクトの暗号化データとを関連づけて制御部10のRAMに格納しておき、以後同じオブジェクトが検索されると、RAMに格納された暗号化データを読み出して当該検索されたオブジェクトのデータと置換する。
上述の第2実施形態では、秘匿すべきオブジェクトのデータをベタ塗り画像データにより置換することにより、秘匿対象のみを秘匿化する構成となっているが、秘匿すべきオブジェクトが1つでも検索された時点で、当該オブジェクトを含む文書画像全体の印刷を中止するように構成してもよい。
上述の実施形態では、画像処理装置1または2が備える制御部10のROMに画像処理プログラムが記憶され、この画像処理プログラムに従って画像処理装置1または2において画像処理が実行されている。しかし、この画像処理プログラムは、CD−ROM等の記憶媒体やネットワークを介して一般的なコンピュータ装置にインストールされ、当該コンピュータ装置において本発明に係る画像処理を実行させるようにしてもよい。
本発明の第1実施形態に係る画像処理装置1のハードウェア構成を示すブロック図である。 画像処理装置1の機能構成を示す機能ブロック図である。 第1実施形態に係る画像処理のフローチャートである。 文書画像の一例を示す図である。 文書画像の一例を示す図である。 本発明の第2実施形態に係る画像処理装置2のハードウェア構成を示すブロック図である。 画像処理装置2の機能構成を示す機能ブロック図である。 第2実施形態に係る画像処理のフローチャートである。
符号の説明
1、2…画像処理装置、10…制御部、11…記憶部、12…表示部、13…指示入力部、14…スキャナ部、20…プリンタ部、100…領域認識部、101…文字認識部、102…秘匿対象情報特定部、103…テキスト検索部、104…画像検索部、105…暗号化部、200…置換部、D1…標準文字特徴量辞書、TB1…秘匿情報テーブル。

Claims (10)

  1. 複数のオブジェクトを含む文書を読み取り、当該文書の画像を表す文書画像データを生成する画像読取手段と、
    文書において秘匿すべきオブジェクトを特定する特定手段と、
    前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定手段により特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出手段と、
    前記画像読取手段により生成された文書画像データのうち、前記抽出手段により抽出されたオブジェクトを表すデータを当該データとは異なるデータにより置換する置換手段と
    を備えることを特徴とする画像処理装置。
  2. 複数のオブジェクトを含む文書から当該文書の画像を表す文書画像データを生成する画像読取手段と、
    文書において秘匿すべきオブジェクトを特定する特定手段と、
    前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定手段により特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出手段と、
    前記抽出手段によりオブジェクトが抽出された場合に、前記画像読取手段により生成された文書画像データの出力を禁止する出力制御手段と
    を備えることを特徴とする画像処理装置。
  3. ユーザの操作に応じて、文書において秘匿すべきオブジェクトを指定する指示入力手段をさらに備え、
    前記特定手段は、前記文書画像データにより表される文書画像において前記指示入力手段により指定されたオブジェクトを、秘匿すべきオブジェクトとして特定することを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記置換手段は、前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定されたオブジェクトに対して所定の類似性を有する、同じオブジェクトが前記抽出手段により複数抽出された場合、当該抽出されたオブジェクトのうち1のオブジェクトについては、当該1のオブジェクトを表すデータを暗号化して得られた暗号化データにより前記1のオブジェクトの置換を行う一方、他のオブジェクトについては、当該他のオブジェクトを暗号化せずに、前記1のオブジェクトを表すデータを暗号化して得られた暗号化データにより当該他のオブジェクトの置換を行うことを特徴とする請求項1に記載の画像処理装置。
  5. 前記画像読取手段により生成された文書画像データにより表される文書画像に含まれる文字を認識してテキストデータを生成する文字認識手段をさらに備え、
    前記抽出手段は、前記特定手段により特定されたオブジェクトが所定の文字列である場合には、前記文字認識手段により生成されたテキストデータから、当該文字列に対して所定の類似性を有する文字列を抽出し、
    前記置換手段は、前記画像読取手段により生成された文書画像データのうち、前記抽出手段により抽出された文字列を表すデータを暗号化し、当該暗号化されたデータにより前記抽出された文字列を置換することを特徴とする請求項1に記載の画像処理装置。
  6. 文書中において秘匿すべきオブジェクトの特徴量を記憶する記憶手段と、
    前記画像読取手段により生成された文書画像データにより表される文書画像を印刷する印刷手段と
    をさらに備え、
    前記抽出手段は、前記画像読取手段により生成された文書画像データにより表される文書画像から、前記記憶手段に記憶されたオブジェクトの特徴量との差が第1の閾値よりも小さい特徴量を有するオブジェクトを抽出し、
    前記出力制御手段は、前記抽出手段によりオブジェクトが抽出された場合に、前記画像読取手段により生成された文書画像データが印刷手段により印刷されることを禁止することを特徴とする請求項2に記載の画像処理装置。
  7. 複数のオブジェクトを含む文書を読み取り、当該文書の画像を表す文書画像データを生成する画像読取ステップと、
    文書において秘匿すべきオブジェクトを特定する特定ステップと、
    前記画像読取ステップにおいて生成された文書画像データにより表される文書画像から、前記特定ステップにおいて特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出ステップと、
    前記画像読取ステップにより生成された文書画像データのうち、前記抽出ステップにより抽出されたオブジェクトを表すデータを当該データとは異なるデータにより置換する置換ステップと
    を備えることを特徴とする画像処理方法。
  8. 複数のオブジェクトを含む文書から当該文書の画像を表す文書画像データを生成する画像読取ステップと、
    文書において秘匿すべきオブジェクトを特定する特定ステップと、
    前記画像読取ステップにおいて生成された文書画像データにより表される文書画像から、前記特定ステップにおいて特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出ステップと、
    前記抽出ステップにおいてオブジェクトが抽出された場合に、前記画像読取ステップにおいて生成された文書画像データの出力を禁止する出力制御ステップと
    を備えることを特徴とする画像処理方法。
  9. コンピュータを、
    複数のオブジェクトを含む文書を読み取り、当該文書の画像を表す文書画像データを生成する画像読取手段と、
    文書において秘匿すべきオブジェクトを特定する特定手段と、
    前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定手段により特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出手段と、
    前記画像読取手段により生成された文書画像データのうち、前記抽出手段により抽出されたオブジェクトを表すデータを当該データとは異なるデータにより置換する置換手段
    として機能させるための画像処理プログラム。
  10. コンピュータを、
    複数のオブジェクトを含む文書から当該文書の画像を表す文書画像データを生成する画像読取手段と、
    文書において秘匿すべきオブジェクトを特定する特定手段と、
    前記画像読取手段により生成された文書画像データにより表される文書画像から、前記特定手段により特定されたオブジェクトに対して所定の類似性を有するオブジェクトを抽出する抽出手段と、
    前記抽出手段によりオブジェクトが抽出された場合に、前記画像読取手段により生成された文書画像データの出力を禁止する出力制御手段
    として機能させるための画像処理プログラム。
JP2006160193A 2006-06-08 2006-06-08 画像処理装置、画像処理方法および画像処理プログラム Pending JP2007328196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006160193A JP2007328196A (ja) 2006-06-08 2006-06-08 画像処理装置、画像処理方法および画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006160193A JP2007328196A (ja) 2006-06-08 2006-06-08 画像処理装置、画像処理方法および画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2007328196A true JP2007328196A (ja) 2007-12-20

Family

ID=38928705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006160193A Pending JP2007328196A (ja) 2006-06-08 2006-06-08 画像処理装置、画像処理方法および画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2007328196A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011015105A (ja) * 2009-06-30 2011-01-20 Canon It Solutions Inc 画像形成装置、及びその制御方法、プログラム、プログラムを記憶した記憶媒体
JP5192039B2 (ja) * 2008-05-29 2013-05-08 株式会社Pfu 電子ドキュメント処理システム、方法およびプログラム
JP2013105207A (ja) * 2011-11-10 2013-05-30 Fujitsu Ltd 秘匿化データの検索のための情報処理方法及び装置
JP2014219448A (ja) * 2013-05-01 2014-11-20 コニカミノルタ株式会社 表示システム、表示方法、表示端末および表示プログラム
JP2015004998A (ja) * 2013-06-18 2015-01-08 京セラドキュメントソリューションズ株式会社 画像形成装置および画像形成プログラム
US9310722B2 (en) 2011-03-18 2016-04-12 Ricoh Company, Limited Image forming apparatus and image forming method
JP2016065904A (ja) * 2014-09-22 2016-04-28 カシオ計算機株式会社 情報処理装置、情報処理方法及びプログラム
JP2020154062A (ja) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5192039B2 (ja) * 2008-05-29 2013-05-08 株式会社Pfu 電子ドキュメント処理システム、方法およびプログラム
JP2011015105A (ja) * 2009-06-30 2011-01-20 Canon It Solutions Inc 画像形成装置、及びその制御方法、プログラム、プログラムを記憶した記憶媒体
US9310722B2 (en) 2011-03-18 2016-04-12 Ricoh Company, Limited Image forming apparatus and image forming method
US9563153B2 (en) 2011-03-18 2017-02-07 Ricoh Company, Ltd. Image forming apparatus and image forming method
US10088781B2 (en) 2011-03-18 2018-10-02 Ricoh Company, Ltd. Image forming apparatus and image forming method
JP2013105207A (ja) * 2011-11-10 2013-05-30 Fujitsu Ltd 秘匿化データの検索のための情報処理方法及び装置
JP2014219448A (ja) * 2013-05-01 2014-11-20 コニカミノルタ株式会社 表示システム、表示方法、表示端末および表示プログラム
US9542562B2 (en) 2013-05-01 2017-01-10 Konica Minolta, Inc. Display system, display method, display terminal and non-transitory computer-readable recording medium stored with display program
JP2015004998A (ja) * 2013-06-18 2015-01-08 京セラドキュメントソリューションズ株式会社 画像形成装置および画像形成プログラム
JP2016065904A (ja) * 2014-09-22 2016-04-28 カシオ計算機株式会社 情報処理装置、情報処理方法及びプログラム
JP2020154062A (ja) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7275698B2 (ja) 2019-03-19 2023-05-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US8179556B2 (en) Masking of text in document reproduction
JP2007328196A (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN102404478B (zh) 图像形成装置及***、信息处理装置、图像形成方法
US8073255B2 (en) Keyword generation process
US8345300B2 (en) Computer readable medium, document processing apparatus, document processing system, and document processing method for managing electronic documents
JP5109516B2 (ja) 文書処理システムおよび画像形成装置およびプログラム
JP2007060634A (ja) 画像処理装置、画像処理装置の制御方法及びコンピュータ可読記憶媒体
JP2007325128A (ja) 画像処理装置および画像処理システム、および画像処理方法。
JP2008059280A (ja) 画像処理プログラム、指示装置および画像処理システム
JP2011118569A (ja) 文書管理システム及びプログラム
US20110007348A1 (en) Process determining apparatus, image processing apparatus, process determining system, computer readable medium storing program, and process determining method
JP4673200B2 (ja) 印刷処理システムおよび印刷処理方法
JP2008171390A (ja) 印刷装置及び印刷方法
JP2007036406A (ja) 画像編集装置
JP4921335B2 (ja) ドキュメント処理装置及び検索方法
EP1727075B1 (en) Printing system, image forming apparatus and computer data carrier
US8009860B2 (en) Image processing apparatus, method, program and recording medium for extracting embedded information
JP5004740B2 (ja) 画像処理装置及びその制御方法、並びにプログラム
JP4479617B2 (ja) 任意図文字挿入コンピュータ、画像形成装置、方法及びプログラム
JP2006276905A (ja) 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
JP2006270589A (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
US8179560B2 (en) Image processing apparatus and image processing method
JP4360418B2 (ja) 画像処理装置、ビューワ、画像処理プログラム及び画像処理システム
JP2007104329A (ja) 画像処理装置及び画像処理方法
JP4158681B2 (ja) 画像処理システム