以下、図面を参照しながら、発明を実施するための形態を説明する。なお、図面の説明において同一要素には同一符号を付し、重複する説明は省略する。
●実施形態●
●システム構成
図1は、一実施形態に係る情報処理システムのシステム構成の一例を示す図である。図1に示す情報処理システム1は、クラウド上に設けられた外部装置を利用した画像処理におけるセキュリティを高めることができるシステムである。情報処理システム1は、OCR(Optical Character Recognition)処理等の画像処理精度を向上させるため、インターネット、公衆回線等に接続されたクラウドサーバ50が提供するサービスを利用することができる。
情報処理システム1は、画像処理装置10A、画像処理装置10B、サーバ装置30およびクラウドサーバ50を含む。画像処理装置10A、画像処理装置10Bおよびサーバ装置30は、LAN(Local Area Network)3を介して、それぞれ接続されている。画像処理装置10A、画像処理装置10Bおよびサーバ装置30は、外部からのアクセスが制限されたローカルエリアに配置されている。
画像処理装置10A、画像処理装置10Bおよびサーバ装置30は、LAN3を介して、それぞれが通信可能なローカルネットワークを形成する。ローカルネットワークは、例えば、オフィス、会議室、倉庫、工場または特定の生産ライン等の、インターネットを経由しないネットワーク環境において形成される。ローカルネットワークは、クラウドサーバ50が配置されたクラウドネットワーク5からファイアウォールによって遮断されている。なお、画像処理装置10Aおよび画像処理装置10Bは、任意のものを示す場合、画像処理装置10と表す。
画像処理装置10は、スキャナ等を用いて読み取った処理対象の原稿の画像情報に基づいて、処理対象の原稿の秘匿性の度合いを判断する。具体的には、画像処理装置10は、処理対象の原稿に含まれる厳秘文字を判別し、判別した厳秘文字が所定の閾値以上である場合、処理対象の原稿が秘匿性の高い原稿(厳秘文書)であると判断する。ここで、秘匿性の高い原稿(厳秘文書)とは、例えば、契約書、事業計画書、個人情報が記述された文書(パスポート、マイナンバーカード、保険証、免許証、社員証、身分証明書等)等である。また、厳秘文字は、契約書または事業計画書等の秘匿性の高い原稿に記述されている可能性の高い文字、数字、特殊記号、バーコード等である。
画像処理装置10は、処理対象の原稿が秘匿性の高い原稿(厳秘文書)であると判断した場合、クラウドサーバ50に対して、処理対象の原稿の画像情報を送信しない。この場合、画像処理装置10は、自装置、またはローカルネットワーク内に位置し、OCR処理機能を備える他の装置(他の画像処理装置10、サーバ装置30等)を用いて、画像情報のOCR処理を行う。一方で、画像処理装置10は、処理対象の原稿が秘匿性の低い原稿である(厳秘文書でない)と判断した場合、クラウドネットワーク5に設けられたクラウドサーバ50に対して、画像情報のOCR処理の処理要求を送信する。
そのため、情報処理システム1は、読み取られた処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)に基づいて、クラウドネットワーク5に設けられたクラウドサーバ50を利用するかを判断するので、クラウドサーバ50を利用した画像処理におけるセキュリティリスク(情報漏洩のリスク)を低減させることができる。
なお、処理対象の原稿は、読み取り対象の情報が記述された媒体であればよい。媒体は、材質または形状に制約はなく、読み取り対象の情報をスキャナ等が読み取れればよい。媒体は、有体物であれば読み取り対象の情報をスキャナ等が読み取れるが、例えば、用紙、文書、プラスチック、樹脂、金属、繊維等の媒体が挙げられる。また、読み取り対象の情報は、ユーザが原稿を作成する上でスキャナ等を用いて読み取りたい、必要とする、もしくは目的の情報、または機械による読み取り、読み取り後さらにデコードまたは文字認識が可能な情報である。読み取り対象の情報は、例えば、バーコード、文字、数字または特殊記号等で記述された情報が挙げられる。
画像処理装置10は、例えば、MFP(Multifunction Peripheral/Printer/Product:複合機)、ファクシミリ、スキャナ、またはプリンタ等の画像処理機能、通信機能並びにOCR結果の出力機能を備える情報処理装置である。画像処理装置10は、原稿の画像情報をテキストデータ(文字コード)に変換するOCRモジュールを備える。また、画像処理装置10は、指定された原稿の画像情報に対して、OCR処理を要求するアプリケーションを実装している。
画像処理装置10は、OCR処理の結果を、表示画像として出力してもよいし、データとして出力してもよい。画像処理装置10は、クラウドサーバ50もしくはサーバ装置30との通信、または外部ストレージへの書込みによってOCR結果をデータとして出力するハンディスキャナであってもよい。画像処理装置10は、OCR結果をデータとして出力する場合、データの形式は特に限定されない。画像処理装置10は、例えば、OCR結果をテキストデータとして出力してもよいし、PDF(portable document format)ファイルに埋め込んで出力してもよい。以下、画像処理装置10がMFPである場合について説明する。
サーバ装置30は、画像処理機能および通信機能を備える情報処理装置である。サーバ装置30は、処理対象の原稿の画像情報をテキストデータ(文字コード)に変換するOCRモジュールを備えている。サーバ装置30は、画像処理装置10からの要求に応じてOCR処理を実行する。
クラウドサーバ50は、ローカルネットワーク内に位置する画像処理装置10またはサーバ装置30に対して、所定のサービスを提供するサーバ装置である。クラウドサーバ50は、例えば、OCRモジュールを備え、画像処理装置10またはサーバ装置30から要求された画像情報の解析処理を実行する。
なお、図1に示す画像処理装置10、サーバ装置30およびクラウドサーバ50の数は、これに限定されない。図1に示す情報処理システム1は、それぞれ1台以上の画像処理装置10またはサーバ装置30、並びにクラウドサーバ50が含まれていればよい。
●ハードウエア構成
図2は、一実施形態に係る画像処理装置のハードウエア構成の一例を示す図である。なお、図2に示すハードウエア構成は、各実施形態において同様の構成を備えていてもよく、必要に応じて構成要素が追加または削除されてもよい。画像処理装置10は、コントローラ1020を備える。コントローラ1020は、CPU(Central Processing Unit)1001、SDRAM(Synchronous Dynamic Random Access Memory)1002、フラッシュメモリ1003、HDD(Hard Disk Drive)1004、ASIC(Application Specific Integrated Circuit)1005および通信部1006を備える。
ASIC1005は、CPUインターフェース、SDRAMインターフェース、ローカルバスインターフェース、PCI(Peripheral Component Interconnect)バスインターフェース、MAC(Media Access Controller)およびHDDインターフェース等を備える多機能デバイスボードである。
CPU1001は、ASIC1005を介して本発明に係るプログラム等の各種プログラムを、HDD1004から読み取り実行する。画像処理装置10は、例えば、本発明に係るプログラムをCPU1001が実行することによって、本発明に係る情報処理方法を実現する。SDRAM1002は、各種プログラムを記憶するプログラムメモリ、またはCPU1001が各種プログラムを実行する際に使用するワークメモリ等として機能する。なお、SDRAM1002は、DRAM(Dynamic Random Access Memory)またはSRAM(Static Random Access Memory)を用いてもよい。
フラッシュメモリ1003は、不揮発性メモリであり、画像処理装置10を起動させるブートローダ(ブートプログラム)、OS(Operation System)、SDK(Software Development Kit)、API(Application Programming Interface)等のプログラムを記憶する。また、フラッシュメモリ1003は、各プログラムを記憶するアプリケーションメモリとして機能する。さらに、フラッシュメモリ1003は、各サービス(コピーサービス、プリントサービス、ファクシミリサービス)のソフトウエアを記憶するサービスメモリとして機能する。
また、フラッシュメモリ1003は、ファームウエアを記憶するファームメモリ、またはネットワークアドレスもしくは機種機番等を記憶するデータメモリとして機能する。なお、フラッシュメモリ1003は、RAM(Random Access Memory)と電池を利用したバックアップ回路を集積した不揮発性RAM、またはEEPROM(Electrically Erasable Programmable Read-Only Memory)等の他の不揮発性メモリを使用してもよい。
HDD1004は、画像処理装置10の電源のオン、オフに関わりなくデータを記憶する不揮発性の記憶媒体である。HDD1004は、フラッシュメモリ1003内に記憶されたプログラムおよびデータ以外のプログラム、並びにデータを記録する。なお、HDD1004は、ファームメモリとして使用してもよい。通信部1006は、有線LAN(Ethernet(登録商標))またはWi−Fi(登録商標)等の無線LANによりネットワークを介して通信(接続)を行うためのインターフェースである。通信部1006は、アンテナ、無線部、MAC部等を含む。
操作部1007は、USB(Universal Serial Bus)ケーブル等を用いてコントローラ1020と接続されている。操作部1007は、画像処理装置10に対して操作を行うユーザのためのインターフェースである。操作部1007は、各種の操作キー、表示装置としてのLCD(Liquid Crystal Display)またはCRT(Cathode-Ray Tube)の文字表示器およびタッチパネルを有する。画像処理装置10は、操作部1007を操作することにより、データの入力、ジョブの実行、表示をすることができる。
さらに、コントローラ1020は、PCIバス1014を介して、ファックス制御ユニット1008、記憶媒体1009aが脱着可能なUSB1009、IEEE(Institute of Electrical and Electronic Engineers)1394(1010)、プロッタエンジン1011、スキャナエンジン1012およびBLE(Bluetooth(登録商標)Low Energy)モジュール1013が接続されている。これにより、画像処理装置10は、コピーサービス、プリントサービス、ファクシミリサービス等の各サービスを提供することができる。プロッタエンジン1011は、電子写真方式またはインクジェット方式のいずれの方式を採用していてもよい。
なお、図2に図示する構成は一例に過ぎず、画像処理装置10のハードウエア構成は、図2の構成には限られない。通信部1006は、例えば、PCIバス1014に接続されていてもよい。さらに、通信部1006は、電話回線網に接続するDSU(Digital Service Unit)またはモデムを有していてもよい。通信部1006は、携帯電話網に接続する通信装置を有していてもよい。
図3は、一実施形態に係るクラウドサーバのハードウエア構成の一例を示す図である。なお、図3に示すハードウエア構成は、各実施形態において同様の構成を備えていてもよく、必要に応じて構成要素が追加または削除されてもよい。また、図3は、クラウドサーバ50のハードウエア構成を示すが、サーバ装置30も同様の構成を備えていてもよい。クラウドサーバ50は、CPU501、ROM(Read Only Memory)502、RAM503、ストレージ504、入力部505、表示インターフェース(I/F)506、入出力インターフェース(I/F)507、通信部508およびバス509を備える。
CPU501は、クラウドサーバ50全体の制御を行う。CPU501は、ROM502またはストレージ504等に格納された、プログラムもしくはデータをRAM503上に読み出し、処理を実行することで、クラウドサーバ50の各機能を実現する演算装置である。RAM503は、CPU501のワークエリア等として用いられる揮発性のメモリである。ROM502は、電源を切ってもプログラムまたはデータを保持することができる不揮発性のメモリである。
ストレージ504は、例えば、HDD、SSD(Solid State Drive)、またはフラッシュROM等のストレージデバイスであり、OS、アプリケーションプログラム、および各種データ等を記憶する。入力部505は、オペレータがクラウドサーバ50に各種指示を入力するためのインターフェースである。入力部505は、例えば、キーボード、マウス、タッチパネル、音声入力装置等である。
表示インターフェース(I/F)506は、CPU501からの要求により、クラウドサーバ50が有する各種情報をカーソル、メニュー、ウィンドウ、文字、または画像等の形態でディスプレイ506aに表示する。表示インターフェース(I/F)506は、例えば、グラフィックチップまたはディスプレイインターフェースである。入出力インターフェース(I/F)507は、クラウドサーバ50に他の装置を接続するためのインターフェースである。他の装置は、例えば、USBメモリ、メモリカード、光学ディスク等の記録媒体507aまたは各種の電子機器等が含まれる。
通信部508は、ローカルネットワークの内部に位置する画像処理装置10またはサーバ装置30と、ネットワークを介して通信(接続)を行う通信インターフェースである。通信部508は、アンテナ、無線部、MAC部等を含む。バス509は、上記各構成要素に接続され、アドレス信号、データ信号、および各種制御信号等を伝送する。CPU501、ROM502、RAM503、ストレージ504、入力部505、表示インターフェース(I/F)506、入出力インターフェース(I/F)507および通信部508は、バス509を介して相互に接続されている。
●機能構成
続いて、実施形態に係る情報処理システムの機能構成について説明する。図4は、一実施形態に係る情報処理システムの機能構成の一例を示す図である。図4に示す画像処理装置10は、本体部100およびアプリケーション部200を含む。本体部100は、画像処理装置10の本体機能である印刷処理等の処理を担う機能である。アプリケーション部200は、画像処理装置10にインストールされたアプリケーションソフトウエアまたはOCRモジュールによって実行される機能である。アプリケーションソフトウエアは、例えば、処理対象の原稿の画像情報に対して、OCR処理を実行するためのソフトウエアである。
本体部100により実現される機能は、通信部11、アプリ制御部12、受付部13、読取部14、表示制御部15および印刷処理部16を含む。通信部11は、ネットワークを介して他の装置との間でデータをやり取りする機能である。通信部11は、例えば、ローカルネットワークの内に位置する他の装置との間の通信を制御する。また、通信部11は、例えば、クラウドネットワーク5に位置するクラウドサーバ50との間の通信を制御する。
通信部11は、HTTPS(HyperText Transfer Protocol Secure)のプロトコルを用いて、クラウドネットワーク5に位置するクラウドサーバ50と通信を行う。なお、通信方式は、これに限られず、FTP(File Transfer Protocol)、HTTP(HyperText Transfer Protocol)またはSMTP(Simple Mail Transfer Protocol)等のプロトコルを用いてもよい。通信部11は、例えば、図2に示した通信部1006およびCPU1001で実行されるプログラム等により実現される。通信部11は、送信手段の一例である。
アプリ制御部12は、画像処理装置10にインストールされたアプリケーショによる処理を要求する機能である。アプリ制御部12は、例えば、後述するアプリケーション部200に対して、読取部14により読み取られた原稿の画像情報に対するOCR処理の実行を要求する。アプリ制御部12は、例えば、図2に示したCPU1001で実行されるプログラム等により実現される。
受付部13は、ユーザによる入力操作を受け付ける機能である。受付部13は、例えば、操作部1007に対するユーザ操作に基づいて、ユーザが画像処理装置10を用いて処理を行いたい原稿に対する処理要求を受け付ける。また、受付部13は、例えば、処理対象の原稿の画像情報を表示制御部15によって表示させ、表示された画像情報に含まれる所定の文字のうち、厳秘文字として設定する文字の登録を受け付ける。登録された厳秘文字は、後述する厳秘文字テーブル210に記憶される。受付部13は、例えば、図2に示したCPU1001で実行されるプログラム等により実現される。受付部13は、登録手段の一例である。
読取部14は、受付部13により読み取り指示の入力が受け付けられた場合、画像処理装置10にセットされた原稿をスキャンして画像情報の読み取りを実行する機能である。読取部14は、例えば、図2に示したCPU1001で実行されるプログラム等により実現される。読取部14は、読取手段の一例である。
表示制御部15は、図2に示した操作部1007に対して、ユーザによる入力操作を受け付ける操作画面、読取部14によって読み取られた画像情報またはOCR結果等の表示を行う機能である。表示制御部15は、例えば、図2に示した操作部1007、およびCPU1001で実行されるプログラム等により実現される。印刷処理部16は、読取部14によって読み取られた画像情報またはOCR結果等の印刷処理を実行する機能である。印刷処理部16は、図2に示したプロッタエンジン1011、およびCPU1001で実行されるプログラム等により実現される。画像処理装置10は、表示制御部15および印刷処理部16のいずれか、または両方によって、OCR結果を出力する。
次に、画像処理装置10のアプリケーション部200の機能を説明する。アプリケーション部200により実現される機能は、アプリ制御部21、データ処理部22、判定部23、記憶・読出部24および記憶部25を含む。アプリ制御部21は、画像処理装置10によって実行されるアプリケーションの動作を制御する機能である。アプリ制御部21は、例えば、本体部100からの処理要求に応じて、要求された処理(アプリケーション)を実行する。アプリ制御部21は、例えば、図2に示したCPU1001で実行されるプログラム等により実現される。
データ処理部22は、本体部100からの処理要求に基づいて、処理要求に含まれる画情報の処理を実行する機能である。データ処理部22は、例えば、処理要求に含まれる画像情報に対して、OCR処理を実行する。データ処理部22は、本体部100からの処理要求を検知した場合、まず、OCRのプレスキャン処理を実行する。OCRのプレスキャン処理は、後述する判定部23による判定処理に用いるテキストデータ(文字コード)を生成するための処理である。また、データ処理部22は、OCR結果に対して、後述する秘匿処理を実行する。データ処理部22は、OCR結果および秘匿処理結果を、テキストデータまたはテキストデータを埋め込んだPDFファイルとして出力する。データ処理部22は、例えば、図2に示したCPU1001で実行されるプログラム等により実現される。データ処理部22は、データ処理手段および秘匿処理手段の一例である。
判定部23は、データ処理部22によるOCRのプレスキャン結果に基づいて、読み取られた原稿の秘匿性の度合いの判定を行う機能である。判定部23は、例えば、後述する記憶部25に記憶された厳秘文字テーブル210および条件情報220に基づいて、読み取られた原稿に含まれる厳秘文字を判別する。そして、判定部23は、判別された厳秘文字の比率に基づいて、原稿の秘匿性の度合いの判断を行う。判定部23は、例えば、図2に示したCPU1001で実行されるプログラム等により実現される。判定部23は、判別手段の一例である。
記憶・読出部24は、記憶部25に各種データを記憶し、記憶部25から各種データを読み出す機能である。記憶部25は、例えば、画像処理(OCR処理)の要求先となるクラウドサーバ50のURL(Uniform Resource Locator)またはホスト名等を記憶している。記憶・読出部24および記憶部25は、例えば、図2に示したフラッシュメモリ1003、HDD1004およびCPU1001で実行されるプログラム等により実現される。記憶部25は、記憶手段の一例である。記憶部25は、厳秘文字テーブル210、条件情報220および秘匿対象テーブル230を記憶している。
ここで、記憶部25に記憶される各種データについて説明する。まず、図5を用いて記憶部25に記憶された厳秘文字テーブル210について説明する。図5は、一実施形態に係る厳秘文字テーブルの一例を示す図である。図5に示す厳秘文字テーブル210は、秘匿性の高い原稿(厳秘文書)に頻出する文字、符号等を登録したものである。厳秘文字テーブル210の厳秘文字パターンは、契約書または事業計画書等の秘匿性の高い原稿に記述されている可能性の高い文字、数字、特殊記号、バーコード等が含まれる。厳秘文字パターンは、厳秘対象の文字の一例である。
図5の例において、厳秘文字テーブル210は、秘匿性の高い原稿(厳秘文書)として契約書を対象とし、契約書、会社名、円、甲、乙等が厳秘文字パターンとして設定されている。厳秘文字テーブル210は、例えば、画像処理装置10を利用するユーザまたは情報処理システム1の管理者によって登録され、適宜修正・変更可能である。なお、厳秘文字テーブル210の厳秘文字パターンに含まれる文字は、これに限られない。
続いて、図6を用いて記憶部25に記憶された条件情報220について説明する。図6は、一実施形態に係る条件情報の一例を示す図である。図6に示す条件情報220は、読取部14によって読み取られた原稿の秘匿性の度合い(厳秘文書であるか否か)を判定するためのものである。条件情報220は、図5に示した厳秘文字パターンとの一致率、およびそれぞれの一致率に紐づけられた(対応づけられた、関連づけられた)処理内容を含む。厳秘文字パターンとの一致率は、厳秘文字パターンに登録された文字のうち、処理対象の原稿のプレスキャン処理によって検出(判別)された厳秘文字の割合を示す。例えば、厳秘文字パターンに登録された文字が10文字である場合、プレスキャン処理によって検出された厳秘文字が8文字であれば、一致率は、80%となる。
判定部23は、例えば、OCRのプレスキャン処理において、厳秘文字パターンに登録された文字の90%が一致した場合、厳秘文字パターンの一致率が「90%以上」に紐づく処理内容を特定する。条件情報220は、厳秘文字パターンとの一致率に応じて、異なる処理内容が設定されている。処理内容は、例えば、クラウドサーバ50においてOCR処理を実行することを許可するか否かの情報である。厳秘文字パターンとの一致率の数値は、処理対象の原稿に含まれる厳秘文字の比率を判断するための所定の閾値の一例である。
図6の例において、条件情報220は、例えば、厳秘文字パターンとの一致率が「90%以上」である場合の処理内容として、「クラウドサーバ50の利用を禁止する」内容が設定されている。また、条件情報220は、例えば、厳秘文字パターンとの一致率が「90%未満〜70%以上」である場合の処理内容として、「ユーザにクラウドサーバ50の利用可否を確認する」内容が設定されている。さらに、条件情報220は、例えば、厳秘文字パターンとの一致率が「70%未満」である場合の処理内容として、「クラウドサーバ50を利用してOCR処理を実行する」内容が設定されている。なお、条件情報220に含まれる厳秘文字パターンとの一致率および処理内容は、これに限られない。条件情報220は、例えば、厳秘文字パターンとの不一致率(厳秘文字パターンと一致しない文字の割合)、およびそれぞれの不一致率に紐づけられた(対応づけられた、関連づけられた)処理内容を含む構成にしてもよい。
続いて、記憶部25に記憶された秘匿対象テーブル230について説明する。図7は、一実施形態に係る秘匿対象テーブルの一例を示す図である。図7に示す秘匿対象テーブル230は、OCR結果であるテキストデータに含まれる所定の文字の秘匿処理を行うためのものである。秘匿対象テーブル230は、秘匿対象となる文字、および秘匿対象となる文字のそれぞれに紐づけられた(対応づけられた、関連づけられた)処理内容を含む。秘匿対象となる文字は、図5に示した厳秘文字テーブル210に含まれる厳秘文字パターンと同様であってもよいし、独自に設定されてもよい。秘匿対象テーブル230は、例えば、画像処理装置10を利用するユーザまたは情報処理システム1の管理者によって登録され、適宜修正・変更可能である。なお、秘匿対象テーブル230に含まれる秘匿対象となる文字および処理内容は、これに限られない。
図7の例において、データ処理部22は、例えば、OCR結果であるテキストデータに含まれる数字の秘匿処理を行う。また、データ処理部22は、例えば、OCR結果であるテキストデータに含まれる“○○会社”について、該当する“○○”の秘匿処理を行う。さらに、データ処理部22は、例えば、OCR結果であるテキストデータに含まれる“△△様”について、該当する“△△”の秘匿処理を行う。ここで、秘匿処理は、秘匿対象となる文字を黒塗り等によってマスクしてもよいし、秘匿対象となる文字を特定の記号(■、*等)に置き換えてもよい。秘匿処理の詳細は、後述する。
なお、図5乃至図7に示した記憶部25に記憶された厳秘文字テーブル210、条件情報220および秘匿対象テーブル230は、情報処理システム1を構成する他の装置(他の画像処理装置10、サーバ装置30またはクラウドサーバ50)に記憶される構成であってもよい。この場合、画像処理装置10は、判定部23およびデータ処理部22における処理を行う際に、必要とする情報が記憶された装置に対して、当該情報の読み出しを行う。
次に、クラウドサーバ50の機能構成について説明する。図5に示すクラウドサーバ50により実現される機能は、通信部51、データ処理部52、記憶・読出部53および記憶部54を含む。通信部51は、インターネットを介して、画像処理装置10およびサーバ装置30との間でデータをやり取りする機能である。通信部51は、例えば、画像処理装置10によって読み取られた原稿の画像情報に対する処理要求を受信する。通信部51は、例えば、後述するデータ処理部52における処理結果を、画像処理装置10に対して送信する。
通信部51は、HTTPSのプロトコルを用いて、ローカルネットワークの内部に位置する画像処理装置10またはサーバ装置30と通信を行う。なお、通信方式は、これに限られず、FTP、HTTPまたはSMTP等のプロトコルを用いてもよい。通信部51は、例えば、図3に示した通信部508およびCPU501で実行されるプログラム等により実現される。
データ処理部52は、画像処理装置10から送信された画像情報に対する処理を実行する機能である。データ処理部52は、例えば、処理要求に含まれる画像情報に対して、OCR処理を実行する。また、データ処理部52は、OCR結果に対して、後述する秘匿処理を実行する。データ処理部52は、OCR結果および秘匿処理結果を、テキストデータまたはテキストデータを埋め込んだPDFファイルとして、画像処理装置10に対して送信する。データ処理部52は、例えば、図3に示したCPU501で実行されるプログラム等により実現される。
記憶・読出部53は、記憶部54に各種データを記憶し、記憶部54から各種データを読み出す機能である。記憶・読出部53および記憶部54は、例えば、図3に示すROM502、ストレージ504およびCPU501で実行されるプログラム等により実現される。記憶部54は、秘匿対象テーブル550を記憶している。なお。記憶部54に記憶される秘匿対象テーブル550は、図7に示した秘匿対象テーブル230と同様である。
なお、図4に示す情報処理システム1は、一台の画像処理装置10を含む例を説明したが、同様の機能を備える画像処理装置10を複数含んで構成されてもよい。また、図4に示す情報処理システム1は、例えば、図1に示したサーバ装置30を含んで構成されてもよい。この場合、サーバ装置30は、OCR処理を実行するためのアプリケーションソフトウエアまたはOCRモジュールを備え、画像処理装置10またはクラウドサーバ50と同様の機能を備えてもよい。
●情報処理方法
続いて、情報処理システム1における情報処理方法について説明する。図8は、一実施形態に係る情報処理システムの情報処理方法の一例(その1)を示すシーケンス図である。図8は、画像処理装置10により読み取られた処理対象の原稿が、秘匿性の高い原稿(厳秘文書(例えば、契約書))である場合について説明する。
ステップS101において、画像処理装置10の本体部100は、受付部13によって、処理対象の原稿に対するユーザから画像処理装置10による印刷処理等の処理要求を受け付ける。具体的には、本体部100の受付部13は、操作部1007に対してユーザによって入力された処理要求を受け付ける。ステップS102において、本体部100の受付部13は、読取部14に対して、受け付けた処理要求を出力する。
ステップS103において、本体部100の読取部14は、ユーザによってスキャナ等にセットされた処理対象の原稿を画像情報(原稿イメージ)として読み取る(読取ステップの一例)。ステップS104において、本体部の読取部14は、読み取った画像情報を、アプリ制御部12に対して出力する。ステップS105において、本体部100のアプリ制御部12は、出力された画像情報を検知した場合、アプリケーション部200に対して、検知した画像情報の処理要求を出力する。
ステップS106において、アプリケーション部200のアプリ制御部21は、本体部100からの処理要求を検知した場合、データ処理部22に対して、検知した処理要求を出力する。ステップS107において、アプリケーション部200のデータ処理部22は、出力された処理要求を検知した場合、処理要求に含まれる画像情報のOCR処理(プレスキャン)を実行する。
ここで、読取部14によって読み取られた原稿の画像情報におけるOCR処理について、図9および図10を用いて説明する。図9は、一実施形態に係る情報処理システムにおけるOCR処理の一例を示すフローチャートである。図9に示すOCR処理は、画像処理装置10のデータ処理部22またはクラウドサーバ50のデータ処理部52によって実行される。なお、図9に示すOCR処理は、データ処理部22およびデータ処理部52におけるOCR処理において同様の処理が行われる。図9は、データ処理部22におけるプレスキャン時に実行されるOCR処理について説明する。
ステップS201において、データ処理部22は、読取部14によって読み取られた原稿の画像情報(原稿イメージ)を取り込む。ステップS202において、データ処理部22は、取り込んだ画像情報のレイアウトを解析する。具体的には、データ処理部22は、取り込んだ画像情報から、表題、図または文章がどのような段組みから構成されているのかを解析する。
ステップS203において、データ処理部22は、解析した情報に基づいて、画像情報を一行ごとに分解して切り出しを行う。ステップS204において、読取部14は、切り出した行から文字情報の切り出しを行う。ステップS205において、読取部14は、切り出し文字に関して、文字の認識を行う。このとき、データ処理部22は、図10に示すように、画像情報250に含まれる認識すべき文字の位置情報(X,Y)を取得する。データ処理部22は、取得した文字の位置情報に基づいて、後述する秘匿処理を行う。データ処理部22は、秘匿対象として、「数字」が指定されている場合、図10に示すように、数字“1”および“2”の位置情報を取得し、取得した位置に対して黒塗り等の秘匿処理を行う。なお、データ処理部22におけるプレスキャン処理の実行時には、秘匿処理は行われない。
図8に戻り、実施形態に係る情報処理システムにおける情報処理方法の説明を続ける。ステップS108において、データ処理部22は、OCRのプレスキャン結果を、判定部23に対して出力する。データ処理部22は、OCRのプレスキャン結果であるテキストデータを出力する。ステップS109において、判定部23は、出力されたOCRのプレスキャン結果に基づいて、読み取られた原稿の秘匿性の度合い(厳秘文書であるか否か)を判定する(判別ステップの一例)。
ここで、判定部23の処理について説明する。図11は、一実施形態に係る情報処理システムにおける処理対象の原稿の秘匿性の度合いの判定処理の一例を示すフローチャートである。図11は、図5に示した厳秘文字テーブル210および図6に示した条件情報220が、予め記憶部25に記憶されている例を説明する。
ステップS301において、判定部23は、OCRのプレスキャン結果を検知した場合、処理をステップS302へ移行させる。一方で、判定部23は、OCRのプレスキャン結果を検知していない場合、ステップS301の処理を繰り返す。
ステップS302において、判定部23は、記憶部25に記憶された厳秘文字テーブル210および条件情報220の読み出しを行う。具体的には、判定部23は、記憶・読出部24に対して、厳秘文字テーブル210および条件情報220の読出要求を出力する。記憶・読出部24は、出力された読出要求を検知した場合、記憶部25に記憶された厳秘文字テーブル210および条件情報220を読み出す。そして、記憶・読出部24は、読み出した厳秘文字テーブル210および条件情報220を、判定部23に対して出力する。
ステップS303において、判定部23は、プレスキャン結果に含まれる文字と厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率を算出(判別)する。厳秘文字パターンとの一致率は、厳秘文字パターンに登録された文字のうち、処理対象の原稿のプレスキャン処理によって検出された厳秘文字の文字数(割合)を示す。ステップS304において、判定部23は、一致率が90%以上である場合、処理をステップS305へ移行させる。ステップS305において、判定部23は、処理対象の原稿が秘匿性の高い原稿(厳秘文書)であると判断し、クラウドサーバ50の利用を禁止する旨の判定結果を出力する。
ステップS306において、判定部23は、一致率が70%以上である場合、処理をステップS307へ移行させる。ステップS307において、判定部23は、ユーザに対して、クラウドサーバ50の利用可否を確認する旨の判定結果を出力する。一方で、ステップS306において、判定部23は、一致率が70%未満である場合、処理をステップS308へ移行させる。ステップS308において、判定部23は、クラウドサーバ50を利用してOCR処理を実行する旨の判定結果を出力する。
図8に戻り、実施形態に係る情報処理システムにおける情報処理方法の説明を続ける。なお、以下に説明する処理は、図11で示したステップS304において、厳秘文字テーブル210に含まれる厳秘文字との一致率が70%未満と算出(判別)された場合の処理である。ステップS110において、アプリケーション部200の判定部23は、処理対象の原稿が秘匿性の高い原稿(厳秘文書)ではないと判断し、アプリ制御部21に対して、クラウドサーバ50を利用してOCR処理を実行する旨の判定結果を出力する。ステップS111において、アプリケーション部200のアプリ制御部21は、判定部23から出力された判定結果を、本体部100に対して出力する。
ステップS112において、本体部100のアプリ制御部12は、アプリ制御部21から出力された判定結果を、通信部11に対して出力する。ステップS113において、本体部100の通信部11は、クラウドサーバ50に対して、処理対象の原稿の画像情報の処理要求を送信する(送信ステップの一例)。ステップS114において、クラウドサーバ50は、画像情報の処理要求を受信した場合、受信した画像情報のOCR処理および秘匿処理を実行する。ステップS115において、クラウドサーバ50は、画像処理装置10に対して、OCR結果および秘匿処理結果を送信する。
ここで、処理対象の原稿の画像情報に対する秘匿処理について説明する。なお、図12および図13に示す秘匿処理は、クラウドサーバ50のデータ処理部52または画像処理装置10のデータ処理部22によって実行される。図12は、一実施形態に係る情報処理システムの秘匿処理の一例(その1)を示す図である。図12(a)〜図12(d)は、秘匿処理に用いられるレイヤまたは秘匿処理の出力結果を示している。図12に示す秘匿処理は、秘匿対象の文字が特定の記号を用いてマスクされる場合の処理である。
図12(a)は、最上位のレイヤ(レイヤ1)であり、図7に示した秘匿対象テーブル230に含まれる秘匿対象の文字が黒塗り記号として作成される。図12(a)に示す黒塗り文字の位置は、秘匿対象の文字に対する図10に示したOCR実行時に取得できる文字位置である。図12(b)は、処理対象の原稿をスキャンした画像情報である。図12(b)のレイヤ(レイヤ2)は、図12(a)に示すレイヤ2の下に位置づけられる。図12(c)は、処理対象の原稿に対してOCR処理を行った結果である。図12(c)に示すレイヤ(レイヤ3)は、透明レイヤとして処理される。
図12(d)は、図12(a)〜図12(c)示したレイヤ(レイヤ1〜3)を合成することにより出力される秘匿処理結果である。図12(d)に示す秘匿処理結果は、最上位からレイヤ1→レイヤ2→レイヤ3の順番で重ねることによって出力される。この場合、レイヤ3は、透明レイヤであり、レイヤ2およびレイヤ1は、通常表示となる。なお、レイヤ1は、秘匿処理が行われないOCR結果もユーザに提示する(出力する)場合、レイヤ1は表示されない(OR表示)構成としてもよい。
次に、処理対象の原稿の画像情報に対する秘匿処理の別の例を説明する。図13は、一実施形態に係る情報処理システムの秘匿処理の一例(その2)を示す図である。図13に示す秘匿処理は、秘匿対象の文字を特定の記号に置き換える場合の処理である。
図13(a)は、処理対象の原稿に対してOCR処理を行った結果である。図13(b)は、図13(a)に示すOCR結果に対して秘匿処理を行った秘匿処理結果である。図13(b)に示す秘匿処理結果は、図13に示すOCR結果に含まれる秘匿対象の文字を、特定の記号(“■”)に置き換えたものである。特定の記号は、例えば、画像処理装置10を利用するユーザまたは情報処理システム1の管理者によって設定され、適宜修正・変更可能である。特定の記号は、“■”のほか、例えば、“*”または“○”等であってもよい。
図12または図13に示す秘匿処理を行うことによって、情報処理システム1は、処理対象の原稿に含まれる秘匿対象の文字を隠蔽することが出来るため、出力される厳密文書(機密文書)の内容を秘匿することができる。
続いて、図11に示したステップS304の処理において、OCRのプレスキャン結果に含まれるテキストデータと厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率が90%以上と算出(判別)された場合の情報処理システム1における情報処理方法について説明する。図14は、一実施形態に係る情報処理システムの情報処理方法の一例(その2)を示すシーケンス図である。なお、図14に示すステップS401〜ステップS409までの処理は、図8に示したステップS101〜ステップS109までの処理と同様である。
ステップS410において、アプリケーション部200の判定部23は、プレスキャン処理結果に含まれるテキストデータと厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率に基づく判定結果を、データ処理部22に対して出力する。この場合、判定部23は、一致率が90%以上であるため、プレスキャンを行った原稿が厳秘文書であると判断し、クラウドサーバ50の利用を禁止する旨の判定結果を出力する。ステップS411において、アプリケーション部200のデータ処理部22は、読み取った原稿の画像情報に対して、OCR処理を実行する。そして、データ処理部22は、OCR結果であるテキストデータに対して、図14または図15に示した秘匿処理を実行する。
ステップS412において、アプリケーション部200のデータ処理部22は、アプリ制御部21に対して、OCR結果および秘匿処理結果を出力する。ステップS413において、アプリケーション部200のアプリ制御部21は、出力されたOCR結果および秘匿処理結果を、本体部100に対して出力する。本体部100は、アプリ制御部12によってOCR結果および秘匿処理結果を検知された場合、OCR結果および秘匿処理の結果を出力する。処理結果の出力方法は、印刷処理部16による印刷処理または表示制御部15による処理結果を表示等の方法によって行われる。
続いて、図11に示したステップS304の処理において、厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率が90%未満〜70%以上と算出(判別)された場合の情報処理システム1における情報処理方法について説明する。図15は、一実施形態に係る情報処理システムの情報処理方法の一例(その3)を示すシーケンス図である。なお、図15に示すステップS501〜ステップS509までの処理は、図8に示したステップS101〜ステップS109までの処理と同様である。
ステップS510において、アプリケーション部200の判定部23は、プレスキャン処理結果と厳秘文字テーブル210に含まれる厳秘文字との一致率の判定結果を、アプリ制御部21に対して出力する。この場合、判定部23は、一致率が90%未満〜70%以上であると判断し、ユーザに対して、クラウドサーバ50の利用可否を確認する旨の判定結果を出力する。なお、ステップS510の処理は、図11に示したステップS305の処理と同様である。
ステップS511において、アプリケーション部200のアプリ制御部21は、プレスキャンの処理結果および判定結果を、本体部100に対して出力する。ステップS512において、本体部100のアプリ制御部21は、アプリケーション部200から出力されたプレスキャンの処理結果および判定結果を、表示制御部15に対して出力する。
ステップS513において、本体部100の表示制御部15は、出力されたOCRのプレスキャン結果および判定結果を、操作部1007に対して表示させる。画像処理装置10のユーザは、操作部1007に表示された処理結果および判定結果の内容に基づいて、クラウドサーバ50を用いてOCR処理を実行するかを確認する。なお、画像処理装置10は、判定結果のみを、操作部1007に対して表示させる構成にしてもよい。
図8、図14および図15に示したように、情報処理システム1は、画像処理装置10の判定部23による判定結果に基づいて、画像処理装置10またはクラウドサーバ50を用いて、処理対象の原稿の画像情報に対するOCR処理および秘匿処理を実行する。これによって、情報処理システム1は、読み取られた処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)に基づいて、クラウドネットワーク5に設けられたクラウドサーバ50を利用するかを判断するため、クラウドサーバ50を利用した画像処理におけるセキュリティリスク(情報漏洩のリスク)を低減させることができる。
●厳秘文字の登録処理
続いて、図5に示した厳秘文字テーブル210に含まれる厳秘文字パターンの登録処理について説明する。図16は、一実施形態に係る情報処理システムの厳秘文字の登録処理の一例を示す図である。図16は、画像処理装置10の操作部1007に表示されるOCR処理結果のプレビュー画面である。画像処理装置10は、まず、読み取り対象の原稿をスキャナ等でスキャンしてOCR処理(またはOCRのプレスキャン処理)を実行する。画像処理装置10の表示制御部15は、OCR結果を操作部1007に表示させる。OCR結果は、テキストデータ(文字列)として、図16に示す“プレビュー内容”の欄に表示される。
画像処理装置10のユーザは、画像処理装置10の操作部1007に表示されたプレビュー画面から登録したい文字を選択して、“OK”アイコンを選択することで、厳秘文字の登録を行う。登録したい文字の選択は、操作部1007が有するタッチパネルをユーザがタッチすることで行われてもよいし、操作部1007が有するキーボードをユーザが操作することにより行われてもよい。画像処理装置10の受付部13は、ユーザにより入力された登録要求を受け付け、図5に示した厳秘文字テーブル210に要求された厳秘文字を記憶させる。これにより、情報処理システム1は、OCR結果として画像処理装置10に表示されたテキストデータを選択することによって、厳秘文字の登録を容易に行うことができる。
●実施形態の効果
以上説明したように、本実施形態に係る情報処理システムは、画像処理装置10が処理対象の原稿をスキャナ等で読み取り、読み取った原稿の画像情報を用いて、処理対象の原稿に含まれる厳秘文字(厳秘対象の文字の一例)を判別する。そして、情報処理システム1は、判別した厳秘文字が所定の閾値より少ない場合、クラウドサーバ50(外部装置の一例)に対して、画像情報の処理要求を送信する。そのため、情報処理システム1は、読み取られた処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)に基づいて、クラウドネットワーク5に設けられたクラウドサーバ50を利用するかを判断するため、クラウドサーバ50を利用した画像処理におけるセキュリティリスク(情報漏洩のリスク)を低減させることができる。
●実施形態の変形例1●
次に、実施形態の変形例1について説明する。実施形態の変形例1に係る情報処理システム1aは、画像処理装置10の記憶部25に、厳秘パターンを原稿の種別(カテゴリ)ごとに設定された厳秘文字テーブル210aが記憶されている。情報処理システム1aは、処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)を、厳秘文字テーブル210aを用いて判断する。
図17は、実施形態の変形例1に係る厳秘文字テーブルの一例を示す図である。図17に示す厳秘文字テーブル210aは、文書カテゴリごとに厳秘文書パターンが登録されている。図17の例では、厳秘文字テーブル210aは、文書カテゴリが“契約書”である場合、厳秘文字パターンとして、“契約書、会社名、円、甲、乙”等が設定されている。また、厳秘文字テーブル210aは、文書カテゴリが“事業計画書”である場合、厳秘文字パターンとして、“予算、決算、事業”等が設定されている。
画像処理装置10は、受付部13によって処理要求とともに、処理対象の原稿の種別(例えば、契約書、事業計画書等)を受け付ける。そして、画像処理装置10の判定部23は、処理対象の原稿の種別(カテゴリ)ごとに、原稿に含まれる文字と厳秘文字パターンとの一致率を算出(判別)することにより、処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)を判定する。なお、厳秘文字パターンの算出(判別)方法および秘匿性の度合いの判定方法は、図11で示した方法と同様である。
なお、厳秘文字テーブル210aに含まれるカテゴリおよびそれぞれのカテゴリに含まれる厳秘文字パターンの内容は、これに限られず、画像処理装置10を利用するユーザまたは情報処理システム1の管理者によって登録され、適宜修正・変更可能である。
●実施形態の変形例1の効果
以上説明したように、実施形態の変形例1に係る情報処理システムは、厳秘文字パターンが処理対象の原稿の種別(カテゴリ)ごとに設定されている。そして、情報処理システム1aは、処理対象の原稿に含まれる厳秘文字を、処理対象の原稿の種別(カテゴリ)に紐づけられた(対応づけられた、関連づけられた)厳秘文字パターンを用いて判別する。そのため、情報処理システム1aは、処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)の判断の精度を向上させることができる。
●実施形態の変形例2●
続いて、実施形態の変形例2に係る情報処理システムについて説明する。上記実施形態と同一構成および同一機能は、同一の符号を付して、その説明を省略する。実施形態の変形例2に係る情報処理システムは、処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)の判定を、処理対象の原稿の読み取り処理を行う画像処理装置10ではなく、ローカルネットワークに位置する他の装置(他の画像形成装置10またはサーバ装置30)を用いて実行する場合の処理である。
●機能構成
図18は、実施形態の変形例2に係る情報処理システムの機能構成の一例を示す図である。実施形態に係る変形例2に係る情報処理システムは、画像処理装置10、サーバ装置30およびクラウドサーバ50を含む。画像処理装置10bは、図4で示した画像処理装置10とは異なり、OCR処理を実行するためのアプリケーションソフトウエアまたはOCRモジュールを備えていない。そのため、画像処理装置10bは、図4に示したアプリケーション部200により実行される機能を備えておらず、本体部100により実行される機能を備える。本体部100により実行される機能は、図4に示した機能と同様である。なお、情報処理システム1bは、OCR処理を実行するためのアプリケーションソフトウエアまたはOCRモジュールを備えた、図4に示した画像処理装置10と同様の機能を備える他の画像処理装置を備えてもよい。
一方で、サーバ装置30は、OCR処理を実行するためのアプリケーションソフトウエアまたはOCRモジュールを備える。サーバ装置30により実行される機能は、通信部31、データ処理部32、判定部33、記憶・読出部34および記憶部35を含む。通信部31は、例えば、ローカルネットワークの内に位置する他の装置(例えば、画像処理装置10b)との間の通信を制御する。また、通信部31は、例えば、クラウドネットワーク5に位置するクラウドサーバ50との間の通信を制御する。通信部31は、例えば、図3に示した通信部508およびCPU501で実行されるプログラム等により実現される。通信部31は、送信手段の一例である。
データ処理部32、判定部33、記憶・読出部34および記憶部35の機能は、それぞれデータ処理部22、判定部23、記憶・読出部24および記憶部25と同様である。また、記憶部35に記憶された厳秘文字テーブル310、条件情報220および秘匿対象テーブル330は、厳秘文字テーブル210、条件情報220および秘匿対象テーブル230と同様である。
クラウドサーバ50bは、サーバ装置30および画像処理装置10と通信可能である。クラウドサーバ50bにより実行される機能は、図4に示したクラウドサーバ50により実行される機能と同様である。
●情報処理方法
続いて、情報処理システム1bにおける情報処理方法について説明する。図19は、実施形態の変形例2に係る情報処理システムの情報処理方法の一例(その1)を示すシーケンス図である。図19は、画像処理装置10bにより読み取られた処理対象の原稿が、秘匿性の高い原稿(厳秘文書(例えば、契約書))である場合について説明する。
ステップS601において、画像処理装置10bの受付部13は、処理対象の原稿に対するユーザから画像処理装置10bによる印刷処理等の処理要求を受け付ける。具体的には、受付部13は、操作部1007に対してユーザによって入力された処理要求を受け付ける。ステップS602において、受付部13は、読取部14に対して、受け付けた処理要求を出力する。
ステップS603において、画像処理装置10bの読取部14は、受付部13によって受け付けられた画像情報を読み取る。ステップS604において、読取部14は、読み取った処理対象の原稿の画像情報を、通信部11に対して出力する。ステップS605において、画像処理装置10bの通信部11は、サーバ装置30の通信部31に対して、画像情報の処理要求を送信する。ステップS606において、サーバ装置30の通信部31は、データ処理部32に対して、受信した処理要求を出力する。
ステップS607において、サーバ装置30のデータ処理部32は、出力された処理要求を検知した場合、処理要求に含まれる画像情報のOCR処理(プレスキャン)を実行する。プレスキャンの方法は、図9に示した処理と同様である。ステップS608において、
データ処理部32は、OCRのプレスキャン結果を、判定部33に対して出力する。データ処理部32は、OCRのプレスキャン結果であるテキストデータを出力する。
ステップS609において、サーバ装置30の判定部33は、出力されたOCRのプレスキャン結果に基づいて、読み取られた原稿の秘匿性の度合い(厳秘文書であるか否か)を判定する。秘匿性の度合い(厳秘文書であるか否か)の判定方法は、図11に示した処理と同様である。この場合、以下に説明する処理は、厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率が70%未満と算出(判別)されたものとして説明する。
ステップS610において、判定部33は、処理対象の原稿が秘匿性の高い原稿(厳秘文書)ではないと判断し、通信部31に対して、クラウドサーバ50bを利用してOCR処理を実行する旨の判定結果を出力する。ステップS611において、サーバ装置30の通信部31は、クラウドサーバ50bに対して、処理対象の原稿の画像情報の処理要求を送信する。ステップS612において、クラウドサーバ50bは、画像情報の処理要求を受信した場合、受信した画像情報のOCR処理および秘匿処理を実行する。クラウドサーバ50bによって実行されるOCR処理および秘匿処理は、それぞれ図11および図13(図14)に示した処理と同様である。ステップS613において、クラウドサーバ50bは、サーバ装置30に対して、OCR結果および秘匿処理結果を送信する。ステップS614において、サーバ装置30の通信部31は、クラウドサーバ50bから処理結果を受信した場合、画像処理装置10bに対して、受信した処理結果を送信する。
なお、図19の例において、サーバ装置30が、クラウドサーバ50bに対して画像情報の処理要求を送信する例を説明したが、サーバ装置30は、画像処理装置10bに判定結果を送信し、クラウドサーバ50bとの通信は、画像処理装置10bが行う構成にしてもよい。
続いて、実施形態の変形例2において、OCRのプレスキャン結果に含まれるテキストデータと厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率が90%以上と算出(判別)された場合の情報処理システム1bにおける情報処理方法について説明する。図20は、実施形態の変形例2に係る情報処理システムの情報処理方法の一例(その2)を示すシーケンス図である。なお、図20に示すステップS701〜ステップS709の処理は、図19に示したステップS601〜ステップS609の処理と同様である。
ステップS710において、サーバ装置30の判定部33は、厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率が90%以上であるためプレスキャンを行った原稿が厳秘文書であると判断し、データ処理部32に対して、クラウドサーバ50bの利用を禁止する旨の判定結果を出力する。ステップS711において、サーバ装置30のデータ処理部32は、判定部33による判定結果を検知した場合、処理要求を受け付けた原稿の画像情報に対して、OCR処理および秘匿処理を実行する。サーバ装置30によって実行されるOCR処理および秘匿処理は、それぞれ図11および図13(または図14)に示した処理と同様である。
ステップS712において、データ処理部32は、OCR結果および秘匿処理結果を、通信部31に対して出力する。ステップS713において、サーバ装置30の通信部31は、OCR結果および秘匿処理結果を検知した場合、検知した処理結果を、画像処理装置10bに対して送信する。画像処理装置10bは、OCR結果および秘匿処理結果を受信した場合、印刷処理部16による印刷処理または表示制御部15による処理結果を表示等の方法によって、処理結果を出力する。
続いて、実施形態の変形例2において、OCRのプレスキャンの処理結果に含まれるテキストデータと厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率が90%未満70%以上と算出(判別)された場合の情報処理システム1bにおける情報処理方法について説明する。図21は、実施形態の変形例2に係る情報処理システムの情報処理方法の一例(その3)を示すシーケンス図である。なお、図21に示すステップS801〜ステップS809の処理は、図19に示したステップS601〜ステップS609の処理と同様である。
ステップS810において、サーバ装置30の判定部33は、厳秘文字テーブル210に含まれる厳秘文字パターンとの一致率が90%未満70%以上であると判断し、データ処理部32に対して、ユーザに対してクラウドサーバ50の利用可否を確認する旨の判定結果を出力する。ステップS811において、サーバ装置30の通信部31は、判定部33による判定結果を検知した場合、プレスキャン結果および検知した判定結果を、画像処理装置10bに対して送信する。
ステップS812において、画像処理装置10bの通信部11は、受信したプレスキャン結果および判定結果を、表示制御部15に対して出力する。ステップS813において、画像処理装置10bの表示制御部15は、プレスキャン結果および判定結果を、操作部1007に対して表示させる。画像処理装置10bのユーザは、操作部1007に表示された処理結果および判定結果の内容に基づいて、クラウドサーバ50を用いてOCR処理を実行するかを確認する。なお、画像処理装置10bは、判定結果のみを、操作部1007に対して表示させる構成にしてもよい。
●実施形態の変形例2の効果
以上説明したように、実施形態の変形例2に係る情報処理システムは、処理対象の原稿を読み取る画像処理装置10bがOCR処理を実行するためのアプリケーションソフトウエアまたはOCRモジュールを備えていない場合においても、ローカルエリアに位置するサーバ装置30(または他の画像処理装置10)を用いて、読み取られた処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)判定することができる。そのため、情報処理システム1bは、処理対象の原稿を読み取る画像処理装置10bにOCR機能が備えられていない場合においても、クラウドネットワーク5に設けられたクラウドサーバ50bを利用するかを判断できるので、クラウドサーバ50bを利用した画像処理におけるセキュリティリスク(情報漏洩のリスク)を低減させることができる。
●まとめ●
以上説明したように、本発明の一実施形態に係る情報処理装置(例えば、画像処理装置10)は、処理対象の原稿の画像情報を読み取り、読み取られた画像情報に対するOCRのプレスキャン処理(文字認識処理の一例)を実行し、プレスキャン結果に含まれる厳秘文字(厳秘対象の文字の一例)を判別する。そして、画像処理装置10は、判別した厳秘文字の文字数が所定の閾値より少ない場合、処理対象の原稿の画像情報に対するOCR処理(画像処理の一例)の処理要求を、クラウドサーバ50(外部装置の一例)に対して送信する。そのため、情報処理装置は、クラウドネットワーク5に設けられたクラウドサーバ50を利用した画像処理におけるセキュリティを高めることができる。
また、本発明の一実施形態に係る情報処理装置は、処理対象の原稿の秘匿性の度合いを判断するための厳秘文字(厳秘対象の文字の一例)を記憶し、プレスキャン結果に含まれる文字と記憶された厳秘文字との一致率を判別する。そのため、情報処理装置は、処理対象の原稿に含まれる情報(文字、符号等)に応じて、クラウドネットワーク5に設けられたクラウドサーバ50b(外部装置の一例)を利用するかを判断できるので、クラウドサーバ50を利用した画像処理におけるセキュリティを高めることができる。
さらに、本発明の一実施形態に係る情報処理装置は、厳秘文字(厳秘対象の文字の一例)を原稿の種別(カテゴリ)ごとに記憶し、処理対象の原稿に含まれる、当該原稿の種別に対応する厳秘文字を判別する。そのため、情報処理装置は、処理対象の原稿の秘匿性の度合い(厳秘文書であるか否か)の判断の精度を向上させることができる。
また、本発明の一実施形態に係る情報処理装置は、読み取られた原稿の画像情報を表示させ、表示された画像情報に含まれる所定の文字のうち、厳秘文字(厳秘対象の文字の一例)として記憶させる文字を登録する。そのため、情報処理装置は、情報処理装置に表示された画像情報に含まれる所定の文字をユーザが選択することによって、厳秘文字の登録を容易に行うことができる。
さらに、本発明の一実施形態に係る情報処理システムは、画像処理を行うクラウドサーバ50(外部装置の一例)と、クラウドサーバ50と通信可能な画像処理装置10(情報処理装置の一例)と、を備える情報処理システムであって、画像処理装置10が、処理対象の原稿の画像情報を読み取る。情報処理システム1は、読み取られた画像情報に対するOCRのプレスキャン処理(文字認識処理の一例)を実行し、プレスキャン結果に含まれる厳秘文字(厳秘対象の文字の一例)を判別する。そして、情報処理システム1は、判別した厳秘文字の文字数が所定の閾値より少ない場合、処理対象の原稿の画像情報に対するOCR処理(画像処理の一例)の処理要求を、クラウドサーバ50に対して送信する。そのため、情報処理システム1は、クラウドネットワーク5に設けられたクラウドサーバ50を利用した画像処理におけるセキュリティを高めることができる。
また、本発明の一実施形態に係る情報処理方法は、画像処理装置10(情報処理装置の一例)が実行する情報処理方法であって、原稿の画像情報を読み取る読取ステップと、読み取られた画像情報に対するOCRのプレスキャン処理(文字認識処理の一例)を実行し、プレスキャン結果に含まれる厳秘文字(厳秘対象の文字の一例)を判別する判別ステップと、判別された厳秘文字の文字数が所定の閾値より少ない場合、原稿の画像情報に対するOCR処理(画像処理の一例)の処理要求を、クラウドサーバ50に対して送信する送信ステップと、を実行する。そのため、本発明の一実施形態に係る情報処理方法は、クラウドネットワーク5に設けられたクラウドサーバ50を利用した画像処理におけるセキュリティを高めることができる。
なお、各実施形態の機能は、アセンブラ、C、C++、C#、Java(登録商標)等のレガシープログラミング言語またはオブジェクト指向プログラミング言語等で記述されたコンピュータ実行可能なプログラムにより実現でき、ROM、EEPROM(Electrically Erasable Programmable Read-Only Memory)、EPROM(Erasable Programmable Read-Only Memory)、フラッシュメモリ、フレキシブルディスク、CD(Compact Disc)−ROM、CD−RW(Re-Writable)、DVD−ROM、DVD−RAM、DVD−RW、ブルーレイディスク、SDカード、MO(Magneto-Optical disc)等の装置可読な記録媒体に格納して、または電気通信回線を通じて頒布することができる。
また、各実施形態の機能の一部または全部は、例えばFPGA(Field Programmable Gate Array)等のプログラマブル・デバイス(PD)上に実装することができ、またはASICとして実装することができ、各実施形態の機能をPD上に実現するためにPDにダウンロードする回路構成データ(ビットストリームデータ)、回路構成データを生成するためのHDL(Hardware Description Language)、VHDL(Very High Speed Integrated Circuits Hardware Description Language)、Verilog−HDL等により記述されたデータとして記録媒体により配布することができる。
これまで本発明の一実施形態に係る情報処理装置、情報処理システム、情報処理方法およびプログラムについて説明してきたが、本発明は上述した実施形態に限定されるものではなく、他の実施形態、追加、変更、削除等、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。