JP6303742B2

JP6303742B2 - 画像処理装置、画像処理方法、および画像処理プログラム

Info

Publication number: JP6303742B2
Application number: JP2014080155A
Authority: JP
Inventors: 堤　隆弘; 隆弘堤
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2014-04-09
Filing date: 2014-04-09
Publication date: 2018-04-04
Anticipated expiration: 2034-04-09
Also published as: JP2015201077A

Description

この発明は画像処理装置、画像処理方法、および画像処理プログラムに関し、特に、ＯＣＲ（Optical Character Reader）機能を利用可能な画像処理装置、画像処理方法、および画像処理プログラムに関する。

画像処理の１つに、スキャン画像に対するＯＣＲ（Optical Character Reader）処理が挙げられる。ＯＣＲ処理を行なうとスキャン画像が文字認識されるため、ＯＣＲ機能の提供元の信頼度に応じては、元の原稿の情報の漏えいの危険性がある。そのため、たとえば外部装置の提供するＯＣＲ機能を利用する場合など、ＯＣＲ機能の提供元の信用度が高くない場合には、セキュリティーを確保する方法として、スキャン画像を分割して異なる提供元から提供されるＯＣＲ機能を利用する、などが考えられる。

特開２００８−２９３３５４号公報特開２００６−２６０１１５号公報特開２０１０−１０２７０９号公報特開２００７−３２３４１５号公報特開２００５−００７３１５号公報

しかしながら、スキャン画像を小エリアに分断してそれぞれ別個にＯＣＲ処理を行なうと、分断された小エリア間での意味解析や単語解析ができなくなる。そのため、ＯＣＲ精度の低下につながるという問題がある。

また、スキャン画像から１文字ずつ切り出す処理は難しいため、小エリアのサイズを小さく設定したり、一部分ずつ重複させて小エリアに分断したりすることが考えられる。しかしながら、そのようにすると、ＯＣＲの処理量が増加してしまうという問題もある。

本発明はこのような問題に鑑みてなされたものであって、セキュリティーを確保しつつ効率的にＯＣＲ機能を利用可能な画像処理装置、画像処理方法、および画像処理プログラムを提供することを目的としている。

上記目的を達成するために、本発明のある局面に従うと、画像処理装置はスキャン画像を処理可能な画像処理装置であって、スキャン画像の入力を受け付けるための入力手段と、ＯＣＲ（Optical Character Reader）機能を利用して、スキャン画像に対してＯＣＲ処理することで得られるテキストデータを取得するためのＯＣＲ処理手段と、ＯＣＲ処理手段でのＯＣＲ機能の利用を制御するための制御手段とを備える。制御手段は、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第１のエリアと第２のエリアとの関連性の度合を判断するための判断手段を含み、第１のエリアと第２のエリアとの関連性の度合が所定度合以上である場合に、制御手段は、第１のエリアと第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する。

好ましくは、ＯＣＲ処理手段がそれぞれ異なる提供元から提供される複数のＯＣＲ機能を利用可能である場合、制御手段は、第１のエリアと第２のエリアとのそれぞれに対して、それぞれ異なる提供元から提供されるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する。

好ましくは、制御手段は、第１のエリアと第２のエリアとのそれぞれに対して、同一の提供元から提供される同一のＯＣＲ機能を異なるタイミングで利用してＯＣＲ処理を行なうよう制御する。

好ましくは、判断手段は、第１のエリアおよび第２のエリアに含まれるキーワードに基づいて関連性の度合を判断する。

好ましくは、判断手段は、スキャン画像における第１のエリアと第２のエリアとのそれぞれの配置に基づいて関連性の度合を判断する。

好ましくは、判断手段において第１のエリアの第２のエリアに対する関連性が判断不能な場合に、制御手段は第１のエリアをさらに複数のエリアに分割し、それぞれ異なるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する。

好ましくは、画像処理装置は、レイアウトごとに、当該レイアウトに含まれるエリアごとに用いるＯＣＲ機能を記憶しておくための記憶領域を有するメモリーをさらに備え、制御手段は、スキャン画像のレイアウトが記憶領域に記憶されているレイアウトに該当する場合に、記憶領域に記憶されているＯＣＲ機能を利用してスキャン画像のＯＣＲ処理を行なうように制御する。

好ましくは、制御手段は、スキャン画像に設定されているセキュリティーレベルが所定範囲である場合に、第１のエリアと第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する。

より好ましくは、入力手段は、スキャン画像に対してセキュリティーレベルを設定するための設定手段を含む。

好ましくは、制御手段は、さらに、スキャン画像から抽出されるエリアに対して設定されているセキュリティーレベルと、ＯＣＲ処理手段で利用可能なＯＣＲ機能のセキュリティーレベルとに基づいて、エリアに対して用いるＯＣＲ機能を決定する。

好ましくは、スキャン画像はページ単位で分けられ、制御手段は、スキャン画像のページごとのレイアウトに基づいて、第１のエリアと第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する。

本発明の他の局面に従うと、画像処理方法はスキャン画像の処理方法であって、スキャン画像の入力を受け付けるステップと、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第１のエリアと第２のエリアとの関連性の度合を判断するステップと、ＯＣＲ機能を利用して、スキャン画像に対してＯＣＲ処理することで得られるテキストデータを取得するステップとを備え、テキストデータを取得するステップは、第１のエリアと第２のエリアとの関連性の度合が所定度合以上である場合に第１のエリアと第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうステップを含む。

本発明のさらに他の局面に従うと、画像処理プログラムはコンピューターにスキャン画像の処理を実行させるプログラムであって、スキャン画像の入力を受け付けるステップと、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第１のエリアと第２のエリアとの関連性の度合を判断するステップと、ＯＣＲ機能を利用して、スキャン画像に対してＯＣＲ処理することで得られるテキストデータを取得するステップとをコンピューターに実行させ、テキストデータを取得するステップは、第１のエリアと第２のエリアとの関連性の度合が所定度合以上である場合に第１のエリアと第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうステップを含む。

この発明によると、画像亜処理装置において、セキュリティーを確保しつつ効率的にＯＣＲ機能を利用することができる。

実施の形態にかかる画像処理装置の一例としてのＭＦＰ（Multi-Functional Peripheral）の装置構成の具体例を示すブロック図である。ＭＦＰでの動作概要を表わした図である。レイアウト解析を説明するための図である。ＭＦＰの機能構成の具体例を表わしたブロック図である。ＭＦＰでの動作の流れを表わすフローチャートである。

以下に、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがって、これらの説明は繰り返さない。

＜装置構成＞
図１は、本実施の形態にかかる画像処理装置の一例としてのＭＦＰ（Multi-Functional Peripheral）１００の装置構成の具体例を示すブロック図である。図１を参照して、ＭＦＰ１００は、装置全体を制御するためのＣＰＵ（Central Processing Unit）１０と、ＣＰＵ１０で実行されるプログラムを記憶するためのメモリーであるＲＯＭ（Read Only Memory）１１と、ＣＰＵ１０でプログラムを実行する際の作業領域となったり計算値を記憶したりするためのメモリーであるＲＡＭ（Random Access Memory）１２と、画像データなどを記憶するための大容量の記憶装置の一例としてのＨＤＤ（Hard Disk Drive）１３と、スキャナー１４と、プリンター１５と、操作パネル１６と、他の装置と通信するためのネットワークコントローラー１７とを含む。

ＭＦＰ１００は、他の装置の一例としてサーバー３００と通信可能である。ＭＦＰ１００は、サーバー３００と通信することによって、サーバー３００が提供するＯＣＲ（Optical Character Reader）機能を利用可能である。サーバー３００は、複数の種類のＯＣＲ機能を提供してもよい。または、ＭＦＰ１００は複数のサーバー３００と通信可能であって、それぞれのサーバー３００が提供する複数のＯＣＲ機能を利用可能であってもよい。

＜動作概要＞
図２は、ＭＦＰ１００での動作概要を表わした図である。図２を参照して、ユーザーは処理対象のドキュメントに対してスキャンを実行する（ステップ＃１）。好ましくは、ユーザーは、スキャン画像に対してセキュリティーレベルを設定する（ステップ＃２）。セキュリティーレベルの設定は、解像度の設定と同様に属性としてスキャン画像情報に付加されるものであってもよいし、セキュリティーレベルを表わす、たとえば「社外秘」などの予め規定された画像やコード（たとえばＱＲコード（登録商標）等）がスキャン画像自体に付加されるものであってもよい。

図３は、レイアウト解析を説明するための図であって、一例として「請求書」とタイトルされたドキュメントをスキャンすることで得られたスキャン画像が示されている。図３にも示されたように、ＯＣＲ処理の対象として、請求書や履歴書など、特定のフォーマットで作成されたドキュメントのスキャン画像が一般的に多いと考えられる。ＭＦＰ１００は、このようなフォーマットを有するスキャン画像に対してＯＣＲ処理を行なうことで当該ドキュメントに含まれる文字情報（テキスト）を取得することができる。

図３のようなスキャン画像の入力を受け付けたＭＦＰ１００は、スキャン画像に対してレイアウト解析を実行する（ステップ＃３）。レイアウト解析は、画像の特徴量から当該画像に含まれる情報を解析、分析する技術であって、文字を含む画像内の情報の配置を検出する技術を指す。図３のスキャン画像をレイアウト解析した場合、一例としてＭＦＰ１００は、文字を含む（または含んでいる可能性のある、以下、同様である）エリアとしてエリア５０１〜５１７を抽出する。ＭＦＰ１００は文字をエリア以外のエリアとして、罫線で構成された表や、写真、その他の図形を含んだエリアを抽出してもよい。ＭＦＰ１００は、各エリアの配置や内容を表わす情報をレイアウト情報として保持する。ＭＦＰ１００は、フォーマットごとにレイアウト情報を記憶してもよい。

ＭＦＰ１００は、さらに、抽出したエリア間での関連性を判断し（ステップ＃４）、その判断結果に基づいて各エリアのＯＣＲ処理に利用するＯＣＲ機能を決定する（ステップ＃５）。

上記ステップ＃４でＭＦＰ１００は各エリアに対してキーワード検索を行なって、予め規定しているキーワードを含むか否かで各エリアを分類する。たとえば、「株式会社」や「有限会社」などの予め規定しているキーワードを含むエリア５０４，５０７，５１７について、ＭＦＰ１００はエリア５０４，５０７，５１７に含まれるテキストが社名を表わすとしてエリア５０４，５０７，５１７の分類を「社名」とすることができる。同様に、「部」や「部長」、「課長」などの予め規定しているキーワードを含むエリア５０６について、ＭＦＰ１００はエリア５０６に含まれるテキストが担当者を表わすとしてエリア５０６の分類を「担当者」とすることができる。予め規定しているいずれのキーワードも含まないエリア５１５については、ＭＦＰ１００は、キーワードを含まない「特殊文字列」として分類する。

ＭＦＰ１００は、上記ステップ＃４で各エリアの分類結果に基づいて、各エリアの関連性を判断する。たとえば、ＭＦＰ１００は、「社名」に分類されたエリア５０４と「担当者」に分類されたエリア５０６とを関連性ある組み合わせと特定することができる。好ましくは、ＭＦＰ１００は、さらに、エリアの配置にも基づいて関連性を判断する。たとえば、ＭＦＰ１００は、「社名」に分類されたエリア５０４と、その近傍に配置された「担当者」に分類されたエリア５０６とを関連性ある組み合わせと特定することができる。

ＭＦＰ１００は、関連性あるエリア（この例ではエリア５０４およびエリア５０６）に対してタグを付与するなどしてグループ化する。そして、ＭＦＰ１００は、関連性があるとされた複数のエリアそれぞれのＯＣＲに用いるＯＣＲ機能を異なるものとするように、ＯＣＲ機能を決定し（ステップ＃５）、ＯＣＲ処理を実行させる（ステップ＃６）。たとえば、上記の例では、ＭＦＰ１００はエリア５０４およびエリア５０６それぞれのＯＣＲ処理に利用するＯＣＲ機能を異なるＯＣＲ機能と決定する。異なるＯＣＲ機能とは、エリア５０４とエリア５０６とのそれぞれに対して異なる提供元である第１のサーバーの提供するＯＣＲ機能と第２のサーバーの提供するＯＣＲ機能とを利用することであってもよいし、第１のサーバーの提供する同一のＯＣＲ機能をエリア５０４とエリア５０６とのそれぞれに対して異なるタイミングで利用することであってもよい。

このように、ＭＦＰ１００は、関連性があると判断されたエリアに対して異なるＯＣＲ機能を利用するので、たとえば社名と担当者とに対して異なるＯＣＲ機能を利用することになる。そのため、複数の情報の間の関連性が分断される。つまり、同一の機会に同一のサーバーの提供するＯＣＲ機能において、たとえば社名および担当者などの関連性のある情報がＯＣＲ処理されることがない。そのため、当該ドキュメントの内容の漏えいを効果的に防止することができる。

なお、ＭＦＰ１００は、関連性の有無のみならず、関連性の度合を判断してもよい。すなわち、ＭＦＰ１００は予め分類ごとに関連性の度合を記憶しておき、レイアウト分析の結果である各エリアの分類に応じて、エリア間の関連性の度合を判断することができる。この場合、ＭＦＰ１００は、エリア間の関連性の度合に応じて各エリアに用いるＯＣＲ機能を決定してもよい。すなわち、ＭＦＰ１００は、エリア間の関連性が所定度以上である場合に異なるＯＣＲ機能を利用すると決定し、上記所定度に満たない場合には同一のＯＣＲ機能を利用してもよいと決定してもよい。または、ＯＣＲ機能にセキュリティーレベルが設定されている場合、ＭＦＰ１００は、エリア間の関連性が所定度以上である場合にはこれらエリアそれぞれに対してセキュリティーレベルの高い、それぞれ異なるＯＣＲ機能を利用する、と決定してもよい。

さらに、ＭＦＰ１００は、スキャン画像のエリアごとにセキュリティーレベルが設定されている場合、当該エリアのセキュリティーレベルもさらに考慮して利用するＯＣＲ機能を決定してもよい。つまり、好ましくはＭＦＰ１００は、エリアに設定されたセキュリティーレベルが高い場合には、セキュリティーレベルの高いＯＣＲ機能を利用すると決定する。

エリアごとのセキュリティーレベルは、予めドキュメントの作成者が設定してもよいし、フォーマットに関連付けてメモリーに登録されていてもよいし、予めＭＦＰ１００がキーワードに応じたセキュリティーレベルを記憶しておき、当該エリアから検出されたキーワードに基づいて判断してもよい。

一方、上記ステップ＃３のレイアウト解析によって「特殊文字列」と分類されたエリア５０４については、ＭＦＰ１００はさらに小エリアに分割し、各小エリアの処理に利用するＯＣＲ機能を異なるＯＣＲ機能に決定する。または、ＯＣＲ機能にセキュリティーレベルが設定されている場合、ＭＦＰ１００は「特殊文字列」と分類されたエリア５０４に対して、特殊文字列に分類されていないエリアに対して利用するＯＣＲ機能よりもセキュリティーレベルの高いＯＣＲ機能を利用すると決定する。

「特殊文字列」と分類されたエリアに記載された内容はレイアウト解析では不明であるため、他のエリアに対する関連性が判断不能である。ＭＦＰ１００が「特殊文字列」と分類されたエリアに対して上記のように利用するＯＣＲ機能を決定することで、当該エリアの内容の漏えいをより効果的に防止することができる。

また、他の例として上記のようにして「住所」と分類されたエリア５０５，５０８についても、ＭＦＰ１００は、さらに小エリアに分類し、各小エリアの処理に利用するＯＣＲ機能を異なるＯＣＲ機能に決定するようにしてもよい。すなわち、ＭＦＰ１００は、特定の分類に対しては、さらに小エリアに分類し、各小エリアの処理に利用するＯＣＲ機能を異なるＯＣＲ機能に決定するようにしてもよい。このようにすることで、当該エリアの内容の漏えいをより効果的に防止することができる。

ＭＦＰ１００は、各ＯＣＲ機能からＯＣＲ処理の結果であるテキスト情報を受け取り、それらを統合することで（ステップ＃７）、ドキュメントの内容を得ることができる。

なお、ＭＦＰ１００は、ＯＣＲ機能にセキュリティーレベルが設定されている場合、さらに、スキャン画像に対して設定されているセキュリティーレベルもさらに考慮してＯＣＲ機能を決定してもよい。すなわち、スキャン画像に対して高いセキュリティーレベルが設定されている場合、ＭＦＰ１００は、最も高いセキュリティーレベルが設定されているＯＣＲ機能を用いると決定することができる。最もセキュリティーレベルの高いＯＣＲ機能としては、当該ＭＦＰ１００自身に搭載されているＯＣＲ機能が挙げられる。一方、スキャン画像に対して設定されているセキュリティーレベルが低い場合には、ＭＦＰ１００は、上記のようにエリア間の関連性の度合を考慮することなく、スキャン画像全体に対していずれかのＯＣＲ機能を利用すると決定してもよい。このようにすることで、処理を効率化、高速化することができる。従って、ＦＭＰ１００は、スキャン画像に対して設定されているセキュリティーレベルが所定範囲の場合にのみ、上記のようにレイアウト分析の結果抽出されたエリア間の関連性の度合に応じて利用するＯＣＲ機能を決定するようにしてもよい。

好ましくは、ＭＦＰ１００は、エリアごとに決定した利用するＯＣＲ機能をＯＣＲ情報として、ドキュメントのフォーマットに関連付けてメモリーに記憶する。たとえば、図３の例の場合、ＭＦＰ１００は、ドキュメントのフォーマット「請求書」に関連付けて、エリア５０１〜５１７それぞれの分類や利用するＯＣＲ機能をメモリーに記憶する。そして、次回の処理でレイアウト解析の結果、処理対象のスキャン画像がフォーマット「請求書」のものであると判断されると、ＭＦＰ１００はメモリーから当該フォーマット「請求書」に関連付けられたＯＣＲ情報を読み出して処理対象のスキャン画像に適用する。このようにすることで、２回目以降の処理において利用するＯＣＲ機能を決定する処理を高速化することができる。従って、好ましくは、ＭＦＰ１００は、スキャン画像がページ単位で分けられたものである場合、つまり、ドキュメントが複数ページからなるものである場合、ページ単位でレイアウト解析を実行して当該ページのフォーマットを特定し、当該フォーマットに関連付けられたＯＣＲ情報がメモリーに登録されているか否かを確認する。

＜機能構成＞
図４は、ＭＦＰ１００が上記の動作を行なうための機能構成の具体例を表わしたブロック図である。図４の各機能は、ＭＦＰ１００のＣＰＵ１０がＲＯＭ１１に記憶されているプログラムをＲＡＭ１２上に読み出して実行することで、主に、ＣＰＵ１０で実現される。しかしながら、少なくとも一部機能が、図１に表わされた他の構成、または図示されない電気回路などの他のハードウェア構成によって実現されてもよい。

図４を参照して、メモリーの一例としてのＨＤＤ１３は、ドキュメントのフォーマットに関連付けてエリアごとに利用すると決定されたＯＣＲ機能を表わした情報であるＯＣＲ情報を記憶するための記憶領域であるＯＣＲ情報記憶部１３１を含む。

さらに図４を参照して、ＣＰＵ１０は、スキャナー１４やネットワークコントローラー１７を介して他の装置からスキャン画像の入力を受け付けるための入力部１０１と、入力されたスキャン画像に対してＯＣＲ処理することで得られるテキストデータを取得するためのＯＣＲ処理部１０２と、スキャン画像に対してＯＣＲ処理を実行するためのＯＣＲ実行部１０３と、ＯＣＲ処理部１０２でのＯＣＲ機能の利用を制御するための制御部１０４とを含む。好ましくは、入力部１０１は、スキャン画像に対してセキュリティーレベルを設定するための設定部１０９を含む。

制御部１０４は、スキャン画像のレイアウト解析を行なうための解析部１０５と、解析されたレイアウトに基づいてスキャン画像から文字（または文字列）を含むエリアを抽出するための抽出部１０６と、抽出されたエリア間の関連性の度合（関連性の有無を含む）を判断するための判断部１０７と、判断されたエリア間の関連性の度合に基づいて各エリアのＯＣＲ処理に利用するＯＣＲ機能を決定するための決定部１０８とを含む。

決定部１０８で決定したエリアごとに利用するＯＣＲ機能は、当該ドキュメントのレイアウトに関連付けてＯＣＲ情報としてＯＣＲ情報記憶部１３１に記憶される。また、解析部１０５で解析されたレイアウトから特定されるドキュメントのフォーマットに関連付けられたＯＣＲ情報がＯＣＲ情報記憶部１３１に記憶されている場合、制御部１０４はＯＣＲ情報記憶部１３１から街頭するＯＣＲ情報を読み出す。この場合、決定部１０８は、ＯＣＲ情報に基づいて各エリアに利用するＯＣＲ機能を決定する。

判断部１０７は、各エリアに含まれるキーワードに基づいて関連性の度合を判断する。好ましくは、判断部１０７は、さらに、スキャン画像における各エリアの配置も考慮して関連性の度合を判断する。

決定部１０８は、エリア間の関連性の度合が所定度合以上である場合に、各エリアに対して異なるＯＣＲ機能を利用すると決定する。異なるＯＣＲ機能とは、それぞれ異なる提供元から提供されるＯＣＲ機能であってもよいし、同一のＯＣＲ機能を異なるタイミングで利用することであってもよい。

なお、判断部１０７において関連性の度合が判断不能であったエリアについては、好ましくは決定部１０８は、当該エリアをさらに複数のエリアに分割してそれぞれ異なるＯＣＲ機能を利用すると決定する。

＜動作フロー＞
図５は、ＭＦＰ１００での動作の流れを表わすフローチャートである。図５のフローチャートに表わされた動作は、ＭＦＰ１００のＣＰＵ１０がＲＯＭ１１に記憶されているプログラムをＲＡＭ１２上に読み出して実行し、図４の各機能を発揮させることによって実現される。

図５を参照して、ＣＰＵ１０は、スキャン画像の入力を受け付けると（ステップＳ１０１でＹＥＳ）、当該スキャン画像にセキュリティーレベルが設定されているか否かを確認する。入力されたスキャン画像に対して高いセキュリティーレベル、または低いセキュリティーレベルが設定されている場合、または、セキュリティーレベルの設定のない場合（ステップＳ１０３でＮＯ）、ＣＰＵ１０は、以降の、エリアごとに異なるＯＣＲ機能を利用するための処理を行なうことなく、所定のＯＣＲ機能を利用すると決定し（ステップＳ１２５）、ＯＣＲ処理を実行する（ステップＳ１２７）。すなわち、スキャン画像のセキュリティーレベルが所定レベルよりも高い場合には、ＣＰＵ１０は、当該スキャン画像のすべてのエリアに対して、たとえばＭＦＰ１００に搭載されているＯＣＲ機能など、セキュリティーレベルの高いＯＣＲ機能を利用すると決定する。スキャン画像のセキュリティーレベルが所定レベルよりも低い場合、またはセキュリティーレベルが設定されていない場合には、ＣＰＵ１０は、当該スキャン画像のすべてのエリアに対して、予め規定されたＯＣＲ機能を利用すると決定する。

入力されたスキャン画像に設定されているセキュリティーレベルが所定範囲である場合（ステップＳ１０３でＹＥＳ）、ＣＰＵ１０は、スキャン画像に対してレイアウト解析を行なって、当該スキャン画像の元のドキュメントのレイアウトを特定して、文字を含んでいるエリアを抽出する（ステップＳ１０５）。

特定されたレイアウトから得られるフォーマットに関連付けてＯＣＲ情報がメモリーに記憶されている場合（ステップＳ１０７でＹＥＳ）、ＣＰＵ１０は、以下の処理に替えて、メモリーから街頭するＯＣＲ情報を読み出すことで（ステップＳ１０９）、エリアごとの利用するＯＣＲ機能を決定し（ステップＳ１２５）、ＯＣＲ処理を実行する（ステップＳ１２７）。

メモリーにＯＣＲ情報が登録されていない場合（ステップＳ１０７でＮＯ）、ＣＰＵ１０は、エリアごとに利用するＯＣＲ機能を決定する処理を実行する。すなわち、ＣＰＵ１０は、上記ステップＳ１０５のレイアウト解析によって抽出されたエリアごとにＯＣＲ処理を実行して（ステップＳ１１１）、当該エリアに予め規定したキーワードが含まれているか否かを検索する（ステップＳ１１３）。その結果、当該エリアにキーワードが含まれる場合には（ステップＳ１１５でＹＥＳ）、ＣＰＵ１０は、含まれるキーワードに応じて当該エリアを分類する（ステップＳ１１７）。当該エリアにいずれのキーワードも含まれない場合には（ステップＳ１１５でＮＯ）、ＣＰＵ１０は、当該エリアを「特殊文字列」に分類する（ステップＳ１１９）。

ＣＰＵ１０は、以上のステップＳ１１１〜Ｓ１１９の処理を抽出されたすべてのエリアに対して実行する。そして、すべてのエリアに対して処理が終了すると（ステップＳ１２１でＮＯ）、ＣＰＵ１０は、各エリアの分類結果に基づいて各エリアの関連性を判断する。すなわち、ＣＰＵ１０は、各エリアの分類結果に応じて関連性あるエリアのグループを特定して、タグを付与するなどしてグループ化する（ステップＳ１２３）。このとき、ＣＰＵ１０は、さらに各エリアの配置も考慮して関連性あるエリアのグループを特定してもよい。

ＣＰＵ１０は、関連性があるとグループ化された複数のエリアそれぞれに利用するＯＣＲ機能を異なるものとするように、各エリアに対して利用するＯＣＲ機能を決定する（ステップＳ１２５）。また、上記ステップＳ１１９で「特殊文字列」と分類されたエリアに対しては、ＣＰＵ１０はさらに当該エリアを小エリアに分割し、各小エリアそれぞれに利用するＯＣＲ機能を異なるものとするように、各小エリアに対して利用するＯＣＲ機能を決定する。

ＣＰＵ１０は、スキャン画像のうちの対象のエリアのみを、当該エリアのＯＣＲ処理に利用すると決定されたＯＣＲ機能を提供するサーバー３００に渡して、ＯＣＲ処理を実行させる（ステップＳ１２７）。

ＣＰＵ１０は、利用したＯＣＲ機能ごとに、当該ＯＣＲ機能を提供するサーバー３００から処理結果であるテキストを受け付ける。そして、それらをエリアの配置に基づいて統合することで（ステップＳ１２９）、スキャン画像の内容を得る。

なお、上記ステップＳ１０１で入力されたスキャン画像がページ単位に分けられたものであった場合、ＣＰＵ１０は、ページごとに上記ステップＳ１０３〜Ｓ１２９を繰り返す。これによって、ＣＰＵ１０は、ページ単位でレイアウト解析を行ない、当該レイアウトから得られたフォーマットに関連付けられたＯＣＲ情報がメモリーに登録されている場合には、（以降のエリアごとにＯＣＲ機能を決定する処理を行なうことなく）登録されているＯＣＲ情報を利用してＯＣＲ機能を決定して処理を実行させることができる。

＜実施の形態の効果＞
以上の処理がＭＦＰ１００において実行されることで、ＭＦＰ１００では、セキュリティーを確保しつつ外部装置の提供するＯＣＲ機能も利用することができる。すなわち、本実施の形態にかかるＭＦＰ１００を利用すると、たとえば住所と社名、商品名と単価など、関連性の度合の高い内容を含むエリアがそれぞれ異なるＯＣＲ機能を利用してＯＣＲ処理がなされる。そのため、たとえ当該ＯＣＲ機能を提供するサーバー３００を介してＯＣＲ処理結果である当該エリアの内容が漏えいした場合であっても、関連性が分断されているため、その内容の意味の漏えいは防止される。つまり、上記の例であれば、商品名のみ、または単価のみが第三者に漏えいしたとしても、「その商品の単価」として意味を構成するような内容で第三者に漏えいすることがない。そのため、すべて自身のＯＣＲ機能を利用する場合と比較して効率的にＯＣＲ処理を行なうことができる。つまり、本実施の形態にかかるＭＦＰ１００では、セキュリティーを確保しつつ効率的にＯＣＲ機能を利用することができる。

さらに、本実施の形態にかかるＭＦＰ１００では、いったんエリアごとに利用するＯＣＲ機能を決定すると、その結果をＯＣＲ情報として、フォーマットに関連付けてメモリーに記憶する。そして、次回以降、対象のスキャン画像をレイアウト解析してフォーマットを特定すると、当該フォーマットに関連付けて記憶されているＯＣＲ情報を読み出して利用するＯＣＲ機能を特定する。一般的に、ドキュメントをＯＣＲ処理して用いる場面はオフィス環境であることが多く、多くの場合には「請求書」や「納品書」など、フォーマットに沿って作成されたドキュメントが処理対象となる。従って、フォーマットごとにエリアごとの利用するＯＣＲ機能を予め登録しておくことで、２回目以降、処理のつどＯＣＲ機能を決定するための処理を繰り返す必要がなく、処理を高速化することができる。

＜他の例１＞
上記の例では、ＭＦＰ１００が自身の搭載するＯＣＲ機能を利用してエリアに含まれるキーワードを特定し、分類するものとしている。エリアの分類はＯＣＲ機能を利用する方法に限定されない。他の例として、予め管理者等の特定のユーザーやドキュメントの作成者によってエリアごとに分類され、当該分類を表わすタグ等が付与されていてもよい。さらには、予め管理者等の特定のユーザーやドキュメントの作成者によってフォーマットごとのＯＣＲ情報が登録されていてもよい。さらには、そのＯＣＲ情報は、ＭＦＰ１００のメモリーのみならず、（サーバー３００等の）他の記憶装置に登録され、ＭＦＰ１００が当該記憶装置にアクセスしてＯＣＲ情報を読み出すようにしてもよい。または、スキャン画像にＯＣＲ情報が付加されていてもよい。

＜他の例２＞
なお、以上の例では、本実施の形態にかかる画像処理装置がＭＦＰであるものとし、さらに、当該ＭＦＰ自身もＯＣＲ機能を搭載するものとしている。しかしながら、画像処理装置はＭＦＰに限定されない。画像処理装置の他の例として、たとえば、汎用のコンピューターやいわゆるタブレットなどと呼ばれる端末装置であってもよい。つまり、ＯＣＲ機能を提供するサーバー３００と通信可能であって、画像データを処理対象のデータとして取扱い可能な装置であればいかなる装置であってもよい。

上記のように画像処理装置が自身がＯＣＲ機能を搭載しない場合には、画像処理装置は上記の例のように予めエリアに対して設定された分類を表わす情報に基づいて、当該エリアに対して利用するＯＣＲ機能を決定することができる。

＜他の例３＞
さらに、上述の処理をＭＦＰ１００や他の装置である画像処理装置に実行させるためのプログラムを提供することもできる。プログラムを提供することで、汎用のＭＦＰやコンピューターを本実施の形態にかかる画像処理装置として機能させることができる。

このようなプログラムは、コンピューターに付属するフレキシブルディスク、ＣＤ−ＲＯＭ（Compact Disk-Read Only Memory）、ＲＯＭ、ＲＡＭおよびメモリカードなどのコンピューター読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピューターに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。

なお、本発明にかかるプログラムは、コンピューターのオペレーティングシステム（ＯＳ）の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずＯＳと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。

また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。

提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

１０ＣＰＵ、１１ＲＯＭ、１２ＲＡＭ、１３ＨＤＤ、１４スキャナー、１５プリンター、１６操作パネル、１７ネットワークコントローラー、１００ＭＦＰ、１０１入力部、１０２ＯＣＲ処理部、１０３ＯＣＲ実行部、１０４制御部、１０５解析部、１０６抽出部、１０７判断部、１０８決定部、１０９設定部、１３１ＯＣＲ情報記憶部、３００サーバー、５０１〜５１７エリア。

Claims

スキャン画像を処理可能な画像処理装置であって、
前記スキャン画像の入力を受け付けるための入力手段と、
ＯＣＲ（Optical Character Reader）機能を利用して、前記スキャン画像に対してＯＣＲ処理することで得られるテキストデータを取得するためのＯＣＲ処理手段と、
前記ＯＣＲ処理手段での前記ＯＣＲ機能の利用を制御するための制御手段とを備え、
前記制御手段は、前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第１のエリアと第２のエリアとの関連性の度合を判断するための判断手段を含み、
前記第１のエリアと前記第２のエリアとの関連性の度合が所定度合以上である場合に、前記制御手段は、前記第１のエリアと前記第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する、画像処理装置。
前記ＯＣＲ処理手段がそれぞれ異なる提供元から提供される複数のＯＣＲ機能を利用可能である場合、前記制御手段は、前記第１のエリアと前記第２のエリアとのそれぞれに対して、それぞれ異なる提供元から提供されるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する、請求項１に記載の画像処理装置。
前記制御手段は、前記第１のエリアと前記第２のエリアとのそれぞれに対して、同一の提供元から提供される同一のＯＣＲ機能を異なるタイミングで利用してＯＣＲ処理を行なうよう制御する、請求項１に記載の画像処理装置。
前記判断手段は、前記第１のエリアおよび前記第２のエリアに含まれるキーワードに基づいて関連性の度合を判断する、請求項１〜３のいずれかに記載の画像処理装置。
前記判断手段は、前記スキャン画像における前記第１のエリアと前記第２のエリアとのそれぞれの配置に基づいて関連性の度合を判断する、請求項１〜３のいずれかに記載の画像処理装置。
前記判断手段において前記第１のエリアの前記第２のエリアに対する関連性が判断不能な場合に、前記制御手段は前記第１のエリアをさらに複数のエリアに分割し、それぞれ異なるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する、請求項１〜５のいずれかに記載の画像処理装置。
レイアウトごとに、当該レイアウトに含まれるエリアごとに用いるＯＣＲ機能を記憶しておくための記憶領域を有するメモリーをさらに備え、
前記制御手段は、前記スキャン画像のレイアウトが前記記憶領域に記憶されているレイアウトに該当する場合に、前記記憶領域に記憶されているＯＣＲ機能を利用して前記スキャン画像のＯＣＲ処理を行なうように制御する、請求項１〜６のいずれかに記載の画像処理装置。
前記制御手段は、前記スキャン画像に設定されているセキュリティーレベルが所定範囲である場合に、前記第１のエリアと前記第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する、請求項１〜７のいずれかに記載の画像処理装置。
前記入力手段は、前記スキャン画像に対してセキュリティーレベルを設定するための設定手段を含む、請求項８に記載の画像処理装置。
前記制御手段は、さらに、前記スキャン画像から抽出されるエリアに対して設定されているセキュリティーレベルと、前記ＯＣＲ処理手段で利用可能なＯＣＲ機能のセキュリティーレベルとに基づいて、前記エリアに対して用いるＯＣＲ機能を決定する、請求項１〜９のいずれかに記載の画像処理装置。
前記スキャン画像はページ単位で分けられ、
前記制御手段は、前記スキャン画像のページごとのレイアウトに基づいて、前記第１のエリアと前記第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうよう制御する、請求項１〜１０のいずれかに記載の画像処理装置。
スキャン画像の処理方法であって、
前記スキャン画像の入力を受け付けるステップと、
前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第１のエリアと第２のエリアとの関連性の度合を判断するステップと、
ＯＣＲ機能を利用して、前記スキャン画像に対してＯＣＲ処理することで得られるテキストデータを取得するステップとを備え、
前記テキストデータを取得するステップは、前記第１のエリアと前記第２のエリアとの関連性の度合が所定度合以上である場合に前記第１のエリアと前記第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうステップを含む、画像処理方法。
コンピューターにスキャン画像の処理を実行させるプログラムであって、
前記スキャン画像の入力を受け付けるステップと、
前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第１のエリアと第２のエリアとの関連性の度合を判断するステップと、
ＯＣＲ機能を利用して、前記スキャン画像に対してＯＣＲ処理することで得られるテキストデータを取得するステップとを前記コンピューターに実行させ、
前記テキストデータを取得するステップは、前記第１のエリアと前記第２のエリアとの関連性の度合が所定度合以上である場合に前記第１のエリアと前記第２のエリアとのそれぞれに対して異なるＯＣＲ機能を利用してＯＣＲ処理を行なうステップを含む、画像処理プログラム。