JP6303742B2 - 画像処理装置、画像処理方法、および画像処理プログラム - Google Patents

画像処理装置、画像処理方法、および画像処理プログラム Download PDF

Info

Publication number
JP6303742B2
JP6303742B2 JP2014080155A JP2014080155A JP6303742B2 JP 6303742 B2 JP6303742 B2 JP 6303742B2 JP 2014080155 A JP2014080155 A JP 2014080155A JP 2014080155 A JP2014080155 A JP 2014080155A JP 6303742 B2 JP6303742 B2 JP 6303742B2
Authority
JP
Japan
Prior art keywords
area
ocr
image
scanned image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014080155A
Other languages
English (en)
Other versions
JP2015201077A (ja
Inventor
堤 隆弘
隆弘 堤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2014080155A priority Critical patent/JP6303742B2/ja
Publication of JP2015201077A publication Critical patent/JP2015201077A/ja
Application granted granted Critical
Publication of JP6303742B2 publication Critical patent/JP6303742B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

この発明は画像処理装置、画像処理方法、および画像処理プログラムに関し、特に、OCR(Optical Character Reader)機能を利用可能な画像処理装置、画像処理方法、および画像処理プログラムに関する。
画像処理の1つに、スキャン画像に対するOCR(Optical Character Reader)処理が挙げられる。OCR処理を行なうとスキャン画像が文字認識されるため、OCR機能の提供元の信頼度に応じては、元の原稿の情報の漏えいの危険性がある。そのため、たとえば外部装置の提供するOCR機能を利用する場合など、OCR機能の提供元の信用度が高くない場合には、セキュリティーを確保する方法として、スキャン画像を分割して異なる提供元から提供されるOCR機能を利用する、などが考えられる。
特開2008−293354号公報 特開2006−260115号公報 特開2010−102709号公報 特開2007−323415号公報 特開2005−007315号公報
しかしながら、スキャン画像を小エリアに分断してそれぞれ別個にOCR処理を行なうと、分断された小エリア間での意味解析や単語解析ができなくなる。そのため、OCR精度の低下につながるという問題がある。
また、スキャン画像から1文字ずつ切り出す処理は難しいため、小エリアのサイズを小さく設定したり、一部分ずつ重複させて小エリアに分断したりすることが考えられる。しかしながら、そのようにすると、OCRの処理量が増加してしまうという問題もある。
本発明はこのような問題に鑑みてなされたものであって、セキュリティーを確保しつつ効率的にOCR機能を利用可能な画像処理装置、画像処理方法、および画像処理プログラムを提供することを目的としている。
上記目的を達成するために、本発明のある局面に従うと、画像処理装置はスキャン画像を処理可能な画像処理装置であって、スキャン画像の入力を受け付けるための入力手段と、OCR(Optical Character Reader)機能を利用して、スキャン画像に対してOCR処理することで得られるテキストデータを取得するためのOCR処理手段と、OCR処理手段でのOCR機能の利用を制御するための制御手段とを備える。制御手段は、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するための判断手段を含み、第1のエリアと第2のエリアとの関連性の度合が所定度合以上である場合に、制御手段は、第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する。
好ましくは、OCR処理手段がそれぞれ異なる提供元から提供される複数のOCR機能を利用可能である場合、制御手段は、第1のエリアと第2のエリアとのそれぞれに対して、それぞれ異なる提供元から提供されるOCR機能を利用してOCR処理を行なうよう制御する。
好ましくは、制御手段は、第1のエリアと第2のエリアとのそれぞれに対して、同一の提供元から提供される同一のOCR機能を異なるタイミングで利用してOCR処理を行なうよう制御する。
好ましくは、判断手段は、第1のエリアおよび第2のエリアに含まれるキーワードに基づいて関連性の度合を判断する。
好ましくは、判断手段は、スキャン画像における第1のエリアと第2のエリアとのそれぞれの配置に基づいて関連性の度合を判断する。
好ましくは、判断手段において第1のエリアの第2のエリアに対する関連性が判断不能な場合に、制御手段は第1のエリアをさらに複数のエリアに分割し、それぞれ異なるOCR機能を利用してOCR処理を行なうよう制御する。
好ましくは、画像処理装置は、レイアウトごとに、当該レイアウトに含まれるエリアごとに用いるOCR機能を記憶しておくための記憶領域を有するメモリーをさらに備え、制御手段は、スキャン画像のレイアウトが記憶領域に記憶されているレイアウトに該当する場合に、記憶領域に記憶されているOCR機能を利用してスキャン画像のOCR処理を行なうように制御する。
好ましくは、制御手段は、スキャン画像に設定されているセキュリティーレベルが所定範囲である場合に、第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する。
より好ましくは、入力手段は、スキャン画像に対してセキュリティーレベルを設定するための設定手段を含む。
好ましくは、制御手段は、さらに、スキャン画像から抽出されるエリアに対して設定されているセキュリティーレベルと、OCR処理手段で利用可能なOCR機能のセキュリティーレベルとに基づいて、エリアに対して用いるOCR機能を決定する。
好ましくは、スキャン画像はページ単位で分けられ、制御手段は、スキャン画像のページごとのレイアウトに基づいて、第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する。
本発明の他の局面に従うと、画像処理方法はスキャン画像の処理方法であって、スキャン画像の入力を受け付けるステップと、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するステップと、OCR機能を利用して、スキャン画像に対してOCR処理することで得られるテキストデータを取得するステップとを備え、テキストデータを取得するステップは、第1のエリアと第2のエリアとの関連性の度合が所定度合以上である場合に第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうステップを含む。
本発明のさらに他の局面に従うと、画像処理プログラムはコンピューターにスキャン画像の処理を実行させるプログラムであって、スキャン画像の入力を受け付けるステップと、スキャン画像のレイアウトに基づいてスキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するステップと、OCR機能を利用して、スキャン画像に対してOCR処理することで得られるテキストデータを取得するステップとをコンピューターに実行させ、テキストデータを取得するステップは、第1のエリアと第2のエリアとの関連性の度合が所定度合以上である場合に第1のエリアと第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうステップを含む。
この発明によると、画像亜処理装置において、セキュリティーを確保しつつ効率的にOCR機能を利用することができる。
実施の形態にかかる画像処理装置の一例としてのMFP(Multi-Functional Peripheral)の装置構成の具体例を示すブロック図である。 MFPでの動作概要を表わした図である。 レイアウト解析を説明するための図である。 MFPの機能構成の具体例を表わしたブロック図である。 MFPでの動作の流れを表わすフローチャートである。
以下に、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがって、これらの説明は繰り返さない。
<装置構成>
図1は、本実施の形態にかかる画像処理装置の一例としてのMFP(Multi-Functional Peripheral)100の装置構成の具体例を示すブロック図である。図1を参照して、MFP100は、装置全体を制御するためのCPU(Central Processing Unit)10と、CPU10で実行されるプログラムを記憶するためのメモリーであるROM(Read Only Memory)11と、CPU10でプログラムを実行する際の作業領域となったり計算値を記憶したりするためのメモリーであるRAM(Random Access Memory)12と、画像データなどを記憶するための大容量の記憶装置の一例としてのHDD(Hard Disk Drive)13と、スキャナー14と、プリンター15と、操作パネル16と、他の装置と通信するためのネットワークコントローラー17とを含む。
MFP100は、他の装置の一例としてサーバー300と通信可能である。MFP100は、サーバー300と通信することによって、サーバー300が提供するOCR(Optical Character Reader)機能を利用可能である。サーバー300は、複数の種類のOCR機能を提供してもよい。または、MFP100は複数のサーバー300と通信可能であって、それぞれのサーバー300が提供する複数のOCR機能を利用可能であってもよい。
<動作概要>
図2は、MFP100での動作概要を表わした図である。図2を参照して、ユーザーは処理対象のドキュメントに対してスキャンを実行する(ステップ#1)。好ましくは、ユーザーは、スキャン画像に対してセキュリティーレベルを設定する(ステップ#2)。セキュリティーレベルの設定は、解像度の設定と同様に属性としてスキャン画像情報に付加されるものであってもよいし、セキュリティーレベルを表わす、たとえば「社外秘」などの予め規定された画像やコード(たとえばQRコード(登録商標)等)がスキャン画像自体に付加されるものであってもよい。
図3は、レイアウト解析を説明するための図であって、一例として「請求書」とタイトルされたドキュメントをスキャンすることで得られたスキャン画像が示されている。図3にも示されたように、OCR処理の対象として、請求書や履歴書など、特定のフォーマットで作成されたドキュメントのスキャン画像が一般的に多いと考えられる。MFP100は、このようなフォーマットを有するスキャン画像に対してOCR処理を行なうことで当該ドキュメントに含まれる文字情報(テキスト)を取得することができる。
図3のようなスキャン画像の入力を受け付けたMFP100は、スキャン画像に対してレイアウト解析を実行する(ステップ#3)。レイアウト解析は、画像の特徴量から当該画像に含まれる情報を解析、分析する技術であって、文字を含む画像内の情報の配置を検出する技術を指す。図3のスキャン画像をレイアウト解析した場合、一例としてMFP100は、文字を含む(または含んでいる可能性のある、以下、同様である)エリアとしてエリア501〜517を抽出する。MFP100は文字をエリア以外のエリアとして、罫線で構成された表や、写真、その他の図形を含んだエリアを抽出してもよい。MFP100は、各エリアの配置や内容を表わす情報をレイアウト情報として保持する。MFP100は、フォーマットごとにレイアウト情報を記憶してもよい。
MFP100は、さらに、抽出したエリア間での関連性を判断し(ステップ#4)、その判断結果に基づいて各エリアのOCR処理に利用するOCR機能を決定する(ステップ#5)。
上記ステップ#4でMFP100は各エリアに対してキーワード検索を行なって、予め規定しているキーワードを含むか否かで各エリアを分類する。たとえば、「株式会社」や「有限会社」などの予め規定しているキーワードを含むエリア504,507,517について、MFP100はエリア504,507,517に含まれるテキストが社名を表わすとしてエリア504,507,517の分類を「社名」とすることができる。同様に、「部」や「部長」、「課長」などの予め規定しているキーワードを含むエリア506について、MFP100はエリア506に含まれるテキストが担当者を表わすとしてエリア506の分類を「担当者」とすることができる。予め規定しているいずれのキーワードも含まないエリア515については、MFP100は、キーワードを含まない「特殊文字列」として分類する。
MFP100は、上記ステップ#4で各エリアの分類結果に基づいて、各エリアの関連性を判断する。たとえば、MFP100は、「社名」に分類されたエリア504と「担当者」に分類されたエリア506とを関連性ある組み合わせと特定することができる。好ましくは、MFP100は、さらに、エリアの配置にも基づいて関連性を判断する。たとえば、MFP100は、「社名」に分類されたエリア504と、その近傍に配置された「担当者」に分類されたエリア506とを関連性ある組み合わせと特定することができる。
MFP100は、関連性あるエリア(この例ではエリア504およびエリア506)に対してタグを付与するなどしてグループ化する。そして、MFP100は、関連性があるとされた複数のエリアそれぞれのOCRに用いるOCR機能を異なるものとするように、OCR機能を決定し(ステップ#5)、OCR処理を実行させる(ステップ#6)。たとえば、上記の例では、MFP100はエリア504およびエリア506それぞれのOCR処理に利用するOCR機能を異なるOCR機能と決定する。異なるOCR機能とは、エリア504とエリア506とのそれぞれに対して異なる提供元である第1のサーバーの提供するOCR機能と第2のサーバーの提供するOCR機能とを利用することであってもよいし、第1のサーバーの提供する同一のOCR機能をエリア504とエリア506とのそれぞれに対して異なるタイミングで利用することであってもよい。
このように、MFP100は、関連性があると判断されたエリアに対して異なるOCR機能を利用するので、たとえば社名と担当者とに対して異なるOCR機能を利用することになる。そのため、複数の情報の間の関連性が分断される。つまり、同一の機会に同一のサーバーの提供するOCR機能において、たとえば社名および担当者などの関連性のある情報がOCR処理されることがない。そのため、当該ドキュメントの内容の漏えいを効果的に防止することができる。
なお、MFP100は、関連性の有無のみならず、関連性の度合を判断してもよい。すなわち、MFP100は予め分類ごとに関連性の度合を記憶しておき、レイアウト分析の結果である各エリアの分類に応じて、エリア間の関連性の度合を判断することができる。この場合、MFP100は、エリア間の関連性の度合に応じて各エリアに用いるOCR機能を決定してもよい。すなわち、MFP100は、エリア間の関連性が所定度以上である場合に異なるOCR機能を利用すると決定し、上記所定度に満たない場合には同一のOCR機能を利用してもよいと決定してもよい。または、OCR機能にセキュリティーレベルが設定されている場合、MFP100は、エリア間の関連性が所定度以上である場合にはこれらエリアそれぞれに対してセキュリティーレベルの高い、それぞれ異なるOCR機能を利用する、と決定してもよい。
さらに、MFP100は、スキャン画像のエリアごとにセキュリティーレベルが設定されている場合、当該エリアのセキュリティーレベルもさらに考慮して利用するOCR機能を決定してもよい。つまり、好ましくはMFP100は、エリアに設定されたセキュリティーレベルが高い場合には、セキュリティーレベルの高いOCR機能を利用すると決定する。
エリアごとのセキュリティーレベルは、予めドキュメントの作成者が設定してもよいし、フォーマットに関連付けてメモリーに登録されていてもよいし、予めMFP100がキーワードに応じたセキュリティーレベルを記憶しておき、当該エリアから検出されたキーワードに基づいて判断してもよい。
一方、上記ステップ#3のレイアウト解析によって「特殊文字列」と分類されたエリア504については、MFP100はさらに小エリアに分割し、各小エリアの処理に利用するOCR機能を異なるOCR機能に決定する。または、OCR機能にセキュリティーレベルが設定されている場合、MFP100は「特殊文字列」と分類されたエリア504に対して、特殊文字列に分類されていないエリアに対して利用するOCR機能よりもセキュリティーレベルの高いOCR機能を利用すると決定する。
「特殊文字列」と分類されたエリアに記載された内容はレイアウト解析では不明であるため、他のエリアに対する関連性が判断不能である。MFP100が「特殊文字列」と分類されたエリアに対して上記のように利用するOCR機能を決定することで、当該エリアの内容の漏えいをより効果的に防止することができる。
また、他の例として上記のようにして「住所」と分類されたエリア505,508についても、MFP100は、さらに小エリアに分類し、各小エリアの処理に利用するOCR機能を異なるOCR機能に決定するようにしてもよい。すなわち、MFP100は、特定の分類に対しては、さらに小エリアに分類し、各小エリアの処理に利用するOCR機能を異なるOCR機能に決定するようにしてもよい。このようにすることで、当該エリアの内容の漏えいをより効果的に防止することができる。
MFP100は、各OCR機能からOCR処理の結果であるテキスト情報を受け取り、それらを統合することで(ステップ#7)、ドキュメントの内容を得ることができる。
なお、MFP100は、OCR機能にセキュリティーレベルが設定されている場合、さらに、スキャン画像に対して設定されているセキュリティーレベルもさらに考慮してOCR機能を決定してもよい。すなわち、スキャン画像に対して高いセキュリティーレベルが設定されている場合、MFP100は、最も高いセキュリティーレベルが設定されているOCR機能を用いると決定することができる。最もセキュリティーレベルの高いOCR機能としては、当該MFP100自身に搭載されているOCR機能が挙げられる。一方、スキャン画像に対して設定されているセキュリティーレベルが低い場合には、MFP100は、上記のようにエリア間の関連性の度合を考慮することなく、スキャン画像全体に対していずれかのOCR機能を利用すると決定してもよい。このようにすることで、処理を効率化、高速化することができる。従って、FMP100は、スキャン画像に対して設定されているセキュリティーレベルが所定範囲の場合にのみ、上記のようにレイアウト分析の結果抽出されたエリア間の関連性の度合に応じて利用するOCR機能を決定するようにしてもよい。
好ましくは、MFP100は、エリアごとに決定した利用するOCR機能をOCR情報として、ドキュメントのフォーマットに関連付けてメモリーに記憶する。たとえば、図3の例の場合、MFP100は、ドキュメントのフォーマット「請求書」に関連付けて、エリア501〜517それぞれの分類や利用するOCR機能をメモリーに記憶する。そして、次回の処理でレイアウト解析の結果、処理対象のスキャン画像がフォーマット「請求書」のものであると判断されると、MFP100はメモリーから当該フォーマット「請求書」に関連付けられたOCR情報を読み出して処理対象のスキャン画像に適用する。このようにすることで、2回目以降の処理において利用するOCR機能を決定する処理を高速化することができる。従って、好ましくは、MFP100は、スキャン画像がページ単位で分けられたものである場合、つまり、ドキュメントが複数ページからなるものである場合、ページ単位でレイアウト解析を実行して当該ページのフォーマットを特定し、当該フォーマットに関連付けられたOCR情報がメモリーに登録されているか否かを確認する。
<機能構成>
図4は、MFP100が上記の動作を行なうための機能構成の具体例を表わしたブロック図である。図4の各機能は、MFP100のCPU10がROM11に記憶されているプログラムをRAM12上に読み出して実行することで、主に、CPU10で実現される。しかしながら、少なくとも一部機能が、図1に表わされた他の構成、または図示されない電気回路などの他のハードウェア構成によって実現されてもよい。
図4を参照して、メモリーの一例としてのHDD13は、ドキュメントのフォーマットに関連付けてエリアごとに利用すると決定されたOCR機能を表わした情報であるOCR情報を記憶するための記憶領域であるOCR情報記憶部131を含む。
さらに図4を参照して、CPU10は、スキャナー14やネットワークコントローラー17を介して他の装置からスキャン画像の入力を受け付けるための入力部101と、入力されたスキャン画像に対してOCR処理することで得られるテキストデータを取得するためのOCR処理部102と、スキャン画像に対してOCR処理を実行するためのOCR実行部103と、OCR処理部102でのOCR機能の利用を制御するための制御部104とを含む。好ましくは、入力部101は、スキャン画像に対してセキュリティーレベルを設定するための設定部109を含む。
制御部104は、スキャン画像のレイアウト解析を行なうための解析部105と、解析されたレイアウトに基づいてスキャン画像から文字(または文字列)を含むエリアを抽出するための抽出部106と、抽出されたエリア間の関連性の度合(関連性の有無を含む)を判断するための判断部107と、判断されたエリア間の関連性の度合に基づいて各エリアのOCR処理に利用するOCR機能を決定するための決定部108とを含む。
決定部108で決定したエリアごとに利用するOCR機能は、当該ドキュメントのレイアウトに関連付けてOCR情報としてOCR情報記憶部131に記憶される。また、解析部105で解析されたレイアウトから特定されるドキュメントのフォーマットに関連付けられたOCR情報がOCR情報記憶部131に記憶されている場合、制御部104はOCR情報記憶部131から街頭するOCR情報を読み出す。この場合、決定部108は、OCR情報に基づいて各エリアに利用するOCR機能を決定する。
判断部107は、各エリアに含まれるキーワードに基づいて関連性の度合を判断する。好ましくは、判断部107は、さらに、スキャン画像における各エリアの配置も考慮して関連性の度合を判断する。
決定部108は、エリア間の関連性の度合が所定度合以上である場合に、各エリアに対して異なるOCR機能を利用すると決定する。異なるOCR機能とは、それぞれ異なる提供元から提供されるOCR機能であってもよいし、同一のOCR機能を異なるタイミングで利用することであってもよい。
なお、判断部107において関連性の度合が判断不能であったエリアについては、好ましくは決定部108は、当該エリアをさらに複数のエリアに分割してそれぞれ異なるOCR機能を利用すると決定する。
<動作フロー>
図5は、MFP100での動作の流れを表わすフローチャートである。図5のフローチャートに表わされた動作は、MFP100のCPU10がROM11に記憶されているプログラムをRAM12上に読み出して実行し、図4の各機能を発揮させることによって実現される。
図5を参照して、CPU10は、スキャン画像の入力を受け付けると(ステップS101でYES)、当該スキャン画像にセキュリティーレベルが設定されているか否かを確認する。入力されたスキャン画像に対して高いセキュリティーレベル、または低いセキュリティーレベルが設定されている場合、または、セキュリティーレベルの設定のない場合(ステップS103でNO)、CPU10は、以降の、エリアごとに異なるOCR機能を利用するための処理を行なうことなく、所定のOCR機能を利用すると決定し(ステップS125)、OCR処理を実行する(ステップS127)。すなわち、スキャン画像のセキュリティーレベルが所定レベルよりも高い場合には、CPU10は、当該スキャン画像のすべてのエリアに対して、たとえばMFP100に搭載されているOCR機能など、セキュリティーレベルの高いOCR機能を利用すると決定する。スキャン画像のセキュリティーレベルが所定レベルよりも低い場合、またはセキュリティーレベルが設定されていない場合には、CPU10は、当該スキャン画像のすべてのエリアに対して、予め規定されたOCR機能を利用すると決定する。
入力されたスキャン画像に設定されているセキュリティーレベルが所定範囲である場合(ステップS103でYES)、CPU10は、スキャン画像に対してレイアウト解析を行なって、当該スキャン画像の元のドキュメントのレイアウトを特定して、文字を含んでいるエリアを抽出する(ステップS105)。
特定されたレイアウトから得られるフォーマットに関連付けてOCR情報がメモリーに記憶されている場合(ステップS107でYES)、CPU10は、以下の処理に替えて、メモリーから街頭するOCR情報を読み出すことで(ステップS109)、エリアごとの利用するOCR機能を決定し(ステップS125)、OCR処理を実行する(ステップS127)。
メモリーにOCR情報が登録されていない場合(ステップS107でNO)、CPU10は、エリアごとに利用するOCR機能を決定する処理を実行する。すなわち、CPU10は、上記ステップS105のレイアウト解析によって抽出されたエリアごとにOCR処理を実行して(ステップS111)、当該エリアに予め規定したキーワードが含まれているか否かを検索する(ステップS113)。その結果、当該エリアにキーワードが含まれる場合には(ステップS115でYES)、CPU10は、含まれるキーワードに応じて当該エリアを分類する(ステップS117)。当該エリアにいずれのキーワードも含まれない場合には(ステップS115でNO)、CPU10は、当該エリアを「特殊文字列」に分類する(ステップS119)。
CPU10は、以上のステップS111〜S119の処理を抽出されたすべてのエリアに対して実行する。そして、すべてのエリアに対して処理が終了すると(ステップS121でNO)、CPU10は、各エリアの分類結果に基づいて各エリアの関連性を判断する。すなわち、CPU10は、各エリアの分類結果に応じて関連性あるエリアのグループを特定して、タグを付与するなどしてグループ化する(ステップS123)。このとき、CPU10は、さらに各エリアの配置も考慮して関連性あるエリアのグループを特定してもよい。
CPU10は、関連性があるとグループ化された複数のエリアそれぞれに利用するOCR機能を異なるものとするように、各エリアに対して利用するOCR機能を決定する(ステップS125)。また、上記ステップS119で「特殊文字列」と分類されたエリアに対しては、CPU10はさらに当該エリアを小エリアに分割し、各小エリアそれぞれに利用するOCR機能を異なるものとするように、各小エリアに対して利用するOCR機能を決定する。
CPU10は、スキャン画像のうちの対象のエリアのみを、当該エリアのOCR処理に利用すると決定されたOCR機能を提供するサーバー300に渡して、OCR処理を実行させる(ステップS127)。
CPU10は、利用したOCR機能ごとに、当該OCR機能を提供するサーバー300から処理結果であるテキストを受け付ける。そして、それらをエリアの配置に基づいて統合することで(ステップS129)、スキャン画像の内容を得る。
なお、上記ステップS101で入力されたスキャン画像がページ単位に分けられたものであった場合、CPU10は、ページごとに上記ステップS103〜S129を繰り返す。これによって、CPU10は、ページ単位でレイアウト解析を行ない、当該レイアウトから得られたフォーマットに関連付けられたOCR情報がメモリーに登録されている場合には、(以降のエリアごとにOCR機能を決定する処理を行なうことなく)登録されているOCR情報を利用してOCR機能を決定して処理を実行させることができる。
<実施の形態の効果>
以上の処理がMFP100において実行されることで、MFP100では、セキュリティーを確保しつつ外部装置の提供するOCR機能も利用することができる。すなわち、本実施の形態にかかるMFP100を利用すると、たとえば住所と社名、商品名と単価など、関連性の度合の高い内容を含むエリアがそれぞれ異なるOCR機能を利用してOCR処理がなされる。そのため、たとえ当該OCR機能を提供するサーバー300を介してOCR処理結果である当該エリアの内容が漏えいした場合であっても、関連性が分断されているため、その内容の意味の漏えいは防止される。つまり、上記の例であれば、商品名のみ、または単価のみが第三者に漏えいしたとしても、「その商品の単価」として意味を構成するような内容で第三者に漏えいすることがない。そのため、すべて自身のOCR機能を利用する場合と比較して効率的にOCR処理を行なうことができる。つまり、本実施の形態にかかるMFP100では、セキュリティーを確保しつつ効率的にOCR機能を利用することができる。
さらに、本実施の形態にかかるMFP100では、いったんエリアごとに利用するOCR機能を決定すると、その結果をOCR情報として、フォーマットに関連付けてメモリーに記憶する。そして、次回以降、対象のスキャン画像をレイアウト解析してフォーマットを特定すると、当該フォーマットに関連付けて記憶されているOCR情報を読み出して利用するOCR機能を特定する。一般的に、ドキュメントをOCR処理して用いる場面はオフィス環境であることが多く、多くの場合には「請求書」や「納品書」など、フォーマットに沿って作成されたドキュメントが処理対象となる。従って、フォーマットごとにエリアごとの利用するOCR機能を予め登録しておくことで、2回目以降、処理のつどOCR機能を決定するための処理を繰り返す必要がなく、処理を高速化することができる。
<他の例1>
上記の例では、MFP100が自身の搭載するOCR機能を利用してエリアに含まれるキーワードを特定し、分類するものとしている。エリアの分類はOCR機能を利用する方法に限定されない。他の例として、予め管理者等の特定のユーザーやドキュメントの作成者によってエリアごとに分類され、当該分類を表わすタグ等が付与されていてもよい。さらには、予め管理者等の特定のユーザーやドキュメントの作成者によってフォーマットごとのOCR情報が登録されていてもよい。さらには、そのOCR情報は、MFP100のメモリーのみならず、(サーバー300等の)他の記憶装置に登録され、MFP100が当該記憶装置にアクセスしてOCR情報を読み出すようにしてもよい。または、スキャン画像にOCR情報が付加されていてもよい。
<他の例2>
なお、以上の例では、本実施の形態にかかる画像処理装置がMFPであるものとし、さらに、当該MFP自身もOCR機能を搭載するものとしている。しかしながら、画像処理装置はMFPに限定されない。画像処理装置の他の例として、たとえば、汎用のコンピューターやいわゆるタブレットなどと呼ばれる端末装置であってもよい。つまり、OCR機能を提供するサーバー300と通信可能であって、画像データを処理対象のデータとして取扱い可能な装置であればいかなる装置であってもよい。
上記のように画像処理装置が自身がOCR機能を搭載しない場合には、画像処理装置は上記の例のように予めエリアに対して設定された分類を表わす情報に基づいて、当該エリアに対して利用するOCR機能を決定することができる。
<他の例3>
さらに、上述の処理をMFP100や他の装置である画像処理装置に実行させるためのプログラムを提供することもできる。プログラムを提供することで、汎用のMFPやコンピューターを本実施の形態にかかる画像処理装置として機能させることができる。
このようなプログラムは、コンピューターに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM、RAMおよびメモリカードなどのコンピューター読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピューターに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
なお、本発明にかかるプログラムは、コンピューターのオペレーティングシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。
また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
10 CPU、11 ROM、12 RAM、13 HDD、14 スキャナー、15 プリンター、16 操作パネル、17 ネットワークコントローラー、100 MFP、101 入力部、102 OCR処理部、103 OCR実行部、104 制御部、105 解析部、106 抽出部、107 判断部、108 決定部、109 設定部、131 OCR情報記憶部、300 サーバー、501〜517 エリア。

Claims (13)

  1. スキャン画像を処理可能な画像処理装置であって、
    前記スキャン画像の入力を受け付けるための入力手段と、
    OCR(Optical Character Reader)機能を利用して、前記スキャン画像に対してOCR処理することで得られるテキストデータを取得するためのOCR処理手段と、
    前記OCR処理手段での前記OCR機能の利用を制御するための制御手段とを備え、
    前記制御手段は、前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するための判断手段を含み、
    前記第1のエリアと前記第2のエリアとの関連性の度合が所定度合以上である場合に、前記制御手段は、前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する、画像処理装置。
  2. 前記OCR処理手段がそれぞれ異なる提供元から提供される複数のOCR機能を利用可能である場合、前記制御手段は、前記第1のエリアと前記第2のエリアとのそれぞれに対して、それぞれ異なる提供元から提供されるOCR機能を利用してOCR処理を行なうよう制御する、請求項1に記載の画像処理装置。
  3. 前記制御手段は、前記第1のエリアと前記第2のエリアとのそれぞれに対して、同一の提供元から提供される同一のOCR機能を異なるタイミングで利用してOCR処理を行なうよう制御する、請求項1に記載の画像処理装置。
  4. 前記判断手段は、前記第1のエリアおよび前記第2のエリアに含まれるキーワードに基づいて関連性の度合を判断する、請求項1〜3のいずれかに記載の画像処理装置。
  5. 前記判断手段は、前記スキャン画像における前記第1のエリアと前記第2のエリアとのそれぞれの配置に基づいて関連性の度合を判断する、請求項1〜3のいずれかに記載の画像処理装置。
  6. 前記判断手段において前記第1のエリアの前記第2のエリアに対する関連性が判断不能な場合に、前記制御手段は前記第1のエリアをさらに複数のエリアに分割し、それぞれ異なるOCR機能を利用してOCR処理を行なうよう制御する、請求項1〜5のいずれかに記載の画像処理装置。
  7. レイアウトごとに、当該レイアウトに含まれるエリアごとに用いるOCR機能を記憶しておくための記憶領域を有するメモリーをさらに備え、
    前記制御手段は、前記スキャン画像のレイアウトが前記記憶領域に記憶されているレイアウトに該当する場合に、前記記憶領域に記憶されているOCR機能を利用して前記スキャン画像のOCR処理を行なうように制御する、請求項1〜6のいずれかに記載の画像処理装置。
  8. 前記制御手段は、前記スキャン画像に設定されているセキュリティーレベルが所定範囲である場合に、前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する、請求項1〜7のいずれかに記載の画像処理装置。
  9. 前記入力手段は、前記スキャン画像に対してセキュリティーレベルを設定するための設定手段を含む、請求項8に記載の画像処理装置。
  10. 前記制御手段は、さらに、前記スキャン画像から抽出されるエリアに対して設定されているセキュリティーレベルと、前記OCR処理手段で利用可能なOCR機能のセキュリティーレベルとに基づいて、前記エリアに対して用いるOCR機能を決定する、請求項1〜9のいずれかに記載の画像処理装置。
  11. 前記スキャン画像はページ単位で分けられ、
    前記制御手段は、前記スキャン画像のページごとのレイアウトに基づいて、前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうよう制御する、請求項1〜10のいずれかに記載の画像処理装置。
  12. スキャン画像の処理方法であって、
    前記スキャン画像の入力を受け付けるステップと、
    前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するステップと、
    OCR機能を利用して、前記スキャン画像に対してOCR処理することで得られるテキストデータを取得するステップとを備え、
    前記テキストデータを取得するステップは、前記第1のエリアと前記第2のエリアとの関連性の度合が所定度合以上である場合に前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうステップを含む、画像処理方法。
  13. コンピューターにスキャン画像の処理を実行させるプログラムであって、
    前記スキャン画像の入力を受け付けるステップと、
    前記スキャン画像のレイアウトに基づいて前記スキャン画像から抽出された第1のエリアと第2のエリアとの関連性の度合を判断するステップと、
    OCR機能を利用して、前記スキャン画像に対してOCR処理することで得られるテキストデータを取得するステップとを前記コンピューターに実行させ、
    前記テキストデータを取得するステップは、前記第1のエリアと前記第2のエリアとの関連性の度合が所定度合以上である場合に前記第1のエリアと前記第2のエリアとのそれぞれに対して異なるOCR機能を利用してOCR処理を行なうステップを含む、画像処理プログラム。
JP2014080155A 2014-04-09 2014-04-09 画像処理装置、画像処理方法、および画像処理プログラム Active JP6303742B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014080155A JP6303742B2 (ja) 2014-04-09 2014-04-09 画像処理装置、画像処理方法、および画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014080155A JP6303742B2 (ja) 2014-04-09 2014-04-09 画像処理装置、画像処理方法、および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2015201077A JP2015201077A (ja) 2015-11-12
JP6303742B2 true JP6303742B2 (ja) 2018-04-04

Family

ID=54552279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014080155A Active JP6303742B2 (ja) 2014-04-09 2014-04-09 画像処理装置、画像処理方法、および画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6303742B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021070167A (ja) * 2019-10-29 2021-05-06 株式会社寺岡精工 ラベル情報処理装置、ラベル情報処理方法、及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4510371B2 (ja) * 1998-01-28 2010-07-21 大和コンピューターサービス株式会社 文書・情報入力システム
JP2002074263A (ja) * 2000-08-28 2002-03-15 Oki Electric Ind Co Ltd ファクシミリ文字読取システム
JP2002269497A (ja) * 2001-03-07 2002-09-20 Ricoh Co Ltd 文書入力代行方法、文書入力代行システム及び記録媒体
JP2006079190A (ja) * 2004-09-07 2006-03-23 Japan Medical Data Center Co Ltd 光学式文字読取装置
JP4747591B2 (ja) * 2005-01-31 2011-08-17 日本電気株式会社 機密文書検索システム、機密文書検索方法、および機密文書検索プログラム
JP4274375B2 (ja) * 2005-03-04 2009-06-03 株式会社アイデック データエントリーシステム
JP5382059B2 (ja) * 2011-05-11 2014-01-08 コニカミノルタ株式会社 画像処理システム、画像処理装置およびプログラム

Also Published As

Publication number Publication date
JP2015201077A (ja) 2015-11-12

Similar Documents

Publication Publication Date Title
US12019675B2 (en) Recognizing text in image data
US9626555B2 (en) Content-based document image classification
US10817615B2 (en) Method and apparatus for verifying images based on image verification codes
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP5353148B2 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
US8838657B1 (en) Document fingerprints using block encoding of text
JP2010073114A6 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
JP2004334334A (ja) 文書検索装置、文書検索方法及び記憶媒体
US10142499B2 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
US10057449B2 (en) Document analysis system, image forming apparatus, and analysis server
US20060285748A1 (en) Document processing device
JP5962449B2 (ja) 判定プログラム、判定方法及び判定装置
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
JP2005151127A5 (ja)
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2021149439A (ja) 情報処理装置及び情報処理プログラム
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2006085234A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP7172343B2 (ja) 文書検索用プログラム
JP2007334670A (ja) 画像処理装置、方法及びプログラム
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP2004280514A (ja) Pdfファイル及びpdfファイル作成システム
JP2014044555A (ja) 画像処理装置、画像処理システム及びプログラム
JP2006092226A (ja) 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JP2009223391A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170123

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180219

R150 Certificate of patent or registration of utility model

Ref document number: 6303742

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150