JP6107756B2 - 電子文書生成システム、電子文書生成装置およびプログラム - Google Patents

電子文書生成システム、電子文書生成装置およびプログラム Download PDF

Info

Publication number
JP6107756B2
JP6107756B2 JP2014143605A JP2014143605A JP6107756B2 JP 6107756 B2 JP6107756 B2 JP 6107756B2 JP 2014143605 A JP2014143605 A JP 2014143605A JP 2014143605 A JP2014143605 A JP 2014143605A JP 6107756 B2 JP6107756 B2 JP 6107756B2
Authority
JP
Japan
Prior art keywords
processing
electronic document
area
character
character area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014143605A
Other languages
English (en)
Other versions
JP2016021088A (ja
Inventor
匡晃 坂
匡晃 坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2014143605A priority Critical patent/JP6107756B2/ja
Priority to CN201510402487.0A priority patent/CN105260996B/zh
Priority to US14/797,690 priority patent/US9473669B2/en
Publication of JP2016021088A publication Critical patent/JP2016021088A/ja
Application granted granted Critical
Publication of JP6107756B2 publication Critical patent/JP6107756B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32502Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device in systems having a plurality of input or output devices
    • H04N1/32545Distributing a job or task among a plurality of input devices or a plurality of output devices
    • H04N1/3255Hybrid jobs, i.e. performing different parts of the same job on different devices, e.g. colour and B/W pages on different devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3876Recombination of partial images to recreate the original image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Facsimiles In General (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Discrimination (AREA)

Description

本発明は、電子文書を生成する電子文書生成システムおよびそれに関連する技術に関する。
MFP(マルチ・ファンクション・ペリフェラル(Multi-Functional Peripheral))などの画像形成装置において、原稿をスキャンして電子文書を作成する技術が存在する。
このような電子文書生成技術においては、スキャン画像内の文字領域と非文字領域(写真領域等)とを分離し、非文字領域を比較的高い圧縮率で圧縮するとともに文字領域を比較的低い圧縮率で圧縮することによって、電子文書(たとえばコンパクトPDF)を生成する技術が存在する(特許文献1等参照)。これによれば、文字の見易さを維持しつつ電子文書ファイルの容量を低減する(コンパクト化する)ことが可能である。
また、テキストデータ付き電子文書(次述)を生成する技術も存在する(特許文献2等参照)。具体的には、原稿のスキャン画像(特に文字を示す画像)に対して光学文字認識処理(以下、OCR(Optical Character Recognition)処理とも称する)が施され、当該スキャン画像内の文字のテキストデータが自動認識され、当該テキストデータが非表示状態で当該スキャン画像に重畳して埋め込まれる。このようにして、たとえば、透明テキスト付きPDF(Portable Document Format)(あるいはサーチャブルPDF)などと呼ばれる所定形式の電子文書(テキストデータ付き電子文書)が生成される。
また、コンパクト化(高圧縮化)され且つサーチャブル化された電子文書(たとえば、サーチャブルコンパクトPDFファイルなどとも称される)を生成する技術も存在する。当該技術では、コンパクト化のための一連のサブ処理(領域分離処理および圧縮処理等)で構成される処理(コンパクト化処理とも称する)と、サーチャブル化のためのOCR処理(サーチャブル化処理とも称する)とが行われ、両処理の結果に基づいて、電子文書が生成される。
特開2008−193234号公報 特開2012−073749号公報
ところで、スキャン画像に基づいて電子文書を生成する装置(電子文書生成装置)が、上述の一連のサブ処理で構成される処理(コンパクト化処理)に加えてOCR処理(サーチャブル化処理)をも行うのではなく、OCR処理を当該電子文書生成装置とは別の装置(連携先装置とも称する)に実行させることが考えられる。より詳細には、電子文書生成装置は、まず当該一連のサブ処理を実行し、その後にOCR処理を連携先装置(クラウドサーバ等)に行わせ、当該連携先装置から受信したOCR結果を利用して電子文書を生成することが考えられる。
しかしながら、このような処理においては、一連のサブ処理が連続的に実行されて完了された後に、当該一連のサブ処理とは別個の処理であるOCR処理が更に実行される。そのため、当該一連のサブ処理が終了するまでは、OCR処理を連携先装置が実行することができず、効率的な処理を行うことができない。
そこで、この発明は、複数の装置で連携して電子文書を生成する技術において、より効率的に電子文書を生成することが可能な技術を提供することを課題とする。
上記課題を解決すべく、請求項1の発明は、電子文書を生成する電子文書生成システムであって、原稿のスキャン画像に基づき電子文書を生成するための処理として、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から非文字領域を分離する非文字領域分離処理と前記文字領域に対する第1の圧縮処理と前記非文字領域に対する第2の圧縮処理とを含む第1の処理を実行する第1の装置と、記電子文書を生成するための処理として、前記文字領域に関する光学文字認識処理を含む第2の処理を前記第1の装置からの依頼に基づいて実行し、当該第2の処理の処理結果を前記第1の装置に送信する第2の装置と、を備え、前記第1の装置は、前記第1の処理を実行する処理実行手段であって、前記第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記第2の装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行する処理実行手段と、前記処理実行手段によって実行される前記残余の処理の少なくとも一部と並列的に前記第2の装置により実行された前記第2の処理の処理結果を前記第2の装置から受信する受信手段と、前記文字領域と前記非文字領域とをそれぞれ互いに異なる圧縮率で圧縮した各画像を有し且つ前記光学文字認識処理の処理結果に係るテキストデータを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果とに基づいて生成する生成手段と、を備えることを特徴とする。
請求項2の発明は、電子文書を生成する電子文書生成システムであって、原稿のスキャン画像に基づき電子文書を生成するための処理として、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から写真領域を分離して写真領域画像データを生成する写真領域分離処理とを含む第1の処理を実行する第1の装置と、前記電子文書を生成するための処理として、前記文字領域に関する光学文字認識処理を含む第2の処理を前記第1の装置からの依頼に基づいて実行し、当該第2の処理の処理結果を前記第1の装置に送信する第2の装置と、を備え、前記第1の装置は、前記第1の処理を実行する処理実行手段であって、前記第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記第2の装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行する処理実行手段と、前記処理実行手段によって実行される前記残余の処理の少なくとも一部と並列的に前記第2の装置により実行された前記第2の処理の処理結果を前記第2の装置から受信する受信手段と、前記写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果とに基づいて生成する生成手段と、を備えることを特徴とする。
請求項3の発明は、請求項2の発明に係る電子文書生成システムにおいて、前記第1の装置からの依頼に基づいて、前記電子文書を生成するための第3の処理を実行し、当該第3の処理の処理結果を前記第1の装置に送信する第3の装置、をさらに備え、前記第1の処理は、前記文字領域とも前記写真領域とも異なる特定種類の領域を前記スキャン画像から分離する特定領域分離処理をさらに含み、前記第3の処理は、複数の個別写真領域を含む前記写真領域画像データから前記複数の個別写真領域をそれぞれ切り出す個別領域切出処理を含み、前記処理実行手段は、前記第3の処理で利用される前記写真領域画像データを前記複数のサブ処理のうち前記写真領域分離処理において生成すると、前記写真領域画像データを前記第3の装置に送信するとともに、前記複数のサブ処理のうち前記写真領域分離処理よりも後に行われる残余の処理を引き続いて実行し、前記受信手段は、前記写真領域分離処理よりも後に行われる前記残余の処理の少なくとも一部と並列的に前記第3の装置により実行された前記第3の処理の処理結果を前記第3の装置から受信し、前記生成手段は、前記特定種類の領域と前記複数の個別写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果と前記受信手段によって受信された前記第3の処理の処理結果とに基づいて生成することを特徴とする。
請求項4の発明は、請求項1ないし請求項3のいずれかの発明に係る電子文書生成システムにおいて、前記第1の装置は、情報端末であり、前記第2の装置は、サーバであることを特徴とする。
請求項5の発明は、請求項1ないし請求項3のいずれかの発明に係る電子文書生成システムにおいて、前記第1の装置は、画像形成装置であり、前記第2の装置は、サーバであることを特徴とする。
請求項6の発明は、請求項1ないし請求項3のいずれかの発明に係る電子文書生成システムにおいて、前記第1の装置は、画像形成装置であり、前記第2の装置は、情報端末であることを特徴とする。
請求項7の発明は、連携先装置と連携して電子文書を生成する電子文書生成装置であって、原稿のスキャン画像に基づき電子文書を生成するための処理として、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から非文字領域を分離する非文字領域分離処理と前記文字領域に対する第1の圧縮処理と前記非文字領域に対する第2の圧縮処理とを含む第1の処理を実行する処理実行手段であって、前記連携先装置にて実行される第2の処理であり且つ前記文字領域に関する光学文字認識処理を含む第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記連携先装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行する処理実行手段と、前記処理実行手段によって実行される前記残余の処理の少なくとも一部と並列的に前記連携先装置により実行された前記第2の処理の処理結果を前記連携先装置から受信する受信手段と、前記文字領域と前記非文字領域とをそれぞれ互いに異なる圧縮率で圧縮した各画像を有し且つ前記光学文字認識処理の処理結果に係るテキストデータを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果とに基づいて生成する生成手段と、を備えることを特徴とする。
請求項8の発明は、連携先装置と連携して電子文書を生成する電子文書生成装置であって、原稿のスキャン画像に基づき電子文書を生成するための処理として、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から写真領域を分離して写真領域画像データを生成する写真領域分離処理とを含む第1の処理を実行する処理実行手段であって、前記連携先装置にて実行される第2の処理であり且つ前記文字領域に関する光学文字認識処理を含む第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記連携先装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行する処理実行手段と、前記処理実行手段によって実行される前記残余の処理の少なくとも一部と並列的に前記連携先装置により実行された前記第2の処理の処理結果を前記連携先装置から受信する受信手段と、前記写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果とに基づいて生成する生成手段と、を備えることを特徴とする。
請求項9の発明は、請求項8の発明に係る電子文書生成装置において、前記処理実行手段は、前記電子文書を生成するための第3の処理を、前記連携先装置とは別の連携先装置に依頼し、前記第1の処理は、前記文字領域とも前記写真領域とも異なる特定種類の領域を前記スキャン画像から分離する特定領域分離処理をさらに含み、前記第3の処理は、複数の個別写真領域を含む前記写真領域画像データから前記複数の個別写真領域をそれぞれ切り出す個別領域切出処理を含み、前記処理実行手段は、前記第3の処理で利用される前記写真領域画像データを前記複数のサブ処理のうち前記写真領域分離処理において生成すると、前記写真領域画像データを前記別の連携先装置に送信するとともに、前記複数のサブ処理のうち前記写真領域分離処理よりも後に行われる残余の処理を引き続いて実行し、前記受信手段は、前記写真領域分離処理よりも後に行われる前記残余の処理の少なくとも一部と並列的に前記別の連携先装置により実行された前記第3の処理の処理結果を前記別の連携先装置から受信し、前記生成手段は、前記特定種類の領域と前記複数の個別写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果と前記受信手段によって受信された前記第3の処理の処理結果とに基づいて生成することを特徴とする。
請求項10の発明は、請求項7ないし請求項9のいずれかの発明に係る電子文書生成装置において、前記電子文書生成装置は、情報端末であることを特徴とする。
請求項11の発明は、請求項7ないし請求項9のいずれかの発明に係る電子文書生成装置において、前記電子文書生成装置は、画像形成装置であることを特徴とする。
請求項12の発明は、連携先装置と連携して電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、a)原稿のスキャン画像に基づき電子文書を生成するための第1の処理であって、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から非文字領域を分離する非文字領域分離処理と前記文字領域に対する第1の圧縮処理と前記非文字領域に対する第2の圧縮処理とを含む第1の処理を開始するステップと、b)前記連携先装置にて実行される第2の処理であって前記文字領域に関する光学文字認識処理を含む第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記連携先装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行するステップと、c)前記ステップb)において実行される前記残余の処理の少なくとも一部と並列的に前記連携先装置により実行された前記第2の処理の処理結果を前記連携先装置から受信するステップと、d)前記文字領域と前記非文字領域とをそれぞれ互いに異なる圧縮率で圧縮した各画像を有し且つ前記光学文字認識処理の処理結果に係るテキストデータを有する前記電子文書を、前記電子文書生成装置による前記第1の処理の処理結果と前記ステップc)にて受信された前記第2の処理の処理結果とに基づいて生成するステップと、を実行させるためのプログラムであることを特徴とする。
請求項13の発明は、連携先装置と連携して電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、a)原稿のスキャン画像に基づき電子文書を生成するための第1の処理であって、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から写真領域を分離して写真領域画像データを生成する写真領域分離処理とを含む第1の処理を開始するステップと、b)前記連携先装置にて実行される第2の処理であって前記文字領域に関する光学文字認識処理を含む第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記連携先装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行するステップと、c)前記ステップb)において実行される前記残余の処理の少なくとも一部と並列的に前記連携先装置により実行された前記第2の処理の処理結果を前記連携先装置から受信するステップと、d)前記写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記電子文書生成装置による前記第1の処理の処理結果と前記ステップc)にて受信された前記第2の処理の処理結果とに基づいて生成するステップと、を実行させるためのプログラムであることを特徴とする。
請求項14の発明は、請求項13の発明に係るプログラムにおいて、前記ステップb)においては、前記電子文書を生成するための第3の処理が、前記連携先装置とは別の連携先装置に依頼され、前記第1の処理は、前記文字領域とも前記写真領域とも異なる特定種類の領域を前記スキャン画像から分離する特定領域分離処理をさらに含み、前記第3の処理は、複数の個別写真領域を含む前記写真領域画像データから前記複数の個別写真領域をそれぞれ切り出す個別領域切出処理を含み、前記ステップb)においては、前記第3の処理で利用される前記写真領域画像データが前記複数のサブ処理のうち前記写真領域分離処理において生成されると、前記写真領域画像データが前記別の連携先装置に送信されるとともに、前記複数のサブ処理のうち前記写真領域分離処理よりも後に行われる残余の処理が引き続いて実行され、前記プログラムは、e)前記写真領域分離処理よりも後に行われる前記残余の処理の少なくとも一部と並列的に前記別の連携先装置により実行された前記第3の処理の処理結果を前記別の連携先装置から受信するステップ、を前記コンピュータにさらに実行させ、前記ステップd)においては、前記特定種類の領域と前記複数の個別写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書が、前記電子文書生成装置による前記第1の処理の処理結果と前記ステップc)にて受信された前記第2の処理の処理結果と前記ステップe)にて受信された前記第3の処理の処理結果とに基づいて生成されることを特徴とする。
請求項15の発明は、請求項12ないし請求項14のいずれかの発明に係るプログラムにおいて、前記電子文書生成装置は、情報端末であることを特徴とする。
請求項16の発明は、請求項12ないし請求項14のいずれかの発明に係るプログラムにおいて、前記電子文書生成装置は、画像形成装置であることを特徴とする。
請求項1ないし請求項16に記載の発明によれば、第2の処理で利用されるデータが第1の処理の途中で第2の装置に送信されるので、第2の装置により実行される第2の処理は、第1の処理の完了を待つことを要することなく開始され得る。したがって、複数の装置で連携して電子文書を生成する技術において、より効率的に電子文書を生成することが可能である。
電子文書生成システムを示す図である。 画像形成装置の機能ブロックを示す図である。 外部端末の概略構成を示す機能ブロック図である。 外部端末およびクラウドサーバにおける動作を示すフローチャートである。 電子文書生成システムにおける動作の概略を示す概念図である。 スキャン画像および電子文書等を示す図である。 スキャン画像を示す図である。 第2実施形態に係る動作の概略を示す概念図である。 外部端末およびクラウドサーバにおける動作を示すフローチャートである。 第3実施形態に係る動作の概略を示す概念図である。 改変例を示す図である。 別のシステム構成を示す図である。 さらに別のシステム構成を示す図である。
以下、本発明の実施形態を図面に基づいて説明する。
<1.第1実施形態>
<1−1.構成概要>
図1は、本発明に係る電子文書生成システム1を示す図である。この電子文書生成システムは、複数の処理を複数の装置で分担して実行し、電子文書を生成するシステムである。図1に示すように、電子文書生成システム1は、画像形成装置10と外部端末50とクラウドサーバ90とを備える。
画像形成装置10と外部端末50とクラウドサーバ90とは、ネットワーク(通信ネットワーク)108を介して互いに接続される。ネットワーク108は、LAN(Local Area Network)およびインターネットなどによって構成される。また、ネットワーク108に対する接続態様は、有線接続であってもよく、或いは無線接続であってもよい。たとえば、画像形成装置10およびクラウドサーバ90はネットワーク108に対して有線接続され、外部端末50はネットワーク108に対して無線接続される。
外部端末50は、画像形成装置10で生成されたスキャン画像に基づいて電子文書を生成する装置であり、電子文書生成装置であるとも表現される。外部端末50には、電子文書生成アプリケーション110がインストールされている。外部端末50は、電子文書生成アプリケーション110を用いて、他の装置(クラウドサーバ90等)と連携して、電子文書を生成する。
クラウドサーバ90(90A,90B,...)は、画像形成装置10とも外部端末50とも異なる外部装置(外部サーバ)である。クラウドサーバ90(90A等)には、アプリケーション120(ここでは、汎用のOCR(Optical Character Recognition)アプリケーション)がインストールされている。クラウドサーバ90は、汎用的なOCR処理サービスをアプリケーション120を用いて提供するサーバである。ただし、このクラウドサーバ90(アプリケーション120)は、サーチャブルPDF(Portable Document Format)ファイルの生成処理サービスを提供しない。サーチャブルPDFファイルは、後述するように、外部端末50およびクラウドサーバ90等が協働することによって生成される。
この電子文書生成システム1においては、原稿のスキャン画像200(図5等参照)が画像形成装置10によって生成され、スキャン画像200が画像形成装置10から外部端末50に送信される。外部端末50は、画像形成装置10から受信(取得)したスキャン画像200に基づき、電子文書500(図5等参照)を生成する。当該電子文書500の生成動作は、当該外部端末50にインストールされている電子文書生成アプリケーション110を実行すること等によって実現される。
電子文書生成アプリケーション110では、一連のサブ処理で構成される処理P1(後述)が実行される。ここでは、比較的小さなファイル容量のPDFファイル(コンパクトPDF形式の電子ファイル)を生成するための処理が処理P1として実行される。具体的には、スキャン画像200から文字領域210が分離され抽出されるとともに非文字領域(背景領域等)が分離され抽出され、文字領域と非文字領域とに対してそれぞれ互いに異なる圧縮率による圧縮処理が施されるなどの処理が行われる。これにより、電子文書の容量(ファイル容量)が低減される。
また、スキャン画像200から分離された文字領域210に対しては、クラウドサーバ90(連携先装置とも称する)によって処理P1とは別の処理(連携処理とも称する)P2(ここではOCR処理)が施される。具体的には、クラウドサーバ90のアプリケーション120によって提供されるOCR処理サービスを利用して、当該文字領域210に対するOCR処理が行われる。
そして、処理P1の処理結果と処理P2の処理結果とに基づいて、外部端末50において電子文書の生成処理P5が行われる。具体的には、外部端末50の電子文書生成アプリケーション110は、外部端末50による処理P1の処理結果(圧縮された画像データ)を取得するとともに、クラウドサーバ90による文字領域210に対する処理P2の処理結果(OCR処理結果(テキストデータ))を汎用アプリケーション120から受け取る。そして、処理P1の処理結果と処理P2の処理結果とに基づいて電子文書が生成される。当該電子文書500は、テキストデータ付き電子文書(ここでは、サーチャブルコンパクトPDFファイル)として生成される。
<1−2.画像形成装置の構成>
図2は、画像形成装置10の機能ブロックを示す図である。ここでは、画像形成装置10として、MFP(マルチ・ファンクション・ペリフェラル(Multi-Functional Peripheral))を例示する。図2においては、MFP10の機能ブロックが示されている。
MFP10は、スキャン機能、コピー機能、ファクシミリ機能およびボックス格納機能などを備える装置(複合機とも称する)である。具体的には、MFP10は、図2の機能ブロック図に示すように、画像読取部2、印刷出力部3、通信部4、格納部5、操作部6およびコントローラ9等を備えており、これらの各部を複合的に動作させることによって、各種の機能を実現する。
画像読取部2は、MFP10の所定の位置に載置された原稿を光学的に読み取って(すなわちスキャンして)、当該原稿の画像データ(原稿画像ないしスキャン画像とも称する)を生成する処理部である。この画像読取部2は、スキャン部であるとも称される。
印刷出力部3は、印刷対象に関するデータに基づいて紙などの各種の媒体に画像を印刷出力する出力部である。
通信部4は、公衆回線等を介したファクシミリ通信を行うことが可能な処理部である。さらに、通信部4は、ネットワーク108を介したネットワーク通信を行うことも可能である。このネットワーク通信では、たとえば、TCP/IP(Transmission Control Protocol / Internet Protocol)等の各種のプロトコルが利用される。当該ネットワーク通信を利用することによって、MFP10は、所望の相手先(たとえば、外部端末50)との間で各種のデータを授受することが可能である。通信部4は、各種データを送信する送信部4aと各種データを受信する受信部4bとを有する。
格納部5は、ハードディスクドライブ(HDD)等の記憶装置で構成される。
操作部6は、MFP10に対する操作入力を受け付ける操作入力部6aと、各種情報の表示出力を行う表示部6bとを備えている。
このMFP10においては、略板状の操作パネル部6c(図1参照)が設けられている。また、操作パネル部6cは、その正面側にタッチパネル25(図1参照)を有している。タッチパネル25は、操作入力部6aの一部としても機能するとともに、表示部6bの一部としても機能する。タッチパネル25は、液晶表示パネルに各種センサ等が埋め込まれて構成され、各種情報を表示するとともに操作者からの各種の操作入力を受け付けることが可能である。
たとえば、タッチパネル25においては、各種の操作画面(メニュー画面等)(ボタン画像等を含む)が表示される。操作者は、タッチパネル25の操作画面内に仮想的に配置されるボタンを押下することによって、MFP10の各種動作内容を設定するとともに動作指示を付与することができる。
コントローラ9は、MFP10に内蔵され、MFP10を統括的に制御する制御装置である。コントローラ9は、CPUおよび各種の半導体メモリ(RAMおよびROM)等を備えるコンピュータシステムとして構成される。コントローラ9は、CPUにおいて、ROM(例えば、EEPROM)内に格納されている所定のソフトウエアプログラム(以下、単にプログラムとも称する)を実行することによって、各種の処理部を実現する。なお、当該プログラム(詳細にはプログラムモジュール群)は、USBメモリなどの可搬性の記録媒体、あるいはネットワーク108等を介してMFP10にインストールされてもよい。
具体的には、図2に示すように、コントローラ9は、当該プログラムの実行により、通信制御部11と入力制御部12と表示制御部13と領域判別部15とを含む各種の処理部を実現する。
通信制御部11は、他の装置(外部端末50等)との間の通信動作を通信部4等と協働して制御する処理部である。たとえば、通信制御部11は、スキャン画像等を外部端末50送信する。
入力制御部12は、操作入力部6a(タッチパネル25等)に対する操作入力動作を制御する制御部である。たとえば、入力制御部12は、タッチパネル25に表示された操作画面に対する操作入力を受け付ける動作を制御する。
表示制御部13は、表示部6b(タッチパネル25等)における表示動作を制御する処理部である。表示制御部13は、たとえば、MFP10を操作するための操作画面をタッチパネル25に表示させる。
領域判別部15は、スキャン画像200(図4参照)の領域(領域種別)を判別する処理部である。たとえば、領域判別部15は、スキャン画像200内における文字領域210と非文字領域(背景領域および写真領域等)220とを区別して判別する。
<1−3.外部端末の構成>
次に外部端末50の構成について説明する。
外部端末50は、MFP10およびクラウドサーバ90との間でのネットワーク通信が可能な情報入出力端末装置(情報端末あるいは通信端末とも称される)である。ここでは、外部端末50として、タブレット型端末を例示する。ただし、これに限定されず、外部端末50は、スマートフォンあるいはパーソナルコンピュータなどであってもよい。また、外部端末は、携帯式の装置(携帯情報端末等)(携帯端末)であってもよく、あるいは、据置型の装置であってもよい。
図3は、外部端末50の概略構成を示す機能ブロック図である。
外部端末50は、図3の機能ブロック図に示すように、通信部54、格納部55、操作部56およびコントローラ59等を備えており、これらの各部を複合的に動作させることによって、各種の機能を実現する。
通信部54は、ネットワーク108を介したネットワーク通信を行うことが可能である。このネットワーク通信では、たとえば、TCP/IP(Transmission Control Protocol / Internet Protocol)等の各種のプロトコルが利用される。当該ネットワーク通信を利用することによって、外部端末50は、所望の相手先(MFP10およびクラウドサーバ90等)との間で各種のデータを授受することが可能である。通信部54は、各種データを送信する送信部54aと各種データを受信する受信部54bとを有する。たとえば、受信部54bは、スキャン画像200を画像形成装置10から受信し、送信部54aは、スキャン画像200における文字領域210(図4参照)の画像データをクラウドサーバ90に送信する。また、受信部54bは、文字領域210に関するOCR処理結果等をクラウドサーバ90から受信する。
格納部55は、不揮発性の半導体メモリ等の記憶装置で構成され、各種の情報を格納する。
操作部56は、外部端末50に対する操作入力を受け付ける操作入力部56aと、各種情報の表示出力を行う表示部56bとを備えている。この外部端末50においては、液晶表示パネルに各種センサ等が埋め込まれて構成されたタッチパネル75(図1参照)が設けられている。具体的には、図1に示すように、略板状の外部端末50の正面側において、その周縁部(枠部)を除くほぼ全面にわたってタッチパネル75が設けられている。このタッチパネル75は、ユーザインターフェイス部として機能する。換言すれば、タッチパネル75は、操作入力部56aの一部としても機能するとともに、表示部56bの一部としても機能する。
図3のコントローラ59は、外部端末50に内蔵され、外部端末50を統括的に制御する制御装置である。コントローラ59は、CPUおよび各種の半導体メモリ(RAMおよびROM)等を備えるコンピュータシステムとして構成される。コントローラ59は、CPUにおいて、記憶部(半導体メモリ等)内に格納されている所定のソフトウエアプログラム(以下、単にプログラムとも称する)を実行することによって、各種の処理部を実現する。なお、当該プログラム(詳細にはプログラムモジュール群)は、USBメモリなどの可搬性の記録媒体、あるいはネットワーク108等を介して外部端末50にインストールされるようにしてもよい。
外部端末50には、画像形成装置10との連携処理を制御するアプリケーションプログラム(単に、アプリケーションとも称する)110がインストールされている。当該アプリケーションプログラム110が外部端末50にて実行されることによって、外部端末50は、画像形成装置10にて生成されたスキャン画像を画像形成装置10から受信するとともに、当該スキャン画像を利用して電子文書を生成する処理を実行する。
具体的には、コントローラ59は、当該アプリケーションプログラム110等の実行により、通信制御部61と入力制御部62と表示制御部63と取得部64と処理実行部65と生成部69とを含む各種の処理部を実現する。
通信制御部61は、通信部54等と協働して、MFP10およびクラウドサーバ90等との通信動作を制御する処理部である。
入力制御部62は、操作入力部56a(タッチパネル75等)に対する操作入力動作を制御する制御部である。たとえば、入力制御部62は、タッチパネル75に表示された操作画面に対するタッチ操作入力を受け付ける動作を制御する。
表示制御部63は、表示部56b(タッチパネル75等)における表示動作を制御する処理部である。表示制御部63は、たとえば、MFP10との連携処理を行うための操作画面をタッチパネル75に表示する。
なお、入力制御部62および表示制御部63は、ユーザインターフェイス制御部とも総称される。
取得部64は、MFP10で生成されたスキャン画像200(図4参照)等を取得する処理部である。取得部64は、通信部54および通信制御部61等と協働して、当該スキャン画像200等をMFP10から受信して取得する。
処理実行部65は、複数のサブ処理で構成される処理P1(後述)をスキャン画像に対して実行する処理部である。また、処理実行部65は、処理P2(後述)をクラウドサーバ90で実行させるためのデータを、クラウドサーバ90に送信する。具体的には、処理実行部65は、クラウドサーバ90で実行される処理P2(OCR処理等)で利用されるデータが、処理P1を構成する複数のサブ処理のいずれかにおいて生成されると、当該複数のサブ処理のうち未実行の残余の処理(サブ処理)が存在する段階で当該データをクラウドサーバ90に送信する。さらに、処理実行部65は、当該データの送信後において当該複数のサブ処理のうち(未実行)の残余の処理を引き続いて実行する。
生成部69は、電子文書500(図4参照)を生成する処理部である。生成部69は、処理実行部65による処理P1の処理結果(圧縮された画像データ)と通信部54および通信制御部61等によって受信された処理P2の処理結果(OCR処理結果であるテキストデータ)とに基づいて、電子文書を生成する。より具体的には、生成部69は、文字領域210についての処理結果に係るテキスト情報(文字コード群)を、スキャン画像200における文字領域210に配置して、電子文書500を生成する。また、当該電子文書500は、文字領域210と非文字領域との両領域のそれぞれに応じた圧縮率で圧縮する処理等が施された画像データ(高圧縮画像データ)に基づいて生成される。
<1−4.動作>
図4は、外部端末50およびクラウドサーバ90(90A)における動作を示すフローチャートである。外部端末50は、電子文書生成アプリケーション110を実行することによって、図4の左側に示すような処理を実行する。また、クラウドサーバ90は、アプリケーション120を実行することによって、図4の右側に示すような処理を実行する。また、図5は、電子文書生成システム1における動作の概略を示す概念図である。以下、これらの図を参照しながら、電子文書生成システム1の動作について説明する。
<スキャン画像生成等>
まず、ユーザは、スキャン対象の原稿をMFP10の原稿台(たとえば、自動給紙装置(ADF:Auto Document Feeder )あるいは原稿載置用ガラス面等)に載置する。
その後、ユーザは、外部端末50を操作することによって、電子文書500の生成指示を外部端末50およびMFP10に対して付与する。
具体的には、まず、外部端末50にインストールされているアプリケーション(電子文書生成アプリケーション)110の操作画面(不図示)において、スキャン処理を実行すべき装置が指定されるとともに、スキャン処理により最終的に生成される電子文書500の形式が指定される。ここでは、スキャン処理を実行すべき装置としてMFP10が指定され、当該電子文書500の形式として、サーチャブルコンパクトPDF(透明テキスト付きコンパクトPDF)が指定されるものとする。そして、ユーザは、電子文書生成アプリケーション110の操作画面内に表示された実行開始ボタン(電子文書500の生成処理の実行開始ボタン)を押下することにより、電子文書(ここではサーチャブルコンパクトPDF)500の生成指示を外部端末50およびMFP10に対して付与する。
なお、サーチャブルコンパクトPDF(透明テキスト付きコンパクトPDF)ファイルは、コンパクト化のための一連のサブ処理(領域分離処理および圧縮処理等)で構成される処理(コンパクト化処理)と、サーチャブル化のためのOCR処理(サーチャブル化処理とも称する)との双方が施されたPDF形式の電子文書である。また、サーチャブルコンパクトPDFファイルは、文字画像を有する画像レイヤと当該文字画像に対する文字認識結果が非表示状態で埋め込まれたテキストレイヤとを有するファイルとして生成される。
外部端末50は、当該生成指示を受け付けると、当該生成指示(詳細には、当該生成指示に基づくスキャン画像生成指示等)をMFP10に転送する。
MFP10は、当該生成指示(スキャン画像生成指示等)を外部端末50から受信するとスキャン動作を開始し、MFP10の原稿台(ADF等)に載置された原稿のスキャン画像200を生成する。
また、MFP10は、スキャン画像200内における各種の領域を判別する領域判別処理を行う。具体的には、MFP10の領域判別部15は、スキャン画像200内における文字領域210(図6参照)と非文字領域(写真領域等)220とを判別し、スキャン画像200における文字領域210の範囲(詳細にはその位置および大きさ)と非文字領域220の範囲とを特定する。また、領域判別部15は、当該文字領域210に対して、当該領域が「文字領域」であることを示す特定コード(たとえば「1」)を付与する。同様に、領域判別部15は、非文字領域220に対して、当該領域が「非文字領域」であることを示す領域種別コード(たとえば「2」、「3」等)を付与する。より詳細には、たとえば、非文字領域である「写真領域」に対して「2」が付与され、非文字領域である「背景領域」に対して「3」が付与される。
そして、領域判別部15は、これらの情報に基づいて属性指定データ300(不図示)を生成する。属性指定データ300は、スキャン画像200内の各画素位置に対して上記の領域種別コードが割り付けられたデータ(スキャン画像200の各画素ごとに領域種別コードが付与されたデータ)として生成される。換言すれば、属性指定データ300は、スキャン画像200における文字領域210および非文字領域220のそれぞれに関する、範囲情報(詳細にはその位置および大きさに関する情報)ならびに領域種別コード等、の情報を含むものとして生成される。
そして、MFP10(通信部4および通信制御部11等)は、スキャン画像(詳細にはその画像データ)200と属性指定データ300とを外部端末50に送信する。
<コンパクト化処理およびOCR処理等>
外部端末50は、MFP10からスキャン画像200および属性指定データ300を取得(受信)する(ステップS11)と、ステップS13に進む。
ステップS13では、外部端末50は、一連のサブ処理で構成される処理(ここでは、コンパクト化のための一連のサブ処理で構成されるコンパクト化処理)P1を開始する。このコンパクト化処理(当該一連のサブ処理)P1は、領域分離処理(文字領域分離処理および非文字領域分離処理(背景領域分離処理および写真領域分離処理等))、領域色判定処理(文字色判定処理および背景色判定処理等)、背景塗りつぶし処理、ならびに領域圧縮処理(文字領域圧縮処理および非文字領域圧縮処理(背景領域圧縮処理および写真領域圧縮処理等))等を備えて構成される。
ここにおいて、領域分離処理は、各領域をスキャン画像から分離(抽出)して各領域に対応するレイヤ(画像データ)を生成する処理である。領域分離処理には、文字領域をスキャン画像から分離して文字レイヤ(文字領域画像データ)を生成する文字領域分離処理が含まれる。また、領域分離処理には、非文字領域(背景領域および写真領域等)をスキャン画像から分離して非文字レイヤを生成する非文字領域分離処理も含まれる。より詳細には、領域分離処理には、背景領域をスキャン画像から分離して背景レイヤ(背景領域画像データ)を生成する背景領域分離処理、および写真領域をスキャン画像から分離して写真レイヤ(写真領域画像データ)を生成する写真領域分離処理等も含まれる。
領域色判定処理は、各領域の色を判定する処理である。領域色判定処理には、文字領域内の文字の色を判定する文字色判定処理、および背景領域の色を判定する背景色判定処理等が含まれる。
背景塗りつぶし処理は、背景レイヤーのうち文字領域が存在する部分(文字領域配置部分)を背景色で塗りつぶす処理である。
領域圧縮処理は、各領域を個別の圧縮手法および個別の圧縮率で圧縮する処理である。領域圧縮処理には、文字領域圧縮処理および非文字領域圧縮処理が含まれる。文字領域圧縮処理は、文字領域を或る圧縮手法(たとえばMMR圧縮)且つ比較的低い圧縮率で圧縮する圧縮処理である。また、非文字領域圧縮処理は、非文字領域(背景領域および写真領域)を別の圧縮手法(たとえばJPEG圧縮)且つ比較的高い圧縮率で圧縮する圧縮処理(背景領域圧縮処理および写真領域圧縮処理等)である。
外部端末50は、ステップS13において、これら複数のサブ処理で構成される処理P1、具体的にはまず領域分離処理(より詳細には文字領域分離処理)を開始する。
文字領域分離処理において、外部端末50は、スキャン画像200と属性指定データ300とに基づいて、スキャン画像200内の文字領域を分離(抽出)し、クラウドサーバ90でのOCR処理における入力データ形式に則したデータファイルを生成する。これにより、スキャン画像200から分離(抽出)された文字領域210の画像データファイル(たとえば、二値化された画像データ)が生成される。
その後、文字領域分離処理が完了し当該画像データファイルが文字領域分離処理の処理結果として生成されたことが外部端末50によって判定されると、外部端末50は、当該画像データファイルをクラウドサーバ90(90A)に直ちに送信する。換言すれば、クラウドサーバ90でのOCR処理P2で利用される画像データが、上述のコンパクト化処理P1を構成する複数のサブ処理のいずれか(ここでは、文字領域分離処理)において生成されると、当該複数のサブ処理のうち未実行の残余の処理が存在する段階で、当該画像データがクラウドサーバ90に送出(送信)される(ステップS14)。なお、当該画像データは、処理P1の途中の段階で出力されるデータであることから、中間出力データとも称される。
このように、ステップS14においては、外部端末50(指示送出部67等)は、文字領域210の画像データと当該画像データに対するOCR処理指示(処理依頼)とを、電子文書生成アプリケーション110からアプリケーション120に向けて送出(送信)する。なお、アプリケーション120(ここでは、OCR処理を行うOCR処理アプリケーション)は、電子文書生成アプリケーション110とは別のアプリケーションである。アプリケーション120は、クラウドサーバ90にインストールされ且つクラウドサーバ90にて実行されるアプリケーションである。
一方、クラウドサーバ90にて実行中のアプリケーション120が、上述の処理指示と文字領域210に関する画像データとを受け取る(受信する)(ステップS31)と、ステップS32に進む。ステップS32においては、クラウドサーバ90(アプリケーション120)は、当該処理指示および画像データに基づいて、OCR処理を実行する。そして、アプリケーション120は、OCR処理の処理結果に係る文字列(テキストデータ)250を電子文書生成アプリケーション110に向けて出力する(ステップS33)。換言すれば、クラウドサーバ90(アプリケーション120)から外部端末50(電子文書生成アプリケーション110)に向けてOCR処理P2の処理結果が送出(送信)される。
ステップS14での送信後、外部端末50(詳細には処理実行部65)は、文字領域210の画像データの送信後において当該複数のサブ処理のうち(未実行の)残余の処理を引き続いて実行する(ステップS15)。外部端末50(処理実行部65)にて実行されるコンパクト化処理P1のうちの当該残余の処理(たとえば、非文字領域分離処理、領域色判定処理(文字色判定処理および背景色判定処理等)、背景塗りつぶし処理、ならびに領域圧縮処理(文字領域圧縮処理および非文字領域圧縮処理)等)の少なくとも一部は、クラウドサーバ90におけるOCR処理P2に対して並列的に実行される。
また、処理P1のうちの当該残余の処理の少なくとも一部(たとえば文字領域圧縮処理等)は、文字領域分離処理の処理結果(文字領域の画像データ)等を用いて実行される。換言すれば、当該文字領域分離処理の処理結果は、処理P2(OCR処理)にも利用され、処理P1における当該文字領域分離処理の後の処理(後続処理)にも利用される。すなわち、文字領域分離処理は、処理P2と処理P1における後続処理との双方で利用される「共通の処理」であるとも表現される。
ステップS16において、外部端末50(受取部68等)は、クラウドサーバ90(アプリケーション120)からOCR処理P2の処理結果を受け取る(受信する)。
そして、ステップS21において、外部端末50(生成部69等)は、処理実行部65による処理P1の処理結果と、通信部54等によって受信された処理P2の処理結果とに基づいて、電子文書500を生成する。
具体的には、文字領域と非文字領域とを互いに異なる圧縮率で圧縮した各画像(互いに異なる圧縮率で圧縮処理が施された後の文字領域画像および非文字領域画像)を有し且つテキストデータ(光学文字認識処理P2の処理結果)を有する電子文書500(サーチャブルコンパクトPDFファイル)が生成される。
詳細には、処理P1の処理結果(具体的には、圧縮後の文字領域210の画像データ520と圧縮後の写真領域220Aの画像データ520Aと圧縮後の背景領域220Bの画像データ520Bとを含むデータ)が電子文書500内に配置される。また、文字領域210に関するOCR処理P2の処理結果であるテキストデータ250が、電子文書500内における対応位置に配置される(図6も参照)。より詳細には、文字領域210に関するOCR結果のテキストデータ250が、コンパクトサーチャブルPDFファイルのテキストレイヤ(非表示)内において文字領域210の対応位置(電子文書500における対応領域510)に配置される。換言すれば、文字領域210に関する処理結果(OCR処理結果)に係るテキストデータ250が、部分領域230の検出位置に「非表示状態」で埋め込まれる。
このようにして、電子文書(サーチャブルコンパクトPDFファイル)500(図6も参照)が生成される。
以上のように、この第1実施形態では、クラウドサーバ90におけるOCR処理(サーチャブル化処理)P2で利用されるデータが、処理P1(コンパクト化処理)を構成する複数のサブ処理のいずれかである特定の処理(ここでは文字領域分離処理)において外部端末50により生成される。そして、これに応答して、外部端末50は、処理P1の途中で(当該複数のサブ処理のうち未実行の残余の処理が存在する段階で)、次のような処理を実行する。具体的には、当該データをクラウドサーバ90に送信する送信処理を実行する(ステップS14)とともに、当該データの送信後において、(コンパクト化処理P1を構成する)当該複数のサブ処理のうち(未実行)の残余の処理を引き続いて実行する(ステップS15)。そして、外部端末50によって実行される処理P1の処理結果と、クラウドサーバ90により当該データに関して実行されたOCR処理P2の処理結果とに基づいて、電子文書が生成される(ステップS21)。
これによれば、OCR処理P2で利用されるデータ(文字領域画像データ)がコンパクト化処理P1の途中でクラウドサーバ90に送信されるので、クラウドサーバ90により実行されるOCR処理P2は、コンパクト化処理P1の完了を待つことを要することなく開始され得る。したがって、処理の効率化を図ることが可能である。換言すれば、複数の装置で連携して電子文書を生成する技術において、より効率的に電子文書を生成することが可能である。
また、処理P2は、外部端末50からクラウドサーバ90への当該データ(文字領域画像データ)の送信に応答してクラウドサーバ90によって開始され、コンパクト化処理P1の残余の処理のうちの少なくとも一部の処理に対して並列的に実行されるので、処理の更なる効率化を図ることが可能である。
特に、ここでは、処理P1のうちの特定の処理(具体的には、文字領域分離処理)の処理結果が、処理P1の後続処理(文字領域の圧縮処理等)に利用されるとともに、処理P1とは別の処理(OCR処理)P2にも利用されることに着目して処理の効率化が図られている。具体的には、外部端末50は、処理P1の完了を待たずに処理P1の途中(詳細には特定の処理の完了直後)において当該特定の処理の処理結果をクラウドサーバ90に送信してOCR処理P2をクラウドサーバ90に実行させる。一方、外部端末50自身は、当該特定の処理の処理結果を用いて、当該特定の処理よりも後に行われる残余の処理を引き続き実行する。その結果、クラウドサーバ90により実行されるOCR処理P2は、コンパクト化処理P1の完了を待つことを要することなく開始され、コンパクト化処理P1のうち特定の処理よりも後に行われる残余の処理のうちの少なくとも一部の処理に対して並列的に実行される。したがって、処理の効率化を図ることが可能である。
また、上記実施形態においては、MFP10の外部の装置(クラウドサーバ90)によって提供されるOCR処理サービスが利用されている。これによれば、OCR処理の依頼元装置(たとえば外部端末50)とは別の装置(クラウドサーバ)でOCR処理を行うことができるので、当該依頼元装置の処理負荷を低減することが可能である。
なお、上記実施形態では、属性指定データ300がMFP10において生成されて外部端末50に送信され属性指定データ300にも基づいて領域分離処理が外部端末50によって実行されている。MFP10にて予め生成された属性指定データ300をも用いて外部端末50における領域分離処理を行うことによれば、外部端末50における当該領域分離処理の処理負荷を低減することが可能である。ただし、本発明はこれに限定されず、たとえば、属性指定データ300が外部端末50において生成されるようにしてもよい。あるいは、属性指定データ300が生成されることなく領域分離処理が行われるようにしてもよい。
<2.第2実施形態>
第2実施形態は、第1実施形態の変形例である。以下、第1実施形態との相違点を中心に説明する。
上記第1実施形態においては、スキャン画像に基づきサーチャブルコンパクトPDFファイルが生成されているが、この第2実施形態においては、スキャン画像に基づきOOXML(Office Open XML(Extensible Markup Language))ファイルが生成される(図8参照)。図8は、第2実施形態に係る動作の概略を示す概念図である。
OOXMLファイルの生成に際しては、文字領域分離処理、写真領域分離処理、他領域分離処理(表領域分離処理等)、個別領域切出処理、個別領域圧縮処理が外部端末50において実行される。一方、クラウドサーバ90においてOCR処理が実行され、その処理結果がクラウドサーバ90から外部端末50に送信される。このOOXMLファイルにおいても、OCR処理の処理結果であるテキストデータ(文字コード群)が付加される。
第2実施形態においても、図4と同様の動作が実行される。ただし、第2実施形態における処理P1は、第1実施形態におけるコンパクト化処理とは異なる処理である。第2実施形態における処理P1は、次のような複数のサブ処理で構成される処理である。当該複数のサブ処理には、文字領域分離処理、写真領域分離処理、他領域分離処理(表領域分離処理)、(写真領域に関する)個別領域切出処理、および個別領域圧縮処理が含まれる。
ここにおいて、写真領域分離処理は、スキャン画像200から写真領域(図形領域を含む)220A(図7参照)を分離する処理であり、他領域分離処理(表領域分離処理)は、他の領域(具体的には文字領域とも写真領域とも異なる特定種類の領域(たとえば表領域220D))を、スキャン画像200から分離する処理(特定領域分離処理)である。写真領域分離処理によって、分離された写真領域220Aに関する写真領域画像データが生成され、他領域分離処理によって、分離された当該他の領域に関する他領域画像データ(表領域画像データ等)が生成される。また、個別領域切出処理は、写真領域分離処理によって生成された写真領域画像データから、写真領域220Aに含まれる複数のサブ領域(複数の個別写真領域)221,222をそれぞれ切り出す処理である。さらに、個別領域圧縮処理は、当該個別領域切出処理によって切り出された個別領域221,222を所定形式(たとえばJPEG形式)で圧縮する圧縮処理である。
この第2実施形態では、ステップS14(図4)において、処理P1のうちの最初のサブ処理(具体的には、文字領域210をスキャン画像から分離して抽出する文字領域分離処理)が終了すると、その処理結果である文字領域画像データ(文字領域210の画像データ)がクラウドサーバ90に送信される。文字領域210の画像データは、OCR処理P2が施されるべき旨(処理依頼)とともに、クラウドサーバ90(90A)に送信される。
また、ステップS14での送信後のステップS15においては、外部端末50は、文字領域210の画像データの送信後において当該複数のサブ処理のうち(未実行の)残余の処理を引き続いて実行する(ステップS15)。処理P1のうちの当該残余の処理(たとえば、写真領域分離処理、(写真領域内の)個別領域切出処理、個別領域圧縮処理、および他領域分離処理(表領域分離処理))の全部又は一部の処理は、クラウドサーバ90におけるOCR処理P2に対して並列的に実行される。
その後、ステップS16にてOCR処理P2の処理結果をクラウドサーバ90(90A)から受信すると、ステップS21において、外部端末50は、処理P1の処理結果と処理P2の処理結果とに基づいて、電子文書500を生成する。具体的には、写真領域(複数の個別写真領域)とテキストデータ(OCR処理の処理結果)とを有する電子文書(OOXML形式の電子文書)500が生成される。この生成処理においては、処理P1の処理結果(文字領域210の画像データ、写真領域220Aの画像データ、および表領域220Dの画像データ等)とOCR処理P2の処理結果(テキストデータ)とが利用される。
以上のような態様によれば、第1実施形態と同様に、OCR処理P2で利用されるデータ(文字領域画像データ)がコンパクト化処理P1の途中でクラウドサーバ90に送信されるので、クラウドサーバ90により実行されるOCR処理P2は、コンパクト化処理P1の完了を待つことを要することなく開始され得る。したがって、処理の効率化を図ることが可能である。換言すれば、複数の装置で連携して電子文書を生成する技術において、より効率的に電子文書を生成することが可能である。
また、クラウドサーバ90により実行されるOCR処理P2は、処理P1の完了を待つことを要することなく、処理P1の少なくとも一部の処理に対して並列的に実行されるので、処理の更なる効率化を図ることができる。
<3.第3実施形態>
第3実施形態は、第2実施形態の変形例である。以下、第2実施形態との相違点を中心に説明する。
この第3実施形態においては、OCR処理P2のみならず、処理P1のうちの一部の処理(個別領域切出処理および個別領域圧縮処理)もが、外部端末50とは異なる装置において実行される。ここでは、OCR処理P2はクラウドサーバ90Aにおいて実行され、当該一部の処理(個別領域切出処理および個別領域圧縮処理)はクラウドサーバ90Bにおいて実行される。
クラウドサーバ90Bには、写真領域から個別領域を切り出す個別領域切出処理と当該個別領域をそれぞれJPEG形式で圧縮する個別領域圧縮処理とを実行するアプリケーション130がインストールされている。クラウドサーバ90Bは、当該アプリケーション130によって、個別領域切出処理と個別領域圧縮処理(JPEG圧縮処理)とを実行する。
第3実施形態においても、図4と同様の動作(ただしステップS21を除く)が実行される。詳細には、外部端末50は、図4のステップS16までの処理を実行し、クラウドサーバ90は対応する処理(ステップS31〜S33)を実行する。また、ステップS16の後には、図9に示す動作が実行される。
図9は、外部端末50およびクラウドサーバ90(90B)における動作を示すフローチャートである。外部端末50は、電子文書生成アプリケーション110を実行することによって、図9の左側に示すような処理を図4のステップS16の処理に引き続いて実行する。また、クラウドサーバ90Bは、アプリケーション130を実行することによって、図9の右側に示すような処理を実行する。また、図10は、第3実施形態に係る動作の概略を示す概念図である。
第3実施形態における処理P1は、次のような複数のサブ処理で構成される処理である。当該複数のサブ処理には、文字領域分離処理、写真領域分離処理、他領域分離処理(表領域分離処理)が含まれる。第3実施形態に係る処理P1には、個別領域切出処理および個別領域圧縮処理は含まれない。
ステップS14においては、処理P1のうちの最初のサブ処理(具体的には、文字領域210をスキャン画像から分離して抽出する文字領域分離処理)が終了すると、その処理結果である画像データ(文字領域210の画像データ)がクラウドサーバ90Aに送信される。
また、ステップS14での送信後のステップS15においては、外部端末50は、当該複数のサブ処理のうち(未実行の)残余の処理(写真領域分離処理等)を引き続いて実行する。
その後、外部端末50は、ステップS17において、処理P1のうちの所定のサブ処理(具体的には、写真領域をスキャン画像から分離して抽出する写真領域分離処理)を終了すると、その処理結果である写真領域画像データ(写真領域の画像データ)をクラウドサーバ90Bに送信する。当該写真領域画像データは、処理P3(個別領域切出処理および個別領域圧縮処理)を施すべき旨(処理依頼)とともに、外部端末50からクラウドサーバ90Bに送信される。
ステップS17における送信処理後においては、外部端末50は、当該複数のサブ処理のうち(未実行の)残余の処理を引き続いて実行する(ステップS18)。
ここにおいて、処理P1のうち文字領域分離処理よりも後に行われる残余の処理の全部又は一部(たとえば、写真領域分離処理)は、クラウドサーバ90におけるOCR処理P2に対して並列的に実行される。
また、処理P1のうち写真領域分離処理よりも後に行われる残余の処理の全部又は一部(たとえば、表領域分離処理)は、クラウドサーバ90における処理P3に対して並列的に実行される。
一方、クラウドサーバ90Bにて実行中のアプリケーション130が、ステップS17にて外部端末50により送信された上述の処理指示と写真領域の画像データとを受け取る(受信する)(ステップS41)と、ステップS42に進む。ステップS42では、クラウドサーバ90B(アプリケーション130)は、当該処理指示および画像データに基づいて、処理P3(個別領域切出処理および個別領域圧縮処理)を実行する。そして、アプリケーション130は、処理P3の処理結果に係る画像データ(各個別領域の圧縮後の画像データ)を電子文書生成アプリケーション110に向けて出力する(ステップS43)。換言すれば、クラウドサーバ90B(アプリケーション130)から外部端末50(電子文書生成アプリケーション110)に向けて、処理P3の処理結果が送出(送信)される。
その後、ステップS22において、外部端末50は、ステップS16にてクラウドサーバ90Aから受信した処理結果(OCR処理P2の処理結果)と、ステップS19にてクラウドサーバ90Bから受信した処理結果(処理P3の処理結果)と、外部端末50自身で実行した処理P1の処理結果(表領域の画像データ等)とに基づいて、電子文書500を生成する。詳細には、表領域と複数の個別写真領域とテキストデータ(OCR処理の処理結果)とを有する電子文書(OOXML形式の電子文書)500が生成される。
以上のような態様によれば、クラウドサーバ90により実行されるOCR処理P2および処理P3は、それぞれ、処理P1の完了を待つことを要することなく且つ処理P1の少なくとも一部の処理に対して並列的に実行されるので、処理の効率化を図ることができる。
なお、図9では、図示の都合上、ステップS17の前にOCR処理P2の処理結果が受信されている(図4のステップS16)が、これに限定されず、ステップS17以降の適宜の時点(たとえばステップS19の後の時点等)にてOCR処理P2の処理結果が受信されるようにしてもよい。特に、複数の異なるクラウドサーバ90A,90Bによって処理P2,P3がそれぞれ並列的に処理されることによれば、処理の更なる効率化を図ることが可能である。
<4.変形例等>
以上、この発明の実施の形態について説明したが、この発明は上記説明した内容のものに限定されるものではない。
たとえば、上記各実施形態においては、OCR処理用の画像データは、ページ単位で外部端末50からクラウドサーバ90に送信されているが、これに限定されない。具体的には、ページ単位よりも小さな単位(たとえば、段落単位あるいは行単位等)の部分画像データが外部端末50にて画像処理等を用いて抽出されるごとに、当該各部分画像データがそれぞれ外部端末50からクラウドサーバ90に送信されるようにしてもよい。そして、これらの単位でOCR処理等がクラウドサーバ90にて施され、当該OCRの処理結果がクラウドサーバ90から外部端末50に送信されるようにしてもよい。
図11は、このような改変例を示す図である。図11には、文字領域210内の複数の部分領域(たとえば複数の行領域)230に関して、部分領域ごとにクラウドサーバ90にてOCR処理が実行される態様が示されている。そして、部分領域ごとのOCR結果であるテキストデータ250が電子文書500における対応領域510(文字領域210に対応する領域)内に配置される。特に、外部端末50は、スキャン画像200内における各行領域の位置(検出位置)(X,Y)を検出しておき、各行領域のOCR結果を電子文書500において当該検出位置(X,Y)に対応する位置に配置する。したがって、各行のOCR結果を正確な位置に配置することが可能である。この際、好ましくは、複数の部分領域230に関する複数の画像データファイルには、各部分領域を互いに識別する識別子を有するファイル名が付されて、外部端末50とクラウドサーバ90との間で授受される。当該複数の画像データファイルに関するOCR処理の処理結果を示すテキストファイルに関しても同様であり、好ましくは、各部分領域を互いに識別する識別子を有するファイル名が付されて、外部端末50とクラウドサーバ90との間で授受される。これによれば、複数の部分領域に対するOCR処理を互いに並列的に実行しつつ、複数の部分領域(およびそれぞれのOCR処理結果)を互いに区別することが可能である。
また、上記各実施形態においては、OCR処理がクラウドサーバ90(90A)において処理P2として実行されているが、これに限定されず、OCR処理に代えて(あるいはOCR処理に加えて)翻訳処理が処理P2としてクラウドサーバ90(90A)において実行されるようにしてもよい。より詳細には、スキャン画像に対するOCR処理が外部端末50(あるいはMFP10)にて実行され、その処理結果であるテキストデータが外部端末50からクラウドサーバ90に送信され、当該テキストデータに対する翻訳処理がクラウドサーバ90にて実行されるようにしてもよい。そして、当該翻訳処理の処理結果に基づいて、外部端末50において電子文書が生成されるようにしてもよい。あるいは、クラウドサーバ90においてOCR処理と翻訳処理との双方が実行され、その処理結果に基づいて外部端末50が電子文書を生成するようにしてもよい。
あるいは、画像検索処理がクラウドサーバ90において処理P2として実行されるようにしてもよい。より詳細には、スキャン画像に対するOCR処理が外部端末50(あるいはMFP10)にて実行され、その処理結果であるテキストデータのうちの一部(指定文字列等)が外部端末50からクラウドサーバ90に送信され、当該指定文字列を検索キーワードとする画像検索処理がクラウドサーバ90にて実行されるようにしてもよい。そして、当該画像検索処理の処理結果に基づいて、外部端末50において電子文書が生成されるようにしてもよい。より詳細には、当該画像検索処理の処理結果としてクラウドサーバ90から送信されてくる画像を当該検索キーワード付近の位置に配置した電子文書が生成されるようにしてもよい。
あるいは、文字画像の圧縮処理が処理P2として実行されるようにしてもよい。
あるいは、処理P2は、OCR処理の前処理としての画像処理(たとえば、エッジ強調処理および/または濃度調整処理)等であってもよく、OCR処理とは無関係に行われる画像処理等であってもよい。さらには、処理P2は、(圧縮されて送信されてきた)文字画像の伸長処理などを含むものであってもよい。
あるいは、処理P2は、写真画像に対する画像処理(平滑化処理、色変換処理、階調再現処理等)であってもよく、写真画像の圧縮処理などであってもよい。また、処理P2は、(圧縮されて送信されてきた)写真画像の伸長処理などを含むものであってもよい。
また、上記各実施形態においては、MFP10において生成されたスキャン画像が外部端末50に送信され、外部端末50から他のクラウドサーバ90に対して、スキャン画像に関する処理P2(,P3)が依頼される態様が例示されているが、これに限定されない。
たとえば、外部端末50を備えず且つMFP10とクラウドサーバ90とを備えて構成されるシステム1(図12参照)において、上記各実施形態の外部端末50の動作がMFP10により実行されるようにしてもよい。より詳細には、MFP10において処理P1が実行され、クラウドサーバ90において処理P2(,P3)が実行されるようにしてもよい。
あるいは、クラウドサーバ90を備えず且つMFP10と外部端末50とを備えて構成されるシステム1(図13参照)において、上記各実施形態の外部端末50の動作がMFP10により実行され、上記各実施形態のクラウドサーバ90の動作(OCR処理等)が外部端末50により実行されるようにしてもよい。より詳細には、MFP10において処理P1が実行され、外部端末50において処理P2(,P3)が実行されるようにしてもよい。
1 電子文書生成システム
10 MFP(画像形成装置)
50 外部端末
90,90A,90B クラウドサーバ
200 スキャン画像
210 文字領域
220 非文字領域
500 電子文書
510 対応領域
520 画像データ

Claims (16)

  1. 電子文書を生成する電子文書生成システムであって、
    原稿のスキャン画像に基づき電子文書を生成するための処理として、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から非文字領域を分離する非文字領域分離処理と前記文字領域に対する第1の圧縮処理と前記非文字領域に対する第2の圧縮処理とを含む第1の処理を実行する第1の装置と、
    記電子文書を生成するための処理として、前記文字領域に関する光学文字認識処理を含む第2の処理を前記第1の装置からの依頼に基づいて実行し、当該第2の処理の処理結果を前記第1の装置に送信する第2の装置と、
    を備え、
    前記第1の装置は、
    前記第1の処理を実行する処理実行手段であって、前記第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記第2の装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行する処理実行手段と、
    前記処理実行手段によって実行される前記残余の処理の少なくとも一部と並列的に前記第2の装置により実行された前記第2の処理の処理結果を前記第2の装置から受信する受信手段と、
    前記文字領域と前記非文字領域とをそれぞれ互いに異なる圧縮率で圧縮した各画像を有し且つ前記光学文字認識処理の処理結果に係るテキストデータを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果とに基づいて生成する生成手段と、
    を備えることを特徴とする電子文書生成システム。
  2. 電子文書を生成する電子文書生成システムであって、
    原稿のスキャン画像に基づき電子文書を生成するための処理として、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から写真領域を分離して写真領域画像データを生成する写真領域分離処理とを含む第1の処理を実行する第1の装置と、
    記電子文書を生成するための処理として、前記文字領域に関する光学文字認識処理を含む第2の処理を前記第1の装置からの依頼に基づいて実行し、当該第2の処理の処理結果を前記第1の装置に送信する第2の装置と、
    を備え、
    前記第1の装置は、
    前記第1の処理を実行する処理実行手段であって、前記第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記第2の装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行する処理実行手段と、
    前記処理実行手段によって実行される前記残余の処理の少なくとも一部と並列的に前記第2の装置により実行された前記第2の処理の処理結果を前記第2の装置から受信する受信手段と、
    前記写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果とに基づいて生成する生成手段と、
    を備えることを特徴とする電子文書生成システム。
  3. 請求項2に記載の電子文書生成システムにおいて、
    前記第1の装置からの依頼に基づいて、前記電子文書を生成するための第3の処理を実行し、当該第3の処理の処理結果を前記第1の装置に送信する第3の装置、
    をさらに備え、
    前記第1の処理は、前記文字領域とも前記写真領域とも異なる特定種類の領域を前記スキャン画像から分離する特定領域分離処理をさらに含み、
    前記第3の処理は、複数の個別写真領域を含む前記写真領域画像データから前記複数の個別写真領域をそれぞれ切り出す個別領域切出処理を含み、
    前記処理実行手段は、前記第3の処理で利用される前記写真領域画像データを前記複数のサブ処理のうち前記写真領域分離処理において生成すると、前記写真領域画像データを前記第3の装置に送信するとともに、前記複数のサブ処理のうち前記写真領域分離処理よりも後に行われる残余の処理を引き続いて実行し、
    前記受信手段は、前記写真領域分離処理よりも後に行われる前記残余の処理の少なくとも一部と並列的に前記第3の装置により実行された前記第3の処理の処理結果を前記第3の装置から受信し、
    前記生成手段は、前記特定種類の領域と前記複数の個別写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果と前記受信手段によって受信された前記第3の処理の処理結果とに基づいて生成することを特徴とする電子文書生成システム。
  4. 請求項1ないし請求項3のいずれかに記載の電子文書生成システムにおいて、
    前記第1の装置は、情報端末であり、
    前記第2の装置は、サーバであることを特徴とする電子文書生成システム。
  5. 請求項1ないし請求項3のいずれかに記載の電子文書生成システムにおいて、
    前記第1の装置は、画像形成装置であり、
    前記第2の装置は、サーバであることを特徴とする電子文書生成システム。
  6. 請求項1ないし請求項3のいずれかに記載の電子文書生成システムにおいて、
    前記第1の装置は、画像形成装置であり、
    前記第2の装置は、情報端末であることを特徴とする電子文書生成システム。
  7. 連携先装置と連携して電子文書を生成する電子文書生成装置であって、
    原稿のスキャン画像に基づき電子文書を生成するための処理として、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から非文字領域を分離する非文字領域分離処理と前記文字領域に対する第1の圧縮処理と前記非文字領域に対する第2の圧縮処理とを含む第1の処理を実行する処理実行手段であって、前記連携先装置にて実行される第2の処理であり且つ前記文字領域に関する光学文字認識処理を含む第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記連携先装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行する処理実行手段と、
    前記処理実行手段によって実行される前記残余の処理の少なくとも一部と並列的に前記連携先装置により実行された前記第2の処理の処理結果を前記連携先装置から受信する受信手段と、
    前記文字領域と前記非文字領域とをそれぞれ互いに異なる圧縮率で圧縮した各画像を有し且つ前記光学文字認識処理の処理結果に係るテキストデータを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果とに基づいて生成する生成手段と、
    を備えることを特徴とする電子文書生成装置。
  8. 連携先装置と連携して電子文書を生成する電子文書生成装置であって、
    原稿のスキャン画像に基づき電子文書を生成するための処理として、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から写真領域を分離して写真領域画像データを生成する写真領域分離処理とを含む第1の処理を実行する処理実行手段であって、前記連携先装置にて実行される第2の処理であり且つ前記文字領域に関する光学文字認識処理を含む第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記連携先装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行する処理実行手段と、
    前記処理実行手段によって実行される前記残余の処理の少なくとも一部と並列的に前記連携先装置により実行された前記第2の処理の処理結果を前記連携先装置から受信する受信手段と、
    前記写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果とに基づいて生成する生成手段と、
    を備えることを特徴とする電子文書生成装置。
  9. 請求項8に記載の電子文書生成装置において、
    前記処理実行手段は、前記電子文書を生成するための第3の処理を、前記連携先装置とは別の連携先装置に依頼し、
    前記第1の処理は、前記文字領域とも前記写真領域とも異なる特定種類の領域を前記スキャン画像から分離する特定領域分離処理をさらに含み、
    前記第3の処理は、複数の個別写真領域を含む前記写真領域画像データから前記複数の個別写真領域をそれぞれ切り出す個別領域切出処理を含み、
    前記処理実行手段は、前記第3の処理で利用される前記写真領域画像データを前記複数のサブ処理のうち前記写真領域分離処理において生成すると、前記写真領域画像データを前記別の連携先装置に送信するとともに、前記複数のサブ処理のうち前記写真領域分離処理よりも後に行われる残余の処理を引き続いて実行し、
    前記受信手段は、前記写真領域分離処理よりも後に行われる前記残余の処理の少なくとも一部と並列的に前記別の連携先装置により実行された前記第3の処理の処理結果を前記別の連携先装置から受信し、
    前記生成手段は、前記特定種類の領域と前記複数の個別写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記処理実行手段による前記第1の処理の処理結果と前記受信手段によって受信された前記第2の処理の処理結果と前記受信手段によって受信された前記第3の処理の処理結果とに基づいて生成することを特徴とする電子文書生成装置。
  10. 請求項7ないし請求項9のいずれかに記載の電子文書生成装置において、
    前記電子文書生成装置は、情報端末であることを特徴とする電子文書生成装置。
  11. 請求項7ないし請求項9のいずれかに記載の電子文書生成装置において、
    前記電子文書生成装置は、画像形成装置であることを特徴とする電子文書生成装置。
  12. 連携先装置と連携して電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
    a)原稿のスキャン画像に基づき電子文書を生成するための第1の処理であって、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から非文字領域を分離する非文字領域分離処理と前記文字領域に対する第1の圧縮処理と前記非文字領域に対する第2の圧縮処理とを含む第1の処理を開始するステップと、
    b)前記連携先装置にて実行される第2の処理であって前記文字領域に関する光学文字認識処理を含む第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記連携先装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行するステップと、
    c)前記ステップb)において実行される前記残余の処理の少なくとも一部と並列的に前記連携先装置により実行された前記第2の処理の処理結果を前記連携先装置から受信するステップと、
    d)前記文字領域と前記非文字領域とをそれぞれ互いに異なる圧縮率で圧縮した各画像を有し且つ前記光学文字認識処理の処理結果に係るテキストデータを有する前記電子文書を、前記電子文書生成装置による前記第1の処理の処理結果と前記ステップc)にて受信された前記第2の処理の処理結果とに基づいて生成するステップと、
    を実行させるためのプログラム。
  13. 連携先装置と連携して電子文書を生成する電子文書生成装置に内蔵されたコンピュータに、
    a)原稿のスキャン画像に基づき電子文書を生成するための第1の処理であって、前記スキャン画像から文字領域を分離する文字領域分離処理と前記スキャン画像から写真領域を分離して写真領域画像データを生成する写真領域分離処理とを含む第1の処理を開始するステップと、
    b)前記連携先装置にて実行される第2の処理であって前記文字領域に関する光学文字認識処理を含む第2の処理で利用される文字領域画像データを、前記第1の処理を構成する複数のサブ処理のうち前記文字領域分離処理において生成すると、前記複数のサブ処理のうち未実行の残余の処理が存在する段階で前記文字領域画像データを前記連携先装置に送信するとともに、前記複数のサブ処理のうち前記文字領域分離処理よりも後に行われる残余の処理を引き続いて実行するステップと、
    c)前記ステップb)において実行される前記残余の処理の少なくとも一部と並列的に前記連携先装置により実行された前記第2の処理の処理結果を前記連携先装置から受信するステップと、
    d)前記写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書を、前記電子文書生成装置による前記第1の処理の処理結果と前記ステップc)にて受信された前記第2の処理の処理結果とに基づいて生成するステップと、
    を実行させるためのプログラム。
  14. 請求項13に記載のプログラムにおいて、
    前記ステップb)においては、前記電子文書を生成するための第3の処理が、前記連携先装置とは別の連携先装置に依頼され、
    前記第1の処理は、前記文字領域とも前記写真領域とも異なる特定種類の領域を前記スキャン画像から分離する特定領域分離処理をさらに含み、
    前記第3の処理は、複数の個別写真領域を含む前記写真領域画像データから前記複数の個別写真領域をそれぞれ切り出す個別領域切出処理を含み、
    前記ステップb)においては、前記第3の処理で利用される前記写真領域画像データが前記複数のサブ処理のうち前記写真領域分離処理において生成されると、前記写真領域画像データが前記別の連携先装置に送信されるとともに、前記複数のサブ処理のうち前記写真領域分離処理よりも後に行われる残余の処理が引き続いて実行され、
    前記プログラムは、
    e)前記写真領域分離処理よりも後に行われる前記残余の処理の少なくとも一部と並列的に前記別の連携先装置により実行された前記第3の処理の処理結果を前記別の連携先装置から受信するステップ、
    を前記コンピュータにさらに実行させ、
    前記ステップd)においては、前記特定種類の領域と前記複数の個別写真領域と前記光学文字認識処理の処理結果に係るテキストデータとを有する前記電子文書が、前記電子文書生成装置による前記第1の処理の処理結果と前記ステップc)にて受信された前記第2の処理の処理結果と前記ステップe)にて受信された前記第3の処理の処理結果とに基づいて生成されることを特徴とするプログラム。
  15. 請求項12ないし請求項14のいずれかに記載のプログラムにおいて、
    前記電子文書生成装置は、情報端末であることを特徴とするプログラム。
  16. 請求項12ないし請求項14のいずれかに記載のプログラムにおいて、
    前記電子文書生成装置は、画像形成装置であることを特徴とするプログラム。
JP2014143605A 2014-07-11 2014-07-11 電子文書生成システム、電子文書生成装置およびプログラム Active JP6107756B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014143605A JP6107756B2 (ja) 2014-07-11 2014-07-11 電子文書生成システム、電子文書生成装置およびプログラム
CN201510402487.0A CN105260996B (zh) 2014-07-11 2015-07-10 电子文档生成***以及电子文档生成装置
US14/797,690 US9473669B2 (en) 2014-07-11 2015-07-13 Electronic document generation system, electronic document generation apparatus, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014143605A JP6107756B2 (ja) 2014-07-11 2014-07-11 電子文書生成システム、電子文書生成装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2016021088A JP2016021088A (ja) 2016-02-04
JP6107756B2 true JP6107756B2 (ja) 2017-04-05

Family

ID=55068497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014143605A Active JP6107756B2 (ja) 2014-07-11 2014-07-11 電子文書生成システム、電子文書生成装置およびプログラム

Country Status (3)

Country Link
US (1) US9473669B2 (ja)
JP (1) JP6107756B2 (ja)
CN (1) CN105260996B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6478623B2 (ja) * 2014-12-24 2019-03-06 キヤノン株式会社 画像処理装置、制御方法及びプログラム
JP6892625B2 (ja) * 2016-07-29 2021-06-23 ブラザー工業株式会社 データ処理装置、および、コンピュータプログラム
JP6844348B2 (ja) * 2017-03-15 2021-03-17 コニカミノルタ株式会社 処理装置
JP7243024B2 (ja) * 2018-03-20 2023-03-22 富士フイルムビジネスイノベーション株式会社 情報処理システム
US11113559B2 (en) * 2018-07-20 2021-09-07 Ricoh Company, Ltd. Information processing apparatus for improving text data recognition, information processing method, and non-transitory recording medium
JP7140591B2 (ja) * 2018-07-26 2022-09-21 キヤノン株式会社 画像形成装置及びその制御方法、並びにプログラム
JP2020160553A (ja) * 2019-03-25 2020-10-01 東芝テック株式会社 画像処理プログラム、及び画像処理装置
JP2020188380A (ja) * 2019-05-15 2020-11-19 京セラドキュメントソリューションズ株式会社 情報処理システム、ユーザ端末及び電子機器
JP7328797B2 (ja) 2019-06-05 2023-08-17 株式会社日立製作所 端末装置、文字認識システム及び文字認識方法
IT201900009543A1 (it) * 2019-06-19 2020-12-19 St Microelectronics Srl Procedimento per la generazione di dati personalizzati di profile package in carte a circuito integrato, corrispondente sistema e prodotto informatico
JP2022188414A (ja) * 2021-06-09 2022-12-21 ブラザー工業株式会社 印刷装置
KR102527677B1 (ko) * 2022-10-17 2023-05-04 유병헌 지게차 매매 중계 시스템 및 그 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4396710B2 (ja) 2007-02-01 2010-01-13 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2008242820A (ja) * 2007-03-27 2008-10-09 Murata Mach Ltd ドキュメント処理システム
JP2009048293A (ja) * 2007-08-15 2009-03-05 Fuji Xerox Co Ltd 情報処理システム、情報処理実行プログラム及び画像処理装置
US20090052804A1 (en) * 2007-08-22 2009-02-26 Prospect Technologies, Inc. Method process and apparatus for automated document scanning and management system
JP2012022571A (ja) 2010-07-15 2012-02-02 Toshiba Tec Corp 翻訳制御装置および翻訳制御方法
JP2012073749A (ja) 2010-09-28 2012-04-12 Kyocera Mita Corp 画像形成装置及び画像形成プログラム
US8996350B1 (en) * 2011-11-02 2015-03-31 Dub Software Group, Inc. System and method for automatic document management
US9092165B2 (en) * 2012-01-31 2015-07-28 Konica Minolta Laboratory U.S.A., Inc. Printing an electronic document using a printer and a mobile device

Also Published As

Publication number Publication date
CN105260996B (zh) 2018-06-12
JP2016021088A (ja) 2016-02-04
CN105260996A (zh) 2016-01-20
US20160014296A1 (en) 2016-01-14
US9473669B2 (en) 2016-10-18

Similar Documents

Publication Publication Date Title
JP6107756B2 (ja) 電子文書生成システム、電子文書生成装置およびプログラム
US9485368B2 (en) Electronic document generation apparatus, recording medium, and electronic document generation system
US9282206B2 (en) Portable information terminal and recording medium
JP2008193682A (ja) 画像処理装置、画像処理方法
US11436762B2 (en) Image processing system, image processing method, and image processing apparatus
JP2010182206A (ja) 画像処理装置および画像処理方法
JP4956319B2 (ja) 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
JP2018129767A (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
JP2015103915A (ja) 画像処理装置及び画像処理方法
JP2020024303A (ja) 画像処理装置及びその制御方法、並びにプログラム
JP5983673B2 (ja) 電子文書生成システム、画像形成装置およびプログラム
US9413841B2 (en) Image processing system, image processing method, and medium
JP2009037558A (ja) 画像処理装置、画像処理方法ならびにそのプログラム及び記憶媒体
JP6303187B2 (ja) 画像処理装置
JP2016096393A (ja) 情報処理装置、システム、情報処理方法およびプログラム
JP6458351B2 (ja) 電子文書生成システム、画像形成装置、通信端末およびプログラム
JP6485051B2 (ja) 画像処理システム、画像処理装置およびプログラム
JP2008305155A (ja) 画像形成装置
US20130194613A1 (en) Processing images from multiple scanners
JP6201635B2 (ja) 画像処理システム、画像処理装置および情報処理端末
US8675236B2 (en) Image processing method
US20130194618A1 (en) Method of image processing from multiple scanners
JP6340943B2 (ja) 電子文書生成システム、画像形成装置およびプログラム
US20130194639A1 (en) Image processing unit for supporting multiple scanners
US20130194615A1 (en) Image scanning and processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170220

R150 Certificate of patent or registration of utility model

Ref document number: 6107756

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150