JP6066108B2 - 電子文書生成システムおよびプログラム - Google Patents

電子文書生成システムおよびプログラム Download PDF

Info

Publication number
JP6066108B2
JP6066108B2 JP2014084743A JP2014084743A JP6066108B2 JP 6066108 B2 JP6066108 B2 JP 6066108B2 JP 2014084743 A JP2014084743 A JP 2014084743A JP 2014084743 A JP2014084743 A JP 2014084743A JP 6066108 B2 JP6066108 B2 JP 6066108B2
Authority
JP
Japan
Prior art keywords
image
line
character string
electronic document
processing result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014084743A
Other languages
English (en)
Other versions
JP2015204075A (ja
Inventor
哲嗣 松谷
哲嗣 松谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2014084743A priority Critical patent/JP6066108B2/ja
Priority to US14/674,848 priority patent/US9614984B2/en
Publication of JP2015204075A publication Critical patent/JP2015204075A/ja
Application granted granted Critical
Publication of JP6066108B2 publication Critical patent/JP6066108B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00236Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server using an image reading or reproducing device, e.g. a facsimile reader or printer, as a local input to or local output from a computer
    • H04N1/00241Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server using an image reading or reproducing device, e.g. a facsimile reader or printer, as a local input to or local output from a computer using an image reading device as a local input to a computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00281Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal
    • H04N1/00307Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal with a mobile telephone apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0034Details of the connection, e.g. connector, interface
    • H04N2201/0037Topological details of the connection
    • H04N2201/0039Connection via a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Facsimiles In General (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、電子文書を生成する電子文書生成システムおよびそれに関連する技術に関する。
MFP(マルチ・ファンクション・ペリフェラル(Multi-Functional Peripheral))などの画像形成装置において、原稿をスキャンして電子文書を作成する技術が存在する。
このような技術においては、原稿のスキャン画像をそのまま取り込んで電子文書を生成するものの他、テキストデータ付き電子文書(次述)を生成するものも存在する(特許文献1等参照)。具体的には、原稿のスキャン画像(特に文字を示す画像)に対して光学文字認識処理(以下、OCR(Optical Character Recognition)処理とも称する)が施され、当該スキャン画像内の文字のテキストデータが自動認識され、当該テキストデータが非表示状態で当該スキャン画像に重畳して埋め込まれる。このようにして、たとえば、透明テキスト付きPDF(Portable Document Format)(あるいはサーチャブルPDF)などと呼ばれる所定形式の電子文書(テキストデータ付き電子文書)が生成される。
特開2012−73749号公報
ところで、画像形成装置で生成されたスキャン画像に基づき、当該画像形成装置と連携する外部端末において、電子文書を生成することが考えられる。また、当該外部端末がさらに別の外部装置(たとえばクラウドサーバ)と連携して当該電子文書を生成することも考えられる。より詳細には、外部端末がクラウドサーバに対してスキャン画像を送信し、当該スキャン画像に対するOCR処理を依頼し、その処理結果をクラウドサーバから受信することが考えられる。
しかしながら、このようなクラウドサーバ90によって提供されるOCR処理サービスでは、基本的機能のみ(汎用的なOCR処理のみ)が提供されることも想定される。汎用的なOCR処理サービスでは、OCR処理結果として、テキストデータのみが依頼元装置に返送される。そのため、テキストデータ付き電子文書の最終的な生成処理は、依頼元装置側で行われることを要する。
この場合、たとえば、スキャン画像に含まれていた一部の情報(OCR対象のスキャン画像に含まれる文章の各行の行末の位置あるいはフォントサイズなどの情報)は、クラウドサーバからの返信データには含まれていない。そのため、OCR処理結果の文字列を外部端末が電子文書内に配置する際に、複数の行に係る文字列のうち或る行の行末文字の次行以降の文字が本来の位置とは異なる位置に配置されるなどの問題が生じることがある。すなわち、このような情報の欠落等に起因して、外部端末50は必ずしも十分な電子文書を生成することができないことがある。換言すれば、画像形成装置から受信したスキャン画像およびクラウドサーバからの汎用的なOCR処理結果だけでは、スキャン画像に基づく電子文書を精緻に構築することが困難である。
そこで、この発明は、画像形成装置からのスキャン画像に基づき、外部端末においてさらに別の外部連携装置と連携して電子文書を生成する技術において、より好適な電子文書を生成することが可能な技術を提供することを課題とする。
上記課題を解決すべく、請求項1の発明は、電子文書生成システムであって、原稿のスキャン画像を生成する画像形成装置と、前記画像形成装置から受信した前記スキャン画像に関する画像データに基づき電子文書を生成する外部端末と、を備え、前記画像形成装置は、前記電子文書の生成処理に利用される補助データであって前記スキャン画像における文字列の各行の区切りを特定するための補助データを生成する補助データ生成手段と、前記補助データを前記外部端末に送信する通信手段と、を有し、前記外部端末は、前記補助データを前記画像形成装置から受信する受信手段と、前記補助データに基づき前記各行の区切りを特定し、前記外部端末とは別の装置である外部連携装置と連携して、前記スキャン画像に関する画像データに基づく前記電子文書を生成する文書生成手段と、を有することを特徴とする。
請求項2の発明は、請求項1の発明に係る電子文書生成システムにおいて、前記外部端末は、前記スキャン画像に関する光学文字認識処理を行うべき旨の指示と、前記スキャン画像に関する画像データとを、前記外部連携装置に送信する送信手段、をさらに有し、前記受信手段は、前記スキャン画像に関する前記光学文字認識処理の処理結果を前記外部連携装置から受信し、前記文書生成手段は、前記処理結果を前記補助データを用いて補足し前記電子文書を生成することを特徴とする。
請求項3の発明は、請求項2の発明に係る電子文書生成システムにおいて、前記画像形成装置の前記補助データ生成手段は、前記スキャン画像における文字列の各行の行末位置を検出し、各行の行末位置特定用の行末特定用文字列を画像化したマーク画像を前記スキャン画像における前記各行の行末位置に付加したマーク付加スキャン画像の画像データを生成するとともに、前記行末特定用文字列を前記補助データとして生成し、前記画像形成装置の前記通信手段は、前記マーク付加スキャン画像の画像データを前記スキャン画像に関する画像データとして前記外部端末に送信し、前記外部端末の前記受信手段は、前記スキャン画像に関する前記光学文字認識処理の処理結果として、前記マーク付加スキャン画像に対する前記光学文字認識処理の処理結果を前記外部連携装置から受信し、前記外部端末の前記文書生成手段は、前記処理結果と前記行末特定用文字列とに基づいて前記処理結果の文字列における本来の行末位置を特定し、前記処理結果に係る文字列を複数の行に区分して、前記電子文書を生成することを特徴とする。
請求項4の発明は、請求項2の発明に係る電子文書生成システムにおいて、前記画像形成装置の前記補助データ生成手段は、前記スキャン画像における文字列の各行の行末文字列を検出し、前記各行の前記行末文字列を前記補助データとして生成し、前記外部端末の前記文書生成手段は、前記処理結果と前記各行の前記行末文字列とに基づいて前記処理結果の文字列における本来の行末位置を特定し、前記処理結果に係る文字列を複数の行に区分して、前記電子文書を生成することを特徴とする。
請求項5の発明は、請求項2の発明に係る電子文書生成システムにおいて、前記補助データは、前記スキャン画像に基づき前記画像形成装置により検出された、前記スキャン画像における文字列の各行の文字のフォントサイズを含み、前記外部端末の前記文書生成手段は、前記処理結果の文字列における各行のフォントサイズを、前記画像形成装置から受信した前記補助データに含まれている前記各行の前記フォントサイズにそれぞれ設定して、前記電子文書を生成することを特徴とする。
請求項6の発明は、請求項2の発明に係る電子文書生成システムにおいて、前記補助データは、前記スキャン画像に基づき前記画像形成装置により検出された、前記スキャン画像における複数の文字領域の各位置を含み、前記外部端末の前記送信手段は、前記スキャン画像に含まれる前記複数の文字領域に関する各画像データと当該各画像データに関する光学文字認識処理を行うべき旨の指示とを、前記外部連携装置に送信し、前記外部端末の前記受信手段は、前記各画像データに関する前記光学文字認識処理の処理結果をそれぞれ前記外部連携装置から受信し、前記外部端末の前記文書生成手段は、前記外部連携装置から受信した前記各画像データに関する前記処理結果と、前記画像形成装置から受信した前記補助データに含まれている前記複数の文字領域の各位置とに基づいて、前記各画像データに関する前記処理結果に係る文字列を前記複数の文字領域の各位置に配置して、前記電子文書を生成することを特徴とする。
請求項7の発明は、請求項1の発明に係る電子文書生成システムにおいて、前記画像形成装置の前記補助データ生成手段は、前記スキャン画像における文字列の各行の行末位置を検出するとともに、各行の行末位置特定用の行末特定用文字列を画像化したマーク画像を前記スキャン画像における前記各行の行末位置に付加したマーク付加スキャン画像の画像データを、前記補助データとして生成し、前記外部端末は、前記マーク付加スキャン画像の画像データに関する光学文字認識処理を行うべき旨の指示と前記マーク付加スキャン画像の画像データとを、前記外部連携装置に送信する送信手段、をさらに有し、前記外部端末の前記受信手段は、前記マーク付加スキャン画像に対する前記光学文字認識処理の処理結果を前記外部連携装置から受信し、前記文書生成手段は、前記処理結果と前記行末特定用文字列とに基づいて前記処理結果の文字列における本来の行末位置を特定し、前記処理結果に係る文字列を複数の行に区分して、前記電子文書を生成することを特徴とする。
請求項8の発明は、請求項4の発明に係る電子文書生成システムにおいて、前記画像形成装置の前記補助データ生成手段は、前記各行の前記行末文字列の検出処理を、前記外部連携装置による前記光学文字認識処理に並行して実行することを特徴とする。
請求項9の発明は、請求項5の発明に係る電子文書生成システムにおいて、前記画像形成装置の前記補助データ生成手段は、前記各行の文字のフォントサイズの検出処理を、前記外部連携装置による前記光学文字認識処理に並行して実行することを特徴とする。
請求項10の発明は、画像形成装置から受信したスキャン画像に関する画像データに基づき電子文書を生成する外部端末に内蔵されたコンピュータに、a)前記電子文書の生成処理に利用される補助データであって前記スキャン画像における文字列の各行の区切りを特定するための補助データを前記画像形成装置から受信するステップと、b)前記補助データに基づき前記各行の区切りを特定し、前記外部端末とは別の装置である外部連携装置と連携して、前記スキャン画像に関する画像データに基づく前記電子文書を生成するステップと、を実行させるためのプログラムであることを特徴とする。
請求項11の発明は、請求項10の発明に係るプログラムにおいて、前記ステップb)は、b−1)前記スキャン画像に関する光学文字認識処理を行うべき旨の指示と、前記スキャン画像に関する画像データとを、前記外部連携装置に送信するステップと、b−2)前記スキャン画像に関する前記光学文字認識処理の処理結果を前記外部連携装置から受信するステップと、b−3)前記処理結果を前記補助データを用いて補足して前記電子文書を生成するステップと、を有することを特徴とする。
請求項12の発明は、請求項11の発明に係るプログラムにおいて、前記ステップa)は、a−1)前記ステップb−3)よりも前に、行末特定用文字列を前記補助データとして前記画像形成装置から受信するステップ、を有し、前記ステップb)は、b−4)前記行末特定用文字列を画像化したマーク画像を前記スキャン画像における文字列の各行の行末位置に付加したマーク付加スキャン画像の画像データを、前記スキャン画像に関する画像データとして、前記ステップb−1)よりも前に前記画像形成装置から受信するステップ、をさらに有し、前記ステップb−1)においては、前記マーク付加スキャン画像の画像データが前記スキャン画像に関する画像データとして前記外部連携装置に送信され、前記ステップb−2)においては、前記スキャン画像に関する前記光学文字認識処理の処理結果として、前記マーク付加スキャン画像に対する前記光学文字認識処理の処理結果が受信され、前記ステップb−3)においては、前記処理結果と前記行末特定用文字列とに基づいて前記処理結果の文字列における本来の行末位置が特定され、前記処理結果に係る文字列が複数の行に区分されて、前記電子文書が生成されることを特徴とする。
請求項13の発明は、請求項11の発明に係るプログラムにおいて、前記ステップa)は、a−1)前記ステップb−3)よりも前に、前記スキャン画像における文字列の各行の行末文字列を前記補助データとして前記画像形成装置から受信するステップ、を有し、前記ステップb−3)においては、前記処理結果と前記各行の前記行末文字列とに基づいて前記処理結果の文字列における本来の行末位置が特定され、前記処理結果に係る文字列が複数の行に区分され、前記電子文書が生成されることを特徴とする。
請求項14の発明は、請求項11の発明に係るプログラムにおいて、前記ステップa)は、a−1)前記ステップb−3)よりも前に、前記補助データ前記画像形成装置から受信するステップ、を有し、前記補助データは、前記スキャン画像における文字列の各行の文字のフォントサイズを含み、前記ステップb−3)においては、前記処理結果の文字列における各行のフォントサイズが、前記画像形成装置から受信した前記補助データに含まれている前記各行の前記フォントサイズにそれぞれ設定されて、前記電子文書が生成されることを特徴とする。
請求項15の発明は、請求項11の発明に係るプログラムにおいて、前記ステップa)は、a−1)前記ステップb−3)よりも前に、前記補助データ前記画像形成装置から受信するステップ、を有し、前記補助データは、前記スキャン画像における複数の文字領域の各位置を含み、前記ステップb−1)においては、前記スキャン画像に含まれる前記複数の文字領域の各画像データに関する光学文字認識処理を行うべき旨の指示が前記外部連携装置に送信され、前記ステップb−2)においては、前記各画像データに関する前記光学文字認識処理の各処理結果が前記外部連携装置から受信され、前記ステップb−3)においては、前記外部連携装置から受信した前記各画像データに関する各処理結果と、前記画像形成装置から受信した前記補助データに含まれている前記複数の文字領域の各位置とに基づいて、前記各画像データに関する前記各処理結果に係る文字列が前記複数の文字領域の各位置に配置され、前記電子文書が生成されることを特徴とする。
請求項16の発明は、請求項10の発明に係るプログラムにおいて、前記ステップa)は、a−1)行末位置特定用の行末特定用文字列を画像化したマーク画像を前記スキャン画像における文字列の各行の行末位置に付加したマーク付加スキャン画像の画像データを、前記補助データとして受信するステップ、を有し、前記ステップb)は、b−1)前記マーク付加スキャン画像の画像データに関する光学文字認識処理を行うべき旨の指示と前記マーク付加スキャン画像の画像データとを、前記外部連携装置に送信するステップと、b−2)前記マーク付加スキャン画像に対する前記光学文字認識処理の処理結果を前記外部連携装置から受信するステップと、b−3)前記処理結果と前記行末特定用文字列とに基づいて前記処理結果の文字列における本来の行末位置を特定し、前記処理結果に係る文字列を複数の行に区分して、前記電子文書を生成するステップと、を有することを特徴とする。
請求項1ないし請求項16に記載の発明によれば、画像形成装置からのスキャン画像に基づき、外部端末においてさらに別の外部連携装置と連携して電子文書を生成するに際して、より好適な電子文書を生成することが可能である。
画像形成システムを示す図である。 MFP(画像形成装置)の機能ブロックを示す図である。 外部端末の概略構成を示す機能ブロック図である。 電子文書生成システムにおける動作の概略を示す図である。 電子文書生成システムにおける動作の概略を示す図である。 電子文書生成システムにおける動作を示すフローチャートである。 第2実施形態に係る動作の概略を示す図である。 第2実施形態に係る動作の概略を示す図である。 第2実施形態に係る動作を示すフローチャートである。 第3実施形態に係る動作の概略を示す図である。 第3実施形態に係る動作の概略を示す図である。 第3実施形態に係る動作を示すフローチャートである。 第4実施形態に係る動作の概略を示す図である。 第4実施形態に係る動作の概略を示す図である。 第4実施形態に係る動作を示すフローチャートである。 第5実施形態に係る動作の概略を示す図である。 第5実施形態に係る動作の概略を示す図である。 第5実施形態に係る動作を示すフローチャートである。 変形例に係る動作を示すフローチャートである。 別の変形例に係る動作の概略を示す図である。 図20の変形例に係る動作の概略を示す図である。 さらに別の変形例に係る動作の概略を示す図である。 図22の変形例に係る動作の概略を示す図である。
以下、本発明の実施形態を図面に基づいて説明する。
<1.第1実施形態>
<1−1.構成概要>
図1は、本発明に係る画像形成システム1を示す図である。図1に示すように、画像形成システム1は、画像形成装置10と外部端末50とクラウドサーバ90とを備える。
画像形成装置10と外部端末50とクラウドサーバ90とは、ネットワーク(通信ネットワーク)108を介して互いに接続される。ネットワーク108は、LAN(Local Area Network)およびインターネットなどによって構成される。また、ネットワーク108に対する接続態様は、有線接続であってもよく、或いは無線接続であってもよい。たとえば、画像形成装置10およびクラウドサーバ90はネットワーク108に対して有線接続され、外部端末50はネットワーク108に対して無線接続される。
クラウドサーバ90は、画像形成装置10とも外部端末50とも異なる外部装置(外部サーバ)である。クラウドサーバ90には、アプリケーション190(ここでは、汎用のOCR(Optical Character Recognition)アプリケーション)がインストールされている。クラウドサーバ90は、汎用的なOCR処理サービスを、アプリケーション(汎用OCRアプリとも称する)190を用いて提供するサーバである。ただし、このクラウドサーバ90(アプリケーション190)は、サーチャブルPDF(Portable Document Format)の生成処理サービスを提供しない。サーチャブルPDFは、後述するように、クラウドサーバ90との連携処理等により、外部端末50によって主に生成される。
この画像形成システム1においては、原稿のスキャン画像200(図4および図5等参照)が画像形成装置10によって生成され、スキャン画像200に関する画像データが画像形成装置10から外部端末50に送信される。外部端末50は、画像形成装置10から受信した画像データ等に基づき、電子文書500(図5等参照)を生成する。当該電子文書500の生成動作は、当該外部端末50にインストールされている電子文書生成アプリケーション150を実行すること等によって実現される。
電子文書生成アプリケーション150は、画像形成装置10およびクラウドサーバ90と連携することによって、クラウドサーバ90に依頼した連携処理の処理結果と画像形成装置10から送信されてくる補助データ300(後述)とに基づいて、電子文書500を生成する。当該電子文書500は、テキストデータ付き電子文書(ここでは、サーチャブルPDF)として生成される。クラウドサーバ90は、外部端末50(および画像形成装置10)と連携する外部装置であることから、外部連携装置とも称される。
なお、画像形成システム1は、電子文書を生成するシステムであることから、電子文書生成システムなどとも表現される。同様に、外部端末50は電子文書生成装置であるとも表現される。
<1−2.画像形成装置の構成>
図2は、画像形成装置10の機能ブロックを示す図である。ここでは、画像形成装置10として、MFP(マルチ・ファンクション・ペリフェラル(Multi-Functional Peripheral))を例示する。図2においては、MFP10の機能ブロックが示されている。
MFP10は、スキャン機能、コピー機能、ファクシミリ機能およびボックス格納機能などを備える装置(複合機とも称する)である。具体的には、MFP10は、図2の機能ブロック図に示すように、画像読取部2、印刷出力部3、通信部4、格納部5、操作部6およびコントローラ9等を備えており、これらの各部を複合的に動作させることによって、各種の機能を実現する。
画像読取部2は、MFP10の所定の位置に載置された原稿を光学的に読み取って(すなわちスキャンして)、当該原稿の画像データ(原稿画像ないしスキャン画像とも称する)を生成する処理部である。この画像読取部2は、スキャン部であるとも称される。
印刷出力部3は、印刷対象に関するデータに基づいて紙などの各種の媒体に画像を印刷出力する出力部である。
通信部4は、公衆回線等を介したファクシミリ通信を行うことが可能な処理部である。さらに、通信部4は、ネットワーク108を介したネットワーク通信を行うことも可能である。このネットワーク通信では、たとえば、TCP/IP(Transmission Control Protocol / Internet Protocol)等の各種のプロトコルが利用される。当該ネットワーク通信を利用することによって、MFP10は、所望の相手先(たとえば、外部端末50)との間で各種のデータを授受することが可能である。通信部4は、各種データを送信する送信部4aと各種データを受信する受信部4bとを有する。
格納部5は、ハードディスクドライブ(HDD)等の記憶装置で構成される。
操作部6は、MFP10に対する操作入力を受け付ける操作入力部6aと、各種情報の表示出力を行う表示部6bとを備えている。
このMFP10においては、略板状の操作パネル部6c(図1参照)が設けられている。また、操作パネル部6cは、その正面側にタッチパネル25(図1参照)を有している。タッチパネル25は、操作入力部6aの一部としても機能するとともに、表示部6bの一部としても機能する。タッチパネル25は、液晶表示パネルに各種センサ等が埋め込まれて構成され、各種情報を表示するとともに操作者からの各種の操作入力を受け付けることが可能である。
たとえば、タッチパネル25においては、各種の操作画面(メニュー画面等)(ボタン画像等を含む)が表示される。操作者は、タッチパネル25の操作画面内に仮想的に配置されるボタンを押下することによって、MFP10の各種動作内容を設定するとともに動作指示を付与することができる。
コントローラ9は、MFP10に内蔵され、MFP10を統括的に制御する制御装置である。コントローラ9は、CPUおよび各種の半導体メモリ(RAMおよびROM)等を備えるコンピュータシステムとして構成される。コントローラ9は、CPUにおいて、ROM(例えば、EEPROM)内に格納されている所定のソフトウエアプログラム(以下、単にプログラムとも称する)110(図1および図4等参照)を実行することによって、各種の処理部を実現する。なお、当該プログラム110(詳細にはプログラムモジュール群)は、USBメモリなどの可搬性の記録媒体、あるいはネットワーク108等を介してMFP10にインストールされてもよい。
具体的には、図2に示すように、コントローラ9は、当該プログラム110の実行により、通信制御部11と入力制御部12と表示制御部13と補助データ生成部15とを含む各種の処理部を実現する。
通信制御部11は、他の装置(外部端末50等)との間の通信動作を通信部4等と協働して制御する処理部である。たとえば、通信制御部11は、スキャン画像等を外部端末50送信する。
入力制御部12は、操作入力部6a(タッチパネル25等)に対する操作入力動作を制御する制御部である。たとえば、入力制御部12は、タッチパネル25に表示された操作画面に対する操作入力を受け付ける動作を制御する。
表示制御部13は、表示部6b(タッチパネル25等)における表示動作を制御する処理部である。表示制御部13は、たとえば、MFP10を操作するための操作画面をタッチパネル25に表示させる。
補助データ生成部15は、補助データ(補足データあるいは補正データとも称される)300を生成する処理部である。この補助データ300は、元のスキャン画像201の画像データ自体とは別のデータ(補助的なデータ)であり、クラウドサーバ90と連携した電子文書生成処理にて利用されるデータである。
<1−3.外部端末の構成>
次に外部端末50の構成について説明する。
外部端末50は、MFP10およびクラウドサーバ90との間でのネットワーク通信が可能な情報入出力端末装置(情報端末あるいは通信端末とも称される)である。ここでは、外部端末50として、タブレット型端末を例示する。ただし、これに限定されず、外部端末50は、スマートフォンあるいはパーソナルコンピュータなどであってもよい。また、外部端末は、携帯式の装置(携帯情報端末等)(携帯端末)であってもよく、あるいは、据置型の装置であってもよい。
図3は、外部端末50の概略構成を示す機能ブロック図である。
外部端末50は、図3の機能ブロック図に示すように、通信部54、格納部55、操作部56およびコントローラ59等を備えており、これらの各部を複合的に動作させることによって、各種の機能を実現する。
通信部54は、ネットワーク108を介したネットワーク通信を行うことが可能である。このネットワーク通信では、たとえば、TCP/IP(Transmission Control Protocol / Internet Protocol)等の各種のプロトコルが利用される。当該ネットワーク通信を利用することによって、外部端末50は、所望の相手先(MFP10およびクラウドサーバ90等)との間で各種のデータを授受することが可能である。通信部54は、各種データを送信する送信部54aと各種データを受信する受信部54bとを有する。たとえば、受信部54bは、スキャン画像200等を画像形成装置10から受信し、送信部54aは、スキャン画像200に関する画像データをクラウドサーバ90に送信する。また、受信部54bは、スキャン画像200に関するOCR処理結果等をクラウドサーバ90から受信する。
格納部55は、不揮発性の半導体メモリ等の記憶装置で構成され、各種の情報を格納する。
操作部56は、外部端末50に対する操作入力を受け付ける操作入力部56aと、各種情報の表示出力を行う表示部56bとを備えている。この外部端末50においては、液晶表示パネルに各種センサ等が埋め込まれて構成されたタッチパネル75(図1参照)が設けられている。具体的には、図1に示すように、略板状の外部端末50の正面側において、その周縁部(枠部)を除くほぼ全面にわたってタッチパネル75が設けられている。このタッチパネル75は、ユーザインターフェイス部として機能する。換言すれば、タッチパネル75は、操作入力部56aの一部としても機能するとともに、表示部56bの一部としても機能する。
図3のコントローラ59は、外部端末50に内蔵され、外部端末50を統括的に制御する制御装置である。コントローラ59は、CPUおよび各種の半導体メモリ(RAMおよびROM)等を備えるコンピュータシステムとして構成される。コントローラ59は、CPUにおいて、記憶部(半導体メモリ等)内に格納されている所定のソフトウエアプログラム(以下、アプリケーションプログラムあるいは単にプログラムとも称する)を実行することによって、各種の処理部を実現する。なお、当該プログラム(詳細にはプログラムモジュール群)は、USBメモリなどの可搬性の記録媒体、あるいはネットワーク108等を介して外部端末50にインストールされるようにしてもよい。
外部端末50には、画像形成装置10およびクラウドサーバ90との連携処理を制御するアプリケーションプログラム(単に、アプリケーションとも称する)150がインストールされている。当該アプリケーションプログラム150が外部端末50にて実行されることによって、外部端末50は、画像形成装置10にて生成されたスキャン画像200を画像形成装置10から受信するとともに、当該スキャン画像200を利用して電子文書500を生成する処理を実行する。
具体的には、コントローラ59は、当該アプリケーションプログラム150等の実行により、通信制御部61と入力制御部62と表示制御部63と文書生成部69とを含む各種の処理部を実現する。
通信制御部61は、通信部54等と協働して、MFP10およびクラウドサーバ90等との通信動作を制御する処理部である。
入力制御部62は、操作入力部56a(タッチパネル75等)に対する操作入力動作を制御する制御部である。たとえば、入力制御部62は、タッチパネル75に表示された操作画面に対するタッチ操作入力を受け付ける動作を制御する。
表示制御部63は、表示部56b(タッチパネル75等)における表示動作を制御する処理部である。表示制御部63は、たとえば、MFP10との連携処理を行うための操作画面をタッチパネル75に表示する。
なお、入力制御部62および表示制御部63は、ユーザインターフェイス制御部とも総称される。
文書生成部69は、電子文書500(図4参照)を生成する処理部である。文書生成部69は、スキャン画像200に関するOCR処理結果(テキスト情報(文字コード群))等に基づいて、電子文書500(サーチャーブルPDF等)を生成する。
<1−4.動作>
図4および図5は、電子文書生成システム1における動作の概略を示す図である。図4は、画像形成装置10から外部端末50にスキャン画像200が送信される動作等を示す図であり、図5は、外部端末50がクラウドサーバ90と連携して、スキャン画像200に関するOCR処理結果(テキストデータ400)に基づき電子文書500を生成する動作等を示す図である。また、図6は、このような動作を示すフローチャートである。
第1実施形態においては、次のような概略の動作を例示する。具体的には、図4に示すように、まず、MFP10にてスキャン画像201が生成されるとともに、当該スキャン画像201に対して行末特定用文字列(ここでは、”#*”)(後述)がその文字領域の各行の行末に画像として付加されたスキャン画像202が生成される。そして、図5にも示すように、スキャン画像202に関する画像データがMFP10から外部端末50を経由してクラウドサーバ90に送信され、当該スキャン画像202に関するOCR処理結果がクラウドサーバ90から外部端末50に送信される。外部端末50は、当該OCR処理結果(テキストデータ400)の中から、行末特定用文字列を検索して、当該OCR処理結果の文字列における本来の行末位置を特定し、当該処理結果に係る文字列を複数の行に区分して電子文書500を生成する。
以下、図4〜図6等を参照しながら、電子文書生成システム1の動作について詳細に説明する。
<スキャン画像生成等>
まず、ユーザは、スキャン対象の原稿をMFP10の原稿載置部(たとえば、自動給紙装置(ADF:Auto Document Feeder )あるいは原稿載置用ガラス面等)に載置する。
その後、ユーザは、外部端末50を操作することによって、電子文書500の生成指示を外部端末50およびMFP10に対して付与する。
具体的には、まず、外部端末50にインストールされているアプリケーション(電子文書生成アプリケーション)150(図4)の操作画面(不図示)において、スキャン処理を実行すべき装置が指定されるとともに、スキャン処理により最終的に生成される電子文書500の形式が指定される。ここでは、スキャン処理を実行すべき装置としてMFP10が指定され、当該電子文書500の形式として、サーチャブルPDF(透明テキスト付きPDF)が指定されるものとする。そして、ユーザは、電子文書生成アプリケーション150の操作画面内に表示された実行開始ボタン(電子文書500の生成処理の実行開始ボタン)を押下することにより、電子文書(ここではサーチャブルPDF)500の生成指示を外部端末50およびMFP10に対して付与する。なお、サーチャブルPDF(透明テキスト付きPDF)は、文字画像を有する画像レイヤ(表示対象レイヤ)と当該文字画像に対する文字認識結果(文字コード群)が非表示状態で埋め込まれたテキストレイヤ(非表示レイヤ)とを有するPDF形式の電子文書である。
外部端末50は、当該生成指示を受け付けるとともに、当該生成指示(詳細には、当該生成指示に基づくスキャン画像生成指示等)をMFP10に転送する。
MFP10は、当該生成指示(スキャン画像生成指示等)を外部端末50から受信するとスキャン動作を開始し、MFP10の原稿載置部(ADF等)に載置された原稿のスキャン画像200(201とも称する)を生成する(図4の左上参照)(ステップS11(図6))。
また、MFP10は、スキャン画像201内における各種の領域を判別する領域判別処理を行う。具体的には、MFP10は、スキャン画像201内における文字領域210(図4)と非文字領域(写真領域等)220(図4参照)とを判別し、スキャン画像200における文字領域210の範囲(詳細にはその位置および大きさ)と非文字領域220の範囲とを特定する(ステップS12)。
さらに、MFP10(詳細には補助データ生成部15)は、スキャン画像200に対して画像処理を施すことにより、スキャン画像200の文字領域210における文字列の各行(詳細には、当該各行に対応する部分領域)を抽出する(ステップS13)。
また、ステップS14において、補助データ生成部15は、スキャン画像200に対して画像処理を施すことにより、当該各行の行末位置(末端位置)をも検出する。そして、補助データ生成部15は、行末特定用文字列に基づく「マーク画像」(次述)を生成するとともに、スキャン画像200(201)の文字領域210における文字列の各行の行末位置に当該マーク画像を配置してスキャン画像200を更新する(ステップS14)。
更新後のスキャン画像200(202とも称する)(図4の左下参照)は、元のスキャン画像201(200)にマーク画像を付加した画像である。換言すれば、スキャン画像202は、マーク画像が付された文字領域画像(マーク画像付き文字領域画像データ)を有する画像である。
マーク画像は、行末位置特定用の文字列(行末特定用文字列)(特定マークなどとも称する)が画像化されたものであり、行末特定用文字列は、OCR処理結果に係る文章(文字列)において元の原稿(スキャン画像)での行末位置を特定するための所定の文字列である。行末特定用文字列は、たとえば、1文字〜数文字の文字の組合せで構成される。行末特定用文字列は、文章における行末位置を特定するための文字列であり、通常の文章には出現し難い文字列であることが好ましい。ここでは、文字列”#*”が行末特定用文字列として例示されている。なお、これに限定されず、行末特定用文字列は、その他の文字列(数字および記号を含む)であってもよい。
図4の左下に示すように、スキャン画像200(202)の文字領域210の各行の行末に、特定マーク”#*”(行末特定用文字列)が(画像化された状態で)付されている。詳細には、第1行目の文字列「The first line」の行末に特定マーク”#*”が付されており、第2行目の文字列「The Second line」の行末と第3行目の文字列「The third line」の行末とにおいてもそれぞれ特定マーク”#*”が付されている。このように、各行の行末文字(最後尾文字)の後ろ側の隣接位置(その次の文字位置)に特定マーク”#*”が付される。
そして、MFP10(通信部4および通信制御部11等)は、スキャン画像202(詳細にはその画像データ)を外部端末50に送信する(ステップS15)。詳細には、マーク画像付き文字領域画像データ(マーク付加スキャン画像の画像データとも称する)を有するスキャン画像202の画像データが送信される。なお、スキャン画像202には、写真領域画像データ等もが含まれていてもよい。
このようにして、スキャン画像200に関する画像データ(ここではマーク付加スキャン画像202の画像データ)がMFP10から外部端末50に送信される。なお、特定マークを有するスキャン画像(マーク付加スキャン画像)202の画像データは、電子文書の生成処理に利用される(詳細には元のスキャン画像201における行末位置を特定するために利用される)補助的なデータであることから、補助データ300であるとも表現される。また、MFP10は、スキャン画像200に埋め込まれている特定マーク(行末特定用文字列)が”#*”である旨の情報をも、外部端末50に送信する。なお、行末特定用文字列が”#*”である旨を示すデータも、補助データ300であると表現され得る。
<OCR処理および電子文書生成処理等>
その後、外部端末50は、電子文書生成アプリケーション150を実行することによって、ステップS31(S31a)〜ステップS36(S36a)の処理等を実行する。
まず、外部端末50は、スキャン画像200(202)に関する画像データ等を、MFP10から受信して取得する(ステップS31a)。
つぎに、外部端末50は、スキャン画像200に関する画像データ(詳細には、マーク画像付き文字領域画像を含むスキャン画像202の画像データ)と当該画像データに対するOCR処理を行うべき旨の指示(OCR処理実行指示)とをクラウドサーバ90(詳細には、汎用OCRアプリ)に送信する(ステップS32(S32a))。ここでは、クラウドサーバ90との連携処理として、スキャン画像200に関する光学文字認識処理(OCR処理)が行われるものとする。連携処理に係る当該OCR処理は、クラウドサーバ90によって実行される。
クラウドサーバ90(アプリケーション190)は、OCR処理実行指示とスキャン画像200(202)に関する画像データとを受信すると、当該OCR処理実行指示および当該画像データに基づいてOCR処理を実行する。
図5の上段部分においては、マーク画像付き文字領域画像(3行に亘る文字列に係る画像)の画像データが、外部端末50からクラウドサーバ90に受け渡される様子が示されている。クラウドサーバ90は、受け取った画像データに対してOCR処理を施し、当該画像データに含まれる文字列を認識して、当該文字列に係るテキストデータ(文字コード群)400(410)を生成する。そして、クラウドサーバ90は、当該文字列に係るテキストデータ(テキスト情報)400をOCR処理の処理結果(マーク付加スキャン画像に対する光学文字認識処理の処理結果)として外部端末50に向けて送信する。
ステップS33(S33a)において、外部端末50は、クラウドサーバ90からの当該処理結果を受信する。当該処理結果に係る文字列(テキストデータ)には、元のスキャン画像201に含まれていた文字列のみならず、行末特定用文字列「#*」も含まれている。たとえば、図5においては、行末特定用文字列「#*」を含む文字列「The first line #* The second line #* The third line #*」が、クラウドサーバ90から外部端末50へと受け渡されている様子が示されている。
ステップS34(S34a)においては、外部端末50は、当該処理結果(テキストデータ410)と行末特定用文字列(補助データ300)とに基づいて当該処理結果の文字列における本来の行末位置を特定する。詳細には、マーク画像に対応する行末特定用文字列「#*」をテキストデータ410の中から検索(文字検索)する検索処理によって、テキストデータ410における特定マーク「#*」の各存在位置を(各行の)各行末位置としてそれぞれ検出する。
そして、ステップS35(S35a)では、マーク付き文字領域画像に関する処理結果であるテキストデータ410の修正処理が行われる。具体的には、ステップS34にて検出された特定マークの各マーク位置(検出位置)において、当該特定マークが削除され、当該特定マークに代えて改行コード(改行情報)がそれぞれ挿入される。行末位置に特定マークに代えて挿入された改行コードを利用することによって、行の区切りが不明であった文字列において各行の行末が認識され、当該文字列が複数の行に区分される。
ステップS36において、外部端末50(文書生成部69等)は、ステップS35aで更新されたテキストデータ410(412)に含まれる文字列を、電子文書500内に配置する(図5も参照)。これにより、当該テキストデータ410(412)に含まれる文字列は、電子文書500(PDF文書)内に取り込まれたスキャン画像200上において、複数の行に区分されて配置される。詳細には、文書生成部69は、当該テキストデータ410(412)を電子文書500内において「非表示状態」で埋め込む。換言すれば、改行コードによって複数の行に区分されたテキストデータが、サーチャブルPDFのテキストレイヤ(非表示レイヤ)において配置される。
また、非文字領域(写真領域等)220がスキャン画像に含まれる場合には、当該非文字領域に係る画像が電子文書500内に配置される。
このようにして、電子文書(サーチャブルPDF)500が生成される。
図5の下段左側には、上述の動作によって生成された電子文書500(サーチャブルPDF)の一例が示されている。ここでは、スキャン画像200の文字領域210において、電子文書500内に元の原稿と同じ位置で改行された3行の文字列が表示されている。このサーチャブルPDFでは、元の文字領域210の画像が削除されずに表示されたまま、OCR処理結果に係る文字列が非表示状態で埋め込まれている。なお、スキャン画像200の非文字領域220が存在する場合には、非文字領域220は、OCR処理を経ることなく、電子文書500内の対応領域にそのまま配置される。
以上のように、この第1実施形態においては、画像形成装置10は、電子文書500の生成処理に利用される補助データ300(スキャン画像202の画像データおよび/または行末特定用文字列の情報)を生成し、当該補助データ300を外部端末50に送信する。そして、外部端末50は、当該補助データ300を利用しつつ、クラウドサーバ90(外部連携装置)と連携して、スキャン画像に関する画像データに基づく電子文書500を生成する。画像形成装置からのスキャン画像に基づき、外部端末においてさらに別の外部連携装置と連携して電子文書を生成するに際して、補助データ300を利用することによれば、より好適な電子文書を生成することが可能である。
より詳細には、外部端末50は、マーク付加スキャン画像の画像データを画像形成装置10から受信するとともにクラウドサーバ90に送信する。また、外部端末50は、クラウドサーバ90からの処理結果を補助データ300(行末特定用文字列)を用いて補足し電子文書500を生成する。具体的には、外部端末50は、クラウドサーバ90からの処理結果のみならずMFP10からの補助データ300(行末特定用文字列)にも基づいて、当該処理結果の文字列における本来の行末位置を特定し、処理結果に係る文字列を複数の行に区分した状態で電子文書500を生成する。
また、このような動作は、次のようにも表現できる。具体的には、外部端末50は、マーク付加スキャン画像の画像データを補助データ300として画像形成装置10から受信するとともに、当該マーク付加スキャン画像の画像データをクラウドサーバ90に送信する。また、外部端末50は、クラウドサーバ90からの処理結果を行末特定用文字列を用いて補足し電子文書500を生成する。具体的には、外部端末50は、クラウドサーバ90からの処理結果のみならずMFP10からの行末特定用文字列にも基づいて、当該処理結果の文字列における本来の行末位置を特定し、処理結果に係る文字列を複数の行に区分した状態で電子文書500を生成する。
特に、仮に、元のスキャン画像201がクラウドサーバ90に送信される場合には、当該スキャン画像201の文章の各行の行末位置の情報は、クラウドサーバ90から外部端末50へと送信されるOCR処理結果には含まれない。そして、当該処理結果がそのまま電子文書500内に埋め込まれるときには、上述のように、行末情報の欠落に起因して、各行の行末(および次の行の行頭)には本来の文字とは異なる文字が配置されることがある。
これに対して、上記実施形態によれば、各行の行末位置をより適切に判定し、より好適な電子文書を生成することが可能である。より詳細には、OCR処理結果に係るテキスト文字列を本来の位置に適切に配置した状態で、サーチャーブルPDF(電子文書500)を生成することが可能である。
なお、このような問題を解決するためには、(MFP10ではなく)外部端末50が上記のような行末位置の検出処理等を行うことも考えられる。しかしながら、外部端末50において、行末位置の検出処理等を実現する新たなプログラムを開発することには多大な労力を要する。これに対して、上記実施形態においては、MFP10による行末位置の検出処理等は、開発済みプログラムにおけるMFP用OCR機能の一部(行末位置の検出機能)を用いることによって、容易に実現することが可能である。すなわち、MFP10は、補助データ300を容易に生成することが可能である。ひいては、電子文書生成システムが比較的容易に構築され得る。
また、上記実施形態においては、外部連携装置(クラウドサーバ90)によって提供されるOCR処理サービスが利用されている。これによれば、OCR処理の依頼元装置(たとえば外部端末50)とは別の装置(クラウドサーバ)でOCR処理を行うことができるので、当該依頼元装置の処理負荷を低減することが可能である。
さらに、上記実施形態においては、スキャン画像200の生成装置であるMFP10とは別の装置(外部端末50)によって、電子文書500の生成処理が行われているので、MFP10の処理負荷を低減することが可能である。換言すれば、MFP10と外部端末50との間で処理負荷を適宜に分散することが可能である。
<2.第2実施形態>
第2実施形態は、第1実施形態の変形例である。以下では、第1実施形態との相違点を中心に説明する。
この第2実施形態においては、次のような概略の動作が例示される。具体的には、図7および図8に示すように、まず、MFP10にてスキャン画像201が生成されるとともに、当該スキャン画像201に関する画像データが外部端末50を経由してMFP10からクラウドサーバ90に送信され、当該スキャン画像201に関するOCR処理結果(テキストデータ400(420))がクラウドサーバ90から外部端末50に送信される。また、MFP10は、スキャン画像201における文字列の各行の行末文字列をOCR処理により検出し、各行の行末文字列(詳細には当該行末文字列の各文字の文字コード)をそれぞれ補助データ300(320)として生成する(図7)。そして、MFP10は、(スキャン画像201のみならず)当該補助データ320をも外部端末50に送信する。外部端末50は、MFP10から受信した補助データ320とクラウドサーバ90から受信したOCR処理結果(テキストデータ420)とに基づいて、OCR処理結果の文字列における本来の行末位置を特定し、OCR処理結果に係る文字列を複数の行に区分して電子文書500を生成する。
以下では、このような動作について図7〜図9等を参照しながら詳細に説明する。なお、図7、図8および図9は、第2実施形態に係る動作等を示す図であり、第1実施形態の図4、図5および図6にそれぞれ対応する。
まず、図9に示すように、ステップS11〜S13の処理が第1実施形態と同様に行われる。
つぎに、ステップS14bにおいて、MFP10の補助データ生成部15は、ステップS13で抽出された各行領域(文字列画像)において、それぞれの行末領域(たとえば、1行の全幅の所定割合(たとえば30%)の横幅を有する行末の領域)に対してOCR処理を施す。これにより、スキャン画像201(詳細にはその文字領域)における文字列の各行の行末文字列(詳細には当該行末文字列の各文字の文字コード)がそれぞれ検出される。そして、MFP10は、各行の行末文字列の情報を含むテキストデータを補助データ300(320)として生成する。たとえば、図7のテキストデータ320においては、1行目の行末文字列として検出された文字列「line」と2行目の行末文字列として検出された文字列「line」と3行目の行末文字列として検出された文字列「line」とが含まれている。
ここにおいて、「行末領域」の大きさ(幅)は、MFP10の処理負荷等を考慮して適宜に定められればよい。たとえば、1行の横幅の数%〜50%の横幅を有する行末の領域が、「行末領域」として定められればよい。詳細には、行末位置検出処理の処理精度を優先する場合には、比較的大きな(長い)領域(たとえば10文字相当分の行末領域)が「行末領域」として定められればよい。逆に、行末位置検出処理の処理速度を優先する場合には、比較的小さな(短い)領域(たとえば3文字相当分の行末領域)が「行末領域」として定められればよい。また、行末領域の大きさ(幅)は、ユーザの設定操作等によって変更され得ることが好ましい。
そして、ステップS15bにおいて、MFP10は、スキャン画像201(詳細にはその画像データ)を外部端末50に送信するとともに、補助データ(テキストデータ320)をも外部端末50に送信する。
その後、外部端末50は、ステップS31(S31b)〜ステップS36(S36b)の処理等を実行する。
まず、外部端末50は、スキャン画像200(201)に関する画像データ等を、MFP10から受信して取得する(ステップS31)。
つぎに、外部端末50は、スキャン画像200に関する画像データ(詳細には、元のスキャン画像201の画像データ)と当該画像データに対するOCR処理を行うべき旨の指示(OCR処理実行指示)とをクラウドサーバ90(詳細には、汎用OCRアプリ190)に送信する(ステップS32(S32b))。
クラウドサーバ90(アプリケーション190)は、OCR処理実行指示とスキャン画像200(201)に関する画像データとを受信すると、当該OCR処理実行指示および当該画像データに基づいてOCR処理を実行する。
クラウドサーバ90は、外部端末50から受信した画像データに対してOCR処理を施し、当該画像データに含まれる文字列を認識して、当該文字列に係るテキストデータ(文字コード群)400(420)を生成する。そして、クラウドサーバ90は、当該文字列に係るテキストデータ(テキスト情報)420をOCR処理の処理結果(スキャン画像201に対する光学文字認識処理の処理結果)として外部端末50に向けて送信する。
ステップS33(S33b)において、外部端末50は、クラウドサーバ90からの当該処理結果(テキストデータ420)をクラウドサーバ90から受信する。たとえば、図8においては、文字列「The first line The second line The third line」が、クラウドサーバ90から外部端末50へと受け渡されている様子が示されている。なお、当該処理結果には、改行位置(行末位置)を示す情報は含まれない。
ステップS34(S34b)においては、外部端末50は、当該処理結果(テキストデータ420)と補助データ320とに基づいて当該処理結果の文字列における本来の行末位置を特定する。詳細には、補助データ320に含まれる各行の行末文字列(検索文字列とも称する)を検索(文字検索)する処理によって、テキストデータ420における各行末文字列の位置を(各行の)各行末位置としてそれぞれ検出する。
より詳細には、テキストデータ420(照合対象文字列)における検索文字列の位置を1文字分ずつすらしながら、当該照合対象文字列と検索文字列との一致度合い(適合度とも称する)を求める。そして、当該一致度合いが所定の閾値TH1(たとえば70%)よりも大きいことを条件として、当該照合対象文字列の位置に検索文字列が存在する旨が判定される。すなわち、テキストデータ420において、当該照合対象文字列の位置がテキストデータ420における行末位置であると判定される。
ここにおいて、当該閾値TH1は、100%であってもよいが、100%未満の値であることが好ましい。これによれば、クラウドサーバ90の誤認識等に起因して生じ得る「行末位置の誤判定」を回避ないし抑制することが可能である。たとえば、クラウドサーバ90における誤認識等に起因して、スキャン画像200中の本来の文字列「line」がテキストデータ420中に別の文字列「tine」等として含まれることがある。検索文字列「line」が照合対象文字列「tine」の位置に存在するときの上記一致度合いは「75%」(4文字中3文字が同一)として算出される。仮に、閾値TH1が100%に設定されている場合には、照合対象文字列「tine」の位置は行末位置ではない旨が判定される。一方、閾値TH1が100%未満の値(たとえば70%)に設定される場合には、この照合対象文字列「tine」の位置が正規の行末位置である旨の正常な判定結果が得られる。すなわち、クラウドサーバ90の誤認識等に起因する照合対象文字列「tine」の位置が正規の行末位置ではないと判定されることを回避ないし抑制することが可能である。
そして、ステップS35(S35b)では、ステップS34にて検出された各行末文字列の位置(行末位置)において改行コード(改行情報)がそれぞれ挿入され、テキストデータ420が修正される。行末位置に挿入された改行コードを利用することによって、行の区切りが不明であった文字列の行末が認識され、当該文字列が複数の行に区分される。
ステップS36(S36b)において、外部端末50(文書生成部69等)は、ステップS35bで修正されたテキストデータ420(422)に含まれる文字列を電子文書500内に配置する(図8も参照)。当該テキストデータ420(422)に含まれる文字列は、電子文書500(PDF文書)内に取り込まれたスキャン画像200上において、複数の行に区分されて配置される。また、当該テキストデータ422は電子文書500内において「非表示状態」で埋め込まれる。
なお、非文字領域(写真領域等)がスキャン画像に含まれる場合には、当該非文字領域に係る画像も電子文書500内に配置される。
このようにして、電子文書(サーチャブルPDF)500が生成される。
以上のように、第2実施形態においては、外部端末50(文書生成部69等)は、クラウドサーバ90からの処理結果を補助データ300を用いて補足し、電子文書500を生成する。具体的には、外部端末50は、クラウドサーバ90からの処理結果420のみならずMFP10からの補助データ320にも基づいて、当該処理結果の文字列における本来の行末位置を特定し、処理結果に係る文字列を複数の行に区分した状態で電子文書500を生成する。
このような動作によっても、第1実施形態と同様の効果を得ることが可能である。具体的には、たとえば、画像形成装置10からのスキャン画像に基づき外部端末50においてさらに別の外部連携装置90と連携して電子文書を生成するに際して、補助データ300を利用することにより、より好適な電子文書を生成することが可能である。特に、各行の行末位置をより適切に判定し、より好適な電子文書を生成することが可能である。より詳細には、OCR処理結果に係るテキスト文字列を本来の位置に適切に配置した状態で、サーチャーブルPDF(電子文書500)を生成することが可能である。
なお、上記第2実施形態では、スキャン画像における各行の行末文字列の検出処理(ステップS14b)はOCR処理実行指示(ステップS15b)の前に既に完了しているが、これに限定されない。たとえば、OCR処理実行指示がスキャン画像200に関する画像データとともにクラウドサーバ90に送信された後において、スキャン画像200における文字列の各行の行末文字列の検出処理が、クラウドサーバ90によるOCR処理に並行して、MFP10の補助データ生成部15によって実行されるようにしてもよい。これによれば、クラウドサーバ90によるスキャン画像に対するOCR処理は、スキャン画像における文字列の各行の行末文字列の検出処理(MFP10による行末文字列のOCR処理)の完了を待たずに比較的早期に開始され得るので、効率的である。特に、クラウドサーバ90でのOCR処理とMFP10での行末領域のOCR処理との両処理が並行して行われることにより、効率的な処理が行われ得る。
<3.第3実施形態>
第3実施形態は、第2実施形態の変形例である。以下では、第2実施形態との相違点を中心に説明する。
上記第2実施形態(および第1実施形態)においては、スキャン画像の文字領域における各行の行末位置を補助データ300を用いて特定する態様について説明した。
この第3実施形態においては、スキャン画像の文字領域における各行の文字のフォントサイズを補助データ300を用いて特定する態様について説明する。第3実施形態では、第2実施形態における補助データ320の代わりに、フォントサイズに関する補助データ330(後述)が利用される。
以下では、このような動作について図10〜図12等を参照しながら詳細に説明する。なお、図10、図11および図12は、第3実施形態に係る動作等を示す図であり、第2実施形態の図7、図8および図9にそれぞれ対応する。
まず、図12に示すように、ステップS11〜S13の処理が第2実施形態と同様に行われる。
次に、ステップS14cにおいて、MFP10の補助データ生成部15は、ステップS13で抽出された各行領域(文字列画像)において、それぞれの行領域において文字の大きさを検出する処理(フォントサイズ検出処理)を実行する(図10の左上部分参照)。具体的には、画像処理によって、当該行領域内において文字が実際に存在する部分の高さが検出されるとともに、当該高さに応じたフォントサイズが検出(特定)される。このような処理が文字領域内の複数の行のそれぞれについて実行され、各行のフォントサイズがそれぞれ検出される。
そして、MFP10は、各行のフォントサイズの情報を含むデータ330を補助データ300として生成する。たとえば、図10の補助データ330においては、特定された各行のフォントサイズ(1行目のフォントサイズ=20pt(ポイント)、2行目のフォントサイズ=16pt(ポイント)、3行目のフォントサイズ=16pt(ポイント)を示す情報が含まれている。
また、ステップS15cにおいて、MFP10は、スキャン画像201(詳細にはその画像データ)を外部端末50に送信するとともに、補助データ330をも外部端末50に送信する。
その後、外部端末50は、ステップS31c以降の処理を実行する。ステップS31c,S32c,S33cにおいては、第2実施形態のステップS31b,S32b,S33bと同様の処理がそれぞれ行われる。また、クラウドサーバ90も、第2実施形態と同様の処理を実行し、テキストデータ400(420)をOCR処理の処理結果(スキャン画像201に関する光学文字認識処理の処理結果)として外部端末50に向けて送信する。
ステップS34cにおいては、外部端末50は、補助データ330に基づいて、当該処理結果(テキストデータ420)の文字列における各行のフォントサイズを決定する。
そして、ステップS36cにおいて、外部端末50は、ステップS33cで受信されたテキストデータ420に含まれる文字列を、電子文書500内に配置する(図11も参照)。この際、テキストデータ420に含まれる文字列における各行のフォントサイズは、MFP10からの補助データ330に記述されたフォントサイズに設定される。換言すれば、電子文書500内に配置される各行の文字列は、MFP10によってステップS14cで決定され且つステップS31cでMFP10から受信したフォントサイズに設定される。
たとえば、電子文書500の1行目に配置される文字のフォントサイズは20ptに設定され、2行目に配置される文字のフォントサイズは16ptに設定され、3行目に配置される文字のフォントサイズは16ptに設定される。なお、当該テキストデータ420は電子文書500内において「非表示状態」で埋め込まれる。この結果、たとえば図11に示すように、1行目に20ptのフォントサイズで文字列「The first line」が埋め込まれ、2行目に16ptのフォントサイズで文字列「The second line The」が埋め込まれ、3行目に16ptのフォントサイズで文字列「third line」が埋め込まれる。
また、非文字領域(写真領域等)がスキャン画像に含まれる場合には、当該非文字領域に係る画像が電子文書500内に配置される。
このようにして、電子文書(サーチャブルPDF)500が生成される。
以上のように、第3実施形態においては、外部端末50(文書生成部69等)は、クラウドサーバ90からの処理結果420を補助データ330を用いて補足し、電子文書500を生成する。外部端末50は、クラウドサーバ90からの処理結果420のみならずMFP10からの補助データ330をも用いて、当該処理結果の文字列における本来のフォントサイズを特定し、処理結果420に係る文字列が行毎に適切なフォントサイズ(適切な大きさ)で埋め込まれた電子文書500を生成する。
このような動作によれば、画像形成装置10からのスキャン画像に基づき外部端末50においてさらに別の外部連携装置90と連携して電子文書を生成するに際して、補助データ330を利用することにより、より好適な電子文書を生成することが可能である。特に、各行のフォントサイズをより適切に判定し、より好適な電子文書を生成することが可能である。より詳細には、OCR処理結果に係るテキスト文字列が行毎の本来のフォントサイズで配置されたサーチャーブルPDF(電子文書500)を生成することが可能である。
なお、ここでは、スキャン画像における各行のフォントサイズの検出処理(ステップS14b)はOCR処理実行指示(ステップS15b)の前に既に完了しているが、これに限定されない。たとえば、OCR処理実行指示がスキャン画像200に関する画像データとともにクラウドサーバ90に送信された後において、スキャン画像における文字列の各行のフォントサイズの検出処理が、クラウドサーバ90によるOCR処理に並行して、MFP10の補助データ生成部15によって実行されるようにしてもよい。これによれば、クラウドサーバ90によるスキャン画像に対するOCR処理は、スキャン画像における文字列の各行のフォントサイズの検出処理(MFP10による行末文字列のOCR処理)の完了を待たずに比較的早期に開始され得るので、効率的である。特に、クラウドサーバ90でのOCR処理とMFP10での各行のフォントサイズ検出処理との両処理が並行して行われることにより、効率的な処理が行われ得る。
<4.第4実施形態>
第4実施形態は、第3実施形態の変形例である。以下では、第3実施形態との相違点を中心に説明する。
上記第3実施形態においては、スキャン画像の文字領域における各行の文字のフォントサイズを補助データ330を用いて特定する態様が例示されている。
この第4実施形態では、スキャン画像内の複数の領域の位置情報に関する補助データ340(後述)を用いて、スキャン画像における当該複数の領域の位置を調整する態様について例示する。
以下では、このような動作について図13〜図15等を参照しながら詳細に説明する。なお、図13、図14および図15は、第4実施形態に係る動作等を示す図であり、第2実施形態の図7、図8および図9にそれぞれ対応する。
まず、図15に示すように、第2実施形態と同様にステップS11,S12の処理がMFP10によって行われる。
次のステップS13dにおいては、スキャン画像201に対して適宜の画像処理を施すことによって、スキャン画像201における複数の文字領域(および写真領域)が抽出される。詳細には、各領域(文字領域等)の外接矩形領域(矩形領域)が、それぞれ、抽出される。
さらに、ステップS14dにおいては、当該各領域の位置(たとえば、外接矩形領域の左上の点などの代表位置)がそれぞれ特定される。
このような処理がスキャン画像201内の複数の領域のそれぞれについて実行され、電子文書500(詳細にはその各ページ)内における各領域の位置(座標位置(X,Y))が検出される。
そして、MFP10は、各領域の位置情報(座標位置(X,Y))を含むデータ340を補助データ300として生成する。たとえば、図13の補助データ340においては、第1の文字領域241(R1)の位置(X1,Y1)、第2の文字領域242(R2)の位置(X2,Y2)、および第3の文字領域243(R3)の座標位置(X3,Y3)を示す情報が含まれている。
また、ステップS15dにおいて、MFP10は、スキャン画像201(詳細には、。各領域241,242,243の(個別の)画像データ)を外部端末50に送信するとともに、補助データ340をも外部端末50に送信する。
その後、外部端末50は、ステップS31d以降の処理を実行する。ステップS31d,S32d,S33dにおいては、第3実施形態のステップS31c,S32c,S33cと同様の処理がそれぞれ行われる。また、クラウドサーバ90も、第3実施形態と同様の処理を実行し、テキストデータ400(420)をOCR処理の処理結果(スキャン画像201に関する光学文字認識処理の処理結果)として外部端末50に向けて送信する。ただし、各文字領域241,242,243の画像データに関する処理は個別に行われる。詳細には、各文字領域241,242,243の画像データが個別に外部端末50からクラウドサーバ90に送信されるとともに、各文字領域241,242,243の画像データに対する各処理結果(テキストデータ441,442,443)(図14中段参照)が個別にクラウドサーバ90から外部端末50に送信される。
また、ステップS36dにおいて、外部端末50は、ステップS33dで受信されたテキストデータ441,442,443に含まれる文字列を、電子文書500内に配置する(図14)。この際、各文字領域の各画像データに関するOCR処理結果に係る文字列は、補助データ340に記述された座標位置に基づく対応位置に配置される。なお、当該テキストデータ420は電子文書500内において「非表示状態」で埋め込まれる。
この結果、たとえば図14に示すように、文字領域241の処理結果(テキストデータ441)に含まれる文字列は、補助データ340に記述された座標位置(X1,Y1)を基準とする対応位置に配置される。同様に、各文字領域242,243の処理結果(テキストデータ442,443)に含まれる文字列は、それぞれ、補助データ340に記述された各座標位置((X2,Y2),(X3,Y3))を基準とする対応位置に配置される。なお、非文字領域(写真領域等)がスキャン画像に含まれる場合には、当該非文字領域に係る画像も電子文書500内に配置される。
このようにして、電子文書(サーチャブルPDF)500が生成される。
以上のように、第4実施形態においては、外部端末50(文書生成部69等)は、クラウドサーバ90からの各処理結果441,442,443を、補助データ340を用いて補足し、電子文書500を生成する。外部端末50は、クラウドサーバ90からの処理結果441,442,443のみならずMFP10からの補助データ340をも用いることにより、当該処理結果の文字列を、適切な位置(その本来の位置(ページ内位置))に埋め込まれた電子文書500を生成する。
このような動作によれば、画像形成装置10からのスキャン画像に基づき外部端末50においてさらに別の外部連携装置90と連携して電子文書を生成するに際して、補助データ340を利用することにより、より好適な電子文書を生成することが可能である。特に、各領域241,242,243の本来の位置をより適切に判定し、より好適な電子文書を生成することが可能である。より詳細には、スキャン画像200内の各領域241,242,243に関する個別のOCR処理結果に係る文字列がスキャン画像200内において各領域ごとにそれぞれ適切な位置に配置されたサーチャーブルPDF(電子文書500)を生成することが可能である。
<5.第5実施形態>
第5実施形態は、第4実施形態の変形例である。以下では、第4実施形態との相違点を中心に説明する。
上記第4実施形態では、スキャン画像内の複数の領域の位置情報に関する補助データ340(後述)を用いて、当該複数の領域の位置を調整する態様について例示した。
この第5実施形態では、スキャン画像内の複数の領域の言語情報に関する補助データ350(後述)を用いて、当該複数の領域のOCR処理の処理言語を指定する態様について例示する。
以下では、このような動作について図16〜図18等を参照しながら詳細に説明する。なお、図16、図17および図18は、第5実施形態に係る動作等を示す図であり、第2実施形態の図7、図8および図9にそれぞれ対応する。
まず、図18に示すように、ステップS11,S12,S13の処理が第4実施形態と同様に行われる。
次のステップS14e(図18)においては、スキャン画像201(205)内の複数の文字領域251,252,253の「言語」がそれぞれ特定される。換言すれば、各文字領域が、英語、日本語、韓国語、中国語、ドイツ語、フランス語などの複数の言語のうちのいずれで記述されているのかが判定される。具体的には、各文字領域の冒頭部分について、MFP10が複数の言語による各OCR処理を試行的に実行するとともに、各OCR処理結果に対する信頼性指数を言語ごとに算出して付与する。そして、各文字領域の言語毎の信頼性指数に基づいて、当該各文字領域の「言語」が判定される。
信頼性指数は、文字認識処理対象の文字画像とそれに最も適合する文字パターンとの一致度合いに応じて算出される。当該一致度合いが比較的高い場合には、当該文字画像に係る処理結果には比較的高い信頼性指数が付与される。一方、当該一致度合いが比較的低い場合には、当該文字画像に係る処理結果には比較的低い信頼性指数が付与される。また、文字領域内の幾つかの文字に関する信頼性指数の平均値が、当該文字領域に対する当該言語によるOCR処理結果に対する信頼性指数(評価値)として算出される。このような信頼性指数の算出処理が複数の言語のそれぞれについて実行される。そして、複数の言語のうち、最も高い信頼性指数を有するOCR処理結果に対応する言語が、当該文字領域の「言語」(言語種類)として決定される。
このような処理がスキャン画像205内の複数の文字領域のそれぞれについて実行され、電子文書500(詳細にはその各ページ)内における各文字領域の言語が検出される。
そして、MFP10は、各文字領域の言語情報を含むデータ350を補助データ300として生成する。たとえば、図16の補助データ350においては、第1の文字領域251(R1)の言語が「英語」であり、第2の文字領域252(R2)の言語が「日本語」であり、第3の文字領域253(R3)の言語が「韓国語」であることを示す情報が含まれている。換言すれば、補助データ350は、スキャン画像内の各文字領域の文字の「言語」を示す言語データを有している。
また、ステップS15eにおいて、MFP10は、スキャン画像205(詳細には、。各領域251,252,253の(個別の)画像データ)を外部端末50に送信するとともに、補助データ350をも外部端末50に送信する。
その後、外部端末50は、ステップS31e以降の処理を実行する。ステップS31e,S32e,S33eにおいては、第4実施形態のステップS31d,S32d,S33dと同様の処理がそれぞれ行われる。また、クラウドサーバ90も、第4実施形態と同様の処理を実行し、テキストデータ400をOCR処理の処理結果(スキャン画像205に関する光学文字認識処理の処理結果)として外部端末50に向けて送信する。ただし、各文字領域251,252,253の画像データに関する処理は個別に行われる。詳細には、各文字領域251,252,253の画像データが個別に外部端末50からクラウドサーバ90に送信される(図17上段参照)とともに、各文字領域251,252,253の画像データに対する各処理結果(テキストデータ451,452,453)が個別にクラウドサーバ90から外部端末50に送信される(図17中段参照)。
具体的には、ステップS32eにおいて、外部端末50は、クラウドサーバ90に対して、各文字領域251,252,253のOCR処理に使用する言語辞書をそれぞれ指定しつつ、各文字領域251,252,253の画像データをそれぞれ送信する。換言すれば、外部端末50は、言語指定を伴う指示とともに各文字領域251,252,253の画像データを送信する。当該指示は、補助データ350によって示される言語をOCR処理の処理言語として指定してOCR処理を行うべき旨の内容を有する。このように、外部端末50は、複数の文字領域のそれぞれに関して当該複数の文字領域ごとに検出された各言語による光学文字認識処理を行うべき旨の指示を、クラウドサーバ90に送信する。
そして、ステップS36eにおいて、外部端末50は、ステップS33eで受信された処理結果(テキストデータ451,452,453)に含まれる文字列を、電子文書500内に配置する(図17も参照)。詳細には、各文字領域251,252,253に対するOCR結果が、電子文書500において、当該各文字領域251,252,253の位置に配置される。なお、各領域(各文字領域等)の位置は、外部端末50によってスキャン画像200に対する画像処理等が実行されることなどにより、外部端末50によってそれぞれ検出(特定)されればよい。あるいは、第4実施形態と同様にして、当該複数の領域の位置がMFP10によって検出(特定)されるようにしてもよい。また、非文字領域(写真領域等)がスキャン画像に含まれる場合には、当該非文字領域に係る画像も同様にして電子文書500内に配置される。
このようにして、電子文書(サーチャブルPDF)500が生成される。
以上のように、第5実施形態においては、外部端末50(文書生成部69等)は、補助データ350をMFP10から受信し、当該補助データ350を利用しつつ、外部連携装置90と連携して、スキャン画像200に関する画像データに基づく電子文書500を生成する。なお、第5実施形態に係る補助データ350は、クラウドサーバ90への処理依頼時に利用されるものであり、他の第1実施形態〜第4実施形態に係る補助データ(文書構成を再現するためのデータとも表現される)のようにクラウドサーバ90の処理結果を受信した後に利用されるもの(処理結果を補足するもの)ではない。ただし、各実施形態に係る補助データ300は、電子文書500の生成処理に利用される点で共通している。
第5実施形態に係る動作によれば、画像形成装置10からのスキャン画像に基づき外部端末50においてさらに別の外部連携装置90と連携して電子文書を生成するに際して、補助データ350を利用することにより、より好適な電子文書を生成することが可能である。特に、各文字領域の本来の言語を予め特定しOCR処理言語を指定した上でOCR処理依頼(処理実行指令)がクラウドサーバ90に対して送出されるので、本来の言語とは異なる言語によるOCR処理が行われることを回避ないし抑制し、より好適な電子文書を生成することが可能である。
なお、上記第5実施形態においては、複数の文字領域に対してそれぞれ個別の言語で翻訳処理が行われれる場合が例示されているが、これに限定されない。たとえば、ページ内の少なくとも1つの文字領域に対して特定の一の言語によるOCR処理が行われれる場合に、上記の思想を適用するようにしてもよい。
また、上記第5実施形態においては、連携処理としてOCR処理のみが行われることが例示されているがこれに限定されない。たとえば、外部端末50は、OCR処理と翻訳処理とを含む複数の処理が連携処理として行われる際にも本発明の思想が適用され得る。
図19は、このような変形例に係る動作を示すフローチャートである。
ステップS11〜S15,ステップS31〜S33までは上記第5実施形態と同様の動作が行われる。
たとえば、ステップS32(S32f)においては外部端末50からクラウドサーバ90へのOCR処理依頼が行われ、ステップS33(S33f)においては当該OCR処理の処理結果がクラウドサーバ90から外部端末50に送信される。これにより、外部端末50は、各文字領域ごとの特定言語によるOCR処理結果(テキストデータ)を取得する。
また、その次のステップS42において、外部端末50は、さらに翻訳処理をクラウドサーバ90に依頼する。具体的には、ステップS33fで受信されたOCR処理結果(テキストデータ)に対する翻訳処理依頼(翻訳処理要求)を、当該OCR処理結果とともにクラウドサーバ90に送信する。この際、外部端末50は、補助データ350(図17)で指定されていたOCR処理言語を、今度は翻訳元言語として指定した上で、翻訳元言語から翻訳先言語への翻訳処理を依頼する。ここでは、翻訳先言語は特定の言語(たとえば、「日本語」あるいは「ドイツ語」等)に固定されているものとする。また、このような翻訳処理依頼は、スキャン画像200内の複数の文字領域のそれぞれに関して行われればよい。
たとえば、領域251(図17参照)に関しては、翻訳元言語として「英語」が特定されて、所定の翻訳先言語への翻訳依頼が行われる。また、領域252に関しては、翻訳元言語として「日本語」が特定されて、所定の翻訳先言語への翻訳依頼が行われる。さらに、領域253に関しては、翻訳元言語として「韓国語」が特定されて、所定の翻訳先言語への翻訳依頼が行われる。なお、翻訳元言語と翻訳先言語とが同一の場合には、クラウドサーバ90に対する翻訳依頼が行われないようにしてもよい。
そして、外部端末50は、クラウドサーバ90からの翻訳処理結果(テキストデータ)を受信する。より詳細には、スキャン画像200内の複数の文字領域のそれぞれに関する翻訳処理結果が受信される。
その後、ステップS36fにおいて、外部端末50は、ステップS42で受信された処理結果に含まれる文字列を、電子文書500内に配置する。
このようにして、電子文書(サーチャブルPDF)500が生成される。
以上のような動作によれば、画像形成装置10からのスキャン画像に基づき外部端末50においてさらに別の外部連携装置90と連携して電子文書を生成するに際して、補助データ350を利用することにより、より好適な電子文書を生成することが可能である。特に、各文字領域の本来の言語をOCR処理言語として予め特定した上でOCR処理依頼がクラウドサーバ90に対して送出されるとともに、各文字領域の本来の言語を翻訳元言語として予め特定した上で翻訳処理依頼がクラウドサーバ90に対して送出される。したがって、特に、本来の言語とは異なる言語を翻訳元言語とする翻訳処理が行われることを回避ないし抑制し、より好適な電子文書を生成することが可能である。
なお、ここでは、OCR処理と翻訳処理とを含む複数の処理を行うべき旨の指示は、当該複数の処理のうちのそれぞれを実行すべき旨の別個の指示として(別時点で)外部端末50からクラウドサーバ90に送信されているが、これに限定されない。たとえば、OCR処理と翻訳処理とを含む複数の処理を行うべき旨の指示は、当該複数の処理を一括して行うべき旨の単一の指示として(或る一つの時点で)外部端末50からクラウドサーバ90に送信されるようにしてもよい。
<6.変形例等>
以上、この発明の実施の形態について説明したが、この発明は上記説明した内容のものに限定されるものではない。
たとえば、上記においては、第3実施形態に係る思想が、第1実施形態および第2実施形態に係る思想とは独立して実現される態様が例示されている。
しかしながら、本発明はこれに限定されず、上記第3実施形態に係る思想が、他の実施形態(たとえば、第1実施形態あるいは第2実施形態)に係る思想と組み合わせて実現されるようにしてもよい。たとえば、第1実施形態(あるいは第2実施形態)において、各行のフォントサイズもが補助データ300として生成され、クラウドサーバ90からの処理結果に係る文字列の各行のフォントサイズを、MFP10から受信した「各行のフォントサイズ」に設定して、電子文書が生成されるようにしてもよい。
また、上記第4実施形態に係る思想についても同様である。たとえば、第4実施形態に係る思想は、第1実施形態および/または第3実施形態と組み合わせて実現されるようにしてもよい。
図20および図21は、第1実施形態、第3実施形態および第4実施形態の組み合わせに係る思想を実現する変形例を示す図である。図20は、第1実施形態の図4に対応する図であり、図21は、第1実施形態の図5に対応する図である。
このような変形例においては、第4実施形態と同様に、3つの文字領域241,242,243の位置(座標位置(X,Y))を示す情報がMFP10において生成される。生成された当該情報は、補助データ300(370)に包含される。また、第3実施形態および第1実施形態に係る各種処理は、文字領域ごとに適宜行われればよい。たとえば、第3実施形態と同様のフォントサイズの決定処理が、各文字領域内の「行」ごとに行われればよい。これに応じて、各文字領域内の行ごとのフォントサイズに関する情報が補助データ370に包含される。同様に、第1実施形態と同様の行末位置特定処理が、各文字領域内の行ごとに行われればよい。これに応じて、各文字領域内の行ごとの行末特定用文字列(「#*」)に関する情報等が補助データ370に包含される。なお、図20における文字領域241,242,243に関する各マーク付加スキャン画像271,272,273は、補助データ370の一部を構成するものであるとも表現される。
そして、スキャン画像200に関するOCR処理依頼等が外部端末50からクラウドサーバ90へ送信され、スキャン画像200に関するOCR処理結果がクラウドサーバ90から外部端末50へ送信される。詳細には、各マーク付加スキャン画像271,272,273に関する各OCR処理依頼等が外部端末50からクラウドサーバ90へ送信され、各マーク付加スキャン画像271,272,273に関する各OCR処理結果がクラウドサーバ90から外部端末50へ送信される。
その後、クラウドサーバ90からのOCR処理結果を補足する補足処理が、このような補助データ370に含まれる各情報を利用して外部端末50により行われればよい。
より具体的には、外部端末50は、3つの文字領域241,242,243の位置(座標位置(X,Y))を示す情報に基づいて、各文字領域241,242,243に対する各OCR処理結果(テキストデータ)471,472,473に含まれる文字列を、電子文書500内の適切な位置に配置する(図21も参照)。
また、外部端末50は、マーク付加スキャン画像271,272,273に対する各OCR処理結果(テキストデータ)471,472,473内の行末特定用文字列「#*」の存在位置に基づいて、各行の行末を特定する。そして、当該各OCR結果が、複数の行に区分された状態で配置される。
さらに、外部端末50は、各文字領域内の行ごとのフォントサイズに関する情報(補助データ370に包含される情報)に基づいて、処理結果に係る文字列を行毎に適切なフォントサイズ(適切な大きさ)で配置する。
このような動作により、図21の左下に示すような電子文書500が生成される。
また、第4実施形態に係る思想は、第2実施形態および/または第3実施形態と組み合わせて実現されるようにしてもよい。
図22および図23は、第2実施形態、第3実施形態および第4実施形態の組み合わせに係る思想を実現する変形例を示す図である。図22は、第2実施形態の図7に対応する図であり、図23は、第2実施形態の図8に対応する図である。
このような変形例においては、第4実施形態と同様に、3つの文字領域241,242,243の位置を示す情報がMFP10において生成される。生成された当該情報は、補助データ300(380)に包含される。また、第3実施形態および第2実施形態に係る各種処理は、文字領域ごとに適宜行われればよい。たとえば、第2実施形態と同様の行末位置特定処理(行末文字列の検出処理等)は、各文字領域内の行ごとに行われればよい。これに応じて、各文字領域内の行ごとの行末文字列に関する情報が補助データ380に包含される。
そして、クラウドサーバ90からのOCR処理結果を補足する補足処理が、このような補助データ380に含まれる各情報を利用して外部端末50により行われればよい。
より具体的には、外部端末50は、3つの文字領域241,242,243の位置(座標位置(X,Y))を示す情報に基づいて、各文字領域241,242,243に対する各OCR処理結果(テキストデータ)481,482,483に含まれる文字列を、電子文書500内の適切な位置に配置する(図23も参照)。
また、外部端末50は、各文字領域内の行ごとの行末文字列に関する情報に基づいて、各行の行末を特定する。そして、各文字領域のOCR結果が、複数の行に区分された状態で配置される。
さらに、外部端末50は、各文字領域内の行ごとのフォントサイズに関する情報に基づいて、処理結果に係る文字列を行毎に適切なフォントサイズ(適切な大きさ)で配置する。
このような動作により、図23の左下に示すような電子文書500が生成される。
また、上記第5実施形態に係る思想についても同様である。第5実施形態に係る思想も他の実施形態(たとえば第4実施形態等)と組み合わせて実現されるようにしても良い。
また、上記各実施形態では、最終的に生成された電子文書500(サーチャブルPDF)においては、元のスキャン画像201が表示される(表示状態で配置される)とともに、クラウドサーバ90からの処理結果(テキストデータ)が非表示状態で配置されているが、これに限定されない。たとえば、電子文書500において、クラウドサーバ90からの処理結果(テキストデータ)が可視化されて(各対応位置に)配置(表示)されるようにしてもよい。その場合、電子文書500内において元のスキャン画像201は表示されないようにしてもよい。
1 画像形成システム(電子文書生成システム)
10 MFP(画像形成装置)
50 外部端末
90 クラウドサーバ(外部連携装置)
500 電子文書
201 (元の)スキャン画像
202 マーク付加スキャン画像
300 補助データ
400 テキストデータ(処理結果)

Claims (16)

  1. 電子文書生成システムであって、
    原稿のスキャン画像を生成する画像形成装置と、
    前記画像形成装置から受信した前記スキャン画像に関する画像データに基づき電子文書を生成する外部端末と、
    を備え、
    前記画像形成装置は、
    前記電子文書の生成処理に利用される補助データであって前記スキャン画像における文字列の各行の区切りを特定するための補助データを生成する補助データ生成手段と、
    前記補助データを前記外部端末に送信する通信手段と、
    を有し、
    前記外部端末は、
    前記補助データを前記画像形成装置から受信する受信手段と、
    前記補助データに基づき前記各行の区切りを特定し、前記外部端末とは別の装置である外部連携装置と連携して、前記スキャン画像に関する画像データに基づく前記電子文書を生成する文書生成手段と、
    を有することを特徴とする電子文書生成システム。
  2. 請求項1に記載の電子文書生成システムにおいて、
    前記外部端末は、
    前記スキャン画像に関する光学文字認識処理を行うべき旨の指示と、前記スキャン画像に関する画像データとを、前記外部連携装置に送信する送信手段、
    をさらに有し、
    前記受信手段は、前記スキャン画像に関する前記光学文字認識処理の処理結果を前記外部連携装置から受信し、
    前記文書生成手段は、前記処理結果を前記補助データを用いて補足し前記電子文書を生成することを特徴とする電子文書生成システム。
  3. 請求項2に記載の電子文書生成システムにおいて、
    前記画像形成装置の前記補助データ生成手段は、前記スキャン画像における文字列の各行の行末位置を検出し、各行の行末位置特定用の行末特定用文字列を画像化したマーク画像を前記スキャン画像における前記各行の行末位置に付加したマーク付加スキャン画像の画像データを生成するとともに、前記行末特定用文字列を前記補助データとして生成し、
    前記画像形成装置の前記通信手段は、前記マーク付加スキャン画像の画像データを前記スキャン画像に関する画像データとして前記外部端末に送信し、
    前記外部端末の前記受信手段は、前記スキャン画像に関する前記光学文字認識処理の処理結果として、前記マーク付加スキャン画像に対する前記光学文字認識処理の処理結果を前記外部連携装置から受信し、
    前記外部端末の前記文書生成手段は、前記処理結果と前記行末特定用文字列とに基づいて前記処理結果の文字列における本来の行末位置を特定し、前記処理結果に係る文字列を複数の行に区分して、前記電子文書を生成することを特徴とする電子文書生成システム。
  4. 請求項2に記載の電子文書生成システムにおいて、
    前記画像形成装置の前記補助データ生成手段は、前記スキャン画像における文字列の各行の行末文字列を検出し、前記各行の前記行末文字列を前記補助データとして生成し、
    前記外部端末の前記文書生成手段は、前記処理結果と前記各行の前記行末文字列とに基づいて前記処理結果の文字列における本来の行末位置を特定し、前記処理結果に係る文字列を複数の行に区分して、前記電子文書を生成することを特徴とする電子文書生成システム。
  5. 請求項2に記載の電子文書生成システムにおいて、
    前記補助データは、前記スキャン画像に基づき前記画像形成装置により検出された、前記スキャン画像における文字列の各行の文字のフォントサイズを含み、
    前記外部端末の前記文書生成手段は、前記処理結果の文字列における各行のフォントサイズを、前記画像形成装置から受信した前記補助データに含まれている前記各行の前記フォントサイズにそれぞれ設定して、前記電子文書を生成することを特徴とする電子文書生成システム。
  6. 請求項2に記載の電子文書生成システムにおいて、
    前記補助データは、前記スキャン画像に基づき前記画像形成装置により検出された、前記スキャン画像における複数の文字領域の各位置を含み、
    前記外部端末の前記送信手段は、前記スキャン画像に含まれる前記複数の文字領域に関する各画像データと当該各画像データに関する光学文字認識処理を行うべき旨の指示とを、前記外部連携装置に送信し、
    前記外部端末の前記受信手段は、前記各画像データに関する前記光学文字認識処理の処理結果をそれぞれ前記外部連携装置から受信し、
    前記外部端末の前記文書生成手段は、前記外部連携装置から受信した前記各画像データに関する前記処理結果と、前記画像形成装置から受信した前記補助データに含まれている前記複数の文字領域の各位置とに基づいて、前記各画像データに関する前記処理結果に係る文字列を前記複数の文字領域の各位置に配置して、前記電子文書を生成することを特徴とする電子文書生成システム。
  7. 請求項1に記載の電子文書生成システムにおいて、
    前記画像形成装置の前記補助データ生成手段は、前記スキャン画像における文字列の各行の行末位置を検出するとともに、各行の行末位置特定用の行末特定用文字列を画像化したマーク画像を前記スキャン画像における前記各行の行末位置に付加したマーク付加スキャン画像の画像データを、前記補助データとして生成し、
    前記外部端末は、
    前記マーク付加スキャン画像の画像データに関する光学文字認識処理を行うべき旨の指示と前記マーク付加スキャン画像の画像データとを、前記外部連携装置に送信する送信手段、
    をさらに有し、
    前記外部端末の前記受信手段は、前記マーク付加スキャン画像に対する前記光学文字認識処理の処理結果を前記外部連携装置から受信し、
    前記文書生成手段は、前記処理結果と前記行末特定用文字列とに基づいて前記処理結果の文字列における本来の行末位置を特定し、前記処理結果に係る文字列を複数の行に区分して、前記電子文書を生成することを特徴とする電子文書生成システム。
  8. 請求項4に記載の電子文書生成システムにおいて、
    前記画像形成装置の前記補助データ生成手段は、前記各行の前記行末文字列の検出処理を、前記外部連携装置による前記光学文字認識処理に並行して実行することを特徴とする電子文書生成システム。
  9. 請求項5に記載の電子文書生成システムにおいて、
    前記画像形成装置の前記補助データ生成手段は、前記各行の文字のフォントサイズの検出処理を、前記外部連携装置による前記光学文字認識処理に並行して実行することを特徴とする電子文書生成システム。
  10. 画像形成装置から受信したスキャン画像に関する画像データに基づき電子文書を生成する外部端末に内蔵されたコンピュータに、
    a)前記電子文書の生成処理に利用される補助データであって前記スキャン画像における文字列の各行の区切りを特定するための補助データを前記画像形成装置から受信するステップと、
    b)前記補助データに基づき前記各行の区切りを特定し、前記外部端末とは別の装置である外部連携装置と連携して、前記スキャン画像に関する画像データに基づく前記電子文書を生成するステップと、
    を実行させるためのプログラム。
  11. 請求項10に記載のプログラムにおいて、
    前記ステップb)は、
    b−1)前記スキャン画像に関する光学文字認識処理を行うべき旨の指示と、前記スキャン画像に関する画像データとを、前記外部連携装置に送信するステップと、
    b−2)前記スキャン画像に関する前記光学文字認識処理の処理結果を前記外部連携装置から受信するステップと、
    b−3)前記処理結果を前記補助データを用いて補足して前記電子文書を生成するステップと、
    を有することを特徴とするプログラム。
  12. 請求項11に記載のプログラムにおいて、
    前記ステップa)は、
    a−1)前記ステップb−3)よりも前に、行末特定用文字列を前記補助データとして前記画像形成装置から受信するステップ、
    を有し、
    前記ステップb)は、
    b−4)前記行末特定用文字列を画像化したマーク画像を前記スキャン画像における文字列の各行の行末位置に付加したマーク付加スキャン画像の画像データを、前記スキャン画像に関する画像データとして、前記ステップb−1)よりも前に前記画像形成装置から受信するステップ、
    をさらに有し、
    前記ステップb−1)においては、前記マーク付加スキャン画像の画像データが前記スキャン画像に関する画像データとして前記外部連携装置に送信され、
    前記ステップb−2)においては、前記スキャン画像に関する前記光学文字認識処理の処理結果として、前記マーク付加スキャン画像に対する前記光学文字認識処理の処理結果が受信され、
    前記ステップb−3)においては、前記処理結果と前記行末特定用文字列とに基づいて前記処理結果の文字列における本来の行末位置が特定され、前記処理結果に係る文字列が複数の行に区分されて、前記電子文書が生成されることを特徴とするプログラム。
  13. 請求項11に記載のプログラムにおいて、
    前記ステップa)は、
    a−1)前記ステップb−3)よりも前に、前記スキャン画像における文字列の各行の行末文字列を前記補助データとして前記画像形成装置から受信するステップ、
    を有し、
    前記ステップb−3)においては、前記処理結果と前記各行の前記行末文字列とに基づいて前記処理結果の文字列における本来の行末位置が特定され、前記処理結果に係る文字列が複数の行に区分され、前記電子文書が生成されることを特徴とするプログラム。
  14. 請求項11に記載のプログラムにおいて、
    前記ステップa)は、
    a−1)前記ステップb−3)よりも前に、前記補助データ前記画像形成装置から受信するステップ、
    を有し、
    前記補助データは、前記スキャン画像における文字列の各行の文字のフォントサイズを含み、
    前記ステップb−3)においては、前記処理結果の文字列における各行のフォントサイズが、前記画像形成装置から受信した前記補助データに含まれている前記各行の前記フォントサイズにそれぞれ設定されて、前記電子文書が生成されることを特徴とするプログラム。
  15. 請求項11に記載のプログラムにおいて、
    前記ステップa)は、
    a−1)前記ステップb−3)よりも前に、前記補助データ前記画像形成装置から受信するステップ、
    を有し、
    前記補助データは、前記スキャン画像における複数の文字領域の各位置を含み、
    前記ステップb−1)においては、前記スキャン画像に含まれる前記複数の文字領域の各画像データに関する光学文字認識処理を行うべき旨の指示が前記外部連携装置に送信され、
    前記ステップb−2)においては、前記各画像データに関する前記光学文字認識処理の各処理結果が前記外部連携装置から受信され、
    前記ステップb−3)においては、前記外部連携装置から受信した前記各画像データに関する各処理結果と、前記画像形成装置から受信した前記補助データに含まれている前記複数の文字領域の各位置とに基づいて、前記各画像データに関する前記各処理結果に係る文字列が前記複数の文字領域の各位置に配置され、前記電子文書が生成されることを特徴とするプログラム。
  16. 請求項10に記載のプログラムにおいて、
    前記ステップa)は、
    a−1)行末位置特定用の行末特定用文字列を画像化したマーク画像を前記スキャン画像における文字列の各行の行末位置に付加したマーク付加スキャン画像の画像データを、前記補助データとして受信するステップ、
    を有し、
    前記ステップb)は、
    b−1)前記マーク付加スキャン画像の画像データに関する光学文字認識処理を行うべき旨の指示と前記マーク付加スキャン画像の画像データとを、前記外部連携装置に送信するステップと、
    b−2)前記マーク付加スキャン画像に対する前記光学文字認識処理の処理結果を前記外部連携装置から受信するステップと、
    b−3)前記処理結果と前記行末特定用文字列とに基づいて前記処理結果の文字列における本来の行末位置を特定し、前記処理結果に係る文字列を複数の行に区分して、前記電子文書を生成するステップと、
    を有することを特徴とするプログラム。
JP2014084743A 2014-04-16 2014-04-16 電子文書生成システムおよびプログラム Active JP6066108B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014084743A JP6066108B2 (ja) 2014-04-16 2014-04-16 電子文書生成システムおよびプログラム
US14/674,848 US9614984B2 (en) 2014-04-16 2015-03-31 Electronic document generation system and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014084743A JP6066108B2 (ja) 2014-04-16 2014-04-16 電子文書生成システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2015204075A JP2015204075A (ja) 2015-11-16
JP6066108B2 true JP6066108B2 (ja) 2017-01-25

Family

ID=54323042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014084743A Active JP6066108B2 (ja) 2014-04-16 2014-04-16 電子文書生成システムおよびプログラム

Country Status (2)

Country Link
US (1) US9614984B2 (ja)
JP (1) JP6066108B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10552699B2 (en) 2016-12-27 2020-02-04 Datalogic Usa, Inc. Robust string text detection for industrial optical character recognition
US10579707B2 (en) * 2017-12-29 2020-03-03 Konica Minolta Laboratory U.S.A., Inc. Method for inferring blocks of text in electronic documents
EP3540588A1 (en) * 2018-03-16 2019-09-18 Oki Data Corporation Image processing method, image processing apparatus, and information processing terminal
JP6874729B2 (ja) * 2018-04-02 2021-05-19 日本電気株式会社 画像処理装置、画像処理方法およびプログラム
JP7476557B2 (ja) 2020-02-14 2024-05-01 株式会社リコー 機器、処理実行システム、処理実行方法、プログラム
KR20230088484A (ko) * 2020-10-23 2023-06-19 구글 엘엘씨 깊이 데이터의 송신측 지오메트리 융합

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5224038A (en) * 1989-04-05 1993-06-29 Xerox Corporation Token editor architecture
US5191612A (en) * 1990-03-13 1993-03-02 Fujitsu Limited Character recognition system
JP2000071520A (ja) * 1998-08-28 2000-03-07 Seiko Epson Corp 画像印刷方法およびその装置
US7617446B2 (en) * 2001-03-26 2009-11-10 International Business Machines Corporation Method and system for pre-print processing of web-based documents to reduce printing costs
US6952236B2 (en) * 2001-08-20 2005-10-04 Ati Technologies, Inc. System and method for conversion of text embedded in a video stream
US7495795B2 (en) * 2002-02-21 2009-02-24 Ricoh Company, Ltd. Interface for printing multimedia information
US7020838B2 (en) * 2002-09-05 2006-03-28 Vistaprint Technologies Limited System and method for identifying line breaks
JP2004195661A (ja) * 2002-12-16 2004-07-15 Fuji Xerox Co Ltd データ出力装置およびホスト装置
JP2005158034A (ja) * 2003-10-31 2005-06-16 Canon Inc 印刷方法、印刷制御装置、印刷装置及びそれらの制御方法
US20060041484A1 (en) * 2004-04-01 2006-02-23 King Martin T Methods and systems for initiating application processes by data capture from rendered documents
US8949287B2 (en) * 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US8838591B2 (en) * 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8156427B2 (en) * 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8195659B2 (en) * 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US7669148B2 (en) * 2005-08-23 2010-02-23 Ricoh Co., Ltd. System and methods for portable device for mixed media system
US20070041041A1 (en) * 2004-12-08 2007-02-22 Werner Engbrocks Method and computer program product for conversion of an input document data stream with one or more documents into a structured data file, and computer program product as well as method for generation of a rule set for such a method
JP2007011515A (ja) * 2005-06-28 2007-01-18 Star Micronics Co Ltd 印刷システム、印刷システムの制御方法及びプログラム
US7769772B2 (en) * 2005-08-23 2010-08-03 Ricoh Co., Ltd. Mixed media reality brokerage network with layout-independent recognition
JP4809057B2 (ja) 2005-12-28 2011-11-02 富士通株式会社 画像処理システム、画像処理方法、画像処理プログラム、画像処理装置及び通信端末装置
US20070226321A1 (en) * 2006-03-23 2007-09-27 R R Donnelley & Sons Company Image based document access and related systems, methods, and devices
JP2009048293A (ja) * 2007-08-15 2009-03-05 Fuji Xerox Co Ltd 情報処理システム、情報処理実行プログラム及び画像処理装置
JP4577420B2 (ja) * 2008-07-10 2010-11-10 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN105930311B (zh) * 2009-02-18 2018-10-09 谷歌有限责任公司 执行与再现文档关联的动作的方法、移动设备和可读介质
JP4772888B2 (ja) * 2009-03-27 2011-09-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
US8385652B2 (en) * 2010-03-31 2013-02-26 Microsoft Corporation Segmentation of textual lines in an image that include western characters and hieroglyphic characters
JP2012022571A (ja) * 2010-07-15 2012-02-02 Toshiba Tec Corp 翻訳制御装置および翻訳制御方法
JP2012073749A (ja) 2010-09-28 2012-04-12 Kyocera Mita Corp 画像形成装置及び画像形成プログラム
US9250834B2 (en) * 2010-12-01 2016-02-02 Xerox Corporation Method and apparatus for reading and replacing control and/or identification data in a print image to support document tracking, flow control, and security
JP5259769B2 (ja) * 2011-04-13 2013-08-07 シャープ株式会社 画像出力システム
US8767257B2 (en) * 2011-06-29 2014-07-01 Konica Minolta Laboratory U.S.A., Inc. Method and system for retrieving print media attributes from a print media database server
JP5845687B2 (ja) * 2011-07-26 2016-01-20 株式会社リコー アプリケーション配信システム
US8493579B2 (en) * 2011-09-30 2013-07-23 Konica Minolta Laboratory U.S.A., Inc. Wireless printing from a device outside the network
US9936036B2 (en) * 2011-10-28 2018-04-03 Sharp Laboratories Of America, Inc. Method and system for indirectly establishing a unique communication channel between a plurality of devices
JP5231620B2 (ja) * 2011-11-22 2013-07-10 シャープ株式会社 サーバ装置
JP2013236234A (ja) * 2012-05-08 2013-11-21 Ricoh Co Ltd 画像処理装置、画像処理システム及びプログラム
TW201401843A (zh) * 2012-06-28 2014-01-01 Avision Inc 文件掃描方法及電腦程式
JP2014119980A (ja) * 2012-12-17 2014-06-30 Canon Inc 情報処理システム、情報処理装置、制御方法およびコンピュータプログラム
JP5720706B2 (ja) * 2013-01-30 2015-05-20 コニカミノルタ株式会社 データ処理装置、データ送信方法およびデータ送信プログラム
JP5907094B2 (ja) * 2013-02-28 2016-04-20 ブラザー工業株式会社 端末装置及び機能実行装置
JP2014162222A (ja) * 2013-02-28 2014-09-08 Brother Ind Ltd 機能実行装置
JP6135191B2 (ja) * 2013-02-28 2017-05-31 ブラザー工業株式会社 端末装置及び機能実行装置
JP5761256B2 (ja) * 2013-05-31 2015-08-12 コニカミノルタ株式会社 共用データ管理システム、共用データ管理装置、共用データ管理方法、およびコンピュータプログラム
JP5853996B2 (ja) * 2013-06-10 2016-02-09 コニカミノルタ株式会社 情報システム、情報機器およびコンピュータプログラム
JP5821903B2 (ja) * 2013-06-13 2015-11-24 コニカミノルタ株式会社 クラウドサーバー、クラウド印刷システムおよびコンピュータープログラム
KR20150015775A (ko) * 2013-08-01 2015-02-11 삼성전자주식회사 화상형성 시스템 상에서 데이터 흐름을 제어하는 화상형성 디바이스 및 컴퓨팅 디바이스, 화상형성 시스템 상의 화상형성 디바이스 및 컴퓨팅 디바이스에서 데이터 흐름을 제어하는 방법
JP5900441B2 (ja) * 2013-09-17 2016-04-06 コニカミノルタ株式会社 ネットワークシステム、コード提供装置、通信方法、およびコンピュータプログラム
WO2015047033A1 (en) * 2013-09-30 2015-04-02 Samsung Electronics Co., Ltd. System and method for providing cloud printing service
JP2015115024A (ja) * 2013-12-16 2015-06-22 コニカミノルタ株式会社 プロファイル管理システム、情報機器、プロファイル更新方法およびコンピュータープログラム
JP5924351B2 (ja) * 2014-01-23 2016-05-25 コニカミノルタ株式会社 情報端末、印刷システム、印刷システムの制御方法、およびプログラム
JP5983673B2 (ja) * 2014-05-01 2016-09-06 コニカミノルタ株式会社 電子文書生成システム、画像形成装置およびプログラム
JP6056811B2 (ja) * 2014-07-14 2017-01-11 コニカミノルタ株式会社 ワークフローシステム、ワークフロー実行装置、ワークフロー実行方法およびワークフロー実行プログラム
JP6361401B2 (ja) * 2014-09-17 2018-07-25 株式会社リコー 画像処理システム、プログラム及び画像処理装置

Also Published As

Publication number Publication date
US9614984B2 (en) 2017-04-04
JP2015204075A (ja) 2015-11-16
US20150304510A1 (en) 2015-10-22

Similar Documents

Publication Publication Date Title
JP6066108B2 (ja) 電子文書生成システムおよびプログラム
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
US10528679B2 (en) System and method for real time translation
US9485368B2 (en) Electronic document generation apparatus, recording medium, and electronic document generation system
US20080050019A1 (en) Image processing apparatus, and computer program product
US8760675B2 (en) Image reading apparatus and image reading system having a reading preference input operation
JP6427964B2 (ja) 画像処理システム、情報処理装置及びプログラム
JP5942640B2 (ja) 画像処理装置およびコンピュータプログラム
JP2019159633A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2010213121A (ja) 画像処理装置、システム及び画像処理方法
JP6852666B2 (ja) 画像形成装置
US20190124219A1 (en) Setting method and setting apparatus of image forming apparatus
US20180084122A1 (en) Processing device, image forming apparatus, and non-transitory computer readable medium
JP2019220906A (ja) 画像処理システム、印刷指示装置、画像処理装置及びプログラム
JP2010109653A (ja) 画像読取装置、画像形成装置、画像読取方法および画像読取プログラム
JP7312357B2 (ja) 画像形成装置
JP6326744B2 (ja) 情報処理システム、情報処理方法およびプログラム
JP6541410B2 (ja) 画像処理装置
JP2023031908A (ja) 画像処理装置、プログラム、画像処理方法
JP2011205473A (ja) 画像読み取り装置及びこれを用いた印刷システム
JP6002618B2 (ja) 画像処理装置、画像形成装置、及び画像処理プログラム
JP2013130997A (ja) 画像形成装置
JP2009230474A (ja) 画像形成装置および所在情報処理方法
JP2009071417A (ja) 画像処理装置および画像処理プログラム
JP2010165217A (ja) 文書情報処理装置、文書情報処理方法、制御プログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151021

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161213

R150 Certificate of patent or registration of utility model

Ref document number: 6066108

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150