JP2015138496A - 文書ファイル生成装置及び文書ファイル生成方法 - Google Patents

文書ファイル生成装置及び文書ファイル生成方法 Download PDF

Info

Publication number
JP2015138496A
JP2015138496A JP2014011223A JP2014011223A JP2015138496A JP 2015138496 A JP2015138496 A JP 2015138496A JP 2014011223 A JP2014011223 A JP 2014011223A JP 2014011223 A JP2014011223 A JP 2014011223A JP 2015138496 A JP2015138496 A JP 2015138496A
Authority
JP
Japan
Prior art keywords
file
size
character
image
vectorized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014011223A
Other languages
English (en)
Other versions
JP6000992B2 (ja
Inventor
元規 平塚
Motonori Hiratsuka
元規 平塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2014011223A priority Critical patent/JP6000992B2/ja
Priority to CN201510033797.XA priority patent/CN104809099B/zh
Priority to US14/604,701 priority patent/US9575935B2/en
Publication of JP2015138496A publication Critical patent/JP2015138496A/ja
Application granted granted Critical
Publication of JP6000992B2 publication Critical patent/JP6000992B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/146Coding or compression of tree-structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

【課題】ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文書ファイルを作成すること。
【解決手段】ベクトル化の処理の開始前である第1段階で算出した第1のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化の処理の実行中である第2段階に進み、第2段階で算出した第2のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化の処理の終了後である第3段階に進み、第3段階で算出した第3のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化部11fによってベクトル化されているデータを書き込んだベクトル化ファイルが生成されるようにした。
【選択図】図1

Description

本発明は、文字認識によって得られる原稿の文字画像をデータ化し、たとえばPDF(Portable Document Format)形式などの文書ファイルを生成する文書ファイル生成装置及び文書ファイル生成方法に関する。
電子書類の規格の一種としてPDF(Portable Document Format)形式がある。PDF形式のファイル(以下、PDFファイルという)には、文書内で用いられるフォント情報をそのPFDファイル自体に埋め込んでおくことができる。そのため、フォントを埋め込んだPFDファイルは、それを作成した環境以外でも、文書に埋め込まれたフォントを用いて作成者の意図通りに描画(表示あるいは印刷)することができる。
また、PDFでは、文書を電子化するに際してファイルサイズを抑えるために、高圧縮方式が用いられている。これは、画像に含まれる文字や図形といったオブジェクト毎に画像層(画像レイヤ)で識別し、それぞれの画像レイヤに含まれるオブジェクトに応じて画像処理や画像圧縮が行われるようにしたものである。これにより、高画質と高圧縮とが同時に達成されるようになっている。
ところで、PDFで描画される、たとえば文字画像を細かく綺麗に描画させる手段の一つとして、文字画像のベクトル化が挙げられる。ところが、文字画像をベクトル化すると、ベクトル化したフォントデータの描画処理をPDFファイル上に記載する必要があり、テキストデータに対して大きくなってしまう。
このような不具合を解消する場合、たとえば特許文献1に示されている文書作成方法を適用することが考えられる。すなわち、特許文献1では、フォントを文書ファイルに埋め込むか否かの基準となるフォント名及びポイント数(すなわちサイズ)の閾値をテーブルとして入力し、処理対象の元データからその中で使用されているフォント名とポイント数とを獲得し、元データ内で使用されているフォント名がテーブル中に登録されていれば、その元データ中におけるポイント数とテーブル中のポイント数閾値とを比較し、閾値よりも大きいポイントの文字があれば、そのフォントを埋め込むものと決定するようにした文書作成方法を提案している。
特開2005−063052
上述した特許文献1では、フォント情報を含むことのできる文書情報を作成する際に、フォントの名前のみならず、フォントのポイント数(すなわちサイズ)にも着目するようにしているため、作成される文書ファイルのサイズの縮小が可能となっている。
ところが、フォント毎にポイント数などを持たせるようにすると、フォント毎のパターンが必要となり、登録されるフォント数が多くなるに従い、ファイルサイズが大きくなってしまうという問題があった。
本発明は、このような状況に鑑みてなされたものであり、ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文書ファイルを生成することができる文書ファイル生成装置及び文書ファイル生成方法を提供することを目的とする。
本発明の文書ファイル生成装置は、文字認識によって得られる原稿の文字画像をデータ化した文書ファイルを生成する文書ファイル生成装置であって、前記文字画像をベクトル化するベクトル化手段と、該ベクトル化手段によるベクトル化の処理を制御するベクトル化処理制御手段とを備え、前記ベクトル化処理制御手段は、前記ベクトル化の処理の開始前である第1段階で、前記文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、前記ベクトル化の処理の実行中である第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、前記ベクトル化の処理の終了後である第3段階で、前記文字画像の文字数及び前記ベクトル化したデータに基づく第3のファイルのサイズを算出し、前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルを生成することを特徴とする。
また、前記ベクトル化処理制御手段は、前記文字認識によって得られる原稿の文字画像を、それぞれの文字画像毎にカウントするカウント手段と、前記ファイルのサイズを算出して比較するファイルサイズ算出比較手段と、前記ベクトル化ファイル又は文書ファイルを生成する画像処理手段とを有し、前記ファイルサイズ算出比較手段は、前記第1段階で、前記文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルを算出し、前記第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、前記文字画像の文字数に該抽出された対象文字のフォントのサイズを乗じた第2のファイルを算出し、前記第3段階で、前記文字画像の文字数に前記ベクトル化によるデータを乗じた第3のファイルのサイズを算出し、前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズと前記原稿のファイルのサイズとを比較し、前記画像処理手段は、前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化ファイルを生成し、前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより大きい場合、以降の処理を中断し、前記原稿のファイルのファイル形式に従った文書ファイルを生成することを特徴とする。
また、前記ファイルサイズ算出比較手段は、前記第1のファイルのサイズを算出する際、前記カウント手段でカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズを乗じることを特徴とする。
また、前記画像処理手段は、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする。
また、前記画像処理手段は、前記文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする。
また、前記フォント辞書への登録を行う場合、既に登録済みの文字についてはその登録が行われないことを特徴とする。
本発明の文書ファイル生成方法は、文字認識によって得られる原稿の文字画像をデータ化した文書ファイルを生成する文書ファイル生成方法であって、ベクトル化手段により前記文字画像をベクトル化する工程と、ベクトル化処理制御手段により該ベクトル化手段によるベクトル化の処理を制御する工程とを有し、前記ベクトル化処理制御手段は、前記ベクトル化の処理の開始前である第1段階で、前記文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、前記ベクトル化の処理の実行中である第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、前記ベクトル化の処理の終了後である第3段階で、前記文字画像の文字数及び前記ベクトル化したデータに基づく第3のファイルのサイズを算出し、前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルを生成することを特徴とする。
また、前記ベクトル化処理制御手段は、カウント手段により、前記文字認識によって得られる原稿の文字画像を、それぞれの文字画像毎にカウントする工程と、ファイルサイズ算出比較手段により、前記ファイルのサイズを算出して比較する工程と、画像処理手段により、前記ベクトル化ファイル又は文書ファイルを生成する工程とを有し、前記ファイルサイズ算出比較手段は、前記第1段階で、前記文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルを算出し、前記第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、前記文字画像の文字数に該抽出された対象文字のフォントのサイズを乗じた第2のファイルを算出し、前記第3段階で、前記文字画像の文字数に前記ベクトル化によるデータを乗じた第3のファイルのサイズを算出し、前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズと前記原稿のファイルのサイズとを比較し、前記画像処理手段は、前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化ファイルを生成し、前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより大きい場合、以降の処理を中断し、前記原稿のファイルのファイル形式に従った文書ファイルを生成することを特徴とする。
また、前記ファイルサイズ算出比較手段は、前記第1のファイルのサイズを算出する際、前記カウント手段でカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズを乗じることを特徴とする。
また、前記画像処理手段は、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする。
また、前記画像処理手段は、前記文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする。
また、前記フォント辞書への登録を行う場合、既に登録済みの文字についてはその登録が行われないことを特徴とする。
本発明の文書ファイル生成装置及び文書ファイル生成方法では、文字画像のベクトル化の処理の開始前である第1段階で、文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、文字画像のベクトル化の処理の実行中である第2段階で、文字認識により得られる文字座標とベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、文字画像のベクトル化の処理の終了後である第3段階で、文字画像の文字数及びベクトル化したデータに基づく第3のファイルのサイズを算出し、第1段階〜第3段階で、第1〜第3のファイルのサイズが原稿のファイルのサイズより小さい場合、ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルが生成される。
よって、第3段階での比較により、第3のファイルのサイズが原稿のファイルのサイズより小さい場合、ベクトル化されているデータを書き込んだベクトル化ファイルが原稿のファイルのサイズより小さくなる。
本発明の文書ファイル生成装置及び文書ファイル生成方法によれば、第3段階での比較により、第3のファイルのサイズが原稿のファイルのサイズより小さい場合、ベクトル化されているデータを書き込んだベクトル化ファイルが原稿のファイルのサイズより小さくなることから、ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文書ファイルを生成することができる。
本発明の文書ファイル生成装置の一実施形態を説明するための図である。 図1の文書ファイル生成装置による文書ファイル生成方法の概要を説明するためのフローチャートである。 図1の文書ファイル生成装置による画像処理の概要を説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とパターンマッチングを利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とパターンマッチングを利用したベクトル化処理について説明するための図である。
以下、本発明の文書ファイル生成装置の一実施形態を、図1〜図3を参照しながら説明する。まず、図1に示すように、文書ファイル生成装置10は、制御部11、操作部12、表示部13、スキャナー部14を備えている。
制御部11は、図示しないROM内の所定のプログラムに基づき、文書ファイル生成装置10の全体の動作を制御するものであり、操作受付部11a、画像認識部11b、画像処理部11c、ファイルサイズ算出比較部11d、カウンター11e、ベクトル化部11f、メモリー11gを備えている。
操作受付部11aは、操作部12による画像処理に係わる操作を受け付ける。画像認識部11bは、スキャナー部14によって読み取られた文字画像のOCR(Optical Character Reader:文字認識)を行う。すなわち、スキャナー部14によって読み取られた文字画像が予め記憶されているパターンと照合されて特定され、その特定された文字画像のデータが得られる。
画像処理部11cは、ベクトル化部11fによってベクトル化されているデータを書き込んだ文書ファイル(以下、ベクトル化ファイルという)、又は後述の原稿20のファイル形式に従った文書ファイルの生成などを行う。ファイルサイズ算出比較部11dは、ベクトル化部11fによるベクトル化の処理開始前(第1段階)、ベクトル化部11fによるベクトル化の処理実行中(第2段階)、ベクトル化部11fによるベクトル化の処理終了後(第3段階)のそれぞれにてファイルのサイズを算出する。また、ファイルサイズ算出比較部11dは、第1段階〜第3段階のそれぞれにて算出したファイルのサイズと後述の原稿20のファイルのサイズとの比較を行うものであるが、その詳細については後述する。
カウンター11eは、画像認識部11bによって認識された文字毎の数(文字数)をカウントする。ベクトル化部11fは、画像認識部11bによって認識された文字画像のベクトル化を行うものであるが、その詳細についても後述する。メモリー11gには、スキャナー部14によって読み取られた文字画像などが記憶される。
操作部12は、画像処理を指示する際に操作されるものであり、たとえばタッチパネルで構成されている。表示部13は、画像処理などをガイドするメッセージや、画像処理を選択させる項目などを表示する。スキャナー部14は、イメージセンサ(図示省略)によって読み取られる後述の原稿20の文字画像を光学的に読み取る。
次に、図2及び図3を参照し、画像処理の概要について説明する。まず、スキャナー部14により、たとえば図3に示すような原稿20の読み取りによるOCR(文字認識)を実行させる(ステップS1)。なお、図3に示す原稿20は、たとえばPDF形式のファイル(以下、PDFファイルという)を印字した文書であり、説明の都合上、たとえばa〜dの文字画像が表示されている文字層のみを示している。
すなわち、そのPDFファイルは、上述したように、画像層(画像レイヤ)に含まれるオブジェクトに応じて画像処理や画像圧縮が行われる高圧縮方式による構成となっている。また、原稿20のPDFファイルのサイズ(描画前のPDFファイルの文字層のデータのサイズ)は、既に取得されているものとする。
また、スキャナー部14による原稿20の読み取りは、矢印で示すように、たとえば上段から順に1行ずつ行われるようになっているものとする。ここで、原稿20が読み取られると、新規の文字画像がOCR(文字認識)される毎に、それぞれ認識された文字画像の登録がカウンター11eにて行われる(ステップS2)。
すなわち、まず「a」の文字画像が認識されると、その認識された「a」の文字画像がカウンター11eのaカウンター11e−1として登録される。続いて、次の「a」の文字画像が認識されると、aカウンター11e−1の文字数が加算される。つまり、「a」の文字画像が認識される毎に、aカウンター11e−1の文字数が加算されていく。
次に、「b」の文字画像が認識されると、その認識された「b」の文字画像がカウンター11eのbカウンター11e−2として登録される。続いて、次の「b」の文字画像が認識されると、bカウンター11e−2の文字数が加算される。つまり、「b」の文字画像が認識される毎に、bカウンター11e−2の文字数が加算されていく。
次に、「c」の文字画像が認識されると、その認識された「c」の文字画像がカウンター11eのcカウンター11e−3として登録される。続いて、次の「c」の文字画像が認識されると、cカウンター11e−3の文字数が加算される。つまり、「c」の文字画像が認識される毎に、cカウンター11e−3の文字数が加算されていく。
次いで、原稿20の読み取りが終わると、ファイルサイズ算出比較部11dにより、aカウンター11e−1、bカウンター11e−2、cカウンター11e−3のそれぞれの文字画像の合計文字数と平均文字画像サイズから第1のファイルのサイズが算出される(ステップS3)。すなわち、平均文字画像サイズにそれぞれのaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算された文字画像の合計文字数を乗じることで、第1のファイルのサイズが算出される。
ここで、平均文字画像サイズを用いる理由は、「a」〜「b」のそれぞれの文字画像サイズが異なるためである。特に、たとえばひらがなと漢字を比べた場合、漢字の方が文字画像サイズが大きくなることが多い。この場合、それぞれの文字画像サイズを用いて第1のファイルのサイズを算出しようとすると、その算出が複雑になってしまうが、平均文字画像サイズを用いることで、第1のファイルのサイズの算出が容易となる。
そして、算出された第1のファイルのサイズとPDFファイルの文字層のサイズとが比較される(ステップS4)。算出された第1のファイルのサイズがPDFファイルの文字層のサイズより大きい場合(ステップS4:NO)、画像処理部11cにより、次の処理となるベクトル化部11fによる文字画像のベクトル化への移行が中断され、通常のPFDファイルが生成される(ステップS5)。ここで、通常のPDFファイルとは、文書内で用いられるフォント情報をそのファイル自体に埋め込んでおくことができる従来のファイル形式を有したものである。
なお、ベクトル化して登録されるフォントは、PDFファイルにおいて圧縮して登録されることになる。そのため、第1のファイルのサイズを算出する際は圧縮率を考慮する必要があるが、本実施形態では最低圧縮率を利用するものとする。つまり、PDFファイルにおいて、たとえば最高画質(低圧縮)、高画質、普通、低画質(高圧縮)の4通りの設定が可能であるとすると、最高画質(低圧縮)での圧縮率を利用するものとして第1のファイルのサイズが算出されるようになっている。このように、最高画質(低圧縮)での圧縮率を利用することで、画像を細かく綺麗に描画するための文書ファイルを生成することが化膿となる。
一方、算出された第1のファイルのサイズがPDFファイルの文字層のサイズより小さい場合(ステップS4:YES)、ベクトル化部11fによる文字画像のベクトル化が行われる(ステップS6)。すなわち、上述したカウンター11eのaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算されたそれぞれの文字画像である「a」〜「c」のベクトル化が行われる。
次に、画像処理部11cにより、aカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算されたそれぞれの文字画像に対して、OCR(文字認識)で得られる文字座標とベクトル化したデータの文字座標とを照らし合わせ、対象文字の抽出が行われる(ステップS7)。ちなみに、OCR(文字認識)で得られるOCR(文字認識)情報には文字座標や文字コードなどが含まれている。また、ベクトル化したデータには、線の起終点の座標(位置)などが含まれている。よって、OCR(文字認識)情報とベクトル化したデータの文字座標を照らし合わせることで、対象文字の抽出が可能となる。
次に、ファイルサイズ算出比較部11dにより、抽出された対象文字のフォントとaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算された文字画像毎の合計文字数から、それぞれの文字毎にサイズがいくつになるかが算出されることで、第2のファイルのサイズが算出される(ステップS8)。次いで、算出された第2のファイルのサイズがPDFファイルの文字層のサイズと比較される(ステップS9)。
算出された第2のファイルのサイズがPDFファイルの文字層のサイズより大きい場合(ステップS9:NO)、次の処理となるフォント置き換え処理が行われず、画像処理部11cにより通常のPDFファイルが生成される(ステップS5)。これに対し、算出された第2のファイルのサイズがPDFファイルの文字層のサイズより小さい場合(ステップS9:YES)、画像処理部11cによりフォント置き換え処理が実行される(ステップS10)。すなわち、ステップS6で行われたベクトル化部11fによるそれぞれの文字画像のベクトル化されたデータがたとえば上述したメモリー11gに記憶される。
次に、画像処理部11cによりメモリー11gに記憶されているベクトル化されたデータに基づき、第3のファイルのサイズが算出される(ステップS11)。第3のファイルのサイズは、メモリー11gに記憶されているベクトル化されたデータとファイル化の際に使用されるフォント数とから算出することができる。
そして、算出された第3のファイルのサイズとPDFファイルの文字層のサイズとが比較される(ステップS12)。ここで、その第3のファイルのサイズがPDFファイルの文字層のサイズより大きい場合(ステップS12:NO)、次の処理となるベクトル化ファイルの生成が行われず、画像処理部11cにより通常のPDFファイルが生成される(ステップS5)。
これに対し、その第3のファイルのサイズがPDFファイルの文字層のサイズより小さい場合(ステップS12:YES)、画像処理部11cによりベクトル化ファイルの生成が行われる(ステップS13)。
以上のように、本実施形態では、ステップS6でのベクトル化部11fによるそれぞれの文字画像のベクトル化の処理の開始前の段階(第1段階)でOCR(文字認識)により得られる文字画像の合計文字数と平均文字画像サイズから第1のファイルのサイズを算出し、ベクトル化部11fによるベクトル化の処理の実行中の段階(第2段階)でOCR(文字認識)情報とベクトル化したデータの文字座標との照合により抽出された対象文字のフォントとaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算された文字画像毎の合計文字数から得られる第2のファイルのサイズを算出し、ベクトル化部11fによるベクトル化の処理の終了後の段階(第3段階)でベクトル化されたデータとファイル化の際に使用されるフォント数とから得られる第3のファイルのサイズを算出している。
そして、それぞれの段階で算出されたファイルのサイズとPDFファイルの文字層のサイズとを比較することで、最終的な第3のファイルのサイズがPDFファイルの文字層のサイズより小さければベクトル化ファイルが生成されるようになっている。
次に、上述した画像処理の具体例について説明する。図4〜図8は、ベクトル化とOCR(文字認識)を利用した文書ファイルの低サイズ化のためのベクトル化処理について説明するものである。なお、以下に説明するベクトル化処理は、上述した画像処理部11cが行うものとする。
まず、図4に示すように、原稿20を上述したスキャナー部14により読み込み、文字画像とOCR(文字認識)情報bとを取得する。なお、ベクトル画像情報(ベクトルデータ)aは、上述したように、原稿20そのもののPDFファイルの情報であり、既に取得されているものとする。また、以下に説明するフォント辞書cは、PDFファイル内に含まれているものである。ここで、描画される文字が、ベクトル画像情報(ベクトルデータ)aからでは特定できないため、OCR(文字認識)情報bから文字コードと文字座標とを取得し、以下の手順でフォント辞書cへの登録を行う。
すなわち、図5及び図6に示すように、
(1)たとえば「K」の文字画像がOCR(文字認識)されたとすると、「K」の文字画像の左端から右端の間で一致する描画開始位置のX座標を、OCR(文字認識)情報bから検索する。
(2)OCR座標(OCR(文字認識)情報bの文字座標)とベクトル画像情報aの描画開始位置のX座標とが一致した場合、Y座標の上端から下端間で一致する描画開始位置のY座標を検索する。
(3)どちらも一致した場合は、該当文字と判断しベクトル画像情報aのfillまでを文字としてフォント辞書cに登録する。
(4)既に登録済みの文字が検索で見つかった場合はフォント辞書cへの登録を行わない。
なお、図6に示すように、フォント辞書cに登録された文字がたとえば「K」「y」「o」「c」となっていると、それぞれの文字が描画処理の際にそのフォント辞書cから読み出されることになる。
次に、図7に示すように、ベクトル画像情報aのEOF(データの終端)までの検索を終えたら、次はベクトル画像情報aのベクトル座標からOCR(文字認識)情報bに対して検索をかける。ここで、OCR(文字認識)で認識できていない文字があり得るので、以下の手順でベクトル画像情報aから再度検索する。
(5)ベクトルデータの書き出し開始位置について、OCR(文字認識)で認識された文字に一致しないものを検索する。
(6)一致した文字は、別認識した記号や既にフォント辞書cに登録済みであるため破棄する。
(7)一致しない文字は、ベクトル列をまとめて1つのフォント辞書cに追加登録する。
ここで、一致しない文字のブロックができるが、9割以上はフォント辞書cに登録されるためファイルのサイズの低減につながる。
次に、図8に示すように、
(8)文字を登録したフォント辞書cからフォントを取得し、サイズ、記載座標を指定して描画処理を行う。すなわち、たとえば「K」「y」「o」「c」「o」「o」を描画する場合、それぞれの文字のフォントがフォント辞書cから取得されることになる。
次に、図9などを参照し、ベクトル化とパターンマッチングを利用した文書ファイルの低サイズ化のためのベクトル化処理について説明する。なお、以下に説明するパターンマッチングは、上述した画像処理部11cが行うものとする。
まず、図9に示すように、原稿20を上述したスキャナー部14により読み込み、文字画像を取得し、以下の手順でフォント辞書cへの登録を行う。
すなわち、図10(a)に示すように、
(1)ベクトル化前の2値画像の近傍画素において同じ輝度を持つ要素を探し出しラベルを作成する。ここでは、たとえば「K」の文字のラベルが取得されることなる。
(2)ラベル取得時の基点dの場所の座標と、縦横のドット幅を記憶する。
(3)文字画像内の記載座標に対して検索をかける。
(4)横ドット幅(X座標)を、文字画像の左端から右端の間で、一致する描画開始位置のX座標をベクトル画像情報aから検索する。
(5)X座標が一致した場合は、縦ドット幅(Y座標)の上端から下端間で一致する描画開始位置のY座標をベクトル画像情報aから検索する。
(6)どちらも一致した場合は該当文字と判断し、ベクトル画像情報aのfillまでを文字として上述したフォント辞書cに登録する。
(7)既に登録済みの文字が検索で見つかった場合はフォント辞書cへの登録を行わない。
次に、図10(b)に示すように、
(8)ラベルの重心eを決め、その重心eの位置からのラベルの特徴量を算出する。
なお、特徴量は、ラベルの重心dから最外周輪郭線間までの距離(点線矢印で示している)である。これにより対象ラベルが拡大/縮小、回転をしても特徴の周期で一致させることが可能となる。
(9)特徴量の一致する文字をベクトル画像情報aから検索する。
(10)一致した文字の座標と縦横の幅を記憶する。
(11)文字が見つからなくなるまで(9)、(10)を繰り返す。
(12)次のラベルを取得し、上記同様のパターンマッチングを行う。
このとき、記憶した文字と座標を次の検索対象から外す。
(13)描画処理の際は、フォント辞書cからフォントを取得し、サイズ、記載座標が指定される。
このように、本実施形態では、文字画像をベクトル化するベクトル化手段であるベクトル化部11fと、このベクトル化部11fによるベクトル化の処理を制御するベクトル化処理制御手段とを備えている。
そして、ベクトル化処理制御手段により、ベクトル化の処理の開始前である第1段階で算出した第1のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化の処理の実行中である第2段階に進み、第2段階で算出した第2のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化の処理の終了後である第3段階に進み、第3段階で算出した第3のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化部11fによってベクトル化されているデータを書き込んだベクトル化ファイルが生成される。
具体的には、ベクトル化処理制御手段は、文字認識によって得られる原稿20の文字画像を、それぞれの文字画像毎にカウントするカウント手段であるカウンター11eと、ファイルのサイズを算出して比較するファイルサイズ算出比較手段であるファイルサイズ算出比較部11dと、ベクトル化ファイル又は文書ファイルを生成する画像処理手段である画像処理部11cとを有している。
ファイルサイズ算出比較部11dは、第1段階で、文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルを算出し、第2段階で、文字認識により得られる文字座標とベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、文字画像の文字数に抽出された対象文字のフォントのサイズを乗じた第2のファイルを算出し、第3段階で、文字画像の文字数にベクトル化によるデータを乗じた第3のファイルのサイズを算出し、第1段階、第2段階又は第3段階のいずれかで第1〜第3のファイルのサイズと原稿のファイルのサイズとを比較している。
そして、画像処理部11cは、第1段階〜第3段階で、第1〜第3のファイルのサイズが原稿のファイルのサイズより小さい場合、ベクトル化ファイルを生成し、第1段階、第2段階又は第3段階のいずれかで第1〜第3のファイルのサイズが原稿20のファイルのサイズより大きい場合、以降の処理を中断し、原稿20のファイルのファイル形式に従った文書ファイルを生成する。
これにより、第3段階での比較により、第3のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化されているデータを書き込んだベクトル化ファイルが原稿20のファイルのサイズより小さくなることから、ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文書ファイルを生成することができる。
また、第1段階、第2段階又は第3段階のいずれかで第1〜第3のファイルのサイズが原稿20のファイルのサイズより大きい場合、以降の処理が中断されるため、無用な処理を省くことができる。
また、ファイルサイズ算出比較部11dにより第1のファイルのサイズが算出される際、カウンター11eでカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズが乗じられることから、第1のファイルのサイズの算出を容易に行うことができる。
また、画像処理部11cにより、文字認識により得られる文字座標とベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書cに登録し、この登録したベクトル化データを用いてベクトル化ファイルが生成されるようにしているので、文字認識により得られる文字画像のベクトル化を容易かつ確実に行うことができる。
また、画像処理部11cにより、文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、この登録したベクトル化データを用いてベクトル化ファイルが生成されるようにしているので、上記同様に、文字認識により得られる文字画像のベクトル化を容易かつ確実に行うことができる。
また、フォント辞書cへの登録を行う場合、既に登録済みの文字についてはその登録が行われないようにしているため、登録すべき文字画像が増えてもファイルサイズが増大してしまうことを抑制することができる。
10 文書ファイル生成装置
11 制御部
11a 操作受付部
11b 画像認識部
11c 画像処理部
11d ファイルサイズ算出比較部
11e カウンター
11e−1 aカウンター
11e−2 bカウンター
11e−3 cカウンター
11f ベクトル化部
11g メモリー
12 操作部
13 表示部
14 スキャナー部
20 原稿
a ベクトル画像情報(ベクトルデータ)
b OCR(文字認識)情報
c フォント辞書
d 基点
e 重心

Claims (12)

  1. 文字認識によって得られる原稿の文字画像をデータ化した文書ファイルを生成する文書ファイル生成装置であって、
    前記文字画像をベクトル化するベクトル化手段と、
    該ベクトル化手段によるベクトル化の処理を制御するベクトル化処理制御手段とを備え、
    前記ベクトル化処理制御手段は、
    前記ベクトル化の処理の開始前である第1段階で、前記文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、
    前記ベクトル化の処理の実行中である第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、
    前記ベクトル化の処理の終了後である第3段階で、前記文字画像の文字数及び前記ベクトル化したデータに基づく第3のファイルのサイズを算出し、
    前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルを生成する
    ことを特徴とする文書ファイル生成装置。
  2. 前記ベクトル化処理制御手段は、
    前記文字認識によって得られる原稿の文字画像を、それぞれの文字画像毎にカウントするカウント手段と、
    前記ファイルのサイズを算出して比較するファイルサイズ算出比較手段と、
    前記ベクトル化ファイル又は文書ファイルを生成する画像処理手段とを有し、
    前記ファイルサイズ算出比較手段は、
    前記第1段階で、前記文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルを算出し、
    前記第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、前記文字画像の文字数に該抽出された対象文字のフォントのサイズを乗じた第2のファイルを算出し、
    前記第3段階で、前記文字画像の文字数に前記ベクトル化によるデータを乗じた第3のファイルのサイズを算出し、
    前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズと前記原稿のファイルのサイズとを比較し、
    前記画像処理手段は、
    前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化ファイルを生成し、
    前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより大きい場合、以降の処理を中断し、前記原稿のファイルのファイル形式に従った文書ファイルを生成する
    ことを特徴とする請求項1に記載の文書ファイル生成装置。
  3. 前記ファイルサイズ算出比較手段は、前記第1のファイルのサイズを算出する際、前記カウント手段でカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズを乗じることを特徴とする請求項2に記載の文書ファイル生成装置。
  4. 前記画像処理手段は、
    前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする請求項2又は3に記載の文書ファイル生成装置。
  5. 前記画像処理手段は、前記文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする請求項2又は3に記載の文書ファイル生成装置。
  6. 前記フォント辞書への登録を行う場合、既に登録済みの文字についてはその登録が行われないことを特徴とする請求項4又は5に記載の文書ファイル生成装置。
  7. 文字認識によって得られる原稿の文字画像をデータ化した文書ファイルを生成する文書ファイル生成方法であって、
    ベクトル化手段により前記文字画像をベクトル化する工程と、
    ベクトル化処理制御手段により該ベクトル化手段によるベクトル化の処理を制御する工程とを有し、
    前記ベクトル化処理制御手段は、
    前記ベクトル化の処理の開始前である第1段階で、前記文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、
    前記ベクトル化の処理の実行中である第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、
    前記ベクトル化の処理の終了後である第3段階で、前記文字画像の文字数及び前記ベクトル化したデータに基づく第3のファイルのサイズを算出し、
    前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルを生成する
    ことを特徴とする文書ファイル生成方法。
  8. 前記ベクトル化処理制御手段は、
    カウント手段により、前記文字認識によって得られる原稿の文字画像を、それぞれの文字画像毎にカウントする工程と、
    ファイルサイズ算出比較手段により、前記ファイルのサイズを算出して比較する工程と、 画像処理手段により、前記ベクトル化ファイル又は文書ファイルを生成する工程とを有し、
    前記ファイルサイズ算出比較手段は、
    前記第1段階で、前記文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルを算出し、
    前記第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、前記文字画像の文字数に該抽出された対象文字のフォントのサイズを乗じた第2のファイルを算出し、
    前記第3段階で、前記文字画像の文字数に前記ベクトル化によるデータを乗じた第3のファイルのサイズを算出し、
    前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズと前記原稿のファイルのサイズとを比較し、
    前記画像処理手段は、
    前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化ファイルを生成し、
    前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより大きい場合、以降の処理を中断し、前記原稿のファイルのファイル形式に従った文書ファイルを生成する
    ことを特徴とする請求項7に記載の文書ファイル生成方法。
  9. 前記ファイルサイズ算出比較手段は、前記第1のファイルのサイズを算出する際、前記カウント手段でカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズを乗じることを特徴とする請求項8に記載の文書ファイル生成方法。
  10. 前記画像処理手段は、
    前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする請求項8又は9に記載の文書ファイル生成方法。
  11. 前記画像処理手段は、前記文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする請求項8又は9に記載の文書ファイル生成方法。
  12. 前記フォント辞書への登録を行う場合、既に登録済みの文字についてはその登録が行われないことを特徴とする請求項10又は11に記載の文書ファイル生成方法。
JP2014011223A 2014-01-24 2014-01-24 文書ファイル生成装置及び文書ファイル生成方法 Expired - Fee Related JP6000992B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014011223A JP6000992B2 (ja) 2014-01-24 2014-01-24 文書ファイル生成装置及び文書ファイル生成方法
CN201510033797.XA CN104809099B (zh) 2014-01-24 2015-01-23 文档文件生成装置及文档文件生成方法
US14/604,701 US9575935B2 (en) 2014-01-24 2015-01-24 Document file generating device and document file generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014011223A JP6000992B2 (ja) 2014-01-24 2014-01-24 文書ファイル生成装置及び文書ファイル生成方法

Publications (2)

Publication Number Publication Date
JP2015138496A true JP2015138496A (ja) 2015-07-30
JP6000992B2 JP6000992B2 (ja) 2016-10-05

Family

ID=53680342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014011223A Expired - Fee Related JP6000992B2 (ja) 2014-01-24 2014-01-24 文書ファイル生成装置及び文書ファイル生成方法

Country Status (3)

Country Link
US (1) US9575935B2 (ja)
JP (1) JP6000992B2 (ja)
CN (1) CN104809099B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7490472B2 (ja) 2020-07-06 2024-05-27 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6729486B2 (ja) * 2017-05-15 2020-07-22 京セラドキュメントソリューションズ株式会社 情報処理装置、情報処理プログラム及び情報処理方法
CN109491977A (zh) * 2018-09-27 2019-03-19 北京车和家信息技术有限公司 一种车辆信息交接方法、服务器及***
US11275934B2 (en) * 2019-11-20 2022-03-15 Sap Se Positional embeddings for document processing
US11138424B2 (en) * 2019-11-20 2021-10-05 Sap Se Contextual vector grids for document processing
CN111597781B (zh) * 2020-05-19 2023-06-02 浪潮软件集团有限公司 非结构化大数据生成方法、***、存储介质及电子设备
CN112486477B (zh) * 2020-12-15 2024-06-04 未来电视有限公司 文件生成方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005063052A (ja) * 2003-08-08 2005-03-10 Canon Inc 文書作成方法及び文書作成装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7035463B1 (en) * 1999-03-01 2006-04-25 Matsushita Electric Industrial Co., Ltd. Document image processor, method for extracting document title, and method for imparting document tag information
JP3862694B2 (ja) * 2003-11-20 2006-12-27 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP3997198B2 (ja) * 2003-12-05 2007-10-24 キヤノン株式会社 画像処理システム及び画像処理方法
JP4510535B2 (ja) * 2004-06-24 2010-07-28 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2006023944A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
US7831107B2 (en) * 2005-10-17 2010-11-09 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program
US7460710B2 (en) * 2006-03-29 2008-12-02 Amazon Technologies, Inc. Converting digital images containing text to token-based files for rendering
JP4764231B2 (ja) * 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
US8164762B2 (en) * 2006-09-07 2012-04-24 Xerox Corporation Intelligent text driven document sizing
US7944581B2 (en) * 2007-03-16 2011-05-17 Xerox Corporation Imposition systems, methods and drivers for printer products
JP4968927B2 (ja) * 2007-06-25 2012-07-04 キヤノン株式会社 画像処理装置及び画像処理方法、並びにプログラム
JP4904235B2 (ja) * 2007-09-20 2012-03-28 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
CN101419661B (zh) * 2007-10-26 2011-08-24 国际商业机器公司 基于图像中的文本进行图像显示的方法和***
JP5006764B2 (ja) * 2007-11-08 2012-08-22 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、および記憶媒体
JP5132347B2 (ja) * 2008-02-13 2013-01-30 キヤノン株式会社 画像処理システム
JP4991590B2 (ja) * 2008-02-14 2012-08-01 キヤノン株式会社 画像処理装置、画像処理方法、画像処理プログラム、及び、記憶媒体
JP5063422B2 (ja) * 2008-03-14 2012-10-31 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5111268B2 (ja) * 2008-07-09 2013-01-09 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
US8947438B2 (en) * 2011-08-01 2015-02-03 Microsoft Corporation Reducing font instructions
US8879112B2 (en) * 2012-09-28 2014-11-04 Interactive Memories, Inc. Method for optimizing printing quality for image-laden PDF files at lower file sizes
US10346560B2 (en) * 2013-02-14 2019-07-09 Plangrid, Inc. Electronic blueprint system and method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005063052A (ja) * 2003-08-08 2005-03-10 Canon Inc 文書作成方法及び文書作成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7490472B2 (ja) 2020-07-06 2024-05-27 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム

Also Published As

Publication number Publication date
US20150215653A1 (en) 2015-07-30
CN104809099A (zh) 2015-07-29
CN104809099B (zh) 2018-03-23
US9575935B2 (en) 2017-02-21
JP6000992B2 (ja) 2016-10-05

Similar Documents

Publication Publication Date Title
JP6000992B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
JP4777393B2 (ja) デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
JP6527410B2 (ja) 文字認識装置、文字認識方法、及びプログラム
US7697001B2 (en) Personalized ink font
JP4758461B2 (ja) デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
US11341739B2 (en) Image processing device, image processing method, and program recording medium
KR20140089915A (ko) 필기 문자 조정 방법 및 장치
CN111190557A (zh) 一种用于可配置打印项的证件打印方法及***
US9710945B2 (en) Method for cutting out character, character recognition apparatus using this method, and program
JP6432179B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6624120B2 (ja) 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体
KR20160053544A (ko) 후보 문자의 추출 방법
CN115035523A (zh) 一种数据识别方法及移动终端
JP2004164674A (ja) フォーマット認識装置及び文字読み取り装置
JP2014154066A (ja) 文字認識システム、文字認識プログラム及び文字認識方法
JP6055952B1 (ja) 画像検査装置、画像検査方法、およびプログラム
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP5343584B2 (ja) 情報処理装置及びプログラム
JP2010061449A (ja) 原画像探索装置及び原画像探索プログラム
JP2006323511A (ja) 記号認識方法及び装置
JP2012058869A (ja) 画像処理装置、画像形成装置および画像処理プログラム
JP4859027B2 (ja) 文字パターン生成方法および文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151120

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20160225

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160831

R150 Certificate of patent or registration of utility model

Ref document number: 6000992

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees