JP2009193283A - 文書画像処理装置、及び文書画像処理プログラム - Google Patents

文書画像処理装置、及び文書画像処理プログラム Download PDF

Info

Publication number
JP2009193283A
JP2009193283A JP2008032614A JP2008032614A JP2009193283A JP 2009193283 A JP2009193283 A JP 2009193283A JP 2008032614 A JP2008032614 A JP 2008032614A JP 2008032614 A JP2008032614 A JP 2008032614A JP 2009193283 A JP2009193283 A JP 2009193283A
Authority
JP
Japan
Prior art keywords
sentence
document image
image processing
area
line spacing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008032614A
Other languages
English (en)
Inventor
Hironari Konno
裕也 今野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2008032614A priority Critical patent/JP2009193283A/ja
Priority to US12/370,259 priority patent/US8170862B2/en
Publication of JP2009193283A publication Critical patent/JP2009193283A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】元の原稿の翻訳文を含む新たな原稿を、元原稿のバランスを崩さずに生成する。
【解決手段】文書画像処理装置10は、文書画像を文章領域に分割し、分割された各文章領域に含まれる文字を認識し、各文章領域を、その文章領域に含まれる文字のサイズ及び行間隔に基づいてグループに分類する。そして、文章領域毎に、その文章領域に含まれる文字からなる文字列を所定の言語に翻訳し、文章領域毎に、翻訳される文字列を配置した場合の文字サイズ及び行間隔を算出し、同一のグループに分類された各文章領域について算出された文字サイズ及び行間隔を、各文章領域同士の文字サイズ及び行間隔の差がそれぞれ所定値以下となるように補正する。
【選択図】図1

Description

本発明は、文書画像処理装置、及び文書画像処理プログラムに関する。
従来から、ある言語で記述された原稿を他の言語に翻訳して出力する技術は数多く提案されている。例えば、下記の特許文献1では、原稿画像に含まれるテキストを取得し、取得したテキストの訳をそのテキストと共に上下位置に合成して画像を形成する際に、原稿画像におけるテキストの幅より翻訳文の幅が小さくなるようにしている。
また、下記の特許文献2では、原稿画像のレイアウトを解析し、テキスト部分を文字認識して得た文字列に対して翻訳を行い、翻訳文を対応するレイアウトに配置した画像を生成するとともに、表面には元の原稿、裏面には翻訳した原稿を印刷する装置が提案されている。
特開平5−324720号公報 特許第3636490号
しかしながら、上記の従来技術では、文章領域毎に翻訳文の文字サイズ、文字間隔、行間隔等を調整して領域内に翻訳文を収めようとしていたため、文章領域毎に文字サイズ、文字間隔、行間隔等が区々になってしまっていた。そのため、従来の技術によると、翻訳文を含む新たな原稿では、元の原稿におけるバランスが崩れてしまうことがあった。
本発明は上記課題に鑑みてなされたものであって、本発明の目的の一つは、元の原稿の翻訳文を含む新たな原稿を、元原稿のバランスを崩さずに生成することができる文書画像処理装置、及び文書画像処理プログラムを提供することにある。
上記目的を達成するために、請求項1に記載の文書画像処理装置の発明は、文書画像を文章領域に分割する領域分割手段と、前記領域分割手段により分割された各文章領域に含まれる文字を認識する文字認識手段と、前記各文章領域を、当該文章領域に含まれる文字のサイズ及び行間隔に基づいてグループに分類する分類手段と、前記文章領域毎に、当該文章領域に含まれる文字からなる文字列を所定の言語に翻訳する翻訳手段と、前記文章領域毎に、当該文章領域に前記翻訳手段により翻訳される文字列を配置した場合の文字サイズ及び行間隔を算出する算出手段と、前記分類手段により同一のグループに分類された各文章領域について前記算出された文字サイズ及び行間隔を、前記各文章領域同士の文字サイズ及び行間隔の差がそれぞれ所定値以下となるように補正する補正手段と、を含むことを特徴とする。
また、請求項2に記載の発明は、請求項1に記載の文書画像処理装置において、前記補正手段は、前記分類手段により同一のグループに分類された各文章領域の文字サイズ及び行間隔を、当該グループに分類された文章領域のうち最小の文字サイズ及び行間隔と一致するように補正する、ことを特徴とする。
また、請求項3に記載の発明は、請求項1又は2に記載の文書画像処理装置において、前記補正手段は、前記分類手段により分類される各グループの文字サイズの大きさの順序が保たれるように、前記各グループの文字サイズを補正する、ことを特徴とする。
また、請求項4に記載の発明は、請求項3に記載の文書画像処理装置において、前記補正手段は、前記分類手段により分類される各グループの文字サイズの比に基づいて、前記各グループの文字サイズを補正する、ことを特徴とする。
また、請求項5に記載の発明は、請求項1乃至4のいずれかに記載の文書画像処理装置において、前記補正手段は、前記分類手段により分類される各グループの行間隔の大きさの順序が保たれるように、前記各グループの文字サイズを補正する、ことを特徴とする。
また、請求項6に記載の発明は、請求項5に記載の文書画像処理装置において、前記補正手段は、前記分類手段により分類される各グループの行間隔の比に基づいて、前記各グループの行間隔を補正する、ことを特徴とする。
また、請求項7に記載の発明は、請求項1乃至6のいずれかに記載の文書画像処理装置において、前記算出手段は、前記各文章領域の前記文字サイズ及び行間隔を、それぞれについて予め定められた最小値を下回らないように算出する、ことを特徴とする。
また、請求項8に記載の文書画像処理プログラムの発明は、コンピュータを、文書画像を文章領域に分割する領域分割手段と、前記領域分割手段により分割された各文章領域に含まれる文字を認識する文字認識手段と、前記各文章領域を、当該文章領域に含まれる文字のサイズ及び行間隔に基づいてグループに分類する分類手段と、前記文章領域毎に、当該文章領域に含まれる文字からなる文字列を所定の言語に翻訳する翻訳手段と、前記文章領域毎に、当該文章領域に前記翻訳手段により翻訳される文字列を配置した場合の文字サイズ及び行間隔を算出する算出手段と、前記分類手段により同一のグループに分類された各文章領域について前記算出された文字サイズ及び行間隔を、前記各文章領域同士の文字サイズ及び行間隔の差がそれぞれ所定値以下となるように補正する補正手段と、して機能させることを特徴とする。
請求項1に記載の発明によれば、元原稿の翻訳文を含む新たな原稿を生成する際に、元原稿における文字サイズと行間隔とに基づいて同一のグループに設定された文章領域については略共通した文字サイズと行間隔とするため、元の原稿のバランスを崩さずに新たな原稿を生成することができる。
請求項2に記載の発明によれば、元の原稿の文章領域に収まるように翻訳文を配置できるため、元の原稿のバランスを崩さずに新たな原稿を生成することができる。
請求項3に記載の発明によれば、元原稿の翻訳文を含む新たな原稿において、元原稿の文章領域の文字サイズの相対的な大小関係を保つようにすることで、元の原稿のバランスを崩さずに新たな原稿を生成することができる。
請求項4に記載の発明によれば、元原稿の翻訳文を含む新たな原稿において、元原稿の文章領域の文字サイズの比を保つようにすることで、元の原稿のバランスを崩さずに新たな原稿を生成することができる。
請求項5に記載の発明によれば、元原稿の翻訳文を含む新たな原稿において、元原稿の文章領域の行間隔の相対的な大小関係を保つようにすることで、元の原稿のバランスを崩さずに新たな原稿を生成することができる。
請求項6に記載の発明によれば、元原稿の翻訳文を含む新たな原稿において、元原稿の文章領域の行間隔の比を保つようにすることで、元の原稿のバランスを崩さずに新たな原稿を生成することができる。
請求項7に記載の発明によれば、元原稿の翻訳文を含む新たな原稿において、文字サイズに対して行間隔が小さくなり過ぎないようにすることができる。
請求項8に記載の発明によれば、元原稿の翻訳文を含む新たな原稿を生成する際に、元原稿において文字サイズと行間隔とに基づいて同一のグループに設定された文章領域については略共通した文字サイズと行間隔に補正するため、元の原稿のバランスを崩さずに新たな原稿を生成するようにコンピュータを機能させることができる。
以下、本発明を実施するための好適な実施の形態(以下、実施形態という)を、図面に従って説明する。
図1には、本実施形態に係る文書画像処理装置10の機能ブロック図を示す。図1に示されるように、文書画像処理装置10は、画像取得部12、レイアウト解析部14、文字認識部16、文字サイズ・行間隔測定部18、グループ分類部20、翻訳処理部22、翻訳文サイズ決定部24、翻訳文サイズ算出部26、翻訳文サイズ補正部28及び翻訳文書生成部30を含み構成される。各部の機能は、コンピュータ読み取り可能な情報記憶媒体に格納された文書画像処理プログラムが、図示しない媒体読取装置を用いてコンピュータシステムたる文書画像処理装置10に読み込まれ、該文書画像処理装置10により実行されることで実現されるものとしてよい。なお、ここでは情報記憶媒体によって文書画像処理プログラムが文書画像処理装置10に供給されることとしたが、インターネット等のデータ通信ネットワークを介して遠隔地から文書画像処理プログラムが文書画像処理装置10にダウンロードされてもよい。
また、図1に示されるように、文書画像処理装置10は、USB等のインターフェースを介してスキャナ50と接続する。スキャナ50は、CCDカメラを具備し、文書画像をCCDカメラにより走査してスキャン画像を取得するとともに、取得したスキャン画像を文書画像処理装置10に転送する。
画像取得部12は、接続されるスキャナ50から文書画像のスキャンデータを受信して取得する。
レイアウト解析部14は、画像取得部12により取得された文書画像のレイアウトを解析する。レイアウト解析は、文書画像を構成するタイトル領域、本文領域、ヘッダ/フッタ領域、図領域、表領域等に分割することにより行われる。レイアウト解析には公知の手法を用いることとしてよい。そして、レイアウト解析部14より解析されたレイアウトの中から、テキストが含まれる領域(以下、文章領域とする)が処理対象として抽出される。文章領域の抽出は、文字を含まない領域、例えば図のみからなる領域を除外することで行うこととしてよい。
文字認識部16は、文章領域に含まれる文字をOCR処理により認識する。OCR処理は、文章領域を文字毎の領域に分割した上で、各分割領域を対象としたパターンマッチングを行い、そのマッチング結果に基づいて各領域に含まれる文字を決定することで行われる。
文字サイズ・行間隔測定部18は、各文章領域に含まれる文字のサイズ(以下、文字サイズ)及び行間隔を測定する。文字サイズ及び行間隔の測定は、文章領域について文字認識部16により認識された文字サイズ及び行間隔の分布を求め、求めた分布に基づく代表値を当該文章領域の文字サイズ及び行間隔として決定することで行うこととしてよい。代表値は、例えば文章領域から得られたそれぞれの平均値や最頻値等としてよい。そして、文字サイズ・行間隔測定部18は、処理対象の全ての文章領域に対して文字サイズ及び行間隔の測定を行い、測定された文字サイズ及び行間隔の代表値を各文章領域に関連づけてメモリに記憶する。
グループ分類部20は、文章領域毎に測定された文字サイズ及び行間隔の代表値に基づいて、文章領域をグループに分類する。グループの分類は、文字サイズ及び行間隔が互いに類似する文章領域(例えば、文字サイズ及び行間隔が一致する文章領域、又は、文字サイズ及び行間隔の差がそれぞれ予め定められた範囲内にある文章領域)を同一のグループに分類することで行うこととしてよい。本実施形態では、文字サイズ及び行間隔が一致する文章領域を同一のグループとして分類することとする。また、グループ分類部20は、各グループの文字サイズ及び行間隔のサイズ比率をメモリに記憶しておく。
翻訳処理部22は、文章領域毎に含まれる文字列を構文解析した後に、所定の言語(例えば英語や中国語等)に翻訳する。ここでの文章領域に含まれる文字列とは、文字認識部16による認識結果から得られたテキストデータである。翻訳処理には公知の手法を用いることとしてよい。
翻訳文サイズ決定部24は、翻訳処理後の各文章領域に配置する翻訳文字列の文字サイズ及び行間隔を決定する。翻訳文サイズ決定部24は、後述する翻訳文サイズ算出部26と、翻訳文サイズ補正部28とを含む。
翻訳文サイズ算出部26は、文章領域のサイズ、暫定的な行間隔と文字間隔、及びその文章領域に含まれるテキストを翻訳して得られた翻訳文の情報(文字数等)に基づいて、翻訳文を対応する文章領域に埋め込んだときに全文が収まるように、行間隔、縮退率、文字サイズの順に小さくしながら上記条件を満足する値を算出する。この際、各項目の最小値を予め設定しておいて、各項目の値が設定された最小値よりも小さくならないように制約条件を定めることとしてもよい。そして、翻訳文サイズ算出部26は、各文章領域について上記の文字サイズ算出処理を行う。
翻訳文サイズ補正部28は、翻訳文における各文章領域の文字サイズが、原文における各文章領域の文字サイズ及び行間隔の相対的な関係を維持するように、翻訳文の文字サイズ及び行間隔を補正する。翻訳文サイズ補正部28では、以下に説明するように第1及び第2の補正が行われる。
まず、第1の補正は、翻訳文サイズ算出部26により算出された各文章領域の文字サイズ及び行間隔が、分類されたグループ毎に同じサイズとなるようにする補正である。第1の補正は、例えば、同一のグループに含まれる文章領域を、グループ内の最小の文字サイズ、行間隔、及び縮退率に合わせることにより行うこととしてよい。こうして各グループについて、グループ内の文字サイズ及び行間隔を統一しつつも文章領域に収まるようにする。
そして、第2の補正は、保存したグループ間の文字サイズ及び行間隔のそれぞれの比率に基づいて、新たに生成される翻訳文を含む文書の各文章領域の文字サイズ及び行間隔が元の文書における各文章領域の文字サイズ及び行間隔の比率に準ずるようにする補正である。第2の補正は、グループ間の文字サイズ及び行間隔の比率が元の文書における比率と一致するか否かを判断し、一致していないと判断される場合に、比率が合っていないグループの文字サイズ及び行間隔をさらに補正することで行われる。また、第2の補正では、文字サイズと行間隔をそれぞれ補正してもよいし、どちらか一方のみであっても構わない。
具体的には、元々のグループの文字サイズが5,10,20ポイントであるとすると、これらの文字サイズの比率1:2:4をメモリに記憶し、中間のグループの翻訳後の文字サイズを、前後のグループとの文字サイズの距離が(2−1):(4−2)、すなわち、1:2となるように補正する。また、行間隔についても同様に処理することができる。
翻訳文書生成部30は、レイアウト解析部14により解析されたレイアウトと、上記決定された各文章領域の翻訳文、及び各文章領域の文字サイズ、行間隔、及び縮退率に基づいて、翻訳文書データを生成する。翻訳文書データは、例えば、ワードプロセッサーのデータ形式や、PDLデータ等の予め定められたデータ形式に生成するようにしてもよい。
次に、図2乃至4を参照しつつ、文書画像処理装置10による原文の文書(スキャン画像)から翻訳文書を生成する処理の具体的な流れを説明する。図2は、翻訳文書の生成処理のフロー図である。
文書画像処理装置10は、スキャナ50にスキャン指示を送信する。スキャナ50は、文書画像処理装置10からスキャン指示を受信すると、セットされた文書画像をCCDカメラによりスキャンしてスキャン画像を生成する。スキャナ50は生成したスキャン画像を文書画像処理装置10に送信し、文書画像処理装置10は送信されたスキャン画像を受信して取得する(S101)。
文書画像処理装置10はスキャナ50から受信したスキャン画像のレイアウトを解析して(S102)、スキャン画像のレイアウトに含まれる文章領域を特定する。ここで具体例として、スキャン画像のレイアウトの一例を図3に示す。図3に示されるように、スキャン画像200は文章領域200a−fを含む。
文書画像処理装置10は、解析されたレイアウトに含まれる各文章領域(200a−f)について、それぞれの文章領域に含まれる文字を認識する文字認識処理を行う(S103)。
次に、文書画像処理装置10は、文章領域毎の文字サイズ及び行間隔を測定する(S104)。文字サイズの測定は、例えば、文章領域毎にその文章領域から認識された文字の大きさ及び行間隔のそれぞれの平均値や最頻値を算出することにより行うこととしてよい。そして、図3(A)の各文章領域の中に示されているのは、上記測定の結果得られた原文の文字サイズ(S)及び行間隔(L)である。
文字サイズ及び行間隔の測定処理がすべての文章領域について行われると、文書画像処理装置10は各文章領域について測定された文字サイズ及び行間隔の組み合わせに基づいて、各文章領域をグループに分類する(S105)。本実施例においては文字サイズが同じ文章領域を同一のグループに分類することとし、図3(A)に示された例では、文書画像処理装置10は、文書画像に含まれる各文章領域を、G1:(200a,d,e)、G2(200b)、G3(200c,f)という3つのグループに分類するとともに、各グループの文字サイズ及び行間隔と、上記各値のグループ間の比率をメモリに記憶する。比率は分類されたグループの中から選択された1つのグループ(例えばG1)を基準にした値を用いることとしてよい。
文書画像処理装置10は、上記のグループ化処理を終えると、各文章領域について認識された文字からなるテキストデータを所定の言語(例えば、英語や中国語等)に翻訳する処理を行う(S106)。
文書画像処理装置10は、上記の翻訳処理を終えると、翻訳後の文章(以下、翻訳文章)がそれぞれの文章領域に収まり、かつ、原文における各文書領域の相対的な文字サイズ及び行間隔の関係が保たれるように、各文章領域に配置する翻訳文の文字サイズ及び行間隔を決定する(S107)。ここで、各文章領域に配置する翻訳文の文字サイズ及び行間隔の決定処理については、図4に示されるフロー図を参照しつつ説明する。
図4に示されるように、文書画像処理装置10は、まず文章領域毎にその文章領域のサイズと、翻訳文字列の情報(翻訳文字列の文字数等)とに基づいて文章領域に収まる文字サイズ及び行間隔を算出する(S201)。図3(B)において、各文章領域の中に示されているのは、上記算出された文字サイズ(S)及び行間隔(L)である。
文書画像処理装置10は、上記の文字サイズの演算処理を終えると、グループ毎にそのグループに属する文章領域の文字サイズ及び行間隔のうち最小の各値を、当該グループの文字サイズ及び行間隔として決定する(S202)。そして、グループに属する文章領域の文字サイズ及び行間隔は全て、上記決定されたグループの文字サイズ及び行間隔に暫定的に変更される。これが翻訳文サイズの第1の補正である。図3(C)において各文章領域の中に示されているのは、上記第1の補正により変更された文字サイズ(S)及び行間隔(L)である。
文書画像処理装置10は、全てのグループについて上記の文字サイズ及び行間隔の決定処理を終えると、次に、上記決定された文字サイズ及び行間隔により、元の文書画像におけるグループ間の文字サイズ及び行間隔の比率が保たれているか否かを判断する(S203)。ここで、グループ間の比率が保たれていないと判断する場合には(S203:N)、文書画像処理装置10はグループ間の比率を保つように各グループの文字サイズ及び行間隔を算出し、その算出値を新たな文字サイズ及び行間隔とする(S204)。これが文字サイズの第2の補正である。なお、第2の補正においては、文字サイズ又は行間隔のいずれか一方について補正することとしてもよい。
文書画像処理装置10は、上記の文字サイズの決定処理を終えると、処理S108に進み、上記決定された各文章領域について決定した文字サイズ及び行間隔に基づいて翻訳文書を生成し(S108)、処理を終了する。
以上説明した本実施形態に係る文書画像処理装置10によれば、紙文書をスキャンし得られた文書画像にOCRを実行、翻訳、元のレイアウトに埋め込む一連の流れを行う際に、元の原稿で同じ文字サイズ、行間隔の文章領域については、翻訳後の原稿でも同様に保つことができる。こうすることで、原稿の全体構成の意味合いを保つことが可能になり、見た目にも統一感のある原稿に仕上げることができる。
また、本発明は上記の実施形態に限定されるものではなく、例えば、翻訳文サイズ補正部28においてグループ間の文字サイズの間隔が所定の間隔よりも狭いか否かをさらに判断し、所定の間隔よりも狭いと判断する場合には、グループの文字サイズを補正するようにしてもよい。ここでの文字サイズの補正は、グループ間の文字サイズを均等な間隔に配置することで行ってもよい。
翻訳文サイズ決定部24において、同じグループに分類された文章領域の翻訳後の文字サイズ分布に偏りがあり、かつ文字サイズが大きくかけ離れた要素が存在すると判断される場合には、文字サイズが大きく離れた要素をグループから除外して扱うこととしてもよい。
また、翻訳文サイズ決定部24においてグループの文字サイズを合わせる際に、文字の縦横比率を変化させることで、最低文字サイズよりも大きな文字サイズを基準に文字サイズを合わせるようにしてもよい。
また、文章領域の翻訳後の文字間隔や行間隔を調整することにより、小さい文字サイズに抑えられた領域の文章の長さを調整するようにしてもよい。
また、翻訳文を含む新たな文書の態様は上記の実施形態で説明したものに限られず、原文と翻訳文とを上下位置に配置して構成することとしてもよい。
また、本発明は日本語以外の他の言語の原稿についても同様に適用することができるほか、紙に印字された原稿をスキャンしたスキャン画像以外の他の形式の文書画像についても同様に適用することができるのはもちろんである。
本実施形態に係る文書画像処理装置の機能ブロック図である。 翻訳文書の生成処理のフロー図である。 スキャン画像のレイアウトの一例を示す図である。 文章領域の翻訳文サイズの決定処理のフロー図である。
符号の説明
10 文書画像処理装置、12 画像取得部、14 レイアウト解析部、16 文字認識部、18 文字サイズ・行間隔測定部、20 グループ分類部、22 翻訳処理部、24 翻訳文サイズ決定部、26 翻訳文サイズ算出部、28 翻訳文サイズ補正部、30 翻訳文書生成部、50 スキャナ、200 スキャン画像、200a−f 文章領域。

Claims (8)

  1. 文書画像を文章領域に分割する領域分割手段と、
    前記領域分割手段により分割された各文章領域に含まれる文字を認識する文字認識手段と、
    前記各文章領域を、当該文章領域に含まれる文字のサイズ及び行間隔に基づいてグループに分類する分類手段と、
    前記文章領域毎に、当該文章領域に含まれる文字からなる文字列を所定の言語に翻訳する翻訳手段と、
    前記文章領域毎に、当該文章領域に前記翻訳手段により翻訳される文字列を配置した場合の文字サイズ及び行間隔を算出する算出手段と、
    前記分類手段により同一のグループに分類された各文章領域について前記算出された文字サイズ及び行間隔を、前記各文章領域同士の文字サイズ及び行間隔の差がそれぞれ所定値以下となるように補正する補正手段と、
    を含むことを特徴とする文書画像処理装置。
  2. 前記補正手段は、前記分類手段により同一のグループに分類された各文章領域の文字サイズ及び行間隔を、当該グループに分類された文章領域のうち最小の文字サイズ及び行間隔と一致するように補正する、
    ことを特徴とする請求項1に記載の文書画像処理装置。
  3. 前記補正手段は、前記分類手段により分類される各グループの文字サイズの大きさの順序が保たれるように、前記各グループの文字サイズを補正する、
    ことを特徴とする請求項1又は2に記載の文書画像処理装置。
  4. 前記補正手段は、前記分類手段により分類される各グループの文字サイズの比に基づいて、前記各グループの文字サイズを補正する、
    ことを特徴とする請求項3に記載の文書画像処理装置。
  5. 前記補正手段は、前記分類手段により分類される各グループの行間隔の大きさの順序が保たれるように、前記各グループの文字サイズを補正する、
    ことを特徴とする請求項1乃至4のいずれかに記載の文書画像処理装置。
  6. 前記補正手段は、前記分類手段により分類される各グループの行間隔の比に基づいて、前記各グループの行間隔を補正する、
    ことを特徴とする請求項5に記載の文書画像処理装置。
  7. 前記算出手段は、前記各文章領域の前記文字サイズ及び行間隔を、それぞれについて予め定められた最小値を下回らないように算出する、
    ことを特徴とする請求項1乃至6のいずれかに記載の文書画像処理装置。
  8. コンピュータを、
    文書画像を文章領域に分割する領域分割手段と、
    前記領域分割手段により分割された各文章領域に含まれる文字を認識する文字認識手段と、
    前記各文章領域を、当該文章領域に含まれる文字のサイズ及び行間隔に基づいてグループに分類する分類手段と、
    前記文章領域毎に、当該文章領域に含まれる文字からなる文字列を所定の言語に翻訳する翻訳手段と、
    前記文章領域毎に、当該文章領域に前記翻訳手段により翻訳される文字列を配置した場合の文字サイズ及び行間隔を算出する算出手段と、
    前記分類手段により同一のグループに分類された各文章領域について前記算出された文字サイズ及び行間隔を、前記各文章領域同士の文字サイズ及び行間隔の差がそれぞれ所定値以下となるように補正する補正手段と、
    して機能させることを特徴とする文書画像処理プログラム。
JP2008032614A 2008-02-14 2008-02-14 文書画像処理装置、及び文書画像処理プログラム Pending JP2009193283A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008032614A JP2009193283A (ja) 2008-02-14 2008-02-14 文書画像処理装置、及び文書画像処理プログラム
US12/370,259 US8170862B2 (en) 2008-02-14 2009-02-12 Document image processing device and document image processing program for maintaining layout in translated documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008032614A JP2009193283A (ja) 2008-02-14 2008-02-14 文書画像処理装置、及び文書画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2009193283A true JP2009193283A (ja) 2009-08-27

Family

ID=40955898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008032614A Pending JP2009193283A (ja) 2008-02-14 2008-02-14 文書画像処理装置、及び文書画像処理プログラム

Country Status (2)

Country Link
US (1) US8170862B2 (ja)
JP (1) JP2009193283A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595614B2 (en) 2010-10-21 2013-11-26 Sharp Kabushiki Kaisha Document generating apparatus, document generating method, computer program and recording medium
US9110871B2 (en) 2010-11-10 2015-08-18 Sharp Kabushiki Kaisha Correcting a document character size based on the average value of each character size
CN109753909A (zh) * 2018-12-27 2019-05-14 广东人啊人网络技术开发有限公司 一种基于内容分块和BiLSTM模型的简历解析方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011118517A (ja) * 2009-12-01 2011-06-16 Fujifilm Corp 文書画像生成サーバ及びプログラム、並びに文書閲覧システム
US8832541B2 (en) * 2011-01-20 2014-09-09 Vastec, Inc. Method and system to convert visually orientated objects to embedded text
KR101414195B1 (ko) * 2012-11-26 2014-07-01 네이버 주식회사 복수의 아이템들을 공간 내에 자동으로 배치하는 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
US10198147B2 (en) * 2016-03-17 2019-02-05 Samsung Electronics Co., Ltd. Object management and visualization using a computing device
RU172882U1 (ru) * 2016-07-20 2017-07-28 Общество с ограниченной ответственностью "Технологии управления переводом" Устройство для автоматического перевода текста
JP6984145B2 (ja) * 2017-03-09 2021-12-17 富士フイルムビジネスイノベーション株式会社 情報処理装置
US11126799B2 (en) * 2018-09-11 2021-09-21 Netflix, Inc. Dynamically adjusting text strings based on machine translation feedback
JP6838209B1 (ja) * 2019-10-31 2021-03-03 楽天株式会社 文書画像解析装置、文書画像解析方法およびプログラム
US11393236B2 (en) * 2020-01-17 2022-07-19 Konica Minolta Business Solutions U.S.A., Inc. Approximating the layout of a paper document

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003044461A (ja) * 2001-07-30 2003-02-14 Seiko Epson Corp レイアウト装置、レイアウトプログラム及びレイアウト方法
JP2006268150A (ja) * 2005-03-22 2006-10-05 Fuji Xerox Co Ltd 翻訳を行う装置、方法、プログラムおよび該プログラムを記憶した記憶媒体

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324720A (ja) 1992-05-19 1993-12-07 Ricoh Co Ltd 対訳画像形成装置
JPH0728829A (ja) 1993-07-12 1995-01-31 Casio Comput Co Ltd 翻訳支援装置
JP3213197B2 (ja) 1994-04-20 2001-10-02 キヤノン株式会社 画像処理装置およびその制御方法
JPH086948A (ja) 1994-06-22 1996-01-12 Matsushita Electric Ind Co Ltd 機械翻訳機
JP3636490B2 (ja) 1994-10-31 2005-04-06 キヤノン株式会社 画像処理装置および画像処理方法
JPH09259127A (ja) * 1996-03-21 1997-10-03 Sharp Corp 翻訳装置
US6012073A (en) * 1996-10-21 2000-01-04 Corbis Corporation Method and system for displaying original documents and translations thereof
US8050906B1 (en) * 2003-06-01 2011-11-01 Sajan, Inc. Systems and methods for translating text
JP2006252048A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd 翻訳装置、翻訳プログラムおよび翻訳方法
US7865353B2 (en) * 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
JP4626356B2 (ja) * 2005-03-25 2011-02-09 富士ゼロックス株式会社 付加情報を含む電子文書を編集する方法、装置およびプログラム
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US20060245005A1 (en) * 2005-04-29 2006-11-02 Hall John M System for language translation of documents, and methods
US20080172219A1 (en) * 2007-01-17 2008-07-17 Novell, Inc. Foreign language translator in a document editor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003044461A (ja) * 2001-07-30 2003-02-14 Seiko Epson Corp レイアウト装置、レイアウトプログラム及びレイアウト方法
JP2006268150A (ja) * 2005-03-22 2006-10-05 Fuji Xerox Co Ltd 翻訳を行う装置、方法、プログラムおよび該プログラムを記憶した記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595614B2 (en) 2010-10-21 2013-11-26 Sharp Kabushiki Kaisha Document generating apparatus, document generating method, computer program and recording medium
US9110871B2 (en) 2010-11-10 2015-08-18 Sharp Kabushiki Kaisha Correcting a document character size based on the average value of each character size
CN109753909A (zh) * 2018-12-27 2019-05-14 广东人啊人网络技术开发有限公司 一种基于内容分块和BiLSTM模型的简历解析方法

Also Published As

Publication number Publication date
US8170862B2 (en) 2012-05-01
US20090210215A1 (en) 2009-08-20

Similar Documents

Publication Publication Date Title
JP2009193283A (ja) 文書画像処理装置、及び文書画像処理プログラム
CN101377855B (zh) 文档图像处理装置和信息处理方法
US8861862B2 (en) Character recognition apparatus, character recognition method and program
JP2008299780A (ja) 画像処理装置、及び画像処理プログラム
US8086040B2 (en) Text representation method and apparatus
JP2001319240A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4869841B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
US7680329B2 (en) Character recognition apparatus and character recognition method
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP4143655B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体、システム
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP5126018B2 (ja) 文書画像処理装置及びプログラム
JP5821994B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP5109548B2 (ja) 画像処理装置及びプログラム
US8125691B2 (en) Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP7150809B2 (ja) 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム
JP4998176B2 (ja) 翻訳装置及びプログラム
JP6852359B2 (ja) 画像処理装置及びプログラム
JP2009205209A (ja) 文書画像処理装置、及び文書画像処理プログラム
JP4626610B2 (ja) 画像処理装置、画像処理システム、画像処理プログラム、画像処理方法
JP2023021595A (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JP4517667B2 (ja) 文書画像照合装置、文書画像位置合わせ方法及びプログラム
JP2010146143A (ja) 文書処理装置及びプログラム
EP2945099B1 (en) Character presence determination system and character presence determination method
JP2023026170A (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100511