JP4177325B2 - 画像処理装置、画像処理プログラム及び画像処理方法 - Google Patents

画像処理装置、画像処理プログラム及び画像処理方法 Download PDF

Info

Publication number
JP4177325B2
JP4177325B2 JP2004376155A JP2004376155A JP4177325B2 JP 4177325 B2 JP4177325 B2 JP 4177325B2 JP 2004376155 A JP2004376155 A JP 2004376155A JP 2004376155 A JP2004376155 A JP 2004376155A JP 4177325 B2 JP4177325 B2 JP 4177325B2
Authority
JP
Japan
Prior art keywords
image
business card
layout
character
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004376155A
Other languages
English (en)
Other versions
JP2006184415A (ja
Inventor
外志正 土橋
博之 水谷
直朗 小平
彰夫 古畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2004376155A priority Critical patent/JP4177325B2/ja
Publication of JP2006184415A publication Critical patent/JP2006184415A/ja
Application granted granted Critical
Publication of JP4177325B2 publication Critical patent/JP4177325B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Controls And Circuits For Display Device (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、例えば文字等の幾何情報を含む文書画像を加工して表示する画像処理装置、画像処理プログラム及び画像処理方法に関する。
スキャナ、デジタルカメラなどの画像入力装置、さらにコンピュータディスプレイ、携帯端末モニタ、電子ブックビューワなどの画像表示装置の多様化が進んでいる。
スキャナなどの入力装置から入力される文書画像に含まれる文字のサイズは、同一の文章を入力しても入力解像度によって変化する。またデジタルカメラや携帯端末内蔵カメラなどの光学式デジタル撮像機では、解像度やカメラと撮影対象間の距離が固定されておらず、多くは被写体が撮像領域一杯に撮影される。
このため、上記光学式デジタル撮像機で文書画像を撮影した場合、画像ごとに文字のサイズが異なったり、マーカーの位置関係が異なるものとなっていた。
上記光学式デジタル撮像機で撮像されたさまざまな解像度の文書画像を、コンピュータや内部プロセッサなどの画像処理装置へ入力し、さまざまな解像度のまま文書画像を混在させて扱う場合、文字の大きさが統一されていないために画面に実際に表示される文字の可読性や視覚性が悪く、可読性や視覚性をよくするためには手動での修正が必要であり、そのための手間がかかるといった問題がある。
例えば手動操作で文字の大きさを統一する場合、画像処理装置では、元の画像サイズの等倍に対する比率、あるいは解像度の指定などのように、文書画像中の文字サイズとは関係のない指標で、画像の拡大・縮小の指定が行う必要があり、縮尺指定を表示対象のすべての画像に対して行う必要があった。
一般に、スキャナなどによって読み取られた文書画像は、比較的高解像度で画像処理装置に入力・保存されるが、その文字画像を例えばPDA、携帯電話機等の画面サイズが小さい携帯端末で表示する場合、文字の大きさが大きすぎて多くの情報を一度に表示することができないなどの問題があった。また文書内容の確認ができさえすれば良い程度の文書画像に対しても必要以上に高解像度、高ファイルサイズで画像が保存されることがあった。
この種の先行技術として、ユーザが予め文字サイズを指定しておき、文書画像を見るときに、指定されていた文字サイズで画像を加工して表示する技術が提案されている(例えば特許文献1参照)。
米国特許第5754873号明細書
上記先行技術の場合、ユーザが予め手操作で文字の表示サイズを指定する必要があるため、予め設定しておいた一定のサイズでしか文字を表示できず、言語(日本語、英語等)、文字種(フォントの種類等)によっては見難く表示される場合がある。
本発明はこのような課題を解決するためになされたものであり、ユーザが画像毎の手動操作による表示サイズ指定等を行うことなく、異なる解像度で得られた文字画像を、文字を読むのに適切な大きさで閲覧することができる画像処理装置、画像処理プログラム及び画像処理方法を提供することを目的としている。
本発明の画像処理装置は、所定表示領域を有する画面を備えた表示手段と、前記表示領域よりも大きなサイズの名刺画像、この名刺画像の構成要素の配置を示す画像配置設定情報および名前辞書を記憶する記憶手段と、前記記憶手段から読み出した名刺画像と画像配置設定情報から、前記名刺画像に含まれる構成要素のレイアウト解析を行うことで前記名刺画像に含まれる文字列の配置情報を得るレイアウト解析手段と、前記レイアウト解析手段により得られた文字列の配置情報及び前記名前辞書から得られる情報を用いて前記名刺画像の中の名前の位置を決定し、位置が決定した名前の始まりを前記表示領域の左端に配置するように前記名刺画像を前記表示手段に出力する画像配置決定手段とを具備したことを特徴とする。
本発明の画像処理プログラムは、所定表示領域を有する画面を備えた表示手段と、前記表示領域よりも大きなサイズの名刺画像、名刺表示用の画像配置設定情報および名前辞書を記憶する記憶手段とを備えた画像処理装置に処理を実行させる画像処理プログラムであって、前記画像処理装置を、前記記憶手段から読み出した名刺画像とこの名刺画像の構成要素の配置を示す画像配置設定情報から、前記名刺画像に含まれる構成要素のレイアウト解析を行うことで前記名刺画像に含まれる文字列の配置情報を得るレイアウト解析手段と、前記レイアウト解析手段により得られた文字列の配置情報及び前記名前辞書から得られる情報を用いて前記名刺画像の中の名前の位置を決定し、位置が決定した名前の始まりを前記表示領域の左端に配置するように前記名刺画像を前記表示手段に出力する画像配置決定手段として機能させることを特徴とする。
本発明の画像処理方法は、所定表示領域を有する画面を備えた表示手段と、前記表示領域よりも大きなサイズの名刺画像、この名刺画像の構成要素の配置を示す画像配置設定情報および名前辞書を記憶する記憶手段と、レイアウト解析手段と、画像配置決定手段とを備えた画像処理装置における画像処理方法において、前記レイアウト解析手段が、前記記憶手段から読み出した名刺画像とこの名刺画像の構成要素の配置を示す画像配置設定情報から、前記名刺画像に含まれる構成要素を抽出し、抽出した構成要素のレイアウト解析を行うことで前記名刺画像に含まれる文字列の配置情報を得るステップと、前記画像配置決定手段が、前記文字列の配置情報及び前記名前辞書から得られる情報を用いて、前記名刺画像の中の名前の位置を決定し、位置が決定した名前の始まりを前記表示領域の左端に配置するように前記名刺画像を前記表示手段に出力するステップとを有することを特徴とする。
発明では、記憶手段から読み出した名刺画像とこの名刺画像の構成要素の配置を示す画像配置設定情報から、前記名刺画像に含まれる構成要素を抽出し、抽出した構成要素のレイアウト解析を行うことで前記名刺画像に含まれる文字列の配置情報を得て、文字列の配置情報及び名前辞書から得られる情報を用いて、名刺画像の中の名前の位置を決定し、その位置が決定した名前の始まりを表示領域の左端に配置するように名刺画像を表示手段に出力するので、画面にはユーザにとって必要な文字が見やすい位置に表示される。
以上説明したように本発明によれば、ユーザが画像毎の手動操作による表示サイズ指定等を行うことなく、異なる解像度で得られた文字画像を、文字を読むのに適切な大きさで閲覧することができる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。
図1は本発明に係る第1実施形態の画像処理装置の構成を示すブロック図、図2は図1の画像処理装置に記憶されている言語・文字種/文字サイズ対応テーブルを示す図である。
図1に示すように、この実施形態の画像処理装置は、画像入力部11、記憶部12、レイアウト解析部13、幾何情報推定部14、言語・文字種推定部15、画像処理部16、画像表示部17、画像出力部18、操作入力部19等を有している。
画像入力部11は、文書画像をデジタルデータとして入力する画像入力手段である。画像入力部11としては、例えばスキャナ、デジタル複合機、デジタルカメラ、携帯端末内蔵カメラなどのような画像入力装置が用いられる。
記憶部12は、画像入力部11より入力された文書画像が保存(一次記憶も含む)および読み出される画像記憶手段である。画像記録部12としては、例えば磁気ディスク装置、光学ディスク装置、各種メモリ、ネットワーク上のストレージ、サーバなどが用いられる。
記憶部12には、図2に示すように、変換対象の画像に含まれる文字の言語、文字種毎に適正な変換文字サイズを対応させた言語・文字種/文字サイズ対応テーブル20が記憶されている。
レイアウト解析部13は、記憶部12に記憶されている文書画像を読み出して文書画像の構成要素を抽出する画像構成要素抽出手段として機能する。またレイアウト解析部13は、抽出した文書画像の構成要素のレイアウトを解析することで構成要素が文書画像の中にどのように配置されているかのレイアウト情報(外矩や列等)を得るレイアウト解析部である。
幾何情報推定部14は、上記レイアウト解析部13により抽出されたレイアウト情報を用いて文書の構成要素(文字、記号、マーク、マーカー、印鑑の印影等)の幾何情報(例えば文字の場合は幅、高さ、サイズ等)を推定する幾何情報推定手段である。
言語・文字種推定部15は、記憶部12に記憶されている言語・文字種/文字サイズ対応テーブル20を参照して文書内で用いられている言語や文字種を推定する言語・文字種推定手段である。
画像処理部16は、言語・文字種推定部15により推定された言語や文字種と幾何情報推定部14により推定された幾何情報等を用いて記憶部12より読み出した画像の加工処理を行うことで、ある表示領域の画面に表示する画像を生成し画像表示部17へ出力する。画像の加工処理とは、例えば文書画像の文字を表示画面で見易い大きさにするための画像の縮小処理または拡大処理等である。
すなわち、画像処理部16と言語・文字種推定部15は、幾何情報推定部14により推定された文字のサイズを基に言語・文字種/文字サイズ対応テーブル20を参照して文書画像に含まれる文字のサイズが変換文字サイズとなるよう記憶部12より読み出した画像を縮小または拡大して画像表示部17へ出力する画像処理手段として機能する。
画像表示部17は、所定の表示領域の画面を備えたLCD、有機EL表示装置、SEDFED等であり、画像処理部16により生成された画像を画面に表示する表示手段である。画像出力部18は画像処理部16により生成された画像を例えばイメージファイルなどファイル形式にして記憶部12等へ記憶したり、外部のプリンタへ出力する画像出力手段である。操作入力部19は利用者からの指示操作を受け付ける入力受付手段である。
図3〜図7を参照してこの画像処理装置の動作を説明する。図3はこの画像処理装置の動作を示すフローチャート、図4,5は2つの文書画像が共に日本語の場合、図6,7は2つの文書画像が日本語とアルファベットの場合の画像の例を示す図である。
この画像処理装置では、画像入力部11が帳票より読み取った文書画像が記憶部12に記憶される(図3のステップ11:以下ステップをSと称す)。
レイアウト解析部13は、処理対象となる文書画像であるイメージデータを記憶部12より読み出してレイアウト解析を実行することで(S12)、イメージデータに含まれる構成要素が画像の中にどのように配置されているかを示すレイアウト情報を抽出する。
ここでのレイアウト解析では、文書中の文字外矩や文字列などのレイアウト情報が抽出される。文字外矩は、画像中の連結黒画素成分を検出することにより抽出される。また、文字列は、近傍文字の統合処理を行うことにより抽出される。
続いて、幾何情報推定部14は、レイアウト解析部13により抽出されたレイアウト情報を基に構成要素の幾何情報を推定する(S13)。
この例における幾何情報とは文書に含まれる文字のサイズ(大きさ)等である。文書の文字サイズは、例えば文書中の文字列の文字サイズの平均をとるなどの方法で推定できる。この他、最小の文字行の文字サイズ、文書の本文部の平均文字サイズ、あるいは最頻文字サイズを文書の文字サイズ推定値として用いるなどの方法を用いても良い。また文字サイズは幅と高さそれぞれを推定しても良く、いずれか一方で代表させても良い。
言語・文字種推定部15は、幾何情報推定部14により推定された幾何情報を基にして文書内で用いられている言語や文字種を推定する(S14)。言語や文字種の推定は、例えば文字認識機能(以下OCR機能と称す)を用いることで実現している。OCR機能は、文書画像内の文字画像(イメージデータ)を予め設定されている文字認識用の辞書のイメージデータとマッチングさせて文字コード(テキストデータ)へ変換する機能であり、例えば日本語に対応したOCRソフトウェアであれば、文書中の日本語やアルファベット・数字などの読み取りが可能である。文字認識用の辞書には、文字のイメージデータと文字コード(テキストデータ)が対で記憶されている。文字種によって文字コードの範囲は異なる(文字コード何番から何番まではアルファベット、何番から何番までは、かな、何番から何番までは漢字というように決められている)ため、OCR機能による文字認識結果を解析することで、文書内で用いられている文字の言語や文字種を推定することができる。
続いて、画像処理部16は、言語・文字種推定部15により推定された言語や文字種の推定結果を基に、言語・文字種/文字サイズ対応テーブル20を参照して該当画像の拡大率または縮小率を決定する(S15)。
例えば入力画像の幅をW、高さをH、推定された文字サイズの幅をEw, 高さをEhとし、変換後の文字サイズの幅と高さがそれぞれTw,Thと予め記憶部12に設定されているものとする。
この場合、画像処理部16は、画像の拡大縮小率を、幅方向にTw/Ew、高さ方向にTh/Ehとし、変換元の画像を、幅Tw×W/Ew、高さTh×H/Ehの画像に変換することで、表示画像を作成する(S16)。
ここで、図4〜図7の画像の例を用いてこの画像処理装置の動作を具体的に説明する。図4の例は、横1280ピクセル×縦1024ピクセル(SXGA)サイズの変換元の文書の画像Aと画像Bであり、これら画像A,Bにはサイズの異なる日本語の文字が含まれている。画像Aの文字サイズは、80×80ピクセルと推定され、画像Bの文字サイズは、160×160ピクセルと推定されたものとする。
また、出力画像の文字サイズ(ターゲット文字サイズ)は、上記言語・文字種/文字サイズ対応テーブル20に、日本語、漢字・かなの場合、20ピクセル(縦20ピクセル×横20ピクセル)と設定されている。
この場合、画像処理部16は、画像Aの縮小率または拡大率を、幅方向にTw/Ew=20/80=1/4、高さも同様で1/4と決定し、画像Bの場合はTw/Ew=20/160=1/8、高さも同様で1/8と決定する。
画像処理部16は、このように決定した倍率(縮小率)に基づいて文書画像を縮小処理(画像加工)する。
これにより、図5に示すように、画像Aは320×256ピクセルの大きさの画像A1に変換され、画像Bは160×128ピクセルの大きさの画像B1に変換され、それぞれの画像処理結果の2つの画像A1,B1中の文字サイズはほぼ同一となる。
画像表示部17は、画像処理部16により画像処理(倍率変換)された画像を表示し、画像出力部18は、各種画像や文書ファイルフォーマット書類としてファイル出力する(S17)。
また、図6に示す例は、横1280ピクセル×縦1024ピクセル(SXGA)サイズの変換元の文書の画像Aと画像Bであり、画像Aには日本語の文字が含まれており、画像Bにはアルファベット(英語の文字)が含まれている。画像A,Bに含まれる文字のサイズは共に80×80ピクセルと推定されたものである。
出力画像の文字サイズ(ターゲット文字サイズ)は、上記言語・文字種/文字サイズ対応テーブル20に、言語毎に最適な変換文字サイズが設定されている。
例えば文字が日本語、漢字・かなの場合、20ピクセル(縦20ピクセル×横20ピクセル)と設定されており、英語、アルファベットの場合、16ピクセル(縦16ピクセル×横16ピクセル)等と設定されている。
この場合、画像処理部16は、画像Aの縮小率または拡大率を、幅方向にTw/Ew=20/80=1/4、高さも同様で1/4と決定し、画像Bの場合はTw/Ew=16/80=1/5、高さも同様で1/5と決定する。
画像処理部16は、このように決定した倍率(縮小率)に基づいて文書画像を縮小処理(画像加工)する。
これにより、図7に示すように、画像Aは320×256ピクセルの大きさの画像A1に変換され、画像Bは256×205ピクセルの大きさの画像B1に変換され、それぞれの画像処理結果の2つの画像A1,B1中の文字サイズは、見た目に読み易い違和感のない大きさとなる。
この例では、例えば比較的文字サイズが小さくても読めるアルファベットなどからなる英語文書に対しては文字サイズTを小さくし、画数の多い漢字などを含む日本語の文書に対しては文字サイズTを大きく設定することで、文書の読みやすさ、ファイルサイズ、ディスプレイに表示できる情報量などのバランスを最適に調整することが可能となる。
拡大・縮小処理の他のバリエーションとしては、入変換後の画像の高さが表示領域の高さと等しくなるように入力画像領域を拡大・縮小したり、表示領域の縦横比(Wv/Hv)が入力画像領域の縦横比(Wi/Hi)よりも大きい場合は、入変換後の画像の高さが表示領域の高さと等しくなるように入力画像領域を拡大・縮小する。
また、表示領域の縦横比(Wv/Hv)が入力画像領域の縦横比(Wi/Hi)より小さい場合のその他のバリエーションとしては、入変換後の画像の高さが表示領域の高さと等しくなるように入力画像領域を拡大・縮小し、表示領域の縦横比(Wv/Hv)が入力画像領域の縦横比(Wi/Hi)よりも大きい場合は入変換後の画像の幅が表示領域の幅と等しくなるように入力画像領域を拡大・縮小する、といったことも可能である。
画像表示部17は、画像処理部16により画像処理(倍率変換)された画像を表示し、画像出力部18は、各種画像や文書ファイルフォーマット書類としてファイル出力する。
このようにこの第1実施形態の画像処理装置によれば、文書画像に対してレイアウト解析、幾何情報推定及び言語・文字種推定を順に行うことによって文書中の文字の言語、文字種、文字サイズなどの幾何情報を推定し、画像処理部16は、推定した幾何情報を基に言語、文字種/文字サイズ対応テーブル20を参照して言語毎に文字が見易い大きさで表示画面に表示される適切なサイズになるよう文書画像を縮小または拡大等の画像処理を行い、表示画面に適切な画像を表示、またはファイル出力を行うので、ユーザによる画像毎の手動操作による表示サイズ指定などの手間なく、文字を見易い大きさで文書画像を表示画面に表示できると共に、文書画像を縮小する場合は、無駄なストレージやメモリの使用を抑制することができる。
つまり、手動操作による表示サイズの変更なしに文書画像中に含まれる文字サイズを統一できるので、表示画面における文書画像の可読性、視覚性を向上することができる。また、用途に応じて必要十分な文字サイズの情報を使って画像を縮小することにより、無駄なストレージやメモリの使用を抑制することができる。
ユーザが文字を閲覧するのに適切な文字サイズをシステムが言語毎に自動的に推定して文字画像を縮小または拡大して画面に表示することができる。また、言語毎に文字サイズを指定(編集)できる言語・文字種/文字サイズ対応テーブル20を備えているので、設定・変更を自由に行うことができる。
なお、言語・文字種に対応する適当な文字サイズは、システムで決められた値を用いても良く、表示画面の大きさや解像度からシステムが適切なサイズを自動的に設定しても良く、ユーザが操作入力部19から設定しても良い。
次に、図8〜図15を参照して本発明に係る第2実施形態の画像処理装置について説明する。図8は本発明に係る第2実施形態の画像処理装置の構成を示すブロック図である。
図8に示すように、この実施形態の画像処理装置は、画像入力部11、記憶部12、レイアウト解析部13、幾何情報推定部14、拡大・縮小倍率決定部31、画像配置決定部32、画像処理部16、画像表示部17、画像出力部18、操作入力部19等を有している。なお、第1実施形態と同様の構成については同一の符号を付しその説明は省略する。
拡大・縮小倍率決定部31は、レイアウト解析部13により得られたレイアウト情報に基づき画像の構成要素の1つである文字のサイズを推定し、画面に表示する文字のサイズが適正となる画像の拡大倍率または縮小倍率を決定する画像拡大・縮小倍率決定手段として機能する。なお、拡大・縮小倍率決定部31に、上記第1実施形態のようにOCR機能を持たせて、幾何情報推定部14により推定された幾何情報を基に文字認識して文字コード(テキストデータ)を得てから、画像に含まれる文書内で用いられている言語や文字種の拡大・縮小倍率を決定してもよい。
画像配置決定部32は、拡大・縮小倍率決定部31により決定された言語や文字種の拡大・縮小倍率と幾何情報推定部14により推定された幾何情報と予め設定されていた画像の帳票種類情報(文書、名刺等といった帳票種とその帳票において文字列の配置を特定する情報)を用いて、画像処理部16により生成された画像の文字を画面のどの位置に配置するかを決定し、画像の配置処理を実行する画像処理手段である。画像の配置処理とは、例えば文書画像の文字を表示画面で見易い位置にするため、画像の中で文字が始まる位置を画面内のどこにどの程度の大きさで表示するかを決定する処理である。つまり画像配置決定部36は、生成された画像の文字を画面の表示領域にどのように配置するかを決定する。
画像表示部17は、画像処理部16により生成された画像を画面に表示する表示手段である。画像出力部18は画像処理部16により生成された画像を例えばイメージファイルなどファイル形式にして記憶部12等へ記憶したり、外部のプリンタへ出力する画像出力手段である。
以下、図9〜図15を参照してこの画像処理装置の動作を説明する。図9はこの画像処理装置の動作を示すフローチャート、図10は画像の拡大・縮小倍率を決定する処理を示すフローチャートである。
この画像処理装置では、画像入力部11が帳票より読み取った文書画像が記憶部12に記憶される(図9のS21)。
レイアウト解析部13は、処理対象となる文書画像であるイメージデータを記憶部12より読み出してレイアウト解析を実行することで(S22)、レイアウト情報を抽出する。
ここでのレイアウト解析では、文書中の文字外矩や文字列などのレイアウト情報が抽出される。文字外矩は、画像中の連結黒画素成分を検出することにより抽出される。また、文字列は、近傍文字の統合処理を行うことにより抽出される。
続いて、幾何情報推定部14は、レイアウト解析部13により抽出されたレイアウト情報を基に構成要素の幾何情報を推定する(S23)。
この例における幾何情報とは文書に含まれる文字のサイズである。文書の文字サイズは、例えば文書中の文字列の文字サイズの平均をとるなどの方法で推定できる。この他、最小の文字行の文字サイズ、文書の本文部の平均文字サイズ、あるいは最頻文字サイズを文書の文字サイズ推定値として用いるなどの方法を用いても良い。また文字サイズは幅と高さそれぞれを推定しても良く、いずれか一方で代表させても良い。
続いて、拡大・縮小倍率決定部32は、幾何情報推定部14により推定された幾何情報(記号や文字のサイズ等)を基に言語・文字種/文字サイズ対応テーブル20を参照して画像全体として拡大率または縮小率を決定する(S24)。
一例として、入力画像あるいは入力画像内で表示したい部分領域(以下入力画像領域と称す)の縦横比を保持したまま、変換後の画像の幅が表示領域の幅と等しくなるように入力画像領域を拡大または縮小する場合の例を説明する。
入力画像領域の幅をWi、高さをHi、表示領域の幅をWv、高さをHv、推定された入力画像領域での文字サイズをE、変換画像での許容最大文字サイズをTmax、変換画像での許容最小文字サイズをTmin(Tmin <= Tmax)、変換画像を表示領域に内接させた場合の変換画像での文字サイズをTfit、変換画像での文字サイズをT、決定された拡大縮小率をRとすると、画像処理後の画像幅が表示領域の幅と等しくなる拡大縮小率は、Wv/Wiであり、その際のTfitはE×Wv/Wiである。
ここで、図10を参照して、上記S24の拡大縮小率決定処理について詳細に説明する。
拡大・縮小倍率決定部32は、以下のフローチャート(図10)の処理を実行して拡大縮小率Rを決定する。
拡大・縮小倍率決定部32は、まずTfitを計算する(Tfit=E×Wv/Wi)(S31)。
拡大・縮小倍率決定部32は、TfitとTmaxとを比較する(S32)。
この比較の結果、TfitがTmaxより大きい場合(S32のY)、拡大・縮小倍率決定部32は、Tの値としてTmaxを用いてRをTmax/Eとする(S33)。
また、比較の結果、TfitがTmaxより小さく(S32のN)、かつTfitがTminよりも大きい場合(S34のN)、拡大・縮小倍率決定部32は、拡大縮小率RをWv/Wiとする(S35)。
一方、比較の結果、TfitがTminより小さい場合(S34のY)、拡大・縮小倍率決定部32は、Tの値としてTminを用いてRをTmin/Eとする(S36)。
ここで、具体的な画像の例で、拡大・縮小倍率を決定することについて説明する。
表示対象の複数の入力画像が、それぞれ640×480ピクセル、640×480ピクセル、1280×1024ピクセルというように少なくとも1つが異なる解像度の3つの画像A,B,Cである場合の例を図11に示す。画像A,B,Cでは、アルファベットの文字の大きさも異なる。
このように横640ピクセル×縦480ピクセル(VGA)サイズの画像Aと横640ピクセル×縦480ピクセル(VGA)サイズの画像Bと、横1280ピクセル×縦1024ピクセル(SXGA)サイズの画像Cが変換元の文書画像、つまり入力画像であり、これら入力画像に含まれる文字のサイズは、幾何情報推定部14によって、それぞれ80×80ピクセル、40×40ピクセル、40×40ピクセルと推定されたものとする。
Tmax、Tminはそれぞれ32,12ピクセル、表示デバイスの解像度は、幅320ピクセル×高さ240ピクセルとする。
図12に、変換対象の画像A,B,Cを、画像表示部17の表示領域に内接させた場合の変換後の画像の文字サイズTfitと拡大縮小率Rの関係を示す。
(画像A)
画像Aの幅は、640ピクセル×高さは480ピクセルであり、画像中の文字サイズは80ピクセルと推定されている。よって変換後の画像の文字サイズTfitは、Tfit=E×Wv/Wi=80×320/640=40より、40ピクセルとなる。
このとき変換後の画像の文字サイズTfitは、Tfit > Tmax であるので、拡大縮小率Rは、R=Tmax/E=32/80=0.4より、0.4となる。
(画像B)
画像Bの幅は、640ピクセル×高さは480ピクセルであり、画像中の文字サイズは40ピクセルと推定されている。よって変換後の画像の文字サイズTfitはTfit=E×Wv/Wi=40×320/640=40より、40ピクセルとなる。
このとき変換後の画像の文字サイズTfitは、Tmin <= Tfit <= Tmax であるので、拡大縮小率Rは、R=Wv/Wi=320/640=0.5より、0.5となる。
(画像C)
画像Cの幅は、1280ピクセル×高さは1024ピクセルであり、画像中の文字サイズは40ピクセルと推定されている。よって変換後の画像の文字サイズTfitはTfit=E×Wv/Wi=40×320/1280=10より、10ピクセルとなる。
このとき変換後の画像の文字サイズTfitは、Tmin > Tfitであるので、拡大縮小率Rは、R=Tmin/E=12/40=0.3より、0.3となる。
続いて、画像処理部16は、拡大・縮小倍率決定部32により決定された倍率で画像の拡大縮小処理を行う(S25)。
この画像処理の結果、元々640×480ピクセルというサイズであった画像Aの幅256(640×0.4)、高さ192(480×0.4)の画像A1に変換される。
元々640×480ピクセルというサイズであった画像Bの幅320(640×0.5)、高さ240(480×0.5)の画像B1に変換される。
元々1280×1024ピクセルというサイズであった画像Cの幅384(1280x0.3)、高さ308(1024×0.3)の画像C1に変換される。
続いて、画像配置決定部32は、画像処理部16により作成された画像をどのような配置で表示領域に表示するかを決定する(S26)。
図10の拡大縮小率決定処理において、TfitがTmaxより大きい場合は、画像サイズが表示領域よりも小さくなるため、画像配置決定部32は、図13の画像A1のように、画像領域の中心が、表示領域の中心の位置にくるように画像を配置する。
TfitがTmaxより小さくTminよりも大きい場合は、画像サイズが表示と等しくなるため、画像配置決定部32は、図13の画像B1に示すように、画像の左上が表示領域の左上にくるように画像を配置する。
TfitがTminより小さい場合は、画像サイズが表示領域よりも大きくなるため、図13の画像C1のように、単純に画像領域の中心を表示領域の中心に配置するだけでは、画像に含まれる情報(画像領域)が一部表示されない場合が生じる。
そこで、画像サイズが表示領域よりも大きい場合、画像配置決定部32は、キー、ボタン、マウス、タッチパネルなどの入力装置による指示で画像をスクロールさせることで、画面からはみ出して隠れていた画像領域を表示し、これにより、ユーザは、小さい画面でも画像領域全体を見ることができる。
つまり、画像配置決定部32は、レイアウト解析の結果や入力される文書画像の種類に関する知識、情報を用いることで文書内容をより多く表示できるような画像の初期配置を決定する。
例えば文書画像の場合、レイアウト解析部13によるレイアウト解析の結果として、文書中の文字の位置を判別できるので、画像配置決定部32は、その文字の位置情報を用いて、図14に示すように、文書の始まり(☆印の位置)がちょうど画面の表示領域の左上端にくるように配置を決定する。
また、入力画像が予め名刺画像等と帳票種が分かっているような場合、名刺表示用の画像配置設定情報を記憶部12に記憶しておくことで、画像配置決定部32は、図15に示すように、名刺画像に含まれる名前が最もよく分かるように名前の始まり(☆印の位置)を表示領域の左端に配置する。
名前文字列の位置は、レイアウト解析部13によりレイアウト解析された結果として得られる文字列配置情報や名前辞書等から得られる情報を画像配置決定部32が用いて推定する。
続いて、画像表示部17は、画像処理部16により画像処理(倍率変換)された画像を表示し、画像出力部18は、各種画像や文書ファイルフォーマット書類としてファイル出力する(S27)。
このようにこの第2実施形態の画像処理装置によれば、画像の表示領域である画面を最大限に生かしつつ、ユーザが読み易いサイズに文字の大きさを適正化した文書画像や名刺画像を画面に表示するので、ユーザは、手操作で画像の大きさを調整することなく画面で文書や名刺の文字を読むことができる。
また、用途に応じ必要十分な文字サイズに画像を縮小させることにより、無駄なストレージやメモリの使用を抑制することができる。
さらに、画像サイズが表示領域サイズより大きい場合、レイアウト解析結果を用いて初期配置を最適なものとすることで、ユーザの入力を最小限に抑えることができる。
なお、本発明は上記実施形態のみに限定されるものではない。
文字サイズを自動的に設定する方法としては、例えば言語、文字種に応じて表示に適した文字サイズとなるよう文字サイズを変更するという方法がある。
また、この他、表示するディスプレイの特性(主に解像度とサイズ)などから適切な文字サイズを自動推定する(例えば携帯端末の画面とPCのディスプレイでは最適なサイズは異なる)という方法もある。
本発明に係る第1実施形態の画像処理装置の構成を示す図である。 図1の画像処理装置の言語・文字種/文字サイズ対応テーブルを示す図である。 この第1実施形態の画像処理装置における処理手順を示すフローチャートである。 この画像処理装置において、2つの文書画像が共に日本語の文字を含む場合の変換元画像を示す図である。 図4の変換元画像をそれぞれ画像処理した結果の文書画像を示す図である。 この画像処理装置において、1つの文書画像が日本語の文字を含み、他の一つの文書画像がアルファベットの文字を含む場合の変換元画像を示す図である。 図6の2つの変換元画像をそれぞれ画像処理した結果の文書画像を示す図である。 本発明に係る第2実施形態の画像処理装置の構成を示す図である。 この第2実施形態における画像処理装置の処理手順を示すフローチャートである。 画像の拡大・縮小率を求めるフローチャートである。 画像の拡大縮小率を決定する処理を説明するための図である。 画像の拡大縮小率を決定するTfitとRの計算処理を説明するための図である。 画像A、B、Cに対する拡大縮小処理の結果を示す図である。 生成した画像サイズが表示領域サイズより大きい場合の画像初期配置の一例を示す図である。 入力画像が予め名刺画像と分かっている場合に生成した画像を画面に表示する場合の一例を示す図である。
符号の説明
11…画像入力部、12…記憶部、13…レイアウト解析部、14…幾何情報推定部、15…言語・文字種推定部、16…画像処理部、17…画像表示部、18…画像出力部、19…操作入力部、20…言語・文字種/文字サイズ対応テーブル、31…拡大・縮小倍率決定部、32…画像配置決定部

Claims (3)

  1. 所定表示領域を有する画面を備えた表示手段と、
    前記表示領域よりも大きなサイズの名刺画像、この名刺画像の構成要素の配置を示す画像配置設定情報および名前辞書を記憶する記憶手段と、
    前記記憶手段から読み出した名刺画像と画像配置設定情報から、前記名刺画像に含まれる構成要素のレイアウト解析を行うことで前記名刺画像に含まれる文字列の配置情報を得るレイアウト解析手段と、
    前記レイアウト解析手段により得られた文字列の配置情報及び前記名前辞書から得られる情報を用いて前記名刺画像の中の名前の位置を決定し、位置が決定した名前の始まりを前記表示領域の左端に配置するように前記名刺画像を前記表示手段に出力する画像配置決定手段
    を具備したことを特徴とする画像処理装置。
  2. 所定表示領域を有する画面を備えた表示手段と、前記表示領域よりも大きなサイズの名刺画像、名刺表示用の画像配置設定情報および名前辞書を記憶する記憶手段とを備えた画像処理装置に処理を実行させる画像処理プログラムであって、
    前記画像処理装置を、
    前記記憶手段から読み出した名刺画像とこの名刺画像の構成要素の配置を示す画像配置設定情報から、前記名刺画像に含まれる構成要素のレイアウト解析を行うことで前記名刺画像に含まれる文字列の配置情報を得るレイアウト解析手段と、
    前記レイアウト解析手段により得られた文字列の配置情報及び前記名前辞書から得られる情報を用いて前記名刺画像の中の名前の位置を決定し、位置が決定した名前の始まりを前記表示領域の左端に配置するように前記名刺画像を前記表示手段に出力する画像配置決定手段
    として機能させることを特徴とする画像処理プログラム。
  3. 所定表示領域を有する画面を備えた表示手段と、前記表示領域よりも大きなサイズの名刺画像、この名刺画像の構成要素の配置を示す画像配置設定情報および名前辞書を記憶する記憶手段と、レイアウト解析手段と、画像配置決定手段とを備えた画像処理装置における画像処理方法において、
    前記レイアウト解析手段が、前記記憶手段から読み出した名刺画像とこの名刺画像の構成要素の配置を示す画像配置設定情報から、前記名刺画像に含まれる構成要素を抽出し、抽出した構成要素のレイアウト解析を行うことで前記名刺画像に含まれる文字列の配置情報を得るステップと、
    前記画像配置決定手段が、前記文字列の配置情報及び前記名前辞書から得られる情報を用いて、前記名刺画像の中の名前の位置を決定し、位置が決定した名前の始まりを前記表示領域の左端に配置するように前記名刺画像を前記表示手段に出力するステップと
    を有することを特徴とする画像処理方法。
JP2004376155A 2004-12-27 2004-12-27 画像処理装置、画像処理プログラム及び画像処理方法 Active JP4177325B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004376155A JP4177325B2 (ja) 2004-12-27 2004-12-27 画像処理装置、画像処理プログラム及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004376155A JP4177325B2 (ja) 2004-12-27 2004-12-27 画像処理装置、画像処理プログラム及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2006184415A JP2006184415A (ja) 2006-07-13
JP4177325B2 true JP4177325B2 (ja) 2008-11-05

Family

ID=36737600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004376155A Active JP4177325B2 (ja) 2004-12-27 2004-12-27 画像処理装置、画像処理プログラム及び画像処理方法

Country Status (1)

Country Link
JP (1) JP4177325B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008124975A (ja) * 2006-11-15 2008-05-29 Fuji Xerox Co Ltd 画像データ作成装置、画像出力装置、およびプログラム
JP2010160210A (ja) * 2009-01-06 2010-07-22 Sharp Corp データ表示装置、データ表示方法、そのためのコンピュータプログラム、及び当該コンピュータプログラムを記録した記録媒体
JP5463726B2 (ja) * 2009-04-28 2014-04-09 カシオ計算機株式会社 画像生成装置、サーバ装置、画像生成方法、および、プログラム
JP5564232B2 (ja) * 2009-10-29 2014-07-30 三星電子株式会社 情報処理装置、情報処理方法、及びプログラム
JP5927942B2 (ja) * 2012-01-30 2016-06-01 株式会社リコー 画面生成装置、画面生成システム及び画面生成プログラム
JP2014099089A (ja) * 2012-11-15 2014-05-29 Ricoh Co Ltd 表示制御装置、表示制御方法及び表示制御プログラム
JP6229315B2 (ja) * 2013-05-31 2017-11-15 富士通株式会社 情報通信装置及びデータ連携プログラム
JP2016004157A (ja) * 2014-06-17 2016-01-12 カシオ計算機株式会社 画像表示装置、画像表示方法及びプログラム
JP7247554B2 (ja) * 2018-11-30 2023-03-29 株式会社リコー 表示装置および表示方法

Also Published As

Publication number Publication date
JP2006184415A (ja) 2006-07-13

Similar Documents

Publication Publication Date Title
US9922400B2 (en) Image display apparatus and image display method
EP2162859B1 (en) Image processing apparatus, image processing method, and computer program
US8237818B2 (en) Camera
US8897594B2 (en) Image reader, mobile terminal apparatus, and non-transitory computer readable medium
US10650489B2 (en) Image display apparatus, control method therefor, and storage medium
US10296559B2 (en) Display apparatus, control method therefor, and storage medium
JP6261237B2 (ja) 画像表示装置、画像表示装置の制御方法およびコンピュータプログラム
KR101018310B1 (ko) 전자 문서 생성장치, 전자 문서 생성방법, 및 기억매체
JP2009146064A (ja) 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
CN107133615B (zh) 信息处理设备和信息处理方法
JP2007241356A (ja) 画像処理装置および画像処理プログラム
JP4177325B2 (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP4443194B2 (ja) 携帯端末の文字認識における処理対象選択方法および携帯端末
JP5256956B2 (ja) 画像処理装置、画像表示システム、及びプログラム
US20100149557A1 (en) Image processing apparatus and image processing method
US20060215187A1 (en) Image processing apparatus and image processing method
JP4474231B2 (ja) 文書リンク情報取得システム
JP2017208655A (ja) 情報処理装置、情報処理方法及びプログラム
JP4501731B2 (ja) 画像処理装置
JP2000137801A (ja) 画像形成方法および装置並びに画像処理制御プログラムを記憶した媒体
JP2005055973A (ja) 携帯情報端末
US8340434B2 (en) Image processing apparatus, image processing system and computer readable medium
JP3671654B2 (ja) 文書処理装置および記録媒体
US20150261740A1 (en) Text reading aid
JP4929643B2 (ja) 画像位置合わせ装置及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080819

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080821

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4177325

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350