JP2005055968A - 携帯情報端末 - Google Patents

携帯情報端末 Download PDF

Info

Publication number
JP2005055968A
JP2005055968A JP2003206166A JP2003206166A JP2005055968A JP 2005055968 A JP2005055968 A JP 2005055968A JP 2003206166 A JP2003206166 A JP 2003206166A JP 2003206166 A JP2003206166 A JP 2003206166A JP 2005055968 A JP2005055968 A JP 2005055968A
Authority
JP
Japan
Prior art keywords
image
unit
character string
character
information terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003206166A
Other languages
English (en)
Inventor
Tatsumi Tsutsui
達巳 筒井
Hisao Ogata
日佐男 緒方
Mitsuhisa Himaga
充寿 日間賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003206166A priority Critical patent/JP2005055968A/ja
Publication of JP2005055968A publication Critical patent/JP2005055968A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

【課題】従来の携帯情報端末では、画面が非常に小さいため、認識対象選択中に、認識対象となる文字の確認をすることが困難であった。また、手ぶれによる画像のズレの発生を確認することが困難であった。
【解決手段】上記目的を達成するため、画像を入力する画像入力部と、入力した画像データを表示する表示部と、利用者がボタンなどの入力操作する操作部と、画像データの特定領域の抽出及び画像の縮小を行う画像処理部と、画像内の文字を認識する文字認識処部と、全体の制御を行う制御部を備えた携帯情報端末あるいは携帯電話において、認識対象選択中に画像入力部から取得した画像データより、認識対象領域付近、又は認識対象文字行、又は認識対象文字列を全体画像に比べて拡大して表示部に別ウインドウとして表示する携帯情報端末、又は方法を提供する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、携帯電話やPDAなどの携帯情報端末であって、特に電子カメラなどを有して画像データを取得できるものにおける文字認識技術の向上に関する。
【0002】
【従来の技術】
上記の技術分野においては、携帯端末によって画像を採取し文字認識する場合に、採取した低解像度の画像から文字行位置の抽出処理を行った後、その文字行位置の部分画像に対し拡大表示を行うことにより、文字行部分画像を高解像度化して認識精度の向上を図る技術思想が提案されている(特許文献1)。
【0003】
【特許文献1】
特開2003−78640号公報
【0004】
【発明が解決しようとする課題】
携帯情報端末の画面は比較的小さいので、その画面に撮影対象の文字列を全て表示すると、画面上における文字が小さくなってしまい、操作者が文字認識前に画面上で視認できない。
【0005】
特許文献1に記載された技術思想では、抽出された文字行の拡大は、文字認識の精度向上のために行われるので、文字認識の指示がなされた後に文字行を拡大するものであるため、文字認識の対象が間違っていた場合、文字認識をやり直さねばならず手間であるという課題がある。また、携帯情報端末は利用者が手でもって扱うため、手ぶれが生じるところ、画面に撮影対象の文字が小さく表示されるため画面を見ても手ぶれの程度が分かりにくく、文字認識の精度を落とす程の手ぶれであるか否かの判断がつかない。手ぶれの程度が大きく、文字認識の精度が悪かった場合、文字認識をやり直さなけれならず手間であるという課題がある。
【0006】
【課題を解決するための手段】
上記課題を解決するために例えば、以下の手段を採用する。
【0007】
撮影対象の画像を取得する画像取得部と、操作入力を受ける操作部と、画像取得部で取得した画像に含まれる文字を識別する文字識別部と、画像取得部が取得した画像及び文字認識部による文字認識結果を表示する表示部とを有する携帯情報端末であって、画像取得部で取得した画像から文字列を抽出する文字列抽出部と、画像取得部で取得した画像を処理して、文字列抽出部で抽出した文字列を含んで且つ縮小率の異なる複数の画像を作成する画像処理部と、画像処理部で作成した複数の画像を表示部の同じ画面に表示し、且つ、操作部への操作入力を受けて文字識別部の識別結果を表示する表示制御部とを有する。
【0008】
【発明の実施の形態】
以下、本発明に好適な実施形態の例を実施例1と2として、図1から図5を用い説明する。
【0009】
図1は、画像入力部を持つ携帯情報端末あるいは携帯電話100(又は単に携帯端末、携帯装置とも言う)の概略を示す構成図である。
【0010】
名刺や雑誌、あるいは看板などの撮影対象の画像が、電子カメラ等の画像入力部(取得部)110から入力され、画像処理部160によって後述する画像処理がされ、文字認識部150において文字認識処理を行い、画像処理部160で処理された画像や文字認識部150の文字認識結果を表示部120に表示する。
【0011】
第1表示ウインドウ123と第2表示ウインドウ122は、画像入力部110で入力した画像を表示しており、見易いようそれぞれに表示する画像の縮小率が異なる(第2表示ウインドウ122のほうが縮小率は小さい。すなわち、撮影対象の文字を大きく表示している)。カーソル121は、文字認識する単語や文字列の位置を示すもので、利用者は携帯電話100自体又は操作部130の矢印キーを操作して所望の単語等にカーソル121を合わせる。なお、第2表示ウインドウに認識後の文字列を表示してもよいが、文字認識に時間がかかると携帯電話100やカーソル121の移動に処理が追いつかない可能性があるため文字認識前の画像を表示している。
【0012】
操作部130は、利用者が一般的に電話をかけるときなどに使用されるものであるが、他に利用者が表示部120に表示された画像の認識を開始する時に押下する認識開始ボタン131を有する。認識対象の画像及び文字認識結果は内部メモリや外部記憶装置(メモリカード他)等の記憶部に記憶される。
【0013】
画像入力部110、表示部120、操作部130、文字認識部150、画像処理部160の各部の制御は、CPU等から構成される制御部140によってされる。
【0014】
上述及び以下に説明する各部は、手段、機構、ユニットとも表現でき、また、ソフトウェア、ハードウェア、又はソフトウェアとハードウェアとの結合によって処理、制御される機能である。
【0015】
実施例1:
図2は、図1の携帯端末を使用した第1の実施形態の処理手順を説明する図である。以下に示す処理、制御は制御部140によって主に行われるが説明を省略する。
【0016】
携帯情報端末あるいは携帯電話100が具備するCCDやイメージセンサ等の画像入力部110で、撮影対象(名刺、雑誌、看板など)の画像をディジタルデータとして入力する(ステップ201)。なお、利用者は、認識したい画面上の文字列の上にカーソル121が位置されるよう携帯電話100自体又は操作部130を操作する。
【0017】
入力した画像を画像処理部160のカーソル位置画像抽出部161にてカーソル位置から上下左右に決められた領域内の画像を抽出する(ステップ202)。カーソル位置付近の抽出した画像に対して、文字行抽出部151にて文字行を抽出し(ステップ203)、抽出した文字行に対して単語抽出部152にて単語の外接矩形の座標を取得する(ステップ204)。画像縮小部162にて、単語の外接矩形の座標より単語領域(挟領域とも言う)の画像を第2表示ウインドウ122に表示するための画像サイズの縮小率(低い場合には文字が大きく表示され、と、縮小率が0や負(すなわち拡大)の場合もあり得る。縮小率の変更には、画素数の変更によるサイズ変更も含む)と、画像の広領域(第2表示ウインドウに表示する領域と比較して広いという意味であり、画像として取得された撮影対象物の領域全体又は利用者が画像入力部110の撮影エリアを認識できる程度の広さの領域である。)第1表示ウインドウ123に表示するための縮小率を算出し、画像の縮小を行い(ステップ205)、表示制御部によって画面を編集して表示部120に出力する(ステップ206)。
【0018】
カーソルが移動(携帯電話100自体の移動を含む)した場合(ステップ207)には、ステップ201からステップ206を再度行う。
【0019】
利用者による第2表示ウインドウ122に認識対象文字列を確認後、認識開始ボタン131が押下(ステップ206)されると、抽出された単語に対して文字識別部154にて文字識別を行い(ステップ209)、認識結果を表示制御部で画面に編集して表示部120に出力する(ステップ210)。
【0020】
図3は、ステップ205における画像縮小処理の詳細を説明する図である。携帯情報端末の表示画面は一般的には小さく(実際の画像サイズは表示サイズより大きく)、画像入力部110から取得した画像データ300は第1表示ウインドウ311には縮小して表示している場合が多い。
【0021】
第1表示ウインドウ311には、画像入力部110から取得した画像データ300が全て収まるように画像の縮小を行う。第2表示ウインドウ312には、単語抽出部152にて取得した単語の外接矩形座標301,302より単語矩形303のサイズを算出して、表示部120のサイズと比較して単語が第2表示ウインドウ312に収まるように画像の縮小を行う。画像入力部110から取得した画像データをそのまま使用又は拡大して使用しても良いが、単語の長さや矩形の大きさに合わせて表示することで操作者に見易い画面を提供できる。本例では、第2表示ウインドウ312自体のサイズは固定であるが、画像の縮小と併せて第2表示ウインドウのサイズを単語矩形303のサイズにより決定するとさらに見易さ(使い勝手)が向上する。
【0022】
以上説明した第1実施形態の特徴は、利用者が認識対象単語を選択中に、携帯電話100は画像入力部110から取得された画像に含まれる認識対象単語を検出して、認識対象単語の表示をすることで、利用者が認識対象単語の確認を容易に行うことができる。
【0023】
なお、単語の代わりに文字行を表示しても良いが、単語まで抽出して表示することで、比較的小さい携帯電話100の表示部120であっても見易くなる。単語と文字行を総称して文字列ともいう。
【0024】
また、第2表示ウインドウに表示する挟領域(第1表示ウインドウに表示する撮影対象の領域との比較において狭いという意味)として、カーソル121周辺の文字列を抽出する代わりに、カーソル121周辺の予定された面積内の領域を表示しても良いが、撮影対象の文字列の大きさや長さが考慮されないため、文字列が欠けてしまったり、小さな表示になってしまったりという弊害があり得る。
【0025】
実施例2:
図4は、本発明に係る第2の実施形態の処理手順を説明する図である。図4の中の符号が図2と同一のステップは、同一機能を有するものとするためここでの説明は省略する。
【0026】
画像取得(ステップ201)後にカーソル領域画像抽出により抽出した画像データとステップ403で1つ前に退避した記憶部に記憶しているカーソル領域画像データのマッチングを画像処理部140で行い(ステップ401)、手ぶれ等による画像の合致度又はズレの大きさを検出して判断する。
【0027】
ステップ402ではカーソル領域画像マッチング(ステップ401)で画像のズレが小さい(合致度が高い)と判定されていれば第2表示ウインドウ122内を赤色で表示する(メッセージボックスを表示する、又は音を出す等でも良い)ことで利用者に手ぶれが小さい状態であることを通知する。
【0028】
図5は、ステップ401におけるカーソル領域画像マッチング処理の一例を説明する図である。カーソル領域画像のマッチング処理ではステップ401でカーソル領域画像抽出により抽出した画像データ500とステップ403で退避した1つ前のカーソル領域画像データ501を重ね合わせて520、画像データ500の黒画素に重なりあっている画像データ501の黒画素の割合(合致度)がある閾値以上であれば、手ぶれによる画像のズレは小さいと判断する。
【0029】
以上説明した第2実施形態の特徴は、利用者が認識対象文字を選択中に、携帯電話100から時系列に画像入力部110から取得される現在のカーソル領域画像フレームと、1つ前のカーソル領域画像フレームをマッチングし、画像ズレを通知することで、利用者の手ぶれによる認識対象撮影後の画像ぶれを未然に防止することができる。
【0030】
なお、カーソル領域画像ではなく元の画像300を時系列で比較しても良いが、比較領域が広くなって処理が遅くなる懸念があること、又は、認識対象であるカーソル領域画像のズレが認識精度に影響することから、カーソル領域画像の比較が望ましい。
【0031】
【発明の効果】
以上に説明したように、認識対象領域の表示を別ウインドウにて表示することで、利用者が認識対象画像選択中に認識対象を容易に撮影することができる。
【0032】
また、利用者が認識対象領域選択中に上記表示ウインドウにて手ぶれによる画像のズレを確認することで、認識領域選択後の画像のズレを未然に防ぐことができる。
【図面の簡単な説明】
【図1】携帯端末の詳細構成図を示す。
【図2】第1の実施形態に係る文字認識方法のフロー図である。
【図3】画像縮小処理の詳細を説明する図である。
【図4】第2の実施形態に係る文字認識方法のフロー図である。
【図5】第2の実施形態に係るカーソル領域画像マッチング処理の詳細を説明する図である。
【符号の説明】
100…携帯情報端末(携帯端末)、110…画像入力部、120…表示部、130…操作部、140…制御部、150…文字認識部、160画像処理部。

Claims (4)

  1. 撮影対象の画像を取得する画像取得部と、操作入力を受ける操作部と、前記画像取得部で取得した画像に含まれる文字を識別する文字識別部と、前記画像取得部が取得した画像及び前記文字識別部による文字識別結果を表示する表示部とを有する携帯情報端末であって、
    前記画像取得部で取得した画像から文字列を抽出する文字列抽出部と、
    前記文字列抽出部で抽出した文字列を含んで且つ縮小率の異なる複数の画像を前記画像取得部で取得した画像を処理して作成する画像処理部と、
    前記画像処理部で作成した複数の画像を前記表示部に共に表示し、且つ、前記操作部への操作入力を受けて前記文字列抽出部で抽出した文字列についての前記文字識別部の識別結果を表示する表示制御部とを有することを特徴とする携帯情報端末。
  2. 請求項1に記載の携帯情報端末であって、
    前記表示部の画面は、前記画像取得部で取得した画像の広域を表示する第1ウインドウと前記第1ウインドウに表示された広域よりも狭い領域を示し且つ縮小率が低い画像を表示する第2ウインドウを含み、
    前記表示制御部は、前記第2ウインドウのサイズを前記画像処理部が作成する画像の大きさに応じて決定することを特徴とする携帯情報端末。
  3. 請求項1又は2に記載の携帯情報端末であって、
    前記画像処理部は、前記文字列抽出部が抽出した文字列の幅と前記表示部の幅とに基づいて画像の縮小率を決定することを特徴とする携帯情報端末。
  4. 請求項1から3のいずれかに記載の携帯情報端末であって、
    前記画像処理部が作成した画像を順次記憶する記憶部を有し、
    前記画像処理部は、作成した画像と前記記憶部に記憶している画像とを比較してそれぞれの画像における前記文字列抽出部が抽出した文字列の合致度又はズレを判断し、
    前記画像処理部で合致度又はズレの大きさが所定以上であると判断したとき、前記表示制御部は、前記表示部に通知を表示することを特徴とする携帯情報端末。
JP2003206166A 2003-08-06 2003-08-06 携帯情報端末 Pending JP2005055968A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003206166A JP2005055968A (ja) 2003-08-06 2003-08-06 携帯情報端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003206166A JP2005055968A (ja) 2003-08-06 2003-08-06 携帯情報端末

Publications (1)

Publication Number Publication Date
JP2005055968A true JP2005055968A (ja) 2005-03-03

Family

ID=34363116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003206166A Pending JP2005055968A (ja) 2003-08-06 2003-08-06 携帯情報端末

Country Status (1)

Country Link
JP (1) JP2005055968A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005071944A1 (ja) * 2004-01-27 2005-08-04 Matsushita Electric Industrial Co., Ltd. 文字読み取り装置及び画像表示方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005071944A1 (ja) * 2004-01-27 2005-08-04 Matsushita Electric Industrial Co., Ltd. 文字読み取り装置及び画像表示方法

Similar Documents

Publication Publication Date Title
US7343049B2 (en) Method and apparatus for performing optical character recognition (OCR) and text stitching
WO2019134516A1 (zh) 全景图像生成方法、装置、存储介质及电子设备
US8120641B2 (en) Panoramic photography method and apparatus
KR100967855B1 (ko) 디지털 이미지의 프레이밍 및 샤프니스를 확인하기 위한 시스템 및 방법
EP2339536A2 (en) Image processing system, image processing apparatus, image processing method, and program
EP1555558A1 (en) Focus state display
JP5050465B2 (ja) 撮像装置、撮影制御方法、およびプログラム
CN112135046A (zh) 视频拍摄方法、视频拍摄装置及电子设备
JP2010141649A (ja) 撮像装置、顔検出方法及びプログラム
JP2004023158A (ja) 画像撮像装置
CN112995500A (zh) 拍摄方法、装置、电子设备及介质
US20070126889A1 (en) Method and apparatus of creating and displaying a thumbnail
CN111787230A (zh) 图像显示方法、装置和电子设备
JP5247338B2 (ja) 画像処理装置及び画像処理方法
JP2007266882A (ja) 撮像装置、撮影制限方法、及び撮影制限プログラム
CN112822394B (zh) 显示控制方法、装置、电子设备及可读存储介质
JP2007088959A (ja) 画像出力装置及びプログラム
JP2007258953A (ja) 自動撮影システム及び自動撮影装置
US20090087102A1 (en) Method and apparatus for registering image in telephone directory of portable terminal
JP2005055973A (ja) 携帯情報端末
JP2005055968A (ja) 携帯情報端末
JP2004341977A (ja) 文字認識装置及び携帯情報端末
CN106874444B (zh) 图片处理方法及装置
KR100700101B1 (ko) 사용자 촬영 영상의 사용자 이미지 편집 기능을 가지는이동통신 단말기 및 그 방법
JP2006128793A (ja) 撮像装置、及びその制御方法

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050223