JP2005135210A

JP2005135210A - 文字認識機能を有する携帯機器

Info

Publication number: JP2005135210A
Application number: JP2003371499A
Authority: JP
Inventors: Masashi Koga; 昌史古賀; Tatsuya Kameyama; 達也亀山; Ryuji Mine; 竜治嶺; Hiroshi Shinjo; 広新庄
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2003-10-31
Filing date: 2003-10-31
Publication date: 2005-05-26

Abstract

【課題】カメラを有する携帯型の端末における入力手段に関し、周囲の景観からの文字認識の読取対象を自動的に検出し、文字認識を行う。
【解決手段】ユーザが指定したキーワードから、認識対象の文字列を自動的に設定する。画像入力手段から連続的に入力される画像に対して文字列抽出・文字認識処理を行い、認識が成功した場合に音声や振動などでユーザに通知する。
【効果】従来は困難であった，景観中の文字列を自動的に検出して操作者に告知することが可能となる。
【選択図】図１

Description

本発明は，カメラを有する携帯型の端末における入力手段に関する技術分野に属する。

従来より，カメラで撮った画像をデジタル化し，ファイルとして蓄積することができるデジタルスチルカメラ，カメラ付き携帯電話，カメラ付きPDAなどの装置が実用化されている。さらに，これらの機器を文字認識における画像入力手段として用いることが試みられている。例えば，H. Fujisawa, H. Sako, Y. Okada, and S-W. Lee, "Information Capturing Camera and Developmental Issues," Proc. Int. Conf. Document Analysis and Recognition, ICDAR'99, Bangalore, India, Sep. 20-22, 1999, pp. 205-208（非特許文献１）では，カメラ付きの携帯機器で外国語の標識や看板の文字を読取り，翻訳，検索などに用いることが述べられている。

一般に文字認識には，(1) 文字行領域の検出(文字行抽出)，(2) 文字行領域からの各文字の領域の検出(文字切出し)，(3) 切出した個々の文字がいかなる文字であるかの識別(文字識別)，(4) 文字識別結果の解釈(言語処理)の４つの機能が必要である。ただし，必ずしもこれらの順に処理を行うとは限らない。例えば，村瀬洋，“言語情報を利用した手書き文字列からの文字きりだしと認識,”信学論 (D), vol.J69-D, no.9, pp.765-772（非特許文献２）においては，様々な仮説に基づいて文字切出した後，文字識別結果と言語処理によって文字の切出し方を確定する。

従来の文字認識技術では，主に紙の文書に書かれた文字を対象としており，画像はイメージスキャナによって入力していた。これに対し，カメラを入力手段として看板や標識などを読取る場合には，上記の機能の内，特に文字行切出しおよび文字切出しを高度化する必要がある。なぜなら，文字と背景の分離や文字配置の解析といった，従来の文字行抽出や文字切出しで必要な要素機能の実現が困難になるからである。例えば，カメラで画像を入力する場合には，スキャナで画像を入力する場合と異なり，照明条件を予め知ることができないため，文字と背景の分離は困難になる。また，紙の文書では文字行の配置に文書固有の制約があるが，カメラで撮った画像中の看板や標識にはこうした制約はないため，文字の配置に関する先見的な知識に基づいて文字行を切出すことは困難になる。

H. Fujisawa, H. Sako, Y. Okada, and S-W. Lee, "Information Capturing Camera and Developmental Issues," Proc. Int. Conf. Document Analysis and Recognition, ICDAR'99, Bangalore, India, Sep. 20-22, 1999, pp. 205-208

村瀬洋，"言語情報を利用した手書き文字列からの文字きりだしと認識,"信学論 (D), vol.J69-D, no.9, pp.765-772 R.M.K. Sinha, B. Prasada, G.F. Houle, M. Sabourin, "Hybrid Contextual Text Recognition with String Matching," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 15, No. 9, December 1993 A.K. Jain, B. Yu, "Automatic Text Location in Images and Video Frames," Pattern Recognition, Vol. 31, No. 12, pp. 2055-2076, 1998 C.-L. Liu, M. Koga and H. Fujisawa, "Lexicon-driven Segmentation and Recognition of Handwritten Character Strings for Japanese Address Reading," IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 24, No. 11, Nov. 2002, pp. 425-1437

本発明の携帯機器は，カメラを文字認識の画像入力手段として用い，街頭などで特定の文字の書かれた看板・標識類を読取るものである。従来の技術では，操作者が読取り対象の看板・標識類を自ら探し，これにカメラを向け，文字認識をする。これに対し，本発明の装置は，広角のカメラを用いて広い範囲を撮影し，自動的に読み取り対象を検出する機能を有する。これにより，操作者が自ら読取り対象を探してカメラを向ける必要がなくなり，大幅に利便性が向上する。

こうした機能を実現するために，本発明で解決しようとするのは以下のような課題である。

第一に，文字の検出・認識には処理時間がかかることである。本発明の携帯機器では従来のものに比べ処理する画像の領域が大きいため，検出される文字行も多くなり，文字切出し，文字識別，言語処理の処理時間が増大する。処理時間の増大により，操作者が必要な情報を得るために待つ時間が延び，機器の利便性は低下する。このため，処理時間の削減は重要な課題である。

第二に，画像中には不要な文字列が多数ある一方，探している看板・標識にどのような文字が書かれているか，必ずしも正確には操作者にはわからないことである。街中で画像を撮った場合には，多数の文字が画像に写る。しかし，操作者の関心のあるものはそれらの一部であることが多い。ここで，認識対象を操作者が予め指定した文字列に限定することにより，不要な文字を排除することができる。しかし，一つの事柄を意味する文字列が何通りもあることも多い。例えば，英語で便所を意味する文字列は「bathroom」「toilet」「rest room」「lavatory」など様々なものがある。これらの様々な文字列のいずれが画像中に出現するかを予め操作者が知ることは出来ない。また，これらを全て操作者が指定するのには,多くの手間がかかる。このように，不要な文字を排除することと，多様な文字列を認識対象にすることを同時に実現することは，重要であり，解決が困難な課題である。

第三に，撮影した画像中には必ずしも操作者に関心のあるの文字列が写っているとは限らないことである。上述したように，操作者に代わって携帯機器が読取り対象の文字を画像中から探し出せるようにすることが，本発明の目的である。この目的を実現するためには，画像を撮影した時点では，操作者が関心のある文字列が写っているか否かを意識しないでよいようにする必要がある。この問題の自明な解決法として，画像を撮影して画像中の文字を認識した後，操作者が関心がある文字列の有無を携帯機器が操作者に提示するという手段がある。しかし,この手段を用いた場合には，操作者は撮影，文字列の有無の確認を何度も繰り返す必要があり，装置の利便性は悪くなる。このように，撮影した画像中に必ずしも操作者の関心のある文字列があるとは限らない問題を，装置の利便性を低下させずに解決することは，重要な課題である。

本発明では，上記の第一の課題を解決するために，予め認識対象の文字列を絞り込めるよう，操作者が認識対象の文字列の集合を指定する手段を提供する。さらに，指定した認識対象の文字列の集合に応じて文字識別の字種を絞り込む手段を提供する。一般に，文字識別の処理時間は，識別する文字種の数に応じて増加する。このため，予め認識対象の文字列が限定できるならば，それに応じて識別する文字種も絞り込むことで，処理時間を削減することができる。そこで，本発明の携帯機器では，操作者が関心のある文字列の集合を指定できるようにし，さらに指定した文字列の集合に応じて自動的に文字識別で用いる文字種を絞り込むようにする。また，認識対象の文字列群を予め記憶しておき，操作者がそれを必要に応じて選択できるようにすることで，認識対象文字列の指定を容易にする。さらに，携帯機器が状況に応じて自動的に行う手段を設けることで,一層の容易化を実現する。

また，第二の課題を解決するために，同じ意味の文字列の集合を自動的に取得する手段を設ける。例えば，操作者が「便所」という文字列を入力，もしくはメニューから選択すると，携帯機器は予め記憶してある同意語に関する情報を参照し，「便所」の同意語の集合を取得する。さらに，一般的な言語の知識を利用し，必要に応じて同意語をさらに変化させ，認識対象の文字列の集合を決定する。ここで一般的な言語知識で同意語を変化させることは，例えば，日本語の場合では送り仮名の多様さに対応して「預かり所」から「預かり所」「預り所」「預所」といった文字列の集合を生成することである。また，英語の場合では大文字・小文字の表記の多様さに対応して「rest room」から「rest room」「Rest Room」「REST ROOM」といった文字列の集合を生成することである。

また，第三の課題を解決するために，携帯機器が自動的に撮像と文字認識を繰り返すようにするとともに，操作者に関心のある文字列が画像中から認識された場合には，その旨を音声や振動などで操作者に伝えるとともに，認識された文字列の場所を画像で表示する。このことにより，操作者が個々の画像に関心のある文字列が写っているかどうかを意識する必要がなくなる。さらに，関心のある文字列が見つかった場合には，速やかにそれを知ることができるとともに，その文字列を容易に目視で見つけ，カメラを介さずに詳細を確認することができるようになる。

従来は困難であった，景観中の文字列を自動的に検出して操作者に告知することが可能となる。

図１に本発明の第一の実施例における画像の入力から画像ファイルの保存に至る処理の流れをデータフロー図で示す。図中の枠１０１で示す範囲が携帯機器内部で行う処理である。

本実施例では，カメラなどによって画像を入力(１０９)後，認識対象文字列辞書１０８を参照し，画像中から文字列を認識（１１０）する。認識が成功，すなわち認識対象が認識対象文字列辞書１０８に格納されている文字列を画像中から検出した際には，その旨を音声もしくは振動で操作者に告知１１１するとともに，認識結果を表示する（１１２）。

認識文字列辞書１０８には，認識対象となる文字列の集合を格納する。格納する文字列は，以下の３通りの方式で決定する。

（１）操作者が関心のある言葉，すなわちキーワードを携帯機器に入力する（１０２）。携帯機器では，携帯機器中に格納してある同意語辞書１０４もしく携帯機器の外部に格納されている外部同意語辞書１１４を参照し，入力されたキーワードの同意語の集合を得て（同意語展開処理１０３），さらにこれらを一般的な言語知識で変化させて，これらを認識対象文字列辞書１０８に格納する。同意語辞書１０４と外部同意語辞書１１４は，単語とその同意語の集合の関係を記憶するものである。外部同意語辞書１１４には後述する通信手段を介して参照する。また,一般的な言語知識による変化としては，以下の処理を行う。
・英単語の先頭文字を大文字にする。
・英単語の全ての文字を大文字にする。

同意語展開の機能により，操作者が多数の同意語を逐一携帯機器に入力する必要がなくなり，利便性が大幅に向上する。さらに，認識対象が外国語の場合，キーワードを母国語で指定し，これに対応する同意語を外国語としてもよい。

（２）携帯機器は，認識メニュー情報１０６を参照し，キーワードをメニューの形で操作者に表示する。操作者は，メニュー中から関心のあるものを選択する（１０５）。選択結果に応じ，携帯機器はメニュー情報１０６に格納してある認識対象文字列の集合を認識対象文字列辞書１０８に格納する。メニュー中から自分の関心のあるキーワードを選択する手段を設けることにより，操作者が多数の同意語を逐一携帯機器に入力する必要がなくなり，携帯機器の利便性が大幅に向上する。

（３）携帯機器は，認識対照文字列取得を要求する信号を，通信手段を介して，外部の計算機に送る。これを受信した計算機は，認識対象文字列の集合を携帯機器に送信する。受信した認識対象文字列の集合を携帯機器は認識対象文字列辞書１０８に格納する。認識対象文字列取得信号は，操作者が特定の操作をした時に送信するようにしてもよい。また，一定の時刻に送信するようにしてもよい。また，外部の計算機が送信する認識対象文字列を，携帯機器の場所，時刻，操作者などに適合して変化させることで，さらに携帯機器の利便性は向上する。

本実施例では，文字列認識処理としては，例えば，R.M.K. Sinha, B. Prasada, G.F. Houle, M. Sabourin, “Hybrid Contextual Text Recognition with String Matching,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 15, No. 9, December 1993（非特許文献３）のような方式を用いる。図２に文字列認識処理のデータフローの一例を示す。まず２０１において入力画像から文字行を切出す。文字行切出しには，例えばA.K. Jain, B. Yu, “Automatic Text Location in Images and Video Frames,” Pattern Recognition, Vol. 31, No. 12, pp. 2055-2076, 1998（非特許文献４）のような方式を用いる。次に２０２において文字行中から個々の文字を切出す。複数の文字行が切出された場合には，それら全てを以降の処理の対象とする。次に，ステップ２０３において切出した個々の文字が何の文字であるかを識別する。この際，文字種限定２０４にて認識文字列辞書１０８中に含まれる文字種のみに識別字種を限定し，文字識別辞書２０６を参照する。文字識別辞書２０６は，各文字の形状に関する情報を記憶してある。最後にステップ２０５において，文字識別した結果を文字列として解釈する。この際，認識文字列辞書１０８を参照する。また，文字列認識処理の出力は，認識対象文字列の有無と，認識された文字列である。

文字識別の処理時間は，おおよそ，識別対象の文字種数に比例する。このため，認識対象の文字列に出現しうる文字種に識別対象を限定することで，大幅な処理時間の削減が可能となる。この効果は，特に，漢字やハングルなど文字種が多い言語で顕著となる。

本実施例では，文字切出し，文字識別，後処理を逐次的に実行しているが，C.-L. Liu, M. Koga and H. Fujisawa, "Lexicon-driven Segmentation and Recognition of Handwritten Character Strings for Japanese Address Reading," IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 24, No. 11, Nov. 2002, pp. 425-1437（非特許文献５）にあるように，これらを統合した処理を実行してもよい。この場合には，文字種の限定は認識の過程で動的に行われ，一層の高速化，高精度化が実現できる。また，別の実施例として，言語情報を用いずに文字認識を実行した後，通常のテキストマッチングのアルゴリズムを用いて認識文字列辞書１０８中の単語と文字認識結果を照合するようにしてもよい。

図３に，本発明の実施例におけるハードウエアの構成を示す。画像は，レンズ,絞りなどからなる光学装置３０２によって撮像された後，例えばCCD素子などの光電変換素子３０３で電気信号に変換される。さらに得られた電気信号はアナログ・デジタル変換器３０４にてデジタル信号に変換し，さらに例えばDSPなどの信号処理素子３０５により，色空間変換，フィルタ処理などの処理を施す。この結果は，ＲＡＭ３０９へと転送する。また,認識対象文字列辞書１０８もＲＡＭ３０９に格納する。演算装置３０７は，ＲＯＭ３０８に格納されている処理手順と文字識別辞書などのデータを参照し，ＲＡＭ３０９に格納されている画像を入力として文字列認識処理１１０を実行する。また，入力装置３１２は，キーワードを入力する際に用いる。また，表示装置３０６は，撮影時の画像の確認，文字列認識結果の表示に用いる。音声発生装置３１３と振動装置３１４は，文字列存在告知１１１に用いる。また，通信装置３１５は，認識対象文字列の受信や外部同意語辞書１１３のアクセスに用いる。

図４に，本発明の実施例における装置の外観を示す。筐体４０１の前面には，光学装置２０２のレンズ部４０２を配置する。レンズには，操作者の周囲の看板,標識などを撮影するのに十分な広い画角のものを用いる。上部には，入力装置３１２の一部であって画像入力１０９を指示するためのシャッター４０３と，電源スイッチ４０４と，音声発生装置３１３の一部であるスピーカ開口部４１０を配置する。側面には，通信装置３１５のアンテナ４０７を配置する。背面には，入力装置３１２の一部である，キャンセルボタン４０５，カーソルキー４０６を配置する。さらに背面には，表示装置３０６の表示面４０９を配置する。カーソルキー４０６は，上下左右の端を押すと方向を指示する信号を入力装置３１２に送り，中央を押すと別の信号を入力装置３１２へ送る。本実施例は，操作時以外は携帯機器は操作者の胸ポケットなどに収納し，レンズのみを外に出して景観を撮影できるようにするとよい。

図５に，本実施例における携帯機器の状態遷移を示す。まず，電源スイッチ４０４を押すことにより，開始状態５０１から待機状態５０２へ遷移する。待機状態５０２にて，キーワード入力操作を起動することにより，キーワード入力状態５０３へ遷移し，入力が完了すると再び待機状態５０２に戻る。キーワード入力状態５０３では，例えば，仮想キーボードが表示面４０９に現れ,これをカーソルキー４０６で操作して文字列を入力する。また待機状態５０２にてメニュー選択操作を起動することで，メニュー選択状態５０４へ遷移し，メニュー選択が完了すると再び待機状態５０２へ戻る。また，待機状態５０２にて認識文字列取得を起動することにより，認識文字列取得状態５０５となり，認識対象文字列の取得が完了すると，再び待機状態５０２に戻る。認識文字列取得状態５０５では，携帯機器への操作は一時的に受け付けられなくなり，その間に，携帯機器が外部の計算機と通信して認識対象の文字列を取得する。待機状態５０２にて電源スイッチ４０４を押すことで，開始状態５０１へ戻る。待機状態５０２にて，認識を起動することにより，認識状態５０６へと遷移する。認識状態５０７では，後述するように，画像中から認識対象の文字列が認識されるまで，携帯機器は画像入力１０９と文字列認識１１０を繰り返す。この状態では，操作者はカメラのレンズだけを外に出して，携帯機器をポケットなどに収納して携行する。文字列が認識されたなら，文字列存在告知状態５０７へ遷移する。文字列存在告知状態５０７では，携帯機器は操作者の注意を喚起するため，音声もしくは振動を発する。操作者がキャンセルボタン４０５を押すと，音声もしくは振動は停止し，文字列認識結果表示状態５０８へ遷移する。文字列認識結果表示状態５０８では，表示面４０９に文字列認識結果が画像と重ねて表示される。ここで，キャンセルボタン４０５を押すことで，再び待機状態５０２へ遷移する。

図６に，待機状態５０２での表示面４０９を示す。表示面４０９にはメニュー６０１が表示される。メニュー中での選択項目は，操作者がカーソルキーの上下部分を押すことで変更し，確定の際にはカーソルキー４０６の中央を押す。いずれも選択しない場合には，キャンセルボタン４０５を押す。キーワード入力状態５０３に遷移する際には，操作者が「キーワード入力」６０３を選択し，カーソルキー４０６の中央を押す。また，メニュー選択状態５０４に遷移するには，「キーワード選択」６０２を選択して確定する。また，認識文字列取得状態５０５に遷移するには，「キーワード取得」６０４を選択して確定する。また，認識５０６状態に遷移するには，「認識」６０５を選択して確定する。

図７に，メニュー選択状態５０４での表示面４０９を示す。ここでは，ウインドウ７０１上に「便所」「案内所」などのキーワードが表示され,各キーワードの左にはチェックボックス７０２が配置してある。チェックボックスを操作することにより，キーワードを選択することができる。ここで,メニューに表示されるキーワードとそれに対応する同意語群は予め認識メニュー情報１０６に記憶してあり，それらが認識対象文字列として用いられる。例えば，「便所」をここで選択した場合には，「rest room」「Restroom」「toilet」などの文字列が認識対象となる。

図８に，入力画像の一例を示す。この例では，「Restroom」８０１と「Exit」８０２の二つの文字列が画像中にある。

図９に，図５の状態遷移図における認識状態５０６から文字列認識結果表示状態５０８に至る処理手順を示す。まず，ステップ９０１にて，認識対象文字列の集合に応じて，文字識別で識別対象とする文字種を限定する。次に，ループ９０２にて，画像入力９０３，文字列認識９０４を繰り返す。もし，画像中から対象の文字列が認識されたなら，ステップ９０５にて繰り返しを終了する。次に，ステップ９０６にて音声もしくは振動で文字列が認識できた旨を操作者に告知する。次にステップ９０７にて，文字列の認識結果を表示する。

図１０に，認識結果表示状態５０９の表示面４０９の状態を示す。ここでは認識された文字列８１０の位置を四辺形で囲むことにより，位置を明らかにする。操作者は，認識の告知後，移動したり向きを変えたりする前に速やかに認識結果を画面で確認することにより，容易に周囲から認識された文字列を見つけ出すことができる。また，認識結果の文字列，当該文字列の元となるキーワード，認識した時刻をウインドウ１００１上に表示する。これにより，操作者が同意語に明るくない場合(例えば認識対象が外国語の場合)でも，認識された文字列が，指定したキーワードのいずれに対応するかを容易に確認できる。

図１１に，同意語辞書１０４および外部同意語辞書１１３での記憶形式を示す。ここでは，キーワード１１０１と同意語群１１０２を１レコードとするテーブルで，同意語情報を格納する。

図１２に，認識メニュー情報１０６での記憶形式を示す。ここでは，認識対象に含めるか否かを表す真偽値１２０１とメニューに表示するキーワード１２０２と認識対象の文字列群１２０３を１レコードとするテーブルで，メニュー情報を記憶する。

画像入力から画像ファイル出力に至る処理の流れを示すデータフロー図。文字列認識処理の流れを示すデータフロー図。ハードウエアの構成図。装置の外観図。装置の操作の状態遷移を表す図。待機状態での表示面の状態を表す図。メニュー選択状態での表示面の状態を表す図。入力画像の模式図。認識状態から認識結果表示状態に至る処理手順を表す図。文字列認識結果表示時の表示面。同意語辞書の記憶形式を表す図。認識メニュー情報の記憶形式を表す図。

符号の説明

１０１・・画像入力から認識結果表示に至る処理，１０２・・・キーワード入力，１０３・・同意語展開，１０４・・・同意語辞書，１０５・・・メニュー選択，１０６・・・認識対象文字列要求，１０７・・・認識対象文字列指定，１０８・・・認識対象文字列，１０９・・・画像入力，１１０・・・文字列認識，１１１・・・文字列存在告知，１１２・・・文字列認識結果表示，１１３・・・外部同意語辞書，２０１・・・文字行切出し,２０２・・・文字切出し，２０３・・・文字識別，２０４・・・文字種限定，２０５・・・後処理，２０６・・・文字識別辞書，３０１・・・携帯機器，３０２・・・光学装置，３０３・・・光電変換素子，３０４・・・アナログデジタル変換器，３０５・・・信号処理素子，３０６・・・表示装置，３０７・・・演算装置，３０８・・・ＲＯＭ，３０９・・・ＲＡＭ，３１０・・・入出力装置，３１１・・・メモリーカード，３１２・・・入力装置，３１３・・・音声発生装置，３１４・・・振動装置，３１５・・・通信装置，４０１・・・筐体，４０２・・・レンズ，４０３・・・シャッター，４０４・・・電源スイッチ，４０５・・・キャンセルボタン，４０６・・・カーソルキー，４０７・・・アンテナ，４０９・・・表示面，４１０・・・スピーカ開口部，５０１・・・開始状態，５０２・・・待機状態，５０３・・・キーワード入力状態，５０４・・・メニュー選択状態，５０５・・・認識文字列取得状態，５０６・・・認識状態，５０７・・・文字列存在告知状態，５０８・・・文字列認識結果表示状態，，６０１・・・メニュー，６０２・・・キーワード選択，６０３・・・キーワード入力，６０４・・・キーワード取得，６０５・・・認識，７０１・・・キーワード指定メニュー，７０２・・・チェックボックス，８０１・・・画像中の文字列「Restroom」，８０２・・・画像中の文字列「Exit」，９０１・・文字種の限定を行うステップ，９０２・・・ループ，９０３・・・画像入力ステップ，９０４・・文字列認識ステップ，９０５・・・繰り返し終了ステップ，９０４・・・告知ステップ，９０５・・・認識結果表示ステップ，１００１・・・文字列認識結果，１１０１・・・同意語辞書のキーワードを格納するフィールド，１１０２・・・同意語辞書の同意語群を格納するフィールド，１２０１・・・認識メニュー情報で認識対象か否かをあらわすフラグ，１２０２・・・認識メニュー情報でメニューに表示するキーワードを格納するフィールド，１２０３・・・認識メニュー情報で認識対象文字列群を格納するフィールド。

Claims

画像を光電変換してデジタル信号として取り込む撮像手段と，認識対象の文字列の集合を格納する認識対象文字列格納手段と，認識対象文字列格納手段に格納されている文字列を画像中から認識する手段とを有し，
認識対象文字列群を代表するキーワードから自動的に認識対象の文字列の集合を生成して認識対象文字列格納手段に格納することを特徴とする携帯機器。
認識対象の文字列の生成手段がキーワードの同義語の集合を取得することであることを特徴とする請求項１の携帯機器。
画像を光電変換してデジタル信号として取り込む撮像手段と，認識対象の文字列の集合を格納する認識対象文字列格納手段と，認識対象文字列格納手段に格納されている文字列を画像中から認識する手段とを有し，
さらに，認識対象文字列群を代表するキーワードと認識対象文字列の集合の対を複数記憶する認識メニュー情報記憶手段と，認識メニュー情報記憶手段中のキーワードを選択する手段とを有し，上記選択結果に応じて認識メニュー情報記憶手段中の認識対象文字列を認識対象文字列格納手段に複写することを特徴とする携帯機器。
画像を光電変換してデジタル信号として取り込む撮像手段と，認識対象の文字列の集合を格納する認識対象文字列格納手段と，認識対象文字列格納手段に格納されている文字列を画像中から認識する手段とを有し，
さらに，外部の計算機と通信する手段を有し，認識対象文字列群を外部より獲得して認識対象文字列格納手段に格納することを特徴とする携帯機器。
画像を光電変換してデジタル信号として取り込む撮像手段と，認識対象の文字列の集合を格納する認識対象文字列格納手段と，認識対象文字列格納手段に格納されている文字列を画像中から認識する手段とを有し，
自動的に撮像と文字列の認識を繰り返し，文字列の認識が成功した場合に音声もしくは振動を発生することを特徴とする携帯機器。
画像を光電変換してデジタル信号として取り込む撮像手段と，認識対象の文字列の集合を格納する認識対象文字列格納手段と，認識対象文字列格納手段に格納されている文字列を画像中から認識する手段とを有し，
自動的に撮像と文字列の認識を繰り返し，文字列の認識が成功した場合に撮像した画像と認識結果を表示することを特徴とする携帯機器。