JP4199535B2 - 画像情報処理装置、画像情報処理プログラム、および、プログラム記録媒体 - Google Patents
画像情報処理装置、画像情報処理プログラム、および、プログラム記録媒体 Download PDFInfo
- Publication number
- JP4199535B2 JP4199535B2 JP2002376604A JP2002376604A JP4199535B2 JP 4199535 B2 JP4199535 B2 JP 4199535B2 JP 2002376604 A JP2002376604 A JP 2002376604A JP 2002376604 A JP2002376604 A JP 2002376604A JP 4199535 B2 JP4199535 B2 JP 4199535B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- recognition
- display
- area
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Television Signal Processing For Recording (AREA)
Description
【発明の属する技術分野】
この発明は、入力画像から文字等を認識して認識結果を出力する画像情報処理装置,画像情報処理プログラムおよびプログラム記録媒体に関する。
【0002】
【従来の技術】
デジタルカメラの画質向上に伴ってカメラ画像を入力とする認識装置が実用化されている。例えば、文字認識機能を有するデジタルカメラとして、特許文献1に記載されているようなものがある。また、特許文献2に開示されている電子カメラは、名刺読み取り機能を有しており、名刺全体の画像を取り込んで、全画像から文字領域を探す画像処理を行ない、画像中の総ての文字を読み取って名刺の項目毎に分類し、編集モードで誤認識等をユーザが修正して確定し、出力するという処理を順次行なっている。
【0003】
上述のように、1画像を入力し、認識し、修正する処理を順次行う方法の場合には、スキャナとは異なって、携帯カメラのごとくぼけや影や手ぶれ等の撮影条件のゆれが大きい入力装置においては、高品質の画像を1度で撮影することが難しく、撮影条件の悪い画像によって入力画像が固定されるため、ユーザに修正まで行なわせるには負担が大きいという欠点がある。また、シャッターキーを押し下げ操作して画像記録処理を実行する場合に、枠イメージに名刺の像をぴったりと収めるには、名刺の任意コーナーを上記枠イメージのコーナーに合わせるように構図調整を行う必要がある。
【0004】
そのために、特許文献3に開示されているパーソナルコンピュータに搭載される文字認識装置では、ユーザが認識させたい文字領域を指定する機能を有している。さらに、ユーザによって文字領域が指定されない場合には、所定の範囲を文字領域として抽出する機能も有している。また、連続的に文字認識を実行する機能を有しており、文字が認識されたと判定された場合には、文字が検出された領域の範囲を示す枠が開示されるようになっている。文字が認識されていない場合には、上記枠に従って撮像処理を繰り返し実行するのである。そして、確定入力がなされない場合には、確定入力がなされるまで、撮像処理を繰り返して実行可能になっている。
【0005】
また、認識履歴表示部に文字認識結果の履歴が表示されるようになっており、トラックポイント等を操作することによって、上記認識履歴表示部に表示された文字認識結果の中から適当な文字を選択して最終の認識結果を決定するようにしている。
【0006】
【特許文献1】
特開平9‐289624号公報
【特許文献2】
特開2001‐8072号公報
【特許文献3】
特開2000‐207487号公報
【0007】
【発明が解決しようとする課題】
しかしながら、上記従来のデジタルカメラ,電子カメラあるいはパーソナルコンピュータ等に搭載されて、文字認識等を行う認識装置においては、以下のような問題がある。
【0008】
すなわち、近年、文字認識装置等の認識装置は、上記特許文献3に開示されているように、パーソナルコンピュータのような大型表示装置を有しているとは限らなくなっている。例えば、携帯電話に装着されたカメラから画像を取り込み、認識処理を行ない、認識結果を携帯電話の表示画面に出力するような小型認識装置の開発が行なわれている。
【0009】
上記特許文献3に開示された文字認識方法では、ユーザが認識させたい文字領域を指定する認識対象領域手動設定時以外において、認識処理移行前に、ユーザに認識対象領域を提示する工夫が全くなされてはいない。したがって、カメラから取り込まれた画像の何れの部分について文字認識が行なわれるのかが、認識結果が出力されるまでユーザーには全く分らないのである。また、入力された画像全体から上記認識対象領域を抽出する場合には画像全体分の画像データをメモリに確保しなければならないため、携帯電話のような小型装置のCPU(中央演算処理装置)の場合には、文字認識される画像データ量が非常に多くなり、処理が遅くなるという問題がある。
【0010】
また、文字が認識されない場合には確定入力がなされるまで撮像処理を繰り返して実行するようになっている。ところが、カメラが撮像を繰り返す間、撮像された全ての画像に関して無条件に文字認識が行なわれるために、撮影条件の悪い画像に対しても文字認識が行われることになり、無意味な認識結果が多く出力されてしまうという問題もある。さらに、無意味な認識結果が出力される結果、確定入力をする時に選択対象となる候補が多くなってしまう。これは、装置が小型化し、表示画面が小さくなった場合には、全認識結果を表示しきれないという不都合が生ずるのである。さらに、カメラが撮像を繰り返す過程において、文字認識処理に移行したタイミングをユーザに視覚的に知らせることができないということもある。
【0011】
また、小型装置に対して上記特許文献3に開示された従来の文字認識装置を適用した場合には、以下のような問題が生ずる。
【0012】
すなわち、小型装置において認識結果を蓄積し、蓄積結果を表示し、その中からユーザが選択するという処理を行なう場合、狭い画面を2分割しなければならない。あるいは、狭い画面で認識結果を表示しきれないので、画像取り込み画面と認識結果表示画面との2画面に切り換えて表示しなくてはならない。さらに、小型装置には、パーソナルコンピュータのトラックポイントのような認識結果を選択する際の簡便な選択手段がない。
【0013】
また、従来の文字認識方法では、操作が煩雑で、認識処理を行い、認識候補を表示し、その中から正しい認識候補をユーザが選択するという操作を、片手で行うことが難しいという問題もある。
【0014】
また、小型装置においては、繰り返し認識して得られた認識結果を多数蓄積するとメモリが足りなくなってしまう。
【0015】
また、特に、上記特許文献2に開示された電子カメラにおいては、画像記録処理を、枠イメージに名刺の像をぴったりと収めてシャッターキーを押し下げ操作して実行するために、名刺の任意コーナーを枠イメージのコーナーに合わせるように構図調整を行う必要がある。したがって、名刺のうちのユーザが必要とする1行のみや数文字のみの文字認識を行うことができないのである。
【0016】
そこで、この発明の目的は、携帯電話のような小型装置において、認識対象領域をユーザーに提示しながら認識処理を行なうことが可能な画像情報処理装置,画像情報処理プログラムおよびこの画像情報処理プログラムが記録されたプログラム記録媒体を提供することにある。
【0017】
【課題を解決するための手段】
上記目的を達成するため、この発明の画像情報処理装置は、
被写体を撮像する撮像手段と、
上記撮像手段によって撮像された画像を認識する認識手段と、
上記認識手段による認識結果が撮像期間中2以上蓄積される認識結果蓄積手段と、
上記画像を含む表示情報を表示する表示手段と、
上記撮像手段によって撮像された画像における上記認識手段による認識の対象となる領域を特定する画像領域特定手段と、
上記画像領域特定手段によって特定された領域を示す情報を、上記表示手段に表示させる画像表示制御手段と、
上記画像領域特定手段で特定された領域内の画像に対する上記認識手段による認識処理への移行が可能であるか否かを判断する認識移行可否判断手段
を備えて、
上記認識手段は、上記認識移行可否判断手段による判断結果が可である場合に上記領域内の画像を認識するようになっており、
上記画像領域特定手段は、認識対象画像が上記特定された領域内に在ることを特定するための指定位置情報を上記領域の中に設定するようになっており、
上記画像表示制御手段は、上記指定位置情報を上記表示手段に表示させるようになっている
画像情報処理装置において、
上記画像領域特定手段によって特定される領域は枠で規定されており、
上記画像領域特定手段によって設定される指定位置情報は上記枠内に在る判別線であり、
上記認識移行可否判断手段は、上記枠内の画像における黒画素の連結を取り囲む領域が上記判別線に掛る数の度合に基づいて、上記枠内の画像に対する認識への移行の可否を判断するようになっている
ことを特徴とする。
【0018】
上記構成によれば、上記認識移行可否判断手段によって認識が可能であると判断された上記特定された領域内の画像に対して、上記認識手段によって認識が行われる。したがって、撮像画像における認識の対象となる領域のみが認識されるため、認識処理量が軽減されて認識速度が速くなる。さらに、認識対象とはならない撮像条件の悪い領域に対する無意味な認識が排除され、上記認識結果蓄積手段の記憶容量が削減される。
【0019】
さらに、上記画像領域特定手段を、認識対象画像が上記特定された領域内に在ることを特定するための指定位置情報を上記領域の中に設定するようにし、上記画像表示制御手段を、上記指定位置情報を上記表示手段に表示させるようにしている。したがって、ユーザは、上記表示手段に表示された認識対象画像と指定位置情報との位置関係から、上記認識対象画像が正しく上記特定された領域内に在ることを目視することが可能になる。
【0020】
さらに、上記画像領域特定手段によって特定される領域を枠で規定し、上記画像領域特定手段によって設定される指定位置情報を上記枠内に在る判別線とし、上記認識移行可否 判断手段を、上記枠内の画像における黒画素の連結を取り囲む領域が上記判別線に掛る数の度合に基づいて、上記枠内の画像に対する認識への移行の可否を判断するようにしている。したがって、上記枠内の線状の指定位置情報に基づいて、上記特定される領域を規定する枠内に在る認識対象画像の認識処理への移行が可であることが、正しく判断される。
【0021】
また、この発明の画像情報処理装置は、
被写体を撮像する撮像手段と、
上記撮像手段によって撮像された画像を認識する認識手段と、
上記認識手段による認識結果が撮像期間中2以上蓄積される認識結果蓄積手段と、
上記認識結果蓄積手段に蓄積された認識結果に基づいて最適認識候補を判定する認識結果判定手段と、
上記画像を含む表示情報を表示する表示手段と、
上記撮像手段によって撮像された画像における上記認識手段による認識の対象となる領域を特定する画像領域特定手段と、
上記画像領域特定手段で特定された領域内の画像に対する上記認識手段による認識処理への移行が可能であるか否かを判断する認識移行可否判断手段
を備えて、
上記認識手段は、上記認識移行可否判断手段による判断結果が可である場合に上記領域内の画像を認識するようになっており、
ユーザによって操作されて、上記撮像手段による撮像の開始および終了を指示する指示手段を備えて、
上記画像領域特定手段は、上記特定された領域を示す情報を上記表示手段に表示させる画像表示制御手段を有し、
上記撮像手段 , 画像領域特定手段 , 認識移行可否判断手段 , 画像表示制御手段 , 認識手段および認識結果判定手段は、上記指示手段によって撮像の開始が指示されてから撮像の終了が指示されるまで繰り返して動作するようになっており、
上記画像領域特定手段は、認識対象画像が上記特定された領域内に在ることを特定するための指定位置情報を上記領域の中に設定するようになっており、
上記画像表示制御手段は、上記指定位置情報を上記表示手段に表示させるようになっている
画像情報処理装置において、
上記画像領域特定手段によって特定される領域は枠で規定されており、
上記画像領域特定手段によって設定される指定位置情報は上記枠内に在る判別線であり、
上記認識移行可否判断手段は、上記枠内の画像における黒画素の連結を取り囲む領域が上記判別線に掛る数の度合に基づいて、上記枠内の画像に対する認識への移行の可否を判断するようになっている。
【0022】
上記構成によれば、撮像画像における認識の対象となる領域のみが認識されるため、認識処理量が軽減されて認識速度が速くなる。また、認識対象とはならない撮像条件の悪い領域に対する無意味な認識が排除されて、上記認識結果蓄積手段の記憶容量が削減される。
【0023】
さらに、上記認識結果判定手段によって、上記認識結果蓄積手段に蓄積された2以上の認識結果に基づいて最適認識候補が判定される。したがって、上記表示手段は、同一認識対象画像に関する多数の認識結果を表示する必要がなくなる。そのため、上記撮像画像と認識結果とを同一画面に表示することが可能になる。
【0024】
すなわち、携帯電話等の小型装置に搭載するのに最適な画像情報処理装置が提供される。
【0025】
さらに、上記指示手段によって撮像の開始が指示されてから撮像の終了が指示されるまで、上記特定された領域を示す情報が表示される。したがって、ユーザは、表示される撮像画像および上記情報を見ながら本画像情報処理装置を上下左右前後に移動させることによって、撮像画像における認識対象領域を的確に上記特定された領域内に入れることが可能になる。
【0026】
さらに、逐次得られる最適認識候補を例えば表示手段によって監視し、所望の認識候補が得られた場合に上記指示手段によって撮像の終了を指示することによって、多くの認識候補の中から所望の認識候補を選択することなく最終認識結果が得られる。
【0027】
そのため、パーソナルコンピュータのトラックポイントのような選択手段がない携帯電話等の小型装置に搭載した場合でも、片手によって最終認識結果の決定を行うことが可能になる。
【0028】
さらに、上記画像領域特定手段を、認識対象画像が上記特定された領域内に在ることを特定するための指定位置情報を上記領域の中に設定するようにし、上記画像表示制御手段を、上記指定位置情報を上記表示手段に表示させるようにしている。したがって、ユーザは、上記表示手段に表示された認識対象画像と指定位置情報との位置関係から、上記認識対象画像が正しく上記特定された領域内に在ることを目視することが可能になる。
【0029】
さらに、上記画像領域特定手段によって特定される領域を枠で規定し、上記画像領域特定手段によって設定される指定位置情報を上記枠内に在る判別線とし、上記認識移行可否判断手段を、上記枠内の画像における黒画素の連結を取り囲む領域が上記判別線に掛る数の度合に基づいて、上記枠内の画像に対する認識への移行の可否を判断するようにしている。したがって、上記枠内の線状の指定位置情報に基づいて、上記特定される領域を規定する枠内に在る認識対象画像の認識処理への移行が可であることが、正しく判断される。
【0030】
また、1実施例の画像情報処理装置では、上記認識結果判定手段を、上記認識手段によって認識結果が得られる毎に、上記認識結果蓄積手段に蓄積されている認識結果に基づいて、出現回数が最大である認識結果を上記最適認識候補であると判定するようにしている。
【0031】
この実施例によれば、同一認識対象画像に関する複数の認識結果に紛れ込んだ手ぶれ等による誤認識結果が的確に排除され、正しい認識結果が上記最適認識候補であると判定される。
【0032】
また、1実施例の画像情報処理装置では、上記認識手段を,認識の際に認識の信頼度を求めるようにし、上記認識結果蓄積手段には認識結果と共に上記信頼度が蓄積されるようにし、上記認識結果判定手段を,上記認識手段によって認識結果が得られる毎に,上記認識結果蓄積手段に蓄積されている認識結果および上記信頼度に基づいて,最大連続出現回数が所定回数以上であり且つ上記信頼度が所定値以上である認識結果を上記最適認識候補であると判定するようにしている。
【0033】
この実施例によれば、同一認識対象画像に関する複数の認識結果に紛れ込んだ手ぶれ等による誤認識結果が的確に排除され、正しい認識結果が上記最適認識候補であると判定される。
【0034】
また、1実施例の画像情報処理装置では、上記画像表示制御手段を、上記認識移行可否判断手段による判断結果が可である場合に、上記認識手段による認識に移行する前に、上記判断結果が可であると判断された撮像画像を所定時間だけ継続して上記表示手段に表示させるようにしている。
【0035】
この実施例によれば、ユーザは、上記枠内の認識対象画像が認識可能であると判定されて認識処理へ移行するタイミングを、時差なく視覚的に知ることが可能になる。
【0036】
また、1実施例の画像情報処理装置では、上記表示手段を,縮小された撮像画像を表示する第1の表示領域と原寸の撮像画像を表示する第2の表示領域とに分割された表示画面を有するようにし、上記画像表示制御手段を,上記撮像手段で撮像された画像の縮小画像を上記表示手段における第1の表示領域に表示させる一方,原寸画像を上記第2の表示領域に表示させるようにしている。
【0037】
この実施例によれば、上記表示手段に上記撮像画像の縮小画像と原寸画像とが表示されるため、上記原寸画像によって、上記撮像画像の細かいチェックが可能になる。
【0038】
また、1実施例の画像情報処理装置では、上記画像表示制御手段を、上記認識移行可否判断手段による判断結果が可である場合に、上記認識手段による認識に移行する前に、上記判断結果が可であると判断された撮像画像に関する縮小画像および原寸画像の何れか一方のみを所定時間だけ継続して上記表示手段に表示させるようにしている。
【0039】
この実施例によれば、ユーザは、上記枠内の認識対象画像が認識可能であると判定されて認識処理へ移行するタイミングを、時差なく視覚的に知ることが可能になる。
【0040】
また、1実施例の画像情報処理装置では、上記撮像手段を、上記認識移行可否判断手段による判断結果が否である場合には次の撮像を行うようにしている。
【0041】
この実施例によれば、上記認識対象画像が認識できない場合における無意味な認識処理への移行を無くして、認識可能な画像のみの認識が行われる。
【0042】
また、1実施例の画像情報処理装置では、上記画像領域特定手段を、上記撮像画像における上記認識の対象となる領域を変更可能にしている。
【0043】
この実施例によれば、上記認識対象画像が文章画像である場合に、撮像画像における認識対象領域が、例えば1行の文字列やそのうちの数文字等に変更することが可能になる。
【0044】
また、1実施例の画像情報処理装置では、上記認識結果判定手段によって最終的に判定された最適認識候補を最終認識結果として他の装置に送信する送信手段を備えている。
【0045】
この実施例によれば、上記送信手段によって、最終認識結果を他の装置に送信することが可能になる。
【0046】
また、この発明の画像情報処理プログラムは、コンピュータを、上記画像情報処理装置における撮像手段,画像領域特定手段,画像表示制御手段,認識移行可否判断手段,認識手段, 認識結果蓄積手段 , 表示手段 ,認識結果判定手段および指示手段として機能させる。
【0047】
また、この発明のプログラム記録媒体は、上記画像情報処理プログラムが記録されている。
【0048】
上記各構成によれば、上記画像情報処理装置の場合と同様に、上記撮像画像における認識の対象となる領域のみが認識されるため、認識による処理量が軽減されて認識速度が速くなる。さらに、認識対象とはならない撮像条件の悪い領域に対する無意味な認識が排除されて、上記認識結果蓄積手段の記憶容量が削減される。さらに、上記認識結果蓄積手段に蓄積された認識結果に基づいて最適認識候補が判定されため、同一認識対象画像に関する多数の認識結果を表示する必要がなくなる。したがって、上記撮像画像と認識結果とを同一画面に表示することが可能になる。
【0049】
【発明の実施の形態】
以下、この発明を図示の実施の形態により詳細に説明する。図1は、本実施の形態の画像情報処理装置におけるブロック図である。以下においては、本画像情報処理装置によって文字認識を行う場合を例に説明するが、本画像情報処理装置は、文字認識に限らず、顔認識,指紋認識,物体認識等の認識にも適応できる。
【0050】
図1において、撮像手段1は、CCD(電荷結合素子)カメラ等で構成され、撮影対象物を撮影してデジタル画像データに変換する。表示手段2は、液晶ディスプレイ等で構成され、撮像手段1から送出されてくる画像データを表示する。さらに、ユーザとのインタフェースとして、認識結果を表示したり、操作方法を表示したりする。
【0051】
メモリ3は、RAM(ランダム・アクセス・メモリ)で構成され、ハードディスク(HDD)4から転送されてくるプログラム等を一時蓄積する。さらに、認識結果等を一時蓄積する各種のバッファの領域が確保されている。
【0052】
画像領域特定手段5は、上記撮像手段1から取り込まれたデジタル画像データに基づく画像のある領域を特定し、この特定された画像領域を示す情報を線等のグラフィックイメージで撮像画像と共に表示手段2に表示させてユーザに提示する。この画像領域特定処理は、メモリ3に一時蓄積された描画プログラムに従って実行される。
【0053】
認識移行可否判断手段6は、上記画像領域特定手段5によって特定された画像領域に対する認識処理の可否を判断する。この判断処理は、メモリ3に一時蓄積された認識移行可否判断用のプログラムに従って実行される。認識手段7は、認識移行可否判断手段6によって認識処理への移行が可能であると判断された画像領域に対して文字認識処理を行なう。この文字認識処理は、メモリ3に一時蓄積された文字認識用のプログラムに従って実行される。尚、認識手段7は、メモリ3に、顔認識,指紋認識または物体認識等用のプログラムを一時蓄積すれば、対応した認識処理を実行することになる。
【0054】
認識結果判定手段8は、上記メモリ3に確保された上記認識結果蓄積手段としての蓄積バッファ12の内容(複数の認識結果)と入力バッファ11の内容(1つの認識結果)とを比較し、この比較結果に応じてメモリ3に確保された最適文字列バッファ13に最適認識候補を書き込む。そして、最終的に得られた最適認識候補が最終認識結果となるのである。この認識結果判定処理は、メモリ3に一時蓄積された認識結果判定処理用のプログラムに従って実行される。認識結果出力手段9は、メモリ3に確保された最適文字列バッファ13の内容(最終認識結果の文字列データ)を表示手段2等に出力する。この認識結果出力処理は、メモリ3に一時蓄積された認識結果出力用のプログラムに従って実行される。送信手段10は、メモリ3に確保された最適文字列バッファ13の内容を送信する。この送信処理は、メモリ3に一時蓄積された送信処理用のプログラムに従って実行される。
【0055】
すなわち、上記メモリ3に確保されている入力バッファ11には、認識手段7によって認識された1つの認識結果が一時蓄積される。また、蓄積バッファ12には、複数の認識結果が一時蓄積される。また、最適文字列バッファ13には、認識結果判定手段8によって判定された1つの認識結果(最終認識結果)が一時蓄積されるのである。
【0056】
さらに、上記メモリ3に確保されている表示用画像蓄積バッファ14には、表示手段2に表示させるイメージの内容(画像データ)が蓄積される。また、撮像画像蓄積バッファ15には、撮像手段1によって撮像されたイメージの内容(画像データ)が蓄積される。また、縮小画像蓄積バッファ16には、撮像手段1によって撮像されたイメージを縮小した内容(画像データ)が蓄積される。また、表示設定情報バッファ17には、画像領域特定手段5によって特定された画像領域の表示設定情報が蓄積される。尚、この表示設定情報は、表示する線分の座標,長さ,色,太さと、原寸画像の表示位置と、原寸画像の表示可否と、縮小画像の表示位置と、縮小画像の表示可否等である。
【0057】
そして、上記画像領域特定手段5における画面表示コントローラ18は、メモリ3に確保された表示設定情報バッファ17に蓄積されている表示設定情報に基づいて、表示手段2を制御して上記特定された画像領域を示すグラフィックイメージを撮像画像と共に表示させる。
【0058】
指示手段19は、撮像の開始や停止を指示するためのボタン等のスイッチである。これは、上記CCDカメラのシャッタで構成しても良いし、シャッタとは別のスイッチで構成してもよい。その際に、上記スイッチ(シャッタ)を押し続けた場合には撮像を繰り返す設計であっても、押すと撮像を開始して再度押すと撮像を停止する設計であっても構わない。
【0059】
送信スイッチ20は、上記送信手段10に対して送信処理の実行を指示するためのボタン等のスイッチである。
【0060】
ここで、上記画像領域特定手段5,認識移行可否判断手段6,認識手段7,認識結果判定手段8,認識結果出力手段9および送信手段10の具体的構成はCPUであり、HDD4からメモリ3に転送されて一時格納された専用のプログラムや描画プログラム等のプログラムに従って、指示手段19や送信スイッチ20や操作ボタン(図示せず)等の操作によって入力されたユーザからの指示に応じて、撮像手段1,表示手段2およびメモリ3等を制御して夫々の処理を実行する。尚、上記CPUは、上記画像領域特定手段5,認識移行可否判断手段6,認識手段7,認識結果判定手段8,認識結果出力手段9および送信手段10による処理以外にも、撮像処理や拡大処理や表示処理や演算処理や判断処理等の種々の処理を実行する。
【0061】
図2は本画像情報処理装置の外観図である。尚、図2(a)および図2(c)は正面図であり、図2(b)は背面図である。
【0062】
21は、上記表示手段2の一例としての小型液晶画面である。また、22は、撮像手段1の一例としてのカメラ部である。尚、図2(b)ではレンズの外観で代表して示されているが、実際にはCCDやシャッタ機構等をも含んだ構成を有している。また、23は、撮像の開始・停止を指示する指示手段19の一例としてのボタンである。
【0063】
上記カメラ部22によって撮像された画像が小型液晶画面21に表示されている。また、上記小型液晶画面21には、画像領域特定手段5によって特定された画像領域を示す枠24が、撮像画像と共に表示されている。ユーザは、本画像情報処理装置を上下・左右・前後に動かすことによって、物体25の認識させたい部分(文字列「URLは http://www.a.htm です。」)をカメラ部22から画像として取り込んで、認識させたい文字列「http://www.a.htm」を小型液晶画面21の枠24内に表示させることができるのである。尚、この枠24は、ユーザが上記画像領域を特定し易いように、図2(c)に示すように、撮像画面21とは異なる液晶画面27に上記特定された画像領域と共に表示するようにしても差し支えない。
【0064】
図3は、上記CPUの制御の下に実行される文字認識処理動作のフローチャートである。以下、図3に従って文字認識動作を例に本画像情報処理装置の動作を説明する。例えば、指示手段(ボタン23)19が操作されると文字認識処理動作がスタートする。
【0065】
ステップS1で、上記メモリ3における最適文字列バッファ13に最終認識結果が格納されているか否かが判別される。その結果、格納されていればステップS2に進む一方、格納されていなければステップS3に進む。ステップS2で、認識結果出力手段9によって、最適文字列バッファ13に格納されている文字列が表示手段(小型液晶画面21)2に表示される。ステップS3で、指示手段19が操作され続けているか否かを判別するによって、撮像を終了するか否かが判別される。その結果、撮像を終了する場合には文字認識処理動作を終了する。一方、撮像を続行する場合にはステップS4に進む。
【0066】
ステップS4で、上記撮像手段(カメラ部22)1からの画像データが取り込まれて、撮像画像蓄積バッファ15に格納される。さらに、撮像画像データに縮小処理が施されて、縮小画像蓄積バッファ16に格納される。こうして、撮像処理が実行される。ステップS5で、画像領域特定手段5によって、上記操作ボタンの操作によって入力されたユーザからの指示に応じて、縮小画像蓄積バッファ16に格納された縮小画像に対して上記画像領域特定処理が実行される。そして、特定された画像領域の表示設定情報によって、表示設定情報バッファ17の内容が更新される。尚、ユーザからの指示が無ければ表示設定情報バッファ17の格納内容が維持される。ステップS6で、画像領域特定手段5の画面表示コントローラ18によって、後に詳述するように、縮小画像蓄積バッファ16の内容を表示手段2に表示する画像表示処理が実行される。その際に、表示設定情報バッファ17に格納されている表示設定情報に基づいて、画像領域を示す枠24が同時に表示される。
【0067】
ステップS7で、上記認識移行可否判断手段6によって、後に詳述するようにして、画像領域特定手段5によって特定された画像領域に対する認識処理への移行の可否が判別される。その結果、認識移行が可能であればステップS8に進む一方、そうでなければ、上記ステップS1に戻って上述のステップS1〜ステップS7の処理が繰り返される。
【0068】
ステップS8で、上記認識手段7によって、文字認識処理が実行されて、認識結果が入力バッファ11に格納される。ステップS9で、認識結果判定手段8によって、後に詳述するようにして、入力バッファ11に格納された認識結果と蓄積バッファ12に格納されている複数の認識結果との比較結果に応じて、最適文字列バッファ13に最適認識候補が書き込まれる。こうして、上記文字認識結果に対する認識結果判定処理が実行される。そうした後、上記ステップS1に戻って、最適文字列バッファ13に格納された最適認識候補の表示に移行する。そして、上記ステップS3において、撮像を終了すると判別されると文字認識処理動作を終了するのである。
【0069】
図4は、図3に示す文字認識処理動作の上記ステップS6において、上記表示手段2に表示される撮像画像と上記画像領域を示す枠24との具体例を示す。ここで、ユーザが認識させたいのは「http://www.a.htm」なる1行の文字列(以下、ターゲット行と言う)である。
【0070】
図4(a)に示す表示例の場合には、上記ターゲット行が枠24からはみ出している。このように、画像領域特定手段5によって描画された枠24に基づいて、被写体が近すぎるとユーザは判断することができる。また、図4(b)に示す表示例の場合には、上記ターゲット行以外の行が枠24内に入っており、被写体が遠すぎると判断することができる。また、図4(c)に示す表示例の場合には、上記ターゲット行が枠24の線に平行になっておらず、被写体が傾いていると判断することができるのである。また、図4(d)に示す表示例の場合には、上記設定された画像領域を示す情報として枠24の中心線26も表示されている。この場合には、上記ターゲット行が枠24の中心線26に接触しておらず、被写体中のターゲット行が特定されていないと判断することができるのである。
【0071】
こうすることによって、認識処理移行前に、ユーザに認識対象領域(画像領域)を提示することができ、ユーザは、所望するターゲット行が認識対象となっていることを確認することができる。また、ユーザは撮像画像の全体からターゲット行を抽出する必要が無いため、メモリの節約と認識処理の迅速化を図ることができるのである。
【0072】
図5は、図3に示す文字認識処理動作の上記ステップS6において、画面表示コントローラ18によって実行される上記画像表示処理動作のフローチャートである。上記文字認識処理動作のステップS5において、画像領域特定手段5による画像領域特定処理が終了すると画像表示処理動作がスタートする。
【0073】
ステップS11で、上記撮像画像蓄積バッファ15に撮像手段1から取り込まれた画像データが格納されているか否かが判別される。その結果、格納されている場合にはステップS12に進む。一方、格納されていない場合には表示すべき撮像画像が無いので画像表示処理動作を終了して、上記文字認識処理動作のステップS7にリターンする。
【0074】
ステップS12で、上記表示設定情報バッファ17から、予め上記文字認識処理動作のステップS5において画像領域特定手段5によって生成された表示設定情報が取得される。ステップS13で、上記取得された表示設定情報に基づいて、上記特定された画像領域を示すグラフィックイメージと、縮小画像蓄積バッファ16から読み出された撮像画像の縮小画像データとが合成されて、表示用画像蓄積バッファ14に格納される。
【0075】
ステップS14で、上記表示用画像蓄積バッファ14に格納された画像データに基づいて、表示手段2に枠24と撮像画像とが表示される。そうした後、画像表示処理動作を終了して、上記文字認識処理動作のステップS7にリターンする。
【0076】
尚、本実施の形態においては、図2に示すような小型の携帯情報機器の場合を想定しており、小型液晶画面21に原寸大の撮像画像を表示することは困難である。そのために、縮小画像データに基づく縮小撮像画像を表示するようにしている。したがって、表示手段2が原寸大の撮像画像を表示することが可能な表示画面を有している場合には、原寸大の撮像画像を表示しても一向に構わない。
【0077】
図6は、上記表示設定情報バッファ17に格納された上記表示設定情報の一例を示す概念図である。図6において、「Lenx」は線分の横の長さ、「Leny」は線分の縦の長さ、「Color」は線分の色、「Th」は線分の太さ、「(lx,ly)」は枠24の左隅座標、「(sx,sy)」は原寸画像(通常の表示画像(縮小画像)に対しては拡大画像)の表示位置、「(ix,iy)」は縮小画像の表示位置である。また、「(SSwitch)」は原寸撮像画像表示のオン・オフを指定するスイッチであり、このスイッチ(SSwitch)がオフであれば原寸撮像画像表示は行われない。また、「(ISwitch)」は縮小画像表示のオン・オフを指定するスイッチであり、このスイッチ(ISwitch)がオフであれば縮小画像表示は行われないのである。
【0078】
以下、図3に示す文字認識処理動作の上記ステップS7において、認識移行可否判断手段6によって実行される認識移行可否判断処理について説明する。図7は、認識移行可否判断処理動作のフローチャートである。上記文字認識処理動作のステップS6において、画像領域特定手段5による画像表示処理が終了すると認識移行可否判断処理動作がスタートする。
【0079】
ステップS21で、上記画面表示コントローラ18による画像合成結果に基づいて、画像領域特定手段5によって特定された画像領域内の画像データ(枠内画像)が取得される。ステップS22で、取得された枠内画像が2値化される。ステップS23で、2値化画像から外接矩形が抽出される。ここで、上記外接矩形とは、例えば、図8に示すように、黒画素の連結成分に外接する矩形31のことである。
【0080】
ステップS24で、図8に示すような線分で表せる指定位置32に接触する矩形数の全矩形数に対する割合が閾値を越えているか否かが判別される。その結果、閾値を越えている場合には、撮像画像中のターゲット行が特定されるため上記特定されたターゲット行に対する認識移行が可であると判定されて、ステップS25に進む。一方、閾値以下である場合には、撮像画像中のターゲット行が特定されないため認識移行が否であると判定されて、ステップS26に進む。ここで、指定位置32は枠24の中にある線分であり、図4(d)における中心線26もこの指定位置32に相当する。この指定位置は線分ではなく他の図形や枠24内の特定位置で設定してもよい。また、図8のごとくユーザに分るように表示せずに、上記プログラム内に保持していても差し支えない。
【0081】
ステップS25で、上記特定されたターゲット行に対する認識移行が「可」であることを表す情報「OK」が出力される。そうした後、認識移行可否判断処理動作を終了して、上記文字認識処理動作のステップS8にリターンする。ステップS26で、上記特定されたターゲット行に対する認識移行が「否」であることを表す情報「NG」が出力される。そうした後、認識移行可否判断処理動作を終了して、上記文字認識処理動作のステップS1にリターンする。
【0082】
図8は、上記枠24内に表示されたターゲット行と指定位置32との関係を示す。以下、図8に従って、上記認識移行可否判断処理動作におけるステップS24において行われる指定位置32に接触する矩形数の割合算出および認識移行の可否判定について説明する。尚、図8においては、指定位置32を上記判別線の一例としての直線で構成しているが、波線等の他の線で構成しても差し支えない。
【0083】
図8(a)において、上記枠24の左上角の座標は(0,0)であり、右下角の座標は(480,100)である。また、指定位置32は座標(10,70)と座標(470,70)を結ぶ線分である。そして、上記可否判定の閾値は「0.12」であるとする。この閾値が高いほど認識処理への移行の判定基準が厳しくなり、閾値が低いほど容易に認識処理に移行できるようになる。
【0084】
図8(a)の場合には、全矩形数は19であり、限定位置32に接触する矩形数は0である。したがって、指定位置32に接触する矩形数の全矩形数に対する割合は0(=0/19)であり、閾値「0.12」よりも小さいため認識移行可否判断処理結果として「NG」が出力される。これに対して、図8(b)の場合には、全矩形数は16であり、指定位置32に接触する矩形数は2である。したがって、指定位置32に接触する矩形数の全矩形数に対する割合は0.125(=2/16)であり、閾値「0.12」よりも大きいため認識移行可否判断処理結果として「OK」を出力するのである。
【0085】
次に、図3に示す文字認識処理動作の上記ステップS9において、上記認識結果判定手段8によって実行される認識結果判定処理について説明する。図9は、認識結果判定処理動作のフローチャートである。上記文字認識処理動作のステップS8において、認識手段7による認識処理が終了すると認識結果判定処理動作がスタートする。
【0086】
ステップS31で、上記認識手段7による文字認識結果が取得されて入力バッファ11に格納される。ステップS32で、最適文字列バッファ13に文字列が格納されているか否かが判別される。その結果、格納されていればステップS33に進み、格納されていなければステップS39に進む。ステップS33で、蓄積バッファ12に空きがあるか否かが判別される。その結果、空きがあればステップS35に進み、空きがなければステップS34に進む。
【0087】
ステップS34で、上記蓄積バッファ12内の古い文字列(認識結果)が削除される。ステップS35で、蓄積バッファ12に入力バッファ11に格納されている文字認識結果がコピーされる。ステップS36で、蓄積バッファ12内の文字列と入力バッファ11内の文字列とが比較され、蓄積バッファ12内に存在する入力バッファ11内の文字列と同じ文字列と、その文字列の蓄積バッファ12内での出現回数とが得られる。ステップS37で、上記得られた出現回数が最適文字列バッファ13内に格納されている出現回数より多いか否かが判別される。その結果、最適文字列バッファ13内の出現回数より多い場合にはステップS38に進む。一方、最適文字列バッファ13内の出現回数以下である場合には、認識結果判定処理動作を終了して、上記文字認識処理動作のステップS1にリターンする。
【0088】
ステップS38で、上記ステップS36において得られた文字列とその出現回数とで最適文字列バッファ13の内容が更新される。そうした後、認識結果判定処理動作を終了して、上記文字認識処理動作のステップS1にリターンする。ステップS39で、最適文字列バッファ13には初期文字列が無いので、入力バッファ11の内容がコピーされる。その場合には、出現回数「1」が設定される。そうした後、認識結果判定処理動作を終了して、上記文字認識処理動作のステップS1にリターンする。
【0089】
図10は、上記入力バッファ11,蓄積バッファ12および最適文字列バッファ13の内容の一例を示す概念図である。但し、図10(a)は蓄積バッファ12の内容であり、図10(b)は最適文字列バッファ13の内容であり、図10(c)は入力バッファ11の内容である。以下、図10に従って、上記認識結果判定処理動作において行われる蓄積バッファ12と入力バッファ11との比較および最適文字列バッファ13の更新について説明する。
【0090】
先ず、上記入力バッファ11の内容(文字列「http://www.a.htm」)と蓄積バッファ12の内容を比較すると、蓄積バッファ12内には、入力バッファ11の文字列「http://www.a.htm」と同じ文字列は「6」回出現する。この出現回数「6」は、最適文字列バッファ13の内容である文字列「http://www.O.htm」の出現回数「5」よりも大きい。その場合には、最適文字列バッファ13の内容を、新たに得られた文字列(つまり、入力バッファ11の文字列)「http://www.a.htm」とその出現回数「6」とで更新するのである。
【0091】
この処理を繰り返すことによって、撮像文字列「http://www.a.htm」の誤認識結果である文字列「http://www.O.htm」や「http://www.o.htm」を排除して、撮影条件の悪い画像に対する無意味な誤認識結果を出力しないようにできる。したがって、全認識結果を表示しきれない不都合やユーザによる認識結果の選択が煩雑になる不都合を解消することができるのである。
【0092】
次に、上記認識結果判定手段8によって実行される認識結果判定処理の他の例について説明する。図11は、本例における認識結果判定処理動作のフローチャートである。上記文字認識処理動作のステップS8において、認識手段7による認識処理が終了すると本認識結果判定処理動作がスタートする。
【0093】
ステップS41〜ステップS45で、図9に示す認識結果判定処理動作における上記ステップS31〜ステップS35の場合と同様にして、文字認識結果の入力バッファ11への格納、最適文字列バッファ13内における文字列存在の判別、蓄積バッファ12内における空きの判別、蓄積バッファ12内の古い文字列(認識結果)の削除、蓄積バッファ12への入力バッファ11内の文字認識結果のコピーが行われる。但し、本例においては、入力バッファ11,蓄積バッファ12および最適文字列バッファ13に格納される認識結果の文字列には、上記認識処理時に得られる信頼度が付加されている。
【0094】
ステップS46で、上記蓄積バッファ12内の文字列と入力バッファ11内の文字列とが比較される。ステップS47で、上記比較の結果、入力バッファ11と同じ文字列の連続認識回数が閾値以上であり、且つ、その文字列の信頼度が所定値以上であるか否かが判別される。その結果、連続認識回数が閾値以上で且つ信頼度が所定値以上である場合にはステップS48に進み、そうでなければ認識結果判定処理動作を終了して上記文字認識処理動作のステップS1にリターンする。
【0095】
ステップS48およびステップS49で、図9に示す認識結果判定処理動作における上記ステップS38およびステップS39の場合と同様にして、上記比較の対象の文字列(入力バッファ11の文字列)による最適文字列バッファ13の更新、最適文字列バッファ13への入力バッファ11内容のコピーが行われる。そして、認識結果判定処理動作を終了して、上記文字認識処理動作のステップS1にリターンする。
【0096】
その場合における上記文字列の信頼度は、マッチング辞書との距離値等を用いる。尚、マッチング辞書とは統計的手法によって構築された標準パターンのことであり、文字認識処理の際に入力パターンと比較される。また、上記マッチング辞書のメンバー(標準パターン)と入力パターンとの距離計算方法は、「認識工学」(1993年 コロナ社 鳥脇純一郎著)等に記載されている計算方法を用いればよい。
【0097】
図12は、上記入力バッファ11(図12(c)),蓄積バッファ12(図12(a))および最適文字列バッファ13(図12(b))の内容の一例を示す概念図である。入力バッファ11の内容(文字列「http://www.a.htm」)と蓄積バッファ12の内容とを比較すると、蓄積バッファ12内に、入力バッファ11と同じ文字列「http://www.a.htm」が連続して閾値「3」以上存在する。そして、図12では明示してはいないが、その文字列「http://www.a.htm」の信頼度は所定値以上であるとする。その場合には、この閾値「3」以上連続して認識された文字列「http://www.a.htm」で、最適文字列バッファ13の内容を更新するのである。
【0098】
この処理を繰り返すことによって、撮像文字列「http://www.a.htm」の誤認識結果である文字列「http://www.O.htm」や「http://www.o.htm」を排除して、撮影条件の悪い画像に対する無意味な誤認識結果を出力しないようにできるのである。
【0099】
本実施の形態における画像情報処理装置は、撮像手段1から連続して画像を取り込むので、図8(b)に示すようにターゲット行が特定され、本画像情報処理装置が静止され、ピントが合っている場合には、連続して認識手段7から正解認識結果が出力される可能性が高い。また、その際に、手ぶれ等によって一時的に正解認識結果中に誤認識結果が紛れ込んでも、手ぶれによる誤認識は連続して出現することはない。したがって、図10や図12で説明したように、手ぶれ等の撮影条件の悪い画像に対する無意味な誤認識結果を振るい落とすことができるのである。
【0100】
このように、本実施の形態によれば、上記認識結果判定手段8を有することによって、手ぶれに強く、正解文字列を判定し易い画像情報処理装置を構築することができるのである。
【0101】
図13に、本実施の形態の画像情報処理装置における上記表示手段2への表示例を示す。以下、図13に従って本画像情報処理装置の操作方法について簡単に述べる。
【0102】
上記表示手段2には、第1の表示領域2aと第2の表示領域2bとが設けられており、第1の表示領域2aには撮像手段1から取り込まれた画像「URLは http://www.a.htm です」および枠24と指定位置32が表示され、同時に、第2の表示領域2bには、指定位置32に接触して特定された文字列の最適認識候補「http://www.a.htm」が表示されている。ユーザは、第2の表示領域2bに所望の認識結果が表示された時点で確定ボタン36を押圧することによって、最終認識結果を取得することができるのである。尚、確定ボタン36は、指示手段19と別体に設けても良いし、指示手段19と兼ねても良い。後者の場合には、図3の文字認識処理動作に示すように、指示手段19(つまり確定ボタン36)を押圧すると撮像を開始し、押し続けている間撮像処理,画像領域特定処理,画像表示処理,認識移行可否判断処理,認識処理および認識結果判定処理を繰り返して逐次最適認識候補を第2の表示領域2bに表示し、所望の認識結果が表示された時点で指示手段19を離すことによって、最終認識結果が取得されることになる。
【0103】
このように、本実施の形態における画像情報処理装置においては、上記表示手段2の第2の表示領域2bに逐次表示される最適認識候補をユーザーが目視判断して撮像の終了を決定することができる。したがって、上記従来の認識装置における複数の認識候補から正解候補を選択する処理と同様の選択処理を行うことができる。しかも、図13に示すように、画面を切り換えることなく1つの画面で認識処理と認識結果の決定処理とを行うことが可能となっている。したがって、本実施の形態の方法によれば、片手で最終認識結果を決定することができるのである。
【0104】
図14は、上記特許文献3に開示された従来のパーソナルコンピュータにおける表示部への表示例を示す。対象画像表示部37にはCCDビデオカメラからの取り込み画像が表示され、認識履歴表示部38には認識結果文字列履歴が表示されている。この場合、ユーザは、認識結果文字列履歴からペン39やマウス等の指定手段によって所望の文字列を選択して最終認識結果を得る。
【0105】
上記認識履歴表示部38に表示されている認識結果文字列履歴中、40はノイズを読んだ結果の認識文字列である。また、41はピントが合っていない場合や画像が傾いている場合等の悪撮影状況下で撮影された結果の認識率の低い認識文字列である。このように、従来の画像情報処理装置での表示においては、認識結果文字列履歴を表示するために大画面でないと実現は不可能なのである。また、ピントが合っていないことや画像が傾いていることは、認識履歴表示部38に認識結果が表示されるまでは分らないのである。
【0106】
図15は、上記特許文献3に開示された従来のパーソナルコンピュータにおける表示部への表示方法を小型装置に適用した場合における表示例を示す。
【0107】
この場合、表示画面42の面積が狭いので総ての認識結果を表示しきれない。そこで、ユーザは、画像取り込み画面と認識結果表示画面とに切り換えて表示する必要がある。図15(a)は、画像取り込みおよび文字認識を行なう場合の画像取り込み画面である。また、図15(b)は、認識結果文字列履歴の中から最適結果を選択決定する場合の認識結果表示画面である。このように、表示画面42の表示内容を切り換えて、認識結果文字列履歴を表示させ、認識結果文字列履歴の中からカーソル操作等によって所望の結果を選択・決定すると言う煩雑な動作が必要なのである。
【0108】
図16は、上記画像領域特定手段5によって設定され描画された上記画像領域を示す情報の他の例を示す。表示手段2の第1の表示領域2aには、上記画像領域を示す情報としての枠線43が表示されている。枠線43で囲まれた面積は図13における枠24よりも小さくなっており、広い枠24と狭い枠線43に切り換え可能になっている。こうすることによって、長い文字列の1文字だけを認識することが可能になる。あるいは、通常よりも長い文字列を認識することが可能になる。
【0109】
尚、上記枠24と枠線43との切り換えは、例えば、画像領域特定手段5によって、図6に示す表示設定情報バッファ17の内容を変更することによって可能である。また、枠24と枠線43とに関する表示設定情報バッファ17の内容設定は、本画像情報処理装置の起動時にモード設定してもよいし、撮像処理開始後にユーザの指定によって設定するようにしてもよい。
【0110】
図17は、上記表示手段2に対する原寸画像(通常の表示画像に対しては拡大画像)の表示例を示す。この場合、表示手段2は、第1の表示領域2aと第2の表示領域2bとに分割されると共に、さらに第1の表示領域2aが縮小表示領域2a1と原寸表示領域2a2とに分割されている。そして、縮小表示領域2a1には縮小画像が枠24および指定位置32と共に表示され、原寸表示領域2a2には指定位置32で特定されたターゲット行の原寸画像が表示され、表示領域2bには最適認識候補が表示されている。図13に示す表示例では縮小画像と認識結果とを表示するのに対して、図17に示す表示例では原寸画像も同時に表示して、入力画像の細かいチェックを可能にしているのである。尚、原寸画像の表示は、画像領域特定手段5の画面表示コントローラ18によって、表示設定情報バッファ17の原寸画像の表示位置(sx,sy)および原寸撮像画像表示のスイッチ(SSwitch)の内容と、撮像画像蓄積バッファ15の内容とに基づいて行われる。
【0111】
図18は、本画像情報処理装置が、赤外線通信またはBlootooth等の無線通信によって、パーソナルコンピュータ等の他の情報処理機器44に最終認識結果を送信している様子を示す。尚、無線通信ではなく、有線通信で送信してもよい。この送信処理は、送信手段10によって、例えば最終認識結果が確定された後のユーザによる送信スイッチ20の操作に従って実行される。
【0112】
図19は、本画像情報処理装置における図3とは異なる文字認識処理動作のフローチャートである。尚、本文字認識処理動作を実現する画像情報処理装置の構成は、図1に示す構成と同じである。
【0113】
ステップS51〜ステップS57で、図3に示す文字認識処理動作における上記ステップS1〜ステップS7の場合と同様にして、最適文字列バッファ13内における最終認識結果存在の判別、最適文字列バッファ13の内容の表示、撮像終了か否かの判別、撮像処理の実行、画像領域特定処理の実行、画像表示処理の実行、認識移行の可否判断、認識移行が否の場合の上記ステップS51へのリターンが行われる。
【0114】
ステップS58で、上記認識移行が可能であるので、認識処理へ移行する前に、画像領域特定手段5の画面表示コントローラ18によって、表示用画像蓄積バッファ14の内容を表示手段2に所定時間継続して表示する画像表示処理が実行される。つまり、ターゲット行の認識処理が可能であると判断された場合には、再度撮像画像を表示するのである。その場合、一定時間だけ画像の取り込みが中止されることになる。
【0115】
ステップS59,ステップS60で、図3に示す文字認識処理動作における上記ステップS8,ステップS9の場合と同様にして、文字認識処理の実行、認識結果判定処理の実行が行われる。そうした後、上記ステップS51に戻って、最適文字列バッファ13に格納された最終認識結果の表示に移行する。そして、ステップS53において、撮像を終了すると判別されると文字認識処理動作を終了するのである。
【0116】
このように、上記認識移行可否判断手段6によって上記特定された画像領域に対する認識処理への移行が可能であると判断された場合には、認識処理へ移行する前に再度撮像画像を表示することによって、認識移行可否判断処理によって認識移行が可能と判定されたことを視覚的にユーザに通知することができるのである。
【0117】
その場合、例えば、画像を白黒にしたり、彩度を変化させたり、画像領域を示す枠24を点滅させたりして、画質を変化させることによって、ユーザに2度目の表示であることを一目で分るようにすることも可能である。
【0118】
尚、上述の場合には、上記ステップS58において再度撮像画像を表示するに際して、全画像を再度表示するようにしている。しかしながら、この発明はこれに限定されるものではない。例えば、表示手段2の第1の表示領域2aにおける縮小表示領域2a1に縮小画像を表示すると共に、原寸表示領域2a2に原寸画像を表示する場合において、上記ステップS58において原寸画像のみを所定時間継続して表示する一方、縮小画像に関しては上記ステップS58をスキップして、逐次撮像画像を表示するようにしても差し支えない。
【0119】
また、この発明は、上記実施の形態における上記画像領域特定手段5,認識移行可否判断手段6,認識手段7,認識結果判定手段8,認識結果出力手段9および送信手段10の総てを備えている必要はない。例えば、認識結果判定手段8や送信手段10が無い場合でも、枠24内の認識対象領域のみを認識することによって、認識処理量を軽減して認識速度を速くし、無意味な認識を排除して蓄積バッファ12の記憶容量を削減すると言う従来に無い効果を奏することができるのである。
【0120】
ところで、上記実施の形態における画像領域特定手段5,認識移行可否判断手段6,認識手段7,認識結果判定手段8,認識結果出力手段9および送信手段10としての機能は、プログラム記録媒体に記録された画像情報処理プログラムによって実現される。上記実施の形態における上記プログラム記録媒体は、RAMでなるメモリ3とは別体に設けられたHDD4としてのROM(リード・オンリ・メモリ)でなるプログラムメディアである。あるいは、外部補助記憶装置に装着されて読み出されるプログラムメディアであってもよい。尚、何れの場合においても、上記プログラムメディアから画像情報処理プログラムを読み出すプログラム読み出し手段は、上記プログラムメディアに直接アクセスして読み出す構成を有していてもよいし、上記メモリ3に設けられたプログラム記憶エリア(図示せず)にダウンロードし、上記プログラム記憶エリアにアクセスして読み出す構成を有していてもよい。尚、上記プログラムメディアからメモリ3の上記プログラム記憶エリアにダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。
【0121】
ここで、上記プログラムメディアとは、本体側と分離可能に構成され、磁気テープやカセットテープ等のテープ系、フロッピーディスク,ハードディスク等の磁気ディスクやCD(コンパクトディスク)‐ROM,MO(光磁気)ディスク,MD(ミニディスク),DVD(ディジタル多用途ディスク)等の光ディスクのディスク系、IC(集積回路)カードや光カード等のカード系、マスクROM,EPROM(紫外線消去型ROM),EEPROM(電気的消去型ROM),フラッシュROM等の半導体メモリ系を含めた、固定的にプログラムを坦持する媒体である。
【0122】
また、上記実施の形態における画像情報処理装置は、インターネットを含む通信ネットワークと通信I/Fを介して接続可能な構成を有している場合には、上記プログラムメディアは、通信ネットワークからのダウンロード等によって流動的にプログラムを坦持する媒体であっても差し支えない。尚、その場合における上記通信ネットワークからダウンロードするためのダウンロードプログラムは、予め本体装置に格納されているものとする。あるいは、別の記録媒体からインストールされるものとする。
【0123】
尚、上記記録媒体に記録されるものはプログラムのみに限定されるものではなく、データも記録することが可能である。
【0124】
【発明の効果】
以上より明らかなように、この発明の画像情報処理装置は、画像領域特定手段によって撮像画像における認識の対象となる領域を特定し、この特定された領域内の画像に対する認識処理への移行の可否を認識移行可否判断手段によって判断し、認識手段は、上記認識移行可否判断手段による判断結果が可である場合に上記領域内の画像を認識するので、上記撮像画像の認識対象領域のみを認識すればよく、認識による処理量を軽減して認識速度を速くすることができる。また、認識対象とはならない領域(撮影条件の悪い場合が多い)に対する無意味な認識を排除することでき、認識結果蓄積手段の記憶容量を削減することができる。
【0125】
さらに、上記画像領域特定手段によって特定された領域を示す情報を画像表示制御手段によって表示手段に表示させるので、ユーザは、表示される撮像画像および上記情報を見ながら本画像情報処理装置を上下左右前後に移動させて、被写体の認識対象領域を的確に上記領域内に入れることができる。したがって、精度の高い認識を行うことができる。
【0126】
さらに、上記画像領域特定手段は、認識対象画像が上記特定された領域内に在ることを特定するための指定位置情報を上記領域の中に設定し、上記画像表示制御手段は、上記指定位置情報を上記表示手段に表示させるので、ユーザは、上記表示手段に表示された認識対象画像と指定位置情報との位置関係から、上記認識対象画像が正しく上記特定された領域内に在ることを目視することが可能になる。
【0127】
さらに、上記画像領域特定手段によって特定される領域を枠で規定し、上記画像領域特定手段によって設定される指定位置情報を上記枠内に在る判別線とし、上記認識移行可否判断手段は、上記枠内の画像における黒画素の連結を取り囲む領域が上記判別線に掛る数の度合に基づいて、上記枠内の画像に対する認識への移行の可否を判断するので、上記枠内の線状の指定位置情報に基づいて、上記特定される領域を規定する枠内に在る認識対象画像の認識処理への移行が可であることを、正しく判断することができる。
【0128】
また、この発明の画像情報処理装置は、画像領域特定手段によって撮像画像における認識の対象となる領域を特定し、この特定された領域内の画像に対する認識処理への移行の可否を認識移行可否判断手段によって判断し、認識手段は、上記認識移行可否判断手段による判断結果が可である場合に上記領域内の画像を認識するので、認識による処理量を軽減して認識速度を速くできる。また、無意味な認識を排除して認識結果蓄積手段の記憶容量を削減できる。
【0129】
さらに、認識結果判定手段によって、上記認識結果蓄積手段に蓄積された2以上の認識結果に基づいて最適認識候補を判定するので、表示手段に、同一認識対象画像に関する多数の認識結果を表示させる必要がない。そのために、上記撮像画像と最適認識候補とを同一画面に表示することができる。
【0130】
すなわち、この発明によれば、携帯電話のような小型装置において、認識対象領域をユーザーに提示しながら認識処理を行なうことができるのである。
【0131】
さらに、指示手段によって撮像の開始が指示されてから撮像の終了が指示されるまで、撮像手段,画像領域特定手段,認識移行可否判断手段,画像表示制御手段,認識手段および認識結果判定手段による処理を繰り返して行うので、ユーザは、逐次得られる最適認識候補を上記表示手段等によって監視し、所望の認識候補が得られた場合に上記指示手段で撮像の終了を指示することによって、表示された多数の認識候補の中から所望の認識候補を選択することなく最終認識結果を得ることができる。したがって、片手によって最終認識結果の決定を行うことができる。
【0132】
さらに、上記画像領域特定手段は、認識対象画像が上記特定された領域内に在ることを特定するための指定位置情報を上記領域の中に設定し、上記画像表示制御手段は、上記指定位置情報を上記表示手段に表示させるので、ユーザは、上記表示手段に表示された認識対象画像と指定位置情報との位置関係から、上記認識対象画像が正しく上記特定された領域内に在ることを目視することが可能になる。
【0133】
さらに、上記画像領域特定手段によって特定される領域を枠で規定し、上記画像領域特定手段によって設定される指定位置情報を上記枠内に在る判別線とし、上記認識移行可否判断手段は、上記枠内の画像における黒画素の連結を取り囲む領域が上記判別線に掛る数の度合に基づいて、上記枠内の画像に対する認識への移行の可否を判断するので、上記枠内の線状の指定位置情報に基づいて、上記特定される領域を規定する枠内に在る認識対象画像の認識処理への移行が可であることを、正しく判断することができる。
【0134】
また、上記画像表示制御手段によって、上記認識移行可否判断手段による判断結果が可である場合に、上記認識手段による認識に移行する前に、上記判断結果が可であると判断された撮像画像を所定時間だけ継続して上記表示手段に表示させるようにすれば、ユーザは、上記枠内の認識対象画像に対する認識処理への移行のタイミングを、時差なく視覚的に知ることができる。
【0135】
また、この発明の画像情報処理プログラムは、コンピュータを、上記画像情報処理装置における撮像手段,画像領域特定手段,画像表示制御手段,認識移行可否判断手段,認識手段, 認識結果蓄積手段 , 表示手段 ,認識結果判定手段および指示手段として機能させるので、上記画像情報処理装置の場合と同様に、認識の処理量を軽減して認識速度を速くすることができる。さらに、認識対象ではない領域に対する無意味な認識を排除して認識結果蓄積手段の記憶容量を削減することができる。さらに、同一認識対象画像に関する多数の認識結果を表示する必要がなく、撮像画像と認識結果とを同一画面に表示することができる。
【0136】
また、この発明のプログラム記録媒体は、上記画像情報処理プログラムが記録されているので、コンピュータで読み出して実行することによって、上記画像情報処理装置の場合と同様に、認識の処理量を軽減して認識速度を速くすることができる。さらに、認識対象ではない領域に対する無意味な認識を排除して認識結果蓄積手段の記憶容量を削減することができる。さらに、同一認識対象画像に関する多数の認識結果を表示する必要がなく、撮像画像と認識結果とを同一画面に表示することができる。
【図面の簡単な説明】
【図1】 この発明の画像情報処理装置におけるブロック図である。
【図2】 図1に示す画像情報処理装置の外観図である。
【図3】 図1に示す画像情報処理装置による文字認識処理動作のフローチャートである。
【図4】 図1における表示手段に表示される撮像画像と枠との具体例を示す図である。
【図5】 図3に示す文字認識処理動作中において実行される画像表示処理動作のフローチャートである。
【図6】 図1における表示設定情報バッファに格納された表示設定情報の一例を示す概念図である。
【図7】 図3に示す文字認識処理動作中において実行される認識移行可否判断処理動作のフローチャートである。
【図8】 枠内に表示されたターゲット行と指定位置との関係を示す図である。
【図9】 図3に示す文字認識処理動作中において実行される認識結果判定処理動作のフローチャートである。
【図10】 図9に示す認識結果判定処理動作中における入力バッファ,蓄積バッファおよび最適文字列バッファの内容の一例を示す概念図である。
【図11】 図9とはことなる認識結果判定処理動作のフローチャートである。
【図12】 図11に示す認識結果判定処理動作中における入力バッファ,蓄積バッファおよび最適文字列バッファの内容の一例を示す概念図である。
【図13】 図1における表示手段への表示例を示す図である。
【図14】 従来のパーソナルコンピュータにおける表示部への表示例を示す図である。
【図15】 従来のパーソナルコンピュータにおける表示部への表示方法を小型装置に適用した場合における表示例を示す図である。
【図16】 画像領域を示す情報の他の例を示す図である。
【図17】 図1における表示手段に対する拡大画像の表示例を示す図である。
【図18】 図1に示す画像情報処理装置が他の情報処理機器に最終認識結果を送信している様子を示す図である。
【図19】 図3とは異なる文字認識処理動作のフローチャートである。
【符号の説明】
1…撮像手段、
2…表示手段、
3…メモリ、
4…HDD、
5…画像領域特定手段、
6…認識移行可否判断手段、
7…認識手段、
8…認識結果判定手段、
9…認識結果出力手段、
10…送信手段、
11…入力バッファ、
12…蓄積バッファ、
13…最適文字列バッファ、
14…表示用画像蓄積バッファ、
15…撮像画像蓄積バッファ、
16…縮小画像蓄積バッファ、
17…表示設定情報バッファ、
18…画面表示コントローラ、
19…指示手段、
20…送信スイッチ、
24…枠、
32…指定位置、
36…確定ボタン。
Claims (12)
- 被写体を撮像する撮像手段と、
上記撮像手段によって撮像された画像を認識する認識手段と、
上記認識手段による認識結果が撮像期間中2以上蓄積される認識結果蓄積手段と、
上記画像を含む表示情報を表示する表示手段と、
上記撮像手段によって撮像された画像における上記認識手段による認識の対象となる領域を特定する画像領域特定手段と、
上記画像領域特定手段によって特定された領域を示す情報を、上記表示手段に表示させる画像表示制御手段と、
上記画像領域特定手段で特定された領域内の画像に対する上記認識手段による認識処理への移行が可能であるか否かを判断する認識移行可否判断手段
を備えて、
上記認識手段は、上記認識移行可否判断手段による判断結果が可である場合に上記領域内の画像を認識するようになっており、
上記画像領域特定手段は、認識対象画像が上記特定された領域内に在ることを特定するための指定位置情報を上記領域の中に設定するようになっており、
上記画像表示制御手段は、上記指定位置情報を上記表示手段に表示させるようになっている
画像情報処理装置において、
上記画像領域特定手段によって特定される領域は枠で規定されており、
上記画像領域特定手段によって設定される指定位置情報は上記枠内に在る判別線であり、
上記認識移行可否判断手段は、上記枠内の画像における黒画素の連結を取り囲む領域が上記判別線に掛る数の度合に基づいて、上記枠内の画像に対する認識への移行の可否を判断するようになっている
ことを特徴とする画像情報処理装置。 - 被写体を撮像する撮像手段と、
上記撮像手段によって撮像された画像を認識する認識手段と、
上記認識手段による認識結果が撮像期間中2以上蓄積される認識結果蓄積手段と、
上記認識結果蓄積手段に蓄積された認識結果に基づいて最適認識候補を判定する認識結果判定手段と、
上記画像を含む表示情報を表示する表示手段と、
上記撮像手段によって撮像された画像における上記認識手段による認識の対象となる領域を特定する画像領域特定手段と、
上記画像領域特定手段で特定された領域内の画像に対する上記認識手段による認識処理への移行が可能であるか否かを判断する認識移行可否判断手段
を備えて、
上記認識手段は、上記認識移行可否判断手段による判断結果が可である場合に上記領域内の画像を認識するようになっており、
ユーザによって操作されて、上記撮像手段による撮像の開始および終了を指示する指示手段を備えて、
上記画像領域特定手段は、上記特定された領域を示す情報を上記表示手段に表示させる画像表示制御手段を有し、
上記撮像手段 , 画像領域特定手段 , 認識移行可否判断手段 , 画像表示制御手段 , 認識手段および認識結果判定手段は、上記指示手段によって撮像の開始が指示されてから撮像の終了が指示されるまで繰り返して動作するようになっており、
上記画像領域特定手段は、認識対象画像が上記特定された領域内に在ることを特定する ための指定位置情報を上記領域の中に設定するようになっており、
上記画像表示制御手段は、上記指定位置情報を上記表示手段に表示させるようになっている
画像情報処理装置において、
上記画像領域特定手段によって特定される領域は枠で規定されており、
上記画像領域特定手段によって設定される指定位置情報は上記枠内に在る判別線であり、
上記認識移行可否判断手段は、上記枠内の画像における黒画素の連結を取り囲む領域が上記判別線に掛る数の度合に基づいて、上記枠内の画像に対する認識への移行の可否を判断するようになっている
ことを特徴とする画像情報処理装置。 - 請求項2に記載の画像情報処理装置において、
上記認識結果判定手段は、
上記認識手段によって認識結果が得られる毎に、上記認識結果蓄積手段に蓄積されている認識結果に基づいて、出現回数が最大である認識結果を上記最適認識候補であると判定する
ようになっていることを特徴とする画像情報処理装置。 - 請求項2に記載の画像情報処理装置において、
上記認識手段は、認識の際に認識の信頼度を求めるようになっており、
上記認識結果蓄積手段には、認識結果と共に上記信頼度が蓄積されるようになっており、
上記認識結果判定手段は、上記認識手段によって認識結果が得られる毎に、上記認識結果蓄積手段に蓄積されている認識結果および上記信頼度に基づいて、最大連続出現回数が所定回数以上であり且つ上記信頼度が所定値以上である認識結果を上記最適認識候補であると判定するようになっている
ことを特徴とする画像情報処理装置。 - 請求項1あるいは請求項2に記載の画像情報処理装置において、
上記画像表示制御手段は、
上記認識移行可否判断手段による判断結果が可である場合に、上記認識手段による認識に移行する前に、上記判断結果が可であると判断された撮像画像を所定時間だけ継続して上記表示手段に表示させるようになっている
ことを特徴とする画像情報処理装置。 - 請求項1あるいは請求項2に記載の画像情報処理装置において、
上記表示手段は、縮小された撮像画像を表示する第1の表示領域と原寸の撮像画像を表示する第2の表示領域とに分割された表示画面を有しており、
上記画像表示制御手段は、上記撮像手段で撮像された画像の縮小画像を上記表示手段における第1の表示領域に表示させる一方、原寸画像を上記第2の表示領域に表示させるようになっている
ことを特徴とする画像情報処理装置。 - 請求項6に記載の画像情報処理装置において、
上記画像表示制御手段は、
上記認識移行可否判断手段による判断結果が可である場合に、上記認識手段による認識に移行する前に、上記判断結果が可であると判断された撮像画像に関する縮小画像および原寸画像の何れか一方のみを所定時間だけ継続して上記表示手段に表示させるようになっている
ことを特徴とする画像情報処理装置。 - 請求項1あるいは請求項2に記載の画像情報処理装置において、
上記撮像手段は、上記認識移行可否判断手段による判断結果が否である場合に次の撮像を行うようになっていることを特徴とする画像情報処理装置。 - 請求項1あるいは請求項2に記載の画像情報処理装置において、
上記画像領域特定手段は、上記撮像画像における上記認識の対象となる領域を変更可能になっていることを特徴とする画像情報処理装置。 - 請求項2に記載の画像情報処理装置において、
上記認識結果判定手段によって最終的に判定された最適認識候補を最終認識結果として他の装置に送信する送信手段を備えたことを特徴とする画像情報処理装置。 - コンピュータを、
請求項2における撮像手段, 画像領域特定手段 , 画像表示制御手段 ,認識移行可否判断手段, 認識手段 , 認識結果蓄積手段 , 表示手段 , 認識結果判定手段および指示手段
として機能させることを特徴とする画像情報処理プログラム。 - 請求項11に記載の画像情報処理プログラムが記録されたことを特徴とするコンピュータ読出し可能なプログラム記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002376604A JP4199535B2 (ja) | 2002-12-26 | 2002-12-26 | 画像情報処理装置、画像情報処理プログラム、および、プログラム記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002376604A JP4199535B2 (ja) | 2002-12-26 | 2002-12-26 | 画像情報処理装置、画像情報処理プログラム、および、プログラム記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004206548A JP2004206548A (ja) | 2004-07-22 |
JP4199535B2 true JP4199535B2 (ja) | 2008-12-17 |
Family
ID=32814024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002376604A Expired - Fee Related JP4199535B2 (ja) | 2002-12-26 | 2002-12-26 | 画像情報処理装置、画像情報処理プログラム、および、プログラム記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4199535B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005215775A (ja) * | 2004-01-27 | 2005-08-11 | Matsushita Electric Ind Co Ltd | 文字読み取り装置及び画像表示方法 |
JP2008250818A (ja) * | 2007-03-30 | 2008-10-16 | Omron Corp | 携帯端末装置用のプログラムおよび携帯端末装置 |
EP2757502B1 (en) * | 2011-09-16 | 2017-04-12 | NEC Corporation | Image processing apparatus, image processing method, and image processing program |
JP5561331B2 (ja) * | 2012-09-12 | 2014-07-30 | オムロン株式会社 | 携帯端末装置用のプログラムおよび携帯端末装置 |
-
2002
- 2002-12-26 JP JP2002376604A patent/JP4199535B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004206548A (ja) | 2004-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11696021B2 (en) | Video recording device and camera function control program | |
US8599251B2 (en) | Camera | |
KR100919221B1 (ko) | 휴대 전화기 | |
JP4250543B2 (ja) | 撮像装置及び情報処理装置及びそれらの制御方法 | |
US8363900B2 (en) | Image processing apparatus, image processing method, and program | |
JP4450783B2 (ja) | 撮影装置 | |
US8131014B2 (en) | Object-tracking computer program product, object-tracking device, and camera | |
US20010013897A1 (en) | Information processing device | |
US8502883B2 (en) | Photographing apparatus and photographing control method | |
JP2006094082A (ja) | 画像撮影装置およびプログラム | |
JP2007166011A (ja) | 撮像装置及びそのプログラム | |
JP4663662B2 (ja) | 描画装置 | |
JP4199535B2 (ja) | 画像情報処理装置、画像情報処理プログラム、および、プログラム記録媒体 | |
JP5733956B2 (ja) | 撮像装置及びその制御方法、動画記録装置並びにその制御方法、プログラム、並びに記憶媒体 | |
KR100816949B1 (ko) | 최적상태 촬상 전자카메라 | |
JP6866210B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2008065851A (ja) | 情報処理装置および記録媒体 | |
JP2005055973A (ja) | 携帯情報端末 | |
JP4266891B2 (ja) | 撮像装置 | |
JP5167618B2 (ja) | 表示装置、撮像装置、表示方法、及び表示処理プログラム | |
JP5564897B2 (ja) | 画像表示装置 | |
JP3466912B2 (ja) | デジタルカメラ、画像処理方法、記憶媒体 | |
JP4571111B2 (ja) | 情報処理装置および記録媒体 | |
JP4310711B2 (ja) | 情報処理装置および記録媒体 | |
JP5846420B2 (ja) | 画像処理装置、画像管理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050525 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080605 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080924 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081003 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131010 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |