JPH10247220A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH10247220A
JPH10247220A JP9048334A JP4833497A JPH10247220A JP H10247220 A JPH10247220 A JP H10247220A JP 9048334 A JP9048334 A JP 9048334A JP 4833497 A JP4833497 A JP 4833497A JP H10247220 A JPH10247220 A JP H10247220A
Authority
JP
Japan
Prior art keywords
character
size
image
unit
recognizable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9048334A
Other languages
English (en)
Other versions
JP3563911B2 (ja
Inventor
Isamu Haneda
勇 羽田
Toshio Isoe
俊雄 磯江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP04833497A priority Critical patent/JP3563911B2/ja
Priority to EP98103642A priority patent/EP0863475B1/en
Priority to DE69834971T priority patent/DE69834971T2/de
Priority to US09/033,671 priority patent/US6252984B1/en
Priority to CN98106466A priority patent/CN1110008C/zh
Publication of JPH10247220A publication Critical patent/JPH10247220A/ja
Application granted granted Critical
Publication of JP3563911B2 publication Critical patent/JP3563911B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 一度読み込んだ文字画像を認識できなかった
場合に、再度読み込み操作を行わなければならないとい
う問題がある。 【解決手段】 まず、使用者が画像取込キー3を押すこ
とによって、文字を含んだ文字画像を撮影する。そし
て、表示部2に表示されている文字画像を切り出す。文
字切り出しの処理は従来から用いられている方法を取
る。例えば、横1行分の同一色の画素を取り出し合計を
求め、その合計が多い部分の縦の列の画素を合計し、多
い部分を文字が存在する領域とする。切り出した文字画
像が認識可能な大きさであれば文字画像を記憶し、切り
出した文字画像が認識不可能なほど小さいものであれ
ば、図3のように表示部2の左下部に「認識できませ
ん。」と、警告表示する。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は撮像した文字画像を
認識する文字認識装置に関するものである。
【0002】
【従来の技術】従来の技術として、例えば、特開昭62
−80791号公報や特開平6−74729号公報に開
示されたものがある。
【0003】まず、特開昭62−80791号公報に
は、入力された画像情報を標準パターンとし、この標準
パターンに基づいて辞書パターンの格納サイズを設定
し、この辞書パターンに基づいて画像情報を認識するこ
とが開示されている。
【0004】また、特開平6−74729号公報には、
認識文字との距離を計算し、認識する文字が所定の大き
さになるようカメラのズームを行うことが開示されてい
る。
【0005】
【発明が解決しようとする課題】しかし、上記従来の技
術では、一度読み込んだ文字画像を認識できなかった場
合に、再度読み込み操作を行わなければならないという
問題がある。
【0006】また、文字画像を読み取った段階ではこれ
が認識可能であるかどうかは判断できず、認識できなか
った場合にはもう一度文字画像を読み込まなければなら
ないという問題がある。
【0007】また、従来の技術では、認識可能な文字画
像まで必要以上の拡大操作を行ってしまうという問題が
ある。
【0008】本発明は、上記問題点を解決するために、
文字画像の大きさが認識できないものであれば、使用者
に対してその旨を報知する文字認識装置を提供すること
目的とする。
【0009】また、本発明は、上記問題点を解決するた
めに、文字種類に応じた複数の認識可能なサイズを記憶
し、切り取った文字画像がどの文字の種類のサイズに該
当するかを報知する文字認識装置を提供することを目的
とする。
【0010】また、本発明は、上記問題点を解決するた
めに、切り取った文字画像より、文字の種類毎の認識可
能なサイズに相当する文字画像を抽出し、報知する文字
認識装置を提供することを目的とする。
【0011】また、本発明は、上記問題点を解決するた
めに、切り取った文字画像の大きさが認識可能なサイズ
でない場合に、その文字画像を認識可能なサイズに拡大
する文字認識装置を提供することを目的とする。
【0012】
【課題を解決するための手段】本発明は、上記目的を達
成するためになされたものであって、請求項1記載の発
明は、撮像手段により得られた画像を認識手段により文
字として認識する文字認識装置であって、前記撮像手段
により得られた画像から文字画像を切り取る切取手段
と、前記切取手段にて切り取った文字画像の大きさが認
識可能なサイズであるか否かを判断する判断手段と、前
記判断手段にて文字画像の大きさが認識可能なサイズに
満たないと判断した場合に、認識不可能の旨を報知する
報知手段とを具備することを特徴とする文字認識装置で
ある。
【0013】また、請求項2記載の発明は、撮像手段に
より得られた画像を認識手段により文字として認識する
文字認識装置であって、前記撮像手段により得られた画
像から文字画像を切り取る切取手段と、文字の種類毎に
認識可能なサイズを記憶する記憶手段と、前記切取手段
にて切り取った文字画像の大きさが前記記憶手段に記憶
されたどの文字の種類の認識可能なサイズに該当するか
を判断する判断手段と、前記判断手段にて判断した認識
可能なサイズの文字の種類を報知する報知手段とを具備
することを特徴とする文字認識装置である。
【0014】また、請求項3記載の発明は、撮像手段に
より得られた画像を認識手段により文字として認識する
文字認識装置であって、前記撮像手段により得られた画
像から文字画像を切り取る切取手段と、文字の種類毎に
認識可能なサイズを記憶する記憶手段と、前記切取手段
にて切り取った文字画像から、前記記憶手段に記憶され
た文字の種類毎の認識可能なサイズに相当する大きさを
有する文字画像を抽出する抽出手段と、前記記憶手段に
記憶された文字の種類毎に、前記抽出手段にて抽出され
た文字画像を認識可能なサイズとして報知する報知手段
とを具備することを特徴とする文字認識装置である。
【0015】また、請求項4記載の発明は、撮像手段に
より得られた画像を認識手段により文字として認識する
文字認識装置であって、前記撮像手段により得られた画
像から文字画像を切り取る切取手段と、前記切取手段に
て切り取った文字画像の大きさが認識可能なサイズであ
るか否かを判断する判断手段と、前記判断手段にて文字
画像の大きさが認識可能なサイズに満たないと判断した
場合に、前記文字画像を認識可能なサイズに拡大する拡
大手段とを具備することを特徴とする文字認識装置であ
る。
【0016】
【発明の実施の形態】以下、図をもとに本発明について
詳述する。なお、これによって本発明は限定されるもの
ではない。
【0017】図1は本発明を採用した装置の外観斜視図
である。図1(a)は撮影者側から見た装置の外観斜視
図であり、図1(b)は撮影者の対面方向から見た装置
の外観斜視図である。
【0018】本発明を採用した装置は本体キャビネット
部1と表示部2と画像取込キー3と記憶指示キー4と電
源スイッチ5とCCDカメラ部6と把持部7とを有す
る。
【0019】本体キャビネット部1は図示していないマ
イクやスピーカなどを有するものであり、表示部2はC
CDカメラ部6により撮影した画像を表示するものであ
り、薄型で文字画像を表示可能なマトリックス方式から
なる液晶表示部と、これを覆う大きさを有するタブレッ
トとによって構成されている。
【0020】該タブレットは例えば、透明なシート2枚
の内側面に透明電極を設け、通電状態において各々の電
極が接触しないように、小さな突起状のスペーサが規則
正しく印刷されており、指或はペンにて指示することに
より透明電極が接触し、選択された位置を透明タブレッ
トにて検出することを可能としている。
【0021】画像取込キー3は画像の撮影開始を指示す
るキーであり、記憶指示キー4は読み込んだ画像の記憶
を指示するキーである。
【0022】電源スイッチ5は装置の電源をON/OF
Fするスイッチであり、CCDカメラ部6は画像を読み
込むためのCCDを撮像素子としたCCDカメラ部であ
り、把持部7は装置を持ちやすくするためものであり、
凹状になっている。
【0023】また、図1の外観斜視図には図示していな
いが、本発明を採用した装置は外部とのデータのやり取
りを行うためのインターフェイス部を備え、外部との通
信を行うためのモデム等を内蔵している。
【0024】次に、図1の装置の操作方法を説明する。
撮影を行う場合、まず、電源スイッチ5で電源をONに
し、撮影したい対象にCCDカメラ部6を据え、画像取
込キー3を一回押すと、CCDカメラ部6のレンズがと
らえた画像が表示部2に表示される。
【0025】以下、実施例1乃至4について説明する。
【0026】[実施例1]実施例1について図1〜図4
をもとに説明する。
【0027】図1において、まず、使用者が画像取込キ
ー3を押すことによって、文字を含んだ文字画像を撮影
する。そして、表示部2に表示されている文字画像を切
り出す。文字切り出しの処理は従来から用いられている
方法を取る。例えば、横1行分の同一色の画素を取り出
し合計を求め、その合計が多い部分の縦の列の画素を合
計し、多い部分を文字が存在する領域とする。切り出し
た文字画像が認識可能な大きさであれば文字画像を記憶
し、切り出した文字画像が認識不可能なほど小さいもの
であれば、図3のように表示部2の左下部に「認識でき
ません。」と、警告表示する。
【0028】以上の操作を図2のブロック図をもとに説
明する。レンズ部8で光を結像し、後に説明を行うズー
ム機構部9により任意に拡大した被写体像をCCD10
の撮像面部に投影する。CCD10ではズーム機構9を
介してレンズ部8から投影された光を増幅器11により
増幅し、このアナログ信号をA/D変換器12に出力す
る。A/D変換器12によりデジタル信号に変換された
画像信号は1フレーム記憶部13に一旦保存され、文字
切り出し部14に出力される。
【0029】文字切り出し部14では上記に述べた文字
切り出し方法により文字表示領域を切り出し、この切り
出した文字の情報をサイズ判断部15に出力する。サイ
ズ判断部15ではサイズ記憶部16に予め記憶している
基準となる文字サイズと、文字切り出し部14より入力
された文字情報の文字サイズとを比較し、基準文字サイ
ズよりも切り出した文字サイズの方が大きければ、OK
側の制御線を通して合成部17に切り出した文字情報を
出力する。
【0030】サイズ記憶部16には英数字であれば認識
可能なサイズ(例えば8×8ドット)を記憶している英
数サイズ記憶部16−1、平仮名や片仮名であれば認識
可能な文字サイズ(例えば16×16ドット)を記憶し
ているひらがなサイズ記憶部16−2、漢字を認識可能
な文字サイズ(例えば64×64ドット)を記憶してい
る漢字サイズ記憶部16−3が含まれており、本実施例
の場合には切り出した文字のサイズと、漢字サイズ記憶
部16−3の内容とを比較している。
【0031】また、この基準となる文字サイズを英数サ
イズ、ひらがなサイズ、漢字サイズの3種類のサイズか
ら使用者が任意に選択可能としてもよい。
【0032】ここで、使用者がスイッチ部23に含まれ
る記憶指示キー4を押すと、スイッチ部23から制御部
22に信号が出力され、記憶部18に表示部2の文字画
像を記憶する。
【0033】また、サイズ判断部15で判断した結果、
切り出した文字のサイズが基準文字サイズよりも小さけ
れば、NG側の制御線を通して表示部2に「認識できま
せん。」と警告表示21を行う。
【0034】以上の処理を図4のフローチャート図をも
とに説明する。まず、STEP1で使用者が画像取込キ
ー3を押したときの画像を読み込み、STEP2で読み
込んだ画像から文字を切り出す。次のSTEP3では切
り出した文字のサイズを取り込み、STEP4でサイズ
記憶部16の基準サイズと切り出した文字サイズとを比
較し、認識可能なサイズであるかどうかを判断する。
【0035】切り出した文字サイズが基準サイズよりも
大きければ、STEP5で読み込んだ文字画像全部に対
して認識可能かどうかを調べたかを判断する。全部の文
字画像を認識可能かどうか調べていないのであればST
EP3に戻り、全部の文字画像に対して認識可能かどう
か調べたのであればSTEP6で読み込んだ画像を記憶
する。
【0036】また、STEP4で切り出した文字サイズ
が基準サイズよりも小さかった場合には、STEP7で
表示部2に「認識できません。」と警告する表示を行
う。
【0037】以上の処理によって、読み込んだ文字画像
が認識不可能な大きさであれば、認識できないことを表
示部に警告表示させることができる。
【0038】[実施例2]実施例2について図1、図
2、図5〜図7をもとに説明する。
【0039】図5は実施例2の表示画面例を示す図であ
る。使用者が画像読込キー3を押したときに表示部2に
表示された文字画像から文字を切り出し、英数、平仮
名、漢字のうちのどの文字種なら認識可能か、判断す
る。
【0040】文字が小さく、英数字しか認識できないと
きには、図5(a)で示すように、切り出した文字とそ
の文字枠を表示し、この文字枠の上部に”A”と表示す
る。
【0041】また、英数字しか認識できないサイズより
も大きい平仮名、片仮名サイズの文字であれば、平仮
名、片仮名まで認識できることを使用者に知らせるた
め、図5(b)で示すように、切り出した文字枠の上部
に”Aあ”と表示する。
【0042】切り出した文字が漢字のように画数の多い
複雑な文字でも認識できるサイズであれば、図5(c)
で示すように、切り出した文字枠の上部に”Aあ漢”と
表示し、英文字、平仮名、片仮名、漢字の何れの文字で
あっても認識は可能であることを確認できるようにす
る。
【0043】さらに、漢字が認識できる文字サイズであ
れば、英数字や平仮名が認識可能なのは明らかなので、
図5(d)に示すように、切り出した文字枠の上部に”
漢”とのみ表示してもよい。すなわち、認識可能な最大
文字種を表示するだけにしてもよい。
【0044】また、切り出した文字枠の上部に認識可能
文字サイズを表示するのではなく、図6(a)〜(c)
のように、認識可能な文字サイズに対応させて、文字枠
のパターンに網かけや斜線等で変化を付けてもよい。
【0045】また、図6(d)に示すように、文字枠の
下部に認識可能文字サイズ毎の領域を設け、切り出した
文字が認識可能な文字サイズの領域を塗り潰すことで区
別してもよい。
【0046】また、図6(e)で示すように、文字枠を
2重、3重とすることで認識可能文字サイズを区別して
もよい。
【0047】以上の処理を図2のブロック図をもとに説
明する。レンズ部8で光を結像し、後に説明を行うズー
ム機構部9により任意に拡大した被写体像をCCD10
の撮像面部に投影する。CCD10ではズーム機構9を
介してレンズ部8から投影された光をアナログ信号に変
換して増幅器11により増幅し、このアナログ信号をA
/D変換器12に出力する。A/D変換器12によりデ
ジタル信号に変換された画像信号は1フレーム記憶部1
3に一旦保存され、文字切り出し部14に出力される。
【0048】文字切り出し部14では上記に述べた文字
切り出し方法により文字表示領域を切り出し、この切り
出した文字の情報をサイズ判断部15に出力する。サイ
ズ判断部15ではサイズ記憶部16に予め記憶している
基準となる文字サイズと、文字切り出し部14より入力
された文字情報の文字サイズとを比較し、基準文字サイ
ズよりも、切り出した文字サイズの方が大きければ、O
K側の制御線を通して合成部17に切り出した文字情報
を出力する。
【0049】サイズ記憶部16には英数字であれば認識
可能なサイズ(例えば8×8ドット)を記憶している英
数サイズ記憶部16−1、平仮名や片仮名であれば認識
可能な文字サイズ(例えば16×16ドット)を記憶し
ているひらがなサイズ記憶部16−2、漢字を認識可能
な文字サイズ(例えば64×64ドット)を記憶してい
る漢字サイズ記憶部16−3が含まれている。
【0050】例えば切り出した文字のサイズが9×9ド
ットである場合には、まず漢字サイズ記憶部16−3の
内容と比較し、切り出した文字のサイズのほうが小さい
ので、ひらがなサイズ記憶部16−2の内容と比較す
る。ひらがなサイズ記憶部16−2の内容との比較の結
果、まだ切り出した文字サイズのほうが小さいので、英
数サイズ記憶部16−1の内容と比較する。その結果切
り出した文字サイズのほうが大きいため、英数サイズで
認識できることが分かる。
【0051】また、サイズ判断部15からOK側の制御
線により、合成部17に英数サイズで認識するという情
報を出力し、合成部17で切り出した文字の枠線とその
上部に”A”の文字を配置し、切り出した文字と合成し
て、表示部2に表示する。
【0052】ここで、使用者が記憶指示キー4を押す
と、スイッチ部23から制御部22に信号が出力され、
記憶部18に表示部2の文字画像を記憶する。
【0053】以上の処理を図7のフローチャート図をも
とに説明する。まず、STEP8で使用者が画像取込キ
ー3を押したときの画像を読み込み、STEP9で読み
込んだ画像から文字を切り出す。次のSTEP10では
切り出した文字のサイズを取り込み、STEP11でサ
イズ記憶部16の漢字サイズ記憶部16−3に記憶され
た漢字サイズと切り出した文字サイズとを比較し、漢字
を認識可能なサイズであるかどうかを判断する。
【0054】切り出した文字サイズが漢字サイズより小
さい場合にはSTEP14に進み、切り出した文字サイ
ズが漢字サイズと同じか大きい場合にはSTEP12で
図6(a)のように切り出した文字枠を黒色に設定し、
STEP13で漢字サイズであることを記憶し、STE
P20に進む。
【0055】STEP14ではサイズ記憶部16のひら
がなサイズ記憶部16−2に記憶されたひらがなサイズ
と切り出した文字サイズとを比較し、平仮名や片仮名を
認識可能なサイズであるかどうかを判断する。
【0056】切り出した文字サイズがひらがなサイズよ
り小さい場合には、STEP17に進み、切り出した文
字サイズがひらがなサイズと同じか大きい場合にはST
EP15で図6(b)のように切り出した文字枠を青色
に設定し、STEP16でひらがなサイズであることを
記憶し、STEP20に進む。
【0057】STEP17ではサイズ記憶部16の英数
サイズ記憶部16−1に記憶された英数サイズと切り出
した文字サイズとを比較し、英数字を認識可能なサイズ
であるかどうかを判断する。
【0058】切り出した文字サイズが英数サイズより小
さい場合には、STEP20に進み、切り出した文字サ
イズが英数サイズと同じか大きい場合にはSTEP18
で図6(c)のように切り出した文字枠を赤色に設定
し、STEP19で英数サイズであることを記憶し、S
TEP20に進む。
【0059】STEP20では読み込んだ文字画像全部
に対して認識可能かどうかを調べたかを判断する。全部
の文字画像を認識可能かどうか調べていないのであれば
STEP10に戻り、全部の文字画像に対して認識可能
かどうか調べたのであれば、STEP21で読み込んだ
画像を表示部2に表示する。
【0060】次のSTEP22では読み込んだ画像を記
憶するかどうかを使用者に判断させ、使用者が画像を記
憶すると指定した場合には、記憶指示キー4の入力に応
じてSTEP23で読み込んだ画像を記憶する。
【0061】以上の処理によって、認識する文字画像に
関して、複数の文字種類の認識可能な文字を使用者が確
認することが可能であり、画像に含まれる使用者が文字
認識を必要とする文字に対して文字認識の可否を認識前
の目安として確認することができる。
【0062】[実施例3]実施例3について図1、図
2、図8および図9をもとに説明する。
【0063】図8は実施例3の表示画面例を示した図で
ある。使用者が画像取込キー3を押したときに表示部2
に表示されていた表示部2の文字を順次切り出してい
き、英数字、平仮名、漢字の各サイズに該当する文字を
探す。
【0064】仮に、左上から切り出した場合、図8で
は、まず始めに漢字が認識可能なサイズの文字「名」2
7を発見し、次に平仮名が認識可能なサイズの文字
「登」28を発見し、最後に英数字が認識可能なサイズ
の文字「請」29を発見する。
【0065】ここで発見された3種の文字サイズに対応
した文字の文字枠上部に、各サイズを示す表示を行い、
使用者がこれを基準に認識可能なサイズを確認すること
ができる。
【0066】以上の処理を図2のブロック図をもとに説
明する。
【0067】レンズ部8で光を結像し、後に説明を行う
ズーム機構部9により任意に拡大しCCD10の撮像面
部に被写体像を投影する。CCD10ではズーム機構9
を介してレンズ部8から投影された光をアナログ信号に
変換し、増幅器11により増幅して、このアナログ信号
をA/D変換器12に出力する。A/D変換器12によ
りデジタル信号に変換された画像信号は、1フレーム記
憶部13に一旦保存され、文字切り出し部14に出力さ
れる。
【0068】文字切り出し部14では上記に述べた文字
切り出し方法により文字表示領域を切り出し、この切り
出した文字の情報をサイズ判断部15に出力する。
【0069】サイズ記憶部16には英数字であれば認識
可能なサイズ(8×8ドット)を記憶している英数サイ
ズ記憶部16−1、平仮名や片仮名であれば認識可能な
文字サイズ(16×16ドット)を記憶しているひらが
なサイズ記憶部16−2、漢字を認識可能な文字サイズ
(64×64ドット)を記憶している漢字サイズ記憶部
16−3が含まれている。
【0070】サイズ判断部15ではサイズ記憶部16よ
り順次送られてくる(例えば、漢字サイズ、平仮名、片
仮名サイズ、英数字サイズ)予め記憶している基準とな
る文字サイズと、文字切り出し部14より入力された文
字情報の文字サイズとを比較し、初めに漢字サイズが認
識可能な文字サイズを切り出した文字より検出する。
【0071】次に平仮名、片仮名サイズ(但し、漢字サ
イズにて認識可能なサイズは除く)、英数字サイズ(但
し平仮名、片仮名サイズ以上のサイズにて認識可能なサ
イズを除く)の順に認識の可否をサイズに基づき判断す
る。
【0072】認識可能な文字サイズが英数サイズである
場合、サイズ記憶部16からは認識可能サイズが英数サ
イズであることを認識部19に出力し、1フレーム記憶
部13の内容を、制御部22により認識部19で認識す
るための文字パターンを記憶する認識データ部20のデ
ータとを比較することにより、文字画像の認識を行い、
認識結果を文字画像に置き換えて表示部2に表示する。
【0073】また、サイズ判断部15からOK側の制御
線により、合成部17にそれぞれ、適合するサイズで認
識可能なサイズであるとして情報を出力し、合成部17
で切り出した文字を囲むように認識可能サイズ枠(16
−1〜16−3に記憶されているサイズ)と上部に認識
可能サイズを意味する文字情報を配置し、切り出した文
字と合成して、表示部2に表示する。
【0074】以上の処理を英数、ひらがな、漢字全ての
文字サイズにおいて各サイズにつき1文字ずつ行う。
【0075】ここで、使用者が認識に十分な大きさと考
えるなら、記憶指示キー4を押し、スイッチ部23から
の信号が制御部22に出力され、記憶部18に表示部2
の文字画像を記憶する。
【0076】以上の処理を図9のフローチャート図をも
とに説明する。まず、STEP24で使用者が画像取込
キー3を押したときの画像を読み込み、STEP25で
読み込んだ画像から文字を切り出す。次のSTEP26
では切り出した文字のサイズを取り込み、STEP27
で取り込んだ文字サイズが漢字サイズであるかどうかを
判断する。切り出した文字サイズが漢字サイズであれ
ば、STEP28で漢字サイズであることと、この文字
画像の情報とを保持する。
【0077】切り出した文字サイズが漢字サイズでなけ
れば、STEP29で切り出した文字全部に対して判断
を行ったかどうかを調べ、全部判断し終わっていればS
TEP30に進み、全部判断し終わっていなければ、S
TEP26に戻って漢字サイズの文字を発見するまで、
または読み込んだ画像全部を漢字サイズであるかどうか
調べ終わるまでSTEP26からSTEP29の処理を
繰り返す。
【0078】STEP30では次に切り出した文字のサ
イズを取り込み、STEP31で取り込んだ文字サイズ
がひらがなサイズであるかどうかを判断する。切り出し
た文字サイズがひらがなサイズであれば、STEP32
でひらがなサイズであることと、この文字画像の情報と
を保持する。
【0079】切り出した文字サイズがひらがなサイズで
なければ、STEP33で切り出した文字全部に対して
判断を行ったかどうかを調べ、全部判断し終わっていれ
ばSTEP34に進み、全部判断し終わっていなけれ
ば、STEP30に戻ってひらがなサイズの文字を発見
するまで、または読み込んだ画像全部をひらがなサイズ
であるかどうか調べ終わるまでSTEP30からSTE
P33の処理を繰り返す。
【0080】STEP34では次に切り出した文字のサ
イズを取り込み、STEP35で取り込んだ文字サイズ
が英数サイズであるかどうかを判断する。切り出した文
字サイズが英数サイズであれば、STEP36で英数サ
イズであることと、この文字画像の情報とを保持する。
【0081】切り出した文字サイズが英数サイズでなけ
れば、STEP37で切り出した文字全部に対して判断
を行ったかどうかを調べ、全部判断し終わっていればS
TEP38に進み、全部判断し終わっていなければ、S
TEP34に戻って英数サイズの文字を発見するまで、
または読み込んだ画像全部を英数サイズであるかどうか
調べ終わるまでSTEP34からSTEP37の処理を
繰り返す。
【0082】次のSTEP38でSTEP28、STE
P32、STEP36の各処理で保持した情報に基づ
き、各サイズの代表的な文字の近傍に、認識可能なサイ
ズを明記して画面表示を行う。
【0083】次のSTEP39では読み込んだ画像を記
憶するかどうかを使用者に判断させ、使用者が画像を記
憶すると指示した場合には、STEP40で読み込んだ
画像を記憶する。
【0084】以上の処理によって、認識する文字画像の
中で、漢字サイズ、ひらがなサイズ、英数サイズの各サ
イズに合致する代表的な文字にのみ、認識可能なサイズ
を表示させることができる。
【0085】上記の例では、STEP26、STEP3
0、STEP34にて、その都度文字サイズの読み込み
を行っているが、一度読み込んだ情報を保持することに
より、それそれのサイズに対する読み込み回数を削減す
ることもできる。
【0086】又、認識できた文字の次の文字からを対象
として読み込みを行っても良い。この場合、該当文字が
有るまでは画面全てを検出するようにする。
【0087】[実施例4]実施例4について図1、図
2、図10および図11をもとに説明する。
【0088】図10は実施例3の表示画面例を示した図
示である。使用者が画像読込キー3を押し、文字画像が
表示された状態で、液晶タブレットである表示部2の認
識したい部分を範囲指定する。ここで、図10(a)に
示すように「登録特許 第1234567号」30と表
示された部分を範囲指定した場合、この範囲内で文字の
切り出し作業を行う。
【0089】次に、切り出した文字サイズと漢字文字サ
イズを比較し、切り出した文字のサイズのほうが小さい
ため、後に説明するズーム機構部9を駆動して図10
(b)のように対象文字画像を拡大する。
【0090】また、ここでは比較対象の文字サイズを漢
字サイズとしているが、使用者が任意に設定し、これに
合わせた対象文字画像の拡大を行う方法もある。
【0091】以上の処理を図2のブロック図をもとに説
明する。
【0092】レンズ部8で光を結像し、後に説明を行う
ズーム機構部9により任意に拡大し、CCD10の撮像
面部に被写体像を投影する。CCD10ではズーム機構
9を介して、レンズ部8から投影された光をアナログ信
号に変換して、増幅器11により増幅して、このアナロ
グ信号をA/D変換器12に出力する。A/D変換器1
2によりデジタル信号に変換された画像信号は、1フレ
ーム記憶部13に一旦保存され、使用者によって範囲指
定された部分のみ文字切り出し部14に出力される。
【0093】文字切り出し部14では上記に述べた文字
切り出し方法により文字表示領域を切り出し、この切り
出した文字の情報をサイズ判断部15に出力する。サイ
ズ判断部15では、サイズ記憶部16に予め記憶してい
る基準となる文字サイズと、文字切り出し部14より入
力された文字情報の文字サイズとを比較し、基準文字サ
イズよりも、切り出した文字サイズの方が大きければ、
OK側の制御線を通して合成部17に切り出した文字情
報を出力する。
【0094】サイズ記憶部16には英数字であれば認識
可能なサイズ(例えば8×8ドット)を記憶している英
数サイズ記憶部16−1、平仮名や片仮名であれば認識
可能な文字サイズ(例えば16×16ドット)を記憶し
ているひらがなサイズ記憶部16−2、漢字を認識可能
な文字サイズ(例えば64×64ドット)を記憶してい
る漢字サイズ記憶部16−3が含まれている。
【0095】次に、サイズ判断部15でサイズ記憶部1
6に予め記憶している基準となる文字サイズと、文字切
り出し部14より入力された文字情報の文字サイズとを
比較した結果、切り出した文字サイズよりも基準文字サ
イズの方が大きければ、NG側の制御線を通してスイッ
チ部25に拡大要求信号を出力する。
【0096】また、サイズ判断部15からはモード指示
部24に信号が出力され、ここからスイッチ部25を導
通させる。スイッチ部25がONになれば、モータ部2
6によりズーム機構部9を駆動させ、レンズ部8から読
み取る画像を拡大させ、使用者が設定した文字サイズで
認識を行うことができる。
【0097】ここで、使用者が記憶指示キー4を押す
と、スイッチ部23から制御部22に信号が出力され、
記憶部18に表示部2の文字画像を記憶する。
【0098】以上の処理を図11のフローチャート図を
もとに説明する。まず、STEP41で使用者が画像取
込キー3を押したときの画像を読み込み、STEP42
で読み込んだ画像を表示する。STEP43では使用者
が表示された画面の中で認識したい部分を画面上に設け
られたタブレット等を用いて範囲指定し、STEP44
でこの指定範囲中の文字画像から文字の切り出しを行
う。
【0099】STEP45では切り出した文字が認識可
能なサイズを、サイズ判断部15で判断、選択し、ST
EP46で選択したサイズを認識時の基準サイズとして
サイズ記憶部16に設定する。
【0100】次に、STEP47で切り出した文字のサ
イズを取り込み、STEP48で取り込んだ文字サイズ
がSTEP46で設定された基準サイズと同じかあるい
は大きいかを比較することで、認識可能なサイズである
かを判断する。
【0101】切り出した文字サイズが認識可能サイズで
あれば、STEP50に進み、切り出した文字が認識不
可能な文字であればSTEP49でモータ部26により
ズーム機構部9を駆動し読み込む文字画像を拡大撮影す
る。
【0102】次に、STEP50で切り出した文字全部
に対して判断を行ったかどうかを調べ、全部判断し終わ
っていればSTEP51に進み、全部判断し終わってい
なければ、STEP47に戻って読み込んだ画像全部を
英数サイズであるかどうか調べ終わるまでSTEP47
からSTEP50の処理を繰り返す。
【0103】次のSTEP51では読み込んだ画像を記
憶するかどうかを使用者に判断させ、使用者が画像を記
憶すると指示した場合には、STEP52で読み込んだ
画像を記憶する。
【0104】従って、使用者が認識したい文字が読み込
んだ状態では認識不可能であれば、自動的に使用者の望
む認識サイズまで拡大することができる。
【0105】以上の説明にて記憶部18に記憶された文
字画像は後に認識部19により、認識データ20のデー
タと比較され文字認識されることになる。また、文字切
り出し等の認識に必要な部分は上記にて説明した文字切
り出し部14を共通に使用すれば良い。
【0106】
【発明の効果】本発明によれば、請求項1記載の発明で
は、文字画像の大きさが認識できないものであれば、使
用者に対してその旨を報知するので、読み込んだ文字画
像が認識可能かどうかを使用者が簡単に判断することが
できる。
【0107】また、請求項2記載の発明では、切り取っ
た文字画像がどの文字の種類のサイズに該当するかを報
知するので、認識したい文字画像が認識可能かどうかを
使用者が判断することができる。
【0108】また、請求項3記載の発明では、切り取っ
た文字画像より、文字の種類毎の認識可能なサイズに相
当する文字画像を抽出し、報知するので、認識したい文
字画像が認識可能かどうかを使用者が判断することがで
きる。
【0109】また、請求項4記載の発明では、切り取っ
た文字画像の大きさが認識可能なサイズではない場合
に、その文字画像を認識可能なサイズに拡大するので、
同じ文字画像の読み込みを繰り返し行うことなしに、必
要となる文字画像の認識を行うことができる。
【図面の簡単な説明】
【図1】本発明を採用した装置の外観斜視図である。
【図2】本発明を採用した装置のブロック図である。
【図3】実施例1の表示画面例を示す図である。
【図4】実施例1の処理のフローチャート図である。
【図5】実施例2の表示画面例を示す図である。
【図6】実施例2の表示画面例を示す図である。
【図7】実施例2の処理のフローチャート図である。
【図8】実施例3の表示画面例を示す図である。
【図9】実施例3の処理のフローチャート図である。
【図10】実施例4の表示画面例を示す図である。
【図11】実施例4の処理のフローチャート図である。
【符号の説明】
1 本体キャビネット部 2 表示部 3 画像取込キー 4 記憶指示キー 5 電源スイッチ 6 CCDカメラ部 7 把持部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 撮像手段により得られた画像を認識手段
    により文字として認識する文字認識装置であって、 前記撮像手段により得られた画像から文字画像を切り取
    る切取手段と、 前記切取手段にて切り取った文字画像の大きさが認識可
    能なサイズであるか否かを判断する判断手段と、 前記判断手段にて文字画像の大きさが認識可能なサイズ
    に満たないと判断した場合に、認識不可能の旨を報知す
    る報知手段とを具備することを特徴とする文字認識装
    置。
  2. 【請求項2】 撮像手段により得られた画像を認識手段
    により文字として認識する文字認識装置であって、 前記撮像手段により得られた画像から文字画像を切り取
    る切取手段と、 文字の種類毎に認識可能なサイズを記憶する記憶手段
    と、 前記切取手段にて切り取った文字画像の大きさが前記記
    憶手段に記憶されたどの文字の種類の認識可能なサイズ
    に該当するかを判断する判断手段と、 前記判断手段にて判断した認識可能なサイズの文字の種
    類を報知する報知手段とを具備することを特徴とする文
    字認識装置。
  3. 【請求項3】 撮像手段により得られた画像を認識手段
    により文字として認識する文字認識装置であって、 前記撮像手段により得られた画像から文字画像を切り取
    る切取手段と、 文字の種類毎に認識可能なサイズを記憶する記憶手段
    と、 前記切取手段にて切り取った文字画像から、前記記憶手
    段に記憶された文字の種類毎の認識可能なサイズに相当
    する大きさを有する文字画像を抽出する抽出手段と、 前記記憶手段に記憶された文字の種類毎に、前記抽出手
    段にて抽出された文字画像を認識可能なサイズとして報
    知する報知手段とを具備することを特徴とする文字認識
    装置。
  4. 【請求項4】 撮像手段により得られた画像を認識手段
    により文字として認識する文字認識装置であって、 前記撮像手段により得られた画像から文字画像を切り取
    る切取手段と、 前記切取手段にて切り取った文字画像の大きさが認識可
    能なサイズであるか否かを判断する判断手段と、 前記判断手段にて文字画像の大きさが認識可能なサイズ
    に満たないと判断した場合に、前記文字画像を認識可能
    なサイズに拡大する拡大手段とを具備することを特徴と
    する文字認識装置。
JP04833497A 1997-03-04 1997-03-04 文字認識装置 Expired - Fee Related JP3563911B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP04833497A JP3563911B2 (ja) 1997-03-04 1997-03-04 文字認識装置
EP98103642A EP0863475B1 (en) 1997-03-04 1998-03-02 Character recognition device
DE69834971T DE69834971T2 (de) 1997-03-04 1998-03-02 Zeichenerkennungsvorrichtung
US09/033,671 US6252984B1 (en) 1997-03-04 1998-03-03 Character recognition device
CN98106466A CN1110008C (zh) 1997-03-04 1998-03-04 字符识别设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04833497A JP3563911B2 (ja) 1997-03-04 1997-03-04 文字認識装置

Publications (2)

Publication Number Publication Date
JPH10247220A true JPH10247220A (ja) 1998-09-14
JP3563911B2 JP3563911B2 (ja) 2004-09-08

Family

ID=12800524

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04833497A Expired - Fee Related JP3563911B2 (ja) 1997-03-04 1997-03-04 文字認識装置

Country Status (5)

Country Link
US (1) US6252984B1 (ja)
EP (1) EP0863475B1 (ja)
JP (1) JP3563911B2 (ja)
CN (1) CN1110008C (ja)
DE (1) DE69834971T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002543536A (ja) * 1999-04-29 2002-12-17 インテル・コーポレーション テキストを含むファイルを作成するための電子カメラの使用
KR101329492B1 (ko) * 2012-01-25 2013-11-13 한국과학기술원 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1288663C (zh) * 1999-05-28 2006-12-06 松下电器产业株式会社 把数据记录在半导体存储卡上的记录装置以及重放装置
JP3554271B2 (ja) * 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
US6721452B2 (en) 2001-09-12 2004-04-13 Auburn University System and method of handwritten character recognition
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
KR100474312B1 (ko) * 2002-12-12 2005-03-10 엘지전자 주식회사 디지털 카메라의 자동 주밍 방법
KR20040069865A (ko) * 2003-01-30 2004-08-06 삼성전자주식회사 영상화면 내의 글자영역 확장장치 및 방법
US8873890B2 (en) * 2004-04-02 2014-10-28 K-Nfb Reading Technology, Inc. Image resizing for optical character recognition in portable reading machine
CN101354746B (zh) * 2007-07-23 2011-08-31 夏普株式会社 文字图像抽出装置及文字图像抽出方法
US9286683B1 (en) * 2013-04-17 2016-03-15 Amazon Technologies, Inc. Text detection near display screen edge
JP5821994B2 (ja) 2014-04-21 2015-11-24 富士ゼロックス株式会社 画像処理装置、画像形成装置およびプログラム
US9239961B1 (en) * 2014-09-24 2016-01-19 Amazon Technologies, Inc. Text recognition near an edge
JP6448696B2 (ja) * 2017-03-22 2019-01-09 株式会社東芝 情報処理装置、方法及びプログラム
CN115862016A (zh) * 2023-02-16 2023-03-28 金现代信息产业股份有限公司 一种小尺寸光学字符识别方法及***

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5966275A (ja) * 1982-10-08 1984-04-14 Hitachi Denshi Ltd テレビジヨンカメラ
US4741045A (en) * 1983-09-23 1988-04-26 Dest Corporation Optical character isolation system, apparatus and method
JPS6280791A (ja) 1985-10-04 1987-04-14 Toshiba Corp 文字読取り装置
EP0457534B1 (en) * 1990-05-14 2001-10-31 Canon Kabushiki Kaisha Image processing method and apparatus
JPH0674729A (ja) 1992-08-25 1994-03-18 Nippon Steel Corp 文字画像入力方法
EP0981243B1 (en) * 1993-07-16 2010-03-17 Sharp Kabushiki Kaisha Image processor
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JPH07288722A (ja) * 1994-04-15 1995-10-31 Canon Inc 撮像装置
JP3095623B2 (ja) * 1994-06-16 2000-10-10 松下電器産業株式会社 属性判定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002543536A (ja) * 1999-04-29 2002-12-17 インテル・コーポレーション テキストを含むファイルを作成するための電子カメラの使用
KR101329492B1 (ko) * 2012-01-25 2013-11-13 한국과학기술원 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법

Also Published As

Publication number Publication date
DE69834971D1 (de) 2006-08-03
EP0863475B1 (en) 2006-06-21
US6252984B1 (en) 2001-06-26
CN1110008C (zh) 2003-05-28
JP3563911B2 (ja) 2004-09-08
CN1201954A (zh) 1998-12-16
EP0863475A3 (en) 2001-02-07
EP0863475A2 (en) 1998-09-09
DE69834971T2 (de) 2007-02-01

Similar Documents

Publication Publication Date Title
JP3563911B2 (ja) 文字認識装置
JP4605458B2 (ja) 画像処理装置及び画像処理プログラム
EP2196943A1 (en) Image capturing apparatus and face area detecting method
JP4663700B2 (ja) 撮影装置、及び撮影方法
JP2006293782A (ja) 画像処理装置及び画像処理プログラム
JP2006293783A (ja) 画像処理装置及び画像処理プログラム
JP2007310813A (ja) 画像検索装置およびカメラ
JP2004023158A (ja) 画像撮像装置
JP5604285B2 (ja) 撮像装置
EP1668885B1 (en) Camera, computer, projector and image processing for projecting a size-adjusted image
EP0678822B1 (en) Image pick-up apparatus
JP2005323015A (ja) デジタルカメラ
JP4371219B2 (ja) デジタルカメラ
KR100816949B1 (ko) 최적상태 촬상 전자카메라
JP2001169169A (ja) 自動追尾装置
JP2002298078A (ja) 文字表示装置、その制御方法、記録媒体およびプログラム
JP2005159708A (ja) デジタルカメラ及び画像処理装置
JP2003216893A (ja) カメラ付携帯情報端末
JP4098889B2 (ja) 電子カメラおよびその動作制御方法
JP2005223660A (ja) デジタルカメラ
JP2006109005A (ja) 画像出力装置および撮像装置
JP4407301B2 (ja) デジタルカメラ
JP2000292834A (ja) 顔画像撮影装置および顔画像撮影方法
JP2004005535A (ja) 文字表示装置、その制御方法、記録媒体およびプログラム
US20220360704A1 (en) Display method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040511

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040604

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090611

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100611

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100611

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110611

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120611

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120611

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees