JPH08106510A - 文字読取り装置及び文字認識装置 - Google Patents

文字読取り装置及び文字認識装置

Info

Publication number
JPH08106510A
JPH08106510A JP6241052A JP24105294A JPH08106510A JP H08106510 A JPH08106510 A JP H08106510A JP 6241052 A JP6241052 A JP 6241052A JP 24105294 A JP24105294 A JP 24105294A JP H08106510 A JPH08106510 A JP H08106510A
Authority
JP
Japan
Prior art keywords
image
lens
character
image pickup
focal length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6241052A
Other languages
English (en)
Inventor
Kimiyasu Mifuji
仁保 美藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP6241052A priority Critical patent/JPH08106510A/ja
Publication of JPH08106510A publication Critical patent/JPH08106510A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Lenses (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】読取り対象となる文字の大きさに関係なく常に
高い認識率で迅速に文字認識処理を実行する。 【構成】複数の焦点距離を有するズームレンズ24とエリ
アCCD21とを有して対象となる画像を撮像する撮像部
と、この撮像部で得た画像中の特定位置にある文字列画
像に対応して上記ズームレンズ24の焦点距離を可変設定
させてから画像を再度撮像させるDSP11とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を有する画像を撮
像してその画像中の文字を認識する文字読取り装置及び
文字認識装置に関する。
【0002】
【従来の技術】従来より、撮像した画像中の文字列を抽
出して、文字認識処理を行なうことで文字情報を得るO
CR(光学式文字読取り装置)が広く普及している。こ
の種の装置では、画像を取込む範囲が一定であり、取込
んだ画像中の文字の大きさに関係なく文字の切出し及び
切出した文字の認識を行なうようになっていた。
【0003】
【発明が解決しようとする課題】上述した如く一定の範
囲で取込んだ画像に対して文字の読取りを実施するた
め、画像中の文字が大きい場合を想定して予め取込む範
囲を大きく設定しており、不要な部分まで取込んでしま
うことで画像記憶用のメモリを無駄に使用し、演算処理
時間が長くなってしまうなどの不具合がある。また、特
に画像中の文字が小さい場合には、分解能が低下して
「かすれ」や「潰れ」と称される読取り上の不備が生じ
易く、そのために認識率も低下してしまうこととなる。
【0004】本発明は上記のような実情に鑑みてなされ
たもので、その目的とするところは、読取り対象となる
文字の大きさに関係なく常に高い認識率で迅速に文字認
識処理を実行することが可能な文字読取り装置及び文字
認識装置を提供することにある。
【0005】
【課題を解決するための手段】すなわち本発明は、複数
の焦点距離を有する例えばズームレンズからなるレンズ
と固体撮像素子とを有し、対象となる画像を撮像する撮
像部に対し、この撮像部で得た画像中の特定位置にある
文字列画像に対応して上記ズームレンズの焦点距離を可
変設定させてから画像を再度撮像させるようにしたもの
である。
【0006】
【作用】上記のような構成とすることにより、読取り対
象となる文字の大きさに対応して常に高い認識率で迅速
に文字認識処理を実行することが可能となる。
【0007】
【実施例】以下図面を参照して本発明の一実施例を説明
する。図1はその機能回路構成を示すもので、11が全体
の動作制御を行なうDSP(Digital Sign
al Processor)である。このDSP11は、
パルスジェネレータ(PG)12から供される動作クロッ
クに従ってインストラクションROM13から順次動作イ
ンストラクションを読出すことでシステムバス14に接続
された各回路に対する制御を実行する。
【0008】システムバス14には、制御途中での各種デ
ータを一時的に記憶保持するワークRAM15、読取った
文字を認識する文字認識用のプログラムを記憶した認識
用ROM16、認識された文字列により単語を検索するた
めの辞書ROM17、使用者に対する操作内容や文字の認
識結果、辞書の検索結果等を表示するLCD表示部18、
指示操作を行なうための各種キーを備えたキー入力部1
9、取込んだ画像を記憶する画像RAM20、固体撮像素
子であるエリアCCD21にクロック、信号を送出して駆
動するCCDドライバ22、このCCDドライバ22に駆動
されるエリアCCD21で取込んだアナログの画像データ
をCCDドライバ22からのクロックによりサンプリン
グ、A/D変換する画像信号処理回路23、上記エリアC
CD21へ原稿面の画像を入射するための光学系部材から
なるズームレンズ24を駆動してその焦点距離を連続的に
可変する駆動モータ25を制御するモータドライバ26、原
稿面を照明するべく設けられたLEDアレー27a,27b
を点灯駆動するLEDドライバ28が接続される。
【0009】次いで上記実施例の動作について説明す
る。図2及び図3は画像の取込みから認識結果の表示に
至るまでの一連の処理内容を例示するもので、その動作
制御は主としてDSP11が行なう。
【0010】しかるに、処理当初にはまずキー入力部19
に設けられる画像の取込みを指示する取込みキーが操作
されるのを待機する(ステップS01)。すなわち該取込
みキーは、上記エリアCCD21、ズームレンズ24、駆動
モータ25及びLEDアレー27a,27bよりなる画像取込
みを行なうスキャナ部を画像取込みの対象となる原稿面
に当接した状態で取込みを開始させるべく操作するもの
である。
【0011】この取込みキーが操作されたと判断すると
DSP11は、LEDドライバ28によりLEDアレー27
a,27bを点灯駆動させると同時にCCDドライバ22に
よりエリアCCD21を駆動させて1画面分の画像データ
を取込ませる(ステップS02)。このときズームレンズ
24の焦点距離は、モータドライバ26の制御に基づいた駆
動モータ25の駆動により例えば中間(標準)位置に設定
されるものとする。
【0012】エリアCCD21で取込まれた1画面分の画
像データはCCDドライバ22の駆動クロックに同期して
順次画像信号処理回路23でデジタル化(2値化)され、
画像RAM20に記憶される。図4(a)はこうして画像
RAM20に取込まれた画像データを例示するもので、画
像を構成する各点画素は白黒2値化されている。
【0013】画像の取込みが終了すると、DSP11は画
像RAM20に記憶されている画像データの横方向の黒点
分布を求めて行切出しを行なう(ステップS03)。図4
(b)はこうして行切出しが行なわれた画像データを例
示するものであり、図中にハッチングで示す領域が切出
された行領域である。
【0014】その後、行切出しができたか否か判断する
もので(ステップS04)、上記図4(b)に示した如く
行切出しができた場合には問題ないが、できなかった場
合には、ズームレンズ24によりズームアップし過ぎた状
態であることとなるので、モータドライバ26によって駆
動モータ25でズームレンズ24をより広角の側に一定幅だ
け駆動(ズームダウン)させ(ステップS05)、再度上
記ステップS02の画像取込みからやり直させる。
【0015】図5(A)はズームレンズ24を広角側に駆
動した場合の光学系の状態を例示するもので、31が画像
取込みの対象となる原稿面である。図からも、取込む対
象の範囲が広くなっていることが分かる。
【0016】こうして行切出しのなされた画像データを
得ると、次いでさらにその切出された各行領域に対して
縦方向の黒点分布を求めて単語切出しを行なう(ステッ
プS06)。図4(c)はこうして単語切出しが行なわれ
た画像データを例示するものであり、図中にハッチング
で示す領域が切出された単語領域である。
【0017】その後、単語切出しができたか否か判断す
るもので(ステップS07)、上記図4(c)に示した如
く単語切出しができた場合には問題ないが、できなかっ
た場合には、ズームレンズ24によりズームアップし過ぎ
た状態であることとなるので、さらにモータドライバ26
によって駆動モータ25でズームレンズ24をより広角の側
に一定幅だけ駆動(ズームダウン)させ(ステップS0
5)、再度上記ステップS02の画像取込みからやり直さ
せる。
【0018】こうして単語切出しのなされた画像データ
を得ると、次いで画像の中心から一番近い位置にある単
語領域(ここでは「freedom」)を目的単語と
し、その4隅の座標から、読取り範囲をはみ出さずに最
大となるズーム率を計算する(ステップS08)。
【0019】この場合、読取り範囲の縦横比と目的単語
領域の縦横比とを比較し、目的単語領域の方が横長であ
れば目的単語領域の横方向の座標を基準として、縦長で
あれば目的単語領域の縦方向の座標を基準としてズーム
率が算出される。
【0020】次いで、算出したズーム率が現在駆動中の
ズームレンズ24のズーム率と同じであるか否かにより、
ズームレンズ24のズーム位置がそのままでよいか否か判
断する(ステップS09)。
【0021】算出したズーム率が現在駆動中のズームレ
ンズ24のズーム率と偶然にも同じであった場合には問題
ないが、異なった場合には上記算出したズーム率となる
ようにモータドライバ26によって駆動モータ25でズーム
レンズ24をより望遠側に駆動(ズームアップ)させ(ス
テップS10)、目的単語の領域が読取り範囲をはみ出さ
ずに最大となるように位置させた状態で再度LEDドラ
イバ28によりLEDアレー27a,27bを点灯駆動させる
と同時にCCDドライバ22によりエリアCCD21を駆動
させて1画面分の画像データを取込ませる(ステップS
11)。
【0022】エリアCCD21で取込まれた1画面分の画
像データは順次画像信号処理回路23でデジタル化され、
画像RAM20に記憶される。図4(d)はこうして画像
RAM20に取込まれた目的単語の領域を含む画像データ
を例示するものである。この場合には、目的単語「fr
eedom」の縦横比と読取り範囲の縦横比とを比較し
た結果、目的単語領域の方が横長であるために目的単語
領域の横方向の座標を基準としてズーム率が算出された
ことにより、目的単語「freedom」の下側に位置
する単語「economic」中の「i」の一部と「f
actors.」の「f」の一部とが目的単語「fre
edom」と共に取込まれていることが分かる。
【0023】画像の取込みが終了すると、DSP11は画
像RAM20に記憶されている目的単語の領域を含む画像
データの横方向の黒点分布を求めて行切出しを行ない
(ステップS12)、それからズーム率に応じた傾き補正
のための傾き角を算出する(ステップS13)。
【0024】その後、続けて切出された行領域に対して
縦方向の黒点分布を求めて単語切出しを行ない(ステッ
プS14)、さらに上記算出した傾き角を用いて単語領域
画像に対する傾き補正を実行する(ステップS15)。
【0025】次いで、得られた傾き補正がなされた単語
領域の画像データを文字切出しにより各文字一つ一つに
分解し(ステップS16)、各文字のパラメータ抽出を行
なった後に(ステップS17)、認識用ROM16に記憶さ
れるプログラムに従って文字認識を行なう(ステップS
18)。
【0026】そして、認識の結果得られたそれぞれ最も
類似度が高い文字からなる文字列を用いて辞書ROM17
を検索し(ステップS19)、その検索結果を表示データ
化してLCD表示部18で表示出力させ(ステップS2
0)、以上でこの一連の処理を終了して、再び次の操作
待ち状態(上記ステップS01)に移行する。
【0027】ここでは、認識の結果得られたそれぞれ最
も類似度が高い文字として「f」「r」「e」「e」
「d」「o」「m」が得られ、その文字列を用いて辞書
ROM17を検索した結果、単語「freedom」とそ
の語意がLCD表示部18で表示されることとなるものと
する。
【0028】なお、上記実施例では、エリアCCD21で
撮像される画像の焦点距離を連続的に可変するレンズと
してズームレンズ24を用い、モータドライバ26の制御の
下に駆動モータ25で駆動するものとしたが、これに限ら
ず、ズームレンズ24の代わりに焦点距離を選択的に切換
える例えば2焦点レンズを、駆動モータ25の代わりにソ
レノイドを、モータドライバ26の代わりにソレノイドド
ライバをそれぞれ用いることで、それほど高い認識率の
認識結果を得ることはできなくなるが、その反面、構成
及び制御方法がより単純となるため、コストをより安価
とすることができると共に、高速処理が可能となる。
【0029】
【発明の効果】以上詳記した如く本発明によれば、読取
り対象となる文字の大きさに対応して常に高い認識率で
迅速に文字認識処理を実行することが可能な文字読取り
装置及び文字認識装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る機能回路構成を示すブ
ロック図。
【図2】同実施例に係る動作処理内容を示すフローチャ
ート。
【図3】同実施例に係る動作処理内容を示すフローチャ
ート。
【図4】同実施例に係る動作を説明するための図。
【図5】同実施例に係る動作を説明するための図。
【符号の説明】
11…DSP、12…パルスジェネレータ(PG)、13…イ
ンストラクションROM、14…システムバス、15…ワー
クRAM、16…認識用ROM、17…辞書ROM、18…L
CD表示部、19…キー入力部、20…画像RAM、21…エ
リアCCD、22…CCDドライバ、23…画像信号処理回
路、24…ズームレンズ、25…駆動モータ、26…モータド
ライバ、27a,27b…LEDアレー、28…LEDドライ
バ、31…原稿面。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数の焦点距離を有するレンズと固体撮
    像素子とを有し、対象となる画像を撮像する撮像手段
    と、 この撮像手段で得た画像中の特定位置にある文字列画像
    に対応して上記撮像画像のレンズの焦点距離を可変設定
    する設定手段と、 この設定手段でレンズの焦点距離を可変設定された上記
    撮像手段により画像を再度撮像させる制御手段とを具備
    したことを特徴とする文字読取り装置。
  2. 【請求項2】 上記撮像手段のレンズはズームレンズか
    らなり、上記設定手段はズームレンズの焦点距離を連続
    的に可変設定することを特徴とする請求項1記載の文字
    読取り装置。
  3. 【請求項3】 上記撮像手段のレンズは多焦点レンズか
    らなり、上記設定手段は多焦点レンズの焦点距離をいず
    れか一つに選択的に可変設定することを特徴とする請求
    項1記載の文字読取り装置。
  4. 【請求項4】 複数の焦点距離を有するレンズと固体撮
    像素子とを有し、対象となる画像を撮像する撮像手段
    と、 この撮像手段で得た画像中の特定位置にある文字列画像
    に対応して上記撮像画像のレンズの焦点距離を可変設定
    する設定手段と、 この設定手段でレンズの焦点距離を可変設定された上記
    撮像手段により画像を再度撮像させる制御手段と、 この制御手段で得られた画像中の文字列画像を用いて文
    字認識を行なう文字認識手段と、 この文字認識手段で得た認識結果を出力する出力手段と
    を具備したことを特徴とする文字認識装置。
  5. 【請求項5】 上記撮像手段のレンズはズームレンズか
    らなり、上記設定手段はズームレンズの焦点距離を連続
    的に可変設定することを特徴とする請求項4記載の文字
    認識装置。
  6. 【請求項6】 上記撮像手段のレンズは多焦点レンズか
    らなり、上記設定手段は多焦点レンズの焦点距離をいず
    れか一つに選択的に可変設定することを特徴とする請求
    項4記載の文字認識装置。
JP6241052A 1994-10-05 1994-10-05 文字読取り装置及び文字認識装置 Pending JPH08106510A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6241052A JPH08106510A (ja) 1994-10-05 1994-10-05 文字読取り装置及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6241052A JPH08106510A (ja) 1994-10-05 1994-10-05 文字読取り装置及び文字認識装置

Publications (1)

Publication Number Publication Date
JPH08106510A true JPH08106510A (ja) 1996-04-23

Family

ID=17068600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6241052A Pending JPH08106510A (ja) 1994-10-05 1994-10-05 文字読取り装置及び文字認識装置

Country Status (1)

Country Link
JP (1) JPH08106510A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102238368A (zh) * 2010-04-28 2011-11-09 长春博鸿电子科技公司(普通合伙) 一种多模式多目一体化智能相机
KR101329492B1 (ko) * 2012-01-25 2013-11-13 한국과학기술원 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법
JP2015537325A (ja) * 2012-12-13 2015-12-24 クアルコム,インコーポレイテッド Ocrを向上させるためのテキスト画質ベースのフィードバック

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102238368A (zh) * 2010-04-28 2011-11-09 长春博鸿电子科技公司(普通合伙) 一种多模式多目一体化智能相机
KR101329492B1 (ko) * 2012-01-25 2013-11-13 한국과학기술원 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법
JP2015537325A (ja) * 2012-12-13 2015-12-24 クアルコム,インコーポレイテッド Ocrを向上させるためのテキスト画質ベースのフィードバック

Similar Documents

Publication Publication Date Title
USRE42234E1 (en) Multiple non-directional scanning
EP0113086B1 (en) Image data processing system
JP3660943B2 (ja) 画像検索装置および画像検索方法
US6252984B1 (en) Character recognition device
JPH11103380A (ja) 画像読み取り装置
JPH08106510A (ja) 文字読取り装置及び文字認識装置
US6028966A (en) Image reading apparatus and method including pre-scanning
JP3674633B2 (ja) 画像検索装置、電子スチルカメラ、および画像検索方法
EP0660584B1 (en) Image processing method and apparatus
JPH0836583A (ja) 画像検索装置
JP4164976B2 (ja) 文字認識装置
JP3582984B2 (ja) 画像状態検出装置及びそれを利用した文書画像補正装置
JPH06303388A (ja) 画像読取装置
JP2001256491A (ja) 画像切り抜き装置及び方法並びに画像切り抜きプログラムを記録した記録媒体
JP2790276B2 (ja) 文字読取装置
JPH1063870A (ja) 画像読取方法及び画像読取装置
JPS5932065A (ja) 文字読取装置
JP2926710B2 (ja) 画像処理装置
JP2002162558A (ja) 焦点調節方法および装置
EP0428795A1 (en) Binary image thinning and feature extracting method and processing device thereof
JP2004103038A (ja) 画像処理装置
JPH07120386B2 (ja) 文字認識装置
JPH07170436A (ja) 画像入力装置
JPS63116282A (ja) 画像入力付きocr
JPH0865467A (ja) イメージスキャナー