JPS5949671A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS5949671A
JPS5949671A JP57161209A JP16120982A JPS5949671A JP S5949671 A JPS5949671 A JP S5949671A JP 57161209 A JP57161209 A JP 57161209A JP 16120982 A JP16120982 A JP 16120982A JP S5949671 A JPS5949671 A JP S5949671A
Authority
JP
Japan
Prior art keywords
character
line
scanning pattern
character line
image information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57161209A
Other languages
English (en)
Other versions
JPH0373916B2 (ja
Inventor
Hiromi Nanba
難波 広海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP57161209A priority Critical patent/JPS5949671A/ja
Publication of JPS5949671A publication Critical patent/JPS5949671A/ja
Publication of JPH0373916B2 publication Critical patent/JPH0373916B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は1文字認識機能、t6よびイメージ処理機能
の両番を何する光学的文字読取装ji’+’: l1関
する。
〔発明の技術的背景とその問題点〕
近年、光学的X字読取装置(以下(JCI(と称する)
には0本来のOCR機能である文字5忍識わx ii@
とファクシミリ機能等す」イメージji’i報を処理す
る機能の両者を有するものがある。このようなOCRは
1例えば文字情報とイメージ情報が混在する帳票に対し
て1文字情報については認識してコード化情報としてコ
ンピュータ等へ出力する。また、イメージ(画像)情報
(認識する必典がなく画像として取1)扱う文字を含む
)(一ついては、非コード化(データ圧縮のためのコー
ド化は除く)イメージ情報としてコンピュータ等へ出力
する。
ところで、上記のようなOCRでは、帳票上のに、−・
取るべき文字情報およびイメージ処理すべきイメージ情
報の両者の位置情報をフォーマットコントロール情報と
して予め記憶しておく必要がある。すf(わち、上記の
ようなフォーマットコントロール情報C′−基づいて、
L)CRは帳票に対して文字情報またはイメージ情報の
処理を行なうことになる−したがって、このような従来
のucRでは、同一フォーマットの帳票を多量に処理す
る場合には有効であるが、各帳票についてフォーマット
が異なる場合g二は処理する〔発明の目的〕 この発明は上記の事情を鑑みてなされたもので、帳票上
の情報が文字情報またはイメージ情報であるかを自動識
別することにより、特別のフォーマット情報等を必要と
せずに、1ハ)単な4・ψ作で文字認識処理またはイメ
ージ情報処理を確実に行なうことができる光学的読取装
w′5を提供することを目的とする。
〔発明の概要〕
すなわち、この発明においては、帳票上の文字またはイ
メージ情報を走査して得られる走査パターンC:対して
1文字行判定手段にょl)文字行であるか否かを判定す
る−この判定結果に基づいて1文字行であれは文字認識
手段Cおいて上記走査パターンの文字認識処理を行なう
。また1判定結果が文字行でない場合(二はイメージ情
報として判定し、上記走査パターンに対してイメージ情
報処理手段でイメージ情報処理を行なうものである。
〔発明の実施例〕
以下図面なt照してこの発明の一実施例について説明す
る・第1因はこの発明に係るOCRの構成を示すブロク
、り図である◎第1図において、lは走貴部で用紙(以
下帳票と称する)(二記入された文字またはイメージ(
画(2)情報を光学的に走査し、電気イハ号g:変換し
走査パターンとして出力する・この走査部lからの走査
パターンは、記憶回路であるラインバッファメモリ2に
格納される◎このラインバッファメモリ2は1通常主走
査方回と副走査方間c二対応する2個のアドレスカウン
タを有し、主走査方向には帳票の横幅以上の記憶容量お
よび副走査方向(−は帳票の文字行の1行分以上の記憶
容量を有している。また、上記走査パターンは1例えば
走査部lから行射影作成回路3にも入力される。
この行射影作成回路3は、第2b(A)に示すような帳
票10上の文字情報itaおよびイメージ情報11bを
走査して得た走査パターンにおいて主疋査万同(矢印J
2)の黒ピット数をカウントして行射影のヒストグラム
(第21の)に示す)を形成する。さらに、この行射影
のヒストグラムC二対して一定値でスライスした2値化
行射影(第2因(Oに示す)を形成する。この場合。
または白ライン(文字情報JIBおよびイメー   潤
一定価は帳票lOの主走査方向のラインが黒ライン(文
字情報lipまたはイメージ情+n7Jb)ジ情報11
bの両者とも無記入)かを判定できる値である◎そして
、ラインバッファメモリ2に格納された走査パターンは
、まず文字行検知回路4に入力する◎この文字行検知回
路4は。
上記走査パターンについて文字行が否かを判定する@こ
の場合1文字行検知回路4は1例えは行射影作成回路3
で作成された2値化行射影に基づいて判定する◎この文
字行検知回路4Iユおいて走査パターンが文字行である
と判定された場合、走査パターンはラインバッファメモ
リ2から又字認識回路5に入力し1文字認識処理かなさ
れる・また、走査パターンが文字行でないと判定された
場合、走査パターンはイ−メージデ−夕作成回路6(二
人力する。このイメージデータ作成回路6は、データ圧
縮処理等を行なって。
走査パターンをイメージデータ(−変換するロモして0
文字認識回路5およびイメージデータ作成回路6カ各出
力データは、データ編集回路7に入力する。このデータ
編集回路1は1文字行検知回路4からの制御信号にに、
じて、予め設定されたフォーマット等に基づいたデータ
編集を行なった後出力インターフェース8を介して外部
(例えはホストコンピュータ)へ出力するOこのような
構成≦二おいて、その動作を説明する。走−Pr、部ノ
は、 l’z11えは第2図(A)に示すような帳票I
O+:対して文字行方向(矢印22)に主走査および文
字行と面角な方向に副走査を行なって、その定食パター
ンを順次ラインバッファメモリ2に書込むOラインバッ
ファメモリ2は。
上記のような主走査および副走査アドレスカウンタによ
IJ 、常に一定幅(通常は文字行1行分(二相当する
)の連続した走査パターンを格納する。そして1文字行
検知回路4は、上記走査ノ(ターンf二ついて文字行で
あるか否かを判定する。
この場合1文字行検知回路4は6例えば上記のような第
2図(Q−二ポす2値化行射影(行射影作成回路3で作
成される)に基づいて、黒ラインの幅VV1が帳票10
のスキュー(傾き)を含めて1行分の幅であり、さらに
一定幅W1以上の白ラインが続く場合にはその走査パタ
ーンを文字行(文字情報tta)と判定する。したがっ
て、上記の条件の範囲外の黒ラインの場合には走査パタ
ーンをイメージパターンJlbと判定する。このような
文字行検知回路4の判定結果i二基づいて1文字行と判
定した場合、走査パターンは文字認識回路5 Cおいて
文字認識処理が行なわれる◎また。上記判定結果が文字
行でない、すなわちイメージ情報llbと判定した場合
、走査パターンはイメージデータ作成回路6で上記のよ
うなイメージ情報処理がなされてイメージデータと1て
出力される。この場合、イメージパターンjibの終端
を検知する必要がある。この検知方法は1例えば第2図
(C1lニボす2値化行射影内で白ラインが一定イ1@
以上出現した場合にイメージパターンllbの終端と検
知する方法である。具体的(二は1文字行検知回路4が
上記のような検知を行なって、その検知結果C二基づい
て、データ輛集回路7のデータ堀集処珪を制御すれはよ
い。また、一定ピツチ毎(−1文字検出処理を行なって
文字が検知された場合。
イメージ情報77bの終端と検知する方法でもよい〇 ところで、上記のように文字行検知回路4で。
走査パターンを文字行であるか否かを判定する場合、そ
の利足方法は行射影作成回路3により作成される2値化
行射影C:基づいて行なったが。
これに限ることなく他の方法でもよい。例えば。
第3図体)1−示すように帳系lO上の文字情報11B
とイメージ情報11bの2値化行射影の幅が同様である
場合である。この場合ζユは1文字行検知回路4は、ラ
インバッファメモ92内を走査して、走査パターンC二
対して文字と判助できるブロック2ノを検知(文字の検
出切出処理を行なう)すると、その走査パターンを文字
行(文字パターン)と判定するーまた。 第3 h(B
)に示すように、上記のように検知したブロック22が
イメージ情報llbである場合がある。
この場合には、ラインバッファメモリ2から上記ブロッ
ク21の文字(例えばA)を取出して文字認識回路5に
人力する。文字行検知回路4は1文字認識回路5の文字
認識処理OJ粘果(二基づいて上記走査パターンを文字
行と判定■る◎こ力判定方法は1例えば第3図(C) 
l二基すような各行の文字パターンllaが接近してい
る場合にも有効である。すなわち、この場合C−は、2
値化行射影はイメージ情報と同様であるため。
2値化行射影を用いた判定万θミでは判定できない口さ
らに、第3図Φ)に不すよう(二、上記のように検出し
たブロック21か文γであっても。
その打金てが文字でない場合がある。この場合には、走
査パタ7ンの1行分を文字認識回路5で文字認識処理を
行なう。文字行検知回路4は。
こ0J1行分の文字認識処理の結果に基づいて走査パタ
ーンが文字行であるが否かを判定する・このようにして
1文字およびイメージ情報が混在した帳票に対して確実
C二読取処理を行なうことができる□そして、この場合
上記のような文字行検知回路4の中11作にょI)、帳
票上の情報が文字情卸またはイメージ情報であるかを自
動識別することができる・したがって、フォーマットが
異なる帳票≦二対して特別のフォーマット情報等を必要
とせずC二極めて簡単な操作で文字認識処理またはイメ
ージ情報処理を確実に行なうことができる・ 〔発明の効果〕 以上詳述したようにこの発明によれば、帳票に対して定
食して得られる走査パターンが1文字情報またはイメー
ジ情報であるかを自動的に識別することができる口した
がって、特別のフォーマット情報等を必要とせずに、簡
単な操作でフォーマットの異なる帳票に対しても所定の
文字認識処理またはイメージ情報処理を確実C二行なう
ことができるものである◎
【図面の簡単な説明】
第1図はこの発明の一実施例に係る光学的文字読取装置
の構成を示すブロック図、@′J2図+(A)。 (H) 、 fclはその動作を説明するための1來1
.第3図(A+乃至(1))はこの発明の他の実施例に
係る光学的文字読取装置の動作を説明するため03図で
ある。 10・・・帳票、tta・・・文ギパターンS Ilb
・・・イメージパターン0 出願人代理人 弁理士 鈴 江 武 愚策1図 第2 口

Claims (1)

  1. 【特許請求の範囲】 (1)  用紙g二記入された文字またはイメージ情報
    を走査しその走査パターンを格納する記憶装置と、この
    記憶装置に格納された走査パターンに対して文字行であ
    るか否かを判定する文字行判定手段と、この文字行判定
    手段の判定結果に基づいてその判定結果が文字行である
    場合上記走査パターンの文字認識を行なう文字認識手段
    と、上記判定結果が文字行でない場合上記走査パターン
    のイメージ情報処理を行なうイメージ1n報処理手段と
    を具幽したことを特徴とする光学的文字読取装置◎ (2上記文字行判定手段において、上記走査パターンの
    行方同射影を作成する行方向射影作成手段を備えその行
    方同射影C二基づいて文字行であるか否かを判定するこ
    とを特徴とする特許h゛、求の範囲第1項記載の光学的
    文字読取装置0(3)  上記文字行判定手段において
    、上記記憶装置内Q〕上記走査パターンに対して文字の
    検出切出を行なうようC二して文字行であるか否かを判
    定下ることを特徴とする持r[5肖求の範囲第1項記載
    の光学的文字読取装置〇 (4)  上記文字行判定手段において、上記記憶装置
    内の上記走査パターン(二対してIJ2なくとも1文字
    または1行分の文字認識を行なうようにして文字行であ
    るか否かを’rJI定することを特徴とする特許請求の
    範囲第114」記載の光学的文字読取装置。
JP57161209A 1982-09-16 1982-09-16 光学的文字読取装置 Granted JPS5949671A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57161209A JPS5949671A (ja) 1982-09-16 1982-09-16 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57161209A JPS5949671A (ja) 1982-09-16 1982-09-16 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS5949671A true JPS5949671A (ja) 1984-03-22
JPH0373916B2 JPH0373916B2 (ja) 1991-11-25

Family

ID=15730672

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57161209A Granted JPS5949671A (ja) 1982-09-16 1982-09-16 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS5949671A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62139483A (ja) * 1985-12-13 1987-06-23 Nippon Telegr & Teleph Corp <Ntt> 画像検索方法
DE4004759A1 (de) * 1989-02-16 1990-09-20 Sanyo Electric Co Wasserstoffabsorbierende legierungselektrode und verfahren zur herstellung derselben
US5290509A (en) * 1990-01-22 1994-03-01 Sanyo Electric Co., Ltd. Multiphase hydrogen-absorbing alloy electrode for an alkaline storage cell
JPH08181837A (ja) * 1994-12-22 1996-07-12 Nec Corp ファクシミリ装置および画像信号の文字認識方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS559222A (en) * 1978-06-30 1980-01-23 Nec Corp Picture input unit

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS559222A (en) * 1978-06-30 1980-01-23 Nec Corp Picture input unit

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62139483A (ja) * 1985-12-13 1987-06-23 Nippon Telegr & Teleph Corp <Ntt> 画像検索方法
DE4004759A1 (de) * 1989-02-16 1990-09-20 Sanyo Electric Co Wasserstoffabsorbierende legierungselektrode und verfahren zur herstellung derselben
US5290509A (en) * 1990-01-22 1994-03-01 Sanyo Electric Co., Ltd. Multiphase hydrogen-absorbing alloy electrode for an alkaline storage cell
JPH08181837A (ja) * 1994-12-22 1996-07-12 Nec Corp ファクシミリ装置および画像信号の文字認識方法

Also Published As

Publication number Publication date
JPH0373916B2 (ja) 1991-11-25

Similar Documents

Publication Publication Date Title
US5335290A (en) Segmentation of text, picture and lines of a document image
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
KR100311633B1 (ko) 문서화상으로부터의타이틀추출장치및방법
US5452374A (en) Skew detection and correction of a document image representation
US6640010B2 (en) Word-to-word selection on images
US6351559B1 (en) User-enclosed region extraction from scanned document images
US20070154112A1 (en) Image processing apparatus, image processing method, and computer program
JPS63155386A (ja) 帳票デ−タ読取装置
US20050047660A1 (en) Image processing apparatus, image processing method, program, and storage medium
JPH01253077A (ja) 文字列検出方法
JPH08202815A (ja) 書類の上下方向検知方法及び装置
US20010043742A1 (en) Communication document detector
JPS5949671A (ja) 光学的文字読取装置
JPH0291789A (ja) 文字認識方法
JP3412441B2 (ja) 画像処理装置
JPH07152856A (ja) 光学的文字読取装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP3345246B2 (ja) 文字認識装置及び文字認識方法
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPH02253383A (ja) 画像処理装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP3074210B2 (ja) 紙文書画像処理装置
JPH0728934A (ja) 文書画像処理装置
JP2925270B2 (ja) 文字読取装置
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム