JPS63116282A - 画像入力付きocr - Google Patents

画像入力付きocr

Info

Publication number
JPS63116282A
JPS63116282A JP61263518A JP26351886A JPS63116282A JP S63116282 A JPS63116282 A JP S63116282A JP 61263518 A JP61263518 A JP 61263518A JP 26351886 A JP26351886 A JP 26351886A JP S63116282 A JPS63116282 A JP S63116282A
Authority
JP
Japan
Prior art keywords
data
ocr
image
circuit
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61263518A
Other languages
English (en)
Inventor
Minoru Ota
実 太田
Toshihiro Hananoi
花野井 歳弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61263518A priority Critical patent/JPS63116282A/ja
Publication of JPS63116282A publication Critical patent/JPS63116282A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、画像入力付き0CR(光学文字読取装置)に
関し、特に画像データとOCRデータとを別個に処理し
て格納し、両方共最適なデータを得ることが可能な画像
入力付きOCRに関するものである。
〔従来の技術〕
従来、画像領域と文字領域とが混在している文書を読み
取る場合、光電スキャナや画像2値化回路等を共用して
読み取っているため、画像領域とOCR領域とを開始マ
ークにより切替えて処理していた。従って、データの記
入位置については、何等配慮されていなかった。すなわ
ち、第1番目の開始マークは画像領域のみであり、第2
番目の開始マークはOCR領域のみであるため、画像と
文字が混入された領域があっても、それはどちらか一方
に限定されて読取られることなってしまう。
また、2値化回路やインタフェースを共用しているため
1両方に最適なデータを得ることができなかった。何故
ならば、画像データとOCRデータに対しては、それぞ
れ最適なシェーディング補正と2値化方式とが必要であ
って、それにより始めてデータの品質が保てることにな
る。
例えば、特開昭55−9222号公報に記載された画像
入力装置においては、同−帳票上の文字図形パターンの
うち、文字読取領域より読取られた文字はコードデータ
として、またイメージ読取領域より読取られた文字図形
等は量子パターンデータとして、それぞれ処理装置に入
力している6〔発明が解決しようとする問題点〕 上記従来の技術では、データの記入位置と最適なデータ
を得ることについては、何等配慮していなかった。従っ
て、画像読取領域とOCR読取領域とが限定され、また
画像とOCRデータのシェーディング補正と2値化スラ
イスが同じになるという問題がある。
本発明の目的は、このような従来の問題点を解決し、画
像とOCRの読取領域の制限をなくし、かつ画像とOC
Rとで別個の処理を行って最適なデータを得ることがで
きる画像入力付きOCRを提供することにある。
〔問題点を解決するための手段〕
上記目的を達成するため、本発明の画像入力付きOCR
は、光電スキャナによりH稿を読取り、読取ったデータ
をシェーディング補正した後、2値化処理する画像信号
処理システムにおいて、上記シェーディング補正と2値
化の処理回路を、画像用とOCR用とに分離し、かつO
CR用に処理ドツト数を間引きする回路を設け、同−r
fc稿から読取った画像データとOCRデータを任意の
画質で別個にメモリに取り込むことに特徴がある。
〔作  用〕
本発明においては、画像データとOCRデータのシェー
ディング補正、2値化スライスを別個に処理しなければ
、それぞれのデータ品質が保てないという点に着目した
。すなわち、シェーディング補正回路の白レベル追跡関
数と2値化回路のスライスレベルは、画像用とOCR用
とを別々に動作させる。それにより、シェーディング補
正回路と2値化回路は処理を分離することができるので
、ファイルメモリからOCRデータと画像データを任意
の画質で別個に取り込むことができる。また、OCRデ
ータを400ドツト/インチから200ドツト/インチ
に間引くことにより、容量を1/4に減らすことができ
る。
〔実施廁〕
以下、本発明の実施例を、図面により詳細に説明する。
第1図は、本発明の一実施例を示す画像入力付きOCR
の構成図である。第1図に示すように、本実施例では、
画像データをシェープイン補正回w!t102、画像2
 ([化[1104、画像D M A 回路105を通
る上段で処理し、OCRデータをOCRシェーディング
回路]03、間引き回路107、OCR,2値化回路1
08、OCR−DMA回路109を通る下段で処理する
ことにより、画像データとOCRデータとを別々に処理
する。
第2図は、第1図の装置で読取られる帳票の記入例を示
す図である。帳票201には、OCR読取領域202,
203と画像読取領域204,205があり、周方の読
取領域は事前にパラメータ等で任意の位置に指定される
。第2図では、従来のように読取り開始マークは不要で
あるため、例えばY方向に読取開始マークを付ける場合
には、同じ位置にOCR読取領域203と画像読取領域
205が存在しても、読取った後にそれぞれ別個に処理
されるので、何等差支えはない。
光電スキャナ101は、例えば1次元半導体センサで構
成され、X方向の主走査とY方向の副走査を行う。走査
して読取ったビデオ信号は、画像シェーディング補正回
路1.02とOCRシェーディング補正回路103に入
力される。なお、光電スキャナ101の走査密度は1画
像データの画質を上げるために、本実施例では、主走査
、副走査ともに400ドツト/インチである。
画像データは、画像シェーディング補正回路102でシ
ェーディング補正され、画像2値化回路104で2値化
された後、画像DMA回路105を介してデータメモリ
106に格納される。
画像データとOCRデータは、同一の処理ができないの
で、処理を分ける必要がある。以下、その理由を述べる
第3図は、シェーディング補正回路の白レベル追跡処理
における動作波形図である。第3図(a)に示すように
、画像データでは、画像ビデオ信号301の白レベル追
跡信号302は黒方向の追跡を行わないため、第3図(
b)に示すように、ビデオ信号301と白レベル追跡信
号302の比をとって、シェーディング補正されたビデ
オ信号303を得る。
また、第3図(e )に示すように、OCRデータには
帳票上に文字を記入する位置を示すドロップアウトカラ
ー314が含まれており、このドロップアウトカラーが
涌き出さないように、OCRビデオ信号311の白レベ
ルの追跡信号312が黒方向の追跡を行っているため、
第3図(d)に示すように、OCRビデオ信号311と
白レベル追跡信号312の比をとって、シェーディング
補正されたビデオ信号313を得る。このシェーディン
グ補正されたビデオ信号313には、ドロップアウトカ
ラーは除去されているため、ドロップアウトカラーの涌
き出しを防止することができる。
このように、画像データとOCRデータとは、シェーデ
ィング補正が同一ではないので、本実施例では、別個の
処理を行っている。
次に、2値化回路のスライスレベルについて、OCRデ
ータに対しては、装置に決められた固有のPC8値をス
ライスレベルとして2値化する。
一方、画像データに対しては、入力すべき画像の濃淡が
あっても良質の画像データを得るために、スライスレベ
ルはユーザが自由に選択できるように、する必要がある
走査線密度については、OCRデータは200ドツト/
インチで認識可能であるが、画像データは画質を向上さ
せるために、400ドツト/インチでなければならない
これらの理由により、OCRデータは画像データを用い
ることができない。従って、第1図に示すように、OC
Rデータに対しては、OCRシェーディング補正回路1
03によりシェーディング補正を行い、間引き回路10
7で主走査、副走査ともに200ドツト/インチに間引
きを行い、○CR2値化回路108により2値化し、O
CR・DMA回路109を介してデータメモリ106に
格納する。
第4図は、第1図のデータメモリに格納された画像デー
タとOCRデータを示す説明図である。
帳票401上のOCR読取領域と画像読取領域は第1図
に示すように、同一の光電スキャナにより走査されて読
取られるが、その後は別々にシェーディング補正処理、
2値化処理等が行われて、データメモリに格納する場合
、OCR読取領域と画像読取領域が一方はイメージデー
タとして400ドツト/インチでメモリ領域402に格
納され。
同一のOCR読取領域と画像読取領域が他方はOCRデ
ータとして200ドツト/インチでメモリ領域403に
格納される。これらのデータは使用される時には、画像
データ404が領域402から読出されて上位装置に転
送され、またOCRデータ405は領域403から読出
されて認識装置に入力される。
このように、画像データ、OCRデータを別々にシェー
ディング補正処理、2値化処理、および間引き処理を行
うため、画像データ、OCRデータはそれぞれの画質に
応じたデータが得られる。
また、画像データ、OCRデータを別個にデータメモリ
106に格納するため、原稿上のOCR読取領域と画像
読取領域をどこに配置してもよく、つまり原稿上の面領
域の位置に制限がないため、例えば第2図の領域203
,205のように、X方向に並んで指定することも可能
であり、領域202.203のデータを、OCR読取領
域、画像読取領域に重複して指定することも可能となる
さらに、OCRデータは間引き回路107で、400ド
ツト/インチから200ドツト/インチに変換するため
、400ドツト/インチでデータメモリに格納してから
プログラムにより間引く方法に比べて、メモリ容量が1
/4に縮少される。
また、その場合、プログラム処理時間が不要となるため
、高速に200ドツト/インチに変換することができる
。なお、第1図における間引き回路107は、ハードウ
ェア構成によって、単純に1走査ごとに出力する単純間
引き、2走査の平均を出力する平均間引き、あるいは2
走査のAND。
ORを出力する間引き、等の種々の方法を選択すること
ができる。
このように1本実施例においては、画像データとOCR
データとを別個にシェーディング補正処理を行い、別々
のスライスにより2値化してメモリに格納するので、O
CR読取領域と画像読取領域とを任意の位置に指定でき
る。また、OCRデータを間引いてメモリに格納するこ
とにより、データメモリの容量を縮少することができる
なお、第2図における帳票201の背景は黒とし、帳票
201のエッチを検出して、帳票エッチから読取領域ま
での距龍により読取領域を指定する方法を用いるため、
開始マークが不要である。
〔発明の効果〕
以上説明したように、本発明によれば、画像データとO
CRデータを別々に処理を行って、別々にメモリに格納
するので2両データとも最適のデータが得られ、かつ読
取領域の制限をなくすことができる。また、OCRデー
タは、rJJり1き回路で間引きされるので、OCRデ
ータのメモリ容量が1/4ですむという利点がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示す画像入力付きOCRの
構成図、第2図は本発明の帳票記入例を示す図、第3図
はシェーディング補正回路の動作波形図、第4図は本発
明における画像データとOCRデータのメモリへの格納
状態図である。 101:走査回路、102:画像シェーディング回路、
OCRシェーディング補正回路、1.o4:画像2値化
回路、107二間引き回路、108:0CR2値化回路
、201:帳票、203:○CR読取領域、205:画
像読取領域。 第     1     図 第     2     図 第     3     図

Claims (1)

    【特許請求の範囲】
  1. 1、光電スキャナにより原稿を読取り、読取ったデータ
    をシェーディング補正した後、2値化処理する画像信号
    処理システムにおいて、上記シェーディング補正と2値
    化の処理回路を、画像用とOCR用とに分離し、かつO
    CR用に処理ドット数を間引きする回路を設け、同一原
    稿から読取った画像データとOCRデータを任意の画質
    で別個にメモリに取り込むことを特徴とする画像入力付
    きOCR。
JP61263518A 1986-11-05 1986-11-05 画像入力付きocr Pending JPS63116282A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61263518A JPS63116282A (ja) 1986-11-05 1986-11-05 画像入力付きocr

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61263518A JPS63116282A (ja) 1986-11-05 1986-11-05 画像入力付きocr

Publications (1)

Publication Number Publication Date
JPS63116282A true JPS63116282A (ja) 1988-05-20

Family

ID=17390649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61263518A Pending JPS63116282A (ja) 1986-11-05 1986-11-05 画像入力付きocr

Country Status (1)

Country Link
JP (1) JPS63116282A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01316883A (ja) * 1988-06-17 1989-12-21 Canon Inc 画像認識方法及び装置
JPH0216689A (ja) * 1988-07-05 1990-01-19 Nec Corp 光学式文字認識装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61237182A (ja) * 1985-04-12 1986-10-22 Sumitomo Electric Ind Ltd 光学読取装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61237182A (ja) * 1985-04-12 1986-10-22 Sumitomo Electric Ind Ltd 光学読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01316883A (ja) * 1988-06-17 1989-12-21 Canon Inc 画像認識方法及び装置
JPH0216689A (ja) * 1988-07-05 1990-01-19 Nec Corp 光学式文字認識装置

Similar Documents

Publication Publication Date Title
US6449065B1 (en) Method for capturing a document image, a scanner using the method and a document image management system using the scanner
JPH04275772A (ja) 画像読み取り装置
JPH0818764A (ja) 枠内領域矩形化装置
JPH0147828B2 (ja)
US5666207A (en) Image processing apparatus
JPS63116282A (ja) 画像入力付きocr
JP2648030B2 (ja) 画像編集方法及び画像編集装置
JPH11341295A (ja) 画像処理方法
JPH04288692A (ja) 画像入力装置
JP3014257B2 (ja) 文書読み取り装置
JP3210378B2 (ja) 画像入力装置
JPH0795397A (ja) 原稿読取装置
JP3393707B2 (ja) 画像読み取り装置
JPH11127348A (ja) 画像読み取り装置
JPH0338782A (ja) 原稿濃度検出装置
JP2755506B2 (ja) 画像形成装置
JP2001307097A (ja) パターン検出装置及び方法
JPH09247461A (ja) 画像再生装置
JPH09172542A (ja) 画像読み取り装置
JPH04331568A (ja) 画像読取装置
JPH0676108A (ja) 文書画像の傾き検出方法
JPH0818763A (ja) 枠内領域矩形化認識装置
JPH0522598A (ja) 画像入力装置
JPH04252665A (ja) 画像処理装置
JPS61264484A (ja) ハンドスキヤナ型画像入力装置