JPH01245376A - 文字読取装置の文字切出し装置 - Google Patents

文字読取装置の文字切出し装置

Info

Publication number
JPH01245376A
JPH01245376A JP63072739A JP7273988A JPH01245376A JP H01245376 A JPH01245376 A JP H01245376A JP 63072739 A JP63072739 A JP 63072739A JP 7273988 A JP7273988 A JP 7273988A JP H01245376 A JPH01245376 A JP H01245376A
Authority
JP
Japan
Prior art keywords
character
frame field
character frame
histogram
pattern data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63072739A
Other languages
English (en)
Inventor
Noboru Okada
昇 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP63072739A priority Critical patent/JPH01245376A/ja
Publication of JPH01245376A publication Critical patent/JPH01245376A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、1文字毎の文字認識処理を行なう文字読取装
置の文字切出し装置に関する。
(従来の技術) 従来、光学的文字読取装置では、読取対象の帳票上を光
学的に走査し、充電変換処理により得られた画像パター
ンデータがイメージバッファに格納される。イメージバ
ッフ?には例えば1シート(1帳票)分の画像パターン
データが格納される。そして、イメージバッファかう1
文字毎の文字切出し処理がなされて、1文字単位の文字
!i!1処理が実行される。
文字切出し処理では、第5図に示すように、イメージバ
ッファ内の各画像パターンデータ(文字パターン)Pに
対応する射影データ10a〜10dからなるヒストグラ
ムが作成される。ここで、各文字は、帳票上にドロップ
アウトカラーで印刷された文字枠11に記録されている
光学的文字読取装置の文字切出し部は、例えば1行分の
フィールドに対応するヒストグラムを走査し、文字枠間
のスペースに相当する白データを検出して文字切出し位
置12a〜12cを決定する。
この文字切出し位置12a〜12Cを基準として、1文
字毎の画像パターンデータをイメージバッファから切出
し、文字認識部へ転送する。これにより、文字認識部は
1文字毎の文字認識処理を行なうことになる。
ところで、前記のような文字切出し方式では、読取対象
である帳票上の各文字の記録位置を設定するために、文
字枠が帳票に予め印刷されているが、その文字枠は読取
不可となるようにドロップアウトカラーで印刷されてい
る必要がある。これは、文字枠が文字と共にイメージバ
ッフ?に格納されると、文字切出し処理に不都合なデー
タとなるからである。しかし、文字枠をドロップアウト
カラーで印刷することは、帳票を作成する際に大きな制
約条件となり、帳票の作成工程の複雑化及び帳票のコス
ト増大化の原因になっている。
また、文字枠間に所定のスペースを設ける必要があるた
め、帳票全体が大型化し、小型の帳票を作成することが
困難である。
(発明が解決しようとする課題) 従来の文字切出し方式では、帳票上に予め設けられる文
字枠はドロップアウトカラーで印刷される必要がある。
このため、帳票の作成工程の複雑化及び帳票のコスト増
大化を招く欠点がある。
また、文字枠間に所定のスペースを設ける必要があるた
め、小型の帳票を作成することが困難である。
本発明の目的は、非ドロップアウトカラーで印刷され、
かつ文字枠間のスペースが不必要な文字枠を有する帳票
を読取対象として、その帳票の文字枠内に記録された文
字の切出し処理を確実に実行できる文字読取装置の文字
切出し装置を提供することにある。
[発明の構成コ (課題を解決するための手段と作用) 本発明は、1文字分毎に区画された文字枠からなる文字
枠フィールド及び文字枠内に記録された読取対象の帳票
上を走査し、文字枠フィールド及び文字に対応する画像
パターンデータを格納するパンフ?メモリ手段を備えて
いる。バッファメモ9手段に格納された画像パターンデ
ータから、行及び列の各方向の射影データからなるヒス
トグラムをヒストグラム生成手段により生成する。この
ヒストグラム生成手段により生成されたヒストグラムに
基づいて、文字枠フィールド検出手段により文字枠フィ
ールドを検出する。この文字枠フィールド検出手段によ
り検出された文字枠フィールドに基づいて、文字切出し
手段によりバッファメモリ手段から1文字毎の文字切出
し処理を行なう。
このような構成の装置により、文字枠を予めドロップア
ウトカラーで帳票に印刷することを不要にすることがで
きる。また、文字枠に基づいて文字切出し処理を行なう
ため、文字枠間に特にスペースを設ける必要がない。
(実施例) 以下図面を参照して本発明の詳細な説明する。第1図は
同実施例の文字読取装置の構成を示すブロック図である
。第1図に示すように、本装置は、走査部20、イメー
ジバッファ21、ヒストグラム生成部22、黒文字枠フ
ィールド検出部23、文字切出し部24及び文字認識部
25を備えている。走査部20は読取対象の帳票上を光
学的に走査し、光電変換されて得られる画像パターンデ
ータを出力する回路である。イメージバッフ?21は、
走査部20から出力される1シ一ト分の画像パターンデ
ータを格納するバッファメモリである。
ヒストグラム生成部22は、イメージバッフ?21に格
納された画像パターンデータにおいて、予め指定される
エリアに対応するヒストグラムを生成する回路である。
黒文字枠フィールド検出部23は、ヒストグラム生成部
22で生成されたピストグラムに基づいて、黒文字枠フ
ィールドの検出を行なう回路である。文字切出し部24
は、検出された黒文字枠フィールドに基づいて、イメー
ジバッファ21から1文字毎の文字パターンデータを切
出し、文字認識部25へ出力する。文字認識EB25は
、1文字毎の文字パターンデータに対する文字認識処理
を行なう回路である。
次に、同実施例の動作を説明する。先ず、読取対象の帳
票が走査部20により走査されると、その帳票に記録さ
れた文字及び黒文字枠に対応する1シ一ト分の画像パタ
ーンデータがイメージバッファ21に格納される。ここ
で、黒文字枠は非ドロップアウトカラーで帳票に印刷さ
れており、縦及び横の罫線により文字群を1文字毎に区
画するためのフィールドである。イメージバッファ21
には、第3図に示すように、文字(ここでは、数字)に
対応する文字パターンデータ及び黒文字枠に対応する画
像パターンデータBが格納されることになる。
次に、ヒストグラム生成部22は、イメージバッファ2
1に格納された画像パターンデータにおいて、予め指定
されるエリア(第3図の点線からなる範囲)に対するヒ
ストグラムを生成する。このエリア指定は、例えばホス
トコンピュータからフォーマットコントロール情報とし
て与えられる。ピストグラム生成部22は、第4図に示
すように、指定されたエリアAの画像パターンデータに
対するヒストグラムの生成処理を行なう。
ヒストグラム生成部22は、第2図のステップS1に示
すように、エリアA内を横方向へ走査し、第4図に示す
ようなヒストグラムH1を生成する。
このヒストグラムH1は、横方向の文字に対応する射影
データD1及び黒文字枠フィールドFに対応する射影デ
ータD2.03からなる。黒文字枠フィールド検出部2
3は、ピストグラム生成部22により生成された横方向
のヒストグラムH1の黒文字枠に対応する射影データ0
2.03に基づいて、黒文字枠フィールドFの上下位1
40.41を検出する(ステップS2)。
次に、ヒストグラム生成部22は、第4図に示すように
、所定のエリアA内の所定の左右端範囲な設定し、その
各t!囲に対して縦方向に走査して、ヒストグラムH2
,H3を生成する(ステップ84)。黒文字枠フィール
ド検出部23は、ヒストグラム生成部22により生成さ
れた縦方向のヒストグラムH2,H3の黒文字枠に対応
する射影データD4.D5に基づいて、黒文字枠フィー
ルドFの左右位置42.43を検出する(ステップS5
)。
ここで、黒文字枠フィールド検出部23は、上下位置4
0.41又は左右位置42.43を検出する際に、それ
ぞれの黒文字枠に対応する射影データD2〜D5のピー
クが予め決定された為さ及び幅の基準値を満足するか否
かを判定することになる。
このようにして、黒文字枠フィールド検出部23は、ヒ
ストグラム生成部22で生成されたヒストグラムH1〜
H3に基づいて黒文字枠フィールドの位IF(第4図の
40〜43)を検出する(ステップ86)。そして、文
字切出し部24は、黒文字枠フィールド検出部23によ
り検出された黒文字枠フィールドに基づいて、イメージ
バッファ21から1文字毎の文字パターンデータ(第4
図のパターンP)を切出して(ステップS7)、文字2
1部25へ出力する。文字認識部25は、文字切出し部
24により切出された1文字毎の文字パターンデータに
対する文字認識処理を行なう。
ここで、文字切出し部24は、検出された黒文字枠フィ
ールドに基づいて、各文字毎の黒文字枠の縦方向及び横
方向のエツジを検出し、このエツジからなる1文字分の
文字枠位置データを作成する。
この文字枠位置データによる切出し位置を決定し、1文
字毎の文字切出し処理を行なうことになる。
尚、ステップS3において、黒文字枠フィールドが検出
されない場合には、従来方式(第5図)による文字切出
し処理が実行されることになる(ステップ88)。
[発明の効果] 以上詳述したように本発明によれば、黒色等の非ドロッ
プアウトカラーで印刷された黒文字枠フィールドを有す
る帳票を使用した場合に、その黒文字枠フィールドに対
応する画像パターンデータを利用して、フィールド内に
記録された文字群から1文字毎の文字切出し処理を行な
うことができる。したがって、文字枠をドロップアウト
カラーで印刷する工程を無(すことができるため、帳票
の作成工程を簡単化し、作成コストの軽減化を図ること
ができる。
また、黒文字枠を利用して文字切出しを行なうために、
従来の方式で必要な文字枠間のスペースを特に確保する
必要がなくなる。このため、帳票上においてそのスペー
ス分を省略できるため、帳票全体の小型化を図ることが
できるものである。
【図面の簡単な説明】
第1図は本発明の実施例に係わる文字読取装置の構成を
示すブロック図、第2図は同実施例の動作を説明するた
めのフローチャート、第3図及び第4図はそれぞれ同実
施例の動作を説明するための概念図、第5図は従来の文
字切出し方式を説明するための概念図である。 20・・・走査部、21・・・イメージバッファ、22
・・・ヒストグラム生成部、23・・・黒文字枠フィー
ルド検出部、24・・・文字切出し部、25・・・文字
認識部。 第 1 図 03 口 第4 囚 第5 図

Claims (1)

  1. 【特許請求の範囲】 1文字分毎に区画された文字枠からなる文字枠フィール
    ド及び前記文字枠内に記録された読取対象の帳票上を走
    査して光電変換されて得られる画像パターンデータを出
    力する走査手段と、この走査手段から出力される前記文
    字枠フィールド及び文字に対応する画像パターンデータ
    を格納するバッファメモリ手段と、 このバッファメモリ手段に格納された画像パターンデー
    タから行及び列の各方向の射影データからなるヒストグ
    ラムを生成するヒストグラム生成手段と、 このヒストグラム生成手段により生成されたヒストグラ
    ムに基づいて前記文字枠フィールドを検出する文字枠フ
    ィールド検出手段と、 この文字枠フィールド検出手段により検出された文字枠
    フィールドに基づいて前記バッファメモリ手段から1文
    字毎の文字切出し処理を行なう文字切出し手段とを具備
    したことを特徴とする文字読取装置の文字切出し装置。
JP63072739A 1988-03-26 1988-03-26 文字読取装置の文字切出し装置 Pending JPH01245376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63072739A JPH01245376A (ja) 1988-03-26 1988-03-26 文字読取装置の文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63072739A JPH01245376A (ja) 1988-03-26 1988-03-26 文字読取装置の文字切出し装置

Publications (1)

Publication Number Publication Date
JPH01245376A true JPH01245376A (ja) 1989-09-29

Family

ID=13498028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63072739A Pending JPH01245376A (ja) 1988-03-26 1988-03-26 文字読取装置の文字切出し装置

Country Status (1)

Country Link
JP (1) JPH01245376A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07105308A (ja) * 1990-03-12 1995-04-21 Internatl Business Mach Corp <Ibm> 書類上の金額フィールドの位置特定方法および識別方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07105308A (ja) * 1990-03-12 1995-04-21 Internatl Business Mach Corp <Ibm> 書類上の金額フィールドの位置特定方法および識別方法
JP2575539B2 (ja) * 1990-03-12 1997-01-29 インターナショナル・ビジネス・マシーンズ・コーポレイション 書類上の金額フィールドの位置特定方法および識別方法

Similar Documents

Publication Publication Date Title
JPS58103266A (ja) 文字画像処理装置
JP2010056691A (ja) 画像処理装置及び画像処理方法
JPH08129550A (ja) 画像処理装置および画像処理方法
JP2001052110A (ja) 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
JPH01245376A (ja) 文字読取装置の文字切出し装置
JPH06131495A (ja) 画像情報抽出方式
WO2001093188A1 (fr) Procede de traitement de document, support sur lequel est enregistre un programme de traitement de document et processeur de document
CN100511267C (zh) 图文影像处理装置及其影像处理方法
JPH01144181A (ja) 光学的文字読取装置
JPH05151388A (ja) 処理領域及び処理条件の指定方式
JP2708604B2 (ja) 文字認識方法
JPH0473192B2 (ja)
JPH0493275A (ja) 画像ファイル装置
JPH0459668B2 (ja)
JPH02216587A (ja) 画像ファイル装置
JPS61198375A (ja) 光学的文字読取装置
JPH04251395A (ja) 光学的文字図形読取装置
JPH08202824A (ja) 文書画像認識装置
JPH06251192A (ja) 光学的文字読み取り装置
JPH04255088A (ja) 光学式文字読取装置
JPH0473193B2 (ja)
JPS6111888A (ja) 文書読取装置
JPS60150189A (ja) パタ−ン読取方式
JPH03230288A (ja) 情報処理装置
JPS6014381A (ja) 光学文字読取装置