JPH01124082A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01124082A
JPH01124082A JP62283501A JP28350187A JPH01124082A JP H01124082 A JPH01124082 A JP H01124082A JP 62283501 A JP62283501 A JP 62283501A JP 28350187 A JP28350187 A JP 28350187A JP H01124082 A JPH01124082 A JP H01124082A
Authority
JP
Japan
Prior art keywords
character
characters
polygon
octagon
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62283501A
Other languages
English (en)
Inventor
Zuiseki Ro
呂 瑞鉐
Biei Chin
陳 美瑛
Inchiyuu En
袁 允中
Toshihiro Hayashi
俊宏 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62283501A priority Critical patent/JPH01124082A/ja
Publication of JPH01124082A publication Critical patent/JPH01124082A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明はまず電子計算機により原稿の文字を高い精度で
切り出し、次に文字パターンをマツチング計算(照合計
算)することにより、文字を認識する文字認識装置に関
するものである。
従来の技術 近年よりパーソナル・コンピュータやワートプロセッザ
が事務所や一般家庭に普及するようになり、いわゆるオ
フィス・オートメーション(0ffice  Auto
mation  )やホーム・オートメーション(Ho
me 八utomation  )の潮流をもたらした
。しかし、現在のパーソナル・コンピュ、−夕やワード
・プロセッサは、まだ、ギーボードによるデータの入力
にたよっている。ギーボートで入力する方式は、入力速
度がおそいことと、オペ−レータの倦怠感が起こり易い
という欠点があった。このために、高速度で取扱い易い
入力方式の開発が要望されている。この発明による文字
認識装置は、上記の要望を満すことができるように発明
されたものである。
第2図は、従来の文字認識装置を示すブロック図である
。同図において、10は、例えば、イメージ・スキャン
ナで原稿を走査し、その原稿にある白点を” o ”、
黒点を”1″とするバイナリ・データ(Binary 
Data )に変換したのちに、それをバッファ・メモ
リ部に貯蔵するためのイメージ・データ入力手段であり
、20はバッファ・メモリ部に貯蔵されたバイナリ・デ
ータを検査し、各文字並びになった文字列の位置座標を
検査して各文字の位置座標を検出して記録する文字列切
り出し手段である。30は上記各文字列の範囲にあるバ
イナリ・データを検出して記録する文字切り出し手段で
あり、40は切り出した上記各文字を解析し、例えばそ
の周辺特徴を計算して識別用の特徴を抽出する特徴抽出
手段である。55は、上記入力された文字と比較するた
めに各識別文字の特徴、例えばその周辺特徴がメモリ部
に貯蔵されている標準文字パターンである。50は、上
記特徴抽出手段40からの文字特徴と、上記標準文字パ
ターン55からのすべての文字の特徴とを逐一比較して
その距離を求め、距離のうちで最も小さいものを認識結
果にする比較手段である。60は上記認識結果を端末デ
゛イスプレイなどの表示装置に表示する出力手段である
文字認識装置においては、文字切り出しが極めて重要な
前処理であり、文字切り出しに際し、もしエラーが生ず
るき、その次の識別が必然的に不正確となるからである
。そして、第2図に示す一般の文字認識装置における文
字切り出し手段30は、例えば、昭和61年度日本電子
通信学会総合全国大会で、発表された「文書清書システ
ムの第2部、文字切り出しアルゴリズム」に記載された
ようなものがあるが、それは、文字のヒストグラムが用
いられている。第3図に示すように、まず文字列の横軸
に投影されたヒストグラム量を計算し、そのヒストグラ
ム量がしきい値(スレッシュボールド)を超過したとこ
ろは、文字があることを表わし、ヒストグラム量がしき
い値よりも低いところは、文字間の分離点を表わす。ま
た、例えば、日本国の特公昭60−53916号には、
文字の各要素における外接四角形のパラメタの計算、比
較、組合せなどの手法により、文字を切り出す方法が開
示されており、正書体文字の「八」なとのような分離部
のある文字を切り出すことができるが、第4図に示すよ
うな斜書体(1ta−lie  )や、複数の文字が結
合している連結文字に対しては、やはり正確に切り出す
ことができないという欠点があった。
発明が解決しようとする問題点 すなわち、上記従来の文字のヒストグラム量による文字
切り出し手段は、字と字との間のヒストグラム量の変化
が激しい正書体文字、すなわち正規フォントの切り出し
に対して確かに有効であるが、斜書体文字、例えば第4
図に示したように、文字と文字との間にヒストグラムが
重なり合っている斜書体文字或いは連結文字に対しては
、ヒストグラム量による文字間の切り出しく分離点)を
判断することができなくなる。これは、ヒストグラム量
による文字を切り出す方法の致命的な欠点である。
本発明は上記問題点に鑑み、精度高く文字切り出し文字
の認識を行う文字認識装置を提供することを目的とする
問題点を解決するための手段 上記の問題点を解消するために、本発明は、所定の特徴
量で貯蔵される標準文字パターンと、画像を走査して2
値データに変換する画像データ入力手段と、前記入力さ
れた画像データから文字列を切り出す文字列切り出し手
段と、前記文字列方向に対して垂直に投影したヒストグ
ラム量を用いて文字の境界を検出する文字ブロック境界
検出手段と、文字ブロックの幅を基準として文字である
か、複数の文字である文字群かを判定する判定手段と、
文字群であれば、多角形により各文字を切り出す多角形
文字切り出し手段と、切り出した各文字に対してそれぞ
れ所定の特徴量を抽出する特徴抽出手段と、抽出した特
徴量と上記の標準文字、パターンとを比較してその距離
の最も小さい文字パターンを認識結果とする比較手段な
どを備えたことを特徴とする文字認識装置である。
作  用 この発明によれば、上記のように構成された文字認識装
置は斜書体文字、正書体文字或いは連結文字を問わず、
高い精度で文字を切り出すことができ、ひいては、文字
認識装置全体の認識率を向上させることができるもので
ある。
実施例 第1図は、本発明の一実施例を示すブロック図である。
第1図において、第2図のものと同一動作を行なうもの
は、同一符号を付している。第1図において、lOは、
原稿を走査して映像の2値データに変換させるイメージ
・データ入力手段、2゜は、縦軸に対するヒストグラム
量及びスレッシュホールド調整により文字列を切り出す
文字列切り出し手段と、31は、左から右へ文字列に沿
って、横軸に投影したヒストグラム量を計算し、文字ブ
ロック判断のスレッシュホールドに超えたがどうかを検
出する文字ブロック境界検出手段である。
そのヒストグラム量は、下記の式により計算できる。
なお、文字列は、座標 ’Yl(とyLの間に存在する
ものとする(第5図)。
ここで、H(Xりは横軸に投影した点X1のヒストグラ
ムを示し、p (x+、y)は画素(Xl。
y)のイメージの2値化値である。黒点を”1°゛とし
、白点を”O゛とすると、文字ブロック境界の検出条件
は、ヒストグラム量が′°0“°の場合或いは既にその
行の右端に到達している場合とになる。
32は、文字ブロックに含まれたものが単一の文字かま
たは複数個の文字からなる文字群であるかを判断するた
めの文字または文字群判断手段である。その判断基準は
下記の通りである。
即ち、文字ブロックの幅が(Xav、+N、+ze)よ
りも小さい場合は、単一文字であると判断し、そうでな
い場合は、文字群であると判断する。ここで、X i 
v aは、切り出された文字の平均幅[その初期値(i
nitial  value)がX + n I tで
ある]を示し、N * + x eは、ノイズの幅(経
験値による)を示すものである。
33は、多角形の追跡手段である。本実施例では最大へ
辺の多角形とする。その追跡動作は、左から右へ文字ブ
ロックを走査し、第1番目の文字の最左側の黒点を探し
出してから、この黒点を始点として、当該文字の外廓を
追跡するとともに、第6図に示したように当該文字を囲
む八辺形の関係パラメタを計算して八辺形を得る。その
八辺形の幅及び高さを検出し、若し両方とも所定値より
小さければ、この六辺形内の文字をノイズとして廃棄す
る。次に、上記と同じような計算を、文字ブロック全体
の処理が終わるまで繰り返す。上記の八辺形に関係のあ
るパラメタの計算を第7図に示す。
この八辺形の各辺は、下記のように定義する。
辺1 : X ” Xmax 辺2: 2x+y=Cs 辺3 : y= ’! mm、 辺4:2x−y=c2 辺5:X:xInIh 辺6 : 2x+y−C1 辺5 : V = V+nin 辺6:2x−y=C4 上記のX ITla X s X 1.l+ 11、’
l m t x、’I+n+n、 C1,C2、C3、
及びC4の値を算出すれば、該文字を囲んだ八辺形を描
(ことができる。そして、この六辺形の幅はXI、、a
X−xlnll、で高さはy、nAX−ylnll。
である。
34は、文字境界補正手段であり、この手段で、例えば
”i ”、”j″、“′%″、′”−″及び一部分の漢
字が二つ又は二つ以上の分離部分を有する文字を六辺形
で完全に切り出すことができる。その補正方法は、第8
図に示すように、仮に第8図における“元の六辺形“の
枠が、上記六辺形の追跡手段33に至るまでに得た文字
枠とすれば、上下の斜線部分を検査し、もし黒点が存在
した場合には、この黒点を始点とし、もう−度上記の六
辺形の追跡手段33により、その外周を追跡し、それを
元の六辺形に納めることにより、当該文字の境界を補正
することができる。
35は、連がっている2個又は2個以上の文字どうしを
切り出すための連結文字処理手段である。
切り出された六辺形が、下記の五つの条件を満足したも
のは、連結文字として認定する。
(1)、(x+nax−xmtn) > (xavex
7/4)(2)、  Vm+n > (j tap +
 5 )(3)、(C3C1)>  (XavaX 2
 )(4)、(2X Xmjn   C2)>  (Y
mtn+ Vmax)/2(5)0文字ブロックの中央
線付近のヒストグラム量が、どれも(VmaXV+n+
n) X3/4よりも少ないこと。
ここで、X n v eは、切り出された文字の平均幅
であり、t 1larは、文字列の始まり位置で、X□
88、X m t n s ylns x s V m
 + n、C1、C2、C3、C4は、全部前記の六辺
形の追跡手段33で述べた定義と同じである。
連結文字を切り出すく分割)方法は、まず連結文字の横
軸上でのヒストグラム量を計算し、ヒストグラム量の最
も小さいものを選び、次に斜線(x+3y=c)に沿っ
て連結文字の斜方向ヒストグラム量を求め、その最も小
さいものを選んだのちに、両方の求めたヒストグラム量
を比較して、小さい方の点を区切り点とする方法である
上記各手段による可変多角形で、一つの文字を囲い出す
ので、この多角形は、該文字の外接多角形になる。第9
図に示す六辺形は、各辺ごとにフォント(字体)の形状
に応じて、その辺の長さと位置が調整されるようになっ
ている。異なったフォントや大きさの異なる文字に対し
、本発明の文字認識装置では、多角形の辺の長さを自動
的に調整することにより、それぞれ異なった形状の多角
形で、必要な文字を囲い出すことができる。その斜書体
文字と結合文字に対する切り出しの成功例を第10図に
示す。ここで特に強調したい事は、この発明の文字切り
出し作用は、各種フォント(正書体又は斜書体)の文字
に対して有効であるのみならず、連結文字或いは一部分
が分離している文字に対しても、有効である。
本実施例の文字認識装置のハードウェアの構成図を、第
11図に示す。第11図において、この発明になる文字
認識装置の中心部の認識ボード(Recognitio
n Board)には、ディジタル・シグナル・プロセ
ッサ(Digital Signal Process
or)が含まれている。認識処理の主要動動作は、のプ
ロセッサに実行させる。認識すべき原稿はイメージ・ス
キャンナにより、映像のバイナリ・データを得たのちに
、これらのデータを検査し、前記の処理によって、文字
列又は文字を切り出す。次に、切り出された文字の特徴
を表わすパラメータとしては、日本電子通信学会全国大
会論文集(1985年、P1577)に示される境界密
度(Boundary Density )や背景密度
(BackgroundDensity  )が公知で
ある。この特徴を計算するとともに、各文字ごとに、小
区間に分けて、所定バイト(byte )数の特徴量を
得る。これを、同様にして予め作成された標準文字パタ
ーンの対応区間に、同一バイト数の特徴量と逐一比較し
、距離の最も小さい文字パターンを認識結果とする。本
実施例の場合、標準文字パターンに複数種類のフォント
を含み、そして、クラスタリング(cluster−i
ng)手法を利用して、標準文字パターン全体を記憶す
るのに必要とする記憶体空間を節約しつつ、マルチフォ
ントの認識に対応することが可能である。
この発明は、上記実施例に限定されることな(、その要
旨を変更しない限り、適当に変形して実施することがで
きる。例えば、文字を囲み出す多角形は、八辺形に限ら
れず、十辺形や六辺形を用いても、同じような区切り結
果が得られる。
また、この発明の切り出し対象は、文字に限らず、図形
にも適用でき、しかもその切り出しの精度はなんら影響
されることがない。
また、データの入力方式は、イメージ・スキャンナを使
用することに限られることなく、TVカメラ等による入
力方式を使っても、イメージ・データをメモリ部に記憶
させることができる。
発明の結果 本発明によれば、英文の大文字や小文字、数字及び特殊
記号など100個の文字を認識対象として、上記文字認
識装置により、多角形の演算法で文字を切り出すことが
できるとともに、境界密度と背景密度の特徴を算出する
ことにより、その特徴を抽出することができ、かつ文字
の切り出しの正確率が99.8%以上、文字の認識率が
98゜9%以上に達した結果が得られたので、実用性が
はるかに大きいである。
【図面の簡単な説明】
第1図は本発明の文字認識装置の一実施例の構成を示す
ブロック図、第2図は従来例の文字認識装置の構成を示
すブロック図、第3図、第4図は従来例におけるヒスト
グラムによる文字切り出しの動作説明図、第5図は文字
列の一例を示す説明図、第6図は本発明の一実施例にお
ける八辺形パラメタの定義を示す説明図、第7図は八辺
形の定義を示す説明図、第8図は文字境界の補正領域を
示す説明図、第9図は八辺形の各辺の伸縮方向を示す説
明図、第10図は八辺形で連結文字と斜書体文字の切り
出しの成功例を示す説明図、第11図はこの発明の一実
施例におけるハードウェアの配置図である。 (lO)・・・イメージ・データ入力手段、(20)・
・・文字列切り出し手段、(31)・・・文字ブロック
境界検索手段、(32)・・・文字又は文字群判断手段
、(33)・・・八辺形の追跡手段、(34)・・・文
字境界補正手段、(35)・・・連結文字処理手段、(
40)・・・特徴抽出手段、(50)・・・比較手段、
(55)・・・標準文字パターン、(60)・・・出力
手段。 代理人の氏名 弁理士 中尾敏男 はか1名」ベム′へ
II′Iべ中  シベムベ)へ4酬塚

Claims (3)

    【特許請求の範囲】
  1. (1) 所定の特徴量で貯蔵される標準文字パターンと
    、画像を走査して2値データに変換する画像データ入力
    手段と、前記入力された画像データから文字列を切り出
    す文字列切り出し手段と、前記文字列方向に対して垂直
    に投影したヒストグラム量を用いて文字の境界を検出す
    る文字ブロック境界検出手段と、文字ブロックの幅を基
    準として文字であるか、複数の文字である文字群かを判
    定する判定手段と、文字群であれば、多角形により各文
    字を切り出す多角形文字切り出し手段と、切り出した各
    文字に対してそれぞれ所定の特徴量を抽出する特徴抽出
    手段と、抽出した特徴量と上記の標準文字パターンとを
    比較してその距離の最も小さい文字パターンを認識結果
    とする比較手段などを備えたことを特徴とする文字認識
    装置。
  2. (2) 多角形文字切り出し手段は、各文字パターンの
    枠を求める手段を備えたことを特徴とする特許請求範囲
    第1項記載の文字認識装置。
  3. (3) 多角形文字切り出し手段は、切り出された各文
    字において各文字の分離部分を前記多角形に包含する文
    字分離部補正手段を備えたことを特徴とする特許請求範
    囲第2項記載の文字認識装置。(4) 多角形文字切り
    出し手段は、多角形の条件により、複数の文字が結合し
    ている連結文字であることを判定し、文字列方向に対し
    て垂直方向又は斜方向上のヒストグラム量の最も小さい
    ところを区切り点として連結文字を区切る連結文字処理
    手段を備えたことを特徴とする特許請求範囲第2項記載
    の文字認識装置。
JP62283501A 1987-11-10 1987-11-10 文字認識装置 Pending JPH01124082A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62283501A JPH01124082A (ja) 1987-11-10 1987-11-10 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62283501A JPH01124082A (ja) 1987-11-10 1987-11-10 文字認識装置

Publications (1)

Publication Number Publication Date
JPH01124082A true JPH01124082A (ja) 1989-05-16

Family

ID=17666363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62283501A Pending JPH01124082A (ja) 1987-11-10 1987-11-10 文字認識装置

Country Status (1)

Country Link
JP (1) JPH01124082A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018519574A (ja) * 2016-01-05 2018-07-19 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 テキスト画像処理方法および装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62121589A (ja) * 1985-11-22 1987-06-02 Oki Electric Ind Co Ltd 文字切出し方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62121589A (ja) * 1985-11-22 1987-06-02 Oki Electric Ind Co Ltd 文字切出し方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018519574A (ja) * 2016-01-05 2018-07-19 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 テキスト画像処理方法および装置
US10572728B2 (en) 2016-01-05 2020-02-25 Tencent Technology (Shenzhen) Company Limited Text image processing method and apparatus

Similar Documents

Publication Publication Date Title
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US5581633A (en) Method and apparatus for segmenting a character and for extracting a character string based on a histogram
US5197107A (en) Character recognition apparatus
US5625710A (en) Character recognition apparatus using modification of a characteristic quantity
Dori et al. Segmentation and recognition of dimensioning text from engineering drawings
JPH01124082A (ja) 文字認識装置
JPH0410087A (ja) 基本ライン抽出方法
JPH02116987A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JP2788506B2 (ja) 文字認識装置
JP3457094B2 (ja) 文字認識装置及び文字認識方法
JP3193573B2 (ja) かぎかっこ付文字認識装置
JP2974396B2 (ja) 画像処理方法及び装置
JP2925303B2 (ja) 画像処理方法及び装置
JPH07160810A (ja) 文字認識装置
JPH0573718A (ja) 領域属性識別方式
JP2974167B2 (ja) 文字の大分類認識方法
JPH0545992B2 (ja)
JPH10162104A (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH1021332A (ja) 非線形正規化方法
JPH10214308A (ja) 文字判別方法
JPH05114048A (ja) 文字認識方法及びその装置
JPH05114047A (ja) 文字切り出し装置
JPH05174189A (ja) 文字認識方法