JPS6013511B2 - 文字認識ユニツト - Google Patents

文字認識ユニツト

Info

Publication number
JPS6013511B2
JPS6013511B2 JP53048382A JP4838278A JPS6013511B2 JP S6013511 B2 JPS6013511 B2 JP S6013511B2 JP 53048382 A JP53048382 A JP 53048382A JP 4838278 A JP4838278 A JP 4838278A JP S6013511 B2 JPS6013511 B2 JP S6013511B2
Authority
JP
Japan
Prior art keywords
character
line
output
processor
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53048382A
Other languages
English (en)
Other versions
JPS5435635A (en
Inventor
マリアン・ウエイン・ネフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Recognition Equipment Inc
Original Assignee
Recognition Equipment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Recognition Equipment Inc filed Critical Recognition Equipment Inc
Publication of JPS5435635A publication Critical patent/JPS5435635A/ja
Publication of JPS6013511B2 publication Critical patent/JPS6013511B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J2/00Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed
    • B41J2/435Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed characterised by selective application of radiation to a printing material or impression-transfer material
    • B41J2/447Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed characterised by selective application of radiation to a printing material or impression-transfer material using arrays of radiation sources
    • B41J2/45Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed characterised by selective application of radiation to a printing material or impression-transfer material using arrays of radiation sources using light-emitting diode [LED] or laser arrays
    • B41J2002/453Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed characterised by selective application of radiation to a printing material or impression-transfer material using arrays of radiation sources using light-emitting diode [LED] or laser arrays self-scanning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明を以下の項目順序に従い詳細に説明する。
A 発明の技術分野 B 従釆技術 C 発明の目的 ○ 発明の概要 E 実施例の説明 E−1 本発明ユニットの1実施例の全体構成(第1図
)E一2 第1図の文字存在プロセサ16及び文字認識
プロセサ20の一部分の詳細(第2図)E−3 文字セ
グメント間にギャップをもつ文字の例(第3〜6図)8
−4 本発明ユニットの別の実施例の全体構成および一
部分の詳細(第7〜8図)F 発明の効果 A 発明の技術分野 本発明は、パターンの認識又は識別のための自動的マシ
ン・オペレーションに関するもので、詳言すれば、本発
明は、文字セグメント間を区分する通路を文字を位置決
めする文字ロケーションプロセサ(以下、これを文字存
在プロセサと呼ぶ)を、本来その字体内に垂直のギャッ
プを持つか、またはその字体に小さな区切りストロ−ク
を持ちこれらのギャップ及びストロークが文字セグメン
ト間を垂直方向に区分する通路と間違われるような文字
に対しても、適応させるとのできるシステムに関するも
のである。
B 従来技術 自動文字認識システムは、通常、光学文字認識(読取)
装置か又は磁気インク文字認識(謙取)装置、或いはこ
れら両装置を組合わせたものである。
これらの両装置に共通する問題は、工業的操作にふさわ
しい速度で文字の存在を認識する必要があることである
さらに別の問題は、文字の中には小さな区切りストロー
クをその字体内にもつものがあり、このために単一の文
字でありながら文字存在検知装置があたかも2個の文字
であるかのように間違えてしまうことがあることである
。小さな区切りストロークとは、文字の一部分であるに
も拘らずその周囲の部分よりもバックグラウンドレベル
に近似し、従って字体内のギャップのように見えるもの
を云う。文字存在プロセサはこのギャップを或る1つの
文字が既に終ってもう1つの文字が始まったことを示す
セグメント間の垂直方向の通路として認識してしまう。
同様な問題が、特別な文字を持つ或る種のフオントすな
わち字型の導入に伴って起っている。これらの特別な文
字のうちの或る文字は字体内に垂直方向のギャップを持
ち、従って文字セグメント間の垂直方向のギャップを見
出すことによって文字を確認し分離する文字存在プロセ
サは、ギャップの両側の文字部分を各各1つの文字であ
るかのように認識する。このように、1個の文字が2個
又はそれ以上の文字として誤認されることがある。最近
に至って、文字認識技術は行方向セグメント間に存在す
る独特な関係を表わすマルチビット・特徴コードを生ず
る特徴コード発生器を採用し始めた。
各行が走査されるごとに、その内に含まれる文字セグメ
ント間の関係を表わす特徴コードが発生される。特徴コ
ードを使う以前には、文字認識システムは文字をマトリ
クス・メモリーに集め次にマトリクス内の文字を1組の
マクスと比較することによって文字を認識するという集
中技法を使っていた。C 発明の目的 本発明は、文字内の4・さな区切りストロークの存在を
認識できるユニットを提供することによって、高速度に
おける文字認識の信頼度を改善しまた誤った文字決定の
数を減らすこと、及び特徴コード・システムが認識する
ことのできるフオントのタイプ及び特別な文字を拡張す
ることを目的とする。
通常はメモリーの中の文字又は以下述べるように読むべ
き字に対するアレーの相対運動と比較して高速度で走査
されるフオトセンサ・アレ−の出力に対して文字存在プ
ロセサを使い、文字を位置決めする。この場合、単一の
文字が、アレ−による走査区域を通過する間に、多回数
に亘つて走査される。文字存在プロセサは文字の始まり
と終りとを見出すことにより、特徴コードから生じる文
字コードの利用をコントロールする。D 発明の概要 本発明ユニットは、フオトセンサから成る2次九アレー
をもつ文字認識システム内で使われる文字存在プロセサ
を備えている。
このアレーは自己走査型であり、このアレ−の処理され
た出力に基づいて特徴コードが発生される。文字存在プ
ロセサは、ァレーの出力内の、文字行内の文字セグメン
ト間の通路を探索する。文字セグメント間の通路は、文
字行が走査されるにつれ文字の始めと終りとを知るのに
利用される。文字存在プロセサは文字認識プロセサの出
力の使用を制御する。フオトセンサは二次元アレー内に
配置され、このアレ−は或る所定の順序で、たとえば頂
部の行から始まり途中の行を経由してアレーの最終すな
わち底部の行まで1度に1行と云うような順序で、自動
的に走査される。アレーのアナログ出力はプリプロセサ
によって変換され、文字セグメントの存在又は不存在を
示す2値信号になる。走査速度は、アレーと文字との相
対運動に比較して高速度である。従って各文字は、その
像がアレ−によって走査された区域を通過する際、多数
回に亘つて走査される。行の2値信号は、特徴コード発
生器によって行走査速度で特徴コードに変換される。特
徴コードは2値語であって、この語は各行に対して発生
され、各行内の行セグメント間の独得な関係を表わす。
特徴コードは、特徴コード発生器内に記憶されたりスト
から得られ、特定の特徴コード‘ま文字セグメント間に
存在する或る特定の関係を表わす。特徴コーNま文字認
識プロセサに送られ、アレーの頂部から底部に亘る全フ
レームにおける特徴コードの順序に基づき文字を識別す
るために、順次判断論理回路網に入れられる。この回路
網の出力は、フオントの各文字を特定的に識別する文字
コードである。文字存在プロセサは、プリプロセサの出
力を受けると共に、文字認識プロセサ内の判断回路網の
出力をも受ける。
文字存在プロセサは、文字認識プロセサによる決定(又
は認識された文字)が或る条件のもとで文字決定プロセ
サへ送られることを許す。文字存在プロセサの機能の1
つは、プリプロセサの出力についてアレー内のいくつか
の列を通る文字セグメント間通路の有無を調べることで
ある。この通路は、文字行に対してほゞ平行なアレー相
対運動方向にほゞ直角をなすものである。文字存在プロ
セサが、文字が終ってしまって今は通路が存在している
ということを検出すると、該プロセサは文字認識プロセ
サ及び文字決定プロセサにその旨を示し、次いで文字決
定プロセサは文字認識プロセサによって発生された複数
個の文字コードーこ基づいて文字決定を行う。通路が検
知されると、通路信号が文字存在プロセサによって発せ
られる。どの文字コードが最大回数に亘つて発生される
かを元にして最終の文字決定が行われる。文字存在プロ
セサは、文字行に対して大体直角をなす通路を持ついく
つかの特別な文字のうちの1つを示す決定をその通路に
対して補正を行う手段を備えている。
この手段は、文字認識プロセサによりある特定の文字コ
ードを指示された場合に、その通路を無視する。従って
このとき文字存在プロセサは文字の始め又は終りを指示
しない。換言すれば文字セグメント間の通路は無視され
、最終の決定は文字全体に基づいて行なわれる。本発明
のもう1つの特徴は、文字認識プロセサの示す文字コー
ドが小さな区切りストローク又は一部分損われた状態を
もつものである場合に、検出される文字セグメント間通
路を無視することができることである。E 実施例の説
明 以下本発明の実施例を添付図面について詳細に説明する
E−1 本発明ユニットの1実施例の全体的構成(第1
図)フオトセル2次元アレー10がプリブロセサ12に
接続されている。
アレ−10の複数個のフオトセルの各アナログ出力が、
プリプロセサ12によって2値信号に変換される。アレ
ー10のアナログ出力は、プリプロセサ12により直列
に受けられ、プリプロセサの2値信号出力は、特徴コー
ド発生器14、文字存在プロセサ16、及び走査方向ユ
ニット18の各各に直列に伝えられる。走査方向ユニッ
ト18は、フレー10と記録用媒体上に在る読もうとす
る文字との間の相対運動の方向を検知する。アレ−10
は、たとえば特開昭51−38933に記載してあるよ
うな、手持ちユニット内に収納することができる。特徴
コード発生器14は、アレーの各フオトセルを代表する
プリプロセサ12の2値出力を受ける。
アレー1川ま自己走査型であり、行及び列から成る二次
元アレーである。アレーは一時に1行ずつ頂部から底部
へと走査され、プリプロセサ12の直列出力は走査順に
従う。すなわち、プリプロセサ12の特徴コード発生器
14に至る出力は、単一の2値信号に変換された、行方
向フオトセルの出力である。プリプロセサ12によって
出力された2値信号は、文字セグメントの存在又は不存
在を表わす。たとえば、ロジック「1」は文字セグメン
ト又は雑音(存在する場合)の存在を表わすことができ
、またロジック「0」は文字セグメント又は雑音の不存
在を表わすことができる。各行内のロジック「1」及び
「0」の配置に基づいて、特徴コード発生器14が特徴
コードを行走査速度で文字認識プロセッサ2川こ対して
出力する。各行の走査毎に4ビットの特徴コード発生さ
れる。本例においては、1筋蚤の特徴コードが次のよう
にコード化される。第1表 特徴コード 0:全白色 1=7個又は7個以上の黒色セルを持つ長い線02=ア
レーの左1/3に於ける中位の線3=アレーの中央に於
ける中位の線 4=アレーの右1′3に於ける中位の線 5=アレーの左1/3に於ける垂直線セグメント6=セ
ンサー5及び7間に於ける垂直線セグメント7=アレー
の中央に於ける垂直線セグメント8=センサー7及び9
間に於ける垂直線セグメント9コアレーの右1/3に於
ける垂直線セグメント10=線セグメントの広い対11
=アレーの左1/3に於ける狭い対 12=アレーの中央に於ける狭い対 13=アレーの右1/3に於ける狭い対 14=コード1またはコード15であるが決定不能15
=3個の線セグメントコード6の場合のような特定位置
のセンサーに対するコードは、アレ−が12×38アレ
ーであって一時に12セル行を走査する場合に関係する
行の各走査に際し12の2値信号がプリプロセサ12に
よって出力され、ブリプロセサ12から第1表に定めら
れた特徴を表わす4ビットコードが生ずる。マルチビッ
ト・特徴コードによって代表される16の特徴は、文字
認識プロセサ2川こよって利用され、与えられた文字を
表わす文字コードが生ずる。特徴コードは文字認識プロ
セサに対して行走査速度で提供され、該プロセサによっ
て順次に翻訳される。文字認識プロセサ20からの文字
決定を表わす出力は、アレ−の各フレーム走査に対する
文字コードの形であって、文字決定プロセサ22にかけ
られる。
文字認識プロセサ20は、アレー10の走査速度がアレ
ーに対する文字の相対運動よりもさらに大きいので、各
文字に対して複数個の文字コードを出力する。文字決定
プロセサ22は単一の文字コードを生じさせ、これによ
って文字認識プロセサ2川こよって生じた文字コードの
流れから走査された文字を識別する。走査方向ユニット
18の出力はライン24を経て編集ユニット(図示して
ない)に接続される。文字決定プロセサ22の最終文字
決定を表わす文字コードは、ライン26を経て編集ユニ
ットに接続される。文字決定プロセサ22はまたライン
28に決定完了信号又は標識を発生し、この信号も編集
ユニットに接続される。編集ユニットは最終文字コード
、標識、及び方向信号を受け、出力として簡単な句又は
文を出力「する。E−2 第1図の文字存在プロセサ1
6及び文字認識プロセサ20の一部分の詳細(第2図)
特徴コード発生器14の4ビット出力は、マルチライン
チャネル32を経てデシジョンROM30‘こ加えられ
る。
ROM30の出力は、チャネル30を経てパスROM3
8に加えられる。またこのROM30の出力は、マルチ
ラインチャネル42を経てディレイバツフアー401こ
接続される。このバッファー40の出力は、マルチライ
ンチャネル44を経てROM30の入力に接続される。
ディレィバッフア−40は、文字認識プロセサ20の他
の部分からも種々の出力を受けるが、その一つは端子4
6へのりセット信号であり、この信号によってデイレイ
バツフアー40はリセツトされ、ROM3川こ文字決定
を始めるように指示する出力を発生する。ROM30の
出力はまたマルチラインチャネル48を経て文字認識プ
ロセサ20の他の部分に接続され、最終的には文字決定
プロセサ22に接続される。ライン51,52,53に
至るパスROM38の出力は、高さテストROM56に
接続される。
この世力は、どの高さテストをROM56によってなす
べきかを指示する。ライン51,52,53は、それぞ
れ抵抗体61,62,63を経て端子58のロジック高
電圧に接続されている。高さテストROM56に至るそ
の他の入力は、カウンタ66及びJ−Kフリップフロツ
プ68から成る高さカゥンタから釆る。カゥンタ66は
、行走査速度でフオトセルアレーからのデータの行を表
わすパルスをライン70で受ける。ライン70上のパル
スはカウンタ66で計数される。各パルスは、文字セグ
メントを含む行及び含まない行のすべての行を、文字セ
グメントのない2つの連続行が検知され文字の下底部が
指示されるまで、送られる。カウンタ66の計数は、ラ
イン73,74,75,76を経てROM56に送られ
る。ライン76は、フリツプフロツブ(FF)68のク
ロツク入力にも接続されている。FF68は、キヤリー
出力のあるカウンタ及び追加カウンタを持つことなく、
高さカウンタの容量を追加ディジット分だけ増すのに使
われる。
ラ・ィン76は、カウンタ66の最上位ビットを表わす
。FF68のQ出力は、ライン79を経てFF68のK
入力及びROM56に接続される。FFの0出力は、ラ
イン82を経てFF68のJ入力に接続される。従って
、カゥンタ66が「1111」の計数に達しまたカウン
タ66がライン70上でもう1つのパルスを受けると、
カウンタ66の計数は「0000」にリサイクルし、F
F68のライン79への出力は高まる。このように、カ
ウンタ66の容量はFF68を使うことにより4ビット
から5ビタツト1ビットだけ増す。カワンタ66はライ
ン84,85上の信号によってゼロにリセツトされる。
FF68はライン82に至る自己の出力で「高」にリセ
ットされ、ライン88上のクリャ信号によりライン79
に至る自己の出力で「低」にZリセットされる。高さテ
ストROM56の出力は、高さ情報を必要とする文字存
在プロセサの種々のその他の部分に接続される。高さテ
ストROM56は、そのライン9 1,92,93,9
4に至る各出力が、それぞれ抵抗体98,99,JIO
0,101を経て端子96の正電圧に接続される。ライ
ン94に至るROM56の出力は、文字の高さがパスR
OM38によって指定された高さよりも低いことを示す
ライン93に至る出力は、2文字が正しい高さ範囲内に
あることを示す。ライン92に至る出力は、指定された
高さよりも高いことを示す。さらにライン91に至る高
さテストROM56の出力は、該文字は正しい高さのも
のであるが、文字存在プロセサ16のもう1つの部分に
よってトレースされつつある文字セグメント間通路を無
視すべき、特別な文字のうちの一つであることを示す。
ライン9 1はORゲート1 04に接続されている。
ORゲート104に至る他の入力はANDI06から来
る。このANDゲート106には、文字の終りの存在を
示している文字セグメント間通路が存在するかどうかを
決定する文字存在プロセサの一部分から来る入力が、ラ
イン109,1 1 1から入る。走査される複数の文
字は一つの行を構成してある。以下に述べるトレーサは
、前記の特関昭51−38933に詳細に述べられてい
る。簡単に説明すると、次の第2表に示す通り、3列の
データが、トレーサによって文字行内の文字の始め又は
終りを示す文字セグメント間通路のサーチを受ける。こ
のトレーサは垂直又は水平の移動をするだけであって、
斜めには動かない。例に於ては、アレーの中央3列を示
しているが、アレーの他の列でも同じ目的に使うことが
できる。第2表 A B 〇〇〇 〇〇・ 010 011 100 〇〇1 〇〇〇 100 〇〇〇 〇〇〇 000 〇〇〇 トレーサは、行又は列に沿って動くだけであって、ある
1つの行及び列から行及び列が共に異なる位置へと飛ぶ
ことはない。
サーチされる通路は、アレ−に対する文字の移動方向に
垂直なものである。アレーは文字のある1行に沿って移
動する。順序Aはトレーサにより、通路は存在しないと
判断される例である。その理由は文字セグメントに出会
う(ロジック「1」で示す)まで列を降下し、出会った
ら文字セグメントを持たないもう1つの列へと行を横切
って移り、次いでその列を降下して最下行に達すること
ができないからである。打倒字Bは通路の存在、すなわ
ち文字の終り又は始めを示す文字セグメント間の通路の
存在を示す例である。順序Bに於ては、上から第4番目
の行に出会うまで最左列を降下し、次いで上から第3番
目の行の中央列に、次いでそこから下方へ移動して最下
行に達することが可能である。サーチの結果は、ライン
109,1 1 1を経てANDゲート106で受ける
ライン109,111上の信号が高いときは、文字セグ
メント間に通路が存在しないことを示し、ANDゲート
106は「高」に行く。従って、ORゲート104はラ
イン114に至る高出力を持つことになる。E一3 文
字セグメント間にギャップをもつ文字の例(第3〜6図
)第3〜5図はEI$として知られている活字型の特別
の文字を示す。
トランシット字117,ダッシュ字119及び「onu
s」字121は、いずれも字体内に垂直方向のギャップ
を持っている。従ってトレーサは、ライン109,11
1の一方又は両方に、文字が終ってしまい文字セグメン
ト間にギャップがあったということを示す低信号を出力
する。これらの特別の文字に対する高さテストROM5
6は、ライン91に高信号を出力し、これによってOR
ゲート104が「高」となり、文字が終っていないこと
を示す。ANDゲートI06からの低出力はブロックさ
れる。第3図のトランシット字117には、文字の左側
の方に長方形のバー124があり、このバー124の右
側には2個の正方形126,127が上下に配置されて
いる。
第4図のEI斑のダッシュ字119は、3個の水平に間
隔をあげて配置された長方形129,121,132を
持っている。左側の2個の長方形129,131は同じ
高さで同じ幅を持ち、右側の長方形132は高さ両長方
形129,131と同じだが幅は狭い。第5図の「on
船」字121は、2個の薄い長方形135,136を持
ち、これらの長方形は水平方向に隔てられ同じ高さ及び
幅を持っている。もっと幅は広いが長さの短い長方形1
38が、平行する長方形135,136の右上方に配置
されている。フオトセルァレー10がトランシット字1
17を走査する際には、アレーは、走査の方向によって
順序は変るが、バー124又は正方形126,127に
出会う。キャップ、すなわちバー124及び両正方形1
26,127間のギャップすなわちスペース141が、
トレーサによって文字セグメント間のギャップの有無を
サーチされているアレhの3個の中央列と、一致整合す
れば、ライン109,111に至る信号が「低」となる
。しかし、デシジョンROM30の出力は或る1つの決
定又は状態を示し、パスROM38は、パスROM38
の要求する高さ条件が満たされるならば高さテストRO
M56がライン91に「1」を出力するという要領で、
上記の決定又は状態を認識する。
.パスROM38は、高さテストROM5
6によって或る1つのテストが行われることを要求した
このテストは、カウンタ66及びFF68に於けるカウ
ントが或る最小・最大両高さ所要量の間にあるかどうか
を定めるものである。同じ方法がダッシュ字及び「on
船」字の場合にも使われ、ライン91は「高」となり、
たとえばダッシュ119の長方形129のような文字の
一部分だけが1つの文字として認識されて決定がなされ
ることがないようにする。第6図のOCRの活字型の数
字「7」141は、該文字を2個の部分150,151
に分離する小さな区切りストローク区域すなわちギャッ
プ147を持っている。
トレーサは、ギヤツプ147を文字セグメント間のギャ
ップと識別し、その結果文字の一部分150を1個の文
字としまた一部分161をもう1個の文字として認識す
ることになる。この問題を解決するために、パスROM
38は、部分150に対してある高さテスト、すなわち
部分150がある高さ条件を満たすか否かのテストを要
求する。満たすならば高さテストROM56がライン9
1に「1」を出力する。こうしてギャップ147によっ
て生ずるライン109,111上の通路存在信号をブロ
ックすることができる。E一4 本発明ユニットの別の
実施例の全体構成および一部分の詳細(第7〜8図)ア
レ−10、プリプロセサ12及び特徴コード発生器14
は、前記と同じように接続して操作される。
アレー10の3個の中央列の出力は、プリプロセサ12
から文字存在プロセサ162の通路トレーサ160に接
続される。特徴コード発生器14の出力は、デシジョン
ROM30すなわち前記のような文字認識プロセサ20
内の回路網に接続される。デシジョンROM30の出力
は、マルチラインチャネル165を経て文字検知ロジッ
クユニット167に接続される。ユニット167の出力
はマルチラインチャネル170を経て高さレインジユニ
ツト172及びデシジョンヱイデット・プレゼンスュニ
ット174に接続される。図示してない回路を経てアレ
ー10から開始走査信号を受ける高さカゥン夕177は
、行が走査されるごとにカゥンタを進める。高さカウン
タ177は、高さテストカウンタ66について前記した
ようにして命令でリセットされる。高さカウンタ177
の出力は、高さレインジュニツト172に接続される。
このユニット172の出力は、マルチラインチャネル1
79を経てユニット174に接続される。ユニット17
4の出力は、ライン182を経て○Rゲート184に接
続される。通路トレーサ160の出力は、ORゲート1
86及びライン188を経て○Rゲート184の入力に
接続される。ORゲート184の出力は、ライン190
を経て第1〜2図について前記した文字決定プロセサ2
2に接続される。文字のステートメントその他これに類
するものを表わすディジタル信号から成る各行をプリプ
ロセサ12から特徴コード発生器14が受けると、デシ
ジョンROM30の入力になる特徴コードが生ずる。
デシジョンROM30は、特徴コード‘こ応答して文字
コードを決定して出力する。この文字コードは、第1図
の文字決定プロセサ22及び第7図の文字検知ロジック
ユニット167がこれを受ける。このユニット167は
デシジョンROM30からの文字コードをデコードして
このデコードされた情報を高さレインジュニツト172
及びデシジョンエイデツト・プレゼンスユニツト174
にチャネル170を経て送る。カウンタ177の文字高
さはユニット172内でテストされ、高さが或る最小及
び最大必要条件を満足させるか、すなわちカウンタ17
7で示された高さがROM30からユニット167に送
られた特定の文字コード‘こ対して或る所定の範囲内に
あるかどうかを決定する。ユニット167の出力により
どの必要条件(又はテスト)が要求されるかが定まる。
通路トレーサ160‘ま、前記のようにして決められた
文字セグメント間の通路に対して、プリプロセサ12か
らの各走査の出力の3個の中央列をサーチする。
通路トレーサ160の出力が「低」となりアレ−の3個
の中央列を通して白色通路が存在することを示すと、O
Rゲート186の出力は「低」となる、ORゲート18
6の低出力はライン188を経て○Rゲート194に接
続されているので、もしライン182が「低」であれば
ORゲート1 84の出力は「低」となる。しかし、も
し第3〜5図に示す特別の文字の1つが文字検知ロジッ
クユニット167によって示されると、ライン182は
「高」である。この場合には、ORゲート184の出力
は「高」にとどまりト通路トレーサ160からの低信号
はブロックされる。通路トレーサは前記特関昭51一斑
9$に開示されているトレーサに準じて作ることができ
る。デシジョンROM30は、チャネル165及び各種
ィンバータ200を経てANDゲート194,195,
196,197に接続されている(これらのANDゲー
トは文字検知ロジックユニット167内に於て必要なコ
ーディングのすべてを示すものではなく、単なる例示に
過ぎない)。
ANDゲート194はその出力が、第3図のトランシッ
ト字を示す文字コードが出力されたときANDゲート1
94が「高」となるように多数のインバータ200を経
てROM30に接続されている。同じように、ANDゲ
−ト195は、ダッシュ字がデシジョンROM3川こよ
って示されると、「高」となる。ANDゲート196は
、「on−瓜1字121がROM30によって示される
と、「高」となる。ANDゲート194,195,19
6の出力はそれぞれANDゲ−ト202,203,20
4に至る入力として接続される。ANDゲート202な
し、し204に至る他の入力は、ライン207,208
,209すなわち第7図のチャネル179内のラインで
あるこれらの各ラインを経て、高さレインジュニット1
72に接続される。レインジユニツトからライン207
,208,209に至る信号は、或る特定の文字がそれ
と協働する高ごコ−ドテストと出会うと、「高」となる
。たとえばANDゲート195の出力が高ければダッシ
ュ字がアレー1川こよって走査されつつあることを示し
、もしダッシュ字が高さの必要条件を満たす場合にはA
NDゲート203は「高」となる。ANDゲート202
,203,204は、ORゲート212を経てORゲー
ト184に接続されている。ORゲート184の機能は
上に述べた通りである。既知の位置にいまいま小さな区
切りストロークを持っていることが知られているような
文字に対して補正又は修正をするために、ANDゲート
197を設けることができる。
ANDゲート197(又は場合によっては他のANDゲ
ート)はANDゲート214に接続し、このANDゲー
ト214はORゲート212に接続してある。たとえば
、ANDゲート1 97をチャネル1 65に接続し、
第6図に示すような「7」を表わす文字コードがROM
30から送られてきたときは、ライン188の低信号を
、もし高さレインジュニツト172からのライン217
が高ならば、ANDゲート214から生ずるライン18
2の高信号によって補正することができる。ライン21
7は文字が高さテストに合格すれば「高」である。この
ように、通路トレーサ16川こよって示された文字セグ
メント間の偽のギャップ又は通路はブロックされ、文字
はこの文字が高さレインジュニットの必要条件を満足さ
せるならば正しく確認される。ORゲート184のライ
ン190‘こ至る出力は、第2図のライン114に至る
ORゲート104の出力の場合と同じ要領で、システム
の残りの部分に接続される。F 発明の効果 要約すれば、フオトセルアレ−によって生じたビデオデ
ータの連続流れを利用する認識装置が得られる。
この2次元フオトセルの2値化された出力が走査速度で
文字認識装置に送られる。特徴コード発生器が走査速度
でデータを受ける。特徴コードが発生し行走査速度で順
次判断回路網に送られる。この回路網にデータの各行で
観察された文字セグメントに基づいて特徴コードを入力
する。この回路網は行走査速度で特徴コードを受けて文
字決定を行う。すなわちこの回路網が特徴コードに基づ
いて文字コードを発生する。この回路網に接続されて作
動するものとしてロジック回路があり、これらの回路は
、走査されつつある行中の文字又は記号、断片、及びス
ペースすなわち認識信頼度を高めるための文字セグメン
ト間のギャップを識別する。或る与えられた文字像がフ
オトセルアレーに対して相対移動をするにつれ、像は反
覆して走査され、最終の文字決定は、像が視野を通過し
た後最大回数生じた文字コードを基にして行われる。
走査方向データは最終文字決定と同時に送られる。或る
いくつかの文字は字体内に4・さな区切りストローク又
はギャップを持ち、またEI班のような或るフオントで
は文字の部分間にスペースすなわちギャップを持つ特別
な文字があり、このことによって該文字が1つの文字よ
り多いものとして講捉りされることがある。本発明によ
れば、或る小さな区切りストローク状態及び或る特別文
字を認識する装置が与えうれ、これにより文字の部分間
の、すなわち小さな区切りストロークすなわちギャップ
によって分割された文字の部分間の、垂直方向のギャッ
プすなわちスペースは無視され、文字決定は該文字全体
に基づいて行われる。
【図面の簡単な説明】
第1図は本発明ユニットの1実施例の全体構成0図、第
2図は第1図中の文字認識プロセサ及び文字存在プロセ
サの一部分の詳細構成図、第3図ないし第5図はそれぞ
れEI斑として知られているフオント中の特別文字の拡
大図、第6図は文字自体内にギャップすなわち弱いスト
。 ークを持つタOCR−Aとして知られているフオント中
の文字の拡大図、第7図は本発明ユニットの別の実施例
の全体構成図、第8図は第7図のユニットの一部分の詳
細構成図である。10……フオトセルアレー、12……
プリプロセサ、14・・・・・・特徴コード発生器、1
6,162・…・・文字存在プロセサ、18・・・・・
・走査方向ユニット、20・・・・・・文字認識プロセ
サ、22…・・・文字決定プロセサ、30・・・・・・
デシジョンROM、38・・・…パスROM、40……
デイレイバツフアー、56・・・・・・高さテストRO
M、66・・・・・・高さテストカウンタ、68……J
一Kフリツプフロツプ、160・・・・・・通路トレー
サ、167・・・・・・文字検知ロジックユニット、1
77……高さカウンタ、172……高さレインジユニツ
ト、174……デシジョンエイデ′ツト・フ。 レゼーンスユニツト。(ソG′ ′′G.J ‘′G.イ (ソ○ク ‘ソ6.6 ‘rG〆 ‘′6.2

Claims (1)

    【特許請求の範囲】
  1. 1 2次元フオトセルアレー10を既知の順序で行に沿
    つて走査することによつて記録用媒体上の文字を構成す
    る文字セグメントに対応する複数個のデイジタル信号を
    利用して文字認識を行うユニツトにおいて、(イ) 前
    記デイジタル信号を受け各行内の文字セグメント間に存
    在する或る所定の関係を表わす特徴コードを行走査速度
    で発生する特徴コード発生器14と、(ロ) 特徴コー
    ドを行走査速度で受取りフオトセルアレーのフレーム走
    査毎に特徴コードの順序に基づいて文字コードを発生す
    る文字認識プロセサ20と、(ハ) フオトセルアレー
    のフレーム内の文字セグメント間に文字とフオトセルア
    レーとの相対運動方向にほゞ直角方向に延びるギヤツプ
    が存在するか否かを調べ、ギヤツプが存在するときは文
    字認識プロセサの出力をブロツクする通路信号を発生す
    る、文字存在プロセサ16と、(ニ) 文字セグメント
    間に前記ギヤツプをもつ予め定めた特定の文字の文字コ
    ードが発生されたときにその文字コードを検知し前記通
    路信号をブロツクする手段38,104,167,18
    4と、を設けたことを特徴とする前記文字認識ユニツト
JP53048382A 1977-08-22 1978-04-25 文字認識ユニツト Expired JPS6013511B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US05/826,580 US4087790A (en) 1977-08-22 1977-08-22 Character presence processor
US826580 1977-08-22

Publications (2)

Publication Number Publication Date
JPS5435635A JPS5435635A (en) 1979-03-15
JPS6013511B2 true JPS6013511B2 (ja) 1985-04-08

Family

ID=25246953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53048382A Expired JPS6013511B2 (ja) 1977-08-22 1978-04-25 文字認識ユニツト

Country Status (9)

Country Link
US (1) US4087790A (ja)
JP (1) JPS6013511B2 (ja)
CA (1) CA1114501A (ja)
DE (1) DE2836725A1 (ja)
FR (1) FR2401467B1 (ja)
GB (1) GB1597775A (ja)
IT (1) IT1103863B (ja)
NL (1) NL7808259A (ja)
SE (1) SE443461B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61259211A (ja) * 1985-05-14 1986-11-17 Copal Co Ltd ズ−ムレンズ鏡胴

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57151601U (ja) * 1981-03-16 1982-09-22
US4542528A (en) * 1981-04-09 1985-09-17 Recognition Equipment Incorporated OCR and bar code reader with optimized sensor
US4411016A (en) * 1981-06-01 1983-10-18 Recognition Equipment Incorporated Barcode width measurement system
JPS5812002A (ja) * 1981-07-15 1983-01-24 Sumitomo Electric Ind Ltd 自動車用多重伝送系における負荷制御方式
JPS5814214A (ja) * 1981-07-18 1983-01-27 Yanmar Agricult Equip Co Ltd 収穫機の自動操向装置
JPS5844504A (ja) * 1981-09-10 1983-03-15 Toshiba Corp 調整弁制御装置
US4499595A (en) * 1981-10-01 1985-02-12 General Electric Co. System and method for pattern recognition
EP0080533B1 (en) * 1981-12-02 1985-11-21 Kabushiki Kaisha Toshiba Character separating system in use for an optical character reader
US4521862A (en) * 1982-03-29 1985-06-04 General Electric Company Serialization of elongated members
US4685141A (en) * 1983-12-19 1987-08-04 Ncr Canada Ltd - Ncr Canada Ltee Method and system for finding image data associated with the monetary amount on financial documents
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
US4949391A (en) * 1986-09-26 1990-08-14 Everex Ti Corporation Adaptive image acquisition system
DE3788774T2 (de) * 1986-10-20 1994-04-28 Sharp Kk Bildeingangsprozessor.
US4882629A (en) * 1987-05-08 1989-11-21 Everex Ti Corporation Adaptive exposure control system
US5077805A (en) * 1990-05-07 1991-12-31 Eastman Kodak Company Hybrid feature-based and template matching optical character recognition system
US5081690A (en) * 1990-05-08 1992-01-14 Eastman Kodak Company Row-by-row segmentation and thresholding for optical character recognition
US6587587B2 (en) * 1993-05-20 2003-07-01 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3219974A (en) * 1960-11-14 1965-11-23 Control Data Corp Means for determining separation locations between spaced and touching characters
US3526876A (en) * 1965-10-24 1970-09-01 Ibm Character separation apparatus for character recognition machines
FR2073822A5 (ja) * 1969-12-31 1971-10-01 Ibm
GB1399348A (en) * 1971-08-02 1975-07-02 Mel Equipment Co Ltd Character recognition apparatus
US3932840A (en) * 1973-10-15 1976-01-13 Taplin Business Machines Incorporated Error detection and sequence maintaining system for bar-code readers
US4075605A (en) * 1974-09-13 1978-02-21 Recognition Equipment Incorporated Character recognition unit
JPS5156139A (en) * 1974-11-13 1976-05-17 Hitachi Ltd Mojomitorisochi niokeru kiridashihoshiki
US4083034A (en) * 1976-10-04 1978-04-04 Recognition Equipment Incorporated Plural tracker character detection and boundary location system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61259211A (ja) * 1985-05-14 1986-11-17 Copal Co Ltd ズ−ムレンズ鏡胴

Also Published As

Publication number Publication date
US4087790A (en) 1978-05-02
FR2401467A1 (fr) 1979-03-23
GB1597775A (en) 1981-09-09
CA1114501A (en) 1981-12-15
FR2401467B1 (fr) 1985-10-18
IT1103863B (it) 1985-10-14
JPS5435635A (en) 1979-03-15
SE7805414L (sv) 1979-02-23
DE2836725A1 (de) 1979-03-08
IT7848983A0 (it) 1978-04-19
NL7808259A (nl) 1979-02-26
SE443461B (sv) 1986-02-24

Similar Documents

Publication Publication Date Title
JPS6013511B2 (ja) 文字認識ユニツト
US4075605A (en) Character recognition unit
EP0138079B1 (en) Character recognition apparatus and method for recognising characters associated with diacritical marks
US4926492A (en) Optical character reading apparatus and method
EP0163377B1 (en) Pattern recognition system
US4355301A (en) Optical character reading system
US4193056A (en) OCR for reading a constraint free hand-written character or the like
US3992697A (en) Character recognition system utilizing feature extraction
GB1028139A (en) Character reader
US4066998A (en) Method and apparatus for discriminating between characters in character recognition systems
US4232290A (en) Handwritten character identification
US4783835A (en) Method of character recognition
JP2644041B2 (ja) 文字認識装置
US3772648A (en) Electro-optical character reader
US3509533A (en) Digital-analog optical character recognition
US4063219A (en) Character recognition system
JPS58101378A (ja) 手書文書読取方法
JPH07160810A (ja) 文字認識装置
US3478315A (en) Automatic character recognition-arrangement
JP2578767B2 (ja) 画像処理方法
KR100241447B1 (ko) 윤곽선 정보를 이용한 영문/숫자 인식방법
JPH0514952B2 (ja)
JP2578768B2 (ja) 画像処理方法
JPS58149574A (ja) 標準パタ−ン登録装置
JPH0782526B2 (ja) 文字ワク検出装置