JPH01277981A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01277981A
JPH01277981A JP63104469A JP10446988A JPH01277981A JP H01277981 A JPH01277981 A JP H01277981A JP 63104469 A JP63104469 A JP 63104469A JP 10446988 A JP10446988 A JP 10446988A JP H01277981 A JPH01277981 A JP H01277981A
Authority
JP
Japan
Prior art keywords
character
image
recognition
buffer
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63104469A
Other languages
English (en)
Other versions
JPH0727543B2 (ja
Inventor
Yoji Nakamura
中村 洋治
G Casey Richard
リチャード・ジイ・ケーシ
Kazuharu Toyokawa
豊川 和治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP63104469A priority Critical patent/JPH0727543B2/ja
Priority to CA000595251A priority patent/CA1317377C/en
Priority to EP19890304050 priority patent/EP0343786A3/en
Publication of JPH01277981A publication Critical patent/JPH01277981A/ja
Priority to US07/813,239 priority patent/US5394484A/en
Publication of JPH0727543B2 publication Critical patent/JPH0727543B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 業主の 本発明は、パターン認識装置に関する。更に具体的に言
うならば、本発明は、パターン若しくは文字のイメージ
を認識している間に、誤って認識されたパターン若しく
は文字のイメージに基づいて文字認識手順を修正する装
置に関する。
莱   びル題点 イメージ走査装置により読取られた文書の印刷文字のイ
メージをパーソナル・コンピュータに入力して文字認識
アルゴリズムにより文字認識を行なうシステムが開発さ
れてきた。このシステムにおいては、高速の文字認識が
望まれるので1文字イメージの特定な画素即ちベルを逐
次的にサンプルし、サンプルされた画素が白であるか若
しくは黒であるかに応じて複数のノードをたどるいわゆ
るポイント・サンプリング型の文字認識ツリーが用いら
れる。この文字認識ツリーはタイプ・フォント毎に用意
される。−旦完成した文字認識ツリーを他のフォントの
文字を認識するように修正することは非常に困難なので
、頻繁に用いられるタイプ・フォントの種類の数だけ文
字認識ツリーを予じめ用意しておく。例えば30種類の
フォントの文字認識ツリーを予じめメモリに記憶するこ
とが、行なわれる。従って、記憶されたツリーのフォン
ト以外のフォントの文字が文書に含まれる場合は認識率
は著しく低下する。
IBMジャーナル・オブ・リサーチ・デベロップメント
、1983年7月、第27巻、第4号号の第386−3
99頁のR,G、Ca5ey及びC,R,Jikによる
論文“A processor−basedOCRsy
stem”は3つのツリーを1組として用い、そして各
ツリーからの結果を如何に組合わせるかを示している。
コンピュータ・グラフィックス及びイメージ・プロセッ
シング1982年第20巻の第375−390頁のF、
M、Wahl、K、Y、Wong及びR,G、Ca5e
yによる論文“BlockSegmentation 
and Text Extraction inMix
ed Text/In+age Documents”
は、印刷文書のテキスト領域及び非テキスト領域を自動
的に区別する方法を示している6 The 6th International Con
ference onPattern Recogni
tion、1982年10月のRoG、Ca5ey及び
G、Nagyによる論文“Recursive seg
mentation and classificat
ionof composite character
 patterns”は、文字を効率的に切出しそして
認識するために如何に決定ツリ方法を用いるかを示して
いる。
IEEE Transaction on Infor
mation Theory、 1984年1月、第1
730巻第1号の第93−99頁のR,G、Ca5ey
及びG、Nagyによる論文“Decision Tr
ee Design Using aProbabil
istic Model”及びIBMテクニカル・ディ
スクロジャ・ブリティン、1979年8月、第22巻、
第3号の第1189頁のR,G。
Ca5eyによる論文“Automatic gene
rationof OCRlogic from 5c
anned characters”は、画素の確率か
ら決定ツリーの数学的モデルを作ることを示している。
IEEE  6th  International 
 Conference  onPattern Re
cognition、 1982年10月のK。
Y、Wong、R,G、Ca5ey及びF。
W a h 1による論文”Document Ana
lysis System”は、文書をテキスト領域及
び非テキスト領域に区切って読取る適応性OCRを示し
ている。
IEEE ?th International Co
nference onPattern Recogn
ition、 1984年8月のR,G。
Ca5ey、S、に、Chai及びに、Y。
W o n gによる論文“Unsupervised
construction of decision 
networks forpattern class
ification”並びにR,G。
casey及びT、D、Friedmanによる米国特
許第4499596号は共に、全体のパターンを比較す
る前にテキスト文字の画素のいくつかを前以って調べる
ことにより認識の速度を高めることを示している。
IBMテクニカル・ディスクロジャ・ブリティン、19
87年8月、第30巻第3号の第1112−1114頁
の論文”Automatic Font5electi
on for Character Recognit
ion”は、文書の文字が複数個のタイプ・フォントの
うちどのフォントで印刷されているかを調べることを示
している。
司 弘を解 するための パターン若しくは文字認識アルゴリズム即ち文字認識手
段の制御のもとに文書走査装置は、文書上のパターン若
しくは文字のイメージを光学的に走査し、そしてこのイ
メージを表わす2進1若しくは0のイメージ・データを
発生する。本明細書では説明を簡略化するために、この
2進1若しくは0のイメージ・データを単にパターン若
しくは文字のイメージと呼ぶ。文書1ページのパターン
若しくは文字のイメージは文字認識アルゴリズムの制御
のもとにイメージ・バッファに記憶される。
そして個々のパターン若しくは文字のイメージが切出さ
れて作業バッファに記憶される。文字認識アルゴリズム
は作業バッファ内のイメージを認識しそしてその結果を
結果バッファに記憶する。文字認識アルゴリズムは、認
識の確率の高い文字に対してはこれの文字コードを結果
バッファに記憶し、認識の確率の低い文字に対してはこ
れの文字コード及びイメージを、確率の低いことを表わ
すフラグと共に結果バッファに記憶する。そして文字認
識アルゴリズムは結果バッファの内容を表示装置の表示
スクリーン上に表示する。操作者は表示された認識結果
を見て、そして誤って認識された文字の文字コードをキ
ーボードを介して指摘しそして結果バッファの文字コー
ドを正しい文字コードに訂正することができる。ここか
ら認識結果に基づくツリーの修正動作が始まる。文字認
識アルゴリズムは、上記誤って認識された文字のイメー
ジ及び正しい文字コードを学習バッファに記憶する。
文字認識アルゴリズムは、学習バッファの文字イメージ
の各ベルを、走査ウィンドウを用いることにより逐次的
に走査する。このウィンドウの大きさは例えば3X3ペ
ルである。ウィンドウの中心ベルは文字イメージの処理
されるべきベルに位置決めされる。文字認識アルゴリズ
ムは中心ベルの周辺の近隣ベルのビット・パターンをア
ドレスとして用いて統計テーブルの1つのエントリィを
アクセスする。アクセスされたエントリィには処理中の
ベルの黒の確率値が記憶されている。文字認識アルゴリ
ズムはこの確率値を取出しそしてこの確率値を、確率マ
ツプのうち上記中心ベルに対応する記憶位置に記憶する
0文学認識アルゴリズムは、確率マツプの値を文字認識
ツリーに入力として与えて、高い確率値を生じる葉ノー
ドを検出し、この葉ノードに割当てられている文字コー
ドの文字イメージを取出し、この文字イメージの確率マ
ツプを形成する。次に、文字認識アルゴリズムは、各記
憶位置毎に、両確率マツプの値を比較し、一方の確率値
が高くそして他方の確率値が低い記憶位置を検出し、上
記検出された葉ノードに最初に割当てられた文字コード
を、上記検出された記憶位置のアドレスに代え、この葉
ノードから2つのノードを延長し、この延長されたノー
ドの一方に上記葉ノードに最初に割当てられた文字コー
ドを割当て、そして他方のノードに学習バッファの文字
イメージの文字コードを割当てる。文字認識アルゴリズ
ムは結果バッファの文字コードをデータ処理装置等に送
ると共に、修正された文字認識ツリーをツリー・メモリ
に新たに記憶する。
従ってこの新たなツリーは以後の文字認識動作において
用いられる。
去11し贋l吸 第1図及び第2図を参照するに、第1図は学習機能によ
って文字認識ツリーを修正するための本発明に従がう回
路ブロック図を示し、第2A乃至第2E図は第1図の回
路ブロックの動作を示すフローチャートである。
文書走査装置1は、文書給送機構、光源、レンズ、1列
に配列された複数個の光学的感知素子及び閾値回路を含
む従来から知られている装置である。光学的感知素子の
数は例えばinn当り8個である。即ち、主走査方向の
画素(ベル)@度は200ペル/2.5aaであり、又
主走査方向と交差する副走査方向の画素密度も例えば2
00ペル/2.5国である。1つの光学的感知素子は1
つのペルのアナログ信号を発生し、そしてこのアナログ
信号は閾値回路に印加され、アナログ信号が所定閾値よ
りも低い場合には黒ベルを表わす2進1信号が発生され
、そしてアナログ信号が閾値よりも高い場合には白ベル
を表わす2進0信号が発生される。これらの動作は第2
A図のブロック21及び22により行なわれる。文書は
複数の文字行を有し、1文字行は例えば平均的に50個
の印刷英数字を含む。文書の読取動作は1行づつ行なわ
れ、1頁分の文字イメージがイメージ・バッファ2に記
憶される。この動作は第2A図のブロック23により行
なわれる。文字切出し論理回路3も又従来の型のもので
、イメージ・バッファを走査して第1番目の行の各文字
に外接する四角形を見い出すことにより第1番目の各文
字を切出す。1行の文字全てが切出され、そして作業バ
ッファ4の9×11ベルのフレームに記憶され、この時
文字イメージの中心が9×11ベルのフレームの中心に
合わされる。これらの動作は第2A図のブロック24及
び25により行なわれる。例えばマイクロプロセッサ等
の制御装置5が上記の動作を制御する。
次の動作の説明を行なう前に文字のタイプ・フォント及
びツリー・メモリ6について説明する。
文書の文字は種々なタイプ・フォントで印刷される。タ
イプ・フォントは例えば10ピツチ・グループ、12ピ
ツチ・グループ、レター・ゴシック・グループ、オレー
タ・グループ及びプロポーショナル・グループに分けら
れ、そして10ピツチ・グループは、フーリエ10、パ
イ力10、プリステージ・パイ力10、タイタン10の
タイプ・フォントを含み、12ピツチ・グループはフー
リエ12、エリート12、プリステージ・エリート12
、OCRB12のタイプ・フォントを含み、レター・ゴ
シック・グループはオレータ、プリゼンタのタイプ・フ
ォントを含み、そしてプロポーショナル・グループは、
ボールド、キュービック/トライアート、ローマン、タ
イトルのタイプ・フォントを含む、ツリー・メモリ6は
上記18種類のタイプ・フォント毎の文字認識ツリー、
文字イメージ及び文字コードを記憶している。第1図を
参照するに、ツリー・メモリ6は18個のメモリ・スペ
ースに分けられている。1つのタイプ・フォントに1つ
のメモリ・スペースが割当てられている。第1図では、
4つのメモリ・スペース6A、6B、6C及び6Dだけ
が示されている。メモリ・スペース6Aはタイプ・フォ
ント“フーリエ10”のための1組の文字認識ツリー即
ち3つの文字認識ツリー6E、6F及び6G、このタイ
プ・フォントの全文字のイメージ及び文字コードを記憶
している。同様に、メモリ・スペース6B、6C及び6
Dもパイ力10、エリート10及びオレータの夫々の文
字認識ツリー、全文字イメージ及び全文字コードを記憶
している。
さて、前記第2A図のブロック25の動作の後に、制御
回路5は文字認識論理回路10を動作させる。文字認識
論理回路10は、ブロック26において、ツリー・メモ
リ6の任意のメモリ・スペースから1組の文字認識ツリ
ーを及び全文字コードを取出す。例えば、メモリ・スペ
ース6Aのり一すエ10用の文字認識ツリー6E、6F
及び6G及び全文字コードが取出されるとする。動作は
ブロック27に進み、文字L&識論理回路10は作業バ
ッファの最初のフレームをアクセスして第1番目の文字
行の最初の文字イメージを取出し、この第1番目の文字
イメージを第1番目の文字認識ツリー6Eを用いて認識
し結果を補助バッファ(図示せず)に記憶する1次に、
文字認識論理回路10は、第2番目の文字認識ツリー6
Fを用いて第1番目の文字イメージを認識し、結果を上
記補助バッファに記憶する。次に文字認識論理回路10
は、第3番目の文字認識ツリー6Gを用いて第1番目の
文字イメージを認識し、結果を上記補助バッファに記憶
する0次に、文字認識論理回路10は補助バッファの3
つの結果を調べ、この結果に依存して次のようにして第
1文字の最終結果を生じる。
場合1:認識の正確度が所定値以上の時は結果バッファ
7に文字コードを記憶する。
場合2;認識の正確度が所定値よりも低い時は、結果バ
ッファに認識結果である文字コード及びこの文字のイメ
ージを記憶し、更しこフラグを1にセットする。フラグ
1はリジェクト文字であることを表わす。
上記の文字イメージの認識動作の例を第3A、3B及び
3G図を参照して説明する。第1文字行の第2及び3番
目の文字tL B ++及びLI M II例えばフー
リエ10のタイプ・フォントでタイプされ第1−第番目
の文字II A IIは異なるタイプ・フォントでタイ
プされたものと仮定する。これらの文字イメージ31−
33は作業バッファ4の3つのフレームに記憶され終え
ている。
第3B図は、第1図に示したフーリエ10のメモリ・ス
ペース6Aの3つの文字認識ツリー6E、6F及び6G
のうちツリー6Eを簡略化して示す。
文字認識ツリーはフレームのうちの所定のベル位置が黒
か白のどちらであるかを判別してその結果に応じて次の
ベル位置が黒か白のどちらであるかを判別してツリーを
たどり最終結果を得る。即ち、ツリー6Eは最初の根ノ
ード301においてフレームのベル・アドレス(4,6
)を選択し、このアドレスのベルが黒であるか白である
かを調べ、その結果に基づいて次の枝ノード302又は
303に進む。この場合答は白なので枝ノード302に
進みこのノード302でアドレス(4、O)のベルを選
択しそしてこのベルが黒であるか白であるかを調べる。
答は黒なので次の技ノード304に進み、アドレス(8
,5)のベルの白黒を調べる。答は白なので葉ノード3
05に進み認識結果Bを得る。即ち、第1文字はIt 
A ++であるにもかかわらず文字認識ツリー6Eはこ
の第1文字を“B ++と認識したことになる。この第
1文字が第3A図の参照番号34で示すフーリエ10の
タイプ・フォントであるならばツリー6Eはノード30
1からノード303及びノード306を経て葉ノード3
07に進み答II A 11を生じる。実際の認識結果
は上述の如< 1lBI+であるので文字認識論理回路
10は、文字“B ++の文字コード及び正確度を補助
バッファ゛(図示せず)に記憶する。
次に文字認識論理回路10はツリー6Fを用いて第1文
字11 A ++を再び認識し結果を補助バッファに記
憶し、次いでツリー6Gを用いて第1文字11 A +
+を再び認識し、結果を補助バッファに記憶し、これら
の3つの結果に基づいて最終結果を生じる。尚、3種類
のツリーを用いて文字を認識することは前述の文献(1
)に更に詳細に示されている。
上記第1文字の最終結果が′B″であるとする。
文字認識論理回路10は、第1図の結果バッファ7の領
域7Aの第1文字の位置に文字It B 71の文字コ
ードを記憶する。同様にして、文字認識論理回路10は
作業バッファ4の第2番目のイメージ”B 11を取出
し1文字認識ツリー6E、6F及び6Gを用いることに
より順次認識して最終結果を生じてこれを結果バッファ
7の領域7Aの第2番目の文字の列に記憶する。このよ
うにして第1番目の文字行の全文字即ち約50文字のイ
メージをL2識して夫々の最終結果を結果バッファ7の
領域7Aに記憶する。第3B図の文字認識ツリー6Eは
簡略化して示しであるが、実際のツリーは例えば10−
11の決定ステップを含み、総ノード数が2999の時
葉ノードの数は1500である。
ここで第1文字行を認識した結果第4番目の実際の印刷
文字がII Q IIであるにもかかわらず、認識の最
終結果が0でありそしてその正確度が低く、そして第2
5番目の実際の印刷文字が11 P Itであるにもか
かわらず、認識の最終結果がII R”でありそしてそ
の正確度が低かったものと仮定する。
この場合、文字認識論理回路10は第1図の結果バッフ
ァ7の領域7Aの第4文字の位置にフラグ1をセットし
、文字rr Onの文字コード、及び実際の印刷文字I
t Q ++のイメージを記憶し、そして第25文字の
位置にフラグ1をセットし、文字11 RITの文字コ
ード及び実際の印刷文字11 P ++のイメージを記
憶する。そして、文字認識論理回路10は領域7Aのフ
ラグの数に基づいてリジェクト率を計算して記憶する。
図示の例では50文字のうち2つの文字についてフラグ
1がセットされているのでリジェクト率は4%であり、
この4%が記憶される。
次に、ブロック28において全フォント即ち説明中の例
では18種類のフォントの全てが用いられたか否かが調
べられる。もしも答がノーであるならばブロック26に
戻りツリー・メモリ6のうち次のフォントのメモリ・ス
ペースがツクセスされて上述の動作を繰返す、又、ブロ
ック28は前文字行の処理中に学習バッファ9に文字コ
ード及び文字イメージが記憶されている時にイエスの出
力を生じる。
18種類のタイプ・フォントのためのツリーを用いて第
1文字行の認識が終るとブロック28の答えはイエスと
なり、そして第1図の結果バッファの18の領域7A、
7B、・・・・・・7Nには認識の結果が記憶されてい
る。尚、簡略化のために領域7B、7Nにはりジェクト
率のみが示されている。
次に、動作は第2B図のブロック29に進み、文字認識
論理回路10は、結果バッファ7の18の領域7A・・
・・・・7Nの夫々のりジエクト率を調べ、リジェクト
率が最も近いフォントを選択し、このフォントのツリー
を以下の処理において使用する。
第2図の結果バッファ7に示されているように、領域7
A即ちフーリエ10のリジェクト率が最も低いものとす
る。次に、文字認識論理回路10は第2B図のブロック
30においてフーリエ1oのリジェクト率4%が0%に
等しいか否かを調べる。
答はノーなので動作はブロック31に進む。もしもブロ
ック30の答がイエスならば、動作は第2A図のブロッ
ク24に戻り次の文字行の文字イメージの処理を開始す
る。
ブロック31において、結果バッファ7の領域7Aに記
憶されている第1文字行の文字コードを文字発生回路(
図示せず)に送り、文字発生回路からの文字イメージを
第1図の表示スクリーン8の表示領域に表示し、そして
フラグ1がセットされている第4文字及び第25文字を
ブリンク又はハイライトで表示する。更に、作業バッフ
ァ4に記憶されている第1文字行の全文字のイメージを
表示スクリーン8の表示領域8Bに表示する。
従って、操作者は表示スクリーン8の表示領域8Aの認
識結果と表示領域8Bの文書の実際の文字イメージとを
比較することができ、そして第1番目の文字にカーソル
を位置づけてキーボード(図示せず)から文字11 A
 77の文字コードを入力して結果バッファ7の領域7
Aの第1文字の文字コードをII B 71から11 
AIIに修正し、次に第4番目の文字の下にカーソルを
位置づけて文字11 Q IIの文字コードを入力して
領域7Aの第4文字の文字コードを0”から“Q 11
に修正し、そして第25番目の文字にカーソルを位置づ
けて文字1gP″′の文字コードを入力して領域7Aの
第25文字の文字コードをパR″′から“P′″に修正
することができる。即ち、この段階で、結果バッファ7
には1行の全文字の正しい文字コードが記憶されている
第2B図のブロック32は、上記の操作者による入力が
行なわれた否かを調べ、もしも答がノーであればブロッ
ク34に進み、そしてもしも答がイエスであれば、ブロ
ック33に進む。
ブロック33では、最初、結果バッファ7の領域7Aの
第1文字の修正された文字コードA及び作業バッファ4
の第1文字のイメージAを学習バッファ9の最初の位置
に図示のように記憶し1次に領域7Aの第4文字の修正
された文字コードQ及び文字イメージQを学習バッファ
9の次の位置に記憶し、そして領域7Aの第25文字の
修正された文字コードP及び文字イメージPを学習バッ
ファ9の次の位置に記憶する。即ち、1文字行のr!識
が終る毎に、操作者による修正が行なわれたか否かを調
べ、修正が行なわれるとその内容を学習バッファ9に記
憶していく。もしも新たに修正された文字が既に学習バ
ッファ9の文字と同じなら、新たな文字を記憶しない、
そして更に、結果バッファ7の1文字行の文字コードを
出力バッファ13には1文字行の処理が終了する毎に正
しい文字コードが記憶される。このようにしてブロック
33の動作が終了すると、動作はブロック34に進む、
ブロック33において、学習バッファ9に文字コード及
びイメージが記憶された後は、以下の文字行即ち説明中
の例では第2番目の文字行以降の処理においては第1文
字行の認識で用いたツリーを用いる。即ち、ブロック3
4の答がノーとなって、そして動作がブロック24に戻
り次にブロック25を介してブロック26に進んだ時、
次の1組のツリーを取出すのではなく、前文字行(即ち
第1文字行)で用いた1組のツリーを用いて認識を行な
う9更に、ブロック28はイエスの出力を生じる。
ブロック34は文書1ページの全文字行が処理され終え
たか否かを調べ、もしもノーであれば第2A図のブロッ
ク24に戻り残りの文字行の処理を行ない、もしもイエ
スであるならば第2C図のブロック35へ進む。
ブロック35において、文字認識論理回路10は学習バ
ッファ9の最初の位置から文字コードA及び文字イメー
ジAを取出し、そしてブロック36の動作に進む。
ブロック36の動作を説明する前にこのブロック36で
用いる3X3ペル・ウィンドウ41(第4図)、統計テ
ーブル11(第1図)及びマツプ・バッファ12(第1
図)を説明する。
3X3ペル・ウィンドウ41のベル位置のうち周辺の8
ベルは第5図に示すようにベル・アドレスが割当てられ
、この3×3ベル・ウィンドウ41はこれの中心ベルX
が第4図に示すように文字イメージの左上角のベルに重
なるように位置づけられる。統計テーブル11は表1に
示すように、3×3ベル・ウィンドウ41の中心ベル即
ち処理されつつある現ペルXの黒の確率を記憶している
アドレス1のビットは最上位ビット(M S B )で
ありアドレス8のビットは最下位ビット(LSB)であ
る。マツプ・バッファ12は領域12A及び12Bを有
し、これら領域の夫々の大きさは、第1図の作業バッフ
ァ4のフレームと同じ寸法、即ち9X11ベルである。
即ち、領域12A及び12Bの寸法は第3A図のイメー
ジ31.32及び33と同じである。
さて、ブロック36の動作を説明すると、文字認識論理
回路10は、3×3ベル・ウィンドウ41の現ペルXを
第4図に示すように文字ri A I+の文字イメージ
31の左上角のベルに位置決めする。
ここで第4図の2進0,1のパターンは第3A図のイメ
ージ31を表わす、イメージ31の外側にある3X3ペ
ル・ウィンドウ41のアドレス1.2.3.4.8の2
進値はOである。この場合、ウィンドウ41のアドレス
】〜8は2進値oOOoooooで表わされる。文字認
識論理回路10は上記2進値をアドレスとして統計テー
ブル11をアクセスする。次に1表1を示す。
10    0000’1O102 440010’1lOO40 1000110’0100     100199  
  1100’0111        3前述の如く
、3X3ペル・ウィンドウ41の現ペルXが第4図の文
字イメージ31の左上角(Olo)のベルに位置決めさ
れている時、この現ペルXの周辺ベル即ちベル・アドレ
ス1−8のベルはooooooooである。文字認識論
理回路10は、上記ビット・パターンoooooooo
をアドレスとして用いることにより統計テーブル11の
エントリィOをアクセスして、この現ペルXが黒である
確率値0%を読出し、そしてこの値0を。
第6図に示すように、マツプ・バッファ12の領域12
Aの左上角(Olo)の位置に書込む。
次に1文字認識論理回路10は、第4図のイメージ31
上でウィンドウ41を右方向に1ベル位置だけベル・ア
ドレス(1,0)に動かす。この場合、ウィンドウ41
のアドレス1−8のビット・パターンはooooooo
oであり、文字認識論理回路10はこのビット・パター
ンをアドレスとして用いて統計テーブル11をアクセス
して確率値Oを領域12Aのベル・アドレス(1,0)
に書込む、このようにして、文字認識論理回路10はウ
ィンドウ41を右方向に頭次シフトしてイメージ31の
第1ベル行の各ベル位置の黒の確率をマツプ・バッファ
12の領域12Aに順次書込む。
第1行の処理を終了した後、文字認識論理回路↓Oはウ
ィンドウ41を第2ベル行の最初のベル位置(0,1)
に位置づけ、第2ベル行の処理を行ない。以下、同様に
して全ペル行の処理を行なう。
第6図は文字“A”のイメージ31の各ベル位置の黒の
確率値を示す。
例えば第4図のベル位置(4,0)にウィンドウ41の
現ペルXが位置づけられた時には、周囲ベルのパターン
は10001101であり、そして統計テーブル11の
エントリィ141がアクセスされ、確率値95%が第6
図の領域12Aのベル位置(4,0)に書込まれる。又
、第4図のベル位置(2,2)にウィンドウ41の現ペ
ルXが位置づけられた時には、周囲ベルのパターンは0
0010010であり、そして統計テーブル11のエン
トリィ18がアクセスされ、そして確率値26%が第6
図の領域12Aのベル・アドレス(2,2)に書込まれ
る。
次に、動作は、第2C図のブロック37に進み、文字認
識論理回路10は、第2B図のブロック29で選択した
文字認識ツリー即ち、フーリエ10の3つのツリー6E
、6F及び6Gの夫々に、領域12Aの確率値を入力す
る。この動作を第3B図のツリー6Eについて説明する
。ツリー6Eの根ノード301はベル位置(4,6)を
選択する。
従って第6図の領域12Aの位置(4,6)の確率値7
0が取出される。この確率値70は、第3A図の文字“
A”のイメージを100回文書上の異なる位置に印刷し
た場合1紙の表面の状態、インク・リボンのインク分布
等に起因して、100個のうち70個即ち70%の文字
のベル位置(4,6)が黒として印刷され、そして30
個即ち30%の文字のベル位N(4,6)が白として印
刷されることを表わす、この確率値を入力した時の動作
を第3D図を参照して説明する。上述の説明から、根ノ
ード301の白出力の確率は30%であり、そして黒出
力は70%である。次に、枝ノード302及び303で
同じ動作が行なわれる。枝ノード302において第6図
の領域12Aの位置(4、O)の確率値95%が取出さ
れる。従って、枝ノード302の白出力の確率は30%
×5%=1.5%であり、そして黒出力の確率は30%
×95%=28.5%である。次に、枝ノード308に
おいて領域にAの位置(1,1o)の確率68%が取出
される。枝ノード308の黒出力の確率は、1.5%×
68%=1.02%であり、これが葉ノード311の確
率値である。そして白出力の確率は、1.5%X32%
=0.48%であり、これが葉ノード310の確率値で
ある。
枝ノード304において領域12Aの位置(8,5)の
確率0%が取出される枝ノード304の黒出力の確率は
、28.5%×0%=O%であり、そしてこれが葉ノー
ド312の確率値である。枝ノード304の白出力の確
率は、28.5%×1oO%=28.5%であり、そし
てこれが葉ノード305の確率値である。同様な動作が
枝ノード303.306及び309.並びに葉ノード3
07及び313で行なわれて、そして第3D図に示す確
率値が発生される。ここで、枝ノード309へ与えられ
る確率値は0%であることに注目されたい。枝ノードに
与えられる確率値が0%の場合には、この枝ノードの黒
及び出出力の確率値は両方共0%であるので、動作はこ
の枝ノードで終了する。次に動作はブロック38に進み
、文字認識論理回路10は、各葉ノードの確率値を予定
の閾値例えば2%と比較し、この閾値よりも高い確率値
を有する葉ノードを選択し、更にこれら選択した葉ノー
ドのうち1つを選択する。説明中の例では、第3D図の
葉ノード305及び307が選択され更にこのうち葉ノ
ード305が最初に選択される。説明中の例では2つの
葉ノードだけが選択されたが、実際のツリーは前述の如
く、例えば1500の葉ノードを有するので、閾値より
も大きい確率値を有する葉ノードの数は10−20とな
る。
次に動作はブロック39に進み1文字認識論理回路10
は、現在処理中の学習バッファ9内の文字コードAが葉
ノード305の文字コードBと同じであるかどうかを調
べる。答はノーであるので動作は第2D図のブロック4
oに進む。もしも答がイエスであれば、現在処理中の葉
ノードを更に処理することなく後述のブロック44に進
む。
ブロック4oでは、文字認識論理回路10は、葉ノード
305の文字イメージをツリー・メモリ6から取出す。
説明中の例では葉ノード305の文字Bの文字イメージ
がツリー・メモリのメモリ・スペース6Aから取出され
る。動作はブロック41に進み、文字認識論理回路10
は、ブロック40で取出した文字Bの文字イメージの全
ベルの黒の確率を計算してマツプ・バッファ12の領域
12Bに書込む、このブロック41の動作は、ブロック
36の動作と同じである。即ち、第5図の3×3ベル・
ウィンドウ41を用いて、第4図の動作と同様にして、
文字Bの文字イメージを走査する。そしてウィンドウ4
1のベル・アドレス1−8のビット・パターンをアドレ
スとして用いて統計テーブル11をアクセスして確率値
をマツプ・バッファ12の領域12Bに書込む、第7図
はこのようにして領域12Bに書込まれた文字Bの各ベ
ル位置の確率を示す。
次に、動作はブロック42に進み、文字認識論理回路1
0は、マツプ・バッファ12の領域12A及び12Bの
同じベル位置の確率値を位置(0゜0)から順次比較し
て、一方が低く例えば0%であり、他方が高く例えば1
00%である位置を見出す。即ち、2つの値の差が最大
値となる位置を検出する。説明中の例では文字認識論理
回路1゜は、位置(1,1)において、領域12Aの確
率値は0%であり、他方領域12Bの確率値は100%
であることを見出す。
動作はブロック43に進み、文字認識論理回路1oは、
上記ブロック38で選択した最初の葉ノード305の文
字コードを消去して、そしてブロック42で見出した位
置アドレス(1,1)を書込み、そしてこの葉ノード3
05から第3E図に示すようにノード316及び317
を延長する。
そして文字認識論理回路10は、ノード305の蒸出力
に接続されている延長ノード317に、位置(1,1)
の確率値が高い方の文字即ち文字Bのコードを書込み、
そしてノード305の出出力に接続されている延長ノー
ド316に、位置(1,1)の確率値が低い方の文字即
ち文字Aの文字コードを書込む。
次に動作はブロック44に進み、文字認識論理回路1o
は、ブロック38で見出した全ノードの処理が終了した
か否かを調べる。説明中の例では、まだノード307の
処理が終了していないのでブロック44の答はノーであ
り、動作は第2C図のブロック38へ戻る。ブロック3
8において1文字認識論理回路1oは、未処理の葉ノー
ド307を選択し、ブロック39において、葉ノード3
07の文字Aの文字コードが学習バッファ9の文字Aの
文字コードと同じかどうかを調べる。ブロック39の答
はノーなので、第2D図のブロック44に進み、全ての
葉ノード即ち305及び307の処理を終了したことを
検出する。そして動作は第2E図のブロック45に進み
、−組のツリー6E、6F及び6Gのうち全てのツリー
の処理が終了したかどうかが調べられる。説明中の例で
は。
ツリー6F及び6Gがまだ処理されていないので動作は
ブロック37に戻る。3つのツリー全ての修正が行なわ
れるとブロック45の答はイエスとなり、ブロック46
に進む。ブロック46において、文字認識論理回路10
は、学習バッファ9の全ての文字が処理され終えたかど
うか即ち文書1ページで見出された修正されるべき文字
の全てが処理され終えたかを調べる。ブロック46の答
がノーであれば、動作はブロック35に戻り、そして答
がイエスであれば動作はブロック47に進む。
ブロック47において1文字認識論理回路10は。
1ペ一ジ分の認識結果即ち、出力バッファ13の全文字
コードを出力し、そして修正された一組のツリー、全文
字コード及び全文字イメージをツリー・メモリ6の空の
メモリ・スペースに記憶する。
そしてブロック48において認識及びツリー修正動作を
終了する。
第8図は、第3B、3D及び3F図に示されたノードに
おける動作を示す。マツプ・バッファ12の確率値をツ
リー6Eの例えば第3D図の枝ノード302の動作を第
8図を参照して説明する。
枝ノード302への入力である確率値は30%であるの
で第8図のブロック81への入力確率値Pは30%であ
る。ブロック81において、このノード302が指定す
るアドレス即ち(4,0)のベルに対応する確率値Q即
ち95%が第6図の領域にAから取出される。次に、ブ
ロック82においてPXQの値即ち30X95%=28
.5%が計算されて閾値例えば1%と比較される。この
場合、ブロック82の答はイエスなのでこのノード30
2はブロック83においてPXQ=28.5%を第3D
図に示すように思出力に生じる。次に、ブロック84に
おいてpx (100−Q)即ち30X (100−9
5)=1.5%を閾値1%と比 −較する。この場合、
ブロック84の答はイエスなのでノード302の白出力
に1.5%が発生される。
次に、2進1(即ち黒100%)若しくは2進0(黒O
%)で各ベルが表わされそして作業バッファ4に記憶さ
れている文字イメージの認識動作について説明する。
ノードが前のノードの思出力に接続されているとすると
このノードへの入力確率Pは100%である。ブロック
81における確率値Qは文字認識時には100%か0%
である。確率値Qが100%であるとするとブロック8
2のPXQは100%となりブロック83においてこの
ノードの黒白出に100%を生じる。ブロック84の答
はノーであるのでこのノードの白出力には何も発生され
ない。
第2D図のブロック43は次のような附加的動作を行な
う、即ち、延長した葉ノード316及び317に文字A
及びBの文字コードを夫々割当てた後に、文字A及びB
の認識確率をこれらのノードに記憶しておく、これは次
のようにして計算される。
修正される前のノード305の文字Bの認識確率が40
%であるとする。このノード305がら延長された最終
ノードである葉ノード316及び317の文字認識確率
は、ノード305の文字Bの認識確率40%、ノード3
05への入力確率28.5%、マツプ・バッファ12の
領域12A及び12Bのうちノード305に新たに割当
てられたアドレス(1,1)の確率値により決められる
葉ノード316の認識確率は次のようにして計算される
。ノード305における文字Aのベル位置が黒となる確
率は第6図のアドレス(1,1)から明らかなように0
%である。即ち、白となる確率が100%である。従っ
て、葉ノード316で文字Aを認識する確率は、28.
5%×100%=28.5%であり、一方文字Bを認識
する確率は40%XQ%=0%となる。
葉ノードの認識確率は次のようにして計算される。ノー
ド305における文字Bが黒となる確率は第7図のアド
レス(1,1)から明らかなように100%である。従
って、葉ノード317で文字Bを認識する確率は、40
%×100%=40%であり、一方文字Aを認識する確
率は28.5%×o%=0%となる。これらのノード3
16及び317に新たに与えられた認識確率は、第2A
図のブロック27において用いられる。
説明を簡単化するために1作業バッファ4のフレームは
9X11ベルの寸法を有するとして説明したが、実際に
は大きな寸法例えば32X40ペルを有する。
実施例の説明は、文字認識ツリーの学習動作即ちツリー
の修正動作に向けられたが、本発明は、文字の特徴を抽
出してこの特徴を表わす特徴リストを文字毎に記憶して
おくことによって文字認識を行なうアルゴリズムにおい
て用いられることができる。
又、パターンとして英数字のパターンの認識及び学習動
作を説明したが、英数字の代わりに日本字又は指紋を用
いることができる。
実施例では、1文字行の認識毎に誤って認識された文字
の文字コードを正しい文字コードに訂正したが、この動
作は複数行おきに行なわれることができる。又、1ペー
ジの文書の認識終了毎にツリーを修正したが、この動作
は複数ページ終了毎に行なわれることができる。
発明の効果 本発明の作用効果は、文字認識ツリーを修正する時間が
短かいこと、修正に要する記憶領域が少ないこと、操作
者の介在が最小であること、本来の認識動作を行なって
いる間にツリーの修正が行なわれること、学習及び修正
を行なうのに最小数のサンプルしか必要としないことで
ある。
【図面の簡単な説明】
第1図は本発明の文字認識装置のブロック図、第2A図
、第2B図、第2C図、第2D図及び第2E図は、本発
明の文字認識方法の認識及びツリー修正工程を示すフロ
ーチャート、第3図及び第3A図は文字イメージを示す
図、第3B図は文字認識ツリーを示す図、第3C図はツ
リー・メモリの1つのメモリ・スペースに記憶される一
組のツリーを示す図、第3D図は第3B図のツリーにマ
ツプ・バッファの確率値を入力する動作を示す図、第3
E図は、ツリーの1つの葉ノードを延ばす動作を示す図
、第4図は文字イメージをウィンドウにより走査する動
作を示す図、第5図はウィンドウのアドレスを示す図、
第6図及び第7図は文字A及びBのイメージの各ベル位
置の確率値を記憶するマツプ・バッファの2つの領域を
示す図、第8図はツリーのノードの動作を示すフローチ
ャートである。 1・・・・文書走査装置、2・・・・イメージ・バッフ
ァ、3・・・・文字切出論理回路、4・・・・作業バッ
ファ、5・・・・制御装置、6・・・・ツリー・メモリ
、6A、6B、6C56D・・・・メモリ・スペース、
7・・・・結果バッファ、8・・・・表示スクリーン、
9・・・・学習バッファ、10・・・・文字認識論理回
路、11・・・・統計テーブル、12・・・・マツプ・
バッファ。 13・・・・出カバソファ。 01234567B 第3図 第3A図 工      工      工 ′L二二 3×3べ°1し・ウィンVう 01° 2345678 第4図 第5図 入力1卆1 第8図

Claims (13)

    【特許請求の範囲】
  1. (1)パターンのイメージを記憶する第1メモリと、複
    数の認識ステップを含むパターン認識手順により誤って
    認識されたパターンのイメージを記憶する第2メモリと
    、 上記パターンのイメージの画素に黒が現われる確率を表
    わす値を夫々記憶する複数の記憶位置を有する確率マッ
    プを発生する手段と、 上記値を上記パターン認識手順に入力として与え上記誤
    り認識を生じた認識ステップを検出する手段と、 上記パターンのイメージを正確に認識するように上記検
    出された認識ステップを修正する手段とを含むパターン
    認識装置。
  2. (2)上記パターン認識手順は、根ノード、複数個の枝
    ノード及び夫々文字コードが割当てられている複数個の
    葉ノードを有する認識ツリーであり、上記パターンは文
    字のパターンであることを特徴とする特許請求の範囲第
    (1)項記載のパターン認識装置。
  3. (3)上記認識ツリーの各ノードは、上記パターンのイ
    メージの選択された画素のアドレス・データを記憶し、
    後続ノードに夫々接続された2つの出力を有し、そして
    上記選択された画素に黒が現われる確率を表わす値に依
    存する出力を発生することを特徴とする特許請求の範囲
    第(2)項記載のパターン認識装置。
  4. (4)上記パターンのイメージの画素の夫々は2進1若
    しくは0により表わされることを特徴とする特許請求の
    範囲第(1)項記載のパターン認識装置。
  5. (5)上記認識ツリーは、文字パターン及び文字コード
    と共にツリー・メモリに記憶されていることを特徴とす
    る特許請求の範囲第(2)項記載のパターン認識装置。
  6. (6)文書の文字のイメージを記憶するイメージ・バッ
    ファ、1文字行の複数文字のイメージを個別の文字イメ
    ージに区切る手段、上記1文字行の上記区切られた文字
    のイメージを上記第1メモリに記憶する手段を含むこと
    を特徴とする特許請求の範囲第(1)項記載のパターン
    認識装置。
  7. (7)上記第1メモリは作業バッファであることを特徴
    とする特許請求の範囲第(6)項記載のパターン認識装
    置。
  8. (8)上記1文字行の区切られたイメージを認識し、認
    識結果を結果バッファに記憶し、上記誤って認識された
    文字のイメージ及び文字コードを学習バッファに記憶す
    る手段を含むことを特徴とする特許請求の範囲第(1)
    項記載のパターン認識装置。
  9. (9)上記学習バッファに記憶された文字のイメージを
    取出し、上記イメージの画素に黒が現われる確率を表わ
    す値を決定する手段を有することを特徴とする特許請求
    の範囲第(1)項記載のパターン認識装置。
  10. (10)上記値を決定する手段は、上記文字のイメージ
    の各画素及び該画素の近隣画素を逐次的に走査し、該近
    隣画素のパターンをアドレスとして用いることにより統
    計テーブルのエントリィをアクセスし、上記近隣画素に
    より囲まれた上記中心画素に黒が生じる確率を表わす値
    を上記エントリィから取出し、該取出した値を、上記確
    率マップのうち上記中心画素の位置に対応する記憶位置
    に記憶することを特徴とする特許請求の範囲第(9)項
    記載のパターン認識装置。
  11. (11)上記認識ステップを検出する手段は、上記確率
    マップの上記値を上記認識ツリーに入力データとして供
    給し、上記学習バッファに記憶されている上記文字を認
    識する確率の高い値を発生する上記認識ツリーの葉ノー
    ドを検出し、該検出された葉ノードに最初に割当てられ
    た文字コードの文字のイメージを取出し、該取出された
    イメージの確率マップを発生し、各記憶位置毎に、上記
    前者の確率マップの値を、上記後者の確率マップの値に
    比較し、両確率マップの一方の値が高くそして他方の確
    率マップの値が低い記憶位置を検出することを特徴とす
    る特許請求の範囲第(1)項記載のパターン認識装置。
  12. (12)上記修正する手段は、上記検出された葉ノード
    に最初に割当てられた文字コードを、上記検出された記
    憶位置のアドレスに代え、上記葉ノードから2つのノー
    ドを延長し、該延長されたノードに上記最初に割当てら
    れた文字コード及び上記学習バッファに記憶された文字
    コードを夫々割当てることを特徴とする特許請求の範囲
    第(1)項記載のパターン認識装置。
  13. (13)文書の文字のイメージを記憶する手段と、上記
    文字のイメージを認識する文字認識ツリーと、 高い確率で認識された文字の文字コード並びに低い確率
    で認識された文字の文字コード及びイメージを記憶する
    結果バッファと、 低い確率で認識された文字の文字コードを正しい文字コ
    ードに代える手段と、 上記低い確率で認識された文字の上記正しい文字コード
    及びイメージを記憶する学習バッファと、上記学習バッ
    ファに記憶された上記イメージの各画素の位置に黒が現
    われる確率を表わす第1の値を計算する手段と、 上記第1の値を上記文字認識ツリーに供給し、上記学習
    バッファに記憶されたイメージを高い確率で認識する上
    記認識ツリーの葉ノードを検出する手段と、 上記検出された葉ノードに割当てられた文字コードのイ
    メージの各画素の位置に黒が現われる確率を表わす第2
    の値を計算する手段と、 上記学習バッファに記憶された文字のイメージ及び上記
    葉ノードに最初に割当てられた文字のイメージの同じ画
    素位置の上記第1及び第2の値を比較し、一方の値が大
    きくそして他方の値が小さい画素位置を検出する手段と
    、 上記検出された葉ノードの文字コードを上記検出された
    画素位置のアドレスに代え、上記葉ノードから2つのノ
    ードを延長し、該延長されたノードに上記最初に割当て
    られた文字コード及び上記学習バッファの文字コードを
    夫々割当てる手段とを有する文字認識装置。
JP63104469A 1988-04-28 1988-04-28 文字認識装置 Expired - Lifetime JPH0727543B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP63104469A JPH0727543B2 (ja) 1988-04-28 1988-04-28 文字認識装置
CA000595251A CA1317377C (en) 1988-04-28 1989-03-30 Image recognition apparatus
EP19890304050 EP0343786A3 (en) 1988-04-28 1989-04-24 Method and apparatus for reading and recording text in digital form
US07/813,239 US5394484A (en) 1988-04-28 1991-12-23 Image recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63104469A JPH0727543B2 (ja) 1988-04-28 1988-04-28 文字認識装置

Publications (2)

Publication Number Publication Date
JPH01277981A true JPH01277981A (ja) 1989-11-08
JPH0727543B2 JPH0727543B2 (ja) 1995-03-29

Family

ID=14381444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63104469A Expired - Lifetime JPH0727543B2 (ja) 1988-04-28 1988-04-28 文字認識装置

Country Status (4)

Country Link
US (1) US5394484A (ja)
EP (1) EP0343786A3 (ja)
JP (1) JPH0727543B2 (ja)
CA (1) CA1317377C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110928216A (zh) * 2019-11-14 2020-03-27 深圳云天励飞技术有限公司 人工智能装置

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4831657A (en) * 1988-07-19 1989-05-16 International Business Machines Corporation Method and apparatus for establishing pixel color probabilities for use in OCR logic
US5633948A (en) * 1992-11-30 1997-05-27 Kegelmeyer, Jr.; W. Philip Method and apparatus for detecting a desired behavior in digital image data
JP4071328B2 (ja) * 1997-11-18 2008-04-02 富士通株式会社 文書画像処理装置および方法
JP4416980B2 (ja) * 1999-10-25 2010-02-17 富士通株式会社 バーコード読取装置およびバーコード読取方法
US6760490B1 (en) * 2000-09-28 2004-07-06 International Business Machines Corporation Efficient checking of key-in data entry
US7502812B2 (en) * 2003-08-21 2009-03-10 Microsoft Corporation Electronic ink processing
MXPA04005722A (es) * 2003-08-21 2005-06-03 Microsoft Corp Procesamiento de tinta electronica.
US7502805B2 (en) * 2003-08-21 2009-03-10 Microsoft Corporation Electronic ink processing
US7616333B2 (en) * 2003-08-21 2009-11-10 Microsoft Corporation Electronic ink processing and application programming interfaces
CA2470930A1 (en) 2003-08-21 2005-02-21 Microsoft Corporation Electronic ink processing
JP2007521535A (ja) * 2003-08-21 2007-08-02 マイクロソフト コーポレーション 電子インク処理
US7958132B2 (en) * 2004-02-10 2011-06-07 Microsoft Corporation Voting based scheme for electronic document node reuse
US7672516B2 (en) * 2005-03-21 2010-03-02 Siemens Medical Solutions Usa, Inc. Statistical priors for combinatorial optimization: efficient solutions via graph cuts
US8214754B2 (en) 2005-04-15 2012-07-03 Microsoft Corporation Registration of applications and complimentary features for interactive user interfaces
GB2449412B (en) * 2007-03-29 2012-04-25 Hewlett Packard Development Co Integrating object detectors
US9639493B2 (en) * 2008-11-05 2017-05-02 Micron Technology, Inc. Pattern-recognition processor with results buffer
US8660371B2 (en) * 2010-05-06 2014-02-25 Abbyy Development Llc Accuracy of recognition by means of a combination of classifiers
US20130039589A1 (en) * 2011-08-11 2013-02-14 I. R. I. S. Pattern recognition process, computer program product and mobile terminal
RU2598300C2 (ru) * 2015-01-27 2016-09-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы автоматического распознавания символов с использованием дерева решений
RU2665261C1 (ru) * 2017-08-25 2018-08-28 Общество с ограниченной ответственностью "Аби Продакшн" Восстановление текстовых аннотаций, связанных с информационными объектами
KR20210092588A (ko) * 2020-01-16 2021-07-26 삼성전자주식회사 영상 처리 장치 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61114387A (ja) * 1984-11-09 1986-06-02 Hitachi Ltd オンライン手書き文字認識装置
JPS6272085A (ja) * 1985-09-26 1987-04-02 Toshiba Corp 文字認識装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2978675A (en) * 1959-12-10 1961-04-04 Bell Telephone Labor Inc Character recognition system
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
JPS60262290A (ja) * 1984-06-08 1985-12-25 Hitachi Ltd 情報認識システム
US4752890A (en) * 1986-07-14 1988-06-21 International Business Machines Corp. Adaptive mechanisms for execution of sequential decisions
JPS63249282A (ja) * 1987-04-03 1988-10-17 Fujitsu Ltd マルチフオント印刷文字読取り装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61114387A (ja) * 1984-11-09 1986-06-02 Hitachi Ltd オンライン手書き文字認識装置
JPS6272085A (ja) * 1985-09-26 1987-04-02 Toshiba Corp 文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110928216A (zh) * 2019-11-14 2020-03-27 深圳云天励飞技术有限公司 人工智能装置
CN110928216B (zh) * 2019-11-14 2020-12-15 深圳云天励飞技术有限公司 人工智能装置

Also Published As

Publication number Publication date
US5394484A (en) 1995-02-28
JPH0727543B2 (ja) 1995-03-29
CA1317377C (en) 1993-05-04
EP0343786A3 (en) 1992-01-29
EP0343786A2 (en) 1989-11-29

Similar Documents

Publication Publication Date Title
JPH01277981A (ja) 文字認識装置
EP0439951B1 (en) Data processing
US5548700A (en) Editing text in an image
US4926492A (en) Optical character reading apparatus and method
US4408342A (en) Method for recognizing a machine encoded character
JPS63155386A (ja) 帳票デ−タ読取装置
JPH11120293A (ja) 文字認識/修正方式
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
EP0129060A2 (en) Displaying and/or printing arabic script
CN109409370B (zh) 一种远程桌面字符识别方法和装置
JP4101345B2 (ja) 文字認識装置
JP3072126B2 (ja) 書体を識別する方法及び装置
JPH0736433A (ja) 文字データベース作成装置
JPS63223987A (ja) 文字検索方法
JP2976990B2 (ja) 文字認識装置
JPH05120471A (ja) 文字認識装置
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JP2962525B2 (ja) テキストブロック認識方法
JPH08305792A (ja) 画像処理装置及び方法
JP2001175858A (ja) 高速ラベリング方式
JPS63155385A (ja) 光学文字読取装置
JPS59205681A (ja) 文字読取装置
JPH06243285A (ja) 文字認識方法
JPH0436885A (ja) 光学式文字読取装置
JPH03136182A (ja) 文字切り出し方法