JPS592189A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS592189A
JPS592189A JP57111895A JP11189582A JPS592189A JP S592189 A JPS592189 A JP S592189A JP 57111895 A JP57111895 A JP 57111895A JP 11189582 A JP11189582 A JP 11189582A JP S592189 A JPS592189 A JP S592189A
Authority
JP
Japan
Prior art keywords
character
segmentation
recognition
memory
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57111895A
Other languages
English (en)
Other versions
JPH0160871B2 (ja
Inventor
▲あ▼ 東善
Touzen Hai
Yukikazu Kaburayama
蕪山 幸和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57111895A priority Critical patent/JPS592189A/ja
Publication of JPS592189A publication Critical patent/JPS592189A/ja
Publication of JPH0160871B2 publication Critical patent/JPH0160871B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、文字認識装置に関し、特に自動的にセグメン
テーション(区分)された結果を表示し、それをオペレ
ータが修正することによってフリーフォーマットで書か
れた文字列の読取りに対処できるようにするものである
従来技術と問題点 最近の文字認識装置は、所定の枠内に記入された文字で
あれば手書き文字でも対処できるまでに認識技術が向上
しているが、同じ手書き文字でもフリーフォーマットで
(枠なしで)書かれた場合には認識率が著しく低下する
。この原因はフリーフォーマットの手書き文字列を1文
字毎に区分するセグメンテーションが正しく行なえない
ことにある。例えば1文字の偏と労を2つの独立した文
字として切り出してしまうか、或いは隣接する2文字の
一部または全部を1文字として切り出してしまう等がそ
の例である。
発明の目的 本発明は、フリーフォーマットの手書き文字列に対する
認識率を、所定の枠内に書込まれた文字列に対するもの
と同等にまで引上げようとするものである。
発明の構成 本発明の文字認識装置は、フリーフォーマットの文字列
を1文字毎に分割するセグメンテーション部と、該セグ
メンテーションの結果を格納するメモリと、該メモリ内
のセグメンテーション結果を表示するディスプレイと、
該メモリ内のセグメンテーション結果を修正可能な操作
部と、該メモリ内のセグメンテーション結果に従い文字
認識を行なう認識部とを備えてなることを特徴とするが
、以下図面を参照しながらこれを詳細に説明する。
発明の実施例 第1図は本発明の一実施例で、1はフリーフォーマット
で手書き文字列が記入された入力帳票、2はその手書き
文字列を1文字毎に区分けするセグメンテーション部、
3は区分された文字列の各文字パターンを格納するセグ
メンテーション結果メモリ、4は該メモリ内に格納され
た文字パターンを認識する認識部、5はディスプレイ、
6は該ディスプレイにメモリ3内の文字パターンまたは
認識部4の認識結果(例えば認識した手書き文字に対応
してキャラクタジェネレータから出力された文字パター
ン)を表示するディスプレイ制御部、7は本認識装置に
各種の指示を与えるキーボードである。
本発明では認識部4が文字認^龜に入る前にメモU 3
のセグメンテーション結果をディスプレイ5に表示し、
オペレータにセグメンテーション結果の良否を問う。例
えば第2図(alのようにフリーフォーマットの帳票1
に「最近、煙草をやめるが人が・・・・・・」なる文字
列が手書きされているとすれば、セグメンテーション部
2はこれを1鳥牢毎に区切る処理をする。同図(blは
そのセグメンテーション結果である。セグメンテーショ
ンの仕方には幾つかの方式があるが、投影法はその有力
な1つである。これは帳票1を横方向に主走査、縦方向
に副走査してビデオ信号を得、それをザンブリングおよ
び2値化して画面メモリに格納し、次いで水平走査線に
対応するメモリのロ一方向の黒ビットの総和を各ロー線
毎に求めて濃淡分布12を得、これにより行を求める。
即ち該分布12の谷部13が行間、ピーク部が行中実生
なくとも行内であるからこれより行検知が可能である。
また該メモリのコラム方向の黒ビットの総和を各コラム
線の1行分毎に求めて濃度分布10を得、これより行内
文字の切出しを行なう。即ち、手書き文字でも各文字が
分離独立しているなら濃淡分布10の谷llは文字間の
余白に相当し、この余白で区切れば1文字ずつの切出し
が可能である。しかしながらこのようなセグメンテーシ
ョン法では例えば1文字の偏と労の間が離れていると、
これを2文字に分割してしまうことがある。上記例の文
字列では「煙」の偏「火」と労「!」が2文字に分割さ
れている。また図示はしないが、上記セグメンテーショ
ン法から分るように2文字であるのにそれが密着及び又
は噛合って書かれていると1文字としてセグメンテーシ
ョンされる恐れがある。このような区分化誤りの発生は
フリーフォーマットの手書き文字では避けることができ
ず、これがこの種の文字の認識率向上に対する大きな阻
害要因であった。
ところでセグメンテーション結果はその文字パターンを
囲む枠を付してメモリ3に格納されるので、ディスプレ
イ5に表示された枠14を見ることで「煙」に関するセ
グメンテーションが失敗していることが判る。そこでオ
ペレータはキーボード7によりセグメンテーションを修
正する。例えばカーソルを「煙」の一方「火」の位置に
移動し、「統合」というキーを押して次にカーソルを「
煙」の他方「栗」に移動し、これらを第2図(C1のよ
うに統合させる。この修正指示は制御部6を通してメモ
リ3に至る。同図fd)は修正後のセグメンテーション
結果であり、これは所定の枠内に手書きされた文字列と
等しい。そこでオペレータが「認識」というキーを押せ
ば認識部4はメモリ3内のセグメンテーション結果に従
って文字認識を行ない、認識結果がディスプレイ5に表
示される。2文字が1文字に合体している場合はカーソ
ルをその2文字の間に移動させ、「分離」のキーを押す
これにより2文字の間に枠線(メモリ上の黒ビット)が
入って分離される。これは例えば前記濃淡分布を再チェ
ックして行なう。なお1文字に誤区分された2文字は入
り組んだりしているはずであり、細い折曲区分線で分離
する必要があるから、カーソルよりは細いライトペンな
どでその分離線を指定するのが有効である。
尚、初めのセグメンテーション結果が正しければそのま
ま認識キーを押せばよい。
発明の効果 以上述べたように本発明によれば、フリーフォーマント
で書かれた手書き文字列に対する自動セグメンテーショ
ンの結果をオペレータが修正できるので、その文字列に
対する認識率を所定フォーマットの手書き文字列に対す
るものと同等にまで向上させることができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
その動作説明図である。 図中、1は入力帳票、2はセグメンテーション部、3は
セグメンテーション結果メモリ、4は認識部、5はディ
スプレイ、6はディスプレイ制御部、7はキーボードで
ある。 出願人 富士通株式会社 代理人弁理士  青  柳    稔

Claims (1)

    【特許請求の範囲】
  1. フリーフォーマットの文字列を1文字毎に分割するセグ
    メンテーション部と、該セグメンテーションの結果を格
    納するメモリと、該メモリ内のセグメンテーション結果
    を表示するディスプレイと、該メモリ内のセグメンテー
    ション結果を修正可能な操作部と、該メモリ内のセグメ
    ンテーション結果に従い文字認識を行なう認識部とを備
    えてなることを特徴とする文字認識装置。
JP57111895A 1982-06-29 1982-06-29 文字認識装置 Granted JPS592189A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57111895A JPS592189A (ja) 1982-06-29 1982-06-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57111895A JPS592189A (ja) 1982-06-29 1982-06-29 文字認識装置

Publications (2)

Publication Number Publication Date
JPS592189A true JPS592189A (ja) 1984-01-07
JPH0160871B2 JPH0160871B2 (ja) 1989-12-26

Family

ID=14572823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57111895A Granted JPS592189A (ja) 1982-06-29 1982-06-29 文字認識装置

Country Status (1)

Country Link
JP (1) JPS592189A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62293475A (ja) * 1986-06-13 1987-12-21 Toshiba Corp 画像処理装置
JPH0744655A (ja) * 1993-08-03 1995-02-14 Sony Corp 手書き入力表示装置
JPH0757053A (ja) * 1993-08-13 1995-03-03 Sony Corp 手書き入力表示方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH077863U (ja) * 1993-07-09 1995-02-03 セラテックジャパン株式会社 ブレード

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62293475A (ja) * 1986-06-13 1987-12-21 Toshiba Corp 画像処理装置
JPH0744655A (ja) * 1993-08-03 1995-02-14 Sony Corp 手書き入力表示装置
JPH0757053A (ja) * 1993-08-13 1995-03-03 Sony Corp 手書き入力表示方法

Also Published As

Publication number Publication date
JPH0160871B2 (ja) 1989-12-26

Similar Documents

Publication Publication Date Title
US6628832B2 (en) Table recognition method and apparatus, and storage medium
US5167016A (en) Changing characters in an image
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JPH04343190A (ja) 文字データ入力方式
JPH06139404A (ja) 表認識装置
JPH01277981A (ja) 文字認識装置
CN112446262A (zh) 文本分析方法、装置、终端和计算机可读存储介质
JP3795238B2 (ja) 文書画像処理装置及び文書画像処理方法
JPS592189A (ja) 文字認識装置
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH1173472A (ja) フォーマット情報登録方法及びocrシステム
US11270146B2 (en) Text location method and apparatus
CN114116474A (zh) 一种软件校验方法、装置、电子设备及存储介质
US6272243B1 (en) Method and apparatus for entering characters into a writing recognizer
US5272765A (en) System for processing character images
JPH02138674A (ja) 文書処理方法及び装置
JP3444561B2 (ja) 文字認識方法及び文字認識装置
JPH0535913A (ja) 文字行切り出し装置及び文字認識装置
JP2890788B2 (ja) 文書認識装置
JP2669897B2 (ja) 誤読文字の修正方法
JPH05290215A (ja) 表認識装置
JP2001052111A (ja) 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
JPH0715702B2 (ja) 文字パターン切り出し装置
JPH10177624A (ja) 文字切出し方法および文字切出し装置
JPH07120387B2 (ja) 文字検索方法