JPS63261486A - 書体識別装置 - Google Patents

書体識別装置

Info

Publication number
JPS63261486A
JPS63261486A JP62095268A JP9526887A JPS63261486A JP S63261486 A JPS63261486 A JP S63261486A JP 62095268 A JP62095268 A JP 62095268A JP 9526887 A JP9526887 A JP 9526887A JP S63261486 A JPS63261486 A JP S63261486A
Authority
JP
Japan
Prior art keywords
mask pattern
image
characters
signal
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62095268A
Other languages
English (en)
Inventor
Tetsuo Umeda
梅田 徹夫
Shigenobu Kasuya
粕谷 重信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62095268A priority Critical patent/JPS63261486A/ja
Priority to US07/182,518 priority patent/US4910787A/en
Priority to DE88303558T priority patent/DE3879254T2/de
Priority to EP88303558A priority patent/EP0288266B1/en
Publication of JPS63261486A publication Critical patent/JPS63261486A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明はパターン認識に関し、特に書類上に記載され
ているものが印刷文字か手書き文字かあるいは文字以外
の図案等かを識別する書体識別装置に関するものである
〔従来の技術〕
従来、との種の書体識別装置は書類上に記載された文字
が印刷文字か手書き文字かを弁別する技術として、例え
ば特公昭48−36091号公報に記載されているよう
に、文字の高さ9幅、上下位置。
ピッチおよびそれらのばらつきを用いて弁別するものが
あった。
〔発明が解決しようとする問題点〕
上述した従来の書体識別信号社、対象となる文字が容易
に分離できる場合は有効であるが、一般的に手書文字は
各文字を分離することは困難であシ、特にアルファベッ
トで書かれた場合は非常に困難となる。また、印刷され
丸文字でもいわゆる可変ピッチのものは各文字あ分離は
困難な場合が多い。このため、個々の文字の高さ1幅、
ピッチ等に着目した方法では各文字の分離が十分く期待
できない時、その弁別結果の性能も期待できないという
欠点−pXあった。
〔問題点を解決するための手段〕
この発明の書体識別装置は、光電憂換スキャナ−で読み
取った映像イメージの一部を記憶し、この映像イメージ
中の微小領域上で各マスクパターンに一致した微小領域
の数をカウントし、そのカウント数を演算して書体を識
別するものである。
〔作用〕
この発明は文書上に記載されたものが手書き文字か活字
文字かを容易に識別することができる。
〔実施例〕
第1図はこの発明に係る書体識別装置の一実施・例を示
すブロック図である。同図において、1は図示せぬ変換
用スキャナーで読み取られた画像信号jが入力し走査線
3本分の2値された映像イメージabe 、 d*f 
、 ghi 、・・拳が一時的に記憶されてシフトされ
るシフトレジスタ、2は3×3メツシユの微小領域の白
黒信号a % iが入力し、例えば第2図に示すように
複数のマスクパターンを有し、入力微小領域パターンが
これらのマスクパターンのいずれかに一致したとき一致
出力信号K。
ttたはmを出力する9例えばゲートアレイなどを用い
て構成したマスクパターン検出回路、3は一致出力信号
Kが入力し、水平ストローク成分が入力画像全体の中に
いくつあったかをカウントし水平カウント出力信号nを
出力する水平成分カウンタ、4は一致出力信号tが入力
し、垂直ストローク成分が入力画像全体の中にいくつあ
ったかをカウントし垂直カウント出力信号rを出力する
垂直成分カウンタ、5は一致出力信号mが入力し、斜め
ストローク成分が入力画像全体の中にいくつあったかを
カウントし斜めカウント出力信号pを出力する斜め成分
カウンタ、6は入力する水平カウント出力信号n、垂直
カウント出力信号rおよび斜めカウント出力信号pを下
記(1)式で示す演算を行ない書体識別し書体識別信号
qを出力する演算回路である。
次に、上記構成による書体識別装置の動作について説明
する。まず、図示せぬ光電変換用スキャナで書類に書か
れている内容を読み取り、その2値された画像信号jを
シフトレジスタ1に入力し走査線3本分のイメージを保
ったままシフトする。
そして、例えば3×3メツシユの微小領域の白黒信号を
表わす信号a〜信号lはマスクパターン検“出回路2に
入力する。このマスクパターン検出回路2は、例えば第
2図ビ)〜第2図(イ)に示すように複数のマスクパタ
ーンを有している。したがって、マスクパターン検出回
路2は入力する微小領域ノくターンが記憶されているマ
スクパターンのいずれかに一致したかを検出し一致した
とき一致信号K。
tlたはmを出力する。すなわち、入力する微小領域パ
ターンが第2図0)あるいは第2図(ロ)に示すマスク
パターンに一致したとき、入カバターンの中に水平スト
四−り成分があることを示し、一致信号Kを水平成分カ
ウンタ3に出力する。同様に、入力する微小領域ノ=、
ターンが第2図(ハ)あるいは第2図に)に示すマスク
パターンに一致したとき、入カバターンの中に垂直スト
ローク成分があることを示し、一致信号rを垂直成分カ
ウンタ4に出力する。同様に1人力する微小領域パター
ンが第2図(ホ)〜第2図(至)に示すマスクパターン
に一致したとき、入カバターンの中に斜めストローク成
分があることを示し、一致信号pを斜め成分カウンタ5
に出力する。したがって、水平成分カウンタ3゜垂直成
分カウンタ4および斜め成分カウンタ5は、それぞれ一
致信号に、t、mをカウントすることによ多入力画像全
体の中に水平ストローク成分。
垂直ストローク成分、斜めストローク成分がいくつあっ
たかをそれぞれカウントし、出力信号n。
rおよびpを演算回路6に出力する。したがって、演算
回路6は書体識別のためにp、/(n+r+p )を演
算する。すなわち、第2図0)〜第2図(ハ)に示すマ
スクパターンのいずれかと一致した微小領域の数に対し
斜めストローク成分の比率を求める。この演算の結果、
例えば0.2以上のとき手書き文字と判断し、0.2以
上のとき活字文字と判断して書体識別信号qを出力する
。このようにして、文書例えば郵便局に記載された住所
が手書きかあるいは活字かを識別することができる。
なお、上述の実施例ではマスクパターンを第2図(イ)
〜第2図(ハ)に示したが、これに限定せず、マスフパ
ターンの大きさ、パターン形状、演算内容などを識別す
べき書体の性質によシ変更してもよいことはもちろんで
ある。
〔発明の効果〕
以上詳細に説明したように、この発明に係る書体識別装
置によれば、文書に記載されたものが手書きかあるいは
活字かを識別し、あらかじめ区分することによシ読取り
装置の処理効率を簡単な回路構成によシ容易に向上させ
ることができる効果がある。
【図面の簡単な説明】
第1図はこの発明に係る書体識別装置の一実施例を示す
ブ□ロック図、第2図(イ)〜第2図(ト)は第1図の
マスクパターン検出回路に記憶されたマスクパターンを
示す図である。 1・・書・シフトレジスタ、2・命・・マスクパターン
検出回路、3・・―・水平成分カウンタ、4・・参・垂
直成分カウンタ、5・・・・斜め成分カウンタ、6・・
・・演算回路。 第 2 図

Claims (1)

    【特許請求の範囲】
  1. 光電変換スキャナで読み取った映像イメージの一部を記
    憶するレジスタと、このレジスタから微小領域画素の映
    像信号を取り出しこの映像信号と記憶されているマスク
    パターンとの一致を検出してそれぞれ一致信号を出力す
    るマスクパターン検出回路と、それぞれのマスクパター
    ンに一致した微小領域の数をカウントする複数のカウン
    タと、これらのカウンタの出力値を演算処理して書体識
    別信号を出力する演算回路とを備えたことを特徴とする
    書体識別装置。
JP62095268A 1987-04-20 1987-04-20 書体識別装置 Pending JPS63261486A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP62095268A JPS63261486A (ja) 1987-04-20 1987-04-20 書体識別装置
US07/182,518 US4910787A (en) 1987-04-20 1988-04-18 Discriminator between handwritten and machine-printed characters
DE88303558T DE3879254T2 (de) 1987-04-20 1988-04-20 Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben.
EP88303558A EP0288266B1 (en) 1987-04-20 1988-04-20 Discriminator between handwritten and machine-printed characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62095268A JPS63261486A (ja) 1987-04-20 1987-04-20 書体識別装置

Publications (1)

Publication Number Publication Date
JPS63261486A true JPS63261486A (ja) 1988-10-28

Family

ID=14133019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62095268A Pending JPS63261486A (ja) 1987-04-20 1987-04-20 書体識別装置

Country Status (4)

Country Link
US (1) US4910787A (ja)
EP (1) EP0288266B1 (ja)
JP (1) JPS63261486A (ja)
DE (1) DE3879254T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114618A (ja) * 1990-12-13 1995-05-02 Xerox Corp 手書き及びマシン印字テキストの区分化方法

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2713911B2 (ja) * 1987-07-08 1998-02-16 株式会社東芝 郵便物処理装置
US5247587A (en) * 1988-07-15 1993-09-21 Honda Giken Kogyo Kabushiki Kaisha Peak data extracting device and a rotary motion recurrence formula computing device
US5119441A (en) * 1989-03-28 1992-06-02 Ricoh Company, Ltd. Optical character recognition apparatus and method using masks operation
JPH087785B2 (ja) * 1989-05-16 1996-01-29 松下電器産業株式会社 2値化処理装置
US5187753A (en) * 1989-12-08 1993-02-16 Xerox Corporation Method and apparatus for identification and correction of document skew
JP2523222B2 (ja) * 1989-12-08 1996-08-07 ゼロックス コーポレーション 画像縮小/拡大方法及び装置
US5272764A (en) * 1989-12-08 1993-12-21 Xerox Corporation Detection of highlighted regions
US5131049A (en) * 1989-12-08 1992-07-14 Xerox Corporation Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask
US5065437A (en) * 1989-12-08 1991-11-12 Xerox Corporation Identification and segmentation of finely textured and solid regions of binary images
US5402504A (en) * 1989-12-08 1995-03-28 Xerox Corporation Segmentation of text styles
US5048109A (en) * 1989-12-08 1991-09-10 Xerox Corporation Detection of highlighted regions
US5129014A (en) * 1989-12-08 1992-07-07 Xerox Corporation Image registration
US5202933A (en) * 1989-12-08 1993-04-13 Xerox Corporation Segmentation of text and graphics
CA2034617C (en) * 1990-01-19 1996-12-31 Masayuki Kimura Data processing system
US5193122A (en) * 1990-12-03 1993-03-09 Xerox Corporation High speed halftone detection technique
US5237628A (en) * 1991-06-03 1993-08-17 Nynex Corporation System and method for automatic optical data entry
DE69228647T2 (de) * 1991-11-01 1999-09-23 Eastman Kodak Co., Rochester Verfahren und Gerät zur Detektion von Text in Punktmatrixdruck zur Verbesserung von optischer Zeichenerkennung
US5357581A (en) * 1991-11-01 1994-10-18 Eastman Kodak Company Method and apparatus for the selective filtering of dot-matrix printed characters so as to improve optical character recognition
US5487115A (en) * 1992-05-14 1996-01-23 United Parcel Service Method and apparatus for determining the fine angular orientation of bar code symbols in two-dimensional CCD images
DE4308245C1 (de) * 1993-03-16 1994-11-03 Friedemann Groh Verfahren zur Erkennung von Schriftzeichen oder Schriftzügen
US5444797A (en) * 1993-04-19 1995-08-22 Xerox Corporation Method and apparatus for automatic character script determination
JP2856661B2 (ja) * 1993-11-05 1999-02-10 シャープ株式会社 濃度変換装置
US6018593A (en) * 1996-09-11 2000-01-25 Ricoh Company, Ltd. Method and system for correcting image position based upon predetermined pattern portions
US6301386B1 (en) * 1998-12-09 2001-10-09 Ncr Corporation Methods and apparatus for gray image based text identification
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability
US7072514B1 (en) 2003-02-06 2006-07-04 The United States Of America As Represented By The National Security Agency Method of distinguishing handwritten and machine-printed images
US20070065003A1 (en) * 2005-09-21 2007-03-22 Lockheed Martin Corporation Real-time recognition of mixed source text
WO2011074067A1 (ja) * 2009-12-15 2011-06-23 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
JP2016015115A (ja) * 2014-06-09 2016-01-28 株式会社リコー 情報処理装置、情報処理方法、及び記録媒体
US11308492B2 (en) 2019-07-03 2022-04-19 Sap Se Anomaly and fraud detection with fake event detection using pixel intensity testing
US12039615B2 (en) 2019-07-03 2024-07-16 Sap Se Anomaly and fraud detection with fake event detection using machine learning
US20210004795A1 (en) 2019-07-03 2021-01-07 Sap Se Anomaly and fraud detection using duplicate event detector
US11488407B1 (en) * 2021-06-01 2022-11-01 Lead Technologies, Inc. Method, apparatus, and computer-readable storage medium for recognizing characters in a digital document

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5837779A (ja) * 1981-08-31 1983-03-05 Ricoh Co Ltd 文書処理装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5418632A (en) * 1977-07-12 1979-02-10 Nippon Telegr & Teleph Corp <Ntt> Character identification system
US4326190A (en) * 1978-08-30 1982-04-20 Borland David L Boundary trace slope feature detection system
JPS56110191A (en) * 1980-02-05 1981-09-01 Tokyo Keiki Co Ltd Type character recognizing device
US4630307A (en) * 1984-09-10 1986-12-16 Eastman Kodak Company Signal processing method and apparatus for sampled image signals

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5837779A (ja) * 1981-08-31 1983-03-05 Ricoh Co Ltd 文書処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114618A (ja) * 1990-12-13 1995-05-02 Xerox Corp 手書き及びマシン印字テキストの区分化方法

Also Published As

Publication number Publication date
US4910787A (en) 1990-03-20
DE3879254T2 (de) 1993-10-14
EP0288266A3 (en) 1990-05-30
EP0288266B1 (en) 1993-03-17
DE3879254D1 (de) 1993-04-22
EP0288266A2 (en) 1988-10-26

Similar Documents

Publication Publication Date Title
JPS63261486A (ja) 書体識別装置
US4408342A (en) Method for recognizing a machine encoded character
US4556985A (en) Pattern recognition apparatus
JPH0812681B2 (ja) バーコードを認識する方法
JPS6011973A (ja) バ−コ−ド読取装置
JP4392907B2 (ja) 文字切出し方法
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPS61221982A (ja) 画像パタ−ン周囲長算出装置
JPH07160810A (ja) 文字認識装置
JP2980636B2 (ja) 文字認識装置
JPS61289476A (ja) 文字読取装置のフオ−マツト生成方式
JPS6227887A (ja) 文字種分離方式
JP3022856B1 (ja) ナンバープレート位置抽出方式
JP2573665B2 (ja) 光学文字読取装置
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JPH03240184A (ja) 属性判定装置
JPH0433074B2 (ja)
JPH05128309A (ja) 文字認識におけるエツジ検出方法
JP2875330B2 (ja) 文字認識方法
JPH0132552B2 (ja)
JPS6077278A (ja) 文字記入領域判別回路
JPH0420506B2 (ja)
JPS58155485A (ja) 標準パタ−ン登録装置
JPH01201789A (ja) 文字読取装置