JPH0773274A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0773274A
JPH0773274A JP5221737A JP22173793A JPH0773274A JP H0773274 A JPH0773274 A JP H0773274A JP 5221737 A JP5221737 A JP 5221737A JP 22173793 A JP22173793 A JP 22173793A JP H0773274 A JPH0773274 A JP H0773274A
Authority
JP
Japan
Prior art keywords
character
image data
recognition
unit
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5221737A
Other languages
English (en)
Inventor
Tadashi Aramaki
正 荒巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5221737A priority Critical patent/JPH0773274A/ja
Publication of JPH0773274A publication Critical patent/JPH0773274A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字の向きが一定でなかったり、表裏が反転
していたりしていても、認識対象文書を正しく認識でき
信頼性に優れ、認識作業を容易に行うことができ作業性
に優れ、異なった向きの文字や表裏が反転した文字でも
認識することができる汎用性に優れた文字認識装置の提
供。 【構成】 2値画像データを得る画像読取部1と、画像
データから文字画像データを切り出す文字画像切り出し
部3と、文字画像データを記憶する文字画像記憶部4
と、を備えた文字認識装置であって、文字画像データを
回転させる文字画像左90度回転部5と、全ての文字の
通常の文字特徴を記憶した文字特徴辞書6と、文字特徴
辞書6を参照して文字画像データと類似する候補文字及
び類似度等の認識確度を求める認識確度計算部7と、認
識確度から認識文字を決定する認識文字決定部8と、を
備えた構成からなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は新聞,雑誌,小説等の活
字,ドット文字及び手書き文字パターンをJISコード
等のコード情報に変換する文字認識装置に関するもので
ある。
【0002】
【従来の技術】近年、オフィースオートメーションの進
展に伴い、キーボードを用いず、文字認識装置によって
活字原稿等をコンピュータ等へ入力することが行われて
いる。
【0003】以下に従来の文字認識装置について説明す
る。図8は認識対象文書の一例を示す図であり、図9は
表裏が反転した認識対象文書の一例を示す図である。
【0004】従来の文字認識装置は、認識対象文書が図
8に示すようなものである場合、aの部分の文字はその
向きが文字認識の向きと合っているために、そのまま認
識することができるが、bの部分の文字はその向きが文
字認識の向きから180度回転しており、cの部分の文
字は同様にその向きが右に90度回転しているために、
認識することができない。そこで、まず、aの部分の文
字を認識し、次に、利用者が認識対象文書を回転させ
て、bの部分の文字の向きと文字認識の向きとを一致さ
せ、bの部分の文字を認識し、次に、同様にしてcの部
分の文字を認識し、次に、利用者がこれらの認識結果を
統合して、認識対象文書全体を認識していた。
【0005】また、OHPシートのような透明なシート
等に書かれた文書を認識する際に、誤ってシートの表裏
を逆にセットした場合等に、図9に示すような表裏が反
転した文字からなるものが認識対象文書となる。この場
合は、各文字の表裏が反転しているため、全く文字認識
を行うことができない。そこで、文字認識を行うために
は、利用者がシートの表裏を正しくセットし直す必要が
あった。
【0006】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、認識対象文書中の文字の向きが一定でない
場合に、各々の文字の向き毎に認識を行い、利用者がそ
の認識結果を統合する等しなければならず、煩雑で手数
が掛かり作業性、汎用性に欠けるとともに、誤認識をす
ることがあり信頼性に欠けるという問題点を有してい
た。また、認識対象文書を表裏逆にセットした場合等
に、表裏が反転した文字を認識することができず作業
性、汎用性に欠けるとともに、誤認識をすることがあり
信頼性に欠けるという問題点を有していた。
【0007】本発明は上記従来の問題点を解決するもの
で、認識対象文書中の文字の向きが一定でなかったり、
文字の表裏が反転していたりした場合であっても、認識
対象文書を正しく認識でき信頼性に優れ、認識作業を容
易に行うことができ作業性に優れ、異なった向きの文字
や表裏が反転した文字でも認識することができる汎用性
に優れた文字認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】この目的を達成するため
に本発明の請求項1に記載された文字認識装置は、認識
対象文書を2値画像データへ変換する画像読取部と、前
記画像読取部より出力される2値画像データから1文字
の文字画像データを切り出す文字画像切り出し部と、前
記文字画像切り出し部で切り出された文字画像データを
記憶する文字画像記憶部と、を備えた文字認識装置であ
って、前記文字画像記憶部に記憶されている文字画像デ
ータを回転及び/又は表裏反転させる文字画像変換部
と、全ての文字の通常の文字特徴を記憶した文字特徴辞
書と、前記文字特徴辞書を参照して前記文字画像記憶部
に記憶されている文字画像データと類似する候補文字及
び類似度等の認識確度を求める認識確度計算部と、前記
認識確度計算部で求められた認識確度から認識文字を決
定する認識文字決定部と、を備えた構成を有しており、
請求項2に記載された文字認識装置は、認識対象文書を
2値画像データへ変換する画像読取部と、前記画像読取
部より出力される2値画像データから1文字の文字画像
データを切り出す文字画像切り出し部と、前記文字画像
切り出し部で切り出された文字画像データを記憶する文
字画像記憶部と、を備えた文字認識装置であって、全て
の文字の通常の文字特徴を記憶した文字特徴辞書と、全
ての文字の通常の文字特徴を回転及び/又は表裏反転さ
せた変換済文字特徴を記憶した変換済文字特徴辞書と、
前記文字特徴辞書と前記変換済文字特徴辞書とを参照し
て前記文字画像記憶部に記憶されている文字画像データ
と類似する候補文字及び類似度等の認識確度を求める認
識確度計算部と、前記認識確度計算部で求められた認識
確度から認識文字を決定する認識文字決定部と、を備え
た構成を有している。
【0009】
【作用】この構成によって、文字画像記憶部に記憶され
ている文字画像データを文字画像変換部によって回転・
表裏反転させながら、認識確度計算部によって文字特徴
辞書を参照して認識確度を求めることで、文字特徴辞書
に要するメモリを増加させることなく、文字の向きが一
定でなかったり、文字の表裏が反転していたりする認識
対象文書を正しく容易に認識することができる。また、
全ての文字の通常の文字特徴を回転させたり表裏を反転
させたりした変換済文字特徴辞書を備えたことによっ
て、文字の向きが一定でなかったり、文字の表裏が反転
している文字画像データを、文字画像変換部等で変換す
ることなく、正しく容易かつ高速に認識することができ
る。
【0010】
【実施例】
(実施例1)以下本発明の一実施例における文字認識装
置について、図面を参照しながら説明する。図1は本発
明の一実施例における文字認識装置の機能ブロック図で
あり、図2は本発明の一実施例における文字認識装置の
回路ブロック図である。図1において1はスキャナ(図
示せず)等からなり認識対象文書を読み取って画像デー
タを出力する画像読取部、2は画像読取部1から出力さ
れる画像データから1ページ分の画像データを記憶する
ページ画像記憶部、3はページ画像記憶部2に記憶され
た1ページ分の画像データから1文字分の文字画像デー
タを切り出す文字画像切り出し部、4は文字画像切り出
し部3で切り出された文字画像データ等を記憶する文字
画像記憶部、5は文字画像変換部の一例であり文字画像
記憶部4に記憶されている文字画像データを左方向へ9
0度回転させる文字画像左90度回転部、6は全ての文
字の通常の文字特徴を記憶している文字特徴辞書、7は
文字特徴辞書6を参照しながら文字画像記憶部4中に記
憶されている文字画像データに類似する候補文字及び類
似度等の認識確度を求める認識確度計算部、8は認識確
度計算部7より出力される認識確度から認識文字及び回
転角を決定する認識文字決定部である。図2において、
9は文字認識装置全体を制御するCPU、10は画像読
取部1を構成し認識対象文書を画像データへと変換する
スキャナ、11はページ画像記憶部2となるページ画像
記憶領域12と文字画像記憶部4となる文字画像記憶領
域13とを有するRAM、14は文字特徴辞書6等を記
憶する文字特徴情報記憶領域15とCPU9における全
ての処理を指示するプログラムを記憶するプログラム記
憶領域16とを有するROMである。
【0011】以上のように構成された本発明の一実施例
における文字認識装置について、以下その動作を説明す
る。図3は本発明の一実施例における文字認識装置のフ
ローチャートであり、図4は本発明の一実施例における
文字認識装置による認識処理の一例を示す図である。
【0012】初めに、画像読取部1によって、認識対象
文書を読み取り、画像データに変換して、その1ページ
分の画像データをページ画像記憶部2に記憶する(S
1)。次に、文字画像切り出し部3によって、ページ画
像記憶部2に記憶されている画像データから1文字分の
文字画像データを切り出し、文字画像記憶部4に原文字
画像データとして記憶する(S2)。次に、認識確度計
算部7によって、文字特徴辞書6を参照しながら、文字
画像記憶部4内の原文字画像データに対する候補文字,
類似度等の認識確度を通常どおりに求める(S3)。次
に、文字画像左90度回転部5によって、文字画像記憶
部4内の文字画像データを左に90度回転させる(S
4)。次に、認識確度計算部7によって、文字特徴辞書
6を参照しながら、文字画像記憶部4内の、原文字画像
データを左に90度回転させた文字画像データに対する
候補文字,類似度等の認識確度を求める(S5)。次
に、文字画像左90度回転部5によって、文字画像記憶
部4内の文字画像データを更に左に90度回転させる
(S6)。次に、認識確度計算部7によって、文字特徴
辞書6を参照しながら、文字画像記憶部4内の、原文字
画像データを180度回転させた文字画像データに対す
る候補文字,類似度等の認識確度を求める(S7)。次
に、文字画像左90度回転部5によって、文字画像記憶
部4内の文字画像データを更に左に90度回転させる
(S8)。次に、認識確度計算部7によって、文字特徴
辞書6を参照しながら、文字画像記憶部4内の、原文字
画像データを左に270度回転させた文字画像データに
対する候補文字,類似度等の認識確度を求める(S
9)。次に、認識文字決定部8によって、S3,S5,
S7,S9で求められた候補文字のうち、類似度が最も
高いものを認識結果とし、同時にその回転角も決定する
(S10)。次に、ページ画像記憶部2内に記憶された
全ての文字を認識したか調べる(S11)。Noである
場合は、次の文字を認識するためにS2へjumpし、
Yesである場合は、認識対象文書の全てのページを認
識したか調べる(S12)。Noである場合は、次のペ
ージを認識するためにS1へjumpし、Yesである
場合は、全ての処理を終了する。
【0013】ここで、例として、原文字画像データが図
4に示すようなものであった場合、本発明の一実施例に
おける文字認識装置は、これを左に90度ずつ回転させ
ながら認識確度を求めていくが、図4から明らかなよう
に、原文字画像データを左に270度回転させた時の候
補文字‘F’に対する類似度が最も高い。よって原文字
画像は‘F’を右に270度回転させたものだと判断
し、これを認識文字とする。
【0014】尚、本実施例においては、文字画像変換部
を左へ90度回転させる文字画像左90度回転部5とし
たが、これは他の方向,角度であってもよく、文字の表
裏を反転させるもの、あるいはこの両者を同時に行うも
のであってもよい。
【0015】以上のように本実施例によれば、文字画像
変換部を設けたことにより、文字特徴辞書6に要するメ
モリを増加させることなく、文字が回転していたり、文
字の表裏が反転していたりする文字を正しく認識するこ
とができる。
【0016】(実施例2)以下本発明の第2の実施例に
おける文字認識装置について、図面を参照しながら説明
する。図5は本発明の第2の実施例における文字認識装
置の機能ブロック図である。1は画像読取部、2はペー
ジ画像記憶部、3は文字画像切り出し部、4は文字画像
記憶部、6は文字特徴辞書、8は認識文字決定部であ
り、これらは実施例1と同様なものなので同一の符号を
付し説明を省略する。17は変換済文字特徴辞書の一例
であり全ての文字の通常の文字特徴を左に90度回転さ
せた左90度回転済文字特徴を記憶した左90度回転文
字特徴辞書、18は左90度回転文字特徴辞書17と同
様な180度回転済文字特徴を記憶した180度回転文
字特徴辞書、19は左90度回転文字特徴辞書17と同
様な左270度回転済文字特徴を記憶した左270度回
転文字特徴辞書、20は文字特徴辞書6,左90度回転
文字特徴辞書17,180度回転文字特徴辞書18,左
270度回転文字特徴辞書19を参照しながら文字画像
記憶部4中に記憶されている文字画像データに類似する
候補文字及び類似度等の認識確度を求める認識確度計算
部である。
【0017】以上のように構成された本発明の第2の実
施例における文字認識装置について、以下その動作を説
明する。図6は本発明の第2の実施例における文字認識
装置のフローチャートであり、図7は本発明の第2の実
施例における文字認識装置による認識処理の一例を示す
図である。
【0018】初めに、画像読取部1によって、認識対象
文書を読み取り、画像データに変換して、その1ページ
分の画像データをページ画像記憶部2に記憶する(S1
3)。次に、文字画像切り出し部3によって、ページ画
像記憶部2に記憶されている画像データから1文字分の
文字画像データを切り出し、文字画像記憶部4に記憶す
る(S14)。次に、認識確度計算部20によって、文
字特徴辞書6,左90度回転文字特徴辞書17,180
度回転文字特徴辞書18,左270度回転文字特徴辞書
19を参照しながら、文字画像記憶部4内の文字画像デ
ータに対する候補文字,類似度等の認識確度を求め、認
識文字決定部8によって、これらの候補文字のうち、類
似度が最も高いものを認識結果とし、同時にその回転角
も決定する(S15)。次に、ページ画像記憶部2内に
記憶された全ての文字を認識したか調べる(S16)。
Noである場合は、次の文字を認識するためにS14へ
jumpし、Yesである場合は、認識対象文書の全て
のページを認識したか調べる(S17)。Noである場
合は、次のページを認識するためにS13へjump
し、Yesである場合は、全ての処理を終了する。
【0019】ここで、例として、原文字画像データが図
7に示すようなものであった場合、本発明の第2の実施
例における文字認識装置は、図7に示すように、左27
0度回転文字特徴辞書19中の候補文字‘F’に対する
類似度が最も高いとし、原文字画像は‘F’を右に27
0度回転させたものだと判断して、これを認識文字とす
る。
【0020】尚、本実施例においては、変換済文字特徴
辞書として、通常の文字特徴を左へ90度ずつ回転させ
た左90度回転文字特徴辞書17,180度回転文字特
徴辞書18,左270度回転文字特徴辞書19を用いた
が、これらは他の方向,角度のものであってもよく、文
字の表裏を反転させたもの、あるいはこの両者を同時に
行ったものであってもよい。
【0021】以上のように本実施例によれば、変換済文
字特徴辞書を設けたことにより、文字が回転していた
り、文字の表裏が反転していたりする文字を、文字画像
データを文字画像変換部等で変換することなく正しく容
易かつ高速に認識することができる。
【0022】
【発明の効果】以上のように本発明は、文字画像記憶部
に記憶されている文字画像データを文字画像変換部によ
って回転・表裏反転させながら、認識確度計算部によっ
て文字特徴辞書を参照して認識確度を求めることで、文
字特徴辞書に要する記憶容量を増加させることなく、文
字の向きが一定でなかったり、文字の表裏が反転してい
る認識対象文書を正しく容易に認識することができ作業
性、汎用性、信頼性に優れ、メモリ効率が高く、全ての
文字の通常の文字特徴を回転させたり表裏を反転させた
りした変換済文字特徴辞書を備えたことによって、文字
の向きが一定でなかったり、文字の表裏が反転している
認識対象文書の文字画像データを文字画像変換部等で変
換することなく、正しく容易かつ高速に認識することが
できる作業性、汎用性、信頼性に優れた文字認識装置を
実現できるものである。
【図面の簡単な説明】
【図1】本発明の一実施例における文字認識装置の機能
ブロック図
【図2】本発明の一実施例における文字認識装置の回路
ブロック図
【図3】本発明の一実施例における文字認識装置のフロ
ーチャート
【図4】本発明の一実施例における文字認識装置による
認識処理の一例を示す図
【図5】本発明の第2の実施例における文字認識装置の
機能ブロック図
【図6】本発明の第2の実施例における文字認識装置の
フローチャート
【図7】本発明の第2の実施例における文字認識装置に
よる認識処理の一例を示す図
【図8】認識対象文書の一例を示す図
【図9】表裏が反転した認識対象文書の一例を示す図
【符号の説明】
1 画像読取部 2 ページ画像記憶部 3 文字画像切り出し部 4 文字画像記憶部 5 文字画像左90度回転部 6 文字特徴辞書 7 認識確度計算部 8 認識文字決定部 9 CPU 10 スキャナ 11 RAM 12 ページ画像記憶領域 13 文字画像記憶領域 14 ROM 15 文字特徴情報記憶領域 16 プログラム記憶領域 17 左90度回転文字特徴辞書 18 180度回転文字特徴辞書 19 左270度回転文字特徴辞書 20 認識確度計算部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】認識対象文書を2値画像データへ変換する
    画像読取部と、前記画像読取部より出力される2値画像
    データから1文字の文字画像データを切り出す文字画像
    切り出し部と、前記文字画像切り出し部で切り出された
    文字画像データを記憶する文字画像記憶部と、を備えた
    文字認識装置であって、前記文字画像記憶部に記憶され
    ている文字画像データを回転及び/又は表裏反転させる
    文字画像変換部と、全ての文字の通常の文字特徴を記憶
    した文字特徴辞書と、前記文字特徴辞書を参照して前記
    文字画像記憶部に記憶されている文字画像データと類似
    する候補文字及び類似度等の認識確度を求める認識確度
    計算部と、前記認識確度計算部で求められた認識確度か
    ら認識文字を決定する認識文字決定部と、を備えたこと
    を特徴とする文字認識装置。
  2. 【請求項2】認識対象文書を2値画像データへ変換する
    画像読取部と、前記画像読取部より出力される2値画像
    データから1文字の文字画像データを切り出す文字画像
    切り出し部と、前記文字画像切り出し部で切り出された
    文字画像データを記憶する文字画像記憶部と、を備えた
    文字認識装置であって、全ての文字の通常の文字特徴を
    記憶した文字特徴辞書と、全ての文字の通常の文字特徴
    を回転及び/又は表裏反転させた変換済文字特徴を記憶
    した変換済文字特徴辞書と、前記文字特徴辞書と前記変
    換済文字特徴辞書とを参照して前記文字画像記憶部に記
    憶されている文字画像データと類似する候補文字及び類
    似度等の認識確度を求める認識確度計算部と、前記認識
    確度計算部で求められた認識確度から認識文字を決定す
    る認識文字決定部と、を備えたことを特徴とする文字認
    識装置。
JP5221737A 1993-09-07 1993-09-07 文字認識装置 Pending JPH0773274A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5221737A JPH0773274A (ja) 1993-09-07 1993-09-07 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5221737A JPH0773274A (ja) 1993-09-07 1993-09-07 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0773274A true JPH0773274A (ja) 1995-03-17

Family

ID=16771452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5221737A Pending JPH0773274A (ja) 1993-09-07 1993-09-07 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0773274A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260274A (ja) * 2005-03-17 2006-09-28 Ricoh Co Ltd 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260274A (ja) * 2005-03-17 2006-09-28 Ricoh Co Ltd 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
JP4607633B2 (ja) * 2005-03-17 2011-01-05 株式会社リコー 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法

Similar Documents

Publication Publication Date Title
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
JP2003308480A (ja) オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
JPH0773274A (ja) 文字認識装置
JPH0528324A (ja) 英文字認識装置
JP3304512B2 (ja) 表認識装置
JPH0728945A (ja) 文字認識装置
JPH0728935A (ja) 文書画像処理装置
JP2908460B2 (ja) 誤認識修正方法及び装置
JP2856409B2 (ja) 文字認識装置および方法
JP3159745B2 (ja) 文字認識方法及びその装置
JP2002042138A (ja) 画像照合装置、画像照合方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0758499B2 (ja) 文字認識装置
JP2007148925A (ja) 情報処理装置及び情報処理方法
JP2939945B2 (ja) ローマ字住所認識装置
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JP2874199B2 (ja) 単語辞書照合装置
JP2972443B2 (ja) 文字認識装置
JPH09138835A (ja) 文字認識装置
JPH01106287A (ja) 単語読取装置
JPH09305712A (ja) 文字認識方法及び装置、及び文字認識用プログラムを記憶した記憶媒体
JP2963474B2 (ja) 類似文字識別方法
JPH08297720A (ja) 一般文書読み取り装置
JPH08180136A (ja) 文字認識方法
JPH0496882A (ja) 全角/半角判定方法
JPH03217993A (ja) 文字サイズ認識装置