JP3666909B2 - 文字認識装置及び方法 - Google Patents
文字認識装置及び方法 Download PDFInfo
- Publication number
- JP3666909B2 JP3666909B2 JP26958994A JP26958994A JP3666909B2 JP 3666909 B2 JP3666909 B2 JP 3666909B2 JP 26958994 A JP26958994 A JP 26958994A JP 26958994 A JP26958994 A JP 26958994A JP 3666909 B2 JP3666909 B2 JP 3666909B2
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- character
- kanji
- kana
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
【産業上の利用分野】
本発明は文字認識装置及び方法、特に認識した文字候補群の中の最適な候補文字を決定するための文字認識装置及び方法に関するものである。
【0002】
【従来の技術】
従来の文字認識を説明する。図3の処理の流れを表すフローチャートのように、入力装置(例えばスキャナ)或いは入力ペン等を使用して文字列を入力すると、文字認識辞書を検索して文字列が特定できたかどうかを判断する。特定できたかどうかは、例えば個々の文字画像の特徴ベクトルと認識辞書にある標準特徴ベクトルとの距離を演算し、その演算した結果が所定値と比較することで判定する。
【0003】
さて、特定できたと判断した場合には、認識結果(文字コード列)をそのまま出力する。
【0004】
また、特定できなかった場合、認識結果が誤っている可能性が高くなり、候補群を作成する。そして、別途用意された単語辞書を検索することを繰り返して単語を決定する。
【0005】
例えは、図4のように「電子」と入力した場合、文字認識で得られた候補文字列の組み合わせが「電千」、「電子」、「電干」、「電于」等である場合、図5のようにこれらの候補を単語の辞書を検索する。この結果、「電子」のみ単語辞書に格納されているので、「電子」が決定し、それを認識結果として出力する。
【0006】
【発明が解決しようとする課題】
ところで、前述した従来の文字認識では、入力された文字が「漢字仮名交じり文字列」の場合に適応させようとすると、単語の辞書に漢字仮名交じりの単語をすべて格納する必要がある。例えば、「電子」という単語の場合では、「でんし」、「電し」、「でん子」、「電子」の4種類の単語のすべてを単語の辞書に格納しなければならない。そのため、漢字のみの単語辞書に比較して漢字仮名混じりの文字認識の単語辞書は容量が著しく大きくなる。かといって、漢字仮名交じり単語すべてを単語の辞書に格納しない場合には、文字の高い認識率は望めない。
【0007】
【課題を解決するための手段】
及び
【作用】
本発明はかかる問題点に鑑みなされたものであり、認識処理にかかる辞書の規模を小さくしながらも、認識対象の文字列が漢字仮名混じり単語である場合における認識率を向上させることを可能とする文字認識装置及び方法を提供しようとするものである。
【0008】
この課題を解決するため、例えば本発明の文字認識装置は以下の構成を備える。すなわち、
漢字仮名混じり文字列を入力する入力手段と、
前記入力手段により入力された漢字仮名混じり文字列の文字を文字認識し、各文字に対して候補文字を1つまたは複数出力する文字認識手段と、
前記文字認識手段で文字認識して得られた各文字の候補文字を組み合わせることにより、前記漢字仮名混じり文字列に対する候補単語を1つまたは複数形成する候補単語形成手段と、
前記候補単語形成手段で形成された候補単語が複数あると判断した場合、当該複数の候補単語のうちから処理対象とされた候補単語に含まれる漢字の候補文字の読みを1つまたは複数取り出す処理を行う取り出し手段と、
前記取り出し手段で取り出された読みと当該候補単語に含まれる仮名の候補文字とを組み合わせることにより前記漢字仮名混じり文字列の読み候補を複数生成し、当該生成された複数の読み候補を仮名漢字変換する処理を行う仮名漢字変換手段と、
前記仮名漢字変換手段で得られた変換結果の漢字と前記候補単語に含まれる漢字部分の候補文字とを照合する処理を行う照合手段と、
前記複数あると判断された候補単語のうちの最初の候補単語から順に前記処理対象の候補単語として、前記取り出し手段と前記仮名漢字変換手段と前記照合手段とによるそれぞれの処理を行っていき、前記照合手段の照合が成功した時点で、前記認識手段で得られた複数の候補文字の中から認識結果とする候補文字を特定し、当該特定された候補文字を前記漢字仮名混じり文字列の認識結果として出力する第1の出力手段と、
前記候補単語形成手段で形成された候補単語が1つであると判断した場合、当該候補単語を構成している候補文字を特定し、当該特定された候補文字を前記漢字仮名混じり文字列の認識結果として出力する第2の出力手段とを備える。
【0009】
ここで、本発明に好適な実施態様に従えば、前記入力手段は、文字をストローク情報として入力することが望ましく、特に、そのストローク情報は、所定のペンによる手書き文字入力によることが望ましい。これによって、ストローク入力面の大きさが限られていたり、画数の多い漢字であったり、或いは、その漢字そのもの忘れてしまったりした場合に、その部分を認識率が高い仮名で入力することで認識させることが可能になる。
【0012】
【実施例】
以下、添付図面に従って本発明に係る実施例を詳細に説明する。
【0013】
図2は、本発明の文字処理方法が実施される情報処理システムの構成を表したブロック図である。
【0014】
入力装置1(手書きパッド,スキャナなど)から入力された文字列は、中央演算処理装置2(CPU)によって処理され、辞書やその処理結果は主記憶装置4(RAMなど)や補助記憶装置5(フロッピーディスク,ハードディスクなど)に記憶し、出力装置3(CRT,プリンタなど)によって出力される。
【0015】
図1は本発明の処理の流れを表すフローチャートである。尚、同フローチャートに基づくプログラムは、補助記憶装置5に記憶保持されており、電源投入時に主記憶装置2にロードされ、実行される。
【0016】
本実施例では、以下の工程を備える。すなわち、
入力装置1から読み文字列の入力処理を行なうステップS11と、かな漢字変換するステップS12と、候補の読みを取得するステップS14と、取得した読みをかな漢字変換するステップS15と、かな漢字変換の結果と読みを取り出した文字を一致するかを判定するステップS16と、一致しなかった場合、次のデータを取得するステップS17と、一致した場合、決定した文字を出力装置3または、主記憶装置4、補助記憶装置5に出力するステップS18とからなる。
【0017】
次に、図1と図6,図7をもとに処理の流れを説明する。ここでは、具体例として「でん子」と入力した場合について説明する。
【0018】
図6のように、文字列「でん子」を入力する(ステップS11)。主記憶装置4、または補助記憶装置5に格納されている辞書より公知の認識処理を行う(ステップS12)。
【0019】
実施例における文字認識は、認識しようとする文字画像或いは文字ストロークの特徴ベクトルと、認識辞書に格納されている各標準ベクトルとの距離を演算し、その演算値が小さい文字を認識結果の文字として出力する。このとき、距離演算値が小さい順に第1候補文字、第2候補文字、…となるが、第1候補文字の距離演算値が所定値以下、すなわち、確からしさが高く、第2候補文字に対して充分な差がある場合、候補文字を1つだけ出力する。これに該当しない場合には、第2候補以下の所定数の候補文字群(但し、演算距離値が所定閾値以下のもの)として出力するものとする。
【0020】
さて、上記文字認識処理で得られた認識文字で文字列候補を作成する。ここで、認識処理で1個の文字に対して複数の候補文字が出力されてくると、候補文字列はその組み合わせの数だけ作成されることになる。そこで、ステップS13では、候補文字列が1つかそれ以上かを判断し、入力された文字列が特定できたかどうかを判定する。
【0021】
図6の場合、候補文字列が4つ存在するため、特定できていないことになる。この場合、処理はステップS14に進み、主記憶装置4、または補助記憶装置5に格納されている読み辞書を検索し、文字列候補の読みを取得する。「千」に対しては「せん」、「ち」、「ぢ」を取得する。
【0022】
次に、図7のように、ステップ14で取得した読みに対してかな漢字変換を行う。「でんせん」、「でんち」、「でんぢ」の読みに対して「電線」、「伝染」、「電池」、「田地」、「伝」「ぢ」等の変換結果を取得する。このとき、変換結果の文節数が最小になるように、または読みが最長になように変換結果を残す。
【0023】
ステップS16では、上記ステップS17の結果である「電線」、「伝染」、「電池」、「田地」に文字「千」が含まれているかどうかを判定する。この場合、それがないわけであるから、処理はステップS17に進み、次の候補文字列、例えば「でん子」を着目し、ステップS14に戻る。
【0024】
さて、今度は、「でん子」の「子」について同様の処理を行う「子」に対しては読み辞書を検索し、「おとこ」「こ」、「ご」、「し」、「じ」、「す」、「ね」、「み」の読みを取得する。取得した読みから手書き文字列の読み候補「でんおとこ」、「でんこ」、「でんご」、「でんし」、「でんじ」、「でんす」、「でんね」、「でんみ」の読みに対して「電」「男」、「電故」、「電」「五」、「電子」、「出んし」、「電磁」、「田地」、「伝」「巣」、「伝ね」、「伝」「身」等を変換結果として取得する。この結果、「電故」、「電子」、「出んし」、「電磁」が残る。「子」と一致する「電子」があるわけであるから、処理はステップS16からステップS18に進む。「子」を認識文字として決定し、「でん子」を出力装置3または、主記憶装置4、補助記憶装置5に出力する(ステップ18)。
【0025】
以上のように、本実施例によれば、認識対象の漢字仮名混じり文字列を入力した場合、認識して得られた候補の組み合わせ中に漢字がある場合、その漢字を「読み」に変換し、全てを平仮名にして仮名漢字変換を行う。そして、この仮名漢字変換と先に文字認識して得られた結果とを照合することで、認識候補文字を高認識率で、しかも、辞書の規模を大きくしないで認識することが可能になる。
【0026】
【他の実施例】
次に第2の実施例を説明する。本第2の実施例では、上記実施例のごとく、文字列「でん子」と入力した場合において、文字認識候補による文字列候補として、「でん千」、「でん子」、「でん于」、「でん干」が生成された場合に、出力として「電子」を出力するものである。
【0027】
以下、図1、図6及び図8をもとに処理の流れを説明する。
【0028】
図6のように、文字列「でん子」を入力する(ステップ11)。主記憶装置4、または補助記憶装置5に格納されている辞書より認識文字候補「でん千」、「でん子」、「でん干」、「でん于」を作成する(ステップ12)。特定できるかの判定で4つ候補が存在するため、この場合は特定できない(ステップ13)。主記憶装置4、または補助記憶装置5に格納されている読み辞書を検索し、文字候補の読みを取得する。「千」に対しては「せん」、「ち」、「ぢ」を取得する(ステップ14)。
【0029】
図8のようにステップ14で取得した読みに対してかな漢字変換を行う。「でんせん」、「でんち」、「でんぢ」の読みに対して「電線」、「伝染」、「電池」、「田地」、「伝」「ぢ」等の変換結果を取得する(ステップ15)。このとき変換結果の文節数が最小になるように、または読みが最長になるように変換結果を残す。この結果、「電線」、「伝染」、「電池」、「田地」が残り、変換結果に「千」が候補に含まれない(ステップ16)。次のデータ「子」を取得する(ステップ17)。
【0030】
「子」について同様の処理を行う「子」に対しては読み辞書を検索し、「おとこ」「こ」、「ご」、「し」、「じ」、「す」、「ね」、「み」の読みを取得する。取得した読みから手書き文字列の読み候補「でんおとこ」、「でんこ」、「でんご」、「でんし」、「でんじ」、「でんす」、「でんね」、「でんみ」の読みに対して「電」「男」、「電故」、「電」「五」、「電子」、「出んし」、「電磁」、「田地」、「伝」「巣」、「伝ね」、「伝」「身」等を変換結果として取得する。この結果、「電故」、「電子」、「出んし」、「電磁」が残り、「子」と一致する「電子」があると判定する(ステップ16)。「子」を認識文字として、かな漢字変換の結果である最適な表記形態として決定した文字「電子」を出力装置3または、主記憶装置4、補助記憶装置5に出力する(ステップ18)。
【0031】
以上説明したように本第2の実施例によれば、本来、漢字文字列で表記されることが望ましいが、その漢字の一部を平仮名で入力した場合、意図した漢字文字列の単語が出力されることになる。
【0032】
尚、実施例では、入力される文字列は、文字をイメージとして取り込んで認識する場合(OCR等)、及び、手書きパッド(例えば専用のペン)で入力する場合のいずれにも適応可能ではあるが、例えばイメージを記憶している記憶媒体から画像を読み取って認識したり、回線を介して受信した画像(例えばファクシミリ)を直接認識するようにしても良い。いずれにしても、上記説明から容易に推察できるように、直接文字を手で記入してそれを認識する装置に適応した場合に、その効果が大きい。特に、ペン入力による入力領域がある程度狭くて画数の多い文字が入力しずらい場合、或いは、漢字そのものが思い出せない場合にその威力を発揮する。
【0033】
また、入力が手書きパッドのような手書き入力の場合、認識用の辞書も手書き認識用の辞書となり、文字を認識する詳細な処理は異なるが、その後の読みに戻し、かな漢字変換をし、認識文字列を決定する処理は同様にできるので、効果が大きい。
【0034】
更にまた、実施例では特に説明しなかったが、候補単語の読みに対する仮名漢字変換を行って照合処理を行う場合、その候補単語を構成する文字は、認識処理で得られた候補文字の第1候補から順に使用することが望ましい。理由は、図1のステップS14〜ステップS17のループ回数が、全体として少ない方向に作用するからである。
【0035】
更には、上記説明から容易に推察されるように、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器から成る装置に適用しても良い。また、本発明はシステム或は装置にプログラムを供給することによって達成される場合にも適用できることは言うまでもない。
【0036】
【発明の効果】
以上説明したように本発明のデータ処理方法は、文字列を入力するステップと、文字を認識するステップと、辞書から漢字の読みを取り出すステップと、その読みをかな漢字変換するステップと、変換した文字と認識した文字の候補を画するステップと、認識した文字列を出力するステップと、を設けることにより、そのことによって、文字認識の認識率の向上、かな漢字変換辞書との共用等の記憶容量の減少等の効果がある。
【0037】
【図面の簡単な説明】
【図1】実施例における文字認識処理の処理手順を示すフローチャートである。
【図2】実施例のシステムのブロック構成図である。
【図3】従来の文字認識処理手順を示すフローチャートである。
【図4】従来の文字認識の概要を説明するための図である。
【図5】従来の文字認識の概要を説明するための図である。
【図6】実施例における文字認識処理の概要を示す図である。
【図7】実施例における文字認識処理の概要を示す図である。
【図8】第2の実施例における文字認識処理の概要を示す図である。
【符号の説明】
1 中央処理装置
2 主記憶装置
3 入力装置
4 表示装置
5 補助記憶装置
Claims (6)
- 漢字仮名混じり文字列を入力する入力手段と、
前記入力手段により入力された漢字仮名混じり文字列の文字を文字認識し、各文字に対して候補文字を1つまたは複数出力する文字認識手段と、
前記文字認識手段で文字認識して得られた各文字の候補文字を組み合わせることにより、前記漢字仮名混じり文字列に対する候補単語を1つまたは複数形成する候補単語形成手段と、
前記候補単語形成手段で形成された候補単語が複数あると判断した場合、当該複数の候補単語のうちから処理対象とされた候補単語に含まれる漢字の候補文字の読みを1つまたは複数取り出す処理を行う取り出し手段と、
前記取り出し手段で取り出された読みと当該候補単語に含まれる仮名の候補文字とを組み合わせることにより前記漢字仮名混じり文字列の読み候補を複数生成し、当該生成された複数の読み候補を仮名漢字変換する処理を行う仮名漢字変換手段と、
前記仮名漢字変換手段で得られた変換結果の漢字と前記候補単語に含まれる漢字部分の候補文字とを照合する処理を行う照合手段と、
前記複数あると判断された候補単語のうちの最初の候補単語から順に前記処理対象の候補単語として、前記取り出し手段と前記仮名漢字変換手段と前記照合手段とによるそれぞれの処理を行っていき、前記照合手段の照合が成功した時点で、前記認識手段で得られた複数の候補文字の中から認識結果とする候補文字を特定し、当該特定された候補文字を前記漢字仮名混じり文字列の認識結果として出力する第1の出力手段と、
前記候補単語形成手段で形成された候補単語が1つであると判断した場合、当該候補単語を構成している候補文字を特定し、当該特定された候補文字を前記漢字仮名混じり文字列の認識結果として出力する第2の出力手段と
を備えることを特徴とする文字認識装置。 - 前記入力手段で入力される文字列は、手書き入力された文字列であることを特徴とする請求項第1項に記載の文字認識装置。
- 前記入力手段で入力される文字列は、文字イメージであることを特徴とする請求項第1項に記載の文字認識装置。
- 入力された漢字仮名混じり文字列の文字を文字認識し、各文字に対して候補文字を1つまたは複数出力する文字認識工程と、
前記文字認識工程で文字認識して得られた各文字の候補文字を組み合わせることにより、前記漢字仮名混じり文字列に対する候補単語を1つまたは複数形成する候補単語形成工程と、
前記候補単語形成工程で形成された候補単語が複数ある場合、当該複数の候補単語のうちから処理対象とされた候補単語に含まれる漢字の候補文字の読みを1つまたは複数取り出す処理を行う取り出し工程と、
前記取り出し工程で取り出された読みと当該候補単語に含まれる仮名の候補文字とを組み合わせることにより前記漢字仮名混じり文字列の読み候補を複数生成し、当該生成された複数の読み候補を仮名漢字変換する処理を行う仮名漢字変換工程と、
前記仮名漢字変換工程で得られた変換結果の漢字と前記候補単語に含まれる漢字部分の候補文字とを照合する処理を行う照合工程と、
前記複数あると判断された候補単語のうちの最初の候補単語から順に前記処理対象の候補単語として、前記取り出し工程と前記仮名漢字変換工程と前記照合工程とによるそれぞれの処理を行っていき、前記照合工程の照合が成功した時点で、前記認識工程で得られた複数の候補文字の中から認識結果とする候補文字を特定し、当該特定された候補文字を前記漢字仮名混じり文字列の認識結果として出力する第1の出力工程と、
前記候補単語形成工程で形成された候補単語が1つの場合、当該候補単語を構成している候補文字を特定し、当該特定された候補文字を前記漢字仮名混じり文字列の認識結果として出力する第2の出力工程と
を備えることを特徴とする文字認識方法。 - 前記入力された漢字仮名混じり文字列は、手書き入力された文字列であることを特徴とする請求項第4項に記載の文字認識方法。
- 前記入力された漢字仮名混じり文字列は、文字イメージであることを特徴とする請求項第4項に記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26958994A JP3666909B2 (ja) | 1994-11-02 | 1994-11-02 | 文字認識装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26958994A JP3666909B2 (ja) | 1994-11-02 | 1994-11-02 | 文字認識装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08129617A JPH08129617A (ja) | 1996-05-21 |
JP3666909B2 true JP3666909B2 (ja) | 2005-06-29 |
Family
ID=17474470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26958994A Expired - Fee Related JP3666909B2 (ja) | 1994-11-02 | 1994-11-02 | 文字認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3666909B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100568246B1 (ko) | 2003-11-19 | 2006-04-05 | 삼성전자주식회사 | 컴퓨터 시스템 및 그 제어방법 |
-
1994
- 1994-11-02 JP JP26958994A patent/JP3666909B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08129617A (ja) | 1996-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4350109B2 (ja) | 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム | |
JP3689455B2 (ja) | 情報処理方法及び装置 | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
EP1971957B1 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
JPH0562391B2 (ja) | ||
CN1121605A (zh) | 信息处理方法和设备 | |
Duygulu et al. | A hierarchical representation of form documents for identification and retrieval | |
JPH11203415A (ja) | 類似パターンカテゴリ識別辞書作成装置および方法 | |
JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
Lamghari et al. | Template matching for recognition of handwritten Arabic characters using structural characteristics and Freeman code | |
Senda et al. | Document image retrieval system using character candidates generated by character recognition process | |
JP3666909B2 (ja) | 文字認識装置及び方法 | |
US8260054B2 (en) | Methods for matching image-based texual information with regular expressions | |
US6320985B1 (en) | Apparatus and method for augmenting data in handwriting recognition system | |
Sagar et al. | OCR for printed Kannada text to machine editable format using database approach | |
EP1010128B1 (en) | Method for performing character recognition on a pixel matrix | |
El-Desouky et al. | A handwritten Arabic character recognition technique for machine reader | |
Marcelli et al. | A structural indexing method for character recognition | |
JPH11328315A (ja) | 文字認識装置 | |
Myroniv et al. | Realization of information technology of character recognition based on competing cellular automata | |
Huang et al. | Research Article Isolated Handwritten Pashto Character Recognition Using aK-NN Classification Tool based on Zoning and HOG Feature Extraction Techniques | |
JPH09114926A (ja) | オンライン文字認識における入力文字大分類方法および装置 | |
JPH06111079A (ja) | 単語読み取り装置 | |
JPH09179935A (ja) | 文字認識装置およびその制御方法 | |
Ahmed et al. | A novel intelligent system for defining similar symbols |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050405 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090415 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090415 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100415 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110415 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |