JP2014146183A - Information processing device, information processing method, and program - Google Patents
Information processing device, information processing method, and program Download PDFInfo
- Publication number
- JP2014146183A JP2014146183A JP2013014550A JP2013014550A JP2014146183A JP 2014146183 A JP2014146183 A JP 2014146183A JP 2013014550 A JP2013014550 A JP 2013014550A JP 2013014550 A JP2013014550 A JP 2013014550A JP 2014146183 A JP2014146183 A JP 2014146183A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- recognition
- character
- character string
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、文字列を処理する技術に関する。 The present invention relates to a technique for processing a character string.
OCR(Optical Character Recognition)や手書き認識による文字認識結果を補正して文字認識の精度を高める技術が知られている。例えば、特許文献1は各文字に複数の文字候補が定義された認識結果と、単語辞書に登録された単語とを比較し、一致度が高い単語を選択して出力する単語認識方法を開示している。特許文献1に記載の技術では、単語の各位置に現れる文字と、対応する位置の認識結果を位置毎に比較する。
There is known a technique for improving the accuracy of character recognition by correcting a character recognition result by OCR (Optical Character Recognition) or handwriting recognition. For example,
特許文献1に記載の技術では、認識対象となった文字列(認識文字列)の認識結果と、単語辞書の単語とを、文字が現れる位置毎に局所的に比較するのみである。そのため、認識結果の位置が認識文字列とずれていた場合や、一部の文字の認識に失敗した場合に補正の精度が大きく低下するなど、文字認識結果を補正する精度が低かった。
In the technique described in
本発明は、このような状況に鑑みてなされたものであり、認識文字列の認識結果を高い精度で補正する情報処理装置を提供することを目的とする。 The present invention has been made in view of such a situation, and an object thereof is to provide an information processing apparatus that corrects a recognition result of a recognized character string with high accuracy.
上記目的を達成するため、本発明に係る情報処理装置は、
文字認識装置からの単語の認識結果として、文字毎に順位付けされた複数の認識候補文字を有する認識文字列を取得する結果取得手段と、
前記認識文字列に対応する複数の候補単語を取得する候補取得手段と、
前記認識文字列の各文字に対応する複数の認識候補文字が前記候補単語の文字列上に現れる位置と当該認識候補文字の順位に基づいて、前記認識文字列と前記候補単語の類似度を決定する決定手段と、
前記複数の候補単語について前記決定手段が決定した類似度に基づいて候補単語の1つを選択し出力する出力手段と、
を備えることを特徴とする。
In order to achieve the above object, an information processing apparatus according to the present invention provides:
A result acquisition means for acquiring a recognition character string having a plurality of recognition candidate characters ranked for each character as a word recognition result from the character recognition device;
Candidate acquisition means for acquiring a plurality of candidate words corresponding to the recognized character string;
The similarity between the recognized character string and the candidate word is determined based on a position where a plurality of recognition candidate characters corresponding to each character of the recognized character string appear on the character string of the candidate word and the rank of the recognized candidate character. A decision means to
Output means for selecting and outputting one of the candidate words based on the similarity determined by the determining means for the plurality of candidate words;
It is characterized by providing.
本発明によれば、認識文字列の認識結果を高い精度で補正することができる。 According to the present invention, the recognition result of the recognized character string can be corrected with high accuracy.
以下、本発明を実施するための形態に係る文字認識装置を、図を参照して説明する。なお、図中同一又は相当する部分には同一符号を付す。 Hereinafter, a character recognition device according to an embodiment for carrying out the present invention will be described with reference to the drawings. In the drawings, the same or corresponding parts are denoted by the same reference numerals.
(実施形態1)
実施形態1に係る文字認識装置1は、i)解析対象となる文字列を記載した紙等を撮影する撮影機能、ii)撮影した画像の文字列を認識して認識結果を出力する機能、iii)認識結果を単語辞書に登録された単語と比較する機能、iv)比較結果に応じて認識結果を補正する機能、等を備える。
(Embodiment 1)
The
文字認識装置1は図1に示すように画像入力部10と、OCR(Optical Character Reader)210と文字列処理部60と文字辞書記憶部220と単語辞書記憶部240とを含む情報処理部20と、表示部40と、操作部30と、を備える。
As shown in FIG. 1, the
画像入力部10は、カメラと画像処理部とから構成され、このような物理構成により文字列を撮影した画像を取得する。画像入力部10は、取得した画像を情報処理部20のOCR210に伝達する。
The
情報処理部20は、物理的には、図2に示すようにCPU(Central Processing Unit)21と、RAM(Random Access Memory)22と、ROM(Read−only memory)23と、I/O(Input/Output)部24と、外部記憶装置25と、内部バス26と、から構成される。
As shown in FIG. 2, the
CPU21は、文字認識装置1の諸機能を制御する中央演算装置であり、ROM23からRAM22にロードされたプログラムを実行して、後述する処理を実行する。
The
RAM22は、CPU21が実行するプログラムや中間データを一時的に保存し、CPU21が各種処理を行う際の作業領域として使用する揮発性メモリである。
ROM23は、CPU21が実行するプログラムを格納している不揮発性メモリである。
The
The
I/O部24は、USB(Universal Serial Bus)やシリアルポートによって情報処理部20に接続された画像入力部10、表示部40、操作部30やその他外部装置等との情報の入出力を制御する入出力デバイスである。
The I /
外部記憶装置25は、ハードディスクドライブ、CD−ROM(Compact Disc Read Only Memory)、フラッシュメモリ等の大容量記憶装置であり、文字辞書や単語辞書等の後述する処理に用いる大容量データを記憶している。
なお、CPU21と、RAM22と、ROM23と、I/O部24と、外部記憶装置25とは内部バス26によってそれぞれ接続され、相互に情報の送信が可能である。
The
The
情報処理部20は、上記物理構成によりOCR210と、文字列処理部60と、文字辞書記憶部220と、単語辞書記憶部240と、として機能する。
The
OCR210は、入力部10から伝達された画像(図3の入力画像TI)の文字を認識し、画像に含まれる文字列(文字認識の対象となる認識文字列)の各文字を文字辞書記憶部220に登録された文字情報を用いて光学認識により認識する。OCR210は、認識文字列に含まれる少なくとも一部の文字について信頼度が異なる複数の認識候補が定義された認識結果(例えば、図3の認識結果R)を出力する。OCR210は、加重方向ヒストグラムを特長量として利用するベイズ識別法を用いた認識方法や、外郭方向寄与度特徴を特徴量として利用する部分空間法を用いた認識方法など、既知の任意の方法を用いて文字認識を行ってよいが、ここでは特開平9−128489号公報に記載された方法を用いる。
各文字に対して、最大n個の認識候補が定義される。本実施形態ではn=2である。認識結果では、認識結果の各認識候補に、認識候補に対応する文字が認識文字列に現れる位置を示す情報として、文字番号が対応付けられている。OCR210は、スペースによって認識結果を単語単位に分割し、単語毎に文字列処理部60に伝達する。
The OCR 210 recognizes characters in the image transmitted from the input unit 10 (input image TI in FIG. 3), and stores each character of the character string (recognized character string to be character recognition target) included in the image as a character dictionary storage unit. Recognition is performed by optical recognition using the character information registered in 220. The
A maximum of n recognition candidates are defined for each character. In this embodiment, n = 2. In the recognition result, a character number is associated with each recognition candidate of the recognition result as information indicating a position where a character corresponding to the recognition candidate appears in the recognized character string. The
文字列処理部60は、図3の中段に示すように、OCR210から伝達された認識結果を単語辞書記憶部240に登録された単語と比較して、最も類似度が高い単語を認識結果に対応する出力文字列として選択する。文字列処理部60は、選択した出力文字列を表示部40に出力する。
As shown in the middle part of FIG. 3, the character
表示部40は、液晶ディスプレイ等から構成され、文字列処理部60から伝達された情報を表示する。
The
操作部30は、タッチパネル、キーボード、ボタン、ポインティングデバイス等の、ユーザの操作を受付ける操作受付装置と、操作受付装置が受け付けた操作の情報を情報処理部20に伝達する伝達部と、から構成される。操作部30はこのような物理構成によりユーザの操作を受け付けて、その情報を情報処理部20に伝達する。
The
ここで文字認識装置1が文字列を撮影した画像と、認識結果と、候補文字列と、出力文字列と、の関係を図3を参照して説明する。
文字認識装置1は、ユーザが画像入力部10を用いて文字列を含む画像(たとえば、レストランのメニュー)を撮影すると、図3の上段に示すような画像TIを取得する。
Here, the relationship between an image obtained by photographing the character string by the
When the user captures an image including a character string (for example, a restaurant menu) using the
そして、画像TIをOCR210が光学認識する。図3の認識結果Rは、入力画像の一つの単語(sweet)を認識した結果である。認識結果において、認識文字列の各位置に現れる文字の認識候補が信頼度順に定義されている。文字番号は各認識候補が、認識文字列の認識結果として何番目に認識されたかを示す。候補番号は、各文字の何番目に信頼度が高い認識候補であるかを示す。図3では、文字番号0に対して小文字の「s」が最も信頼度が高い認識候補として、大文字の「S」が次に信頼度が高い認識候補として設定されている。
Then, the
単語辞書記憶部240は、認識結果に対応する出力文字列の候補となる候補文字列として、複数の単語を記録している(図3中段右)。文字列処理部60は、単語辞書に登録されている単語を順次その処理における候補文字列として取得し、認識結果と候補文字列が類似する程度を示す類似度を算出する。そして、単語辞書に登録されている単語のうち、最も類似度が高い単語を出力文字列として選択する。そして、OCR210が出力する各単語について出力文字列を選択して、表示部40に出力する(図3下段)。
The word
ここで、CPU21は、ROM23内の各種プログラムを読み出し、RAM22にロードすることにより、図4に示すような文字列処理部60の各部の機能を発揮することができる。
具体的には、文字列処理部60は機能単位として結果取得部610、特定部620、候補取得部630、比較部640、決定部650、選択部660及び出力部670を含む。
Here, the
Specifically, the character
結果取得部610は、OCR210から認識結果Rを単語単位で一つずつ取得する。候補取得部630は、単語辞書記憶部240が記憶する単語辞書から、現在のループで処理対象となる注目候補文字列を取得する。
The
特定部620は、認識結果と候補文字列とで同じ文字が互いに類似する位置に現れるヒット位置を特定する。ここで、候補文字列に含まれ、かつ認識結果の認識候補にも含まれる文字のうち、文字番号の差が所定の閾値(例えば2)以下である文字を共通文字とする。そして、共通文字の認識結果における文字番号が認識結果におけるヒット位置となる。また、共通文字の候補文字列における文字番号が、候補文字列におけるヒット位置となる。
The identifying
比較部640は、認識結果の複数の位置を基点として、候補文字列に現れかつ認識候補に含まれる文字の、候補文字列における位置と、認識結果における位置及び信頼度に基づいて、認識結果と候補文字列とを比較する。具体的には、特定部620が特定した認識結果のヒット位置を、比較の起点(注目認識番号)として順次選択する。そして、比較の起点から連続して、認識候補の何れかが、候補文字列の対応する位置に現れる文字の何れかと一致する範囲について比較注目候補文字列と認識結果を比較する。具体的には、信頼度が高い認識候補が、候補文字列のより類似した位置に現れる程度を示す部分スコアを求める。部分スコアを求める具体的な方法については後述する。
The
決定部650は、比較部640の比較結果に基づいて、認識結果と候補文字列の類似度を決定する。具体的には、比較部640が認識結果のヒット位置のそれぞれについて求めた部分スコアを合算した値を、類似度として決定する。
The
選択部660は、候補取得部630が単語辞書から取得した複数の候補文字列から、決定部650が決定した類似度に応じて出力文字列を選択する。具体的には、複数の候補文字列のうち、決定部650が決定した類似度が最も高い候補文字列を、出力文字列として選択する。
The
出力部670は、選択部660が選択した出力文字列を出力する。具体的には、出力文字列の情報を表示部40に表示させる。あるいは、出力文字列を補正した認識結果として外部記憶装置25に記憶する、I/O部24を介して外部装置に出力するなど、ユーザの設定操作に応じた出力態様により出力してもよい。
The
文字認識装置1が実行する処理を、フローチャートを用いて説明する。文字認識装置1は、ユーザが画像入力部10を用いて文字列を含む画像(入力画像TI)を撮影すると、図5に示す認識結果出力処理を開始する。
Processing executed by the
認識結果出力処理では、まずOCR210が画像入力部10から入力画像TIを取得する(ステップS101)。そして、OCR210が、入力画像TIに含まれる各文字を認識する(ステップS102)。
In the recognition result output process, first, the
次に、OCR210が認識結果をスペース文字を区切として単語単位に分割する(ステップS103)。そして、分割された単語の一つが現在のループにおいて処理対象となる注目認識文字列として選択される。選択された注目認識文字列の認識結果Rを結果取得部610が取得する(ステップS104)。
Next, the
次に、候補取得部630が、単語辞書記憶部240が記憶する単語辞書から、現在のループにおいて比較対象となる候補文字列(注目候補文字列)を取得する(ステップS105)。本実施形態では処理速度を向上するため、認識結果の文字の長さを基準として、文字長の差が所定の閾値以下である単語を候補文字列として、その他の単語は処理対象としない。例えば、認識結果の長さが5文字である場合、3文字以上7文字以下の単語を、候補文字列とする。
Next, the
そして、特定部620、比較部640及び決定部650が、注目認識文字列の認識結果と注目候補文字列の類似度を決定するための処理(類似度決定処理)を実行する(ステップS106)。以下、必要に応じて図3の認識結果Rと、注目候補文字列“sweet”の類似度を決定する場合を例にとって説明する。
Then, the specifying
ステップS106で実行される類似度決定処理について、図6を参照して説明する。類似度決定処理では、文字列処理部60による使用変数の初期化等に続いて、特定部620が認識結果の文字番号(認識番号)から、処理対象となる注目認識番号を選択する(ステップS201)。この例では、認識文字列の“s”の位置に対応する「0番」から、最後の“t”に対応する「4番」まで順に選択するものとする。注目認識番号は、処理対象となる認識結果の位置、即ち認識文字列の何番目の文字が処理対象であるかを示す。
The similarity determination process executed in step S106 will be described with reference to FIG. In the similarity determination process, following the initialization of the variables used by the character
ステップS201にて注目認識番号を選択すると、次に特定部620は注目候補文字列の文字番号(比較番号)のうち、処理対象となる注目比較番号を選択する(ステップS202)。ここでは、比較処理のループ毎に候補文字列の“s”の位置に対応する「0番」から、最後の“t”に対応する「4番」まで順に選択するものとする。注目比較番号は、処理対象となる注目候補文字列の位置、即ち注目候補文字列の何番目の文字が処理対象であるかを示す。
When the attention recognition number is selected in step S201, the specifying
ステップS202にて注目比較番号を選択すると、次に特定部620は注目認識番号に対応する認識候補から、処理対象となる注目候補を選択する(ステップS203)。ここでは、信頼度が高いものを優先して処理するため、ループ毎に候補番号が若い順に選択する。この例では、0番の認識候補のうち候補番号0に対応する“s”が最初に、1番に対応する“S”が次に選択される。
When the attention comparison number is selected in step S202, the specifying
そして、特定部620は注目候補が注目比較番号に対応する比較文字と一致するか否か判別する(ステップS204)。一致すると判別すると(ステップS204;YES)、処理対象の位置はヒット部位であるので、比較部640が注目認識番号及び注目比較番号の位置を基点に詳細スコアを算出するための詳細スコア算出処理を開始する(ステップS205)。この場合、注目比較番号に対応する候補文字列の位置が候補文字列におけるヒット部位、認識結果の注目認識番号の位置に対応する位置が認識結果におけるヒット部位となる。
Then, the specifying
例えば、図3の認識結果Rと、注目候補文字列"sweet"を比較すると、ヒット部位は図8のように示すことができる。図8の左上の円は、認識結果の先頭位置(文字番号0)の、候補番号0に対応する候補“s”が、候補文字列の先頭位置(文字番号0)に現れる文字と一致することを示す。この場合、認識結果の0番に相当する位置(文字番号0の行)が、認識結果のヒット部位である。また、候補文字列の0番に相当する位置(文字番号0の列)が、候補文字列のヒット部位である。
For example, when the recognition result R of FIG. 3 is compared with the candidate character string “sweet”, the hit site can be shown as shown in FIG. The upper left circle in FIG. 8 indicates that the candidate “s” corresponding to the
本実施形態では、認識結果のn番に対応する認識候補の何れかが、点線長方形でしめした候補文字列の文字番号が(n−2)〜(n+2)までの何れかの位置に現れる文字と一致した場合に、その行は認識結果のヒット部位とする。即ち、許容誤差を2文字とする。 In the present embodiment, any of the recognition candidates corresponding to the nth recognition result is a character that appears in any position from (n-2) to (n + 2) where the character number of the candidate character string indicated by the dotted rectangle is If it matches, the line is set as a hit part of the recognition result. That is, the allowable error is 2 characters.
なお、ステップS204で注目候補は注目比較番号の文字と一致しないと判別された場合(ステップS204;NO)は、特定部620が注目認識番号に定義された全認識候補を処理済みであるか判別し(ステップS206)、未処理の認識候補が残っている場合は(ステップS206;NO)、次の認識候補についてステップS203から処理を繰り返す。一方、全認識候補が処理済である場合は(ステップS206;YES)、ステップS207にスキップする。これにより、例えば文字番号2の位置の、候補番号0に対応する候補“c”について処理を終えた後、未処理の認識候補“e”を注目候補としてステップS203から処理が繰り返される。
When it is determined in step S204 that the attention candidate does not match the character of the attention comparison number (step S204; NO), it is determined whether all the recognition candidates defined in the attention recognition number have been processed by the specifying
このように、定義された認識文字のいずれかが、注目候補文字列の対応する位置及びその位置を基準として許容範囲内(図8ではその行の点線四角形に含まれる何れかの位置)に現れる文字の何れかに一致する場合に、該当位置はヒット部位となり、その位置を基点に詳細スコアが算出される。特定部620は各ループで注目認識番号、注目比較番号、注目候補が更新される毎にステップS204で注目候補と比較文字とが一致するかを判別する処理を実行する。このようにして、特定部620は認識結果と候補文字列とで同じ文字が、互いに類似した位置で現れるヒット位置(認識番号と比較番号)を特定する。
In this way, any of the defined recognized characters appears within the permissible range based on the corresponding position of the candidate character string of interest and the position thereof (in FIG. 8, any position included in the dotted rectangle in the row). If it matches any of the characters, the corresponding position becomes a hit site, and a detailed score is calculated based on that position. Each time the attention recognition number, the attention comparison number, and the attention candidate are updated in each loop, the specifying
ステップS205で実行される詳細スコア算出処理について、図7を参照して説明する。詳細スコア算出処理では、比較部640がまず比較の起点となるヒット部位に対応して、注目候補の信頼度と位置のズレ(認識番号と比較番号の差)に応じたスコアを詳細スコアに加算する(ステップS301)。
The detailed score calculation process executed in step S205 will be described with reference to FIG. In the detailed score calculation process, the
より信頼度が高い認識候補が、候補文字列のより類似した位置に現れるほど、候補文字列と認識結果は類似していると判断できる。そこで、ヒット位置のそれぞれに対応してステップS301とS305で加算するスコアを図9のように設定する。図9の例では、認識番号と選択番号が一致し、かつ信頼度が高い(候補番号0)文字に対応するヒット位置に最も高いスコア(10点)が設定されている。一方、認識番号と選択番号が一致し、信頼度が低い(候補番号1)文字に対応するヒット位置には、これよりも低いスコア(5点)が設定されている。さらに、これを基準として認識番号と選択番号が1違う場合には、同一の場合よりも小さくスコア(候補番号0に対して6点、候補番号1に対して3点)が、2違う場合には、さらに小さくスコア(候補番号0に対して4点、候補番号1に対して2点)がそれぞれ設定されている。その他の各位置については位置の差が大きすぎるとの判断のもと、0点が設定されている。0点の部分は比較範囲外に設定されるため、たとえ共通文字が現れていても詳細スコアは算出されない。
It can be determined that the recognition result is more similar to the candidate character string as the recognition candidate with higher reliability appears at a more similar position in the candidate character string. Therefore, the score to be added in steps S301 and S305 corresponding to each hit position is set as shown in FIG. In the example of FIG. 9, the highest score (10 points) is set at the hit position corresponding to the character whose recognition number matches the selection number and has high reliability (candidate number 0). On the other hand, a lower score (5 points) is set at the hit position corresponding to the character whose recognition number matches the selected number and has low reliability (candidate number 1). Furthermore, when the recognition number and the selection number are different from each other on the basis of this, the score (6 points for
スコアの設定はこれに限らず、位置のズレにより厳しく、比較番号と認識番号が一致していない部分(一文字以上ずれている位置)にはすべて0点を設定しても良い。このような設定は、入力画像が鮮明で、文字の位置がズレる割合が少ない場合などに好適である。あるいは、候補番号の数値が上がった場合によりスコアの減少幅を大きくするなど、条件に合わせて任意に設定可能である。 The setting of the score is not limited to this, and it is severe due to the position shift, and 0 points may be set for all portions where the comparison number and the recognition number do not match (a position shifted by one or more characters). Such a setting is suitable for a case where the input image is clear and the ratio of character positions is small. Alternatively, it can be arbitrarily set according to the conditions, such as increasing the decrease range of the score when the numerical value of the candidate number increases.
例えば図9のようにスコアが設定されている場合であって、注目認識番号が3番、注目比較番号が3番の候補番号0(図10の星型六角形)が比較の起点となるヒット部位であったときには、ステップS301で10点が加算される。一方、注目認識番号が3番、注目比較番号が2番の候補番号0(図10の三角形)が詳細スコアの算出基準であったときには6点が加算される。
For example, in the case where a score is set as shown in FIG. 9, the candidate number 0 (star hexagon in FIG. 10) having the
ステップS301で詳細スコアに加算すると、次に比較部640は起点からの比較処理を開始する。具体的には、まず調査方向に一つずらした位置、即ち一つ前(又は後ろ)の位置を調査位置として選択する(ステップS302)。本実施形態ではまず前方向に調査し、前方向の調査が終われば後ろ方向に変更する。例えば前に調査する場合、認識番号と比較番号とをデクリメントした位置が新たな調査位置として選択される。例えば、図10の星型6角形から、認識番号2、比較番号2の位置(斜線の部分)で認識結果と候補文字列を比較する。
If it adds to a detailed score by step S301, the
認識結果と候補文字列の比較の具体例として、まず比較部640は調査位置の認識候補から、比較対象となる調査候補を選択する(ステップS303)。ここでは、信頼度が高い順に選択する。例えば、認識番号2、比較番号2の位置(図10の斜線部)の場合、認識候補“c”が先に選択される。そして、比較部640は調査候補と対応文字(候補文字列の調査位置における文字)が一致するか否か判別する(ステップS304)。例えば、調査位置が認識番号2、比較番号2であり、調査候補が1番目の認識候補“c”であった場合、対応文字は“e”であるので、文字は一致しないと判別される。
As a specific example of the comparison between the recognition result and the candidate character string, the
調査候補と対応文字が一致しないと判別された場合には(ステップS304;NO)、次に調査位置の全認識候補が処理済であるか否かを判別する(ステップS306)。未処理の認識候補が存在する場合(ステップS306;NO)、次の認識候補を調査候補としてステップS303から処理を繰り返す。例えば、調査位置が認識番号2、比較番号2であり、調査候補が1番目の認識候補“c”であった場合、2番目の認識候補“e”が未処理であるので、ステップS303にて2番目の認識候補“e”が調査候補として選択される。
If it is determined that the survey candidate and the corresponding character do not match (step S304; NO), it is then determined whether all the recognition candidates at the survey position have been processed (step S306). If there is an unprocessed recognition candidate (step S306; NO), the process is repeated from step S303 with the next recognition candidate as the investigation candidate. For example, if the survey position is the
一方、ステップS306にて全認識候補が処理済であると判別された場合は(ステップS306;YES)、調査位置のどの認識候補も、対応文字(認識文字列の対応する位置の文字)と一致しないので、現在の調査方向については調査を終了し、ステップS308にスキップする。このため、比較部640は起点となる位置から連続して、認識候補の何れかが、候補文字列の対応する位置に現れる文字の何れかと一致する範囲で、認識結果と候補文字列とを比較することとなる。
On the other hand, if it is determined in step S306 that all recognition candidates have been processed (step S306; YES), any recognition candidate at the survey position matches the corresponding character (the character at the corresponding position in the recognized character string). Therefore, the survey is terminated for the current survey direction, and the process skips to step S308. For this reason, the
このように本実施形態では、起点となる位置から認識候補の何れかが、候補文字列の対応する位置に現れる文字の何れかと一致する範囲で認識結果と候補文字列とを比較する。一致する範囲外については比較を打ち切ることで、処理負担を軽減することが出来る。また、複数の起点からこのような比較を行うことで、認識文字列の一部に認識不能な文字が有った場合や、認識結果の位置がずれていた場合でも、文字列全体を比較して類似度を求めることが出来る。 Thus, in the present embodiment, the recognition result and the candidate character string are compared within a range in which any of the recognition candidates from the starting position matches any of the characters appearing at the corresponding position of the candidate character string. Processing out of the matching range can be reduced by terminating the comparison. In addition, by making such a comparison from multiple starting points, even if there are unrecognizable characters in some of the recognized character strings, or even if the recognition results are misaligned, the entire character strings are compared. The similarity can be obtained.
ステップS304で調査候補と対応文字が一致すると判別された場合(ステップS304;YES)、ステップS301と同様に、調査候補の信頼度と位置のズレ(認識番号と比較番号の差)に応じたスコアを詳細スコアに加算する(ステップS305)。例えば、調査位置が認識番号2、比較番号2であり、調査候補が2番目の認識候補“e”であった場合、認識番号と比較番号が一致し、かつ調査候補の認識番号が2番であることに対応して、5点が詳細スコアに加算される。なお、一つの認識番号に3つ以上の認識候補が定義されている場合には、3番目の認識候補には1番目の認識候補の1/3のスコアを設定すればよい。
When it is determined in step S304 that the survey candidate matches the corresponding character (step S304; YES), the score corresponding to the reliability of the survey candidate and the positional deviation (difference between the recognition number and the comparison number) is the same as in step S301. Is added to the detailed score (step S305). For example, when the survey position is the
ステップS305でスコアを加算すると、次に比較部640は調査位置が文字列の端部に到達したか否か判別する(ステップS307)。具体的には、ステップS302の調査方向が前方向の場合であって調査位置が認識結果又は候補文字列の先端の何れかに到達したときには、それ以上調査方向に比較を続けることが出来ないので、端部に到達したと判別する。調査方向が後方向の場合であって調査位置が認識結果又は候補文字列のいずれかの後端に到達したときには、それ以上調査方向に比較を続けることが出来ないので、端部に到達したと判別する。
When the scores are added in step S305, the
文字列の端部に到達していない場合には(ステップS307;NO)、ステップS302に戻って、次の位置を調査位置として、現在の調査方向への比較を続ける。例えば、現在の調査位置が図10の斜線部(認識番号2、比較番号2に対応)であった場合で、調査方向が前方向のときは、矢印の示すように認識番号1、比較番号1を調査位置として比較を続ける。
If the end of the character string has not been reached (step S307; NO), the process returns to step S302, and the comparison in the current survey direction is continued with the next position as the survey position. For example, when the current survey position is the hatched portion in FIG. 10 (corresponding to
一方、端部に到達した場合は(ステップS307;YES)、現在の調査方向へは比較を続けられないので、現在の調査方向に対する比較は中止する。そして、比較部640は前後の両方向に比較処理を終えたか否か判別する(ステップS308)。前後のいずれかについて比較処理を終えていない場合は(ステップS308;NO)、比較部340は調査方向の前後を入れ替える(ステップS309)。そして、ステップS302に戻って新たな調査方向(今まで前方向だった場合には後ろ方向)へ比較を続ける。このとき、一旦比較を開始した基準位置に戻って、基準位置から新たな調査方向に一つ進んだ位置を新たな調査位置とする。
例えば、図10の比較処理が前方向に進んで、認識番号0、比較番号0に対応する位置まで到達した場合に、次に基点である星型六角形の位置まで戻り、次に後ろ方向(認識番号4、比較番号4)に比較処理を進める。
On the other hand, if the end has been reached (step S307; YES), the comparison cannot be continued in the current survey direction, so the comparison for the current survey direction is stopped. Then, the
For example, when the comparison process of FIG. 10 proceeds in the forward direction and reaches the position corresponding to the
ステップS308で前後の両方向に比較を終えたと判別した場合は(ステップS308;YES),比較部640はその時点まで加算されたスコアを詳細スコアとして、詳細スコア算出処理を終了する。
When it is determined in step S308 that the comparison has been completed in both the front and rear directions (step S308; YES), the
例えば、比較の起点が図10の星型六角形である場合には、前後に実線矢印にそって比較処理を進めた結果、前方に比較した結果として(10点+5点+10点+10点)が加算され、後方に比較した結果としてさらに10点が加算されるため、45点が詳細スコアとなる。一方、同じ比較結果の3番目を比較の基準とした場合でも、図10の三角形に対応する候補文字列の2文字目を起点とした場合には、前後の何れの方向にもヒット位置が無いので、詳細スコアはステップS301にて加算された起点のスコア6点が最終的な詳細スコアとなる。 For example, when the starting point of the comparison is the star-shaped hexagon in FIG. 10, the comparison process is advanced along the solid arrows before and after, and as a result of comparison ahead (10 points + 5 points + 10 points + 10 points). Since 10 points are added as a result of comparison after the addition, 45 points become the detailed score. On the other hand, even when the third comparison result is used as a reference for comparison, there is no hit position in any direction before or after the second character of the candidate character string corresponding to the triangle in FIG. Therefore, the detailed score is the final score obtained from the starting score of 6 added in step S301.
図6に戻って、ステップS205にて詳細スコアを算出するか、ステップS206にてYESと判別するか、何れかの場合は次に文字列処理部60は比較範囲の全比較番号について上記処理済であるか否か判別する(ステップS207)。例えば、注目認識番号がnであって、許容誤差が2である場合に、比較番号(n−2)〜(n+2)の範囲が比較範囲となる。例えば、注目認識番号が3である場合に、図8の下から2行目の点線四角形の部分(候補文字列の1〜4)が比較範囲である。この比較範囲に、現在のステップS202〜ステップS207までのループにおいて処理されていない比較番号が有る場合は(ステップS207;NO)、次の未処理の比較番号についてステップS202から処理を繰り返す。
Returning to FIG. 6, the detailed score is calculated in step S205, or YES is determined in step S206. In either case, the character
例えば、注目認識番号が「3」である場合、ステップS201からステップS209のループの中で、ステップS202〜ステップS207までのループで図10の星型六角形の位置について詳細スコア(45点)を算出した後、次のループで三角形の位置(注目比較番号2)について詳細スコア(6点)を算出する。 For example, when the attention recognition number is “3”, the detailed score (45 points) is obtained for the position of the star-shaped hexagon in FIG. 10 in the loop from step S202 to step S207 in the loop from step S201 to step S209. After the calculation, a detailed score (6 points) is calculated for the position of the triangle (attention comparison number 2) in the next loop.
一方、全比較番号が処理済であった場合(ステップS207;YES)、詳細スコアに基づいて注目認識番号の部分スコアを決定する(ステップS208)。具体的には、現在の注目認識番号についてステップS202〜ステップS207のループで算出した詳細スコアのうち、最も高い値を部分スコアとして決定する。このようにして、より精度が高い比較結果に対応する詳細スコアを、注目認識番号における比較結果として採用する。 On the other hand, when all the comparison numbers have been processed (step S207; YES), the partial score of the attention recognition number is determined based on the detailed score (step S208). Specifically, the highest value among the detailed scores calculated in the loop of step S202 to step S207 for the current attention recognition number is determined as the partial score. In this way, the detailed score corresponding to the comparison result with higher accuracy is adopted as the comparison result in the attention recognition number.
部分スコアは、現在の認識番号の位置から認識結果と候補文字列を比較した場合に、認識結果のより信頼度が高い認識候補が、候補文字列のより類似した位置に現れる程度を示す。部分スコアが高いほど、より信頼度が高い認識候補が、候補文字列のより類似した位置に現れる。 The partial score indicates the degree to which a recognition candidate with higher reliability of the recognition result appears at a more similar position in the candidate character string when the recognition result is compared with the candidate character string from the position of the current recognition number. The higher the partial score, the more reliable the recognition candidate appears at a more similar position in the candidate character string.
ステップS208が終わると、次に文字列処理部60は注目識別文字列の認識結果の全位置について上記処理済であるか否か判別する(ステップS209)。未処理の位置がある場合(ステップS209;NO)、例えば図10の認識結果の文字番号3の行の次に4の行を処理するといったように、次の未処理の認識番号についてステップS201から処理を繰り返す。
When step S208 ends, the character
一方、全位置が処理済の場合(ステップS209;YES)、次に決定部650が、比較部640が算出した部分スコアに基づいて、注目認識文字列と注目候補文字列の類似度を決定する(ステップS210)。具体的には、注目認識文字列と、注目候補文字列について算出した部分スコアを合算した値(本例では45×5=225点)を類似度とする。そして、類似度決定処理を終了する。なお、文字数によって類似スコアが変わるのを防ぐために、類似度は、合算した値を文字数の2乗で除算して正規化した値としてもよい。
On the other hand, when all the positions have been processed (step S209; YES), the
図5に戻って、ステップS106にて注目候補文字列について類似度を決定すると、次に文字列処理部60は全候補文字列について類似度を決定済みであるか否か判別する(ステップS107)。未処理の候補文字列が有る場合(ステップS107;NO)は、ステップS105に戻って次の候補文字列を注目候補文字列として処理を繰り返す。
Returning to FIG. 5, when the similarity is determined for the candidate character string of interest in step S106, the character
図11は、図10とは異なる候補文字列(“ewder”)について類似度決定処理をした場合の算出結果を示す。この場合、認識番号1、2、4が認識結果のヒット位置である。認識結果のヒット位置を基点に部分スコアを算出すると、認識番号1については10点、認識番号2については2点、認識番号4については5点となる。共通文字が認識候補に含まれない認識番号1はヒット部位が無い。認識番号3については、共通文字が認識候補に含まれてはいるが、共通文字が現れる位置が比較範囲に含まれないので、やはりヒット位置は無い。ヒット位置が無い位置については比較部640は部分スコアを算出しない。その結果、類似度は17点となり、認識候補“ewder”は認識候補“sweet” (類似度225点)よりも認識結果に類似する程度が低いことがわかる。
FIG. 11 shows a calculation result when similarity determination processing is performed for a candidate character string (“ewder”) different from that in FIG. In this case,
一方、全候補文字列が処理済である場合(ステップS107;YES)は、選択部660が出力文字列を選択する(ステップS108)。具体的には、候補文字列のうち、最も類似度が高いものを、出力文字列として選択する。ただし、同じ類似度が決定された複数の候補文字列が有る場合は、認識結果の文字長に最も近い候補文字列を選択する。類似度が同じ場合には、文字長が最も近い候補文字列が、認識結果と最も相関性が高いと判断できるからである。
On the other hand, if all candidate character strings have been processed (step S107; YES), the
次に文字列処理部60はステップS103で分割した全単語について上記処理済みであるか否か判別する(ステップS109)。未処理の単語が有る場合(ステップS109;NO)は、ステップS104に戻って次の単語を注目認識文字列として処理を繰り返す。一方、全単語が処理済である場合(ステップS109;YES)は、出力部670が出力文字列を出力する(ステップS110)。具体的には、出力部670が出力文字列を単語順に並べて、補正済みの認識結果として表示部40に出力する
Next, the character
以上説明したとおり、本実施形態の文字認識装置1は認識対象となった文字列(認識文字列)の認識結果と、単語辞書の単語とを、複数の起点から比較した結果に基づいてそれぞれ実行する。そのため、認識結果と候補文字列をより包括的に比較した結果に基づいて認識結果を精度良く補正できる。
As described above, the
また、本実施形態の文字認識装置1は前記複数の位置のそれぞれを起点として、認識結果のより信頼度が高い認識候補が、候補文字列のより類似した位置に現れる程度を示す部分スコアを求め、各スコアを合算して類似度を求める。この部分スコアは、信頼度が高い認識候補が、起点から比較した認識結果と候補文字列が一致する程度を示す。そのため、各部分スコアを合算することで、各起点から比較した一致する程度をそれぞれ反映した精度の高い類似度を求めることが出来る。また、各起点からの比較結果を示す部分スコアを総合して類似度を求めるため、例え認識結果の位置が実際とはずれていたり、一部の文字が認識不能であった場合でも認識精度の低下を押さえることが出来る。そのため、精度良く類似度を決定することが出来る。
Further, the
また、本実施形態の文字認識装置1は複数の起点となる位置から連続して、認識候補の何れかが、候補文字列の対応する位置に現れる文字の何れかと一致する範囲で、認識結果と候補文字列とを比較した部分スコアに基づいて類似度を決定する。言い換えれば、認識結果と候補文字列が類似する部分のそれぞれついて比較スコアを求め、それぞれの比較スコアを合算して全体の類似度を決定する。そのため、認識結果と認識文字列の類似度が高い場合でも低い場合でも、全体の類似度を精度良く求めることが出来る。また、起点から比較して、類似しない文字に到達すると比較処理を中断するため、処理量を低減することができる。
In addition, the
さらに、一つの認識結果に複数のヒット位置があった場合に、各ヒット位置を基点として詳細スコアを求め、最も大きい詳細スコアを部分スコアとして採用する。そのため、認識結果と単語とが一致する程度を正確に表す比較結果に基づいて、認識結果を補正することが出来る。 Furthermore, when there are a plurality of hit positions in one recognition result, a detailed score is obtained from each hit position as a base point, and the largest detailed score is adopted as a partial score. Therefore, the recognition result can be corrected based on the comparison result that accurately represents the degree to which the recognition result matches the word.
また、特定部が特定した認識結果と候補文字列とで同じ文字が、互いに類似した位置で現れる複数の位置(ヒット位置)を起点として比較する。即ち、認識結果と候補文字列とが一致する複数の部位について、認識結果と候補文字列とを比較した結果に基づいて認識結果を補正することが出来る。このため、認識結果と候補文字列の一部が大きく類似し、一部で類似度が小さい場合などでも、それぞれの類似部分を総合的に評価して、認識結果を補正することが出来る。 In addition, a comparison is made using a plurality of positions (hit positions) where the same character appears in positions similar to each other in the recognition result specified by the specifying unit and the candidate character string. That is, the recognition result can be corrected based on the result of comparing the recognition result with the candidate character string for a plurality of portions where the recognition result matches the candidate character string. For this reason, even if the recognition result and a part of the candidate character string are largely similar and the degree of similarity is small in part, the similar result can be comprehensively evaluated to correct the recognition result.
(変形例)
本発明の実施形態1について説明したが、本発明の実施形態はこれに限られず、さまざまな変形が可能である。例えば、上記実施形態では、OCR210が出力する認識結果には複数の認識候補に対して信頼度の順番が設定されていた。しかし、これに限らず信頼度の数値や、信頼度のレベル(信頼度低、信頼度中、信頼度高の3レベルなど)が定義された認識結果を出力するOCR210を用いても良い。
この場合、ステップS301やステップS305で加算するスコアを、信頼度の順位(候補番号)に応じて決定する代わりに、正規化した信頼度の数値やレベルに応じて決定すれば良い。例えば、スコア表では信頼度に関わらず位置のズレ(認識番号と比較番号の差)に応じたスコアを設定し、ステップS301やステップS305において加算する際に、信頼度の大きさに応じた重み係数を用いてスコアを調整すればよい。
(Modification)
Although
In this case, the score to be added in step S301 or step S305 may be determined according to the normalized numerical value or level of reliability, instead of being determined according to the rank (candidate number) of reliability. For example, in the score table, a score corresponding to a positional shift (difference between a recognition number and a comparison number) is set regardless of the reliability, and a weight corresponding to the magnitude of the reliability when adding in step S301 or step S305. The score may be adjusted using the coefficient.
また上記実施形態1では、OCR210が、一文字に対して最大値2つの認識候補を出力する場合について説明した。しかしこれに変えて、より多くの認識候補(例えば各10文字づつ)を出力するOCRや、所定の信頼度以上の認識候補を無制限に出力するOCRを用いても良い。
In the first embodiment, the case has been described in which the
これに関連して、多くの認識候補を出力するOCRを用いる場合は、結果取得部が認識候補の数を制限してもよい。通常、認識結果の補正に当たっては、各文字の認識結果に正しい文字が含まれるように、多くの認識候補を出力させる。しかし、本実施形態では、複数の起点から比較して結果に基づいて類似度を決定するため、認識候補の数を制限しても、補正精度の低下の割合は小さいため、認識候補の数を制限することが可能となる。これにより、処理対象となる認識候補の数を制限することにより、類似度の算出処理に必要な計算量を抑えることが出来る。また、多くの認識候補に基づいて補正する場合、信頼度の低い認識結果によってノイズが発生するが、認識候補の数を制限することでノイズが低減する場合もある。 In relation to this, when using OCR that outputs many recognition candidates, the result acquisition unit may limit the number of recognition candidates. Usually, when correcting the recognition result, many recognition candidates are output so that the recognition result of each character includes a correct character. However, in this embodiment, since the similarity is determined based on the result by comparing from a plurality of starting points, even if the number of recognition candidates is limited, the rate of decrease in correction accuracy is small, so the number of recognition candidates is It becomes possible to restrict. As a result, by limiting the number of recognition candidates to be processed, the amount of calculation required for the similarity calculation process can be suppressed. Further, when correction is performed based on many recognition candidates, noise is generated due to a recognition result with low reliability, but noise may be reduced by limiting the number of recognition candidates.
認識候補の数を制限する手段としては、結果取得部が得られた認識結果に所定数以上の認識候補が含まれている場合に、信頼度が低いものを削除すればよい。あるいは、OCR210の設定を変更して、信頼度が高い認識候補のみを出力するように制御しても良い。また、認識候補の数を制限する代わりに、信頼度の下限を設定してもよい。
As a means for limiting the number of recognition candidates, if the recognition result obtained by the result acquisition unit includes a predetermined number or more of recognition candidates, the one with low reliability may be deleted. Alternatively, the setting of the
また、上記実施形態では候補文字列は一般的な単語辞書として説明したが、これに限らず、熟語辞書や、テンプレートとなる文書を登録したテンプレート辞書であってもよい。また、文字認識装置を用いて認識する認識文字列が、料理メニューや人名など、現れる単語が既知の特定のジャンルに限定されるものである場合には、一般的な単語辞書に代わって特定のジャンルに対応する専門の単語辞書を用いても良い。このような構成によれば、一般的な辞書を用いる場合よりも、認識結果の補正の精度を高めることが出来る。 In the above embodiment, the candidate character string has been described as a general word dictionary. However, the candidate character string is not limited to this, and may be a idiom dictionary or a template dictionary in which a template document is registered. In addition, when the recognized character string to be recognized using the character recognition device is such that the appearing word is limited to a known specific genre such as a cooking menu or a person name, a specific word dictionary is used instead of a specific word dictionary. A specialized word dictionary corresponding to the genre may be used. According to such a configuration, the accuracy of correction of the recognition result can be improved as compared with the case of using a general dictionary.
また、上記実施形態ではOCRの認識結果を補正する場合について説明したが、本発明は手書き認識の結果など、少なくとも一部の文字に対して複数の認識候補が定義された任意の文字認識の結果を補正する場合にも応用できる。 Moreover, although the said embodiment demonstrated the case where the recognition result of OCR was correct | amended, this invention is the result of the arbitrary character recognition in which several recognition candidates were defined with respect to at least one part character, such as the result of handwriting recognition. It can also be applied when correcting
また上記実施例では、決定部は類似度を、部分スコアを合算して求めた。しかしこれに限定されず、部分スコアを重み付け加算するなど、部分スコアが大きくなるにつれて類似度が大きくなるような代替の方法を用いて部分スコアに応じた類似度を決定しても良い。例えば、誤認識が発生しやすい文字に対応する認識候補については、比較結果への影響を低減するため、重みを小さくすることが考えられる。また、文字列の類似度の算出段階で、認識結果と候補文字列の長さの違いに応じて類似度を加減しても良い。例えば、文字列の長さが同じ場合には類似度を1.2倍にし、2文字以上異なる場合は0.9倍する。この加減率は、文字長の認識誤差が発生する程度に応じて自由に設定可能である。このような構成によれば、文字長の違いを反映した精度の高い類似度を決定できる。 Moreover, in the said Example, the determination part calculated | required similarity by adding a partial score. However, the present invention is not limited to this, and the degree of similarity according to the partial score may be determined using an alternative method in which the degree of similarity increases as the partial score increases, such as weighted addition of partial scores. For example, for a recognition candidate corresponding to a character that is likely to be erroneously recognized, it is conceivable to reduce the weight in order to reduce the influence on the comparison result. Further, in the step of calculating the similarity between character strings, the similarity may be adjusted according to the difference between the recognition result and the length of the candidate character string. For example, when the lengths of character strings are the same, the similarity is increased by 1.2, and when two or more characters are different, the similarity is increased by 0.9. This adjustment rate can be freely set according to the degree of occurrence of character length recognition errors. According to such a configuration, it is possible to determine a high-accuracy similarity that reflects the difference in character length.
また、選択部は候補文字列のうち、類似度が最も高い候補文字列を出力文字列として選択した。しかし、これに限らず、選択部は類似度が高い順に所定数(例えば3つ)の候補文字列を出力する、類似度が所定の閾値以上の候補文字列を全て出力する、等ユーザの設定操作により指定された任意の選択条件を用いて出力文字列を選択してよい。 Moreover, the selection part selected the candidate character string with the highest similarity among candidate character strings as an output character string. However, the present invention is not limited to this, and the selection unit outputs a predetermined number (for example, three) of candidate character strings in descending order of similarity, and outputs all candidate character strings having a similarity equal to or higher than a predetermined threshold. The output character string may be selected using an arbitrary selection condition designated by the operation.
また、CPU21、RAM22,ROM23、等から構成される文字認識装置が実行する認識結果の補正処理(認識結果出力処理)を行う中心となる部分は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。たとえば、前記の動作を実行するためのコンピュータプログラムを、コンピュータが読み取り可能な記録媒体(フレキシブルディスク、CD−ROM、DVD−ROM(Digital Versatile Disk Read Only Memory)等)に格納して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、前記の処理を実行する情報端末を構成してもよい。また、インターネット等の通信ネットワーク上のサーバ装置が有する記憶装置に当該コンピュータプログラムを格納しておき、通常のコンピュータシステムがダウンロード等することで情報処理装置を構成してもよい。
In addition, a central part for performing recognition result correction processing (recognition result output processing) executed by a character recognition device including the
また、文字認識装置の機能を、OS(Operating System)とアプリケーションプログラムの分担、またはOSとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。 In addition, when the functions of the character recognition device are realized by sharing an OS (Operating System) and an application program, or by cooperation between the OS and the application program, only the application program portion is stored in a recording medium or a storage device. May be.
また、搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して配信することも可能である。たとえば、通信ネットワーク上の掲示板(BBS:Bulletin Board System)に前記コンピュータプログラムを掲示し、ネットワークを介して前記コンピュータプログラムを配信してもよい。そして、このコンピュータプログラムを起動し、OSの制御下で、他のアプリケーションプログラムと同様に実行することにより、前記の処理を実行できるように構成してもよい。 It is also possible to superimpose a computer program on a carrier wave and distribute it via a communication network. For example, the computer program may be posted on a bulletin board (BBS: Bulletin Board System) on a communication network, and the computer program may be distributed via the network. The computer program may be started and executed in the same manner as other application programs under the control of the OS, so that the above-described processing may be executed.
また、上記メニュー表示装置が実行する処理の一部を、文字認識装置とは独立したコンピュータを用いて実現しても良い。 A part of the processing executed by the menu display device may be realized by using a computer independent of the character recognition device.
以上、本発明の好ましい実施形態について説明したが、本発明は係る特定の実施形態に限定されるものではなく、本発明には、特許請求の範囲に記載された発明とその均等の範囲が含まれる。以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。 As mentioned above, although preferable embodiment of this invention was described, this invention is not limited to the specific embodiment which concerns, This invention includes the invention described in the claim, and its equivalent range It is. Hereinafter, the invention described in the scope of claims of the present application will be appended.
(付記1)
文字認識装置からの単語の認識結果として、文字毎に順位付けされた複数の認識候補文字を有する認識文字列を取得する結果取得手段と、
前記認識文字列に対応する複数の候補単語を取得する候補取得手段と、
前記認識文字列の各文字に対応する複数の認識候補文字が前記候補単語の文字列上に現れる位置と当該認識候補文字の順位に基づいて、前記認識文字列と前記候補単語の類似度を決定する決定手段と、
前記複数の候補単語について前記決定手段が決定した類似度に基づいて候補単語の1つを選択し出力する出力手段と、
を備えることを特徴とする情報処理装置。
(Appendix 1)
A result acquisition means for acquiring a recognition character string having a plurality of recognition candidate characters ranked for each character as a word recognition result from the character recognition device;
Candidate acquisition means for acquiring a plurality of candidate words corresponding to the recognized character string;
The similarity between the recognized character string and the candidate word is determined based on a position where a plurality of recognition candidate characters corresponding to each character of the recognized character string appear on the character string of the candidate word and the rank of the recognized candidate character. A decision means to
Output means for selecting and outputting one of the candidate words based on the similarity determined by the determining means for the plurality of candidate words;
An information processing apparatus comprising:
(付記2)
前記決定手段は、前記認識候補文字が前記候補単語の文字列上に現れる位置を起点として、前後方向に位置する文字について比較することにより、前記認識候補文字のより順位が高い認識候補文字が、前記候補単語のより類似した位置に現れる程度を示すスコアを求め、求めたスコアに基づいて前記類似度を決定する、
ことを特徴とする付記1に記載の情報処理装置。
(Appendix 2)
The determination unit compares a character positioned in the front-rear direction with a position where the recognition candidate character appears on the character string of the candidate word as a starting point, so that the recognition candidate character having a higher rank than the recognition candidate character, Obtaining a score indicating the degree of appearing at a more similar position of the candidate word, and determining the similarity based on the obtained score;
The information processing apparatus according to
(付記3)
前記決定手段は、前記起点となる位置から連続して、前記認識候補文字の何れかが、前記候補単語の文字列の対応する位置に現れる文字と一致する範囲で、前記認識候補文字と前記候補単語を比較する、
ことを特徴とする付記2に記載の情報処理装置。
(Appendix 3)
The determining means includes the recognition candidate character and the candidate within a range in which any of the recognition candidate characters matches a character appearing at a corresponding position in the character string of the candidate word continuously from the starting position. Compare words,
The information processing apparatus according to
(付記4)
複数の単語を記憶している単語記憶手段をさらに含み、
前記候補取得手段は、前記認識文字列の文字数に応じて、前記単語記憶手段が記憶している単語の中から複数の候補単語を取得する、
ことを特徴とする付記1乃至3の何れかに記載の情報処理装置。
(Appendix 4)
A word storage means for storing a plurality of words;
The candidate acquisition unit acquires a plurality of candidate words from the words stored in the word storage unit according to the number of characters of the recognized character string.
The information processing apparatus according to any one of
(付記5)
文字認識装置からの単語の認識結果として、文字毎に順位付けされた複数の認識候補文字を有する認識文字列を取得し、
前記認識文字列に対応する複数の候補単語を取得し、
前記認識文字列の各文字に対応する複数の認識候補文字が前記候補単語の文字列上に現れる位置と当該認識候補文字の順位に基づいて、前記認識文字列と前記候補単語の類似度を決定し、
前記複数の候補単語について前記決定した類似度に基づいて候補単語の1つを選択し出力する、
ことを特徴とする情報処理方法。
(Appendix 5)
As a recognition result of the word from the character recognition device, obtain a recognition character string having a plurality of recognition candidate characters ranked for each character,
Obtaining a plurality of candidate words corresponding to the recognized character string;
The similarity between the recognized character string and the candidate word is determined based on a position where a plurality of recognition candidate characters corresponding to each character of the recognized character string appear on the character string of the candidate word and the rank of the recognized candidate character. And
Selecting and outputting one of the candidate words based on the determined similarity for the plurality of candidate words;
An information processing method characterized by the above.
(付記6)
コンピュータを、
文字認識装置からの単語の認識結果として、文字毎に順位付けされた複数の認識候補文字を有する認識文字列を取得する結果取得手段と、
前記認識文字列に対応する複数の候補単語を取得する候補取得手段と、
前記認識文字列の各文字に対応する複数の認識候補文字が前記候補単語の文字列上に現れる位置と当該認識候補文字の順位に基づいて、前記認識文字列と前記候補単語の類似度を決定する決定手段と、
前記複数の候補単語について前記決定手段が決定した類似度に基づいて候補単語の1つを選択し出力する出力手段、
として機能させるためのプログラム。
(Appendix 6)
Computer
A result acquisition means for acquiring a recognition character string having a plurality of recognition candidate characters ranked for each character as a word recognition result from the character recognition device;
Candidate acquisition means for acquiring a plurality of candidate words corresponding to the recognized character string;
The similarity between the recognized character string and the candidate word is determined based on a position where a plurality of recognition candidate characters corresponding to each character of the recognized character string appear on the character string of the candidate word and the rank of the recognized candidate character. A decision means to
Output means for selecting and outputting one of the candidate words based on the similarity determined by the determining means for the plurality of candidate words;
Program to function as.
1…文字認識装置、10…画像入力部、20…情報処理部、21…CPU、22…RAM、23…ROM、24…I/O部、25…外部記憶装置、26…内部バス、210…OCR、220…文字辞書記憶部、240…単語辞書記憶部、30…操作部、40…表示部、60…文字列処理部、610…結果取得部、620…特定部、630…候補取得部、640…比較部、650…決定部、660…選択部、670…出力部、TI…入力画像、R…認識結果
DESCRIPTION OF
Claims (6)
前記認識文字列に対応する複数の候補単語を取得する候補取得手段と、
前記認識文字列の各文字に対応する複数の認識候補文字が前記候補単語の文字列上に現れる位置と当該認識候補文字の順位に基づいて、前記認識文字列と前記候補単語の類似度を決定する決定手段と、
前記複数の候補単語について前記決定手段が決定した類似度に基づいて候補単語の1つを選択し出力する出力手段と、
を備えることを特徴とする情報処理装置。 A result acquisition means for acquiring a recognition character string having a plurality of recognition candidate characters ranked for each character as a word recognition result from the character recognition device;
Candidate acquisition means for acquiring a plurality of candidate words corresponding to the recognized character string;
The similarity between the recognized character string and the candidate word is determined based on a position where a plurality of recognition candidate characters corresponding to each character of the recognized character string appear on the character string of the candidate word and the rank of the recognized candidate character. A decision means to
Output means for selecting and outputting one of the candidate words based on the similarity determined by the determining means for the plurality of candidate words;
An information processing apparatus comprising:
ことを特徴とする請求項1に記載の情報処理装置。 The determination unit compares a character positioned in the front-rear direction with a position where the recognition candidate character appears on the character string of the candidate word as a starting point, so that the recognition candidate character having a higher rank than the recognition candidate character, Obtaining a score indicating the degree of appearing at a more similar position of the candidate word, and determining the similarity based on the obtained score;
The information processing apparatus according to claim 1.
ことを特徴とする請求項2に記載の情報処理装置。 The determining means includes the recognition candidate character and the candidate within a range in which any of the recognition candidate characters matches a character appearing at a corresponding position in the character string of the candidate word continuously from the starting position. Compare words,
The information processing apparatus according to claim 2.
前記候補取得手段は、前記認識文字列の文字数に応じて、前記単語記憶手段が記憶している単語の中から複数の候補単語を取得する、
ことを特徴とする請求項1乃至3の何れかに記載の情報処理装置。 A word storage means for storing a plurality of words;
The candidate acquisition unit acquires a plurality of candidate words from the words stored in the word storage unit according to the number of characters of the recognized character string.
The information processing apparatus according to claim 1, wherein the information processing apparatus is an information processing apparatus.
前記認識文字列に対応する複数の候補単語を取得し、
前記認識文字列の各文字に対応する複数の認識候補文字が前記候補単語の文字列上に現れる位置と当該認識候補文字の順位に基づいて、前記認識文字列と前記候補単語の類似度を決定し、
前記複数の候補単語について前記決定した類似度に基づいて候補単語の1つを選択し出力する、
ことを特徴とする情報処理方法。 As a recognition result of the word from the character recognition device, obtain a recognition character string having a plurality of recognition candidate characters ranked for each character,
Obtaining a plurality of candidate words corresponding to the recognized character string;
The similarity between the recognized character string and the candidate word is determined based on a position where a plurality of recognition candidate characters corresponding to each character of the recognized character string appear on the character string of the candidate word and the rank of the recognized candidate character. And
Selecting and outputting one of the candidate words based on the determined similarity for the plurality of candidate words;
An information processing method characterized by the above.
文字認識装置からの単語の認識結果として、文字毎に順位付けされた複数の認識候補文字を有する認識文字列を取得する結果取得手段と、
前記認識文字列に対応する複数の候補単語を取得する候補取得手段と、
前記認識文字列の各文字に対応する複数の認識候補文字が前記候補単語の文字列上に現れる位置と当該認識候補文字の順位に基づいて、前記認識文字列と前記候補単語の類似度を決定する決定手段と、
前記複数の候補単語について前記決定手段が決定した類似度に基づいて候補単語の1つを選択し出力する出力手段、
として機能させるためのプログラム。 Computer
A result acquisition means for acquiring a recognition character string having a plurality of recognition candidate characters ranked for each character as a word recognition result from the character recognition device;
Candidate acquisition means for acquiring a plurality of candidate words corresponding to the recognized character string;
The similarity between the recognized character string and the candidate word is determined based on a position where a plurality of recognition candidate characters corresponding to each character of the recognized character string appear on the character string of the candidate word and the rank of the recognized candidate character. A decision means to
Output means for selecting and outputting one of the candidate words based on the similarity determined by the determining means for the plurality of candidate words;
Program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013014550A JP2014146183A (en) | 2013-01-29 | 2013-01-29 | Information processing device, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013014550A JP2014146183A (en) | 2013-01-29 | 2013-01-29 | Information processing device, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014146183A true JP2014146183A (en) | 2014-08-14 |
Family
ID=51426397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013014550A Pending JP2014146183A (en) | 2013-01-29 | 2013-01-29 | Information processing device, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014146183A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017068562A (en) * | 2015-09-30 | 2017-04-06 | 富士ゼロックス株式会社 | Information processing device and program |
CN112733524A (en) * | 2020-12-31 | 2021-04-30 | 浙江省方大标准信息有限公司 | Method, system and device for automatically correcting standard serial numbers and batch checking standard states |
-
2013
- 2013-01-29 JP JP2013014550A patent/JP2014146183A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017068562A (en) * | 2015-09-30 | 2017-04-06 | 富士ゼロックス株式会社 | Information processing device and program |
CN112733524A (en) * | 2020-12-31 | 2021-04-30 | 浙江省方大标准信息有限公司 | Method, system and device for automatically correcting standard serial numbers and batch checking standard states |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5146190B2 (en) | Character recognition device, character recognition program, and character recognition method | |
US11816923B2 (en) | Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium | |
CN108596079B (en) | Gesture recognition method and device and electronic equipment | |
CN112036362A (en) | Image processing method, image processing device, computer equipment and readable storage medium | |
US20150169971A1 (en) | Character recognition using search results | |
JP2018185730A (en) | Verification device, verification method, and verification program | |
US10997281B2 (en) | Information processing device, biometric authentication method, and recording medium recording biometric authentication program | |
US8208685B2 (en) | Word recognition method and word recognition program | |
JP2014146183A (en) | Information processing device, information processing method, and program | |
US20220392107A1 (en) | Image processing apparatus, image processing method, image capturing apparatus, and non-transitory computer-readable storage medium | |
JP6365010B2 (en) | Learning program and information processing apparatus | |
JP6812804B2 (en) | Character recognition device, character recognition program and character recognition method | |
US10268869B2 (en) | Method and electrical device for merging fingerprint images | |
JP2010237909A (en) | Knowledge correction program, knowledge correcting device and knowledge correction method | |
JP2021068203A (en) | Information processing device and program | |
US7899251B2 (en) | Balancing out-of-dictionary and in-dictionary recognition scores | |
JP7421384B2 (en) | Information processing device, correction candidate display method, and program | |
JP6293455B2 (en) | Handwritten character input device and computer program | |
KR20130116280A (en) | Information retrieval device and information retrieval method | |
JP2019204146A (en) | Data conversion apparatus, image processing apparatus and program | |
JP7268311B2 (en) | Information processing device and program | |
JP7438744B2 (en) | Information processing device, information processing method, and program | |
CN109085932B (en) | Candidate entry adjustment method, device, equipment and readable storage medium | |
CN110674863B (en) | Hamming code identification method and device and electronic equipment | |
JP5319726B2 (en) | PATTERN SELECTION DEVICE, PATTERN SELECTION METHOD, AND PROGRAM |