JP5344338B2 - Program, information storage medium, and character string recognition device - Google Patents

Program, information storage medium, and character string recognition device Download PDF

Info

Publication number
JP5344338B2
JP5344338B2 JP2008199388A JP2008199388A JP5344338B2 JP 5344338 B2 JP5344338 B2 JP 5344338B2 JP 2008199388 A JP2008199388 A JP 2008199388A JP 2008199388 A JP2008199388 A JP 2008199388A JP 5344338 B2 JP5344338 B2 JP 5344338B2
Authority
JP
Japan
Prior art keywords
character
character string
point
unit
cut
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008199388A
Other languages
Japanese (ja)
Other versions
JP2010039609A (en
Inventor
碧蘭 朱
正樹 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NATIONAL UNIVERSITY CORPORATION TOKYO UNIVERSITY OF AGRICULUTURE & TECHNOLOGY
Original Assignee
NATIONAL UNIVERSITY CORPORATION TOKYO UNIVERSITY OF AGRICULUTURE & TECHNOLOGY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NATIONAL UNIVERSITY CORPORATION TOKYO UNIVERSITY OF AGRICULUTURE & TECHNOLOGY filed Critical NATIONAL UNIVERSITY CORPORATION TOKYO UNIVERSITY OF AGRICULUTURE & TECHNOLOGY
Priority to JP2008199388A priority Critical patent/JP5344338B2/en
Publication of JP2010039609A publication Critical patent/JP2010039609A/en
Application granted granted Critical
Publication of JP5344338B2 publication Critical patent/JP5344338B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a program, an information storage medium and a character string recognition device, for improving a recognition rate by weakening tendency to interpret a character string into the small number of characters, or tendency to interpret the character string into the large number of characters. <P>SOLUTION: An off-stroke to be set as a temporary segmentation point is determined from among off-strokes between strokes, and character recognition is carried out for each temporary segmentation unit segmented by the temporary segmentation point, and a candidate character string is generated. The temporary segmentation unit includes at least one minimum temporary segmentation unit to be segmented by the adjacent temporary segmentation point. As for the connection of the minimum temporary segmentation unit included in the temporary segmentation unit corresponding to each candidate character of the candidate character string and the adjacent minimum segmentation unit, the certainty of a plurality of items is evaluated, and as for the certainty of the plurality of items, the value of weight to be given to each item is set. <P>COPYRIGHT: (C)2010,JPO&amp;INPIT

Description

本発明は、プログラム、情報記憶媒体及び文字列認識装置に関する。   The present invention relates to a program, an information storage medium, and a character string recognition device.

従来から、与えられた文字列パタンを1文字ごとに分割して切出し候補とし、切出し候補に対応する文字パタンを文字認識して候補文字を出力し、候補文字列を評価して最適な文字列を認識結果として出力するオンライン文字列認識装置が知られている(例えば特許文献1参照)。
特開平11−328316号公報
Conventionally, a given character string pattern is divided into characters to be extracted candidates, character patterns corresponding to the extracted candidates are recognized, candidate characters are output, the candidate character strings are evaluated, and the optimal character string Is known as an on-line character string recognition device (see, for example, Patent Document 1).
JP-A-11-328316

しかしながら従来の文字列認識装置では、文字列を少ない文字数に解釈する傾向や、文字列を多い文字数に解釈する傾向があった。   However, the conventional character string recognition apparatus has a tendency to interpret a character string into a small number of characters or to interpret a character string into a large number of characters.

本発明は、以上のような課題に鑑みてなされたものであり、その目的とするところは、
文字列を少ない文字数に解釈する傾向や、文字列を多い文字数に解釈する傾向を弱めて、認識率を向上させることが可能なプログラム、情報記憶媒体及び文字列認識装置を提供することにある。
The present invention has been made in view of the problems as described above, and the object is as follows.
An object of the present invention is to provide a program, an information storage medium, and a character string recognition device capable of improving the recognition rate by weakening the tendency to interpret a character string into a small number of characters and the tendency to interpret a character string into a large number of characters.

(1)本発明は、手書き入力された文字パタンのストロークから文字列を認識するためのプログラムであって、
ストローク間のオフストロークのうち、仮切出しポイントとして設定するオフストロークを決定する仮切出しポイント決定部と、
前記仮切出しポイントによって切り出された仮切出しユニット毎に文字認識を行い、候補文字列を生成する候補文字列生成部と、
前記候補文字列について複数項目の確からしさを評価し、評価結果に基づき文字列を認識する認識部としてコンピュータを機能させ、
前記仮切出しユニットは、隣接する前記仮切出しポイントにより切り出される最小仮切出しユニットを少なくとも1つ含み、
前記認識部は、
前記候補文字列の各候補文字に対応する前記仮切出しユニットに含まれる前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、前記複数項目の確からしさを評価し、前記複数項目の確からしさについて各項目に与える重みの値を設定することを特徴とする。
(1) The present invention is a program for recognizing a character string from a stroke of a character pattern input by handwriting,
Of the off-strokes between strokes, a provisional cut-out point determination unit that determines an off-stroke to be set as a temporary cut-out point;
Character recognition for each provisional cutout unit cut out by the provisional cutout point, a candidate character string generation unit that generates a candidate character string,
Evaluating the probability of multiple items for the candidate character string, causing the computer to function as a recognition unit that recognizes the character string based on the evaluation result,
The temporary cutting unit includes at least one minimum temporary cutting unit cut out by the adjacent temporary cutting point,
The recognition unit
For the connection between the minimum provisional cutout unit included in the provisional cutout unit corresponding to each candidate character of the candidate character string and the adjacent minimum cutout unit, the probability of the plurality of items is evaluated, and the plurality of items A feature is to set a weight value to be given to each item for the probability.

また本発明は、上記各部を含む文字列認識装置に関係する。また本発明はコンピュータ読み取り可能な情報記憶媒体であって、上記各部としてコンピュータを機能させるプログラムを記憶した情報記憶媒体に関係する。   The present invention also relates to a character string recognition device including the above-described parts. The present invention is also a computer-readable information storage medium, and relates to an information storage medium storing a program that causes a computer to function as each of the above-described units.

本発明によれば、各最小仮切出しユニットと隣接する最小仮切出しユニット間の連結について複数項目の確からしさを評価し、前記複数項目の各項目に適切な重みの値を設定することで、候補文字列の尤度評価を最小仮切出しユニットに基づき行うことができ、文字列候補の文字数に影響されず文字を認識することができる。すなわち、文字列を少ない文字数に解釈する傾向や、文字列を多い文字数に解釈する傾向を弱めて認識率を向上させることができる。   According to the present invention, by evaluating the likelihood of a plurality of items for the connection between each minimum provisional cutout unit and the adjacent minimum provisional cutout unit, and setting an appropriate weight value for each item of the plurality of items, The likelihood evaluation of the character string can be performed based on the minimum provisional cutout unit, and the character can be recognized without being influenced by the number of characters of the character string candidate. That is, the recognition rate can be improved by weakening the tendency of interpreting a character string to a small number of characters and the tendency to interpret a character string to a large number of characters.

(2)また本発明に係るプログラム及び情報記憶媒体では、
前記認識部は、
前記候補文字列の前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、言語文脈の確からしさ、文字パタンサイズの確からしさ、文字パタン内分割の確からしさ、文字認識の確からしさ、単一文字パタン位置の確からしさ、ペア文字パタン位置の確からしさ及び前記仮切出しポイントの確からしさを含む複数項目の確からしさを評価するようにしてもよい。
(2) In the program and information storage medium according to the present invention,
The recognition unit
Regarding the connection between the minimum provisional cutout unit of the candidate character string and the adjacent minimum cutout unit, the accuracy of language context, the probability of character pattern size, the probability of division within character patterns, the probability of character recognition, You may make it evaluate the probability of several items including the probability of a single character pattern position, the probability of a pair character pattern position, and the probability of the said provisional cutout point.

本発明によれば、各候補文字列について上記7項目の確からしさを評価することで、認識率を向上させることができる。   According to the present invention, the recognition rate can be improved by evaluating the likelihood of the above seven items for each candidate character string.

(3)また本発明に係るプログラム及び情報記憶媒体では、
前記認識部は、
前記仮切出しポイントを、隣接する文字パタン間の仮切出しポイントとして判断する場合には、前記仮切出しポイントが切出しポイントとして識別される確からしさを評価し、前記仮切出しポイントを、文字パタン内部の仮切出しポイントとして判断する場合には、前記仮切出しポイントが非切出しポイントとして識別される確からしさを評価するようにしてもよい。
(3) In the program and information storage medium according to the present invention,
The recognition unit
When determining the temporary cutting point as a temporary cutting point between adjacent character patterns, the probability of identifying the temporary cutting point as a cutting point is evaluated, and the temporary cutting point is determined as a temporary cutting point inside the character pattern. When determining as a cut-out point, the probability that the temporary cut-out point is identified as a non-cut-out point may be evaluated.

本発明によれば、仮切出しポイントが文字パタン間にあるか、或いは文字パタン内部にあるかによって、それぞれ切出しポイントとして識別される確からしさ、或いは非切出しポイントとして識別される確からしさを評価することによって、文字列を少ない文字数に解釈する傾向や、文字列を多い文字数に解釈する傾向を弱めて認識率を向上させることができる。   According to the present invention, the probability of being identified as a cut-out point or the probability of being identified as a non-cut-out point is evaluated depending on whether the provisional cut-out point is between character patterns or inside a character pattern. Accordingly, the recognition rate can be improved by weakening the tendency of interpreting a character string into a small number of characters and the tendency of interpreting a character string into a large number of characters.

(4)また本発明に係るプログラム及び情報記憶媒体では、
前記仮切出しポイント決定部は、
前記オフストロークから抽出した多次元の特徴値をサポートベクターマシン(SVM)に適用することで、前記仮切出しポイントのSVM出力値を求め、
前記認識部は、
前記SVM出力値に基づき前記仮切出しポイントの確からしさを評価するようにしてもよい。
(4) In the program and information storage medium according to the present invention,
The temporary cut point determination unit
By applying a multi-dimensional feature value extracted from the off-stroke to a support vector machine (SVM), an SVM output value of the temporary cut point is obtained.
The recognition unit
You may make it evaluate the certainty of the said temporary extraction point based on the said SVM output value.

本発明によれば、仮切出しポイントを多角的に評価することができる。   According to the present invention, the provisional cut-out point can be evaluated from various perspectives.

(5)また本発明に係るプログラム及び情報記憶媒体では、
前記認識部は、
遺伝的アルゴリズムにより学習した複数の重みの値を前記複数項目の確からしさに与えるようにしてもよい。
(5) In the program and information storage medium according to the present invention,
The recognition unit
A plurality of weight values learned by a genetic algorithm may be given to the probability of the plurality of items.

以下、本実施形態について説明する。なお、以下に説明する本実施形態は、特許請求の範囲に記載された本発明の内容を不当に限定するものではない。また本実施形態で説明される構成の全てが、本発明の必須構成要件であるとは限らない。   Hereinafter, this embodiment will be described. In addition, this embodiment demonstrated below does not unduly limit the content of this invention described in the claim. In addition, all the configurations described in the present embodiment are not necessarily essential configuration requirements of the present invention.

1.構成
図1に本実施形態の文字列認識装置の機能ブロック図の一例を示す。なお本実施形態の文字列認識装置は図1の構成要素(各部)の一部を省略した構成としてもよい。
1. Configuration FIG. 1 shows an example of a functional block diagram of the character string recognition apparatus of this embodiment. Note that the character string recognition apparatus of this embodiment may have a configuration in which some of the components (each unit) in FIG. 1 are omitted.

文字入力部160は、ユーザがペンで手書き文字を入力するためのものであり、その機能は、タブレット(筆記面)などにより実現できる。文字入力部160は、ペンが筆記面に触れてから離れるまでのペン先の位置を表す座標データを一定時間間隔で検出し、検出された座標データを筆点情報取得部110に出力する。   The character input unit 160 is for the user to input handwritten characters with a pen, and the function can be realized by a tablet (writing surface) or the like. The character input unit 160 detects coordinate data representing the position of the pen tip from when the pen touches the writing surface until it leaves, and outputs the detected coordinate data to the writing point information acquisition unit 110.

記憶部170は、処理部100や通信部196などのワーク領域となるもので、その機能はRAMなどにより実現できる。   The storage unit 170 serves as a work area for the processing unit 100, the communication unit 196, and the like, and its function can be realized by a RAM or the like.

情報記憶媒体180(コンピュータにより読み取り可能な媒体)は、プログラムやデータなどを格納するものであり、その機能は、光ディスク(CD、DVD)、光磁気ディスク(MO)、磁気ディスク、ハードディスク、磁気テープ、或いはメモリ(ROM)などにより実現できる。処理部100は、情報記憶媒体180に格納されるプログラム(データ)に基づいて本実施形態の種々の処理を行う。即ち情報記憶媒体180には、本実施形態の各部としてコンピュータを機能させるためのプログラム(各部の処理をコンピュータに実行させるためのプログラム)が記憶される。   The information storage medium 180 (computer-readable medium) stores programs, data, and the like, and functions as an optical disk (CD, DVD), magneto-optical disk (MO), magnetic disk, hard disk, and magnetic tape. Alternatively, it can be realized by a memory (ROM). The processing unit 100 performs various processes of the present embodiment based on a program (data) stored in the information storage medium 180. That is, the information storage medium 180 stores a program for causing a computer to function as each unit of the present embodiment (a program for causing a computer to execute processing of each unit).

表示部190は、本実施形態により生成された画像を出力するものであり、その機能は、CRT、LCD、タッチパネル型ディスプレイ、或いはHMD(ヘッドマウントディスプレイ)などにより実現できる。   The display unit 190 outputs an image generated according to the present embodiment, and its function can be realized by a CRT, LCD, touch panel display, HMD (head mounted display), or the like.

処理部100(プロセッサ)は、文字入力部160からの座標データやプログラムなどに基づいて、認識処理、表示処理などの処理を行う。この処理部100は記憶部170内の主記憶部172をワーク領域として各種処理を行う。処理部100の機能は各種プロセッサ(CPU、DSP等)、ASIC(ゲートアレイ等)などのハードウェアや、プログラムにより実現できる。   The processing unit 100 (processor) performs processing such as recognition processing and display processing based on coordinate data from the character input unit 160, a program, and the like. The processing unit 100 performs various processes using the main storage unit 172 in the storage unit 170 as a work area. The functions of the processing unit 100 can be realized by hardware such as various processors (CPU, DSP, etc.), ASIC (gate array, etc.), and programs.

処理部100は、筆点情報取得部110、仮切出しポイント決定部112、候補文字列生成部114、認識部116、表示処理部120を含む。なおこれらの一部を省略する構成としてもよい。   The processing unit 100 includes a writing point information acquisition unit 110, a provisional cutout point determination unit 112, a candidate character string generation unit 114, a recognition unit 116, and a display processing unit 120. Note that some of these may be omitted.

筆点情報取得部110は、ペンが筆記面に触れてから離れるまでの座標データ列(筆点座標系列)をストロークのデータとして文字入力部160から取得する。また筆点情報取得部110は、他の情報処理装置からネットワーク及び通信部196を介してストロークのデータを取得するようにしてもよい。   The writing point information acquisition unit 110 acquires, from the character input unit 160, a coordinate data string (writing point coordinate series) from when the pen touches the writing surface until it leaves. The writing point information acquisition unit 110 may acquire stroke data from another information processing apparatus via a network and communication unit 196.

仮切出しポイント決定部112は、ストローク間のオフストローク(ペンが筆記面から離れてから再び触れるまでのベクトル)のうち、仮切出しポイントとして設定するオフストロークを決定する。具体的には、オフストロークから距離や交わりを表す特徴値を抽出し、抽出した特徴値に基づき仮切出しポイントとして設定するオフストロークを決定する。   The temporary cut point determination unit 112 determines an off stroke to be set as a temporary cut point among the off strokes between the strokes (vectors from when the pen leaves the writing surface until it touches again). Specifically, feature values representing distances and intersections are extracted from the off-stroke, and an off-stroke to be set as a temporary cut-out point is determined based on the extracted feature values.

また仮切出しポイント決定部112は、前記オフストロークから抽出した多次元の特徴値をサポートベクターマシン(SVM)に適用することで、前記仮切出しポイントのSVM出力値を求めるようにしてもよい。   The temporary cut point determination unit 112 may obtain the SVM output value of the temporary cut point by applying a multidimensional feature value extracted from the off-stroke to a support vector machine (SVM).

候補文字列生成部114は、前記仮切出しポイントによって切り出された仮切出しユニット(隣接する前記仮切出しポイントにより切り出される最小仮切出しユニットを少なくとも1つ含む仮切出しユニット)毎に文字認識を行い、候補文字列を生成する。   The candidate character string generation unit 114 performs character recognition for each temporary cutting unit cut out by the temporary cutting point (a temporary cutting unit including at least one minimum temporary cutting unit cut out by the adjacent temporary cutting point) Generate a string.

認識部116は、前記候補文字列について複数項目の確からしさを評価し、評価結果に基づき文字列を認識する。また認識部116は、前記候補文字列の各候補文字に対応する前記仮切出しユニットに含まれる前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、前記複数項目の確からしさを評価し、前記複数項目の確からしさについて各項目に適切な重みの値を設定する。   The recognition unit 116 evaluates the probability of a plurality of items for the candidate character string, and recognizes the character string based on the evaluation result. The recognizing unit 116 evaluates the probability of the plurality of items regarding the minimum provisional cutout unit included in the provisional cutout unit corresponding to each candidate character of the candidate character string and the connection between the adjacent minimum cutout units. Then, an appropriate weight value is set for each item for the probability of the plurality of items.

また認識部116は、前記候補文字列の各前記最小仮切出しユニットと隣接する前記最小切出しユニット間の連結について、言語文脈の確からしさ、文字パタンサイズの確からしさ、文字パタン内分割の確からしさ、文字認識の確からしさ、単一文字パタン位置の確からしさ、ペア文字パタン位置の確からしさ及び前記仮切出しポイントの確からしさを含む複数項目の確からしさを評価するようにしてもよい。   The recognizing unit 116, for the connection between each of the minimum provisional cutout units of the candidate character string and the adjacent minimum cutout unit, the accuracy of language context, the probability of character pattern size, the probability of division within character patterns, You may make it evaluate the probability of several items including the probability of character recognition, the probability of a single character pattern position, the probability of a pair character pattern position, and the probability of the said provisional cutout point.

また認識部116は、前記仮切出しポイントを、隣接する文字パタン間の仮切出しポイントとして判断する場合には、前記仮切出しポイントが切出しポイントとして識別される確からしさを評価し、前記仮切出しポイントを、文字パタン内部の仮切出しポイントとして判断する場合には、前記仮切出しポイントが非切出しポイントとして識別される確からしさを評価するようにしてもよい。   Further, when the recognition unit 116 determines the temporary cut point as a temporary cut point between adjacent character patterns, the recognition unit 116 evaluates the probability that the temporary cut point is identified as the cut point, and determines the temporary cut point as the temporary cut point. When determining as a temporary cut point inside a character pattern, the probability of identifying the temporary cut point as a non-cut point may be evaluated.

また認識部116は、前記SVM出力値に基づき前記仮切出しポイントの確からしさを評価するようにしてもよい。   Further, the recognition unit 116 may evaluate the probability of the temporary cut point based on the SVM output value.

また認識部116は、遺伝的アルゴリズムにより学習した複数の重みの値を前記複数項目の確からしさに与えるようにしてもよい。   The recognition unit 116 may give a plurality of weight values learned by a genetic algorithm to the probability of the plurality of items.

表示処理部120は、認識部116により認識された文字列(認識結果)を表示部190に出力する。なお処理部100は、認識部116による認識結果をネットワーク及び通信部196を介して他の情報処理装置に送信するようにしてもよい。   The display processing unit 120 outputs the character string (recognition result) recognized by the recognition unit 116 to the display unit 190. Note that the processing unit 100 may transmit the recognition result by the recognition unit 116 to another information processing apparatus via the network and communication unit 196.

通信部196は、他の情報処理装置との間で通信を行うための各種制御を行うものであり、その機能は、各種プロセッサ又は通信用ASICなどのハードウェアや、プログラムなどにより実現できる。   The communication unit 196 performs various controls for communicating with other information processing apparatuses, and functions thereof can be realized by hardware such as various processors or communication ASICs, programs, and the like.

なお本実施形態の各部としてコンピュータを機能させるためのプログラム(データ)は、サーバが有する情報記憶媒体からネットワーク及び通信部196を介して記憶部170、情報記憶媒体180に配信してもよい。このようなサーバの情報記憶媒体の使用も本発明の範囲内に含めることができる。   Note that a program (data) for causing a computer to function as each unit of the present embodiment may be distributed from the information storage medium of the server to the storage unit 170 and the information storage medium 180 via the network and the communication unit 196. Use of such server information storage media can also be included within the scope of the present invention.

2.本実施形態の手法
次に本実施形態の手法について図面を用いて説明する。
2. Next, the method of this embodiment will be described with reference to the drawings.

2−1.仮切出しポイントの決定
本実施形態では、入力された各ストロークを、隣接するストローク間の距離や重なりなどの特徴によって、切出しポイント、非切出しポイントと不確定ポイントに分類する。切出しポイントは、2つの文字パタン間にあると判断されたポイントであり、非切出しポイントは、1つの文字パタンの内部にあると判断されたポイントである。また不確定ポイントは、切出しポイントであるか非切出しポイントであるかを決定できないポイントである。本実施形態では、切出しポイントと不確定ポイントとを仮切出しポイントとする。
2-1. Determination of Temporary Cutting Point In this embodiment, each input stroke is classified into a cutting point, a non-cutting point, and an indeterminate point according to features such as the distance between adjacent strokes and overlap. The cut-out point is a point determined to be between two character patterns, and the non-cut-off point is a point determined to be inside one character pattern. An indeterminate point is a point that cannot be determined whether it is a cut point or a non-cut point. In the present embodiment, the cut-out point and the indeterminate point are set as temporary cut-out points.

本実施形態では、入力されたオフストロークから水平方向距離と交差長さの2つの特徴値を抽出する。オフストロークの水平方向距離特徴fは、次式により求めることができる。 In the present embodiment, two feature values of the horizontal distance and the intersection length are extracted from the input off-stroke. The off-stroke horizontal distance feature f d can be obtained by the following equation.

=DBx/acs (1)
ここでacsは平均文字サイズを示し、各ストロークの外接矩形における長い方の辺長をもとめ、全てのストロークについてその辺長をソートし、それらの辺長の中において長い方から3分の1のものに対して平均を取ることによって求めることができる。
f d = D Bx / acs (1)
Here, acs indicates the average character size, finds the longer side length in the circumscribed rectangle of each stroke, sorts the side lengths for all strokes, and is one-third from the longer side among those side lengths. It can be determined by taking an average over things.

またDBxは、図2に示すように、注目するオフストロークの前の全ての外接矩形Bbp_allと、注目するオフストロークの後の全ての外接矩形Bbs_allとのX方向距離を示し、DBxは、次式により求めることができる。 The D Bx, as shown in FIG. 2, shows all of the circumscribed rectangles Bb P_ALL previous off stroke of interest, the X direction between the all enclosing rectangles Bb S_all after off stroke of interest, D Bx Can be obtained by the following equation.

Bx=Bbs_allの左位置X座標−Bbp_allの右位置X座標 (2)
また、オフストロークの交差長さ特徴fは、以下のように求める。
D Bx = Bb s_all the left position X coordinate -BB P_ALL the right position X-coordinate (2)
The off-stroke crossing length feature f i is obtained as follows.

すわなち、図3に示すように、注目するオフストロークを基準として、前の全てのストローク列をSp_allとし、後ろの全てのストローク列をSs_allとし、Sp_allに属する1つのストロークをSとし、Ss_allに属する1つのストロークをSとし、SとSとが交差する点をpとし、pからSの右側の端点までのS上の長さとpからSの左側の端点までのS上の長さの短い方をlとし、Sの長さとSの長さの長い方をlとして、SとSの交差長さlを、次式により求める。 That is, as shown in FIG. 3, with reference to the off-stroke of interest, all previous stroke sequences are set to Sp_all , all subsequent stroke sequences are set to Ss_all, and one stroke belonging to Sp_all is set to S_all. and p, one stroke belonging to S S_all and S s, the point where the S p and S s intersects the p, p from the length and p on S p to the right end point of the S p of S s The shorter length on S s to the left end point is defined as ln , the longer length of S p and the longer length of S s is defined as l d , and the intersection length l i of S p and S s is expressed as follows: Obtained by the following equation.

=−l/l (3)
なお、SとSが交差していない場合にはl=0とする。
l i = −l n / l d (3)
Note that l i = 0 when Sp and S s do not intersect.

次に、交差長さの和Lsumを、SとSの組み合わせペアの数をnとして、次式により求める。 Then, the sum L sum of cross length, the number of combinations pairs S p and S s is n, calculated by the following equation.

そしてオフストロークの交差長さ特徴fを、Lsum<0の場合には、f=Lsumとし、f(水平方向距離特徴)>0の場合には、f=fとし、それ以外の場合には、f=0として求める。 The cross length feature f i off stroke, L sum <0, the a f i = L sum, f d ( horizontal distance characteristic)> 0, the a f i = f d, In other cases, it is determined as f i = 0.

図4は、水平方向距離特徴と交差長さ特徴の学習パタンの分布を示す図である。図4において、横軸は水平方向距離特徴fを示し、縦軸は交差長さ特徴fを示す。また、実線と黒点は、学習パタンにおける切出しポイント(文字パタン間のオフストローク)の特徴値の分布を示し、グレーの領域は、学習パタンにおける非切出しポイント(文字パタン内部のオフストローク)の特徴値の分布を示す。 FIG. 4 is a diagram showing a distribution of learning patterns of horizontal distance features and intersection length features. In FIG. 4, the horizontal axis represents the horizontal distance feature f d , and the vertical axis represents the intersection length feature f i . The solid lines and black dots show the distribution of feature values of the cut points (off strokes between character patterns) in the learning pattern, and the gray area shows the feature values of the non-cut points (off strokes inside the character pattern) in the learning patterns. The distribution of.

本実施形態では、入力されたオフストロークから抽出した水平方向距離特徴と交差長さ特徴が0以上であり、或いはOABCDE(学習パタンにおいて切出しポイントが密集する2つの長方形を重ねた形)のエリアに位置する場合に、当該オフストロークを不確定ポイントに分類し、それ以外のオフストロークを非切出しポイントに分類する。   In the present embodiment, the horizontal distance feature and the intersection length feature extracted from the input off-stroke are 0 or more, or in the area of OABCDE (a shape in which two rectangles where cut points are densely gathered in the learning pattern are overlapped). If it is located, the off-stroke is classified as an indeterminate point, and the other off-stroke is classified as an uncut point.

その後、全ての隣接する2つの不確定ポイントについて、2つの不確定ポイント間のストローク列の外接矩形の幅を求め、当該外接矩形の幅/acs(平均文字サイズ)が所定の閾値より大きい場合には、当該2つの不確定ポイント間に存在する非切出しポイントの特徴値がOFGH(学習パタンにおいて切出しポイントが存在し得る長方形)のエリアに位置する場合に、当該非切出しポイントを不確定ポイントに修正する。   After that, for all two adjacent uncertain points, the width of the circumscribed rectangle of the stroke sequence between the two uncertain points is obtained, and the width / acs (average character size) of the circumscribed rectangle is larger than a predetermined threshold. If the feature value of a non-cut point that exists between the two uncertain points is located in the area of OFGH (a rectangle where a cut point can exist in the learning pattern), the non-cut point is corrected to an indeterminate point. To do.

次に、各不確定ポイント(仮切出しポイント)から、交差長さ特徴値fに加えて、18個の特徴値と、広さ特徴値を含む20個の特徴値を抽出する。18個の特徴値f〜f18は、それぞれ次式(5)〜(22)により求めることができる。 Next, in addition to the intersection length feature value f i , 18 feature values and 20 feature values including the width feature value are extracted from each indeterminate point (provisional cut point). The 18 feature values f 1 to f 18 can be obtained by the following equations (5) to (22), respectively.

=オフストロークの経過時間 (5)
=DBx/acs (6)
=Bbp_allとBbs_allの重なり面積/(acs) (7)
=Dbx/Bbp1の幅 (8)
=Dbx/Bbs1の幅 (9)
=Dbx/acs (10)
=Dby/Bbp1の高さ (11)
=Dby/Bbs1の高さ (12)
=Dby/acs (13)
10=O/(Bbs1の幅×高さ) (14)
11=O/(acs) (15)
12=Dbsy/acs (16)
13=Dbs/acs (17)
14=Df/acs (18)
15=オフストロークの長さ/acs (19)
16=オフストロークの正弦値 (20)
17=オフストロークの余弦値 (21)
18=f/文字列中の最大f (22)
ここで、Bbp1は、1つ前のストロークの外接矩形を示し、Bbs1は、1つ後のストロークの外接矩形を示す。またDByは、Bbp_allとBbs_allのY方向距離(DBy=Bbs_allの上位置Y座標−Bbp_allの下位置Y座標)を示す。またDbxは、Bbp1とBbs1のX方向距離(Dbx=Bbs1の左位置X座標−Bbp1の右位置X座標)を示す。またDbyは、Bbp1とBbs1のY方向距離(Dby=Bbs1の上位置Y座標−Bbp1の下位置Y座標)を示す。またOは、Bbp1とBbs1の重なり面積を示す。またDbsyは、Bbp1とBbs1の中心のY方向距離(Dbsy=Bbs1の中心のY座標−Bbp1の中心のY座標)を示す。またDbsは、Bbp1とBbs1の中心の距離を示す。またDfは、Bbp_allとBbs1の上位置Y座標のずれ(Df=abs(Bbp_allの上位置Y座標−Bbs1の上位置Y座標))を示す。
f 1 = elapsed time of off-stroke (5)
f 2 = D Bx / acs (6)
f 3 = B bp_all and B bs_all overlap area / (acs) 2 (7)
f 4 = width of D bx / Bb p1 (8)
f 5 = width of D bx / Bb s1 (9)
f 6 = D bx / acs (10)
f 7 = D by / Bb p1 height (11)
The height of the f 8 = D by / Bb s1 (12)
f 9 = D by / acs (13)
f 10 = O b / (width of Bb s1 × height) (14)
f 11 = O b / (acs) 2 (15)
f 12 = D bsy / acs (16)
f 13 = D bs / acs (17)
f 14 = Df b / acs (18)
f 15 = length of off-stroke / acs (19)
f 16 = off stroke sine value (20)
f 17 = cosine value of off-stroke (21)
f 18 = f 2 / maximum f 2 in the character string (22)
Here, Bb p1 represents the circumscribed rectangle of the previous stroke, and Bb s1 represents the circumscribed rectangle of the next stroke. The D By A shows the Y-direction distance of Bb P_ALL and Bb s_all (D By = Bb position Y coordinate -BB P_ALL the lower position Y-coordinate on the s_all). D bx represents the distance in the X direction between Bb p1 and Bb s1 (D bx = the left position X coordinate of Bb s1− the right position X coordinate of Bb p1 ). D by indicates a distance in the Y direction between Bb p1 and Bb s1 (D by = the upper position Y coordinate of Bb s1− the lower position Y coordinate of Bb p1 ). In addition, O b indicates the overlapping area of Bb p1 and Bb s1 . D bsy represents a Y-direction distance between the centers of Bb p1 and Bb s1 (D bsy = the Y coordinate of the center of Bb s1− the Y coordinate of the center of Bb p1 ). D bs indicates the distance between the centers of Bb p1 and Bb s1 . Further, Df b indicates a shift between the upper position Y coordinates of Bb p_all and Bb s1 (Df b = abs (the upper position Y coordinate of Bb p_all− the upper position Y coordinate of Bb s1 )).

また、広さ特徴値fは、次式により求めることができる。 Further, the breadth feature value f w can be calculated by the following equation.

=w/acs (23)
ここで、wは、1つ前の仮切出しポイントから1つ後の仮切出しポイントまでのストローク列の外接矩形の幅である。
f w = w / acs (23)
Here, w is the width of the circumscribed rectangle of the stroke sequence from the previous temporary cut point to the next temporary cut point.

本実施形態では、学習パタンに対して、切出しポイントに教師信号1、非切出しポイントに教師信号−1を与えて、オフストロークから抽出した20個の特徴値(18個の特徴値f〜f18、交差長さ特徴値f、広さ特徴値f)をSVMに適用し、SVMモデルを学習しておく。 In the present embodiment, 20 feature values (18 feature values f 1 to f) extracted from an off-stroke by applying a teacher signal 1 to a cut-out point and a teacher signal -1 to a non-cut-out point with respect to a learning pattern. 18 , the intersection length feature value f i and the area feature value f w ) are applied to the SVM to learn the SVM model.

そして、不確定ポイント(仮切出しポイント)から抽出した上記20個の特徴値を、学習したSVMに適用することで、不確定ポイントのSVM出力値を求める。SVM出力値が所定の閾値より大きく、且つ広さ特徴値fが所定の閾値より大きい不確定ポイントを切出しポイントとして確定する。 Then, the SVM output value of the indeterminate point is obtained by applying the 20 feature values extracted from the indeterminate point (provisional cut point) to the learned SVM. SVM output value is greater than a predetermined threshold value, and wide feature value f w is determined as a point cut indeterminate point greater than a predetermined threshold value.

2−2.候補ラティスの構築
図5に、本実施形態の候補ラティスの一例を示す。
2-2. Construction of Candidate Lattice FIG. 5 shows an example of a candidate lattice of the present embodiment.

本実施形態では、図5に示すように、仮切出しポイント(不確定ポイントUP及び切出しポイントDP)によりストローク列を切り出し、切り出されたストローク列(仮切出しユニット)毎に文字認識を行って候補文字(認識候補)を並べ、それらをリンクして複数の候補文字列からなる候補ラティスを構築する。   In the present embodiment, as shown in FIG. 5, a stroke sequence is cut out by temporary cut points (indeterminate point UP and cut point DP), and character recognition is performed for each cut stroke sequence (temporary cut unit) to obtain candidate characters. (Recognition candidates) are arranged and linked to construct a candidate lattice composed of a plurality of candidate character strings.

ここで不確定ポイントUPは、切出しポイントと非切出しポイントの2通りに仮定され、切出しポイントとして仮定される場合には、切出しユニットの抽出に利用される。例えば図5において、不確定ポイントUPを切出しユニットとして仮定した場合に、「明」という手書き文字パタンから2つの仮切出しユニットを抽出し、それぞれ「日、目、月」、「月、口、目、旦」という候補文字を生成する。また不確定ポイントUPを非切出しユニットとして仮定した場合には、「明」という手書き文字パタンから1つの仮切出しユニットを抽出して「朋、胴、明」という候補文字を生成する。なお、1つの仮切出しユニットの内部に仮切出しポイントを含まないもの、すなわち隣接する仮切出しポイントによって切り出されたユニットを最小仮切出しユニットとする。   Here, the indeterminate point UP is assumed to be a cut-out point and a non-cut-out point, and when it is assumed as a cut-out point, it is used for extraction of a cut-out unit. For example, in FIG. 5, assuming that the indeterminate point UP is a cut-out unit, two temporary cut-out units are extracted from the handwritten character pattern “Akira”, and “day, eye, month”, “month, mouth, eye” are extracted. , "Canon" is generated. If the indeterminate point UP is assumed to be a non-cutout unit, one temporary cutout unit is extracted from the handwritten character pattern “Ming”, and a candidate character “と い う, torso, light” is generated. Note that a unit that does not include a temporary cutting point in one temporary cutting unit, that is, a unit cut out by an adjacent temporary cutting point is defined as a minimum temporary cutting unit.

候補ラティスにおいて、各ノードNDは文字認識によって1つの仮切出しユニットに関して生成される1つの候補文字を示し、各連結線ALは1つの仮切出しポイントを文字の境として文字列の連接を示す。後述する複数項目の確からしさからなる尤度を評価するスコアは、各連結線ALとノードNDに与えられる。本実施形態では、閾値より低い確からしさを持つノードNDを削除する。このようにすると、文字列候補パスの数を削減して認識処理を高速化することができる。   In the candidate lattice, each node ND indicates one candidate character generated for one provisional cutout unit by character recognition, and each connection line AL indicates connection of character strings with one provisional cutout point as a character boundary. A score for evaluating the likelihood composed of the probability of a plurality of items to be described later is given to each connection line AL and node ND. In the present embodiment, the node ND having a probability lower than the threshold is deleted. In this way, the number of character string candidate paths can be reduced to speed up the recognition process.

2−3.文字列認識
本実施形態では、仮切出しポイントから構築した候補ラティスの各文字列候補パス(候補文字列)について複数項目の確からしさを評価する。
2-3. Character String Recognition In this embodiment, the probability of a plurality of items is evaluated for each character string candidate path (candidate character string) of a candidate lattice constructed from temporary cut points.

図6(A)に示すように、1つの文字列パタンXに対して、ある切出しS=S..S..S(nは仮切出しユニットの数)を選択して、ある候補文字列C=C..C..Cに認識するとする。ここで仮切出しユニットSはCに対応している。図6(B)に示すように、仮切出しユニットSは、最小仮切出しユニットの列Si1i2..Sij..Sikiからなる。Sijは、1つの最小仮切出しユニットである。 As shown in FIG. 6A, with respect to one character string pattern X, a certain cutout S = S 1 S 2 . . S i . . S n (where n is the number of provisional cut-out units) is selected, and a candidate character string C = C 1 C 2 . . C i. . Let C n be recognized. Here, the provisional cutting unit S i corresponds to C i . As shown in FIG. 6B, the temporary cut-out unit S i includes a row of minimum temporary cut-out units S i1 S i2 . . S ij . . It consists of Siki . S ij is one minimum provisional cutout unit.

文字列パタンXが候補文字列Cに認識される条件付き確立P(C|X)は、次式により求めることができる。   The conditional establishment P (C | X) in which the character string pattern X is recognized by the candidate character string C can be obtained by the following equation.

ここで、最小仮切出しユニットSijは、外接矩形bij、内分割qijと位置情報p ijを持ち、隣接する最小仮切出しユニットにおいて、位置関係情報p ijと仮切出しポイントgijをもつ。Cijは、Sijの認識候補の1つであり、文字Cの全部か一部である。b,q,S,p,p,gは仮切出しの特徴値の列である。 Here, the minimum provisional cut unit S ij is circumscribed rectangle b ij, having position information p u ij and the inner dividing q ij, at the minimum provisional cut units adjacent, the positional relationship information p b ij and a temporary cut point g ij Have. C ij is one of the recognition candidates of S ij and is all or part of the character C i . b, q, S, p u , p b , and g are sequences of feature values of provisional cutout.

式(24)において、分母P(b,q,S,p,p,g)は、文字列候補パスによらない。そこで特徴値間の独立を仮定して、文字列候補パスの尤度f(X,C)を、次式のように近似する。 In the equation (24), the denominator P (b, q, S, p u , p b , g) does not depend on the character string candidate path. Therefore, assuming the independence between feature values, the likelihood f (X, C) of the character string candidate path is approximated by the following equation.

ここで、C−1 ijとC−2 ijは、直前の2つの認識候補を示し、kは仮切出しユニットSに含まれる最小仮切出しユニットの数を示し、Lijは、切出しポイントか非切出しポイントであるかを示すラベルである。 Here, C −1 ij and C −2 ij indicate the previous two recognition candidates, k i indicates the number of minimum provisional cutout units included in the provisional cutout unit S i , and L ij is a cutout point. It is a label which shows whether it is an uncut point.

ijが文字の一部である場合、式(25)の第7項目(仮切出しポイントに関わる項目)以外については、求めるのが困難である。これを解決するために、Cijをそれを含む文字Cに置き換えて、式(25)の第1項目について、次式のように近似する。 When C ij is a part of a character, it is difficult to obtain other than the seventh item (item related to the provisional cut-out point) in Expression (25). In order to solve this, C ij is replaced with a character C i including it, and the first item of Expression (25) is approximated as the following expression.

ここで、λ11とλ12は重みパラメータを示し、λはバイアスを示す。 Here, λ 11 and λ 12 indicate weight parameters, and λ 1 indicates a bias.

式(25)の第7項目については、ラベルLijを、切出しspと非切出しn−spの2種類に分類してその推定誤差を調節するための重みを付け、それ以外の第2〜第6項目については、式(26)と同じ方法で近似すると、文字列候補パスの尤度f(X,C)は、次式により求めることができる。 As for the seventh item of the expression (25), the label L ij is classified into two types of cut-out sp and non-cut-out n-sp, and weights for adjusting the estimation error are given, and the other second through second labels When the six items are approximated by the same method as in equation (26), the likelihood f (X, C) of the character string candidate path can be obtained by the following equation.

ここで、b、q、p は、それぞれ仮切出しユニットSの外接矩形、内分割、位置情報に関する特徴ベクトルであり、p は、隣接する仮切出しユニット間の位置関係に関する特徴ベクトルを示し、gi1、gij(j=2〜k)は、仮切出しポイントの特徴ベクトルを示す。これらの詳細については後述する。またλ11〜λ71、λ12〜λ72とλは、重みパラメータを示し、後述する遺伝的アルゴリズムを用いて学習されたものである。 Here, b i , q i , and p u i are feature vectors related to the circumscribed rectangle, inner division, and position information of the temporary cutting unit S i , respectively, and p b i is related to the positional relationship between adjacent temporary cutting units. A feature vector is indicated, and g i1 and g ij (j = 2 to k i ) indicate feature vectors of provisional cut points. Details of these will be described later. Further, λ 11 to λ 71 , λ 12 to λ 72, and λ indicate weight parameters, which are learned using a genetic algorithm described later.

式(27)において、第1項目は言語文脈の確からしさ、第2項目は文字パタンサイズの確かしさ、第3項目は文字パタン内分割の確からしさ、第4項目は、文字認識の確からしさ、第5項目は単一文字パタン位置の確からしさ、第6項目はペア文字パタン位置の確からしさ、第7、第8項目(以下、第7項目という)は仮切出しポイントの確からしさを評価するための項目である。   In Equation (27), the first item is the probability of language context, the second item is the accuracy of character pattern size, the third item is the probability of character pattern division, and the fourth item is the probability of character recognition. The fifth item is used to evaluate the accuracy of the single character pattern position, the sixth item is used to evaluate the probability of the paired character pattern position, and the seventh and eighth items (hereinafter referred to as the seventh item) are used to evaluate the accuracy of the provisional cutout point. It is an item.

本実施形態では、式(27)に示すように、文字列候補パスの尤度は最小切出しユニットに基づいて尤度を積み上げたものであり、文字列候補の文字数に影響されない。従って、文字列を少ない文字数に解釈する傾向や、文字列を多い文字数に解釈する傾向を弱めて認識率を向上させることができる。   In this embodiment, as shown in Expression (27), the likelihood of the character string candidate path is obtained by accumulating the likelihood based on the minimum cutout unit, and is not affected by the number of characters of the character string candidate. Accordingly, the recognition rate can be improved by weakening the tendency of interpreting a character string into a small number of characters and the tendency of interpreting a character string into a large number of characters.

本実施形態では、式(27)によって求めた文字列候補パスの尤度を候補ラティスの各ノードと各連結線に与え、当該候補ラティスに対してビタビ(Viterbi)探索を行うことによって、最適な候補文字列(最適な切出しと文字認識結果)を決定する。   In the present embodiment, the likelihood of the character string candidate path obtained by the equation (27) is given to each node and each connection line of the candidate lattice, and a Viterbi search is performed on the candidate lattice, so that the optimum Candidate character strings (optimum clipping and character recognition results) are determined.

以下、式(27)の各項目の詳細について説明する。   Hereinafter, details of each item of Expression (27) will be described.

第1項目のP(C|Ci−1,Ci−2)は、Ci−1,Ci−2からCへの移転的確率(tri−gram確率)である。なお、1番目の文字Cについては、uni−gram確率P(C)、2番目の文字Cについては、bi−gram確率P(C|C)により求める。tri−gram確率を学習するには膨大なテキストが必要なため、P(C|Ci−1,Ci−2)の代わりに、次式に示すP’(C|Ci−1,Ci−2)を用いる。 The first item P (C i | C i-1 , C i-2 ) is a transfer probability (tri-gram probability) from C i -1 , C i-2 to C i . The first character C 1 is determined by the uni-gram probability P (C 1 ), and the second character C 2 is determined by the bi-gram probability P (C 2 | C 1 ). For tri-gram probabilities required enormous text to learning a, P (C i | C i -1, C i-2) instead of, in the following equation P '(C i | C i -1 , C i-2 ).

ここで、β、β、β、βは、tri−gram確率の学習用テキストと異なるテキストによって認識率が最大になるように求める。 Here, β 1 , β 2 , β 3 , and β 4 are determined so that the recognition rate is maximized by a text different from the text for learning with the tri-gram probability.

第2項目のP(b|C)は、文字パタンサイズの条件付き確率である。bは、平均文字サイズacsで正規化した文字パタン(仮切出しユニット)の外接矩形の幅と高さからなる幾何学的な特徴ベクトルである。 The second item P (b i | C i ) is a conditional probability of the character pattern size. b i is a geometric feature vector composed of the width and height of the circumscribed rectangle of the character pattern (temporary cutout unit) normalized with the average character size acs.

第3項目のP(q|C)は、文字パタン内分割の条件付き確率である。qは、図7に示すqik(k=1〜6)からなる幾何的特徴ベクトルである。qik(k=1〜3)は各垂直の分割での文字パタンの垂直方向の射影におけるギャップdの長さを平均文字サイズacsで正規化した値であり、qik(k=4〜6)は各水平の分割での文字パタンの水平方向の射影におけるギャップdの長さを平均文字サイズacsで正規化した値である。各分割において2つ以上のギャップがある場合、これらのギャップの和が使用される。 The third item P (q i | C i ) is a conditional probability of character pattern division. q i is a geometric feature vector composed of q ik (k = 1 to 6) shown in FIG. q ik (k = 1~3) are normalized values of the length in average character size acs gaps d v in the vertical projection of the character patterns in the division of each vertical, q ik (k = 4~ 6) is the normalized value of the length in average character size acs gaps d v in the horizontal direction of the projection of the character patterns in the division of each horizontal. If there are more than one gap in each partition, the sum of these gaps is used.

第4項目のP(S|C)は、仮切出しユニットの条件付き確率である。Sは、文字パタンとしての仮切出しユニットの特徴ベクトルを示す。P(S|C)は、文字認識のスコアから近似することができる。 The fourth item P (S i | C i ) is the conditional probability of the provisional cut-out unit. S i indicates a feature vector of the temporary cut-out unit as a character pattern. P (S i | C i ) can be approximated from the score of character recognition.

第5項目のP(p |C)は、単一文字パタン位置の条件付き確率である。p は、図8(A)に示すように、単一文字パタン位置(unary位置)の2つの要素からなる幾何学的な特徴ベクトルである。2つの要素は、それぞれ文字パタンの上部から文字列の中心線CLまでの距離を平均文字サイズacsで正規化した値と、文字パタンの底部から文字列の中心線CLまでの距離を平均文字サイズacsで正規化した値である。 The fifth item P (p u i | C i ) is the conditional probability of the single character pattern position. As shown in FIG. 8A, p u i is a geometric feature vector composed of two elements of a single character pattern position (unary position). The two elements are the value obtained by normalizing the distance from the top of the character pattern to the center line CL of the character string by the average character size acs, and the distance from the bottom of the character pattern to the center line CL of the character string as the average character size. It is a value normalized by acs.

第6項目のP(p |C,Ci−1)は、ペア文字パタン位置の条件付き確率である。p は、図8(A)に示すように、2つの隣接する文字パタン(仮切出しユニット)間におけるペア文字パタン位置(binary位置)の2つの要素からなる幾何学的な特徴ベクトルである。2つの要素は、それぞれ隣接する文字パタンの上部同士の距離を平均文字サイズacsで正規化した値と、隣接する文字パタンの下部同士の距離を平均文字サイズacsで正規化した値である。 The sixth item, P (p b i | C i , C i−1 ), is a conditional probability of the pair character pattern position. As shown in FIG. 8A, p b i is a geometric feature vector composed of two elements of a pair character pattern position (binary position) between two adjacent character patterns (temporary cutout unit). . The two elements are a value obtained by normalizing the distance between the upper parts of the adjacent character patterns with the average character size acs and a value obtained by normalizing the distance between the lower parts of the adjacent character patterns with the average character size acs.

第7項目のP(gi1|sp)は、切出しポイントがgi1を生じる条件付き確率であり、P(gij|n−sp)(j=2〜k)は、非切出しポイントがgijを生じる条件付き確率である。図8(B)に示すように、gi1は、仮切出しユニットSの先頭に位置し、切出しポイントとして識別される仮切出しポイント(隣接する文字パタン間の仮切出しポイント)から抽出した20次元の幾何学的な特徴ベクトル(20個の特徴値)であり、gij(j=2〜k)は、仮切出しユニットSの内部に位置し、非切出しポイントして識別される仮切出しポイント(文字パタン内部の仮切出しポイント)から抽出した20次元の幾何学的な特徴ベクトルである。 The seventh item P (g i1 | sp) is a conditional probability that the cut-out point gives g i1 , and P (g ij | n-sp) (j = 2 to k i ) is the conditional probability that yields ij . As shown in FIG. 8B, g i1 is a 20-dimensional pattern extracted from a temporary cutting point (temporary cutting point between adjacent character patterns) that is located at the beginning of the temporary cutting unit S i and is identified as a cutting point. , And g ij (j = 2 to k i ) is located inside the temporary cutting unit S i and is identified as a non-cutting point. This is a 20-dimensional geometric feature vector extracted from a point (a temporary cutout point inside a character pattern).

このように本実施形態では、切出しポイントして識別される仮切出しポイントのみならず、非切出しポイントして識別される仮切出しポイントについても、非切出しポイントとして識別される確からしさを評価することで、文字列を少ない文字数に解釈する傾向や、文字列を多い文字数に解釈する傾向を弱めて認識率を向上させることができる。   Thus, in the present embodiment, not only the provisional cut point identified as the cut-out point but also the provisional cut-out point identified as the non-cut-out point is evaluated by evaluating the probability of being identified as the non-cut-out point. The recognition rate can be improved by weakening the tendency of interpreting a character string into a small number of characters and the tendency of interpreting a character string into a large number of characters.

なお本実施形態では、P(gi1|sp)を、P(oi1=SVM(gi1)|sp)により近似し、P(gij|n−sp)(j=2〜k)を、P(oij=SVM(gij)|n−sp)により近似する。ここでは、oijはgijに関するSVM出力値である。P(oi1|sp)は切出しポイントに対して、学習パタンで学習したSVMが出力値oi1を生じる条件付き確率である。P(oij|n−sp)(j=2〜k)は非切出しポイントに対して、学習パタンで学習したSVMが出力値oijを生じる条件付き確率である。なお、P(o11|sp)=1とする。 In this embodiment, P (g i1 | sp) is approximated by P (o i1 = SVM (g i1 ) | sp), and P (g ij | n-sp) (j = 2 to k i ) is , P (o ij = SVM (g ij ) | n-sp). Here, o ij is the SVM output value for g ij . P (o i1 | sp) is a conditional probability that the SVM learned by the learning pattern generates the output value o i1 with respect to the extraction point. P (o ij | n-sp) (j = 2 to k i ) is a conditional probability that the SVM learned by the learning pattern generates the output value o ij with respect to the uncut point. Note that P (o 11 | sp) = 1.

以下、説明を簡略化するためにoijの代わりに符号oを使用する。図9(A)に示すようにSVMの出力値oについて、学習パタンからP(o|sp)とP(o|n−sp)を学習することができる。ここで、SVMの出力値が1か−1に近づくと確率値が激しく降下する。そこで、P(o|sp)とP(o|n−sp)の代わりに、次式に示す累積の関数P’(o|sp)とP’(o|n−sp)を使用する。 Hereinafter, in order to simplify the description, the symbol o i is used instead of o ij . As shown in FIG. 9A, P (o i | sp) and P (o i | n-sp) can be learned from the learning pattern for the output value o i of the SVM. Here, when the output value of the SVM approaches 1 or -1, the probability value drops drastically. Therefore, instead of P (o i | sp) and P (o i | n-sp), cumulative functions P ′ (o i | sp) and P ′ (o i | n-sp) shown in the following equations are used. use.

図9(B)に、P’(o|sp)とP’(o|n−sp)の確率値を示す。さらに、次式に示すシグモンド関数によってこれらを近似することができる。 FIG. 9B shows the probability values of P ′ (o i | sp) and P ′ (o i | n-sp). Furthermore, these can be approximated by a sigmond function expressed by the following equation.

図9(b)に示すSVMの出力値に対して、−10から10まで0.02の間隔でSVMの出力値o(k=1〜Ns)を取り、確率P’(o|sp)とP’(o|n−sp)を得る。ここで、NsはSVM出力値を取る個数である。そして、最急降下法により次式に示すエラー関数の最小化の尺度に基づいてパラメータα10,α11,α20,α21を求める。 With respect to the SVM output value shown in FIG. 9B, SVM output values o k (k = 1 to Ns) are taken at intervals of 0.02 from −10 to 10, and the probability P ′ (o i | sp ) And P ′ (o i | n-sp). Here, Ns is the number of SVM output values. Then, parameters α 10 , α 11 , α 20 , and α 21 are obtained by the steepest descent method based on the error function minimization scale shown in the following equation.

2−4.重みパラメータの学習
本実施形態では、学習パタンを利用して遺伝的アルゴリズムにより、式(27)における複数の重みパラメータ(λ11〜λ71、λ12〜λ72、λ)を学習する。ここでは、複数の重みパラメータからなる重み系列を1つの染色体とみなす。1つの重みパラメータは染色体の1つの遺伝子である。以下、学習の処理手順について説明する。
2-4. Weight Parameter Learning In this embodiment, a plurality of weight parameters (λ 11 to λ 71 , λ 12 to λ 72 , λ) in Equation (27) are learned by a genetic algorithm using a learning pattern. Here, a weight series composed of a plurality of weight parameters is regarded as one chromosome. One weight parameter is one gene of the chromosome. Hereinafter, the learning process procedure will be described.

まず、N個の染色体をランダムで0〜1の値に初期化する。N個の染色体の古い平均評価値foldを0、繰返し数tを1に初期化する。 First, N chromosomes are initialized to a value of 0 to 1 at random. The old average evaluation value f old of N chromosomes is initialized to 0, and the repetition number t is initialized to 1.

次に、N個の染色体の中からランダムで選択した2つの染色体について、ランダムで決定した2位置の中の遺伝子を交叉させることで新しい2つの染色体を生成する。これをM個の新染色体が生成されるまで繰り返す。   Next, two new chromosomes are generated by crossing genes in two randomly determined positions for two chromosomes randomly selected from N chromosomes. This is repeated until M new chromosomes are generated.

次に、N+M個の染色体の各遺伝子に確率Pmutで突然変異を起こさせる。具体的には−1〜1のランダム値を加算し、[0,1]に丸める。 Next, each gene of N + M chromosomes is mutated with probability Pmut . Specifically, random values of −1 to 1 are added and rounded to [0, 1].

次に、各染色体を学習パタンに関する認識率により評価する。ここでは、各染色体の遺伝子は式(27)における重みに設定される。   Next, each chromosome is evaluated by the recognition rate regarding the learning pattern. Here, the gene of each chromosome is set to the weight in equation (27).

次に、各染色体の評価値によりそのルーレット確率を求める。ここでは、評価値が高い染色体ほどルーレット確率が大きくなるようにする。そして、評価値が最高の2つの染色体を選択し、N個の新染色体を得るまでルーレット確率により染色体を選択する。N個の新染色体でN個の古い染色体を置換する。   Next, the roulette probability is obtained from the evaluation value of each chromosome. Here, the higher the evaluation value, the higher the roulette probability. Then, the two chromosomes having the highest evaluation value are selected, and the chromosome is selected by the roulette probability until N new chromosomes are obtained. Replace N old chromosomes with N new chromosomes.

次に、N個の新染色体の平均評価値fnewを求める。もし(fnew−fold<閾値)がnstop回以上発生するかそれともt>Tであれば、評価値が最高の染色体を返す。それ以外の場合には、fnewをfoldに、tをt+1に置換し、前記交叉の処理に戻る。ここでは、Nを50に、Mを100に、Pmutを0.03に、nstopを25に、Tを10000にセットする。 Next, determine the average evaluation value f new of the N new chromosomes. If (f new −fold <threshold) occurs n stop times or more or t> T, the chromosome with the highest evaluation value is returned. Otherwise, f new is replaced with f old and t is replaced with t + 1, and the process returns to the crossover process. Here, N is set to 50, M is set to 100, P mut is set to 0.03, n stop is set to 25, and T is set to 10,000.

染色体を評価するために学習パタンに対して手書き文字認識(単文字認識)を適用し、候補ラティスを生成し、そこでViterbi探索を行う必要がある。仮切出しと単文字認識は1回だけで済むが、Viterbi探索は重み系列(染色体)ごとに行う必要があるが、多大な処理時間を要することになる。そこで、まず各重みを1にセットし、学習パタンの各文字列からViterbi探索を用いて上位100個の文字列候補パスを選択する。   In order to evaluate the chromosome, it is necessary to apply handwritten character recognition (single character recognition) to the learning pattern to generate a candidate lattice and perform a Viterbi search there. Temporary extraction and single character recognition need only be performed once, but Viterbi search needs to be performed for each weight sequence (chromosome), but it takes a lot of processing time. Therefore, first, each weight is set to 1, and the top 100 character string candidate paths are selected from each character string of the learning pattern using Viterbi search.

そして遺伝的アルゴリズムにより重み系列を発生し、これらの選択した文字列候補パスに発生した重み系列を適用して評価を行うことで、可能性の高い重みを選択する。収束したら、学習した新しい重み系列を適用して、学習パタンの各文字列からViterbi探索を用いて上位100個の文字列候補パスを選択する。遺伝的アルゴリズムにより重み系列を学習する。このプロセスをもう1度繰り返す。このようにすることで、重み系列の組み合わせを1つずつ試すことなく、効率よく最適な重みの組み合わせを求めることができる。   A weight sequence is generated by a genetic algorithm, and a weight sequence having a high probability is selected by applying the generated weight sequence to the selected character string candidate path. After convergence, the learned new weight sequence is applied, and the top 100 character string candidate paths are selected from each character string of the learning pattern using Viterbi search. A weight sequence is learned by a genetic algorithm. Repeat this process one more time. By doing in this way, it is possible to obtain an optimum weight combination efficiently without trying one combination of weight series.

3.性能評価結果
性能評価に先立って、データベースを利用してP(S|C)について文字認識のモデルを学習した。またデータベースを利用して文字パタンサイズ、文字パタン内分割、単一文字パタン位置(unary位置特徴)とペア文字パタン位置(binary位置特徴)における4つの二次識別関数(QDF)を学習した。また新聞データにより言語文脈の確からしさのためのtri−gram表を作った。そして、データベースによりβ、β、β、βを学習した。
3. Performance Evaluation Results Prior to performance evaluation, a character recognition model was learned for P (S i | C i ) using a database. Also, four secondary discriminant functions (QDF) at the character pattern size, character pattern division, single character pattern position (unary position feature) and pair character pattern position (binary position feature) were learned using a database. In addition, a tri-gram table for the accuracy of language context was created from newspaper data. Then, β 1 , β 2 , β 3 , and β 4 were learned from the database.

さらに、100人分の文字列方向と文字方向自由のオンライン日本語手書き文字列データベースから1行ずつの左から右への文字列を抽出した。このうち75人分のデータから20次元の仮切出し特徴値を抽出し、これらのデータを利用することで、仮切出しのための閾値、仮切出しポイント確かさしさのためのSVMモデルと式(27)における重みパラメータを学習した。そして、残った25人分の文字列データをテストパタンとして本実施形態の方法(式(27)に示す文字列候補パス評価方法)の性能を評価した。   Furthermore, a character string from left to right was extracted line by line from an online Japanese handwritten character string database of 100 character strings and free character direction. Of these, 20-dimensional temporary cutout feature values are extracted from data for 75 persons, and by using these data, the threshold value for temporary cutout and the SVM model and formula (27 ) Weight parameters were learned. Then, the performance of the method of the present embodiment (character string candidate path evaluation method shown in Expression (27)) was evaluated using the remaining 25 character string data as test patterns.

なお比較対象として、式(32)、式(33)に示す文字列候補パス評価方法(方法1、方法2)についても評価した。   For comparison, the character string candidate path evaluation methods (Method 1 and Method 2) shown in Expression (32) and Expression (33) were also evaluated.

ここで、式(32)、式(33)におけるλ(i=1〜7)とλは、本実施形態と同様の重みパラメータであり、遺伝的アルゴリズムにより学習されたものである。式(32)に示すように、方法1では、最小仮切出しユニットではなく仮切出しユニットに基づいて尤度を積み上げたもので、文字列候補の文字数に影響され、文字列を少ない文字数に解釈する傾向がある。つまり、そこでは、学習した重みパラメータをそのまま各項目に与えており、本実施形態のように、最小切出しユニットに基づいて尤度を積み上げていない。また式(33)に示すように、方法2では、文字列候補の文字数によって文字列候補パスの尤度を正規化するため、文字列を多い文字数に解釈する傾向がある。また方法1、方法2では、非切出しポイントして識別される確からしさを評価していない。 Here, λ i (i = 1 to 7) and λ in the equations (32) and (33) are the same weighting parameters as in this embodiment, and are learned by a genetic algorithm. As shown in Expression (32), in Method 1, the likelihood is accumulated based on the temporary cutout unit, not the minimum temporary cutout unit, and is influenced by the number of characters of the character string candidate, and the character string is interpreted as a small number of characters. Tend. That is, the learned weight parameter is given to each item as it is, and the likelihood is not accumulated based on the minimum cutout unit as in this embodiment. Further, as shown in Expression (33), in Method 2, since the likelihood of the character string candidate path is normalized by the number of characters of the character string candidate, the character string tends to be interpreted as a large number of characters. In the method 1 and the method 2, the probability of being identified as an uncut point is not evaluated.

図10に、本実施形態の方法、方法1、方法2それぞれの性能評価結果を示す。   FIG. 10 shows the performance evaluation results of the method, method 1, and method 2 of this embodiment.

なお、図10に示すfは、次式に示す文字切出し性能のf尺度である。   In addition, f shown in FIG. 10 is an f scale of the character extraction performance shown in the following equation.

図10に示すように、本実施形態の方法では、方法1、方法2に比べて、文字切出し性能と文字認識率が向上していることが確認できる。文字認識率の差は1%程度であるが、90%を越えた文字認識率をさらに1%向上させることは容易なことではない。 As shown in FIG. 10, in the method of this embodiment, it can be confirmed that the character extraction performance and the character recognition rate are improved as compared with the method 1 and the method 2. The difference in the character recognition rate is about 1%, but it is not easy to further improve the character recognition rate exceeding 90% by 1%.

4.本実施形態の処理
図11は、本実施形態の文字列認識装置の処理の一例を示すフローチャートである。
4). Processing of this Embodiment FIG. 11 is a flowchart showing an example of processing of the character string recognition device of this embodiment.

まず、筆点情報取得部110は、文字入力部160からストロークのデータ(筆点座標系列)を取得する(ステップS10)。   First, the writing point information acquisition unit 110 acquires stroke data (writing point coordinate series) from the character input unit 160 (step S10).

次に、仮切出しポイント決定部112は、各オフストロークから抽出した水平方向距離と交差長さの特徴値に基づいて、不確定ポイント(仮切出しポイント)を決定する(ステップS12)。次に、各オフストロークから抽出した20個の特徴値を学習したSVMに適用して仮切出しポイントのSVM出力値を求める(ステップS14)。次に、仮切出しポイントのSVM出力値に基づき切出しポイントを確定する(ステップS16)。   Next, the temporary cut point determination unit 112 determines an indeterminate point (temporary cut point) based on the horizontal distance extracted from each off-stroke and the feature value of the intersection length (step S12). Next, the 20 feature values extracted from each off-stroke are applied to the learned SVM to obtain the SVM output value of the temporary cut point (step S14). Next, the cutting point is determined based on the SVM output value of the temporary cutting point (step S16).

次に、候補文字列生成部114は、仮切出しポイント(不確定ポイント、切出しポイント)によって切出された仮切出しユニット毎に文字認識を行い、候補ラティスを生成する(ステップS18)。   Next, the candidate character string generation unit 114 performs character recognition for each temporary cutting unit cut out by the temporary cutting point (indeterminate point, cutting point), and generates a candidate lattice (step S18).

次に、認識部116は、候補ラティスの各文字列候補パス(候補文字列)について、それぞれ重み付けされた複数項目の確からしさを考慮した尤度を求める(ステップS20)。次に、候補ラティスに対してViterbi探索を行って、最適な文字列候補パスを選択する認識処理を行う(ステップS22)。   Next, the recognizing unit 116 obtains a likelihood in consideration of the probabilities of weighted items for each character string candidate path (candidate character string) of the candidate lattice (step S20). Next, a Viterbi search is performed on the candidate lattice, and a recognition process for selecting an optimum character string candidate path is performed (step S22).

なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。   In addition, this invention is not limited to the above-mentioned embodiment, A various deformation | transformation is possible. The present invention includes configurations that are substantially the same as the configurations described in the embodiments (for example, configurations that have the same functions, methods, and results, or configurations that have the same objects and effects). In addition, the invention includes a configuration in which a non-essential part of the configuration described in the embodiment is replaced. In addition, the present invention includes a configuration that exhibits the same operational effects as the configuration described in the embodiment or a configuration that can achieve the same object. Further, the invention includes a configuration in which a known technique is added to the configuration described in the embodiment.

本実施形態の文字列認識装置の機能ブロック図の一例。An example of the functional block diagram of the character string recognition apparatus of this embodiment. 本実施形態の手法について説明するための図。The figure for demonstrating the method of this embodiment. 本実施形態の手法について説明するための図。The figure for demonstrating the method of this embodiment. 本実施形態の手法について説明するための図。The figure for demonstrating the method of this embodiment. 本実施形態の手法について説明するための図。The figure for demonstrating the method of this embodiment. 本実施形態の手法について説明するための図。The figure for demonstrating the method of this embodiment. 本実施形態の手法について説明するための図。The figure for demonstrating the method of this embodiment. 本実施形態の手法について説明するための図。The figure for demonstrating the method of this embodiment. 本実施形態の手法について説明するための図。The figure for demonstrating the method of this embodiment. 性能評価結果を示す図。The figure which shows a performance evaluation result. 本実施形態の文字列認識装置の処理の流れを示すフローチャート図。The flowchart figure which shows the flow of a process of the character string recognition apparatus of this embodiment.

符号の説明Explanation of symbols

100 処理部、110 筆点情報取得部、112 仮切出しポイント決定部、114 候補文字列生成部、116 認識部、120 表示処理部、160 文字入力部、170 記憶部、180 情報記憶媒体、190 表示部、196 通信部 DESCRIPTION OF SYMBOLS 100 Processing part, 110 Writing point information acquisition part, 112 Temporary extraction point determination part, 114 Candidate character string generation part, 116 Recognition part, 120 Display processing part, 160 Character input part, 170 Storage part, 180 Information storage medium, 190 Display Part, 196 communication part

Claims (10)

手書き入力された文字パタンのストロークから文字列を認識するためのプログラムであって、
ストローク間のオフストロークのうち、仮切出しポイントとして設定するオフストロークを決定する仮切出しポイント決定部と、
前記仮切出しポイントによって切り出された仮切出しユニット毎に文字認識を行い、候補文字列を生成する候補文字列生成部と、
前記候補文字列について複数項目の確からしさを評価し、評価結果に基づき文字列を認識する認識部としてコンピュータを機能させ、
前記仮切出しユニットは、隣接する前記仮切出しポイントにより切り出される最小仮切出しユニットを少なくとも1つ含み、
前記認識部は、
前記候補文字列の各候補文字に対応する前記仮切出しユニットに含まれる前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、前記複数項目の確からしさを評価し、前記複数項目の確からしさについて各項目に与える重みの値を、前記仮切出しユニットに含まれる前記最小仮切出しユニットの数に応じて設定することを特徴とするプログラム。
A program for recognizing a character string from a stroke of a character pattern input by handwriting,
Of the off-strokes between strokes, a provisional cut-out point determination unit that determines an off-stroke to be set as a temporary cut-out point;
Character recognition for each provisional cutout unit cut out by the provisional cutout point, a candidate character string generation unit that generates a candidate character string,
Evaluating the probability of multiple items for the candidate character string, causing the computer to function as a recognition unit that recognizes the character string based on the evaluation result,
The temporary cutting unit includes at least one minimum temporary cutting unit cut out by the adjacent temporary cutting point,
The recognition unit
For the connection between the minimum provisional cutout unit included in the provisional cutout unit corresponding to each candidate character of the candidate character string and the adjacent minimum cutout unit, the probability of the plurality of items is evaluated, and the plurality of items A program that sets a weight value to be given to each item with respect to the probability in accordance with the number of the minimum provisional extraction units included in the provisional extraction unit.
請求項1において、
前記複数項目の確からしさは、単一文字パタン位置の確からしさを含み、
前記認識部は、
文字パタンの上部から文字列の中心線までの距離を平均文字サイズで正規化した値と、文字パタンの底部から文字列の中心線までの距離を平均文字サイズで正規化した値とからなる特徴ベクトルに基づいて、前記単一文字パタン位置の確からしさを評価することを特徴とするプログラム。
In claim 1,
The certainty of the plurality of items includes the certainty of a single character pattern position,
The recognition unit
Characteristic consisting of a value obtained by normalizing the distance from the top of the character pattern to the center line of the character string by the average character size, and a value obtained by normalizing the distance from the bottom of the character pattern to the center line of the character string by the average character size. A program for evaluating the probability of the single character pattern position based on a vector.
請求項1において、
前記複数項目の確からしさは、ペア文字パタン位置の確からしさを含み、
前記認識部は、
隣接する文字パタンの上部同士の距離を平均文字サイズで正規化した値と、隣接する文字パタンの下部同士の距離を平均文字サイズで正規化した値とからなる特徴ベクトルに基づいて、前記ペア文字パタン位置の確からしさを評価することを特徴とするプログラム。
In claim 1,
The certainty of the plurality of items includes the certainty of the pair character pattern position,
The recognition unit
Based on a feature vector consisting of a value obtained by normalizing the distance between the upper parts of adjacent character patterns with the average character size and a value obtained by normalizing the distance between the lower parts of adjacent character patterns with the average character size, the pair characters A program characterized by evaluating the probability of pattern position.
請求項1において、
前記複数項目の確からしさは、文字パタン内分割の確からしさを含み、
前記認識部は、
文字パタンの垂直方向の射影におけるギャップの長さを平均文字サイズで正規化した値と、文字パタンの水平方向の射影におけるギャップの長さを平均文字サイズで正規化した値とからなる特徴ベクトルに基づいて、前記文字パタン内分割の確からしさを評価することを特徴とするプログラム。
In claim 1,
The certainty of the plurality of items includes the certainty of division within the character pattern,
The recognition unit
A feature vector consisting of a value obtained by normalizing the gap length in the vertical projection of the character pattern by the average character size and a value obtained by normalizing the gap length in the horizontal projection of the character pattern by the average character size. A program for evaluating the probability of division within the character pattern based on the above.
請求項2乃至4のいずれかにおいて、
前記複数項目の確からしさは、言語文脈の確からしさ、文字パタンサイズの確からしさ及び文字認識の確からしさを更に含むことを特徴とするプログラム。
In any of claims 2 to 4,
The likelihood of multiple items, the probability of language context, program characterized by further comprising a likelihood of certainty and character recognition of the character pattern size.
請求項において、
前記認識部は、
前記候補文字列について、前記複数項目の確からしさの他に、前記仮切出しポイントの確からしさを評価し、前記仮切出しポイントを、隣接する文字パタン間の仮切出しポイントとして判断する場合には、前記仮切出しポイントが切出しポイントとして識別される確からしさを評価し、前記仮切出しポイントを、文字パタン内部の仮切出しポイントとして判断する場合には、前記仮切出しポイントが非切出しポイントとして識別される確からしさを評価することを特徴とするプログラム。
In claim 1 ,
The recognition unit
For the candidate character string, in addition to the certainty of the plurality of items, when evaluating the certainty of the provisional cut point, and determining the provisional cut point as a provisional cut point between adjacent character patterns, When assessing the probability that a temporary cut point is identified as a cut point, and determining that the temporary cut point is a temporary cut point inside a character pattern, the probability that the temporary cut point is identified as a non-cut point A program characterized by evaluating
請求項において、
前記仮切出しポイント決定部は、
前記オフストロークから抽出した多次元の特徴値をサポートベクターマシン(SVM)に適用することで、前記仮切出しポイントのSVM出力値を求め、
前記認識部は、
前記SVM出力値に基づき前記仮切出しポイントの確からしさを評価することを特徴とするプログラム。
In claim 6 ,
The temporary cut point determination unit
By applying a multi-dimensional feature value extracted from the off-stroke to a support vector machine (SVM), an SVM output value of the temporary cut point is obtained.
The recognition unit
A program for evaluating the probability of the provisional cut-out point based on the SVM output value.
請求項1乃至7のいずれかにおいて、
前記認識部は、
遺伝的アルゴリズムにより学習した複数の重みの値を前記複数項目の確からしさに与えることを特徴とするプログラム。
In any one of Claims 1 thru | or 7,
The recognition unit
A program characterized in that a plurality of weight values learned by a genetic algorithm are given to the probabilities of the plurality of items.
コンピュータ読み取り可能な情報記憶媒体であって、請求項1乃至8のいずれかのプログラムを記憶したことを特徴とする情報記憶媒体。   A computer-readable information storage medium, wherein the program according to any one of claims 1 to 8 is stored. 手書き入力された文字パタンのストロークから文字列を認識する文字列認識装置であって、
ストローク間のオフストロークのうち、仮切出しポイントとして設定するオフストロークを決定する仮切出しポイント決定部と、
前記仮切出しポイントによって切り出された仮切出しユニット毎に文字認識を行い、候補文字列を生成する候補文字列生成部と、
前記候補文字列について複数項目の確からしさを評価し、評価結果に基づき文字列を認識する認識部とを含み、
前記仮切出しユニットは、隣接する前記仮切出しポイントにより切り出される最小仮切
出しユニットを少なくとも1つ含み、
前記認識部は、
前記候補文字列の各候補文字に対応する前記仮切出しユニットに含まれる前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、前記複数項目の確からしさを評価し、前記複数項目の確からしさについて各項目に与える重みの値を、前記仮切出しユニットに含まれる前記最小仮切出しユニットの数に応じて設定することを特徴とする文字列認識装置。
A character string recognition device for recognizing a character string from a stroke of a character pattern input by handwriting,
Of the off-strokes between strokes, a provisional cut-out point determination unit that determines an off-stroke to be set as a temporary cut-out point;
Character recognition for each provisional cutout unit cut out by the provisional cutout point, a candidate character string generation unit that generates a candidate character string,
A recognition unit that evaluates the probability of a plurality of items for the candidate character string and recognizes the character string based on the evaluation result;
The temporary cutting unit includes at least one minimum temporary cutting unit cut out by the adjacent temporary cutting point,
The recognition unit
For the connection between the minimum provisional cutout unit included in the provisional cutout unit corresponding to each candidate character of the candidate character string and the adjacent minimum cutout unit, the probability of the plurality of items is evaluated, and the plurality of items A character string recognizing apparatus, wherein a value of a weight given to each item regarding the probability is set according to the number of the minimum provisional cutout units included in the provisional cutout unit.
JP2008199388A 2008-08-01 2008-08-01 Program, information storage medium, and character string recognition device Active JP5344338B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008199388A JP5344338B2 (en) 2008-08-01 2008-08-01 Program, information storage medium, and character string recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008199388A JP5344338B2 (en) 2008-08-01 2008-08-01 Program, information storage medium, and character string recognition device

Publications (2)

Publication Number Publication Date
JP2010039609A JP2010039609A (en) 2010-02-18
JP5344338B2 true JP5344338B2 (en) 2013-11-20

Family

ID=42012116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008199388A Active JP5344338B2 (en) 2008-08-01 2008-08-01 Program, information storage medium, and character string recognition device

Country Status (1)

Country Link
JP (1) JP5344338B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5867227B2 (en) * 2012-03-27 2016-02-24 富士ゼロックス株式会社 Learning data generation device for character recognition, character recognition device, and program
JP2014092817A (en) * 2012-10-31 2014-05-19 Fuji Xerox Co Ltd Character recognition device and program
CN116071764B (en) * 2023-03-28 2023-07-14 中国人民解放军海军工程大学 Prototype network-based handwritten Chinese character recognition method, device, equipment and medium

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2940747B2 (en) * 1992-10-13 1999-08-25 三洋電機株式会社 Character segmentation device
JP2002063548A (en) * 2001-06-18 2002-02-28 Hitachi Software Eng Co Ltd Handwritten character recognizing method
JP2004171316A (en) * 2002-11-21 2004-06-17 Hitachi Ltd Ocr device, document retrieval system and document retrieval program
JP2005141329A (en) * 2003-11-04 2005-06-02 Toshiba Corp Device and method for recognizing handwritten character
TW200809660A (en) * 2006-03-01 2008-02-16 Zi Decuma Ab A method for additive character recognition and an apparatus thereof

Also Published As

Publication number Publication date
JP2010039609A (en) 2010-02-18

Similar Documents

Publication Publication Date Title
JP5071914B2 (en) Recognition graph
CN111695527B (en) Mongolian online handwriting recognition method
Bharath et al. HMM-based lexicon-driven and lexicon-free word recognition for online handwritten Indic scripts
JP2019087237A (en) Font recognition improvement using adversarial neural network training
Davila et al. Using off-line features and synthetic data for on-line handwritten math symbol recognition
Kim et al. Hierarchical random graph representation of handwritten characters and its application to Hangul recognition
CN111931710B (en) Online handwritten character recognition method and device, electronic equipment and storage medium
US7903877B2 (en) Radical-based HMM modeling for handwritten East Asian characters
KR102293538B1 (en) Method and apparatus for recognising music symbols
Lacerda et al. Segmentation of connected handwritten digits using Self-Organizing Maps
Purohit et al. A literature survey on handwritten character recognition
JP2018524734A (en) System for recognizing input of multiple objects, method and product therefor
Stern et al. Most discriminating segment–Longest common subsequence (MDSLCS) algorithm for dynamic hand gesture classification
Zarro et al. Recognition-based online Kurdish character recognition using hidden Markov model and harmony search
JP2015185033A (en) Character recognition device and identification function generation method
Mandal et al. GMM posterior features for improving online handwriting recognition
Potrus et al. An evolutionary harmony search algorithm with dominant point detection for recognition-based segmentation of online Arabic text recognition
JP5344338B2 (en) Program, information storage medium, and character string recognition device
Yesilbek et al. Sketch recognition with few examples
Ghadhban et al. Segments interpolation extractor for finding the best fit line in Arabic offline handwriting recognition words
JP5343617B2 (en) Character recognition program, character recognition method, and character recognition device
Goswami et al. Classification of printed Gujarati characters using SOM based k-Nearest Neighbor Classifier
TWI303783B (en) Method and device for recognition of a handwritten pattern, and computer program product
Porwal et al. Ensemble of biased learners for offline arabic handwriting recognition
Premaratne et al. Lexicon and hidden Markov model-based optimisation of the recognised Sinhala script

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110801

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130802

R150 Certificate of patent or registration of utility model

Ref document number: 5344338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250