JP2013011932A - Character checking device, method, and program - Google Patents

Character checking device, method, and program Download PDF

Info

Publication number
JP2013011932A
JP2013011932A JP2011142621A JP2011142621A JP2013011932A JP 2013011932 A JP2013011932 A JP 2013011932A JP 2011142621 A JP2011142621 A JP 2011142621A JP 2011142621 A JP2011142621 A JP 2011142621A JP 2013011932 A JP2013011932 A JP 2013011932A
Authority
JP
Japan
Prior art keywords
character
check
characters
recognized
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011142621A
Other languages
Japanese (ja)
Inventor
Daisuke Nishiwaki
大輔 西脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011142621A priority Critical patent/JP2013011932A/en
Priority to PCT/JP2012/004079 priority patent/WO2013001774A1/en
Publication of JP2013011932A publication Critical patent/JP2013011932A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns

Abstract

PROBLEM TO BE SOLVED: To check characters designed in a drawing or the like with high accuracy and at low costs.SOLUTION: In a character checking device (10), recognition means (100) optically acquires image data of a check target, and also recognizes characters included in the image data. A check unit (200) stores respective sorts of characters recognized by the recognition means (100) and their similar characters in association. Also, the check unit (200) checks characters recognized by the recognition means (100). The check unit (200) displays information about similar characters corresponding to the recognized characters as a check result on a display means (300).

Description

本発明は、文字チェック装置、方法及びプログラムに関し、特に図面等に表示された文字をチェックする技術に関する。   The present invention relates to a character check apparatus, method, and program, and more particularly, to a technique for checking characters displayed in drawings and the like.

ものづくりにおいては、設計図面がベースになっている。近年、設計図面は、CAD(Computer Aimed Design)を利用して作成されるようになっている。CADを利用するメリットとしては、例えば、寸法の入力ミスがあっても、CADが図面の矛盾をチェックして指摘し、以て図面の再作成や製品の作り直しを低減できる点等が挙げられる。   In manufacturing, design drawings are the basis. In recent years, design drawings have been created using CAD (Computer Aimed Design). As an advantage of using CAD, for example, even if there is a dimensional input error, CAD can check and point out a contradiction in the drawing, thereby reducing the re-creation of the drawing and the re-creation of the product.

一方、製品に印刷する文字やロゴについては、その誤りを自動的に検出することは困難である。これは、製品に印刷する文字やロゴに関する情報がCADには入力されておらず、CADでは文字やロゴの正誤を判定できないためである。文字やロゴに関する情報は、図面を作成するための仕様として、別の文書上に存在するのが一般的である。CADによる自動チェックができないため、文字やロゴは、設計者或いは責任者自身の目視作業によってチェックされている。   On the other hand, it is difficult to automatically detect errors in characters and logos printed on products. This is because information on characters and logos to be printed on the product is not input to the CAD, and the correctness of the characters and logo cannot be determined by the CAD. Information on characters and logos is generally present on another document as a specification for creating a drawing. Since automatic check by CAD is not possible, characters and logos are checked by the visual work of the designer or the person in charge.

図面上の文字やロゴのチェックを人手で行うため、万一、文字やロゴに誤りがあり且つそれを発見できない場合、図面は、誤りを含んだ状態で製造プロセスに渡ってしまう。この結果、文字の誤りやロゴの誤りを含んだ製品が生産されてしまうことになる。例えば、キーボードの「ひらがな」キーを「ひながな」として製作してしまうこと等がある。このような問題は、チェック者が母国語の文字をチェックしても発生するので、チェック者或いは図面設計者が母国語でない文字をチェックする場合にはさらに顕著に現れる。   Since the characters and logos on the drawings are manually checked, if the characters or logos are incorrect and cannot be found, the drawings are transferred to the manufacturing process with errors. As a result, a product including a letter error or a logo error is produced. For example, the “Hiragana” key of the keyboard may be manufactured as “Hiragana”. Such a problem occurs even when the checker checks characters in the native language, so that the problem appears more prominently when the checker or drawing designer checks characters that are not in the native language.

特開平5−314305号公報JP-A-5-314305

人手による文字チェックを行う場合、チェックミスを完全に防ぐためには、非常に多くのコストを必要とする。具体的には、チェック者を複数にしてチェックを多重化する方法が考えられるが、その分、チェックに要するコストが単純増大してしまう。   When performing a manual character check, a very large cost is required to completely prevent a check error. Specifically, there can be a method of multiplexing the check with a plurality of checkers, but the cost required for the check simply increases accordingly.

この問題に対処するため、前述の別文書をコンピュータで編集可能なデータとして作成し、CAD内の文字データと電子的に照合する対策が考えられる。しかしながら、この対策は得策で無い。その理由は、例え電子的な照合で文字コードが一致しても、CADデータを図面としてプリンタなどで印刷する際に、意図していない文字が印刷される「文字化け」や印字位置のずれが発生する虞があるためである。   In order to cope with this problem, it is conceivable to prepare the above-mentioned separate document as data editable by a computer and electronically collate it with character data in CAD. However, this measure is not a good idea. The reason for this is that even if the character codes are matched by electronic verification, when printing CAD data as a drawing with a printer or the like, unintended characters are printed, or the print position is misaligned. This is because it may occur.

そこで、誌面等の文字を自動的に読み取る光学的文字読み取り装置(OCR:Optical Character Reader)を活用する対策が考えられる。具体的には、OCRにCADデータを印刷した図面上の文字記載箇所を読み取らせ、前述の別文書の記載事項と照合することで誤植を検出する。このようにOCRを利用して文字チェックを行う方法は、例えば特許文献1に記載されている。   Therefore, a countermeasure using an optical character reader (OCR: Optical Character Reader) that automatically reads characters such as magazines can be considered. Specifically, the typographical error is detected by causing the OCR to read the character description location on the drawing on which the CAD data is printed, and collating it with the description items of the other document. A method for checking characters using OCR in this way is described in Patent Document 1, for example.

しかしながら、本願発明者は、OCRを用いた文字チェックには、その精度が低いという課題があることを発見した。   However, the inventor of the present application has found that the character check using OCR has a problem that its accuracy is low.

具体的には、OCRでは、入力画像に含まれる文字を100%の精度で認識することが困難である。例えば、数字の「1」を英字の「I」と誤って認識するケースや、漢字の「網」を「綱」と誤って認識するケース等が存在する。このため、照合結果が"一致"を示す場合であっても、これを必ずしも信用できない。より詳細には、或る文字列の1番目が数字の「1」であると前述の別文書に登録され、且つOCRによる当該文字の認識結果が「1」である場合であっても、実際の図面上には英字の「I」が印字されている可能性がある。この場合、誤植を何ら検出できないことから、前述のような文字チェックにはOCRは適さないと考えられる。   Specifically, in OCR, it is difficult to recognize characters included in an input image with 100% accuracy. For example, there are cases where the number “1” is mistakenly recognized as the English letter “I”, and the Chinese character “net” is mistakenly recognized as “tuna”. For this reason, even if the collation result indicates “match”, this cannot always be trusted. More specifically, even if the first character string is registered in the above-mentioned separate document as the number “1” and the recognition result of the character by OCR is “1”, it is actually There is a possibility that the letter “I” is printed on the drawing. In this case, since no typographical errors can be detected, it is considered that OCR is not suitable for the character check as described above.

本発明は、上記の課題に鑑みてなされたものであり、その目的は、図面等に表示された文字を、より高精度且つ低コストでチェックすることにある。   The present invention has been made in view of the above problems, and an object of the present invention is to check characters displayed on a drawing or the like with higher accuracy and lower cost.

上記の目的を達成するため、本発明の第1の態様に係る文字チェック装置は、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する認識手段と、前記認識された文字をチェックするチェック手段と、前記チェックの結果を表示する表示手段とを備える。前記チェック手段は、前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる。   In order to achieve the above object, the character check device according to the first aspect of the present invention optically obtains image data of a check target, and recognizes a character included in the image data; Check means for checking the recognized character and display means for displaying the result of the check. The checking means stores each character type that can be recognized by the recognizing means and the similar characters in association with each other, and stores information on the similar characters corresponding to the recognized characters on the display means. Display as a result.

また、本発明の第2の態様に係る文字チェック方法は、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能な装置における文字チェック方法を提供する。この方法は、認識され得る字種各々と、その類似文字とを対応付けて記憶し、前記認識された文字に対応する類似文字に関する情報を表示することを含む。   The character check method according to the second aspect of the present invention provides a character check method in an apparatus capable of optically acquiring image data of a check target and recognizing characters included in the image data. The method includes storing each character type that can be recognized and the similar character in association with each other, and displaying information related to the similar character corresponding to the recognized character.

さらに、本発明の第3の態様に係る文字チェックプログラムは、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能なコンピュータに、認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、前記認識された文字に対応する類似文字に関する情報を表示する処理とを実行させる。   Furthermore, the character check program according to the third aspect of the present invention is a computer program that optically acquires image data of a check target and that can be recognized by a computer that can recognize characters included in the image data. And a process of storing the similar character in association with each other and a process of displaying information on the similar character corresponding to the recognized character.

本発明によれば、図面等に表示された文字を、より高精度且つ低コストでチェックすることが可能である。   According to the present invention, it is possible to check characters displayed on a drawing or the like with higher accuracy and lower cost.

本発明の実施の形態1に係る文字チェック装置の構成例を示したブロック図である。It is the block diagram which showed the structural example of the character check apparatus which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る文字チェック装置の動作例を示したフローチャート図である。It is the flowchart figure which showed the operation example of the character check apparatus which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る文字チェック装置による、チェック対象物の第1の例を示した図である。It is the figure which showed the 1st example of the check target object by the character check apparatus which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る文字チェック装置に用いる、類似文字情報の構成例を示した図である。It is the figure which showed the structural example of the similar character information used for the character check apparatus which concerns on Embodiment 1 of this invention. 図4に示す類似文字情報の作成に用いる、類似度マトリクスの構成例を示した図である。It is the figure which showed the structural example of the similarity matrix used for preparation of the similar character information shown in FIG. 本発明の実施の形態1に係る文字チェック装置による、チェック対象物の第2の例を示した図である。It is the figure which showed the 2nd example of the check target object by the character check apparatus which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る文字チェック装置による、チェック対象物の第3の例を示した図である。It is the figure which showed the 3rd example of the check target object by the character check apparatus which concerns on Embodiment 1 of this invention. 本発明の実施の形態2に係る文字チェック装置の構成例を示したブロック図である。It is the block diagram which showed the structural example of the character check apparatus which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る文字チェック装置に用いる、正解データの構成例を示した図である。It is the figure which showed the structural example of the correct data used for the character check apparatus which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る文字チェック装置の動作例を示したフローチャート図である。It is the flowchart figure which showed the operation example of the character check apparatus which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る文字チェック装置による、チェック対象物の一例を示した図である。It is the figure which showed an example of the check target object by the character check apparatus which concerns on Embodiment 2 of this invention.

以下、本発明に係る文字チェック装置の実施の形態1及び2を、図1〜図11を参照して説明する。なお、各図面において、同一要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略される。   Embodiments 1 and 2 of the character check device according to the present invention will be described below with reference to FIGS. In the drawings, the same components are denoted by the same reference numerals, and redundant description is omitted as necessary for the sake of clarity.

[実施の形態1]
図1に示すように、本実施の形態に係る文字チェック装置10は、認識部100と、チェック部200と、表示部300とを含む。
[Embodiment 1]
As shown in FIG. 1, the character check device 10 according to the present embodiment includes a recognition unit 100, a check unit 200, and a display unit 300.

この内、認識部100は、入力モジュール101と、抽出モジュール102と、認識モジュール103と、認識辞書モジュール104とを含む。入力モジュール101は、印刷された図面をスキャンして画像データへ変換する。抽出モジュール102は、画像データから文字列領域を抽出する。認識モジュール103は、抽出された文字列領域に相当する画像に対して文字認識を行う。認識辞書モジュール104は、認識モジュール103によって認識され得る字種各々に対する標準を記憶する。この標準は、認識モジュール103での文字認識に際して参照される。   Among these, the recognition unit 100 includes an input module 101, an extraction module 102, a recognition module 103, and a recognition dictionary module 104. The input module 101 scans a printed drawing and converts it into image data. The extraction module 102 extracts a character string area from the image data. The recognition module 103 performs character recognition on an image corresponding to the extracted character string area. The recognition dictionary module 104 stores a standard for each character type that can be recognized by the recognition module 103. This standard is referred to when character recognition is performed by the recognition module 103.

また、チェック部200は、評価モジュール201と、類似文字情報モジュール202とを含む。評価モジュール201は、認識モジュール103によって認識された文字をチェックすると共に、その結果を表示部300に表示させる。類似文字情報モジュール202は、認識モジュール103によって認識され得る字種各々と、その類似文字とを対応付けて記憶する。認識モジュール103によって認識された文字に対応する類似文字は、表示部300での表示に供される。   The check unit 200 includes an evaluation module 201 and a similar character information module 202. The evaluation module 201 checks the characters recognized by the recognition module 103 and causes the display unit 300 to display the result. The similar character information module 202 stores each character type that can be recognized by the recognition module 103 in association with the similar character. Similar characters corresponding to the characters recognized by the recognition module 103 are provided for display on the display unit 300.

なお、表示部300は、例えば、ディスプレイ及びそのコントローラによって構成できる。また、文字チェック装置10は、スキャナが接続され、且つ入力部、処理部、記憶部、及び出力部を有する一般的なコンピュータで実現可能である。   In addition, the display part 300 can be comprised with a display and its controller, for example. The character check apparatus 10 can be realized by a general computer to which a scanner is connected and which has an input unit, a processing unit, a storage unit, and an output unit.

次に、本実施の形態の動作を、図2〜図7を参照して詳細に説明する。   Next, the operation of the present embodiment will be described in detail with reference to FIGS.

図2に示すように、まず文字チェック装置10には、チェックすべき文字列の数"n"(nは任意の自然数)が入力される(ステップS1)。今、図3に示す図面1001がチェック対象物であるとする。この場合、図面1001上には3行の文字列が存在するため、チェック数n="3"が入力される。   As shown in FIG. 2, first, the number “n” (n is an arbitrary natural number) of character strings to be checked is input to the character check device 10 (step S1). Assume that a drawing 1001 shown in FIG. 3 is a check target. In this case, since there are three lines of character strings on the drawing 1001, the number of checks n = “3” is input.

この時、文字チェック装置10は、文字列のチェックに用いるローカル変数iを"1"に初期化する(ステップS2)。ここで、変数iの値は、"i"番目("i"行目)の文字列がチェックされることを意味する。   At this time, the character check device 10 initializes a local variable i used for checking the character string to “1” (step S2). Here, the value of the variable i means that the “i” -th (“i” line) character string is checked.

変数i≠チェック数n(図3の例では"3")が成立する間(ステップS3)、文字チェック装置10は、以降のステップS4〜S7を繰り返し実行する。   While the variable i ≠ the number of checks n (“3” in the example of FIG. 3) is established (step S3), the character check device 10 repeatedly executes the following steps S4 to S7.

具体的には、認識部100内の入力モジュール101は、図面1001をスキャンして画像データを取得し、抽出モジュール102へ出力する。抽出モジュール102は、画像データから文字列に相当する領域を切り出す。より詳細には、抽出モジュール102は、画像データに対して、Y軸(図面1001の左上を原点とする垂直方向)に対する投影プロファイルより、各文字列のY方向分離を行う。続いて、抽出モジュール102は、各文字列のY軸方向の存在範囲に対し、X軸(図面1001の左上を原点とする水平方向)に対する投影プロファイルを用いて文字列の終点を求め、以て各文字列に対応する画像を切り出す。   Specifically, the input module 101 in the recognition unit 100 scans the drawing 1001 to acquire image data, and outputs the image data to the extraction module 102. The extraction module 102 cuts out an area corresponding to the character string from the image data. More specifically, the extraction module 102 separates each character string in the Y direction based on the projection profile with respect to the Y axis (vertical direction with the upper left of the drawing 1001 as the origin) for the image data. Subsequently, the extraction module 102 obtains the end point of the character string by using a projection profile with respect to the X axis (horizontal direction with the origin at the upper left of the drawing 1001) for the existence range in the Y axis direction of each character string, and Cut out an image corresponding to each character string.

この結果、図3に示す座標(X1、Y1)を開始座標として、1番目の文字列401(1)="ABCDEF"を囲む外接矩形に対応する画像が切り出される。同様に、座標(X2、Y2)を開始座標として、2番目の文字列401(2)="XYZ"を囲む外接矩形に対応する画像が切り出され、座標(X3、Y3)を開始座標として、3番目の文字列401(3)="□□株式会社"を囲む外接矩形に対応する画像が切り出される。抽出モジュール102は、切り出した画像を、認識モジュール103へ順次出力する。   As a result, an image corresponding to the circumscribed rectangle surrounding the first character string 401 (1) = “ABCDEF” is cut out with the coordinates (X1, Y1) shown in FIG. 3 as the start coordinates. Similarly, an image corresponding to a circumscribed rectangle surrounding the second character string 401 (2) = “XYZ” is cut out with the coordinates (X2, Y2) as the start coordinates, and the coordinates (X3, Y3) as the start coordinates, The image corresponding to the circumscribed rectangle surrounding the third character string 401 (3) = “□□ Corporation” is cut out. The extraction module 102 sequentially outputs the cut out images to the recognition module 103.

認識モジュール103は、まず文字列401(1)="ABCDEF"に対応する画像に対して、文字認識を行う(ステップS4)。より詳細には、認識モジュール103は、認識辞書モジュール104に記憶されている各字種の特徴データを参照して認識を行う。設計図面の場合は使用されるフォントが既知であるので、各字種の画像そのものを認識辞書モジュール104へ格納し、パタンの重ね合わせにより類似度若しくは距離値を計算し、どの字種であるかを判定すれば良い。或いは、「澤他:こう配特徴ベクトルと変動吸収共分散行列による手書き漢字認識の高精度化、電子情報通信学会論文誌D ,Vol.J84−D2,No.11,pp.2387−2397, 2001」に記載される特徴量を用いても良い。この場合、認識辞書モジュール104には、各字種のパタンに代えて特徴量を格納しておく。なお、文字列画像を1文字毎に分離するには、よく知られているように、文字列方向への投影プロファイルの谷を用いれば良い。   The recognition module 103 first performs character recognition on an image corresponding to the character string 401 (1) = “ABCDEF” (step S4). More specifically, the recognition module 103 performs recognition with reference to the feature data of each character type stored in the recognition dictionary module 104. In the case of a design drawing, since the font to be used is known, the image itself of each character type is stored in the recognition dictionary module 104, the similarity or distance value is calculated by superimposing the patterns, and which character type is used Can be determined. Or, “Sawa et al .: Improvement in accuracy of handwritten Kanji recognition using gradient feature vector and variable absorption covariance matrix, IEICE Transactions D, Vol. J84-D2, No. 11, pp. 2387-2397, 2001” May be used. In this case, the feature value is stored in the recognition dictionary module 104 instead of the pattern of each character type. In order to separate the character string image for each character, as is well known, the valley of the projection profile in the character string direction may be used.

そして、認識モジュール103は、文字認識によって得た文字列402(i)を、チェック部200内の評価モジュール201へ出力する。なお、以降の説明においては、文字認識によって得た文字列402を、"認識文字列"と呼称し、認識対象の文字列401と区別する。   Then, the recognition module 103 outputs the character string 402 (i) obtained by character recognition to the evaluation module 201 in the check unit 200. In the following description, the character string 402 obtained by character recognition is referred to as a “recognized character string” and is distinguished from the character string 401 to be recognized.

評価モジュール201は、類似文字情報モジュール202を参照し、認識文字列402(1)中に認識モジュール103が認識を誤る可能性のある類似文字が存在するか否かを判定する(ステップS5)。   The evaluation module 201 refers to the similar character information module 202 and determines whether or not there is a similar character that the recognition module 103 may erroneously recognize in the recognized character string 402 (1) (step S5).

今、認識文字列402(1)="ABCDEF"が入力され、且つ類似文字情報モジュール202に、文字"C"の類似文字として文字"G"が登録されているとする。この場合、評価モジュール201は、表示部300に、『"C"を確認せよ』とのメッセージを認識文字列402(1)と共に表示させる(ステップS6)。   Assume that the recognized character string 402 (1) = “ABCDEF” is input and the character “G” is registered in the similar character information module 202 as a similar character of the character “C”. In this case, the evaluation module 201 causes the display unit 300 to display a message “Check“ C ”” together with the recognized character string 402 (1) (step S6).

この後、文字チェック装置10は、変数iをインクリメントして(ステップS7)、上記のステップS3へ戻り、以て変数i=チェック数nが成立する迄、上記のステップS4〜S6を繰り返し実行する。これにより、文字列401(2)="XYZ"及び文字列401(3)="□□株式会社"に対する文字認識、並びに類似文字に関するメッセージの表示が行われることとなる。   Thereafter, the character check device 10 increments the variable i (step S7), returns to the above step S3, and thus repeatedly executes the above steps S4 to S6 until the variable i = the number n of checks is established. . As a result, the character recognition for the character string 401 (2) = “XYZ” and the character string 401 (3) = “□□ Co., Ltd.” and the display of a message regarding similar characters are performed.

このように、本実施の形態においては、OCRによって誤認識されている可能性のある文字を表示し(換言すると、誤植であり得る文字を検出し)、以て上述したOCRを用いた文字チェックにおける欠点を改善している。また、文字チェック自体は機械的に行われるため、複数のチェック者による作業は不要である。従って、本実施の形態によれば、図面に表示された文字を、従来と比して高精度且つ低コストでチェックすることができる。   As described above, in this embodiment, characters that may be erroneously recognized by OCR are displayed (in other words, characters that may be typographical errors are detected), and thus the above-described character check using OCR is performed. Has improved the shortcomings. Further, since the character check itself is performed mechanically, work by a plurality of checkers is not necessary. Therefore, according to the present embodiment, it is possible to check the characters displayed in the drawing with higher accuracy and lower cost than in the past.

次に、類似文字情報モジュール202に記憶される情報(以下、類似文字情報)の具体的な構成例及びその作成手順例を、図4及び図5を参照して説明する。   Next, a specific configuration example of information stored in the similar character information module 202 (hereinafter referred to as similar character information) and an example of a creation procedure thereof will be described with reference to FIGS.

図4に示すように、類似文字情報501には、認識対象となる"K"個の字種p1〜pKの各々に対して、各字種に類似している文字が類似性の高い順に対応付けて記憶されている。各字種の類似文字は最大で"K−1"字種存在し得るが、各字種の形状に応じて記憶すべき類似文字の数は変わってくる。類似文字情報モジュール202は、類似文字情報501の作成に際して類似度を類似性の尺度として用いる場合、所定の類似度以上の文字を類似度の降順に記憶すれば良く、距離値を類似性の尺度として用いる場合には、所定の距離値以下の文字を距離値の昇順に記憶すれば良い。   As shown in FIG. 4, in the similar character information 501, for each of the “K” character types p1 to pK to be recognized, characters similar to each character type correspond in descending order of similarity. It is remembered. Although the maximum number of similar characters of each character type can be "K-1", the number of similar characters to be stored varies depending on the shape of each character type. When using the similarity as a measure of similarity when creating the similar character information 501, the similar character information module 202 may store characters having a predetermined similarity or higher in descending order of similarity, and the distance value is a measure of similarity. In the case of using as, characters having a predetermined distance value or less may be stored in ascending order of the distance value.

類似度を類似性の尺度として用いる場合、類似文字情報モジュール202は、図5に示す類似度マトリクス502を作成し、この類似度マトリクス502を用いて類似文字情報501を作成すれば良い。類似度マトリクス502には、字種p1〜pK同士間の類似度s11〜sKKが示されている。類似文字情報モジュール202は、縦、横K字種の組み合わせそれぞれに対して類似度を算出し、以て類似度マトリクス502を作成する。そして、類似文字情報モジュール202は、各字種に対して類似度が一定以上となる字種を類似度マトリクス502から検索すると共に、検索した字種を類似度の高い順に選択して各字種と対応付けて記憶し、以て類似文字情報501を作成する。   When using the similarity as a measure of similarity, the similar character information module 202 may create the similarity matrix 502 shown in FIG. 5 and create the similar character information 501 using the similarity matrix 502. The similarity matrix 502 shows the similarities s11 to sKK between the character types p1 to pK. The similar character information module 202 calculates the similarity for each combination of vertical and horizontal K character types, and creates the similarity matrix 502. Then, the similar character information module 202 searches the similarity matrix 502 for character types having a certain degree of similarity with respect to each character type, and selects the searched character types in descending order of similarity. And similar character information 501 is created.

一方、距離値が類似性の尺度として用いる場合、類似文字情報モジュール202は、各字種に対して距離値が一定以下となる字種を検索し、検索した字種を距離値の低い順に選択して各字種と対応付けて記憶すれば良い。   On the other hand, when the distance value is used as a measure of similarity, the similar character information module 202 searches for a character type having a distance value equal to or less than a certain value for each character type, and selects the searched character types in order of increasing distance value. Then, it may be stored in association with each character type.

また、認識対象となる字種が複数種類の書体(複数のフォントや手書文字等)によって表現される場合、類似文字情報モジュール202は、字種間の類似度又は距離値の算出に際し、或る書体を代表パタンとして用いても良いし、字種毎に代表パタンを作成して用いても良い。或る書体を代表パタンとする場合、類似文字情報モジュール202は、類似度を類似性の尺度とするのであれば、比較している字種との類似度が最も高くなるパタンを用いれば良く、距離値を類似性の尺度とするのであれば、比較している字種との距離値が最も低くなるパタンを用いれば良い。一方、代表パタンを作成する場合、類似文字情報モジュール202は、各書体に属する同一字種同士間の平均パタンを作成する。この場合、認識対象となる字種の書体に依存せず、類似文字の表示を行うことができる。   In addition, when the character type to be recognized is expressed by a plurality of types of fonts (such as a plurality of fonts and handwritten characters), the similar character information module 202 calculates the similarity or distance value between character types, or May be used as a representative pattern, or a representative pattern may be created and used for each character type. When a certain typeface is used as a representative pattern, the similar character information module 202 may use a pattern having the highest degree of similarity with the character type being compared if the similarity is used as a measure of similarity. If the distance value is used as a measure of similarity, a pattern having the lowest distance value with the character type being compared may be used. On the other hand, when creating a representative pattern, the similar character information module 202 creates an average pattern between the same character types belonging to each typeface. In this case, similar characters can be displayed without depending on the typeface of the character type to be recognized.

さらに、図4に示す如く類似文字情報501を構成した場合、評価モジュール201は、上記のステップS6にて、認識文字列402中の各文字に対応する複数の類似文字を表示対象として扱うと好適である。この場合、誤植が発見される確率を向上させることができる。   Furthermore, when the similar character information 501 is configured as shown in FIG. 4, it is preferable that the evaluation module 201 treats a plurality of similar characters corresponding to each character in the recognized character string 402 as a display target in step S6. It is. In this case, the probability that a typographical error is found can be improved.

なお、類似文字情報501は、静的に作成されるに限らず、文字チェック装置10の外部からの指示(例えば、文字チェック装置10に対するユーザ操作)に応じて動的に更新しても良い。この場合、類似文字の表示精度を調整すること等が可能となる。   Note that the similar character information 501 is not limited to be created statically, but may be dynamically updated according to an instruction from the outside of the character check device 10 (for example, a user operation on the character check device 10). In this case, it is possible to adjust the display accuracy of similar characters.

また、文字チェック装置10は、図3に示したような印字された図面に限らず、文字が直接印刷又は刻印された部品や製品等、他の種々の物品のチェックに適用可能である。   Further, the character check device 10 is not limited to the printed drawing as shown in FIG. 3, but can be applied to check various other articles such as parts and products in which characters are directly printed or stamped.

例えば、文字チェック装置10は、図6に示す銘板シール2001に表示される文字をチェックすることができる。ここで、銘板シール2001は、図3に示した図面1001を元に製作したものである。   For example, the character check device 10 can check the characters displayed on the nameplate seal 2001 shown in FIG. Here, the nameplate seal 2001 is manufactured based on the drawing 1001 shown in FIG.

この場合、文字チェック装置10内の入力モジュール101が、銘板シール2001の画像データを取得する。この時、入力モジュール101としては、スキャナを用いても良いし、カメラを用いても良い。取得された画像データは、抽出モジュール102及び認識モジュール130を経由して認識文字列402に変換され、評価モジュール201でのチェックに供されることとなる。   In this case, the input module 101 in the character check device 10 acquires the image data of the nameplate sticker 2001. At this time, as the input module 101, a scanner or a camera may be used. The acquired image data is converted into a recognized character string 402 via the extraction module 102 and the recognition module 130 and is used for checking in the evaluation module 201.

また、文字チェック装置10は、図7に示す部品3001に表示される文字をチェックすることもできる。ここで、部品3001には、図6に示した銘板シール200が貼り付けられている。   Moreover, the character check apparatus 10 can also check the character displayed on the component 3001 shown in FIG. Here, the nameplate seal 200 shown in FIG. 6 is affixed to the component 3001.

部品3001の画像データの取得に際しては、入力モジュール101としてカメラを用い、カメラを部品3001の上面にセットすれば良い。取得された画像データは、抽出モジュール102及び認識モジュール130を経由して認識文字列402に変換され、評価モジュール201でのチェックに供されることとなる。   When acquiring the image data of the component 3001, a camera may be used as the input module 101, and the camera may be set on the upper surface of the component 3001. The acquired image data is converted into a recognized character string 402 via the extraction module 102 and the recognition module 130 and is used for checking in the evaluation module 201.

但し、銘板シール2001と部品3001とでは原点が異なるので、文字列の開始座標(抽出モジュール102において文字列領域の切り出しを開始する座標)を適宜変更すると良い。原点は、銘板シール2001の左上、及び部品3001の左上の各々に設定する。   However, since the origin is different between the nameplate seal 2001 and the part 3001, the start coordinates of the character string (the coordinates at which the extraction module 102 starts to cut out the character string area) may be changed as appropriate. The origin is set at each of the upper left of the nameplate seal 2001 and the upper left of the part 3001.

[実施の形態2]
図8に示すように、本実施の形態に係る文字チェック装置10aは、チェック部200が正解データモジュール203を更に含み、評価モジュール201がこの正解データモジュール203に記憶されるデータ(以下、正解データ)も参照して文字チェックを行う点で、上記の実施の形態1と異なる。
[Embodiment 2]
As shown in FIG. 8, in the character check device 10a according to the present embodiment, the check unit 200 further includes a correct answer data module 203, and the evaluation module 201 stores data (hereinafter referred to as correct answer data) stored in the correct answer data module 203. ) Is also referred to and a character check is performed, which is different from the first embodiment.

ここで、図9に示すように、正解データ601には、文字列401(i)の開始座標(Xi、Yi)と、チェック対象物に表示されているべき正解の文字列cij(j=1〜m)とがセットとして記憶される。この内、開始座標(Xi、Yi)は、図8に点線で示す如く、抽出モジュール102での文字列領域の切り出しに用いると好適である。この場合、抽出モジュール102は、チェック対象物のどこにチェックすべき文字列が存在するかを容易に特定でき、以て切り出しに係る処理の効率化を図ることができる。一方、文字列cijは、評価モジュール201によって、認識文字列402(i)との比較に供される。   Here, as shown in FIG. 9, the correct answer data 601 includes the start coordinates (Xi, Yi) of the character string 401 (i) and the correct character string cij (j = 1) to be displayed on the check target. ~ M) are stored as a set. Among these, the start coordinates (Xi, Yi) are preferably used for cutting out a character string region in the extraction module 102 as indicated by a dotted line in FIG. In this case, the extraction module 102 can easily identify where the character string to be checked exists in the check target, and thus can increase the efficiency of the processing related to the clipping. On the other hand, the character string cij is used for comparison with the recognized character string 402 (i) by the evaluation module 201.

なお、文字列cij中の各文字は、図4に示した字種pk(k=1,K)のいずれかであり、下記の式に示す条件を満たすものとする。
cij∈{pk|k=1,K}
Each character in the character string cij is one of the character types pk (k = 1, K) shown in FIG.
cijε {pk | k = 1, K}

図10に示すように、本実施の形態の動作は、図2に示した上記のステップS1〜S7に加えて、ステップS8〜S10の処理が実行される点で、上記の実施の形態1と異なる。   As shown in FIG. 10, the operation of the present embodiment is the same as that of the first embodiment in that the processing of steps S8 to S10 is executed in addition to the steps S1 to S7 shown in FIG. Different.

具体的には、文字チェック装置10a内の評価モジュール201は、上記のステップS4で認識モジュール103から入力された認識文字列402(i)を、正解データ601中の文字列cijと比較する(ステップS8)。   Specifically, the evaluation module 201 in the character check device 10a compares the recognized character string 402 (i) input from the recognition module 103 in the above step S4 with the character string cij in the correct answer data 601 (step S4). S8).

この結果、認識文字列402(i)と文字列cijとが一致していない場合(ステップS9)、評価モジュール201は、表示部300に、一致していない文字を表示させる(ステップS10)。そして、評価モジュール201は、上記のステップS5へ進む。なお、認識文字列402(i)と文字列cijとが一致した場合、評価モジュール201は、上記のステップS10をスキップして、上記のステップS5へ進む。   As a result, when the recognized character string 402 (i) and the character string cij do not match (step S9), the evaluation module 201 causes the display unit 300 to display characters that do not match (step S10). Then, the evaluation module 201 proceeds to step S5 described above. If the recognized character string 402 (i) matches the character string cij, the evaluation module 201 skips step S10 and proceeds to step S5.

今、図3に示した第1版図面1001の認識結果を用いて、正解データ601を作成したとする。また、図11に示す改版後の第2版図面1002を、文字チェック装置10aによるチェック対象物とする。ここで、図11に示すように、第2版図面1002においては、部品の高さが"○○○"から"○○●"へ変更されている。さらに、第2版図面1002では、2行目の文字列として"XY2"が印刷され、誤植が発生しているとする。   Now, it is assumed that correct data 601 is created using the recognition result of the first version drawing 1001 shown in FIG. Further, the second edition drawing 1002 after the revision shown in FIG. 11 is set as an object to be checked by the character check device 10a. Here, as shown in FIG. 11, in the second edition drawing 1002, the height of the part is changed from “XXX” to “XXX”. Furthermore, in the second edition drawing 1002, it is assumed that “XY2” is printed as the character string on the second line and a typographical error has occurred.

認識モジュール103での正常認識によって認識文字列402(2)="XY2"が得られた場合、評価モジュール201は、この認識文字列402(2)と正解データ601中の文字列"XYZ"との不一致を検出する。よって、評価モジュール201は、不一致文字"2"の表示を行う。   When the recognized character string 402 (2) = “XY2” is obtained by normal recognition in the recognition module 103, the evaluation module 201 determines that the recognized character string 402 (2) and the character string “XYZ” in the correct answer data 601 are Detect mismatch of. Therefore, the evaluation module 201 displays the mismatch character “2”.

一方、認識モジュール103での誤認識によって認識文字列402(2)="XYZ"が得られた場合、評価モジュール201は、この認識文字列402(2)と正解データ601中の文字列"XYZ"との一致を検出する。しかしながら、類似文字情報モジュール202に文字"Z"の類似文字として文字"2"が登録されていれば、評価モジュール201は、『"Z"を確認せよ』とのメッセージの表示を行い、以てチェック者へ確認を促すことができる。   On the other hand, when the recognition character string 402 (2) = “XYZ” is obtained due to misrecognition by the recognition module 103, the evaluation module 201 determines that the recognition character string 402 (2) and the character string “XYZ” in the correct answer data 601. Detects a match with ". However, if the character “2” is registered as the similar character of the character “Z” in the similar character information module 202, the evaluation module 201 displays a message “Confirm“ Z ””, thereby The checker can be prompted for confirmation.

このように、本実施の形態においては、上記の実施の形態1に示した効果に加え、チェック者に対しチェック対象物に表示された文字の正誤を報告できるという更なる効果が得られる。   As described above, in this embodiment, in addition to the effect shown in the above-described first embodiment, a further effect that the correctness of the characters displayed on the check target can be reported to the checker is obtained.

なお、上記の実施の形態によって本発明は限定されるものではなく、特許請求の範囲の記載に基づき、当業者によって種々の変更が可能なことは明らかである。   Note that the present invention is not limited to the above-described embodiments, and it is apparent that various modifications can be made by those skilled in the art based on the description of the scope of the claims.

例えば、上記の実施の形態に示した文字チェック装置の各処理を、コンピュータに実行させるためのプログラムとして提供することもできる。この場合、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。ここで、非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されても良い。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。   For example, each process of the character check apparatus shown in the above embodiment can be provided as a program for causing a computer to execute the processes. In this case, the program can be stored and provided to a computer using various types of non-transitory computer readable media. Here, the non-transitory computer readable medium includes various types of tangible storage media. Examples of non-transitory computer-readable media include magnetic recording media (for example, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (for example, magneto-optical disks), CD-ROMs (Read Only Memory), CD- R, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (Random Access Memory)). The program may be supplied to the computer by various types of transitory computer readable media. Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.

本発明は、文字チェック装置、方法及びプログラムに適用でき、特にCADによる図面作成時に入力する文字データの誤りを低コストで検出する用途に適用できる。また、本発明は、図面に限らず、製品に印字又は刻印された文字の誤植の検出や、図面の改版前後での文字列情報の比較等の種々の用途に適用できる。   The present invention can be applied to a character check apparatus, method, and program, and in particular, can be applied to an application for detecting an error in character data input at the time of drawing creation by CAD at low cost. Further, the present invention is not limited to drawings, and can be applied to various uses such as detection of typographical errors of characters printed or stamped on a product, comparison of character string information before and after revision of a drawing, and the like.

上記の実施の形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。   A part or all of the above embodiment can be described as in the following supplementary notes, but is not limited thereto.

(付記1)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する認識手段と、
前記認識された文字をチェックするチェック手段と、
前記チェックの結果を表示する表示手段と、を備え、
前記チェック手段は、
前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる、
文字チェック装置。
(Appendix 1)
Recognizing means for optically acquiring the image data of the check object and recognizing characters included in the image data;
Checking means for checking the recognized character;
Display means for displaying the result of the check,
The checking means includes
Each character type that can be recognized by the recognition means and its similar characters are stored in association with each other,
Causing the display means to display information on similar characters corresponding to the recognized characters as a result of the check;
Character check device.

(付記2)
付記1において、
前記チェック手段は、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記表示手段に、前記認識された文字に対応する複数の類似文字に関する情報を表示させる、
ことを特徴とした文字チェック装置。
(Appendix 2)
In Appendix 1,
The checking means includes
For each character type, memorize multiple similar characters with different similarity,
Causing the display means to display information on a plurality of similar characters corresponding to the recognized character;
Character check device characterized by that.

(付記3)
付記1又は2において、
前記チェック手段は、前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック装置。
(Appendix 3)
In Appendix 1 or 2,
The checking means determines each similar character by using an average pattern between the same character types belonging to a plurality of types of fonts in the storage.
Character check device characterized by that.

(付記4)
付記1〜3のいずれか一つにおいて、
前記チェック手段は、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を、前記表示手段に更に表示させる、
ことを特徴とした文字チェック装置。
(Appendix 4)
In any one of appendices 1-3,
The checking means includes
Referring to the information about the character displayed on the check object, determine the correctness of the recognized character,
As a result of the determination, the character determined to be erroneous is further displayed on the display means.
Character check device characterized by that.

(付記5)
付記1〜4のいずれか一つにおいて、
前記チェック手段は、自装置外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック装置。
(Appendix 5)
In any one of appendices 1-4
The checking means updates each similar character in accordance with an instruction from the outside of the device.
Character check device characterized by that.

(付記6)
付記1〜5のいずれか一つにおいて、
前記チェック対象物は、印刷された図面、又は前記図面に則して製造された物品である、
ことを特徴とした文字チェック装置。
(Appendix 6)
In any one of appendices 1-5,
The check object is a printed drawing or an article manufactured according to the drawing.
Character check device characterized by that.

(付記7)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能な装置における文字チェック方法であって、
認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記認識された文字に対応する類似文字に関する情報を表示する、
ことを含む文字チェック方法。
(Appendix 7)
A character check method in an apparatus capable of optically acquiring image data of a check object and recognizing characters included in the image data,
Each character type that can be recognized and its similar characters are stored in association with each other,
Displaying information about similar characters corresponding to the recognized characters;
Character check method including that.

(付記8)
付記7において、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記認識された文字に対応する複数の類似文字に関する情報を表示する、
ことを特徴とした文字チェック方法。
(Appendix 8)
In Appendix 7,
For each character type, memorize multiple similar characters with different similarity,
Displaying information about a plurality of similar characters corresponding to the recognized characters;
Character check method characterized by that.

(付記9)
付記7又は8において、
前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック方法。
(Appendix 9)
In Appendix 7 or 8,
In the storage, each similar character is determined using an average pattern between the same character type belonging to a plurality of types of fonts.
Character check method characterized by that.

(付記10)
付記7〜9のいずれか一つにおいて、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を表示する、
ことを更に含む文字チェック方法。
(Appendix 10)
In any one of appendices 7-9,
Referring to the information about the character displayed on the check object, determine the correctness of the recognized character,
As a result of the determination, a character determined to be erroneous is displayed.
A character check method further including:

(付記11)
付記7〜10のいずれか一つにおいて、
前記装置の外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック方法。
(Appendix 11)
In any one of appendices 7-10,
Updating each similar character according to an instruction from the outside of the device;
Character check method characterized by that.

(付記12)
付記7〜11のいずれか一つにおいて、
前記チェック対象物として、印刷された図面、又は前記図面に則して製造された物品を用いる、
ことを特徴とした文字チェック方法。
(Appendix 12)
In any one of appendices 7-11,
As the check target, a printed drawing or an article manufactured according to the drawing is used.
Character check method characterized by that.

(付記13)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能なコンピュータに、
認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、
前記認識された文字に対応する類似文字に関する情報を表示する処理と、
を実行させるための文字チェックプログラム。
(Appendix 13)
A computer capable of optically acquiring image data of a check target and recognizing characters included in the image data,
A process of storing each character type that can be recognized and its similar characters in association with each other;
Processing for displaying information on similar characters corresponding to the recognized characters;
Character check program for running

10, 10a 文字チェック装置
100 認識部
101 入力モジュール
102 抽出モジュール
103 認識モジュール
104 認識辞書モジュール
200 チェック部
201 評価モジュール
202 類似文字情報モジュール
203 正解データモジュール
300 表示部
401 文字列
402 認識文字列
501 類似文字情報
502 類似度マトリクス
601 正解データ
1001, 1002 図面
2001 銘板シール
3001 部品
DESCRIPTION OF SYMBOLS 10, 10a Character check apparatus 100 Recognition part 101 Input module 102 Extraction module 103 Recognition module 104 Recognition dictionary module 200 Check part 201 Evaluation module 202 Similar character information module 203 Correct data module 300 Display part 401 Character string 402 Recognition character string 501 Similar character Information 502 Similarity Matrix 601 Correct Data 1001, 1002 Drawing 2001 Nameplate Sticker 3001 Parts

Claims (10)

チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する認識手段と、
前記認識された文字をチェックするチェック手段と、
前記チェックの結果を表示する表示手段と、を備え、
前記チェック手段は、
前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる、
文字チェック装置。
Recognizing means for optically acquiring the image data of the check object and recognizing characters included in the image data;
Checking means for checking the recognized character;
Display means for displaying the result of the check,
The checking means includes
Each character type that can be recognized by the recognition means and its similar characters are stored in association with each other,
Causing the display means to display information on similar characters corresponding to the recognized characters as a result of the check;
Character check device.
請求項1において、
前記チェック手段は、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記表示手段に、前記認識された文字に対応する複数の類似文字に関する情報を表示させる、
ことを特徴とした文字チェック装置。
In claim 1,
The checking means includes
For each character type, memorize multiple similar characters with different similarity,
Causing the display means to display information on a plurality of similar characters corresponding to the recognized character;
Character check device characterized by that.
請求項1又は2において、
前記チェック手段は、前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック装置。
In claim 1 or 2,
The checking means determines each similar character by using an average pattern between the same character types belonging to a plurality of types of fonts in the storage.
Character check device characterized by that.
請求項1〜3のいずれか一項において、
前記チェック手段は、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を、前記表示手段に更に表示させる、
ことを特徴とした文字チェック装置。
In any one of Claims 1-3,
The checking means includes
Referring to the information about the character displayed on the check object, determine the correctness of the recognized character,
As a result of the determination, the character determined to be erroneous is further displayed on the display means.
Character check device characterized by that.
請求項1〜4のいずれか一項において、
前記チェック手段は、自装置外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック装置。
In any one of Claims 1-4,
The checking means updates each similar character in accordance with an instruction from the outside of the device.
Character check device characterized by that.
請求項1〜5のいずれか一項において、
前記チェック対象物は、印刷された図面、又は前記図面に則して製造された物品である、
ことを特徴とした文字チェック装置。
In any one of Claims 1-5,
The check object is a printed drawing or an article manufactured according to the drawing.
Character check device characterized by that.
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能な装置における文字チェック方法であって、
認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記認識された文字に対応する類似文字に関する情報を表示する、
ことを含む文字チェック方法。
A character check method in an apparatus capable of optically acquiring image data of a check object and recognizing characters included in the image data,
Each character type that can be recognized and its similar characters are stored in association with each other,
Displaying information about similar characters corresponding to the recognized characters;
Character check method including that.
請求項7において、
前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック方法。
In claim 7,
In the storage, each similar character is determined using an average pattern between the same character type belonging to a plurality of types of fonts.
Character check method characterized by that.
請求項7又は8において、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を表示する、
ことを更に含む文字チェック方法。
In claim 7 or 8,
Referring to the information about the character displayed on the check object, determine the correctness of the recognized character,
As a result of the determination, a character determined to be erroneous is displayed.
A character check method further including:
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能なコンピュータに、
認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、
前記認識された文字に対応する類似文字に関する情報を表示する処理と、
を実行させるための文字チェックプログラム。
A computer capable of optically acquiring image data of a check target and recognizing characters included in the image data,
A process of storing each character type that can be recognized and its similar characters in association with each other;
Processing for displaying information on similar characters corresponding to the recognized characters;
Character check program for running
JP2011142621A 2011-06-28 2011-06-28 Character checking device, method, and program Pending JP2013011932A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011142621A JP2013011932A (en) 2011-06-28 2011-06-28 Character checking device, method, and program
PCT/JP2012/004079 WO2013001774A1 (en) 2011-06-28 2012-06-22 Character checking device, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011142621A JP2013011932A (en) 2011-06-28 2011-06-28 Character checking device, method, and program

Publications (1)

Publication Number Publication Date
JP2013011932A true JP2013011932A (en) 2013-01-17

Family

ID=47423696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011142621A Pending JP2013011932A (en) 2011-06-28 2011-06-28 Character checking device, method, and program

Country Status (2)

Country Link
JP (1) JP2013011932A (en)
WO (1) WO2013001774A1 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0424779A (en) * 1990-05-15 1992-01-28 Canon Inc Character recognition device
JPH05108872A (en) * 1991-10-18 1993-04-30 Canon Inc Method and device for character recognition
JPH0816728A (en) * 1994-06-28 1996-01-19 Canon Inc Character recognition device and method
JPH08202811A (en) * 1995-01-25 1996-08-09 Oki Electric Ind Co Ltd Character reader
JPH09190505A (en) * 1996-01-12 1997-07-22 Canon Inc Device for recognizing character and its method
JPH1021325A (en) * 1996-06-28 1998-01-23 Baazu Joho Kagaku Kenkyusho:Kk Method for recognizing character
JP2006252575A (en) * 2006-04-14 2006-09-21 Katsuyoshi Nagashima Financial statement automatic input apparatus and method therefore

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1021327A (en) * 1996-06-28 1998-01-23 Toshiba Corp On-line handwritten character input device and method for informing of recognition candidate

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0424779A (en) * 1990-05-15 1992-01-28 Canon Inc Character recognition device
JPH05108872A (en) * 1991-10-18 1993-04-30 Canon Inc Method and device for character recognition
JPH0816728A (en) * 1994-06-28 1996-01-19 Canon Inc Character recognition device and method
JPH08202811A (en) * 1995-01-25 1996-08-09 Oki Electric Ind Co Ltd Character reader
JPH09190505A (en) * 1996-01-12 1997-07-22 Canon Inc Device for recognizing character and its method
JPH1021325A (en) * 1996-06-28 1998-01-23 Baazu Joho Kagaku Kenkyusho:Kk Method for recognizing character
JP2006252575A (en) * 2006-04-14 2006-09-21 Katsuyoshi Nagashima Financial statement automatic input apparatus and method therefore

Also Published As

Publication number Publication date
WO2013001774A1 (en) 2013-01-03

Similar Documents

Publication Publication Date Title
JP6286866B2 (en) Image processing apparatus and image processing method
CN111325110A (en) Form format recovery method and device based on OCR and storage medium
US20090226090A1 (en) Information processing system, information processing apparatus, information processing method, and storage medium
US20020041713A1 (en) Document search and retrieval apparatus, recording medium and program
US9934429B2 (en) Storage medium, recognition method, and recognition apparatus
JP6000992B2 (en) Document file generation apparatus and document file generation method
WO2007094078A1 (en) Character string search method and device thereof
JP5538812B2 (en) Image processing apparatus, image processing method, and program
Bhagvati et al. On developing high accuracy OCR systems for Telugu and other Indian scripts
US11593591B2 (en) Optical character recognition systems and methods
JP6432179B2 (en) Document file generation apparatus and document file generation method
Naz et al. Arabic script based character segmentation: a review
WO2013001774A1 (en) Character checking device, method, and program
JP2011076390A (en) Device, method and program for recognizing mark item
JP5712415B2 (en) Form processing system and form processing method
US10657404B2 (en) Character recognition device, character recognition method, and character recognition program
JP4194020B2 (en) Character recognition method, program used for executing the method, and character recognition apparatus
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP6118646B2 (en) Form processing device, form processing method, form processing program
US9047535B2 (en) Image processing apparatus, image processing method, and computer readable medium
JP2004005761A (en) Keyword extraction/search system
JP3812719B2 (en) Document search device
SE528063C2 (en) Method and apparatus for segmentation-based recognition
KR102605381B1 (en) System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications
JP5669044B2 (en) Document verification system and document verification method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130326

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130723