JP2013011932A - Character checking device, method, and program - Google Patents
Character checking device, method, and program Download PDFInfo
- Publication number
- JP2013011932A JP2013011932A JP2011142621A JP2011142621A JP2013011932A JP 2013011932 A JP2013011932 A JP 2013011932A JP 2011142621 A JP2011142621 A JP 2011142621A JP 2011142621 A JP2011142621 A JP 2011142621A JP 2013011932 A JP2013011932 A JP 2013011932A
- Authority
- JP
- Japan
- Prior art keywords
- character
- check
- characters
- recognized
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
Abstract
Description
本発明は、文字チェック装置、方法及びプログラムに関し、特に図面等に表示された文字をチェックする技術に関する。 The present invention relates to a character check apparatus, method, and program, and more particularly, to a technique for checking characters displayed in drawings and the like.
ものづくりにおいては、設計図面がベースになっている。近年、設計図面は、CAD(Computer Aimed Design)を利用して作成されるようになっている。CADを利用するメリットとしては、例えば、寸法の入力ミスがあっても、CADが図面の矛盾をチェックして指摘し、以て図面の再作成や製品の作り直しを低減できる点等が挙げられる。 In manufacturing, design drawings are the basis. In recent years, design drawings have been created using CAD (Computer Aimed Design). As an advantage of using CAD, for example, even if there is a dimensional input error, CAD can check and point out a contradiction in the drawing, thereby reducing the re-creation of the drawing and the re-creation of the product.
一方、製品に印刷する文字やロゴについては、その誤りを自動的に検出することは困難である。これは、製品に印刷する文字やロゴに関する情報がCADには入力されておらず、CADでは文字やロゴの正誤を判定できないためである。文字やロゴに関する情報は、図面を作成するための仕様として、別の文書上に存在するのが一般的である。CADによる自動チェックができないため、文字やロゴは、設計者或いは責任者自身の目視作業によってチェックされている。 On the other hand, it is difficult to automatically detect errors in characters and logos printed on products. This is because information on characters and logos to be printed on the product is not input to the CAD, and the correctness of the characters and logo cannot be determined by the CAD. Information on characters and logos is generally present on another document as a specification for creating a drawing. Since automatic check by CAD is not possible, characters and logos are checked by the visual work of the designer or the person in charge.
図面上の文字やロゴのチェックを人手で行うため、万一、文字やロゴに誤りがあり且つそれを発見できない場合、図面は、誤りを含んだ状態で製造プロセスに渡ってしまう。この結果、文字の誤りやロゴの誤りを含んだ製品が生産されてしまうことになる。例えば、キーボードの「ひらがな」キーを「ひながな」として製作してしまうこと等がある。このような問題は、チェック者が母国語の文字をチェックしても発生するので、チェック者或いは図面設計者が母国語でない文字をチェックする場合にはさらに顕著に現れる。 Since the characters and logos on the drawings are manually checked, if the characters or logos are incorrect and cannot be found, the drawings are transferred to the manufacturing process with errors. As a result, a product including a letter error or a logo error is produced. For example, the “Hiragana” key of the keyboard may be manufactured as “Hiragana”. Such a problem occurs even when the checker checks characters in the native language, so that the problem appears more prominently when the checker or drawing designer checks characters that are not in the native language.
人手による文字チェックを行う場合、チェックミスを完全に防ぐためには、非常に多くのコストを必要とする。具体的には、チェック者を複数にしてチェックを多重化する方法が考えられるが、その分、チェックに要するコストが単純増大してしまう。 When performing a manual character check, a very large cost is required to completely prevent a check error. Specifically, there can be a method of multiplexing the check with a plurality of checkers, but the cost required for the check simply increases accordingly.
この問題に対処するため、前述の別文書をコンピュータで編集可能なデータとして作成し、CAD内の文字データと電子的に照合する対策が考えられる。しかしながら、この対策は得策で無い。その理由は、例え電子的な照合で文字コードが一致しても、CADデータを図面としてプリンタなどで印刷する際に、意図していない文字が印刷される「文字化け」や印字位置のずれが発生する虞があるためである。 In order to cope with this problem, it is conceivable to prepare the above-mentioned separate document as data editable by a computer and electronically collate it with character data in CAD. However, this measure is not a good idea. The reason for this is that even if the character codes are matched by electronic verification, when printing CAD data as a drawing with a printer or the like, unintended characters are printed, or the print position is misaligned. This is because it may occur.
そこで、誌面等の文字を自動的に読み取る光学的文字読み取り装置(OCR:Optical Character Reader)を活用する対策が考えられる。具体的には、OCRにCADデータを印刷した図面上の文字記載箇所を読み取らせ、前述の別文書の記載事項と照合することで誤植を検出する。このようにOCRを利用して文字チェックを行う方法は、例えば特許文献1に記載されている。
Therefore, a countermeasure using an optical character reader (OCR: Optical Character Reader) that automatically reads characters such as magazines can be considered. Specifically, the typographical error is detected by causing the OCR to read the character description location on the drawing on which the CAD data is printed, and collating it with the description items of the other document. A method for checking characters using OCR in this way is described in
しかしながら、本願発明者は、OCRを用いた文字チェックには、その精度が低いという課題があることを発見した。 However, the inventor of the present application has found that the character check using OCR has a problem that its accuracy is low.
具体的には、OCRでは、入力画像に含まれる文字を100%の精度で認識することが困難である。例えば、数字の「1」を英字の「I」と誤って認識するケースや、漢字の「網」を「綱」と誤って認識するケース等が存在する。このため、照合結果が"一致"を示す場合であっても、これを必ずしも信用できない。より詳細には、或る文字列の1番目が数字の「1」であると前述の別文書に登録され、且つOCRによる当該文字の認識結果が「1」である場合であっても、実際の図面上には英字の「I」が印字されている可能性がある。この場合、誤植を何ら検出できないことから、前述のような文字チェックにはOCRは適さないと考えられる。 Specifically, in OCR, it is difficult to recognize characters included in an input image with 100% accuracy. For example, there are cases where the number “1” is mistakenly recognized as the English letter “I”, and the Chinese character “net” is mistakenly recognized as “tuna”. For this reason, even if the collation result indicates “match”, this cannot always be trusted. More specifically, even if the first character string is registered in the above-mentioned separate document as the number “1” and the recognition result of the character by OCR is “1”, it is actually There is a possibility that the letter “I” is printed on the drawing. In this case, since no typographical errors can be detected, it is considered that OCR is not suitable for the character check as described above.
本発明は、上記の課題に鑑みてなされたものであり、その目的は、図面等に表示された文字を、より高精度且つ低コストでチェックすることにある。 The present invention has been made in view of the above problems, and an object of the present invention is to check characters displayed on a drawing or the like with higher accuracy and lower cost.
上記の目的を達成するため、本発明の第1の態様に係る文字チェック装置は、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する認識手段と、前記認識された文字をチェックするチェック手段と、前記チェックの結果を表示する表示手段とを備える。前記チェック手段は、前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる。 In order to achieve the above object, the character check device according to the first aspect of the present invention optically obtains image data of a check target, and recognizes a character included in the image data; Check means for checking the recognized character and display means for displaying the result of the check. The checking means stores each character type that can be recognized by the recognizing means and the similar characters in association with each other, and stores information on the similar characters corresponding to the recognized characters on the display means. Display as a result.
また、本発明の第2の態様に係る文字チェック方法は、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能な装置における文字チェック方法を提供する。この方法は、認識され得る字種各々と、その類似文字とを対応付けて記憶し、前記認識された文字に対応する類似文字に関する情報を表示することを含む。 The character check method according to the second aspect of the present invention provides a character check method in an apparatus capable of optically acquiring image data of a check target and recognizing characters included in the image data. The method includes storing each character type that can be recognized and the similar character in association with each other, and displaying information related to the similar character corresponding to the recognized character.
さらに、本発明の第3の態様に係る文字チェックプログラムは、チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能なコンピュータに、認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、前記認識された文字に対応する類似文字に関する情報を表示する処理とを実行させる。 Furthermore, the character check program according to the third aspect of the present invention is a computer program that optically acquires image data of a check target and that can be recognized by a computer that can recognize characters included in the image data. And a process of storing the similar character in association with each other and a process of displaying information on the similar character corresponding to the recognized character.
本発明によれば、図面等に表示された文字を、より高精度且つ低コストでチェックすることが可能である。 According to the present invention, it is possible to check characters displayed on a drawing or the like with higher accuracy and lower cost.
以下、本発明に係る文字チェック装置の実施の形態1及び2を、図1〜図11を参照して説明する。なお、各図面において、同一要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略される。
[実施の形態1]
図1に示すように、本実施の形態に係る文字チェック装置10は、認識部100と、チェック部200と、表示部300とを含む。
[Embodiment 1]
As shown in FIG. 1, the
この内、認識部100は、入力モジュール101と、抽出モジュール102と、認識モジュール103と、認識辞書モジュール104とを含む。入力モジュール101は、印刷された図面をスキャンして画像データへ変換する。抽出モジュール102は、画像データから文字列領域を抽出する。認識モジュール103は、抽出された文字列領域に相当する画像に対して文字認識を行う。認識辞書モジュール104は、認識モジュール103によって認識され得る字種各々に対する標準を記憶する。この標準は、認識モジュール103での文字認識に際して参照される。
Among these, the
また、チェック部200は、評価モジュール201と、類似文字情報モジュール202とを含む。評価モジュール201は、認識モジュール103によって認識された文字をチェックすると共に、その結果を表示部300に表示させる。類似文字情報モジュール202は、認識モジュール103によって認識され得る字種各々と、その類似文字とを対応付けて記憶する。認識モジュール103によって認識された文字に対応する類似文字は、表示部300での表示に供される。
The
なお、表示部300は、例えば、ディスプレイ及びそのコントローラによって構成できる。また、文字チェック装置10は、スキャナが接続され、且つ入力部、処理部、記憶部、及び出力部を有する一般的なコンピュータで実現可能である。
In addition, the
次に、本実施の形態の動作を、図2〜図7を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to FIGS.
図2に示すように、まず文字チェック装置10には、チェックすべき文字列の数"n"(nは任意の自然数)が入力される(ステップS1)。今、図3に示す図面1001がチェック対象物であるとする。この場合、図面1001上には3行の文字列が存在するため、チェック数n="3"が入力される。
As shown in FIG. 2, first, the number “n” (n is an arbitrary natural number) of character strings to be checked is input to the character check device 10 (step S1). Assume that a
この時、文字チェック装置10は、文字列のチェックに用いるローカル変数iを"1"に初期化する(ステップS2)。ここで、変数iの値は、"i"番目("i"行目)の文字列がチェックされることを意味する。
At this time, the
変数i≠チェック数n(図3の例では"3")が成立する間(ステップS3)、文字チェック装置10は、以降のステップS4〜S7を繰り返し実行する。
While the variable i ≠ the number of checks n (“3” in the example of FIG. 3) is established (step S3), the
具体的には、認識部100内の入力モジュール101は、図面1001をスキャンして画像データを取得し、抽出モジュール102へ出力する。抽出モジュール102は、画像データから文字列に相当する領域を切り出す。より詳細には、抽出モジュール102は、画像データに対して、Y軸(図面1001の左上を原点とする垂直方向)に対する投影プロファイルより、各文字列のY方向分離を行う。続いて、抽出モジュール102は、各文字列のY軸方向の存在範囲に対し、X軸(図面1001の左上を原点とする水平方向)に対する投影プロファイルを用いて文字列の終点を求め、以て各文字列に対応する画像を切り出す。
Specifically, the
この結果、図3に示す座標(X1、Y1)を開始座標として、1番目の文字列401(1)="ABCDEF"を囲む外接矩形に対応する画像が切り出される。同様に、座標(X2、Y2)を開始座標として、2番目の文字列401(2)="XYZ"を囲む外接矩形に対応する画像が切り出され、座標(X3、Y3)を開始座標として、3番目の文字列401(3)="□□株式会社"を囲む外接矩形に対応する画像が切り出される。抽出モジュール102は、切り出した画像を、認識モジュール103へ順次出力する。
As a result, an image corresponding to the circumscribed rectangle surrounding the first character string 401 (1) = “ABCDEF” is cut out with the coordinates (X1, Y1) shown in FIG. 3 as the start coordinates. Similarly, an image corresponding to a circumscribed rectangle surrounding the second character string 401 (2) = “XYZ” is cut out with the coordinates (X2, Y2) as the start coordinates, and the coordinates (X3, Y3) as the start coordinates, The image corresponding to the circumscribed rectangle surrounding the third character string 401 (3) = “□□ Corporation” is cut out. The
認識モジュール103は、まず文字列401(1)="ABCDEF"に対応する画像に対して、文字認識を行う(ステップS4)。より詳細には、認識モジュール103は、認識辞書モジュール104に記憶されている各字種の特徴データを参照して認識を行う。設計図面の場合は使用されるフォントが既知であるので、各字種の画像そのものを認識辞書モジュール104へ格納し、パタンの重ね合わせにより類似度若しくは距離値を計算し、どの字種であるかを判定すれば良い。或いは、「澤他:こう配特徴ベクトルと変動吸収共分散行列による手書き漢字認識の高精度化、電子情報通信学会論文誌D ,Vol.J84−D2,No.11,pp.2387−2397, 2001」に記載される特徴量を用いても良い。この場合、認識辞書モジュール104には、各字種のパタンに代えて特徴量を格納しておく。なお、文字列画像を1文字毎に分離するには、よく知られているように、文字列方向への投影プロファイルの谷を用いれば良い。
The
そして、認識モジュール103は、文字認識によって得た文字列402(i)を、チェック部200内の評価モジュール201へ出力する。なお、以降の説明においては、文字認識によって得た文字列402を、"認識文字列"と呼称し、認識対象の文字列401と区別する。
Then, the
評価モジュール201は、類似文字情報モジュール202を参照し、認識文字列402(1)中に認識モジュール103が認識を誤る可能性のある類似文字が存在するか否かを判定する(ステップS5)。
The
今、認識文字列402(1)="ABCDEF"が入力され、且つ類似文字情報モジュール202に、文字"C"の類似文字として文字"G"が登録されているとする。この場合、評価モジュール201は、表示部300に、『"C"を確認せよ』とのメッセージを認識文字列402(1)と共に表示させる(ステップS6)。
Assume that the recognized character string 402 (1) = “ABCDEF” is input and the character “G” is registered in the similar
この後、文字チェック装置10は、変数iをインクリメントして(ステップS7)、上記のステップS3へ戻り、以て変数i=チェック数nが成立する迄、上記のステップS4〜S6を繰り返し実行する。これにより、文字列401(2)="XYZ"及び文字列401(3)="□□株式会社"に対する文字認識、並びに類似文字に関するメッセージの表示が行われることとなる。
Thereafter, the
このように、本実施の形態においては、OCRによって誤認識されている可能性のある文字を表示し(換言すると、誤植であり得る文字を検出し)、以て上述したOCRを用いた文字チェックにおける欠点を改善している。また、文字チェック自体は機械的に行われるため、複数のチェック者による作業は不要である。従って、本実施の形態によれば、図面に表示された文字を、従来と比して高精度且つ低コストでチェックすることができる。 As described above, in this embodiment, characters that may be erroneously recognized by OCR are displayed (in other words, characters that may be typographical errors are detected), and thus the above-described character check using OCR is performed. Has improved the shortcomings. Further, since the character check itself is performed mechanically, work by a plurality of checkers is not necessary. Therefore, according to the present embodiment, it is possible to check the characters displayed in the drawing with higher accuracy and lower cost than in the past.
次に、類似文字情報モジュール202に記憶される情報(以下、類似文字情報)の具体的な構成例及びその作成手順例を、図4及び図5を参照して説明する。 Next, a specific configuration example of information stored in the similar character information module 202 (hereinafter referred to as similar character information) and an example of a creation procedure thereof will be described with reference to FIGS.
図4に示すように、類似文字情報501には、認識対象となる"K"個の字種p1〜pKの各々に対して、各字種に類似している文字が類似性の高い順に対応付けて記憶されている。各字種の類似文字は最大で"K−1"字種存在し得るが、各字種の形状に応じて記憶すべき類似文字の数は変わってくる。類似文字情報モジュール202は、類似文字情報501の作成に際して類似度を類似性の尺度として用いる場合、所定の類似度以上の文字を類似度の降順に記憶すれば良く、距離値を類似性の尺度として用いる場合には、所定の距離値以下の文字を距離値の昇順に記憶すれば良い。
As shown in FIG. 4, in the
類似度を類似性の尺度として用いる場合、類似文字情報モジュール202は、図5に示す類似度マトリクス502を作成し、この類似度マトリクス502を用いて類似文字情報501を作成すれば良い。類似度マトリクス502には、字種p1〜pK同士間の類似度s11〜sKKが示されている。類似文字情報モジュール202は、縦、横K字種の組み合わせそれぞれに対して類似度を算出し、以て類似度マトリクス502を作成する。そして、類似文字情報モジュール202は、各字種に対して類似度が一定以上となる字種を類似度マトリクス502から検索すると共に、検索した字種を類似度の高い順に選択して各字種と対応付けて記憶し、以て類似文字情報501を作成する。
When using the similarity as a measure of similarity, the similar
一方、距離値が類似性の尺度として用いる場合、類似文字情報モジュール202は、各字種に対して距離値が一定以下となる字種を検索し、検索した字種を距離値の低い順に選択して各字種と対応付けて記憶すれば良い。
On the other hand, when the distance value is used as a measure of similarity, the similar
また、認識対象となる字種が複数種類の書体(複数のフォントや手書文字等)によって表現される場合、類似文字情報モジュール202は、字種間の類似度又は距離値の算出に際し、或る書体を代表パタンとして用いても良いし、字種毎に代表パタンを作成して用いても良い。或る書体を代表パタンとする場合、類似文字情報モジュール202は、類似度を類似性の尺度とするのであれば、比較している字種との類似度が最も高くなるパタンを用いれば良く、距離値を類似性の尺度とするのであれば、比較している字種との距離値が最も低くなるパタンを用いれば良い。一方、代表パタンを作成する場合、類似文字情報モジュール202は、各書体に属する同一字種同士間の平均パタンを作成する。この場合、認識対象となる字種の書体に依存せず、類似文字の表示を行うことができる。
In addition, when the character type to be recognized is expressed by a plurality of types of fonts (such as a plurality of fonts and handwritten characters), the similar
さらに、図4に示す如く類似文字情報501を構成した場合、評価モジュール201は、上記のステップS6にて、認識文字列402中の各文字に対応する複数の類似文字を表示対象として扱うと好適である。この場合、誤植が発見される確率を向上させることができる。
Furthermore, when the
なお、類似文字情報501は、静的に作成されるに限らず、文字チェック装置10の外部からの指示(例えば、文字チェック装置10に対するユーザ操作)に応じて動的に更新しても良い。この場合、類似文字の表示精度を調整すること等が可能となる。
Note that the
また、文字チェック装置10は、図3に示したような印字された図面に限らず、文字が直接印刷又は刻印された部品や製品等、他の種々の物品のチェックに適用可能である。
Further, the
例えば、文字チェック装置10は、図6に示す銘板シール2001に表示される文字をチェックすることができる。ここで、銘板シール2001は、図3に示した図面1001を元に製作したものである。
For example, the
この場合、文字チェック装置10内の入力モジュール101が、銘板シール2001の画像データを取得する。この時、入力モジュール101としては、スキャナを用いても良いし、カメラを用いても良い。取得された画像データは、抽出モジュール102及び認識モジュール130を経由して認識文字列402に変換され、評価モジュール201でのチェックに供されることとなる。
In this case, the
また、文字チェック装置10は、図7に示す部品3001に表示される文字をチェックすることもできる。ここで、部品3001には、図6に示した銘板シール200が貼り付けられている。
Moreover, the
部品3001の画像データの取得に際しては、入力モジュール101としてカメラを用い、カメラを部品3001の上面にセットすれば良い。取得された画像データは、抽出モジュール102及び認識モジュール130を経由して認識文字列402に変換され、評価モジュール201でのチェックに供されることとなる。
When acquiring the image data of the
但し、銘板シール2001と部品3001とでは原点が異なるので、文字列の開始座標(抽出モジュール102において文字列領域の切り出しを開始する座標)を適宜変更すると良い。原点は、銘板シール2001の左上、及び部品3001の左上の各々に設定する。
However, since the origin is different between the
[実施の形態2]
図8に示すように、本実施の形態に係る文字チェック装置10aは、チェック部200が正解データモジュール203を更に含み、評価モジュール201がこの正解データモジュール203に記憶されるデータ(以下、正解データ)も参照して文字チェックを行う点で、上記の実施の形態1と異なる。
[Embodiment 2]
As shown in FIG. 8, in the
ここで、図9に示すように、正解データ601には、文字列401(i)の開始座標(Xi、Yi)と、チェック対象物に表示されているべき正解の文字列cij(j=1〜m)とがセットとして記憶される。この内、開始座標(Xi、Yi)は、図8に点線で示す如く、抽出モジュール102での文字列領域の切り出しに用いると好適である。この場合、抽出モジュール102は、チェック対象物のどこにチェックすべき文字列が存在するかを容易に特定でき、以て切り出しに係る処理の効率化を図ることができる。一方、文字列cijは、評価モジュール201によって、認識文字列402(i)との比較に供される。
Here, as shown in FIG. 9, the
なお、文字列cij中の各文字は、図4に示した字種pk(k=1,K)のいずれかであり、下記の式に示す条件を満たすものとする。
cij∈{pk|k=1,K}
Each character in the character string cij is one of the character types pk (k = 1, K) shown in FIG.
cijε {pk | k = 1, K}
図10に示すように、本実施の形態の動作は、図2に示した上記のステップS1〜S7に加えて、ステップS8〜S10の処理が実行される点で、上記の実施の形態1と異なる。 As shown in FIG. 10, the operation of the present embodiment is the same as that of the first embodiment in that the processing of steps S8 to S10 is executed in addition to the steps S1 to S7 shown in FIG. Different.
具体的には、文字チェック装置10a内の評価モジュール201は、上記のステップS4で認識モジュール103から入力された認識文字列402(i)を、正解データ601中の文字列cijと比較する(ステップS8)。
Specifically, the
この結果、認識文字列402(i)と文字列cijとが一致していない場合(ステップS9)、評価モジュール201は、表示部300に、一致していない文字を表示させる(ステップS10)。そして、評価モジュール201は、上記のステップS5へ進む。なお、認識文字列402(i)と文字列cijとが一致した場合、評価モジュール201は、上記のステップS10をスキップして、上記のステップS5へ進む。
As a result, when the recognized character string 402 (i) and the character string cij do not match (step S9), the
今、図3に示した第1版図面1001の認識結果を用いて、正解データ601を作成したとする。また、図11に示す改版後の第2版図面1002を、文字チェック装置10aによるチェック対象物とする。ここで、図11に示すように、第2版図面1002においては、部品の高さが"○○○"から"○○●"へ変更されている。さらに、第2版図面1002では、2行目の文字列として"XY2"が印刷され、誤植が発生しているとする。
Now, it is assumed that
認識モジュール103での正常認識によって認識文字列402(2)="XY2"が得られた場合、評価モジュール201は、この認識文字列402(2)と正解データ601中の文字列"XYZ"との不一致を検出する。よって、評価モジュール201は、不一致文字"2"の表示を行う。
When the recognized character string 402 (2) = “XY2” is obtained by normal recognition in the
一方、認識モジュール103での誤認識によって認識文字列402(2)="XYZ"が得られた場合、評価モジュール201は、この認識文字列402(2)と正解データ601中の文字列"XYZ"との一致を検出する。しかしながら、類似文字情報モジュール202に文字"Z"の類似文字として文字"2"が登録されていれば、評価モジュール201は、『"Z"を確認せよ』とのメッセージの表示を行い、以てチェック者へ確認を促すことができる。
On the other hand, when the recognition character string 402 (2) = “XYZ” is obtained due to misrecognition by the
このように、本実施の形態においては、上記の実施の形態1に示した効果に加え、チェック者に対しチェック対象物に表示された文字の正誤を報告できるという更なる効果が得られる。 As described above, in this embodiment, in addition to the effect shown in the above-described first embodiment, a further effect that the correctness of the characters displayed on the check target can be reported to the checker is obtained.
なお、上記の実施の形態によって本発明は限定されるものではなく、特許請求の範囲の記載に基づき、当業者によって種々の変更が可能なことは明らかである。 Note that the present invention is not limited to the above-described embodiments, and it is apparent that various modifications can be made by those skilled in the art based on the description of the scope of the claims.
例えば、上記の実施の形態に示した文字チェック装置の各処理を、コンピュータに実行させるためのプログラムとして提供することもできる。この場合、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。ここで、非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されても良い。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。 For example, each process of the character check apparatus shown in the above embodiment can be provided as a program for causing a computer to execute the processes. In this case, the program can be stored and provided to a computer using various types of non-transitory computer readable media. Here, the non-transitory computer readable medium includes various types of tangible storage media. Examples of non-transitory computer-readable media include magnetic recording media (for example, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (for example, magneto-optical disks), CD-ROMs (Read Only Memory), CD- R, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (Random Access Memory)). The program may be supplied to the computer by various types of transitory computer readable media. Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.
本発明は、文字チェック装置、方法及びプログラムに適用でき、特にCADによる図面作成時に入力する文字データの誤りを低コストで検出する用途に適用できる。また、本発明は、図面に限らず、製品に印字又は刻印された文字の誤植の検出や、図面の改版前後での文字列情報の比較等の種々の用途に適用できる。 The present invention can be applied to a character check apparatus, method, and program, and in particular, can be applied to an application for detecting an error in character data input at the time of drawing creation by CAD at low cost. Further, the present invention is not limited to drawings, and can be applied to various uses such as detection of typographical errors of characters printed or stamped on a product, comparison of character string information before and after revision of a drawing, and the like.
上記の実施の形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。 A part or all of the above embodiment can be described as in the following supplementary notes, but is not limited thereto.
(付記1)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識する認識手段と、
前記認識された文字をチェックするチェック手段と、
前記チェックの結果を表示する表示手段と、を備え、
前記チェック手段は、
前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる、
文字チェック装置。
(Appendix 1)
Recognizing means for optically acquiring the image data of the check object and recognizing characters included in the image data;
Checking means for checking the recognized character;
Display means for displaying the result of the check,
The checking means includes
Each character type that can be recognized by the recognition means and its similar characters are stored in association with each other,
Causing the display means to display information on similar characters corresponding to the recognized characters as a result of the check;
Character check device.
(付記2)
付記1において、
前記チェック手段は、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記表示手段に、前記認識された文字に対応する複数の類似文字に関する情報を表示させる、
ことを特徴とした文字チェック装置。
(Appendix 2)
In
The checking means includes
For each character type, memorize multiple similar characters with different similarity,
Causing the display means to display information on a plurality of similar characters corresponding to the recognized character;
Character check device characterized by that.
(付記3)
付記1又は2において、
前記チェック手段は、前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック装置。
(Appendix 3)
In
The checking means determines each similar character by using an average pattern between the same character types belonging to a plurality of types of fonts in the storage.
Character check device characterized by that.
(付記4)
付記1〜3のいずれか一つにおいて、
前記チェック手段は、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を、前記表示手段に更に表示させる、
ことを特徴とした文字チェック装置。
(Appendix 4)
In any one of appendices 1-3,
The checking means includes
Referring to the information about the character displayed on the check object, determine the correctness of the recognized character,
As a result of the determination, the character determined to be erroneous is further displayed on the display means.
Character check device characterized by that.
(付記5)
付記1〜4のいずれか一つにおいて、
前記チェック手段は、自装置外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック装置。
(Appendix 5)
In any one of appendices 1-4
The checking means updates each similar character in accordance with an instruction from the outside of the device.
Character check device characterized by that.
(付記6)
付記1〜5のいずれか一つにおいて、
前記チェック対象物は、印刷された図面、又は前記図面に則して製造された物品である、
ことを特徴とした文字チェック装置。
(Appendix 6)
In any one of appendices 1-5,
The check object is a printed drawing or an article manufactured according to the drawing.
Character check device characterized by that.
(付記7)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能な装置における文字チェック方法であって、
認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記認識された文字に対応する類似文字に関する情報を表示する、
ことを含む文字チェック方法。
(Appendix 7)
A character check method in an apparatus capable of optically acquiring image data of a check object and recognizing characters included in the image data,
Each character type that can be recognized and its similar characters are stored in association with each other,
Displaying information about similar characters corresponding to the recognized characters;
Character check method including that.
(付記8)
付記7において、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記認識された文字に対応する複数の類似文字に関する情報を表示する、
ことを特徴とした文字チェック方法。
(Appendix 8)
In Appendix 7,
For each character type, memorize multiple similar characters with different similarity,
Displaying information about a plurality of similar characters corresponding to the recognized characters;
Character check method characterized by that.
(付記9)
付記7又は8において、
前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック方法。
(Appendix 9)
In Appendix 7 or 8,
In the storage, each similar character is determined using an average pattern between the same character type belonging to a plurality of types of fonts.
Character check method characterized by that.
(付記10)
付記7〜9のいずれか一つにおいて、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を表示する、
ことを更に含む文字チェック方法。
(Appendix 10)
In any one of appendices 7-9,
Referring to the information about the character displayed on the check object, determine the correctness of the recognized character,
As a result of the determination, a character determined to be erroneous is displayed.
A character check method further including:
(付記11)
付記7〜10のいずれか一つにおいて、
前記装置の外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック方法。
(Appendix 11)
In any one of appendices 7-10,
Updating each similar character according to an instruction from the outside of the device;
Character check method characterized by that.
(付記12)
付記7〜11のいずれか一つにおいて、
前記チェック対象物として、印刷された図面、又は前記図面に則して製造された物品を用いる、
ことを特徴とした文字チェック方法。
(Appendix 12)
In any one of appendices 7-11,
As the check target, a printed drawing or an article manufactured according to the drawing is used.
Character check method characterized by that.
(付記13)
チェック対象物の画像データを光学的に取得すると共に、前記画像データに含まれる文字を認識可能なコンピュータに、
認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、
前記認識された文字に対応する類似文字に関する情報を表示する処理と、
を実行させるための文字チェックプログラム。
(Appendix 13)
A computer capable of optically acquiring image data of a check target and recognizing characters included in the image data,
A process of storing each character type that can be recognized and its similar characters in association with each other;
Processing for displaying information on similar characters corresponding to the recognized characters;
Character check program for running
10, 10a 文字チェック装置
100 認識部
101 入力モジュール
102 抽出モジュール
103 認識モジュール
104 認識辞書モジュール
200 チェック部
201 評価モジュール
202 類似文字情報モジュール
203 正解データモジュール
300 表示部
401 文字列
402 認識文字列
501 類似文字情報
502 類似度マトリクス
601 正解データ
1001, 1002 図面
2001 銘板シール
3001 部品
DESCRIPTION OF
Claims (10)
前記認識された文字をチェックするチェック手段と、
前記チェックの結果を表示する表示手段と、を備え、
前記チェック手段は、
前記認識手段によって認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記表示手段に、前記認識された文字に対応する類似文字に関する情報を、前記チェックの結果として表示させる、
文字チェック装置。 Recognizing means for optically acquiring the image data of the check object and recognizing characters included in the image data;
Checking means for checking the recognized character;
Display means for displaying the result of the check,
The checking means includes
Each character type that can be recognized by the recognition means and its similar characters are stored in association with each other,
Causing the display means to display information on similar characters corresponding to the recognized characters as a result of the check;
Character check device.
前記チェック手段は、
字種毎に、類似性の異なる複数の類似文字を記憶し、
前記表示手段に、前記認識された文字に対応する複数の類似文字に関する情報を表示させる、
ことを特徴とした文字チェック装置。 In claim 1,
The checking means includes
For each character type, memorize multiple similar characters with different similarity,
Causing the display means to display information on a plurality of similar characters corresponding to the recognized character;
Character check device characterized by that.
前記チェック手段は、前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック装置。 In claim 1 or 2,
The checking means determines each similar character by using an average pattern between the same character types belonging to a plurality of types of fonts in the storage.
Character check device characterized by that.
前記チェック手段は、
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を、前記表示手段に更に表示させる、
ことを特徴とした文字チェック装置。 In any one of Claims 1-3,
The checking means includes
Referring to the information about the character displayed on the check object, determine the correctness of the recognized character,
As a result of the determination, the character determined to be erroneous is further displayed on the display means.
Character check device characterized by that.
前記チェック手段は、自装置外部からの指示に応じて、各類似文字を更新する、
ことを特徴とした文字チェック装置。 In any one of Claims 1-4,
The checking means updates each similar character in accordance with an instruction from the outside of the device.
Character check device characterized by that.
前記チェック対象物は、印刷された図面、又は前記図面に則して製造された物品である、
ことを特徴とした文字チェック装置。 In any one of Claims 1-5,
The check object is a printed drawing or an article manufactured according to the drawing.
Character check device characterized by that.
認識され得る字種各々と、その類似文字とを対応付けて記憶し、
前記認識された文字に対応する類似文字に関する情報を表示する、
ことを含む文字チェック方法。 A character check method in an apparatus capable of optically acquiring image data of a check object and recognizing characters included in the image data,
Each character type that can be recognized and its similar characters are stored in association with each other,
Displaying information about similar characters corresponding to the recognized characters;
Character check method including that.
前記記憶に際し、各類似文字を、複数種類の書体に属する同一字種間の平均パタンを用いて決定する、
ことを特徴とした文字チェック方法。 In claim 7,
In the storage, each similar character is determined using an average pattern between the same character type belonging to a plurality of types of fonts.
Character check method characterized by that.
前記チェック対象物に表示された文字に関する情報を参照して、前記認識された文字の正誤を判定し、
前記判定の結果、誤りと判定した文字を表示する、
ことを更に含む文字チェック方法。 In claim 7 or 8,
Referring to the information about the character displayed on the check object, determine the correctness of the recognized character,
As a result of the determination, a character determined to be erroneous is displayed.
A character check method further including:
認識され得る字種各々と、その類似文字とを対応付けて記憶する処理と、
前記認識された文字に対応する類似文字に関する情報を表示する処理と、
を実行させるための文字チェックプログラム。 A computer capable of optically acquiring image data of a check target and recognizing characters included in the image data,
A process of storing each character type that can be recognized and its similar characters in association with each other;
Processing for displaying information on similar characters corresponding to the recognized characters;
Character check program for running
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011142621A JP2013011932A (en) | 2011-06-28 | 2011-06-28 | Character checking device, method, and program |
PCT/JP2012/004079 WO2013001774A1 (en) | 2011-06-28 | 2012-06-22 | Character checking device, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011142621A JP2013011932A (en) | 2011-06-28 | 2011-06-28 | Character checking device, method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013011932A true JP2013011932A (en) | 2013-01-17 |
Family
ID=47423696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011142621A Pending JP2013011932A (en) | 2011-06-28 | 2011-06-28 | Character checking device, method, and program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2013011932A (en) |
WO (1) | WO2013001774A1 (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0424779A (en) * | 1990-05-15 | 1992-01-28 | Canon Inc | Character recognition device |
JPH05108872A (en) * | 1991-10-18 | 1993-04-30 | Canon Inc | Method and device for character recognition |
JPH0816728A (en) * | 1994-06-28 | 1996-01-19 | Canon Inc | Character recognition device and method |
JPH08202811A (en) * | 1995-01-25 | 1996-08-09 | Oki Electric Ind Co Ltd | Character reader |
JPH09190505A (en) * | 1996-01-12 | 1997-07-22 | Canon Inc | Device for recognizing character and its method |
JPH1021325A (en) * | 1996-06-28 | 1998-01-23 | Baazu Joho Kagaku Kenkyusho:Kk | Method for recognizing character |
JP2006252575A (en) * | 2006-04-14 | 2006-09-21 | Katsuyoshi Nagashima | Financial statement automatic input apparatus and method therefore |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1021327A (en) * | 1996-06-28 | 1998-01-23 | Toshiba Corp | On-line handwritten character input device and method for informing of recognition candidate |
-
2011
- 2011-06-28 JP JP2011142621A patent/JP2013011932A/en active Pending
-
2012
- 2012-06-22 WO PCT/JP2012/004079 patent/WO2013001774A1/en active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0424779A (en) * | 1990-05-15 | 1992-01-28 | Canon Inc | Character recognition device |
JPH05108872A (en) * | 1991-10-18 | 1993-04-30 | Canon Inc | Method and device for character recognition |
JPH0816728A (en) * | 1994-06-28 | 1996-01-19 | Canon Inc | Character recognition device and method |
JPH08202811A (en) * | 1995-01-25 | 1996-08-09 | Oki Electric Ind Co Ltd | Character reader |
JPH09190505A (en) * | 1996-01-12 | 1997-07-22 | Canon Inc | Device for recognizing character and its method |
JPH1021325A (en) * | 1996-06-28 | 1998-01-23 | Baazu Joho Kagaku Kenkyusho:Kk | Method for recognizing character |
JP2006252575A (en) * | 2006-04-14 | 2006-09-21 | Katsuyoshi Nagashima | Financial statement automatic input apparatus and method therefore |
Also Published As
Publication number | Publication date |
---|---|
WO2013001774A1 (en) | 2013-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6286866B2 (en) | Image processing apparatus and image processing method | |
CN111325110A (en) | Form format recovery method and device based on OCR and storage medium | |
US20090226090A1 (en) | Information processing system, information processing apparatus, information processing method, and storage medium | |
US20020041713A1 (en) | Document search and retrieval apparatus, recording medium and program | |
US9934429B2 (en) | Storage medium, recognition method, and recognition apparatus | |
JP6000992B2 (en) | Document file generation apparatus and document file generation method | |
WO2007094078A1 (en) | Character string search method and device thereof | |
JP5538812B2 (en) | Image processing apparatus, image processing method, and program | |
Bhagvati et al. | On developing high accuracy OCR systems for Telugu and other Indian scripts | |
US11593591B2 (en) | Optical character recognition systems and methods | |
JP6432179B2 (en) | Document file generation apparatus and document file generation method | |
Naz et al. | Arabic script based character segmentation: a review | |
WO2013001774A1 (en) | Character checking device, method, and program | |
JP2011076390A (en) | Device, method and program for recognizing mark item | |
JP5712415B2 (en) | Form processing system and form processing method | |
US10657404B2 (en) | Character recognition device, character recognition method, and character recognition program | |
JP4194020B2 (en) | Character recognition method, program used for executing the method, and character recognition apparatus | |
US7133556B1 (en) | Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition | |
JP6118646B2 (en) | Form processing device, form processing method, form processing program | |
US9047535B2 (en) | Image processing apparatus, image processing method, and computer readable medium | |
JP2004005761A (en) | Keyword extraction/search system | |
JP3812719B2 (en) | Document search device | |
SE528063C2 (en) | Method and apparatus for segmentation-based recognition | |
KR102605381B1 (en) | System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications | |
JP5669044B2 (en) | Document verification system and document verification method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130723 |