JP2019133289A - Image processing program, image processing method and image processing apparatus - Google Patents
Image processing program, image processing method and image processing apparatus Download PDFInfo
- Publication number
- JP2019133289A JP2019133289A JP2018013219A JP2018013219A JP2019133289A JP 2019133289 A JP2019133289 A JP 2019133289A JP 2018013219 A JP2018013219 A JP 2018013219A JP 2018013219 A JP2018013219 A JP 2018013219A JP 2019133289 A JP2019133289 A JP 2019133289A
- Authority
- JP
- Japan
- Prior art keywords
- character
- answer
- question
- image processing
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
本発明は、画像処理プログラム、画像処理方法および画像処理装置に関する。 The present invention relates to an image processing program, an image processing method, and an image processing apparatus.
従来、手書きされた文字を光学的に読み取るOCR(Optical Character Reader)と呼ばれる技術がある。また、OCRを利用して、手書きで記入されたテストの答案を文字認識し、テストの自動採点を行うシステムがある。 Conventionally, there is a technique called OCR (Optical Character Reader) that optically reads a handwritten character. In addition, there is a system that automatically recognizes a test by using OCR to recognize a test answer written by hand and characterize the test.
先行技術としては、例えば、利用者がペン入力手段を用いて入力した筆跡を、文字認識手段が漢字辞書を使って認識するときに、利用者の漢字に対する習熟度に応じて、漢字辞書中の認識の候補となる漢字の範囲を限定するものがある。 As a prior art, for example, when a handwriting input by a user using a pen input unit is recognized by a character recognition unit using a kanji dictionary, the kanji dictionary contains Some limit the range of kanji that are candidates for recognition.
しかしながら、従来技術では、答案に記入された回答に対するOCRの文字認識精度を確保することが難しい。例えば、テストの自動採点を行うにあたり、文字認識精度を確保できなければ、誤採点を招いてしまう。 However, it is difficult for the conventional technology to ensure the OCR character recognition accuracy for the answer written in the answer. For example, when automatic test scoring is performed, if character recognition accuracy cannot be ensured, erroneous scoring will be caused.
一つの側面では、本発明は、文字認識精度を向上させることを目的とする。 In one aspect, the present invention aims to improve character recognition accuracy.
1つの実施態様では、答案の画像データからOCRにより第1の文字であると認識された設問に対する回答の文字の前記第1の文字との一致度を、記憶部に記憶した前記答案及び/又は前記設問に対応付けた学年、科目および設問の種別のうちの少なくともいずれかに対応する一致度の第1の閾値と比較し、前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、画像処理プログラムが提供される。 In one embodiment, the answer stored in the storage unit and / or the degree of coincidence between the character of the answer to the question recognized as the first character by OCR from the image data of the answer and / or Compared with the first threshold value of the degree of coincidence corresponding to at least one of the grade, subject, and question type associated with the question, the degree of coincidence of the character of the answer with the first character is the first An image processing program is provided for determining whether or not the character of the answer matches the character of the correct answer of the question when it is greater than a threshold value of 1.
本発明の一側面によれば、文字認識精度を向上させることができる。 According to an aspect of the present invention, character recognition accuracy can be improved.
以下に図面を参照して、本発明にかかる画像処理プログラム、画像処理方法および画像処理装置の実施の形態を詳細に説明する。 Hereinafter, embodiments of an image processing program, an image processing method, and an image processing apparatus according to the present invention will be described in detail with reference to the drawings.
(実施の形態)
図1は、実施の形態にかかる画像処理方法の一実施例を示す説明図である。図1において、画像処理装置101は、答案の画像データから文字を認識するコンピュータである。答案は、設問に対する回答が記入された用紙である。答案の画像データは、答案をスキャンして得られる画像データである。
(Embodiment)
FIG. 1 is an explanatory diagram of an example of the image processing method according to the embodiment. In FIG. 1, an
ここで、答案の画像データをOCRで文字認識し、認識した設問に対する回答の文字を、その設問の正答の文字と比較することで、答案の自動採点を行う場合がある。しかし、文字を書く能力は、個人差があるだけでなく、学年の違いによって変わる傾向がある。例えば、小学校では、学年が高くなるにつれて、綺麗に文字を書く児童が多くなる傾向があり、低学年ほど、読みやすい字を書く児童は少なくなる。 Here, there is a case where the answer image is automatically scored by character-recognizing the image data of the answer by OCR and comparing the character of the answer to the recognized question with the character of the correct answer of the question. However, the ability to write letters not only varies from individual to individual, but tends to vary depending on the grade. For example, in elementary school, the number of children who write beautiful characters tends to increase as the school year rises, and the number of children who write easy-to-read characters decreases in the lower grades.
例えば、文字120は、小学6年生の児童が書いた「ア」という文字である。また、文字130は、小学1年生の児童が書いた「ア」という文字である。文字120と文字130とを比較すると、文字120のほうが綺麗に書けており、OCRで正しく認識される可能性が高い。
For example, the
OCRを用いた文字認識では、例えば、ある文字を認識するにあたり、予め登録された複数の文字それぞれとの一致度を求め、一致度が最大となる文字を認識する。ただし、単純に一致度が最大となる文字を認識すると、本来ならば認識エラーとすべきものまで、何らかの文字として認識されてしまうことがある。 In character recognition using OCR, for example, when recognizing a certain character, the degree of coincidence with each of a plurality of pre-registered characters is obtained, and the character with the largest degree of coincidence is recognized. However, simply recognizing the character with the highest degree of coincidence may cause it to be recognized as some character even if it should be a recognition error.
このため、ある文字を認識するにあたり、予め登録された文字との一致度について閾値を設け、一致度が最大で、かつ、閾値より大きい文字を認識する方式がとられることがある。この方式によれば、本来ならば認識エラーとすべきものが、何らかの文字として認識されるのを防ぐことができる。 For this reason, when recognizing a certain character, there is a case where a threshold is set for the degree of coincidence with a previously registered character, and a character having the maximum degree of coincidence and recognizing a character larger than the threshold may be used. According to this method, it is possible to prevent a recognition error from being recognized as some character.
ところが、上述したように、文字を書く能力は、学年の違いによって変わる傾向がある。このため、1年生から6年生まで一律に閾値を設定すると、文字認識精度を確保できなくなるおそれがある。例えば、6年生に合わせて閾値を厳しめに設定すると、1年生の児童が書いた文字130のような文字は正しく認識されないことになる。
However, as described above, the ability to write letters tends to change depending on the grade. For this reason, if the threshold value is uniformly set from the first grader to the sixth grader, the character recognition accuracy may not be ensured. For example, if the threshold is set strictly for the sixth grader, characters such as the
しかし、文字130について、児童自身は「ア」という文字を書いており、「ア」と認識されて採点されるべきである。一方、1年生に合わせて閾値を緩めに設定すると、高学年の児童が書いた文字を認識する際に、本来ならば認識エラーとすべきものまで、何らかの文字として認識されてしまうことが増えるおそれがある。
However, for the
このような問題は、学年の違いだけでなく、科目の違い、設問の種別の違いによっても生じる可能性がある。設問の種別とは、設問に対する回答形式を示すものである。設問の種別としては、例えば、単一回答、複数回答、記述回答などがある。単一回答は、選択肢の中から回答を一つ選ぶ形式である。複数回答は、選択肢の中から回答を二つ以上選ぶ形式である。 Such problems may arise not only due to differences in grades but also due to differences in subjects and question types. The type of question indicates the answer format for the question. Examples of the types of questions include a single answer, a plurality of answers, and a written answer. The single answer is a form in which one answer is selected from the choices. Multiple answers is a form in which two or more answers are selected from the choices.
まず、科目によっては、設問に対する回答として、数字や記号(○、×など)を書くことが多いものがある。数字や記号は、ひらがなやカタカナに比べて、文字認識しやすい傾向があるため、閾値は厳しめに設定してもよいといえる。また、設問の種別が「複数回答」の場合、文字同士が近づきすぎたり重なったりするため、「単一回答」に比べて、閾値は緩めに設定することが望ましい。 First, depending on the subject, there are many cases where numbers and symbols (such as ○ and ×) are often written as answers to questions. Since numbers and symbols tend to be recognized more easily than hiragana and katakana, it can be said that the threshold may be set strictly. In addition, when the question type is “multiple answers”, the characters are too close to each other and overlap each other, so it is desirable to set the threshold value more loosely than “single answer”.
そこで、本実施の形態では、学年、科目および設問の種別のうちの少なくともいずれかに対応する一致度の閾値を用いて、OCRで認識した文字の確からしさを検証することで、文字認識精度の向上を図る画像処理方法について説明する。以下、画像処理装置101の処理例について説明する。
Therefore, in this embodiment, character recognition accuracy is verified by verifying the accuracy of characters recognized by OCR using a threshold value of coincidence corresponding to at least one of a grade, a subject, and a question type. An image processing method for improvement will be described. Hereinafter, a processing example of the
(1)画像処理装置101は、答案の画像データからOCRにより第1の文字であると認識された設問に対する回答の文字の第1の文字との一致度を取得する。ここで、第1の文字は、予め登録された複数の文字のうち、設問に対する回答の文字としてOCRで認識された文字(認識文字)である。
(1) The
予め登録された複数の文字は、OCRで認識する文字として登録されたものである。文字の種類としては、例えば、ひらがな(あ、い、う、…)、カタカナ(ア、イ、ウ、…)、数字(1、2、3、…)、アルファベット(A、B、C、…)、記号(○、×、…)、漢字などがある。 A plurality of characters registered in advance are registered as characters recognized by the OCR. Examples of characters include hiragana (a, i, u, ...), katakana (a, i, u, ...), numbers (1, 2, 3, ...), alphabets (A, B, C, ...). ), Symbols (○, ×, ...), kanji, etc.
第1の文字との一致度とは、OCRで認識された文字、すなわち、手書きで記入された文字の第1の文字との一致度合いを示す値である。ここでは、一致度が大きいほど、第1の文字との一致度合いが高いことを示す。ただし、第1の文字との一致度を、第1の文字との違いをあらわす距離によって表現することにしてもよい。この場合、第1の文字との距離が小さいほど、第1の文字との一致度合いが高いことを示す。 The degree of coincidence with the first character is a value indicating the degree of coincidence between the character recognized by the OCR, that is, the character written by handwriting with the first character. Here, the greater the degree of matching, the higher the degree of matching with the first character. However, the degree of coincidence with the first character may be expressed by a distance representing a difference from the first character. In this case, the smaller the distance from the first character, the higher the degree of matching with the first character.
図1の例では、文字120を、小学6年生に出題されたある設問に対する回答の文字として答案に記入されたものとする。また、文字130を、小学1年生に出題されたある設問に対する回答の文字として答案に記入されたものとする。また、文字120,130は、各答案の画像データからOCRによりそれぞれ第1の文字「ア」であると認識された場合を想定する。また、文字120の第1の文字「ア」との一致度を「80」とし、文字130の第1の文字「ア」との一致度を「40」とする。
In the example of FIG. 1, it is assumed that the
(2)画像処理装置101は、取得した一致度を、記憶部110に記憶した答案及び/又は設問に対応付けた学年、科目および設問の種別のうちの少なくともいずれかに対応する一致度の第1の閾値と比較する。記憶部110は、学年、科目および設問の種別のうちの少なくともいずれかに対応する一致度の閾値を記憶する。
(2) The
記憶部110は、画像処理装置101が有していてもよく、また、画像処理装置101がアクセス可能な他のコンピュータが有していてもよい。他のコンピュータが記憶部110を有する場合、画像処理装置101は、他のコンピュータにアクセスして、記憶部110の記憶内容を参照する。
The
図1の例では、記憶部110には、各学年(小学1年生〜小学6年生)に対応する一致度の閾値が記憶されている場合を想定する。また、小学6年生に対応する一致度の第1の閾値を「70」とし、小学1年生に対応する一致度の第1の閾値を「30」とする。
In the example of FIG. 1, it is assumed that the
この場合、画像処理装置101は、文字120の第1の文字「ア」との一致度「80」を、小学6年生に対応する第1の閾値「70」と比較する。また、画像処理装置101は、文字130の第1の文字「ア」との一致度「40」を、小学1年生に対応する第1の閾値「30」と比較する。なお、学年は、答案及び/又は設問に対応付けられている。
In this case, the
(3)画像処理装置101は、回答の文字の第1の文字との一致度が第1の閾値よりも大きい場合に、回答の文字と設問の正答の文字とが一致するか否かを判定する。ここで、回答の文字の第1の文字との一致度が第1の閾値よりも大きければ、OCRで正しく文字が認識された可能性が高いといえる。
(3) The
すなわち、画像処理装置101は、OCRで回答の文字が正しく認識されたといえる場合に、回答の文字と設問の正答の文字との一致判定を実施する。設問の正答の文字とは、設問の答えを示す文字である。一方、OCRで回答の文字が正しく認識されたといえない場合には、画像処理装置101は、回答の文字と設問の正答の文字との一致判定を実施しない。
In other words, when it can be said that the character of the answer is correctly recognized by the OCR, the
図1の例では、文字120の第1の文字「ア」との一致度「80」は、小学6年生に対応する第1の閾値「70」よりも大きい。このため、画像処理装置101は、設問に対する回答の文字(文字120)と、設問の正答の文字とが一致するか否かを判定する。
In the example of FIG. 1, the matching degree “80” of the
また、文字130の第1の文字「ア」との一致度「40」は、小学1年生に対応する第1の閾値「30」よりも大きい。このため、画像処理装置101は、設問に対する回答の文字(文字130)と、設問の正答の文字とが一致するか否かを判定する。なお、設問の正答の文字を示す情報は、例えば、画像処理装置101に記憶されている。
Further, the degree of coincidence “40” of the
このように、画像処理装置101によれば、学年、科目および設問の種別のうちの少なくともいずれかに対応する第1の閾値(判断基準)を用いて、OCRで認識した文字の確からしさを検証して文字認識精度の向上を図ることができる。
As described above, according to the
例えば、学年に対応する閾値を用いることで、学年の違いによって文字を書く能力が異なることを考慮して、OCRで認識した文字の確からしさを検証することができる。また、科目に対応する閾値を用いることで、科目の違いによって回答として書かれる文字の種類が異なることを考慮して、OCRで認識した文字の確からしさを検証することができる。また、設問の種別に対応する閾値を用いることで、設問の種別の違いによってOCRによる文字認識のしやすさが異なることを考慮して、OCRで認識した文字の確からしさを検証することができる。 For example, by using the threshold value corresponding to the grade, it is possible to verify the certainty of the character recognized by the OCR in consideration of the difference in the ability to write characters depending on the grade. Further, by using the threshold value corresponding to the subject, it is possible to verify the certainty of the character recognized by the OCR, considering that the type of character written as an answer varies depending on the subject. Also, by using the threshold value corresponding to the question type, it is possible to verify the probability of the character recognized by the OCR, considering that the ease of character recognition by the OCR varies depending on the question type. .
図1の例では、小学1年生に対しても小学6年生と同じ第1の閾値「70」を用いた場合、文字130の第1の文字「ア」との一致度「40」は、第1の閾値「70」以下となり、文字130は認識されない。これに対して、学年の特性に応じた第1の閾値、すなわち、小学1年生に対応する第1の閾値「30」を用いることで、文字130は、「ア」と正しく認識される。
In the example of FIG. 1, when the same first threshold “70” is used for the first grader as the sixth grader, the degree of coincidence “40” of the
(画像処理システム200のシステム構成例)
つぎに、実施の形態にかかる画像処理システム200のシステム構成例について説明する。ここでは、画像処理システム200を、全国の各拠点で実施されるテストの答案の画像データに対する文字認識を行うシステムに適用する場合を例に挙げて説明する。
(System configuration example of the image processing system 200)
Next, a system configuration example of the
図2は、画像処理システム200のシステム構成例を示す説明図である。図2において、画像処理システム200は、画像処理装置101と、複数の拠点端末201と、を含む。画像処理システム200において、画像処理装置101および複数の拠点端末201は、有線または無線のネットワーク210を介して接続される。ネットワーク210は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどである。
FIG. 2 is an explanatory diagram showing a system configuration example of the
画像処理装置101は、答案画像DB(DataBase)220、小片画像DB230、正答テーブル240および閾値テーブル250を有する。各種DB等220,230,240,250の記憶内容については、図6〜図9を用いて後述する。画像処理装置101は、例えば、サーバである。
The
拠点端末201は、テストが実施される各拠点に設置されるコンピュータであり、スキャナ202を有する。スキャナ202は、画像を光学的に読み取る装置である。スキャナ202により読み取られた画像は画像データとして拠点端末201に格納される。拠点端末201は、例えば、PC(Personal Computer)である。
The
画像処理システム200において、スキャナ202は、テストの答案を読み取るために用いられる。スキャナ202により読み取られた答案の画像データは、拠点端末201に取り込まれた後、拠点端末201から画像処理装置101に送信される。画像処理装置101は、拠点端末201から答案の画像データを受信すると、受信した答案の画像データを答案画像DB220に記憶する。答案の画像データの具体例については、図4を用いて後述する。
In the
また、画像処理装置101は、答案の画像データを設問単位で区切って小片画像に分割する。小片画像は、各設問の回答欄を含む画像データである。分割された小片画像は、小片画像DB230に記憶される。小片画像の具体例については、図5を用いて後述する。
Further, the
なお、画像処理装置101は、1台のコンピュータによって実現されてもよく、また、複数のコンピュータによって実現されることにしてもよい。
The
(画像処理装置101のハードウェア構成例)
図3は、画像処理装置101のハードウェア構成例を示すブロック図である。図3において、画像処理装置101は、CPU(Central Processing Unit)301と、メモリ302と、I/F(Interface)303と、ディスクドライブ304と、ディスク305と、を有する。また、各構成部は、バス300によってそれぞれ接続される。
(Hardware configuration example of image processing apparatus 101)
FIG. 3 is a block diagram illustrating a hardware configuration example of the
ここで、CPU301は、画像処理装置101の全体の制御を司る。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMがOS(Operating System)のプログラムを記憶し、ROMがアプリケーションプログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
Here, the
I/F303は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して外部のコンピュータ(例えば、図2に示した拠点端末201)に接続される。そして、I/F303は、ネットワーク210と装置内部とのインターフェースを司り、外部のコンピュータからのデータの入出力を制御する。I/F303には、例えば、モデムやLANアダプタなどを採用することができる。
The I /
ディスクドライブ304は、CPU301の制御に従ってディスク305に対するデータのリード/ライトを制御する。ディスク305は、ディスクドライブ304の制御で書き込まれたデータを記憶する。ディスク305としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
The
なお、画像処理装置101は、上述した構成部のほかに、例えば、SSD(Solid State Drive)、入力装置、ディスプレイ等を有することにしてもよい。また、図2に示した拠点端末201についても、画像処理装置101と同様のハードウェア構成により実現することができる。ただし、拠点端末201は、上述した構成部のほかに、スキャナ202(図2参照)、入力装置、ディスプレイ等を有する。
Note that the
(答案画像の具体例)
つぎに、答案画像の具体例について説明する。
(Specific example of answer image)
Next, a specific example of the answer image will be described.
図4は、答案画像の具体例を示す説明図である。図4において、答案画像P1は、スキャナ202(図2参照)により読み取られた、ある児童(生徒ID:S1)の答案(答案ID:A1)の画像データである。答案(答案ID:A1)は、小学1年生を対象とする算数のテストの答案である。 FIG. 4 is an explanatory diagram showing a specific example of an answer image. In FIG. 4, an answer image P1 is image data of an answer (answer ID: A1) of a certain child (student ID: S1) read by the scanner 202 (see FIG. 2). The answer (answer ID: A1) is an answer to an arithmetic test for first graders.
各拠点においてテストが実施されると、答案画像P1のような答案の画像データが、テストを受けた児童の数分、スキャナ202に読み取られて、拠点端末201から画像処理装置101に転送される。この結果、テストを受けた全児童の答案の画像データが画像処理装置101に記憶される。
When the test is performed at each site, the image data of the answer such as the answer image P1 is read by the
(小片画像の具体例)
つぎに、答案画像から分割された小片画像の具体例について説明する。
(Specific example of small image)
Next, a specific example of a small piece image divided from the answer image will be described.
図5は、小片画像の具体例を示す説明図である。図5において、小片画像p1は、図4に示した答案画像P1から分割された小片画像の一つである。画像処理装置101では、答案画像P1を設問単位に区切って分割することで、小片画像p1のような画像データが設問の数分、答案画像P1から生成される。
FIG. 5 is an explanatory diagram showing a specific example of a small piece image. In FIG. 5, the small piece image p1 is one of the small piece images divided from the answer image P1 shown in FIG. In the
(各種DB等220,230,240,250の記憶内容)
つぎに、図6〜図9を用いて、画像処理装置101が有する各種DB等220,230,240,250の記憶内容について説明する。各種DB等220,230,240,250は、例えば、図3に示したメモリ302、ディスク305等の記憶装置により実現される。
(Storage contents of
Next, the storage contents of
図6は、答案画像DB220の記憶内容の一例を示す説明図である。図6において、答案画像DB220は、答案ID、学年、科目、児童IDおよび答案画像のフィールドを有し、各フィールドに情報を設定することで、答案画像情報(例えば、答案画像情報600−1〜600−3)をレコードとして記憶する。
FIG. 6 is an explanatory diagram showing an example of the contents stored in the
ここで、答案IDは、テストの答案を一意に識別する識別子である。学年は、テストの対象となる学年である。例えば、学年「1」は、小学1年生を示す。学年「6」は、小学6年生を示す。科目は、テストの科目である。科目としては、国語、社会、算数、理科などがある。児童IDは、テストを受けた児童を一意に識別する識別子である。答案画像は、テストを受けた児童が提出した答案の画像データである。 Here, the answer ID is an identifier for uniquely identifying the answer of the test. The grade is the grade that will be tested. For example, the grade “1” indicates a first grader. The grade “6” indicates a sixth grader of elementary school. The subject is a test subject. Subjects include national language, society, mathematics, and science. The child ID is an identifier that uniquely identifies a child who has been tested. The answer image is image data of an answer submitted by the child who took the test.
例えば、答案画像情報600−1は、小学1年生の児童S1が提出した算数のテストの答案A1の答案画像P1を示す。 For example, the answer image information 600-1 indicates the answer image P1 of the answer A1 of the arithmetic test submitted by the first grade child S1.
図7は、小片画像DB230の記憶内容の一例を示す説明図である。図7において、小片画像DB230は、答案ID、児童ID、設問IDおよび小片画像のフィールドを有し、各フィールドに情報を設定することで、小片画像情報(例えば、小片画像情報700−1〜700−3)をレコードとして記憶する。
FIG. 7 is an explanatory diagram showing an example of the contents stored in the small
ここで、答案IDは、テストの答案を一意に識別する識別子である。児童IDは、テストを受けた児童を一意に識別する識別子である。設問IDは、テストの設問を一意に識別する識別子である。小片画像は、答案画像から分割された設問単位の画像データである。 Here, the answer ID is an identifier for uniquely identifying the answer of the test. The child ID is an identifier that uniquely identifies a child who has been tested. The question ID is an identifier for uniquely identifying a test question. The small piece image is image data for each question divided from the answer image.
例えば、小片画像情報700−1は、児童S1が提出した答案A1に含まれる設問Q1の小片画像p1を示す。 For example, the small piece image information 700-1 indicates the small piece image p1 of the question Q1 included in the answer A1 submitted by the child S1.
図8は、正答テーブル240の記憶内容の一例を示す説明図である。図8において、正答テーブル240は、答案ID、学年、科目、設問ID、設問パターンおよび正答のフィールドを有し、各フィールドに情報を設定することで、正答情報(例えば、正答情報800−1〜800−3)をレコードとして記憶する。 FIG. 8 is an explanatory diagram showing an example of the contents stored in the correct answer table 240. In FIG. 8, the correct answer table 240 has fields of answer ID, grade, subject, question ID, question pattern, and correct answer, and by setting information in each field, correct answer information (for example, correct answer information 800-1 to 800-1). 800-3) is stored as a record.
ここで、答案IDは、テストの答案を一意に識別する識別子である。学年は、テストの対象となる学年である。科目は、テストの科目である。設問IDは、テストの設問を一意に識別する識別子である。設問パターンは、設問の種別である。設問パターンとしては、例えば、単一回答、複数回答などがある。正答は、設問の答えを示す。 Here, the answer ID is an identifier for uniquely identifying the answer of the test. The grade is the grade that will be tested. The subject is a test subject. The question ID is an identifier for uniquely identifying a test question. The question pattern is a question type. Examples of the question pattern include a single answer and a plurality of answers. The correct answer indicates the answer to the question.
例えば、正答情報800−1は、学年「1」の児童を対象とする科目「算数」のテストの答案A1に含まれる設問Q1の設問パターン「単一回答」および正答「ア」を示す。 For example, the correct answer information 800-1 indicates the question pattern “single answer” and the correct answer “A” of the question Q1 included in the test answer A1 of the subject “arithmetic” for the child of the grade “1”.
図9は、閾値テーブル250の記憶内容の一例を示す説明図である。図9において、閾値テーブル250は、学年、科目、設問パターン、対象文字、距離閾値および隣接差閾値のフィールドを有し、各フィールドに情報を設定することで、閾値情報(例えば、閾値情報900−1,900−2)をレコードとして記憶する。 FIG. 9 is an explanatory diagram illustrating an example of the contents stored in the threshold table 250. In FIG. 9, the threshold table 250 has fields of grade, subject, question pattern, target character, distance threshold, and adjacent difference threshold. By setting information in each field, threshold information (for example, threshold information 900- 1,900-2) is stored as a record.
ここで、学年は、テストの対象となる学年である。科目は、テストの科目である。設問パターンは、設問の種別である。対象文字は、OCRで認識する対象となる文字である。距離閾値は、距離値についての閾値である。隣接差閾値は、距離値の隣接差についての閾値である。 Here, the grade is the grade to be tested. The subject is a test subject. The question pattern is a question type. The target character is a character to be recognized by OCR. The distance threshold is a threshold for the distance value. The adjacent difference threshold is a threshold for the adjacent difference of distance values.
例えば、閾値情報900−1は、学年「1」、科目「算数」、設問パターン「単一回答」および対象文字「ア」の組合せに対応する距離閾値「100」および隣接差閾値「500」を示す。 For example, the threshold information 900-1 includes a distance threshold “100” and an adjacent difference threshold “500” corresponding to a combination of the grade “1”, the subject “arithmetic”, the question pattern “single answer”, and the target character “a”. Show.
(画像処理装置101の機能的構成例)
図10は、画像処理装置101の機能的構成例を示すブロック図である。図10において、画像処理装置101は、取得部1001と、特定部1002と、判断部1003と、判定部1004と、出力部1005と、受付部1006と、記録部1007と、更新部1008と、を含む。取得部1001〜更新部1008は制御部となる機能であり、具体的には、例えば、図3に示したメモリ302、ディスク305などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、I/F303により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク305などの記憶装置に記憶される。
(Functional configuration example of the image processing apparatus 101)
FIG. 10 is a block diagram illustrating a functional configuration example of the
取得部1001は、答案の画像データを取得する。答案は、例えば、各拠点で実施されたテストの設問に対する回答が記入された用紙である。答案の画像データは、例えば、図4に示した答案画像P1である。具体的には、例えば、取得部1001は、拠点端末201からテストの答案の画像データを受信することにより、答案の画像データを取得する。
The
答案の画像データには、例えば、テストの答案、テストの対象となる学年、テストの科目、およびテストを受けた児童を特定する情報が対応付けられている。答案を特定する情報は、例えば、答案IDである。児童を特定する情報は、例えば、児童IDや氏名などである。 The image data of the answer is associated with, for example, information for specifying the test answer, the grade to be tested, the subject of the test, and the child who took the test. The information specifying the answer is, for example, an answer ID. The information for identifying the child is, for example, a child ID or a name.
取得された答案の画像データは、例えば、答案ID、学年、科目および児童IDと対応付けて、図6に示した答案画像DB220に記憶される。
The acquired answer image data is stored in the
なお、図2の例では、拠点端末201がスキャナ202を有することにしたが、画像処理装置101がスキャナ202を有することにしてもよい。この場合、取得部1001は、スキャナ202により読み取られた答案の画像データを取り込むことにより、答案の画像データを取得する。
In the example of FIG. 2, the
特定部1002は、取得された答案の画像データからOCRにより第1の文字であると認識された設問に対する回答の文字の第1の文字との一致度を特定する。ここで、第1の文字との一致度とは、OCRで認識された文字、すなわち、手書きで記入された文字の第1の文字との一致度合いを示す値である。
The identifying
以下の説明では、第1の文字との一致度として、第1の文字との違いをあらわす距離値を用いる場合を例に挙げて説明する。この場合、第1の文字との距離値が小さいほど、認識した文字と第1の文字との一致度合いが高く、認識した文字が正しい可能性が高いことを示す。 In the following description, a case where a distance value representing a difference from the first character is used as an example of the degree of coincidence with the first character will be described as an example. In this case, the smaller the distance value from the first character, the higher the degree of matching between the recognized character and the first character, indicating that the recognized character is more likely to be correct.
具体的には、例えば、まず、特定部1002は、取得された答案の画像データを設問単位で区切って小片画像に分割する。小片画像は、各設問の回答欄を含む画像データである。分割された小片画像は、例えば、図7に示した小片画像DB230に記憶される。なお、答案上の各設問の回答欄の位置を特定する情報は、例えば、答案の答案ID等と対応付けて、メモリ302、ディスク305等の記憶装置に予め記憶されている。
Specifically, for example, the specifying
つぎに、特定部1002は、分割した小片画像に対してOCR処理を実施して文字を認識する。OCR処理とは、文字を光学的に読み取る文字認識処理である。OCR処理では、例えば、ある文字を認識するにあたり、複数の対象文字それぞれとの距離値(一致度)を求め、距離値が最小となる対象文字(第1の文字)を認識する。
Next, the specifying
対象文字は、OCRで認識する文字として予め登録された文字である。文字間の距離値の算出方法については、既存のいかなる技術を用いることにしてもよい。そして、特定部1002は、認識した第1の文字を回答の文字として特定する。また、特定部1002は、第1の文字であると認識した回答の文字の第1の文字との距離値を特定する。
The target character is a character registered in advance as a character recognized by OCR. Any existing technique may be used for calculating the distance value between characters. Then, the specifying
例えば、ある小片画像に対してOCR処理を実施した結果、距離値が低いものから上位3つの文字「ア」、「イ」、「ウ」が候補文字として抽出されたとする。また、候補文字「ア」との距離値を「10」とし、候補文字「イ」との距離値を「110」とし、候補文字「ウ」との距離値を「500」とする。この場合、特定部1002は、3つの候補文字「ア」、「イ」、「ウ」のうち、距離値が最小の候補文字「ア」を認識する。そして、特定部1002は、認識した候補文字「ア」を回答の文字として特定する。また、特定部1002は、回答の文字の候補文字「ア」との距離値「10」を特定する。
For example, suppose that as a result of performing OCR processing on a small piece image, the top three characters “A”, “I”, and “U” are extracted as candidate characters from the ones with a low distance value. Further, the distance value with the candidate character “A” is “10”, the distance value with the candidate character “I” is “110”, and the distance value with the candidate character “U” is “500”. In this case, the identifying
なお、答案の画像データを小片画像に分割する処理については、画像処理装置101とは異なる他のコンピュータにおいて実行することにしてもよい。また、小片画像に対するOCR処理についても、画像処理装置101とは異なる他のコンピュータにおいて実行することにしてもよい。
Note that the process of dividing the image data of the answer into small pieces of images may be executed by another computer different from the
また、特定部1002は、回答の文字の第1の文字との距離値と、回答の文字の第2の文字との距離値との差分を算出することにしてもよい。ここで、第1の文字は、複数の対象文字のうち、回答の文字との距離値が最小の文字であり、回答の文字との一致度合いが最も高いといえる文字である。また、第2の文字は、複数の対象文字のうち、回答の文字との距離値が第1の文字のつぎに小さい文字であり、回答の文字との一致度合いが第1の文字のつぎに高いといえる文字である。
Further, the specifying
上述した3つの候補文字「ア」、「イ」、「ウ」の例では、第1の文字は候補文字「ア」であり、第2の文字は候補文字「イ」である。この場合、特定部1002は、回答の文字の候補文字「ア」との距離値「10」と、回答の文字の候補文字「イ」との距離値「110」との差分「100」を算出する。
In the example of the three candidate characters “A”, “I”, and “U” described above, the first character is the candidate character “A”, and the second character is the candidate character “A”. In this case, the specifying
以下の説明では、回答の文字の第1の文字との距離値と回答の文字の第2の文字との距離値との差分を「第1の文字/第2の文字間の距離値の隣接差」と表記する場合がある。 In the following description, the difference between the distance value between the first character of the answer character and the distance value between the second character of the answer character is expressed as “adjacent distance value between first character / second character”. Sometimes referred to as “difference”.
判断部1003は、特定された第1の文字との距離値を、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応する距離閾値と比較する。距離閾値は、距離値(一致度)についての閾値(第1の閾値)である。距離閾値は、学年、科目および設問パターンのうちの少なくともいずれかに対応付けて保持される。この際、距離閾値は、OCRで認識する文字として登録された対象文字ごとに保持されることにしてもよい。
The
具体的には、例えば、まず、判断部1003は、小片画像DB230を参照して、小片画像に対応する答案IDおよび設問IDを特定する。つぎに、判断部1003は、図8に示した正答テーブル240を参照して、特定した答案IDおよび設問IDに対応する学年、科目および設問パターンを特定する。
Specifically, for example, first, the
つぎに、判断部1003は、図9に示した閾値テーブル250を参照して、特定した学年、科目および設問パターンに対応する第1の文字についての距離閾値を特定する。一例として、学年を「1」、科目を「算数」、設問パターンを「単一回答」、第1の文字を「ア」とすると、距離閾値は「100」となる。
Next, the
そして、判断部1003は、第1の文字との距離値が、特定した距離閾値よりも小さいか否かを判断する。上述した候補文字「ア」を第1の文字とする例では、回答の文字の第1の文字「ア」との距離値は「10」である。このため、距離閾値を「100」とすると、判断部1003は、第1の文字「ア」との距離値「10」が距離閾値「100」より小さいと判断する。
Then, the
また、判断部1003は、第1の文字/第2の文字間の距離値の隣接差を、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応する第1の文字についての隣接差閾値と比較することにしてもよい。隣接差閾値は、距離値の隣接差についての対象文字ごとの閾値(第2の閾値)である。
In addition, the
ここで、文字によっては、特徴がよく似た他の文字があるものや、特徴が他の文字と大きく異なるものなど様々である。例えば、カタカナの「カ」は「オ」と特徴がよく似ている。このため、隣接差閾値は、対象文字ごとに設けられ、例えば、閾値テーブル250から特定される。一例として、学年を「1」、科目を「算数」、設問パターンを「単一回答」、第1の文字を「ア」とすると、隣接差閾値は「500」となる。 Here, there are various types of characters, such as those having other characters with similar characteristics and those having features that are greatly different from other characters. For example, the katakana “ka” is very similar in character to “o”. For this reason, the adjacent difference threshold is provided for each target character, and is specified from the threshold table 250, for example. As an example, if the grade is “1”, the subject is “arithmetic”, the question pattern is “single answer”, and the first character is “a”, the adjacent difference threshold is “500”.
そして、判断部1003は、第1の文字/第2の文字間の距離値の隣接差が、第1の文字についての隣接差閾値よりも大きいか否かを判断する。上述した3つの候補文字「ア」、「イ」、「ウ」の例では、第1の文字/第2の文字間の距離値の隣接差は「100」であり、第1の文字「ア」についての隣接差閾値は「500」である。このため、判断部1003は、隣接差「100」が隣接差閾値「500」以下であると判断する。隣接差「100」が隣接差閾値「500」以下であれば、第2の文字「イ」が正しい文字である可能性が無視できない程度に高いといえる。
Then, the
以下の説明では、OCRにより認識された回答の文字の第1の文字との距離値が距離閾値よりも小さいという条件を、「第1の条件」と表記する場合がある。第1の条件を満たすということは、OCRで認識した文字(第1の文字)が正しいと判断できる程度に、回答の文字の第1の文字との一致度合いが高いことを意味する。 In the following description, the condition that the distance value between the reply character recognized by the OCR and the first character is smaller than the distance threshold may be referred to as “first condition”. Satisfying the first condition means that the degree of coincidence between the answer character and the first character is high enough to determine that the character (first character) recognized by the OCR is correct.
また、OCRにより認識された回答の文字についての第1の文字/第2の文字間の距離値の隣接差が隣接差閾値よりも大きいという条件を、「第2の条件」と表記する場合がある。第2の条件を満たすということは、第2の文字が正しい文字である可能性が低いことを意味する。換言すれば、第2の条件を満たさなければ、第2の文字が正しい文字である可能性を無視できないことを意味する。 Further, the condition that the adjacent difference in the distance value between the first character and the second character for the reply character recognized by the OCR is larger than the adjacent difference threshold may be referred to as a “second condition”. is there. Satisfying the second condition means that the second character is unlikely to be a correct character. In other words, if the second condition is not satisfied, it means that the possibility that the second character is a correct character cannot be ignored.
判定部1004は、第1の条件を満たすと判断された場合、認識された回答の文字と設問の正答の文字とが一致するか否かを判定する。ここで、設問の正答の文字とは、設問の答えを示す文字である。すなわち、判定部1004は、第1の条件を満たす場合に、OCRにより認識された回答の文字を文字認識結果として決定し、正答の文字との一致判定を行う。
When it is determined that the first condition is satisfied, the
具体的には、例えば、判定部1004は、正答テーブル240を参照して、小片画像の答案IDおよび設問IDに対応する正答の文字を特定する。そして、判定部1004は、認識された回答の文字と、特定した正答の文字とが一致するか否かを判定する。
Specifically, for example, the
これにより、学年、科目、設問パターン等の特性に応じた判断基準を用いてOCRで認識した文字の確からしさが検証された場合、すなわち、OCRで認識した文字が正しいと判断された場合に、正答の文字との一致判定を行うことができる。 As a result, when the accuracy of the characters recognized by the OCR is verified using the criteria according to the characteristics of the grade, subject, question pattern, etc., that is, when the characters recognized by the OCR are determined to be correct, It is possible to make a match with the correct character.
なお、例えば、設問パターンが「複数回答」の場合、正答の文字は複数存在する。この場合、判定部1004は、認識された回答の文字それぞれと、正答の文字それぞれとを比較して、回答の文字と正答の文字とが一致するか否かを判定する。この場合、全ての正答の文字と一致する回答の文字があれば、正解となる。
For example, when the question pattern is “multiple answers”, there are a plurality of correct answers. In this case, the
また、判定部1004は、第1の条件を満たすと判断され、かつ、第2の条件を満たすと判断された場合に、認識された回答の文字と設問の正答の文字とが一致するか否かを判定することにしてもよい。これにより、第2の文字が正しい文字である可能性の高さも考慮して、OCRで認識した文字の確からしさを検証することができる。
In addition, the
出力部1005は、設問と対応付けて、判定された判定結果を出力する。出力部1005の出力形式としては、例えば、メモリ302、ディスク305などの記憶装置への記憶、I/F303による他のコンピュータへの送信、不図示のディスプレイへの表示、不図示のプリンタへの印刷出力などがある。
The
具体的には、例えば、出力部1005は、小片画像の答案IDおよび設問IDと対応付けて、判定された判定結果を出力することにしてもよい。これにより、どのテストのどの設問の回答が、正解または不正解であったのかを特定可能となる。なお、画像処理装置101は、判定部1004によって判定された判定結果に基づいて、児童ごとに、答案を採点して、答案の採点結果を出力することにしてもよい。より具体的には、例えば、画像処理装置101は、児童の答案画像上の各設問に対する回答に○記号または×記号を付した採点結果画像を出力することにしてもよい。
Specifically, for example, the
また、出力部1005は、第1の条件を満たさないと判断された場合、設問に対する回答の文字の画像データを出力またはハイライト表示する。また、出力部1005は、第1の条件または第2の条件の少なくともいずれかを満たさないと判断された場合に、設問に対する回答の文字の画像データを出力またはハイライト表示することにしてもよい。
Further, when it is determined that the first condition is not satisfied, the
ここで、回答の文字の画像データは、答案に記入された回答の文字を含む画像データであり、例えば、小片画像である。具体的には、例えば、出力部1005は、第1の条件(または、第2の条件)を満たさないと判断された回答の文字を含む小片画像を、チェック担当者が使用するコンピュータに表示することにしてもよい。
Here, the character image data of the answer is image data including the character of the answer written in the answer, and is, for example, a small piece image. Specifically, for example, the
チェック担当者とは、OCRで認識された文字の正しさをチェックしたり、テストの採点を行ったりする者である。チェック担当者が使用するコンピュータは、例えば、図2に示した拠点端末201である。より具体的には、例えば、出力部1005は、図11に示すような文字チェック画面1100を表示することにしてもよい。
The person in charge of checking is a person who checks the correctness of the characters recognized by the OCR and performs a test scoring. The computer used by the person in charge of the check is, for example, the
図11は、文字チェック画面の画面例を示す説明図である。図11において、文字チェック画面1100は、OCRで認識された文字の正しさをチェックするための操作画面である。文字チェック画面1100には、第1の条件または第2の条件の少なくともいずれかを満たさないと判断された設問に対する回答の文字と、OCRの文字認識結果である第1の文字「ア」が表示されている。
FIG. 11 is an explanatory diagram illustrating a screen example of a character check screen. In FIG. 11, a
文字チェック画面1100において、不図示の入力装置を用いた操作入力により、ボタン1101を選択すると、回答の文字がOCRの文字認識結果と一致するというチェック結果を入力することができる。また、文字チェック画面1100において、ボタン1102を選択すると、回答の文字がOCRの文字認識結果と一致しないというチェック結果を入力するとともに、正しい文字を選択するための操作画面を表示することができる。
When the
すなわち、チェック担当者は、OCRの文字認識結果が正しいと判断した場合、ボタン1101を選択する。一方、OCRの文字認識結果が誤っていると判断した場合には、チェック担当者は、ボタン1102を選択して、正しい文字を選択する。
That is, the checker selects the
また、出力部1005は、例えば、第1の条件または第2の条件の少なくともいずれかを満たさないと判断された回答の文字がハイライト表示された答案の画像データを、チェック担当者が使用するコンピュータに表示することにしてもよい。より具体的には、例えば、出力部1005は、図12に示すような答案チェック画面1200を表示することにしてもよい。
The
図12は、答案チェック画面の画面例を示す説明図である。図12において、答案チェック画面1200は、第1の条件または第2の条件の少なくともいずれかを満たさないと判断された回答の文字がハイライト表示された答案画像P1を表示する操作画面である。具体的には、答案チェック画面1200では、第1の条件または第2の条件の少なくともいずれかを満たさないと判断された回答の文字が、枠1201で囲われて強調表示されている。
FIG. 12 is an explanatory diagram illustrating a screen example of an answer check screen. In FIG. 12, an
答案チェック画面1200において、不図示の入力装置を用いた操作入力により、枠1201を選択すると、例えば、図11に示したような文字チェック画面1100に遷移して、OCRで認識された文字の正しさをチェックすることができる。また、答案チェック画面1200において、採点チェックを行えるようにしてもよい。
When the
受付部1006は、出力またはハイライト表示された回答の文字の画像データに対して、回答の文字が第1の文字と一致するとの入力を受け付ける。ここで、回答の文字が第1の文字と一致するとの入力は、OCRによる文字認識結果が正しいものであることを示し、例えば、図11に示した文字チェック画面1100において入力される。
The accepting
具体的には、例えば、受付部1006は、拠点端末201から回答の文字がOCRの文字認識結果と一致するというチェック結果を受信することにより、回答の文字が第1の文字と一致するとの入力を受け付ける。
Specifically, for example, the
また、受付部1006は、回答の文字が第1の文字と一致しないとの入力を受け付けた場合、正しい文字の選択を受け付けることにしてもよい。ここで、回答の文字が第1の文字と一致しないとの入力は、OCRによる文字認識結果が誤っていることを示し、例えば、図11に示した文字チェック画面1100において入力される。
The accepting
具体的には、例えば、受付部1006は、拠点端末201から回答の文字がOCRの文字認識結果と一致しないというチェック結果を受信することにより、回答の文字が第1の文字と一致しないとの入力を受け付ける。そして、受付部1006は、拠点端末201から正しい文字の選択結果を受信することにより、回答の文字についての正しい文字の選択を受け付ける。
Specifically, for example, the
この場合、判定部1004は、回答の文字について選択された正しい文字と設問の正答の文字とが一致するか否かを判定することにしてもよい。これにより、OCRで誤って認識された文字を用いて正答の文字との一致判定が行われるのを防ぐことができる。
In this case, the
記録部1007は、回答の文字が第1の文字と一致するとの入力を受け付けた場合、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応付けて、回答の文字の第1の文字との距離値を記録する。この際、記録部1007は、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応付けて、第1の文字/第2の文字間の距離値の隣接差をあわせて記録することにしてもよい。 When the recording unit 1007 receives an input indicating that the character of the answer matches the first character, the recording unit 1007 associates the answer with at least one of the grade, the subject, and the question pattern associated with the answer and / or the question. The distance value between the first character and the first character is recorded. At this time, the recording unit 1007 associates the distance difference between the first character / second character with at least one of the grade, subject, and question pattern associated with the answer and / or question. May be recorded together.
具体的には、例えば、記録部1007は、答案及び/又は設問に対応付けた学年、科目および設問パターンの組合せに対応付けて、回答の文字の第1の文字との距離値、および第1の文字/第2の文字間の距離値の隣接差を、後述の図13に示すような距離値/隣接差テーブル1300に記録する。 Specifically, for example, the recording unit 1007 associates the combination of the grade, the subject, and the question pattern with the answer and / or the question, the distance value between the character of the answer and the first character, and the first The adjacent difference in distance value between the second character and the second character is recorded in a distance value / adjacent difference table 1300 as shown in FIG.
これにより、第1の条件または第2の条件を満たさないものの、答案に記入された回答の文字がOCRにより正しく認識されていたときの距離値および距離値の隣接差を、学年、科目および設問パターンの組合せに対応付けて記録することができる。 As a result, although the first condition or the second condition is not satisfied, the distance value and the adjacent difference of the distance value when the character of the answer written in the answer is correctly recognized by the OCR, the grade, subject and question It can be recorded in association with a combination of patterns.
また、記録部1007は、第1の条件を満たすと判断された場合、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応付けて、回答の文字の第1の文字との距離値を記録する。具体的には、例えば、記録部1007は、答案及び/又は設問に対応付けた学年、科目および設問パターンの組合せに対応付けて、回答の文字の第1の文字との距離値を距離値/隣接差テーブル1300に記録する。これにより、第1の条件を満たすときの距離値を、学年、科目および設問パターンの組合せに対応付けて記録することができる。 If the recording unit 1007 determines that the first condition is satisfied, the recording unit 1007 associates at least one of the grade, the subject, and the question pattern associated with the answer and / or the question with the first character of the answer. Record the distance from the 1 character. Specifically, for example, the recording unit 1007 associates the distance value with the first character of the answer character in correspondence with the combination of the grade, subject, and question pattern associated with the answer and / or question. Record in the adjacent difference table 1300. Thereby, the distance value when satisfying the first condition can be recorded in association with the combination of the grade, the subject, and the question pattern.
また、記録部1007は、第1の条件を満たすと判断され、かつ、第2の条件を満たすと判断された場合に、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応付けて、回答の文字の第1の文字との距離値、および第1の文字/第2の文字間の距離値の隣接差を記録することにしてもよい。 In addition, the recording unit 1007 determines that the first condition is satisfied and the second condition is determined, and the recording unit 1007 includes a grade, a subject, and a question pattern associated with the answer and / or the question. Corresponding to at least one of them, the distance between the answer character and the first character and the adjacent difference between the first character / second character may be recorded.
具体的には、例えば、記録部1007は、答案及び/又は設問に対応付けた学年、科目および設問パターンの組合せに対応付けて、回答の文字の第1の文字との距離値、および第1の文字/第2の文字間の距離値の隣接差を、距離値/隣接差テーブル1300に記録する。これにより、第1の条件および第2の条件をともに満たすときの距離値および距離値の隣接差を、学年、科目および設問パターンの組合せに対応付けて記録することができる。 Specifically, for example, the recording unit 1007 associates the combination of the grade, the subject, and the question pattern with the answer and / or the question, the distance value between the character of the answer and the first character, and the first The adjacent difference in the distance value between the second character and the second character is recorded in the distance value / adjacent difference table 1300. Thereby, the distance value and the adjacent difference of the distance value when both the first condition and the second condition are satisfied can be recorded in association with the combination of the school year, the subject, and the question pattern.
ここで、距離値/隣接差テーブル1300の記憶内容について説明する。 Here, the contents stored in the distance value / adjacent difference table 1300 will be described.
図13は、距離値/隣接差テーブル1300の記憶内容の一例を示す説明図である。図13において、距離値/隣接差テーブル1300は、対象文字、学年、科目、設問パターン、距離値および隣接差のフィールドを有する。各フィールドに情報を設定することで、距離値/隣接差情報(例えば、距離値/隣接差情報1300−1〜1300−4)がレコードとして記憶される。 FIG. 13 is an explanatory diagram showing an example of the contents stored in the distance value / adjacent difference table 1300. In FIG. 13, the distance value / adjacent difference table 1300 includes fields for target character, grade, subject, question pattern, distance value, and adjacent difference. By setting information in each field, distance value / adjacent difference information (for example, distance value / adjacent difference information 1300-1 to 1300-4) is stored as a record.
ここで、対象文字は、OCRで認識する文字として登録された文字である。学年は、テストの対象となる学年である。科目は、テストの科目である。設問パターンは、設問の種別である。距離値は、設問に対する回答の文字がOCRで認識されたときの対象文字(第1の文字)との距離値である。隣接差は、設問に対する回答の文字がOCRで認識されたときの第1の文字/第2の文字間の距離値の隣接差である。 Here, the target character is a character registered as a character recognized by OCR. The grade is the grade that will be tested. The subject is a test subject. The question pattern is a question type. The distance value is a distance value from the target character (first character) when the character of the answer to the question is recognized by the OCR. The adjacent difference is an adjacent difference in the distance value between the first character and the second character when the character of the answer to the question is recognized by the OCR.
更新部1008は、学年、科目および設問パターンのうちの少なくともいずれかに対応付けて記録された回答の文字の第1の文字との距離値に基づいて、距離閾値を更新する。ここで、学年、科目および設問パターンのうちの少なくともいずれかに対応付けて記録された、回答の文字の第1の文字との距離値の分布は、正規分布となることが想定される。 The update unit 1008 updates the distance threshold based on the distance value between the answer character and the first character recorded in association with at least one of the school year, the subject, and the question pattern. Here, it is assumed that the distribution of the distance value between the answer character and the first character recorded in association with at least one of the school year, the subject, and the question pattern is a normal distribution.
そこで、更新部1008は、記録された距離値の統計値に基づいて、全体の95%〜98%程度の距離値が存在する範囲を特定して、更新後の距離閾値を決定することにしてもよい。例えば、正規分布の場合、「平均値±2σ」に全体の約95%が存在することが知られている。σは、標準偏差である。 Therefore, the update unit 1008 determines a distance threshold after updating by specifying a range in which a distance value of about 95% to 98% of the whole exists based on the recorded statistical value of the distance value. Also good. For example, in the case of a normal distribution, it is known that about 95% of the whole exists in “average value ± 2σ”. σ is a standard deviation.
具体的には、例えば、更新部1008は、図13に示した距離値/隣接差テーブル1300を参照して、学年、科目および設問パターンの組合せごとに、各対象文字について、距離値の平均値、標準偏差(σ)を算出する。そして、更新部1008は、「距離値の平均値+2σ」を、各対象文字についての更新後の距離閾値に決定することにしてもよい。 Specifically, for example, the update unit 1008 refers to the distance value / adjacent difference table 1300 illustrated in FIG. 13 and calculates the average value of the distance values for each target character for each combination of grade, subject, and question pattern. The standard deviation (σ) is calculated. Then, the updating unit 1008 may determine “average distance value + 2σ” as the updated distance threshold for each target character.
これにより、全体の約95%の距離値が含まれるような値を、更新後の距離閾値に決定することができる。更新された対象文字についての距離閾値は、例えば、学年、科目および設問パターンの組合せに対応付けて、図9に示した閾値テーブル250に記憶される。 As a result, a value that includes about 95% of the total distance value can be determined as the updated distance threshold. The updated distance threshold value for the target character is stored in the threshold value table 250 shown in FIG. 9 in association with, for example, a combination of grade, subject, and question pattern.
なお、更新部1008は、学年、科目および設問パターンの組合せごとに、全ての対象文字を含めて、距離値の平均値、標準偏差(σ)を算出することにしてもよい。そして、更新部1008は、「距離値の平均値+2σ」を、全ての対象文字に共通の更新後の距離閾値に決定することにしてもよい。 The update unit 1008 may calculate the average value of the distance value and the standard deviation (σ) including all target characters for each combination of school year, subject, and question pattern. Then, the update unit 1008 may determine “average distance value + 2σ” as the updated distance threshold value common to all target characters.
また、更新部1008は、学年、科目および設問パターンのうちの少なくともいずれかに対応付けて記録された第1の文字/第2の文字間の距離値の隣接差に基づいて、第1の文字についての隣接差閾値を更新することにしてもよい。 The update unit 1008 also selects the first character based on the adjacent difference in the distance value between the first character / second character recorded in association with at least one of the school year, the subject, and the question pattern. You may decide to update the adjacent difference threshold about.
具体的には、例えば、更新部1008は、距離値/隣接差テーブル1300を参照して、学年、科目および設問パターンの組合せごとに、各対象文字について、隣接差の平均値、標準偏差(σ)を算出する。そして、更新部1008は、「隣接差の平均値+2σ」を、各対象文字についての更新後の隣接差閾値に決定することにしてもよい。 Specifically, for example, the update unit 1008 refers to the distance value / adjacent difference table 1300, and for each combination of grade, subject, and question pattern, the average value of the adjacent difference, standard deviation (σ ) Is calculated. Then, the update unit 1008 may determine “average value of adjacent differences + 2σ” as the updated adjacent difference threshold value for each target character.
これにより、全体の約95%の隣接差が含まれるような値を、更新後の隣接差閾値に決定することができる。更新された対象文字についての隣接差閾値は、例えば、学年、科目および設問パターンの組合せに対応付けて、閾値テーブル250に記憶される。 As a result, a value that includes about 95% of the total adjacent difference can be determined as the updated adjacent difference threshold value. The updated adjacent difference threshold value for the target character is stored in the threshold value table 250 in association with, for example, a combination of grade, subject, and question pattern.
(画像処理装置101の画像処理手順)
つぎに、画像処理装置101の画像処理手順について説明する。画像処理装置101の画像処理は、例えば、1つのテストが実施されるたびに、そのテストについての各児童の答案画像から分割された小片画像を用いて実行される。
(Image processing procedure of image processing apparatus 101)
Next, an image processing procedure of the
図14および図15は、画像処理装置101の画像処理手順の一例を示すフローチャートである。図14のフローチャートにおいて、まず、画像処理装置101は、小片画像DB230から選択されていない未選択の小片画像情報を選択する(ステップS1401)。そして、画像処理装置101は、選択した小片画像情報の小片画像に対してOCR処理を実施する(ステップS1402)。
14 and 15 are flowcharts illustrating an example of an image processing procedure of the
つぎに、画像処理装置101は、小片画像からOCR処理により第1の文字であると認識された設問に対する回答の文字の第1の文字との距離値を特定する(ステップS1403)。そして、画像処理装置101は、回答の文字についての第1の文字/第2の文字間の距離値の隣接差を算出する(ステップS1404)。
Next, the
つぎに、画像処理装置101は、正答テーブル240を参照して、選択した小片画像情報の答案IDおよび設問IDに対応する学年、科目、設問パターンおよび正答を特定する(ステップS1405)。そして、画像処理装置101は、閾値テーブル250を参照して、特定した学年、科目および設問パターンの組合せに対応する第1の文字についての距離閾値、隣接差閾値を特定する(ステップS1406)。
Next, the
つぎに、画像処理装置101は、特定した回答の文字の第1の文字との距離値が、特定した距離閾値よりも小さいか否かを判断する(ステップS1407)。ここで、距離値が距離閾値よりも小さい場合(ステップS1407:Yes)、画像処理装置101は、算出した隣接差が、特定した隣接差閾値よりも大きいか否かを判断する(ステップS1408)。
Next, the
ここで、隣接差が隣接差閾値よりも大きい場合(ステップS1408:Yes)、画像処理装置101は、OCR処理で認識された回答の文字と、特定した正答の文字とが一致するか否かを判定して(ステップS1409)、図15に示すステップS1501に移行する。
If the adjacent difference is larger than the adjacent difference threshold (step S1408: YES), the
また、ステップS1407において、距離値が距離閾値以上の場合(ステップS1407:No)、または、ステップS1408において、隣接差が隣接差閾値以下の場合(ステップS1408:No)、画像処理装置101は、OCRで認識された文字の正しさをチェックするための文字チェック画面(例えば、図11参照)を表示する(ステップS1410)。そして、画像処理装置101は、回答の文字がOCRの文字認識結果と一致するというチェック結果の入力を受け付けたか否かを判断する(ステップS1411)。
In step S1407, if the distance value is equal to or greater than the distance threshold (step S1407: No), or if the adjacent difference is equal to or smaller than the adjacent difference threshold (step S1408: No), the
ここで、回答の文字がOCRの文字認識結果と一致するというチェック結果の入力を受け付けた場合(ステップS1411:Yes)、画像処理装置101は、ステップS1409に移行する。
If an input of a check result indicating that the response character matches the character recognition result of the OCR is received (step S1411: YES), the
一方、回答の文字がOCRの文字認識結果と一致しないというチェック結果とともに、正しい文字の選択を受け付けた場合(ステップS1411:No)、画像処理装置101は、選択された正しい文字と、特定した正答の文字とが一致するか否かを判定して(ステップS1412)、図15に示すステップS1502に移行する。
On the other hand, when the selection of the correct character is accepted together with the check result that the character of the answer does not match the character recognition result of the OCR (step S1411: No), the
図15のフローチャートにおいて、まず、画像処理装置101は、特定した学年、科目および設問パターンの組合せに対応付けて、特定した回答の文字の第1の文字との距離値、および、算出した第1の文字/第2の文字間の距離値の隣接差を距離値/隣接差テーブル1300に記録する(ステップS1501)。
In the flowchart of FIG. 15, first, the
つぎに、画像処理装置101は、小片画像情報の答案IDおよび設問IDと対応付けて、ステップS1409またはステップS1412において判定した判定結果を出力する(ステップS1502)。そして、画像処理装置101は、小片画像DB230から選択されていない未選択の小片画像情報があるか否かを判断する(ステップS1503)。
Next, the
ここで、未選択の小片画像情報がある場合(ステップS1503:Yes)、画像処理装置101は、図14に示したステップS1401に戻る。一方、未選択の小片画像情報がない場合(ステップS1503:No)、画像処理装置101は、距離値/隣接差テーブル1300を参照して、学年、科目および設問パターンの組合せごとに、各対象文字について、距離閾値、隣接差閾値を算出する(ステップS1504)。
If there is unselected small piece image information (step S1503: YES), the
そして、画像処理装置101は、算出した算出結果に基づいて、閾値テーブル250に記憶された各対象文字についての距離閾値、隣接差閾値を更新して(ステップS1505)、本フローチャートによる一連の処理を終了する。なお、画像処理装置101は、ステップS1502において出力した判定結果に基づいて、各児童の答案を採点して、各児童の答案の採点結果を出力することにしてもよい。
Then, the
これにより、学年、科目および設問パターンの組合せに対応する距離閾値、隣接差閾値を用いて、OCRで認識した文字の確からしさを検証することができる。また、第1の条件または第2の条件を満たさなかったものの、目視確認(目検)によって、回答の文字がOCRにより正しく認識されていたと判断されたときの距離値および距離値の隣接差を用いて、距離閾値および隣接差閾値を更新することができる。 Thereby, the probability of the character recognized by OCR can be verified using the distance threshold value and the adjacent difference threshold value corresponding to the combination of the grade, the subject, and the question pattern. In addition, although the first condition or the second condition is not satisfied, the distance value and the adjacent difference of the distance value when the character of the answer is determined to be correctly recognized by the OCR by visual check (visual inspection) Used to update the distance threshold and the adjacent difference threshold.
以上説明したように、実施の形態にかかる画像処理装置101によれば、答案の画像データからOCRにより第1の文字であると認識された設問に対する回答の文字の第1の文字との距離値を、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応する距離閾値と比較することができる。そして、画像処理装置101によれば、回答の文字の第1の文字との距離値が距離閾値よりも小さい場合に、回答の文字と設問の正答の文字とが一致するか否かを判定することができる。
As described above, according to the
これにより、学年、科目および設問パターンのうちの少なくともいずれかに対応する距離閾値を用いて、OCRで認識した文字の確からしさを検証して文字認識精度の向上を図ることができる。例えば、学年に対応する距離閾値を用いることで、学年の違いによって文字を書く能力が異なることを考慮して、OCRで認識した文字の確からしさを検証することができる。 Thereby, using the distance threshold corresponding to at least one of the school year, the subject, and the question pattern, the accuracy of the character recognized by the OCR can be verified to improve the character recognition accuracy. For example, by using the distance threshold corresponding to the grade, it is possible to verify the certainty of the character recognized by the OCR in consideration of the difference in the ability to write characters depending on the grade.
また、画像処理装置101によれば、回答の文字の第1の文字との距離値が距離閾値以上の場合、回答の文字の画像データを出力またはハイライト表示することができる。これにより、OCRで認識した文字が正しいとはいえない場合に、人手による目視確認(目検)を促すことができる。
Further, according to the
また、画像処理装置101によれば、出力またはハイライト表示した回答の文字の画像データに対して、回答の文字が第1の文字と一致するとの入力を受け付けた場合、回答の文字の第1の文字との距離値に基づいて、距離閾値を更新することができる。これにより、第1の条件は満たさなかったものの、人手による目視確認(目検)を実施したところ、答案に記入された回答の文字がOCRにより正しく認識されていたと判断されたときの距離値を用いて、距離閾値を更新することができる。
Further, according to the
具体的には、例えば、画像処理装置101は、第1の条件を満たすと判断された場合、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応付けて、回答の文字の第1の文字との距離値を記録する。また、画像処理装置101は、回答の文字が第1の文字と一致するとの入力を受け付けた場合、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応付けて、回答の文字の第1の文字との距離値を記録する。そして、画像処理装置101は、学年、科目および設問パターンのうちの少なくともいずれかに対応付けて記録した距離値の統計値(例えば、平均値、標準偏差など)に基づいて、距離閾値を更新する。
Specifically, for example, when the
これにより、画像処理システム200を運用しながら、OCRにより正しく認識されていたときの距離値を収集し、収集した距離値を用いて、学年、科目、設問パターン等の特性に応じた距離閾値を統計的に求めることができる。この結果、距離閾値が厳しくなりすぎたときは、目視確認で正しい文字であったと判断されることが多くなり、距離閾値が緩くなるように自動調整される。一方、距離閾値が緩くなりすぎたときは、分布が中央に寄り、距離閾値が厳しくなるように自動調整される。
Thereby, while operating the
また、画像処理装置101によれば、第1の文字/第2の文字間の距離値の隣接差を、答案及び/又は設問に対応付けた学年、科目および設問パターンのうちの少なくともいずれかに対応する第1の文字についての隣接差閾値と比較することができる。そして、画像処理装置101によれば、回答の文字の第1の文字との距離値が距離閾値よりも小さく、かつ、第1の文字/第2の文字間の距離値の隣接差が隣接差閾値よりも大きい場合に、回答の文字と設問の正答の文字とが一致するか否かを判定することができる。
Further, according to the
これにより、学年、科目および設問パターンのうちの少なくともいずれかに対応する対象文字ごとの隣接差閾値を用いて、2番目に一致度合いが高い文字(第2の文字)が正しい文字である可能性の高さを判断して、OCRで認識した文字の確からしさを検証することができる。 As a result, using the adjacent difference threshold value for each target character corresponding to at least one of the grade, subject, and question pattern, the second most likely character (second character) may be the correct character It is possible to verify the accuracy of the characters recognized by the OCR.
また、画像処理装置101によれば、第1の文字/第2の文字間の距離値の隣接差が隣接差閾値以下の場合に、回答の文字の画像データを出力またはハイライト表示することができる。これにより、第2の文字が正しい文字である可能性が無視できない程度にある場合に、人手による目視確認(目検)を促すことができる。
Further, according to the
また、画像処理装置101によれば、出力またはハイライト表示した回答の文字の画像データに対して、回答の文字が第1の文字と一致するとの入力を受け付けた場合、第1の文字/第2の文字間の距離値の隣接差に基づいて、隣接差閾値を更新することができる。これにより、第2の条件は満たさなかったものの、人手による目視確認(目検)を実施したところ、答案に記入された回答の文字がOCRにより正しく認識されていたと判断されたときの距離値の隣接差を用いて、隣接差閾値を更新することができる。
Also, according to the
また、画像処理装置101によれば、設問と対応付けて、判定した判定結果を出力することができる。これにより、各設問に対する回答の正否を特定することができ、例えば、児童ごとに答案の自動採点を行うことが可能となる。
Further, according to the
これらのことから、画像処理装置101によれば、学年、科目、設問パターン等の特性に応じた判断基準を用いて、OCRで認識した文字の確からしさを検証して文字認識精度の向上を図ることができる。これにより、小学生等を対象としたテストの答案についての文字認識精度を確保することが可能となり、ひいては、テストの自動採点の精度を向上させることができる。
Therefore, according to the
なお、本実施の形態で説明した画像処理方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本画像処理プログラムは、ハードディスク、フレキシブルディスク、CD(Compact Disc)−ROM、MO(Magneto−Optical disk)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本画像処理プログラムは、インターネット等のネットワークを介して配布してもよい。 The image processing method described in the present embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This image processing program is a computer-readable recording medium such as a hard disk, flexible disk, CD (Compact Disc) -ROM, MO (Magneto-Optical disk), DVD (Digital Versatile Disk), USB (Universal Serial Bus) memory, etc. And is executed by being read from the recording medium by a computer. The image processing program may be distributed via a network such as the Internet.
上述した実施の形態に関し、さらに以下の付記を開示する。 The following additional notes are disclosed with respect to the embodiment described above.
(付記1)答案の画像データからOCRにより第1の文字であると認識された設問に対する回答の文字の前記第1の文字との一致度を、記憶部に記憶した前記答案及び/又は前記設問に対応付けた学年、科目および設問の種別のうちの少なくともいずれかに対応する一致度の第1の閾値と比較し、
前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、
処理をコンピュータに実行させることを特徴とする画像処理プログラム。
(Supplementary Note 1) The answer and / or the question stored in the storage unit with the degree of coincidence of the answer character with the first character for the question recognized as the first character by OCR from the image data of the answer Compared to the first threshold of coincidence corresponding to at least one of the grade, subject and question type associated with
Determining whether the character of the answer matches the character of the correct answer of the question when the degree of coincidence of the character of the answer with the first character is greater than the first threshold;
An image processing program for causing a computer to execute processing.
(付記2)前記回答の文字の前記第1の文字との一致度が前記第1の閾値以下の場合、前記回答の文字の画像データを出力またはハイライト表示する、処理を前記コンピュータに実行させることを特徴とする付記1に記載の画像処理プログラム。
(Appendix 2) When the degree of coincidence between the character of the answer and the first character is equal to or less than the first threshold value, the image data of the character of the answer is output or highlighted, and the process is executed by the computer The image processing program according to
(付記3)出力またはハイライト表示した前記回答の文字の画像データに対して、前記回答の文字が前記第1の文字と一致するとの入力を受け付けた場合、前記回答の文字の前記第1の文字との一致度に基づいて、前記第1の閾値を更新する、処理を前記コンピュータに実行させることを特徴とする付記2に記載の画像処理プログラム。
(Supplementary Note 3) When an input indicating that the character of the answer matches the first character is received for the image data of the character of the answer that is output or highlighted, the first character of the character of the answer The image processing program according to
(付記4)前記記憶部は、前記答案及び/又は前記設問に対応付けた学年、科目および設問の種別のうちの少なくともいずれかに対応する前記第1の文字についての一致度の隣接差に関する第2の閾値をさらに記憶しており、
前記回答の文字の前記第1の文字との一致度と、前記回答の文字の第2の文字との一致度との差分を前記第2の閾値と比較する、処理を前記コンピュータに実行させ、
前記判定する処理は、
前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きく、かつ、前記差分が前記第2の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、ことを特徴とする付記1〜3のいずれか一つに記載の画像処理プログラム。
(Additional remark 4) The said memory | storage part is the 1st regarding the adjacent difference of the coincidence degree about the said 1st character corresponding to at least any one of the grade associated with the said answer and / or the said question, and the kind of question. 2 threshold values are further stored,
Causing the computer to execute a process of comparing the difference between the degree of coincidence of the character of the answer with the first character and the degree of coincidence of the character of the answer with the second character with the second threshold;
The determination process is as follows.
When the degree of coincidence between the character of the answer and the first character is greater than the first threshold and the difference is greater than the second threshold, the character of the answer and the correct answer of the
(付記5)前記設問と対応付けて、判定した判定結果を出力する、
処理を前記コンピュータに実行させることを特徴とする付記1〜4のいずれか一つに記載の画像処理プログラム。
(Supplementary Note 5) Output the determined determination result in association with the question.
The image processing program according to any one of
(付記6)前記回答の文字の前記第1の文字との一致度が前記第1の閾値以下の場合、または、前記差分が前記第2の閾値以下の場合、前記回答の文字の画像データを出力またはハイライト表示する、処理を前記コンピュータに実行させることを特徴とする付記4に記載の画像処理プログラム。
(Supplementary Note 6) When the degree of coincidence between the character of the answer and the first character is equal to or less than the first threshold value, or when the difference is equal to or less than the second threshold value, the image data of the character of the answer is The image processing program according to
(付記7)出力またはハイライト表示した前記回答の文字の画像データに対して、前記回答の文字が前記第1の文字と一致するとの入力を受け付けた場合、前記回答の文字の前記第1の文字との一致度と、前記回答の文字の前記第2の文字との一致度との差分に基づいて、前記第2の閾値を更新する、処理を前記コンピュータに実行させることを特徴とする付記6に記載の画像処理プログラム。 (Supplementary note 7) When an input indicating that the character of the answer matches the first character is received for the image data of the character of the answer that is output or highlighted, the first character of the character of the answer An additional note that causes the computer to execute a process of updating the second threshold based on a difference between a matching degree with a character and a matching degree between the reply character and the second character. 6. The image processing program according to 6.
(付記8)前記第1の文字は、OCRで認識する文字として予め登録された複数の文字のうち前記回答の文字との一致度が最大の文字であり、
前記第2の文字は、前記複数の文字のうち前記回答の文字との一致度が前記第1の文字のつぎに大きい文字である、
ことを特徴とする付記4に記載の画像処理プログラム。
(Supplementary Note 8) The first character is a character having a maximum coincidence with the character of the answer among a plurality of characters registered in advance as characters recognized by OCR,
The second character is a character having a degree of coincidence with the character of the answer among the plurality of characters next to the first character.
The image processing program according to
(付記9)答案の画像データからOCRにより第1の文字であると認識された設問に対する回答の文字の前記第1の文字との一致度を、記憶部に記憶した前記答案及び/又は前記設問に対応付けた学年、科目および設問の種別のうちの少なくともいずれかに対応する一致度の第1の閾値と比較し、
前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、
処理をコンピュータが実行することを特徴とする画像処理方法。
(Supplementary note 9) The answer and / or the question stored in the storage unit, the degree of coincidence of the answer character with the first character for the question recognized as the first character by OCR from the image data of the answer Compared to the first threshold of coincidence corresponding to at least one of the grade, subject and question type associated with
Determining whether the character of the answer matches the character of the correct answer of the question when the degree of coincidence of the character of the answer with the first character is greater than the first threshold;
An image processing method, wherein the computer executes the processing.
(付記10)答案の画像データからOCRにより第1の文字であると認識された設問に対する回答の文字の前記第1の文字との一致度を、記憶部に記憶した前記答案及び/又は前記設問に対応付けた学年、科目および設問の種別のうちの少なくともいずれかに対応する一致度の第1の閾値と比較し、
前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、
制御部を有することを特徴とする画像処理装置。
(Supplementary Note 10) The answer and / or the question stored in the storage unit with the degree of coincidence of the answer character with the first character for the question recognized as the first character by OCR from the image data of the answer Compared to the first threshold of coincidence corresponding to at least one of the grade, subject and question type associated with
Determining whether the character of the answer matches the character of the correct answer of the question when the degree of coincidence of the character of the answer with the first character is greater than the first threshold;
An image processing apparatus having a control unit.
101 画像処理装置
110 記憶部
200 画像処理システム
201 拠点端末
202 スキャナ
210 ネットワーク
220 答案画像DB
230 小片画像DB
240 正答テーブル
250 閾値テーブル
300 バス
301 CPU
302 メモリ
303 I/F
304 ディスクドライブ
305 ディスク
1001 取得部
1002 特定部
1003 判断部
1004 判定部
1005 出力部
1006 受付部
1007 記録部
1008 更新部
1100 文字チェック画面
1200 答案チェック画面
1300 距離値/隣接差テーブル
DESCRIPTION OF
230 Small Image DB
240 Correct answer table 250 Threshold table 300
302 Memory 303 I / F
304
Claims (7)
前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、
処理をコンピュータに実行させることを特徴とする画像処理プログラム。 The degree of coincidence between the character of the answer to the question recognized as the first character by OCR from the image data of the answer is associated with the answer and / or the question stored in the storage unit Compare with the first threshold of coincidence corresponding to at least one of grade, subject and question type,
Determining whether the character of the answer matches the character of the correct answer of the question when the degree of coincidence of the character of the answer with the first character is greater than the first threshold;
An image processing program for causing a computer to execute processing.
前記回答の文字の前記第1の文字との一致度と、前記回答の文字の第2の文字との一致度との差分を前記第2の閾値と比較する、処理を前記コンピュータに実行させ、
前記判定する処理は、
前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きく、かつ、前記差分が前記第2の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、ことを特徴とする請求項1〜3のいずれか一つに記載の画像処理プログラム。 The storage unit sets a second threshold value related to the adjacent difference in the degree of coincidence for the first character corresponding to at least one of a grade, a subject, and a question type associated with the answer and / or the question. And remember
Causing the computer to execute a process of comparing the difference between the degree of coincidence of the character of the answer with the first character and the degree of coincidence of the character of the answer with the second character with the second threshold;
The determination process is as follows.
When the degree of coincidence between the character of the answer and the first character is greater than the first threshold and the difference is greater than the second threshold, the character of the answer and the correct answer of the question The image processing program according to claim 1, wherein it is determined whether or not the character matches.
処理を前記コンピュータに実行させることを特徴とする請求項1〜4のいずれか一つに記載の画像処理プログラム。 Output the determination result determined in association with the question,
The image processing program according to claim 1, wherein the computer executes the process.
前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、
処理をコンピュータが実行することを特徴とする画像処理方法。 The degree of coincidence between the character of the answer to the question recognized as the first character by OCR from the image data of the answer is associated with the answer and / or the question stored in the storage unit Compare with the first threshold of coincidence corresponding to at least one of grade, subject and question type,
Determining whether the character of the answer matches the character of the correct answer of the question when the degree of coincidence of the character of the answer with the first character is greater than the first threshold;
An image processing method, wherein the computer executes the processing.
前記回答の文字の前記第1の文字との一致度が前記第1の閾値よりも大きい場合に、前記回答の文字と前記設問の正答の文字とが一致するか否かを判定する、
制御部を有することを特徴とする画像処理装置。 The degree of coincidence between the character of the answer to the question recognized as the first character by OCR from the image data of the answer is associated with the answer and / or the question stored in the storage unit Compare with the first threshold of coincidence corresponding to at least one of grade, subject and question type,
Determining whether the character of the answer matches the character of the correct answer of the question when the degree of coincidence of the character of the answer with the first character is greater than the first threshold;
An image processing apparatus having a control unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018013219A JP6984447B2 (en) | 2018-01-30 | 2018-01-30 | Image processing program, image processing method and image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018013219A JP6984447B2 (en) | 2018-01-30 | 2018-01-30 | Image processing program, image processing method and image processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019133289A true JP2019133289A (en) | 2019-08-08 |
JP6984447B2 JP6984447B2 (en) | 2021-12-22 |
Family
ID=67546240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018013219A Active JP6984447B2 (en) | 2018-01-30 | 2018-01-30 | Image processing program, image processing method and image processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6984447B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381099A (en) * | 2020-11-24 | 2021-02-19 | 中教云智数字科技有限公司 | Question recording system based on digital education resources |
CN117894033A (en) * | 2024-03-14 | 2024-04-16 | 山东山大鸥玛软件股份有限公司 | Method and system for checking consistency of answer sheets based on OCR (optical character recognition) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10134146A (en) * | 1996-10-29 | 1998-05-22 | Matsushita Electric Ind Co Ltd | Chinese character recognition device |
JPH1153476A (en) * | 1997-07-31 | 1999-02-26 | Mitsubishi Electric Corp | Character recognition device |
JP2009276709A (en) * | 2008-05-19 | 2009-11-26 | Fujitsu Ltd | Learning support system, program, and learning support method |
JP2010230988A (en) * | 2009-03-27 | 2010-10-14 | Nippon Tokei Jimu Center:Kk | Scoring device and program |
JP2013105331A (en) * | 2011-11-14 | 2013-05-30 | Canon Marketing Japan Inc | Information processor, information processing system, control method, and program thereof |
JP2015161892A (en) * | 2014-02-28 | 2015-09-07 | 大日本印刷株式会社 | Analysis device and program |
WO2017104805A1 (en) * | 2015-12-18 | 2017-06-22 | 国立大学法人東京農工大学 | Program, information storage medium, and character string recognition device |
-
2018
- 2018-01-30 JP JP2018013219A patent/JP6984447B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10134146A (en) * | 1996-10-29 | 1998-05-22 | Matsushita Electric Ind Co Ltd | Chinese character recognition device |
JPH1153476A (en) * | 1997-07-31 | 1999-02-26 | Mitsubishi Electric Corp | Character recognition device |
JP2009276709A (en) * | 2008-05-19 | 2009-11-26 | Fujitsu Ltd | Learning support system, program, and learning support method |
JP2010230988A (en) * | 2009-03-27 | 2010-10-14 | Nippon Tokei Jimu Center:Kk | Scoring device and program |
JP2013105331A (en) * | 2011-11-14 | 2013-05-30 | Canon Marketing Japan Inc | Information processor, information processing system, control method, and program thereof |
JP2015161892A (en) * | 2014-02-28 | 2015-09-07 | 大日本印刷株式会社 | Analysis device and program |
WO2017104805A1 (en) * | 2015-12-18 | 2017-06-22 | 国立大学法人東京農工大学 | Program, information storage medium, and character string recognition device |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381099A (en) * | 2020-11-24 | 2021-02-19 | 中教云智数字科技有限公司 | Question recording system based on digital education resources |
CN117894033A (en) * | 2024-03-14 | 2024-04-16 | 山东山大鸥玛软件股份有限公司 | Method and system for checking consistency of answer sheets based on OCR (optical character recognition) |
CN117894033B (en) * | 2024-03-14 | 2024-05-28 | 山东山大鸥玛软件股份有限公司 | Method and system for checking consistency of answer sheets based on OCR (optical character recognition) |
Also Published As
Publication number | Publication date |
---|---|
JP6984447B2 (en) | 2021-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8781172B2 (en) | Methods and systems for enhancing the performance of automated license plate recognition applications utilizing multiple results | |
US5889897A (en) | Methodology for OCR error checking through text image regeneration | |
RU2613734C1 (en) | Video capture in data input scenario | |
JP6528147B2 (en) | Accounting data entry support system, method and program | |
CN115204110A (en) | Extracting searchable information from digitized documents | |
US8768241B2 (en) | System and method for representing digital assessments | |
KR102004180B1 (en) | Apparatus and method for extracting similar test problem using recognition of test paper | |
WO2019194028A1 (en) | Image processing device, image processing method, and storage medium for storing program | |
RU2571396C2 (en) | Method and system for verification during reading | |
CN110785773A (en) | Bill recognition system | |
JP2007179395A (en) | Medium processing apparatus, method and system, and computer readable recording medium for recording medium processing program | |
CN111783855A (en) | Intelligent marking method and device | |
EP3757881A1 (en) | Documentation determination device and documentation determination program | |
JP6984447B2 (en) | Image processing program, image processing method and image processing device | |
JP6146209B2 (en) | Information processing apparatus, character recognition method, and program | |
JP2008020506A (en) | Image processor and image processing program | |
KR102282025B1 (en) | Method for automatically sorting documents and extracting characters by using computer | |
JP5634972B2 (en) | Method, computer program product and system for text segmentation | |
JP6217407B2 (en) | Information processing system, information processing apparatus, and program | |
KR100351584B1 (en) | System of proofreading a Chinese character by contrasting one by one | |
JP7021496B2 (en) | Information processing equipment and programs | |
US20150178559A1 (en) | Chinese, japanese, or korean language detection | |
US20210264218A1 (en) | Character recognition system and method | |
JP4807486B2 (en) | Teaching material processing apparatus, teaching material processing method, and teaching material processing program | |
JP2021012741A (en) | Image processor, method for processing image, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211014 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6984447 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |