JP3957848B2 - COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY - Google Patents

COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY Download PDF

Info

Publication number
JP3957848B2
JP3957848B2 JP35851997A JP35851997A JP3957848B2 JP 3957848 B2 JP3957848 B2 JP 3957848B2 JP 35851997 A JP35851997 A JP 35851997A JP 35851997 A JP35851997 A JP 35851997A JP 3957848 B2 JP3957848 B2 JP 3957848B2
Authority
JP
Japan
Prior art keywords
recognition
threshold
character
area
recognition area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP35851997A
Other languages
Japanese (ja)
Other versions
JPH11191134A (en
Inventor
北洋 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP35851997A priority Critical patent/JP3957848B2/en
Priority to US09/212,434 priority patent/US6891972B2/en
Publication of JPH11191134A publication Critical patent/JPH11191134A/en
Priority to US11/081,504 priority patent/US7440617B2/en
Application granted granted Critical
Publication of JP3957848B2 publication Critical patent/JP3957848B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、端末と中央制御装置間で通信を行う通信システム及びその制御方法、コンピュータ可読メモリに関するものである。
【0002】
【従来の技術】
一般に、文字認識装置を有する端末は、端末における文字認識結果を中央制御装置に転送し、そこで、文字認識結果の誤り訂正、検索、保存などの後処理を行う。この際、端末側で文字認識候補の精度が低いと判定した場合は、その文字認識候補を認識不能として所定の識別子(以下、リジェクトコードと称する)を中央制御装置へ送信し、認識不能である旨を知らせていた。
【0003】
リジェクトコードは、個々の認識侯補文字の確からしさ(以下、類似度と称する)を算出し、それが所定の閾値より低い場合に、認識不能と判定される。従って、図4に示すように、一般にリジェクトコードが発生する度合い(以下、リジェクト率と称する)が高い場合、即ち、類似度の閾値が高い場合、相対的に認識可能と判断される文字の類似度が高くなりその正解率も高い。反対に、リジェクト率が低い場合は、認識可能と判断されてもその文字の正解率は低くなる傾向にある。
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来の端末と中央制御装置間で通信を行う通信システムでは、リジェクト率は通信システム固有のもの、即ち、類似度の閾値が固定である。そのため、例えば、端末の認識対象である原稿画像内に異なるフォントの文字が混在して認識精度が同一原稿画像内で大きく変化してしまう場合、中央制御装置側としてはそれに対しなんら対処することができず、後処理の効率低下は免れなかった。
【0005】
本発明は上記の問題点に鑑みてなされたものであり、文字認識を行う端末と中央制御装置間で通信を行う通信システムにおいて、処理効率を向上することができる通信システム及びその制御方法、コンピュータ可読メモリを提供することを目的とする。
【0006】
【課題を解決するための手段】
上記の目的を達成するための本発明による通信システムは以下の構成を備える。即ち、
端末と中央制御装置間で通信を行う通信システムであって、
前記端末は、
原稿を画像データとして読み取る読取手段と、
前記読取手段で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識手段と、
前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識手段で認識された前記各認識領域内の各文字画像の文字認識結果を送信する文字認識結果送信手段と、
前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定手段と、を備え、
前記中央制御装置は、
前記端末より前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果を受信する文字認識結果受信手段と、
前記文字認識結果受信手段受信した前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果に基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御手段と、
前記閾値制御手段で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信手段と、
を備える。
【0007】
また、好ましくは、前記閾値制御手段は、前記文字認識結果受信手段で受信した前記文字認識結果に基づいて、当該認識領域内で認識不能と判断された文字数が前記第1閾値未満かつ前記第2閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた前記認識不能判定用閾値が適当な値であると決定する
【0013】
上記の目的を達成するための本発明による通信システムの制御方法は以下の構成を備える。即ち、
端末と中央制御装置間で通信を行う通信システムの制御方法であって、
前記端末において、原稿を画像データとして読み取る読取工程と、
前記端末において、前記読取工程で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識工程と、
前記端末から、前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識工程で認識された前記各認識領域内の各文字画像の文字認識結果を送信する文字認識結果送信工程と、
前記端末において、前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定工程と、を備え、
前記中央制御装置において、前記端末より前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果を受信する文字認識結果受信工程と、
前記中央制御装置において、前記文字認識結果受信工程受信した前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果に基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御工程と、
前記中央制御装置から、前記閾値制御工程で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信工程と、
を備える。
【0014】
上記の目的を達成するための本発明によるコンピュータ可読メモリは以下の構成を備える。即ち、
端末と中央制御装置間で通信を行う通信システムの制御をコンピュータに実行させるためのプログラムを記録したコンピュータ可読メモリであって、
前記端末において、原稿を画像データとして読み取る読取工程と、
前記端末において、前記読取工程で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識工程と、
前記端末から、前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識工程で認識された前記各認識領域内の各文字画像の文字認識結果を送信する文字認識結果送信工程と、
前記端末において、前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定工程と、を備え、
前記中央制御装置において、前記端末より前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果を受信する文字認識結果受信工程と、
前記中央制御装置において、前記文字認識結果受信工程受信した前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果に基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御工程と、
前記中央制御装置から、前記閾値制御工程で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信工程と、
をコンピュータに実行させるためのプログラムを記録したことを特徴とする。
【0015】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
【0016】
図1は本発明の実施形態の通信システムの構成を示す図である。
【0017】
図1に示すように、通信システムは移動端末100と中央制御装置200から構成される。また、移動端末100と中央制御装置200は無線ネットワーク300を通して結ばれている。尚、ここでは、1台の移動端末100と中央制御装置200で構成されているが、移動端末100を複数構成した場合にも、本発明は適用される。そして、複数の移動端末100の各移動端末が中央制御装置200と通信を行う場合には、各移動端末を識別できるように、例えば、互いに異なる識別信号を中央制御装置200に発行してから通信を開始することで、中央制御装置200は各移動端末を識別することができる。
【0018】
移動端末100において、102は読取原稿である。104は読取原稿102を読み取り、画像信号を生成するスキャナである。106はスキャナ104で生成された画像信号の認識領域を認識し、その認識された認識領域に対し文字認識を認識用辞書106aを用いて行う文字認識部である。106bは文字認識部106が出力する文字認識候補文字が認識不能であるか否かを認識不能判定用閾値に基づいて判定する認識不能判定部である。108は文字認識部106による文字認識結果及び認識領域を示す位置情報を中央制御装置200へ送信する文字認識結果送信部である。110は画像信号の認識領域を示す位置情報と、その認識領域の認識不能判定用閾値とを中央制御装置200より受信する閾値・位置情報受信部である。
【0019】
中央制御装置200において、202は文字認識結果及び位置情報を移動端末100より受信する文字認識結果受信部である。208は文字認識結果受信部202で受信した文字認識結果の後処理を行う文字認識結果後処理部である。208aは文字認識結果後処理部208による処理結果等のデータを保存する保存部である。210は文字認識結果後処理部208による処理結果を表示する表示部である。204は文字認識結果受信部202で受信された位置情報が示す認識対象の画像信号中の各認識領域の文字認識結果の多寡を判定し、移動端末100の認識不能判定部106bにおける各認識領域の最適な認識不能判定用閾値を設定する閾値制御部である。206は閾値制御部204で設定された画像信号中の各認識領域の位置情報及び認識不能判定用閾値を移動端末100へ送信する閾値・位置情報送信部である。
【0020】
尚、移動端末100、中央制御装置200には、それぞれ不図示のCPU、RAM、ROMが搭載されており、各端末に搭載されるCPUは、ROMに記憶されている装置を制御するための各種プログラムをRAMに展開して実行する。また、RAMはデータの作業領域、一時退避領域としても機能する。
【0021】
次に、本実施形態の通信システムの動作について、図1を用いて説明する。
【0022】
移動端末100側で準備された読取原稿102は、スキャナ104にて読取原稿102に対応する画像信号を生成する。生成した画像信号は文字認識部106に送られ、認識領域を認識し、その認識された認識領域の文字認識を行う。閾値・位置情報受信部110は、無線ネットワーク300を介して、中央制御装置200の閾値制御部204において設定された認識対象の画像信号中の各認識領域の位置情報及び認識不能判定用閾値を受信する。ここで、文字認識部106では、閾値・位置情報受信部110が受信した画像信号中の各認識領域の認識不能判定用閾値と、その各認識領域内の認識候補文字の類似度を比較する。比較の結果、認識不能判定用閾値よりも認識候補文字の類似度が大きい場合は、その認識候補文字に対応する文字コードを認識結果として出力する。一方、認識不能判定用閾値より認識候補文字の類似度が小さい場合は、認識不能として所定のリジェクトコードを出力する。尚、文字認識部106で実行される処理の詳細については、後述する。文字認識結果送信部108は、文字認識部106による文字認識結果である文字コード及び認識不能を示すリジェクトコード、認識領域を示す位置情報を中央制御装置200に無線ネットワーク300を介して送信する。
【0023】
一方、中央制御装置200では、まず、移動端末100から送信された文字認識結果及び位置情報を文字認識結果受信部202において受信する。受信した文字認識結果は、文字認識結果後処理部208で訂正、保存部208aの保存、文字認識結果をキーにした保存部208aに保存されているデータの検索等の処理を行い、その処理結果を表示部210に表示する。閾値制御部204では、受信した位置情報が示す各認識領域の文字認識結果に基づいて、各認識領域に最適な認識不能判定用閾値を設定する。尚、閾値制御部204で実行される処理の詳細については、後述する。閾値制御部204で設定した認識対象の画像信号の各認識領域の認識不能判定用閾値及び位置情報は、閾値・位置情報送信部206により移動端末100へ無線ネットワーク300を介して送信する。
【0024】
次に、本発明で実行される処理について、図2、図3を用いて説明する。尚、ここでは、特に、本発明の主眼となる文字認識部106及び閾値制御部204で実行される処理の詳細について説明する。
【0025】
図2は本発明の実施形態の文字認識部で実行される処理を示すフローチャートである。
【0026】
まず、ステップS300で、移動端末100内の文字認識部106は、スキャナ104から入力された画像信号から文字を切り出す文字抽出を行う。ステップS301で、画像信号中の認識領域を認識する。そして、認識された認識領域に基づいて、ステップS300で抽出された文字が、どの認識領域に属するかを判別する。ステップS302で、ステップS300で抽出された文字から所定の特徴抽出を行う。ステップS304で、認識対象文字と認識用辞書106a内の学習文字との類似度をステップS302で抽出された特徴を元に算出する。ステップS306で、認識候補文字をその類似度の大きい方から所定の数(認識候補文字数)だけ選択し、ソーティングする。また、この候補文字数は、認識候補文字数レジスタ(不図示)にセットされる。
【0027】
ステップS308で、認識不能判定部106bによって、認識候補文字の第1候補、即ち、類似度が最も大きい認識候補文字の類似度と、その認識候補文字が含まれる認識領域の認識不能判定用閾値とを比較する。第1候補の類似度がその認識候補文字が含まれる認識領域の認識不能判定用閾値より小さい場合(ステップS308でNO)、ステップS310に進み、認識対象文字を認識不能として、所定の識別子、即ち、リジェクトコードを出力する。一方、第1候補の類似度がその認識候補文字が含まれる認識領域の認識不能判定用閾値より大きい場合(ステップS308でYES)、最低1個の文字認識結果は出力できるので、認識成功として、ステップS312に進む。
【0028】
ステップS312で、認識候補文字の処理数をカウントする認識候補文字数カウンタi(不図示)に2を代入する。ステップS314で、認識侯補文字数カウンタiの内容が、認識候補文字数レジスタにセットされた認識候補文字数を超えたか否かを判定する。認識候補文字数カウンタの内容が認識候補文字数を超えている場合(ステップS314でYES)、それ以上の認識候補文字はないので以後の処理を中止し、ステップS316に進む。そして、ステップS316で、類似度が認識不能判定用閾値を超えている認識候補文字に対応する文字コードをすべて出力する。一方、認識候補文字数カウンタiの内容が候補文字数を越えていない場合(ステップS314でNO)、ステップS318へ進む。
【0029】
ステップS318で、第i候補の類似度と、その認識候補文字が含まれる認識領域の認識不能判定用閾値とを比較する。第i候補の類似度がその認識候補文字が含まれる認識領域の認識不能判定用閾値より小さい場合(ステップS318でNO)、第i候補以降の候補文字は認識不能として、ステップS316に進む。一方、第i候補の類似度がその認識候補文字が含まれる認識領域の認識不能判定用閾値より大きい場合(ステップS318でYES)、ステップS320に進み、認識候補文字数カウンタiをインクリメントし、ステップS314に戻る。
【0030】
尚、認識候補文字数レジスタ、認識候補文字数カウンタは、それぞれ中央制御装置200において、例えば、装置に搭載されているRAM上で実現されたり、専用のハードウェアで構成することで実現される。
【0031】
以上の処理によって、画像信号の各認識領域において判定されたリジェクト率は図4に示すような傾向を持つ。即ち、リジェクト率が高い場合は、認識可能と判断された文字の正解率は向上するが、その絶対数は少ない。逆に、リジェクト率が低い場合は、認識可能と判断される文字数は多いが、文字の正解率も低下する。そこで、本発明では、最適なリジェクト率で移動端末100での文字認識が実行されるように、移動端末100の文字認識部106の各認識領域の文字認識結果に基づいて、画像信号の各認識領域の最適な認識不能判定用閾値を中央制御装置200の閾値制御部04で再設定する。
【0032】
図3は本発明の実施形態の閾値制御部で実行される処理を示すフローチャートである。
【0033】
ステップS400で、画像信号中の処理対象の認識領域を示す認識領域ポインタiを初期化する。また、画像信号中の各認識領域には、番号が順番に付加され、認識領域ポインタiが示す値に従って、各認識領域の処理を行う。更に、画像信号中の認識領域数が認識領域数レジスタに記憶される。ステップ402で、文字認識結果受信部202で受信された文字認識結果及び位置情報に基づいて、認識領域ポインタiが示す第i領域に対応する認識領域の認識不能文字数(リジェクトコード)が第1の閾値TH1以上である否かを判定する。認識不能文字数が第1の閾値TH1以上である場合(ステップS402でYES)、移動端末100のスキャナ104の第i領域に対応する認識領域の読み取り状態が何らかの理由で悪化したと判断し、ステップS406へ進む。そして、ステップ406で、認識可能文字数を増加させるために、移動端末100の認識不能判定部106bで設定されている現在の第i領域に対応する認識領域の認識不能判定用閾値よりも減少させた認識不能判定用閾値を再設定する。その後、処理を終了する。
【0034】
一方、第i領域に対応する認識領域の認識不能文字数が第1の閾値TH1未満である場合(ステップS402でNO)、ステップS404に進む。ステップS404で、認識不能文字数が第2の閾値TH2(<TH1)未満であるか否かを判定する。認識不能文字数が第2の閾値TH2未満である場合(ステップS404でYES)、文字認識結果の正解率が悪化したと判断し、ステップ408へ進む。そして、ステップ408で、認識結果の正解率を向上させるために、移動端末100の認識不能判定部106bで設定されている現在の第i領域に対応する認識領域の認識不能判定用閾値よりも増加させた認識不能判定用閾値を再設定する。その後、処理を終了する。
【0035】
一方、第i領域に対応する認識領域の認識不能文字数が第2の閾値TH2以上である場合(ステップS40でNO)、移動端末100の認識不能判定部106bで設定されている現在の第i領域に対応する認識領域の認識不能判定用閾値が適当であると判断し、処理を終了する。
【0036】
ステップS410で、画像信号中の認識領域のすべてについて、認識不能判定用閾値の設定が終了したか否かを判定する。つまり、認識領域ポインタiが示す値と認識領域数レジスタに記憶される値が同じであるか否かを判定する。認識不能判定用閾値の設定が終了した場合(ステップS410でYES)、処理を終了する。一方、認識不能判定用閾値の設定が終了していない場合(ステップS410でNO)、ステップS412に進む。ステップS412で、認識領域ポインタiの値を1つ進め、ステップS402に戻る。
【0037】
尚、認識領域ポインタ、認識領域数レジスタは、それぞれ中央御装置200において、例えば、装置に搭載されているRAM上で実現されたり、専用のハードウェアで構成することで実現される。
【0038】
以上説明したように本発明によれば、中央制御装置200が移動端末100より入力された文字認識結果及び認識領域に基づいて、移動端末100で入力された画像信号の各認識領域毎に最適な認識不能判定用閾値を設定することができるので、各認識領域の認識精度を向上することができる。特に、処理対象の同一読取原稿内で筆記者の異なる文字、あるいは異なるフォントが混在するような場合、あるいは読取原稿のフォーマットが変化した場合でも、その読取原稿に対する文字認識を精度良く行うことができ、処理の効率を大幅に向上させることができる。
【0039】
上記実施形態では、移動端末100の文字認識部106が出力する認識候補文字数を複数としたが、これに限定されない。例えば、類似度が最も大きい認識候補文字を唯一の認識候補文字とし、それに対し認識不能判定部106bによる判定を行ってもよい。この場合、処理の高速化を図ることができる。
【0040】
上記実施形態では、無線ネットワーク300により結ばれた移動端末100、中央制御装置200から構成される通信システムを例に挙げて説明したが、これに限定されるものではない。例えば、有線ネットワークで結ばれた端末、中央制御装置で構成される通信システムでも何ら問題ない。
【0041】
尚、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0042】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0043】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0044】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0045】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0046】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0047】
【発明の効果】
以上説明したように、本発明によれば、文字認識を行う端末と中央制御装置間で通信を行う通信システムにおいて、処理効率を向上することができる通信システム及びその制御方法、コンピュータ可読メモリを提供できる。
【0048】
【図面の簡単な説明】
【図1】本発明の実施形態の通信システムの構成を示す図である。
【図2】本発明の実施形態の文字認識部で実行される処理を示すフローチャートである。
【図3】本発明の実施形態の閾値制御部で実行される処理を示すフローチャートである。
【図4】リジェクト率と認識文字精度の関係を示す図である。
【符号の説明】
100 端末
200 中央制御装置
300 無線ネットワーク
104 スキャナ
106 文字認識部
106a 認識用辞書
106b 認識不能判定部
108 文字認識結果送信部
110 閾値・位置情報受信部
202 文字認識結果受信部
204 閾値制御部
206 閾値・位置情報送信部
208 文字認識結果後処理部
208a 保存部
210 表示部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a communication system that performs communication between a terminal and a central control device, a control method thereof, and a computer-readable memory.
[0002]
[Prior art]
In general, a terminal having a character recognition device transfers a character recognition result at the terminal to a central control device, where post-processing such as error correction, search, and storage of the character recognition result is performed. At this time, if it is determined that the accuracy of the character recognition candidate is low on the terminal side, the character recognition candidate is unrecognizable and a predetermined identifier (hereinafter referred to as a reject code) is transmitted to the central control unit, which is not recognizable. I was informed.
[0003]
The reject code calculates the likelihood (hereinafter referred to as similarity) of each recognized supplementary character, and is determined to be unrecognizable when it is lower than a predetermined threshold. Therefore, as shown in FIG. 4, when the degree of occurrence of a reject code (hereinafter referred to as a rejection rate) is generally high, that is, when the similarity threshold is high, the similarity of characters that are determined to be relatively recognizable. The degree of accuracy increases and the accuracy rate is high. On the other hand, when the rejection rate is low, even if it is determined that recognition is possible, the accuracy rate of the character tends to be low.
[0004]
[Problems to be solved by the invention]
However, in the communication system in which communication is performed between the conventional terminal and the central control device, the rejection rate is unique to the communication system, that is, the similarity threshold is fixed. For this reason, for example, when characters of different fonts are mixed in the document image to be recognized by the terminal and the recognition accuracy changes greatly in the same document image, the central controller side can deal with it. It was not possible to avoid a reduction in post-processing efficiency.
[0005]
The present invention has been made in view of the above problems, and in a communication system that performs communication between a terminal that performs character recognition and a central controller, a communication system that can improve processing efficiency, a control method therefor, and a computer An object is to provide a readable memory.
[0006]
[Means for Solving the Problems]
In order to achieve the above object, a communication system according to the present invention comprises the following arrangement. That is,
A communication system that performs communication between a terminal and a central controller,
The terminal
Reading means for reading a document as image data;
The image data read by the reading unit is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area by using a recognition dictionary. The recognition candidate character and its similarity are calculated, and when the calculated similarity is equal to or less than the recognition-unrecognition determination threshold of the recognition area, it is output as a character recognition result indicating that the recognition is impossible. A character recognition unit that outputs the recognition candidate character as a character recognition result when the recognition area is larger than the recognition-recognition determination threshold;
A character recognition result transmission means for transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition means for indicating the location of the region to,
When receiving the unrecognized determination threshold for resetting any of the recognition areas from the central control unit, reset the unrecognizable determination threshold for the recognition area with the unrecognizable determination threshold for resetting Threshold reception setting means for
The central controller is
A character recognition result receiving means for receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
Based on said character recognition result character recognition of the received by the receiving means and the position information indicating the position of each recognition area each character image in said each recognition area results for each of the recognition region, the recognition area When it is determined that the number of characters determined to be unrecognizable in step S1 is equal to or greater than the first threshold, a value lower than the threshold for determining unrecognition of the recognition area used when obtaining the character recognition result in the recognition area When it is determined that the number of characters determined to be unrecognizable in the recognition area is smaller than the second threshold and less than the second threshold, the recognition is determined. Threshold control means for determining, as the unrecognition determination threshold for resetting the recognition area, a value higher than the recognition unrecognition determination threshold of the recognition area used when obtaining the character recognition result in the area;
Threshold transmission means for transmitting to the terminal a threshold for determination of unrecognition for resetting the recognition area determined by the threshold control means;
Is provided.
[0007]
Preferably, the threshold control means is configured such that the number of characters determined to be unrecognizable within the recognition area based on the character recognition result received by the character recognition result receiving means is less than the first threshold and the second If it is determined that the threshold value is equal to or greater than the threshold value, it is determined that the unrecognizable determination threshold value used when obtaining the character recognition result in the recognition area is an appropriate value .
[0013]
In order to achieve the above object, a control method for a communication system according to the present invention comprises the following arrangement. That is,
A control method of a communication system for performing communication between a terminal and a central control device,
In the terminal, a reading process of reading a document as image data;
In the terminal, the image data read in the reading step is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area using a recognition dictionary. The recognition candidate character for each character image and its similarity are calculated, and if the calculated similarity is less than or equal to the recognition unrecognition threshold for the recognition area, the recognition is output as a character recognition result, and the calculation is performed. A character recognition step of outputting the recognition candidate character as a character recognition result when the similarity is greater than the recognition-unrecognition determination threshold of the recognition region ;
From the terminal, and the character recognition result transmission step of transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition process shown the location of the region to ,
In the terminal, when a threshold value for non-recognition determination for resetting one of the recognition areas is received from the central control unit , the threshold value for non-recognition determination for the recognition area is used for the non-recognition determination for resetting. A threshold reception setting step for resetting with a threshold, and
In the central control device, a character recognition result reception step of receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
In the central control unit, on the basis of the received in the character recognition result reception step into a character recognition result of each character image position information indicating a position and of the respective recognition region of each recognition area, with respect to each of the recognition region When it is determined that the number of characters determined to be unrecognizable in the recognition area is greater than or equal to the first threshold, the recognition area non-recognition threshold used for obtaining the character recognition result in the recognition area A lower value than the first threshold is determined, and a lower value is determined as a threshold for determining the unrecognition for resetting the recognition area, and the number of characters determined to be unrecognizable in the recognition area is less than a second threshold smaller than the first threshold. In such a case, a value higher than the recognition-unrecognition threshold value for the recognition area used when obtaining the character recognition result in the recognition area is set as the re-recognition determination threshold value for the recognition area. A threshold control step of determining,
A threshold transmission step of transmitting, from the central control device, a threshold for determination of unrecognition for resetting the recognition area determined in the threshold control step to the terminal;
Is provided.
[0014]
In order to achieve the above object, a computer readable memory according to the present invention comprises the following arrangement. That is,
A computer-readable memory storing a program for causing a computer to execute control of a communication system that performs communication between a terminal and a central control device,
In the terminal, a reading process of reading a document as image data;
In the terminal, the image data read in the reading step is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area using a recognition dictionary. The recognition candidate character for each character image and its similarity are calculated, and if the calculated similarity is less than or equal to the recognition unrecognition threshold for the recognition area, the recognition is output as a character recognition result, and the calculation is performed. A character recognition step of outputting the recognition candidate character as a character recognition result when the similarity is greater than the recognition-unrecognition determination threshold of the recognition region ;
From the terminal, and the character recognition result transmission step of transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition process shown the location of the region to ,
In the terminal, when a threshold value for non-recognition determination for resetting one of the recognition areas is received from the central control unit , the threshold value for non-recognition determination for the recognition area is used for the non-recognition determination for resetting. A threshold reception setting step for resetting with a threshold, and
In the central control device, a character recognition result reception step of receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
In the central control unit, on the basis of the received in the character recognition result reception step into a character recognition result of each character image position information indicating a position and of the respective recognition region of each recognition area, with respect to each of the recognition region When it is determined that the number of characters determined to be unrecognizable in the recognition area is greater than or equal to the first threshold, the recognition area non-recognition threshold used for obtaining the character recognition result in the recognition area A lower value than the first threshold is determined, and a lower value is determined as a threshold for determining the unrecognition for resetting the recognition area, and the number of characters determined to be unrecognizable in the recognition area is less than a second threshold smaller than the first threshold. In such a case, a value higher than the recognition-unrecognition threshold value for the recognition area used when obtaining the character recognition result in the recognition area is set as the re-recognition determination threshold value for the recognition area. A threshold control step of determining,
A threshold transmission step of transmitting, from the central control device, a threshold for determination of unrecognition for resetting the recognition area determined in the threshold control step to the terminal;
A program for causing a computer to execute is recorded.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings.
[0016]
FIG. 1 is a diagram showing a configuration of a communication system according to an embodiment of the present invention.
[0017]
As shown in FIG. 1, the communication system includes a mobile terminal 100 and a central control device 200. Further, the mobile terminal 100 and the central control device 200 are connected through a wireless network 300. Note that, here, the mobile terminal 100 and the central controller 200 are configured, but the present invention is also applied to a case where a plurality of mobile terminals 100 are configured. Then, when each mobile terminal of the plurality of mobile terminals 100 communicates with the central control apparatus 200, for example, a communication is performed after issuing different identification signals to the central control apparatus 200 so that each mobile terminal can be identified. Is started, the central controller 200 can identify each mobile terminal.
[0018]
In the mobile terminal 100, reference numeral 102 denotes a read original. A scanner 104 reads the read original 102 and generates an image signal. A character recognition unit 106 recognizes the recognition area of the image signal generated by the scanner 104 and performs character recognition on the recognized recognition area using the recognition dictionary 106a. Reference numeral 106b denotes an unrecognizable determination unit that determines whether or not the character recognition candidate character output from the character recognition unit 106 is unrecognizable based on the unrecognized determination threshold. A character recognition result transmission unit 108 transmits the character recognition result by the character recognition unit 106 and position information indicating the recognition area to the central control device 200. Reference numeral 110 denotes a threshold / position information receiving unit that receives position information indicating a recognition area of an image signal and a threshold for determining whether or not the recognition area is recognized from the central controller 200.
[0019]
In the central controller 200, 202 is a character recognition result receiving unit that receives a character recognition result and position information from the mobile terminal 100. A character recognition result post-processing unit 208 performs post-processing of the character recognition result received by the character recognition result receiving unit 202. A storage unit 208 a stores data such as processing results by the character recognition result post-processing unit 208. Reference numeral 210 denotes a display unit that displays a processing result obtained by the character recognition result post-processing unit 208. 204 determines the number of character recognition results in each recognition area in the recognition target image signal indicated by the position information received by the character recognition result receiving unit 202, and the recognition area determination unit 106 b of the mobile terminal 100 recognizes each recognition area. It is a threshold value control part which sets the optimal threshold value for recognition failure determination. Reference numeral 206 denotes a threshold / position information transmission unit that transmits the position information of each recognition area in the image signal set by the threshold control unit 204 and the threshold for recognition failure determination to the mobile terminal 100.
[0020]
Note that the mobile terminal 100 and the central control device 200 are each equipped with a CPU, RAM, and ROM (not shown), and the CPU mounted on each terminal controls various devices stored in the ROM. The program is expanded on the RAM and executed. The RAM also functions as a data work area and a temporary save area.
[0021]
Next, the operation of the communication system of this embodiment will be described with reference to FIG.
[0022]
The read original 102 prepared on the mobile terminal 100 side generates an image signal corresponding to the read original 102 by the scanner 104. The generated image signal is sent to the character recognition unit 106, which recognizes the recognition area and performs character recognition of the recognized recognition area. The threshold value / position information receiving unit 110 receives the position information of each recognition area and the threshold for unrecognition determination in the image signal to be recognized set in the threshold control unit 204 of the central control device 200 via the wireless network 300. To do. Here, the character recognition unit 106 compares the recognition failure determination threshold value of each recognition area in the image signal received by the threshold / position information reception unit 110 with the similarity of the recognition candidate character in each recognition area. As a result of the comparison, when the similarity of the recognition candidate character is larger than the recognition-rejection determination threshold, the character code corresponding to the recognition candidate character is output as the recognition result. On the other hand, when the similarity of the recognition candidate character is smaller than the recognition-rejection determination threshold, a predetermined reject code is output as being unrecognizable. Details of processing executed by the character recognition unit 106 will be described later. The character recognition result transmitting unit 108 transmits the character code, which is the character recognition result by the character recognizing unit 106, the reject code indicating unrecognizable, and the position information indicating the recognition area to the central control device 200 via the wireless network 300.
[0023]
On the other hand, in the central controller 200, first, the character recognition result receiving unit 202 receives the character recognition result and the position information transmitted from the mobile terminal 100. The received character recognition result is corrected by the character recognition result post-processing unit 208, stored in the storage unit 208a, and searched for data stored in the storage unit 208a using the character recognition result as a key. Is displayed on the display unit 210. Based on the character recognition result of each recognition area indicated by the received position information, the threshold control unit 204 sets an optimum recognition failure determination threshold for each recognition area. Details of processing executed by the threshold control unit 204 will be described later. The threshold value for determining the unrecognition and the position information of each recognition region of the recognition target image signal set by the threshold control unit 204 are transmitted to the mobile terminal 100 by the threshold value / position information transmitting unit 206 via the wireless network 300.
[0024]
Next, processing executed in the present invention will be described with reference to FIGS. Here, in particular, details of processing executed by the character recognition unit 106 and the threshold control unit 204, which are the main features of the present invention, will be described.
[0025]
FIG. 2 is a flowchart showing processing executed by the character recognition unit according to the embodiment of the present invention.
[0026]
First, in step S300, the character recognition unit 106 in the mobile terminal 100 performs character extraction for cutting out characters from the image signal input from the scanner 104. In step S301, a recognition area in the image signal is recognized. Based on the recognized recognition area, it is determined to which recognition area the character extracted in step S300 belongs. In step S302, a predetermined feature is extracted from the characters extracted in step S300. In step S304, the similarity between the recognition target character and the learning character in the recognition dictionary 106a is calculated based on the feature extracted in step S302. In step S306, a predetermined number of recognition candidate characters (number of recognition candidate characters) are selected from the ones with the highest similarity, and are sorted. The number of candidate characters is set in a recognition candidate character number register (not shown).
[0027]
In step S308, the recognition-unrecognition determining unit 106b uses the recognition candidate character first candidate, that is, the similarity of the recognition candidate character having the highest similarity, and the recognition-unrecognition determination threshold value of the recognition region including the recognition candidate character. Compare When the similarity of the first candidate is smaller than the recognition-rejection determination threshold value of the recognition region including the recognition-candidate character (NO in step S308), the process proceeds to step S310, where the recognition target character is made unrecognizable and a predetermined identifier, , Output reject code. On the other hand, if the similarity of the first candidate is larger than the recognition-rejection determination threshold of the recognition area including the recognition candidate character (YES in step S308), since at least one character recognition result can be output, The process proceeds to step S312.
[0028]
In step S312, 2 is substituted into a recognition candidate character number counter i (not shown) for counting the number of recognition candidate character processes. In step S314, it is determined whether or not the content of the recognized supplementary character number counter i exceeds the number of recognition candidate characters set in the recognition candidate character number register. If the content of the recognition candidate character counter exceeds the number of recognition candidate characters (YES in step S314), since there are no more recognition candidate characters, the subsequent processing is stopped and the process proceeds to step S316. In step S316, all the character codes corresponding to the recognition candidate characters whose similarity exceeds the recognition-rejection determination threshold are output. On the other hand, if the content of the recognition candidate character counter i does not exceed the number of candidate characters (NO in step S314), the process proceeds to step S318.
[0029]
In step S318, the similarity of the i-th candidate is compared with the recognition-unrecognition threshold value for the recognition region including the recognition candidate character. If the similarity of the i-th candidate is smaller than the recognition-rejection determination threshold of the recognition area including the recognition-candidate character (NO in step S318), the candidate characters after the i-th candidate are regarded as unrecognizable, and the process proceeds to step S316. On the other hand, when the similarity of the i-th candidate is larger than the recognition-rejection determination threshold value of the recognition area including the recognition candidate character (YES in step S318), the process proceeds to step S320, the recognition candidate character number counter i is incremented, and step S314 is performed. Return to.
[0030]
It should be noted that the recognition candidate character number register and the recognition candidate character number counter are each realized in the central control device 200, for example, on a RAM mounted in the device, or configured by dedicated hardware.
[0031]
Through the above processing, the rejection rate determined in each recognition area of the image signal has a tendency as shown in FIG. That is, when the rejection rate is high, the accuracy rate of characters determined to be recognizable is improved, but the absolute number is small. On the other hand, when the rejection rate is low, the number of characters determined to be recognizable is large, but the accuracy rate of characters also decreases. Therefore, in the present invention, each recognition of the image signal is performed based on the character recognition result of each recognition area of the character recognition unit 106 of the mobile terminal 100 so that the character recognition at the mobile terminal 100 is executed at the optimum rejection rate. to reset the optimum unrecognizable determination threshold region at the threshold control unit 2 04 of the central control unit 200.
[0032]
FIG. 3 is a flowchart showing processing executed by the threshold control unit according to the embodiment of the present invention.
[0033]
In step S400, a recognition area pointer i indicating the recognition area to be processed in the image signal is initialized. Each recognition area in the image signal is numbered in order, and each recognition area is processed according to the value indicated by the recognition area pointer i. Further, the number of recognition areas in the image signal is stored in the recognition area number register. In step 402, based on the character recognition result and the position information received by the character recognition result receiving unit 202, the number of unrecognizable characters (reject code) in the recognition area corresponding to the i-th area indicated by the recognition area pointer i is the first. It is determined whether or not the threshold value is TH1 or more. If the number of unrecognizable characters is equal to or greater than the first threshold value TH1 (YES in step S402), it is determined that the reading state of the recognition area corresponding to the i-th area of the scanner 104 of the mobile terminal 100 has deteriorated for some reason, and step S406 is performed. Proceed to In step 406, in order to increase the number of recognizable characters, the threshold is set to be less than the recognition unrecognition determination threshold of the recognition area corresponding to the current i-th area set by the unrecognition determination unit 106b of the mobile terminal 100. Reset the threshold for determining unrecognition. Thereafter, the process ends.
[0034]
On the other hand, if the number of unrecognizable characters in the recognition area corresponding to the i-th area is less than the first threshold value TH1 (NO in step S402), the process proceeds to step S404. In step S404, it is determined whether or not the number of unrecognizable characters is less than a second threshold value TH2 (<TH1). If the number of unrecognizable characters is less than the second threshold TH2 (YES in step S404), it is determined that the accuracy rate of the character recognition result has deteriorated, and the process proceeds to step 408. In step 408, in order to improve the accuracy rate of the recognition result, the recognition rate determination unit 106b of the mobile terminal 100 is set higher than the recognition-recognition determination threshold for the recognition region corresponding to the current i-th region. The recognized recognition threshold value is reset. Thereafter, the process ends.
[0035]
On the other hand, if the unrecognizable characters of the recognition region corresponding to the i-region is the second threshold TH2 or higher (NO at Step S40 4), the current is set by the unrecognizable determination unit 106b of the mobile terminal 100 the i It is determined that the recognition unrecognition threshold value of the recognition area corresponding to the area is appropriate, and the process ends.
[0036]
In step S410, it is determined whether or not the recognition-rejection determination threshold value has been set for all of the recognition regions in the image signal. That is, it is determined whether or not the value indicated by the recognition area pointer i is the same as the value stored in the recognition area number register. If the setting of the threshold for determination of unrecognition is completed (YES in step S410), the process ends. On the other hand, if the setting of the recognition failure determination threshold has not ended (NO in step S410), the process proceeds to step S412. In step S412, the value of the recognition area pointer i is incremented by 1, and the process returns to step S402.
[0037]
Note that the recognition area pointer and the recognition area number register are each realized in the central control device 200, for example, on a RAM mounted in the device, or configured by dedicated hardware.
[0038]
As described above, according to the present invention, the central controller 200 is optimal for each recognition area of the image signal input from the mobile terminal 100 based on the character recognition result and the recognition area input from the mobile terminal 100. Since it is possible to set a threshold value for determination of unrecognition, the recognition accuracy of each recognition area can be improved. In particular, even when characters of different writers or different fonts are mixed in the same scanned document to be processed, or even when the format of the scanned document changes, it is possible to accurately perform character recognition on the scanned document. The processing efficiency can be greatly improved.
[0039]
In the above embodiment, a plurality of recognition candidate characters are output from the character recognition unit 106 of the mobile terminal 100, but the present invention is not limited to this. For example, the recognition candidate character with the highest degree of similarity may be set as the only recognition candidate character, and the determination by the unrecognizable determination unit 106b may be performed on the recognition candidate character. In this case, the processing speed can be increased.
[0040]
In the above embodiment, the communication system including the mobile terminal 100 and the central control device 200 connected by the wireless network 300 has been described as an example, but the present invention is not limited to this. For example, there is no problem even in a communication system including terminals connected by a wired network and a central control device.
[0041]
Note that the present invention can be applied to a system composed of a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), or an apparatus composed of a single device (for example, a copier, a facsimile machine, etc.). You may apply.
[0042]
Another object of the present invention is to supply a storage medium storing software program codes for implementing the functions of the above-described embodiments to a system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores the storage medium. Needless to say, this can also be achieved by reading and executing the program code stored in the.
[0043]
In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the storage medium storing the program code constitutes the present invention.
[0044]
As a storage medium for supplying the program code, for example, a floppy disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.
[0045]
Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) operating on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
[0046]
Further, after the program code read from the storage medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. It goes without saying that the CPU or the like provided in the board or the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.
[0047]
【The invention's effect】
As described above, according to the present invention, in a communication system that performs communication between a terminal that performs character recognition and a central controller, a communication system that can improve processing efficiency, a control method therefor, and a computer-readable memory are provided. it can.
[0048]
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of a communication system according to an embodiment of the present invention.
FIG. 2 is a flowchart showing processing executed by a character recognition unit according to the embodiment of the present invention.
FIG. 3 is a flowchart illustrating processing executed by a threshold control unit according to the embodiment of this invention.
FIG. 4 is a diagram showing a relationship between a rejection rate and recognized character accuracy.
[Explanation of symbols]
100 Terminal 200 Central control device 300 Wireless network 104 Scanner 106 Character recognition unit 106a Recognition dictionary 106b Unrecognition determination unit 108 Character recognition result transmission unit 110 Threshold / position information reception unit 202 Character recognition result reception unit 204 Threshold control unit 206 Threshold / Position information transmission unit 208 Character recognition result post-processing unit 208a Storage unit 210 Display unit

Claims (5)

端末と中央制御装置間で通信を行う通信システムであって、
前記端末は、
原稿を画像データとして読み取る読取手段と、
前記読取手段で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識手段と、
前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識手段で認識された前記各認識領域内の各文字画像の文字認識結果を送信する文字認識結果送信手段と、
前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定手段と、を備え、
前記中央制御装置は、
前記端末より前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果を受信する文字認識結果受信手段と、
前記文字認識結果受信手段受信した前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果に基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御手段と、
前記閾値制御手段で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信手段と、
を備えることを特徴とする通信システム。
A communication system that performs communication between a terminal and a central controller,
The terminal
Reading means for reading a document as image data;
The image data read by the reading unit is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area by using a recognition dictionary. The recognition candidate character and its similarity are calculated, and when the calculated similarity is equal to or less than the recognition-unrecognition determination threshold of the recognition area, it is output as a character recognition result indicating that the recognition is impossible. A character recognition unit that outputs the recognition candidate character as a character recognition result when the recognition area is larger than the recognition-recognition determination threshold;
A character recognition result transmission means for transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition means for indicating the location of the region to,
When receiving the unrecognized determination threshold for resetting any of the recognition areas from the central control unit, reset the unrecognizable determination threshold for the recognition area with the unrecognizable determination threshold for resetting Threshold reception setting means for
The central controller is
A character recognition result receiving means for receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
Based on said character recognition result character recognition of the received by the receiving means and the position information indicating the position of each recognition area each character image in said each recognition area results for each of the recognition region, the recognition area When it is determined that the number of characters determined to be unrecognizable in step S1 is equal to or greater than the first threshold, a value lower than the threshold for determining unrecognition of the recognition area used when obtaining the character recognition result in the recognition area When it is determined that the number of characters determined to be unrecognizable in the recognition area is smaller than the second threshold and less than the second threshold, the recognition is determined. Threshold control means for determining, as the unrecognition determination threshold for resetting the recognition area, a value higher than the recognition unrecognition determination threshold of the recognition area used when obtaining the character recognition result in the area;
Threshold transmission means for transmitting to the terminal a threshold for determination of unrecognition for resetting the recognition area determined by the threshold control means;
A communication system comprising:
前記閾値制御手段は、前記文字認識結果受信手段で受信した前記文字認識結果に基づいて、当該認識領域内で認識不能と判断された文字数が前記第1閾値未満かつ前記第2閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた前記認識不能判定用閾値が適当な値であると決定する
ことを特徴とする請求項1に記載の通信システム。
The threshold control means, based on the character recognition result received by the character recognition result receiving means, that the number of characters determined to be unrecognizable within the recognition area is less than the first threshold and greater than or equal to the second threshold. 2. The communication system according to claim 1 , wherein when the determination is made, it is determined that the recognition threshold value used when obtaining the character recognition result in the recognition area is an appropriate value .
端末と中央制御装置間で通信を行う通信システムの制御方法であって、
前記端末において、原稿を画像データとして読み取る読取工程と、
前記端末において、前記読取工程で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識工程と、
前記端末から、前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識工程で認識された前記各認識領域内の各文字画像の文字認識結果を送信する文字認識結果送信工程と、
前記端末において、前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定工程と、を備え、
前記中央制御装置において、前記端末より前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果を受信する文字認識結果受信工程と、
前記中央制御装置において、前記文字認識結果受信工程受信した前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果に基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御工程と、
前記中央制御装置から、前記閾値制御工程で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信工程と、
を備えることを特徴とする通信システムの制御方法。
A control method of a communication system for performing communication between a terminal and a central control device,
In the terminal, a reading process of reading a document as image data;
In the terminal, the image data read in the reading step is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area using a recognition dictionary. The recognition candidate character for each character image and its similarity are calculated, and if the calculated similarity is less than or equal to the recognition unrecognition threshold for the recognition area, the recognition is output as a character recognition result, and the calculation is performed. A character recognition step of outputting the recognition candidate character as a character recognition result when the similarity is greater than the recognition-unrecognition determination threshold of the recognition region ;
From the terminal, and the character recognition result transmission step of transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition process shown the location of the region to ,
In the terminal, when a threshold value for non-recognition determination for resetting one of the recognition areas is received from the central control unit , the threshold value for non-recognition determination for the recognition area is used for the non-recognition determination for resetting. A threshold reception setting step for resetting with a threshold, and
In the central control device, a character recognition result reception step of receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
In the central control unit, on the basis of the received in the character recognition result reception step into a character recognition result of each character image position information indicating a position and of the respective recognition region of each recognition area, with respect to each of the recognition region When it is determined that the number of characters determined to be unrecognizable in the recognition area is greater than or equal to the first threshold, the recognition area non-recognition threshold used for obtaining the character recognition result in the recognition area A lower value than the first threshold is determined, and a lower value is determined as a threshold for determining the unrecognition for resetting the recognition area, and the number of characters determined to be unrecognizable in the recognition area is less than a second threshold smaller than the first threshold. In such a case, a value higher than the recognition-unrecognition threshold value for the recognition area used when obtaining the character recognition result in the recognition area is set as the re-recognition determination threshold value for the recognition area. A threshold control step of determining,
A threshold transmission step of transmitting, from the central control device, a threshold for determination of unrecognition for resetting the recognition area determined in the threshold control step to the terminal;
A control method for a communication system, comprising:
前記閾値制御工程は、前記文字認識結果受信工程で受信した前記文字認識結果に基づいて、当該認識領域内で認識不能と判断された文字数が前記第1閾値未満かつ前記第2閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた前記認識不能判定用閾値が適当な値であると決定する
ことを特徴とする請求項3に記載の通信システムの制御方法。
In the threshold control step, the number of characters determined to be unrecognizable in the recognition area based on the character recognition result received in the character recognition result receiving step is less than the first threshold and not less than the second threshold. 4. The communication system control method according to claim 3 , wherein if the determination is made, it is determined that the unrecognizable determination threshold value used when obtaining the character recognition result in the recognition area is an appropriate value. .
端末と中央制御装置間で通信を行う通信システムの制御をコンピュータに実行させるためのプログラムを記録したコンピュータ可読メモリであって、
前記端末において、原稿を画像データとして読み取る読取工程と、
前記端末において、前記読取工程で読み取られた画像データを認識領域毎に分割し、当該分割された各認識領域内の各文字画像に対して認識用辞書を用いて文字認識を行なうことによって、当該各文字画像に対する認識候補文字とその類似度とを算出し、当該算出した類似度が当該認識領域の認識不能判定用閾値以下の場合は認識不能であることを文字認識結果として出力し、当該算出した類似度が当該認識領域の認識不能判定用閾値より大きい場合は当該認識候補文字を文字認識結果として出力する文字認識工程と、
前記端末から、前記中央制御装置へ前記認識領域の位置を示す位置情報と前記文字認識工程で認識された前記各認識領域内の各文字画像の文字認識結果を送信する文字認識結果送信工程と、
前記端末において、前記中央制御装置より認識領域のいずれかに対する再設定用の認識不能判定用閾値を受信した場合、当該認識領域についての前記認識不能判定用閾値を前記再設定用の認識不能判定用閾値で再設定する閾値受信設定工程と、を備え、
前記中央制御装置において、前記端末より前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果を受信する文字認識結果受信工程と、
前記中央制御装置において、前記文字認識結果受信工程受信した前記認識領域の位置を示す位置情報と前記各認識領域内の各文字画像の文字認識結果に基づいて、前記認識領域それぞれに対して、当該認識領域内で認識不能と判断された文字数が第1閾値以上であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも低い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定し、当該認識領域内で認識不能と判断された文字数が前記第1閾値より小さい第2閾値未満であると判断した場合は、当該認識領域内の文字認識結果を得る際に用いた当該認識領域の認識不能判定用閾値よりも高い値を当該認識領域に対する前記再設定用の認識不能判定用閾値として決定する閾値制御工程と、
前記中央制御装置から、前記閾値制御工程で決定した前記認識領域に対する再設定用の認識不能判定用閾値を前記端末へ送信する閾値送信工程と、
をコンピュータに実行させるためのプログラムを記録したことを特徴とするコンピュータ可読メモリ。
A computer-readable memory storing a program for causing a computer to execute control of a communication system that performs communication between a terminal and a central control device,
In the terminal, a reading process of reading a document as image data;
In the terminal, the image data read in the reading step is divided for each recognition area, and character recognition is performed on each character image in each divided recognition area using a recognition dictionary. The recognition candidate character for each character image and its similarity are calculated, and if the calculated similarity is less than or equal to the recognition unrecognition threshold for the recognition area, the recognition is output as a character recognition result, and the calculation is performed. A character recognition step of outputting the recognition candidate character as a character recognition result when the similarity is greater than the recognition-unrecognition determination threshold of the recognition region ;
From the terminal, and the character recognition result transmission step of transmitting the character recognition result of each character image in the central controller the recognition in the respective recognition region recognized by the position information and the character recognition process shown the location of the region to ,
In the terminal, when a threshold value for non-recognition determination for resetting one of the recognition areas is received from the central control unit , the threshold value for non-recognition determination for the recognition area is used for the non-recognition determination for resetting. A threshold reception setting step for resetting with a threshold, and
In the central control device, a character recognition result reception step of receiving the character recognition result of each character image in said each recognition area and position information indicating the position of each recognition area from the terminal,
In the central control unit, on the basis of the received in the character recognition result reception step into a character recognition result of each character image position information indicating a position and of the respective recognition region of each recognition area, with respect to each of the recognition region When it is determined that the number of characters determined to be unrecognizable in the recognition area is greater than or equal to the first threshold, the recognition area non-recognition threshold used for obtaining the character recognition result in the recognition area A lower value than the first threshold is determined, and a lower value is determined as a threshold for determining the unrecognition for resetting the recognition area, and the number of characters determined to be unrecognizable in the recognition area is less than a second threshold smaller than the first threshold. In such a case, a value higher than the recognition-unrecognition threshold value for the recognition area used when obtaining the character recognition result in the recognition area is set as the re-recognition determination threshold value for the recognition area. A threshold control step of determining,
A threshold transmission step of transmitting, from the central control device, a threshold for determination of unrecognition for resetting the recognition area determined in the threshold control step to the terminal;
A computer-readable memory in which a program for causing a computer to execute is recorded.
JP35851997A 1997-12-19 1997-12-25 COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY Expired - Fee Related JP3957848B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP35851997A JP3957848B2 (en) 1997-12-25 1997-12-25 COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY
US09/212,434 US6891972B2 (en) 1997-12-19 1998-12-16 Communication system and control method thereof, and computer-readable memory
US11/081,504 US7440617B2 (en) 1997-12-19 2005-03-17 Communication system and control method thereof, and computer-readable memory

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35851997A JP3957848B2 (en) 1997-12-25 1997-12-25 COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY

Publications (2)

Publication Number Publication Date
JPH11191134A JPH11191134A (en) 1999-07-13
JP3957848B2 true JP3957848B2 (en) 2007-08-15

Family

ID=18459745

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35851997A Expired - Fee Related JP3957848B2 (en) 1997-12-19 1997-12-25 COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY

Country Status (1)

Country Link
JP (1) JP3957848B2 (en)

Also Published As

Publication number Publication date
JPH11191134A (en) 1999-07-13

Similar Documents

Publication Publication Date Title
US7440617B2 (en) Communication system and control method thereof, and computer-readable memory
JP3957848B2 (en) COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY
JP3957846B2 (en) COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY
JP3957847B2 (en) COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY
JPH02293989A (en) Character recognizing device
JPH11184973A (en) Communication system, control method for the same and computer readable memory
JPH07168913A (en) Character recognition system
JPH11191140A (en) Communication system, control method therefor and computer readable memory
JPH11213095A (en) Character recognition device, its method and computer-readable memory
JPH11191141A (en) Communication system, control method therefor and computer readable memory
JP3056950B2 (en) Character recognition apparatus and method
JPH051512B2 (en)
JP2856409B2 (en) Character recognition apparatus and method
JPH09218741A (en) Information controller and its control method
JP2972443B2 (en) Character recognition device
JP2001143020A (en) Character recognition device, method and recording medium thereof
JPS62281082A (en) Character recognizing device
JP3045086B2 (en) Optical character reading method and apparatus
JPH08202830A (en) Character recognition system
JP2002157550A (en) Device and method for recognizing character and recording medium
JPH09282468A (en) Image processor and its method
JP2002074269A (en) Method for recognizing character
JPH09223186A (en) On-line character recognizing device
JPH05258097A (en) Optical character reader
JPH10134148A (en) Device and method for font discrimination, and computer-readable storage medium where program implementing the same font discriminating method is stored

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041115

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20041115

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070509

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100518

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110518

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130518

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140518

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees