JP4977368B2 - 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体 - Google Patents

媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体 Download PDF

Info

Publication number
JP4977368B2
JP4977368B2 JP2005378617A JP2005378617A JP4977368B2 JP 4977368 B2 JP4977368 B2 JP 4977368B2 JP 2005378617 A JP2005378617 A JP 2005378617A JP 2005378617 A JP2005378617 A JP 2005378617A JP 4977368 B2 JP4977368 B2 JP 4977368B2
Authority
JP
Japan
Prior art keywords
information
unit
recognition
contents
pieces
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005378617A
Other languages
English (en)
Other versions
JP2007179395A (ja
Inventor
浩一 金元
真一 江口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP2005378617A priority Critical patent/JP4977368B2/ja
Priority to US11/411,086 priority patent/US7715633B2/en
Priority to KR1020060044627A priority patent/KR100742582B1/ko
Priority to CN200610082620XA priority patent/CN1991863B/zh
Publication of JP2007179395A publication Critical patent/JP2007179395A/ja
Application granted granted Critical
Publication of JP4977368B2 publication Critical patent/JP4977368B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明は、情報を記入された媒体(例えば、帳票)を読み取って得られたイメージデータに基づいて媒体を判別する技術に関し、特に、媒体に記入された情報の内容を高精度に認識するための技術に関する。
近年、文字,記号,数字,絵,バーコード等(以下、これらをまとめて単に文字という)の情報を記入された媒体(例えば、帳票)をイメージデータとして読み取ってから文字認識する装置として、光学式文字読み取り装置(OCR(Optical Character Recognition/Reader)装置)等の帳票認識装置が開発され、各種産業においてはこの帳票認識装置を広く利用することにより、業務の効率化等を図っている。
例えば、金融機関等における窓口業務を行なうオペレータは、上述の帳票認識装置を用いて、帳票媒体(以下、単に帳票という)を効率的に処理することを通じて、業務の効率化を図っている。
上述のような帳票処理装置において、帳票処理をより高効率に実行するために、同一種類の帳票の多量処理を行なうだけでなく、多種多様なフォーマットを有する帳票を自動的に処理する技術がある(例えば、下記特許文献1,2参照)。
また、帳票処理業務の効率化を図るために、種類が異なる複数の帳票群をまとめて自動的に処理することが要求される場合もある。例えば、金融機関の統廃合により、異なる金融機関の異なるフォーマットを有する複数の帳票群を一つのシステムに統合する場合や、複数支社(支店)の帳票群を本社(本店)機構等でまとめて処理(センター処理化)する場合など、種類が異なる複数の帳票群をまとめて処理することを要求される場合がある。
そこで、従来から、各帳票群の先頭に、当該帳票群の種類,内容,及び枚数等を示す帳票群を識別するための帳票群情報を記入された識別用帳票を挿入し、媒体認識装置が、帳票群の各帳票に対する処理に先立って、まず識別用帳票を識別することによって、その識別用帳票に後続する帳票群の種類や枚数を認識した上で、かかる帳票群の処理を実行することにより、それぞれ種類が異なる複数の帳票群に対する処理を効率良く、且つ、精度良く実行する技術がある。
具体的には、例えば、図48に示すような識別用帳票100を各帳票群の先頭に来るようにして帳票群の読み取りを実行する。つまり、識別用帳票100は、識別用帳票100自身を認識させるための帳票ID(ここでは数字“1234”)を記入(付加)され、さらに後続する帳票群の種類(ここでは“P”)や枚数(ここでは“500枚”)等の帳票群情報を記入される。
そして、帳票識別装置は、この識別用帳票100と帳票群とをスキャナ装置でイメージデータとして読み取ると、まず、先頭の識別用帳票100の帳票IDを認識し、識別用帳票100を判別する。
つまり、帳票認識装置は、例えば、予めデータベース等に保持された、帳票IDと識別用帳票における帳票群情報の記入箇所や記入項目との対応を示す情報に基づいて、識別用帳票100のどこにどのような帳票群情報が記入されているかを判別した上で、かかる帳票群情報の内容を認識する。
これにより、帳票認識装置は、識別用帳票100に後続する帳票群の内容の認識を効率的に実行することができ、種類が異なる複数の帳票群に対しても効率的に認識処理を実行することができるのである。
また、帳票群の各帳票にも、識別用帳票100と同様に帳票IDを記入し、帳票認識装置が各帳票を認識する際に、まず、この帳票IDを認識することにより、当該帳票のどこにどのような情報が記載されているかを判別する。
これにより、帳票認識装置は、各帳票に対しても、認識処理を効率良く実行することができる。
国際公表WO97/05561号 特開2003−168075号公報
ところで、上述した従来の帳票認識装置では、識別用帳票における帳票IDを認識する処理、及び、帳票群を構成する各帳票における帳票IDを認識する処理が、非常に重要である。
したがって、これらの帳票IDは非常に高精度に認識する必要がある。
しかしながら、帳票認識装置は、100%の認識率で文字を認識することができるわけではなく、文字を認識する精度に限界があるので、帳票IDを誤って認識してしまうことがある他、帳票IDを構成する文字がリジェクトされてしまう(つまり、一つの文字を一文字として認識できない)ことや、最悪の場合には帳票IDが全く認識されないこともある。
このように帳票IDが正しく認識されなかった場合には、帳票認識装置による自動的な帳票処理(認識処理)を一旦中断して、帳票IDが正しく認識されなかった帳票をスキャナ装置によって再読み取りさせるか、もしくは、オペレータがその帳票の帳票IDを手入力するという、補正処理が必要になる。
ここで、上述のような、帳票認識装置が、種類が異なる複数の帳票群をまとめて自動認識する場合に、かかる補正処理のために一度でも処理を中断すると、処理時間が大幅に遅延してしまう。
したがって、帳票IDをより高精度に認識して、帳票をより高精度に判別できるようにすることが望まれている。
なお、より高精度な認識処理を実現するために、帳票をイメージデータとして読み取るスキャナ装置の解像度を上げることが考えられるが、スキャナ装置の解像度を上げると、逆に、処理速度が低下してしまったり、あるいは、僅かではあるが文字認識精度が下がってしまうことがある。特に、高速スキャナの場合には中速機に比べてこの傾向が顕著である。
本発明は、このような課題に鑑み創案されたもので、例えば帳票のように情報を記入された媒体を読み取って得られたイメージデータに基づいて、媒体を高精度に認識できるようにすることを目的とし、特に、媒体に記入された情報の内容をより高精度に認識できるようにすることを目的とする。
上記目的を達成するために、媒体処理装置は、複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られたイメージデータから、前記複数の情報のそれぞれを抽出する抽出部と、この抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部と、この認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容の補正を行なって、前記複数の情報の内容を確定する確定部とをそなえ、前記媒体が、第1情報と第2情報とを含む前記複数の情報を記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のそれぞれとが、互いに一対一の対応関係を有する文字からなるとともに、前記一対一の対応関係は、各文字の認識率に応じて設定され、前記確定部が、前記対応関係に基づいて前記判定を行なうことを特徴としている。
なお、前記確定部によって前記情報の内容が確定されると、当該情報の内容に基づいて、前記媒体を判別する媒体判別部をそなえて構成されることが好ましい。
また、上記目的を達成するために、本発明の媒体処理方法は、複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られたイメージデータから前記複数の情報のそれぞれを抽出し、抽出された前記複数の情報のそれぞれの内容を認識し、認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を認識されたとおりに確定する一方、認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて認識された内容を補正して、前記複数の情報の内容を確定するとともに、前記媒体が、第1情報と第2情報とを含む前記複数の情報を記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のそれぞれとが、互いに一対一の対応関係を有する文字からなるとともに、前記一対一の対応関係は、各文字の認識率に応じて設定され、前記対応関係に基づいて前記判定を行なうことを特徴としている。
また、上記目的を達成するために、本発明の媒体処理システムは、複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体と、この媒体を読み取って該媒体のイメージデータを取得するスキャナ装置と、このスキャナ装置によって取得された前記イメージデータに基づいて、前記情報の内容を認識する媒体処理装置とをそなえ、この媒体処理装置が、前記イメージデータから、前記複数の情報のそれぞれを抽出する抽出部と、この抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部と、この認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容を補正して、前記複数の情報の内容を確定する確定部とをそなえ、前記媒体が、第1情報と第2情報とを含む前記複数の情報を記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のそれぞれとが、互いに一対一の対応関係を有する文字からなるとともに、前記一対一の対応関係は、各文字の認識率に応じて設定され、前記確定部が、前記対応関係に基づいて前記判定を行なうことを特徴としている。
また、上記目的を達成するために、本発明のコンピュータ読取可能な記録媒体は、複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られるイメージデータに基づいて、前記情報の内容を認識する機能をコンピュータに実現させるための媒体処理プログラムを記録したものであって、この媒体処理プログラムが、前記イメージデータから前記複数の情報のそれぞれを抽出する抽出部、この抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部、及び、この認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容を補正して、前記複数の情報の内容を確定する確定部として、前記コンピュータを機能させるとともに、前記媒体が、第1情報と第2情報とを含む前記複数の情報を記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のそれぞれとが、互いに一対一の対応関係を有する文字からなるとともに、前記一対一の対応関係は、各文字の認識率に応じて設定され、前記確定部が、前記対応関係に基づいて前記判定を行なうように、前記コンピュータを機能させることを特徴としている。
このように、本発明によれば、所定の関係を満たす複数の情報が記入された媒体を認識するにあたり、確定部が、認識部による認識内容が正しいか否かをかかる所定の関係に基づいて判断し、誤っていると判定した場合には、この所定の関係に基づいて、媒体における複数の情報を補正して、これら複数の情報の内容を確定するので、媒体に記入された複数の情報の内容認識を非常に高精度に行なうことができる。
さらに、媒体に記入された複数の情報の内容を高精度に認識することができるので、帳票判別部が媒体の判別をより確実に実行することができ、その結果、媒体のスキャナ装置による再読み取りやオペレータによる手入力処理等、本発明の帳票認識装置による自動処理を中断する、処理時間が掛かる処理を実行することを抑止でき、媒体の判別処理を高効率に、且つ、高速に実行することができる。
以下、図面を参照しながら本発明の実施の形態について説明する。
〔1〕本発明の一実施形態について
〔1−1〕媒体処理システムの構成について
まず、図1に示すブロック図を参照しながら、本発明の一実施形態としての帳票認識システム(媒体処理システム)1の構成について説明する。この図1に示すように、本帳票認識システム1は、認識(処理)対象であり、複数の領域に所定の関係を満たす複数の情報(文字,記号,数字,絵,バーコード等(以下、これらをまとめて単に文字という))をそれぞれ記入された複数の帳票(媒体)30と、これら複数の帳票30のそれぞれを読み取って当該帳票30のイメージデータを取得するスキャナ装置40と、このスキャナ装置40によって取得されたイメージデータに基づいて、当該帳票30に記入された情報を認識する帳票認識装置(媒体処理装置)10とをそなえて構成されている。
以下に、媒体30,スキャナ装置40,及び帳票認識装置10のそれぞれの構成について説明する。
〔1−2〕帳票について
まず、本帳票認識システム1における帳票30について説明すると、図2に示すように、帳票30は領域31に第1の帳票ID31a(図中“ID1”と表記)を記入され、領域32に第2の帳票ID32a(図中“ID2”と表記)を記入されている。
そして、これら第1の帳票ID31a(以下、帳票ID31aともいう)と第2の帳票ID32a(以下、帳票ID32aともいう)とは、後述するような、所定の関係(相関関係もしくは補填関係)を満たすように設定されている。
〔1−2−1〕第1の帳票IDと第2の帳票IDとの間の所定の関係について
以下、帳票30の第1の帳票ID31aと第2の帳票ID32aとの間の所定の関係について具体例をあげて説明すると、例えば、帳票ID31aと帳票ID32aとの間には、同一であるという関係が設定されたり、あるいは、図3に示すように、帳票ID31aと帳票ID32aとの和が一定値であるという関係が設定される。
ここで、図3に示す関係では、帳票ID31aと帳票ID32aとがともに3桁の100以上の数字で構成され、帳票ID31aと帳票ID32aとは、互いの和が常に“1000”になるような関係を満たしている。
また、他の例としては、帳票ID31aを構成する文字のそれぞれと、帳票ID32aを構成する文字のそれぞれとが、互いに一対一の対応関係を有する異なる文字からなるように設定される場合がある。
つまり、図4に示すように、例えば、帳票ID31a,32aが数字からなる場合、帳票ID31aにおける数字0〜9のそれぞれに対して、帳票ID32aにおける数字が一対一の対応関係を有する異なる数字となるように設定されている。ここでは、帳票ID31aにおける“0”,“1”,“2”,“3”,“4”,“5”,“6”,“7”,“8”,“9”のそれぞれが、帳票ID32aにおいて“5”,“8”,“9”,“6”,“7”,“0”,“3”,“4”,“1”,“2”にそれぞれ対応する。
換言すると、帳票ID31aと帳票ID32aとの間で、“0”と“5”とが互いに一対一の対応を示し、“1”と“8”とが互いに一対一の対応を示し、“2”と“9”とが互いに一対一の対応を示し、“3”と“6”とが互いに一対一の対応を示し、“4”と“7”とが互いに一対一の対応を示すように、帳票ID31a,32aを構成する数字が設定されている。
したがって、図5に示すごとく、帳票ID31a,32aが3桁の数字であり帳票ID31aが100〜500の範囲からなる場合、例えば、帳票ID31aが“100”の場合には帳票ID32aは“855”になり、帳票ID31aが“237”の場合には帳票ID32aは“964”になり、帳票ID31aが“500”の場合には帳票ID32aは“055”になるというように、図4に示す対応関係に基づいて、帳票ID31aと帳票ID32aとが互いに一対一の補填関係を有する異なる数字に設定される。
なお、図4に示す一対一の対応関係は、各数字に対する帳票認識装置10(具体的には後述する認識部15)による認識率に基づいて決定されることが好ましい。
つまり、図6(a)に示すように、帳票認識装置10では、文字(ここでは数字0〜9)によって、その文字を正しく認識することができる認識率が異なる。
したがって、図4に示す一対一の対応関係では、図6(b)に示すように、図6(a)に示す帳票認識装置10による各数字0〜9の認識率に基づいて、認識率が最上位の“1”と最下位の“8”とが互いに対応するように設定し、第2位の“3”が第9位の“6”と、第3位の“7”が第8位の“4”と、第4位の“5”が第7位の“0”と、第5位の“9”が第6位の“2”と、それぞれ対応するように設定して、これらの一対一の対応を示す一対の数字の認識率の合計ができるだけ均一になるように設定することが好ましい。
これにより、帳票ID31a,32aを構成する数字による認識率のばらつきを少なくすることができ、帳票ID31a,32aを構成する文字に係わらず、帳票認識装置10が安定した認識率で文字認識を実行することができる。
また、帳票30の帳票ID31aと帳票ID32aとを、図4に示すような一対一の対応関係を満たすように設定することにより、帳票ID31aと帳票ID32aとを単に同一にする場合よりも、帳票認識装置10による認識率を向上させることができる。
つまり、図7に示すように、例えば、帳票ID31aが“8888”であり、帳票ID32aも“8888”であった場合(ケース1)と、帳票ID31aが“8888”であり、帳票ID32aが上記図4の補填関係に基づいて設定された“1111”であった場合(ケース2)とを比較すると、“8”に対する帳票認識装置10の認識率が99.99%で、“1”に対する帳票認識装置10の認識率が99.999%であった場合、ケース1では、帳票ID31a,32aのそれぞれの認識率が、ともに99.99%の4乗になり、これら帳票ID31aと帳票ID32aとを合わせた認識率(帳票判別率)は“(99.99%×99.99%)^4”で表わすことができ、したがって、帳票判別不可率(つまり、これら帳票ID31a,32aが認識できない確率)は、“0.08%”になる。
これに対して、ケース2では、帳票ID31aの認識率は99.99%の4乗になり、帳票ID32aの認識率は99.999%の4乗になる。したがって、これら帳票ID31a,32aの認識率は、“(99.99%×99.999%)^4”で表わすことができ、帳票判別不可率は“0.044%”になる。
このように、ケース1とケース2とでは、これらの帳票判別不可率に0.036%の差が生じ、ケース2のように帳票ID31a,32aが図4に示す補填関係を満足するように設定している方が、ケース1のように帳票ID31a,32aが単に同一である場合よりも認識率を向上させることができる。
〔1−2−2〕第1の帳票ID及び第2の帳票IDを構成する文字について
次に、帳票ID31a,32aのそれぞれを構成する文字について説明すると、図8(a)に示すように、帳票ID32a,32aのそれぞれを構成する文字として、数字と英字(ここでは大文字)とを使用する場合、各文字の認識率に基づいて、認識率が所定値以下の文字は帳票ID31a,32aを構成する文字として使用しない。
また、図8(b)に示すように、数字と英字とを使用する場合、数字の“0”と英字の“O”及び“Q”は非常に類似しているために、帳票認識装置10がこれら類似文字(図中“類似文字グループ1”と表記)を区別して認識することが困難になる。
さらに、図8(c)に示すように、数字の“1”と英字の“I”とも、帳票認識装置10にとって類似文字(図中“類似文字グループ2”)である。
したがって、これらの類似文字については、各グループで一文字だけを使用するようにする。例えば、図8(d)に示すごとく、数字を優先的に使用することにより、類似文字グループ1では、英字“O”及び“Q”は帳票ID31a,32aを構成する文字から除外する。また、類似文字グループ2では、英字“I”を除外する。
このように、帳票ID31a,32aを構成する文字を所定の認識率を有する文字だけにすることにより、帳票ID31a,32aに対する帳票認識装置10の認識率を高めることができ、帳票認識装置10が帳票30を高い精度で認識することができるようになる。
さらに、帳票ID31a,32aを構成する文字として、複数種類の文字を使用する場合には、帳票認識装置10が区別困難な類似文字については、類似文字グループの中の一文字だけを帳票ID31a,32aを構成する文字として使用することによって、帳票認識装置10による認識率を高めることができる。
また、図8(a)〜(d)では、2種類の文字(数字及び英字)を使用する場合を例にあげて説明したが、図9(a)〜(e)に示すように、3種類以上(ここでは、数字,英字,及び記号)を使用して帳票ID31a,32aを構成してもよい。この場合には図9(b)に示すように3種類のそれぞれの間及び3種類すべての間において類似文字が現れることになるが、図9(c)及び図9(d)に示すような類似文字グループの中で一文字だけを帳票ID31a,32aを構成する文字として使用することにより(図9(a)参照)、帳票認識装置10による高精度な文字認識を実現することができる。
なお、図9(e)は、数字と記号とを組み合わせて帳票ID31aを構成した例を示している。
〔1−2−3〕帳票の変形例について
なお、本帳票認識システム1における帳票の変形例として、例えば、図10に示すごとく、帳票30aが、帳票ID31a,32aに加えて、領域33,34に帳票ID33a(図中“ID3”と表記),34a(図中“ID4”と表記)をそれぞれ記入され、3以上(ここでは4つ)の帳票ID31a〜34aをそなえるように構成してもよい。
〔1−3〕スキャナ装置について
次に、本帳票認識システム1のスキャナ装置40について説明すると、スキャナ装置40は、媒体(ここでは帳票30)を光学的にイメージデータとして読み取るものである。
ここで、図11に、図2に示す帳票30をスキャナ装置40が読み取って得られたイメージデータ40aを示す。なお、上記図2を参照しながら説明したように、帳票30は領域31に第1の帳票ID31a(図中“ID1”と表記)を記入され、領域32に第2の帳票ID32a(図中“ID2”と表記)を記入されている。
〔1−4〕帳票認識装置の構成について
次に、本帳票認識システム1における、本発明の帳票認識装置10の構成について説明すると、図1に示すように、本帳票認識装置10は、イメージデータ読込部11,IDデータベース(IDDB)12,IDDB読込部13,抽出部14,認識部15,検査部16,補正部17,確定部18,帳票情報データベース(帳票情報DB)21,帳票判別部(媒体判別部)22,判断部23,画像状態検出部24,及び選択部25をそなえて構成されている。
なお、本帳票認識装置10は、例えば、図12に示すごとく表示部3,入力インタフェースとしてのキーボード4及びマウス5,並びに記憶装置6をそなえて構成されたコンピュータ2の演算部(例えば、CPU:Central Processing Unit)7によって実現される。
つまり、本帳票認識システム1のスキャナ装置40が演算部7に接続され、本帳票認識装置10のイメージデータ読込部11,IDDB読込部13,抽出部14,認識部15,検査部16,補正部17,確定部18,帳票判別部22,判断部23,画像状態検出部24,及び選択部25は、演算部7が、所定のアプリケーションプログラム(例えば、後述する媒体処理プログラム)を実行することによって実現される。
なお、以下の説明において、特に断らない限りは、本帳票認識装置10が認識対象として図2に示す帳票30(つまり、図11に示すイメージデータ40a)を認識する場合を例にあげて説明する。
イメージデータ読込部11は、スキャナ装置40が帳票30を読み取って得られたイメージデータ40aを読み込むものである。
IDDB12は、帳票の種類と、当該帳票における帳票IDに関する情報との対応を示すテーブルを保持するデータベースであり、例えば、帳票30における第1の帳票ID31a及び第2の帳票ID32aに関する情報として、以下の(1)〜(6)の情報を保持している。
(1)帳票30における、領域31,32のそれぞれの原点(ここでは領域の左上端)の座標。つまり、図11における座標(X1,Y1)及び(X2,Y2)。
(2)第1の帳票ID31a及び第2の帳票ID32aのそれぞれの桁数(文字数)。
(3)第1の帳票ID31a及び第2の帳票ID32aのそれぞれにおけるチェックデジット(Check Digit)の位置。
(4)第1の帳票ID31a及び第2の帳票ID32aのそれぞれの文字種類。
(5)領域31,32のそれぞれのサイズ。
(6)抽出部14が領域31,32を抽出するための探索テンプレートにおけるクリアエリア(余白部分)。
ここで、IDDB12が保持するテーブルの構成例を図13〜図15に示すと、まず、図13に示す第1例では、IDDB12が保持するテーブル12aは、図11に示す帳票30を処理対象とする場合のものであって、上記(1)〜(4)の情報を保持している。なお、テーブル12aにおいて、“ID”項目が“1”は第1の帳票ID31aを示しており、“2”は第2の帳票ID32aを示している。
そして、図11にも示すごとく、テーブル12aは、上記(1)の情報として、領域31の原点座標(X1,Y1)及び領域32の原点座標(X2,Y2)を保持している。
また、テーブル12aは、上記(2)の情報として第1の帳票ID31a及び第2の帳票ID32aのそれぞれの桁数“4”を保持している。
さらに、テーブル12aは、上記(3)の情報として第1の帳票ID31aのチェックデジットの位置(図中“CD”と表記)“前”及び第2の帳票ID32aのチェックデジットの位置“後”を保持している。なお、ここで“前”とは帳票ID31a,32aの左端を表わし、“後”とは帳票ID31a,32aの右端を表わしている。
最後に、テーブル12aは、上記(4)の情報として第1の帳票ID31a及び第2の帳票ID32aのそれぞれの文字種類“数字”を保持している。
また、図14に示す第2例としてのテーブル12bについて説明すると、この例は本帳票認識装置10が複数種類の帳票を認識対象とする場合のものであり、テーブル12bは、帳票種類(ここでは“種01”及び“種02”)ごとに、上述した図13のテーブル12aと同一の内容を保持している。なお、テーブル12bにおいて、“種01”の帳票の第1の帳票IDの原点座標は(X11,Y11)であり、第2の帳票IDの原点座標は(X12,Y12)であるとともに、帳票種類が“種02” の帳票の第1の帳票IDの原点座標は(X21,Y21)であり、第2の帳票IDの原点座標は(X22,Y22)である。また、帳票種類が“種02” の帳票の第1の帳票ID及び第2の帳票IDは桁数が“6”で文字種類が“英字”である。
さらに、図15に示す第3例としてのテーブル12cについて説明すると、このテーブル12cは主として抽出部14が帳票30から帳票ID(つまり、領域31,32)を抽出するのに必要な情報を保持しており、上記(2)〜(6)の情報を保持している。
ここで、上記(2)〜(4)の情報はテーブル12aと同様である。なお、テーブル12cにおいてもテーブル12aと同様に、“ID”項目が“1”は第1の帳票ID31aを示しており、“2”は第2の帳票ID32aを示している。
そして、テーブル12cは、上記(5)の情報として、各領域31,32のサイズを表わす寸法(ここでは領域31,32が長方形であるので高さと横幅)“3mm×10mm”を各帳票ID31a,32aそれぞれについて保持している。
さらに、テーブル12cは、上記(6)の情報として、抽出部14が領域31,32を抽出するために使用する探索テンプレート(後述する図17参照)におけるクリアエリア(図中単に“クリアエリア”と表記)“上下左右:5mm”を各帳票ID31a,32aそれぞれについて保持している。
IDDB読込部13は、抽出部14が帳票ID31a,32aを抽出するのに必要な情報をIDDB12(例えば、テーブル12a〜12cのいずれか)から読み込むものである。
抽出部14は、イメージデータ読込部11によって読み込まれた帳票30のイメージデータ40aから、IDDB読込部13によって読み込まれた情報に基づいて、帳票ID31a,32aのそれぞれを抽出する。
具体的には、抽出部14は、IDDB読込部13によって取得された上記(1),(5),(6)の情報のうちの少なくとも一つの情報に基づいて、探索テンプレート14a(後述する図17参照)を用いてイメージデータ40a上を探索し、イメージデータ40aから領域31,32を抽出する。
ここで、抽出部14がテーブル12cに示す上記(5),(6)の情報に基づいて領域31を抽出する場合について、図16〜図19を参照しながら説明する。
図16に示すように、抽出部14は、帳票ID特徴解析部14−1及び帳票ID探索部14−2をそなえて構成されており、帳票ID特徴解析部14−1は、IDDB読込部13によって読み込まれた、IDDB12のテーブル12cの情報を解析する。特に、帳票ID特徴解析部は、テーブル12cの上記(5)の情報としての領域31,32のサイズ(“3mm×10mm”)と、上記(6)の情報としてのクリアエリア(“上下左右:5mm”)とに基づいて、図17に示すような、探索テンプレート14aを決定する。
つまり、抽出部14の帳票ID特徴解析部14−1は、領域31,32と同様の“3mm×10mm”の長方形の網掛領域14bと、この領域14bの各辺から垂直に5mm(両矢印a〜d参照)空けた長方形の探索テンプレート14aを作成する。
そして、抽出部14の帳票ID探索部14−2は、図18に示すように、イメージデータ40aにおける帳票30に対して探索テンプレート14aを用いた横方向検索を実行する。この横方向検索では、探索テンプレート14aを帳票30の左上端部から右方向に移動することにより探索を開始し、帳票30の右側端部に到達すると、探索テンプレート14aを所定距離下方に移動させて、左側端部から右方向へ移動させながら探索を実行する。帳票ID探索部14−2は、この探索処理を帳票ID31a,32a(ここでは帳票ID31aのみ)が抽出されるまで実行する。
そして、例えば、第1の帳票ID31aが“1237”であった場合、図19に示すごとく、探索テンプレート14aの網掛領域14bの内部にきっちりと“1237”が記入された領域31が入る(つまり、網掛領域14bと領域31とが一致する)と、抽出部14は第1の帳票ID31a(領域31)を抽出して処理を終了する。
なお、この探索テンプレート14aを用いた処理によれば、抽出部14は、上記(1)の情報がなくても、イメージデータ40aの帳票30上から領域31,32を抽出することができる。
また、抽出部14による探索テンプレート14aを用いた領域31,32の帳票ID31a,32aの抽出方法以外の他の実施例について説明すると、抽出部14は、上記(1),(2)の情報を用いて領域31,32の帳票ID31a,32aを抽出することもできる。
つまり、抽出部14は、例えば、テーブル12a,12bに保持された領域31,32の原点の座標と、帳票ID31a,32aの文字数とを用いて、イメージデータ40aから直接領域31,32に記入された帳票ID31a,32aを抽出する。
認識部15は、抽出部14によって抽出された領域31の第1の帳票ID31a及び領域32の第2の帳票ID32aのそれぞれの内容(つまり文字)を認識するものであり、IDDB読込部13によって読み込まれた上記(2),(4)の情報を用いて文字認識を行なう。
つまり、認識部15は、各帳票ID31a,32aの一文字ごとに複数の候補文字との一致度(確信度)を算出し、算出された一致度が最も高かった候補文字をかかる各帳票ID31a,32aの一文字として認識する。
ここで、抽出部14によって抽出された領域31の帳票ID31aが “1237”であるときを例にあげて、この帳票ID31aに対する認識部15の具体的な文字認識処理を説明する。
つまり、図20に示すように、認識部15は、日本字辞書15a−1や数字辞書15a−2や英字辞書15a−3や記号辞書15a−4などからなる文字辞書15aに接続され、抽出部14によって抽出された帳票ID31aが“1237”であるとき、IDDB読込部13によって読み込まれた上記(4)の情報(文字種類情報)に基づいて帳票ID31aが数字であることを認識し、文字辞書15aにおける数字辞書15a−2を用いて文字認識を行なう。
さらに、認識部15は、IDDB読込部13によって読み込まれた上記(2)の情報(字数情報)に基づいて帳票ID31aが4文字であることを認識して文字認識を行なう。
そして、認識部15は、抽出部14によって抽出された帳票ID31aの一文字ごとに、数字辞書15a−2に基づく候補文字との一致度を算出し、算出された一致度が最も高い第1位の一致度を有する候補文字を、帳票ID31aを構成する文字として採用する。この作業を、ここでは4文字ごとに行ない、認識部15は、帳票ID31aを“1237”と認識する。
ただし、例えば、図21(a)に示すように、帳票30において帳票ID31aとしての数字“1”の上に×印などの落書き(上書き)がされていた場合、認識部15は、落書きをされた“1”に対して、候補文字との一致度を算出するが、図21(b)に示すように、落書きが運用ノイズとなって、認識部15が帳票ID31aを正しく認識することができずに、数字“1”をリジェクトする場合や、文字として認識できない場合がある(図中“?”と表記)。
ここで、認識部15が、リジェクトする場合とは、第1位の一致度を有する候補文字が複数ある場合や、第1位の候補文字の一致度と第2位の候補文字の一致度とが僅差である場合など、認識部が、認識対象の文字を一文字に特定することができない場合をいう。
また、認識部15が、文字として認識できない場合とは、例えば、すべての候補文字の一致度が所定値以下であった場合である。
なお、図22(a)に示すように、帳票30の元からの汚れやしわ、あるいは、スキャナ装置40による読み取り時に付着した汚れやしわによって、スキャナ装置40が読み取ったイメージデータ40aにおいて、帳票ID31aとしての数字“2”の部分が汚れている場合にも、この汚れが運用ノイズになり、図22(b)に示すように、認識部15は数字“2”を正しく認識することができない(図中“?”と表記)。
検査部16は、認識部15によって文字認識された帳票ID31a,32aのそれぞれに対してチェックデジットを用いた検査を実行するものである。
つまり、検査部16は、IDDB読込部13がIDDB12から読み込んだ上記(3)の情報を用いて、上記各帳票ID31a,32aからチェックデジットを抽出し、抽出したチェックデジットに基づいて、当該帳票ID31a,32aが認識部15によって正しく認識されたか否かを検査する。
例えば、認識部15によって帳票ID31aが“1247”と認識された場合、上記図13のテーブル12aに示したように、帳票ID31aのチェックデジットの位置は“前(左端)”であるので、検査部16はこの情報に基づいて、“1”をチェックデジットとして抽出する。
ここで、チェックデジットのアルゴリズムは、4桁の帳票IDにおいて、下3桁が表わす数(ここでは“247”)を右端の数字(ここでは“7”)で割ったときの余りを、右端の数字から差し引いた値が、チェックデジットと同一であるというものとする。
検査部16は、上記のアルゴリズムに基づいて下記(A),(B)の計算を行なう。
247/7=35...2 ・・・(A)
7−2=5 ・・・(B)
そして、検査部16は、上記計算(B)の結果“5”とチェックデジット“1”とが同一であるか否かを判断するが、ここではこれらの値が同一ではないので、検査部16は、認識部15による帳票ID31aの認識“1247”は誤っていると判断する。
補正部17は、検索部16によるチェックデジットを用いた検査の結果、認識部15によって認識された帳票ID31a,32aが誤っていた場合、もしくは、認識部15による文字認識で帳票ID31a,32aのうちのいずれかの文字がリジェクトあるいは認識されなかった場合に、かかるチェックデジットを用いて帳票ID31a,32aの内容を補正するか、もしくは、認識部15によって算出された一致度に基づいて帳票ID31a,32aの内容を補正するものである。
例えば、図23(a)に示すごとく、認識部15によってチェックデジットがリジェクト(図中“CD”と表記)された場合(つまり、帳票IDが“?237”と認識された場合)、補正部17は、図23(b)に示す計算(C),(D)を実行し、計算(D)の結果“1”をリジェクトされたチェックデジットとする。つまり、図23(c)に示すごとく、認識部15によって認識された帳票IDを“1237”に補正する。
また、図24(a)に示すごとく、認識部15によって左端から3桁目の文字がリジェクトされた場合(つまり、帳票IDが“12?7”と認識された場合)には、補正部17は、図24(b)に示す計算(E),(F)を実行する。そして、図24(c)に示すように、補正部17は、計算(F)の結果、リジェクトされた文字“?”を“3”と補正して、認識部15によって認識された帳票IDを“1237”に補正する。
さらに、図25(a)に示すように、認識部15によって左端から2桁目の文字がリジェクトされた場合(つまり、帳票IDが“1?37”と認識された場合)には、補正部17は、図25(b)に示す計算(G),(H)を実行する。そして、図25(c)に示すように、補正部17は、計算(H)の結果、リジェクトされた文字“?”を、“2”もしくは“9”に補正する。
なお、この“2”,“9”のいずれか一方の選択は、認識部15におけるこれら“2”,“9”の数字に対する一致度に基づいて行なわれ、補正部17は、認識部15で算出された一致度が高い方の数字を用いて帳票IDを補正する。
確定部18は、認識部15によって認識された帳票ID31a,32aの内容(文字)を確定するものであり、図1に示すように、判定部19及び相互補正部20をそなえて構成されている。
判定部19は、認識部15によって認識された帳票ID31a,32aの文字のそれぞれ、もしくは、補正部17によって補正処理が実行された場合には、この補正処理後の帳票ID31a,32aの文字のそれぞれが正しいか否かを、例えば、上記図3〜図6(a),(b)を参照しながら説明した、これら帳票ID31a,32a間に予め設定された所定の関係に基づいて判定するものである。
なお、判定部19は、検査部16による検査結果に係わらず判定処理を実行する。
相互補正部20は、判定部19が認識部15による文字認識が正しいと判定した場合には、帳票ID31a,32aの文字を認識部15によって認識されたとおりに確定する。
一方、相互補正部20は、判定部が認識部15による文字認識が誤っていると判定した場合には、帳票ID31a,32a間の所定の関係に基づいて、認識部15による認識内容を補正して帳票ID31a,32aの文字を確定する。
ここで、図26(a),(b)〜図29(a),(b)を参照しながら、確定部18(判定部19及び相互補正部20)の具体的な動作例について説明する。なお、図26(a),(b)に示す具体例は、補正部17による補正処理は実行されていない場合であり、図27(a),(b)〜図29(a),(b)に示す具体例は、補正部17による補正処理が実行された場合である。
まず、図26(a),(b)に示す例では、図26(a)に示すように、認識部15によって、帳票ID31aの左端から2桁目がリジェクトされ(つまり、“1?37”と認識され)、帳票ID32aの左端がリジェクトされた(つまり、“?237”と認識された)場合である。このとき、帳票30において、帳票ID31a,32aが同一であるという関係を満たしている場合、判定部19は、図26(a)に示す認識部15の認識内容は誤っていると判定する。
そして、相互補正部20は、帳票ID31a,32aで互いに異なる桁がリジェクトされているので、各桁の数字を帳票ID31a,32aのうちのリジェクトされていない方の数字で補正することにより、図26(b)に示すように、帳票ID31a,32aを“1237”であると補正して確定する。
また、図27(a)に示すように、補正部17によって帳票ID31aが複数算出された(つまり、“1237”と“1937”とが算出された)場合には、判定部19は複数の内容が存在するので、この認識内容は誤っていると判断する。そして、帳票30において、帳票ID31a,32aが同一であるという関係を満たしている場合、相互補正部20は、図27(b)に示すように、帳票ID32aの認識結果(つまり、“1237”)に基づいて、帳票ID31aの内容を“1237”に確定する。
さらに、図28(a)に示すように、図27(a)と同様に補正部17によって帳票ID31aが複数算出された場合であって、帳票30において、帳票ID31a,32aが、互いの合計が“10000”となるという関係を満たしている場合、相互補正部20は、図28(b)に示すように、帳票ID31aの複数の候補を帳票ID32a“8763”とそれぞれ合計して、その結果が“10000”になる内容“1237”を、帳票ID31aと確定する。
また、図29(a)に示すように、図27(a)と同様に補正部17によって帳票ID31aが複数算出された場合であって、帳票30において、帳票ID31a,32aが上記図4に示す一対一の対応関係を満たすように異なる文字で構成されている場合、相互補正部20は、図29(b)に示すように、帳票ID32a“8964”のそれぞれを図4に示す対応関係を示す他方の文字に変換して得られる“1237”を、帳票ID31aと確定する。
帳票情報DB21は、帳票IDごとに、当該帳票IDを記入された帳票の種類や記載内容(つまり、帳票のどこにどのような情報が記載されているかという情報)に関する帳票情報を保持するものであり、例えば、図30に示すごとく構成された、帳票IDと帳票IDに対応する帳票の種類や記載内容など(帳票情報)の対応を示すテーブル21aを保持している。
なお、このテーブル21aには、3種類の第1の帳票ID及び第2の帳票IDごとに、当該帳票の種類,文字認識項目(記載内容)として項目名(座標、字種、字数),及び日付の形式(和暦もしくは西暦)が保持されている。
帳票判別部22は、確定部18によって帳票30の帳票ID31a,32aの内容が確定すると、確定した帳票ID31a,32aの内容に基づいて、帳票30を判別するものであり、図31に示すように、帳票ID照合部22a,定義情報判別部22b,及び記載内容認識部22cをそなえて構成されている。
帳票ID照合部22aは、帳票情報DB21に保持されたテーブル21aに基づいて、帳票ID31aもしくは帳票ID32aに対応する、帳票の種類や、記載内容(例えば、帳票30のどこに、どのような項目が、どのような種類の文字で、何文字で、記載されているかという情報)を判別するものであり、具体的には、確定部18によって確定された帳票ID31a,32aが、帳票情報DB21に保持されたテーブル21aの帳票IDに存在するかを照合し、この照合の結果、同一の帳票IDがテーブル21aから検索されると、検索された帳票IDに対応する帳票種類や文字認識項目(つまり、帳票情報)を抽出する。
定義情報判別部22bは、帳票ID照合部22aによって、帳票ID31a,32aと同一の帳票IDがテーブル21aから検索されなかった場合、つまり、確定部18によって帳票30の帳票ID31a,32aの内容が確定されなかった場合や、確定部18によって確定はされたが、確定された帳票ID31a,32aがテーブル21aに存在しなかった場合に、例えば、帳票情報DB21に予め保持されている、帳票ID31a,32a以外の帳票を特定するための情報(定義情報)に基づいて、帳票30を判別する。
なお、定義情報としては、例えば、帳票30のレイアウトに関する情報(例えば、罫線や項目の配置情報)、あるいは、所定の特殊記号(マーク)とその記載箇所、さらには、帳票のデザインに関する情報などが考えられる。
そして、定義情報判別部22bは、判別した帳票30の種類に基づいて、例えば、テーブル21aから帳票30の帳票情報を抽出する。
記載内容認識部22cは、帳票ID照合部22aもしくは定義情報判別部22bによって判別された帳票30の帳票情報に基づいて、帳票30のイメージデータ40aから帳票30に記載された帳票ID31a,32a以外の記載内容を認識するものであり、記載内容認識部22cは、認識した記載内容(認識結果)を、例えば、上記図12に示す表示部3に表示させたり、あるいは、記憶装置6にデータとして記録する。
判断部23は、帳票判別部22によって帳票30を判別することができなかった場合に、帳票30をスキャナ装置40に再度読み取らせるか、帳票30の帳票ID31a,32aもしくは帳票30の帳票ID31a,32a以外の記載内容をオペレータによって手入力させるかを、認識部15による帳票30の帳票ID31a,32aの認識状態に基づいて判断するものである。なお、オペレータによる手入力処理は、例えば図12に示すキーボード4やマウス5を用いて実行される。
そして、判断部23は、例えば、認識部15によって帳票ID31a,32aのそれぞれが2文字以上認識できていれば、帳票30をスキャナ装置40に再度読み取らせると判断する一方、帳票ID31a,32aのいずれかが3文字以上認識できなければ、判断部23は、帳票30をオペレータによって手入力させると判断する。
具体的には、判断部23は、例えば、図32(a)に示すように、帳票30の帳票ID31a,32a部分にしわ23aがある場合に、認識部15による帳票ID31a,32aの認識の結果、図32(b)に示すように、帳票ID31a,32aのそれぞれが2文字認識できなかった場合には、判断部23は、この帳票30をスキャナ装置40によって再度読み取らせると判断する。
しかし、図33(a)に示すように、帳票30の帳票ID31aには、しわ23aがあるとともに、印鑑23bが捺印されており、さらに、帳票ID32aには記入23cがされている場合に、認識部15による帳票ID31a,32aの認識の結果が、図33(b)に示すごとくすべての文字が認識できなかった場合には、判断部23は、この帳票30をオペレータによって手入力させると判断する。
なお、判断部23は、オペレータによって手入力させると判断した場合には、その旨を例えば図12に示す表示部3に表示させることにより、オペレータに手入力処理を通知する。
画像状態検出部24は、スキャナ装置40によって得られたイメージデータ40a(図11参照)において、帳票ID31a,32a(つまり領域31,32)を含むこれら帳票ID31a,32aのそれぞれの周辺領域の画像状態(すなわち、帳票30の用紙状態)を検出するものであり、例えば、対象領域における色(ここでは白黒の階調度0〜255)に関するヒストグラムを算出することにより画像状態を検出する。
例えば、図34に示すように、画像状態検出部24が、帳票ID31aを記入された領域31付近の所定領域(図中の斜線部)31xの画像状態を検出する場合について説明すると、図35(a)に示すように、帳票30の領域30xに汚れやしわが無い場合には、画像状態検出部24によって算出されるヒストグラムでは、文字(黒)を表す部分と背景(白)を表す部分とが図35(b)に示すように表わされる。
しかし、図36(a)に示すように、帳票30の領域31付近にしわ24aが付いていた場合には、画像状態検出部24によって算出されるヒストグラムでは、図36(b)に示すごとく、しわ24aが雑音となって文字部分や背景部分に影響する。
この図36(b)に示す例では、正常状態(帳票30が良好な状態)のヒストグラム図35(b)に対して、文字部分を表わす領域が太く大きくなるとともに、背景部分に接近する。また、背景部分は台形で表わされるように変形しその面積も大きくなる。
また、図37(a)に示すように、帳票ID31a上に印鑑24bや記入24cがある場合には、画像状態検出部24によって検出されるヒストグラムでは、図37(b)に示すように、印鑑24bや記入24cが雑音となって文字部分や背景部分に大きく影響する。
この図37(b)に示す例では、図35(b)に示す正常状態に対して、文字部分を表わす領域が非常に太く大きくなるとともに、背景部分を表わす領域も非常に太く大きくなる。
このように、画像状態検出部24では、ヒストグラムを算出することによって、画像状態(帳票30の状態)を確実に検出することができる。
選択部25は、画像状態検出部24によって検出された画像状態に基づいて、認識部15が文字認識を行なう帳票IDを選択するものである。
ここで、これら認識部15,画像状態検出部24,及び選択部25の動作例について、図38(a)〜(e)を参照しながら説明すると、本帳票認識装置10では、画像状態検出部24及び選択部25は、特に、上記図10に示したような3以上の帳票ID31a〜34aが記入された帳票30aに対して認識処理を実行する場合に動作する。
つまり、抽出部14が3以上の帳票ID31a〜34aを抽出した場合に、画像状態検出部24は、3以上の帳票ID31a〜34aを含む帳票ID31a〜34aのそれぞれの周辺領域の画像の状態を検出する。
このとき、図38(a)に示すように、帳票30aの第1の帳票ID31aの付近にはしわ24aがあり、第4の帳票ID34a上には記入24cがある場合には、画像状態検出部24は、第1の帳票ID31aを含む所定領域のヒストグラムを図38(b)に示すごとく算出し、第2の帳票ID32aを含む所定領域のヒストグラムを図38(c)に示すごとく算出し、第3の帳票ID33aを含む所定領域のヒストグラムを図38(d)に示すごとく算出し、第4の帳票ID34aを含む所定領域のヒストグラムを図38(e)に示すごとく算出する。
次に、選択部25は、これら図38(b)〜(e)に示す画像状態検出部24の検出結果に基づいて、2つの帳票ID32a,33aを選択する。
そして、認識部15は、選択部25によって選択された2つの帳票ID32a,33aの文字認識を実行する。
このように、画像状態検出部24によって検出された画像状態に基づいて、選択部25が、状態が良好な画像を認識部15の文字認識対象として選択するので、認識部15による文字認識をより高効率、且つ、より高精度なものにすることができる。しかも、結果的に認識部15による認識処理において、リジェクト等のエラーが少なくなるので、帳票ID31a,32aの内容認識だけでなく、帳票30の判別を高効率に行なうことができる。
〔1−5〕帳票認識装置の動作例について
次に、本帳票認識装置10の具体的な動作例について図面を参照しながら説明する。なお、以下の説明においても本帳票認識装置10の処理対象が帳票30である場合を例にあげて説明する。
〔1−5−1〕第1動作例について
まず、図39に示すフローチャート(ステップS1〜S10)を参照しながら、本帳票認識装置10の第1動作例(帳票処理方法)について説明すると、まず、イメージデータ読込部11がスキャナ装置40によって読み取られた帳票30のイメージデータ40aを読み込む(ステップS1)。
さらに、IDDB読込部13がIDDB12から帳票30の帳票ID31a,32aに関する情報を読み込む(ステップS2)。
そして、抽出部14が、イメージデータ40aから帳票ID31aが記入された領域31と帳票ID32aが記入された領域32とを抽出する(ステップS3)。
次に、認識部15が、抽出部14によって抽出された帳票ID31a,32aの内容(文字)を認識する(ステップS4)。
次いで、検査部16が、IDDB読込部13によって読み込まれた帳票ID31a,32aに関する情報に基づいて、認識部15によって認識された帳票ID31a,32aのそれぞれのチェックデジットを特定し、このチェックデジットを用いて帳票ID31a,32aのそれぞれが正しいか検査する(ステップS5)。
ここで、検査部16による検査の結果、認識部15による認識内容が正しければ、(ステップS5のYesルート)、確定部18の判定部19が、帳票ID31a,32a間に予め設定された所定の関係(上記図3〜図6(a),(b)参照)に基づいて、再度、認識部15による認識内容が正しいか否かを判定する(ステップS8)。
一方、認識部15による認識内容が誤っていると(ステップS5のNoルート)、補正部17が、チェックデジットを用いた補正が可能であるか否かを判断し(ステップS6)、ここでチェックデジットを用いた補正が可能であると判断されると(ステップS6のYseルート)、補正部17は、チェックデジットを用いて帳票ID31a,32aの内容を補正する(ステップS7)。
なお、補正部17によるチェックデジットを用いた補正が可能でなければ(ステップS6のNoルート)、上記ステップS7の補正処理をスキップする。
補正部17によるチェックデジットを用いた補正処理を行なった場合にも、次に、確定部18の判定部19が、再度、補正部17による補正処理を施された帳票ID31a,32aの認識内容が正しいか否かを、かかる所定の関係に基づいて判定する(ステップS8)。
そして、判定部19による判定の結果、帳票ID31a,32aの認識内容が誤っていると判定されると(ステップS8のNoルート)、相互補正部20が、かかる所定の関係に基づいて帳票ID31a,32aの認識内容を補正する(ステップS9)。
なお、判定部19による判定の結果、帳票ID31a,32aの認識内容が正しいと判定されると(ステップS8のYesルート)、上記ステップS9の処理をスキップする。
最後に、帳票判別部22が、帳票ID31a,32aの認識内容を用いて、帳票情報DB21に基づいて、帳票30を判別して(ステップS10)、処理を終了する。
このように、本帳票認識装置10の第1動作例によれば、認識部15によって認識された帳票ID31a,32aの内容に対して、検査部16によるチェックデジットを用いた検査及び判定部19による所定の関係に基づいた判定を行なうので、認識内容を2重にチェックすることになり、より高精度に帳票ID31a,32aの内容を認識することができる。
さらに、認識部15による認識内容に対する補正処理についても、補正部17及び相互補正部20によって対応することができるので、より確実に帳票ID31a,32aの内容を認識することができる。
〔1−5−2〕第2動作例について
次に、図40に示すフローチャート(ステップS1〜S4,S5a,S8〜S10)を参照しながら、本帳票認識装置10の第2動作例(帳票処理方法)について説明する。なお、図40において既述の処理ステップと同一の処理ステップは、既述の処理ステップと同一もしくは略同一の処理ステップを示しているので、ここではその詳細な説明を省略する。
この図40に示す第2動作例では、補正部17によるチェックデジットを用いた補正処理を実行しない点を除いては、上記図39に示す第1動作例と同様である。
つまり、図40に示す第2動作例は、認識部15による帳票ID31a,32aの文字認識(ステップS4)後、検査部16がチェックデジットを用いた検査を実行する(ステップS5a)。
しかし、ここで、この検査結果に基づいて補正部17による補正処理を行なわず、検査部16による検査結果に係わらず、確定部18の判定部19による判定処理に移行する(ステップS8)。
例えば、図41(a)に示すように、帳票30の帳票ID31aの一部(ここでは、左端の“1”の部分)が用紙が折れて生じた折れ線30bによって、図41(b)に示すように認識部15によって正しく認識されなかった場合(図中“?”と表記)、第2動作例によれば、図41(c)に示すように、補正部17によるチェックデジットを用いた補正処理を行なうことなく、相互補正部20が補正処理を行なう。つまり、補正部17は、帳票ID31a,32aのうちのいずれかのチェックデジットがリジェクトされた場合には、補正処理を実行しない。なお、相互補正部20は、ここでは、帳票ID31a,32aが同一であるという所定の関係に基づいて、帳票ID31a,32aを一意に“1237”に補正する。
したがって、本帳票認識装置10の第2動作例によれば、上述した第1動作例と同様の作用効果を得ることできるとともに、補正部17による補正処理を行なわない分、上述した第1動作例よりも高速に認識処理を実行することができる。
〔1−6〕本帳票認識システムの効果について
このように、本発明の一実施形態としての帳票認識システム1によれば、所定の関係を満たす複数の帳票ID31a,32aが記入された帳票30を認識するにあたり、帳票認識装置10の確定部18が、認識部15による認識内容が正しいか否かを帳票ID31a,32aに予め設定された所定の関係に基づいて判断し、誤っていると判定した場合には、この所定の関係に基づいて帳票ID31a,32aを補正した上で確定する。
したがって、単に一つの帳票IDだけで当該帳票IDの内容を認識することなく、複数の帳票ID31a,32aを用いてこれら帳票ID31a,32aの内容を認識するので帳票ID31a,32aの内容認識を高精度に行なうことができる。しかも、これら帳票ID31a,32a間の所定の関係に基づいて認識内容が正しいか否かの判定処理や補正処理を行なうので、帳票ID31a,32aの内容をより高精度に認識することができる。
さらに、帳票ID31a,32aの内容を高精度に認識することができるので、帳票判別部22による帳票30の判別を高精度に行なうことができる。その結果、本帳票認識システム1では、帳票30のスキャナ装置40による再読み取りやオペレータによる手入力処理等、本帳票認識装置10の自動処理を中断する、時間が掛かる処理を行なうことを抑止でき、帳票30の判別処理を高効率且つ高速に行なうことができる。
また、帳票判別部22は、確定部18によって帳票ID31a,32aの内容が確定しなかった場合には、定義情報に基づいて帳票30を判別するので、帳票30をより確実に判別することができる。
さらに、検査部16がチェックデジットを用いた検査を実行するので、認識部15によって認識された帳票ID31a,32aの認識内容に対して、検査部16と判定部19とによって2重の検査が実行されることになり、その結果、より高精度な文字認識を行なうことができる。
なお、チェックデジットを用いた補正が可能な場合には、補正部17がチェックデジットを用いて帳票ID31a,32aの内容を補正するので、相互補正部20による補正を行なわずに、認識部15による認識内容を効率良く補正することができる。
また、補正部17が、認識部15によって帳票ID31a,32aのいずれかのチェックデジットがリジェクトされた場合には、チェックデジットを用いた補正処理を行なわないので、チェックデジットを逆算するような処理時間が比較的長くなる処理を省くことができ、この場合には相互補正部20が補正処理を実行することによって、認識部15による認識内容に対する補正処理を非常に高効率に実行することができる。
〔2〕本発明の変形例について
なお、本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
〔2−1〕変形例1について
上述した実施形態では、帳票認識装置10の補正部17が、チェックデジットに基づいて補正処理を実行する例をあげて説明したが、本発明はこれに限定されるものではなく、例えば、補正部17が、認識部15によって算出された一致度に基づいて、補正処理を実行するように構成してもよく、これによっても上述した実施形態と同様の作用効果を得ることができる。
なお、検査部16による検査の結果、帳票ID31a,32aがともに誤っていると判定された場合に、補正部17が認識部15によって算出された一致度に基づいて補正処理を実行することが好ましい。
つまり、図42(a)に示すように、帳票30の帳票ID31a,32aがそれぞれ“1237”,“2964”であった場合に、認識部15によって、図42(b)に示すように帳票ID31aが“1737”と認識され、帳票ID32aが“2984”と認識されたとする。
このとき、図42(c)に示すように、検査部16によるチェックビットを用いた検査結果が、帳票ID31a,32aが両方とも誤っていると判定された場合(図中、整合性“×”と表記)、補正部17は、帳票ID31aについては、“1737”のうちの一致度が最も低い左端から2桁目の“7”を、一致度が第2位の“2”に補正(つまり、“1237”に補正)して、再度、検査部16による検査を受ける。そして、図42(c)に示すように、検査部16によって正しいと判定された場合(図中、整合性“○”と表記)、この数字を帳票ID31aとする。
一方、帳票ID32aについては、“2984”のうちの一致度が最も低い右端の“4”を、一致度が第2位の“9”に補正(つまり、“2989”に補正)する。
そして、再度、検査部16による検査を受けた結果、誤っていると判定された場合には、最初に認識部15によって認識された“2984”のうちの、一致度が2番目に低い左端から3桁目の“8”を一致度が第2位の“6”に補正(つまり、“2964”に補正)する。
そして、再度、検査部による検査を受け、ここで正しいと判定されると、この数字を帳票ID32aとする。
これにより、上述した実施形態と同様の効果を得ることができる。
〔2−2〕変形例2について
上述した実施形態では、確定部18の相互補正部20が、判定部19によって認識部15による認識内容が誤っていると判定されると、必ず補正処理を実行するように構成したが、本発明はこれに限定されるものではなく、例えば、相互補正部20は、図43(a)に示すように、帳票ID31a,32aが同一であるという関係を満たしている場合に、認識部15によって、これら帳票ID31a,32aのそれぞれにおいて、チェックデジット(ここでは、左端の“?”参照)がリジェクトされた場合であって、且つ、図43(b)に示すように、帳票情報DB21aが保持する帳票情報(ここではテーブル21b)が、帳票ID31a,32aのチェックデジットを除いた部分で構成されている場合には、補正処理を実行しない。
つまり、確定部18は、下3桁の“237”だけを帳票ID31a,32aとして確定し、このとき、帳票判別部22は、帳票ID31a,32a“237”とテーブル21bとに基づいて、帳票30を判別する。
したがって、この場合には、相互補正部20による補正処理を省くことができ、高効率に帳票ID31a,32aを認識することができるとともに、相互補正部20による補正処理の分、帳票30の判別処理を高速に実行することができる。
〔2−3〕変形例3について
上述した実施形態では、確定部18の相互補正部20が、帳票ID31a,32a間に予め設定された所定の関係に基づいて補正処理を実行する例をあげて説明したが、本発明はこれに限定されるものではなく、例えば、相互補正部20が、認識部15によって算出された一致度に基づいて補正を行なうように構成してもよい。
例えば、図44(a)に示すように、帳票30において、帳票ID31a,32aが同一の場合であって、帳票ID32aの左端から3桁目の“3”に折れ線30bが入ったことによって、この数字“3”に対する認識部15による認識結果が、図44(b)に示すように“8”になってしまった場合、相互補正部20は、図44(c)に示すような帳票ID31a,32aのそれぞれの左端から3桁目の数字に対する一致度に基づいて、補正処理を行なう。
ここでは、図44(c)に示す帳票ID31a,32aのそれぞれの一位の文字の一致度を比較し、左端から3桁目の数字を、一致度が大きい“3”で確定すべく、帳票ID32aの“8”を“3”に補正する。
これにより、上述した実施形態と同様の効果を得ることができる。
なお、図44(d)に示すように、帳票ID31aにおける“3”の一致度(ここでは90%)と、帳票ID32aにおける“8”の一致度(ここでは90%)とが等しい場合には、相互補正部20は、帳票ID31a,32aのそれぞれについて、認識部15によって算出された一致度が第1位の内容についての一致度と第2位の内容についての一致度との差を算出し(ここでは、帳票ID31aが“50%”、帳票ID32aが“20%”)、この差が大きい方の帳票ID31a,32aの第1位の内容を、帳票ID31a,32aの内容として確定するように補正する。
ここでは、左端から3桁目の数字を、一致度の差が大きい帳票ID31aの“3”で確定すべく、帳票ID32aの“8”を“3”に補正する。
これにより、帳票ID31a,32aの内容をより確実に認識することができる。
また、図44(e)に示すような、認識部15によって算出される一致度(一位と二位の候補文字に対する一致度)を示すテーブル15bを予めそなえ、相互補正部20が、図44(c)もしくは図44(d)に示す一致度と、このテーブル15bに示す一致度とを比較し、一致度が異なっていれば、その一致度が異なっている文字が誤っていると判断するようにしてもよく、これによっても上述した実施形態と同様の効果を得ることができる。
つまり、ここでは、帳票ID32aの“8”の一致度(図44(c),図44(d)参照)が、テーブル15bの“8”の一致度と異なっているので、相互補正部20は、この“8”が誤っていると判断して、“3”に補正する。
これにより、上述した実施形態と同様の効果を得ることができる。
〔2−4〕変形例4について
上述した実施形態では、判断部23が、認識部15による帳票ID31a,32aの認識状態に基づいて判断処理を行なう場合を例にあげて説明したが、本発明はこれに限定されるものではなく、判断部23が、帳票30のスキャナ装置40による再読み取り回数に基づいて、オペレータによる手入力をさせるか否かを決定するように構成してもよい。
つまり、図45に示すフローチャート(ステップS20〜S25)に示すように、帳票判別部22によって初めて判別できなかったときには、再読み取り回数(Nre)を“1”にし(ステップS20)、判断部23はスキャナ装置40による再読み取りを実行させて、帳票判別部22による処理が実行される(ステップS21)。
ここで帳票が判別されれば(ステップS22のYesルート)、処理は終了する。
しかし、ここでも帳票が判別されなければ(ステップS22のNoルート)、判断部23は、再読み取り回数を1回カウントアップし(ステップS23)、さらに、再読み取り回数が所定回数(NreMax)より小さいかを判断する(ステップS24)。
ここで、再読み取り回数が所定回数よりも小さければ(ステップS24のNoルート)、再度、上記ステップS21〜S24までの処理を実行する。
一方、再読み取り回数が所定回数以上になれば(ステップS24のYesルート)、判断部23は、オペレータによる手入力を判断して(ステップS25)、処理を終了する。
これにより、上述した実施形態と同様に、帳票の判別処理を高精度に効率良く実行することができる。
また、この判断部23によって判断された、オペレータによる手入力処理は、例えば、図46に示すフローチャート(ステップS30〜S36)に示すように、所定時間経過後、もしくは、所定枚数到達後、に実行することが好ましく、これにより、オペレータによる手入力処理をある程度まとめて実行することができ、帳票認識装置10の自動的な認識処理を中断することなく、効率良い認識処理を実行することができる。
つまり、処理時間Tng(NG時間)が現在(Now)、オペレータによって手入力すべき帳票判別部22で判別できなかった帳票の枚数(NG枚数:Nng)が“0”の初期状態(ステップS30)から、帳票判別部22が判別処理を行ない(ステップS31)、次に、判断部32がオペレータによる手入力を実行させるか否かを判断する(ステップS32)。
この判断の結果、手入力処理と判断しなければ(ステップS32のYesルート)、帳票判別部22が次の帳票の判別を行なう(ステップS31)。
一方、手入力処理と判断されると(ステップS32のNoルート)、判断部23が、NG枚数を一つカウントアップし(ステップS33)、NG枚数が所定間数よりも小さいか否かを判断する(ステップS34)。
ここで、NG枚数が所定値以上であれば(ステップS34のNoルート)、判断部23は、オペレータによる手入力処理を実行すべきと判断して、オペレータによる手入力処理を実行させる(ステップS36)。
一方、NG枚数が所定値より小さければ(ステップS34のYesルート)、判断部23は、現在の時間が予め設定された所定時間(TngMax)に達していないかを判断する(ステップS35)。
ここで、所定時間に達していなければ(ステップS35のNoルート)、再度、上記ステップS31〜S34までの処理を実行する。
一方、所定時間に達していれば(ステップS35のYesルート)、判断部23は、上記ステップS36の処理を実行する。
このようにして、オペレータによる手入力処理を、帳票認識処理開始から所定時間経過後、もしくは、NG枚数が所定枚数到達後に実行させることができる。
〔2−5〕変形例5について
上述した実施形態では、確定部18が、複数の帳票ID間に予め設定された所定の関係に基づいて、帳票IDの内容を確定するように構成したが、本発明は、これに限定されるものではなく、例えば、確定部18が、画像状態検出部24によって検出された画像状態に基づいて、帳票IDの内容を確定してもよく、これによっても、上述した実施形態と同様の効果を得ることができる。
つまり、認識対象の帳票に3以上の帳票IDが記入されている場合であって、確定部18の判定部19が、これらの帳票IDの内容が誤っていると判定した場合に、画像状態検出部24が、3以上の帳票IDの周辺領域の画像状態をそれぞれ検出し、確定部18が、この検出された画像状態が悪い帳票IDは認識対象から除外して、画像状態が良好な帳票IDの内容を、帳票に記載された帳票IDの内容と確定してもよい。
これにより、確定部18による確定処理を効率良く、且つ、高精度に実行することができる。
〔3〕その他
なお、上述した本帳票認識装置10のイメージデータ読込部11,IDDB読込部13,抽出部14,認識部15,検査部16,補正部17,確定部18,帳票判別部22,判断部23,画像状態検出部24,及び選択部25としての機能は、コンピュータ(CPU,情報処理装置,各種端末を含む)が所定のアプリケーションプログラム(帳票認識プログラム)を実行することによって実現されてもよい。
そのプログラムは、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RWなど),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD−RW,DVD+R,DVD+RWなど)等のコンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体から帳票認識プログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。
また、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信回線を介してコンピュータに提供するようにしてもよい。
ここで、コンピュータとは、ハードウェアとOS(オペレーティングシステム)とを含む概念であり、OSの制御の下で動作するハードウェアを意味している。
また、OSが不要でアプリケーションプログラム単独でハードウェアを動作させるような場合には、そのハードウェア自体がコンピュータに相当する。
ハードウェアは、少なくとも、CPU等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とをそなえている。
上記帳票認識プログラムとしてのアプリケーションプログラムは、上述のようなコンピュータに、イメージデータ読込部11,IDDB読込部13,抽出部14,認識部15,検査部16,補正部17,確定部18,帳票判別部22,判断部23,画像状態検出部24,及び選択部25としての機能を実現させるプログラムコードを含んでいる。また、その機能の一部は、アプリケーションプログラムではなくOSによって実現されてもよい。
なお、本実施形態としての記録媒体としては、上述したフレキシブルディスク,CD,DVD,磁気ディスク,光ディスク,光磁気ディスクのほか、ICカード,ROMカートリッジ,磁気テープ,パンチカード,コンピュータの内部記憶装置(RAMやROMなどのメモリ),外部記憶装置等や、バーコードなどの符号が印刷された印刷物等の、コンピュータ読取可能な種々の媒体を利用することもできる。
〔4〕付記
(付記1)
複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られたイメージデータから、前記複数の情報のそれぞれを抽出する抽出部と、
該抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部と、
該認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容の補正を行なって、前記複数の情報の内容を確定する確定部とをそなえて構成されていることを特徴とする、媒体処理装置。
(付記2)
前記確定部によって前記情報の内容が確定されると、当該情報の内容に基づいて、前記媒体を判別する媒体判別部をそなえて構成されていることを特徴とする、付記1記載の媒体処理装置。
(付記3)
前記媒体判別部は、前記確定部によって前記情報の内容が確定されなかった場合には、前記媒体の定義情報に基づいて前記媒体を判別することを特徴とする、付記2記載の媒体処理装置。
(付記4)
前記媒体判別部によって前記媒体を判別することができなかった場合に、当該判別できなかった媒体を再読取させるかオペレータによって手入力させるかを、当該媒体の情報の前記認識部による認識状態に応じて判断する判断部をそなえて構成されていることを特徴とする、付記2または付記3記載の媒体処理装置。
(付記5)
前記判断部が、予め設定された前記媒体の再読取回数を超えた場合に、当該媒体を前記オペレータによって手入力させるものと判断することを特徴とする、付記4記載の媒体処理装置。
(付記6)
前記複数の情報のそれぞれがチェックデジットを含み、前記認識部によって認識された前記複数の情報のそれぞれの内容を前記チェックデジットに基づいて検査する検査部をそなえて構成されていることを特徴とする、付記1〜付記5のいずれか1項に記載の媒体処理装置。
(付記7)
前記検査部による前記チェックデジットを用いた検査の結果、前記認識部によって認識された情報の内容が誤っていた場合に、当該チェックデジットを用いて当該情報の内容の補正を行なう補正部をそなえて構成されていることを特徴とする、付記6記載の媒体処理装置。
(付記8)
前記認識部が前記情報としての文字を認識する際に、候補文字ごとに一致度を算出するとともに、
前記検査部による前記検査の結果、前記認識部によって認識された情報としての文字が誤っていた場合に、前記補正部が、前記一致度に基づいて前記候補文字を用いて前記情報を補正することを特徴とする、付記7記載の媒体処理装置。
(付記9)
前記複数の情報が第1情報と第2情報とからなり、前記検査部による前記検査の結果、前記第1情報及び前記第2情報ともに誤っていた場合に、前記補正部が前記補正を実行することを特徴とする、付記8記載の媒体処理装置。
(付記10)
前記認識部によって前記複数の情報のうちのいずれかのチェックデジットがリジェクトされた場合もしくは認識されなかった場合には、前記補正部は、チェックデジットを用いた補正を実行しないことを特徴とする、付記7〜付記9のいずれか1項に記載の媒体処理装置。
(付記11)
前記複数の情報のそれぞれがチェックデジットを含み、前記認識部によって認識された前記複数の情報のそれぞれの内容を前記チェックデジットに基づいて検査する検査部と、
該検査部による前記チェックデジットを用いた検査の結果、前記認識部によって認識された情報の内容が誤っていた場合に、当該チェックデジットを用いて当該情報の内容を補正する補正部とをそなえ、
前記認識部によって前記複数の情報のそれぞれにおいてチェックデジットだけがリジェクトされた場合もしくは認識されなかった場合には、前記補正部は、チェックデジットを用いた補正を実行せず、前記媒体判別部は、前記複数の情報のそれぞれにおいてチェックデジットを除いた内容を用いて前記媒体を判別することを特徴とする、付記2〜付記5のいずれか1項に記載の媒体処理装置。
(付記12)
前記認識部が、前記情報の内容を認識する際に当該内容に対する一致度を算出するように構成され、
前記認識部によって認識された前記複数の情報のそれぞれの内容が前記所定の関係を満たしていない場合には、前記確定部は、前記認識部による認識内容が誤っていると判定するとともに、前記複数の情報のそれぞれにおける前記内容が異なっている部分に対する前記認識部の前記一致度に基づいて、前記補正を行なうことを特徴とする、付記1〜付記11のいずれか1項に記載の媒体処理装置。
(付記13)
前記認識部が前記情報の内容を認識する際に複数の候補の中から前記一致度が最も高い第1位の内容を当該情報に対する認識内容として採用するように構成され、
前記認識部によって認識された前記複数の情報のそれぞれの内容が前記所定の関係を満たしていない場合には、前記確定部は、前記認識部における前記一致度が第1位の内容についての一致度と第2位の内容についての一致度との差を、前記複数の情報のそれぞれについて算出し、算出された前記複数の情報のそれぞれの差に基づいて、前記補正を行なうことを特徴とする、付記12記載の媒体処理装置。
(付記14)
前記抽出部によって3以上の情報が抽出された場合に、前記イメージデータにおける、前記3以上の情報を含むこれら3以上の情報のそれぞれの周辺領域の画像の状態を検出する画像状態検出部と、
該画像状態検出部によって検出された画像状態に基づいて、前記3以上の情報から少なくとも2つの情報を選択する選択部とをそなえ、
前記認識部が、前記選択部によって選択された情報の内容を認識することを特徴とする、付記1〜付記13のいずれか1項に記載の媒体処理装置。
(付記15)
前記確定部が前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合であって、且つ、前記複数の情報が3以上ある場合に、前記イメージデータにおける、前記3以上の情報を含むこれら3以上の情報のそれぞれの周辺領域の画像の状態を検出する画像状態検出部をそなえ、
前記確定部が、該画像状態検出部によって検出された画像状態に基づいて前記複数の情報の内容を確定することを特徴とする、付記1〜付記11のいずれか1項に記載の媒体処理装置。
(付記16)
複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られたイメージデータから前記複数の情報のそれぞれを抽出し、
抽出された前記複数の情報のそれぞれの内容を認識し、
認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を認識されたとおりに確定する一方、認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて認識された内容を補正して、前記複数の情報の内容を確定することを特徴とする、媒体処理方法。
(付記17)
複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体と、
該媒体を読み取って該媒体のイメージデータを取得するスキャナ装置と、
該スキャナ装置によって取得された前記イメージデータに基づいて、前記情報の内容を認識する媒体処理装置とをそなえ、
該媒体処理装置が、
前記イメージデータから、前記複数の情報のそれぞれを抽出する抽出部と、
該抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部と、
該認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容を補正して、前記複数の情報の内容を確定する確定部とをそなえて構成されていることを特徴とする、媒体処理システム。
(付記18)
前記媒体が、前記複数の情報として第1情報と第2情報とを記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のれぞれとが、互いに一対一の対応関係を有する異なる文字からなり、
前記媒体処理装置の前記確定部が、前記対応関係に基づいて前記判定を行なうことを特徴とする、付記17の媒体処理システム。
(付記19)
前記媒体の前記第1情報及び前記第2情報が、前記媒体処理装置の前記認識部による認識率が所定値以上の文字からなり、さらに、前記対応関係が前記認識率に基づいて決定されていることを特徴とする、付記18記載の媒体処理システム。
(付記20)
複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られるイメージデータに基づいて、前記情報の内容を認識する機能をコンピュータに実現させるための媒体処理プログラムを記録したコンピュータ読取可能な記録媒体であって、
前記媒体処理プログラムが、
前記イメージデータから前記複数の情報のそれぞれを抽出する抽出部、
該抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部、及び、
該認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容を補正して、前記複数の情報の内容を確定する確定部として、前記コンピュータを機能させることを特徴とする、媒体処理プログラムを記録したコンピュータ読取可能な記録媒体。
以上のように、本発明によれば、所定の関係を満たす複数の帳票IDを記入された帳票に対して、かかる所定の関係に基づいて複数の帳票IDを高精度に認識することができる。
したがって、本発明は、種類が異なる複数の帳票群をまとめて処理する場合に、各帳票群の先頭に帳票群を識別するための識別情報を記入された識別用帳票を挿入し、帳票群の各帳票に対する処理に先立って、まず識別用帳票を識別することによって、その識別用帳票に後続する帳票群の種類や枚数を認識した上で、かかる帳票群の処理を実行するような帳票認識システムに用いて好適であり、その有用性は極めて高いものと考えられる。
このとき、この帳票認識システムでは、例えば、図47に示すような識別用帳票30cを用いることが考えられる。つまり、識別用帳票30cには、複数の帳票ID31a,32aが記入されるとともに、識別情報として、後続する帳票群の種類(ここでは“P”)や枚数(ここでは“500枚”)が記入される。
本発明によれば、このような識別用帳票30cを用いることによって、種類が異なる複数の帳票群に対する認識処理を非常に高精度に且つ高効率に実行することができる。
本発明の一実施形態としての帳票認識システムの構成を示すブロック図である。 本発明の一実施形態としての帳票認識システムの帳票の一例を示す図である。 図2に示す帳票の第1の帳票IDと第2の帳票IDとの関係を説明するための図である。 図2に示す帳票の第1の帳票IDを構成する文字と第2の帳票IDを構成する文字との一対一の対応関係を説明するための図である。 図2に示す帳票の第1の帳票IDと第2の帳票IDとの関係を説明するための図である。 図2に示す帳票の第1及び第2の帳票IDを構成する文字を説明するための図であり、(a)は各文字の認識率を示す図であり、(b)は各文字の一対一の対応関係を示す図である。 図2に示す帳票の第1の帳票IDと第2の帳票IDとが、図4に示す一対一の対応関係を満たす場合の認識率を説明するための図である。 本発明の一実施形態としての帳票認識システムの帳票に記入される帳票IDを構成する文字の一例について説明するための図であり、(a)はその候補文字の認識率を示す図であり、(b),(c)は候補文字における類似文字を説明するための図であり、(d)は帳票を構成する文字と、各文字の認識率とを示す図である。 本発明の一実施形態としての帳票認識システムの帳票に記入される帳票IDを構成する文字の一例について説明するための図であり、(a)は帳票を構成する文字の認識率を示す図であり、(b),(c),(d)は(a)に示す文字における類似文字を説明するための図であり、(e)は(a)に示す文字を用いて帳票IDを記入された帳票の例を示す図である。 本発明の一実施形態としての帳票認識システムの帳票の一例を示す図である。 本発明の一実施形態としての帳票認識システムのスキャナ装置が図2に示す媒体を読み取ったイメージデータを示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置が実現されるコンピュータの構成例を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の帳票IDデータベースが保持するテーブルの一例を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の帳票IDデータベースが保持するテーブルの一例を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の帳票IDデータベースが保持するテーブルの一例を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の抽出部の構成を説明するための図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の抽出部が帳票IDを抽出する際に使用する探索テンプレートの一例を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の抽出部による図17に示す探索テンプレートを用いた探索処理を説明するための図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の抽出部により図17に示す探索テンプレートによって帳票IDが探索された場合の探索テンプレートを示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の認識部による文字認識処理を説明するための図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の認識部による帳票IDの認識処理の一例を説明するための図であり、(a)は認識対象の帳票IDを示す図であり、(b)は認識結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の認識部による帳票IDの認識処理の一例を説明するための図であり、(a)は認識対象の帳票IDを示す図であり、(b)は認識結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の補正部による帳票IDの補正処理の一例を説明するための図であり、(a)は補正対象の帳票IDを示す図であり、(b)は補正処理にかかる計算を示す図であり、(c)は補正結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の補正部による帳票IDの補正処理の一例を説明するための図であり、(a)は補正対象の帳票IDを示す図であり、(b)は補正処理にかかる計算を示す図であり、(c)は補正結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の補正部による帳票IDの補正処理の一例を説明するための図であり、(a)は補正対象の帳票IDを示す図であり、(b)は補正処理にかかる計算を示す図であり、(c)は補正結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の確定部による帳票IDの内容を確定する処理の一例を説明するための図であり、(a)は内容確定対象の帳票IDを示す図であり、(b)は内容確定結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の確定部による帳票IDの内容を確定する処理の一例を説明するための図であり、(a)は内容確定対象の帳票IDを示す図であり、(b)は内容確定結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の確定部による帳票IDの内容を確定する処理の一例を説明するための図であり、(a)は内容確定対象の帳票IDを示す図であり、(b)は内容確定結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の確定部による帳票IDの内容を確定する処理の一例を説明するための図であり、(a)は内容確定対象の帳票IDを示す図であり、(b)は内容確定結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の帳票情報データベースが保持するテーブルの一例を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の帳票判別部の構成を説明するための図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の判断部による判断例を説明するための図であり、(a)は判断対象の帳票を示す図であり、(b)は(a)に示す帳票の認識部による認識結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の判断部による判断例を説明するための図であり、(a)は判断対象の帳票を示す図であり、(b)は(a)に示す帳票の認識部による認識結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の画像状態検出部による画像状態の検出対象領域の一例を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の画像状態検出部による画像状態の検出処理の一例を説明するための図であり、(a)は検出対象の帳票を示す図であり、(b)は検出結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の画像状態検出部による画像状態の検出処理の一例を説明するための図であり、(a)は検出対象の帳票を示す図であり、(b)は検出結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の画像状態検出部による画像状態の検出処理の一例を説明するための図であり、(a)は検出対象の帳票を示す図であり、(b)は検出結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の画像状態検出部による画像状態の検出処理の一例を説明するための図であり、(a)は検出対象の帳票を示す図であり、(b)は(a)に示す帳票の第1の帳票IDを含む所定領域に対する検出結果を示す図であり、(c)は(a)に示す帳票の第2の帳票IDを含む所定領域に対する検出結果を示す図であり、(d)は(a)に示す帳票の第3の帳票IDを含む所定領域に対する検出結果を示す図であり、(e)は(a)に示す帳票の第4の帳票IDを含む所定領域に対する検出結果を示す図である。 本発明の一実施形態としての帳票認識システムの帳票認識装置の動作手順の一例を示すフローチャートである。 本発明の一実施形態としての帳票認識システムの帳票認識装置の動作手順の一例を示すフローチャートである。 図40に示す動作手順に対応した帳票認識装置の処理内容の具体例を説明するための図であり、(a)は処理対象の帳票を示す図であり、(b)は認識部による認識結果を示す図であり、(c)は確定部の相互補正部による補正処理を説明するための図である。 本発明の変形例としての帳票認識装置の補正部による補正処理の一例を説明するための図であり、(a)は認識対象の帳票を示す図であり、(b)は認識部による認識結果を示す図であり、(c)は補正部による補正処理を説明するための図である。 本発明の変形例としての帳票認識装置の相互補正部による補正処理の一例を説明するための図であり、(a)は補正対象である帳票IDの認識部による認識結果を示す図であり、(b)は帳票情報データベースが保持するテーブルの一例を示す図である。 本発明の変形例としての帳票認識装置の確定部の相互補正部による補正処理の一例を説明するための図であり、(a)は処理対象の帳票を示す図であり、(b)は認識部による認識結果を示す図であり、(c),(d)は認識部によって算出された一致度を含めた認識結果を示す図であり、(e)は予め保持される認識部によって算出される一致度に関するテーブルを示す図である。 本発明の変形例としての帳票認識装置の判断部による判断処理の動作手順を説明するためのフローチャートである。 本発明の変形例としての帳票認識装置の判断部による判断処理の動作手順を説明するためのフローチャートである。 本発明の一実施形態としての帳票認識システムの帳票(識別用帳票)の一例を示す図である。 従来の帳票認識装置が適用される帳票の一例を示す図である。
符号の説明
1 帳票認識システム(媒体処理システム)
2 コンピュータ
3 表示部
4 キーボード
5 マウス
6 記憶装置
7 演算部(CPU:Central Processing Unit)
10 帳票認識装置(媒体処理装置)
11 イメージデータ読込部
12 IDデータベース
12a〜12c,15b,21a,21b テーブル
13 IDDB読込部
14 抽出部
14−1 帳票ID特徴解析部
14−2 帳票ID探索部
14a 探索テンプレート
15 認識部
15a 文字辞書
15a−1 日本字辞書
15a−2 数字辞書
15a−3 英字辞書
15a−4 記号辞書
16 検査部
17 補正部
18 確定部
19 判定部
20 相互補正部
21 帳票情報データベース
22 帳票判別部(媒体判別部)
22a 帳票ID照合部
22b 定義情報識別部
22c 帳票内容認識部
23 判断部
24 画像状態検出部
25 選択部
30,30c,100 帳票(媒体)
31〜34 領域
31a〜34a 帳票ID
40 スキャナ装置
40a イメージデータ

Claims (5)

  1. 複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られたイメージデータから、前記複数の情報のそれぞれを抽出する抽出部と、
    該抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部と、
    該認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容の補正を行なって、前記複数の情報の内容を確定する確定部とをそなえ、
    前記媒体が、第1情報と第2情報とを含む前記複数の情報を記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のそれぞれとが、互いに一対一の対応関係を有する文字からなるとともに、前記一対一の対応関係は、各文字の認識率に応じて設定され
    前記確定部が、前記対応関係に基づいて前記判定を行なうことを特徴とする、媒体処理装置。
  2. 前記確定部によって前記情報の内容が確定されると、当該情報の内容に基づいて、前記媒体を判別する媒体判別部をそなえて構成されていることを特徴とする、請求項1記載の媒体処理装置。
  3. 複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られたイメージデータから前記複数の情報のそれぞれを抽出し、
    抽出された前記複数の情報のそれぞれの内容を認識し、
    認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を認識されたとおりに確定する一方、認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて認識された内容を補正して、前記複数の情報の内容を確定するとともに、
    前記媒体が、第1情報と第2情報とを含む前記複数の情報を記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のそれぞれとが、互いに一対一の対応関係を有する文字からなるとともに、前記一対一の対応関係は、各文字の認識率に応じて設定され
    前記対応関係に基づいて前記判定を行なうことを特徴とする、媒体処理方法。
  4. 複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体と、
    該媒体を読み取って該媒体のイメージデータを取得するスキャナ装置と、
    該スキャナ装置によって取得された前記イメージデータに基づいて、前記情報の内容を認識する媒体処理装置とをそなえ、
    該媒体処理装置が、
    前記イメージデータから、前記複数の情報のそれぞれを抽出する抽出部と、
    該抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部と、
    該認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容を補正して、前記複数の情報の内容を確定する確定部とをそなえ、
    前記媒体が、第1情報と第2情報とを含む前記複数の情報を記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のそれぞれとが、互いに一対一の対応関係を有する文字からなるとともに、前記一対一の対応関係は、各文字の認識率に応じて設定され
    前記確定部が、前記対応関係に基づいて前記判定を行なうことを特徴とする、媒体処理システム。
  5. 複数の領域に所定の関係を満たす複数の情報をそれぞれ記入された媒体を読み取って得られるイメージデータに基づいて、前記情報の内容を認識する機能をコンピュータに実現させるための媒体処理プログラムを記録したコンピュータ読取可能な記録媒体であって、
    前記媒体処理プログラムが、
    前記イメージデータから前記複数の情報のそれぞれを抽出する抽出部、
    該抽出部によって抽出された前記複数の情報のそれぞれの内容を認識する認識部、及び、
    該認識部によって認識された前記複数の情報の内容が正しいか否かを前記所定の関係に基づいて判定し、正しいと判定した場合には、前記複数の情報の内容を前記認識部によって認識されたとおりに確定する一方、前記認識部によって認識された前記複数の情報の内容が誤っていると判定した場合には、前記所定の関係に基づいて前記認識部による認識内容を補正して、前記複数の情報の内容を確定する確定部として、前記コンピュータを機能させるとともに、
    前記媒体が、第1情報と第2情報とを含む前記複数の情報を記入され、前記第1情報を構成する文字のそれぞれと前記第2情報を構成する文字のそれぞれとが、互いに一対一の対応関係を有する文字からなるとともに、前記一対一の対応関係は、各文字の認識率に応じて設定され
    前記確定部が、前記対応関係に基づいて前記判定を行なうように、前記コンピュータを機能させることを特徴とする、媒体処理プログラムを記録したコンピュータ読取可能な記録媒体。
JP2005378617A 2005-12-28 2005-12-28 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体 Active JP4977368B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005378617A JP4977368B2 (ja) 2005-12-28 2005-12-28 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
US11/411,086 US7715633B2 (en) 2005-12-28 2006-04-26 Medium processing apparatus, medium processing method, medium processing system and computer readable recording medium with medium processing program recorded thereon
KR1020060044627A KR100742582B1 (ko) 2005-12-28 2006-05-18 매체 처리 장치, 매체 처리 방법, 매체 처리 시스템 및매체 처리 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
CN200610082620XA CN1991863B (zh) 2005-12-28 2006-05-19 介质处理设备、介质处理方法及介质处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005378617A JP4977368B2 (ja) 2005-12-28 2005-12-28 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2007179395A JP2007179395A (ja) 2007-07-12
JP4977368B2 true JP4977368B2 (ja) 2012-07-18

Family

ID=38193819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005378617A Active JP4977368B2 (ja) 2005-12-28 2005-12-28 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体

Country Status (4)

Country Link
US (1) US7715633B2 (ja)
JP (1) JP4977368B2 (ja)
KR (1) KR100742582B1 (ja)
CN (1) CN1991863B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7787158B2 (en) * 2005-02-01 2010-08-31 Canon Kabushiki Kaisha Data processing apparatus, image processing apparatus, data processing method, image processing method, and programs for implementing the methods
JP2007206822A (ja) * 2006-01-31 2007-08-16 Fuji Xerox Co Ltd 文書管理システム、文書廃棄管理システム、文書管理方法および文書廃棄管理方法
JP4984554B2 (ja) * 2006-01-31 2012-07-25 富士ゼロックス株式会社 廃棄処理装置、廃棄処理情報管理システムおよび廃棄処理方法
JP4849216B2 (ja) * 2006-01-31 2012-01-11 富士ゼロックス株式会社 用紙廃棄処理システムおよび用紙廃棄処理装置
JP2007206879A (ja) * 2006-01-31 2007-08-16 Fuji Xerox Co Ltd 廃棄装置、廃棄システム及び廃棄方法
US8023718B1 (en) * 2007-01-16 2011-09-20 Burroughs Payment Systems, Inc. Method and system for linking front and rear images in a document reader/imager
JP5116608B2 (ja) * 2008-08-20 2013-01-09 キヤノン株式会社 情報処理装置、制御方法、及びプログラム
JP7206740B2 (ja) * 2018-09-25 2023-01-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN111695566B (zh) * 2020-06-18 2023-03-14 郑州大学 一种对固定格式文档的识别处理方法及处理***
CN112308070B (zh) * 2020-10-30 2024-04-26 深圳前海微众银行股份有限公司 证件信息的识别方法及装置、设备和计算机可读存储介质
CN112817716B (zh) * 2021-01-28 2024-02-09 厦门树冠科技有限公司 一种视觉检测处理方法及***

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6235989A (ja) * 1985-08-08 1987-02-16 Nec Corp 光学文字読み取り装置における認識方式
JPH01109488A (ja) * 1987-10-23 1989-04-26 Hitachi Ltd 誤読検出方式
JPH0256086A (ja) * 1988-08-22 1990-02-26 Ricoh Co Ltd 文字認識の後処理方法
JPH06141123A (ja) 1992-10-28 1994-05-20 Hitachi Ltd イメ−ジ処理システム
JP3593379B2 (ja) 1995-03-20 2004-11-24 株式会社日立製作所 帳票類取扱装置
JPH08272880A (ja) * 1995-03-31 1996-10-18 Hitachi Ltd Fax受信システム帳票判別方法
JPH08335247A (ja) 1995-06-08 1996-12-17 Oki Electric Ind Co Ltd フォーマット情報生成方法及びフォーマット情報生成装置
EP0790573B1 (en) * 1995-07-31 2007-05-09 Fujitsu Limited Document processor and document processing method
JPH09190482A (ja) * 1996-01-09 1997-07-22 Toshiba Corp 帳票読取システム及び帳票データ読取方法
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
JPH10320488A (ja) 1997-05-21 1998-12-04 Hitachi Ltd データエントリ方法及び装置
JP3871417B2 (ja) * 1997-11-14 2007-01-24 シャープ株式会社 画像処理装置
TW457458B (en) * 1998-06-01 2001-10-01 Canon Kk Image processing method, device and storage medium therefor
JP4235286B2 (ja) * 1998-09-11 2009-03-11 キヤノン株式会社 表認識方法及び装置
JP2000215131A (ja) * 1999-01-22 2000-08-04 Canon Inc 情報処理装置、ネットワ―クシステム、情報管理方法、及び記憶媒体
US6580820B1 (en) * 1999-06-09 2003-06-17 Xerox Corporation Digital imaging method and apparatus for detection of document security marks
JP3766854B2 (ja) 1999-06-22 2006-04-19 カシオ計算機株式会社 データ処理装置
US6996538B2 (en) * 2000-03-07 2006-02-07 Unisone Corporation Inventory control system and methods
JP2003526166A (ja) 2000-03-07 2003-09-02 インビニティ・システムズ・コーポレーション インベントリ管理システム及び方法
JP3682400B2 (ja) 2000-05-18 2005-08-10 エスオーエンジニアリング株式会社 計測対象物の自動出荷管理システムおよび自動出荷方法
JP2002032704A (ja) * 2000-07-17 2002-01-31 Toshiba Corp 帳票処理システム、帳票処理方法、記憶媒体、帳票
JP4392114B2 (ja) 2000-07-19 2009-12-24 ポーラ化成工業株式会社 真皮コラーゲン線維束再構築剤及びそれを含有する組成物
JP3962891B2 (ja) * 2000-08-09 2007-08-22 富士ゼロックス株式会社 文書画像処理装置、文書画像処理方法、及び記憶媒体
JP4298904B2 (ja) * 2000-09-20 2009-07-22 沖ソフトウェア株式会社 文字認識方法
JP2002215800A (ja) 2000-11-29 2002-08-02 Toshiba Corp 統合型在宅介護サービス支援システム、統合型在宅介護サービス支援方法、および記憶媒体
JP2002334162A (ja) 2001-05-11 2002-11-22 Yoshitsugu Tsujita 本人及び事物情報管理システム
JP2002192785A (ja) 2001-09-19 2002-07-10 Hitachi Ltd 帳票類取扱装置
JP3882585B2 (ja) * 2001-11-07 2007-02-21 富士ゼロックス株式会社 画像処理装置およびプログラム
JP4412525B2 (ja) 2001-11-30 2010-02-10 富士通株式会社 帳票認識装置および帳票認識方法
JP4185699B2 (ja) 2002-04-12 2008-11-26 日立オムロンターミナルソリューションズ株式会社 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
JP4102105B2 (ja) * 2002-05-24 2008-06-18 株式会社日立製作所 電子ペンを利用した書類記入システム
JP4141754B2 (ja) * 2002-07-09 2008-08-27 株式会社リコー 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004054749A (ja) 2002-07-23 2004-02-19 Nec Corp 多種多様な直接材b2b取引に対応可能な注文登録システムに活用できる画面生成エンジン。
JP3902163B2 (ja) 2003-07-11 2007-04-04 大日本印刷株式会社 関連帳票判定システム、電子ペン及びプログラム
JP2005128865A (ja) * 2003-10-24 2005-05-19 Casio Comput Co Ltd データ認識装置及びプログラム
EP1551146B1 (en) * 2004-01-05 2011-08-24 Ricoh Company, Ltd. Document security management for repeatedly reproduced hardcopy and electronic documents
JP2005266925A (ja) * 2004-03-16 2005-09-29 Toshiba Solutions Corp 帳票読取装置、プログラム及び帳票読取装置による帳票読取方法
US20050281450A1 (en) * 2004-06-18 2005-12-22 Digicor Llc System and method for correcting data in financial documents
US20060157559A1 (en) * 2004-07-07 2006-07-20 Levy Kenneth L Systems and methods for document verification
US7588192B2 (en) * 2006-01-20 2009-09-15 Xerox Corporation Hard copy protection and confirmation method

Also Published As

Publication number Publication date
KR20070070018A (ko) 2007-07-03
JP2007179395A (ja) 2007-07-12
CN1991863A (zh) 2007-07-04
CN1991863B (zh) 2010-05-12
US7715633B2 (en) 2010-05-11
KR100742582B1 (ko) 2007-08-02
US20070147710A1 (en) 2007-06-28

Similar Documents

Publication Publication Date Title
JP4977368B2 (ja) 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
US7120318B2 (en) Automatic document reading system for technical drawings
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
JP5500480B2 (ja) 帳票認識装置及び帳票認識方法
US7106904B2 (en) Form identification method
JP4873138B2 (ja) 情報処理装置及びプログラム
US20100094888A1 (en) Method and system for acquiring data from machine-readable documents
JP4078009B2 (ja) 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置
US6320983B1 (en) Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein
JP2012181653A (ja) 採点方法、採点方法のプログラム及び採点システム
JP4160206B2 (ja) 文字認識装置を利用したデータベース登録方法
JPH1173472A (ja) フォーマット情報登録方法及びocrシステム
JP4566510B2 (ja) 帳票認識装置および帳票認識方法
JP2009223612A (ja) 画像認識装置及びプログラム
CN113449763A (zh) 信息处理装置以及记录媒体
JP3673616B2 (ja) 商品券識別方法及び装置
JP3946043B2 (ja) 帳票識別装置及び識別方法
JPH0773267A (ja) 誤りを識別し補正する方法および装置
US11704921B2 (en) Image processing apparatus, image processing method, and storage medium
JP3648270B2 (ja) 帳票類読取装置及び会計帳票読取装置
JP2965165B2 (ja) パターン認識方法及び認識用辞書作成方法
JP2014081867A (ja) 情報処理装置及び情報処理プログラム
JP6941331B2 (ja) 画像認識システム
JP7404625B2 (ja) 情報処理装置、及びプログラム
JP2002366900A (ja) 光学式文字読取装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120416

R150 Certificate of patent or registration of utility model

Ref document number: 4977368

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150420

Year of fee payment: 3