JPH1166232A - 帳票定義方法 - Google Patents

帳票定義方法

Info

Publication number
JPH1166232A
JPH1166232A JP9229815A JP22981597A JPH1166232A JP H1166232 A JPH1166232 A JP H1166232A JP 9229815 A JP9229815 A JP 9229815A JP 22981597 A JP22981597 A JP 22981597A JP H1166232 A JPH1166232 A JP H1166232A
Authority
JP
Japan
Prior art keywords
information
area
definition
setting
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9229815A
Other languages
English (en)
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP9229815A priority Critical patent/JPH1166232A/ja
Publication of JPH1166232A publication Critical patent/JPH1166232A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字認識技術等を用いて、定型帳票に帳票情
報を自動的に入力処理する定型帳票処理システムにおい
て、帳票情報を容易に定義できるようにする。 【解決手段】 帳票画像から表のセル及びフレームを自
動的に抽出し、帳票情報を処理する帳票処理領誠を設定
し、文字領域、表領域、図領域等を自動的に分類・識別
し、前記帳票処理領域を前記分類・識別に従ってグルー
プ化し、帳票情報を各グループごとに一括的に定義し、
定義した帳票情報とともに該帳票情報に付随する情報を
設定するようにした帳票情報定義方法。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像の認識方
法に関するものであって、より詳しくは文書画像認識を
利用した帳票処理システムを実現する際に必要不可欠な
技術となる帳票上の各領域の情報を定義する帳票定義方
法に関するものである。
【0002】
【従来の技術】現在コンピュータの進化に伴い、OCR
(光学的文字読取装置)を初めとする文書画像認識の技
術も大きく進歩している。この文書認識技術を利用した
システムとして受発注書などの定型帳票を自動的に処理
する帳票処理システムが実用化されてきた。帳票処理シ
ステムを利用する際には、帳票上のどの領域にどのよう
な情報が入力されるのかを予め定義しておかなければな
らない。そこで、定型帳票を文字認識技術などを用いて
自動的に処理する際に必要となる定型帳票の帳票情報を
定義する方法について、これまでに多くの考案がなされ
ている。帳票情報の定義は非常に面倒な作業であり、操
作方法も難しいことが多いので、考案された方法の多く
はこの操作をより容易にするように工夫したものであ
る。
【0003】例えば、特開平6−96272号公報に記
載された帳票フォーマット定義体作成装置では、日付け
欄では6桁(文字)の数字が入力され、氏名欄ではカタ
カナの領域を8文字分確保している等の入力情報を設定
することにより、帳票情報の定義の簡略化を図ってい
る。しかしながら、この方法では、一つの項目の記入欄
が複数行にわたる場合や、記入欄が離れた位置に存在す
る等、複雑な帳票の場合には設定することが困難である
という問題がある。
【0004】特開平6−19695号公報に記載された
画面帳票情報定義体自動生成処理方式では、同じ定義領
域が何回か繰り返す場合、定義領域が繰り返しであるこ
とを入力するだけで定義することができるようにしてい
る。しかしながら、これらの方法を用いてもまだ帳票情
報定義は容易ではなく、結局、現在までに考案されてき
た帳票定義方法は、十分な効果は得られておらず、ユー
ザの負担も大きく、帳票の定義操作を容易にするために
は不十分なものである。
【0005】
【発明が解決しようとする課題】本発明は、このような
実情に鑑みてなされたものであって、ユーザが帳票処理
システムにおける帳票情報をより容易に定義できるよう
にすることを目的としている。
【0006】請求項1の発明の課題は帳票上の処理領域
を予めグループ化し、帳票情報を各グループ毎に一括し
て定義することによって帳票の定義を容易にすることで
ある。
【0007】請求項2の発明の課題は請求項1の課題に
加え、帳票情報を定義する際に、該情報とともに付随す
る情報を同時に設定して、帳票情報定義の作業量を軽減
することである。
【0008】請求項3の発明の課題は請求項1又は2の
いずれかの発明の課題に加え、表処理技術を用いること
により、処理領域設定を自動化して帳票定義の作業量を
軽減しかつ容易にすることである。
【0009】請求項4の発明の課題は請求項1,2又は
3のいずれかの発明の課題に加え、領域識別技術を用い
ることにより、前記グループ化を実施する領域の設定を
自動化して、帳票情報定義の作業量を軽減しかつ容易に
するとともに、領域設定の全自動化を実現することであ
る。
【0010】
【課題を解決するための手段】請求項1の発明は、定型
帳票に帳票情報を自動的に入力処理する定型帳票処理シ
ステムにおいて、帳票上に前記帳票情報の処理領域を設
定し、前記各処理領域をグループ化し、その後前記帳票
情報を前記処理領域のグループ毎に一括して定義して設
定する各段階から成る、帳票上の前記各処理領域の情報
を定義する帳票定義方法である。
【0011】請求項2の発明は、請求項1に記載の帳票
定義方法において、前記帳票情報を設定する際に、前記
定義した情報とともに前記情報に付随する情報をも設定
する帳票定義方法である。
【0012】請求項3の発明は、請求項1又は2のいず
れかに記載の帳票定義方法において、前記帳票情報の処
理領域を設定する際に、表のセル及びフレームを自動的
に抽出する帳票定義方法である。
【0013】請求項4の発明は、請求項1,2又は3の
いずれかに記載の帳票定義方法において、前記グループ
化を行う際に、帳票画像から文字領域、表領域、図領域
などを自動的に分類・識別する帳票定義方法である。
【0014】
【発明の実施の形態】請求項1の発明の実施態様を図1
及び2を参考に説明する。図1中、1は画像入力部、2
は領域座標設定部、3はグループ設定部、4は帳票情報
設定部、5は帳票定義情報保存部、6は帳票処理部であ
る。画像入力部1は帳票の画像の入力を行う部分であ
り、スキャナーなどの画像入力装置を用いることができ
る。
【0015】領域座標設定部2は、画像入力部1で入力
された画像に対して、処理したい領域を設定するもので
あって、例えば図6に示すような帳票が入力された場合
には、図7に示す住所欄の一番左上の領域のように領域
座標、即ち領域の左上点、右下点の座標値{(x1,y
1)−(x2,y2)}を設定すればよい。このような
領域の設定を帳票上の処理したい全ての領域に対して設
定する。
【0016】グループ設定部3では、領域座標設定部2
で設定した領域のグループ化を行うものであり、例え
ば、図6に示すような帳票が入力された場合、図8に示
すように、住所欄の領域を一つのグループとしてまとめ
るようグループ化する。グループ化の設定方法として
は、グループ化したい領域をすべて包含するグループに
グループ化するなどすればよい。
【0017】帳票情報設定部4は、例えば、図6のよう
な帳票が入力された場合、その帳票の右下の個数欄には
数字しか入ってこないので、OCRで読取りを行う際の
認識対象文字種を数字に設定するようにする。また、住
所欄、氏名欄、品名欄では入ってくる文字列が限定され
ているので、入力される可能性のある文字列を知識辞書
として保持しておき、前記記入欄の種別を設定しておく
とよい。その際、グループ設定部3でグループ化された
領域の情報を設定する場合には、そのグループにグルー
プ化されている領域全体に対して同じ設定をするように
なっている。帳票定義情報保存部5は、帳票情報設定部
4で設定された認識指定文字種など、領域の定義情報を
保持する。
【0018】帳票処理部6では、帳票定義情報保存部5
で保存された帳票定義情報をもとに実際に文字の書かれ
た帳票をOCRなどを使って自動的に処理するものであ
る。しかし、この帳票処理部6は本発明を特定するため
に必要な事項ではないので、本発明には含まれない。
【0019】次に、請求項1の発明の実施態様を図2に
示す動作のフローチャートによって説明する。帳票画像
がスキャナーなどの画像入力手段により入力されると
(S101)、領域座標設定部2では処理したい画像領
域の座標(領域座標)を設定し(S102)、座標が設
定された領域はグループ設定部3においてグループ化さ
れ(S103)、更に、帳票情報設定部4で例えば認識
対象文字種、文字列等の帳票情報の設定を行う(S10
4)、そして、ここまでの動作で設定が終了していれ
ば、その定義情報を保存し(S106)、終了していな
ければ設定が終了するまで、領域座標の設定から前記各
ステップを繰り返し順次実行し(S105)、最後に定
義情報を保存して(S106)帳票の定義を終了する。
【0020】図3は、請求項2の発明の実施態様を説明
するためのフローチャートであり、図3を参考に請求項
2の発明の実施態様を説明する。帳票画像がスキャナー
などの画像入力手段により入力されると(S201)、
領域座標設定部2では処理したい画像の領域の座標(領
域座標)を設定し(S202)、座標が設定された領域
はグループ設定部3においてグループ化され(S20
4)、更に、帳票情報設定部4で例えば認識対象文字
種、文字列等の帳票情報の設定(S204)及び付属情
報の設定を行う(S205)。そして、ここまでの動作
で設定が終了していれば、その帳票定義情報を保存し
(S207)、終了していなければ設定が終了するま
で、領域座標の設定から前記各ステップを繰り返し順次
実行し(S206)、最後に定義情報を保存して(S2
07)帳票の定義を終了する。
【0021】請求項2の発明の実施態様を実施するため
の帳票情報定義部は、図1に記載されたものを用いれば
よい。即ち、画像入力部1、領域座標設定部2、グルー
プ設定部3、帳票情報設定部4、帳票定義情報保存部
5、帳票処理部6が用いられる。ここで、帳票情報設定
部4は、領域座標設定部2、グループ設定部3で設定さ
れた領域、グループ領域に対してその領域毎の詳細な情
報を設定するが、その設定の際に、設定する情報に基づ
いてその情報に付随する情報も同時に設定できるように
している。例えば、帳票中に郵便番号を記入する欄があ
った場合に、その欄をグループ化し、郵便番号欄である
と指定した場合には、認識指定文字種を自動的に数字に
設定したり、認識文字数を3または5と設定することが
できる。
【0022】次に、請求項3の発明の実施態様について
説明する。図4は、請求項3の発明の実施態様の一例を
説明するためのフローチャートであり、この図を参考に
して請求項3の発明の実施態様を説明する。帳票画像が
スキャナーなどの画像入力手段により入力されると(S
301)、表中のセルやフレームを自動的に抽出する表
処理を行い(S302)、領域座標設定部2では処理し
たい画像の領域の座標(領域座標)を設定し(S30
3)、座標が設定された領域はグループ設定部3におい
てグループ化され(S304)、更に、帳票情報設定部
4で例えば認識対象文字種、文字列等の帳票情報の設定
を行う(S305)。そして、ここまでの動作で設定が
終了していれば、その定義情報を保存し(S307)、
終了していなければ設定が終了するまで、表処理のステ
ップから前記各ステップを繰り返し順次実行し(S30
6)、最後に定義情報を保存して(S307)帳票の定
義を終了する。
【0023】請求項3の発明の実施態様を実施するため
の帳票定義部は図1に記載されたものが用いられる。即
ち、画像入力部1、領域座標設定部2、グループ設定部
3、帳票情報設定部4、帳票定義情報保存部5、帳票処
理部6から成る帳票定義部が用いられる。しかしここで
は領域座標設定部2が画像入力部1で入力された画像に
対して処理したい領域を設定する際に、表中のセルやフ
レームを自動的に抽出する表処理技術を用いている。例
えば、図6に示す帳票が入力された際に、図9図示のよ
うに表領域を指定すると、その表中のセルを図中の灰色
で塗潰された領域のように自動的に抽出するので、その
領域を帳票処理用の領域としてそのまま設定することが
できる。
【0024】図5は、請求項4の発明の実施態様の一例
を説明するためのフローチャートであり、この図を参考
にして請求項4の発明の実施態様を説明する。帳票画像
がスキャナーなどの画像入力手段により入力されると
(S401)、表中のセルやフレームを自動的に抽出す
る表処理を行い(S402)、領域座標設定部2では処
理したい画像の領域の座標(領域座標)を設定し(S4
03)、座標が設定された領域は領域識別され(S40
4)、グループ設定部3においてグループ化され(S4
05)、更に、帳票情報設定部4で例えば認識対象文字
種、文字列等の帳票情報の設定を行う(S406)。そ
して、ここまでの動作で設定が終了していれば、その定
義情報を保存し(S408)、終了していなければ設定
が終了するまで、表処理のステップから前記各ステップ
を繰り返し順次実行し(S407)、最後に定義情報を
保存して(S408)帳票の定義を終了する。
【0025】請求項4の発明の実施態様を実施するため
の帳票定義部は図1に示すとおりである。即ち、図1に
示す画像入力部1、領域座標設定部2、グループ設定部
3、帳票情報設定部4、帳票定義情報保存部5、帳票処
理部6から成る帳票定義部が用いられる。但し、この場
合、グループ設定部3では、領域座標設定部2で設定し
た領域のグループ化を行う際に画像から文字領域、表領
域、図領域などを自動的に分類・識別する領域識別技術
を用いている。例えば、図6の帳票が入力された場合、
領域識別技術を用いると、図10のように文字領域・表
領域・囲み領域といように自動的に分類できるので、こ
の表領域、囲み枠領域をグループ化領域として利用する
ことができる。
【0026】本発明の方法はソフトウェアによっても実
現することができる。本発明をソフトウェアによって実
現する場合には、図11に示すように、CPU、メモ
リ、表示装置、ハードディスク、キーボード、CD−R
OMドライブ、スキャナなどからなるコンピュータシス
テムを用意する。CD−ROMなどのコンピュータ読み
取り可能な記録媒体には、本発明の画像領域座標の設
定、グループ化、帳票情報設定、等の帳票定義機能を実
現するプログラムが記録されている。また、スキャナな
どの画像入力手段から入力された帳票画像は一時的にハ
ードディスクなどに格納される。そして、該プログラム
が起動されると、一時保存された帳票画像データが読み
込まれて、前記帳票定義を実行し、その処理結果をディ
スプレイなどに出力する。
【0027】
【発明の効果】
請求項1に対応する効果:帳票で定義する情報を予めグ
ループ化して一括して定義するので、非常に面倒であ
り、大変であった帳票の定義を容易にすることができ
る。 請求項2に対応する効果:請求項1に対応する効果に加
え、帳票情報を定義する際に、該情報とともに付随する
情報も同時に設定するので、帳票定義の作業量を軽減す
ることができる。 請求項3に対応する効果:請求項1又は2のいずれかに
対応する効果に加え、表処理技術を用いることにより、
処理領域の設定を自動化できるので、帳票定義の作業量
を軽減できかつ帳票定義も容易になる。 請求項4に対応する効果:請求項1,2又は3のいずれ
かに対応する効果に加え、領域識別技術を用いることに
より、グループ化領域の設定を自動化できるので、帳票
情報定義の作業量が軽減できかつ帳票情報定義が容易に
なる。また、請求項3の発明において、請求項4の発明
を実施することにより領域設定の全自動化を実現するこ
とができる。
【図面の簡単な説明】
【図1】 本発明を実施する帳票定義部及び帳票処理部
を説明するためのブロック図である。
【図2】 請求項1の発明の実施態様を説明するための
フローチャートである。
【図3】 請求項2の発明の実施態様を説明するための
フローチャートである。
【図4】 請求項3の発明の実施態様の一例を説明する
ためのフローチャートである。
【図5】 請求項4の発明の実施態様の一例を説明する
ためのフローチャートである。
【図6】 本発明の実施態様により処理する帳票の一例
を示す図である。
【図7】 本発明の実施態様による帳票の処理領域の設
定を説明するための図である。
【図8】 本発明の実施態様による前記処理領域のグル
ープ化を説明するための図である。
【図9】 本発明の実施態様による表中のセルやフレー
ムの自動抽出を説明するための図である。
【図10】 本発明の実施態様による領域識別を説明す
るための図である。
【図11】 本発明をソフトウェアによって実施する場
合に使用されるコンピュータシステムの一例を示す図で
ある。
【符号の説明】 1…画像入力部、2…領域座標設定部、3…グループ設
定部、4…帳票情報設定部、5…帳票定義情報保存部、
6…帳標処理部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 定型帳票に帳票情報を自動的に入力処理
    する定型帳票処理システムにおいて、帳票上に前記帳票
    情報の処理領域を設定し、前記各処理領域をグループ化
    し、その後前記帳票情報を前記処理領域のグループ毎に
    一括して定義して設定する各段階から成る、帳票上の前
    記各処理領域の情報を定義する帳票定義方法。
  2. 【請求項2】 請求項1に記載の帳票定義方法におい
    て、前記帳票情報を設定する際に、前記定義した情報と
    ともに前記情報に付随する情報をも設定することを特徴
    とする帳票定義方法。
  3. 【請求項3】 請求項1又は2のいずれかに記載の帳票
    定義方法において、前記帳票情報の処理領域を設定する
    際に、表のセル及びフレームを自動的に抽出することを
    特徴とする帳票定義方法。
  4. 【請求項4】 請求項1,2又は3のいずれかに記載の
    帳票定義方法において、前記グループ化を行う際に、帳
    票画像から文字領域、表領域、図領域などを自動的に分
    類・識別することを特徴とする帳票定義方法。
JP9229815A 1997-08-26 1997-08-26 帳票定義方法 Pending JPH1166232A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9229815A JPH1166232A (ja) 1997-08-26 1997-08-26 帳票定義方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9229815A JPH1166232A (ja) 1997-08-26 1997-08-26 帳票定義方法

Publications (1)

Publication Number Publication Date
JPH1166232A true JPH1166232A (ja) 1999-03-09

Family

ID=16898111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9229815A Pending JPH1166232A (ja) 1997-08-26 1997-08-26 帳票定義方法

Country Status (1)

Country Link
JP (1) JPH1166232A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011192274A (ja) * 2010-03-11 2011-09-29 Ricoh Co Ltd フォームテンプレートを定義する方法及び装置
JP2022162380A (ja) * 2021-04-12 2022-10-24 株式会社プリマジェスト 情報処理装置、情報処理方法、及びプログラム
JP2022162379A (ja) * 2021-04-12 2022-10-24 株式会社プリマジェスト 情報処理装置、情報処理方法、及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011192274A (ja) * 2010-03-11 2011-09-29 Ricoh Co Ltd フォームテンプレートを定義する方法及び装置
JP2022162380A (ja) * 2021-04-12 2022-10-24 株式会社プリマジェスト 情報処理装置、情報処理方法、及びプログラム
JP2022162379A (ja) * 2021-04-12 2022-10-24 株式会社プリマジェスト 情報処理装置、情報処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP2000090195A (ja) 表認識方法及び装置
JP3814320B2 (ja) 画像処理方法及び装置
EP0584776A2 (en) Information processing method and apparatus
CN114937270A (zh) 古籍文字处理方法、装置及计算机可读存储介质
JP2008108114A (ja) 文書処理装置および文書処理方法
CN116682118A (zh) 一种古文字识别方法、***、终端及介质
JPH1166232A (ja) 帳票定義方法
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP2001202475A (ja) 文字認識装置及び文字認識装置の制御方法
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JP2002024761A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP3484446B2 (ja) 光学文字認識装置
JPH1166065A (ja) 画像配置装置およびそのプログラム記録媒体
JPH0635987A (ja) 回路図作成装置および回路図作成方法
JPH0384681A (ja) 名刺情報の入力処理方法
JPH08161350A (ja) 電子ファイリング方法および装置
JP2000339405A (ja) 光学的文字認識システム、同システムに於ける帳票のフォーマットコントロール作成方法、及び同方法が格納された記憶媒体
JPH11272707A (ja) 情報処理システム
JPH11191112A (ja) テンプレートによる文字抽出方法
CN114332875A (zh) 一种笔记卡片结构化方法
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPS63204434A (ja) 電子化文書検索装置
JP2837611B2 (ja) プログラム編集方法
JP3237709B2 (ja) 文書処理装置及び文書処理方法
JPH08335249A (ja) 文書読取装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050901

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051122