JP2000148763A - 画像記憶方法及びその装置 - Google Patents

画像記憶方法及びその装置

Info

Publication number
JP2000148763A
JP2000148763A JP10313680A JP31368098A JP2000148763A JP 2000148763 A JP2000148763 A JP 2000148763A JP 10313680 A JP10313680 A JP 10313680A JP 31368098 A JP31368098 A JP 31368098A JP 2000148763 A JP2000148763 A JP 2000148763A
Authority
JP
Japan
Prior art keywords
information
image
extracted
storage device
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10313680A
Other languages
English (en)
Inventor
Toshiaki Shoji
利明 小路
Ichiro Saito
一郎 斎藤
Yoshikazu Nadai
義和 灘井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP10313680A priority Critical patent/JP2000148763A/ja
Publication of JP2000148763A publication Critical patent/JP2000148763A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】形式が定められた帳票の画像を入力する1回の
作業で検索キーを自動的に入力する。キーの種別を分別
する。 【解決手段】データ処理装置1と記憶装置とスキャナー
2とからなる画像記憶装置において、記憶装置に記憶さ
れる情報は、スキャナー2により記入済み帳票3から読
み取られた帳票画像情報と、帳票書式の複数項記載にそ
れぞれに対応するように記載種類と記載座標とにより記
憶データ化された帳票書式情報と、帳票画像から記載座
標により抽出された抽出画像情報と、抽出画像から前記
記載種類の種別が付加されて取り出された記載種別情報
とからなる。各情報は座標を持つので同じ座標系上の元
の帳票帳票を差し引いた差分情報は、そのまま、検索キ
ーとして用いることができるので、キーワードの入力が
不要である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像記憶方法及び
その記憶装置に関し、特に、形式が定まった帳票上に検
査データなど種々の情報が書き込まれ蓄積された膨大な
データから必要な情報を検索する画像記憶方法及びその
記憶装置に関する。
【0002】
【従来の技術】原子力発電プラント、火力発電プラン
ト、化学プラント、輸送機、各種工場の構造を形成する
構造体、配管等に関して、破損、亀裂、剥離、磨耗など
多様な項目について定期検査が行われる。元になるデー
タは、現場で規定の(形式が定まった)帳票用紙に検査
員により手書きで記入される。その記入情報は、オペレ
ータによりコンピュータに登録され記録される。これら
の情報は、後に検索される。その検索のためにキーワー
ドが入力される。このような検査結果を記録する帳票の
数は膨大である。
【0003】現在、帳票は、画像として光学的スキャナ
ーによりコンピュータに読み込まれ、同時に、その読み
込みと独立にその帳票を見ながら検索時のキーとなるべ
き文字列をキーボードから入力している。言い換える
と、従来は、帳票データとキーワードは、これらの独立
情報が人為的に関連づけられ2回の操作に分けられて入
力されている。このため、画像入力とキー入力の2回の
膨大な量の作業が必要であり膨大な作業時間が必要であ
る。その入力作業には、人が帳票を読みキーワードを解
釈する必要があり、解釈ミス、入力ミスが発生する。個
々の画像データとキーを1対1で関連づける知的作業も
膨大である。
【0004】帳票の画像を入力する1回の作業で検索キ
ーも自動的に入力され、その結果、データの入力時間を
大幅に短縮し人為的入力ミスが生じないことが好まし
い。
【0005】
【発明が解決しようとする課題】本発明は、このような
技術的背景に基づいてなされたものであり、次のような
課題を解決する。本発明の課題は、形式が定められた帳
票の画像を入力する1回の作業で検索キーも自動的に入
力される画像記憶方法及びその記憶装置を提供すること
にある。本発明の他の課題は、形式が定められた帳票の
画像を入力する1回の作業で検索キーも自動的に入力さ
れデータの入力時間が大幅に短縮される画像記憶方法及
びその記憶装置を提供することにある。本発明の更に他
の課題は、形式が定められた帳票の画像を入力する1回
の作業で検索キーも自動的に入力されデータの入力時間
が大幅に短縮され人為的入力ミスが生じない画像記憶方
法及びその記憶装置を提供することにある。本発明の更
に他の課題は、形式が定められた帳票の画像を入力する
1回の作業で検索キーも自動的に入力されキーの種別の
分別が可能である画像記憶方法及びその記憶装置を提供
することにある。
【0006】
【課題を解決するための手段】本発明による画像記憶方
法は、下記ステップ、即ち、形式化された帳票のそれ自
体の基礎画像情報を持つこと、記入された帳票を画像情
報として入力すること、前記画像情報から前記基礎画像
情報を減算すること、前記減算後の画像情報の全部又は
一部をキーとすることとからなる。減算後の情報の全部
又は一部は、そのままキーとなる。基礎情報は、情報を
情報種別ごとに区別することができる構成情報として用
いられる。構成情報は、大分類を行う領域の類情報と各
領域ごとの小分類を行う種情報を含む。
【0007】言い換えると、本発明による画像記憶方法
は、前もって対象とする帳票の基礎画像を複数の領域に
分けて、その各領域が表現する基礎情報の種類を定めて
おき、その基礎情報を用いて、実際に読み込んだ画像情
報の各領域の種類に応じた情報を座標に基づいて減算に
より抽出する処理を施すことにより、キーとなるキー情
報を自動的に抽出し、画像データと関連づけてキー情報
を蓄積する検索可能な画像記憶装置である。同一フォー
ムの帳票について最初に構成情報データを作成しておく
ことにより、帳票入力の自動化が可能になっている。1
回のスキャナーによる所定フォームの帳票を読み込むだ
けで、検索用のキーが画像データと関連づけられて自動
的に作成される。テキストファイルである構成定義ファ
イルの情報は、エディタで直接に作成することもできる
が、元の帳票に各領域を示す矩形とその領域の種類を記
入したものをスキャナーで読み込むことによって、自動
的に作成することができる。
【0008】本発明による画像記憶装置は、データ処理
装置と記憶装置とスキャナーとからなる画像記憶装置に
おいて、前記記憶装置に記憶される情報は、前記スキャ
ナーにより記入済み帳票から読み取られた帳票画像情報
と、帳票書式の複数項記載にそれぞれに対応するように
記載種類と記載座標とにより記憶データ化された帳票書
式情報と、前記帳票画像から前記記載座標により抽出さ
れた抽出画像情報と、前記抽出画像情報から前記記載種
類の種別が付加されて取り出された記載種別情報とから
なる。
【0009】その記憶装置に記憶される情報は、更に、
帳票が元から有する元画像情報を含むことが好ましい。
この元画像情報は各帳票について共通情報であるから、
スキャナーで得られた画像情報からその共通情報を差し
引くことにより、簡単に、その帳票に固有の情報を取り
出すことができ、このように取り出された(切り出され
た)情報は、そのままが、検索キー(ワード・図形)と
して用いることができる。言い換えれば、その抽出画像
情報は、帳票画像情報から元画像情報が差し引かれた差
分情報である。
【0010】その抽出画像情報は、帳票画像の第1領域
として抽出された文字列情報と、帳票画像の第2領域と
して抽出された図形の記載座標情報と図形の形状情報
と、帳票画像の第3領域として抽出された選択項目情報
と前記選択項目の座標情報とから構成することが更に好
ましい。このように、図形、文字、選択項目がそれぞれ
に抽出画像から小分類として取り出され、このように取
り出された情報は個々の帳票上で特定された座標を持つ
ので、各領域ごとに検索キーとして用いることができ
る。
【0011】
【発明の実施の形態】図1は、本発明による画像記憶装
置の形態の構成機器を示している。ディスプレイを持つ
パソコン又はEWS1は、大量に画像情報を記憶するこ
とができる補助記憶装置を備えている。光学的読み取り
装置であるスキャナー2が、EWS1に接続されてい
る。スキャナー2で読み取られる帳票の画像情報は、E
WS1に記憶される。図2に示すように、各帳票3は、
スキャナー2でディジタル情報に変換され、パソコン又
はEWS1の帳票読込部4で読み込まれ、EWS1の帳
票データ部5に蓄積される。
【0012】EWS1のデータ抽出部6は、後述する帳
票テンプレートデータ7と構成情報データ8とにより記
述される。帳票に設定されている各領域の範囲とその領
域の種類が元にされ、帳票データ5から将来の検索のた
めに使用するキーとなるキー情報がデータ抽出部6によ
り抽出される。抽出された情報は、検索キー9としてデ
ータベースに蓄積される。それと同時に、帳票データを
検索キー9と対応させ、画像データ10としてデータベ
ースに蓄積される。
【0013】構成情報データ8は、帳票上に設定される
座標系でその座標値で規定される各範囲の領域と、その
各領域を示す領域コードとからなるテキストデータであ
る。構成情報データ8は、エディタ等を用いて直接に作
成することができる。その作成を簡単にするために、E
WS1は領域構成データ生成部12を備えている。領域
構成データ生成部12は、各領域を示す矩形図と各領域
に対応した種類を示す領域番号が元となる帳票の上に記
入された領域構成図11を読み込むことができる。領域
構成データ生成部12は、更に、読み込んだ画像の処理
を行って、各領域の範囲とその種類を認識し、構成情報
データ8を作成する。
【0014】帳票テンプレート7は、未記入の帳票が帳
票読込部4で読み込まれた情報であり、情報が書き込ま
れた帳票から前もって印刷されている情報(元の帳票自
体の情報)を減算する場合に用いられる元情報である。
【0015】[実施例]図3,4は、前述の実施の形態
の実施例を示している。図3は、ある製品に関する検査
結果を書き込むための帳票を示し、そこにはまだ何も記
入されていない。図4は、その帳票の領域を説明するた
めの参考図であり、後述する領域2に検査対象部位が射
軸投影図として記入されている。図4に示すように、そ
の帳票は3つの領域を持っている。領域1は、その製品
名、検査種別、シリアルコード等の情報が文字列として
手書きで記入される文字列入力領域の記入欄である。領
域1で記述された情報に対しては、OCR技術によって
文字列を帳票読込部4により取り出してパソコン又はE
WS1に読み込むことができる。
【0016】領域2は、手書きで図形が追記される図形
入力領域である。手書入力図形は、OCRで読み込んだ
後には、画像処理を受け、更には、デジタル化されるこ
とができる。領域2に対しては、帳票テンプレート7に
ある画像データを記入ずみ帳票のデータから図形情報の
みを取り出すために減算処理が特に行われる。このよう
な減算処理による図形情報の取り出し方は、その後にそ
の情報を用いてどのような検索を行うかの都合によって
異なる。手書きで記入された図形の領域だけが必要な場
合は、その座標値の最大値と最小値を求めておけばよ
く、形状認識が必要となる場合はパターン認識処理が行
われる。
【0017】領域3は、検査項目、亀裂、磨耗などが発
見された検査結果の種類を選ぶ選択領域であ。その記入
の仕方は、予め印刷されているいくつかの項目のいずれ
かをチェックして選択することである。チェックとは、
レ点をつけたり、丸印をつけたりすることである。その
チェック位置がどの項目位置に近いかを判断することに
より、減算処理なしにキーを発生させることができる。
【0018】図5は、図3,4の帳票に対応した領域構
成を示す領域構成図である。この領域構成図には、対象
となる帳票と同じ座標系で、上述の3領域を示す矩形と
各領域の種類を示す数字・番号が記入される。大分類で
ある3領域には、数字1、数字2、数字3が対応してい
る。その対応は、帳票上に機械的原点が設定された機械
座標系とコンピュータ内の帳票上にプログラム原点が設
定されたプログラム座標系により記述される。
【0019】小分類項目は、大分類表示の数字の後(右
側)にハイフン”−”を続けてその次に小分類番号がつ
けられ、”3−12”のように記入される。選択領域に
ついては、更に、選択項目ごとのチェック位置とその選
択項目を区別して識別するための記号(英数字)が記入
される。
【0020】[付記]なお、手書き図形情報は、慣用の
図形認識技術により、線、円、閉じた曲線として、数量
化される。図形情報はもともと帳票上で座標を持つ。文
字列、選択項目も帳票上の幾何学的位置としてそれらの
座標値が与えられる。帳票上の座標は、帳票が拡大縮小
されて読み取られても、帳票が持つ矩形情報などからス
キャナーで読み取られた画像情報をパソコンなどの計算
手段により、原点が特定された上で決定される。
【0021】座標の僅かな読み取り誤差は、慣用の画像
修正機能により容易に修正されうる。選択項目の座標
は、厳密でなくてよく、ある範囲で与えられ、例えば座
標100から座標110の範囲にある情報として検索さ
れることになる。たとえて言えば、碁盤状の下敷きの上
に位置決めして載せたトレーシングぺーパ(テンプレー
ト)に書き込んだ図形は、そのまま、その原点が特定さ
れている限りその2次元座標情報を有している。この2
次元座標情報は、碁盤情報が捨象された抽出情報であ
る。逆に、2次元座標情報が捨象された残りの碁盤情報
も、抽出情報である。
【0022】
【発明の効果】本発明による画像記憶方法及びその記憶
装置は、大量の帳票を画像データベースに登録する際
に、個々の帳票にキーワード(検索キー)をつける必要
がなく、従って、その作業が不要であるから、膨大な入
力作業を一掃することができ、入力ミスは当然に発生し
ない。帳票の構成データの形式などに関する知識が不要
であるので、データ作成が容易であり他種類の帳票への
対応が簡単である。
【図面の簡単な説明】
【図1】図1は、本発明による画像記憶装置の実施の形
態の機器構成を示す斜軸投影図である。
【図2】図2は、キー情報を抽出するための機器構成又
は機能を示すブロック図である。
【図3】図3は、帳票を示す平面図である。
【図4】図4は、図4の帳票の領域を解説するための参
考用平面図である。
【図5】図5は、帳票の構成情報データの構成を示す仮
想の構成図である。
【符号の説明】
1…パソコン又はEWS 2…スキャナー 3…帳票 5…帳票データ部 6…データ抽出部 7…帳票テンプレート 8…構成情報データ 9…検索キー 10…画像データ 11…領域構成図 12…領域構成データ生成部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 灘井 義和 兵庫県高砂市荒井町新浜2丁目1番1号 三菱重工業株式会社高砂製作所内 Fターム(参考) 5B075 ND06 NK13 NK24 NK31 PP10 PP12

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】形式化された帳票のそれ自体の基礎情報を
    持つステップと、 記入された帳票を画像情報として入力するステップと、 前記画像情報から前記基礎情報を減算するステップと、 前記減算後の情報の全部又は一部をキーとするステップ
    とからなる画像記憶方法。
  2. 【請求項2】データ処理装置と記憶装置とスキャナーと
    からなる画像記憶装置において、前記記憶装置に記憶さ
    れる情報は、 前記スキャナーにより記入済み帳票から読み取られた帳
    票画像情報と、 帳票書式の複数項記載にそれぞれに対応するように記載
    種類と記載座標とにより記憶データ化された帳票書式情
    報と、 前記帳票画像から前記記載座標により抽出された抽出画
    像情報と、 前記抽出画像から前記記載種類の種別が付加されて取り
    出された記載種別情報とからなる画像記憶装置。
  3. 【請求項3】請求項2において、 前記記憶装置に記憶される前記情報は、更に、 前記帳票が元から有する元画像情報とからなり、 前記抽出画像情報は、前記帳票画像情報から前記元画像
    情報が差し引かれた差分情報である画像記憶装置。
  4. 【請求項4】請求項2において、 前記抽出画像情報は、 前記帳票画像の第1領域として抽出された文字列情報
    と、 前記帳票画像の第2領域として抽出された図形の記載座
    標情報と前記図形の形状情報と、 前記帳票画像の第3領域として抽出された選択項目情報
    と前記選択項目の座標情報とからなる画像記憶装置。
JP10313680A 1998-11-04 1998-11-04 画像記憶方法及びその装置 Withdrawn JP2000148763A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10313680A JP2000148763A (ja) 1998-11-04 1998-11-04 画像記憶方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10313680A JP2000148763A (ja) 1998-11-04 1998-11-04 画像記憶方法及びその装置

Publications (1)

Publication Number Publication Date
JP2000148763A true JP2000148763A (ja) 2000-05-30

Family

ID=18044227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10313680A Withdrawn JP2000148763A (ja) 1998-11-04 1998-11-04 画像記憶方法及びその装置

Country Status (1)

Country Link
JP (1) JP2000148763A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304889A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像処理装置及びその制御方法
US7487119B2 (en) 2000-12-20 2009-02-03 Ricoh Company, Ltd. Physical distribution business management method, physical distribution business management system, and storage medium
JP2009037605A (ja) * 2007-07-12 2009-02-19 Oki Data Corp 文書検索装置及び画像形成装置、文書検索システム
KR101024522B1 (ko) 2007-12-28 2011-03-31 주식회사 디케이아이테크놀로지 키워드 데이터 추출방법 및 그 장치

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7487119B2 (en) 2000-12-20 2009-02-03 Ricoh Company, Ltd. Physical distribution business management method, physical distribution business management system, and storage medium
JP2007304889A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像処理装置及びその制御方法
JP2009037605A (ja) * 2007-07-12 2009-02-19 Oki Data Corp 文書検索装置及び画像形成装置、文書検索システム
US8429154B2 (en) 2007-07-12 2013-04-23 Oki Data Corporation Document search device, imaging forming apparatus, and document search system
KR101024522B1 (ko) 2007-12-28 2011-03-31 주식회사 디케이아이테크놀로지 키워드 데이터 추출방법 및 그 장치

Similar Documents

Publication Publication Date Title
US6782144B2 (en) Document scanner, system and method
EP0439743B1 (en) Constraint driven on-line recognition of handwritten characters and symbols
US7181068B2 (en) Mathematical expression recognizing device, mathematical expression recognizing method, character recognizing device and character recognizing method
US5201011A (en) Method and apparatus for image hand markup detection using morphological techniques
US5926565A (en) Computer method for processing records with images and multiple fonts
JP3534277B2 (ja) 文書エレメントの論理的識別方法
JPH06111056A (ja) 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法
JP3294995B2 (ja) 帳票読取装置
JPH0420226B2 (ja)
JP3422924B2 (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Meunier Optimized XY-cut for determining a page reading order
US5950213A (en) Input sheet creating and processing system
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
US6401235B1 (en) Method of and apparatus for producing exposure mask
EP1202213B1 (en) Document format identification apparatus and method
JP2008108114A (ja) 文書処理装置および文書処理方法
Hamzah et al. Data capturing: Methods, issues and concern
JP2000148763A (ja) 画像記憶方法及びその装置
JP2004178010A (ja) 文書処理装置並びにその方法及びプログラム
JP2005234790A (ja) 手書き帳票処理システム、手書き帳票処理方法
Peng et al. Document image matching based on component blocks
Mariner Optical Character Recognition (OCR)
Yamashita et al. A document recognition system and its applications
Alzuru et al. Cooperative human-machine data extraction from biological collections
JP3487523B2 (ja) 文書処理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060110