JPH09204494A - 文字認識装置及びその方法及び画像認識装置及びその方法 - Google Patents

文字認識装置及びその方法及び画像認識装置及びその方法

Info

Publication number
JPH09204494A
JPH09204494A JP8010046A JP1004696A JPH09204494A JP H09204494 A JPH09204494 A JP H09204494A JP 8010046 A JP8010046 A JP 8010046A JP 1004696 A JP1004696 A JP 1004696A JP H09204494 A JPH09204494 A JP H09204494A
Authority
JP
Japan
Prior art keywords
original image
area
block
dividing
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8010046A
Other languages
English (en)
Other versions
JP3412999B2 (ja
Inventor
Kazuyuki Saito
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP01004696A priority Critical patent/JP3412999B2/ja
Priority to US08/786,913 priority patent/US6201894B1/en
Publication of JPH09204494A publication Critical patent/JPH09204494A/ja
Application granted granted Critical
Publication of JP3412999B2 publication Critical patent/JP3412999B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 原稿画像に含まれる罫線で囲まれた領域の構
成を識別することで、複数種類のフォーマットを有する
原稿画像に含まれる該領域内に存在する文字を認識する
ことができる文字認識装置及びその方法を提供する。 【解決手段】 複数種類の戸籍文書に関するフォーマッ
ト情報をROM106に記憶する。そして、戸籍文書を
複数の領域に分割し、分割される領域の特徴に基づい
て、戸籍文書の種類を識別する。識別された種類に対応
する戸籍文書のフォーマット情報を、該戸籍文書の分割
される領域に割り当てて、割り当てられた領域に存在す
る文字を認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、所定のフォーマッ
トを有する原稿画像に含まれる罫線で囲まれた領域に存
在する文字を認識する文字認識装置及びその方法に関す
るものである。
【0002】
【従来の技術】従来、原稿画像に含まれる罫線で囲まれ
た領域内に存在する文字を認識する文字認識装置は、あ
らかじめ該領域の構成が決まっている特定のフォーマッ
トからなる原稿画像の領域内に存在する文字だけしか認
識できなかった。
【0003】
【発明が解決しようとする課題】そのため、上記従来の
文字認識装置では、複数種類のフォーマットを有する原
稿画像に適用できず、利用性が乏しいという問題点があ
った。また、スキャナ等で特定のフォーマットからなる
原稿画像に含まれる罫線で囲まれた領域に含まれる文字
を読み取る際には、その読み取り位置を正確に位置決め
しなけらばならず、文字認識処理における操作に手間が
かかるという問題点があった。
【0004】本発明は上記の問題点に鑑みてなされたも
のであり、原稿画像に含まれる罫線で囲まれた領域の構
成を識別することで、複数種類のフォーマットを有する
原稿画像に含まれる該領域内に存在する文字を認識する
ことができる文字認識装置及びその方法を提供すること
を目的としている。また、原稿画像に含まれる罫線で囲
まれた領域内に存在する文字の認識処理における操作の
作業効率を向上する文字認識装置及びその方法を提供す
ることを目的としている。
【0005】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による画像処理装置は以下の構成を備える。
即ち、所定のフォーマットを有する原稿画像に含まれる
罫線で囲まれた領域に存在する文字を認識する文字認識
装置であって、複数種類の所定のフォーマットを有する
原稿画像に関するフォーマット情報を記憶する記憶手段
と、前記所定のフォーマットを有する原稿画像を複数の
領域に分割する分割手段と、前記分割手段で分割される
領域の特徴に基づいて、前記所定のフォーマットを有す
る原稿画像の種類を識別する識別手段と、前記識別手段
で識別された種類に対応する所定のフォーマットを有す
る原稿画像のフォーマット情報を、該原稿画像の前記分
割手段で分割される領域に割り当てる割当手段と、前記
割当手段で前記フォーマット情報が割り当てられた領域
に存在する文字を認識する認識手段とを備える。
【0006】また、好ましくは、前記識別された種類に
対応する所定のフォーマットを有する原稿画像のフォー
マット情報に基づいて、該原稿画像の前記分割手段で分
割された領域に存在する文字の組方向を設定する設定手
段を更に備え、前記認識手段は、前記設定手段で設定さ
れた組方向に基づいて、前記分割手段で分割された領域
に存在する文字を認識する。
【0007】また、好ましくは、前記識別された種類に
対応する所定のフォーマットを有する原稿画像のフォー
マット情報に基づいて、該原稿画像の前記分割手段で分
割された領域に順序を付加する付加手段と、前記認識手
段は、前記付加手段で付加された順序に基づいて、前記
分割手段で分割された領域に存在する文字を認識する。
【0008】また、好ましくは、前記領域は、罫線で囲
まれた矩形の領域である。また、好ましくは、前記設定
手段は、前記領域の形状に基づいて、該領域に存在する
文字の組方向を設定する。また、好ましくは、前記所定
のフォーマットを有する原稿画像に含まれる罫線を抽出
する抽出手段を更に備え、前記識別手段は、前記抽出手
段の抽出結果に基づいて、前記所定のフォーマットを有
する原稿画像の種類を識別する。
【0009】上記の目的を達成するための本発明による
文字認識方法は以下の構成を備える。即ち、所定のフォ
ーマットを有する原稿画像に含まれる罫線で囲まれた領
域に存在する文字を認識する文字認識方法であって、複
数種類の所定のフォーマットを有する原稿画像に関する
フォーマット情報を記憶媒体に記憶する記憶工程と、前
記所定のフォーマットを有する原稿画像を複数の領域に
分割する分割工程と、前記分割工程で分割される領域の
特徴に基づいて、前記所定のフォーマットを有する原稿
画像の種類を識別する識別工程と、前記識別工程で識別
された種類に対応する所定のフォーマットを有する原稿
画像のフォーマット情報を、該原稿画像の前記分割工程
で分割される領域に割り当てる割当工程と、前記割当工
程で前記フォーマット情報を割り当てられた領域に存在
する文字を認識する認識工程とを備える。
【0010】また、好ましくは、前記識別された種類に
対応する所定のフォーマットを有する原稿画像のフォー
マット情報に基づいて、該原稿画像の前記分割工程で分
割された領域に存在する文字の組方向を設定する設定工
程を更に備え、前記認識工程は、前記設定工程で設定さ
れた組方向に基づいて、前記分割工程で分割された領域
に存在する文字を認識する。
【0011】また、好ましくは、前記識別された種類に
対応する所定のフォーマットを有する原稿画像のフォー
マット情報に基づいて、該原稿画像の前記分割工程で分
割された領域に順序を付加する付加工程を更に備え、前
記認識工程は、前記付加工程で付加された順序に基づい
て、前記分割工程で分割された領域に存在する文字を認
識する。
【0012】また、好ましくは、前記領域は、罫線で囲
まれた矩形の領域である。また、好ましくは、前記設定
工程は、前記領域の形状に基づいて、該領域に存在する
文字の組方向を設定する。また、好ましくは、前記所定
のフォーマットを有する原稿画像に含まれる罫線を抽出
する抽出工程を更に備え、前記識別工程は、前記抽出工
程の抽出結果に基づいて、前記所定のフォーマットを有
する原稿画像の種類を識別する。
【0013】上記の目的を達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
文字認識処理のプログラムコードが格納されたコンピュ
ータ可読メモリであって、複数種類の所定のフォーマッ
トを有する原稿画像に関するフォーマット情報を記憶媒
体に記憶する記憶工程のコードと、前記所定のフォーマ
ットを有する原稿画像を複数の領域に分割する分割工程
のコードと、前記分割工程で分割される領域の特徴に基
づいて、前記所定のフォーマットを有する原稿画像の種
類を識別する識別工程のコードと、前記識別工程で識別
された種類に対応する所定のフォーマットを有する原稿
画像のフォーマット情報を、該原稿画像の前記分割工程
で分割される領域に割り当てる割当工程のコードと、前
記割当工程で前記フォーマット情報を割り当てられた領
域に存在する文字を認識する認識工程のコードとを備え
る。
【0014】
【発明の実施の形態】以下、図面を参照して本発明の好
適な実施の形態を詳細に説明する。図1は本実施の形態
の画像処理装置の機能構成を示すブロック図である。図
1において、101はスキャナであり、原稿画像に光を
照射し、その反射光を読み取り電気信号に変換する。ま
た、スキャナ101より読み込まれた原稿画像は、イメ
ージデータとしてRAM107のVRAM領域に格納さ
れる。102はスキャナインターフェースであり、スキ
ャナ101で得られた電気信号を2値のデジタル電気信
号に変換し、他の装置構成要素に伝送する。103はポ
インティングデバイスとして機能するマウスであり、マ
ウス103を移動することでディスプレイ108上に表
示されるカーソル100を移動する。また、画面に表示
されるメニューにカーソル100を位置し、そのメニュ
ー上で付帯するボタン(不図示)を用いてドラッグ操
作、クリック操作を行うことで、その内容を実行するこ
とができる。104はマウスインタフェースであり、マ
ウス103からの信号を受け、それを他の装置構成要素
に伝送する。114はKB(キーボード)であり、キー
ボードを介してデータの入力や命令の実行を行う。11
3はKBインターフェースであり、KB114からの信
号を受け、それを他の装置構成要素に伝送する。
【0015】105はCPUであり、装置全体の制御及
び後述する領域分割等の本発明で説明される処理や認識
処理を実行する。106はROMであり、CPU105
が実行する制御プログラム、各種処理プログラムやフォ
ントデータ等の各種データを格納している。107はR
AMであり、原稿画像の展開や領域分割処理のための作
業領域等として用いる。また、スキャナ101より読み
込まれたイメージデータ(2値画像データ)を格納する
ための所定の記憶領域としてVRAM領域を持つ。10
8はディスプレイであり、RAM107のVRAM領域
に格納されているイメージデータや本実施の形態で実行
される罫線抽出処理結果等を表示する。109はディス
プレイインターフェースである。
【0016】110はFDD(フロッピーディスクドラ
イブ)であり、FDを装着しデータの読み書きが可能で
ある。また、装着されたFD(不図示)に後述する処理
フローのプログラムを書き込み、該プログラムを本装置
のRAM107に読み込むことで処理を実行させること
ができる。111はFDDインターフェースである。そ
して、112は各装置構成要素を接続するバスである。
【0017】次に本実施の形態で実行される処理につい
て、図2のフローチャートを用いて説明する。図2は本
実施の形態で実行される処理の処理フローを示すフロー
チャートである。図2は本実施の形態で実行される処理
フローを示すフローチャートである。
【0018】尚、本実施の形態で実行される処理は、あ
らかじめ原稿画像を構成する罫線で囲まれる領域(以
下、この領域を項目と呼ぶ)が決まっているような、例
えば、図10に示すような戸籍文書等に適用した場合に
ついて説明するが、これに限定されるものではない。例
えば、構成が決まっている原稿画像であるならば、どの
ようなものでも良い。
【0019】まず、ステップS201で、原稿画像をス
キャナ101で読み込み2値画像データに変換する。ス
テップS202で、得られた2値画像データに対して、
2値画像データに含まれる属性(写真、図形、文字等)
毎に領域を分割する領域分割処理を行う。本実施の形態
では、領域分割処理において、特に、項目を抽出した場
合、その項目の座標データ等の情報をブロックデータと
して図3のように記憶する。
【0020】ここで、図3に示されるブロックデータに
ついて説明する。図3は本実施の形態のブロックデータ
の構成を示す図である。図3は、RAM107に展開さ
れる2値画像データに含まれる項目の位置を示すための
始点座標(X1,Y1)、終点座標(X2,Y2)、有
効フラグ、項目識別ID、認識順序、属性、組方向の情
報を格納する。始点座標は、図10に示されるような各
項目の右上角の位置座標、終点座標は、各項目の左下角
の位置座標を示す。有効フラグは、抽出された項目が有
効であるか否かを示す。項目識別IDは、後述する設定
方法によって各項目の項目識別IDを格納する。認識順
序は、各項目に記入されている文字を認識する場合の認
識順序を格納する。
【0021】属性は、領域分割処理で分割単位である属
性を格納する。本発明の場合、項目(罫線で囲まれた領
域)内にテキストデータが存在する場合は、その旨を示
す属性が格納され、有効フラグに「1」が格納される。
また、項目(罫線で囲まれた領域)内にテキストデータ
が存在しない場合は、その旨を示す属性が格納され、有
効フラグに「0」が格納される。また、組方向は、各項
目に記入されている文字の方向(縦書きあるいは横書
き)を示す情報を格納する。
【0022】次に、ステップS203で、原稿画像の項
目の構成を示すフォーマット情報からその原稿画像の項
目の構成を分類し、その原稿画像を構成する項目を識別
する項目識別処理を行う。尚、原稿画像の項目の構成を
識別する場合、その原稿画像を領域分割して得られるブ
ロックの位置、形状、面積、数等によって、その原稿画
像の項目の構成の種類を分類し、各項目を識別する。ま
た、フォーマット情報はあらかじめROM106に記憶
されているものとする。
【0023】また、本実施の形態の原稿画像として用い
る戸籍文書の項目を分類し識別するために、各項目を分
類し識別するためのID(項目識別ID)を図4の
(a)〜(c)のように定義する。そして、各項目のI
Dを組み合わせることによって戸籍文書の項目を分類し
識別する。ここで、図4の(a)〜(c)に示されるI
D(項目識別ID)について説明する。
【0024】図4の(a)は、戸籍文書の項目の構成
(以下、ページタイプと呼ぶ)の種別を定義するIDで
あり、戸籍文書の最上右にある罫線に囲まれたブロック
領域(図10参照)に書かれている、「筆頭者」あるい
は「非筆頭者」を種別として定義している。図4の
(b)は、戸籍文書のページの記載者の種別を定義する
IDであり、図4の(b)に示されるような種別のID
が定義されている。図4の(c)は、戸籍文書を構成す
る項目の項目名を定義するIDであり、図4の(c)に
示されるような種別のIDが定義されている。
【0025】次に、ステップS203で実行される項目
識別処理の詳細を、図6を用いて説明する。図6は本実
施の形態の項目識別処理の詳細な処理フローを示すフロ
ーチャートである。まず、ステップS601で、戸籍文
書のページタイプの種別を分類し識別する。この識別の
方法としては、戸籍文書の最右上にあるブロック(項
目)の形状によって、その戸籍文書のページタイプを識
別する。
【0026】尚、戸籍文書のページタイプ、筆頭者が記
載されているページタイプ(以下、「筆頭者タイプ」と
呼ぶ)と、筆頭者が記載されていないページタイプ(以
下、「非筆頭者タイプ」と呼ぶ)の2種類がある。ま
た、識別の方法としては、例えば、戸籍文書の最右上の
ブロックの幅がその高さよりも長い場合は「筆頭者タイ
プ」として識別し、それ以外は「非筆頭者タイプ」とし
て識別することでページタイプを識別する。あるいは、
最右上のブロックの幅が、そのブロックのY1座標と同
じY1座標を持つブロックの幅よりも大きい場合は「筆
頭者タイプ」として識別し、一方、最右上のブロックの
幅が、そのブロックのY1座標と同じY1座標を持つブ
ロックの幅が同じである場合は「非筆頭者タイプ」とし
て識別することもできる。
【0027】再び、フローチャートの説明に戻る。ステ
ップS601において、戸籍文書の最右上のブロックの
幅がその高さよりも長い場合は「筆頭者タイプ」として
識別し、ステップS604に進む。一方、戸籍文書の最
右上のブロックの幅がその高さよりも短い場合は「非筆
頭者タイプ」として識別し、ステップS602に進む。
【0028】戸籍文書のページタイプが識別されたなら
ば、次に、更に詳細な戸籍文書の識別と項目の識別の鍵
となるブロック(以下、KEYブロックと呼ぶ)を、戸
籍文書に構成される各項目の相対的な位置関係に検出す
る。まず、ページタイプが「筆頭者タイプ」の場合、ス
テップS604で、「本籍」というタイトルがついてい
るブロックと、編製された年月日が記載されている欄の
最初の行のブロックと、入籍データ等が記載されている
欄の最初の行のブロックと、「父」というタイトルがつ
いているブロックをそれぞれKEY0〜3ブロックとし
て検出し、各ブロックデータのアドレスを図5に示すよ
うなKEYブロックデータ構造体に記憶する。
【0029】ここで図5に示すKEYブロックデータ構
造体について説明する。図5は本実施の形態のKEYブ
ロックデータ構造体の構成を示す図である。図5におい
て、KEYブロック構造体は、戸籍文書を構成する項目
の識別の鍵となる項目の情報を記憶するものであり、図
に示すような6つのKEY0〜5ブロックが存在する。
そして、ページタイプの種別に応じて検出すべきKEY
ブロックが検出され、その検出されたKEYブロックの
ブロックデータを記憶する。
【0030】次に、ステップS605で、検出したKE
Y0〜3ブロックを用いて、各KEY0〜3ブロックと
共通する情報を持つ項目毎に、更に詳細に項目を抽出
し、抽出した項目に対し、項目識別IDを設定する。こ
の設定の詳細については、図7のフローチャートを用い
て後述する。一方、ページタイプが「非筆頭者タイプ」
の場合、ステップS602で、1人目の入籍データが記
載されている欄の最初の行のブロックと、1人目の
「父」というタイトルがついているブロックと、2人目
の入籍データ等が記載されている欄の最初の行のブロッ
クと、2人目の「父」というタイトルがついているブロ
ックをそれぞれKEY2〜5ブロックとして検出し、そ
の検出されたKEY2〜5ブロックのブロックデータを
KEYブロック構造体に記憶する。
【0031】次に、ステップS603で、検出したKE
Y2〜5ブロックを用いて、各KEY2〜5ブロックと
共通する情報を持つ項目毎に、更に詳細に項目を抽出
し、抽出した項目に対し、項目識別IDを設定する。こ
の設定の詳細については、図8のフローチャートを用い
て後述する。まず、ページタイプが「筆頭者タイプ」の
場合の項目識別IDを設定する処理について、図7のフ
ローチャートを用いて説明する。
【0032】図7は本実施の形態のページタイプが「筆
頭者タイプ」の場合の項目識別IDを設定する処理の処
理フローを示すフローチャートである。まず、ステップ
S701で、KEY0ブロック(図10の「本籍」とい
うタイトルがついているブロック)の下にある3つの同
じ幅を持つブロックに対して、それぞれ項目識別IDを
設定する。ステップS702で、KEY1ブロック(図
10の編製事項が記載されている欄の最初の行のブロッ
ク)からKEY1ブロックを含めて左に4個のブロック
およびその下にあるブロックは、同じ項目群(編製事項
の欄)とみなせるブロックであるので、これらのブロッ
クに項目識別IDを設定する。
【0033】ステップS703で、KEY2ブロック
(図10の入籍データ等が記載されている欄の最初の行
のブロック)からKEY2ブロックを含めて左に10個
のブロックは、同じ項目群(入籍データ等の欄)とみな
せるブロックであるので、これらのブロックに項目識別
IDを設定する。ステップS704で、KEY2ブロッ
クを含む項目群の下にあるブロックは、KEY3ブロッ
ク(図10の「父」というタイトルがついているブロッ
ク)からKEY3ブロックを含めて左にあるKEY3ブ
ロックと同じY1座標を持つブロックが存在し、そのブ
ロック数を計数する。そして、ステップS705で、計
数されたブロック数に基づいて、KEY2ブロックを含
む項目群の下にあるブロックの項目識別IDを設定す
る。この設定の詳細については、図9のフローチャート
を用いて後述する。
【0034】次に、ページタイプが「非筆頭者タイプ」
の場合の項目識別IDを設定する処理について、図8の
フローチャートを用いて説明する。図8は本実施の形態
のページタイプが「非筆頭者タイプ」の場合の項目識別
IDを設定する処理の処理フローを示すフローチャート
である。まず、ステップS801で、KEY2ブロック
(入籍データ等が記載されている欄の最初の行のブロッ
ク)からKEY2ブロックを含めて左に9個のブロック
は、同じ項目群(入籍データ等の欄)とみなせるブロッ
クであるので、これらのブロックに項目識別IDを設定
する。
【0035】ステップS802で、KEY4ブロック
(2人目の入籍データ等が記載されている欄の最初の行
のブロック)からKEY4ブロックを含めて左に9個の
ブロックは、同じ項目群(2人目の入籍データ等の欄)
とみなせるブロックであるので、これらのブロックに項
目識別IDを設定する。ステップS803で、KEY2
ブロックを含む項目群の下にあるブロックは、KEY3
ブロック(「父」というタイトルがついているブロッ
ク)からKEY3ブロックを含めて左にあるKEY3ブ
ロックと同じY1座標を持つブロックが存在し、そのブ
ロック数を計数する。そして、ステップS804で、計
数されたブロック数に基づいて、KEY2ブロックを含
む項目群の下にあるブロックの項目識別IDを設定す
る。
【0036】ステップS805で、KEY4ブロックを
含む項目群の下にあるブロックは、KEY5ブロック
(2人目の「父」というタイトルがついているブロッ
ク)からKEY5ブロックを含めて左にあるKEY5ブ
ロックと同じY1座標を持つブロックが存在し、そのブ
ロック数を計数する。そして、ステップS806で、計
数されたブロック数に基づいて、KEY4ブロックを含
む項目群の下にあるブロックの項目識別IDを設定す
る。
【0037】次に、入籍データ等の欄の下にあるブロッ
クの項目識別IDを設定する処理の詳細について、図9
のフローチャートを用いて説明する。図9は本実施の形
態の入籍データ等の欄の下にあるブロックの項目識別I
Dを設定する処理の処理フローを示すフローチャートで
ある。尚、図9のフローチャートは、図7のフローチャ
ートのステップS704、図8のフローチャートのステ
ップS804、ステップS805で実行される処理であ
るが、ここでは図7のフローチャートのステップS70
4、つまり、ページタイプが「筆頭者タイプ」の戸籍文
書である場合を、例に挙げて説明する。また、図8のフ
ローチャートのステップS804、ステップS805、
つまり、ページタイプが「非筆頭者タイプ」の戸籍文書
である場合については、同様の処理で実現されるので、
ここでは省略する。
【0038】まず、ステップS901で、計数されたブ
ロック数を判定し、ブロック数が4の場合は、実父母の
みが記載されているタイプ(以下、「実子タイプ」と呼
ぶ)と判定して、ステップS902に進む。また、ブロ
ック数が5の場合は、養父あるいは養母のどちらか一方
のみが記載されているタイプ(以下、「養子タイプA」
と呼ぶ)と判定して、ステップS905に進む。更に、
ブロック数が6の場合は、養父および養母の両方が記載
されているタイプ(以下、「養子タイプB」と呼ぶ)と
判定して、ステップS909に進む。
【0039】計数されたブロック数が4の場合、つま
り、「実子タイプ」である場合、ステップS902で、
KEY3ブロックから左に2番目のブロックの形状が横
長であるか否かを判定する。横長である場合(ステップ
S902でYES)、「既婚(夫か妻)タイプ」と判定
して、ステップS903に進む。一方、横長でない場合
(ステップS902でNO)、「未婚タイプ」と判定し
て、ステップS904に進む。
【0040】ステップS903では、「実子タイプ」及
び「既婚(夫か妻)タイプ」として、KEY3ブロック
との相対位置関係から項目識別IDを設定する。また、
ステップS904では、「実子タイプ」及び「未婚タイ
プ」として、KEY3ブロックとの相対位置関係から項
目識別IDを設定する。計数されたブロック数が5の場
合、つまり、「養子タイプA」である場合、ステップS
905で、KEY3ブロックから左に3番目のブロック
の形状が横長であるか否かを判定する。横長である場合
(ステップS905でYES)、「既婚(夫か妻)タイ
プ」と判定して、ステップS906に進む。一方、横長
でない場合(ステップS905でNO)、「未婚タイ
プ」と判定して、ステップS907に進む。
【0041】ステップS906では、「実子タイプ」及
び「既婚(夫か妻)タイプ」として、KEY3ブロック
との相対位置関係から項目識別IDを設定する。また、
ステップS907では、「実子タイプ」及び「未婚タイ
プ」として、KEY3ブロックとの相対位置関係から項
目識別IDを設定する。計数されたブロック数が6の場
合、つまり、「養子タイプB」である場合、ステップS
909で、KEY3ブロックから左に4番目のブロック
の形状が横長であるか否かを判定する。横長である場合
(ステップS909でYES)、「既婚(夫か妻)タイ
プ」と判定して、ステップS910に進む。一方、横長
でない場合(ステップS909でNO)、「未婚タイ
プ」と判定して、ステップS911に進む。
【0042】ステップS910では、「実子タイプ」及
び「既婚(夫か妻)タイプ」として、KEY3ブロック
との相対位置関係から項目識別IDを設定する。また、
ステップS911では、「実子タイプ」及び「未婚タイ
プ」として、KEY3ブロックとの相対位置関係から項
目識別IDを設定する。次に、上述の図2のフローチャ
ートのステップS203において実行される具体的な処
理の過程を、図10〜図12を用いて説明する。
【0043】例えば、図10のような戸籍文書の原稿画
像に対して、図2のステップS202で説明される領域
分割処理を施した結果として、図11に示すような複数
の項目のブロックB1101〜B1136が得られたと
する。そして、図11の領域分割結果に対し、図2のス
テップS203で説明される項目識別処理を行うと、こ
の場合、最右上のブロックB1101の幅が高さより長
く、かつ他の同じY1座標を持つブロックの幅とは異な
るので「筆頭者タイプ」と判定される。
【0044】そして、ページタイプが「筆頭者タイプ」
と判定されたので、最右上のブロックB1101を
『「本籍」というタイトルがついているブロック(KE
Y0)』とみなし、KEYブロックデータとしてそのア
ドレスを記録する。次に、KEY0ブロックの左に隣接
し、KEY0ブロックのY1座標が同じブロックB11
05を『編製事項が記載されている欄の最初の行のブロ
ック(KEY1)』とみなし、KEYブロックデータと
してそのアドレスを記憶する。
【0045】次に、KEY0ブロックのY1座標と同じ
Y1座標を持ち、KEY1ブロックよりも高さが大き
く、そのX2座標が最も右にあるブロックB1109を
『入籍データ等が記載されている欄の最初の行のブロッ
ク(KEY2)』とみなし、KEYブロックデータとし
てそのアドレスを記録する。さらにそのブロックB11
09の下に隣接するブロックB1123を『「父」とい
うタイトルがついているブロック(KEY3)』とみな
して、KEYブロックデータとしてそのアドレスを記憶
する。
【0046】次に、上述のように検出した各KEYブロ
ックと共通する情報を持つ項目毎に、更に詳細にブロッ
クを抽出する。そして、抽出した各ブロックに項目識別
IDを設定する。まず、ページタイプが「筆頭者タイ
プ」であるので、KEY0ブロックの下には3つの同じ
幅を持ったブロックB1102〜B1104が存在す
る。そのため、KEY0ブロックも含めてそれぞれのブ
ロックに項目識別IDを設定する。例えば、ブロックB
1101の項目識別IDは図4の(a)〜(c)を用い
ると、 1000(ページタイプが筆頭者)+000(筆頭者の
ページの記載者)+10(本籍というタイトル)=10
10 が項目識別IDとして設定される。同様にして、他のブ
ロックB1102〜B1104の項目識別IDはそれぞ
れ1011〜1013が設定される。
【0047】次に、KEY1ブロックからKEY1ブロ
ックを含めて左に4個のブロックB1105〜B110
8及びその下にあるブロックB1119〜B1122は
KEY1ブロックと共通する情報を持つブロックである
ので、それぞれのブロックに対応する項目識別IDを設
定する。この場合、それぞれの項目識別IDは1020
〜1027が設定される。
【0048】次に、KEY2ブロックからKEY2ブロ
ックを含めて左に10個のブロックB1109〜B11
18はKEY2ブロックと共通する情報を持つブロック
であるので、それぞれのブロックに対応する項目識別I
Dを設定する。この場合、それぞれの項目識別IDは1
109〜1118が設定される。次に、KEY2ブロッ
クの下にあるブロックはKEY3ブロックからKEY2
ブロックを含めて左にある個数によって、更に項目識別
IDを設定する。
【0049】図10に示される戸籍文書の場合は、その
個数が6個であるので、養父および養母の両方が記載さ
れているタイプ(「養父タイプB」)であると判定され
る。また、更にKEY3ブロックから左に4番目のブロ
ックB1133の形状が横長であるので、「既婚(夫か
妻)タイプ」であると判定される。その結果、KEY3
ブロックのY1座標と同じY1座標をもつブロックに対
して右から、ブロックB1123はKEY3ブロックそ
のものであり『「父」とタイトルがついているブロッ
ク』と判定され、項目識別IDは1030が設定され
る。
【0050】また、ブロックB1126は『「母」とタ
イトルがついているブロック』と判定され、項目識別I
Dは1032が設定される。ブロックB1129は
『「養父」とタイトルがついているブロック』と判定さ
れ、項目識別IDは1040が設定される。ブロックB
1132は『「養母」とタイトルがついているブロッ
ク』と判定され、項目識別IDは1042が設定され
る。ブロックB1133は『「夫」または「妻」と記載
されるブロック』と判定され、項目識別IDは1050
が設定される。ブロックB1135は『「出生」とタイ
トルがついているブロック』と判定され、項目識別ID
は1070が設定される。
【0051】次に、「父」、「母」、「養父」、「養
母」、「夫」または「妻」、「出生」の各ブロックの直
下のブロックは、各々の「名前」または「出生年月日」
が記載されているブロックと判定され、ブロックB11
24には、項目識別IDとして1031が設定される。
ブロックB1127には、項目識別IDとして1033
が設定される。ブロックB1128には、項目識別ID
として1041が設定される。ブロックB1131に
は、項目識別IDとして1043が設定される。ブロッ
クB1134には、項目識別IDとして1051が設定
される。ブロックB1136には、項目識別IDとして
1071が設定される。
【0052】次に、ブロックB1124とB1127の
直下のブロックB1125は「続柄」が記載されている
ブロックと判定され、ブロックB1125には、項目識
別IDとして1034が設定される。また、ブロックB
1128とB1131の直下のブロックB1130は
「続柄」が記載されているブロックと判定され、ブロッ
クB1130には、項目識別IDとして1034が設定
される。
【0053】このようにして、各項目は図12に示すよ
うな項目識別IDが設定されることになる。次に、ステ
ップS204で、ステップS203で各項目に設定され
た項目識別IDの小さい方から順に、テキストデータが
存在する項目に対してのみ行う文字認識処理の処理順序
を設定する処理順序設定処理を行う。また、各項目に設
定された処理順序は、対応するブロックデータの認識順
序に格納される。一方、テキストデータが存在しない項
目に対応するブロックデータには、「−1」を格納し文
字認識処理を行わないことを示すフラグとする。例え
ば、図12に示されるような項目識別IDの値が設定さ
れた各項目に対して、処理順序設定処理を行うと、図1
3に示されるようなテキストデータが存在する項目に、
処理順序1〜19が設定される。
【0054】ステップS205で、ステップS204で
処理順序が設定された項目に存在するテキストデータの
組方向を設定する組方向設定処理を行う。尚、組方向の
設定方法は、例えば、図14に示されるような項目識別
IDの値と対応した組方向のデータベースをあらかじめ
ROM106に記憶しておき、この記憶されたデータベ
ースと、処理対象の項目に項目識別IDを比較すること
で、各項目に存在するテキストデータの組方向を設定す
る。
【0055】ステップS206で、ステップS204で
設定された処理順序に従って、各項目に存在するテキス
トデータに対応する文字を認識する文字認識処理を行
う。尚、文字認識処理は、既知の文字認識方法を用いて
行うものとし、文字を認識できる方法ならば、どのよう
なものでも良い。以上説明したように、本発明によれ
ば、戸籍文書に含まれる項目の構成を識別することで、
各項目に存在する文字を認識することができる。
【0056】また、上述の領域分割処理と、項目識別処
理と、処理順序設定処理と、組方向設定処理と、文字認
識処理を設けて各項目に設定された処理順序で、各項目
に存在するテキストデータに対応する文字の認識を行う
ことをできるようにすることにより、複数種類のフォー
マットの文字認識処理順序が正確になり、スキャナ等で
イメージを読み取る際の項目のずれに対処でき、操作性
を向上させ、処理全体の時間の短縮を図ることができ
る。
【0057】尚、上述のステップS202の領域分割処
理を行う前に、原稿画像に含まれる罫線を抽出する罫線
抽出処理を更に追加した構成にすることも可能である。
このような罫線抽出処理を行う構成にすることで、領域
分割処理を行う前に原稿画像の種類を識別することがで
きる。例えば、図2のフローチャートのステップS20
2の領域分割処理前に、上述の構成を付加した図15に
示されるようなフローチャートによって、容易に実現さ
れる。
【0058】図15は本実施の形態の他の構成によって
実行される処理の処理フローを示すフローチャートであ
る。まず、ステップS1501で、原稿画像をスキャナ
101で読み込み2値画像データに変換する。ステップ
S1502で、得られた2値画像データに対して、2値
画像データに含まれる罫線を抽出する罫線抽出処理を行
う。そして、抽出した罫線の座標データ等の情報をブロ
ックデータとして図3のように記憶する。
【0059】ステップS1503で、得られた2値画像
データに対して、2値画像データに含まれる属性(写
真、図形、文字等)毎に領域を分割する領域分割処理を
行う。本実施の形態では、領域分割処理において、特
に、項目を抽出した場合、その項目の座標データ等の情
報をブロックデータとして図3のように記憶する。そし
て、分割した項目の座標データ等の情報をブロックデー
タとして図3のように記憶する。次に、ステップS15
04で、原稿画像の項目の構成を示すフォーマット情報
からその原稿画像の項目の構成を分類し、その原稿画像
を構成する項目を識別する項目識別処理を行う。尚、項
目識別処理は、図2のステップS203と同様なので、
その詳細は省略する。
【0060】ステップS1505で、ステップS150
4で各項目に設定された項目識別IDの小さい方から順
に、テキストデータが存在する項目に対してのみ行う文
字認識処理の処理順序を設定する処理順序設定処理を行
う。ステップS1506で、ステップS1505で処理
順序が設定された項目に存在するテキストデータの組方
向を設定する組方向設定処理を行う。ステップS150
7で、ステップS1505で設定された処理順序に従っ
て、各項目に存在するテキストデータに対応する文字を
認識する文字認識処理を行う。
【0061】例えば、罫線抽出処理を図10の戸籍文書
に対して実行した場合に、図16に示されるような処理
結果が得られたとする。この場合、罫線1601や罫線
1602や罫線1603が存在すれば、ページタイプが
「筆頭者タイプ」の戸籍文書であると識別される。一
方、罫線1601や罫線1602が無く、罫線1603
のX1座標が上端の罫線1604または下端の罫線16
05と同じであれば、ページタイプが「非筆頭者タイ
プ」の戸籍文書であると識別される。
【0062】また、組方向設定処理において、組方向の
設定を各テキストデータが含まれる項目の幅、高さの長
短によって判別することも可能である。この場合、各テ
キストデータが含まれる項目の項目識別IDに対応する
組方向のデータベースを用意する必要がなくなり、RO
M106等の記憶媒体の記憶容量を節約することが可能
となる。
【0063】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インタフェース機器、リーダ、プリンタ
等)から構成されるシステムに適用しても、一つの機器
からなる装置(例えば、複写機、ファクシミリ装置等)
に適用してもよい。また、本発明の目的は、前述した実
施形態の機能を実現するソフトウェアのプログラムコー
ドを記録した記憶媒体を、システムあるいは装置に供給
し、そのシステムあるいは装置のコンピュータ(または
CPUやMPU)が記憶媒体に格納されたプログラムコ
ードを読出し実行することによっても、達成されること
は言うまでもない。
【0064】この場合、記憶媒体から読出されたプログ
ラムコード自体が上述した実施の形態の機能を実現する
ことになり、そのプログラムコードを記憶した記憶媒体
は本発明を構成することになる。プログラムコードを供
給するための記憶媒体としては、例えば、フロッピディ
スク、ハードディスク、光ディスク、光磁気ディスク、
CD−ROM、CD−R、磁気テープ、不揮発性のメモ
リカード、ROMなどを用いることができる。
【0065】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施の形態の機能
が実現される場合も含まれることは言うまでもない。
【0066】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
【0067】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図17のメモリマップ例に示す各モジュール
を記憶媒体に格納することになる。すなわち、図17で
は、少なくとも「記憶モジュール」、「分割モジュー
ル」、「識別モジュール」、「割当モジュール」および
「認識モジュール」の各モジュールのプログラムコード
を記憶媒体に格納すればよい。
【0068】尚、「記憶モジュール」は、複数種類の所
定のフォーマットを有する原稿画像に関するフォーマッ
ト情報を記憶媒体に記憶する。「分割モジュール」は、
所定のフォーマットを有する原稿画像を複数の領域に分
割する。「識別モジュール」は、分割される領域の特徴
に基づいて、前記所定のフォーマットを有する原稿画像
の種類を識別する。「割当モジュール」は、識別された
種類に対応する所定のフォーマットを有する原稿画像の
フォーマット情報を、該原稿画像の分割される領域に割
り当てる。「認識モジュール」は、フォーマット情報を
割り当てられた領域に存在する文字を認識する。
【0069】
【発明の効果】以上の説明からも明らかなように、本発
明によれば、原稿画像に含まれる罫線で囲まれた領域の
構成を識別することで、複数種類のフォーマットを有す
る原稿画像に含まれる該領域内に存在する文字を認識す
ることができる文字認識装置及びその方法を提供でき
る。
【0070】また、原稿画像に含まれる罫線で囲まれた
領域内に存在する文字の認識処理における操作の作業効
率を向上する文字認識装置及びその方法を提供できる。
【図面の簡単な説明】
【図1】本実施の形態の文字認識装置の機能構成を示す
ブロック図である。
【図2】本実施の形態で実行される処理の処理フローを
示すフローチャートである。
【図3】本実施の形態のブロックデータの構成を示す図
である。
【図4】本実施の形態の項目識別IDの構成を示すであ
る。
【図5】本実施の形態のKEYブロックデータ構造体の
構成を示す図である。
【図6】本実施の形態の項目識別処理の詳細な処理フロ
ーを示すフローチャートである。
【図7】本実施の形態のページタイプが「筆頭者タイ
プ」の場合の項目識別IDを設定する処理の処理フロー
を示すフローチャートである。
【図8】本実施の形態のページタイプが「非筆頭者タイ
プ」の場合の項目識別IDを設定する処理の処理フロー
を示すフローチャートである。
【図9】本実施の形態の入籍データ等の欄の下にあるブ
ロックに項目識別IDを設定する処理の処理フローを示
すフローチャートである。
【図10】本実施の形態の原稿画像の例を示す図であ
る。
【図11】本実施の形態の原稿画像に対して実行した領
域分割処理の処理結果を示す図である。
【図12】本実施の形態の原稿画像に対して設定した項
目識別IDの設定結果を示す図である。
【図13】本実施の形態の原稿画像に対して設定した処
理順序の設定結果を示す図である。
【図14】本実施の形態の項目識別IDと組方向の関係
を示す図である。
【図15】本実施の形態の他の構成によって実行される
処理の処理フローを示すフローチャートである。
【図16】本実施の形態の原稿画像に対して実行した罫
線抽出処理の処理結果を示す図である。
【図17】本発明で実行される処理フローのプログラム
を記憶させたFDのメモリマップの構造を示す図であ
る。
【符号の説明】
101 スキャナ 102 スキャナインタフェース 103 マウス 104 マウスインタフェース 105 CPU 106 ROM 107 RAM 108 ディスプレイ 109 ディスプレイインタフェース 110 FDD 111 FDDインタフェース 112 バス 113 KBインタフェース 114 KB
【手続補正書】
【提出日】平成8年4月8日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】発明の名称
【補正方法】変更
【補正内容】
【発明の名称】 文字認識装置及びその方法及び画像認
識装置及びその方法
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0001
【補正方法】変更
【補正内容】
【0001】
【発明の属する技術分野】本発明は、所定のフォーマッ
トを有する原稿画像に含まれる罫線で囲まれた領域に存
在する文字を認識する文字認識装置及びその方法と、入
力された原稿画像のフォーマットを認識する画像認識装
置及びその方法に関するものである。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0003
【補正方法】変更
【補正内容】
【0003】
【発明が解決しようとする課題】そのため、上記従来の
文字認識装置では、複数種類のフォーマットを有する原
稿画像に適用できず、利用性が乏しいという問題点があ
った。そのため、特定のフォーマットに限らず、複数種
類のフォーマットを有する原稿画像に含まれる領域内に
存在する文字を認識するには、原稿画像のフォーマット
を認識できる画像認識装置も必要とされていた。また、
スキャナ等で特定のフォーマットからなる原稿画像に含
まれる罫線で囲まれた領域に含まれる文字を読み取る際
には、その読み取り位置を正確に位置決めしなけらばな
らず、文字認識処理における操作に手間がかかるという
問題点があった。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0004
【補正方法】変更
【補正内容】
【0004】本発明は上記の問題点に鑑みてなされたも
のであり、原稿画像に含まれる罫線で囲まれた領域の構
成を識別することで、複数種類のフォーマットを有する
原稿画像に含まれる該領域内に存在する文字を認識する
ことができる文字認識装置及びその方法を提供すること
を目的としている。また、原稿画像に含まれる罫線で囲
まれた領域内に存在する文字の認識処理における操作の
作業効率を向上する文字認識装置及びその方法を提供す
ることを目的としている。また、複数種類のフォーマッ
トを有する原稿画像に関し、入力された原稿画像のフォ
ーマットを認識できる画像処理装置及びその方法を提供
することを目的としている。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0013
【補正方法】変更
【補正内容】
【0013】上記の目的を達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
文字認識処理のプログラムコードが格納されたコンピュ
ータ可読メモリであって、複数種類の所定のフォーマッ
トを有する原稿画像に関するフォーマット情報を記憶媒
体に記憶する記憶工程のコードと、前記所定のフォーマ
ットを有する原稿画像を複数の領域に分割する分割工程
のコードと、前記分割工程で分割される領域の特徴に基
づいて、前記所定のフォーマットを有する原稿画像の種
類を識別する識別工程のコードと、前記識別工程で識別
された種類に対応する所定のフォーマットを有する原稿
画像のフォーマット情報を、該原稿画像の前記分割工程
で分割される領域に割り当てる割当工程のコードと、前
記割当工程で前記フォーマット情報を割り当てられた領
域に存在する文字を認識する認識工程のコードとを備え
る。上記の目的を達成するための本発明による画像認識
装置は以下の構成を備える。即ち、入力された原稿画像
のフォーマットを認識する画像認識装置であって、複数
種類の原稿画像のフォーマットに関するフォーマット情
報を記憶する記憶手段と、前記原稿画像を複数の領域に
分割する分割手段と、前記分割手段で分割された領域の
特徴と、前記記憶手段に記憶されるフォーマット情報を
比較する比較手段と、前記比較手段の比較結果に基づい
て、前記原稿画像のフォーマットを認識する認識手段と
を備える。上記の目的を達成するための本発明による画
像認識方法は以下の構成を備える。即ち、入力された原
稿画像のフォーマットを認識する画像認識方法であっ
て、複数種類の原稿画像のフォーマットに関するフォー
マット情報を記憶媒体に記憶する記憶工程と、前記原稿
画像を複数の領域に分割する分割工程と、前記分割手段
で分割された領域の特徴と、前記記憶工程で前記記憶媒
体に記憶されるフォーマット情報を比較する比較工程
と、前記比較工程の比較結果に基づいて、前記原稿画像
のフォーマットを認識する認識工程とを備える。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0053
【補正方法】変更
【補正内容】
【0053】このようにして、各項目は図12に示すよ
うな項目識別IDが設定されることになる。以上説明し
たように、ステップS201〜ステップS203で実行
される処理によって、特定のフォーマットを持つ戸籍文
書に限らず、複数種類のフォーマットを有する戸籍文書
(原稿画像)を認識することができる。次に、ステップ
S204で、ステップS203で各項目に設定された項
目識別IDの小さい方から順に、テキストデータが存在
する項目に対してのみ行う文字認識処理の処理順序を設
定する処理順序設定処理を行う。また、各項目に設定さ
れた処理順序は、対応するブロックデータの認識順序に
格納される。一方、テキストデータが存在しない項目に
対応するブロックデータには、「−1」を格納し文字認
識処理を行わないことを示すフラグとする。例えば、図
12に示されるような項目識別IDの値が設定された各
項目に対して、処理順序設定処理を行うと、図13に示
されるようなテキストデータが存在する項目に、処理順
序1〜19が設定される。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0070
【補正方法】変更
【補正内容】
【0070】また、原稿画像に含まれる罫線で囲まれた
領域内に存在する文字の認識処理における操作の作業効
率を向上する文字認識装置及びその方法を提供できる。
また、複数種類のフォーマットを有する原稿画像に関
し、入力された原稿画像のフォーマットを認識できる画
像処理装置及びその方法を提供できる。

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 所定のフォーマットを有する原稿画像に
    含まれる罫線で囲まれた領域に存在する文字を認識する
    文字認識装置であって、 複数種類の所定のフォーマットを有する原稿画像に関す
    るフォーマット情報を記憶する記憶手段と、 前記所定のフォーマットを有する原稿画像を複数の領域
    に分割する分割手段と、 前記分割手段で分割される領域の特徴に基づいて、前記
    所定のフォーマットを有する原稿画像の種類を識別する
    識別手段と、 前記識別手段で識別された種類に対応する所定のフォー
    マットを有する原稿画像のフォーマット情報を、該原稿
    画像の前記分割手段で分割される領域に割り当てる割当
    手段と、 前記割当手段で前記フォーマット情報が割り当てられた
    領域に存在する文字を認識する認識手段とを備えること
    を特徴とする文字認識装置。
  2. 【請求項2】 前記識別された種類に対応する所定のフ
    ォーマットを有する原稿画像のフォーマット情報に基づ
    いて、該原稿画像の前記分割手段で分割された領域に存
    在する文字の組方向を設定する設定手段を更に備え、 前記認識手段は、前記設定手段で設定された組方向に基
    づいて、前記分割手段で分割された領域に存在する文字
    を認識することを特徴とする請求項1に記載の文字認識
    装置。
  3. 【請求項3】 前記識別された種類に対応する所定のフ
    ォーマットを有する原稿画像のフォーマット情報に基づ
    いて、該原稿画像の前記分割手段で分割された領域に順
    序を付加する付加手段を更に備え、 前記認識手段は、前記付加手段で付加された順序に基づ
    いて、前記分割手段で分割された領域に存在する文字を
    認識することを特徴とする請求項1に記載の文字認識装
    置。
  4. 【請求項4】 前記領域は、罫線で囲まれた矩形の領域
    であることを特徴とする請求項1に記載の文字認識装
    置。
  5. 【請求項5】 前記設定手段は、前記領域の形状に基づ
    いて、該領域に存在する文字の組方向を設定することを
    特徴とする請求項4に記載の文字認識装置。
  6. 【請求項6】 前記所定のフォーマットを有する原稿画
    像に含まれる罫線を抽出する抽出手段を更に備え、 前記識別手段は、前記抽出手段の抽出結果に基づいて、
    前記所定のフォーマットを有する原稿画像の種類を識別
    することを特徴とする請求項1に記載の文字認識装置。
  7. 【請求項7】 所定のフォーマットを有する原稿画像に
    含まれる罫線で囲まれた領域に存在する文字を認識する
    文字認識方法であって、 複数種類の所定のフォーマットを有する原稿画像に関す
    るフォーマット情報を記憶媒体に記憶する記憶工程と、 前記所定のフォーマットを有する原稿画像を複数の領域
    に分割する分割工程と、 前記分割工程で分割される領域の特徴に基づいて、前記
    所定のフォーマットを有する原稿画像の種類を識別する
    識別工程と、 前記識別工程で識別された種類に対応する所定のフォー
    マットを有する原稿画像のフォーマット情報を、該原稿
    画像の前記分割工程で分割される領域に割り当てる割当
    工程と、 前記割当工程で前記フォーマット情報を割り当てられた
    領域に存在する文字を認識する認識工程とを備えること
    を特徴とする文字認識方法。
  8. 【請求項8】 前記識別された種類に対応する所定のフ
    ォーマットを有する原稿画像のフォーマット情報に基づ
    いて、該原稿画像の前記分割工程で分割された領域に存
    在する文字の組方向を設定する設定工程を更に備え、 前記認識工程は、前記設定工程で設定された組方向に基
    づいて、前記分割工程で分割された領域に存在する文字
    を認識することを特徴とする請求項7に記載の文字認識
    方法。
  9. 【請求項9】 前記識別された種類に対応する所定のフ
    ォーマットを有する原稿画像のフォーマット情報に基づ
    いて、該原稿画像の前記分割工程で分割された領域に順
    序を付加する付加工程を更に備え、 前記認識工程は、前記付加工程で付加された順序に基づ
    いて、前記分割工程で分割された領域に存在する文字を
    認識することを特徴とする請求項7に記載の文字認識方
    法。
  10. 【請求項10】 前記領域は、罫線で囲まれた矩形の領
    域であることを特徴とする請求項7に記載の文字認識装
    置。
  11. 【請求項11】 前記設定工程は、前記領域の形状に基
    づいて、該領域に存在する文字の組方向を設定すること
    を特徴とする請求項10に記載の文字認識装置。
  12. 【請求項12】 前記所定のフォーマットを有する原稿
    画像に含まれる罫線を抽出する抽出工程を更に備え、 前記識別工程は、前記抽出工程の抽出結果に基づいて、
    前記所定のフォーマットを有する原稿画像の種類を識別
    することを特徴とする請求項7に記載の文字認識方法。
  13. 【請求項13】 文字認識処理のプログラムコードが格
    納されたコンピュータ可読メモリであって、 複数種類の所定のフォーマットを有する原稿画像に関す
    るフォーマット情報を記憶媒体に記憶する記憶工程のコ
    ードと、 前記所定のフォーマットを有する原稿画像を複数の領域
    に分割する分割工程のコードと、 前記分割工程で分割される領域の特徴に基づいて、前記
    所定のフォーマットを有する原稿画像の種類を識別する
    識別工程のコードと、 前記識別工程で識別された種類に対応する所定のフォー
    マットを有する原稿画像のフォーマット情報を、該原稿
    画像の前記分割工程で分割される領域に割り当てる割当
    工程のコードと、 前記割当工程で前記フォーマット情報を割り当てられた
    領域に存在する文字を認識する認識工程のコードとを備
    えることを特徴とするコンピュータ可読メモリ。
JP01004696A 1996-01-23 1996-01-24 画像処理装置及びその方法 Expired - Fee Related JP3412999B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP01004696A JP3412999B2 (ja) 1996-01-24 1996-01-24 画像処理装置及びその方法
US08/786,913 US6201894B1 (en) 1996-01-23 1997-01-22 Method and apparatus for extracting ruled lines or region surrounding ruled lines

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01004696A JP3412999B2 (ja) 1996-01-24 1996-01-24 画像処理装置及びその方法

Publications (2)

Publication Number Publication Date
JPH09204494A true JPH09204494A (ja) 1997-08-05
JP3412999B2 JP3412999B2 (ja) 2003-06-03

Family

ID=11739465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01004696A Expired - Fee Related JP3412999B2 (ja) 1996-01-23 1996-01-24 画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JP3412999B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219442A (ja) * 1997-11-25 1999-08-10 Mitsubishi Electric Corp 文書編集出力装置
JP2006011714A (ja) * 2004-06-24 2006-01-12 Canon Inc 画像処理装置及びその制御方法、プログラム
JP2021047693A (ja) * 2019-09-19 2021-03-25 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219442A (ja) * 1997-11-25 1999-08-10 Mitsubishi Electric Corp 文書編集出力装置
JP2006011714A (ja) * 2004-06-24 2006-01-12 Canon Inc 画像処理装置及びその制御方法、プログラム
JP2021047693A (ja) * 2019-09-19 2021-03-25 富士ゼロックス株式会社 情報処理装置及びプログラム

Also Published As

Publication number Publication date
JP3412999B2 (ja) 2003-06-03

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
US8041113B2 (en) Image processing device, image processing method, and computer program product
US6201894B1 (en) Method and apparatus for extracting ruled lines or region surrounding ruled lines
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP4920928B2 (ja) 画像処理装置及びその制御方法、プログラム
CN117668402A (zh) 用于将布局应用于文档的***和方法
JP2008022159A (ja) 文書処理装置及び文書処理方法
JP3178483B2 (ja) 文書処理装置
JPH11184894A (ja) 論理要素抽出方法および記録媒体
WO2009087999A1 (ja) 目次構造特定装置
JP2008108114A (ja) 文書処理装置および文書処理方法
JP2015005100A (ja) 情報処理装置、テンプレート生成方法、およびプログラム
JP2022162908A (ja) 画像処理装置、画像処理方法、およびプログラム
EP1202213A2 (en) Document format identification apparatus and method
JP3412999B2 (ja) 画像処理装置及びその方法
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
JPS58208865A (ja) 文書作成装置
JP5298997B2 (ja) 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体
JP6947971B2 (ja) 情報処理装置、制御方法、プログラム
JPH09198518A (ja) 画像処理装置及びその方法
US8059138B2 (en) Image processing and arranging system, image processing and arranging method, and computer readable medium for image processing and arranging
JP2001028032A (ja) 画像情報処理装置及びマークシート
JPH10207981A (ja) 帳票認識方法
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030307

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090328

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100328

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100328

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees