JPH11224308A - 文字認識装置及びその方法 - Google Patents

文字認識装置及びその方法

Info

Publication number
JPH11224308A
JPH11224308A JP10024884A JP2488498A JPH11224308A JP H11224308 A JPH11224308 A JP H11224308A JP 10024884 A JP10024884 A JP 10024884A JP 2488498 A JP2488498 A JP 2488498A JP H11224308 A JPH11224308 A JP H11224308A
Authority
JP
Japan
Prior art keywords
character recognition
area
color information
data attribute
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10024884A
Other languages
English (en)
Inventor
Kazuyuki Saito
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10024884A priority Critical patent/JPH11224308A/ja
Publication of JPH11224308A publication Critical patent/JPH11224308A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】文字認識装置において、文書中の所定の項目に
ついて文字認識を行うような場合に、文書フォーマット
の相違に対して柔軟に対応可能とする。 【解決手段】ステップS201で入力されたイメージ
は、ステップS202において、当該イメージの背景色
の色情報に基づいて複数の領域に分割され、各領域には
背景色に対応する色情報が付される。ステップS203
では、ステップS202で得られた各領域の色情報に基
づいて、各領域にデータ属性を設定する。これは、色情
報と項目情報を対にして記憶する項目変換テーブルを参
照することで行う。そして、ステップS204では、ス
テップS203設定されたデータ属性に従って文字認識
処理をおこなう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字認識装置に関
し、特に帳票等の所定のフォーマットを有する文書に対
して文字認識をおこなう文字認識装置及びその方法に関
するものである。
【0002】
【従来の技術】従来の文字認識装置において、帳票等の
罫線に囲まれた画像を読み取って文字認識を行うものが
ある。この種の装置においては、読取対象の文書のもつ
フォーマットを1つのフォーマットに限定し、当該文書
の特定の場所(即ち、特定の項目)のみを認識させるよ
うにすることが行われている。
【0003】また、文字領域の座標の異なるフォーマッ
トに対応させるために、罫線を抽出し、罫線に囲まれた
場所を認識させるようにするものも提案されている。
【0004】
【発明が解決しようとする課題】しかしながら、上述の
ように文書の特定の場所について文字認識を行う技術で
は、複数種類のフォーマットに対応出来なかったり、ス
キャナ等でイメージを読み取る際に読取対象の項目の位
置が、所定の位置以外にずれないようにする等の手間が
必要となる。
【0005】また、罫線を抽出して文字認識位置を特定
する技術では、複雑な表等の罫線を有する文書を処理す
る場合において、そのフォーマットが予めわかっていて
も、傾斜、かすれ、位置のずれ、大きさの違い等の要因
があると罫線の抽出ができなくなったり、テキスト等を
誤って罫線としてしまうこと等があり、正確な文字認識
が困難となるといった問題があった。
【0006】本発明は上記の問題に鑑みてなされたもの
であり、文書中の所定の項目について文字認識を行うよ
うな場合に、文書フォーマットの相違に柔軟に対応でき
る文字認識装置及びその方法を提供することを目的とす
る。
【0007】
【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様である文字認識装置は例えば以下の
構成を備えるものである。すなわち、画像を色情報に基
づいて複数の領域に分割する領域分割手段と、前記領域
分割手段によって得られた各領域の色情報に基づいて各
領域にデータ属性を設定する設定手段と、前記設定手段
によって設定されたデータ属性に従って文字認識処理を
おこなう文字認識手段とを備える。
【0008】また、上記の目的を達成するための本発明
の他の態様である文字認識方法は例えば以下の工程を備
える。すなわち、画像を色情報に基づいて複数の領域に
分割する領域分割工程と、前記領域分割工程によって得
られた各領域の色情報に基づいて各領域にデータ属性を
設定する設定工程と、前記設定工程によって設定された
データ属性に従って文字認識処理をおこなう文字認識工
程とを備える。
【0009】
【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な一実施形態を説明する。
【0010】図1は本実施形態の文字認識装置の構成を
表すブロック図である。図1において、101は画像原
稿に光を照射し、その反射光を読み取り、電気信号に変
換するスキャナ、102はスキャナ101で得られた電
気信号を2値のデジタル電気信号に変換し他の装置構成
要素に伝送するためのスキャナインタフェース回路であ
る。103はディスプレイのウィンドウ上で所望とする
座標を入力するためのポインティングデバイス(本例で
はマウス)、104はポインティングデバイス103か
らの信号を受け、それを他の装置構成要素に伝送するた
めのインターフェース回路である。105は装置全体の
制御及び項目識別処理等を実行するためのCPU、10
6はCPU105が実行する制御プログラム、各種処理
プログラムやフォントデータなどを格納しているRO
M、107はCPU105による文書画像の展開処理や
項目識別処理のための作業領域などとして用いられるR
AMである。
【0011】また、108は入力イメージ等を表示する
ためのディスプレイ、109はディスプレイインターフ
ェース回路である。ディスプレイ108には、RAM1
07の所定アドレスエリアであるVRAM領域に格納さ
れているイメージが表示される。110は、登録された
データが格納されるハードディスク等の外部記憶装置
で、111はそのインタフェースである。そして112
は各装置構成要素を接続するバスである。なお、CPU
105が実行する制御プログラムを外部記憶装置110
に格納しておき、必要に応じてRAM107にロード
し、これをCPU105が実行するように構成してもよ
い。
【0012】次に本実施形態の文字認識装置による処理
の流れについて図2のフローチャート、図3、図4、図
5、および図6を参照して説明する。図2は本実施形態
による文字認識装置の動作手順を説明するフローチャー
トである。図3は、本実施形態のブロック領域データの
構造例を示す図である。また、図4は、本実施形態の項
目変換データベースにおける項目変換テーブル例を示す
図である。図5は、本実施形態の文字認識装置で読取を
行う文書の例を示す図である。図6は、他の文書の例を
示す図である。
【0013】まず、ステップS201で認識しようとす
る文書(図5)をスキャナで読み込み、nビットのカラ
ー画像データに変換する。得られた入力画像データに対
してステップS202で領域識別処理を行い、バックグ
ラウンドのカラー毎にブロック領域を抽出し、その色情
報並びにレイアウト情報をブロックデータとして記憶す
る。本実施形態では、図3に示す例のように、色情報と
して「色」、レイアウト情報として「座標」「属性」
「組方向」がブロックデータとして、領域識別処理後に
記憶される。
【0014】次に項目情報変換処理(ステップS20
3)によって各ブロック領域の色情報を項目変換データ
ベースに従って項目情報に変換する。本実施形態の場
合、認識しようとする文書(図5)は「住所録」である
ので、項目変換データベースの「住所録」用の項目変換
テーブル(図4)を用いる。例えば図5のブロック50
2は色情報がカラーDであるので、項目変換テーブル
(図4)により項目「住所」に変換され、ブロックデー
タの項目番号に「4」というデータがセットされる。
【0015】なお、本実施形態では項目番号をブロック
データの認識順序としてセットすることで認識順序の設
定を同時に実行している。すなわち、ブロックデータに
おいて項目番号と同じ値が認識順序にセットされる。次
に、文字認識処理(ステップS204)において、設定
されたブロックデータの認識順序の順番、すなわち項目
番号順に、各ブロック領域内の文字の認識処理を実行し
ていく。
【0016】以上のような本実施形態の文字認識装置に
よれば、たとえフォーマットの形状が異なる帳票等の文
書について処理を行うとしても、項目情報(色と項目の
対応)が同じものであれば、同じ種類のフォーマットと
して文字認識処理が可能である。
【0017】例えば、図5と図6の文書は、同じ「住所
録」というフォーマットの種類であるにも関わらず、フ
ォーマット形状が異なる。このため、従来の文字認識装
置では、文字認識処理に際して異なるフォーマットとし
て扱わなければならなかった。しかしながら本実施形態
によれば、ともに同じ「住所録」であるので、「住所
録」用の項目変換テーブル(図4)を用いることによ
り、同一の項目情報に変換することが可能である。
【0018】例えば、図5のブロック503と図6のブ
ロック602は、レイアウト情報の座標は異なるが、共
に色情報が「カラーB」であるので、項目変換データベ
ース(図4)により項目「氏名」に変換され、ブロック
データに項目番号「2」というデータがセットされる。
そして、文字認識処理(S204)によって、「氏名」
という項目のデータとして、ブロック領域内の文字が認
識される。
【0019】なお、項目変換データベースには複数種類
のフォーマット(住所録、帳票等)に対応する項目変換
テーブルが格納されており、ユーザはマウス103等の
入力装置を介して使用する項目変換テーブルを指定する
ことが可能である。
【0020】以上説明した様に上記実施形態によれば、
入力画像を背景色に基づいて複数の領域に分割し、各領
域の背景色に従って夫々の項目を決定し、各項目毎の文
字認識を実行するので、 帳票等の文書の文字認識処理が正確になる、 文字領域の座標の異なりや罫線等の形状の異なりのあ
るフォーマットの文書の文字認識処理が可能になる、 スキャナ等でイメージを読み取る際の項目のずれに影
響されなくなるので操作性が向上する、 処理全体の時間の短縮等が図れるといった効果があ
る。
【0021】なお、本発明は、複数の機器(例えばホス
トコンピュータ,インタフェイス機器,リーダ,プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
【0022】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0023】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0024】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0025】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0026】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0027】
【発明の効果】以上説明したように、本発明によれば、
文書中の所定の項目について文字認識を行うような場合
に、文書フォーマットの相違に対して柔軟に対応するこ
とが可能となる。
【0028】
【図面の簡単な説明】
【図1】本実施形態の文字認識装置の構成を表すブロッ
ク図である。
【図2】本実施形態による文字認識装置の動作手順を説
明するフローチャートである。
【図3】本実施形態のブロック領域データの構造例を示
す図である。
【図4】本実施形態の項目変換データベースにおける変
換テーブル例を示す図である。
【図5】本実施形態の文字認識装置で読取を行う文書の
例を示す図である。
【図6】他の文書の例を示す図である。

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 画像を色情報に基づいて複数の領域に分
    割する領域分割手段と、 前記領域分割手段によって得られた各領域の色情報に基
    づいて各領域にデータ属性を設定する設定手段と、 前記設定手段によって設定されたデータ属性に従って文
    字認識処理をおこなう文字認識手段とを備えることを特
    徴とする文字認識装置。
  2. 【請求項2】 前記設定手段は、色情報とデータ属性と
    を対応させた変換テーブルを有し、前記領域分割手段に
    よって得られた各領域の色情報に対応するデータ属性を
    該変換テーブルを参照して獲得し、該各領域に設定する
    ことを特徴とする請求項1に記載の文字認識装置。
  3. 【請求項3】 前記データ属性は処理順序を含み、 前記文字認識手段は、前記データ属性で示される処理順
    序に従って各領域に対する文字認識処理を実行すること
    を特徴とする請求項1に記載の文字認識装置。
  4. 【請求項4】 前記データ属性は各領域のデータ項目を
    表すことを特徴とする請求項1に記載の文字認識装置。
  5. 【請求項5】 複数種類の文書フォーマットに対応する
    複数種類の変換テーブルと、 前記複数種類の変換テーブルのうちの所望の一つを選択
    する選択手段とを更に備え、 前記設定手段は、前記領域分割手段によって得られた各
    領域の色情報に対応するデータ属性を前記選択手段で選
    択された変換テーブルを参照して獲得し、該各領域に設
    定することを特徴とする請求項1に記載の文字認識装
    置。
  6. 【請求項6】 画像を色情報に基づいて複数の領域に分
    割する領域分割工程と、 前記領域分割工程によって得られた各領域の色情報に基
    づいて各領域にデータ属性を設定する設定工程と、 前記設定工程によって設定されたデータ属性に従って文
    字認識処理をおこなう文字認識工程とを備えることを特
    徴とする文字認識方法。
  7. 【請求項7】 前記設定工程は、色情報とデータ属性と
    を対応させた変換テーブルを有し、前記領域分割工程に
    よって得られた各領域の色情報に対応するデータ属性を
    該変換テーブルを参照して獲得し、該各領域に設定する
    ことを特徴とする請求項6に記載の文字認識方法。
  8. 【請求項8】 前記データ属性は処理順序を含み、 前記文字認識工程は、前記データ属性で示される処理順
    序に従って各領域に対する文字認識処理を実行すること
    を特徴とする請求項6に記載の文字認識方法。
  9. 【請求項9】 前記データ属性は各領域のデータ項目を
    表すことを特徴とする請求項6に記載の文字認識方法。
  10. 【請求項10】 複数種類の文書フォーマットに対応す
    る複数種類の変換テーブルと、 前記複数種類の変換テーブルのうちの所望の一つを選択
    する選択工程とを更に備え、 前記設定工程は、前記領域分割工程によって得られた各
    領域の色情報に対応するデータ属性を前記選択工程で選
    択された変換テーブルを参照して獲得し、該各領域に設
    定することを特徴とする請求項6に記載の文字認識方
    法。
  11. 【請求項11】 文字認識処理のための制御プログラム
    を格納する記憶媒体であって、該制御プログラムが画像
    を色情報に基づいて複数の領域に分割する領域分割工程
    のコードと、 前記領域分割工程によって得られた各領域の色情報に基
    づいて各領域にデータ属性を設定する設定工程のコード
    と、 前記設定工程によって設定されたデータ属性に従って文
    字認識処理をおこなう文字認識工程のコードとを備える
    ことを特徴とする記憶媒体。
JP10024884A 1998-02-05 1998-02-05 文字認識装置及びその方法 Withdrawn JPH11224308A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10024884A JPH11224308A (ja) 1998-02-05 1998-02-05 文字認識装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10024884A JPH11224308A (ja) 1998-02-05 1998-02-05 文字認識装置及びその方法

Publications (1)

Publication Number Publication Date
JPH11224308A true JPH11224308A (ja) 1999-08-17

Family

ID=12150623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10024884A Withdrawn JPH11224308A (ja) 1998-02-05 1998-02-05 文字認識装置及びその方法

Country Status (1)

Country Link
JP (1) JPH11224308A (ja)

Similar Documents

Publication Publication Date Title
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
JP4100746B2 (ja) 画像処理装置及び方法
CN107133615B (zh) 信息处理设备和信息处理方法
JP2005536783A (ja) pdfドキュメントのセクション抽出ツール
US7453594B2 (en) Document filing apparatus for storing information added to a document file
US6968501B2 (en) Document format identification apparatus and method
US8533590B2 (en) Information processing apparatus and layout processing method
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP2009031937A (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH11224308A (ja) 文字認識装置及びその方法
JPH08329187A (ja) 文書読取装置
JP3412998B2 (ja) 画像処理装置及びその方法
JPH11187231A (ja) 画像検索装置及び画像検索方法
JPH09288728A (ja) 画像処理装置及びその方法
JPH11224306A (ja) 文字認識装置及びその方法
JP2001028032A (ja) 画像情報処理装置及びマークシート
JPH11203402A (ja) 画像処理装置及び画像処理方法
US20090241063A1 (en) Information processing apparatus, information processing method, and computer readable medium for designing a gui
JP2007299321A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体
JPS61131082A (ja) Ocrのリジエクト文字表示方式
JPH11224307A (ja) 文書認識装置及びその方法
JPH11339041A (ja) カラー画像処理方法及び装置並びに記録媒体
JPH09146947A (ja) 文字領域の順序付け方法及び装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050405