JPH09146947A - 文字領域の順序付け方法及び装置 - Google Patents

文字領域の順序付け方法及び装置

Info

Publication number
JPH09146947A
JPH09146947A JP7298236A JP29823695A JPH09146947A JP H09146947 A JPH09146947 A JP H09146947A JP 7298236 A JP7298236 A JP 7298236A JP 29823695 A JP29823695 A JP 29823695A JP H09146947 A JPH09146947 A JP H09146947A
Authority
JP
Japan
Prior art keywords
character area
character
footer
area
areas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7298236A
Other languages
English (en)
Inventor
Tadanori Nakatsuka
忠則 中塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7298236A priority Critical patent/JPH09146947A/ja
Publication of JPH09146947A publication Critical patent/JPH09146947A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 フッタ部分に関しては、処理順番を最後に
し、例えば文字認識結果による本文の文章の流れを正常
にする。 【解決手段】 原稿画像を入力し、個々の文字領域を抽
出する。そして、抽出された個々の文字了以に対して、
それがフッタである文字領域を取り出す(S11)。次
いで、フッタ以外も文字領域に対して処理順序を付け
(S12)、その最後にフッタと判定された文字領域の
順番を付ける(S13)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、原稿画像中の文字
領域を抽出し、当該抽出した文字領域に対して処理順序
を設定する文字領域の順序付け方法及び装置に関するも
のである。
【0002】
【従来の技術】一般に、文書画像を光学的に読み取り、
文字認識する装置の場合、文章の流れに沿って認識処理
を行うことが必要になる。
【0003】入力した文書が1カラムのみの場合には問
題はないが、2カラム、例えば同一ページ内で左欄と右
欄に分けて文章が記述されている場合には、カラム単位
に文字認識する必要がある。
【0004】
【発明が解決しようとする課題】ところが、昨今では、
図3に示すように、原稿中にフッタ(図示ではページ番
号)を設けることが良くある。この場合は、フッタが本
文とが区別できずに(フッタが本文として解釈される)
文字認識してしまうので、本文としての流れが正常には
ならない。
【0005】
【課題を解決するための手段】本発明はフッタ部分に関
しては、その処理順序を原稿画像の他の文字領域の最後
にし、上記問題点を解決する文字領域の順序付け方法及
び装置を提供しようとするものである。
【0006】かかる課題を解決するため、例えば本発明
の文字領域の順序付け方法は以下に示す工程を備える。
すなわち、原稿画像中の文字領域を抽出し、当該抽出し
た文字領域に対して処理順序を設定する文字領域の順序
付け方法であって、抽出された個々の文字領域の中のフ
ッタ文字領域を識別する識別工程と、該識別工程で識別
されたフッタ領域に対しては、他の文字領域より後に処
理順番を設定する設定工程とを備える。
【0007】ここで本発明の好適な実施形態に従えば、
前記識別工程は、注目文字領域が原稿画像中の所定位置
より下方に位置するかを判定する工程を含み、当該判定
工程によって前記所定位置より下方に位置する場合に注
目文字領域をフッタ文字領域として識別することが望ま
しい。これによって、原稿画像中の下方に位置する文字
領域をフッタとして判定することが可能になる。
【0008】また、前記識別工程は、更に、注目文字領
域が1行のみの文字列で構成されているか否かを判定す
る工程を含み、1行のみの文字列であると判定した場合
に注目文字領域をフッタ文字領域として識別することが
望ましい。これによって、フッタより高い精度で判定す
ることが可能になる。
【0009】また、前記識別工程は、更に、注目文字領
域が横書き或いは横長を判定する工程を含み、横書き或
いは横長であると判定した場合に注目文字領域をフッタ
文字領域として識別することが望ましい。これによっ
て、フッタより高い精度で判定することが可能になる。
【0010】また、前記識別工程は、更に、注目文字領
域の下方に他の文字領域が存在するか否かを判定する工
程を含み、下方に他の文字領域がないと判定した場合に
注目文字領域をフッタ文字領域として識別することが望
ましい。これによって、フッタより高い精度で判定する
ことが可能になる。
【0011】また、前記識別工程は、更に、注目文字領
域が他の線画に含まれるか否かを判定する工程を含み、
他の線画に含まれる場合には注目文字領域を非フッタ文
字領域として識別することが望ましい。これによって、
フッタより高い精度で判定することが可能になる。
【0012】また、更に、前記設定工程で設定された順
序に従って、個々の文字領域内の文字画像を認識する文
字認識工程を備えることが望ましい。これによって、文
字認識した結果の文章の流れが、自然な状態とさせるこ
とが可能になる。
【0013】
【発明の実施の形態】以下、添付図面に従って本発明に
係る実施形態の一例を詳細に説明する。
【0014】[第1の実施形態]一般に、原稿画像を読
み取り、その読み取った原稿画像中の文字を認識する場
合には、先ず、文字が存在する領域を判定する。
【0015】文字が存在する領域の判定には、様々な手
法がある。例えば、原稿画像を低解像度でプリスキャン
して読み取ることで、文字がつぶれ、隣接する文字パタ
ーンと接続されるようにする。そして、その領域に外接
する矩形を求め、原稿画像を本来の高解像度で読み取
り、決定された矩形に併せて文字領域のビットマップデ
ータを抽出する。このあとは、水平及び垂直方向にドッ
トのヒストグラムを作成し、個々の文字の存在位置及び
大きさを検出し、それでもって切出されたビットマップ
パターンを文字認識処理に渡す、という手法がある。
【0016】尚、プリスキャンせずに、読み取った画像
データ中の“1”のドットを上下左右(及び斜め)方向
に膨らませて、結果的に低解像度画像を形成する手法
や、読み取った画像中のn×m画素ブロック内に1つで
も“1”があった場合に、n×mを1ドットとして低解
像度の画像データを新規に作成する手法もある。
【0017】本実施形態は、いずれの手法でも良いし、
この手法の選択によって本願発明が限定されるものでは
ない。
【0018】図9に実施形態における文字認識装置のブ
ロック構成図を示す。図示において、1は装置全体の制
御を司るCPU、2はブートプログラム等を記憶してい
るROM、3はCPU1が実行するプログラム、読み取
った画像等を展開したり、CPU1のワークエリアとし
て使用するRAMである。4はキーボードやポインティ
ングデバイス等で構成される入力装置である。
【0019】5は原稿画像を読み取るイメージスキャナ
であり、6はイメージスキャナで読み取られた画像デー
タを本装置内部に取り込むためのインタフェースであ
る。7はハードディスク装置等の外部記憶装置であり、
オペレーティングシステム(OS)や、後述する各フロ
ーチャートに対応するプログラム、更には文字認識に使
用される辞書及び該当するプログラムを記憶している。
8は表示画面に表示する画像を展開するVRAMであ
り、9はVRAM8に展開された画像を表示する表示装
置である。
【0020】上記構成において、本装置に電源が投入さ
れると、CPU1はROM2内のブートプログラムに従
って外部記憶装置7からOSプログラムを読み出して本
装置を稼動状態にさせる。ついで、操作者の指示により
(或いは、自動的でも良い)、文字認識プログラムがR
AM3にロードされることになる。
【0021】さて、本実施形態では、文字認識プログラ
ムが起動され、その中で原稿画像(図2の符号21)を
読み取り指示を受けてイメージスキャナ5からインタフ
ェース6を介して画像が読み込まれ、各文字領域(図2
の符号22、23)が判定されると、図1に示す手順に
従って処理が行われる。
【0022】先ず、ステップS11で、文字領域の中か
ら、フッタの文字領域を取り出し、ステップS12でフ
ッタ以外の文字領域に順序を付ける。そして、ステップ
S13で、最後の文字領域の次の順番位置にフッタの文
字領域を割当てる。
【0023】ステップS11におけるフッタの文字領域
の取り出し処理を、図5のフローチャートに従って説明
する。
【0024】先ず、ステップS51で、注目している文
字領域の位置が、原稿の下端から、原稿画像の高さの1
/n以内にあるかどうかを判断する。尚、nは原稿画像
の高さを等分する数であり、例えば原稿画像のサイズに
よって異なる。フッタは、原稿の下端に設けられるの
で、ここでは、その位置に注目文字領域があるかどうか
を判断していることになる。
【0025】ここで、注目領域がこの条件を満足しない
場合には、注目文字領域はフッタではないと判断し、例
えば、各文字領域に設けられたフラグに、その領域がフ
ッタ以外である旨の情報をセットする(ステップS5
5)。
【0026】また、注目文字領域が原稿画像の下端近傍
にあると判断した場合には、ステップS52に進み、そ
の文字領域が1行のみの文字列で構成されるかどうかを
判断する。行数の判定は、文字パターンの並び方向にド
ットのヒストグラムを取ることで判断できる。いずれに
せよ、2行以上の場合には、注目文字領域はフッタ以外
の文字領域として決定する(ステップS55)。
【0027】また、原稿の下端近傍にあって、しかも、
それが1行のみの文字列からなると判断した場合には、
ステップS53に進み、横書き或いは横長かを判断す
る。
【0028】そして、この判断が“YES”の場合に
は、ステップS54に進み、注目文字領域はフッタとし
て判定する(フッタである旨をフラグに書き込む)。
【0029】ステップS56では、全ての文字領域に対
して行ったか否かを判断し、否の場合にはステップS5
1に戻り、上記処理を繰り返すことになる。
【0030】以上の結果、フッタ部分であると領域は、
図1の処理によって最後に位置付けられるので、文字認
識させた場合に、本文の途中にフッタ部分の認識結果が
挿入されることはなくなる。
【0031】尚、説明が前後するが、原稿画像が2カラ
ムもしくはそれ以上で構成される場合、それぞれのカラ
ムを判別する手法自身は公知であり、例えば、原稿画像
の縦方向のドットのヒストグラムを作成することでカラ
ム間の区切りを検出すれば良い。
【0032】<第2の実施形態>上記第1の実施形態で
は、フッタ部分となる文字領域は1つの場合を想定して
説明したが、図7に示すごとく、符号72、73で示す
ように、2つ以上のフッタの文字列がある場合の処理例
を第2の実施形態として説明する。
【0033】本第2の実施形態では、図6に示す順序付
け処理手順に従って各文字領域に対して順序付けを行
う。
【0034】ステップS61、62までは、先の第1の
実施形態と同じである。すなわち、文字領域の中からフ
ッタとなる領域を取り出し、フッタ以外の文字領域に順
序を付ける。
【0035】ステップS63では、フッタであると判定
された文字領域が複数ある場合、その座標位置に基づい
て、左側にあるものを優先順位を与え、フッタ以外の文
字領域の後に続ける。
【0036】この結果、図7に示すごとく、フッタ文字
領域72は、その順序番号が“11”、フッタ文字領域
73のそれは“12”となる。
【0037】以上の如く、本題2の実施形態に従えば、
フッタ部分が複数ある場合に、自然な文字認識を行なわ
せることが可能になる。
【0038】<第3の実施形態>上記第1、第2の実施
形態では、先ず、フッタ部分を取り出し、その後でフッ
タ以外の文字領域を順序付けを行ない、その最後にフッ
タの文字領域を付加させたが、これによっても本願発明
が限定されるものではない。例えば、図8に示すように
処理しても構わない。
【0039】先ず、ステップS81で、フッタを含む全
文字領域に順序を付ける。この後、ステップS82で、
各文字領域からフッタを取り出し、ステップS83で取
り出したフッタの順番を最後の順番に付けなおす。
【0040】以上の処理によっても同様の効果を得るこ
とが可能になる。
【0041】<第4の実施形態>上記実施形態では、フ
ッタの判定をその原稿の高さに基づいて判定したが、フ
ッタであるか否かの判定がこれによって限定されるもの
ではない。
【0042】特に、上記実施形態では、原稿の高さの1
/nの位置を境界位置とし、それ以下の部分をフッタの
可能性があるとして判定した。しかしながら、例えば、
図15に示すごとく、境界位置が図示の符号102で示
す位置にあり、その下に本文の文字領域103が存在す
ると、その位置もフッタとして判定することになってし
まう。
【0043】そこで、第4の実施形態では、このような
場合であっても、図15における文字領域104がフッ
タとして判定する。尚、装置構成は図9と同様であるも
のとし、且つ、文字領域の抽出処理についても第1の実
施形態と同様であるものとし、その説明は省略する。
【0044】図10は第4の実施形態におけるフッタ判
定処理のフローチャートであって、図5に代わるもので
ある。
【0045】先ず、ステップS101では、1行のみの
文字領域か否かを判断する。1行のみであると判断した
場合には、ステップS102に進み、その文字領域は横
書きか或いは横長かを判定する。いずれかであると判断
した場合には、ステップS103に進み、注目している
文字領域の座標位置の下の領域(例えば注目文字領域が
図15における文字領域103である場合には、図示の
符号105の領域)に、他の文字領域があるかどうかを
判断する。
【0046】この結果、注目文字領域が最も下に位置す
ることが判明したら、ステップS104において、注目
文字領域はフッタであると決定する。また、上記ステッ
プS101〜S103のいずれかの条件を満たさない場
合(例えば文字領域103の場合など)には、その文字
領域についてはフッタ以外の文字領域として判定する。
【0047】こうして、全ての文字領域に対しての処理
が完了したことをステップS106で判断できるまで、
上記処理を繰り返す。
【0048】以上の結果、図15に示すような状況にあ
っても、文字領域104のみがフッタであると判断さ
れ、文字領域103はフッタ以外の文字領域(本文)と
して判定することが可能になる。
【0049】<第5の実施形態>上記第4の実施形態で
は、注目文字領域の下側(その文字領域と同じ幅で、そ
の下側の領域)に、他の文字領域があるかどうかで注目
文字領域がフッタであるかどうかを判断した。例えば、
原稿を読み込むとき、フッタ付き原稿であることをユー
ザがキーボード等で設定し、その設定があった場合に上
記第4の処理を行なえば問題はないものの、フッタがな
いにもかかわらず、フッタ有りとして文字認識させてし
まうと、本文の最下段の文字領域がフッタとして認識さ
れ、結果的にその認識結果は最後に位置することになっ
てしまう。の最後に認識結果がくる可能性も否定できな
い。
【0050】そこで、本題5の実施形態では、図11の
ステップS111の如く、フッタか否かの判定条件に、
第1の実施形態と同様に、その位置情報を盛り込むこと
で解決した。
【0051】他の部分は、第4の実施形態と同じである
ので、説明は省略する。
【0052】以上の結果、第5の実施形態によれば、第
4の実施形態と比較して、フッタを正しく識別すること
が可能になる。
【0053】<第6の実施形態>第6の実施形態を説明
する。本第6の実施形態では、例えば図16や図17に
示すごとく、本文中に枠(例えば表等)112や122
があって、たまたまその表中の下側に位置するところに
文字領域113や123があった場合でも、その文字領
域113及び123をフッタと判定しないようにする。
また、矩形枠のみならず、例えば図18に示すごとく、
線画132内に文字領域133がある場合でも、その文
字領域133をフッタと判定しないようにする。
【0054】以下、図12に第6の実施形態の処理手順
を示す。先の第5の実施形態と異なるのは、ステップS
124を追加した点である。
【0055】すなわち、注目文字領域がフレーム
(枠)、表、図形等の文字領域以外に属するか(内包さ
れるか)否かを判断条件にした点である。
【0056】尚、フレームや表、図形(これらを総称し
て線画という)か否かを判定するためには、例えばその
線画を構成しているドットの連続する外接矩形を検出
し、その外接矩形の大きさに対する黒ドット数の割合が
所定値以下であるかどうかなどの手法を使えばよい。
【0057】以上の結果、第6の実施形態によれば、線
画に含まれる文字が原稿画像の下段にあっても、その文
字列はフッタとは判断しない様にすることになり、本文
の認識結果の順序を正常にさせることが可能になる。
【0058】<第7の実施形態>また、図13のステッ
プS134(図12のステップS124と同じ)を、図
10に追加することでも、第6の実施形態と同様の作用
効果を得ることが可能になる。
【0059】<第8の実施形態>また、図14に示すご
とく、第6、第7の実施形態での処理を統合しても良
い。この場合には、更に精度良くフッタとそうでない文
字領域とを区別できるようになる。
【0060】以上説明したように、本第1〜第8の実施
形態に従えば、原稿画像中のフッタ部分を識別できる。
また、識別できたフッタ部分の文字認識処理する順番
を、本文の後にするので、少なくとも認識結果である本
文における文章の流れを自然な状態にさせることが可能
になる。
【0061】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インターフェース機器、リーダ、プリン
タ等)から構成されるシステムに適用しても、1つの機
器からなる装置(例えば複写機、ファクシミリ等)に適
用しても良い。
【0062】また、本発明の目的は、上述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
憶した記憶媒体を、システム或いは装置に供給し、その
システム或いは装置のコンピュータ(またはCPUやM
PU)が記憶媒体に格納されたプログラムコードを読出
して実行することによっても、達成されることは言うま
でのもない。
【0063】この場合、記憶媒体から読み出されたプロ
グラムコード自体が本発明の新規な機能を実現すること
になり、そのプログラムコードを記憶した記憶媒体は本
発明を構成することになる。
【0064】プログラムコードを供給するための記憶媒
体としては、例えばフロッピーディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROM等
を用いることができる。
【0065】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼動しているOSなどが実
際の処理の一部または全部を行ない、その処理によって
実施形態の機能が実現される場合も含まれることは言う
までもない。
【0066】更に、記憶媒体から読み出されたプログラ
ムコードが、コンピュータに挿入された拡張機能ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書き込まれた後、そのプログラムコードの指示
に基づき、その機能拡張ボードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行な
い、その処理によって前述した実施形態の機能が実現さ
れる場合も含まれることは言うまでもない。
【0067】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートのいずれ
かに対応するプログラムコードを格納することになる
が、簡単に説明すると、図19のメモリマップ例に示す
各モジュールを記憶媒体に格納することになる。すなわ
ち、少なくとも、個々の文字領域の中のフッタ文字領域
を識別する識別モジュールと、識別されたフッタ領域に
対しては、他の文字領域より後に処理順番を設定する設
定モジュールを記憶媒体に格納すれば良い。
【0068】
【発明の効果】以上説明したように本発明によれば、フ
ッタ部分に関しては、その処理順序を原稿画像の他の文
字領域の最後にすることで、例えば文字認識処理を行う
のであれば、認識結果の文章の流れを自然な状態にさせ
ることが可能になる。
【0069】
【図面の簡単な説明】
【図1】第1の実施形態における文字領域順序付け処理
のフローチャートである。
【図2】原稿画像から抽出された文字領域を示す図であ
る。
【図3】従来の文字領域の順序付けを示す図である。
【図4】第1の実施形態における順序付け結果を示す図
である。
【図5】第1の実施形態におけるフッタ識別処理を示す
フローチャートである。
【図6】第2の実施形態の順序付け処理を示すフローチ
ャートである。
【図7】第2の実施形態における順序づけ結果を示す図
である。
【図8】第3の実施形態における順序付け処理を示すフ
ローチャートである。
【図9】実施形態における装置のブロック構成図であ
る。
【図10】第4の実施形態におけるフッタ識別処理を示
すフローチャートである。
【図11】第5の実施形態におけるフッタ識別処理を示
すフローチャートである。
【図12】第6の実施形態におけるフッタ識別処理を示
すフローチャートである。
【図13】第7の実施形態におけるフッタ識別処理を示
すフローチャートである。
【図14】第8の実施形態におけるフッタ識別処理を示
すフローチャートである。
【図15】第4の実施形態の動作処理内容を説明するた
めの図である。
【図16】非フッタ文字領域となる例を示す図である。
【図17】非フッタ文字領域となる例を示す図である。
【図18】非フッタ文字領域となる例を示す図である。
【図19】記憶媒体内のプログラム格納状態を示す図で
ある。
【符号の説明】
21、71 原稿画像 22 文字領域 23、72、73 フッタの文字領域

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 原稿画像中の文字領域を抽出し、当該抽
    出した文字領域に対して処理順序を設定する文字領域の
    順序付け方法であって、 抽出された個々の文字領域の中のフッタ文字領域を識別
    する識別工程と、 該識別工程で識別されたフッタ領域に対しては、他の文
    字領域より後に処理順番を設定する設定工程とを備える
    ことを特徴とする文字領域の順序付け方法。
  2. 【請求項2】 前記識別工程は、注目文字領域が原稿画
    像中の所定位置より下方に位置するかを判定する工程を
    含み、当該判定工程によって前記所定位置より下方に位
    置する場合に注目文字領域をフッタ文字領域として識別
    することを特徴とする請求項第1項に記載の文字領域の
    順序付け方法。
  3. 【請求項3】 前記識別工程は、更に、注目文字領域が
    1行のみの文字列で構成されているか否かを判定する工
    程を含み、1行のみの文字列であると判定した場合に注
    目文字領域をフッタ文字領域として識別することを特徴
    とする請求項第2項に記載の文字領域の順序付け方法。
  4. 【請求項4】 前記識別工程は、更に、注目文字領域が
    横書きか横長かを判定する工程を含み、横書き或いは横
    長であると判定した場合に注目文字領域をフッタ文字領
    域として識別することを特徴とする請求項第3項に記載
    の文字領域の順序付け方法。
  5. 【請求項5】 前記識別工程は、更に、注目文字領域の
    下方に他の文字領域が存在するか否かを判定する工程を
    含み、下方に他の文字領域がないと判定した場合に注目
    文字領域をフッタ文字領域として識別することを特徴と
    する請求項第4項に記載の文字領域の順序付け方法。
  6. 【請求項6】 前記識別工程は、更に、注目文字領域が
    他の線画に含まれるか否かを判定する工程を含み、他の
    線画に含まれる場合には注目文字領域を非フッタ文字領
    域として識別することを特徴とする請求項第5項に記載
    の文字領域の順序付け方法。
  7. 【請求項7】 更に、前記設定工程で設定された順序に
    従って、個々の文字領域内の文字画像を認識する文字認
    識工程を備えることを特徴とする請求項第1項に記載の
    文字領域の順序付け方法。
  8. 【請求項8】 原稿画像中の文字領域を抽出し、当該抽
    出した文字領域に対して処理順序を設定する文字領域の
    順序付け装置であって、 抽出された個々の文字領域の中のフッタ文字領域を識別
    する識別手段と、 該識別手段で識別されたフッタ領域に対しては、他の文
    字領域より後に処理順番を設定する設定手段とを備える
    ことを特徴とする文字領域の順序付け装置。
  9. 【請求項9】 前記識別手段は、注目文字領域が原稿画
    像中の所定位置より下方に位置するかを判定する手段を
    含み、当該判定手段によって前記所定位置より下方に位
    置する場合に注目文字領域をフッタ文字領域として識別
    することを特徴とする請求項第8項に記載の文字領域の
    順序付け装置。
  10. 【請求項10】 前記識別手段は、更に、注目文字領域
    が1行のみの文字列で構成されているか否かを判定する
    手段を含み、1行のみの文字列であると判定した場合に
    注目文字領域をフッタ文字領域として識別することを特
    徴とする請求項第9項に記載の文字領域の順序付け装
    置。
  11. 【請求項11】 前記識別手段は、更に、注目文字領域
    が横書きか横長かを判定する手段を含み、横書き或いは
    横長であると判定した場合に注目文字領域をフッタ文字
    領域として識別することを特徴とする請求項第10項に
    記載の文字領域の順序付け装置。
  12. 【請求項12】 前記識別手段は、更に、注目文字領域
    の下方に他の文字領域が存在するか否かを判定する手段
    を含み、下方に他の文字領域がないと判定した場合に注
    目文字領域をフッタ文字領域として識別することを特徴
    とする請求項第11項に記載の文字領域の順序付け装
    置。
  13. 【請求項13】 前記識別手段は、更に、注目文字領域
    が他の線画に含まれるか否かを判定する手段を含み、他
    の線画に含まれる場合には注目文字領域を非フッタ文字
    領域として識別することを特徴とする請求項第12項に
    記載の文字領域の順序付け装置。
  14. 【請求項14】 更に、前記設定手段で設定された順序
    に従って、個々の文字領域内の文字画像を認識する文字
    認識手段を備えることを特徴とする請求項第8項に記載
    の文字領域の順序付け装置。
  15. 【請求項15】 原稿画像中の文字領域を抽出し、当該
    抽出した文字領域に対して処理順序を設定する文字領域
    の順序付けするプログラムコードが格納されたコンピュ
    ータ可読メモリであって、 抽出された個々の文字領域の中のフッタ文字領域を識別
    する識別工程のコードと、 該識別工程で識別されたフッタ領域に対しては、他の文
    字領域より後に処理順番を設定する設定工程のコードと
    を有することを特徴とするコンピュータ可読メモリ。
JP7298236A 1995-11-16 1995-11-16 文字領域の順序付け方法及び装置 Pending JPH09146947A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7298236A JPH09146947A (ja) 1995-11-16 1995-11-16 文字領域の順序付け方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7298236A JPH09146947A (ja) 1995-11-16 1995-11-16 文字領域の順序付け方法及び装置

Publications (1)

Publication Number Publication Date
JPH09146947A true JPH09146947A (ja) 1997-06-06

Family

ID=17857003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7298236A Pending JPH09146947A (ja) 1995-11-16 1995-11-16 文字領域の順序付け方法及び装置

Country Status (1)

Country Link
JP (1) JPH09146947A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100392321B1 (ko) * 1996-12-27 2003-09-19 삼성전자주식회사 꼬리말 인쇄 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06203020A (ja) * 1992-12-29 1994-07-22 Hitachi Ltd テキストフォーマット認識生成方法および装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06203020A (ja) * 1992-12-29 1994-07-22 Hitachi Ltd テキストフォーマット認識生成方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100392321B1 (ko) * 1996-12-27 2003-09-19 삼성전자주식회사 꼬리말 인쇄 방법

Similar Documents

Publication Publication Date Title
US6466694B2 (en) Document image processing device and method thereof
CN102117269B (zh) 对文档进行数字化的装置及方法
US8225200B2 (en) Extracting a character string from a document and partitioning the character string into words by inserting space characters where appropriate
JP2004158036A (ja) 機械可読フォームのインスタンス上の領域を識別するコンピュータ・システム
JP2008108114A (ja) 文書処理装置および文書処理方法
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JPH09146947A (ja) 文字領域の順序付け方法及び装置
JPH08180068A (ja) 電子ファイリング装置
JP3814334B2 (ja) 画像処理装置及びその方法
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH0969136A (ja) 文書方向判定方法及び装置及び文字認識装置、及びコンピュータ制御装置
JP5361315B2 (ja) 情報処理装置及び情報処理方法
JPH11187231A (ja) 画像検索装置及び画像検索方法
JPH09269970A (ja) 文字認識方法とその装置
JPH0830725A (ja) 画像処理装置及び方法
JP3412998B2 (ja) 画像処理装置及びその方法
JP3052438B2 (ja) 表認識装置
JPH117493A (ja) 文字認識処理装置
JPH11242716A (ja) 画像処理方法および記録媒体
JPH09288714A (ja) 表認識方法および装置
JPH01292586A (ja) 文字認識支援装置
JP3045086B2 (ja) 光学式文字読取方法および装置
JP2000187704A (ja) 文字認識装置及びその方法及び記憶媒体
JPS63172663A (ja) 文書処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041119

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050916