JPH0676103A - 文書画像の文章領域抽出装置 - Google Patents

文書画像の文章領域抽出装置

Info

Publication number
JPH0676103A
JPH0676103A JP4250626A JP25062692A JPH0676103A JP H0676103 A JPH0676103 A JP H0676103A JP 4250626 A JP4250626 A JP 4250626A JP 25062692 A JP25062692 A JP 25062692A JP H0676103 A JPH0676103 A JP H0676103A
Authority
JP
Japan
Prior art keywords
line
document image
detected
partition
partition line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4250626A
Other languages
English (en)
Inventor
Ichiro Ogura
一郎 小倉
Yasuo Hongo
保夫 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP4250626A priority Critical patent/JPH0676103A/ja
Publication of JPH0676103A publication Critical patent/JPH0676103A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 文書画像から段組を高速・高精度に抽出す
る。 【構成】 粗な文書画像1に変換してから周辺部を除去
し、さらに文書の縦横形式を判別した後に、大まかの段
組を抽出する(S1〜S4)。次いで、段組間の、行に
垂直な方向の周辺分布を求め(S5−1)、得られた周
辺分布の突出した分の凸値を求める(S5−2)。凸値
ΔP(x)の値によっては、さらに行方向の周辺分布を
求めて仕切線を検出する(S5−3)。検出された仕切
線に二重線があれば統合し(S6)、同様に段組間の空
白領域を検出する(S7)。さらに、段組間についても
同様な処理により周辺分布を求めて仕切線を検出する
(S8)。これらの検出結果に基づき、行ブロックおよ
び段落ブロックを抽出するとともにそれらにラベリング
する(S9,S10)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置が文書画像
を読み取る際に用いられる文書画像の文章領域抽出装置
に関し、詳しくは、文章、線図、写真等が混在し多段組
で構成される文書画像についても自動的に文章領域を抽
出することを可能にした文書画像の文章領域抽出装置に
関する。
【0002】
【従来の技術】従来、多段組で構成される文書画像から
行ブロックを抽出するには、先ず行に垂直な方向に各ラ
インの黒画素の変化点の数を計測して周辺部分を求め、
得られた周辺分布から段落の谷間を検出し、段落を判定
する。次に、段ごとに行方向にぬりつぶし処理を行い、
段落内の行ブロックを作成する。
【0003】さらに、段と段の間の距離をもとに閾値を
作成し、隣合う行ブロックの間にある黒画素(文字)と
の距離が閾値を越えた場合は、段組ごとの行ブロック
か、または段組をまたぐ行ブロック(タイトル、概要
等)であるかの判定を行う。距離が閾値以下の場合は、
行ブロックの統合を行い、段組をまたぐ行ブロックの作
成をおこなう。なお、これ以外にも行等の線情報の検出
法として、連結性解析や境界追跡によるベクトル化とい
う手法がある。
【0004】
【発明が解決しようとする課題】しかしながら、これら
従来の行ブロックの抽出法で、新聞等のように段と段の
間に仕切線のある文書画像を処理する場合は、仕切線の
黒画素のため隣合う行ブロックの間にある黒画素との距
離が短くなり、段組をまたぐ行ブロック(タイトル、概
要等)であると誤判定されることがある。
【0005】また、従来の方法では、段組内にある表や
図が行方向のぬりつぶし処理により行と一つに統合され
てしまい、行ブロックが正しく抽出されない。さらに、
連結性解析による線情報の検出法や境界追跡によるベク
トル化による線情報の検出法では、処理に時間がかか
り、しかも文字に接触した線の検出が困難である等の問
題があった。
【0006】本発明は上記問題点を解決するためになさ
れたもので、その目的とするところは、段と段との間に
仕切線がある文書画像および段組内に表や図が含まれる
文書画像についても高精度で行ブロックおよび段落ブロ
ックを抽出することのできる文書画像の文章領域抽出装
置を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、第1の発明は、2値化信号として入力された原画像
を、それよりも粗である文書画像に変換する手段と、文
書画像から周辺の空白部分を除去する手段と、文書画像
が縦書きまたは横書きのいずれであるかを判別する手段
と、文書画像を文字行と垂直な方向に走査し走査ライン
ごとに画素値が反転する回数を計数し、その頻度分布を
求める手段と、頻度分布の谷部から文書画像中の段組み
領域を抽出する手段とを備えた文書画像の文章領域抽出
装置において、段組み間を走査し、走査ラインごとに黒
画素の個数を計測して周辺分布を求め、その周辺分布か
ら仕切線を検出する手段と、段組み間の画素値を反転し
てから走査し、走査ラインごとに黒画素の個数を計測し
て周辺分布を求め、その周辺分布から段組み間の空白領
域を検出する手段と、段組み内を走査し、走査ラインご
とに黒画素の個数を計測して周辺分布を求め、その周辺
分布から仕切線を検出する手段と、検出された仕切線お
よび空白領域情報に基づき、文書画像内の行ブロックを
抽出する手段と、検出された仕切線および空白領域情報
に基づき、行ブロックより段落ブロックを抽出する手段
とを備えたことを特徴とする。
【0008】第2の発明は、第1の発明において、検出
された仕切線に対してその長手方向に膨張処理または膨
張・収縮処理を加える手段を備えたことを特徴とする。
【0009】第3の発明は、第1または第2の発明にお
いて、検出された仕切線に対しその垂直方向に膨張処理
または膨張・収縮処理を加える手段を備えたことを特徴
とする。
【0010】第4の発明は、第1、第2または第3の発
明において、原画像を参照しながら仕切線および空白領
域の検出結果の正誤を判別する手段を備えたことを特徴
とする。
【0011】
【作用】第1の発明においては、文書画像の抽出された
段組み間が走査されて走査ラインごとに黒画素の個数が
計測されることにより、得られた周辺分布から仕切線が
検出される。また、段組み間の画素値が反転されてから
走査され、走査ラインごとに黒画素の個数が計測される
ことにより、得られた周辺分布から段組み間の空白領域
が検出される。
【0012】さらに、段組み内が走査されて走査ライン
ごとに黒画素の個数が計測されることにより、得られた
周辺分布から仕切線が検出される。これら検出された仕
切線および空白領域情報に基づき、文書画像内の行ブロ
ックが抽出され、次いで検出された仕切線および空白領
域情報に基づき、行ブロックより段落ブロックが抽出さ
れる。
【0013】第2の発明においては、検出された仕切線
に対し、その長手方向に膨張処理または膨張・収縮処理
が加えられる。
【0014】第3の発明においては、検出された仕切線
に対しその垂直方向に膨張処理または膨張・収縮処理が
加えられる。
【0015】第4の発明においては、原画像を参照しな
がら仕切線および空白領域の検出結果の正誤が判別され
る。
【0016】
【実施例】以下、図に沿って本発明の実施例を説明す
る。図1は第1の発明に係る文章領域抽出処理の一例を
示すフローチャートであり、図2は変換処理される画像
の一例を示す説明図である。以下、図1のフローチャー
トに基づき、図2の画像を参照しながら文章領域抽出処
理を説明する。
【0017】図1において、初めに2値画像信号として
力された文書画像を変換して粗な文書画像1を作成する
(S1)。以後、ここで変換された粗なる文書画像1に
対して文章領域抽出の処理を行うことにより、処理速度
が向上する。次に、作成された画像1の周辺の空白部を
除去する(S2)。これも、文書が書き込まれていない
空白部分を処理対象から除くことにより、以後の処理速
度が向上する。この処理については、本出願人が特願平
3−306447号として出願している。
【0018】次いで、文書画像の縦書き・横書きの判別
をする(S3)。この処理については、本出願人が特願
平3−277069号として出願している。ここで、文
書の方向の判別結果に従い、S3で横書きと判別された
場合はY軸方向、縦書きと判別された場合はX軸方向つ
まりいずれも行と垂直な方向にラインごとの黒画素の変
化点の数をカウントし、周辺分布を求めて段組の判定を
行う(S4)。図2では、行2が横書きと判別されるた
め、Y軸方向についての周辺分布5が求められる。
【0019】黒画素の変化点とは、2値画像中のライン
を構成する黒画素または白画素の反転を指すものであ
り、その周辺分布は、変化点のカウント値をラインごと
に示した頻度分布でもある。この処理については、本出
願人が特願平3−351065号として出願している。
なお、この段組の判定は、段の切れ目の可能性を示して
いるだけであり、文書にはタイトルや概要等のように段
組をまたぐ行ブロックが存在する。そのため、段を完全
に分離する情報として、段組間にある仕切線3の検出を
行う(S5)。
【0020】具体的には、段と段とを分離し、しかも行
に垂直な方向の実線を検出するため、段組間について行
に垂直な方向の周辺分布を求める(S5−1)。なお、
ここで求める周辺分布とは、ライン上の黒画素の総数を
示すものであり、仕切線の場合、文書領域よりも分布値
が格段に大きくなる。
【0021】図3はその説明図であり、図では説明の便
宜上、画像1に仕切線6のみを示している。X軸に沿っ
て変化する周辺分布をP(x)とすると、仕切線6での
周辺分布P(x)がその前後よりも突出する。そこで周
辺分布の突出した分の凸値を求める(S5−2)。求め
る凸値をΔP(x)とすると、ΔP(x)は次式により
表せる。
【0022】 ΔP(x)=2P(x)−P(x−ε)−P(x+ε)……(1)
【0023】なお、前後幅の指定値εは固定せずに、例
えば線が細い場合は1mmとし、太い線や傾きがある場
合は2mmというようにして、線の太さや傾きに応じて
変える。得られた凸値ΔP(x)が、仕切線を判別する
ための閾値T1(例えば、40mm)を越えた場合は、
仕切線の可能性ありと判別し、さらに仕切線の可能性の
ある範囲について、行と同じ方向の周辺分布を求める。
得られた周辺分布中に黒画素の区間が閾値T2(例え
ば、20mm)を越えた場合は、仕切線であると判別す
る(S5−3)。
【0024】図4は、判別処理の説明図であり、この判
別処理により検出された2本の仕切線7が接近していて
二重線と見なせるような場合は、統合処理を行い1本の
仕切線8とみなす(S6)。なお、図中の9は行であ
る。次に、段を完全に分離するために必要な他の情報と
して、段組間にある空間領域の検出を行う(S7)。具
体的には、画像の白黒値を反転してS5−1〜S5−3
と同様な処理を行い、反転され黒画素の仕切線として表
された空間領域を検出する。
【0025】次にこれらの処理により確定された段組内
について、再度仕切線の検出を行う(S8)。すなわ
ち、段組内には、図2に示すように行以外の表罫線4
や、図中に引かれた縦線、横線がある。そこで、これら
の直線のうち、行に垂直な直線については上述した段組
間の直線検出と同じ処理により検出する。
【0026】また、行と同じ方向の直線については、高
さが1mm程度の行が検出されると、その原画像につい
てチェックし、連続した線か文字かを判別する。図5は
その処理の説明図であり、粗な文書画像1中に行と同じ
方向の直線が検出されると、その領域11について原画
像を参照し、線12、あるいは文字13であることを確
認する。これらの判別結果は、有効な段落の区切り情報
となる。
【0027】次に、行ブロックの作成とラベリングを行
う(S9)。具体的な処理としては、画像1について得
られた段組情報、仕切線情報および空白領域情報をもと
に、仕切線と空白領域の影響がないように、段ごとに行
方向の塗りつぶし画像を作成し、段ごとの行ブロックを
作成する。次いで、この段と段との間の距離をもとにし
て閾値を作成する。
【0028】この閾値と、隣合う行ブロックの間にある
黒画素との距離を比較し、段組ごとの行ブロックである
か、あるいは段組をまたぐ行ブロック(タイトル、概要
等)であるかの判定を行う。なお、距離が閾値以下であ
り、それらの行ブロックの間に仕切線が存在しない場合
は、行ブロックの統合を行い、段組をまたぐ行ブロック
の作成をおこなう。
【0029】次いで、作成された行ブロックについてラ
ベリングを行う。図6はこの行ブロックの作成処理の説
明図であり、行ブロック14は左右に2分され、段落間
の距離がdとなる。行ブロック14の下3行の段落間に
は行に垂直な仕切線15が検出される。また、上3行の
行ブロック14の段落間には黒画素16が検出される。
その結果、上3行は、タイトルまたは概要を表す行ブロ
ックと判定され、下3行は、本文を表す行ブロックと判
定される。
【0030】次に、これら行ブロックをまとめ、得られ
た段組情報および仕切線情報に基づき、段落構造を解析
して段落ブロックを作成するとともに、その順番付けの
ラベリングを行う(S10)。特に、行と同じ方向の実
線は、段落の区切り情報として有効であり、段落の順番
付けの妥当性を増すことができる。
【0031】以上説明した第1の発明の実施例では、段
組を判定するとともに、段組間の仕切線や段組内の仕切
線を検出した後、段ごとに行方向の塗りつぶし画像を作
成し、段ごとの行ブロックを作成する。さらに、得られ
た段組情報、仕切線情報をもとに、段組をまたぐ行ブッ
ロク(タイトル、概要等)かどうかの判定をおこなう。
それにより、仕切線で仕切られた行ブロック同士を誤統
合することがなくなり、タイトル行と本文行の判別が精
度良く行える。
【0032】また、表罫線や図についても、仕切線とし
て検出するので、段落内にある線、表、図と隣合う行ブ
ロックとが統合されることがなくなり、行ブロックを正
しく抽出することができるようになる。さらに、従来の
段組情報に仕切線情報を加えて段落構造を解析するの
で、段落の区切りの検出が確実になり、精度の良い段落
ブロックを作成することができる。
【0033】次に、第2の発明の実施例を説明する。こ
の実施例は、第1の発明において、仕切線方向に画素の
膨張および収縮処理を加えてから周辺分布より仕切線を
検出するものであり、破線に対する検出能力を強化す
る。図7は第2の発明に係る仕切線抽出処理の一例を示
すフローチャートであり、図8は処理例を示す説明図で
ある。以下、図7のフローチャートに基づき、図8を参
照しながら文章領域抽出処理を説明する。
【0034】図8に示すように、仕切線が破線21であ
ると、破線21は短い線のかたまりであるので、そのま
ま行に垂直な方向に周辺分布22をとり凸値を求めれば
仕切線として検出できる可能性がある。しかし、行と同
じ方向に周辺分布23をとると、短い連続領域となって
仕切線として検出されない。そこで行に垂直な方向に画
素数Nの膨張処理を行い、実線24に変換する(S1
1)。なお、画素数Nは、行を接続させないように最大
行間空白の1/2以下の値とする。
【0035】次いで、段組間の行に垂直な方向に周辺分
布をとり(S12)、得られた周辺分布25から数式
(1)を用いて、凸値を求める(S13)。ここで、得
られた凸値の中で閾値T1以上のものは、仕切線の可能
性がある。そこで、さらに仕切線の可能性がある範囲に
ついて、行と同じ方向に周辺分布をとり、その周辺分布
26の中で黒画素の連続区間が閾値T2を越えていれば
仕切線と判定する(S14)。なおN画素の膨張処理
後、N画素の収縮処理を加える。
【0036】このようにして第2の発明の実施例では、
仕切線の方向にN画素の膨張または収縮処理を加えるこ
とにより破線が実線に置き換えられる。それにより、破
線からなる仕切線に対する検出能力が強化されて、段落
ブロックが高精度に抽出される。
【0037】次に、第3の発明の実施例を説明する。こ
の実施例は、第1または第2の発明において、仕切線に
垂直な方向に画素の膨張および収縮処理を加えて得られ
た周辺分布より仕切線を検出するものであり、傾いた仕
切線に対する検出能力を強化する。図9は第3の発明に
係る仕切線抽出処理の一例を示すフローチャートであ
り、図10は処理例を示す説明図である。以下、図9の
フローチャートに基づき、図10を参照しながら文章領
域抽出処理を説明する。
【0038】図10に示すように、仕切線31が傾いて
いると、行に垂直な方向に周辺分布32をとっても、凸
値が明確に現れず仕切線として検出することが困難にな
る。そこで、行と同じ方向の長さが例えば1mm以下で
ある場合は、同方向に画素数Mの膨張処理を行い、太い
仕切線33を得る(S21)。なお、画素数Mは、行を
接続させないように最大行間空白の1/2以下程度の値
とする。
【0039】次いで、段組間の行に垂直な方向に周辺分
布34をとり(S22)、得られた周辺分布34から数
式(1)を用いて、凸値を求める(S23)。次に、得
られた凸値の中で、閾値T1以上のものは、仕切線の可
能性がある。そこで、さらに仕切線の可能性がある範囲
について、行と同じ方向に周辺分布をとり、黒画素の連
続区間が閾値T2を越えていれば仕切線と判定する(S
24)。なおM画素の膨張処理後、必要な場合はM画素
の収縮処理を加える。
【0040】このようにして第3の発明の実施例では、
仕切線と同じ方向にM画素の膨張処理を加えることによ
り、傾いた仕切線31に対する検出能力が強化される。
それにより、傾いた仕切線を含む文書画像に対しても、
段落ブロックが高精度に抽出されるようになる。
【0041】次に、第4の発明の実施例を説明する。こ
の実施例は、第1または第2または第3の発明におい
て、すでに粗な文書画像1から得られた仕切線や空白領
域についての検出結果を、再度原画像を参照して誤検出
か否かを判別する。
【0042】すなわち、原画像について、線に垂直な方
向に周辺分布をとり、連続していれば実線、同じ長さの
線が周期的に並んでいれば破線であるというルールを使
用して判断し、その結果を既に粗な画像1から検出して
おいた結果と比較して一致することを確認する。その結
果、第1〜第3の発明の実施例で粗な文書画像1により
高速に抽出された段落についても、原画像を用いた場合
と同等の信頼性が得られる。
【0043】
【発明の効果】以上述べたように第1の発明によれば、
段組み間の仕切線、空白を検出するとともに段組み内の
仕切線を検出してから、行ブロックを抽出しさらに段落
ブロックを抽出することにより、段と段との間に仕切線
が有る文書画像および段組内に表や図が含まれる文書画
像についても高精度に行ブロックおよび段落ブロックを
抽出することができる。
【0044】第2の発明によれば、検出された仕切線に
対し、その長手方向に膨張処理または膨張・収縮処理を
加えることにより、仕切線が破線である場合も確実に検
出して抽出精度を向上することができる。
【0045】第3の発明によれば、検出された仕切線に
対しその垂直方向に膨張処理または膨張・収縮処理を加
えることにより、傾斜している仕切線についても確実に
検出し抽出精度を向上することができる。
【0046】第4の発明によれば、原画像を参照しなが
ら仕切線および空白領域の検出結果をチェックすること
により、行ブロックおよび段落ブロックの抽出精度が向
上する。
【図面の簡単な説明】
【図1】第1の発明に係る文章領域抽出処理の一例を示
すフローチャートである。
【図2】変換処理される画像の一例を示す説明図であ
る。
【図3】周辺分布から凸値を求める処理の説明図であ
る。
【図4】二重線を統合する処理の説明図である。
【図5】行と同方向の直線について文字か否かを判別す
る処理の説明図である。
【図6】行ブロックの作成処理の説明図である。
【図7】第2の発明に係る仕切線抽出処理の一例を示す
フローチャートである。
【図8】図7における処理例を示す説明図である。
【図9】第3の発明に係る仕切線抽出処理の一例を示す
フローチャートである。
【図10】図9における処理例を示す説明図である。
【符号の説明】
1 粗な文書画像 3 仕切線 4 表罫線 5 周辺分布 6 仕切線 7 仕切線 8 仕切線 11 領域 12 線 13 文字 14 行ブロック 15 仕切線 16 黒画素 21 破線 22 周辺分布 23 周辺分布 24 実線 31 仕切線 32 周辺分布 33 仕切線

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 2値化信号として入力された原画像を、
    それよりも粗である文書画像に変換する手段と、 文書画像から周辺の空白部分を除去する手段と、 文書画像が縦書きまたは横書きのいずれであるかを判別
    する手段と、 文書画像を文字行と垂直な方向に走査し画素値が反転す
    る回数を走査ラインごとに計数し、その頻度分布を求め
    る手段と、 頻度分布の谷部から文書画像中の段組み領域を抽出する
    手段と、 を備えた文書画像の文章領域抽出装置において、 段組み間を走査し、走査ラインごとに黒画素の個数を計
    測して周辺分布を求め、その周辺分布から仕切線を検出
    する手段と、 段組み間の画素値を反転してから走査し、走査ラインご
    とに黒画素の個数を計測して周辺分布を求め、その周辺
    分布から段組み間の空白領域を検出する手段と、 段組み内を走査し、走査ラインごとに黒画素の個数を計
    測して周辺分布を求め、その周辺分布から仕切線を検出
    する手段と、 検出された仕切線および空白領域情報に基づき、文書画
    像内の行ブロックを抽出する手段と、 検出された仕切線および空白領域情報に基づき、行ブロ
    ックより段落ブロックを抽出する手段と、 を備えたことを特徴とする文書画像の文章領域抽出装
    置。
  2. 【請求項2】 請求項1記載の文書画像の文章領域抽出
    装置において、検出された仕切線に対してその長手方向
    に膨張処理または膨張・収縮処理を加える手段を備えた
    ことを特徴とする文書画像の文章領域抽出装置。
  3. 【請求項3】 請求項1または2記載の文書画像の文章
    領域抽出装置において、検出された仕切線に対しその垂
    直方向に膨張処理または膨張・収縮処理を加える手段を
    備えたことを特徴とする文書画像の文章領域抽出装置。
  4. 【請求項4】 請求項1、2または3記載の文書画像の
    文章領域抽出装置において、原画像を参照しながら仕切
    線および空白領域の検出結果の正誤を判別する手段を備
    えたことを特徴とする文書画像の文章領域抽出装置。
JP4250626A 1992-08-25 1992-08-25 文書画像の文章領域抽出装置 Pending JPH0676103A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4250626A JPH0676103A (ja) 1992-08-25 1992-08-25 文書画像の文章領域抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4250626A JPH0676103A (ja) 1992-08-25 1992-08-25 文書画像の文章領域抽出装置

Publications (1)

Publication Number Publication Date
JPH0676103A true JPH0676103A (ja) 1994-03-18

Family

ID=17210656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4250626A Pending JPH0676103A (ja) 1992-08-25 1992-08-25 文書画像の文章領域抽出装置

Country Status (1)

Country Link
JP (1) JPH0676103A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050121580A (ko) * 2004-06-22 2005-12-27 박인술 투약용 소분 계량용기
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050121580A (ko) * 2004-06-22 2005-12-27 박인술 투약용 소분 계량용기
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image

Similar Documents

Publication Publication Date Title
JP3576570B2 (ja) 比較方法
JPH01292486A (ja) 文字認識装置及び方法
JPH0519753B2 (ja)
JPH0676103A (ja) 文書画像の文章領域抽出装置
JP4412762B2 (ja) 点線抽出方法、その装置及びその記録媒体
JPH0410087A (ja) 基本ライン抽出方法
JP2683116B2 (ja) 罫線の除去方法
JPH07160810A (ja) 文字認識装置
JPH10187886A (ja) 文字認識装置および文字認識方法
JPH05166001A (ja) 文字認識装置
JPH09288714A (ja) 表認識方法および装置
JPH0528310A (ja) フオーム型文書識別装置
JPH08249419A (ja) 表領域判定装置
JP3100825B2 (ja) 線認識方法
JPH05282487A (ja) 文字認識装置
JP2569132B2 (ja) 特殊文字行の判別方法
JP2000207490A (ja) 文字切出装置、および文字切出方法
JPH05274472A (ja) 画像認識装置
JPH06223224A (ja) 行切出し方法
JP3039427B2 (ja) 文字切り出し方式及び方法
JPS62187988A (ja) 光学的文字認識方式において使用する処理手段
JPH0540846A (ja) 文書画像の和文・欧文判定方法
JP3381803B2 (ja) 傾き角検出装置
JPH0628520A (ja) 文字認識装置
JPH10143607A (ja) 画像処理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000307