JPH03142691A - 表形式文書認識方式 - Google Patents

表形式文書認識方式

Info

Publication number
JPH03142691A
JPH03142691A JP1282736A JP28273689A JPH03142691A JP H03142691 A JPH03142691 A JP H03142691A JP 1282736 A JP1282736 A JP 1282736A JP 28273689 A JP28273689 A JP 28273689A JP H03142691 A JPH03142691 A JP H03142691A
Authority
JP
Japan
Prior art keywords
ruled line
projection data
ruled
vertical
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1282736A
Other languages
English (en)
Other versions
JP2796561B2 (ja
Inventor
Koji Katano
片野 浩司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP1282736A priority Critical patent/JP2796561B2/ja
Publication of JPH03142691A publication Critical patent/JPH03142691A/ja
Application granted granted Critical
Publication of JP2796561B2 publication Critical patent/JP2796561B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、文字、表、図等が混在する文書を読込んで
文書画像情報とし、この文書画像情報から個々の情報を
分離して認識する表形式文書認識方式に関する。
〔従来の技術〕
従来、光学文字認識装置(OCR)等の文字認識装置で
は、文書を画像情報として読取り、この画像情報を行或
いは列と文字群とに分離し、さらに文字と思われる所で
細分化して文字認識を行うようにしているが、表中の文
字を認識する場合には、罫線が含まれていることから枠
内の文字については行間や文字間がことなるため、誤認
識も多くなり、しかも表の構造を認識しているわけでは
ないので、その表自身が持つ意味を失わせてしまうとい
う課題があった。
この課題を解決するために、従来、昭和63年電子情報
通信学会春季全国大会予稿集第2−224頁に記載され
ているように、文書画像を水平(又は垂直)方向に走査
し、黒画素数のヒストグラムを形成し、次いでヒストグ
ラムの山の部分について、高さが闇値以上である区間を
山の幅として、その幅が小さいものを抽出し、それに対
応する文書画像の領域を線分の領域とし、さらに線分領
域を線分の方向に走査し、白画素が闇値以上連続する部
分を終点として線分を抽出し、その後抽出した線分から
表の外接矩形を求めて欄情報を生威し、裏構造を認識す
ることが提案されている。
〔発明が解決しようとする課題〕
しかしながら、上記従来の表形式文書認識方式にあって
は、文書画像を水平又は垂直方向に走査する関係で、水
平又は垂直方向に連続する罫線の場合には、罫線を切り
出すことができるが、例えば水平方向の2本の罫線間を
結ぶ短い垂直方向の罫線がある場合にはこれを検出する
ことができないので、細かく区分けされた表を正確に認
識するには、文書画像を短い罫線を認識可能な大きさの
領域に分割し、各領域毎に水平及び垂直方向の走査を行
ってヒストグラムを作成する必要があり、画像認識を行
う場合の処理時間が長くなると共に、分割領域の周縁部
に罫線があるときには判別が困難であり、また各分割領
域で抽出した罫線候補を連結する場合の処理時間も長く
なり、さらには文字群が実線、点線等の線によって区分
けされず、空白領域による仮想罫線によって区分けされ
た表については表認識を行うことができないという未解
決の課題があった。
そこで、この発明は、上記従来例の未解決の課題に着目
してなされたものであり、表認識を短時間で正確に行う
ことができ、また空白領域による仮想罫線であっても容
易に表認識を行うことができる表形式文書認識方式を提
供することを目的としている。
〔課題を解決するための手段〕
上記目的を遠戚するために、請求項(1)に係る表形式
文書認識方式は、文字と罫線とが混在する表形式文書を
画像読取装置で読取り、該画像読取装置からの画像情報
中の罫線を切り出し、該罫線によって両底された領域の
文字情報を文字認識装置に送出するようにした表形式文
書認識方式であって、前記画像情報を所定幅の帯状領域
に分割し、各帯状領域をその長手方向と直交する方向に
投影した投影データを形成する投影データ形成手段と、
該投影データ形成手段で形成した投影データから罫線候
補を抽出する罫線候補抽出手段と、該罫線候補抽出手段
で抽出した罫線候補を隣接する帯状領域間で連結して罫
線を認識する罫線認識手段とを備えたことを特徴として
いる。
また、請求項(2)に係る表形式文書認識方式は、前記
請求項(1)において、罫線候補抽出手段は、文字列間
に空白領域があるときに、当該空白領域から仮想罫線候
補を抽出するように構成されていることを特徴としてい
る。
〔作用〕
請求項(1)に係る表形式文書認識方式においては、画
像読取装置で読取った2値化画像情報を例えば水平方向
の複数の帯状領域に分割し、これら帯状領域の夫々につ
いてその長手方向と直交する方向に投影データをとり、
この投影データから例えば幅狭の垂直方向の罫線候補を
抽出することにより、垂直罫線候補を正確に抽出するこ
とができ、この抽出した罫線候補を隣接する帯状領域間
で連結することにより、垂直罫線を認識することができ
る。
また、水平罫線を抽出するには、2値化画像情報を垂直
方向の複数の帯状領域に分割し、その長手方向と直交す
る投影データから水平方向罫線候補を抽出し、各帯状領
域の罫線候補を連結することにより、水平罫線を抽出す
ることができる。この水平罫線を抽出する際に、予め前
記処理によって抽出した垂直罫線を前記2値化画像情報
から消去しておくことにより、罫線認識の時間を短縮す
ることができる。
また、請求項(2)に係る表形式文書認識方式において
は、文字列が空白領域で区分されている表である場合に
、その空白領域を探索して仮想罫線候補を抽出すること
により、線で区分けされていない表であっても、罫線認
識を容易に行うことかできる。
〔実施例〕
以下、この発明の実施例を図面に基づいて説明する。
第1図はこの発明の概略構成を示すブロック図である。
図中、lはイメージスキャナーであって、パーソナルコ
ンピュータ等で構成される処理装置4によって制御され
、第2図に示すように、垂直罫線Rv及び水平罫線RH
によって形成された表T内に任意の文字が描かれた表形
式文書りを読取り、これを所定レベルで黒白画素に2値
化した2値化画像情報を出力する。
このイメージスキャナー1の2値化画像情報は、図形分
離部2に送出され、この図形分離部2で表情報とこれに
よって区分けされた文字情報とに分割され、文字情報が
光学文字認識装置(OCR)3に入力され、この光学文
字認識装置3で文字認識が行われて認識された文字デー
タが処理装置4に入力される。
図形分離部2は、例えばインタフェース回路2a、演算
処理装置2b及びドツト対応の画像メモリを含む記憶装
置2Cを少なくとも有し、イメージスキャナーlからの
2値化画像情報が入力されると、この2値化画像情報を
記憶装置2Cの画像メモリに格納し、次いで演算処理装
置2bで第3図の処理を実行する。すなわち、先ずステ
ップので垂直罫線Rvを抽出する垂直罫線抽出処理を実
行し、次いでステップ■に移行して水平罫線Rgを抽出
する水平罫線抽出処理を実行し、次いでステップ■に移
行して罫線によらず罫線に対応する空白領域による仮想
罫線R,を抽出する仮想罫線抽出処理を実行し、次いで
ステップ■に移行して各処理で抽出した垂直罫線RV、
水平罫線R工及び仮想罫線R7で囲まれる欄内の画像情
報を光学文字読取装置3に送出する。
ここで、垂直罫線抽出処理は、第4図に示すようにステ
ップ■で画像メモリに格納されている2値化画像情報を
、第7図(a)に示すように、所定幅の水平方向(X方
向)に延長する複数N個の帯状領域B X I−B X
 Nに分割するように水平方向に順次垂直方向の所定幅
W分づつ読出し、夫々の帯状領域BX+”’BXNにつ
いてその長手方向(X方向)と直交する垂直方向(Y方
向)に投影して第7図(b)に示すように、黒画素とな
る論理値“l”の垂直投影データを形成し、次いでステ
ップ@に移行して、この投影データから垂直罫線候補を
抽出する。この垂直罫線候補の抽出は、投影データを予
め設定した閾値で再度2値化し、この2値化データの“
l”が連続する部分を探索し、罫線は通常幅狭であるこ
とから′°1”の連続幅が予め設定した幅以下であると
きに、これを垂直罫線候補として抽出し、その他を文字
候補として抽出する。
次いで、ステップ■に移行して、文字候補中に含まれる
垂直罫線候補を抽出する罫線候補再抽出処理を実行する
。すなわち、第7図(a)に示すように、ある帯状領域
BX、内に水平罫線R□を含む場合には、その投影デー
タは、第7図(b)に示すように、水平罫線RHを表す
論理値“1”分だけ嵩上げされるので、第7図(ロ)で
点線図示の所定の閾値T、で再2値化を行っても、各垂
直罫線R8間で論理値“l”が連続することになり、全
体が文字候補として認識されてしまう、このため、罫線
候補再抽出処理では、論理値“1”が連続する幅区間内
の最大値(罫線を含んでいるときには、その罫線部分が
通常は高いピークとなる)と、その幅区間内の平均値と
で再々2値化を行うことにより、第7図(C)に示すよ
うに、文字候補中に含まれる垂直罫線候補を抽出するこ
とができる。
次いで、ステップ[相]に移行して、各帯状領域BX1
〜BX、について、罫線候補の抽出が完了したか否かを
判定し、罫線候補抽出が完了していない帯状領域がある
ときには、ステップ[相]に移行して次の画像メモリの
続出アドレスを次の帯状領域BX11となるように設定
したから前記ステップ■に戻り、全ての帯状領域B X
 t〜BX、について罫線候補の抽出が完了したときに
は、ステップ[相]に移行して各帯状領域BX、〜BX
、で抽出した垂直罫線候補を垂直方向に連結して垂直罫
線候補列を形成する。この垂直罫線候補列を形成するに
は、隣接する帯状領域間で各罫線候補群から垂直方向(
Y方向)に重なりを持つ垂直罫線候補を抽出して両者を
連結することにより行う。
次いで、ステップ@に移行して、垂直罫線候補列をその
延長方向と直交する方向即ちX方向に投影して投影デー
タをとり、この投影データがあるレベル以上連続してい
るときに罫線として認識し、その投影データから始端及
び終端座標を求めることで垂直罫線を決定してから処理
を終了して第3図の処理に復帰する。
また、水平罫線抽出処理は、第5図に示すように先ずス
テップ■で、画像メモリに格納されている2値化画像情
報から前記垂直罫線候補抽出処理で決定された垂直罫線
Rvを消去した消去2値化画像情報を作成し、これを画
像メモリに格納する。
次いで、ステップ@に移行して、消去2値化画像情報に
ついて、前記垂直罫線候補抽出処理における帯状領域B
X、〜B X sに代えて所定幅Wで垂直方向に分割し
て垂直帯状領域BY、〜BY。
を形成するように、消去2値化画像情報を垂直方向に所
定幅分づつ読出し、その長手方向(Y方向)とは直交す
るX方向に投影して投影データを作威する。
次いで、ステップ0に移行して、投影データに基づいて
前記垂直罫線候補抽出処理と同様の処理を行うことによ
り水平罫線候補を抽出する。
次いで、ステップ[相]に移行して全ての垂直帯状領域
BY、−BY、について水平罫線候補の抽出を完了した
か否かを判定し、抽出が未完了であるときには、ステッ
プ@に移行して次の垂直帯状領域B Y j+ rに対
応する続出アドレスを設定してから前記ステップ@に戻
り、全ての垂直帯状領域BY1〜BY、について水平罫
線候補の抽出が完了したときには、ステップ[相]に移
行する。
このステップ[相]では、隣接する垂直帯状領域の水平
罫線候補を抽出して連結することにより、水平罫線候補
列を作威し、次いでステップOに移行して水平罫線候補
列をX方向に投影することにより、水平罫線を決定する
さらに、仮想罫線抽出処理は、第6図に示すように、先
ずステップ[相]で、第8図に示すように、上記垂直罫
線候補抽出処理及び水平罫線候補抽出処理によって求め
られた垂直罫線Rv及び水平罫線RMの最外罫線に外接
する矩形の最外罫線枠Fの内側を仮想罫線処理領域に設
定し、次いでステップ@に移行して、画像メモリに格納
されている垂直罫線消去2値化画像情報から水平罫L9
. R,を消去して第9図に示すような2値化画像情報
を形成し、次いでステップ0に移行して、2値化画像情
報を前述した水平罫線候補抽出処理と同様に、複数M個
の帯状領域BY、−BY、に分割し、これら帯状領域B
Y、〜BYイの夫々についてX方向の投影データを形成
し、次いでステップ[相]に移行して、投影データから
論理値゛0”を表す領域を仮想罫線候補として抽出する
。この結果、例えば各帯状領域BYi−,,BYえ及び
B Y t −tで第1O図(a)に示すように、空白
部の仮想罫線候補を抽出することができる。
次いで、ステップ[相]に移行して全ての垂直帯状領域
BY、−BY、について仮想罫線候補の抽出が完了した
か否かを判定し、仮想罫線候補の抽出が未完了の垂直帯
状領域があるときには、ステップ[相]に移行して画像
メモリに対する続出アドレスを次の帯状領域BY、、、
に対応するアドレスに更新してからステップ0に戻り、
全ての垂直帯状領域B Y +〜BYwについて仮想罫
線候補の抽出が完了したときには、ステップ■に移行す
る。
このステップ■では、前記ステップ[相]で抽出した仮
想罫線候補は、空白部の全てが候補となるため、候補の
大きさの違いが著しくなり、例えば第10図(a)にお
ける帯状領域BY□では、全てが仮想罫線候補となって
しまうので、この帯状領域BYtの仮想罫線候補と、こ
れに隣接する帯状領域BYえ−、及びBY、。1の仮想
罫線候補CA r及びCAZの数を算出し、両者の仮想
罫線候補数を比較して何れか多い方の仮想罫線候補に合
わせて仮想罫線候補を分割して仮想罫線分割候補CA。
及びCAz’を選定する。
次いで、ステップ[相]に移行して、抽出した仮想罫線
分割候補を含む全ての仮想罫線候補のうち、隣接する帯
状wI域の互いに水平方向連接する仮想罫線候補を探索
して連結し、仮想罫線候補列を形成する。
次いで、ステップ0に移行して、仮想罫線候補列のうち
前述した罫線候補抽出処理で決定した垂直罫線Rv及び
水平罫線R9と重なる仮想罫線候補列を消去し、残りの
仮想罫線候補列について仮想罫線を決定してから第4図
の処理に戻る。この仮想罫線の決定は、仮想罫線候補列
が罫線に比較して幅広であるので、仮想罫線候補列の始
端及び終端における仮想罫線候補の中点を代表点とし、
この代表点の座標を求めることにより、両代表点を結ぶ
線分を仮想罫線として決定する。
なお、仮想罫線を決定するときに、福に第11図(a)
に示すように幅広の仮想罫線候補CA、に対して幅狭の
複数の仮想罫線候補CA + z及びCA13が連接す
る場合があり、この場合には幅広の仮想罫線候補CA 
+ +の中点と幅狭の仮想罫線候補CA2.の中点とを
代表点に選定すると、仮想罫線を誤抽出することになる
ので、幅広の仮想罫線候補と幅狭の仮想罫線候補とが連
結されて仮想罫線候補列が形成される場合には、第11
図(ロ)に示すように、幅狭の仮想罫線候補の何れか一
方の中点を唯一の代表点として選択し、仮想罫線を決定
すると共に、残りの幅狭の仮想罫線候補に対しては幅広
罫線候補に接する境界位置を仮想罫線の終点又は始点座
標として決定する。
このようにして、全ての罫線及び仮想罫線を決定するこ
とにより表形式の認識が終了したら、前記第4図のステ
ップ■に移行して、各罫線で囲まれる欄の文字情報を一
括して光学文字認識装置3に出力する。
したがって、光学文字認識装置3では、表形式文書りの
各欄毎に文字1mを行うことになるので、文字認識率を
向上させることができると共に、裏構造を認識すること
ができるので、表形式文書の行又は列に対しての項目毎
に文字のみ或いは数字のみなどの指定を行うことが可能
となり、文字の選択数を限定することができ、認識率と
認識速度の向上を図ることができる。さらに、光学文字
認識装置3で認識した文字を制御コードに変換してパー
ソナルコンピュータ等で構成される演算処理装置4に入
力することにより、住所録や電話帳などの氏名、住所、
電話番号等のデータベースを作成する場合に、これらの
文書をイメージスキャナーで読込むだけでよく、データ
ベースの作成を容易に行うことができる。
なお、上記実施例においては、画像読取装置としてイメ
ージスキャナー1を適用した場合について説明したが、
これに限定されるものではなく、テレビカメラ、固体撮
像装置等の任意の画像読取装置を適用することができる
また、上記実施例においては、表形式文書の罫線が実線
である場合について説明したが、これに限定されるもの
ではなく、破線、鎖線等の罫線である場合にも投影デー
タのピークが実線の場合に比較して小さくなるだけであ
るので、容易に罫線を認識することができる。
さらに、上記実施例においては、イメージスキャナー1
の読取方向と表形式文書の罫線方向とが一致している場
合について説明したが、これに限らず表形式文書の2値
化画像情報がイメージスキャナー1の読取方向とずれて
いる場合には、垂直罫線Rv、水平罫線RH及び仮想罫
IIRIの始終端座標を決定する場合に、罫線候補列の
罫線候補を抽出する場合の投影方向とは直交する方向の
投影データをとり、これによって始端及び終端座標を求
めると共に、罫線候補列の方程式を求めることにより、
始点及び終点座標を決定することができる。但し、仮想
罫線候補については、前述したように実在する罫線がな
いことにより、代表点となる仮想罫線候補列の始端及び
終端の中点を結ぶ直線の方程式を利用する。
〔発明の効果〕
以上説明したように、請求項(1)に係る表形式文書認
識方式にあっては、表形式文書の表を形成する垂直罫線
及び水平罫線をそれぞれ両者に直交する帯状領域に分割
した2値化画像情報をその長手方向と直交する方向に投
影した投影データに基づいて罫線候補を抽出するように
したので、2値化画像情報の分割数を少なくすることが
でき、表形式文書の認識速度を向上させることができ、
しかも裏構造を認識してこの裏構造の各欄毎に文字認識
を行うので、行又は列に対しての項目毎に文字のみ或い
は数字のみ等の指定を行うことができ、文字認識装置で
の文字の選択数を限定できることで、文学誌m装置の文
字認識率及び認識速度を向上させることができ、さらに
は表形式を認識することができるので、表形式文書から
所定項目毎のデータベースを作成する場合に、表形式文
書を文字読取装置で読取るだけで容易に作成することが
できる効果が得られる。
また、請求項(2)に係る表形式文書認識方式にあって
は、前記請求項(1)の効果に加えて、罫線によって区
分けされておらず、空白部分による仮想罫線によって区
分けされている表形式であっても、罫線があるものとし
て認識することができるので、文字認識装置での文字認
識率及び認識速度をより向上させることができる効果が
得られる。
【図面の簡単な説明】
第1図はこの発明の概略構成を示すブロック図、第2図
は表形式文書を示す説明図、第3図〜第6図は図形分離
部における処理手順の一例を示すフローチャート、第7
図(a)、 (b)及び(C)は夫々この発明の詳細な
説明に供する水平帯状領域、その垂直投影データ及び再
々2値化データを示す説明図、第8図は仮想罫線処理領
域を示す説明図、第9図は消去2値化情報を示す説明図
、第10図(a)及び働)並びに第11図(a)及び(
b)は夫々仮想罫線抽出処理の説明に供する説明図であ
る。 図中、1はイメージスキャナー(文字読取装置)2は図
形分離部、3は光学文字認識装置、4は演算処理装置、
Dは表形式文書、Rvは垂直罫線、RNは水平罫線であ
る。

Claims (2)

    【特許請求の範囲】
  1. (1)文字と罫線とが混在する表形式文書を画像読取装
    置で読取り、該画像読取装置からの画像情報中の罫線を
    切り出し、該罫線によって画成された領域の文字情報を
    文字認識装置に送出するようにした表形式文書認識方式
    であって、前記画像情報を所定幅の帯状領域に分割し、
    各帯状領域をその長手方向と直交する方向に投影した投
    影データを形成する投影データ形成手段と、該投影デー
    タ形成手段で形成した投影データから罫線候補を抽出す
    る罫線候補抽出手段と、該罫線候補抽出手段で抽出した
    罫線候補領域を隣接する帯状領域間で連結して罫線を決
    定する罫線決定手段とを備えたことを特徴とする表形式
    文書認識方式。
  2. (2)前記罫線候補抽出手段は、文字列間に空白領域が
    あるときに、当該空白領域から仮想罫線候補を抽出する
    ように構成されている請求項(1)記載の表形式文書認
    識方式。
JP1282736A 1989-10-30 1989-10-30 表形式文書認識方式 Expired - Lifetime JP2796561B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1282736A JP2796561B2 (ja) 1989-10-30 1989-10-30 表形式文書認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1282736A JP2796561B2 (ja) 1989-10-30 1989-10-30 表形式文書認識方式

Publications (2)

Publication Number Publication Date
JPH03142691A true JPH03142691A (ja) 1991-06-18
JP2796561B2 JP2796561B2 (ja) 1998-09-10

Family

ID=17656380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1282736A Expired - Lifetime JP2796561B2 (ja) 1989-10-30 1989-10-30 表形式文書認識方式

Country Status (1)

Country Link
JP (1) JP2796561B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5668892A (en) * 1992-10-27 1997-09-16 Fuji Xerox Co., Ltd. Table recognition apparatus
JP2003030585A (ja) * 2001-07-12 2003-01-31 Canon Inc 画像処理装置、方法、プログラム及び記憶媒体
CN105426856A (zh) * 2015-11-25 2016-03-23 成都数联铭品科技有限公司 一种图像表格文字识别方法
CN107622233A (zh) * 2017-09-11 2018-01-23 畅捷通信息技术股份有限公司 一种表格识别方法、识别***及计算机装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61269779A (ja) * 1985-05-24 1986-11-29 Agency Of Ind Science & Technol 文書画像解析方式
JPS63101983A (ja) * 1986-10-17 1988-05-06 Fujitsu Ltd 文字列抽出方式
JPH01169686A (ja) * 1987-12-25 1989-07-04 Fujitsu Ltd 文字行検出装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61269779A (ja) * 1985-05-24 1986-11-29 Agency Of Ind Science & Technol 文書画像解析方式
JPS63101983A (ja) * 1986-10-17 1988-05-06 Fujitsu Ltd 文字列抽出方式
JPH01169686A (ja) * 1987-12-25 1989-07-04 Fujitsu Ltd 文字行検出装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5668892A (en) * 1992-10-27 1997-09-16 Fuji Xerox Co., Ltd. Table recognition apparatus
US5708730A (en) * 1992-10-27 1998-01-13 Fuji Xerox Co., Ltd. Table recognition apparatus
JP2003030585A (ja) * 2001-07-12 2003-01-31 Canon Inc 画像処理装置、方法、プログラム及び記憶媒体
CN105426856A (zh) * 2015-11-25 2016-03-23 成都数联铭品科技有限公司 一种图像表格文字识别方法
CN107622233A (zh) * 2017-09-11 2018-01-23 畅捷通信息技术股份有限公司 一种表格识别方法、识别***及计算机装置

Also Published As

Publication number Publication date
JP2796561B2 (ja) 1998-09-10

Similar Documents

Publication Publication Date Title
JP4271878B2 (ja) 映像中の文字検索方法及び装置並びに文字検索処理プログラム
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
JP2926066B2 (ja) 表認識装置
JPH03142691A (ja) 表形式文書認識方式
JPH08320914A (ja) 表認識方法および装置
Nguyen et al. Enhanced character segmentation for format-free Japanese text recognition
JP3904397B2 (ja) 表認識方法
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
CN109409370B (zh) 一种远程桌面字符识别方法和装置
JP2786361B2 (ja) 文書画像の領域抽出方法
JPS62121589A (ja) 文字切出し方法
JP2006106931A (ja) 文字列探索装置、探索方法およびこの方法のプログラム
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2789622B2 (ja) 文字/図形領域判定装置
JPH0697470B2 (ja) 文字列抽出装置
JPH03268181A (ja) 文書読み取り装置
JPH11242716A (ja) 画像処理方法および記録媒体
JP4763113B2 (ja) 高速ラベリング方式
JP2022051198A (ja) Ocr処理装置、ocr処理方法、及びプログラム
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPS6343788B2 (ja)
JP3976804B2 (ja) 画像処理方法
JPH01295383A (ja) 領域抽出方法
JPH03210688A (ja) 行検出装置
JPH0394393A (ja) 文字認識装置