JPH0212390A - 文字列領域抽出装置 - Google Patents

文字列領域抽出装置

Info

Publication number
JPH0212390A
JPH0212390A JP63161680A JP16168088A JPH0212390A JP H0212390 A JPH0212390 A JP H0212390A JP 63161680 A JP63161680 A JP 63161680A JP 16168088 A JP16168088 A JP 16168088A JP H0212390 A JPH0212390 A JP H0212390A
Authority
JP
Japan
Prior art keywords
character
character string
string
area
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63161680A
Other languages
English (en)
Inventor
Kinji Hashimoto
橋本 欽司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP63161680A priority Critical patent/JPH0212390A/ja
Publication of JPH0212390A publication Critical patent/JPH0212390A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分舟 本発明はシンボル又はシンボル間の結合関係を表す線分
である結線と、水平・垂直2方向に書かれた文字列を含
み、シンボル又は結線の近傍に位置し、あらかじめ定め
た範囲である文字列の有効範囲に表記される文字列の種
類がシンボル又は結線毎に限定されているという規則を
有する図面等の画像から、文字列領域を抽出する際の文
字列領域抽出装置に関するものである。
従来の技術 従来、水平拳垂直2方向に書かれた文字列を含む図面等
の画像から文字列領域を抽出する手法としては、 (1)文字列領域を抽出するために優先方向を設け、ま
ずその優先方向で文字列領域を抽出し、その後その残り
の文字からもう一方の方向で文字列領域の抽出を行う方
法 (2)水平・垂直2方向で文字列領域候補を抽出し、水
平中垂直2方向の文字列領域候補に含まれた文字の水平
・垂直2方向の文字認識結果によりその文字が含まれる
文字列領域を決定する方法などがある。第3図は第1の
従来例における処理のブロック図を示し、第4図はその
流れを説明したパターン図である。ここでは、文字列領
域を抽出するための優先方向が水平の場合のみ示してい
るが、優先方向が垂直の場合も同様である。第5図は第
2の従来例における処理のブロック図を示し、第6図は
その流れを説明したパターン図である。第6図において
、文字”C”と文字″F”は水平・垂直2方向の文字列
領域に一旦含まれるが、その文字の水平・垂直2方向の
文字認識の結果により確信度の高い方向の文字列領域の
文字として決定される。
発明が解決しようとする課題 しかしながら上記第1の従来例では水平・垂直2方向の
文字列が近接して書かれた場合、文字列領域の抽出が正
しくできないという課題がある。
又上記第2の従来例では水平・工直2方向の文字列領域
に含まれる文字の水平−垂直2方向の候補文字の確信度
に差が見られない場合などで文字列領域の抽出誤りが生
じると言う問題を有していた。
本発明は上記問題点に鑑み、各シンボル又は各結線につ
いて文字列の有効範囲及び表記可能な文字列の種類に関
する情報を利用し、水平・垂直2方向の文字列が近接し
て書かれた場合でも文字列領域が正しく抽出できる文字
列領域抽出装置を提供するものである。
課題を解決するための手段 上記課題を解決するために、本発明の文字列領域抽出装
置は、文字列領域候補抽出手段と、文字認識手段と、文
字接続関係抽出手段と、文字情報記憶部と、文字列情報
記憶部と、文字列領域抽出手段という構成を備えたもの
である。
作   用 本発明は上記した構成によって、各シンボル又は各結線
について文字列の有効範囲及び表記可能な文字列の種類
に関する情報を利用し、水平方向、垂直方向あるいは垂
直方向、水平方向の順に交互に文字列領域を決定してい
くことにより、2つの文字列領域に重複して含まれた文
字を確実に1つの文字列領域の文字に決定することが可
能なこととなる。
実施例 以下本発明の一実施例の文字列領域抽出装置について図
面を参照しながら説明する。第1図は本発明の一実施例
における文字列領域抽出装置の処理のブロック図を示し
ている。第1図において、1はシンボル又はシンボル間
の結合関係を表す線分である結線と、水平・垂直2方向
に書かれた文字列を含み、シンボル又は結線の近傍に位
置し、あらかじめ定めた範囲である文字列の有効範囲に
表記される文字列の種類がシンボル又は結線毎に限定さ
れているという規則を宵する図面等の画像から、水平・
垂直各方向について、領域があるしきい値内で隣接する
文字の並びを抽出する文字列領域候補抽出手段、2は抽
出された文字列領域候補内の文字を認識する文字認識手
段、3は文字間の接続関係を抽出する文字接続関係抽出
手段、4は文字認識の結果及び文字間の接続関係を格納
する文字情報記憶部、5は各シンボル又は各結線の種類
と位置情報を利用し、文字列の有効範囲及び表記可能な
文字列の種類を抽出する文字列情報抽出手段、6は文字
列情報を格納する文字列情報記憶部、7は文字情報及び
文字列清報を用い、水平方向、垂直方向あるいは垂直方
向、水平方向の順に交互に文字列領域を決定していく文
字列領域抽出手段である。なお、ここで実線は制御の流
れ、第破線はデータの流れをそれぞれ示す。2図は本発
明の一実施例における文字列領域抽出の流れを説明した
パターン図である。第2図において、R1゜R2、R3
はシンボル、SCI、  SC2、SC3は文字列領域
候補、C1から09は文字列を構成する文字領域、A1
、A2、A3はそれぞれR1,R2、R3に関する文字
列の有効範囲、Sl、  S2、S3は抽出された文字
列領域である。以下第1図、第2図を用いてその動作を
説明する。まず、文字列領域候補抽出手段1においては
、水平方向について領域が隣接する文字の並びを抽出す
る事により文字列領域候補sciとSC2を抽出し、そ
の後垂直方向について同じ手法により文字列領域候補S
C3を抽出する。次に、文字認識手段2においては、文
字列領域候補内の文字を文字列領域候補の方向で認識し
、その認識結果を文字情報記憶部4に格納する。文字接
続関係抽出手段3においては、認識した文字の位置情報
を用い文字間の接続関係を抽出し、その情報を文字情報
記憶部4に格納する。ここで、文字列領域候補SCIは
文字領域CI、C2、C3、C4を、文字列領域候補S
C2は文字領域C5、C6,07を、 文字列領域候補
SC3は文字領域CI、 CB、09、C4を含む。さ
らに、文字列情報抽出手段5においては、各シンボル又
は各結線と位置情報を利用し、文字列の有効範囲及び表
記可能な文字列の種類を抽出する。ここで、文字列の有
効範囲AI、A2、A3と表記可能な文字列の種類”数
字列千単位″が抽出される。この文字列情報を文字列情
報記憶部6に格納する。最後に、文字列領域抽出手段7
においては、文字情報及び文字列情報を用い文字列領域
を抽出する。第一回目の水平方向についての文字列領域
の抽出では、対象となる文字列領域候補きしてSCIと
SC2がある。SCIはR3に関する文字列の有効範囲
A3に表記されているが、文字列の先頭文字CIの認識
結果が数字とならないため表記可能な文字列の種類に当
てはまらず文字列領域として抽出されない。一方、SC
2は、R1に関する文字列の有効領域AIに表記されて
おり、又表記可能な文字列の種類も″数字列(10)+
単位(Ω)“である。そこで、文字領域C5、CB、C
7を含む文字列領域Slが抽出される。
なお、文字列領域候補SC3に含まれていた文字領域C
5は省かれ、SC3は文字領域CI、  CB、CBよ
り構成される事になる。第一回目の垂直方向についての
文字列領域の抽出では、対象となる文字列領域候補とし
てSC3がある。SC3は、R2に関する文字列の存効
領域人2に表記されており、又表記可能な文字列の種類
も”数字列(20)千単位(Ω)”である。
そこで、文字領域C11C8、C9を含む文字列領域S
2が抽出される。なお、文字列領域候補SC1に含まれ
ていた文字領域C1は省かれ、SCIは文字領域C2、
C3、C4より構成される事になる。第二回目の水平方
向についての文字列領域の抽出では、対象となる文字列
領域候補としてSolがある。SCIは、R3に関する
文字列のを動領域A3に表記されており、又表記可能な
文字列の種類もパ数字列(30)千単位(Ω)”である
。そこで、文字領域02.03、C4を含む文字列領域
S3が抽出される。上記の手法により、文字列領域Sl
、S2、S3が抽出される。
発明の効果 以上のように本発明は、 文字列領域候補抽出手段と、
文字認識手段と、文字接続関係抽出手段と、文字情報記
憶部と、文字列情報記憶部と、文字列領域決定抽出を設
ける事により、シンボル又はシンボル間の結合関係を示
す線分である結線と、水平拳垂i’i!2方向に書かれ
た文字列を含み、シンボル又は結線の近傍に位置し、あ
らかじめ定めた節回である文字列の有効範囲に表記され
る文字列の種類がシンボル又は結線毎に限定されている
という規則を有する図面等の画像から、各シンボル又は
各結線に関する文字列の有効範囲と表記可能な文字列の
種類についての情報を用い、水平e垂直2方向の文字列
が近接して書かれた場合でも文字列領域を正しく抽出す
ることができる。
【図面の簡単な説明】
第1図は本発明の一実施例における文字列領域抽出装置
の全体構成を示すブロック図、第2図は本発明の一実施
例における文字列領域抽出の流れを説明したパターン図
、第3図は第1の従来例における処理のブロック図、第
4図は第1の従来例の流れを説明したパターン図、第5
図は第2の従来例における処理のブロック図、第6図は
第2の従来例の流れを説明したパターン図である。 1・・・文字列領域候補抽出手段、2・・・文字認識手
段、3・・・文字接続関係抽出手段、4・・・文字情報
記憶部、5・・・文字列情報抽出手段、6・・・文字列
情報記憶部、7・・・文字列領域抽出手段。 第 図 第 図 第 図

Claims (1)

    【特許請求の範囲】
  1. シンボル又は前記シンボル間の結合関係を表す線分であ
    る結線と、水平・垂直2方向に書かれた文字列を含み、
    前記シンボル又は前記結線の近傍に位置し、あらかじめ
    定めた範囲である文字列の有効範囲に表記される文字列
    の種類が前記シンボル又は前記結線毎に限定されている
    という規則を有する図面等の画像から、水平・垂直各方
    向について、領域が隣接する文字の並びを抽出する文字
    列領域候補抽出手段と、抽出された前記文字列領域候補
    内の文字を認識する文字認識手段と、文字間の接続関係
    を抽出する文字接続関係抽出手段と、前記文字認識の結
    果及び前記文字間の接続関係を格納する文字情報記憶部
    と、各前記シンボル又は各前記結線について前記文字列
    の有効範囲及び表記可能な文字列の種類が格納されてい
    る文字列情報記憶部と、前記文字情報及び前記文字列情
    報を用い、水平方向、垂直方向あるいは垂直方向、水平
    方向の順に交互に文字列領域を決定していく文字列領域
    抽出手段を備え、水平・垂直2方向での前記文字列領域
    候補に重複して含まれた文字を一つの文字列領域に決定
    できる事を特徴とする文字列領域抽出装置。
JP63161680A 1988-06-29 1988-06-29 文字列領域抽出装置 Pending JPH0212390A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63161680A JPH0212390A (ja) 1988-06-29 1988-06-29 文字列領域抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63161680A JPH0212390A (ja) 1988-06-29 1988-06-29 文字列領域抽出装置

Publications (1)

Publication Number Publication Date
JPH0212390A true JPH0212390A (ja) 1990-01-17

Family

ID=15739802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63161680A Pending JPH0212390A (ja) 1988-06-29 1988-06-29 文字列領域抽出装置

Country Status (1)

Country Link
JP (1) JPH0212390A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2358195A (en) * 2000-01-13 2001-07-18 Atofina Electrolytic synthesis of tetramethylammonium hydroxide

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS593593A (ja) * 1982-06-30 1984-01-10 Fujitsu Ltd 文字デ−タ分離方式
JPS62134767A (ja) * 1985-12-06 1987-06-17 Fujitsu Ltd 記号名・線分名の自動抽出装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS593593A (ja) * 1982-06-30 1984-01-10 Fujitsu Ltd 文字デ−タ分離方式
JPS62134767A (ja) * 1985-12-06 1987-06-17 Fujitsu Ltd 記号名・線分名の自動抽出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2358195A (en) * 2000-01-13 2001-07-18 Atofina Electrolytic synthesis of tetramethylammonium hydroxide

Similar Documents

Publication Publication Date Title
JPS63182793A (ja) 文字切り出し方式
JPH0212390A (ja) 文字列領域抽出装置
JPH0520794B2 (ja)
JPH1063744A (ja) 文書のレイアウト解析方法及びシステム
JPH0247788B2 (ja)
JP2618018B2 (ja) 文字認識装置
Hwang et al. Segmentation of a text printed in Korean and English using structure information and character recognizers
JP2856409B2 (ja) 文字認識装置および方法
JPH11203405A (ja) 文字認識装置及び方法並びにプログラム記憶媒体
JPH0586585B2 (ja)
JP2976445B2 (ja) 文字認識装置
JPH0217575A (ja) 図面自動認識方式
JP3151866B2 (ja) 英文字認識方法
JPH04199274A (ja) ファイリングシステム
JPS6389990A (ja) 文字読取装置
JPS61131091A (ja) 文字読取装置
JP2004280530A (ja) 帳票処理システム及び帳票処理方法
JPH04115384A (ja) 単語チェック機能を持つ日本語ocr
JPH0353392A (ja) 文字認識装置
JPH03116392A (ja) パターン認識後処理方式
JP2870640B2 (ja) 図形認識方法
JPH06203201A (ja) 光学的手書き文字列認識方法および装置
JP2002189984A (ja) 文書読取装置
JPS61163477A (ja) 文字認識装置
JPH03122786A (ja) 光学的文字読取装置