JPH10334188A - 書体識別装置および書体識別方法および情報記憶媒体 - Google Patents

書体識別装置および書体識別方法および情報記憶媒体

Info

Publication number
JPH10334188A
JPH10334188A JP9154545A JP15454597A JPH10334188A JP H10334188 A JPH10334188 A JP H10334188A JP 9154545 A JP9154545 A JP 9154545A JP 15454597 A JP15454597 A JP 15454597A JP H10334188 A JPH10334188 A JP H10334188A
Authority
JP
Japan
Prior art keywords
character
stroke
image
typeface
leading end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9154545A
Other languages
English (en)
Inventor
Tei Abe
悌 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP9154545A priority Critical patent/JPH10334188A/ja
Publication of JPH10334188A publication Critical patent/JPH10334188A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 斜めのストロークを含む文字画像や、ノイ
ズ,つぶれ,かすれのある文字画像や、種々の書体(フ
ォント)の文字画像に対しても、その文字の書体を容易
にかつ正確に識別することの可能な書体識別装置を提供
する。 【解決手段】 書体識別部4は、文字画像において文字
のストロークの先端部分の画像を抽出するストローク先
端部分抽出手段8と、ストローク先端部分抽出手段8で
抽出された文字のストローク先端部分の画像を予め用意
された書体別のストローク先端形状モデルと比較して文
字の書体を識別する識別手段9とを有している。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字の書体(フォ
ント)の識別を行なう書体識別装置および書体識別方法
および情報記憶媒体に関する。
【0002】
【従来の技術】従来、例えば特開平6−208649号
には、文字の縦方向および横方向の文字線幅を推定し、
これらの線幅の比によって、文字の書体が明朝体である
かゴシック体であるかを識別する書体識別技術が示され
ている。この書体識別技術は、より具体的には、文字画
像の水平方向および垂直方向のランレングスヒストグラ
ムのモード(最頻値)によって、横方向および縦方向の文
字線幅を推定し、これらの線幅の比によって、文字の書
体が明朝体であるかゴシック体であるかを識別するよう
になっている。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た従来の書体識別技術では、「中」や「田」等のように
文字を構成するストロークの多くが水平または垂直な直
線で、かつ画像にノイズがない場合にしか、書体を良好
に識別することができないという問題があった。すなわ
ち、ほとんどの文字のフォントは、斜めのストロークが
存在し、文字に斜めのストロークが存在する場合、上述
した従来の書体識別技術では、ランレングスヒストグラ
ムのピーク(最頻値)が誤ったところに出てしまい、正し
い線幅を検出できないので、大半の文字の書体を正確に
識別することができず、実用化には適しないという問題
があった。
【0004】本発明は、斜めのストロークを含む文字画
像や、ノイズ,つぶれ,かすれのある文字画像や、種々
の書体(フォント)の文字画像に対しても、その文字の書
体を容易にかつ正確に識別することの可能な書体識別装
置および書体識別方法および情報記憶媒体を提供するこ
とを目的としている。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、請求項1乃至請求項5記載の発明では、文字画像に
おいて文字のストロークの先端部分の画像を抽出し、抽
出した文字のストローク先端部分の画像を予め用意され
た書体別のストローク先端形状モデルと比較して文字の
書体を識別することを特徴としている。これにより、文
字画像の文字の書体(フォント)を精度良く識別すること
が可能となる。
【0006】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は本発明に係る書体識別装置の
構成例を示す図である。図1を参照すると、この書体識
別装置は、文書を例えば2値画像(黒,白の画素画像)と
して読み込む画像入力部1と、画像入力部1で読み込ま
れた文書画像等を記憶するメモリ2と、文書画像から文
字画像を抽出する文字切り出し処理部3と、文字切り出
し処理部3により切り出された文字画像に対し、その文
字の書体(フォント)の識別を行なう書体識別部4と、全
体の制御を行なう制御部5と、書体識別部4による文字
の書体の識別結果を出力する結果出力部6とを有してい
る。
【0007】ここで、文字切り出し処理部3は、文書画
像から例えば図2に示すように1つの文字画像を切り出
すようになっている。すなわち、図2の例では、1つの
文字画像(図2の例では、文字「K」)は、文字の外接矩
形領域ARとして切り出される。
【0008】また、書体識別部4は、文字画像において
文字のストロークの先端部分の画像を抽出するストロー
ク先端部分抽出手段8と、ストローク先端部分抽出手段
8で抽出された文字のストローク先端部分の画像を予め
用意された書体別のストローク先端形状モデルと比較し
て文字の書体を識別する識別手段9とを有している。
【0009】また、図3は図1の書体識別部4のストロ
ーク先端部分抽出手段8の第1の構成例を示す図であ
る。図3の例では、ストローク先端部分抽出手段8は、
文字画像の細線化を行なう細線化部11と、細線化画像
から端点を抽出する端点抽出部12と、端点抽出部12
で抽出された端点位置を中心として半径rの円の範囲内
の文字画像をストローク先端部分として抽出するストロ
ーク先端部分抽出部13とを有している。
【0010】ここで、端点抽出部12およびストローク
先端部分抽出部13は、第1の抽出例として、文字を構
成する全てのストロークの端点および先端部分を抽出す
ることができる。
【0011】あるいは、端点抽出部12およびストロー
ク先端部分抽出部13は、第2の抽出例として、文字を
構成する各ストロークのうち、特定の(例えば所定の傾
きをもつ1つの)ストロークの端点および先端部分のみ
を抽出することもできる。
【0012】次に、図1の構成の書体識別装置の処理動
作を図4,図5のフローチャートを用いて説明する。な
お、図4は全体の処理動作を説明するためのフローチャ
ート、図5は書体識別部4のストローク先端部分抽出手
段8が図4のようになっている場合の書体(フォント)を
判定する処理(図4の処理動作において書体(フォント)
を判定する処理)の一例を示すフローチャートである。
【0013】図4を参照すると、先ず、ステップS10
1では、画像入力部1により、書体識別対象である文字
が記載された文書(例えば原稿)を読込み、これを文書画
像としてメモリ2内に取り込む。次いで、ステップS1
02では、文字切り出し部3によって文書画像から文字
画像のみを切り出し、その外接矩形領域の座標を求める
文字矩形切り出し処理を行なう。このようにして、文字
画像に含まれる各文字画像に対して切り出しを行ない、
切り出した各文字画像に対して順番に番号付けをする。
次いで、ステップS103では、各文字画像をサーチす
るための番号(文字カウンタ)iを“1”に初期設定す
る。
【0014】しかる後、ステップS104では、i番目
の文字の書体(フォント)の判定を行なう。
【0015】ステップS104における書体(フォント)
の判定処理は、例えば図5のようにしてなされる。な
お、図5の処理例は、前述した第1の抽出例に従い、文
字を構成する全てのストロークの先端部分を抽出するも
のである。図5を参照すると、先ず、ステップS201
では、文字画像を細線化し、次いで、ステップS202
では、ステップS201で細線化した文字画像(骨格画
像)から端点を抽出し、全ての端点をメモリ2に記憶す
る。この際、抽出した各端点に順番に番号付けをして記
憶する。次いで、ステップS203では、端点をサーチ
するための番号jを“1”に初期設定する。
【0016】次いで、ステップS204では、j番目の
端点を中心として半径rの円の範囲にある黒画素をスト
ロークの先端部分として求める。
【0017】しかる後、ステップS205では、番号j
を“1”だけインクリメントし、ステップS206で
は、j番目の端点が存在するか否かを判定し、存在すれ
ば、ステップS204へ戻り、次の端点について、上述
したと同様の処理(文字の中の1つのストロークの先端
部分を抽出する処理)を行なう。
【0018】このようにして、ステップS202でメモ
リ2に記憶された全ての端点に対応する各ストローク先
端部分を順次に求め、ステップS206でj番目の端点
が存在しなくなったとき(全ての端点の処理を完了した
とき)、ステップS207では、この1つの文字画像内
において抽出した各ストローク先端部分を予め用意した
全フォントの先端形状と比較して、i番目の文字の書体
(フォント)を識別する。例えば、i番目の文字の書体
が、例えば、明朝体であるか、丸ゴシック体であるか、
角ゴシック体であるかを判定する。
【0019】図4のステップS104において、i番目
の文字の書体(フォント)を、例えば図5のステップS2
01乃至S207のようにして判定した後、図4のステ
ップS105では、番号iを“1”だけインクリメント
し、次いで、ステップS106では、i番目の文字が存
在するか否かを判定し、存在すれば、ステップS104
へ戻り、次の文字について、上述したと同様の処理(こ
の文字の書体(フォント)を判定する処理)を行なう。
【0020】このようにして、ステップS101で入力
された文書画像に含まれる各文字画像について、書体
(フォント)を判定する処理を順次に行ない、ステップS
106でi番目の文字が存在しなくなったとき(全ての
文字画像について書体を判定する処理を完了したと
き)、全ての処理を終了する。
【0021】なお、図5の例では、第1の抽出例に従っ
て、全てのストロークの先端部分を用いて書体(フォン
ト)を判定したが、文字を構成する各ストロークのうち
予め定めた特定の方向のストロークの先端部分だけを用
いて、書体(フォント)を判定することも可能である。
【0022】図6(a),(b),(c)は書体(フォント)が
それぞれ明朝体,丸ゴシック体,角ゴシック体である場
合のある文字のストロークの先端部分を示す図である。
なお、図6(a),(b),(c)において、円は細線化画像
の端点を中心として抽出される範囲である。図6(a),
(b),(c)からわかるように、書体(フォント)がそれぞ
れ明朝体,丸ゴシック体,角ゴシック体である場合で、
ストロークの先端部分の形状はそれぞれ互いに相違して
おり、従って、ストロークの先端部分の形状の相違に基
づいて、書体(フォント)を識別することができる。
【0023】また、図7は図1の書体識別部4のストロ
ーク先端部分抽出手段8の第2の構成例を示す図であ
る。図7の例では、ストローク先端部分抽出手段8は、
文字画像の輪郭追跡を行なう輪郭追跡部21と、輪郭の
曲率を算出する曲率算出部22と、曲率算出部22で算
出された曲率に基づいてストローク先端部分を抽出する
ストローク先端部分抽出部23とを有している。
【0024】ここで、ストローク先端部分抽出部23
は、第1の抽出例として、文字を構成する全てのストロ
ークの先端部分を抽出することができる。
【0025】あるいは、ストローク先端部分抽出部23
は、第2の抽出例として、文字を構成する各ストローク
のうち、特定の(例えば1つの)ストロークの先端部分の
みを抽出することもできる。
【0026】なお、曲率算出部22における曲率の算出
は、例えば次のようになされる。すなわち、文字画像の
輪郭線の曲率Rは、文字画像の輪郭線をy=f(x)とす
るとき、次式で与えられる。
【0027】
【数1】 R=[(d2y/dx2)/{1+(dy/dx)2}3/2
【0028】この式を離散的な形の折線に近似して曲率
を算出するため、平均化の概念を導入することができ
る。すなわち、図8に示すように、曲率を求めようとす
る輪郭線の点(x0,y0)について、その左右にそれぞれ
k個の点をとり、これらから、次式(数2)のような値d
-,d+,d±などを計算する。
【0029】
【数2】
【0030】あるいは、さらに簡単に、次式によって求
めることもできる。
【0031】
【数3】d-=(y0−y-k)/(x0−x-k) d+=(yk−y0)/(xk−x0) d±=(yk/2−y-k/2)/(xk/2−x-k/2)
【0032】そして、このようにして求めた値d-
+,d±から、次式のように、(d2y/dx2),(dy
/dx)を求める。
【0033】
【数4】(d2y/dx2)=d+−d- (dy/dx)=d±
【0034】そして、数4で求めた(d2y/dx2),
(dy/dx)を数1に代入して、点(x0,y0)について
の曲率Rを求めることができる。
【0035】このようにして、文字画像の輪郭を追跡
し、輪郭の各点について曲率が算出されるとき、ストロ
ーク先端部分抽出部23は、例えば、曲率の変化の大き
い輪郭点の近傍の画素(より具体的に、例えば、この輪
郭点の前後の輪郭画素)をストローク先端部分として抽
出することができる。
【0036】図9は、図1の構成の書体識別装置におい
て、書体識別部4のストローク先端部分抽出手段8が図
7のようになっている場合の書体(フォント)を判定する
処理(図4の処理動作において書体(フォント)を判定す
る処理)の一例を示すフローチャートである。
【0037】すなわち、書体識別部4のストローク先端
部分抽出手段8が図7のようになっている場合には、図
4のステップS104における書体(フォント)の判定処
理は、例えば図9のようにしてなされる。なお、図9の
処理例は、前述した第1の抽出例に従い、文字を構成す
る全てのストロークの先端部分を抽出するものである。
図9を参照すると、先ず、ステップS301では、i番
目の文字画像の輪郭を追跡し、ステップS302では、
文字画像の各輪郭の曲率を計算し、ステップS303で
は、曲率の変化の大きい輪郭点を抽出し、抽出した全て
の輪郭点(曲率の変化の大きい輪郭点)をメモリ2に記憶
する。この際、抽出した各輪郭点に順番に番号付けをし
て記憶する。次いで、ステップS304では、各輪郭点
をサーチするための番号jを“1”に初期設定する。
【0038】しかる後、ステップS305では、j番目
の輪郭点の前後の輪郭画素を抽出し、これをストローク
の先端部分として求める。
【0039】しかる後、ステップS306では、番号j
を“1”だけインクリメントし、ステップS307で
は、j番目の輪郭点が存在するか否かを判定し、存在す
れば、ステップS305へ戻り、次の輪郭点について、
上述したと同様の処理(文字の中の1つのストロークの
先端部分を抽出する処理)を行なう。
【0040】このようにして、ステップS303でメモ
リ2に記憶された全ての輪郭点に対応する各ストローク
先端部分を順次に求め、ステップS307でj番目の輪
郭点が存在しなくなったとき(全ての輪郭点の処理を完
了したとき)、ステップS308では、この1つの文字
画像内において抽出した各ストローク先端部分を予め用
意した全フォントの先端形状と比較して、i番目の文字
の書体(フォント)を識別する。例えば、i番目の文字の
書体が、例えば、明朝体であるか、丸ゴシック体である
か、角ゴシック体であるかを判定する。
【0041】図7の構成例では、図4のステップS10
4において、i番目の文字の書体(フォント)を、例えば
図9のステップS301乃至S308のようにして判定
した後、図4のステップS105では、番号iを“1”
だけインクリメントし、次いで、ステップS106で
は、i番目の文字が存在するか否かを判定し、存在すれ
ば、ステップS104へ戻り、次の文字について、上述
したと同様の処理(この文字の書体(フォント)を判定す
る処理)を行なう。
【0042】このようにして、ステップS101で入力
された文書画像に含まれる各文字画像について、書体
(フォント)を判定する処理を順次に行ない、ステップS
106でi番目の文字が存在しなくなったとき(全ての
文字画像について書体を判定する処理を完了したと
き)、全ての処理を終了する。
【0043】なお、図9の例では、第1の抽出例に従っ
て、全てのストロークの先端部分を用いて書体(フォン
ト)を判定したが、文字を構成する各ストロークのうち
予め定めた特定の方向のストロークの先端部分だけを用
いて、書体(フォント)を判定することも可能である。
【0044】図10(a),(b),(c)は書体(フォント)
がそれぞれ明朝体,丸ゴシック体,角ゴシック体である
場合のある文字のストロークの先端部分を示す図であ
る。なお、図10(a),(b),(c)からわかるように、
書体(フォント)がそれぞれ明朝体,丸ゴシック体,角ゴ
シック体である場合で、ストロークの先端部分の形状
(曲率の変化の大きい輪郭点の前後の輪郭画素により構
成される形状)はそれぞれ互いに相違しており、従っ
て、ストロークの先端部分の形状の相違に基づいて、書
体(フォント)を識別することができる。
【0045】このように、本発明では、文字画像におい
て文字のストロークの先端部分の画像を抽出し、抽出し
た文字のストローク先端部分の画像を予め用意された書
体別のストローク先端形状モデルと比較して文字の書体
を識別するので、文字の書体(フォント)を小さなプログ
ラムサイズで容易にかつ正確に精度良く識別することが
できる。
【0046】すなわち、文字のストロークの先端の形状
を特徴量として用いるので、非常に精度が高く、効率良
く、書体(フォント)の識別ができる。例えば、書体(フ
ォント)の特徴はストロークの先端の形状に顕著に表さ
れるので、例えばゴシック体と丸ゴシック体のように従
来の方法では識別が不可能なフォントでも識別できる。
【0047】また、本発明では、各種のフォントの各種
の文字のストロークの先端形状モデルを予め登録するこ
とによって、各種の文字について、各種のフォントの識
別が可能になる。すなわち、識別の対象としたい全ての
書体(フォント)のストロークの先端部分の形状モデルを
予め用意し、それとの形状の一致度(相違度)を計測する
ことによって対象文字の書体(フォント)を識別できる。
【0048】また、図3の例では、ストロークの先端部
分を抽出するのにまず文字画像を細線化して、その端点
を検出し、検出した端点を中心として予め決定した半径
rの範囲の画像をストロークの先端部分として抽出する
ことによって、ストロークの先端部分を安定して抽出で
きる。
【0049】また、図7の例では、ストロークの先端部
分を抽出するのにまず文字画像の輪郭を追跡し、輪郭の
曲率が大きく変わる部分をストロークの先端部分とみな
し、その部分の画像をストロークの先端部分として抽出
することによって、ストロークの先端部分を安定して抽
出できる。
【0050】なお、上述の例では、書体として、明朝
体,丸ゴシック体,角ゴシック体のいずれかを識別する
場合が示されているが、本発明は、書体として、明朝
体,丸ゴシック体,角ゴシック体の他のフォントを識別
することももちろん可能であり、また、書体として、明
朝体,丸ゴシック体,角ゴシック体に加えてさらに他の
フォントを識別することも可能である。
【0051】このように、本発明では、文字画像の文字
の書体(フォント)を精度良く識別することが可能とな
り、このようにして得られた文字の書体(フォント)の識
別結果に基づいて、例えば文書画像を再現したりするの
に有用である。
【0052】図11は図1の書体識別装置のハードウェ
ア構成例を示す図である。図11を参照すると、この書
体識別装置は、例えばパーソナルコンピュータ等で実現
され、全体を制御するCPU31と、CPU31の制御
プログラム等が記憶されているROM32と、CPU3
1のワークエリア等として使用されるRAM33と、文
書を文書画像として読込むスキャナ34と、スキャナ3
4で読込まれた文書画像が例えばページ単位で記憶され
る文書画像ファイル35と、文書画像に含まれている各
文字画像に対し書体識別を行なった結果の情報を出力す
る結果出力装置(例えば、ディスプレイやプリンタ)36
とを有している。
【0053】ここで、スキャナ34,文書画像ファイル
35,結果出力装置36は、図1の画像入力部1,メモ
リ2,結果出力部6にそれぞれ対応している。また、C
PU31は、図1の制御部5,文字切り出し処理部3,
書体識別部4の機能を有している。
【0054】なお、CPU31におけるこのような制御
部5,文字切り出し処理部3,書体識別部4等としての
機能は、例えばソフトウェアパッケージ(具体的には、
CD−ROM等の情報記憶媒体)の形で提供することが
でき、このため、図11の例では、情報記憶媒体40が
セットさせるとき、これを駆動する媒体駆動装置41が
設けられている。
【0055】換言すれば、本発明の書体識別装置は、イ
メージスキャナ,ディスプレイ等を備えた汎用の計算機
システムにCD−ROM等の情報記憶媒体に記録された
プログラムコードを読み込ませて、この汎用計算機シス
テムのマイクロプロセッサに書体識別処理を実行させる
装置構成においても実施することが可能である。この場
合、本発明の書体識別処理プログラムなどを格納する情
報記憶媒体としては、CD−ROMに限られるものでは
なく、ROM,RAM,FD等が用いられても良い。
【0056】
【発明の効果】以上に説明したように、請求項1,請求
項4,請求項5記載の発明によれば、文字画像において
文字のストロークの先端部分の画像を抽出し、抽出した
文字のストローク先端部分の画像を予め用意された書体
別のストローク先端形状モデルと比較して文字の書体を
識別するので、文字画像の文字の書体(フォント)を容易
にかつ正確に精度良く識別することができる。
【0057】また、請求項2記載の発明では、ストロー
クの先端部分を抽出するのにまず文字画像を細線化し
て、その端点を検出し、検出した端点を中心として予め
決定した半径rの範囲の画像をストロークの先端部分と
して抽出することによって、ストロークの先端部分を安
定して抽出できる。
【0058】また、請求項3記載の発明では、ストロー
クの先端部分を抽出するのにまず文字画像の輪郭を追跡
し、輪郭の曲率が大きく変わる部分をストロークの先端
部分とみなし、その部分の画像をストロークの先端部分
として抽出することによって、ストロークの先端部分を
安定して抽出できる。
【図面の簡単な説明】
【図1】本発明に係る書体識別装置の構成例を示す図で
ある。
【図2】1つの文字画像の一例を示す図である。
【図3】図1の書体識別部のストローク先端部分抽出手
段の一構成例を示す図である。
【図4】図1の書体識別装置の処理動作を説明するため
のフローチャートである。
【図5】図1の構成の書体識別装置において、書体識別
部4のストローク先端部分抽出手段が図3のようになっ
ている場合の書体(フォント)を判定する処理(図4の処
理動作において書体(フォント)を判定する処理)の一例
を示すフローチャートである。
【図6】書体(フォント)がそれぞれ明朝体,丸ゴシック
体,角ゴシック体である場合のある文字のストロークの
先端部分を示す図である。
【図7】図1の書体識別部のストローク先端部分抽出手
段の他の構成例を示す図である。
【図8】曲率の算出例を説明するための図である。
【図9】図1の構成の書体識別装置において、書体識別
部4のストローク先端部分抽出手段が図7のようになっ
ている場合の書体(フォント)を判定する処理(図4の処
理動作において書体(フォント)を判定する処理)の一例
を示すフローチャートである。
【図10】書体(フォント)がそれぞれ明朝体,丸ゴシッ
ク体,角ゴシック体である場合のある文字のストローク
の先端部分を示す図である。
【図11】図1の書体識別装置のハードウェア構成例を
示す図である。
【符号の説明】
1 画像入力部 2 メモリ 3 文字切り出し処理部 4 書体識別部 5 制御部 6 結果出力部 8 ストローク先端部分抽出手段 9 識別手段 11 細線化部 12 端点抽出部 13,23 ストローク先端部分抽出部 21 輪郭追跡部 22 曲率算出部 31 CPU 32 ROM 33 RAM 34 スキャナ 35 文書画像ファイル 36 結果出力装置 40 情報記憶媒体 41 媒体駆動装置

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字画像において文字のストロークの先
    端部分の画像を抽出するストローク先端部分抽出手段
    と、ストローク先端部分抽出手段で抽出された文字のス
    トローク先端部分の画像を予め用意された書体別のスト
    ローク先端形状モデルと比較して文字の書体を識別する
    識別手段とを有していることを特徴とする書体識別装
    置。
  2. 【請求項2】 請求項1記載の書体識別装置において、
    前記ストローク先端部分抽出手段は、文字画像を細線化
    し、細線化画像から端点を抽出し、抽出した端点位置に
    基づき、文字画像からストロークの先端部分の画像を抽
    出することを特徴とする書体識別装置。
  3. 【請求項3】 請求項1記載の書体識別装置において、
    前記ストローク先端部分抽出手段は、文字画像の輪郭を
    追跡し、その曲率に基づき、文字画像からストロークの
    先端部分の画像を抽出することを特徴とする書体識別装
    置。
  4. 【請求項4】 文字画像において文字のストロークの先
    端部分の画像を抽出し、抽出した文字のストローク先端
    部分の画像を予め用意された書体別のストローク先端形
    状モデルと比較して文字の書体を識別することを特徴と
    する書体識別方法。
  5. 【請求項5】 文字画像において文字のストロークの先
    端部分の画像を抽出し、抽出した文字のストローク先端
    部分の画像を予め用意された書体別のストローク先端形
    状モデルと比較して文字の書体を識別するためのプログ
    ラムが記憶されていることを特徴とする情報記憶媒体。
JP9154545A 1997-05-28 1997-05-28 書体識別装置および書体識別方法および情報記憶媒体 Pending JPH10334188A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9154545A JPH10334188A (ja) 1997-05-28 1997-05-28 書体識別装置および書体識別方法および情報記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9154545A JPH10334188A (ja) 1997-05-28 1997-05-28 書体識別装置および書体識別方法および情報記憶媒体

Publications (1)

Publication Number Publication Date
JPH10334188A true JPH10334188A (ja) 1998-12-18

Family

ID=15586603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9154545A Pending JPH10334188A (ja) 1997-05-28 1997-05-28 書体識別装置および書体識別方法および情報記憶媒体

Country Status (1)

Country Link
JP (1) JPH10334188A (ja)

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
JP2000181993A (ja) 文字認識方法および装置
CN111126266A (zh) 文本处理方法、文本处理***、设备及介质
JP3099797B2 (ja) 文字認識装置
JPH10334188A (ja) 書体識別装置および書体識別方法および情報記憶媒体
JP4804433B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JPH1185905A (ja) 書体識別装置および書体識別方法および情報記憶媒体
JPH10187887A (ja) 書体識別装置および書体識別方法および情報記録媒体
JP3095470B2 (ja) 文字認識装置
JP2821303B2 (ja) 掠れ文字結合方式
JPH10124614A (ja) 書体識別装置および書体識別方法および情報記憶媒体
JPH0528319A (ja) 画像処理方法及び装置
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JP2803736B2 (ja) 文字認識方式
JP2007058819A (ja) 索引情報生成装置
JP3379663B2 (ja) 文字認識装置
JP3115139B2 (ja) 文字切り出し方法
JP2576080B2 (ja) 文字切出し方法
JPH1166225A (ja) 表情報抽出装置及び方法並びに記録媒体
JP2753094B2 (ja) 単語切り出し装置
JP3220226B2 (ja) 文字列方向判別方法
JPH1055411A (ja) フォント識別装置
JPH06215181A (ja) 文字・文字列切り出し方法および文字認識装置
JP3045086B2 (ja) 光学式文字読取方法および装置
JPH10214308A (ja) 文字判別方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050315