JPH10334188A

JPH10334188A - 書体識別装置および書体識別方法および情報記憶媒体

Info

Publication number: JPH10334188A
Application number: JP9154545A
Authority: JP
Inventors: Tei Abe; 悌阿部
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1997-05-28
Filing date: 1997-05-28
Publication date: 1998-12-18

Abstract

(57)【要約】【課題】斜めのストロークを含む文字画像や、ノイ
ズ，つぶれ，かすれのある文字画像や、種々の書体(フ
ォント)の文字画像に対しても、その文字の書体を容易
にかつ正確に識別することの可能な書体識別装置を提供
する。【解決手段】書体識別部４は、文字画像において文字
のストロークの先端部分の画像を抽出するストローク先
端部分抽出手段８と、ストローク先端部分抽出手段８で
抽出された文字のストローク先端部分の画像を予め用意
された書体別のストローク先端形状モデルと比較して文
字の書体を識別する識別手段９とを有している。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文字の書体(フォ
ント)の識別を行なう書体識別装置および書体識別方法
および情報記憶媒体に関する。

【０００２】

【従来の技術】従来、例えば特開平６−２０８６４９号
には、文字の縦方向および横方向の文字線幅を推定し、
これらの線幅の比によって、文字の書体が明朝体である
かゴシック体であるかを識別する書体識別技術が示され
ている。この書体識別技術は、より具体的には、文字画
像の水平方向および垂直方向のランレングスヒストグラ
ムのモード(最頻値)によって、横方向および縦方向の文
字線幅を推定し、これらの線幅の比によって、文字の書
体が明朝体であるかゴシック体であるかを識別するよう
になっている。

【０００３】

【発明が解決しようとする課題】しかしながら、上述し
た従来の書体識別技術では、「中」や「田」等のように
文字を構成するストロークの多くが水平または垂直な直
線で、かつ画像にノイズがない場合にしか、書体を良好
に識別することができないという問題があった。すなわ
ち、ほとんどの文字のフォントは、斜めのストロークが
存在し、文字に斜めのストロークが存在する場合、上述
した従来の書体識別技術では、ランレングスヒストグラ
ムのピーク(最頻値)が誤ったところに出てしまい、正し
い線幅を検出できないので、大半の文字の書体を正確に
識別することができず、実用化には適しないという問題
があった。

【０００４】本発明は、斜めのストロークを含む文字画
像や、ノイズ，つぶれ，かすれのある文字画像や、種々
の書体(フォント)の文字画像に対しても、その文字の書
体を容易にかつ正確に識別することの可能な書体識別装
置および書体識別方法および情報記憶媒体を提供するこ
とを目的としている。

【０００５】

【課題を解決するための手段】上記目的を達成するため
に、請求項１乃至請求項５記載の発明では、文字画像に
おいて文字のストロークの先端部分の画像を抽出し、抽
出した文字のストローク先端部分の画像を予め用意され
た書体別のストローク先端形状モデルと比較して文字の
書体を識別することを特徴としている。これにより、文
字画像の文字の書体(フォント)を精度良く識別すること
が可能となる。

【０００６】

【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図１は本発明に係る書体識別装置の
構成例を示す図である。図１を参照すると、この書体識
別装置は、文書を例えば２値画像(黒，白の画素画像)と
して読み込む画像入力部１と、画像入力部１で読み込ま
れた文書画像等を記憶するメモリ２と、文書画像から文
字画像を抽出する文字切り出し処理部３と、文字切り出
し処理部３により切り出された文字画像に対し、その文
字の書体(フォント)の識別を行なう書体識別部４と、全
体の制御を行なう制御部５と、書体識別部４による文字
の書体の識別結果を出力する結果出力部６とを有してい
る。

【０００７】ここで、文字切り出し処理部３は、文書画
像から例えば図２に示すように１つの文字画像を切り出
すようになっている。すなわち、図２の例では、１つの
文字画像(図２の例では、文字「Ｋ」)は、文字の外接矩
形領域ＡＲとして切り出される。

【０００８】また、書体識別部４は、文字画像において
文字のストロークの先端部分の画像を抽出するストロー
ク先端部分抽出手段８と、ストローク先端部分抽出手段
８で抽出された文字のストローク先端部分の画像を予め
用意された書体別のストローク先端形状モデルと比較し
て文字の書体を識別する識別手段９とを有している。

【０００９】また、図３は図１の書体識別部４のストロ
ーク先端部分抽出手段８の第１の構成例を示す図であ
る。図３の例では、ストローク先端部分抽出手段８は、
文字画像の細線化を行なう細線化部１１と、細線化画像
から端点を抽出する端点抽出部１２と、端点抽出部１２
で抽出された端点位置を中心として半径ｒの円の範囲内
の文字画像をストローク先端部分として抽出するストロ
ーク先端部分抽出部１３とを有している。

【００１０】ここで、端点抽出部１２およびストローク
先端部分抽出部１３は、第１の抽出例として、文字を構
成する全てのストロークの端点および先端部分を抽出す
ることができる。

【００１１】あるいは、端点抽出部１２およびストロー
ク先端部分抽出部１３は、第２の抽出例として、文字を
構成する各ストロークのうち、特定の(例えば所定の傾
きをもつ１つの)ストロークの端点および先端部分のみ
を抽出することもできる。

【００１２】次に、図１の構成の書体識別装置の処理動
作を図４，図５のフローチャートを用いて説明する。な
お、図４は全体の処理動作を説明するためのフローチャ
ート、図５は書体識別部４のストローク先端部分抽出手
段８が図４のようになっている場合の書体(フォント)を
判定する処理(図４の処理動作において書体(フォント)
を判定する処理)の一例を示すフローチャートである。

【００１３】図４を参照すると、先ず、ステップＳ１０
１では、画像入力部１により、書体識別対象である文字
が記載された文書(例えば原稿)を読込み、これを文書画
像としてメモリ２内に取り込む。次いで、ステップＳ１
０２では、文字切り出し部３によって文書画像から文字
画像のみを切り出し、その外接矩形領域の座標を求める
文字矩形切り出し処理を行なう。このようにして、文字
画像に含まれる各文字画像に対して切り出しを行ない、
切り出した各文字画像に対して順番に番号付けをする。
次いで、ステップＳ１０３では、各文字画像をサーチす
るための番号(文字カウンタ)ｉを“１”に初期設定す
る。

【００１４】しかる後、ステップＳ１０４では、ｉ番目
の文字の書体(フォント)の判定を行なう。

【００１５】ステップＳ１０４における書体(フォント)
の判定処理は、例えば図５のようにしてなされる。な
お、図５の処理例は、前述した第１の抽出例に従い、文
字を構成する全てのストロークの先端部分を抽出するも
のである。図５を参照すると、先ず、ステップＳ２０１
では、文字画像を細線化し、次いで、ステップＳ２０２
では、ステップＳ２０１で細線化した文字画像(骨格画
像)から端点を抽出し、全ての端点をメモリ２に記憶す
る。この際、抽出した各端点に順番に番号付けをして記
憶する。次いで、ステップＳ２０３では、端点をサーチ
するための番号ｊを“１”に初期設定する。

【００１６】次いで、ステップＳ２０４では、ｊ番目の
端点を中心として半径ｒの円の範囲にある黒画素をスト
ロークの先端部分として求める。

【００１７】しかる後、ステップＳ２０５では、番号ｊ
を“１”だけインクリメントし、ステップＳ２０６で
は、ｊ番目の端点が存在するか否かを判定し、存在すれ
ば、ステップＳ２０４へ戻り、次の端点について、上述
したと同様の処理(文字の中の１つのストロークの先端
部分を抽出する処理)を行なう。

【００１８】このようにして、ステップＳ２０２でメモ
リ２に記憶された全ての端点に対応する各ストローク先
端部分を順次に求め、ステップＳ２０６でｊ番目の端点
が存在しなくなったとき(全ての端点の処理を完了した
とき)、ステップＳ２０７では、この１つの文字画像内
において抽出した各ストローク先端部分を予め用意した
全フォントの先端形状と比較して、ｉ番目の文字の書体
(フォント)を識別する。例えば、ｉ番目の文字の書体
が、例えば、明朝体であるか、丸ゴシック体であるか、
角ゴシック体であるかを判定する。

【００１９】図４のステップＳ１０４において、ｉ番目
の文字の書体(フォント)を、例えば図５のステップＳ２
０１乃至Ｓ２０７のようにして判定した後、図４のステ
ップＳ１０５では、番号ｉを“１”だけインクリメント
し、次いで、ステップＳ１０６では、ｉ番目の文字が存
在するか否かを判定し、存在すれば、ステップＳ１０４
へ戻り、次の文字について、上述したと同様の処理(こ
の文字の書体(フォント)を判定する処理)を行なう。

【００２０】このようにして、ステップＳ１０１で入力
された文書画像に含まれる各文字画像について、書体
(フォント)を判定する処理を順次に行ない、ステップＳ
１０６でｉ番目の文字が存在しなくなったとき(全ての
文字画像について書体を判定する処理を完了したと
き)、全ての処理を終了する。

【００２１】なお、図５の例では、第１の抽出例に従っ
て、全てのストロークの先端部分を用いて書体(フォン
ト)を判定したが、文字を構成する各ストロークのうち
予め定めた特定の方向のストロークの先端部分だけを用
いて、書体(フォント)を判定することも可能である。

【００２２】図６(ａ)，(ｂ)，(ｃ)は書体(フォント)が
それぞれ明朝体，丸ゴシック体，角ゴシック体である場
合のある文字のストロークの先端部分を示す図である。
なお、図６(ａ)，(ｂ)，(ｃ)において、円は細線化画像
の端点を中心として抽出される範囲である。図６(ａ)，
(ｂ)，(ｃ)からわかるように、書体(フォント)がそれぞ
れ明朝体，丸ゴシック体，角ゴシック体である場合で、
ストロークの先端部分の形状はそれぞれ互いに相違して
おり、従って、ストロークの先端部分の形状の相違に基
づいて、書体(フォント)を識別することができる。

【００２３】また、図７は図１の書体識別部４のストロ
ーク先端部分抽出手段８の第２の構成例を示す図であ
る。図７の例では、ストローク先端部分抽出手段８は、
文字画像の輪郭追跡を行なう輪郭追跡部２１と、輪郭の
曲率を算出する曲率算出部２２と、曲率算出部２２で算
出された曲率に基づいてストローク先端部分を抽出する
ストローク先端部分抽出部２３とを有している。

【００２４】ここで、ストローク先端部分抽出部２３
は、第１の抽出例として、文字を構成する全てのストロ
ークの先端部分を抽出することができる。

【００２５】あるいは、ストローク先端部分抽出部２３
は、第２の抽出例として、文字を構成する各ストローク
のうち、特定の(例えば１つの)ストロークの先端部分の
みを抽出することもできる。

【００２６】なお、曲率算出部２２における曲率の算出
は、例えば次のようになされる。すなわち、文字画像の
輪郭線の曲率Ｒは、文字画像の輪郭線をｙ＝ｆ(ｘ)とす
るとき、次式で与えられる。

【００２７】

【数１】Ｒ＝［(ｄ²ｙ／ｄｘ²)／{１＋(ｄｙ／ｄｘ)²}^3/2］

【００２８】この式を離散的な形の折線に近似して曲率
を算出するため、平均化の概念を導入することができ
る。すなわち、図８に示すように、曲率を求めようとす
る輪郭線の点(ｘ₀，ｙ₀)について、その左右にそれぞれ
ｋ個の点をとり、これらから、次式(数２)のような値ｄ
_-，ｄ₊，ｄ_±などを計算する。

【００２９】

【数２】

【００３０】あるいは、さらに簡単に、次式によって求
めることもできる。

【００３１】

【数３】ｄ_-＝(ｙ₀−ｙ_-k)／(ｘ₀−ｘ_-k) ｄ₊＝(ｙ_k−ｙ₀)／(ｘ_k−ｘ₀) ｄ_±＝(ｙ_k/2−ｙ_-k/2)／(ｘ_k/2−ｘ_-k/2)

【００３２】そして、このようにして求めた値ｄ_-，
ｄ₊，ｄ_±から、次式のように、(ｄ²ｙ／ｄｘ²)，(ｄｙ
／ｄｘ)を求める。

【００３３】

【数４】(ｄ²ｙ／ｄｘ²)＝ｄ₊−ｄ_- (ｄｙ／ｄｘ)＝ｄ_±

【００３４】そして、数４で求めた(ｄ²ｙ／ｄｘ²)，
(ｄｙ／ｄｘ)を数１に代入して、点(ｘ₀，ｙ₀)について
の曲率Ｒを求めることができる。

【００３５】このようにして、文字画像の輪郭を追跡
し、輪郭の各点について曲率が算出されるとき、ストロ
ーク先端部分抽出部２３は、例えば、曲率の変化の大き
い輪郭点の近傍の画素(より具体的に、例えば、この輪
郭点の前後の輪郭画素)をストローク先端部分として抽
出することができる。

【００３６】図９は、図１の構成の書体識別装置におい
て、書体識別部４のストローク先端部分抽出手段８が図
７のようになっている場合の書体(フォント)を判定する
処理(図４の処理動作において書体(フォント)を判定す
る処理)の一例を示すフローチャートである。

【００３７】すなわち、書体識別部４のストローク先端
部分抽出手段８が図７のようになっている場合には、図
４のステップＳ１０４における書体(フォント)の判定処
理は、例えば図９のようにしてなされる。なお、図９の
処理例は、前述した第１の抽出例に従い、文字を構成す
る全てのストロークの先端部分を抽出するものである。
図９を参照すると、先ず、ステップＳ３０１では、ｉ番
目の文字画像の輪郭を追跡し、ステップＳ３０２では、
文字画像の各輪郭の曲率を計算し、ステップＳ３０３で
は、曲率の変化の大きい輪郭点を抽出し、抽出した全て
の輪郭点(曲率の変化の大きい輪郭点)をメモリ２に記憶
する。この際、抽出した各輪郭点に順番に番号付けをし
て記憶する。次いで、ステップＳ３０４では、各輪郭点
をサーチするための番号ｊを“１”に初期設定する。

【００３８】しかる後、ステップＳ３０５では、ｊ番目
の輪郭点の前後の輪郭画素を抽出し、これをストローク
の先端部分として求める。

【００３９】しかる後、ステップＳ３０６では、番号ｊ
を“１”だけインクリメントし、ステップＳ３０７で
は、ｊ番目の輪郭点が存在するか否かを判定し、存在す
れば、ステップＳ３０５へ戻り、次の輪郭点について、
上述したと同様の処理(文字の中の１つのストロークの
先端部分を抽出する処理)を行なう。

【００４０】このようにして、ステップＳ３０３でメモ
リ２に記憶された全ての輪郭点に対応する各ストローク
先端部分を順次に求め、ステップＳ３０７でｊ番目の輪
郭点が存在しなくなったとき(全ての輪郭点の処理を完
了したとき)、ステップＳ３０８では、この１つの文字
画像内において抽出した各ストローク先端部分を予め用
意した全フォントの先端形状と比較して、ｉ番目の文字
の書体(フォント)を識別する。例えば、ｉ番目の文字の
書体が、例えば、明朝体であるか、丸ゴシック体である
か、角ゴシック体であるかを判定する。

【００４１】図７の構成例では、図４のステップＳ１０
４において、ｉ番目の文字の書体(フォント)を、例えば
図９のステップＳ３０１乃至Ｓ３０８のようにして判定
した後、図４のステップＳ１０５では、番号ｉを“１”
だけインクリメントし、次いで、ステップＳ１０６で
は、ｉ番目の文字が存在するか否かを判定し、存在すれ
ば、ステップＳ１０４へ戻り、次の文字について、上述
したと同様の処理(この文字の書体(フォント)を判定す
る処理)を行なう。

【００４２】このようにして、ステップＳ１０１で入力
された文書画像に含まれる各文字画像について、書体
(フォント)を判定する処理を順次に行ない、ステップＳ
１０６でｉ番目の文字が存在しなくなったとき(全ての
文字画像について書体を判定する処理を完了したと
き)、全ての処理を終了する。

【００４３】なお、図９の例では、第１の抽出例に従っ
て、全てのストロークの先端部分を用いて書体(フォン
ト)を判定したが、文字を構成する各ストロークのうち
予め定めた特定の方向のストロークの先端部分だけを用
いて、書体(フォント)を判定することも可能である。

【００４４】図１０(ａ)，(ｂ)，(ｃ)は書体(フォント)
がそれぞれ明朝体，丸ゴシック体，角ゴシック体である
場合のある文字のストロークの先端部分を示す図であ
る。なお、図１０(ａ)，(ｂ)，(ｃ)からわかるように、
書体(フォント)がそれぞれ明朝体，丸ゴシック体，角ゴ
シック体である場合で、ストロークの先端部分の形状
(曲率の変化の大きい輪郭点の前後の輪郭画素により構
成される形状)はそれぞれ互いに相違しており、従っ
て、ストロークの先端部分の形状の相違に基づいて、書
体(フォント)を識別することができる。

【００４５】このように、本発明では、文字画像におい
て文字のストロークの先端部分の画像を抽出し、抽出し
た文字のストローク先端部分の画像を予め用意された書
体別のストローク先端形状モデルと比較して文字の書体
を識別するので、文字の書体(フォント)を小さなプログ
ラムサイズで容易にかつ正確に精度良く識別することが
できる。

【００４６】すなわち、文字のストロークの先端の形状
を特徴量として用いるので、非常に精度が高く、効率良
く、書体(フォント)の識別ができる。例えば、書体(フ
ォント)の特徴はストロークの先端の形状に顕著に表さ
れるので、例えばゴシック体と丸ゴシック体のように従
来の方法では識別が不可能なフォントでも識別できる。

【００４７】また、本発明では、各種のフォントの各種
の文字のストロークの先端形状モデルを予め登録するこ
とによって、各種の文字について、各種のフォントの識
別が可能になる。すなわち、識別の対象としたい全ての
書体(フォント)のストロークの先端部分の形状モデルを
予め用意し、それとの形状の一致度(相違度)を計測する
ことによって対象文字の書体(フォント)を識別できる。

【００４８】また、図３の例では、ストロークの先端部
分を抽出するのにまず文字画像を細線化して、その端点
を検出し、検出した端点を中心として予め決定した半径
ｒの範囲の画像をストロークの先端部分として抽出する
ことによって、ストロークの先端部分を安定して抽出で
きる。

【００４９】また、図７の例では、ストロークの先端部
分を抽出するのにまず文字画像の輪郭を追跡し、輪郭の
曲率が大きく変わる部分をストロークの先端部分とみな
し、その部分の画像をストロークの先端部分として抽出
することによって、ストロークの先端部分を安定して抽
出できる。

【００５０】なお、上述の例では、書体として、明朝
体，丸ゴシック体，角ゴシック体のいずれかを識別する
場合が示されているが、本発明は、書体として、明朝
体，丸ゴシック体，角ゴシック体の他のフォントを識別
することももちろん可能であり、また、書体として、明
朝体，丸ゴシック体，角ゴシック体に加えてさらに他の
フォントを識別することも可能である。

【００５１】このように、本発明では、文字画像の文字
の書体(フォント)を精度良く識別することが可能とな
り、このようにして得られた文字の書体(フォント)の識
別結果に基づいて、例えば文書画像を再現したりするの
に有用である。

【００５２】図１１は図１の書体識別装置のハードウェ
ア構成例を示す図である。図１１を参照すると、この書
体識別装置は、例えばパーソナルコンピュータ等で実現
され、全体を制御するＣＰＵ３１と、ＣＰＵ３１の制御
プログラム等が記憶されているＲＯＭ３２と、ＣＰＵ３
１のワークエリア等として使用されるＲＡＭ３３と、文
書を文書画像として読込むスキャナ３４と、スキャナ３
４で読込まれた文書画像が例えばページ単位で記憶され
る文書画像ファイル３５と、文書画像に含まれている各
文字画像に対し書体識別を行なった結果の情報を出力す
る結果出力装置(例えば、ディスプレイやプリンタ)３６
とを有している。

【００５３】ここで、スキャナ３４，文書画像ファイル
３５，結果出力装置３６は、図１の画像入力部１，メモ
リ２，結果出力部６にそれぞれ対応している。また、Ｃ
ＰＵ３１は、図１の制御部５，文字切り出し処理部３，
書体識別部４の機能を有している。

【００５４】なお、ＣＰＵ３１におけるこのような制御
部５，文字切り出し処理部３，書体識別部４等としての
機能は、例えばソフトウェアパッケージ(具体的には、
ＣＤ−ＲＯＭ等の情報記憶媒体)の形で提供することが
でき、このため、図１１の例では、情報記憶媒体４０が
セットさせるとき、これを駆動する媒体駆動装置４１が
設けられている。

【００５５】換言すれば、本発明の書体識別装置は、イ
メージスキャナ，ディスプレイ等を備えた汎用の計算機
システムにＣＤ−ＲＯＭ等の情報記憶媒体に記録された
プログラムコードを読み込ませて、この汎用計算機シス
テムのマイクロプロセッサに書体識別処理を実行させる
装置構成においても実施することが可能である。この場
合、本発明の書体識別処理プログラムなどを格納する情
報記憶媒体としては、ＣＤ−ＲＯＭに限られるものでは
なく、ＲＯＭ，ＲＡＭ，ＦＤ等が用いられても良い。

【００５６】

【発明の効果】以上に説明したように、請求項１，請求
項４，請求項５記載の発明によれば、文字画像において
文字のストロークの先端部分の画像を抽出し、抽出した
文字のストローク先端部分の画像を予め用意された書体
別のストローク先端形状モデルと比較して文字の書体を
識別するので、文字画像の文字の書体(フォント)を容易
にかつ正確に精度良く識別することができる。

【００５７】また、請求項２記載の発明では、ストロー
クの先端部分を抽出するのにまず文字画像を細線化し
て、その端点を検出し、検出した端点を中心として予め
決定した半径ｒの範囲の画像をストロークの先端部分と
して抽出することによって、ストロークの先端部分を安
定して抽出できる。

【００５８】また、請求項３記載の発明では、ストロー
クの先端部分を抽出するのにまず文字画像の輪郭を追跡
し、輪郭の曲率が大きく変わる部分をストロークの先端
部分とみなし、その部分の画像をストロークの先端部分
として抽出することによって、ストロークの先端部分を
安定して抽出できる。

【図面の簡単な説明】

【図１】本発明に係る書体識別装置の構成例を示す図で
ある。

【図２】１つの文字画像の一例を示す図である。

【図３】図１の書体識別部のストローク先端部分抽出手
段の一構成例を示す図である。

【図４】図１の書体識別装置の処理動作を説明するため
のフローチャートである。

【図５】図１の構成の書体識別装置において、書体識別
部４のストローク先端部分抽出手段が図３のようになっ
ている場合の書体(フォント)を判定する処理(図４の処
理動作において書体(フォント)を判定する処理)の一例
を示すフローチャートである。

【図６】書体(フォント)がそれぞれ明朝体，丸ゴシック
体，角ゴシック体である場合のある文字のストロークの
先端部分を示す図である。

【図７】図１の書体識別部のストローク先端部分抽出手
段の他の構成例を示す図である。

【図８】曲率の算出例を説明するための図である。

【図９】図１の構成の書体識別装置において、書体識別
部４のストローク先端部分抽出手段が図７のようになっ
ている場合の書体(フォント)を判定する処理(図４の処
理動作において書体(フォント)を判定する処理)の一例
を示すフローチャートである。

【図１０】書体(フォント)がそれぞれ明朝体，丸ゴシッ
ク体，角ゴシック体である場合のある文字のストローク
の先端部分を示す図である。

【図１１】図１の書体識別装置のハードウェア構成例を
示す図である。

【符号の説明】

１画像入力部２メモリ３文字切り出し処理部４書体識別部５制御部６結果出力部８ストローク先端部分抽出手段９識別手段１１細線化部１２端点抽出部１３，２３ストローク先端部分抽出部２１輪郭追跡部２２曲率算出部３１ＣＰＵ３２ＲＯＭ３３ＲＡＭ３４スキャナ３５文書画像ファイル３６結果出力装置４０情報記憶媒体４１媒体駆動装置

Claims

【特許請求の範囲】

【請求項１】文字画像において文字のストロークの先
端部分の画像を抽出するストローク先端部分抽出手段
と、ストローク先端部分抽出手段で抽出された文字のス
トローク先端部分の画像を予め用意された書体別のスト
ローク先端形状モデルと比較して文字の書体を識別する
識別手段とを有していることを特徴とする書体識別装
置。
【請求項２】請求項１記載の書体識別装置において、
前記ストローク先端部分抽出手段は、文字画像を細線化
し、細線化画像から端点を抽出し、抽出した端点位置に
基づき、文字画像からストロークの先端部分の画像を抽
出することを特徴とする書体識別装置。
【請求項３】請求項１記載の書体識別装置において、
前記ストローク先端部分抽出手段は、文字画像の輪郭を
追跡し、その曲率に基づき、文字画像からストロークの
先端部分の画像を抽出することを特徴とする書体識別装
置。
【請求項４】文字画像において文字のストロークの先
端部分の画像を抽出し、抽出した文字のストローク先端
部分の画像を予め用意された書体別のストローク先端形
状モデルと比較して文字の書体を識別することを特徴と
する書体識別方法。
【請求項５】文字画像において文字のストロークの先
端部分の画像を抽出し、抽出した文字のストローク先端
部分の画像を予め用意された書体別のストローク先端形
状モデルと比較して文字の書体を識別するためのプログ
ラムが記憶されていることを特徴とする情報記憶媒体。