JPH0498477A

JPH0498477A - 文字切り出し方法

Info

Publication number: JPH0498477A
Application number: JP2212593A
Authority: JP
Inventors: Keiko Abe; 阿部　惠子
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1990-08-10
Filing date: 1990-08-10
Publication date: 1992-03-31
Anticipated expiration: 2014-12-27
Also published as: JP2995818B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】二産業上の利用分野］本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に適用さ
れる文字切り出し方法ｊ二関する。

［発明の概要］本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に適用さ
れる文字切り出し方法に関し、複数の文字列を夫々列方
向に投影して個々の文字列幅を求め、上記複数の文字列
中の個々の入力文字を夫々列方向及び該列方向に直交す
る幅方向に投影することにより個々の文字ブロックを求
め、これら個々の文字ブロックの列方向及び幅方向の長
さの内で最も頻度の大きい長さを上記入力文字を代表す
る文字パターンの列方向及び幅方向の長さとみなし、上
記個々の文字列幅の分布の内で最も頻度の大きい文字列
幅を一辺として上記入力文字を代表する文字パターンに
相似なパターンを基本文字枠とし、該基本文字枠を単位
として上記入力文字の切り出しを行うことにより、オペ
レータがその入力文字の縦横比等を設定しなくとも自動
的にその入力文字の形状を判別して文字の切り出しが正
確に行えるようにしたものである。

また、本発明は、複数の文字列を夫々列方向に投影して
個々の文字列幅を求約１上記複数の文字列中の個々の入
力文字を夫々列方向及び該列方向に直交する幅方向に投
影することにより個々の文字ブロックを求め、これら個
々の文字ブロックの列方向及び幅方向の長さの内で最も
頻度の大きい長さを上記入力文字を代表する文字パター
ンの列方向及び幅方向の長さとみなし、上記複数の文字
列の認識対象とする文字列において、先頭の文字の立ち
上がり部から上記入力文字を代表する文字パターンの列
方向の長さを中心として所定幅の領域にウィンドウを設
定し、該ウィンドウ内で上配詔識対象とする文字列を幅
方向に投影して投影値が最小となる上記列方向の谷部位
置を求め、該谷部位置の投影値と上記ウィンドウ内の他
の投影値との勾配の最大値が所定値を超えた場合には上
記谷部位置で文字の切り出しを行うと共に、該文字の切
り出しを行った位置を基準として次のウィンドウを設定
し、上記谷部位置の投影値と上記ウィンドウ内の他の投
影値との勾配の最大値が上記所定値以下である場合には
上記谷部位置から更に上記入力文字を代表する文字パタ
ーンの列方向の長さを中心として所定幅の領域に新たな
ウィンドウを設定することにより、投影では分離できな
い連結文字ブロックからでも正確に個々の文字の切り出
しが出来るようにしたものである。

また、本発明は、複数の文字列を夫々列方向に投影して
個々の文字列幅を求め、上記複数の文字列中の個々の入
力文字を夫々列方向及び該列方向に直交する幅方向に投
影することにより個々の文字ブロックを求め、これら個
々の文字ブロックの列方向及び幅方向の長さの内で最も
頻度の大きい長さ−を上記入力文字を代表する文字パタ
ーンの列方向及び幅方向の長さとみなし、上記値々の文
字列幅の分布の内で最も頻度の大きい文字列幅を一辺と
して上記入力文字を代表する文字パターンに相似なパタ
ーンを基本文字枠とし、上記複数の文字列の内の認識対
象とする文字列に属する先頭の文字ブロックを基準とし
て上記基本文字枠の中に入る文字ブロックを統合して切
り出し、以下上記切り出された文字ブロックの次の文字
ブロックを基準として上記基本文字枠の中に入る文字ブ
ロックを統合して切り出していくことにより、文字ピッ
チが変動しても更に分離文字であっても正確に文字の切
り出しができるようにしたものである。

［従来の技術］例えば活版印刷において作業者が活字を拾う工程を自動
化するためには、タイプ印刷等で作成された原稿の各文
字を認識して文字コードに変換する文字認識装置が必要
である。

第２２図は従来の文字認識装置の一例を示し、この第２
２図において、（１）は原稿読取部であり、この原稿読
取部（１）から原稿の１ペ一ジ分の濃淡に対応する原文
字信号Ｓ１が文字列切出し部（２）に供給される。この
原文字信号Ｓ１は原稿を所定の密度でドツト分解し、黒
いドツトをハイレベル“１”　白いドツトをローレベル
“０″で表わしたものであるが、各ドツトの濃度を複数
ビットの２進数で表わす場合もある。

文字列切出し部（２）は第１段前処理部（３）、第２段
前処理部（４）及び第３段前処理部（５）より構成され
、原文字信号Ｓ１には第１段前処理部（３）において雑
音の除去及び原稿の回転補正がなされ、第２段前処理部
（４）において文字領域ＡＲ（第２３ＴｙＪ参照）がそ
の他の領域（写真、図面等の領域）から区分されてその
文字領域ＡＲに含まれるイメージデータだけが抽出され
、第３段前処理部（５）においてその抽出された文字領
域ＡＲに含まれる文字列Ａ　Ｒ１，Ａ　Ｒ２，・・・・
に対応する文字列信号Ｓ４が抽出される。

この文字列信号Ｓ４の抽出を行なうには、第２３図で示
す如く、文字領域ＡＲの各ドツトの位置を水平方向にと
ったＸ軸と垂直方向にとったＹ軸とよりなる（Ｘ、Ｙ）
座標で表わし、各ドツトの“１″又は“０”の値をＹ軸
上に投影して和をとることによりＹ投影ＹＰを生成する
。そして、二のＹ投影ＹＰを所定の闇値レベルで２値化
すると、この２値化した信号の内のハイレベル“１”の
区間が夫々文字列Ａ　Ｒ１，Ａ　Ｒ２，・・・・に対応
する如くなり、文字列信号Ｓ４は後続の文字切出し部（
６）に供給される。

文字切出し部（６）においては、例えば第２４図Ａに示
す１番目の文字列ＡＲｉ　の文字列信号ｓ４をＸ軸上に
投影してＸ投影ＸＰを生成し、このＸ投影ＸＰを最小レ
ベル（値が２）のＨ値ＴＨＩで２値化することにより粗
切出し信号ＤＴＩ　　（第２４図Ｃ）を得て、このＸ投
影ＸＰを中程度のレベルの閾値ＴＨ２（第２４図Ｄ）で
２値化することにより細切出し信号ＤＴ２（第２４図Ｅ
）を得る。同様に粗切出し信号ＤＴＩがハイレベル“１
”の区間だけで個々にＹ投影ＹＰを生成することにより
、Ｙ方向の切出し信号を生成することができる。そして
、最終的に第２４図Ａに示す如く、例えば文字「て−に
ついてはこの文字に外接する外接枠（９）の内部でハイ
レベル“１”となると共に、分離文字である１−い」に
つい゛ては分離されている各部に外接する外接枠（１１
）、　（１２＞　　の内部でハイレベル“１″′となる
切出し信号が得られ、入力される文字列信号Ｓ４からそ
の切出し信号がハイレベル“１”となる部分だけを順次
切出した信号が基本矩形切出し文字信号Ｓ７となる。

尚、第２４図Ｅの細切出し信号ＤＴ２は各文字のより微
細な構造を調べる場合に使用される。また、第２４図Ａ
の分離文字である「い」については外接枠（１１）、　
（１２）　が２個あるため、後に文字識別の段階で統合
を行なう必要がある。

（７）は文字識別部を示し、この文字識別部（７）は基
本矩形切出し文字信号ｓ７を各外接枠毎に取込んで文字
認識を行なう。具体的には、先ず位置による分類を行な
い、第２４図Ａの文字例ＡＲｉ　　に対して上半分の範
囲に存在する文字（ｒ’」、Ｖ″」。

「°」など）及び下半分に存在する文字（「。」。

ｒ、Ｊ、　ｒ、　　Ｊなど）を第１特徴文字としてパタ
ーンマツチングを行って、対応する文字コード（Ｊ　Ｉ
　Ｓコードなど）を付与する。これで識別ができない場
合には、外接枠の幅をＷ、高さをｈとして、縦横比ｈ　
／　ｗ及び相対的大きさによる分類を行なう。即ち、縦
横比ｈ　／　ｗがＣＩ＜ｈ／ｗ＜０．５の範囲に入るか
、１．５＜ｈ／ｗの範囲に入るかによって分類を行なう
。更に、平均的な大きさの外接枠の幅をＷＲ、高さをｈ
Ｒとして、縦相対比ｈ／ｈＲ及び横相対比Ｗ／ＷＲの値
が夫々０〈ｈ／ｈＲ＜０．５及び０＜ｗ／ｗＲ＜０．５
の範囲に入るか否かによって分類を行ない。上述の範囲
に入る文字を第２特徴文字としてパターンマツチングを
行なう。

また、第１及び第２特徴文字に分類されない文字に対し
ては個別に記憶されているドツトパターンとのパターン
マツチングを行ない、所定の合致度が得られた場合には
その文字コードを付与する。

それでもＫＩＪ　Ｗｉできない文字が残った場合には、
その外接枠を更に複数の微少外接枠に分離する再切出し
及び後に続く外接枠と合体させる統合の動作が実行され
る。尚、最終的に認識できな５）文字が残った場合には
、その文字には認識できない文字であることを示すリジ
ェクトコードが付与される。

その文字識別部（７）で生成された原稿の１ペ一ジ分の
文字コードは文字の位置や大きさを示す情報と共に所定
の記憶装置に記憶される。更に、認識結果が正しいかど
うかをオペレータが判定できる様に、その文字コードに
対応する文字のビデオ信号が陰極線管等の表示部（８）
に供給され、この表示部（８）の表示画面には原稿に対
応した形式で認識結果としての一部の文字が表示される
。この場合、認識できなかった文字の部分には高輝度の
矩形のブランクが表示される。従って、修正対象文字や
認識できない文字が存在する場合には、オペレータはワ
ードプロセッサと同じ要領でその部分に所望の文字を打
込むことができる。

第２４図例のように個々の文字が完全に分離されている
場合には「い」のような分離文字を除くと比較的文字の
識別確率は高いが、例えば新聞の記事の如く文字のピッ
チが短く投影によっては個々の文字を完全には分離でき
ないような文字列（以下、「連結文字ブロック−という
）には、文字を切り出すための特別な方法が必要になる
。

従来そのような特別な方法としては、オペレータが文字
ピッチを設定してこの文字ピッチに合わせて文字を切り
出していく方法、文字の縦横比を略１と仮定して文字を
切りだして行く方法及び活字のＩ準的な大きさを予め与
えておく方法等が知られている。、丈だ、電子通信学会
論文誌’　８５／８．　Ｖｏｌ。

Ｊ６８−Ｄ、　Ｎｏ、　８．　ｐｐ’、　１４９７−１
５０４　には、線形２乗誤差関数及び２個のパラメータ
を用いて文字ピッチ（文字ピッチが変化する場合をも含
む）を推定し、この推定された文字ピッチを用いて文字
を切り出す方′法が開示されている。尚、その文字ピッ
チが変化する場合は、英文の所謂バリアプルピッチの他
に和文においても組版時の所謂追込み又は追い出し操作
によって生じることがある。

［発胡が解決しようとする課題コしかしながら、文字の縦横比等を予め設定しておく方法
ではその縦横比が異なる文字パターン（文字フォント）
ををする文字に対しては誤った切り圧しが行われたり、
誤った組合せの文字統合が行われたりする虞がある。具
体的に例えば文字の縦横比を全角文字用の１に設定する
と、新聞で使用されるような縦横比が０．７６〜０．７
９の文字の正確な切り出しが困難になる。これに関して
、文字の縦横比等を予め設定するといっても、認識対象
とする文書の文字の縦横比をオペレータが正確に測定す
るのは困難である不都合もある。

また、所定のパラメータを用いて文字ピッチを推定する
方法ではオペレータの操作が煩雑になると共に、判定方
法及び処理内容が複雑である不都合がある。

また、従来は特に「い」及び「三」のような分離文字の
認識確率が低い不都合があった。

本発明は斯かる点に鑑み、文字認識装置における文字切
り出しの工程において先ず認識対象とする文書の文字の
大きさ等の形状を自動的に判別できるようにすることを
目的とする。

また、本発明は、その判別した文字の形状を用いて連結
文字ブロックからでも正確に文字の切り出しができるよ
うにすることを目的とする。

更に、本発明はその判別した文字の形状を用いて文字ピ
ッチに依存することなく正確に分離文字等の切り出しが
できるようにすることを目的とする。

［課題を解決するための手段］本発明による第１の文字切り出し方法は、例えば第３図
及び第４図に示す如く、複数の文字列を夫々列方向に投
影して個々の文字列幅Ｈを求め、上記複数の文字列中の
個々の入力文字を夫々列方向及び該列方向に直交する幅
方向に投影することにより個々の文字ブロック（１３Ａ
、　１３Ｂ、　１３Ｃ，・・・・）を求め、これら個々
の文字ブロックの列方向及び幅方向の長さｗ、ｈの内で
最も頻度の大きい長さを上記入力文字を代表する文字パ
ターン（１５）の列方向及び幅方向の長さとみなし、上
記例々の文字列幅Ｈの分布の内で最も頻度の大きい文字
列幅を一辺として上記入力文字を代表する文字パターン
（１５）に相似なパターンを基本文字枠（１６）とし、
該基本文字枠（１６）を単位として上記入力文字の切り
出しを行うようにしたものである。

また、本発明による第２の文字切り出し方法は、例えば
第５図に示す如く、複数の文字列を夫々列方向に投影し
て個々の文字列幅を求め、上記複数の文字列中の個々の
入力文字を夫々列方向及び該列方向に直交する幅方向に
投影することにより個々の文字ブロックを求ｔ、これら
個々の文字ブロックの列方向及び幅方向の長さの内で最
も頻度の大きい長さを上記入力文字を代表する文字パタ
ーン（１７）の列方向及び幅方向の長さとみなし、例え
ば第１８図に示す如く上記複数の文字列の認識対象とす
る文字列において、先頭の文字の立ち上がり部から上記
入力文字を代表する文字パターン（１７）の列方向の長
さを中心として所定幅の領域にウィンドウ（２１）を設
定し、該ウィンドウ内で上記認識対象とする文字列を幅
方向に投影して投影値（２２）が最小となる上記列方向
の谷部位置１．、、。を求め、該谷部位置の投影値と上
記ウィンドウ内の他の投影値との勾配の最大値が所定値
を超えた場合には上記谷部位置で文字の切り出しを行う
と共に、該文字の切り出しを行った位置を基準として次
のウィンドウ（２５）を設定し、上記谷部位置の投影値
と上記ウィンドウ内の他の投影値との勾配の最大値が上
記所定値以下である場合には上記谷部位置から更に上記
入力文字を代表する文字パターンの列方向の長さを中心
として所定幅の領域に新たなウィンドウを設定するよう
にしたものである。

また、本発明による第３の文字切り出し方法は、例えば
第５図に示す如く、複数の文字列を夫々列方向に投影し
て個々の文字列幅を求め、上記複数の文字列中の個々の
入力文字を夫々列方向及び該列方向に直交する幅方向に
投影することにより個々の文字ブロックを求め、これら
個々の文字ブロックの列方向及び幅方向の長さの内で最
も頻度の大きい長さを上記入力文字を代表する文字パタ
ーン（１７〉の列方向及び幅方向の長さとみなし、上記
例々の文字列幅の分布の内で最も頻度の大きい文字列幅
を一辺として上記入力文字を代表する文字パターン（１
７）に相似なパターンを基本文字枠（１８）とし、例え
ば第１２図及び第１４図に示す如く、上記複数の文字列
の内のＪ　Ｒ対象とする文字列に属する先頭の文字ブロ
ック（１９Ａ）　　を基準として上記基本文字枠（１８
）の中に入る文字ブロックを統合して切り圧し、以下上
記切り出された文字ブロックの次の文字ブロックを基準
として上記基本文字枠（１８）の中に入る文字ブロック
を統合して切り出していくようにしたものである。

また、本発明による第４の文字切り出し方法は、その第
３の文字切り出し方法において、上記複数の文字列が縦
書きの場合には、上記複数の文字列の内の認識対象とす
る文字列に属する文字ブロックを縦方向の座標を基準と
して順位付けするようにしたものである。

また、本発明による第５の文字切り出し方法はその第３
の文字切り出し方法において、上記複数の文字列が横書
きの場合には、上記複数の文字列の内の認識対象とする
文字列に属する文字ブロックを横方向の座標を基準とし
て順位付けするようにしたものである。

［作用コ斯かる第１の文字切り出し方法によれば、それら個々の
入力文字を囲む文字ブロックの縦方向及び横方向の長さ
の内で最も頻度の大きい長さが入力文字を代表する文字
パターン（１５）の列方向及び幅方向の長さとみなされ
、それら個々の文字列幅Ｈの分布の内で最も頻度の大き
い文字列幅を一辺としてその入力文字を代表するパター
ン（１５）に相似なパターンが基本文字枠（１６）とさ
れる。

従って、オペレータが入力文字の形状を指定しなくとも
自動的に入力文字を代表する文字パターン（１５）の形
状が判別される。この場合、最も頻度の大きい長さが採
用されているので、その入力文字の中に含まれる特殊な
文字（ルビ文字等）によりその入力文字の形状の判別が
左右されることがない。

更にその基本文字枠（１６）を単位として上記入力文字
の切り８しを行うことにより、入力文字がどのような形
状であっても入力文字の切り出しを正確に行うことが出
来る。

また、斯かる第２の文字切り出し方法によれば、先頭の
文字の立ち上がり部からその入力文字を代表する文字パ
ターンの列方向の長さを中心として所定幅の領域にウィ
ンドウ（２１）が設定され、このウィンドウ内でその認
識対象とする文字列を幅方向に投影して投影値（２２）
が最小となるその列方向の谷部位置１　ｓｉｎが求めら
れ、この谷部位置の投影値とそのウィンドウ内の他の投
影値との勾配の最大値が所定値を超えた場合にはその谷
部位置で文字の切り出しが行われる。この場合、一般に
連結文字ブロックであっても各文字の境界部は谷状に凹
むので、例えばその入力文字が連結文字ブロックを構成
していて個々の文字間の境界部の投影値が０にならない
場合であっても、その文字間の境界部の投影値が比較的
大きく凹む極小値となっている限り、その連結文字ブロ
ック内の文字を正確に切り出すことができる。

また、斯かる第３の文字切り出し方法によれば、認識対
象とする文字列の中に分離文字が存在すると、その分離
文字の内の上位側の文字ブロックを基準としてその基本
文字枠（１８）の中に入る文字ブロックが統合して切り
出されるので、その分離文字も正確に切り出される。こ
の場合、その基本文字枠（１８）を基準として文字が切
り出されるので、入力文字のピッチが変化しても正確に
その分離文字の切り出しが行われる。

また、斯かる第４の文字切り出し方法によれば、その入
力文字列が縦書きの場合にその縦方向の座標に沿って座
標値の小さい文字ブロックを基準としてその基本文字枠
に入る文字ブロックが統合して切り出される。

また、斯かる第５の文字切り出し方法によれば、その入
力文字列が横書きの場合にその横方向の座標に沿って座
標値の小さい文字ブロックを基準としてその基本文字枠
に入る文字ブロックが統合して切り出される。

！実施例コ以下、本発明の〜実施例につき第１図〜第２１図を参照
して説明しよう。本例は印刷文書の文字列の中の各文字
を認識して文字コードを出力する文字認識装置で使用さ
れる文字切り出し方法に本発明を適用したものである。

その文字認識装置の全体構成は従来の第２２図例と同様
であるが、文字列切り出し部（２）及び文字切り出し５
（６）の動作が異なっている。以下、本例におけるそれ
ら切り出し部（２）及び（６）の動作につき説明する。

本例では入力文字の縦横比を自動的に求めることができ
るが、最初に認識対象とする文字列が横書きである場合
について、この縦横比を求めるときの文字切り出し部等
の動作につき説明する。

第１図Ａの英文はその横書きの複数の文字列（正確には
口文字行」である）の例を示し、この文字列を列方向（
Ｘ方向）に投影してｙ投影ＹＰを得た後に、このｙ投影
ＹＰを閾値ＴＨ３で２値化して各文字列の文字列高さＨ
（Ｘ方向に垂直なＸ方向の幅）を求める。各文字を数十
ドツトＸ数十ドツトに分解してそのｙ投影ＹＰの分解能
を１ドツトとすると、その閾値ＴＨ３は例えばその分解
能である１に設定する。そして、その文字列高さＨが１
になる部分はノイズであるとして無視すると、その文字
列高さＨが２以上の部分が夫々文字列として検出された
ことになる。この検出された各文字列を第１図已に示す
如くＸ方向に投影してＸ投影ＸＰを求める。

第２図は横書きの和文の１個の文字列のＸ投影ＸＰの拡
大図を示し、この第２図において、１個の文字「手」の
Ｘ投影ＸＰが所定の閾値を超える領域の長さを横方向（
Ｘ方向）の長さＷとして、他の個々の文字についても横
方向の長さを求める。

また、その文字「手」をＸ方向に投影してこの投影が所
定の閾値を超える領域の長さを縦方向（Ｘ方向）の長さ
ｈとして、他の個々の文字についても夫々縦方向の長さ
を求める。その高さｈｘ幅Ｗの矩形のブロック（１３）
をその文字の文字ブロックと称する。

第３図Ａは和文の文字列高さＨの文字列ＡＲｉより文字
ブロック（１３Ａ）、　（１３Ｂ）、　（１３Ｃ）、　
（１３０）、・・・・を抽出した結果を示し、第３図Ｂ
は英文の文字列高さＨ′の文字列ＡＲｊより文字ブロッ
ク（１４Ａ）。

（１４日）、　（１４Ｃ）、　（１４０）、・・・・を
抽出した結果を示す。

第３図Ａにおいては、分離文字である・判」、「い」等
は夫々複数の文字ブロックに分解されている。本例では
先ずその文字列高さＨの分布の統計をとる。具体的には
、その高さＨの範囲を２〜９、１０−１９．２０〜２９
．・・・・にグループ分けして、各グループの度数及び
各グループ内の平均値を求める。

これはその文字列高さＨのヒストグラムを作成するのと
同じである。そして、最も度数の大きい最頻部の平均値
ＨＢを求める。第４図に示す如く、その最頻部の平均値
ＨＢが最も出現頻度の高い文字列の高さになる。

各文字ブロックの縦横比はｈ　／　ｗで表されるが、本
例では切り出した全ての文字ブロックの内で縦横比が０．７５≦ｈ　／　ｗ≦１．　２５　　　・・・・（１
）を充足する文字ブロックだけを選び出して、これら選
び出した文字ブロックの縦方向の長さ（高さ）ｈ及び横
方向の長さ（幅）Ｗの分布の統計をとる。

これは縦横比が１の全角文字の文字ブロックに略相似す
る文字ブロックを有する文字について分布を調べること
を意味し、縦横比が０．５≦ｈ／ｗ≦０．７の範囲にあ
る半角文字等を除外することを意味する。従って、例え
ば高さ及び幅が夫々全角文字の高さ及び幅の１／２のル
ビ文字（２分ルビ）及び３分ルビ等についても、式（１
）を充足する限り統計の対象となる。具体的には、縦方
向の長さｈ及び横方向の長さＷを夫々θ〜９．１０〜１
９．２０〜２９．・・・・にグループ分けして各グルー
プの度数及び平均値を調べ、長さｈ及びＷについて夫々
度数の最も大きい最頻のグループの平均値ｈｂ及びｗｂ
求める。

但し、入力文書が英文のように半角文字が主体である文
書の場合には、その統計をとる縦横比の範囲は半角文字
等を中心にすることがある。

第４図に示す如く本例では、それら平均値ｈｂ及びｗｂ
を夫々入力文字のパターン（入力フォント）の平均枠（
１５）の縦方向の長さ及び横方向の長さとする。そして
、文字列高さが最頻部の平均値であるＨＢの文字列から
その入力フォントの平均枠（１５）に相似な領域を切り
出して得られるブロックを基本文字枠（１６）とする。

即ち、その基本文字枠（１６）の横方向の長さをＷＢと
すると、このＷＢは次式より求めることができる。

ＷＢ＝ＨＢ−ｗｂ／ｈ　ｂ　　　　−・・・（２）これ
ら入力フォントの平均枠（１５）及び基本文字枠（１６
）は後述のように連結文字ブロックの切り出し等に利用
される。これら基本文字枠等は入力文字に応じて自動的
に設定されるので、入力文書の文字の大きさ等に依存す
ることなく常に最適な文字の切り出しを行うことができ
る。この場合、般にルビ文字（例えば２分ルビ）は全角
文字等の被ルビ文字に対して縦方向及び横方向の長さが
夫々１／２なので、そのルビ文字の基本文字枠としては
高さ及び幅が夫々被ルビ文字の基本文字枠（１６）の１
／２である枠を用いる。

一方、入力文書が第５図に示す如く縦書きの場合には、
各文字列の幅Ｗについて度数分布の統計をとることによ
り最頻部の平均値ＷＢが得られる。

そして、個々の文字ブロックについて式（１）の条件の
下でそれら文字ブロックの縦方向及び横方向の長さり、
Ｗの統計をとり、最頻部の平均値の長さｈｂ及びｗｂを
得る。この縦書きの場合の入力フォントの平均枠は（１
７）となり、その文字列幅の最頻部の平均値ＷＢを一辺
の長さとしてその入力フォントの平均枠（１７）に相似
するブロックが基本文字枠（１８）となる。この基本文
字枠（１８）の高さＨＢは次式により求することができ
る。

ＨＢ＝ＷＢ−ｈ　ｂ／ｗｂ　　　・・・・（３）上述の
ように本例によれば個々の文字ブロックの縦方向及び横
方向の長さり、ｗの統計をとり、最頻部の平均値の長さ
を夫々入力フォントの平均枠の縦方向及び横方向の長さ
としているので、ルビ文字及び分離文字の部分のパター
ン等に影響されることなく、入力文字の通常の入力フォ
ントの大きさを正確に検出できる利益がある。この場合
、オペレータが外部よりパラメータを設定する必要がな
いので、オペレータの負担が軽減されている。

入力文書が新聞の杜説く縦書き）である場合に実際に度
数分布の統計をとった結果について説明するに、第６図
は全文字列の幅Ｗの度数分布を示し、第７図及び第８図
は夫々個々の文字ブロックの幅Ｗ及び高さｈの度数分布
を示す。第６図より文字列幅Ｗの最頻部（４０≦Ｗ≦４
９）の平均値は４７であるため、基本文字枠（１８）　
（第５図参照）の幅ＷＢは４７となる。また、第７図及
び第８図より文字ブロックの幅Ｗの最頻部（４０≦Ｗ≦
４９）の平均値は４３であり、高さｈの最頻部（３０≦
ｈ≦３９）の平均値は３３であるため、入力フォントの
平均枠（１７）の幅ｗｂ及び高さｈｂは夫々４３及び３
３になる。

従って、縦横比ｈｂ／ｗｂは０．７６７４となり、式（
３）より基本文字枠（１８）の高さＨＢはＨＢ　＝４７・３３／４３　＝３６となる。

また、入力文書が新平家物語（縦書き）である場合に実
際に度数分布の統計をとった結果について説明するに、
第９図は全文字列の幅Ｗの度数分布を示し、第１０図及
び第１１図は夫々個々の文字ブロックの幅Ｗ及び高さｈ
の度数分布を示す。第９図より文字列幅Ｗの最頻部の平
均値は４１であり、第１０図及び第１１図より文字ブロ
ックの幅Ｗの最頻部の平均値は３５且つ高さｈの最頻部
の平均値は３５である。従って、入力フォントの平均枠
及び基本文字枠の縦横比は１となる。

次に、上述の基本文字枠を用いて文字を切り出す方法の
一例につき第１２図〜第１７図を参照して説明する。本
例は入力文字の文字ピ・ソチは必ずしも一定ではないが
基本的な文字枠は一定であるとして、分離文字であれば
分離している各文字ブロックを統合して文字を切り出し
ていく方法である。

第１２図は切り出し対象とする縦書きの入力文字の文字
ブロックの例を示し、この第１２図において、（１９Ａ
）、　（１９Ｂ）、・・・・は全角文字等の被ルビ文字
の文字ブロック、（２７）はルビ文字の文字ブロックで
ある。これらの文字ブロックの横方向の長さＷ及び縦方
向の長さｈの度数分布の最頻部の平均値及び各文字列の
幅の最頻部の平均値を用いて、第５図に示す基本文字枠
（１８）の高さＨＢ及び幅ＷＢが得られる。また、被ル
ビ文字のブロックとルビ文字のブロックとは横方向（Ｘ
方向）の位置により区別できるので、ルビ文字について
はルビ文字用の基本文字枠を用いて別途切り出しを行う
。

その切り出し対象とする文字列の被ルビ文字の文字ブロ
ックを列方向、即ち縦方向（Ｘ方向）にそのｙ座標の値
が小さい順に順位付けする。第１２回倒の文字ブロック
の順序は（１９Ａ）、　（１９Ｂ）、　（１９Ｃ）。

（１９０）、・・・・となる。そして、それら文字ブロ
ックの内で横方向（Ｘ方向）の座標が最も小さい文字ブ
ロックの右辺のＸ方向の座標を基準点ｘ０　とする。

第１３図のフローチャートを参照して文字ブロックの統
合手順につき説明するに、先ずステップ（１０１）　　
においてｙ座標が’１１ｓである１番目の文字ブロック
ｂ、を文字統合用の文字バッファに登録する。この文字
バッファとは第２２図の装置中の文字切り出し部（６）
に付加されるメモリであり、この文字バッファに登録す
ることはその文字ブロックｂ、の内部のドツトパターン
をそのメモリに書き込むことを意味する。その後ステッ
プ（１０２）　　で第１４図に示す如く、その文字ブロ
ックｂ１　の上辺に基本文字枠（１８）の上辺を一致さ
せ、その基本文字枠（１８）の左辺を基準点Ｘ。に一致
させた後に、（ｉ＋１）番目の文字ブロックを切り出し
対象にするため、ステップ（１０３）　　でその（ｉ二
１）をｊと置く。

そして、その文字ブロックｂｊの上辺のｙＷｌｌｌｌで
あるｙＪｓ等の４頂点の座標データを取り込み（ステッ
プ（１０４）　）　、そのブロックｂＪがその基本文字
枠（１８）の中に一部でも入っているかどうかを調べる
（ステップ（１０５）　）　　その基本文字枠（１８）
の下辺のｙ座標は（ｙｉ−＋ＨＢ）であるので、次の式
（４）が成立すればその文字ブロックｂ、はその基本ブ
ロック（１８）に一部でも入っていることになる。

ｙＪｓ＜ｙ、＋ＨＢ　　　・・・・（４）この式（４）
が成立しないときは、その文字ブロックｂ、はその最初
の文字ブロックｂ、とは異なる文字に属すると判断して
、文字切り出し部の動作はステップ（１０７）　　に進
んでその文字バッファにそれまでに登録されているデー
タが文字識別部（第２２図の（７））に渡され、この文
字識別部でノ々ターンマツチング等により文字の識別が
行われる（ステップ（１０８）　）その式（４）が成立するときにはステ・ンプ（１０６）
に進み、文字ブロックｂエ　と文字ブロックｂ、とがＸ
方向に隣接すると共に両ブロックのＸ方向の間隔ΔＷが
その基本文字枠（１８）の幅ＷＢの１／２未満であるか
どうかが調べられる。即ち、０≦Δｗ　＜　Ｗ　Ｂ　／
　２　　　　・・・・（５）が成立するときには、第１
４図に示す如くそれら文字ブロックｂ、及びす、は夫々
成る共通の分離文字の構成要素であると考えられるので
、ステップ（１１０）　　に移行してその文字ブロック
ｂ、を文字ノ＜ッファに登録した後に、更に（ｊ＋１）
番目の文字ブロックの統合を行うかどうかを判断するた
め、変数」の値を１だけ増分させてから（ステップ（１
１１））、再びステップ（１０４）に戻って文字ブロッ
クｂ、のデータを取り込む。

また、式（５）が成立しないときにはステ、ノブ（１０
９）に移行して、第１５図に示すようにそれら文字ブロ
ックｂ１　　とす、とがＸ方向に隣接して且つその下側
の文字ブロックｂ、が完全に基本文字枠（１８）に含ま
れているかどうかを調べる。その文字ブロックｂ、の下
辺のｙ座標を’ｌｔｅとすると、文字ブロックｂ１　　
とす、とがＸ方向に隣接して且つその下側の文字ブロッ
クｂｊが完全に基本文字枠（１８）に含まれているとい
う条件は次の式で表現することができる。

ｙ０≦ｙＪｓ　　且つ　ｙ４．≦ｙ、、＋ＨＢ・・・・
（６）そして、式（６）が成立するときには両文字ブロックｂ
、及びす、は共通の分離文字の構成要素であると判断し
てステップ（１１０）　　に移行してその文字ブロック
ｂｊ　を文字バッファに登録し、その式（６）が成立し
ないときには更にステップ（１１２）に移行する。

このステップ（１１２）　　においては、第１６図に示
す如く下側の文字ブロックｂＪ　は基本文字枠（１８）
と一部が重なった状態で存在する。この場合、本例では
その文字ブロックｂ、と基本文字枠（１８）との重なり
面積ｍを求杓、この重なり面積ｍがその文字ブロックｂ
、の面積の１／２よりも大きいかどうかを調べる（ステ
ップ（１１３））。この重なり面積ｍがその文字ブロッ
クｂ、の面積の１／２よりも大きいときには、その文字
ブロックｂ」がその基本文字枠（１８）の最初の文字ブ
ロックｂ１　　と共に共通の分離文字を構成する確率が
高いと判断して、更にステップ（１１４）　　に移行し
てその文字ブロックｂｊ　とその次の文字ブロックｂｋ
　（−に＝Ｊ＋１）とのＸ方向の間隔Δｈを求める。

また、その文字ブロックｂｊ　の高さをｈｊ　として、
本例ではその高さり、及び間隔Δｈが次の式を充足する
かどうかを調べる（ステップ（１１５））。

ｈ、＜ＨＢ／４　　且つ　Δｈ＜ＨＢ／３・・・・（７
）そして、式（７）が成立するときには、ブロックｂｔ　
とｂｊ　とは共通の分離文字を構成すると判断してその
文字ブロックｂ、を文字バッファに登録してから（ステ
ップ（１１６））、次の文字ブロックのデータを取り込
むためにステップ（１１７）　　でＪの値を１だけ増分
した後に再びステップ（１０４）に戻る。

一方、式（７）が成立しないとき及びステップ（１１３
）で重なり面積ｍが小さいときには、本例の文字切り出
し部はその下側の文字ブロックｂ、はその基本文字枠（
１８）には属さないと判断して、ステップ（１１７）を
介してステップ（１０４）に戻る。この場合には、ステ
ップ（１０５）で式（４）が成立しないので、動作はス
テップ（１０７）　　に移行して文字ブロックｂ、まで
の文字バッファのデータが文字識別部に供給される。

切り出し対象とする分離文字が例えば４個の文字ブロッ
クより構成される場合には、先頭の文字ブロックｂＩ　
　に続いて３個の文字ブロックがその文字バッファに登
録され、この登録後の文字バッファの内容が文字識別部
に渡される。その後、切り出された直後の文字ブロック
を新たな先頭の文字ブロックとして第１３図の文字統合
が適用される。

上述のように本例によれば、先頭の文字ブロックを基準
として基本文字枠に入るか又は所定量以上型なる文字ブ
ロックを統合するようにしているので、文字ピッチが変
動するような場合でも簡単なアルゴリズムで正確に分離
文字の切り出しを行うことができる利益がある。

尚、上述実施例のステップ（１１４）及び（１１５）で
は式（７）を用いて文字ブロックｂ、がその基本文字枠
に属するかどうかを判定しているが、その他に例えば第
１６図に示すように上側の文字ブロックｂ１とその文字
ブロックｂ、とのＸ方向の間隔Δｑを求め、この間隔Δ
ｑが間隔Δｈよりも小さいときにその文字ブロックｂ、
がその基本文字枠に属すると判定する方法もある。

また、切り出し対象とする文字列が第１７図に示す如く
横書きである場合には、個々の文字より文字ブロック（
２ＯＡ）、　（２０Ｂ）、・・・・を抽出した後にこれ
ら文字ブロックを横方向（Ｘ方向）に座標値の小さい順
序で順位付けする。第１７図例の文字ブロックの順序は
（２ＯＡ）、　（２０Ｂ）、　（２０Ｃ）、　（２００
）、・・・・となる。

そして、先頭の文字ブロック（２ＯＡ）　　より基本文
字枠を用いて文字の切り出しを行う。

次に上述の統計的に求めた入力フォントの平均枠（例え
ば第５図の平均枠（１７）　）を用いて連結文字ブロッ
クより文字を切り出していくときの文字切り出し部の動
作につき説明する。連結文字ブロックでは文字同士の境
界部の投影値が０にならないので、このような場合の文
字の切り出しを強制切り出しと呼ぶ。

第１８図は強制切り出しの対象とする縦書きの文字列の
例を示し、この文字列の列方向にドツト単位で座標１を
設定する。この場合、先頭の文字のパターンの内で最も
高い位置にあるドツトの座標ｌの値を０　（始点）とす
る。また、予め個々の文字をＸ方向及びＸ方向に投影し
て式（１）の縦横比の条件を充足する文字ブロックの高
さｈ及び幅Ｗの度数分布を求め、最頻部の平均値より入
力フォントの平均枠の高さｂｂ及び幅ｗｂを求めておく
。

その式（１）よりその入力フォントは全角文字の入力フ
ォントと考える二とができる。

本例では、その入力フォントの平均枠の高さｈｂを強制
切り出しパラメータＣとする。但し、切り出し対象とす
る文字列が横書きであるときには、その強制切り出しパ
ラメータＣはその平均枠の幅ｗｂとする。即ち、縦書き
のときにはｃ＝ｈ　ｂ　　　　・・・・（８）が成立し、横書きのときにはｃ＝ｗｂ　　　　・・・・（９）が成立する。

入力文字列が縦書きの場合には、その文字列を横方向（
Ｘ方向）に投影して得られたｙ投影ＹＰが０を含まずに
１．５０を超えて連続する部分は連結文字ブロックであ
ると判断して、強制切り出しアルゴリズムを適用する。

第１９図の強制切り出しの手順を示すフローチャートを
参照して第１８図の連結文字ブロックより文字を切り出
すときの文字切り出し部の動作につき説明するに、第１
８図例ではｃ＝ｈｂ＝３４であるとする。

先ず第１９図のステップ（１１Ｂ）　　において、中央
変数ｍｉｄの値として強制切り出しパラメータＣの値を
そのまま代入した後に、ステップ（１１９）　　にて半
値幅ｗ（＝１０）を用いて下限変数ｍｉｄｍ及び上限変
数ｍ１ｄｐの値を次のように設定する。

ｍｉｄｍ　＝　ｍ　ｉ　ｄ　−Ｗ　　　　・・・・（１
０）ｍｉｄｐ　＝　ｍ　ｉ　ｄ　＋Ｗ　　　　・−・・
（ｌｌ）その下限変数ｍｉｄｍで定まる座標と上限変数
ｍ１ｄｐで定まる座標との中間部である幅２０の領域が
最初のウィンドウ（２１）となる。そして、座標ｉの関
数としてその文字列の横方向へのｙ投影であるＹＰ（１
）を求め（ステップ（１２０）Ｌそのウィンドウ（２１
）の中でそのＹＰ（ｉ）（第１８図のヒストグラム（２
２））が最小となるときのｉの値１１１１！ｌを求める
（ステップ（１２１））。ｙ投影が最小となる１の値が
複数存在するときには例えば最も大きい値を採用する。

そして、ステップ（１２２）　　で１が１．１、のとき
のｙ投影であるＹ　Ｐ　（１ｓｉｎ　）　　が閾値ＴＨ
Ｖよりも小さいかどうかを調べる。そのｙ投影がその閾
値ＴＨｙ以上であるときには、文字切り出し部の動作は
ステップ（１２３）　　に移行してその結果に対応する
処理が施される。具体的には後述のステップ（１３１）
　　に移行して半角切り出しの可否を検討するか、又は
一応その１１ＲＩ１１　の位置で文字を切り出して文字
認識部に渡して文字認識ができるかどうか試す等の処理
が施される。

そのＹＰ　（ｉ、ｔｈ）が閾値ＴＨｙよりも小さいとき
には、更にステップ（１２４）　　にてそのウィンドウ
（２１）内でそのｌ　＋ａｌｈ　を中心としてそのＹＰ
（ｉ）の負の勾配の絶対値の最大値Δｍが測定される。

即ち、成る変数δを用いてその最大値Δｍは次式％式％それと共に、ステップ−（１２５）にてそのウィンドウ
（２１）内でそのｌ　＋ａｌｈを中心としてそのＹＰ（
ｉ）の正の勾配の最大値Δｐが測定される。即ち、変数
δを用いてその最大値Δｐは次式で表される。

ｌａｉ、、＜ｌ　　≦　ｌ　＋ａｌｎ＋δ　　　　　　
・・・・（１３）第１８図例のヒストグラム（２２）に
おいて、直線（２３）の負の勾配の絶対値が６ｍに対応
し、直線（２４）の正の勾配が△ｐに対応する。そして
ステップ（１２６）において、それら最大値Δｍ及び△
ｐが共に闇値ＴＨＯより大きいかどうかが調べられ、そ
れら最大値が共にその闇値ＴＨＯより大きいときにはス
テップ（１２７）　　にて強制切り出しが行われる。強
制切り出しとは、座標ｌの値が１　＋ａ１．．の位置を
文字の境界部であるとみなして、０≦ｌく］　１１１１
’ｌ　の範囲の文字パターンを文字認識部に渡すことを
いう。即ち、本例ではそのウィンドウ（２１）内のｙ投
影であるＹＰ　（ｉ）が１ｍ１ｍＩｎで谷状に凹むと共
にその谷の傾斜が所定量以上であるときに、その１＝１
ａｌｔ＋　の位置が文字の境界部であるとみなすのであ
る。具体的にそのウィンドウ（２１）における１　＊Ｉ
ｈ　の値を３５であるとすると、第２０図に示す文字パ
ター　ンが切り出される。

その強制切り出し後のステップ（１２８）　　にて、中
央変数ｍｉｄの値を次のように更新した後に文字切り出
し部の動作はステップ（１２９）へ進む。

ｍ　１　ｄ　−（］＋＊ｉ。＋１）＝Ｃ−・・・（１４
）これは前回文字の境界部であるとみなした座標である
１１．７　の次の１座標を新たな始点として、この新た
な始点を基準として新たなウィンドウを設定することを
意味する。このステップ（１２９）　　では次に切り出
すべき文字がまだ存在するかどうかが調べられ、切り出
すべき文字がまだ存在するときにはステップ（１１９）
　　に戻り下限変数ｍｉｄｍ及び上限変数ｍ１ｄｐの値
が新たな値に更新される。

前回のウィンドウ（２１）における１　＋ａｉ＋ａ　は
３５であるため、式（１４）より今回の中央変数ｍｉｄ
の値は７０になり、第１８図に示す如＜１＝７０の位置
を中心とする輻２０の領域が新たなウィンドウ（２５）
になる。

そして、この新たなウィンドウ（２５）内でのその文字
列のｙ投影ＹＰ　（ｉ）のヒストグラム（２６）の中で
傾斜が所定量以上ある谷部の座標１の値が新たな１　ｍ
ｌｈ　となる。この１　ｓｉｎ　の値を７１であるとす
ると、第２１図に示す如き文字パターンが切り出され、
以下その１　ｍｉｈ　の次の座標を始点として次のウィ
ンドウが設定される。また、ステップ（１２９）で次に
切り出す文字が存在しないときはその余った文字パター
ンのデータを文字認識部へ渡した後に（ステップ（１３
０））、その文字の切り出しが終了する。

また、ステップ（１２６）　　において勾配の絶対値Δ
ｍ及びΔｐが共に閾値ＴＨＯ以下であるときには、その
１＝１１＋ｓの位置は文字の境界部ではないとみなして
、ステップ（１３１）で半角文字の切り出しができるか
どうかを判定する。この場合の半角文字とは座標ｌに沿
う高さが先に求めた文字フォントの平均枠の高さｈｂ（
＝ｃ）の１／２である文字をいい、本例では中央変数ｍ
　ｉ　ｄよりＣ／２を差し引いてステップ（１１９）〜
（１２２）までを実行して谷部が存在するかどうかを調
べる。その谷部が存在するときにはステップ（１３２）
　　にてその中央変数ｍｉｄから正式にＣ／２を差し引
いてステップ（１１９）に移行して、半角文字の切り出
しを行う。

このように半角文字が混入している場合には、その・切
り出し対象とする文字の上に括弧記号が付されているよ
うな場合がある。

一方、ステップ（１３１）　　で半角文字の切り出しが
できないときには、ステップ（１３３）　で中央変数ｍ
１ｄＯ値にＣを加算してからステップ（１２９）　　に
移行する。これは全角文字の切り出しも亨角文字の切り
出しもできないので、ウィンドウの位置を更に全角文字
の高さ分のＣだけ移動させることを意味する。これ以後
は既に述べた手順に従って更に文字の切り出しが実行さ
れる。

上述のように本例によれば、統計的に求めた文字フォン
トの平均枠の大きさに合わせてウィンドウが設定され、
このウィンドウ内の文字列の投影値に傾斜が急な谷部が
存在したときにその谷部が文字間の境界部であると判定
されるので、連結文字ブロックであっても正確に文字の
切り出しを行うことができる利益がある。この場合、統
計的に求めた文字フォントの平均枠の大きさが使用され
るので、認識対象とする全角文字の縦横比が１でない場
合であっても正確に文字の切り出しを行うことができる
。

更に本例ではステップ（１３１）　　で示すように半角
文字の切り出しができるかどうかを判定するステップが
設けられているので、全角文字の連結のみならず半角文
字の連結した文字ブロックからも個々の文字を正確に切
り出すことができる。

尚、本発明は上述実施例に限定されず本発明の要旨を逸
脱しない範囲で種々の構成を採り得ることは勿論である
。

［発明の効果］本発明よる第１の文字切り出し方法によれば、統計的に
入力文字の形状が判別されるので、オペレータがその入
力文字の縦横比等を設定しなくとも自動的にその入力文
字の形状を判別して文字の切り出しが正確に行える利益
がある。

また、第２の文字切り出し方法によれば、所定のウィン
ドウ内の投影の傾斜が急な谷部が文字の境界部とみなさ
れるので、単なる投影では分離できない連結文字ブロッ
クからでも正確に個々の文字の切り出しが出来る利益が
ある。

また、第３〜第５の文字切り出し方法によれば、統計的
に検出された基本文字枠を用いて文字の切り出しが行わ
れるので、文字ピッチが変動しても更に分離文字であっ
ても正確に文字の切り出しができる利益がある。

【図面の簡単な説明】

第１図は本発明の一実施例の文字ブロックの袖出過程を
示す線図、第２図は文字列のｙ方向への投影の例を示す
拡大図、第３図は切り出された文字ブロック、の例を示
す線図、第４図及び第５図は夫々実施例の横書き文字列
の基本文字枠及び縦書き文字列の基本文字枠を示す線図
、第６図は文字列の幅の度数分布の一例を示す線図、第
７図及び第８図は夫々第６図例に対応する文字ブロック
の輻及び高さの度数分布の一例を示す線図、第９図は文
字列の幅の度数分布の他の例を示す線図、第１０図及び
第１１図は夫々第９図例に対応する文字ブロックの輻及
び高さの度数分布の一例を示す線図、第１２図は一実施
例で切り出し対象とする縦書きの文字ブロックの例を示
す線図、第１３図は一実施例の文字ブロックの統合手順
を示すフローチャート図、第１４図〜第１６図は夫々そ
の統合手順の説明に供する線図、第１７図は横書きの文
字ブロックの例を示す線図、第１８図は一実施例で強制
切り出しの対象とする連結文字ブロックの例を示す線図
、第１９図は一実施例の強制切り出しの手順を示すフロ
ーチャート図、第２０図及び第２１図は夫々強制切り出
しの結果の例を示す線図、第２２図は従来の文字認識装
置の全体構成を示す機能ブロック図、第２３図は従来の
文字列の切り出しの説明に供する線図、第２４図は従来
の原矩形切り出し動作の説明に供する線図である。（１）は原稿読み取り部、（２）は文字列切り出し部、
（６）は文字切り出し部、（７）は文字識別部、（１３
）は文字ブロック、（１５）及び（１７）は夫々入力フ
ォントの平均枠、（１６）及び（１８）は夫々基本文字
枠、（２１）及び（２５）は夫々ウィンドウである。代　　理　　人松　　隈　　秀　　盛を杯ａ合する４１台（３）第１６図統合する４合（２）第１５図項書き文字ブロックのＪ′ｊ第１７図第１８図第２０図強＾り切ソエしの腿−１（２）第２１図

Claims

【特許請求の範囲】１、複数の文字列を夫々列方向に投影して個々の文字列
幅を求め、上記複数の文字列中の個々の入力文字を夫々
列方向及び該列方向に直交する幅方向に投影することに
より個々の文字ブロックを求め、これら個々の文字ブロックの列方向及び幅方向の長さの
内で最も頻度の大きい長さを上記入力文字を代表する文
字パターンの列方向及び幅方向の長さとみなし、上記個
々の文字列幅の分布の内で最も頻度の大きい文字列幅を
一辺として上記入力文字を代表する文字パターンに相似
なパターンを基本文字枠とし、該基本文字枠を単位として上記入力文字の切り出しを行
うようにした事を特徴とする文字切り出し方法。２、複数の文字列を夫々列方向に投影して個々の文字列
幅を求め、上記複数の文字列中の個々の入力文字を夫々
列方向及び該列方向に直交する幅方向に投影することに
より個々の文字ブロックを求め、これら個々の文字ブロックの列方向及び幅方向の長さの
内で最も頻度の大きい長さを上記入力文字を代表する文
字パターンの列方向及び幅方向の長さとみなし、上記複
数の文字列の認識対象とする文字列において、先頭の文
字の立ち上がり部から上記入力文字を代表する文字パタ
ーンの列方向の長さを中心として所定幅の領域にウィン
ドウを設定し、該ウィンドウ内で上記認識対象とする文
字列を幅方向に投影して投影値が最小となる上記列方向
の谷部位置を求め、該谷部位置の投影値と上記ウィンド
ウ内の他の投影値との勾配の最大値が所定値を超えた場
合には上記谷部位置で文字の切り出しを行うと共に、該
文字の切り出しを行った位置を基準として次のウィンド
ウを設定し、上記谷部位置の投影値と上記ウィンドウ内の他の投影値
との勾配の最大値が上記所定値以下である場合には上記
谷部位置から更に上記入力文字を代表する文字パターン
の列方向の長さを中心として所定幅の領域に新たなウィ
ンドウを設定するようにした事を特徴とする文字切り出
し方法。３、複数の文字列を夫々列方向に投影して個々の文字列
幅を求め、上記複数の文字列中の個々の入力文字を夫々
列方向及び該列方向に直交する幅方向に投影することに
より個々の文字ブロックを求め、これら個々の文字ブロックの列方向及び幅方向の長さの
内で最も頻度の大きい長さを上記入力文字を代表する文
字パターンの列方向及び幅方向の長さとみなし、上記個
々の文字列幅の分布の内で最も頻度の大きい文字列幅を
一辺として上記入力文字を代表する文字パターンに相似
なパターンを基本文字枠とし、上記複数の文字列の内の認識対象とする文字列に属する
先頭の文字ブロックを基準として上記基本文字枠の中に
入る文字ブロックを統合して切り出し、以下上記切り出
された文字ブロックの次の文字ブロックを基準として上
記基本文字枠の中に入る文字ブロックを統合して切り出
していくようにした事を特徴とする文字切り出し方法。４、上記複数の文字列が縦書きの場合には、上記複数の
文字列の内の認識対象とする文字列に属する文字ブロッ
クを縦方向の座標を基準として順位付けするようにした
請求項３記載の文字切り出し方法。５、上記複数の文字列が横書きの場合には、上記複数の
文字列の内の認識対象とする文字列に属する文字ブロッ
クを横方向の座標を基準として順位付けするようにした
請求項３記載の文字切り出し方法。