JP3587009B2

JP3587009B2 - 画像入力装置

Info

Publication number: JP3587009B2
Application number: JP02555097A
Authority: JP
Inventors: 祥二今泉; 英幸橋本; 徹飯田; 智也吉村
Original assignee: ミノルタ株式会社
Priority date: 1997-02-07
Filing date: 1997-02-07
Publication date: 2004-11-10
Anticipated expiration: 2017-02-07
Also published as: JPH10224596A

Description

【０００１】
【発明の属する技術分野】
本発明は、イメージリーダや複写機の原稿読取部として用いられる画像入力装置に関する。
【０００２】
【従来の技術】
従来、例えば、自動原稿搬送装置を備えた複写機において、複数枚の原稿を連続して読み取ってコピーする場合、読み取られた原稿の向きに応じてコピーが排出されるので、原稿を自動原稿搬送装置にセットする際に、各原稿が一律に同じ方向を向いているか否かを確認する必要があった。しかし、このような確認作業は結構手間がかかるものであり、原稿枚数が多ければ、それだけ反対方向の原稿を見落とすおそれも多くなる。
【０００３】
このような原稿方向の確認作業を怠ると、複数の排出ビンに仕分けして排出するソートユニットを備える複写機において所定のソートモードを実行させた場合、各排出ビンに排出されたコピー束のそれぞれについてコピーの向きを修正しなければならないという不都合があり、さらには、自動的にステープル止めを行うステープルユニットやパンチ穴開けを行うパンチユニットを備えた複写機において、それらの機能を実行させると、異なる方向のコピー含むコピー束をそのままステープル止めしたり、パンチ穴を開けてしまうので、最悪の場合にはもう一度コピー作業をやり直さなければならない事態も生じ、コピー作業における効率が大変悪くなると共にコピー用紙の無駄使いともなり、省資源化に反する。
【０００４】
このような不都合を避けるため、読み取った画像データからまず原稿の向きを判別し（このような原稿方向の判別を以下「天地認識」という。）、その画像出力が適切な方向になるように画像データを回転処理して出力する方法が考えられている。
例えば、特開平４−２２９７６３号公報には、次のような天地認識方法が開示されている。
【０００５】
すなわち、予め所定の参照文字についてその線部分における複数の点（参照点）を抽出してパターンとして記憶しておき、原稿画像を読み取って得られた画像データから文字画像を切り出して、当該切り出された文字と参照点とを比較し、各参照点における文字の画像信号の有無を、切り出した文字画像を９０゜ずつ回転させながら確認して各回転角における一致度を求める。その一致度が一番高い回転角を、当該文字の方向と認識し、これにより天地認識を行うようにしている。
【０００６】
具体的には、例えば、図２３（ａ）に示すように、参照文字「Ａ」について６個の参照点Ａ１〜Ａ６を抽出して記憶しておき、切り出された文字画像が図２３（ｂ）に示すように「Ａ」が９０゜左方向に横向きになっている場合には、参照点Ａ２、Ａ５には文字の画像信号は存在しないので一致度は低く、この文字画像を９０゜ずつ回転していき、参照点との一致度が最も高い回転角を求めてこれを文字の方向として認識するようにしている。
【０００７】
【発明が解決しようとする課題】
ところが上述した従来の天地認識方法においては、特定の文字について参照点における画像信号の有無を比較するだけであるため、そもそも読み取った文字が「Ａ」であるか否かは不明であり、多くの参照文字のデータを内部のメモリに格納してこれを順次切り替えて比較しなければならない。また、仮に切り出された文字が「Ａ」の文字であったとしても、格納した「Ａ」のデータと切り出した文字画像がまったく同じサイズで同じ字体（フォント）であればよいが、文字サイズが異なったり、少しでもフォントが変われば、文字の方向が一致しているにもかかわらず当該参照点の位置に画像信号が位置しないことになり、認識率が著しく低下する。
【０００８】
このように認識対象となる文字のサイズやフォントを予め知ることは不可能であり、仮に知ることができたとしてもそれぞれのフォントやサイズに対応した参照文字のデータを全て装置内に持つことは、大きなメモリ容量が必要になるだけでなく、認識作業にも大変な手間がかかるので、コピー作業の効率を著しく低下し、システムとして機能しないという問題があった。
【０００９】
本発明は、上述のような問題点に鑑みてなされたものであって、原稿の方向を簡単な構成で正確に識別し、適切な方向に画像データを回転して出力できる画像入力装置を提供することを目的とする。
【００１０】
【課題を解決するための手段】
上記目的を達成するため、本発明に係る画像入力装置は、原稿の画像を入力するための装置であって、原稿を読み取って画像データを生成する画像読取手段と、前記画像データを記憶する画像データ記憶手段と、前記画像データから文字画像を抽出する文字切り出し手段と、当該文字画像における複数種類の局所的な形状に関する情報を、複数種類の文字特徴量として抽出する特徴量抽出手段と、所定文字について、前記特徴量抽出手段における文字特徴量と同様な特徴量を、予め辞書データとして複数記憶する特徴量記憶手段と、前記文字特徴量と前記辞書データをその特徴量の種類ごとに比較する比較手段と、前記比較手段における特徴量の種類ごとの比較結果に対して所定の重み付けを行う重み付け手段と、前記重み付け手段における重みを、前記特徴量の種類ごとに変更する重み変更手段と、前記重み付け手段の出力結果に基づいて文字の方向を認識する認識手段と、前記認識手段の認識結果に基づいて前記画像データを回転する画像データ回転手段とを備えたことを特徴とする。
【００１１】
また、本発明は、前記比較手段が、前記文字特徴量に対して辞書データを所定角度ずつ相対的に回転させて、各回転角における当該文字特徴量と辞書データの一致度を求める回転角評価手段を備え、前記重み付け手段は、上記一致度に対し、その特徴量ごとに設定された重み付け係数を乗じて重み付けを行うことを特徴とする。
【００１２】
さらに本発明は、前記重み変更手段は、操作パネルからの入力により各特徴量の種類ごとの重みを変更することを特徴とする。
また、本発明は、さらに、原稿の文章の種類を入力する操作手段を備え、前記重み変更手段は、前記操作手段により入力された原稿の文章の種類に応じて前記各特徴量の種類ごとの重みを変更することを特徴とする。
【００１３】
また、さらに、本発明は、前記認識手段が、特徴量の種類ごとに重み付けされた前記一致度を各回転角ごとに加算し、その最大のものが所定の閾値より大きい場合に、その最大の加算値を有する回転角に基づいて文字画像の方向を認識することを特徴とする。
また、さらに、本発明は、前記文字画像における局所的な形状が、文字閉ループ、文字十字交差点、文字Ｔ字交差点、文字端点のうち少なくとも１つの形状であることを特徴とする。
【００１４】
【発明の実施の形態】
以下、本発明に係る画像入力装置を、フルカラーのデジタル複写機に適用した場合について説明する。
（１）フルカラーデジタル複写機全体の構成
まず、図１によりフルカラーデジタル複写機（以下、単に「複写機」という。）の全体の構成を説明する。
【００１５】
同図に示すように、この複写機は、原稿を自動的に搬送する原稿自動搬送部１００と、搬送された原稿の画像を読み取る画像読取部２００と、読み取った原稿画像のデータに基づいて記録シート上に画像を形成するプリンタ部３００と、からなる。
原稿自動搬送部１００は、原稿給紙トレイ１１と、搬送ローラ群１２と、レジストローラ１３と、搬送ベルト１４などから構成される。原稿給紙トレイ１１にセットされた原稿束は、搬送ローラ群１２により一番下の原稿から１枚ずつ下方に給紙され、レジストローラ１３でタイミングを取られ、搬送ベルト１４により画像読取部２００の原稿ガラス板２１の原稿読取位置まで搬送される。
【００１６】
そして、画像読取部２００で画像をスキャンされた後、再び、搬送ベルト１４が駆動され、排紙ローラ１５を経て原稿排紙トレイ１６上に排出される。
また、この原稿の裏面もスキャンする場合には、原稿の先端が排紙ローラ１５に至る直前で、切換爪１７により原稿の搬送路を反転ローラ１８方向に切り替え、当該反転ローラ１８により原稿の向きを反転させて再び原稿ガラス板２１方向へ移送するようになっている。
【００１７】
画像読取部２００は、上記原稿ガラス板２１の原稿読取位置に搬送された原稿の画像を光学的に読み取るものであって、スキャナ２２、集光レンズ２３、ＣＣＤイメージセンサ２４、スキャナモータＭ２などから構成される。
スキャナ２２には、露光ランプ２５とこの露光ランプ２５の照射による原稿からの反射光を原稿ガラス板２１に平行な方向に光路変更するミラー２６が設置されて、スキャナモータＭ２により駆動されて図の矢印方向に移動することにより原稿ガラス板２１上の原稿をスキャンする。
【００１８】
スキャナモータＭ２としてパルスモータが使用されており、スキャナ２２の位置は、ホームポジションに設置された光電式のスキャナホームセンサＳＥ１による検出位置を基準として、その位置からの移動量、すなわちパルスモータのステップ数に基づいて制御される。
原稿からの反射光は、ミラー２６に反射された後、ミラー２７、２８および集光レンズ２３を介してＣＣＤカラーイメージセンサ（以下、単に「ＣＣＤセンサ」という）２４のセンサ面まで導かれ、ここで電気信号に変換されて各色成分（Ｒ，Ｇ，Ｂ）ごとの画像データが生成される。
【００１９】
なお、ミラー２７、２８は対となって、スキャナ２２の移動速度の半分の速度で同一方向に移動するようになっており、これによりスキャナ２２から集光レンズ２３までの光路長を一定に保ち、常に原稿画像がＣＣＤセンサ２４のセンサ面で結像するように構成されている。
ＣＣＤセンサ２４で生成された画像データは、制御部４００内の画像信号処理部４２０（図２参照）においてＡ／Ｄ変換されてデジタル信号となり、さらにシェーディング補正や濃度変換、エッジ強調などの必要な処理を加えられた後、色成分ごとに画像メモリ４３１（同図２）に格納される。
【００２０】
画像メモリ４３１に格納された画像データは、後述するように原稿判別部５００でなされた天地認識の結果に応じて回転処理され、最終的に、シアン（Ｃ）、マゼンタ（Ｍ）、イエロー（Ｙ）、黒（Ｋ）の印字用データに変換されて、プリンタ部３００の露光ヘッド部３１０に出力され、あるいは、通信インターフェース４５１から電話回線等を介して他の複写機やコンピュータなどに送信される。
【００２１】
プリンタ部３００は、公知の電子写真方式により、コピー用紙やＯＨＰ用のフィルムシートなどの記録シート上に画像を形成するものであって、露光ヘッド部３１０と、画像形成プロセス部３２０と、給紙部３３０と、再給紙部３４０と、からなる。
露光ヘッド部３１０は、上述のシアン（Ｃ）、マゼンタ（Ｍ）、イエロー（Ｙ）、黒（Ｋ）の印字用データに対応して、４つの露光ヘッド３１１ｃ、３１１ｍ、３１１ｙ、３１１ｋを備えており、それぞれ、レーザダイオードとポリゴンミラー等を備える。
【００２２】
また、画像形成プロセス部３２０も、同じく、Ｃ，Ｍ，Ｙ，Ｋの各印字用データに対応して、４つの画像形成ユニット３２１ｃ、３２１ｍ、３２１ｙ、３２１ｋを備えており、それぞれ、感光体ドラム３２２ｃ、３２２ｍ、３２２ｙ、３２２ｋを中心にしてその周囲にクリーナ、帯電チャージャおよび現像器などを配設して構成され、上記露光ヘッド部３１０によるレーザビームの露光走査を受けて、各感光体ドラム３２２ｃ、３２２ｍ、３２２ｙ、３２２ｋにその色成分に応じたトナー像が形成される。
【００２３】
例えば、シアンの印字用データが露光ヘッド３１１ｃのレーザダイオード３１２ｃに出力されると、レーザダイオード３１２ｃから変調されたレーザ光が発光され、このレーザ光が、所定の角速度で回転するポリゴンミラー３１３ｃのミラー面で反射して、図１の時計回りに回転駆動される感光体ドラム３２２ｃ表面を露光走査し、これにより感光体ドラム３２２ｃ表面に静電潜像が形成される。感光体ドラム３２２ｃに形成された静電潜像は、現像器３２３ｃによりシアンのトナー粒子の供給を受けて、トナー像として顕像化される。
【００２４】
一方、給紙部３３０には、異なるサイズの記録シートを収納する３つの用紙カセット３３１〜３３３が設けられており、上述の感光体ドラム３２２ｃにおける作像動作に同期して、例えば用紙カセット３３１から所定サイズの記録シートが給紙されて、転写用搬送ベルト３３４により感光体ドラム３２２ｃの下方の転写位置まで搬送され、転写チャージャ３２４ｃの静電力により感光体ドラム３２２ｃ表面のトナー像が当該記録シート表面に転写される。
【００２５】
このような画像形成動作が他の露光ヘッド３１１ｍ、３１１ｙ、３１１ｋ、および画像形成ユニット３２１ｍ，３２１ｙ，３２１ｋにおいてタイミングをずらしながら実行され、記録シート上に各色のトナー像が重ねて転写されることによりフルカラーの画像が再現される。
その後、記録シートは、定着部３２７で定着され、再給紙部３４０内の搬送路３４１を経由して排紙トレイ３４２上に排出される。
【００２６】
もし、この記録シートの裏側にも印字する場合（いわゆる両面コピーの場合）には、再給紙部３４０の切換爪３４３の方向を変えて記録シートを搬送路３４４方向に導き、一旦反転用搬送路３４５に押し出してから、図示しない搬送ローラにより搬送路３４６を介して中間トレイ３４７へ送り出し、記録シートの表裏が反転した状態で収納する。そして、当該中間トレイ３４７内の記録シートを転写用搬送ベルト３３４に給紙することにより、その裏面への画像形成を実行し、その後、定着部３２７を経由して排紙トレイ３４２上に排出する。
【００２７】
なお、プリンタ部３００におけるＳＥ２は、タイミングセンサであって、転写用搬送ベルト３３４上の基準マーク（不図示）を検出し、これにより記録シートの搬送のタイミング合わせが行われる。また、各画像形成ユニット３２１ｃ、３２１ｍ、３２１ｙ、３２１ｋの内部にはそれぞれレジスト補正センサ３２５ｃ、ｍ、ｙ、ｋが内蔵されており、転写用搬送ベルト３３４上の上記基準マークを順次検出することにより、各色成分の印字用データの出力のタイミングを微調整し、各色成分による画像形成の色ずれを防止するようにしている。
【００２８】
また、転写用搬送ベルト３３４を掛け渡した複数のローラの内、図の１番右側のローラ３２８は、昇降可能なフレーム（図示せず）に軸支されており、黒のみの単色画像の形成時には、当該フレームを図示しない昇降装置により下方に移動させることにより、補助ローラ３３４ａより右側の部分の転写用搬送ベルト３３４が、画像形成ユニット３２１ｃ，３２１ｍ，３２１ｙの各感光帯ドラム３２２ｃ，３２２ｍ，３２２ｙから離脱するようになっている。この際、転写チャージャ３２６ｃ，３２６ｍ，３２６ｙも上記フレームと共に下方に移動する。
【００２９】
これにより単色画像形成時には、転写用搬送ベルト３３４が、感光体ドラム３２２ｃ，ｍ，ｙと非接触状態となり、該当する画像形成ユニット３２１ｃ，ｍ，ｙの駆動を停止することができるため、各感光体ドラム３２２ｃ，ｍ，ｙやその周辺のプロセスユニットの摩耗を低減することができる。
なお、画像形成ユニット３２１ｃ、ｍ、ｙ、ｋは、それぞれ各プロセス毎に一体化されて本体に着脱可能になっており、トナーの交換等のメンテナンスが容易なようになっている。また、画像読取部２００の前面の操作しやすい位置には、操作パネル７０（図２参照）が設置されており、これにより操作者がコピー開始やコピー部数の設定などの所定の入力操作を行う。
（２）制御部４００の構成
次に、上記複写機の内部に設置される制御部４００の構成を図２のブロック図により説明する。
【００３０】
同図に示すように制御部４００は、画像読取制御部４１０と、画像信号処理部４２０と、メモリ制御部４３０と、プリンタ制御部４４０と、外部通信制御部４５０と、メイン制御部４６０と、原稿判別部５００等からなる。
各制御部４１０〜４６０および原稿判別部５００は、それぞれＣＰＵを中心として構成されており、コマンドラインＣＲを介して、相互に必要なデータやコマンドの授受を行い、また、画像データバスＧＢを介して画像データの転送が行われるようになっている。
【００３１】
画像読取制御部４１０は、上記原稿自動搬送部１００および画像読取部２００の動作を制御して原稿の読取を実行させるものである。すなわち、操作パネル７０から所定のコピーモードが設定されてコピー開始の操作がなされると、メイン制御部４６０を介して原稿読取要求を受取り、原稿自動搬送部１００の動作を制御して原稿を画像読取部２００の原稿ガラス板２１上の所定位置まで搬送し、その後、画像読取部２００各部の動作を制御して、スキャナ２２により原稿をスキャンさせ、ＣＣＤセンサ２４により読み取られた画像データを、画像信号処理部４２０に送信する。
【００３２】
画像信号処理部４２０は、Ａ／Ｄコンバータ、シェーディング補正部、ＭＴＦ補正部や、変倍部、γ補正部などを備えており、入力された原稿の画像データは、Ａ／Ｄコンバータでデジタルの多値信号に変換され、シェーディング補正部で露光ランプ２５の照度ムラやＣＣＤセンサ２４の感度ムラが補正された後、ＭＴＦ補正部でエッジ強調などの画質改善のための処理を受け、さらに変倍部やγ補正部でそれぞれ変倍処理、γ補正処理を加えられた後に、原稿判別部５００およびメモリ制御部４３０に送られる。
【００３３】
原稿判別部５００は、上記画像データに基づいて、読み取った原稿の方向を判断して、所定の回転角信号を発生し、あるいは、当該原稿が紙幣などコピー禁止の対象となる特定の原稿の場合には、コピー禁止信号を発生する。詳しくは後述する。
メモリ制御部４３０は、上記画像データを２値化し、あるいはさらに符号化処理して、ページ単位で画像メモリ４３１に格納すると共に、メイン制御部４６０からの読出し要求を受けて、画像メモリ４３１から目的のページの画像データを読み出して（圧縮されている場合には伸長処理を行ってから）多値データに戻し、上記原稿判別部５００からの回転角度信号により回転処理部４３２で必要に応じて画像データを回転処理してから、プリンタ制御部４４０に転送する。なお、この回転処理は、画像データのメモリアドレスを変更する公知の技術（例えば、特開昭６０ー１２６７６９号公報参照）によってなされる。
【００３４】
プリンタ制御部４４０は、上記メモリ制御部４３０から出力された画像データについて、内部のＲＯＭに格納された制御プログラムに基づいてプリンタ部３００各部の動作を制御して記録シートへの画像形成を実行する。
外部通信制御部４５０は、他の複写機やファクシミリ装置またはコンピュータなどの外部機器との画像データなどの授受を制御するものであって、当該外部機器から通信インターフェース４５１を介して受信した画像データを上記画像メモリ４３１に格納し、反対に自装置の画像読取部２００で読み取った原稿の画像データを通信インターフェース４５１を介して外部機器に送信する処理を行う。
【００３５】
また、メイン制御部４６０は、操作パネル７０からの各種のキー入力を受け付けて、設定されたコピーモードを各制御部４１０〜４５０に報告し、あるいは、各制御部４１０〜４５０からの連絡を受けて必要な内容を操作パネル７０の表示部に表示させたりするほか、処理ルーチンの時間を管理しながら各制御部４１０〜４５０、原稿判別部５００に対してそれぞれの動作のタイミングを指示して、全体を統一的に制御し、円滑なコピー動作を実現させる。また、原稿判別部５００からコピー禁止信号を受けた場合は、プリンタ制御部４４０に画像形成動作を実行しないように指示を送る。
（３）原稿判別部５００の構成
図３は、上記原稿判別部５００の構成を示すブロック図である。
【００３６】
なお、当該ブロック図において、普通の実線の矢印は通常のデータもしくは制御信号の流れを、太い実線の矢印は画像データの流れを、太い破線の矢印は、これら以外の文字の特徴量に関するデータの流れを、それぞれ示している。
この原稿判別部５００は、画像読取部２００で読み取られた原稿の画像データに基づき、２つの処理を実行する。すなわち、▲１▼当該原稿が紙幣などの特定原稿であるか否かを判別して、特定原稿と判定される場合にはメイン制御部４６０にコピーを禁止するコピー禁止信号を出力する特定原稿判別処理と、▲２▼画像読取部２００で読み取られた原稿の方向を判別して適切な方向で画像データが出力されるようにメモリ制御部４３０に回転角信号を出力する原稿方向判別処理（すなわち天地認識処理）である。
【００３７】
前者の特定原稿判別処理は、特定色抽出回路５１０からの出力に基づきＣＰＵ５０１で実行され、後者の天地認識処理は、カラーデータキャンセル回路５２０、文字切り出し回路５３０、特徴量抽出回路５４０、さらに辞書データ発生回路５６０を経た後、最終的に比較回路５８０においてなされる比較結果に基づきＣＰＵ５０１で実行される。
【００３８】
以下、上記２つの処理に分けて説明する。
（３−１）特定原稿判別処理
画像読取部２００で読み取られ、画像信号処理部４２０で所定の処理を施されたＲ，Ｇ，Ｂの各色成分の画像データが画像データバスＧＢ（図２）を介して、特定色抽出回路５１０に入力されると、特定色抽出回路５１０は、これらの画像データに基づいて予め設定された特定色の色面積を求め、これにより当該原稿が特定の原稿であるか否かを判別する。
【００３９】
当該特定色抽出回路５１０は、図４のブロック図に示すように色空間変換回路５１１と、３個の特定色カウンタユニット５１２〜５１４、およびＯＲ回路５１５とからなる。
色空間変換回路５１１は、入力されたＲ，Ｇ，Ｂの画像データの値を、輝度（Ｙ）と２つの色度（Ｃｒ、Ｃｂ）からなる色空間の色信号に変換する回路である。このような色空間への変換は、一般にテレビジョンなどにおける色再現のための公知の技術であるので、ここでの詳細な説明は省略する。
【００４０】
Ｒ，Ｇ，Ｂのデータ値のままでは、帯域幅も広くなりデータ処理も複雑になるため、上述のようにＹ、Ｃｒ、Ｃｂの色信号に変換することにより、「色」を比較的帯域の狭い色信号で特定することが可能となり、次に述べる特定色カウンタユニット５１２〜５１４での色判定を容易にさせる。
色空間変換回路５１１で得られたＹ、Ｃｒ、Ｃｂの色信号は、それぞれ、特定色カウンタユニット５１２〜５１４に入力される。
【００４１】
このうち特定色カウンタユニット５１２は、色判定部５１２１〜５１２３、カウンタ５１２４〜５１２６およびＡＮＤ回路５１２７からなり、各色判定部５１２１〜５１２３は、それぞれ色空間変換回路５１１で変換されたＹ、Ｃｒ、Ｃｂの色信号の値により、当該画素が指定された特定の色であるか否かを判定する。そのため、例えば、各色判定部５１２１〜５１２３は、それぞれ複数のコンパレータを内部に有し、各コンパレータには、自己の判定部に指定された特定色にについて、そのＹ，Ｃｒ，Ｃｂの下限値と上限値が設定されており、これらのコンパレータの出力結果により、各色信号値の全てについて所定の範囲内にあると判断された場合には、当該画素の色が当該指定された特定色であるとして、それぞれ次段のカウンタ５１２４〜５１２６にカウントアップ信号を送信する。
【００４２】
各カウンタ５１２４〜５１２６では、対応する色判定部５１２１〜５１２３からカウントアップ信号を得るたびにカウントを「１」だけインクリメントしていき、それぞれＣＰＵ５０１により設定された所定の閾値を超えると、ＡＮＤ回路５１２７に色面積一致信号を出力するようになっている。
ＡＮＤ回路５１２７は、カウンタ５１２４〜５１２６のいずれもから色面積一致信号を受けると論理信号「１」を出力し、ＯＲ回路５１５を介して特定色カウントアップ信号をＣＰＵ５０１に送る。
【００４３】
図３に戻り、ＣＰＵ５０１は、この特定色カウントアップ信号を受けた場合には、当該原稿が特定原稿であると判断して、メイン制御部４６０にコピー禁止信号を送信する。メイン制御部４６０は、このコピー禁止信号を受けて、操作パネル７０からの操作の受付けを拒否すると共に、プリンタ制御部４４０に対し当該画像データに基づく画像形成動作を禁止する。
【００４４】
このように特定色カウンタユニット５１２は、読み取ったカラー原稿の画像データについて、３種類の特定色の画素数（色面積）をカウントし、各特定色の画素数が全て所定の閾値より大きい場合のみ、特定色カウントアップ信号を生成し、これにより当該原稿のコピーが禁止される。
例えば、コピー禁止の対象となる原稿が１万円札である場合には、この紙幣に使用されている特徴的な色を３色選択し、各特定色を判定できるように色信号Ｙ、Ｃｒ、Ｃｂに分解して表したときの各色信号値の上限値と下限値を３つの特徴色ごとに色判定部５１２１〜５１２３内部のコンパレータに設定すると共に、その特定色を有する画素をカウントしてその合計値を各カウンタ５１２４〜５１２６に閾値として設定しておく、そして原稿を読み取って得られた画像データの特定色の画素数が選択された３色について共に上記閾値より多い場合には、その原稿を１万円札とみなしてコピー禁止信号を発生し、これによりカラーデジタル複写機の悪用を事前に防止することができる。
【００４５】
紙幣には、通常の印刷では使用されない特徴的な色が使用されており、紙幣以外の原稿において当該特徴的な色が３色の全部について所定の色面積以上となる可能性はほとんどなく、上記構成により当該原稿がほぼ確実に１万円札であると判別しうる。
また、このようなコピー禁止の動作を免れるため、わずかにコピー倍率を変更して特定色の画素数のカウントに誤差を生ぜしめるような場合も考えられる。このような場合には、ＣＰＵ５０１により当該コピー倍率の設定に連動してカウンタ５１２４〜５１２６に与える閾値も変更するようにしておけばよい。
【００４６】
なお、他の特定色カウンタユニット５１３、５１４も上述の特定色カウンタユニット５１２と同じ構成であって、それぞれのコピー禁止の対象となるカラー原稿に応じて各色判定部における色信号の上限・下限の値や各カウンタにおける画素数の閾値が異なって設定されているだけでなので説明を省略する。これらにより、上記一万円札のほか五千円札や千円札も判別することが可能となり、そのコピーを禁止することができる。
【００４７】
以上のような特定原稿判別方法によれば、極めて簡易かつ容易に特定原稿が判別されることになる。
すなわち、従来の複写機においては、特定原稿のパターンを抽出し、予め内部に設定されたパターンとマッチングすることにより特定原稿か否かを判別するようになっていたので、当該パターン画像を内部のメモリに格納しておく必要があり、新紙幣が発行されてその模様が変更された場合には、当該新紙幣のパターンを新たに登録しなければならない不便さがあり、その上、パターンマッチングのための制御プログラムも複雑であるという問題もあったが、本実施の形態においては、複数の特定色の色面積のみで判断しているので、複雑な制御プログラムは一切不要となり上述のような簡易なハード回路のみで、リアルタイムに特定原稿を判別でき、しかもＣＰＵ５０１により各色信号の上限・下限値や対応する特定色の画素数の閾値を変更するのみで、国内の紙幣のみならず外国紙幣の判別にも容易に対応できる。
【００４８】
また、装置特有のばらつきにより、各色信号の値に多少の誤差や読取値のばらつきがあってもＣＰＵ５０１により上記諸値を補正することにより容易に補正可能となる。
さらに、各特定色カウンタユニット５１２〜５１４における色判定部およびカウンタの数を増加して判定可能な特定色の数を増加すれば、特定原稿の判別精度をより向上させることができ、また、特定色カウンタユニット５１２〜５１４自体の数を増加すれば、より多くの種類の特定原稿を判別することが可能となる。
【００４９】
なお、ＣＰＵ５０１は、原稿中にコピー禁止を示す文字もしくは記号を発見した場合にもコピー禁止信号を発生するが、これについては後述する。
（３−２）天地認識処理
天地認識処理は、大きく分けて、▲１▼原稿画像から文字画像を１文字ずつ切り出す文字切り出し処理と、▲２▼この切り出された文字からその特徴量を抽出する特徴量抽出処理と、▲３▼当該特徴量のうち文字の方向に依存しないデータから天地認識のための候補文字の辞書データを選択する辞書データ生成処理と、▲４▼上記特徴量のうち文字の方向に依存するデータと上記辞書データとを比較して回転角を決定する回転角決定処理と、からなる。
【００５０】
［文字切り出し処理］
図３において、画像メモリ４３１から読み出されたＲ，Ｇ，Ｂの画像データはカラーデータキャンセル回路５２０に入力され、ここで有彩色のカラー画像データを白データに置き換える処理がなされる。
具体的には、例えば、Ｒ、Ｇ、Ｂの画像データを、上記特定色抽出回路５１０における色空間変換回路５１１（図４）と同じ色空間変換回路を用いて、Ｙ、Ｃｒ、Ｃｂの色信号に変換する。一般に、Ｃｒ，Ｃｂの値が小さいほど無彩色に近いので、「０」に近い所定の閾値を予め設定しておき、画素ごとにＣｒ、Ｃｂの値と閾値と比較して、双方の値が当該閾値より小さい場合には、無彩色の画像データとみなして当該画素のＹの値をそのまま出力し、Ｃｒ，Ｃｂの少なくとも一方が、上記閾値より大きな場合には、カラー画像データとみなして当該画素のＹの値を「白」に相当する値に置き換えて出力するようにすればよい。
【００５１】
このように有彩色のカラー画像データを予めキャンセルするのは、読み取った原稿がカラー写真画像であるような場合には、天地認識を行うにあたり不要なデータであり、また新聞や雑誌の見出しなどに用いられるカラー文字は、デザイン上の処理が施されていたり、意図的に傾いて配置されていたりして、文字の方向を認識を行うのに適していないと考えられるからである。このような誤認識のおそれのあるデータを予め除外することにより以降の天地認識処理をより確実にすることができる。
【００５２】
カラーデータキャンセル回路５２０から出力された画像データ（輝度信号Ｙ）は濃淡の階調を含むので、次の２値化回路５２１により２値化して不要な階調情報を除去し、以後のデータ処理をさらに容易かつ確実にする。
この２値化回路５２１は、ＣＰＵ５０１から与えられた所定のパラメータに基づき、上記画像データを「０」と「１」に２値化し、ヒストグラム生成回路５２２と文字切り出し回路５３０のそれぞれに出力する。
【００５３】
ヒストグラム生成回路５２２は、上記２値化された画像データの濃度値を主走査方向と副走査方向に積分したヒストグラムを生成する。図５は、このヒストグラム生成の例を示す図である。原稿１枚分の２値画像データＤ１を主走査方向に積分すると第１のヒストグラムＨ１のようになり、副走査方向に積分すると第２のヒストグラムＨ２のようになる。これらの第１、第２のヒストグラムＨ１，Ｈ２がヒストグラムデータとしてヒストグラムメモリ５２３に格納される。
【００５４】
文字切り出し回路５３０は、このヒストグラムデータに基づき２値画像データから１文字ずつ文字画像を切り出す。
このような文字切り出しの処理自体は公知の技術であり、上記図５の第１のヒストグラムＨ１の分布を見れば分かるようにヒストグラムの谷の部分が行間を示しており、これにより、まず各行ごとに画像データを抽出し、抽出された各行を副走査方向に積分して第３のヒストグラムを得る。この第３のヒストグラムにおいてほぼ等間隔に生じる積分値の谷部は文字間を示している筈であり、この位置により１文字分の画像データが文字画像として切り出されることになる。
【００５５】
文字切り出し回路５３０は、上記文字切り出し処理の結果に基づき、当該切り出した文字画像のサイズ（画素数）を示す「ＸＹ信号」と、白黒比を示す「Ｂ／Ｗ信号」をＣＰＵ５０１に出力する。
ＸＹ信号は、切り出された文字画像の横方向の画素数Ｘと縦方向の画素数Ｙの積として表され、Ｂ／Ｗ信号は、当該文字画像中の線部分を示す画素（２値化された「１」の部分。これを以下、「黒画素」という）の数Ｂを、線部以外の画素（２値化された「０」の部分。以下、「白画素」という。）の数Ｗで除した値として示される。
【００５６】
ＣＰＵ５０１は、これらの情報を基づき所定の閾値と比較して当該切り出された文字がその向きを認識する上で適しているか否かを判定し、当該文字が大サイズの場合や黒画素が多い場合には、ＲＥＴＲＹ信号を生成して文字切り出し回路５３０に送信して、次の文字画像の切り出しを促す。詳しくは後述する。
［特徴量抽出処理」
文字切り出し回路５３０は、上記ＲＥＴＲＹ信号を受信しない限り、当該切り出した文字の画像データを次段の特徴量抽出回路５４０に出力する。
【００５７】
この特徴量抽出回路５４０は、入力された画像データに基づき、当該文字を特徴付ける複数の局所的形状、すなわち閉ループ、十字交差点、Ｔ字交差点、端点（これらを以下、単に「特徴形状」という。）や要素数などを抽出して所定のデータを生成する回路であって、図６に示すように外接長方形比率抽出回路５４１、要素数抽出回路５４２、閉ループ抽出回路５４３、十字抽出回路５４４、Ｔ字抽出回路５４５、端点抽出回路５４６、細線化処理回路５４７、エラーチェック回路５４８、特徴データ並び変え回路５４９とからなる。
【００５８】
外接長方形比率抽出回路５４１は、切り出されたＸＹドットの文字画像の縦横の比率（Ｘ／Ｙ）を計算し、これを比率情報として８ｂｉｔのデータで表して出力する。
要素数抽出回路５３２は、文字を構成する要素の数（例えば、「く」は１個、「い」は２個、「ば」は４個）を抽出し、その要素数を個数情報として３ｂｉｔ（最大８個）で表して出力する。このような要素数は、公知の画像処理技術により得ることができる。例えば、文字画像の左上画素を初期点として副走査方向にラスタ走査を実行し、最初に黒画素を発見すると、これを追跡開始点として所定方向に文字の線部の外側の輪郭の画素を追跡していき（この処理を以下「輪郭線追跡処理」という。）、再び追跡開始点の黒画素に帰着したときに、当該輪郭線で囲まれた領域が１個の要素であると判断されるので、このような追跡走査を繰り返すことにより、当該文字の全要素数を抽出することができる。
【００５９】
上記以外の閉ループ抽出回路５４３、十字抽出回路５４４、Ｔ字抽出回路５４５および端点抽出回路５４６には、ＣＰＵ５０１から辞書サイズ切り替え信号が与えられており、各抽出回路５４３〜５４６は、当該切り替え信号の内容に応じて特徴量抽出のための解像度を切り替えるようになっている。
具体的には、文字切出回路５３０で切り出された文字画像を３×３の９ブロックもしくは５×５の２５ブロックに分割し、各ブロック内で特徴形状を抽出する。この際、例えば、閉ループ抽出回路５４３において一つのブロック内を走査して閉ループを一つでも発見すれば、もうそのブロック内における閉ループの走査は行わず、次のブロック内の閉ループの走査に移る。したがって、３×３の方が、５×５の場合よりも抽出速度が早くなるが、１つのブロック内に２つの閉ループがあっても１個としかカウントしないことになるので、５×５の場合よりも解像度が劣ることになる。後述する辞書データ発生回路５６０に格納された辞書データもこの解像度に合わせて作成されているので、以下、このような解像度の区別をその分割ブロック数に基づき、３×３辞書サイズ、５×５辞書サイズと呼ぶことにする。
【００６０】
このようなＣＰＵ５０１からの辞書サイズの指定に基づき、閉ループ抽出回路５４３では、文字画像内に存在する閉ループを分割されたブロックごとに検出し、その個数（例えば、「く」は０個、「は」は１個、「ぱ」は２個）および、当該閉ループの位置を求め、閉ループについての個数情報および位置情報を出力する。
【００６１】
この閉ループの抽出も公知の画像処理技術により行うことができ、例えば上述の輪郭線追跡処理により、まず文字の要素を抽出し、次に当該要素内部を走査して白画素の領域の数を上記要素数の抽出の場合と同様にして抽出することによって達成できる。
そして、抽出された当該閉ループの個数を３ｂｉｔ（最大８個）で表して個数情報として出力する。
【００６２】
その一方で、当該閉ループの文字画像における相対的位置から位置情報が生成される。この位置情報は、分割されたブロックごとに閉ループの有無を判断して生成される。
具体的に図７を参照して、切り出された文字が「ぱ」、「ぬ」であった場合における閉ループの位置情報の生成について説明する。
【００６３】
図７（ａ）は、「ぱ」の文字画像を３×３の９ブロックに分割した図である。１１〜３３までの各ブロックに対応するｂｉｔが用意され、位置情報は当該閉ループを有するブロックに対応するｂｉｔを「１」に、それ以外のｂｉｔを「０」にそれぞれセットすることにより生成される。「ぱ」の場合、ブロック１３と３２に閉ループＬ１、Ｌ２が存するので、当該ブロックに対応するｂｉｔが「１」にセットされることになる。なお、ブロック２２に閉ループが位置しても、この位置情報は文字の回転に依存しないので、天地認識のデータとしては不要であり、本実施の形態では、このブロック２２を除くブロック数８に対応した８ｂｉｔで閉ループの位置情報を示すようにしている（同様に、５×５辞書サイズの場合は２４ｂｉｔとなる）。
【００６４】
一方、「ね」の場合、図７（ｂ）に示すように１個の閉ループＬ３をブロック３２と３３にまたがって有している。この場合の位置情報は、閉ループＬ３内の白画素をより多く含むブロック、すなわち、図７（ｂ）の例では、ブロック３２に閉ループＬ３が位置すると判断して、そのブロックに対応するｂｉｔを「１」セットして位置情報を生成することになる。
【００６５】
上記外接長方形比率抽出回路５４１、要素数抽出回路５４２および閉ループ抽出回路５４３では、文字切り出し回路５３０から出力された画像データを加工しないまま各抽出処理を行ったが、以下に述べる十字抽出回路５４４、Ｔ字抽出回路５４５、端点抽出回路５４６においては、それらの抽出処理を容易かつ確実に行うため、予め細線化処理回路５４７において文字の線部（線図形）の幅を狭くする細線化処理を行う。
【００６６】
この細線化処理においては、主に次の要件が充足される必要がある。
（ｉ）線幅が１（１画素単位）となる。
（ｉｉ）線の位置はもとの線図形のほぼ中心にくる。
（ｉｉｉ）図形の連結性が保存される。
（ｉｖ）線図形の端の部分が必要以上に縮退しない。
【００６７】
このような細線化処理を行うため、画像処理の分野において従来から様々な細線化処理の方法が提案されているので、ここでの具体的な説明は省略する。
細線化処理回路５４７で細線化された文字画像のデータは、十字抽出回路５４４、Ｔ字抽出回路５４５、端点抽出回路５４６にそれぞれ出力される。
十字抽出回路５４４では、細線化された画像データに基づいて、分割されたブロックごとに十字交差点を検出して、その個数情報および位置情報を生成する。
【００６８】
十字交差点の抽出は、例えば、特定の黒画素（以下、「注目画素」という。）を中心にしてその周囲の隣接画素（８近傍）を走査し、当該注目画素に隣接する黒画素数Ｍを検出する。当該画像データは細線化処理回路５４７で細線化されているため、注目点の８近傍同士で黒画素が隣接することはないので、Ｍ＝４の場合には、当該注目画素は十字交差点であると判断できる。
【００６９】
この走査をブロックごとに実行していけば、当該文字画像における十字交差点の個数が判明する。例えば、「く」は０個、「さ」は１個、「き」は２個である。
十字交差点の位置は、文字の方向に合わせて変化するので、その位置は天地認識のための有用な情報となる。この位置情報は上述の閉ループの位置情報の場合と同様、十字交差点が存在するブロックに対応するｂｉｔを「１」にセットすることにより、３×３辞書サイズの場合は９ｂｉｔ、５×５辞書サイズの場合は２５ｂｉｔで表現される。
【００７０】
Ｔ字抽出回路５４５は、細線化された画像データについて、Ｔ字交差点を分割されたブロックごとに検出して、その個数、位置および隣接方向の情報を生成する。
このＴ字交差点は、上述の十字交差点抽出において注目画素の８近傍の黒画素数Ｍ＝３である場合に検出され、この走査をブロックごとに実行することにより、当該文字画像におけるＴ字交差点の個数が判明する。例えば、「く」は０個、「と」は１個、「エ」は２個となる。
【００７１】
これに合わせて、当該Ｔ字交差点の位置情報を生成する。この位置情報は上述の十字交差点の場合と同様にして生成される。
Ｔ字交差点の隣接方向も、文字の方向により異なるため天地認識のため有用な情報である。このＴ字交差点の隣接方向は、（上／下／左／右）の計４種類の隣接方向があり、例えば、上記「と」におけるＴ字交差点の隣接方向は「上」となり、これらを当該Ｔ字交差点の存するブロックについて２ｂｉｔの信号として表現し、分割されたブロック数×２のｂｉｔ数で表現する。
【００７２】
端点抽出回路５４６は、細線化された画像データについて、その文字端点を分割されたブロックごとに検出して、その個数、位置および隣接方向の情報を生成する。端点は、上述の十字交差点検出において注目画素の８近傍の黒画素数Ｍ＝１である場合に検出され、この検出動作をブロックごとに実行することにより、当該文字画像における端点の個数が判明する。例えば、「の」は１個、「く」は２個、「エ」は４個である。
【００７３】
これに合わせて当該端点の位置情報を生成する。この位置情報は上述の閉ループや十字交差点の場合と同じように、端点が存在するブロックに対応するｂｉｔを「１」にセットすることにより表現される。
端点の隣接方向も、文字の方向により異なるため天地認識のため有用な情報となる。この端点のＴ字交差点の隣接方向は、（上／下／左／右／左上／右上／左下／右下）の計８種類あり、この８種類の隣接方向を３ｂｉｔの信号として表現するので、それぞれの端点に対する隣接方向を分割されたブロック数×３ｂｉｔで表現することになる。
【００７４】
ＣＰＵ５０１は、上記抽出回路５４３〜５４６に辞書サイズ切り替え信号を送信して、辞書サイズを切り替えて天地認識に必要な解像度で各特徴量を抽出するように指示するが、この切り替え動作の詳細については後述する。
以上のようにして、各抽出回路５４１〜５４６で生成された１２種類の情報は、文字の方向に依存しないデータ、すなわち、各抽出回路５４２〜５４６からの個数情報と、文字の方向に依存するデータ、すなわち、外接長方形比率抽出回路５４１からの比率情報およびその他の抽出回路５４２〜５４６からの位置情報や隣接方向情報とに２分することができ、以下、前者の情報を「特徴量個数情報」と総称し、後者の情報を「特徴量データ」と総称することにする。
【００７５】
上記特徴量個数情報と特徴量データは、次段のエラーチェック回路５４８に入力され、そのうち特徴量個数情報と、特徴量データのうちの比率情報の各値が、それぞれについて予め定められた閾値以下であるか否か判定され、ひとつでも所定の閾値を超える場合には、抽出された特徴量が、天地認識を行う上で適当ではないと判断される。
【００７６】
例えば、切り出された文字が「購」という文字であった場合、閉ループ抽出回路５４３から出力された閉ループの個数は、５×５辞書サイズでは、７内至９個となると考えられるが、後述する辞書データにはそのような複雑な文字のデータが格納されていないので、当該切り出し文字は天地認識に適当な文字ではない。そこで、辞書データから予め閉ループの個数情報の上限値を求めて、これをエラーチェック回路５４８内部のコンパレータ等に閾値として設定しておき、入力された閉ループの個数情報が当該閾値を超える場合に特徴量抽出エラー信号を発生してＣＰＵ５０１に送信する。
【００７７】
ＣＰＵ５０１は、このエラー信号を受信すると、次の文字画像の切り出しを行うためにＲＥＴＲＹ信号を文字切り出し回路５３０に送信して新たな文字切り出しを実行させると共に、現在の抽出済みの特徴量の情報を破棄する。
なお、上記各抽出回路５４１〜５４６における特徴量抽出や、エラーチェック回路５４８における特徴量抽出チェックは全てハード回路により行われ、ＣＰＵ５０１は当該エラーチェック回路５４８からの特徴量抽出エラー信号をチェックするだけなので、高速な処理が可能である。
【００７８】
また、エラーチェック回路５４８に設定される上記閾値は、３×３辞書サイズの方が５×５辞書サイズの場合よりも少なく設定される。これは、３×３辞書サイズの場合には１つのブロックサイズが大きく、その中に２個以上の同種の特徴量が含まれても上述のように特徴量の個数をブロックごとに最大１個しかカウントしないようにしているので、それだけ５×５辞書サイズの場合より特徴量のカウント数が少なくなることによるものである。
【００７９】
各抽出回路５４１〜５４６で抽出された特徴量個数情報および比率情報のいずれもがエラーチェック回路５４８でのチェックをパスすると、特徴量個数情報および特徴量データが次段の特徴データ並び変え回路５４９に送られる。特徴データ並び変え回路５４９は、これらの特徴量の情報を、それぞれ辞書データ発生回路５６０、比較回路５８０で処理しやすい順序に並び変えて出力する。
【００８０】
特に特徴量データは、後述する辞書データ発生回路５６０から出力される辞書データと同じ順に並び変えられ、ＣＰＵ５０１からの辞書データ切り替え信号を受けて、８ｂｉｔ単位で共通バス上に出力されるようになっており、このような構成にすることにより、少ないビット幅のバスで複数の特徴量データを効果的に扱うことができ、回路の簡略化を可能にすると共に、比較回路５８０における辞書データとの比較処理を容易にすることができる。
【００８１】
［辞書データ発生処理］
次に辞書データ発生回路５６０について説明する。
辞書データ発生回路５６０は、特徴量抽出回路５４０から特徴量個数情報を受信すると、内部に格納された複数の文字の中から当該特徴量個数情報に適合するものを認識候補文字としてリストアップし、この認識候補文字について予め格納されている特徴量データを辞書データとして所定の順序で比較回路５８０に出力する。
【００８２】
この辞書データ発生回路５６０は、図８のブロック図に示すように、辞書アドレス発生回路５６１、ＲＥＴＲＹカウンタ５６２、辞書データＲＯＭ５６３、切り替え信号カウンタ５６４とからなり、辞書アドレス発生回路５６１と辞書データＲＯＭ５６３には辞書サイズ切り替え信号が、切り替え信号カウンタ５６４には特徴データ切り替え信号が、それぞれＣＰＵ５０１により与えられる。
【００８３】
辞書データＲＯＭ５６３には、次の（表１）に示す天地認識用の２５６個の文字もしくは記号について（以下、単に「参照文字」という。）、３×３，５×５の２種類の辞書サイズごとに上述の特徴量データに相当するデータ（辞書データ）が予め求められて格納されている。
【００８４】
【表１】

一方、辞書アドレス発生回路５６１は、特徴量個数情報（計１５ｂｉｔ）とＲＥＴＲＹカウンタ５６２からの３ｂｉｔおよび辞書サイズ切り替え信号（１ｂｉｔ）の計１９ｂｉｔをアドレスとして、上記辞書データＲＯＭ５６３内の対応する辞書データのアドレスを８ｂｉｔのデータとして出力する２５６ＫＢｙｔｅのＲＯＭテーブル（以下、「アドレス発生ＲＯＭテーブル」という。）として構成されている。
【００８５】
具体的にこのアドレス発生ＲＯＭテーブルの作成手順について説明すると次のようになる。すなわち、まず、２５６個の各参照文字について、予めその個数情報を上述の手順で３×３、５×５の辞書サイズごとに求めておき、その個数の組合わせごとに２５６文字を分類する。図９は、上記（表１）の参照文字のうち、ひらがなの４６文字について、その４つの特徴形状（閉ループ、十字交差点、Ｔ字交差点、文字端点）の個数および要素数を５×５辞書サイズで求めてリストアップしたものである。
【００８６】
この図表から、例えば、（閉ループ数、十字交差数、Ｔ字交差数、文字端数、要素数）＝（０、０、０、４、２）個という個数情報の組合せに該当するひらがなは、「い」、「う」、「こ」、「り」の４文字あることが分かる。
したがって、当該個数情報の組合わせに対して、ひらがなではこの４文字が後の比較回路５８０で比較の対象となるための認識候補文字としてリストアップされ、当該特徴量個数情報に関係付けられてアドレス発生ＲＯＭテーブルに格納される。これと同様にして他の参照文字についても個数情報の組合せごとの分類が実行され、アドレス発生ＲＯＭテーブル内に格納される。
【００８７】
また、本実施の形態では、上記ＲＯＭテーブル内に同一の特徴量個数情報について最大８個の認識候補文字を格納できるできるようになっており、当該ＲＯＭテーブルにより入力された特徴量個数情報に該当する認識候補文字の個数Ｎが判明すると、その個数を辞書数信号（３ｂｉｔ）としてＣＰＵ５０１に送信するようになっている。
【００８８】
ＣＰＵ５０１は、上記辞書数信号により、所定の特徴量個数情報に該当する認識候補文字の個数Ｎを知ることができ、辞書ＲＥＴＲＹ信号をＲＥＴＲＹカウンタ５６２に送信して、そのカウント値を最高Ｎまで更新することにより上記複数の認識候補文字からを１文字ずつ選択していく。
したがって、例えば、上述の認識候補文字の「こ」は、（閉ループ数、十字交差数、Ｔ字交差数、文字端数、要素数）＝（０、０、０、４、２）を示す特徴量個数情報（１５ｂｉｔ）と、３番目を示すＲＥＴＲＹカウンタ５６２からのカウント数（３ｂｉｔ）により選択されることになる。
【００８９】
実際には、アドレス発生ＲＯＭテーブルには、各文字が８ｂｉｔで示される文字コードで格納されており、上述のように認識候補文字として「こ」が選択されるとその文字コードが辞書アドレスとして辞書データＲＯＭ５６３に送られる。辞書データＲＯＭ５６３は、上記辞書アドレス（８ｂｉｔ）と辞書サイズ切り替え信号（１ｂｉｔ）と切り替え信号カウンタ（５ｂｉｔ）をアドレスとし、該当する文字の辞書データを８ｂｉｔずつ出力する１６ＫＢｙｔｅのＲＯＭテーブル（以下、「辞書発生ＲＯＭテーブルという」）として構成されている。
【００９０】
図１０は、当該辞書発生ＲＯＭテーブル内に各文字コードごとに格納されている辞書データの構成を示す図であり、同じ文字コードについて左側は３×３辞書サイズ、右側は５×５辞書サイズの辞書データが格納され、それぞれ各アドレスごとに８ｂｉｔ単位で比率情報、閉ループ情報および特徴点データ情報が格納されている。
【００９１】
同図のデータ欄において、「比率情報」は、文字の外接する長方形の縦横比を８ｂｉｔで表わしている。
また、「閉ループ情報」は、上述の閉ループ位置情報に相当する情報である。この情報は、図７で説明したのと同様な方法で求められ、例えば、３×３辞書サイズにおけるひらがなの閉ループの位置は、図１１で○印を付した位置となり、当該ブロックに対応するｂｉｔが「１」にセットされる。これによれば、３×３辞書サイズの場合には９ｂｉｔ、５×５辞書サイズの場合には２５ｂｉｔが必要となるが、上述のように中央の閉ループの有無は、文字の方向には関与しないので、天地認識には不要のデータであり、それぞれ１ｂｉｔを削減し、３×３辞書サイズの場合には、８ｂｉｔ（１Ｂｙｔｅ）、５×５辞書サイズの場合には２４ｂｉｔ（３Ｂｙｔｅ）のデータで表現され、前者は１個のアドレスに、後者は３個のアドレス（閉ループ情報１、２、３）に分けて格納される。
【００９２】
「特徴点データ」は、十字交差点、Ｔ字交差点、端点の３種類の特徴点についての位置情報もしくは隣接方向情報を総称するものであり、分割されたブロックにおける各特徴点の有無やその隣接方向を該当するブロックごとに８ｂｉｔずつのデータとして表現される。
図１２は、３×３辞書サイズにおける当該特徴点データの格納状態をビットプレーンで示す図である。
【００９３】
同図に示すように各ブロック（ＭＡＴ３＿１１〜３３）における各特徴点の有無または隣接方向の情報を示すビットプレーンが手前から奥に８種類用意されており、これらのビットプレーンのデータを各ブロック毎にまとめたものをそれぞれ８ｂｉｔ（１Ｂｙｔｅ）の特徴点データＭＡＴ３＿１１〜３３（図１０の左側）として取り扱っている。従って、３×３辞書サイズの場合には９個のブロックに分割されているため、この特徴点データは、１文字について９Ｂｙｔｅのデータとして表現される。
【００９４】
このような特徴点データの作成も基本的には、上記特徴量データの抽出の際に説明したのと同様な方法でなされ、まず、（表１）の各参照文字を図１３の一例に示すように３×３の９ブロックに分割する。
そして、十字位置情報は、ビットプレーンのＭＡＴ３＿１１〜３３のうち、文字の十字交差点が存するブロックのｂｉｔを「１」とし、それ以外のブロックのｂｉｔを「０」とする。同様にＴ字位置情報や端点位置情報も当該特徴量の位置するブロックのｂｉｔを「１」とし、それ以外のブロックのｂｉｔを「０」とする。
【００９５】
また、Ｔ字隣接方向情報は、Ｔ字交差点の存するブロックにおいてＴ字の隣接方向を２ｂｉｔデータで示すようになっている。すなわち、隣接方向が、（上／左／右／下）に応じて「００」、「０１」、「１０」、「１１」で示されており、このため２枚のビットプレーン（Ｔ字隣接方向情報ｂｉｔ１、２）が用意されている。
【００９６】
端点隣接方向情報は、端点の存するブロックにおいてその隣接方向を３ｂｉｔデータで示す。すなわち、隣接方向が、（上／下／左／右／左上／右上／左下／右下）に応じて「０００」、「００１」、「０１０」、「０１１」、「１００」、「１０１」、「１１０」、「１１１」で示しており、このため３つのビットプレーン（端点隣接方向情報ｂｉｔ１、２、３）が用意されている。
【００９７】
図１４は、辞書サイズ５×５の場合の特徴点データのビットプレーンを示す図であり、図１５の一例に示すように（表１）の各参照文字を２５のブロックに分割し、各ブロックについてｂｉｔを割り当て、上述の３×３辞書サイズの場合と同じ要領で特徴点データを作成する。各ブロックにおける特徴点データは８ｂｉｔ（１Ｂｙｔｅ）で示されるので、上記特徴点データは１文字につき、１×２５＝２５Ｂｙｔｅのデータとして表現されることになる。
【００９８】
以上のような辞書データが、（表１）に示す全２５６個の参照文字について予め作成され、その文字コードごとに辞書データＲＯＭ５６３（図８）の辞書発生ＲＯＭテーブルに格納されており、辞書アドレス発生回路５６１から出力された上記辞書アドレス（文字コード）、ＣＰＵ５０１からの辞書サイズ切り替え信号および特徴データ切り替え信号の受信状態に応じて必要なデータを図１０のアドレス番号××０１（３×３辞書サイズの場合）もしくは××２１（５×５辞書サイズの場合）からそのアドレス番号順に８ｂｉｔずつ、比較回路５８０（図３）に出力される。
【００９９】
前述したようにＣＰＵ５０１からの特徴データ切り替え信号は、上記切り替え信号カウンタ５６４のほかに特徴量抽出回路５４０の特徴データ並び変え回路５４９（図６）にも与えられており、特徴データ並び変え回路５４９は、切り出した文字から抽出された特徴量データをその辞書サイズに応じて上記図１０の格納状態と同じ順序になるように並び変え、上記特徴データ切り替え信号を受けるたびに並び変え処理後の特徴量データを８ｂｉｔずつ比較回路５８０に出力するようになっており、これにより、特徴量抽出回路５４０で述べたのと同様に少ないｂｉｔ幅のバスを介して効率よくデータを送信できると共に、比較回路５８０での比較処理が容易となり、そのハード回路も簡易化できるという利点がある。
【０１００】
［回転角決定処理］
比較回路５８０は、辞書データ発生回路５６０から出力された辞書データを９０゜ずつ回転したものと、特徴量抽出回路５４０から出力された特徴量データを比較し、各回転角における特徴量データと辞書データの一致度に関する情報を生成する一方、内部の特定文字辞書と比較して、当該切り出された文字がコピー禁止を意味する特定の文字と認められる場合にコピー禁止情報を生成する。
【０１０１】
図１６は、上記比較回路５８０の構成を示すブロック図である。
同図に示すように比較回路５８０は、入力部と出力部にそれぞれ配設されたセレクタ５８１、５８２と、特定文字辞書５８３と、３×３辞書サイズに対応した回転角評価回路５８４・特定文字評価回路５８５と、５×５辞書サイズに対応した回転角評価回路５８６・特定文字評価回路５８７とを備える。
【０１０２】
特定文字辞書５８３には、通常のコピー禁止文書に含まれる特定の文字、例えば「秘」の文字を丸印で囲んだいわゆる「マル秘」文字に関する辞書データ（この辞書データを上記辞書データ発生回路５６０から出力された天地認識のための辞書データと区別するため、以下「禁止辞書データ」という。）が、辞書サイズ３×３と５×５ごとに予め格納され、セレクタ５８１に与えられる。
【０１０３】
特徴量抽出回路５４０、辞書データ発生回路５６０から同種の特徴量データと辞書データが、それぞれセレクタ５８１に入力されると、セレクタ５８１は、ＣＰＵ５０１から送られてくる辞書サイズ切り替え信号の内容に応じて、当該特徴量データおよび辞書データの送り先を切り替える。
以下、ＣＰＵ５０１から３×３辞書サイズの切り替え信号が送信されている場合について主に説明するが、５×５辞書サイズの場合についても、ほぼ同様に処理される。
【０１０４】
セレクタ５８１は、３×３の辞書切り替え信号を受信すると、特徴量データを、回転角評価回路５８４と特定文字評価回路５８５に、辞書データを回転角評価回路５８４に送る。一方、特定文書辞書５８３にも辞書サイズ切り替え信号が与えられており、これにより３×３辞書サイズの禁止辞書データが選択され、セレクタ５８１は、これを特定文字評価回路５８５に送る。
【０１０５】
回転角評価回路５８４は、図１７のブロック図に示すように、閉ループ評価回路５９０、縦横比評価回路５９１、特徴点評価回路５９２と、各評価回路５９０〜５９２からの出力値にそれぞれ所定の係数Ｋ１〜Ｋ３を掛けて重み付けを行う重み付け回路５９３〜５９５と、この重み付け回路からの出力値を回転角ごとに加算する加算回路５９６と、この重み付けの結果で最大のものを抽出する最大値抽出回路５９７とからなっており、各回転角ごとに特徴量データと辞書データを比較してその一致度を求め、このうち最も高いもの抽出して、これを完全に一致した場合に対するパーセンテージに換算して一致度情報とすると共にそのときの回転角を回転角情報としてＣＰＵ５０１に出力する。
【０１０６】
すなわち、特徴量データと辞書データは、その内容ごとに、閉ループ評価回路５９０と縦横比評価回路５９１と特徴点評価回路５９２に入力され、各評価回路５９０〜５９２は、入力された辞書データを９０°単位で回転させる回転処理回路を有しており、それぞれの回転角で回転させた辞書データと特徴データの内容を分割されたブロックごとに対照して一致度を算出する。
【０１０７】
ここで算出される一致度とは、縦横比評価回路５９１を除いて、対応するｂｉｔのセット状態の一致を排他的論理和の否定形（一致したときのみ「１」とする）を用いて判断し、これに基づいて得られる評価ポイントを加算することにより得られる。
例えば、閉ループ評価回路５９０では、閉ループの有無を、分割されたブロック数に相当する９ｂｉｔ（５×５辞書サイズでは２５ｂｉｔ）の内、上述したように中央のブロックの１ｂｉｔを除いた他の８ｂｉｔ（同２４ｂｉｔ）について対応するブロックごとに辞書データと比較し、全てのｂｉｔが一致すれば８ポイント（同２４ポイント）が付与される。
【０１０８】
また、縦横の比率情報は分割ブロック数に無関係なので、縦横比評価回路５９１では次のようにして比率情報の一致度を評価する。すなわち、辞書データの縦横比Ａと特徴量データの縦横比Ｂの比率Ａ／Ｂを求め、一致度が高い程、すなわちＡ／Ｂが１に近いほど高ポイントとなるようにする。例えば、｜Ａ／Ｂ−１｜＜０．１のとき、８ポイント、Ｏ．１≦｜Ａ／Ｂ−１｜＜０．２のとき７ポイント・・・というようにＡ／Ｂの値と１との誤差の大きさにより０〜８ポイントを付与するようになっている。
【０１０９】
この場合、縦横比という性質上、０°と１８０°の評価ポイントと、９０°と２７０°の評価ポイントはそれぞれ一致し、また、この評価ポイントは、上述のようにブロックの分割数とは関係なしに求められるので、当然辞書サイズには依存しない。
特徴点評価回路５９２では、分割されたブロックにおける３つの特徴点（十字交差点、Ｔ字交差点、端点）に関する特徴点データ（図１０参照）ついて比較する。
【０１１０】
各特徴点データは、図１２（図１４）で示したように８種類のビットプレーンの情報を各ブロックごとに８ｂｉｔで表現されており、辞書データとの一致度は次のようにして求められる。
すなわち、十字位置情報ついては、当該ブロックでの有無が辞書データと一致すればそのまま１ポイント与える。Ｔ字交差点、端点の位置情報については、当該ブロックでのＴ字交差点もしくは端点の有無が辞書データと一致しても、「有」の場合にはさらにその隣接方向の情報を比較して、当該隣接情報も一致している場合のみ１ポイントを与えるようにする。「無」で一致している場合には、隣接情報を比較するまでもなくそのまま１ポイントが与えられる。
【０１１１】
従って一つの特徴点について全てのブロックでの情報が一致すれば９ポイント（５×５辞書サイズの場合は、２５ポイント）が与えられ、３種類の特徴点の全てについて完全に一致した場合には、最高ポイントとして２７ポイント（同７５ポイント）が与えられることになる。
以上のような評価処理が、閉ループ評価回路５９０、縦横比評価回路５９１、特徴点評価回路５９２において、対応する辞書データを０゜、９０゜、１８０゜、２７０゜に回転しながら実行され、各回転角での評価ポイントが次段の重み付け回路５９３〜５９４に出力され、それぞれの評価ポイントに重み付け係数Ｋ１、Ｋ２、Ｋ３が乗算されて加算回路５９６に出力される。
【０１１２】
ここで各特徴量データの評価ポイントに重み付けにより軽重を付するのは、各特徴量データについて得られた評価の結果が文字方向の認識（すなわち天地認識）に与える影響は必ずしも均等ではなく、原稿の内容によっては評価の比重を変更した方がより正確に天地認識を行える場合があると考えられるからである。
例えば、原稿が通常の日本語の文章では、ひらがな占める割合が原稿全体の６〜７割もあり、天地認識する上で非常に重要な役割をもっているため、この場合にはひらがなに多く含まれる閉ループの評価ポイントを高くして、その影響力を高くする方が、他の縦横比などにおける評価ポイントを参考にするよりも効果的に天地認識を行える。そこで、重み付け回路５９４における係数Ｋ２を、他の重み付け回路５９３、５９４における係数Ｋ１、Ｋ３より大きくすることにより、天地認識の精度を高めることができる。
【０１１３】
また、原稿にアルファベットの文字が多い場合には、天地認識のためには、特徴点データの評価ポイントが影響力が大きいと考えられるため、係数Ｋ３の値を他の係数Ｋ１，Ｋ２より大きくするようにすればよい。これらの係数Ｋ１〜Ｋ３の値は、実験的もしくは経験的に求め得るものであって、これらを予めＣＰＵ５０１内部のメモリに格納しておき、必要に応じて、例えば、操作パネル７０に原稿の種類を入力するスイッチを設けて、これにより操作者が予め文章の種類を入力することにより、各重み付け回路５９３〜５９５設定されるようにしておけばよい。
【０１１４】
このようにして各重み付け回路５９３〜５９５により評価の比重を変更された評価ポイントは、加算回路５９６において回転角ごとに上記評価項目の個数分だけ加算され、次段の最大値抽出回路５９７に出力される。
最大値抽出回路５９７は、各回転角における加算ポイントのうち最大のものを抽出し、その加算ポイントを、完全に一致した場合の最大ポイントに対するパーセンテージに換算して「一致度情報」とすると共に、そのときの角度を「回転角情報」として、ＣＰＵ５０１に送信する。
【０１１５】
図１６に戻り、特定文字評価回路５８５では、各回転角ごとに特徴量データと禁止辞書データが比較される。この特定文字評価回路５８５の構成も基本的には、上記回転角評価回路５８４における動作と同じであって、各回転角において特徴量データと禁止辞書データと比較して評価ポイントを算出し、その最大の評価ポイントが内部に設定された所定の閾値を超えた場合に、「マル秘」などのコピー禁止文字であると判定し、コピー禁止信号をセレクタ５８２を介してＣＰＵ５０１に送信する。
【０１１６】
ＣＰＵ５０１は、比較回路５８０からコピー禁止情報を受けた場合には、コピー禁止信号をメイン制御部４６０（図２）に送信し、メイン制御部４６０は、さらにメモリ制御部４３０、プリンタ制御部４４０にコピー禁止の指示を送って、当該原稿のコピー動作を実行させないようにする。通常、コピー禁止文句は原稿の上部に記載されていることが多いが、原稿下部に記載されている場合や、原稿の上部であってもたまたま当該原稿が上下逆さまである場合も考えられるので、上記特定文字評価処理は、原稿１ページ分の文字の全てについて行う必要がある。そのため、特定文字の評価時間が長くなりコピー動作が遅延する場合も考えられるので、例えば、装置内部に施錠可能なスイッチボックスを設けて内部にモード切り替えスイッチを設置するか、あるいは操作パネルから暗証コードを入力することにより、特定の者のみが必要に応じて当該特定文字の認識を行わないモードに切り替え可能なようにしておけば便利である。
【０１１７】
一方、ＣＰＵ５０１は、比較回路５８０から出力された上記一致度情報の値と内部に設定されている所定の閾値とを比較して、当該一致度情報の値が閾値より大きい場合には、切り出された文字と参照文字が一致した結果であると判断し、その回転角情報の回転角を示す信号を回転角信号としてメモリ制御部４３０に送信する。
【０１１８】
メモリ制御部４３０は、当該原稿の画像データを上記ＣＰＵ５０１から指定された回転角だけ回転処理する。そして、原稿１ページ分の特定文字の評価に必要な時間を経過してもＣＰＵ５０１が比較回路５８０から上記コピー禁止情報を受信せず、かつ、特定色抽出回路５１０から特定色カウントアップ信号を受信しない場合には、当該原稿はコピー禁止の対象となる原稿ではないと判断して、上記回転処理された画像データをプリンタ制御部４４０に出力し、これにより記録シート上に正しい方向で原稿画像が再生される。
【０１１９】
なお、一致度情報の値が内部に設定された閾値より低い場合には、辞書サイズを切り替えて再評価し、もしくは次の文字の切り出しを実行して、上記特徴量抽出回路５４０、辞書データ発生回路５６０、比較回路５８０での処理を天地認識が完了するまで繰り返す。詳細は後述する。
（４）制御部４００における動作
図１８は、制御部４００で実行される制御動作のメインルーチンを示すフローチャートである。
【０１２０】
装置に電源が投入されると、まず、各ＣＰＵ内部のレジスタなどの初期設定が行われる（ステップＳ１、Ｓ２）。この際、辞書サイズ切り替え信号も初期値として３×３辞書サイズに設定される。
その後、待機中処理として直接コピー動作には関与しない定着部３２７（図１）の温度制御や操作パネルの表示制御などが行われ（ステップＳ３）、操作パネル７０のスタートキーが押下されてコピー開始の指示があると（ステップＳ４）、原稿自動搬送部１００で原稿を順次原稿ガラス板２１に搬送して、スキャナ２２で走査し、読み取った画像データを画像信号処理部４２０で画像処理して、画像メモリ４３１に原稿１ページごとに書き込む画像入力処理を行う（ステップＳ５）。
【０１２１】
そして、画像メモリ４３１から所定の原稿１ページ分の画像データを読み出し、原稿判別部５００において、文字の方向を認識して原稿の天地認識処理を行い（ステップＳ６）、この天地認識処理の結果、原稿の画像データを適切な方向に回転する必要がある場合には、回転処理部４３２で必要な回転角だけ回転処理を行う（ステップＳ７）。
【０１２２】
次に、当該原稿がコピー禁止の対象であるか否かを判断する（ステップＳ８）。すなわち、上述のように原稿がコピー禁止の対象となっている、紙幣やコピー禁止文書であると原稿判別部５００で判断されて、そのコピー禁止信号をメイン制御部４６０が受信すると、プリンタ制御部４４０に対し画像形成処理を行わないように指示を送り、そうでない場合には、画像形成処理を実行させ（ステップＳ９）、その後ステップ３の待機中処理にリターンする。
【０１２３】
図１９、図２０は、上記ステップＳ６の天地認識処理のサブルーチンを示すフローチャートである。
まず、図１９のステップＳ６０１において、ＣＰＵ５０１は、ＲＥＴＲＹ信号発して文字切り出し回路５３０に画像メモリ４３１の画像データから文字画像を切り出すように指示する。
【０１２４】
文字切り出し回路５３０は、この信号に基づいて上述したように１文字分の文字画像を切り出し、その横画素数Ｘと縦画素数Ｙの積で示される文字サイズをＸＹ信号とすると共に黒画素と白画素の比をＢ／Ｗ信号として、それぞれＣＰＵ５０１に送信する。ＣＰＵ５０１は、まず、ＸＹ信号により、当該切り出された文字が所定サイズ以上の大サイズの文字でないか否かを判定する（ステップＳ６０２）。ここでいう大サイズの文字は、縦横の文字サイズが例えば１０ｍｍ以上（４００ｄｐｉでは、ＸまたはＹが１５７ｄｏｔを超えるもの）を示す。
【０１２５】
このように文字のサイズを判定するのは、通常の原稿に用いられる文字としてこれほど大サイズのものはあまり使用されないし、仮に新聞等において見出しとして大サイズの文字が使用されていたとしても、強調文字や傾いた文字などかなりデフォルメされている可能性が高く、天地認識の対象とする文字としては適当でないと考えられるからである。
【０１２６】
次に、ＣＰＵ５０１は、Ｂ／Ｗ信号により、切り出された文字画像における黒画素と白画素の比Ｂ／Ｗが所定値、例えば、１以上ではないか否かを判定する（ステップＳ６０３）。Ｂ／Ｗ比が、１以上、すなわち黒画素が全体の画素の５０％以上ある場合には、当該文字は、極端にデフォルメされた太字もしくは反転文字であると考えられるので、これもまた天地認識の対象文字としては適当ではなく、予め排除しておく方が望ましい。
【０１２７】
ＣＰＵ５０１は、上述の判定の結果、文字サイズもしくはＢ／Ｗ比がそれぞれの所定値を超える場合には、文字切り出しのエラーがあったものとみなして（ステップＳ６０４でＹｅｓ）、再び文字切り出し回路５３０にＲＥＴＲＹ信号を発して、次の文字の切り出しを実行させる。
一方、ステップＳ６０４において、文字切り出しエラーであると判断されなかった場合には、その切り出された画像データは特徴量抽出回路５４０に送られると共に、ＣＰＵ５０１は、３×３の辞書サイズで処理するように特徴量抽出回路５４０、辞書データ発生回路５６０、比較回路５８０の各部に当該辞書サイズ切り替え信号を送信する（ステップＳ６０５）。
【０１２８】
そして、上述した特徴量抽出回路５４０における各抽出回路５４１〜５４６（図６）により当該文字の特徴量の抽出を行って（ステップＳ６０６）、エラーチェック回路５４８においてその比率情報および、要素数、閉ループ、十字交差点、Ｔ字交差点、端点の各個数情報がそれぞれ３×３辞書サイズについて設定された閾値以上ではないかを判定する（ステップＳ６０７）。
【０１２９】
もし、一つの情報でも、その情報に該当する閾値を超えていれば、ステップＳ６０８において特徴量抽出エラーと判断され、その信号（特徴量抽出エラー信号）がＣＰＵ５０１に送られ、ＣＰＵ５０１は、現在の辞書サイズが３×３であるか否かを判断するが（ステップＳ６１１）、初期設定において上述のように３×３辞書サイズに設定されているので、より解像度の高い５×５辞書サイズでさらに正確な特徴量の抽出を実行させるべく、５×５辞書サイズへの辞書切り替え信号を特徴量抽出回路５４０等に送信する（ステップＳ６１２）。
【０１３０】
これにより特徴量抽出回路５４０は、５×５辞書サイズで再度特徴量の抽出を実行した後、各特徴量の個数情報についてエラーチェックを行い（ステップＳ６０６、Ｓ６０７）、それでもなお特徴量抽出エラー有りと判断された場合には（ステップＳ６０８でＹｅｓ）、ステップＳ６１１に移るが、このときにはすでに５×５辞書サイズとなっているので、「Ｎｏ」と判断されてステップＳ６０１に戻って、ＲＥＴＲＹ信号により次の文字の切り出しを指示し、新たに切り出された文字について上述のステップＳ６０２以下の処理を実行する。
【０１３１】
図２１は、上記ステップＳ６０８での特徴量抽出のエラーチェックと辞書切り替え動作（ステップＳ６１１、Ｓ６１２）の関係を示す図である。同図において特徴量数は上方にいくほど多くなっているが、上述のように縦横比率情報や要素数は辞書サイズには依存しないので、ここでの特徴量数は、当該比率情報および要素数を除く４つの特徴形状（閉ループ、十字交差点、Ｔ字交差点、端点）の各個数情報を意味している。
【０１３２】
まず、３×３辞書サイズで特徴量の抽出が行われ、このときの特徴量個数が３×３辞書サイズにおける特徴量抽出エラー値（閾値）を超えた場合には、次に５×５の辞書サイズに切り替えて特徴量の抽出を行う。上述したように縦横比率情報や要素数を除く各個数情報は、同じブロック内に同一の特徴点などが複数含まれていても１個しかカウントしないので、分割ブロック数を多くして解像度を高くするほど正確な個数情報を把握することができる。
【０１３３】
したがって、通常は高速に比較処理が行える３×３辞書サイズで処理を行い、特徴量が多い複雑な文字に対しては正確な比較処理が行える５×５辞書サイズで処理し、それでも特徴量抽出エラーが発生する場合には、そもそも切り出された文字が画数の多い漢字など参照文字に含まれない文字であると判断されるので、切り出し文字自体を切り替えることにより誤判定を防止するのである。
【０１３４】
図２２は、辞書サイズごとの各特徴量における特徴量抽出エラー値を示す図表である。各エラー値には、上述の表１に示した参照文字について３×３辞書、５×５辞書ごとに求められた各特徴量個数情報の最高値が設定されており、上述したように所定の特徴形状については解像度が高い方が抽出される個数情報も多くなるので、そのエラー値も高く設定される。
【０１３５】
なお、同図表で要素数個数情報や端点個数情報のエラー値が大きいのは、上述した「マル秘」の文字は、辞書データ発生回路５６０に内蔵された２５６個の参照文字に比較して要素数、端点とも個数が多く、このようにエラー値を大きくしておかないと当該文字の特徴量データが比較回路５８０に入力される前に、特徴量抽出回路５４０のエラーチェック回路５４８（図６）におけるチェックにより排除されてしまうからである。なお、当該エラー値におけるカッコ内の数値は、マル秘文書の判定によるコピー禁止モードが解除されたときに採用されるべきエラー値を示している。
【０１３６】
図１９に戻り、ステップＳ６０８において特徴量抽出エラーでないと判定された場合には、当該切り出し文字の特量量個数情報に基づき辞書データ発生回路５６０の辞書アドレス発生回路５６１（図８）で参照文字から認識候補文字が選択され、その個数が辞書数信号ＮとしてＣＰＵ５０１に送信される。ＣＰＵ５０１は、この辞書数信号Ｎを確認し（ステップＳ６０９）、辞書ＲＥＴＲＹ信号を辞書データ発生回路５６０の送信して辞書データを出力するように指示する。
【０１３７】
次に、比較回路５８０の回転角評価回路５８４、５８６の各重み付け回路（図１７参照）における重み付け係数Ｋ１〜Ｋ３が設定される（ステップＳ６１０）。この重み付け係数は、上述したように、例えば、原稿に用いられている日本文や英文の種類ごとに予め求められてＣＰＵ５０１内部に格納されており、操作者が原稿の種類を操作パネルから入力することによりＣＰＵ５０１により設定される。
【０１３８】
このような準備が完了してから図２０のステップＳ６１３に移り、辞書データの読み出しを実行する。これは、辞書データ発生回路５６０がＣＰＵ５０１からの辞書ＲＥＴＲＹ信号を受信することにより開始され、当該辞書データ発生回路５６０内のＲＥＴＲＹカウンタ５６２（図８）は、上記辞書ＲＥＴＲＹ信号を受信するたびにカウントアップし、そのカウント値を辞書アドレス発生回路５６１に送信する。辞書アドレス発生回路５６１は、上記Ｎ個の認識候補文字からカウント値に相当する文字を選択してその文字コードを辞書アドレスとして辞書データＲＯＭ５６３に送信する。辞書データＲＯＭ５６３はこの辞書アドレスとＣＰＵ５０１からの辞書サイズ切り替え信号に基づいて図１０で説明したような辞書データを読み出し、ＣＰＵ５０１からの特徴データ切り替え信号の受信によりカウントアップする切り替え信号カウンタ５６４のカウント値に基づいて、該当するアドレスの辞書データを上から順に８ｂｉｔ（１Ｂｙｔｅ）ずつ比較回路５８０に送信する。
【０１３９】
この際、ＣＰＵ５０１からの特徴データ切り替え信号は、辞書サイズが３×３の時は特徴点データが９Ｂｙｔｅであるため９回、辞書サイズが５×５の時は特徴点データが２５Ｂｙｔｅであるため２５回出力されるため、特徴点データの比較だけを考えると辞書サイズが５×５の時は辞書サイズが３×３の時に比べ約２．５倍の処理時間を必要とすることになる
比較回路５８０は、特徴量抽出回路５４０からの特徴量データと、辞書データ発生回路５６０からの辞書データの内容を上述のように回転角度ごとに比較して、それぞれの評価ポイントを算出して一致度を求め、そのうち最大のものを完全に一致した場合に対するパーセンテージに換算し、これを一致度情報としてその回転角に関する情報と共にＣＰＵ５０１に送信する（ステップＳ６１４）。
【０１４０】
ＣＰＵ５０１は、上記一致度情報の値と予め内部に設定されている閾値ＴＨ１（例えば、９５％）と比較し（ステップＳ６１５）、一致度情報の値がこの閾値ＴＨ１を超える場合には、切り取られた文字と辞書データの文字が当該回転角において完全に一致したものとみなして、そのときの回転角情報の角度を回転角信号としてメモリ制御部４３０（図２）に送信し、リターンする（ステップＳ６１９）。
【０１４１】
一方、ステップＳ６１５において比較回路５８０から送信されてきた一致度情報の示す値が閾値ＴＨ１以下の場合には、他の認識候補文字の辞書データを読み出して特徴量データと比較し、得られた一致度情報同士を比較してその最大値を抽出する（ステップＳ６１６）。そのため、ステップＳ６１７で、認識候補文字の辞書数Ｎの全部について比較したか否かを判断し、全部について比較していなければ、ＣＰＵ５０１は辞書ＲＥＴＲＹ信号を送信して、これにより辞書データ発生回路５６０は辞書データを切り替えて出力し（ステップＳ６１３）、この辞書データに基づいて比較回路５８０で新たに求められた一致度情報が上記ＴＨ１を超えておれば、その回転角を回転確信号としてメモリ制御部４３０に送信し、そうでなければ再びステップＳ６１６に移って、一致度情報の最大値の抽出を行う。
【０１４２】
このステップＳ６１６における抽出処理は、Ｎ個の全認識候補文字の辞書データと比較するまで最大（Ｎ−１）回繰り返されることになるが（ステップＳ６１７）、その途中で一致度情報がＴＨ１を超えるものがあれば、そのときの回転角情報を回転角信号とし（ステップＳ６１５でＮｏ、Ｓ６１９）、全ての認識候補文字について一致度情報を求めたにもかかわらず、ＴＨ１を超えるものがなかった場合には（ステップＳ６１７でＹｅｓ）、仕方がないのでステップＳ６１６で抽出された最大の一致度情報を、閾値ＴＨ１より小さな閾値ＴＨ２（例えば、９０％程度）と比較し（ステップＳ６１８）、当該一致度情報がこの閾値ＴＨ２以上であれば、そのときの回転角を回転角信号とする（ステップＳ６１９）。
【０１４３】
もし、ステップＳ６１８において、一致度情報の最大値が、閾値ＴＨ２未満であった場合には、ステップＳ６２０に移り、現在の辞書サイズが３×３であるか否かを確認して、辞書サイズが３×３であれば、図１９のステップＳ６１２に移って、辞書サイズを５×５に切り替えて解像度を上げ、この辞書サイズで再度ステップＳ６０６〜Ｓ６１９の処理を実行する。
【０１４４】
また、図２０のステップＳ６２０において、すでに辞書サイズ５×５に切り替えられていた場合には、当該切り出した文字が、天地認識に不適当な文字であったとみなして、図１９のステップＳ６０１に戻って、切り出し文字を切り替え、以下上述の天地認識処理の動作を繰り返すことになる。
以上のように、本実施の形態においては、予め認識の対象となる２５６個の参照文字に関する辞書データを内部に格納しておき、文字切り出し回路５３０で切り出された文字について、特徴量抽出回路５４０において文字の方向に依存しない特徴量個数情報と文字の方向に依存する特徴量データを生成し、まず、特徴量個数情報に基づいて上記２５６文字の中から認識候補文字を選択して、これらの限定された数の辞書データと切り出した文字の特徴量データとを比較するので、比較処理の回数を極端に低減して、天地認識のための処理時間を大幅に減少させることができ、最短の場合には１回の一致度情報の比較により文字の方向が判定できる。
【０１４５】
しかも、特徴量の抽出および辞書データとの比較などの処理は、全てハード回路で達成できるので、複雑なパターン認識のアルゴリズムの実行は不要であり、さらに迅速な処理が可能となる。
また、切り出した文字についても、予め天地認識の判定の難しそうな文字については、上記文字切り出しエラーの判定（図１９、ステップＳ６０４）や特徴量抽出エラーの判定（同図、ステップＳ６０８）において予め除外しているので、辞書データと異なる文字について比較を行って、偶然、比較結果がよかった場合の誤認識の防止が可能となる。
（５）変形例
以上、本発明に係る画像入力装置の実施の形態を説明してきたが、本発明は、上述の実施の形態に限定されないのは勿論であり、以下のような変形例を考えることができる。
【０１４６】
（５−１）上記実施の形態においては、天地認識のための特徴量として、閉ループ、十字交差点、Ｔ字交差点、端点などの文字特有の局所的形状の位置情報あるいは隣接方向情報を抽出して文字方向の判定に利用した。このような情報量が多いほど天地認識の確実性が増すことはいうまでもないが、認識する文字によっては、そのうち一部の情報に基づいて方向を判定することも可能であり、必ずしも全ての情報は必要ではない。
【０１４７】
また、反対に、上記実施の形態では、切り出した１文字についてその一致度情報が閾値ＴＨ１（ＴＨ２）より大きい場合に、すぐにその回転角を原稿方向とみなして画像データの回転処理を行ったが、別の切り出し文字についても確認して、その結果が一致した場合のみ当該回転角を原稿方向と認識するようにすれば、天地認識の精度が増す。
【０１４８】
（５−２）また、上記実施の形態においては、切り出された文字画像について、文字の方向に依存しない特徴量個数情報と、文字の方向に依存する特徴量データの双方を抽出し、特徴量個数情報によってまず比較すべき認識候補文字をリストアップして、その認識候補文字の辞書データと特徴量データを順に比較するようにしたので、極めて効率的かつ迅速に天地認識処理を行うことが可能となったが、場合によっては特徴量個数情報によって認識候補文字をリストアップする処理を行わずに、全ての辞書データと特徴量データを順に比較するようにしてもよい。この場合、上記実施の形態に比べて処理時間が少し長くなるが、それでも従来のパターン照合による処理に比べて迅速かつ正確な天地認識が行える。
【０１４９】
（５−３）上記比較回路５８０における特定文字評価回路５８５、５８７（図１６）においては、特定文字辞書５８３の禁止辞書データを９０゜ずつ回転させて切り出された文字の特徴量データと比較して、コピー禁止文字の判定を行ったが、回転角評価回路５８４、５８６からの回転角情報、一致度情報に基づきＣＰＵ５０１により原稿方向が確定した後に、その回転角で禁止辞書データを回転して特定文字の判定を行うようにしてもよい。
【０１５０】
また、上記実施の形態では、比較回路５８０における特定文字辞書５８３にいわゆる「マル秘」の１文字の禁止辞書データを格納して、読み出された特徴量データがこの辞書データと一致した場合にコピー禁止信号を発生するようにしたが、場合によっては、複数の文字からなる語句、例えば「コピー禁止」という語句の各文字について辞書データ作成して格納しておき、切り出された文字の特徴量データが、「コ」、「ピ」、「ー」、「禁」、「止」の各辞書データと、この順で連続して一致した場合に特定文字評価回路５８５（５８７）よりコピー禁止信号を発生するように構成してもよい。
【０１５１】
（５−４）上記回転角評価回路５８４（５８６）では、辞書データの方を９０゜ずつ回転して特徴量データと比較しているが、特徴量データの方を回転して比較してもよいのは勿論である。この場合には回転処理部４３２により画像データを回転する方向が逆となる。
また、通常の原稿は、縦長の原稿に横書きで文字が印刷されているものがほとんどなので、９０゜、２７０゜の回転角での比較を省略してもあまり不都合はないであろう。反対に、９０゜の回転角の幅をもっと小さくして少しずつ回転しながら比較することにより、原稿自動搬送装置１００の搬送ベルト１４の不都合等により、原稿が原稿ガラス板２１の原稿読取位置に斜めに設置された場合でも、正しい方向に画像データを回転して出力することが可能となる。
【０１５２】
（５−５）また、上記実施の形態では、回転角評価回路５８４（５８６）の各重み付け回路に設定された重み付け係数は、日本語や英語など使用される言語による原稿の種類に応じて予め求められてＣＰＵ５０１内部に格納され、操作者が原稿の種類を操作パネルから入力することにより設定されるようにしたが、入力できる原稿の種類を例えば、学術論文や技術資料、一般文書などのように記載内容に基づき細分化し、それらの原稿の種類に応じて、辞書データ発生回路５６０に格納されている参照文字の辞書データを専用のＩＣカードなどにより補充・変更できるようにしておけば、さらに確実な天地認識が可能となる。
【０１５３】
また、各重み付け係数を、操作者が、操作パネル等により直接入力して設定・変更可能とし、これを内部のメモリに登録するようにしておけば、操作者が一番多くコピーする原稿の内容に合わせた重み付けも行うことができ、大変便利である。
（５−６）上記実施の形態においては、本発明に係る画像入力装置を複写機に適用した例を説明したが、その他の原稿の読取が必要な装置、例えばファクシミリ装置における画像入力装置としても適用される。
【０１５４】
【発明の効果】
以上説明してきたように、本発明に係る画像入力装置の構成によれば、特徴量抽出手段において、文字切り出し手段により切り出された文字画像の局所的な形状に関する情報を、複数の文字特徴量として抽出する一方、同様な特徴量を所定の文字について抽出してこれを辞書データとして特徴量記憶手段に記憶しておき、当該文字特徴量と辞書データを文字特徴量の種類ごとに比較する。そしてその特徴量の種類ごとの比較結果に対して重み付けをした結果に基づき文字方向を認識し、この認識結果に基づいて画像データを回転して出力する。当該重みは、重み変更手段により文字の特徴量の種類ごとに変更できるように構成されている。
【０１５５】
これにより文字方向の認識は、パターンの認識によるのではなく、局所的な形状の相対的位置もしくは隣接方向の比較のみで行われるので、当該パターン認識のための複雑なアルゴリズムなどは一切不要であり、簡易なハード回路による迅速な処理が可能となる。しかも、複数の特徴量を抽出しその特徴量の種類ごとの比較結果について、必要に応じて変更される重みにより重み付けをして各比較結果の影響度を調整した上で、文字方向の認識処理が行われるので、その認識精度をより向上することができ、常に適正な方向で画像データを出力することができる。
【０１５６】
また、本発明によれば、前記比較手段が、前記文字特徴量に対して辞書データを相対的に所定角度ずつ回転させながら比較して、各回転角における当該文字特徴量と辞書データの一致度を求め、重み付け手段により上記一致度に対し、その特徴量ごとに設定された重み付け係数を乗じて重み付けを行うようにしているので、認識手段において文字の回転方向を確実に認識するため有効な判断材料を提供することができる。
【０１５７】
さらに、本発明は、前記重み変更手段は、操作パネルからの入力により各特徴量の種類ごとの重みを変更するようにしており、これにより原稿方向の認識に最適な重み付け係数を設定することができる。
また、本発明は、さらに、原稿の文章の種類を入力する操作手段を備え、前記重み変更手段は、前記操作手段により入力された原稿の文章の種類に応じて前記各特徴量の種類ごとの重みを変更するようにしているので、例えば、日本文原稿や英文原稿などの原稿の種類に応じて、それらの原稿に用いられる文字の特徴を予め分析して、原稿の方向の認識に与える影響の大きな文字特徴量の比較結果に対する比重を大きくなるように設定しておけば、原稿方向をより精度よく認識できる。
【０１５８】
また、本発明によれば、前記認識手段が、前記各回転角における一致度の加算値の最大のものが所定の閾値より大きい場合にのみ、その最大の加算値を有する回転角に基づき文字画像の方向を認識するので、当該閾値を高くすることにより、切り出した文字と異なる文字の辞書データとの比較によって生じる誤認識を効果的に排除できる。
【０１５９】
さらに本発明によれば、前記文字画像の局所的な形状が、文字閉ループ、文字十字交差点、文字Ｔ字交差点、文字端点のうち少なくとも１つの形状であり、これらはいずれも文字特有の形状であるので、その相対的位置や隣接方向の情報に基づいてより正確に文字画像の方向を判別できる。
【図面の簡単な説明】
【図１】本発明に係る画像入力装置が適用される複写機の全体の構成を示す図である。
【図２】上記複写機における制御部の構成を示すブロック図である。
【図３】上記制御部における原稿判別部の構成を示すブロック図である。
【図４】上記原稿判別部の特定色抽出回路の構成を示すブロック図である。
【図５】上記原稿判別部のヒストグラム生成回路で生成されるヒストグラムの内容を説明するための図である。
【図６】上記原稿判別部の特徴量抽出回路の構成を示すブロック図である。
【図７】上記特徴量抽出回路における閉ループ抽出回路で抽出される、閉ループの位置情報の内容を説明するための図である。
【図８】上記原稿判別部における辞書データ発生回路の構成を示すブロック図である。
【図９】参照文字のうち、ひらがなの４６文字について、５×５辞書サイズにおける各特徴量個数情報の値を示す図である。
【図１０】上記辞書データ発生回路の辞書データＲＯＭにおける各参照文字ごとの辞書データの内容を示す図である。
【図１１】３×３辞書サイズの場合の上記辞書データに格納される閉ループ位置情報の生成を説明するための図である。
【図１２】上記辞書データにおける３×３辞書サイズの特徴点データの格納状態をビットプレーンにより模式的に示す図である。
【図１３】３×３の辞書サイズにおいて、ひらがなの文字を９ブロックに分割して各特徴点の位置情報を得る場合について説明するための図である。
【図１４】上記辞書データにおける５×５辞書サイズの特徴点データの格納状態をビットプレーンにより模式的に示す図である。
【図１５】５×５の辞書サイズにおいて、ひらがなの文字を２５ブロックに分割して各特徴点の位置情報を得る場合について説明するための図である。
【図１６】上記制御部における比較回路の構成を示すブロック図である。
【図１７】上記比較回路における回転角評価回路の構成を示すブロック図である。
【図１８】上記制御部における制御動作のメインルーチンを示すフローチャートである。
【図１９】図１８のステップＳ６における天地認識処理のサブルーチンを示すフローチャートである。
【図２０】図１９の続きのフローチャートである。
【図２１】辞書サイズの切り替えと特徴量数との関係を示す図である。
【図２２】各辞書サイズにおける特徴量数の抽出エラー値の一例を示す図である。
【図２３】従来の文字方向の認識方法を説明するための図である。
【符号の説明】
１００原稿自動搬送部
２００画像読取部
３００プリンタ部
４００制御部
４１０画像読取制御部
４２０画像信号処理部
４３０メモリ制御部
４３１画像メモリ
４３２回転処理部
４４０プリンタ制御部
４５０外部通信制御部
４６０メイン制御部
５００原稿判別部
５０１ＣＰＵ
５１０特定色抽出回路
５２０カラーデータキャンセル回路
５３０文字切り出し回路
５３２要素数抽出回路
５４０特徴量抽出回路
５６０辞書データ発生回路
５８０比較回路

Claims

原稿の画像を入力するための装置であって、
原稿を読み取って画像データを生成する画像読取手段と、
前記画像データを記憶する画像データ記憶手段と、
前記画像データから文字画像を抽出する文字切り出し手段と、
当該文字画像における複数種類の局所的な形状に関する情報を、複数種類の文字特徴量として抽出する特徴量抽出手段と、
所定文字について、前記特徴量抽出手段における文字特徴量と同様な特徴量を、予め辞書データとして複数記憶する特徴量記憶手段と、
前記文字特徴量と前記辞書データをその特徴量の種類ごとに比較する比較手段と、
前記比較手段における特徴量の種類ごとの比較結果に対して所定の重み付けを行う重み付け手段と、
前記重み付け手段における重みを、前記特徴量の種類ごとに変更する重み変更手段と、
前記重み付け手段の出力結果に基づいて文字の方向を認識する認識手段と、
前記認識手段の認識結果に基づいて前記画像データを回転する画像データ回転手段と、
を備えたことを特徴とする画像入力装置。
前記比較手段は、前記文字特徴量に対して辞書データを所定角度ずつ相対的に回転させて、各回転角における当該文字特徴量と辞書データの一致度を求める回転角評価手段を備え、
前記重み付け手段は、上記一致度に対し、その特徴量ごとに設定された重み付け係数を乗じて重み付けを行うことを特徴とする請求項１記載の画像入力装置。
前記重み変更手段は、操作パネルからの入力により各特徴量の種類ごとの重みを変更することを特徴とする請求項２記載の画像入力装置。
さらに、原稿の文章の種類を入力する操作手段を備え、
前記重み変更手段は、前記操作手段により入力された原稿の文章の種類に応じて前記各特徴量の種類ごとの重みを変更することを特徴とする請求項３記載の画像入力装置。
前記認識手段は、特徴量の種類ごとに重み付けされた前記一致度を各回転角ごとに加算し、その最大のものが所定の閾値より大きい場合に、その最大の加算値を有する回転角に基づいて文字画像の方向を認識することを特徴とする請求項２ないし４のいずれかに記載の画像入力装置。
前記文字画像における局所的な形状は、文字閉ループ、文字十字交差点、文字Ｔ字交差点、文字端点のうち少なくとも１つの形状であることを特徴とする請求項１ないし５のいずれかに記載の画像入力装置。