JPH08307665A - テキスト領域をハイライトする方法 - Google Patents

テキスト領域をハイライトする方法

Info

Publication number
JPH08307665A
JPH08307665A JP8105784A JP10578496A JPH08307665A JP H08307665 A JPH08307665 A JP H08307665A JP 8105784 A JP8105784 A JP 8105784A JP 10578496 A JP10578496 A JP 10578496A JP H08307665 A JPH08307665 A JP H08307665A
Authority
JP
Japan
Prior art keywords
edge
processor
text
pixel
text area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8105784A
Other languages
English (en)
Other versions
JP3857746B2 (ja
Inventor
Darrell E Jefferson
ダレル・イー・ジェファーソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH08307665A publication Critical patent/JPH08307665A/ja
Application granted granted Critical
Publication of JP3857746B2 publication Critical patent/JP3857746B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 長時間の処理と大容量のメモリを必要とする
ことなく、テキストと画像領域を区別すること。 【解決手段】 本発明は、走査線信号の画像領域とテキ
スト領域を区別して、テキスト領域をハイライトする方
法である。この方法は、走査線信号の中の縁の組を識別
することによって始まる。次に、縁の組がテキスト領域
の境界を表すかどうかが決定される。もしそうであれ
ば、次いで、平均画素強度値がテキスト領域について計
算される。その後、値が平均と異なるテキスト領域の中
のこれらの画素の強度は修正されて、修正された走査線
信号が生成される。その結果として、修正された走査線
信号が走査線を再現するために使用されるとき、テキス
トがハイライトされる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキスト/画像分
割を行なうための方法に関する。
【0002】
【従来の技術】ラスタ画像は、一連の走査線信号として
表現される。各々の走査線信号は、画像を横切る多数の
絵要素すなわち画素による一つの水平ストリップを表
し、画素の各々は、仮想的なグリッドの中の位置と値を
有する。画素レベルは、白と黒の間で変化可能な灰色の
階調を示す。8ビットが、画素レベルを表すために使用
され、これはレベルが0および255の間で変化するこ
とを可能にする。典型的には、黒を表すために0が選択
され、白を表すために255が選択される。換言すれ
ば、そのレベルが下がるほど、画素は暗くなる。
【0003】走査線信号によって表現された多くの文書
は、テキストと、グラフィック或いは画像の両方を含
む。テキストとグラフィックを識別して分離する能力
は、多くの画像処理分野で重要である。例えば、高品質
な複写を生成するためには、テキストとグラフィックの
取り扱いを異ならせる必要がある。グラフィック領域
は、連続的に変化する灰色の階調の範囲で表現され表示
される場合には、視覚的に一層満足され、より多くの視
覚的情報を伝達する。これに対して、テキスト領域は、
2階調のみの高コントラストで表現され表示されるとき
に、一層容易に視覚的に区別される。文書のテキストと
画像領域の識別は、テキスト/画像分割として一般に知
られている。
【0004】
【発明が解決しようとする課題】テキスト/画像分割の
いくつかの従来の方法は、グラフィックスを表す形を識
別することを試みることによって、テキストと画像領域
を区別する。これは、多数の走査線信号、多分文書を表
す全ての走査線信号を分析することを必要とする。した
がって、テキスト/画像分割の従来の方法は、それらが
分析されている間、多数の走査線信号をバッファするた
めの大容量のメモリを必要とする。テキスト/画像分割
のこれらの従来の方法は、その上、長い処理時間を必要
とする。テキスト/画像分割の他の従来の方法は、グラ
フィックスからテキストを識別するために異なった解決
法をとるが、前述した方法と同様に、これらの方法も、
長時間の処理と大容量のメモリを必要とする。
【0005】
【発明の実施の形態】図1は、テキスト/画像分割を行
なう本発明の方法を行なう多機能装置のブロック図であ
る。図2Aは、テキスト領域とこれを横切る走査線を示
す。図2Bは、図2Aのテキスト領域を横切る走査線に
関しての画素位置対画素強度のグラフである。図2C
は、図2Dの画像領域を横切る走査線に関しての画素位
置対画素強度のグラフである。図2Dは、画像領域とこ
れを横切る走査線を示す。図3は、画像領域を含む走査
線の中でテキスト領域を識別してハイライトする方法の
流れ図である。図4は、縁を位置付ける方法の流れ図で
ある。
【0006】〔好適な実施態様の詳細な説明〕図1のブ
ロック図は、パーソナルコンピュータ20のユーザを、
紙と文書の電子表現との間で容易に移動することができ
るようにする多機能装置22を示す。多機能装置22
は、文書が用紙に転写されている間に、文書の質も改善
する。多機能装置22は、本発明のテキスト/画像分割
の方法を用いてそれを行う。テキスト/画像分割とテキ
ストの本発明の方法によれば、ハイライトは一度に一つ
の走査線だけ実行される。
【0007】I.システム概観 本発明の方法のより詳細な議論の前に、本発明の方法を
動作させようとする環境を考える。多機能装置22は、
文書をプリントしたり文書をコピーしたりするだけでな
く、ファクシミリ文書を送信したり受信したりする。多
機能装置22は、多機能制御装置24、ファックスモデ
ム26、スキャナ28、および、プリンタ30により、
これらのタスクを実行する。図示されていないが、多機
能装置22は、陰極線管(CRT)のような追加のディ
スプレイ装置を含んでもよい。多機能制御装置24は、
多機能オペレーティングシステム32を用いる入力/出
力装置26,28、および、30の動作と協働を制御す
る。多機能オペレーティングシステム32は、適切な命
令シーケンスを選択し、それは、実行のためにプロセッ
サ34へ送られる。多機能オペレーティングシステム3
2は、記憶装置の中に格納されたソフトウェアとして実
現することができる。好適には、多機能オペレーティン
グシステム32を実現するのに使用されるのは、Mic
rosoftat Work(商標)である。
【0008】ファックスモデム26、スキャナ30、プ
リンタ28、ネットワークポート21、多機能制御装置
24は、それらが取り扱う文書を、走査線信号を使用し
て表す。スキャナ30は、プリンタ28が走査線信号を
使用して記録媒体の上に画像を記録する間、ハードコピ
ー文書の上の画像から走査線信号を発生させる。ファッ
クスモデム26と多機能制御装置24は、パーソナルコ
ンピュータ20、ネットワークポート21、電話線、プ
リンタ28、または、スキャナ30から受信した走査線
信号を使用して、電子媒体と紙の間の情報の移動を可能
にする。
【0009】多機能オペレーティングシステム32の機
能性は、本発明の方法のプロセスを含んでいる追加のプ
ロセスをコールすることによって強化される。これらの
プロセスは、好適には、プロセッサ34によって実行さ
れ、メモリ36の中にオブジェクトコードの形態で格納
された命令を使用して実現される。メモリ36は、読み
出し専用メモリ(ROM)、ランダムアクセスメモリ
(RAM)、ダイナミックランダムアクセスメモリ(D
RAM)、プログラム可能な読み出し専用メモリ(PR
OM)、消去可能でプログラム可能な読み出し専用メモ
リ(EPROM)、電気的に消去可能でプログラム可能
な読み出し専用メモリ(EEPROM)のような、及
び、フラッシュメモリのような、ソリッドステート記憶
装置を使用して実現することができる。
【0010】テキスト/画像分割の本発明の方法は、多
機能装置で使用することに限定されるものではない。こ
の方法は、走査線信号を使用するメモリとプロセッサを
含む任意の装置と連結して使用することもできる。この
ように、例えば、本発明の方法は、パーソナルコンピュ
ータ20、ファックス装置の中で、或いは、複雑なコピ
ー機械の中で実現することができる。
【0011】前述したように、多機能制御装置24は、
テキスト領域をハイライトすることにより、テキスト領
域の視認性を改善する。多機能制御装置24は、周囲の
走査線を参照することなく、一度に一つの走査線の割合
でこのタスクを実行する。多機能制御装置24は、設定
された特徴に関して各々の走査線信号を探索し、走査線
信号の中のテキスト領域を画像領域から区別する。テキ
スト領域を画像領域から区別する走査線信号のこれらの
特徴は、図2A、図2B、図2C、および、図2Dを参
照して議論される。図2Aは、表現するのに何本かの走
査線を必要とする小さいテキスト領域40を示す。線4
2は、テキスト領域40を横切る一つの走査線を表す。
図2Bは、画素位置に対する走査線42を表す走査線信
号についての強度値をグラフで示す。テキスト領域40
の中のテキストの各々の文字は、2本の縁を含む。例え
ば、縁44そして46は、「T」とその背景の間のカラ
ーの変化を表す。これに加えて、図2Bの中の隣接して
いる縁は極性が異なる。例えば、図2Bを左から右に見
ると、縁44の極性は下降し、縁46の極性は上昇し、
縁48の極性は下降し、縁50の極性は上昇しており、
以下同様である。図2Bは、各々の組の縁の間にメサと
いう実質的に一定の強度値の領域も含む。例えば、メサ
52は、縁44そして46の間に位置付けられる。テキ
ストのテキスト文字の終わりは、領域58のような、縁
なしの長距離部分によって記録される。これに対して、
図2Dの特徴を考える。図2Cは、図2Dに示された画
像領域60を横切る走査線62について画素位置に対す
る強度値をグラフで示す。画像領域60を表すために
は、数本の走査線を必要とする。図2Cは、64,6
6,68および70のような縁を含む。隣接している縁
の極性が常に異なっているとはかぎらない。例えば、図
2Cのグラフを左から右に見ると、両方の縁64および
66の極性は下降し、縁66及び68の極性は異なって
おり、両方の縁68および70の極性は上がっている。
図2Cのグラフは、強度の変化が大きくないが、一定で
はない縁の間の領域を含む。このように、所定の図2B
と図2Cのテキスト領域は、少なくとも3つの特徴を有
する。第1に、テキスト領域は、少なくとも2本の縁に
よって境界をつけられる。第2に、テキスト領域の最後
の縁は、縁或いは画素強度における大きな漸増がない長
距離部分58により示すことができる。第3に、縁が互
い違いに変わるテキスト領域の中に、異なった極性を持
っている。
【0012】II.テキスト/画像分割の方法 図3の流れ図は、画像領域も含む走査線信号のテキスト
領域を識別してハイライトするためのプロセッサ34に
よって使用されるプロセス80を示す。プロセス80
は、メモリ36内にオブジェクトコードの形態で格納さ
れる。簡単に述べられたように、実行されたプロセス8
0が、入力走査線信号を、修正された走査線信号に変換
したとき、そのテキスト領域は、表示されたときに、入
力走査線のものに比べてハイライトされる。最初に、ス
テップ112の間、プロセッサ34は、第1のテキスト
領域の可能性のある開始縁を探索する。ステップ114
の間、プロセッサ34は、新しいテキスト領域について
変数を初期化する。その後、ステップ116の間、プロ
セッサ34は、縁カウントをインクリメントし、ポイン
タをテキスト領域の終わりへ調整することにより、縁の
発見に応答する。プロセッサ34は、ステップ118の
間に別の縁の探索する。別の縁を見つけた後に、プロセ
ッサ34は、ステップ120−124とステップ126
−129かステップ134−138のどちらか一方の
間、縁が丁度テキスト領域の部分に位置するかどうか決
定する。すなわち、プロセッサ34は、発見されたばか
りの縁にもっとも接近した隣接縁へ十分に接近してお
り、且つ、正しい極性であるかどうか、及び、縁間の間
隔内の画素レベルの変化が許容可能であるかどうかを決
定する。もしそうであれば、プロセッサはステップ11
6に戻り、そして、最新のテキスト領域の終縁を探索し
続ける。最新のテキスト領域の終縁を識別した後に、ス
テップ132の間に、領域内の平均レベルとは異なるレ
ベルの画素の値を変えることにより、領域内のテキスト
をハイライトする。プロセッサ34は、その後ステップ
114に戻り、そして、走査線の全ての画素が検査され
るまでテキスト縁を探索し続ける。
【0013】A.開始縁の位置付け 概観に述べられたように、命令80は、プロセッサ34
に、入力走査線によって定義された第1の縁を位置付け
ることを要求することによって始まる。プロセッサ34
は、命令148を実行することによってステップ312
の間にその第1の縁を位置付ける。プロセッサ34は、
入力走査線の全ての他の縁を位置付けるために、命令1
48を同じく使用する。命令148は、メモリ36に、
または、いくつかの他の機械の読みやすい媒体の中に格
納することができる。命令148は、図4において流れ
図の形態で示される。
【0014】簡単にいうと、命令148を実行すること
によって縁を位置付ける努力は、画素レベルに何らかの
変化が検出されるまで走査線を走査することから始ま
る。次に、プロセッサ34は、画素レベルが上昇してい
るか、下降しているかを決定する。プロセッサ34は、
次いで、場合によるが、レベルが上昇或いは下降を停止
するまで走査線の走査を続ける。もしこの時点で、最新
の画素レベルが適切な境界の外側にあれば、次いで、プ
ロセッサ34は縁が発見された可能性を調査する。もし
画素レベルの変化が十分に鋭くて、且つ、十分に大きけ
れば、プロセッサ34は、縁を発見したことになる。縁
を位置付けると、プロセッサ34は適切なステップ、ス
テップ114またはステップ120の適当な方へ戻る。
【0015】プロセッサ34は、多数の変数を初期化す
ることによって、ステップ150の間に縁探索の準備を
行う。プロセッサ34は、最新の画素位置へ初期化され
たEdgeStartPosを使用して縁の開始位置を
追跡する。プロセッサ34は、HighPosを使用し
て縁に沿った最高強度レベルの位置と、LowPosを
使用して縁に沿った最低強度レベルの位置を追跡する。
プロセッサ34は、HighPosとLowPosの両
方を、最新の画素の位置へ初期化する。プロセッサ34
は、HighLevelとLowLevelを使用して
縁に沿った高レベル及び低レベルも追跡する。ステップ
150の間、両方の変数は最新の画素レベルの値へ初期
化される。これらの変数の初期化が完了すると、プロセ
ッサ34は、ステップ150からステップ152に進
む。
【0016】ステップ152の間、プロセッサ34は、
走査線の次の画素のレベルが最新の画素のレベルと異な
るかどうかを決定する。プロセッサ34は、画素レベル
の変化が検出されるまで、または、走査線の終わりに到
達するまで、画素を走査し続ける。画素レベルの変化が
走査線の終わりの前に検出されたときに命令148によ
って指示された動作を先ず考える。これに応答して、プ
ロセッサ34はステップ154に進んで、ステップ15
2の間に発見された強度レベルの変化が、上昇であるか
下降であるかを決定する。プロセッサ34は、これに続
いて強度レベルが上昇であるか下降であるか、同様に反
応する。ステップ156−163の記載は、議論される
ことはないステップ164−172により指示された低
下する強度レベルへの応答も示す。縁が上昇していると
決定されると、プロセッサ34は、ステップ154から
ステップ156に分岐する。ステップ156の間、プロ
セッサ34は、レベルが上昇を停止するまで走査線を走
査し続ける。レベルがもはや上昇していないことが判っ
たとき、、或いは、走査線の最後の画素に到達したとき
に、プロセッサ34は、ステップ156からステップ1
58に分岐する。
【0017】プロセッサ34は、ステップ158の間
に、縁を位置付けたかどうかを決定するためのテストの
第1のものを実行する。プロセッサ34は、ステップ1
58の間に、最新の画素のレベルをHighLevel
と比較する。もし最新の画素のレベルがHighLev
elより大きくなければ、プロセッサ34は、予期した
上昇縁を発見しなかったことになる。これに応答して、
ステップ158に抜け出し、ステップ152に戻って縁
の探索を続ける。他方では、もし最新の画素のレベル
が、HighLevelを越えれば、プロセッサ34は
ステップ160に進む。ステップ160の間に、プロセ
ッサ34は、縁に沿った高レベルの発見を反映するため
に、上昇縁と関連づけられた値を調整する。すなわち、
ステップ160の間に、プロセッサ34は、最新の画素
のレベルに等しいHighLevelを設定し、最新の
画素の位置に等しいHighPosを設定する。プロセ
ッサ34は、次いで、ステップ160に抜け出しステッ
プ162に進む。
【0018】ステップ162で、プロセッサ34は、発
見されたばかりのレベル増加が縁に必要とされる傾斜を
満足するかどうかを決定する二つのテストの第1のもの
を実行する。縁の確認には、互いからMaxEdgeW
idth以上離れて位置していない2つの画素の間の、
少なくともMinEdgeHeightのレベルに差を
必要とする。1つの実施態様では、MinEdgeHe
ightは64に設定され、MaxEdgeWidth
は7に設定される。これは、過度に包括的に縁を定義し
ている。すなわち、これらの値を使用して、プロセッサ
34は、多くの非テキスト縁を識別することになる。そ
の結果として、テキスト領域を確実に識別するために追
加の基準を使用する必要がある。包括的でない縁定義を
使用するときには、これらの他の基準は、テキスト領域
を識別するためには必要とされない場合がある。縁定義
は、特定の性能要求にを適合させることができる。
【0019】ステップ162の間、プロセッサ34は、
LowPosとHighPosの間の位置の差をMax
EdgeWidthと比較する。もし縁幅がMaxEd
geWidthより大きければ、プロセッサ34は、ス
テップ162からステップ163に進んで、縁の開始が
余りにも早く定義された可能性を考慮する。ステップ1
63の間に、プロセッサ34は、EdgeStartP
osを、最新の画素位置とMaxEdgeWidthの
間の差に変更する。付加的に、プロセッサ34は、Lo
wLevelとLowPosを、それらがEdgeSt
artPosの位置とレベルを表すように調整する。そ
れが完了すると、プロセッサ34は、ステップ163か
らステップ174に進む。プロセッサ34は、縁幅がM
axEdgeWidth以下である時には、ステップ1
62から直接ステップ174に達する。プロセッサ34
は、EdgeEndPosを最新の画素に等しく設定す
る。その後、プロセッサ34は、ステップ174からス
テップ176へ分岐する。
【0020】ステップ176の間、プロセッサ34は第
2の縁テストを実行する。プロセッサ34は、High
LevelとLowLevelの間の差をMinEdg
eHeightと比較することによって、縁レベルの変
化が十分であるかどうかを決定する。もし差がMinE
dgeHeight以下ならば、検出されたレベルの変
化は縁を表さない。これに応答して、プロセッサ34は
ステップ152へ戻り、縁を検索し続ける。他方では、
もし縁のレベルの差がMinEdgeHeightを越
えれば、プロセッサ34はステップ178に進み、これ
により、命令80の適切なステップに戻る。
【0021】命令148の一つの特徴、すなわち、走査
線の最後の画素へ到達したときの応答が、これから議論
される。プロセッサ34は、ステップ152、156、
または、164の間に最後の画素を発見するかもしれな
い。もし最後の画素に到着する前にステップ152の間
にレベルの変化が発見されなければ、縁は見つからなか
ったことになり、プロセッサ34はステップ180に進
む。プロセッサ34は、縁が見つけられなかったこと指
示し、178へ分岐し、ステップ112または118の
適切な方に戻る。これに対して、もし最後の画素が、ス
テップ156または164の間で走査している間に検索
されたときには、特別な動作は必要でない。例えば、も
し検査すべき画素が残っていないことがステップ156
の間に発見されたら、プロセッサ34は、レベルの上昇
が停止したように応答し、ステップ158に進む。次い
で、プロセッサ34は、ステップ178に到達するまで
前述した方法で命令を実行し、ステップ112または1
18のいずれかに戻らせる。
【0022】B.テキスト領域の終縁の位置付け 第1の可能性のあるテキスト領域の探索を始める時に、
プロセッサ34はステップ112からステップ114へ
分岐する。ステップ114で、プロセッサ34は変数を
初期化することによって、探索の準備をする。最初に、
プロセッサ34は縁カウンタEdgeCountをゼロ
に初期化する。またプロセッサ34は、テキスト開始位
置TextStartPosを、新しいテキスト領域の
開始縁位置EdgeStartPosへ設定する。次い
で、プロセッサ34は、ステップ116へ進む。プロセ
ッサ34は、ステップ116の間に他の変数を調整し
て、最近発見された縁を反映させる。プロセッサ34
は、EdgeCountをインクリメントし、テキスト
終了位置TextEndPosを、発見したばかりの縁
の終わり、すなわち、EdgeEndPosに等しく設
定する。その結果として、今やテキスト領域は、検出さ
れた最初の縁の開始位置から、発見された最後の縁まで
拡張される。これが完了すると、プロセッサ34はステ
ップ118に進む。
【0023】プロセッサの34は、詳細に前に議論され
た命令148を実行することにより、ステップ118の
間に、別の縁を探索する。それが別の縁を発見すると、
プロセッサ34は、ステップ118からステップ120
に進む。
【0024】ステップ120で、プロセッサ34は、縁
の許容度の2つの、すなわち縁ギャップとギャップレベ
ルのテストを実行する準備をする。テキスト領域の中で
は、隣接している縁が互いの近くに位置付けられる傾向
があるので、隣接している縁の間の間隔が調べられる。
このように、もしそれが前の縁から非常に遠く位置付け
られていれば、縁はテキスト領域の部分である見込みが
ない。隣接している縁の間の距離よりも非常に大きく選
択されている距離MaxEdgeSpacingは、デ
ィザリングにより大きく影響されることになる最大のフ
ォントサイズに依存する設計上の選択事項である。テキ
スト領域の中では、レベルが実質的に一定のままである
傾向があるので、縁ギャップの中のレベルが調べられ
る。縁ギャップの中の強度レベルの大幅な変化は、分析
される走査線の一部がもはやテキスト領域を表さないこ
とを示す。好適な実施態様においては、発見された最後
の縁のメジアンのレベルMedianLevelが、縁
ギャップの中のレベルの変化が大きすぎることを識別す
るために使用される。
【0025】プロセッサ34は、MedianLeve
lと縁ギャップEdgeGapを計算することにより、
ステップ120の間に縁ギャップとギャップレベルの双
方について準備する。好適には、プロセッサ34は、下
記式に従ってメジアンの強度レベルを計算する。
【0026】MedianLevel=(HighLe
vel+LowLevel)/2
【0027】ここで、MedianLevelは、最も
最近に発見された縁のメジアンの強度である。
【0028】好適には、縁ギャップは下記式を使用して
計算される。
【0029】EdgeGap=EdgeStartPo
s−TextEndPos
【0030】EdgeGapとMedianLevel
が計算されると、プロセッサ34はステップ120から
ステップ122に分岐する。
【0031】ステップ122の間、プロセッサ34は、
EdgeGapがMaxEdgeSpacingを越え
るかどうかを決定することによって、縁ギャップテスト
を実行する。もし越えていれば、その時点ではそのよう
には認識されなかったけれども、最新のテキスト領域の
終縁は既に発見されたとになる。プロセッサ34は、ス
テップ122からステップ130に分岐することによっ
てこの状況に応答するステップ130の間の動作の説明
は後述する。他方では、もしEdgeGapがあまり大
きくなければ、発見されたばかりの縁は許容することが
できる。この可能性を調査するために、プロセッサ34
は、ステップ122からステップ124へ分岐する。
【0032】ステップ124の間、プロセッサ34は、
位置付けたばかりの縁が上昇縁か下降縁であるかを決定
する。上昇縁と下降縁に応答して指示された動作は類似
しており、従って、ステップ126、128、そして1
29の説明は、同じくステップ134、136、そして
138の動作を説明するのにも役に立つ。ステップ12
4と126の間、プロセッサ34は、発見されたばかり
の縁の極性が前に発見された縁のものとは異なるかどう
かを決定する。そうでなければ、発見されたばかりの縁
は、最新のテキスト領域の部分ではない。なぜなら、テ
キスト領域の中では縁の極性は、交互に変化するからで
ある。これに応答して、プロセッサ34は、ステップ1
26からステップ130に進む。ステップ130の議論
は後で行われる。他方では、もし発見されたばかりの縁
の極性が最新のテキスト領域と一致すれば、プロセッサ
34はステップ126からステップ128へ分岐する。
【0033】ステップ128の間、ギャップレベルテス
トを見越して、プロセッサ34は縁ギャップの中の最大
値レベルMaxLevelを決定する。その後、ステッ
プ129の間、プロセッサ34は、MaxLevelを
MedianLevelと比較することによって、ギャ
ップレベルテストを実行する。プロセッサ34は、もし
MaxLevelがMedianLevelを越えなけ
れば、発見されたばかりの縁が、最新のテキスト領域の
部分であると見做す。これに応答して、プロセッサ34
はステップ129からステップ116に分岐し、最新の
テキスト領域と関係した縁を探索し続ける。これに対し
て、もしMedianLevelがMaxLevelを
越えれば、発見されたばかりの縁は、最新のテキスト領
域の部分ではない。これは、プロセッサ34が、最新の
テキスト領域の最後の縁を既に発見し、多分、他のテキ
スト領域の最初の縁を発見したことを意味する。プロセ
ッサ34は、ステップ129に抜け出てステップ130
へ分岐することにより、この状況に応答する。
【0034】発見されたばかりの縁が最新のテキスト領
域の部分ではないことが決定された場合には、ステップ
122、126、129、134、または、138の間
にどのような決定がなされたかには無関係に、プロセッ
サ34はステップ130に進む。ステップ130の間、
プロセッサ34は、発見されたばかりの縁の組が、テキ
スト領域を形成するかどうかを決定する。もし縁の組
が、MinEdgesと名付けられた最小数の縁よりも
小さい場合には、プロセッサ34は、テキスト領域を発
見しなかったことになる。MinEdgesに設定され
る値は、設計事項である。好適な実施態様においては、
ハイライトされた各々のテキスト領域が少なくとも2本
の縁を含むことを確実にするために、MinEdges
は2に設定される。プロセッサ34は、ステップ130
からステップ114に戻ることによって、2本以下の縁
の発見に応答し、別のテキスト領域を探索し始める。こ
れに対して、発見されたばかりの縁の組がMinEdg
es以上を含んでいるときには、プロセッサ34は、テ
キスト領域を位置付けた。プロセッサ34は、ステップ
130からステップ132に進み、そのテキスト領域を
ハイライトして注意を引く。
【0035】C.テキスト領域のハイライト プロセッサ34は、ステップ132の間に発見されたば
かりのテキスト領域をハイライトする。最初に、プロセ
ッサ34は、発見されたばかりのテキスト領域の、Pe
lAvgと名付けられた平均画素強度を計算する。プロ
セッサ34は、平均画素強度を使用して、走査線の画素
毎の新しい強度値を計算する。プロセッサ34は、既に
平均画素値より暗い画素がより暗くなり、既に平均画素
レベルより明るい画素が更に明るくなるように、各々の
画素の値を修正する。好適には、NewValueと名
付けられた画素毎の新しい値は、数学的に以下のように
表現される。
【0036】NewValue=PelAvg+N*
(OldValue−PelAvg) ここで、OldValueは、強調前の画素の強度値で
あり、Nは、定数である。
【0037】Nは視覚的に満足な画像を生成する任意の
値とすることができる。好適な実施態様においては、N
は2に等しく設定される。
【0038】好適には、プロセッサ34は、NewVa
lueを最大255と最小0にクランプする。NewV
alueの計算後に、プロセッサ34は、ステップ13
2に抜け出し、ステップ114へ戻って、別のテキスト
領域を捜す。
【0039】D.走査線の終わりに対する応答 ステップ112そして118の間の、縁の探索期間中
に、幾つかの点に走査線の最後の画素が到達する。先に
議論されたように、もしステップ152の間に到達した
ら、これは命令148に、縁が見つからなかったという
メッセージを返させる。もしプロセッサ34が、ステッ
プ112の間にこのメッセージを受信した場合には、こ
れ以上の動作は不要である。なぜなら、テキスト領域が
必要としている最小の数を見つけることが出来なかった
からである。従って、プロセッサ34は、単純にステッ
プ112からステップ144に分岐し、これにより、命
令80の実行を開始させたプログラムに戻す。もし縁が
見つからなかったというメッセージがステップ118の
間に返された場合には、状況は異なる。少なくとも一つ
の縁が以前に発見され、テキスト領域を形成するため必
要とされる最小数の縁が見つかったかも知れないという
可能性が存在する。これに応答して、プロセッサ34
は、ステップ118からステップ140に進む。ステッ
プ140の間、プロセッサ34は、最小数の縁が発見さ
れたかどうかを決定する。もしそうであれば、プロセッ
サ34は、ステップ142へ分岐し、ステップ132に
関して前に議論された同じ方法でTextStartP
osとEdgeEndPosの間で画素値を修正する。
これが完了すると、プロセッサ34はステップ144へ
分岐する。走査線の分析と修正が完了すると、プロセッ
サ34は、選択された装置20,21,26または28
に、命令80の実行期間中に計算された全ての新しい画
素レベルを含む修正された走査線を結合する。
【0040】IV.概要 このように走査線信号の画像領域とテキスト領域を区別
して、テキスト領域をハイライトする方法が説明され
た。この方法は、走査線信号の中の縁の組を識別するこ
とによって始まる。次に、縁の組がテキスト領域の境界
を表すかどうかが決定される。もしそうであれば、次い
で、平均画素強度値がテキスト領域について計算され
る。その後、値が平均と異なるテキスト領域の中のこれ
らの画素の強度は修正されて、修正された走査線信号が
生成される。その結果として、修正された走査線信号が
走査線を再現するために使用されるとき、テキストがハ
イライトされる。
【0041】前述した明細書においては、本発明は特定
の例示的な実施態様に関して説明された。しかしなが
ら、特許請求の範囲に記載された発明の広範な精神及び
範囲から離れることなく、様々な修正及び変更を成しえ
ることは明らかである。したがって、明細書及び図面
は、制限的に解釈されるものではなく、例示として見做
される。
【図面の簡単な説明】
【図1】 テキスト/画像分割を行なう本発明の方法を
行なう多機能装置のブロック図である。
【図2】 図2Aは、テキスト領域とこれを横切る走査
線を示す。図2Bは、図2Aのテキスト領域を横切る走
査線に関しての画素位置対画素強度のグラフである。図
2Cは、図2Dの画像領域を横切る走査線に関しての画
素位置対画素強度のグラフである。図2Dは、画像領域
とこれを横切る走査線を示す。
【図3】 画像領域を含む走査線の中でテキスト領域を
識別してハイライトする方法の流れ図である。
【図4】 縁を位置付ける方法の流れ図である。
【符号の説明】
21 ネットワークポート 22 多機能装置 24 多機能制御装置 26 ファックスモデム 28 プリンタ 30 スキャナ 32 多機能オペレーティングシステム 34 プロセッサ 36 メモリ 44,46,48,50,64,66,68,70 縁 52 メサ 58 長距離部分 60 画像領域 62 走査線

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 画像領域を含む一つの走査線信号の中で
    テキスト領域をハイライトする方法であって、 プロセッサに連結されたメモリ内に格納された命令を実
    行するプロセッサを使用し、走査線信号は複数の画素を
    含み、各々の画素は強度を示す値を有し、プロセッサは
    走査線信号を再現するための再現装置に連結され、 a)走査線信号の画素の値によって表現された開始縁を
    識別し、 b)次の縁が、最も近い以前に発見された縁の所定の距
    離の中に位置するかどうかを決定し、 c)もし次の縁が最も近い以前に発見された縁の所定の
    距離の中に位置する場合には、 1)次の縁の極性を最も近い以前に発見された縁の極性
    と比較し、 2)もし次の縁の極性が最も近い以前に発見された縁の
    極性と異なる場合には、ステップc)を繰り返し、 d)ステップc)の間に識別された開始縁と次の縁がテ
    キスト領域を形成するかどうかを決定し、 e)ステップの間に識別された開始縁と次の縁がテキス
    ト領域を形成する場合には、 1)テキスト領域の中の画素毎に平均強度値を計算し、 2)平均強度値とは異なる値を有するテキスト領域の中
    に位置する画素の値を変更して修正された走査線信号を
    生成するプロセッサにより実行される各ステップからな
    る方法。
  2. 【請求項2】 ステップd)が、ステップc)の間に識
    別された縁の数が少なくとも3であるかどうかを決定す
    ることを含む請求項1に記載の方法。
JP10578496A 1995-05-01 1996-04-25 テキスト領域をハイライトする方法 Expired - Fee Related JP3857746B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/432,215 US5745596A (en) 1995-05-01 1995-05-01 Method and apparatus for performing text/image segmentation
US432215 1995-05-01

Publications (2)

Publication Number Publication Date
JPH08307665A true JPH08307665A (ja) 1996-11-22
JP3857746B2 JP3857746B2 (ja) 2006-12-13

Family

ID=23715229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10578496A Expired - Fee Related JP3857746B2 (ja) 1995-05-01 1996-04-25 テキスト領域をハイライトする方法

Country Status (4)

Country Link
US (1) US5745596A (ja)
EP (1) EP0741487B1 (ja)
JP (1) JP3857746B2 (ja)
DE (1) DE69618068T2 (ja)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5946420A (en) * 1996-05-10 1999-08-31 Hewlett-Packard Company Printing with text enhancement: recognition by sensing paired edges, or by disqualification in pictorial regions
US5987448A (en) * 1997-07-25 1999-11-16 Claritech Corporation Methodology for displaying search results using character recognition
GB9727322D0 (en) 1997-12-29 1998-02-25 Xerox Corp Multilingual information retrieval
JP2000138833A (ja) * 1998-08-28 2000-05-16 Toshiba Tec Corp 画像処理方法及び画像処理装置
US6711292B2 (en) 1998-12-30 2004-03-23 Canon Kabushiki Kaisha Block selection of table features
US6681047B1 (en) * 1999-05-31 2004-01-20 Ricoh Co., Ltd. Method and system for determining character edges based upon edges pair and image characteristics of pixels between the edge pair
US6976223B1 (en) * 1999-10-04 2005-12-13 Xerox Corporation Method and system to establish dedicated interfaces for the manipulation of segmented images
KR20020027332A (ko) * 2000-03-31 2002-04-13 요트.게.아. 롤페즈 텍스트 검출
US6633670B1 (en) 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US6704449B1 (en) * 2000-10-19 2004-03-09 The United States Of America As Represented By The National Security Agency Method of extracting text from graphical images
US7043080B1 (en) 2000-11-21 2006-05-09 Sharp Laboratories Of America, Inc. Methods and systems for text detection in mixed-context documents using local geometric signatures
US8438004B2 (en) * 2001-10-03 2013-05-07 Hewlett-Packard Development Company L.P. System and methods for language translation printing
US7356183B2 (en) * 2002-07-01 2008-04-08 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents
US7382489B2 (en) * 2002-07-01 2008-06-03 Xerox Corporation Efficient interpolation technique using programmable node spacing
US7433084B2 (en) * 2002-07-01 2008-10-07 Xerox Corporation Digital de-screening technique for scanned documents
US7324120B2 (en) * 2002-07-01 2008-01-29 Xerox Corporation Segmentation method and system for scanned documents
US6987882B2 (en) * 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
US7456982B2 (en) * 2002-07-01 2008-11-25 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents
US7269294B2 (en) * 2002-07-01 2007-09-11 Xerox Corporation Foreground erosion method and system for Multiple Raster Content (MRC) representation of documents
US7308136B2 (en) * 2002-07-01 2007-12-11 Xerox Corporation Weak edge repositioning in a MRC segmentor
US6983076B2 (en) 2002-07-01 2006-01-03 Xerox Corporation Control system for digital de-screening of documents
US7031518B2 (en) * 2002-07-01 2006-04-18 Xerox Corporation Segmentation method and system for Multiple Raster Content (MRC) representation of documents
US7233695B2 (en) * 2002-07-01 2007-06-19 Xerox Corporation Scan color conversion method
US7236641B2 (en) * 2002-07-01 2007-06-26 Xerox Corporation Page background detection and neutrality on scanned documents
US7242802B2 (en) * 2002-07-01 2007-07-10 Xerox Corporation Segmentation method and system for Multiple Raster Content (MRC) representation of documents
US7375856B2 (en) * 2002-07-01 2008-05-20 Xerox Corporation Halftone screen frequency and magnitude estimation for digital descreening of documents
US7218418B2 (en) * 2002-07-01 2007-05-15 Xerox Corporation Digital de-screening of documents
US7227988B2 (en) * 2002-07-01 2007-06-05 Xerox Corporation Prioritized PDL segmentation producing two bit selector
US7200263B2 (en) * 2002-07-01 2007-04-03 Xerox Corporation Background suppression and color adjustment method
US8261184B2 (en) * 2002-08-02 2012-09-04 Ignatius Xavier Haase Apparatus and method for encoding and displaying documents
US20040096102A1 (en) * 2002-11-18 2004-05-20 Xerox Corporation Methodology for scanned color document segmentation
JP4538214B2 (ja) * 2002-11-22 2010-09-08 オセ−テクノロジーズ・ベー・ヴエー グラフによる画像分割
US20040150858A1 (en) * 2003-01-31 2004-08-05 Cholewo Tomasz J. Method, apparatus and system for image data correction
US7532363B2 (en) * 2003-07-01 2009-05-12 Xerox Corporation Apparatus and methods for de-screening scanned documents
US7116374B2 (en) * 2003-08-26 2006-10-03 Koplar Interactive Systems International, L.L.C. Method and system for enhanced modulation of video signals
US7433535B2 (en) * 2003-09-30 2008-10-07 Hewlett-Packard Development Company, L.P. Enhancing text-like edges in digital images
US7302116B2 (en) * 2004-02-12 2007-11-27 Xerox Corporation Method and apparatus for reduced size image
US7386166B2 (en) * 2004-02-12 2008-06-10 Xerox Corporation Systems and methods for connecting regions image data having similar characteristics
US7365882B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Halftone screen frequency and magnitude estimation for digital descreening of documents
US7366746B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Finite impulse response filter method and apparatus
US7379587B2 (en) * 2004-02-12 2008-05-27 Xerox Corporation Systems and methods for identifying regions within an image having similar continuity values
US7403661B2 (en) * 2004-02-12 2008-07-22 Xerox Corporation Systems and methods for generating high compression image data files having multiple foreground planes
US7366357B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Systems and methods for adjusting image data to form highly compressible image planes
US7343046B2 (en) * 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
US7664175B1 (en) 2004-06-16 2010-02-16 Koplar Interactive Systems International, L.L.C. Mark-based content modulation and detection
US7729546B2 (en) * 2005-12-23 2010-06-01 Lexmark International, Inc. Document segmentation for mixed raster content representation
US8798133B2 (en) * 2007-11-29 2014-08-05 Koplar Interactive Systems International L.L.C. Dual channel encoding and detection
US8339672B2 (en) * 2009-03-30 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for rendering data using graphic-list partitions and associated rendering processors
US8339670B2 (en) * 2009-03-30 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for rendering data based on graphic-list partitioning
US8339671B2 (en) * 2009-03-30 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for rendering data by partitioning a graphics list
US8411319B2 (en) * 2009-03-30 2013-04-02 Sharp Laboratories Of America, Inc. Methods and systems for concurrent rendering of graphic-list elements
US20100245918A1 (en) * 2009-03-30 2010-09-30 Nguyen Uoc H Methods and Systems for Rendering Data
US20100245889A1 (en) * 2009-03-30 2010-09-30 Nguyen Uoc H Methods and Systems for Rendering Data
US8339653B2 (en) * 2009-03-30 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for rendering data based on overlap characteristics
US20110026816A1 (en) * 2009-07-29 2011-02-03 Vaughn Robert L Rapid image categorization
US8345998B2 (en) 2010-08-10 2013-01-01 Xerox Corporation Compression scheme selection based on image data type and user selections
US9058539B2 (en) 2013-04-16 2015-06-16 Canon Kabushiki Kaisha Systems and methods for quantifying graphics or text in an image
US20140314314A1 (en) * 2013-04-23 2014-10-23 Canon Kabushiki Kaisha Systems and methods for quantifying graphics or text in an image
BR112016006860B8 (pt) 2013-09-13 2023-01-10 Arris Entpr Inc Aparelho e método para criar um único fluxo de dados de informações combinadas para renderização em um dispositivo de computação do cliente
US9445108B1 (en) 2015-05-26 2016-09-13 International Business Machines Corporation Document compression with neighborhood biased pixel labeling
WO2018208638A1 (en) * 2017-05-07 2018-11-15 Invexer Technology Inc. A method of rendering visual presentations of data
US11455762B2 (en) * 2017-12-14 2022-09-27 Adobe Inc. Text border tool and enhanced corner options for background shading

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3107521A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
DE3107655A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum auffinden und abgrenzen von textbereichen auf einer vorlage, die text-, graphik- und/oder bildbereiche enthalten kann
US4562594A (en) * 1983-09-29 1985-12-31 International Business Machines Corp. (Ibm) Method and apparatus for segmenting character images
GB2153619B (en) * 1983-12-26 1988-01-20 Canon Kk Image processing apparatus
US5081689A (en) * 1989-03-27 1992-01-14 Hughes Aircraft Company Apparatus and method for extracting edges and lines
US5138465A (en) * 1989-09-14 1992-08-11 Eastman Kodak Company Method and apparatus for highlighting nested information areas for selective editing
US5202933A (en) * 1989-12-08 1993-04-13 Xerox Corporation Segmentation of text and graphics
US5131049A (en) * 1989-12-08 1992-07-14 Xerox Corporation Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask
JPH04271662A (ja) * 1991-02-27 1992-09-28 Nec Corp 画像領域判定装置
JP2616386B2 (ja) * 1993-06-21 1997-06-04 日本電気株式会社 画像処理装置
DE69518467T2 (de) * 1994-06-03 2001-01-04 Riso Kagaku Corp Bildverarbeitungsgerät

Also Published As

Publication number Publication date
EP0741487A3 (en) 1998-02-04
DE69618068T2 (de) 2002-07-11
DE69618068D1 (de) 2002-01-31
JP3857746B2 (ja) 2006-12-13
US5745596A (en) 1998-04-28
EP0741487A2 (en) 1996-11-06
EP0741487B1 (en) 2001-12-19

Similar Documents

Publication Publication Date Title
JPH08307665A (ja) テキスト領域をハイライトする方法
US6385351B1 (en) User interface high-lighter function to provide directed input for image processing
US6385338B1 (en) Image processing method and apparatus
US7330600B2 (en) Image processing device estimating black character color and ground color according to character-area pixels classified into two classes
EP1826720B1 (en) Image processing apparatus and method, computer program, and storage medium
KR20080006112A (ko) 경계 영역의 선명도를 개선하는 하프토닝 방법 및 장치
US20040091172A1 (en) Image processing device performing inclination correcting processing
US6807301B1 (en) Image production controlling device, image producing device, image production controlling method, and a storage medium
JP3772262B2 (ja) 画像の型を識別する方法
EP0949801B1 (en) Image process apparatus, image process method and storage medium
US20110187721A1 (en) Line drawing processing apparatus, storage medium storing a computer-readable program, and line drawing processing method
US20230062113A1 (en) Information processing apparatus, information processing method and non-transitory storage medium
JP7341758B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US6813382B2 (en) Image outline determination method, image outline determination apparatus, image outline determination program storage medium, image input apparatus and image input program storage medium
JP2006268180A (ja) 画像処理システム
EP0991265A2 (en) User interface high-lighter function to provide directed input for image processing
US5682250A (en) Method and apparatus for reproducing an image without salt and pepper specks
JP5825142B2 (ja) 画像処理装置、画像処理方法およびコンピュータープログラム
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム
JP6841254B2 (ja) 画像処理装置、および、コンピュータプログラム
JP2008177721A (ja) 画像処理装置、画像形成装置、画像形成システム、および画像処理プログラム
JP4433373B2 (ja) ラスタ画像生成装置、印字装置、およびコンピュータプログラム
JP4113047B2 (ja) 帳票処理装置、及びプログラム
JP2004236157A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2000040153A (ja) 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060915

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100922

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100922

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110922

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120922

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120922

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130922

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees