JP2002352191A - 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法 - Google Patents

手書き判別能力を持つプリンティング制御インターフェースシステムとその方法

Info

Publication number
JP2002352191A
JP2002352191A JP2002033379A JP2002033379A JP2002352191A JP 2002352191 A JP2002352191 A JP 2002352191A JP 2002033379 A JP2002033379 A JP 2002033379A JP 2002033379 A JP2002033379 A JP 2002033379A JP 2002352191 A JP2002352191 A JP 2002352191A
Authority
JP
Japan
Prior art keywords
text
probability
handwritten
request
proximity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002033379A
Other languages
English (en)
Other versions
JP2002352191A5 (ja
Inventor
Yue Ma
マ ユゥー
Jinhong Katherine Guo
キヤサリン グオ ジンホン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of JP2002352191A publication Critical patent/JP2002352191A/ja
Publication of JP2002352191A5 publication Critical patent/JP2002352191A5/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 【課題】 手書きテキストと機械プリントテキストの混
合を含む文書中の機械プリントテキストから手書きテキ
ストを同定し分離するためのシステムと方法の提供。 【解決手段】 1つの実施例では、通常のコンピュータ
ー中のインテリジェントなプリンティングコントロール
インターフェースとしてインストールされ、ユーザーの
コントロールのもとに、任意のアプリケーションによっ
て生成された任意の文書から、その文書のプリンティン
グに先立って、いかなる手書きのテキストをも除去する
ように選択的に処理することを可能にし、他の実施例で
は、通常のディジタルコピー機中のインテリジェントな
プリンティングコントロールインターフェースとしてイ
ンストールされ、ユーザーのコントロールのもとに、コ
ピー中の任意の文書から、その文書のプリンティングに
先立って、いかなる手書きのテキストをも除去するよう
に選択的に処理することを可能にしている。手書きテキ
ストか機械プリントテキストかのいずれかとして隠され
たマルコフモデルを用いる手書き分離法を採用してい
る。

Description

【発明の詳細な説明】
【0001】本発明は広く機械プリントによるテキスト
と手書きの注釈とが混在したイメージを処理してそのよ
うな手書きの注釈を除去するシステムと方法に関する。
【0002】
【発明の背景】プリンターに送られたりコピー用のコピ
ー機に置かれた文書にとって、機械プリントされたテキ
ストともとの内容の上に上書きされた追加情報というよ
うに内容の混在を含むことはよく起こることである。
【0003】追加情報の例は手書きのメモ、書名、スタ
ンプ、等々(まとめて「手書きの注釈」と言う)を含ん
でいる。
【0004】多くの場合、ユーザーは、もとの内容、例
えば、手書きのメモを含まないレビュー用のレターをプ
リントすることを意図的に望む。
【0005】通常のコンピューターシステムでは、図1
に示すように、ユーザーアプリケーション100からの
大部分のプリンティングジョブはフグラフィックスデバ
イスインターフェース(GDI)110、プリンタード
ライバー120、およびプリントスプーラー130を通
して実行される。この方法では、ユーザーアプリケーシ
ョン100は、文書を生成しプリント要求を発する。
【0006】GDI 110はオペレーレーティングシ
ステムのコンポーネントであって、グラフィックセルを
プリンタードライバーが理解するフォーマットに変換す
る。GDI110は、各種のユーザーアプリケーション
からの要求を受けて、これらの要求をアプリケーション
によって選ばれたプリンターの対応するドライバーに送
る。
【0007】アプリケーションから見ると、各種のプリ
ンターの間には何の違いもなく、それらは単に出力デバ
イスと見られる。GDI 110は、テキスト、ビット
マップ、グラフィックスレンダリング(すなわち、線を
引き、弧をえがき、四角をつくり、それを色で塗りつぶ
すなど)をサポートする。このプリンティングの手順は
アプリケーション100がデバイス独立なプリンティン
グコマンドを送ってテキストとグラフィックスのレンダ
リングを実効することを可能としている。
【0008】これらのプリンティングコマンドは次にG
DI110を通してプリンタードライバー120に送ら
れる。プリンタードライバー120は標準的なグラフィ
ックス要求をプリンターが理解するコマンドに変換し、
それらをスプーラー130とポートモニター140に送
る。最後に、プリンターはスプーラー130とモニター
を通してプリンティングコマンド受け取る。スプーラー
130はプリントジョブをマネージし、現在の動作を中
断することなくコンピューターCPUからプリンティン
グ用に資源を割り当てる。
【0009】同様に、従来のディジタルコピー機は、そ
のサブシステムは固定型であって、一般的にユーザーに
開放されていないよりクローズな環境中ではあるが同種
のサブシステムを含んでいる。
【0010】従来技術では、機械プリントのテキストと
注釈を含む文書から手書きの注釈を除去する能力に限界
がある。その第1の従来方法では、処理中の文書上にマ
ーカーまたはテンプレートが処理中の文書上に置かれて
手書きの注釈の位置決めを支援している。例えば、手書
きサインの位置決め用に銀行小切手上に磁気インキ文字
認識ラインを設置する米国特許No.5,631,9084を参照さ
れたい。
【0011】この第1の従来方法は、そのマーカーまた
はテンプレートを位置決めするのに特殊な装置を必要と
する。第2の従来方法では、手書きの注釈が同定され、
それらは分離プロセスのために機械プリントされたテキ
ストから分離される。
【0012】しかし、 その従来技術は、文書が機械プ
リントテキストと手書きの注釈との混在を含んでいた
り、手書きの注釈が機械プリントテキストと混じってい
たり、つまり、手書きの注釈がマージンのようなもとの
文書の白いスペースの領域にだけ現れるとは限らないな
どの複雑な場合を扱う能力に限界がある。
【0013】隠されたマルコフモデル(Hidden Markov
Model;HMM)は多くのアプリケーションで使われて
きている。最も成功した応用の1つは音声認識である
が、それはまた光学的文字認識とキーワードの同定にも
応用されてきた。
【0014】要するに、HMM理論を概観するとき、自
然言語には、そこに含まれたマルコフ構造が存在すると
いうことに注意することが大切である。たとえば、
“q”という文字のあとに “u” という文字を見出す
確率は他のどの文字のあとに“u”という字を見出す確
率よりも普通大きい。過去と現在の出来事を与えている
現時点の出来事の条件確率が最も近い出来事にのみ依存
している、という性質を持っているプロセスはマルコフ
過程である。
【0015】不連続なマルコフ過程では、各々の状態は
観測可能な決定論的な事象に対応している。しかし、
隠されたマルコフモデルでは、各々の状態の出力は出力
確率分布に対応している。
【0016】本発明の方法は 隠されたマルコフモデル
(HMM)の理論に基礎を置いている。未知のOCRの
知識は隠された状態として扱われ、決定はこれらの状態
から出て来る観測シーケンスにもとづいて行われる。
【0017】したがって、本発明の目的は、手書きの注
釈を機械プリントのテキストから自動的に分離するため
のシステムと方法を提供することである。
【0018】本発明の付加的な目的は、隠されたマルコ
フモデルにもとづいて手書きの注釈を機械プリントのテ
キストから自動的に分離するためのシステムと方法を提
供することである。
【0019】本発明のさらなる目的は、手書きの注釈を
通常のディジタルコピー機内で実施される機械プリント
のテキストから自動的に分離するためのシステムと方法
を提供することである。
【0020】本発明のもう1つの目的は、手書きの注釈
を通常のプリンター上でのプリント用に送られてきた文
書内の機械プリントテキストから自動的に分離するため
のシステムと方法を提供することである。
【0021】本発明の種々の他の目的、利点および特徴
は、以下に続く詳しい説明から容易に明らかになるだろ
うし、また、新しい特徴は付属の請求項で特に指摘され
るだろう。
【0022】
【発明の概要】これらの目的および他の目的は、手書き
のテキストと(ふつう)プリントされた文書が機械プリ
ントテキストだけを含んでいるような機械プリントされ
たテキストとの混在を含む文書をプリントまたはコピー
するためのシステムと方法に関する本発明によって実現
される。
【0023】特に、本発明の第1の実施例は、手書きテ
キストと機械プリントテキストを含むディジタル文書発
生のためとディジタル文書の少なくとも1つをプリント
するリクエストを発生するためとの手段、リクエストを
受け取り、そのリクエストを選択的に処理して手書きテ
キストを除去するところの、前記発生するための手段に
接続されたインテリジェントなプリンティングコントロ
ールインターフェース、及び選択的に処理されたリクエ
ストをプリントするため前記インテリジェントなプリン
ティングコントロールインターフェースに接続された手
段、を具えている。
【0024】そのインテリジェントなプリンティングコ
ントロールインターフェースは、リクエストを受け取る
ための仮想プリンタードライバー、リクエストを処理す
るかどうかを判定するためのプリンティングコントロー
ルパネル、及び、プリンティングコントロールパネルの
コントロールのもとにリクエストを選択的に処理して手
書きテキストを除去するための手書き分離モジュールを
具備する。
【0025】さらに、その手書き分離モジュールは:デ
ィジタルイメージを複数のテキストブロックに分割する
ことによってリクエストを処理すること、テキストブロ
ックの各々に対する観測のシーケンスを計算すること、
観測のシーケンスが機械プリントテキストに対する所定
の隠されたマルコフ過程で現れるであろう各々のテキス
トブロックに対する第1の確率を計算すること、観測の
シーケンスが手書きテキストに対する所定の隠されたマ
ルコフ過程で現れるであろう各々のテキストブロックに
対する第2の確率を計算すること、各々のテキストブロ
ックに対して第1の確率と第2の確率を比較すること、
もし第1の確率が第2の確率よりも大きければ機械テキ
ストとしてそのテキストブロックをマークすること、も
し第2の確率が第1の確率よりも大きければ手書きテキ
ストとしてそのテキストブロックをマークすること、及
びマークされた手書きテキストを除去することを行な
う。
【0026】他の実施例では、本発明は、手書きテキス
トと機械プリントテキストを含むディジタル文書を発生
するための、また、そのディジタル文書をプリントする
リクエストを発生するためのスキャナー、リクエストを
受け取り、そのリクエストを選択的に処理して手書きテ
キストを除去するところのスキャナーに接続されたイン
テリジェントプリンティングコントロールインターフェ
ース、及び、選択的に処理されたリクエストをプリント
するためのインテリジェントプリンティングコントロー
ルインターフェースに接続されたプリンター、を含む文
書コピーのためのシステムを具備してなる。
【0027】本発明はまた、手書きテキストと機械プリ
ントテキストの混在を含むディジタルイメージの機械プ
リントテキストから手書きテキストを分離するための方
法を具え、その発明は:ディジタルイメージを複数のテ
キストブロックに分割すること;テキストブロックの各
々に対する観測のシーケンスを計算すること;観測のシ
ーケンスが機械プリントテキストに対する所定の隠され
たマルコフ過程で現れるであろう各々のテキストブロッ
クに対する第1の確率を計算すること;観測のシーケン
スが手書きテキストに対する所定の隠されたマルコフ過
程で現れるであろう各々のテキストブロックに対する第
2の確率を計算すること;各々のテキストブロックに対
して第1の確率と第2の確率を比較すること;もし第1
の確率が第2の確率よりも大きければ、機械プリントテ
キストとしてそのテキストブロックをマークすること、
もし第2の確率が第1の確率よりも大きければ、手書き
テキストとしてそのテキストブロックをマークするこ
と;の、各ステップを具える。
【0028】本発明の手書き分離法は、各々のテキスト
ブロックが機械プリントテキストか手書きテキストかの
いずれかとしてマークされた後に、個別エラー(複数)
を補正する後処理過程のステップをさらに具備してな
る。
【0029】特に、手書き分離法の分割化ステップは、
ディジタルイメージ内で連結しているコンポーネント
(複数)を発生し、連結されたコンポーネントを複数の
テキストブロックにグループ化するステップを具備して
いる。
【0030】さらに、手書き分離法のグループ化ステッ
プは、近接連結コンポーネントの各ペアーが同一行上に
あるかどうかを判定し、同一行上にある与えられた近接
連結コンポーネントの各ペアーに対しては、近接連結コ
ンポーネントの各ペアーが互いに隣接しているかどうか
を判定する。
【0031】次に、同一行上の与えられた隣接した近接
連結コンポーネントの各ペアーに対して、本方法は、隣
接した近接連結コンポーネントのペアーが同じ高さを持
っているかどうかを判定し、もし、近接連結コンポーネ
ントのペアーが同じ高さを持っていれば、近接連結コン
ポーネントのペアーは単一のテキストブロック内に一緒
に入れられる。
【0032】実施例によって示され、本発明をそれにだ
け制限する意図のない本発明の以下の詳細な説明は、そ
れに付随する図面との連係によって最良に理解されるだ
ろう。
【0033】
【好適実施例の詳細な説述と発明の効果】図面、特に図
2に示すように、インテリジェント・プリンティング・
コントロール・インターフェース(以下IPCIと言
う)295は特別なイメージ処理機能、すなわち、手書
きの注釈を分離する機能を持つプリンリンティング/コ
ピーイングデバイスを形成するように構成されている。
【0034】このプリンティング/コピーイングデバイ
スは一般目的のコンピューターシステム内、または、専
用のプリンター/コピアー内で実行することができる。
【0035】IPCI 295は仮想プリンタードライ
バー290、プリンティングコントロールパネル28
0、及び、手書き分離モジュール275を含んでいる。
【0036】ユーザーアプリケーション200によって
生成された文書がプリントされようとするとき、その文
書にに付随するプリンティングコマンドはグラフィック
ス・デバイス・インターフェース(以下GDIと言う)
210に渡される。GDI210はこれらのコマンドを
従来通りの方法で処理し、それらを(プリンタードライ
バーにではなく)IPCI 295に渡す。
【0037】IPCI 295はプリンティングコント
ロールパネル280のコントロールのもとで、文書中の
どんな手書き注釈も除去するプリンティングコマンドを
処理し、この処理されたプリンティングコマンドを第1
の実施例に関して上に述べたのと同様のやり方で、スプ
ーラー230、ポートモニター240及びプリンター2
50を用いる通常の方法によるプリント用のプリンター
ドライバー220に渡す。
【0038】2種類のタイプの文書つまり:(1)プリ
ントされた後でもとの文書に加えられた手書きの注釈を
含むスキャンされた文書と(2)オンラインの注釈ツー
ルを使って生成された手書きの注釈を含むディジタル文
書と、が予想されている。
【0039】IPCI295は、コンピューターシステ
ムにインストールされたとき、ユーザーザーにその動作
が知られるように(すなわち、IPCI「明示(アウェ
ヤ)」モードで)インストールされてもよいし、あるい
は、その動作が知られないように(すなわち、IPCI
「非明示(ブラインド)」モードで)インストールされ
てもよい。「明示」モードでは、ユーザーは手書き分離
の能力の利点を生かせるように専用の「IPCIプリン
ター」を選ばなければならない。
【0040】「非明示」モードでは、ユーザーは任意の
入手できるプリンターを選択し、その選択されたプリン
ターに対するプリンター選択を用いて手書き分離能力を
構築することになる。
【0041】上に議論したように、仮想プリンタードラ
イバー290は GDI 210からのコマンドを受け付
け、それらを目的のデバイス(すなわち、サードパーテ
ィー製のプリンタードライバー220、スプーラー23
0、ポートモニター240、及びプリンター250)に
渡す。それに加えて、仮想プリンタードライバー290
は プリント中の文書内の手書きの注釈を除去する。
【0042】動作スピードのためと実行の簡単化のため
に、このことはもとの文書の内容を検出された手書き領
域におけるビットマップに重ねることによって行われ
る。
【0043】あるいは図3に示すように、本発明の手書
き分離法は専用のプリンター/コピアー300内の特定
目的コンピューター(たとえば、ディジタルコピー機ま
たは多目的周辺装置)で実行できる。専用のプリンター
/コピアー300はスキャンニングエンジン310、手
書き分離モジュール320、及びプリンティングモジュ
ール330を含んでいる。
【0044】動作中、専用プリンター/コピアー300
は2つの動作モードを持っている。第1のモード(すな
わち、「プリントモード」)では、プリントリクエスト
は外部のコンピューター340にいるユーザーによって
発せられ、専用プリンター/コピアー300に送られ
る。
【0045】プリントリクエストは、いずれの手書き注
釈も除去するための処理を行う手書き分離モジュール3
20に送られ、次に、修正されたプリントリクエストが
プリントエンジン330にプリントのために送られる。
第2のモード(すなわち、「コピーモード」)では、文
書はスキャニングモジュール310を用いてスキャンさ
れ、得られたディジタルイメージはどんな手書き注釈を
も除去する処理を行うため、手書き分離モジュール32
0に送られる。
【0046】次に、修正されたプリントリクエストがプ
リントのためにプリントエンジン330に送られる。
【0047】図4は注釈を除去するために仮想プリンタ
ードライバー290によって実行されるステップのフロ
ーチャートである。ユーザーアプリケーション(すなわ
ち、スキャンで発生されたかディジタルに発生された
か)によって生成された両方のタイプの文書に対して、
手書き注釈除去の処理は同じであり、イメージは単にI
PCIプリンター(「明示」モード)または任意のプリ
ンター(「非明示」モード)のいずれかを用いてプリン
トされるだけである。
【0048】図4に示すように、最初のステップはサー
ドパーティーのプリンタードライバーをロードして(ス
テップ400)、そのプリンタードライバーの能力を取
得する(ステップ410)ことである。次に、プリント
すべきイメージがGDI210(図2)から得られる情
報を用いてメモリー中でレンダリングされる(ステップ
420)。
【0049】ステップ430で、下に詳しく議論する手
書き分離アルゴリズムがメモリー中のイメージに適用さ
れて、ステップ410で、手書きを含むすべての領域が
同定される。そこで、GDI 210から得られたもと
の情報が何の変更もなしにサードパーティーのプリンタ
ードライバー220に渡される(ステップ450)。
【0050】最後に、ブランクのビットマップが手書き
を含むことを同定された各々の領域でレンダリングさ
れ、この付加的な情報がサードパーティーのプリンター
ドライバー220に渡され(ステップ460)、プリン
ティング中に手書き注釈部分は取り除かれてしまう。
【0051】ユーザーインターフェースコントロールパ
ネル280は、必要なとき 、IPCI 295の動作を
構成するインターフェースをユーザーに供給する。たと
えば、ユーザーはシステムの手書き分離能力を動作させ
たり停止させたりすることを希望するだろう。
【0052】コンピューターシステムとともに使うとき
には、ユーザーインターフェースコントロールパネル2
80は、現存のサードパーティープリンターユーザーイ
ンターフェースに対するアドオンプロパティーシートで
あってもかまわない。IPCIプリンターを構成すると
き(すなわち、「明示」モード)、または任意のサード
パーティープリンターをインストールされているIPC
Iとともに動作させるように構成するとき(すなわち、
「非明示」モード)それが呼び出される。
【0053】プリンター/コピアーシステムとともに使
うときには、ユーザーインターフェースコントロールパ
ネル280は、通常のやり方でシステムのユーザーイン
ターフェースを通してコントロールされる(たとえば、
プリンター/コピアーはディスプレースクリーンとキー
パッド/マウスまたはタッチスクリーンインターフェー
スを通してアクセスできるコンフィグレーションメニュ
ーを含んでいる)。
【0054】手書き注釈を同定するために、適切な特徴
の統計的変化が考慮される。ひとつの文字の投影プロフ
ァイルはその領域ボックス内のイメージピクセルの垂直
投影として定義される。投影プロファイルの例が図5A
と5Bに示されている。
【0055】機械プリントテキストは機械プリントテキ
ストされたテキストの規則性のゆえに投影プロファイル
上に多くの規則性をつくり出す。一方、手書き注釈は字
体によって変わる傾向があり不規則に現れるので、それ
らの投影はよりスムーズである。
【0056】機械プリントテキストと手書き注釈との間
の違いは図5Aと5Bを比較することによってはっきり
と示されている。
【0057】図5Aは、その大きさに急峻で突然の変化
を含んでいる機械プリントされた文字「M」に対する投
影プロファイルを示しており、一方、図5Bはその大き
さによりゆっくりとした変化を含む手書きの文字「M」
を示している。
【0058】弁別は1つのワード(または文字列)が字
体に対して普通は均一であることから、文字レベルにま
で降りて行く必要がないので、ワードレベルでなされ
る。本発明の方法は隠されたマルコフ過程(HMM)の
理論にもとづいている。
【0059】未知のOCRの知識は隠された状態として
扱われ、判定はこれらの段階から出てくる観測シーケン
スにもとづいてなされる。
【0060】投影プロファイルを分析するとき、たとえ
ば、もし隣接する文字に沿っての投影が計算されるなら
ば、機械プリントテキストの隣接文字に沿う投影中の変
化はマルコフチェーンと考えられる。
【0061】しかし、多数の文字の1つから同じ投影プ
ロファイルが生じるかも知れないので、簡単にマルコフ
モデルを用いることはできない。隠されたマルコフモデ
ルでは、観測は状態の確率関数である。
【0062】HMMは、同一性のように隠された背後に
ある確率過程で二重に埋め込まれた確率過程、すなわち
印刷された文字である。
【0063】たとえば、Nをモデルの状態の数とし、M
を状態毎のはっきりとした観測のシンボルの数としよ
う。(ボールド)Aは状態遷移確率マトリックスで、 aij =P[qt+1= S|q=S], 1≦i, j≦N (1) であり、aij は、時刻tにおける状態がS が時
刻t+1における状態S に変化する確率である。
(ボールド)Bは観測シンボル確率マトリックスで、 b(k)=P[νat t|q=S],1≦j≦N,1≦k≦M ( 2) であり、b(k)は時刻tに状態がSであるとし
て、時刻tにシンボルνを観測する確率である。πは
初期状態の分布である。すなわち、 π=P[q=S], 1≦i≦N ( 3) は時刻t=1において状態Sにある確率である。観測
シーケンスをO=O...Oとし、マルコフモデ
ルを λ=(ボールド)A,(ボールド)B,πとし
て、確率P(O|λ)が計算すべきものである。使われ
る計算法はいわゆるフォーワード・バックワード計算法
である。もしフォーワード変数がa(i)=P(O
...O,q=S|λ)とセットされるなら
ば、すなわち、a(i)が部分観測シーケンスO=O
...O(時刻 t まで)の確率であるならば、モ
デルをλとしての、時刻tにおける状態はSである。
フォーワード計算法は以下の通りである。
【0064】
【数1】
【0065】誘導から、tが増大するにつれてα
減少するのは明らかである。もし観測シーケンスが長す
ぎれば、aは装置の容量を超えてしまうだろう。したが
って、実際の適用においてはスケーリングが適用され
る。ここでは具体的な詳細は議論しないが、隠されたマ
ルコフモデル内でのスケーリングは当該技術に通常に精
通する人々によってよく理解されるところである。
【0066】本発明の手書き分離法は、イメージ内のテ
キストブロックの同定と分割に頼ってHMMをワードレ
ベルで働かせている。当該技術に精通した人々には、テ
キストブロックの分割について多くのアルゴリズムが知
られている。
【0067】しかし本発明では、連結されたコンポーネ
ントがまず発生せられる。次に、以下のように簡単なグ
ループ分け方法が使われる。それぞれがそれらの境界付
けボックス(x1_min, x1_max, y1_min, y1_max) と
(x2_min, x2_max, y2_min,y2_max) によって表される
2つの連結コンポーネントが与えられたとする。ただ
し、xは、原点が上方左コーナーである座標系におい
て、水平方向の座標を、yは垂直方向の座標をそれぞれ
表しており、(x_min, y_min ) は境界付けボックスの
上左コーナーを表し、(x_max, y_max ) は境界付けボ
ックスの下右コーナーを表している。
【0068】以下の3つの条件がチェックされる。 1.|y1_min−y2_min| はあらかじめ決められたしきい
値T0より小さいか? 2.|x1_max−x2_min| または|x2_max−x1_min| はあら
かじめ決められたしきい値T1より小さいか? 3.|y1_max−y1_min|−|y2_max−y2_min| はあらかじ
め決められたしきい値T2より小さいか?
【0069】第1の条件は「同じ」行上のグループ分け
境界付けボックスに対するものである。第2の条件は隣
接度に対するものであり、また、第3の条件は2つの境
界付けボックスが「同じ」高さを持っていることを保証
するものである。ここに「同じ」とは、あらかじめ決め
られたしきい値T0、T1、T2で設定できるところの
ある程度の類似度を意味している。
【0070】もし上の条件が満足されれば、2つのコン
ポーネントは合体され、新しく生まれたボックスの座標
は x_min = min (x1_min, x2_min) x_max = max (x1_max, x2_max) y_min = min (y1_min, y2_min) x_max = min (y1_max, y2_max) となる。
【0071】分割では、小さなコンポーネント(たとえ
ば、1つのダッシュのような)はグループ化に先だって
除去される。
【0072】ワードのレベルでは、分割されたワードは
境界付けボックスによって表されているいくつかの個々
の文字からなっているだろう。観測シーケンスは、ワー
ド内にある個々の文字からの投影プロファイルをつなぎ
合わせることによってワードレベルで得られる。
【0073】本発明の手書き分離法に対して用いられる
モデルでは、52個の大文字と小文字のラテン系文字及
び10個の数字に対応する計62個の隠された状態が用
いられ、さらに、観測シーケンスにおける10のレベル
の投影値に対応する10個のシンボルが用いられる。
【0074】このようにして、状態は未知の文字であ
り、観測シーケンスはその状態の確率関数である。
【0075】このモデルでは、状態遷移マトリックス
(ボールド)Aの要素aijは1つのワード内の2つの
隣り合う文字の遷移確率である。すなわち、(ボール
ド)Bの要素bは与えられた文字または数字内で起
こるシンボルの確率であり、要素πはワードが文字
または数字で始まる確率である。
【0076】図6は本発明の手書き分離の分類プロセス
を示すフローチャートである。ある1つのイメージが、
上に述べたようにまずN個のテキスト文字列(複数のワ
ード)に分割される(ステップ600)。インデックス
を1からはじめる(ステップ610)。
【0077】そうして、判定ボックス620とインデッ
クス増加ステップ690のコントロールのもとに各ワー
ドに対するループを処理する。各処理ループのあいだ、
ワード内の各文字の投影が計算され、つなぎ合わされて
そのワードの観測シーケンスが発生される(ステップ6
50)。もちろん、当業技術に普通の知識を有する人々
がすぐに分かるように、1つのワードに対して観測シー
ケンスを計算する方法は沢山ある。
【0078】次に、モデル(P(O|λ))で与えられ
るシーケンスを観測する確率がある特定のモデル、ここ
では、機械プリントテキスト(ステップ645と65
5)か又は手書きテキスト(ステップ660と680)
のあるモデルとされている各ワードに対して計算され
る。最も高い確率を与えるモデルが結果として選択され
る(ステップス670及び680)。
【0079】明らかなように、2つのモデルは、(1)
機械モデルまたは(2)手書きモデル、の分類に対して
生成される。隠されたマルコフモデルを得るのに用いら
れるモデルを下に説明する。一旦同定されたすべてのワ
ードが分類されると、その確度を改善するために後処理
ステップ630が下に示すように使われ、その後にプロ
セスが終了する(ステップ640)。
【0080】一旦、文書内のすべてのワードがHMM
と無関係に分類されるとある程度のエラーが残る、すな
わち手書きテキストが機械テキストとして分類されたり
またその逆になったりするかもしれない。そこで、本発
明の手書き注釈の方法では、分類結果の大多数にもとづ
いて、後処理が個々のエラー補正に随意追加的に適用さ
れうる。
【0081】先ず各分類されたワードに対して、3つの
数が次のように計算される。 1.MN それに隣接の(主として、左または右サイド
の)機械ワードの数 2.HN それに隣接の手書きワードの数 3.ML ほぼ同一行にある機械ワードの数
【0082】それから、下記のルールが、MN、HN、
及びMLの値にもとづいて導かれる。 1.もし現在のワードが手書きと分類されて、それが機
械プリントテキスト行にあり(ML>1)、しかも、そ
こに少なくとも1個の隣接機械ワードがある(MN>
0)ならば、現在のワードを「機械プリントテキスト」
に入れかえよ。 2.もし現在のワードが機械プリントテキストと分類さ
れ、そうして、もし2個あるいはそれ以上の手書きワー
ドがその隣にある(HN>1)ならば、「手書き注釈」
に入れかえよ。もし現在のワードが機械テキスト行にあ
り(ML>1)しかも少なくとも機械の隣接がある(M
N>0)ならば、それは「機械プリントテキスト」にと
どめる。もし現在のワードが1個の手書きワードの隣接
を持ち(HN=1)、かつ1個かゼロ個の機械ワードの
隣接を持つ(MN<=1)ならば判定は困難で、その現
在のワードは「不明」としてマークされる。
【0083】後処理の期間に考えられるそれ以外のすべ
ての場合においては、判定中のワードの状態はそのまま
に保たれる。
【0084】機械プリントテキスト(λ)と手書きテ
キスト(λ)に対するHMMを得るのに学習が用いら
れる。モデルの計算は学習プロセスの中でただ1回だけ
行うことができる。学習においては、確率マトリックス
(ボールド)AとπはASCIIテキストの例から得ら
れる。マトリックス(ボールド)Bは文字と数字の各種
の字体のスキャンによって得られたビットマップイメー
ジのセットから計算される。マトリックス(ボールド)
Aとπは機械と手書きのモデルの両方に対して同じであ
る。
【0085】マトリックス(ボールド)Bは機械と手書
きに対して別々に計算されなければならない。図7と8
は機械テキストと手書き注釈のそれぞれに対する学習マ
トリックス(ボールド)Bの例をえがいたものである。
【0086】学習マトリックス(ボールド)Bでは、同
じ文字(状態)についてのいくつかのサンプルが得られ
る。各文字の各々のサンプルに対して、観測シーケンス
が計算され、確率が平均ベースで計算される。図7で見
られるように、各機械プリントされた文字(状態)に対
しては、いくつかのフォントスタイルが使われている。
【0087】手書き文字に対しては、図8に見られるよ
うに、異なるユーザーからのサンプルを各手書き文字に
対して集めておかなければならない。複数のサンプルの
使用は機械プリントテキストについての種々のフォント
スタイルと手書きにおける個人差を考慮するためであ
る。大きな学習サンプルズの選択は各種の文書スタイル
と異なる手書きテキスト筆者に対してわれわれの判別の
不相違性を確実にするはずである。
【0088】その上、観測シーケンスの計算法はフォン
トサイズとは独立である。マトリックス(ボールド)B
を計算するためのすべての学習サンプルは600dpi
のプリンターでプリントされ、300dpiでスキャン
される。しかし、このプリンティングとスキャニングで
異なる分解能は学習には影響を与えないだろう。
【0089】本発明の手書き分離法のテストの結果が図
9から11に示されている。すべてのもとの文書は60
0dpiでプリントされ、300dpiでスキャンされ
たものである。手書きの注釈は中細のボールペンを使っ
て書かれたものである。図9は手書きの注釈と機械プリ
ントテキストの混じった文書900を示している。
【0090】図10は図9の文書900の処理後のバー
ジョン910であり、それはもとの文書の内容の上に重
ねて置かれた境界付けボックス(たとえばボックス91
5)によって機械プリントされたテキストをグラフィッ
クに同定することを可能としたワード分割とそれに引き
続く分類ステップを示している。
【0091】図11は図9の文書900の処理後のバー
ジョン920であり、それはもとの文書の内容の上に重
ねて置かれた境界付けボックス(たとえばボックス92
5)によって手書きの注釈をグラフィックに同定するこ
とを可能としたワード分割とそれに引き続く分類ステッ
プを示している。
【0092】図9から11によって示されているよう
に、本発明の方法は、手書きの注釈が機械プリントされ
たテキスト上に直接置かれた場合でも、同定可能であ
る。
【0093】本発明の手書き分離法の好適実施例におい
て、分類ステップはワードからワードへのベースで実行
されており、それは強靱であり、また処理時間の点で高
効率である。
【0094】さらに、この方法は、ページの内容の全体
的な情報を必要とせず、機械プリントテキストがフォン
トスタイルとサイズについて変化するときにも、また、
手書きが文書内のどこに現れても動作可能である。
【0095】機械プリントされたテキストと手書き注釈
からなる文書上の手書きの注釈を検出する本発明の方法
に対して種々の応用が存在する。そのような応用の1つ
は文書の認識である。
【0096】同じ文書内の手書きの注釈と機械プリント
テキストは分離せられ、効率のよい認識のために、機械
プリントテキストはOCRのような適当な認識エンジン
に送られ、手書きの注釈はICR(Inteligent Charact
er Recognition; インテリジェント文字認識)に送られ
る。
【0097】手書きの注釈の分離についての他の応用に
は、手書きの注釈だけが重要となるフォームの処理、銀
行小切手の処理がある。他の応用には、もとの文書内容
に対してなされた変更が追跡できる自動バージョン管
理、もとの文書内容の安全な伝達とプリンティング、及
び、もとの内容が最初に保管され、その後その文書に対
する増加的な変化(付加された手書き注釈のような)だ
けが保存されるところの文書の内容にもとづく効率のよ
い文書アーカイビングなどが含まれている。
【0098】本発明を、以上、特に好適実施例とその種
々の性質に関して示し説明しきたが、本発明の精神と範
囲から逸脱することなく種々の変化と変更がなされ得る
ことは当該技術に精通した人々には理解されるであろ
う。各請求項はここに述べられた実施例、前記された別
案、及びそれらのすべての均等物を含むものと解釈され
るべきことが意図されている。
【図面の簡単な説明】
【図1】通常のコンピューターがどのようにしてにして
プリントリクエストを処理しているかを示す図
【図2】あるコンピューターシステムにおいて実施され
た本発明のインテリジェントプリントコントロールの要
素(複数)を示す図
【図3】あるプリンター/コピアーシステムにおいて実
施された本発明のインテリジェントプリントコントロー
ルの図
【図4】本発明の動作ステップを示すフローチャ−ト
【図5A】プリントされた文字「M」に対する投影プロ
ファイル
【図5B】手書きされた文字「M」に対する投影プロフ
ァイル
【図6】本発明の手書き分離法のフローチャート
【図7】本発明の手書き分離法で用いるための機械プリ
ントされたテキスト学習用シート
【図8】本発明の手書き分離法で用いるための手書きテ
キスト学習用シート
【図9】手書きと機械プリントテキストの混在を有する
サンプル文
【図10】本発明の手書き分離法の機械テキスト同定ス
テップの出力を示す文書
【図11】本発明の手書き分離法の手書きテキスト同定
ステップの出力を示す文書
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 2C061 AP01 AP04 5B021 LL01 QQ03 5B064 AA01 AA07 AB13 EA26 FA00 5L096 BA17 FA38 GA19 GA30 HA13 JA22 KA04

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 手書きテキストと機械プリントテキスト
    を有するディジタル文書(複数)を生成するための、か
    つ前記ディジタル文書の少なくとも1つをプリントする
    リクエストを発生するための手段、 前記リクエストを受け取り、前記リクエストを選択的に
    処理して前記手書きテキストを除去する、前記発生する
    ための手段に接続されたインテリジェントなプリンティ
    ングコントロールインターフェース、及び前記選択的に
    処理されたリクエストをプリントするため前記インテリ
    ジェントなプリンティングコントロールインターフェー
    スに接続された手段、 を具備した文書プリンティングのためのシステム。
  2. 【請求項2】 前記インテリジェントなプリンティング
    コントロールインターフェースがさらに、 前記リクエストを受け取るための仮想プリンタードライ
    バー、 前記リクエストを処理するかどうかを判定するためのプ
    リンティングコントロールパネル、及び前記プリンティ
    ングコントロールパネルのコントロールのもとで前記リ
    クエストを選択的に処理して前記手書きテキストを除去
    するための手書き分離モジュール、 を具備した請求項1のシステム。
  3. 【請求項3】 請求項2のシステムにおいて、前記手書
    き分離モジュールが、ディジタルイメージを複数のテキ
    ストブロックに分割することによって前記リクエストを
    処理し、前記テキストブロックの各々に対する観測のシ
    ーケンスを計算し、前記観測シーケンスが機械プリント
    テキストに対する所定の隠されたマルコフ過程で現れる
    であろう前記テキストブロックの各々のに対する第1の
    確率を計算し、前記観測シーケンスが手書きテキストに
    対する所定の隠されたマルコフ過程で現れるであろう前
    記テキストブロックの各々に対する第2の確率を計算
    し、前記テキストブロックの各々に対して前記第1の確
    率と前記第2の確率を比較し、もし前記第1の確率が前
    記第2の確率よりも大きければ機械テキストとして前記
    テキストブロックをマークし、もし前記第2の確率が前
    記第1の確率よりも大きければ手書きテキストとして前
    記テキストブロックをマークし、前記マークされた手書
    きテキストを除去する、ことを特徴とする請求項2のシ
    ステム。
  4. 【請求項4】 手書きテキストと機械プリントテキスト
    を含むディジタル文書を発生するための、かつ前記ディ
    ジタル文書をプリントするリクエストを発生するための
    スキャナー、 前記リクエストを受け取り、前記リクエストを選択的に
    処理して前記手書きテキストを除去する前記スキャナー
    に接続されたインテリジェントなプリンティングコント
    ロールインターフェース、及び前記選択的に処理された
    リクエストをプリントするためのインテリジェントプリ
    ンティングコントロールインターフェースに接続された
    プリンター、 を具備する文書コピーのためのシステム。
  5. 【請求項5】 前記インテリジェントなプリンティング
    コントロールインターフェースが、さらに、 前記リクエストを受け取るための仮想プリンタードライ
    バー、 前記リクエストを処理するかどうかを判定するためのプ
    リンティングコントロールパネル、及び前記プリンティ
    ングコントロールパネルのコントロールのもとに前記リ
    クエストを選択的に処理して前記手書きテキストを除去
    するための手書き分離モジュールを具備する請求項4の
    システム。
  6. 【請求項6】 前記請求項5のシステムにおいて、 前記手書き分離モジュールが、ディジタルイメージを複
    数のテキストブロックに分割することによって前記リク
    エストを処理し、前記テキストブロックの各々に対する
    観測シーケンスを計算し、前記観測シーケンスが機械プ
    リントテキストに対する所定の隠されたマルコフ過程で
    現れるであろう前記テキストブロックの各々に対する第
    1の確率を計算し、前記観測シーケンスが手書きテキス
    トに対する所定の隠されたマルコフ過程で現れるであろ
    う前記テキストブロックの各々に対する第2の確率を計
    算し、前記テキストブロックの各々に対して前記第1の
    確率と前記第2の確率を比較し、もし前記第1の確率が
    前記第2の確率よりも大きければ、機械テキストとし
    て、前記テキストブロックをマークし、もし前記第2の
    確率が前記第1の確率よりも大きければ、手書きテキス
    トとして前記テキストブロックをマークし、前記マーク
    された手書きテキストを除去する、システム。
  7. 【請求項7】A.ディジタルイメージを複数のテキスト
    ブロックに分割すること; B. 前記テキストブロックの各々に対する観測シーケン
    スを計算すること; C. 前記観測シーケンスが機械プリントテキストに対す
    る所定の隠されたマルコフ過程で現れるであろう前記テ
    キストブロックの各々に対する第1の確率を計算するこ
    と; D. 前記観測シーケンスが手書きテキストに対する所定
    の隠されたマルコフ過程で現れるであろう前記テキスト
    ブロックの各々に対する第2の確率を計算すること; E.テキストブロックの各々のに対して前記第1の確率
    と前記第2の確率を比較すること; F.もし前記第1の確率が前記第2の確率よりも大きけ
    れば、 機械プリントテキストとして、前記テキストブ
    ロックをマークすること; G.もし前記第2の確率が前記第1の確率よりも大きけ
    れば、手書きテキストとして、前記テキストブロックを
    マークすること; の各ステップを含む、手書きテキストと機械プリントテ
    キストの混在を含むディジタルイメージの機械プリント
    テキストから手書きテキストを分離するための方法。
  8. 【請求項8】 前記テキストブロックの各々が機械プリ
    ントテキストか手書きテキストかのいずれかとしてマー
    クされた後に個別エラー(複数)を補正するディジタル
    イメージの後処理をすることのステップをさらに具備す
    る請求項7の方法。
  9. 【請求項9】 前記分割ステップが、ディジタルイメー
    ジ内で連結しているコンポーネント(複数)を発生する
    こと、及び前記連結されたコンポーネントを複数のテキ
    ストブロックにグループ化することの各ステップを含
    む、請求項7の方法。
  10. 【請求項10】 前記グループ化ステップが:近接連結
    コンポーネントの各ペアーが同一行上にあるかどうかを
    判定すること;同一行上の与えられた近接連結コンポー
    ネントの各ペアーに対しては、近接連結コンポーネント
    の前記ペアーが互いに隣接しているかどうかを判定する
    こと;与えられた互に隣接した近接連結コンポーネント
    の各ペアーに対しては、隣接した近接連結コンポーネン
    トのペアーが同じ高さを持っているかどうかを判定する
    こと;及びもし、近接連結コンポーネントのペアーが同
    じ高さを持っていれば、近接連結コンポーネントのペア
    ーは単一のテキストブロック内に一緒に入れること;の
    各ステップを具えてなる請求項9の方法。
  11. 【請求項11】 前記近接連結コンポーネントの前記ペ
    アーが同一行上にあるかどうかを判定する前記ステップ
    が:近接連結コンポーネントの前記ペアーが互いに隣接
    しているかどうかを判定し、連結コンポーネントの前記
    ペアーの各々にに対して最小の垂直座標を同定するこ
    と;前記近接連結コンポーネントの前記最小垂直座標間
    の差が第1の所定のしきい値より小さいかどうかを判定
    すること;および前記近接連結コンポーネントの前記最
    小垂直座標間の差が第1の所定のしきい値より小さいと
    のしきい値判定のとき、前記近接連結コンポーネントを
    同一行上にあるものとしてマークすること;の各ステッ
    プを具えてなる請求項10の方法。
  12. 【請求項12】 前記請求項10の方法において、 近接連結コンポーネントの前記ペアーが互いに隣接して
    いるかどうかを判定する前記ステップがさらに:前記近
    接連結コンポーネントの各々に対する最大と最小の水平
    座標を同定すること;前記近接連結コンポーネントの第
    1の最大の水平座標と前記近接連結コンポーネントの第
    2の最小の水平座標の間の差が第2の所定のしきい値よ
    りも小さいかどうかを判定すること;前記近接連結コン
    ポーネントの前記第2の前記最大の水平座標と前記近接
    連結コンポーネントの前記第1の最小の水平座標の間の
    差が前記第2の所定のしきい値よりも小さいかどうかを
    判定すること;及び前記近接連結コンポーネントの前記
    第1の前記最大の水平座標と前記近接連結コンポーネン
    トの前記第2の前記最小の水平座標の間の差が前記第2
    の所定のしきい値よりも小さいか、あるいは、前記近接
    連結コンポーネントの前記第2の前記最大の水平座標と
    前記近接連結コンポーネントの前記第1の前記最小の水
    平座標の間の差が前記第2の所定のしきい値よりも小さ
    いとき、連結コンポーネントの前記ペアーを互いに隣接
    しているとしてマークすること;各ステップを具えてな
    る請求項10の方法。
  13. 【請求項13】 前記請求項10の方法において:近接
    連結コンポーネントの前記ペアーが同じ高さを持ってい
    るかどうかを判定する前記ステップがさらに:前記近接
    連結コンポーネントの各々に対して最大と最小の垂直座
    標を同定すること;前記近接連結コンポーネントの第1
    の最大と最小の各垂直座標間の差から前記近接連結コン
    ポーネントの第2の最大と最小の各垂直座標間の差を差
    し引いた差が、第3の所定のしきい値よりも小さいこと
    を判定すること;そして前記近接連結コンポーネントの
    第1の最大と最小の各垂直座標間の差から前記近接連結
    コンポーネントの第2の最大と最小の各垂直座標間の差
    を差し引いた差が第3の所定のしきい値よりも小さいと
    きは、連結コンポーネントの前記ペアーを同じ高さを持
    つものとしてマークすること;の各ステップを具えるこ
    とを特徴とするステップを含んでなる請求項10の方
    法。
  14. 【請求項14】 文書コピー及びプリンティングのため
    の方法において;手書きテキストと機械プリントテキス
    トの両方を持つ文書のディジタルイメージを生成するこ
    と;前記ディジタルイメージをプリントするリクエスト
    発生すること;前記リクエストを処理して前記手書きテ
    キストを選択的に除去すること;前記選択的に処理され
    たリクエストをそれのプリンティングのためのプリンタ
    ーに伝送すること;の各ステップを具えてなる文書コピ
    ーおよびプリンティングのための方法。
  15. 【請求項15】 前記リクエストを処理する前記ステッ
    プがさらに、 A.前記ディジタルイメージを複数のテキストブロック
    に分割すること; B. 前記テキストブロックの各々に対する観測シーケン
    スを計算すること; C. 前記観測シーケンスが機械プリントテキストに対す
    る所定の隠されたマルコフ過程で現れるであろう前記テ
    キストブロックの各々に対する第1の確率を計算するこ
    と; D. 前記観測シーケンスが手書きテキストに対する所定
    の隠されたマルコフ過程で現れるであろう前記テキスト
    ブロックの各々に対する第2の確率を計算すること; E.テキストブロックの各々のに対して前記第1の確率
    と前記第2の確率を比較すること; F.もし前記第1の確率が前記第2の確率よりも大きけ
    れば、前記テキストブロックを機械プリントテキストと
    してマークすること;および G.もし前記第2の確率が前記第1の確率よりも大きけ
    れば、前記テキストブロックを手書きテキストとしてマ
    ークすること; の各ステップを具えてなる請求項14の方法。
JP2002033379A 2001-02-09 2002-02-12 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法 Pending JP2002352191A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/781,529 US6940617B2 (en) 2001-02-09 2001-02-09 Printing control interface system and method with handwriting discrimination capability
US09/781,529 2001-02-09

Publications (2)

Publication Number Publication Date
JP2002352191A true JP2002352191A (ja) 2002-12-06
JP2002352191A5 JP2002352191A5 (ja) 2005-08-25

Family

ID=25123028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002033379A Pending JP2002352191A (ja) 2001-02-09 2002-02-12 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法

Country Status (3)

Country Link
US (2) US6940617B2 (ja)
EP (1) EP1231558A2 (ja)
JP (1) JP2002352191A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006201885A (ja) * 2005-01-18 2006-08-03 Sharp Corp 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
JP2020053891A (ja) * 2018-09-27 2020-04-02 大日本印刷株式会社 情報処理装置、情報処理方法及びプログラム

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability
US7013029B2 (en) * 2001-06-29 2006-03-14 Intel Corporation Incorporating handwritten notations into an electronic document
US20030004991A1 (en) * 2001-06-29 2003-01-02 Keskar Dhananjay V. Correlating handwritten annotations to a document
US7120299B2 (en) 2001-12-28 2006-10-10 Intel Corporation Recognizing commands written onto a medium
US7573598B2 (en) * 2002-01-16 2009-08-11 Infoprint Solutions Company, Llc Method and apparatus for selectively copying documents with handwritten notations
US7072514B1 (en) * 2003-02-06 2006-07-04 The United States Of America As Represented By The National Security Agency Method of distinguishing handwritten and machine-printed images
US20050200913A1 (en) * 2004-03-11 2005-09-15 International Business Machines Corporation Systems and methods for identifying complex text in a presentation data stream
US7327884B2 (en) * 2004-10-12 2008-02-05 Loeb Enterprises, Llc Realistic machine-generated handwriting
US7352899B2 (en) * 2004-10-12 2008-04-01 Loeb Enterprises, Llc Realistic machine-generated handwriting with personalized fonts
US20080147687A1 (en) * 2005-02-17 2008-06-19 Naohiro Furukawa Information Management System and Document Information Management Method
US8340476B2 (en) 2005-03-18 2012-12-25 The Invention Science Fund I, Llc Electronic acquisition of a hand formed expression and a context of the expression
US8749480B2 (en) 2005-03-18 2014-06-10 The Invention Science Fund I, Llc Article having a writing portion and preformed identifiers
US20060212430A1 (en) 2005-03-18 2006-09-21 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Outputting a saved hand-formed expression
US8787706B2 (en) 2005-03-18 2014-07-22 The Invention Science Fund I, Llc Acquisition of a user expression and an environment of the expression
US7813597B2 (en) 2005-03-18 2010-10-12 The Invention Science Fund I, Llc Information encoded in an expression
US8229252B2 (en) 2005-03-18 2012-07-24 The Invention Science Fund I, Llc Electronic association of a user expression and a context of the expression
US7809215B2 (en) 2006-10-11 2010-10-05 The Invention Science Fund I, Llc Contextual information encoded in a formed expression
US8823636B2 (en) 2005-03-18 2014-09-02 The Invention Science Fund I, Llc Including environmental information in a manual expression
JP4420877B2 (ja) * 2005-09-22 2010-02-24 シャープ株式会社 画像処理方法、画像処理装置、及び画像出力装置
JP4254775B2 (ja) * 2005-10-24 2009-04-15 コニカミノルタビジネステクノロジーズ株式会社 書込画像取得装置、書込情報抽出方法、およびコンピュータプログラム
JP4620741B2 (ja) * 2005-10-25 2011-01-26 富士通株式会社 印刷画像生成プログラムおよびその記録媒体並びに印刷画像生成方法
JP4886312B2 (ja) * 2006-02-09 2012-02-29 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、及びプログラム
US8265345B2 (en) * 2006-11-20 2012-09-11 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image forming apparatus, and image reading apparatus
US7903877B2 (en) 2007-03-06 2011-03-08 Microsoft Corporation Radical-based HMM modeling for handwritten East Asian characters
US9277090B2 (en) * 2007-10-01 2016-03-01 Hewlett-Packard Development Company, L.P. System and method of document reproduction
US8457448B2 (en) * 2008-02-04 2013-06-04 Hewlett-Packard Development Company, L.P. Removing inserted text from an image using extrapolation for replacement pixels after optical character recognition
JP2010211466A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置および画像処理方法及びプログラム
US8351700B2 (en) * 2009-04-08 2013-01-08 Gracious Eloise, Inc. Variable glyph system and method
JP4875723B2 (ja) * 2009-04-24 2012-02-15 シャープ株式会社 画像形成装置
US8649600B2 (en) * 2009-07-10 2014-02-11 Palo Alto Research Center Incorporated System and method for segmenting text lines in documents
US8379801B2 (en) 2009-11-24 2013-02-19 Sorenson Communications, Inc. Methods and systems related to text caption error correction
US8832853B2 (en) 2009-12-07 2014-09-09 Dst Technologies, Inc. Managed virtual point to point communication service having verified directory, secure transmission and controlled delivery
US8948535B2 (en) * 2010-01-27 2015-02-03 Dst Technologies, Inc. Contextualizing noisy samples by substantially minimizing noise induced variance
US8824785B2 (en) 2010-01-27 2014-09-02 Dst Technologies, Inc. Segregation of handwritten information from typographic information on a document
US8600173B2 (en) 2010-01-27 2013-12-03 Dst Technologies, Inc. Contextualization of machine indeterminable information based on machine determinable information
US9412135B2 (en) 2013-10-29 2016-08-09 Bank Of America Corporation Check data lift for online accounts
US9432671B2 (en) * 2014-05-22 2016-08-30 Xerox Corporation Method and apparatus for classifying machine printed text and handwritten text
US9940511B2 (en) * 2014-05-30 2018-04-10 Kofax, Inc. Machine print, hand print, and signature discrimination
KR20170037424A (ko) * 2015-09-25 2017-04-04 엘지전자 주식회사 이동 단말기 및 그 제어방법
US11383153B2 (en) * 2019-06-10 2022-07-12 Scientific Games, Llc Lottery ticket packs with identification and security image and associated method for making
JP7282314B2 (ja) * 2019-08-29 2023-05-29 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
CN111275139B (zh) * 2020-01-21 2024-02-23 杭州大拿科技股份有限公司 手写内容去除方法、手写内容去除装置、存储介质
EP4182895A4 (en) * 2021-02-10 2024-01-10 Samsung Electronics Co., Ltd. METHOD AND SYSTEMS FOR PERFORMING IMAGE TO TEXT CONVERSION ON A DEVICE

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223227A (ja) * 1992-12-17 1994-08-12 Xerox Corp プロセッサベースの判定方法
JPH07114618A (ja) * 1990-12-13 1995-05-02 Xerox Corp 手書き及びマシン印字テキストの区分化方法
JPH07200720A (ja) * 1993-12-09 1995-08-04 At & T Corp 脱落書式文書画像圧縮
JPH07234917A (ja) * 1994-02-24 1995-09-05 Canon Inc 画像処理装置
JPH08272900A (ja) * 1995-03-29 1996-10-18 Oki Electric Ind Co Ltd 文書読取装置
JPH11232456A (ja) * 1998-02-10 1999-08-27 Atr Chino Eizo Tsushin Kenkyusho:Kk 顔動画像からの表情抽出方法
JPH11296324A (ja) * 1998-04-09 1999-10-29 Seiko Epson Corp プリンタ制御装置およびその方法並びに記録媒体
JP2001061061A (ja) * 1999-08-23 2001-03-06 Minolta Co Ltd 画像処理装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ582900A0 (en) * 2000-02-24 2000-03-16 Silverbrook Research Pty Ltd Printed media production
JPS63261486A (ja) * 1987-04-20 1988-10-28 Nec Corp 書体識別装置
US5402504A (en) * 1989-12-08 1995-03-28 Xerox Corporation Segmentation of text styles
US5029223A (en) * 1990-02-02 1991-07-02 International Business Machines Corporation Constraint driven-on line recognition of handwritten characters and symbols
US5063600A (en) * 1990-05-14 1991-11-05 Norwood Donald D Hybrid information management system for handwriting and text
US5048099A (en) * 1990-05-21 1991-09-10 Eastman Kodak Company Polygon-based method for automatic extraction of selected text in a digitized document
AU648595B2 (en) * 1990-09-27 1994-04-28 Cgk Computer Gesellschaft Konstanz Mbh Process for extracting individual characters from raster images of a read-in handwritten or typed series of characters in free distribution
US5216725A (en) * 1990-10-31 1993-06-01 Environmental Research Institute Of Michigan Apparatus and method for separating handwritten characters by line and word
US5442715A (en) * 1992-04-06 1995-08-15 Eastman Kodak Company Method and apparatus for cursive script recognition
US5812697A (en) * 1994-06-10 1998-09-22 Nippon Steel Corporation Method and apparatus for recognizing hand-written characters using a weighting dictionary
US5970170A (en) * 1995-06-07 1999-10-19 Kodak Limited Character recognition system indentification of scanned and real time handwritten characters
JP3504054B2 (ja) * 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
JP3436025B2 (ja) * 1995-12-27 2003-08-11 ミノルタ株式会社 読取り画像の修正方法及び画像読取り装置
US5953451A (en) * 1997-06-19 1999-09-14 Xerox Corporation Method of indexing words in handwritten document images using image hash tables
US6108444A (en) * 1997-09-29 2000-08-22 Xerox Corporation Method of grouping handwritten word segments in handwritten document images
EP0965943A3 (en) * 1998-06-04 2001-11-28 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and their application
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
US6567548B2 (en) * 1999-01-29 2003-05-20 International Business Machines Corporation Handwriting recognition system and method using compound characters for improved recognition accuracy
US6598087B1 (en) * 1999-09-08 2003-07-22 Ge Capital Commercial Finance, Inc. Methods and apparatus for network-enabled virtual printing
US7042594B1 (en) * 2000-03-07 2006-05-09 Hewlett-Packard Development Company, L.P. System and method for saving handwriting as an annotation in a scanned document
US6909805B2 (en) * 2001-01-31 2005-06-21 Matsushita Electric Industrial Co., Ltd. Detecting and utilizing add-on information from a scanned document image
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114618A (ja) * 1990-12-13 1995-05-02 Xerox Corp 手書き及びマシン印字テキストの区分化方法
JPH06223227A (ja) * 1992-12-17 1994-08-12 Xerox Corp プロセッサベースの判定方法
JPH07200720A (ja) * 1993-12-09 1995-08-04 At & T Corp 脱落書式文書画像圧縮
JPH07234917A (ja) * 1994-02-24 1995-09-05 Canon Inc 画像処理装置
JPH08272900A (ja) * 1995-03-29 1996-10-18 Oki Electric Ind Co Ltd 文書読取装置
JPH11232456A (ja) * 1998-02-10 1999-08-27 Atr Chino Eizo Tsushin Kenkyusho:Kk 顔動画像からの表情抽出方法
JPH11296324A (ja) * 1998-04-09 1999-10-29 Seiko Epson Corp プリンタ制御装置およびその方法並びに記録媒体
JP2001061061A (ja) * 1999-08-23 2001-03-06 Minolta Co Ltd 画像処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006201885A (ja) * 2005-01-18 2006-08-03 Sharp Corp 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
JP2020053891A (ja) * 2018-09-27 2020-04-02 大日本印刷株式会社 情報処理装置、情報処理方法及びプログラム
JP7107138B2 (ja) 2018-09-27 2022-07-27 大日本印刷株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
EP1231558A2 (en) 2002-08-14
US20050248808A1 (en) 2005-11-10
US6940617B2 (en) 2005-09-06
US20020135786A1 (en) 2002-09-26

Similar Documents

Publication Publication Date Title
JP2002352191A (ja) 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
US8225200B2 (en) Extracting a character string from a document and partitioning the character string into words by inserting space characters where appropriate
US9596378B2 (en) Method and apparatus for authenticating printed documents that contains both dark and halftone text
EP2553625B1 (en) Detecting position of word breaks in a textual line image
US7528986B2 (en) Image forming apparatus, image forming method, program therefor, and storage medium
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
US6937762B2 (en) Image processing device and program product
JPH08305803A (ja) 文字テンプレートセット学習マシン動作方法
JPH10116340A (ja) ビットマップ比較装置及び方法
US20080239330A1 (en) Image processing apparatus, image forming apparatus and computer-readable medium
JP2017105175A (ja) ページ記述言語文書からの直接文字認識
US7149352B2 (en) Image processing device, program product and system
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP3159087B2 (ja) 文書照合装置および方法
US8125691B2 (en) Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP2015202667A (ja) 情報処理装置、その制御方法およびコンピュータプログラム
JP4109738B2 (ja) 画像処理方法及び装置及びその記憶媒体
JP7497620B2 (ja) 文書データ生成装置、画像形成装置、及び文書データ生成プログラム
JP4651407B2 (ja) 画像処理装置およびコンピュータプログラムおよび記憶媒体
JP2019077116A (ja) 情報処理装置、情報処理方法、及びプログラム
JP5173690B2 (ja) 情報処理装置及び情報処理方法、並びに、コンピュータプログラム及びコンピュータ可読記録媒体
US9367525B2 (en) Data processing apparatus for page ordering, data processing method, and nontransitory storage medium for same
JP2010026986A (ja) 画像形成装置
WO2016027476A1 (ja) 文書処理装置、プログラム、及び記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050210

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050523

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070410

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070731