JP4745758B2 - テキストおよびグラフィクスの空間認識およびグループ化 - Google Patents
テキストおよびグラフィクスの空間認識およびグループ化 Download PDFInfo
- Publication number
- JP4745758B2 JP4745758B2 JP2005246356A JP2005246356A JP4745758B2 JP 4745758 B2 JP4745758 B2 JP 4745758B2 JP 2005246356 A JP2005246356 A JP 2005246356A JP 2005246356 A JP2005246356 A JP 2005246356A JP 4745758 B2 JP4745758 B2 JP 4745758B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- stroke
- recognition
- graph
- strokes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
- G06V30/18029—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering filtering with Haar-like subimages, e.g. computation thereof with the integral image technique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
C({Vi})=Φ(R(V1),R(V2),…,R(Vn))(式1)
式1において、Viの各々はページの区画を形成する頂点の部分集合(ストロークと頂点という用語は相互交換的に使用される)、Rはその頂点集合に関する最良の認識結果、関数Φは組み合わせコスト(総和、最大値または平均等)、Cは特定のグループ化{Vi}の全体的コストを示す。この最適化を効率的に実行するために、有効な集合Vi(グラフの反復)、効率的かつ正確な記号認識器R(認識コスト)、2つの部分グラフのコストを組み合わせるコスト関数Φ(組み合わせコスト)、そして計算を再利用する方法(ダイナミックプログラミング)があることが望ましい。
1.近傍グラフを作成し(図7(b)704、図8(b)804)、ページ上で相互に近い頂点を結び付ける。グループ化Viは、その頂点が近傍グラフにおいて結び付けられている場合のみ有効である。
2.グラフ内の各部分集合Viの大きさは、定数Κより小さいと制約されている(図7(c)706、図8(c)806)。たとえば、データ内のストロークが8より大きい記号は一般的には見当たらないため、部分集合の大きさに上限を設けることは合理的であるといえる。
これらの制限を設けた上で、2つの最適化方法を使って、最良のソリューションを得るための努力がなされた。第一の最適化方法は、ダイナミックプログラミングを用い、第二の最適化方法はさらに、「A−スター検索」に基づく改良を利用している。
・総和(Sum):Φ(c1,c2)=c1+c2+ε。コストの総和は、直感的にわかる。つまり、コストが負対数尤度であると、総和は可能性の積に対応する。εペナルティは、オーバーグループ化またはアンダーグループ化(under grouping)を制御するのに使用できる(εの数値を高くすると、強制的に、より少ない記号にグループ化される)。
・最大(Max):Φ(c1,c2)=Max(c1,c2)。この関数は、その集合の中の最悪の仮定にペナルティを与える。
・平均(Average):Φ(c1,c2)=(c1+ωc2)/(1+ω)。この関数は、仮定の中のすべての記号を通じて、スコアを平均する。ωは、V−Viに対する最良の解釈における記号の数に対応する重みである。
(費特許文献24から入手可能)のスケッチ形状データベース(非特許文献5参照)を利用して評価され、これには、19人の異なるユーザから収集された、13の形状クラスについての7,791個の複数のストロークからなる例が含まれる。図15は、このような試験例1500を示しており、(a)はランダムに生成された形状の集合1502、(b)は実際のユーザから収集された形状、矢印、文字で構成される合成フローチャート1504である。その近傍グラフを重ね合わせ、問題の大きさを説明している。形状がランダムなパターンになるよう相互の近辺に配置される、ランダム生成形状シーンで(図15(a)1502)、本発明の例は、同時のグループ化と認識については97%の精度、グループ化だけの場合は99%を超える精度を実現した(トレーニング/試験が80/20に分割された)。
C({Vi})=Φ(R(V1),R(V2),…,R(Vn)) (式1)
この式は、認識コストRと、組み合わせコストΦを含む。本発明の1つの例では、ダイナミックプログラミングを利用してコスト計算プロセスを容易にしている。これには通常、1からΚ(ただし、Κはストローク(頂点)の部分グラフ限界)の反復プロセスがかかわる。各部分グラフは、その水平軸上のすべての辺によって拡大され、重複が排除され、再び拡張され、これがサイズΚまで繰り返され、反復ごとに重複の伝播が排除される。本発明の別の例では、A−スター検索を使って最適な候補を発見する。A−スター検索は、各状態から目標に対する経験則による過小評価を利用して、検索空間のうち、最適解を導くことのできない部分を除去する。当業者は、本発明が最適なソリューションを見出すのに、コスト指向的な方法を使用できると推測するであろう。このように、A−スター検索方法のほかに、本発明は他のコスト指向的検索方法、たとえば、最良優先検索法や分岐限定検索法等を利用できる。最適な候補が決定されると、1712において、候補、文脈、ストロークの特徴による画像がレンダリングされる。当業者は、上記のシーケンスがすでにトレーニングされている認識器へのストローク入力の前処理にも適用できると推測するであろう。1714において、これらの画像を使い、線形関数、つまり「矩形フィルタ」を計算する。次に、1716において、アダブーストを使い、複合された矩形フィルタの集合に基づいて分類器を学習させ、フローは1718で終了する。基本的に、最終的な分類器は、前述の反復工程によって得られる弱分類器の集合からなる。次に、最終的な分類器が、本発明を使用する認識器の中で利用される。これにより、従来のシステムのような線形空間および時間限定を必要とせずに、セグメンテーションと認識の同時工程を自動的にトレーニングすることができる。
104,204,304 入力
106,206,306 出力
208,304 受信コンポーネント
210,302 認識コンポーネント
212 トレーニングコンポーネント
214 最適化コンポーネント
308 認識前コンポーネント
310 アダブースト認識器/分類器
312 近傍グラフ発生器
314 部分集合グループ化コンポーネント
316 画像レンダリングコンポーネント
418 認識器
502 認識器
504 画像
506 矩形フィルタ
508 分類器学習器
510 分類器
1804 処理ユニット
1806 システムメモリ
1810 ROM
1812 RAM
1814 BIOS
1826 ハードディスクドライブインタフェース
1828 磁気ディスクドライブインタフェース
1830 光ドライブインタフェース
1832 オペレーティングシステム
1834 アプリケーションプログラム
1836 その他のプログラムモジュール
1838 プログラムデータ
1840 キーボード
1844 シリアルポートインタフェース
1846 モニタ
1860 リモートコンピュータ
1862 メモリ記憶装置
1864 ローカルエリアネットワーク
1866 広域ネットワーク
1868 ネットワークインタフェース
1870 モデム
1902 クライアント
1904 サーバ
1906 サーバデータ記憶装置
1908 通信フレームワーク
1910 クライアントデータ記憶装置
Claims (24)
- 手書き記号を認識するためのコンピューティングシステムであって、
記号を表すストロークの組を含む少なくとも1つの入力を受け取る受信コンポーネントと、
前記入力中の前記記号を認識する認識コンポーネントと、
を備え、前記認識コンポーネントは、
前記受信コンポーネントからの入力を受信し、前記入力内で見つかったストロークの近似グラフを構成する近傍グラフ生成器であって、前記近似グラフはストロークに対応する頂点を含み、それぞれのストロークの凸包間の最短距離が閾値より短い場合、前記それぞれのストロークに対応する頂点の間に辺を追加する近傍グラフ生成器と、
前記近傍グラフ生成器から受信した近似グラフを接続された部分グラフに区分けする部分集合グループ化コンポーネントであって、接続された各部分グラフは辺により接続された頂点の部分集合に対応し、各部分集合のサイズは別の閾値以下である、部分集合グループ化コンポーネントと、
接続された各部分グラフに対応するストロークのレンダリングされた画像を生成する画像レンダリングコンポーネントと、
前記レンダリングされた画像を認識することにより、接続された前記部分グラフに対する記号の仮定及び対応するスコアを出力する分類器と
を含むことを特徴とするコンピューティングシステム。 - 請求項1に記載のシステムであって、前記入力は、1次元空間、2次元空間、または3次元空間内に存在する幾何学構造を含むことを特徴とするシステム。
- 請求項1に記載のシステムであって、前記入力は、テキストの入力とグラフィクスの入力とで構成されるグループから選択される少なくとも1つを含むことを特徴とするシステム。
- 請求項1に記載のシステムであって、前記入力は画素の集合を含むことを特徴とするシステム。
- 請求項1に記載のシステムであって、前記入力は、時間における非線形シーケンスと空間における非線形シーケンスとで構成されるグループから選択される少なくとも1つを含むことを特徴とするシステム。
- 請求項1に記載のシステムであって、
入力から手書き記号を特定するように前記認識コンポーネントをトレーニングするトレーニングコンポーネントをさらに備えることを特徴とするシステム。 - 請求項1に記載のシステムであって、前記手書き記号は、等式に関する文字を含むことを特徴とするシステム。
- 請求項7に記載のシステムであって、前記認識コンポーネントは、それが認識する前記文字に基づいて、前記等式の部分式を判断することを特徴とするシステム。
- 請求項8に記載のシステムであって、前記認識コンポーネントは、前記判断された部分式に基づいて、前記等式を取得することを特徴とするシステム。
- 請求項1に記載のシステムであって、前記分類器は、不正確な区分けにペナルティを与える機能を学習する、トレーニング可能な分類器を含むことを特徴とするシステム。
- 手書き記号を認識する方法であって、
記号を表現するストロークの集合を含む少なくとも1つの入力を受け取るステップと、
前記入力中の記号を認識するステップと、
を備え、前記入力中の記号を認識するステップは、
近似グラフ内の前記入力のストロークを連結するステップであって、前記近似グラフはストロークに対応する頂点を含み、それぞれのストロークの凸包間の最短距離が閾値より短い場合、前記それぞれのストロークに対応する頂点の間に辺を追加するステップと、
前記近似グラフを区分けして、辺により接続された複数の部分グラフを形成するステップであって、各部分グラフは辺により接続された頂点の部分集合に対応し、各部分集合のサイズは別の閾値以下であるステップと、
前記近似グラフの前記接続された複数の部分グラフに亘って、コスト指向型検索方法を適用して、最適な分解を決定するステップであって、前記最適な分解は部分グラフの集合であり、前記集合が1つにまとまるとグラフ全体となるステップと、
接続された各部分グラフに対応してレンダリングされたストロークの画像に基づいて、分類器の使用を通じて前記最適な分解を認識するステップと
を含むことを特徴とする方法。 - 請求項11に記載の方法であって、前記入力は、1次元入力、2次元入力、および3次元入力で構成されるグループから選択される少なくとも1つを含むことを特徴とする方法。
- 請求項11に記載の方法であって、前記入力は、テキストの入力とグラフィクスの入力とで構成されるグループから選択される少なくとも1つを含むことを特徴とする方法。
- 請求項11に記載の方法であって、前記入力は、光学的に認識可能なマークの集合と画素の集合とで構成されるグループから選択される少なくとも1つを含むことを特徴とする方法。
- 請求項11に記載の方法であって、前記入力は、時間の非線形シーケンスと空間の非線形シーケンスとで構成されるグループから選択される少なくとも1つを含むことを特徴とする方法。
- 請求項11に記載の方法であって、前記入力中の記号を認識するステップは、スケールおよび回転に対して不変の空間認識を行うステップを含むことを特徴とする方法。
- 請求項11に記載の方法であって、前記ストロークを連結して部分グラフを作成するステップは、
前記近似グラフを構成するステップと、
接続された部分集合Vi(ただし、|Vi|≦Κ、Κは部分グラフのサイズを限定する前記別の閾値)を列挙するステップと
を含むことを特徴とする方法。 - 請求項11に記載の方法であって、前記入力中の記号を認識するステップは、
トレーニング例の集合から前記分類器および/または分類パラメータを自動的に学習するステップをさらに含むことを特徴とする方法。 - 請求項11に記載の方法であって、前記コスト指向型検索方法は、A−スター検索方法、最善優先検索方法、分岐限定検索方法で構成されるグループから選択される少なくとも1つを含むことを特徴とする方法。
- 請求項11に記載の方法であって、前記コスト指向型検索方法は、
コスト最適化関数を利用して区分けおよび認識を実行し、
C({Vi})=Φ(R(V1),R(V2),…,R(Vn))
(ただし、Viは入力の分解を形成する頂点の部分集合、Rは前記頂点の集合についての最良の認識結果、関数Φは組み合わせコスト、Cは特定のグループ{Vi}の全体的コストを表す)
に従って最適なグループ化およびラベリングを判断するステップを含む最適化方法を用いることを特徴とする方法。 - 請求項11に記載の方法であって、
ストロークの湾曲、ストロークの向き、ストロークの少なくとも1つの端点で構成されるグループから選択される少なくとも1つを含むストロークの特徴を有するストロークのレンダリングされた画像を結合するステップをさらに含むことを特徴とする方法。 - 請求項11に記載の方法であって、前記最適な分解を認識するステップは、
機械学習に基づく分析器を利用して有効および無効な部分グラフを区別するステップをさらに含み、前記機械学習に基づく分析器は、アダブースト、ニューラルネットワーク、サポートベクトルマシン、およびベイズ式分類法で構成されるグループから選択される少なくとも1つを含むことを特徴とする方法。 - コンピュータを請求項1に記載のシステムとして機能させるためのプログラムを記憶したことを特徴とするコンピュータ読取可能記録媒体。
- コンピュータに、請求項11に記載の方法を実行させるためのプログラムを記憶したことを特徴とするコンピュータ読取可能記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/927,452 US7729538B2 (en) | 2004-08-26 | 2004-08-26 | Spatial recognition and grouping of text and graphics |
US10/927,452 | 2004-08-26 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006073000A JP2006073000A (ja) | 2006-03-16 |
JP2006073000A5 JP2006073000A5 (ja) | 2008-10-09 |
JP4745758B2 true JP4745758B2 (ja) | 2011-08-10 |
Family
ID=35478337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005246356A Expired - Fee Related JP4745758B2 (ja) | 2004-08-26 | 2005-08-26 | テキストおよびグラフィクスの空間認識およびグループ化 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7729538B2 (ja) |
EP (1) | EP1630723A3 (ja) |
JP (1) | JP4745758B2 (ja) |
Families Citing this family (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7475061B2 (en) * | 2004-01-15 | 2009-01-06 | Microsoft Corporation | Image-based document indexing and retrieval |
US7567715B1 (en) * | 2004-05-12 | 2009-07-28 | The Regents Of The University Of California | System and method for representing and encoding images |
US7299407B2 (en) * | 2004-08-24 | 2007-11-20 | International Business Machines Corporation | Marking and annotating electronic documents |
US7729538B2 (en) | 2004-08-26 | 2010-06-01 | Microsoft Corporation | Spatial recognition and grouping of text and graphics |
US7574048B2 (en) * | 2004-09-03 | 2009-08-11 | Microsoft Corporation | Freeform digital ink annotation recognition |
US7586490B2 (en) * | 2004-10-20 | 2009-09-08 | Siemens Aktiengesellschaft | Systems and methods for three-dimensional sketching |
US7522771B2 (en) | 2005-03-17 | 2009-04-21 | Microsoft Corporation | Systems, methods, and computer-readable media for fast neighborhood determinations in dynamic environments |
US7570816B2 (en) * | 2005-03-31 | 2009-08-04 | Microsoft Corporation | Systems and methods for detecting text |
US20060242568A1 (en) * | 2005-04-26 | 2006-10-26 | Xerox Corporation | Document image signature identification systems and methods |
US20060245654A1 (en) * | 2005-04-29 | 2006-11-02 | Microsoft Corporation | Utilizing grammatical parsing for structured layout analysis |
US7526129B2 (en) * | 2005-06-23 | 2009-04-28 | Microsoft Corporation | Lifting ink annotations from paper |
US8249344B2 (en) * | 2005-07-01 | 2012-08-21 | Microsoft Corporation | Grammatical parsing of document visual structures |
US7929769B2 (en) * | 2005-12-13 | 2011-04-19 | Microsoft Corporation | Script recognition for ink notes |
US7720773B2 (en) * | 2005-12-29 | 2010-05-18 | Microsoft Corporation | Partitioning data elements of a visual display of a tree using weights obtained during the training state and a maximum a posteriori solution for optimum labeling and probability |
US7953253B2 (en) * | 2005-12-31 | 2011-05-31 | Arcsoft, Inc. | Face detection on mobile devices |
US8509563B2 (en) * | 2006-02-02 | 2013-08-13 | Microsoft Corporation | Generation of documents from images |
US7986827B2 (en) * | 2006-02-07 | 2011-07-26 | Siemens Medical Solutions Usa, Inc. | System and method for multiple instance learning for computer aided detection |
US8050500B1 (en) * | 2006-07-06 | 2011-11-01 | Senapps, LLC | Recognition method and system |
WO2008033439A2 (en) | 2006-09-13 | 2008-03-20 | Aurilab, Llc | Robust pattern recognition system and method using socratic agents |
AU2006252019B2 (en) * | 2006-12-13 | 2012-06-28 | Canon Kabushiki Kaisha | Method and Apparatus for Dynamic Connector Analysis |
US7907141B2 (en) * | 2007-03-23 | 2011-03-15 | Palo Alto Research Center Incorporated | Methods and processes for recognition of electronic ink strokes |
US7725493B2 (en) * | 2007-03-23 | 2010-05-25 | Palo Alto Research Center Incorporated | Optimization method and process using tree searching operation and non-overlapping support constraint requirements |
US8014607B2 (en) * | 2007-03-23 | 2011-09-06 | Palo Alto Research Center Incorporated | Method and apparatus for creating and editing node-link diagrams in pen computing systems |
US7840503B2 (en) * | 2007-04-10 | 2010-11-23 | Microsoft Corporation | Learning A* priority function from unlabeled data |
US8009915B2 (en) * | 2007-04-19 | 2011-08-30 | Microsoft Corporation | Recognition of mathematical expressions |
US7840502B2 (en) * | 2007-06-13 | 2010-11-23 | Microsoft Corporation | Classification of images as advertisement images or non-advertisement images of web pages |
US8094939B2 (en) | 2007-06-26 | 2012-01-10 | Microsoft Corporation | Digital ink-based search |
US8041120B2 (en) * | 2007-06-26 | 2011-10-18 | Microsoft Corporation | Unified digital ink recognition |
US8315482B2 (en) * | 2007-06-26 | 2012-11-20 | Microsoft Corporation | Integrated platform for user input of digital ink |
US9030462B2 (en) * | 2007-09-24 | 2015-05-12 | Siemens Corporation | Sketching three-dimensional(3D) physical simulations |
US8160396B2 (en) * | 2007-12-06 | 2012-04-17 | Mitsubishi Electric Research Laboratories, Inc. | Method and apparatus for touching-up images |
US20090198646A1 (en) * | 2008-01-31 | 2009-08-06 | International Business Machines Corporation | Systems, methods and computer program products for an algebraic approach to rule-based information extraction |
US8099373B2 (en) * | 2008-02-14 | 2012-01-17 | Microsoft Corporation | Object detector trained using a working set of training data |
US20100114619A1 (en) * | 2008-10-30 | 2010-05-06 | International Business Machines Corporation | Customized transformation of free-form business concepts to semantically rich business models |
US20100134497A1 (en) * | 2008-12-02 | 2010-06-03 | Yifan Hu | Methods, Systems, and Products for Graphing Data |
US20100186234A1 (en) | 2009-01-28 | 2010-07-29 | Yehuda Binder | Electric shaver with imaging capability |
US20100166314A1 (en) * | 2008-12-30 | 2010-07-01 | Microsoft Corporation | Segment Sequence-Based Handwritten Expression Recognition |
US20100163316A1 (en) * | 2008-12-30 | 2010-07-01 | Microsoft Corporation | Handwriting Recognition System Using Multiple Path Recognition Framework |
US8462161B1 (en) | 2009-01-20 | 2013-06-11 | Kount Inc. | System and method for fast component enumeration in graphs with implicit edges |
US8306940B2 (en) * | 2009-03-20 | 2012-11-06 | Microsoft Corporation | Interactive visualization for generating ensemble classifiers |
US20100295782A1 (en) | 2009-05-21 | 2010-11-25 | Yehuda Binder | System and method for control based on face ore hand gesture detection |
US8275805B2 (en) * | 2010-03-26 | 2012-09-25 | Intel Corporation | Method of decreasing a total computation time for a visual simulation loop in a virtual world application |
US9449026B2 (en) | 2010-08-31 | 2016-09-20 | Microsoft Technology Licensing, Llc | Sketch-based image search |
US8724911B2 (en) * | 2010-09-16 | 2014-05-13 | Palo Alto Research Center Incorporated | Graph lattice method for image clustering, classification, and repeated structure finding |
US8872828B2 (en) | 2010-09-16 | 2014-10-28 | Palo Alto Research Center Incorporated | Method for generating a graph lattice from a corpus of one or more data graphs |
US8718375B2 (en) | 2010-12-03 | 2014-05-06 | Massachusetts Institute Of Technology | Sketch recognition system |
US8760451B2 (en) | 2011-06-30 | 2014-06-24 | Google Inc. | Rendering a text image using texture map character center encoding with character reference encoding |
US8400453B2 (en) | 2011-06-30 | 2013-03-19 | Google Inc. | Rendering a text image following a line |
US8996350B1 (en) | 2011-11-02 | 2015-03-31 | Dub Software Group, Inc. | System and method for automatic document management |
JP2014092902A (ja) * | 2012-11-02 | 2014-05-19 | Toshiba Corp | 電子機器および手書き文書処理方法 |
US9058660B2 (en) * | 2012-11-21 | 2015-06-16 | Gravity Jack, Inc. | Feature searching based on feature quality information |
JP2014127188A (ja) * | 2012-12-27 | 2014-07-07 | Toshiba Corp | 整形装置及び方法 |
US9218321B2 (en) * | 2013-01-29 | 2015-12-22 | International Business Machines Corporation | Creating tag clouds based on user specified arbitrary shape tags |
US9147125B2 (en) | 2013-05-03 | 2015-09-29 | Microsoft Technology Licensing, Llc | Hand-drawn sketch recognition |
CN103400109B (zh) * | 2013-07-10 | 2016-05-25 | 西安交通大学 | 一种手绘草图离线识别与整形方法 |
US9430141B1 (en) * | 2014-07-01 | 2016-08-30 | Amazon Technologies, Inc. | Adaptive annotations |
US9589185B2 (en) * | 2014-12-10 | 2017-03-07 | Abbyy Development Llc | Symbol recognition using decision forests |
US20180101724A1 (en) * | 2015-06-04 | 2018-04-12 | Mowdo | System and method for capturing and interpreting images into triple diagrams |
US9904847B2 (en) * | 2015-07-10 | 2018-02-27 | Myscript | System for recognizing multiple object input and method and product for same |
US11402991B2 (en) * | 2015-12-01 | 2022-08-02 | Myscript | System and method for note taking with gestures |
US10216992B2 (en) | 2016-11-21 | 2019-02-26 | Microsoft Technology Licensing, Llc | Data entry system with drawing recognition |
EP3563305A4 (en) * | 2016-12-30 | 2020-08-05 | Nokia Technologies Oy | ARTIFICIAL NEURAL NETWORK |
US10896357B1 (en) * | 2017-12-29 | 2021-01-19 | Automation Anywhere, Inc. | Automatic key/value pair extraction from document images using deep learning |
US10769427B1 (en) | 2018-04-19 | 2020-09-08 | Automation Anywhere, Inc. | Detection and definition of virtual objects in remote screens |
US11176310B2 (en) | 2019-04-01 | 2021-11-16 | Adobe Inc. | Facilitating dynamic document layout by determining reading order using document content stream cues |
CN111860506B (zh) * | 2020-07-24 | 2024-03-29 | 北京百度网讯科技有限公司 | 识别文字的方法和装置 |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5035379B1 (ja) * | 1970-05-25 | 1975-11-15 | ||
US4972496A (en) | 1986-07-25 | 1990-11-20 | Grid Systems Corporation | Handwritten keyboardless entry computer system |
US4955066A (en) | 1989-10-13 | 1990-09-04 | Microsoft Corporation | Compressing and decompressing text files |
US5109433A (en) | 1989-10-13 | 1992-04-28 | Microsoft Corporation | Compressing and decompressing text files |
US5181255A (en) | 1990-12-13 | 1993-01-19 | Xerox Corporation | Segmentation of handwriting and machine printed text |
US5237628A (en) | 1991-06-03 | 1993-08-17 | Nynex Corporation | System and method for automatic optical data entry |
US5526444A (en) * | 1991-12-10 | 1996-06-11 | Xerox Corporation | Document image decoding using modified branch-and-bound methods |
US5499294A (en) | 1993-11-24 | 1996-03-12 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Digital camera with apparatus for authentication of images produced from an image file |
US5699244A (en) | 1994-03-07 | 1997-12-16 | Monsanto Company | Hand-held GUI PDA with GPS/DGPS receiver for collecting agronomic and GPS position data |
US6869023B2 (en) | 2002-02-12 | 2005-03-22 | Digimarc Corporation | Linking documents through digital watermarking |
US5465353A (en) * | 1994-04-01 | 1995-11-07 | Ricoh Company, Ltd. | Image matching and retrieval by multi-access redundant hashing |
US5542006A (en) * | 1994-06-21 | 1996-07-30 | Eastman Kodak Company | Neural network based character position detector for use in optical character recognition |
US6137908A (en) * | 1994-06-29 | 2000-10-24 | Microsoft Corporation | Handwriting recognition system simultaneously considering shape and context information |
US5594809A (en) * | 1995-04-28 | 1997-01-14 | Xerox Corporation | Automatic training of character templates using a text line image, a text line transcription and a line image source model |
US5812698A (en) * | 1995-05-12 | 1998-09-22 | Synaptics, Inc. | Handwriting recognition system and method |
US5867597A (en) * | 1995-09-05 | 1999-02-02 | Ricoh Corporation | High-speed retrieval by example |
US5999653A (en) | 1996-01-19 | 1999-12-07 | Xerox Corporation | Fast techniques for searching images using the Hausdorff distance |
US5832474A (en) | 1996-02-26 | 1998-11-03 | Matsushita Electric Industrial Co., Ltd. | Document search and retrieval system with partial match searching of user-drawn annotations |
US6938203B1 (en) | 1997-08-11 | 2005-08-30 | Chrysanne Dimarco | Method and apparatus for authoring of customizable multimedia documents |
US6658623B1 (en) | 1997-09-15 | 2003-12-02 | Fuji Xerox Co., Ltd. | Displaying in a first document a selectable link to a second document based on a passive query |
US6587217B1 (en) | 1997-09-15 | 2003-07-01 | International Business Machines Corporation | Method for organizing files in a library in a network printing system |
US6356922B1 (en) | 1997-09-15 | 2002-03-12 | Fuji Xerox Co., Ltd. | Method and system for suggesting related documents |
US6279014B1 (en) | 1997-09-15 | 2001-08-21 | Xerox Corporation | Method and system for organizing documents based upon annotations in context |
US7062497B2 (en) | 1998-01-22 | 2006-06-13 | Adobe Systems Incorporated | Maintaining document state history |
US6487301B1 (en) | 1998-04-30 | 2002-11-26 | Mediasec Technologies Llc | Digital authentication with digital and analog documents |
US6233353B1 (en) | 1998-06-29 | 2001-05-15 | Xerox Corporation | System for segmenting line drawings from text within a binary digital image |
US6523134B2 (en) | 1998-09-18 | 2003-02-18 | International Business Machines Corporation | Selective undo |
US6363381B1 (en) | 1998-11-03 | 2002-03-26 | Ricoh Co., Ltd. | Compressed document matching |
US6580806B1 (en) | 1998-11-20 | 2003-06-17 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method and storage |
US6687876B1 (en) | 1998-12-30 | 2004-02-03 | Fuji Xerox Co., Ltd. | Method and system for maintaining freeform ink annotations on changing views |
US6393395B1 (en) * | 1999-01-07 | 2002-05-21 | Microsoft Corporation | Handwriting and speech recognizer using neural network with separate start and continuation output scores |
US6397212B1 (en) | 1999-03-04 | 2002-05-28 | Peter Biffar | Self-learning and self-personalizing knowledge search engine that delivers holistic results |
US6546385B1 (en) | 1999-08-13 | 2003-04-08 | International Business Machines Corporation | Method and apparatus for indexing and searching content in hardcopy documents |
WO2001061448A1 (en) | 2000-02-18 | 2001-08-23 | The University Of Maryland | Methods for the electronic annotation, retrieval, and use of electronic images |
US6470094B1 (en) | 2000-03-14 | 2002-10-22 | Intel Corporation | Generalized text localization in images |
US6594393B1 (en) * | 2000-05-12 | 2003-07-15 | Thomas P. Minka | Dynamic programming operation with skip mode for text line image decoding |
US7058223B2 (en) * | 2000-09-14 | 2006-06-06 | Cox Ingemar J | Identifying works for initiating a work-based action, such as an action on the internet |
US6928548B1 (en) | 2000-09-29 | 2005-08-09 | Intel Corporation | System and method for verifying the integrity of stored information within an electronic device |
US7346841B2 (en) | 2000-12-19 | 2008-03-18 | Xerox Corporation | Method and apparatus for collaborative annotation of a document |
US7266765B2 (en) | 2001-08-31 | 2007-09-04 | Fuji Xerox Co., Ltd. | Detection and processing of annotated anchors |
US7747943B2 (en) | 2001-09-07 | 2010-06-29 | Microsoft Corporation | Robust anchoring of annotations to content |
GB2380277B (en) | 2001-09-28 | 2005-12-14 | Hewlett Packard Co | A solid state memory device and a method of document reproduction |
US7120299B2 (en) | 2001-12-28 | 2006-10-10 | Intel Corporation | Recognizing commands written onto a medium |
WO2003063067A1 (en) | 2002-01-24 | 2003-07-31 | Chatterbox Systems, Inc. | Method and system for locating positions in printed texts and delivering multimedia information |
WO2003071393A2 (en) * | 2002-02-15 | 2003-08-28 | Mathsoft Engineering And Education, Inc. | Linguistic support for a regognizer of mathematical expressions |
CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
US7243301B2 (en) | 2002-04-10 | 2007-07-10 | Microsoft Corporation | Common annotation framework |
JP2004040246A (ja) | 2002-06-28 | 2004-02-05 | Canon Inc | 情報処理装置、情報処理方法 |
US7360093B2 (en) | 2002-07-22 | 2008-04-15 | Xerox Corporation | System and method for authentication of JPEG image data |
US7024054B2 (en) | 2002-09-27 | 2006-04-04 | Eastman Kodak Company | Method and system for generating a foreground mask for a composite image |
US20040090439A1 (en) * | 2002-11-07 | 2004-05-13 | Holger Dillner | Recognition and interpretation of graphical and diagrammatic representations |
JP2004180278A (ja) | 2002-11-15 | 2004-06-24 | Canon Inc | 情報処理装置、サーバ装置、電子データ管理システム、情報処理システム、情報処理方法、コンピュータプログラム及びコンピュータ読み取り可能な記憶媒体 |
US7486294B2 (en) * | 2003-03-27 | 2009-02-03 | Microsoft Corporation | Vector graphics element-based model, application programming interface, and markup language |
US7218783B2 (en) | 2003-06-13 | 2007-05-15 | Microsoft Corporation | Digital ink annotation process and system for recognizing, anchoring and reflowing digital ink annotations |
US7111230B2 (en) | 2003-12-22 | 2006-09-19 | Pitney Bowes Inc. | System and method for annotating documents |
US7475061B2 (en) | 2004-01-15 | 2009-01-06 | Microsoft Corporation | Image-based document indexing and retrieval |
US7729538B2 (en) | 2004-08-26 | 2010-06-01 | Microsoft Corporation | Spatial recognition and grouping of text and graphics |
US7574048B2 (en) | 2004-09-03 | 2009-08-11 | Microsoft Corporation | Freeform digital ink annotation recognition |
US7570816B2 (en) * | 2005-03-31 | 2009-08-04 | Microsoft Corporation | Systems and methods for detecting text |
US7526129B2 (en) * | 2005-06-23 | 2009-04-28 | Microsoft Corporation | Lifting ink annotations from paper |
-
2004
- 2004-08-26 US US10/927,452 patent/US7729538B2/en not_active Expired - Fee Related
-
2005
- 2005-08-23 EP EP05107713A patent/EP1630723A3/en not_active Withdrawn
- 2005-08-26 JP JP2005246356A patent/JP4745758B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1630723A2 (en) | 2006-03-01 |
US20060045337A1 (en) | 2006-03-02 |
EP1630723A3 (en) | 2007-02-07 |
US7729538B2 (en) | 2010-06-01 |
JP2006073000A (ja) | 2006-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4745758B2 (ja) | テキストおよびグラフィクスの空間認識およびグループ化 | |
Ingle et al. | A scalable handwritten text recognition system | |
US9064147B2 (en) | Sketch recognition system | |
KR101087443B1 (ko) | 디지털 잉크 스트로크 제공 방법 | |
EP1971957B1 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
WO2007005937A2 (en) | Grammatical parsing of document visual structures | |
WO1995034048A1 (en) | Method and apparatus for automated text recognition | |
CN111626297A (zh) | 文字书写质量评价方法、装置、电子设备和记录介质 | |
WO2007070662A1 (en) | Script recognition for ink notes | |
Shilman et al. | Recognition and grouping of handwritten text in diagrams and equations | |
CN112069900A (zh) | 基于卷积神经网络的票据文字识别方法及*** | |
CN116958957A (zh) | 多模态特征提取网络的训练方法及三维特征表示方法 | |
Suresh et al. | Telugu Optical Character Recognition Using Deep Learning | |
Wan et al. | An interactive mathematical handwriting recognizer for the Pocket PC | |
Ogwok et al. | Detecting, Contextualizing and Computing Basic Mathematical Equations from Noisy Images using Machine Learning | |
Lai et al. | Pattern Recognition and Computer Vision: First Chinese Conference, PRCV 2018, Guangzhou, China, November 23-26, 2018, Proceedings, Part III | |
EP4086744B1 (en) | Gesture stroke recognition in touch-based user interface input | |
Hamplová et al. | Character Segmentation in the Development of Palmyrene Aramaic OCR | |
Aruleba | Extracting finite automata from hand-drawn images | |
Alkholy | Arabic optical character recognition using local invariant features | |
Korovai et al. | Handwriting Enhancement: Recognition-Based and Recognition-Independent Approaches for On-device Online Handwritten Text Alignment | |
Shukla et al. | A Review Mostly on Identification of Early Tamil Extracts Actors Through Historical Writing | |
Parvez | DESC: Descriptors Extractor for Shape Contours | |
Suriyan et al. | Recent Trends in Pattern Recognition: Challenges and Opportunities | |
Ouyang | Understanding freehand diagrams: combining appearance and context for multi-domain sketch recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080826 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110506 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110512 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |