JP2004282701A - 最小領域による合成画像の分割 - Google Patents
最小領域による合成画像の分割 Download PDFInfo
- Publication number
- JP2004282701A JP2004282701A JP2003364142A JP2003364142A JP2004282701A JP 2004282701 A JP2004282701 A JP 2004282701A JP 2003364142 A JP2003364142 A JP 2003364142A JP 2003364142 A JP2003364142 A JP 2003364142A JP 2004282701 A JP2004282701 A JP 2004282701A
- Authority
- JP
- Japan
- Prior art keywords
- image
- field
- field separator
- mosaic grid
- separator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
【解決手段】ピクセルから成る画像を複数のフィールドに分割する方法は、最初に、画像のバックグラウンド、特に例えばテキストフィールド間の白領域を使用して、フィールドセパレータ110を見い出す。分割は、少なくとも1つの分離方向(実際には、水平方向および垂直方向)に沿って、画像の外側の境界まで前記フィールドセパレータを延長することによって形成される、ノードおよびラインから成るモザイクグリッドを構成し、フィールドセパレータ110および延長されたフィールドセパレータ111のモザイクグリッドのラインによって囲まれる基本長方形のセットを構成することを含む。最後に、フィールドは、1つのフィールドセパレータによって分離されることなく隣り合う基本長方形同士を統合することによって構成される。
【選択図】 図13
Description
(a)水平方向のオーバーラップ
12 CCオブジェクト
13 レイアウトオブジェクト
14 CCAモジュール
15 LAモジュール
16 AFモジュール
17 記事
21 垂直方向読み方向
22 水平方法読み方向
23 黒ライン
31 最初の解析ステップ
32 算定閾値
33 分類ステップ
34 補正された連結成分
35 統合ステップ
36 オブジェクト
37 テキスト統合ステップ
38 テキストブロック
41 画像のグラフ
42 フィールド検出ステップ
43 連結成分
44 ステップ
45 読む順番
46 ライン形成ステップ
47 テキストブロック
51 ホワイトラン
52 最大白長方形
53 フォアグラウンド領域
61 ホワイトラン
62、63、64、65、66 最大白長方形
80 デジタル画像
81 グラフの頂点
82 辺
88 長方形領域
89 交点
91 入力ユニット
92 記憶ユニット
93 ディスプレイユニット
94 処理ユニット
95 ユーザインタフェース
96 TESSステップ
97 MATRIXステップ
98 CONNステップ
99 NODEステップ
100 FIELDステップ
109 フィールド
110 フィールドセパレータ
111 ラインセグメント
113 基本長方形
116 仮想ノード
120 マトリクスマップ
121、123、124、125 要素
122、141 影付き領域
130 連結領域
140 外形
Claims (14)
- ピクセルから成る複合画像を、画像のレイアウト要素に対応する複数のフィールドに分割する方法であって、前記ピクセルが、画素の強度および/または色を示す値を有し、
画像の隣り合うピクセルの領域に対応し且つ画像のバックグラウンドを示す所定の特性を有するフィールドセパレータを見出すステップを含み、前記分割する方法がさらに、
少なくとも1つの分離方向に沿って画像の外側の境界まで前記フィールドセパレータを延長するステップと、
前記延長されたフィールドセパレータに対応するラインのモザイクグリッドを構成するステップと、
前記モザイクグリッドのラインによって囲まれる領域である基本長方形のセットを構成するステップと、
互いに隣り合い且つ1つのフィールドセパレータによって分離されない基本長方形同士を連結することによりフィールドを構成するステップとを含むことを特徴とする方法。 - 基本長方形のセットを構成する前記ステップが、要素の2次元配列によって前記モザイクグリッドを表わすマトリクスマップを構成することを含み、各要素は、モザイクグリッドの基本長方形またはラインセグメントのいずれかを表わし、1つの要素が、フィールドセパレータに対応するラインを表わすための所定の第1の値、または基本長方形あるいは延長されたフィールドセパレータに対応するラインを表わすための更なる異なる値を有している、請求項1に記載の方法。
- フィールドを構成する前記ステップが、前記更なる異なる値を有するマトリクスマップ内の要素同士を連結することを含む、請求項2に記載の方法。
- 前記フィールドセパレータが連結する点でノードが規定され、フィールドを構成する前記ステップが、前記モザイクグリッドに対応し且つ前記モザイクグリッド内のノードを示す要素を含むノードマトリクスを構成することを含む、請求項1から3のいずれか一項に記載の方法。
- フィールドを構成する前記ステップが、マトリクスマップ内の連結された要素の各領域毎に外形を構成し、該外形を前記ノードマトリクス上に描出することによりフィールドを規定するノードを見出すことを含む、請求項4に記載の方法。
- 前記外形が、前記領域を拡張して、拡張された領域の領域を取り去ることにより構成される、請求項5に記載の方法。
- 分割が、画像のバックグラウンドを示す所定の特性を有する隣り合う領域に対応する辺と、辺が接続する頂点とを有するグラフを構成するとともに、前記フィールドセパレータを前記グラフの辺に関連付け、かつ
前記フィールドセパレータを画像の外側の境界まで延長することにより、前記モザイクグリッドを形成することを含む、請求項1から6のいずれか一項に記載の方法。 - グラフを構成するステップが、2つ未満の辺に連結される頂点を除去することにより、かつ/または2つ未満の辺に連結される頂点に連結する任意の辺を除去することにより、前記グラフをクリーニングすることを含む、請求項7に記載の方法。
- 前記モザイクグリッド内のラインを2つの直交する分離方向でのズレを無くす、すなわちスナッピングすることを含む、請求項1から8のいずれか一項に記載の方法。
- ピクセルから成る画像を複数のフィールドに分割するためのコンピュータプログラム製品であって、請求項1から9のいずれか一項に記載の方法をプロセッサに実行させるようにプログラムが動作する、コンピュータプログラム製品。
- ピクセルから成る複合画像を、画像のレイアウト要素に対応する複数のフィールドに分割する装置であって、前記ピクセルが、画素の強度および/または色を示す値を有し、前記分割する装置が、
画像を入力するための入力ユニット(91)と、
隣り合うピクセルの領域に対応し且つ画像のバックグラウンドを示す所定の特性を有するフィールドセパレータを見出す処理ユニット(94)とを備え、
前記処理ユニット(94)が、
少なくとも1つの分離方向に沿って画像の外側の境界まで前記フィールドセパレータを延長し、
前記延長されたフィールドセパレータに対応するラインのモザイクグリッドを構成し、
前記モザイクグリッドのラインによって囲まれる領域である基本長方形のセットを構成し、
互いに隣り合い且つ1つのフィールドセパレータによって分離されない基本長方形同士を連結することによりフィールドを構成するように、構成されていることを特徴とする装置。 - 前記処理ユニット(94)が、
要素の2次元配列によって前記モザイクグリッドを表わすマトリクスマップを構成し、各要素が、モザイクグリッドの基本長方形またはラインセグメントのいずれかを表わし、1つの要素が、フィールドセパレータに対応するラインを表わすための所定の第1の値、または基本長方形あるいは延長されたフィールドセパレータに対応するラインを表わすための更なる異なる値を有するように構成されている、請求項11に記載の装置。 - 前記処理ユニット(94)が、
前記モザイクグリッドに対応し且つ前記モザイクグリッド内のノードを示す要素を含むノードマトリクスを構成するように構成されている、請求項11または12に記載の装置。 - 分割後に画像のフィールドを表示するディスプレイユニット(93)を備えている、請求項11から13のいずれか一項に記載の装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02079882 | 2002-11-22 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004282701A true JP2004282701A (ja) | 2004-10-07 |
JP2004282701A5 JP2004282701A5 (ja) | 2009-03-19 |
JP4390523B2 JP4390523B2 (ja) | 2009-12-24 |
Family
ID=32338099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003364142A Expired - Fee Related JP4390523B2 (ja) | 2002-11-22 | 2003-10-24 | 最小領域による合成画像の分割 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7336825B2 (ja) |
JP (1) | JP4390523B2 (ja) |
AT (1) | ATE378648T1 (ja) |
DE (1) | DE60317455T2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4538214B2 (ja) * | 2002-11-22 | 2010-09-08 | オセ−テクノロジーズ・ベー・ヴエー | グラフによる画像分割 |
US20080288530A1 (en) * | 2007-01-17 | 2008-11-20 | Sparta Systems, Inc. | User-Defined Fields with Automatic Numbering |
US8760453B2 (en) * | 2010-09-01 | 2014-06-24 | Microsoft Corporation | Adaptive grid generation for improved caching and image classification |
CA2863522C (en) | 2012-01-23 | 2018-08-28 | Microsoft Corporation | Formula detection engine |
US20140258852A1 (en) * | 2013-03-11 | 2014-09-11 | Microsoft Corporation | Detection and Reconstruction of Right-to-Left Text Direction, Ligatures and Diacritics in a Fixed Format Document |
US9330070B2 (en) | 2013-03-11 | 2016-05-03 | Microsoft Technology Licensing, Llc | Detection and reconstruction of east asian layout features in a fixed format document |
US9396177B1 (en) * | 2014-02-10 | 2016-07-19 | Jpmorgan Chase Bank, N.A. | Systems and methods for document tracking using elastic graph-based hierarchical analysis |
WO2017165538A1 (en) * | 2016-03-22 | 2017-09-28 | Uru, Inc. | Apparatus, systems, and methods for integrating digital media content into other digital media content |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8502643A (nl) * | 1985-09-27 | 1986-04-01 | Oce Nederland Bv | Werkwijze voor het genereren van lijnstukken. |
US6633669B1 (en) * | 1999-10-21 | 2003-10-14 | 3M Innovative Properties Company | Autogrid analysis |
-
2003
- 2003-10-24 JP JP2003364142A patent/JP4390523B2/ja not_active Expired - Fee Related
- 2003-11-10 AT AT03078520T patent/ATE378648T1/de not_active IP Right Cessation
- 2003-11-10 DE DE60317455T patent/DE60317455T2/de not_active Expired - Lifetime
- 2003-11-24 US US10/718,540 patent/US7336825B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE60317455T2 (de) | 2008-09-18 |
US20040105583A1 (en) | 2004-06-03 |
ATE378648T1 (de) | 2007-11-15 |
JP4390523B2 (ja) | 2009-12-24 |
US7336825B2 (en) | 2008-02-26 |
DE60317455D1 (de) | 2007-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
He et al. | A run-based two-scan labeling algorithm | |
JP5854802B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
JP3950777B2 (ja) | 画像処理方法、画像処理装置および画像処理プログラム | |
US6711292B2 (en) | Block selection of table features | |
JPH05500874A (ja) | ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法 | |
JP3204259B2 (ja) | 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置 | |
JP2018081674A (ja) | 手書きテキスト画像に対する行及び単語切り出し方法 | |
Shafait et al. | Pixel-accurate representation and evaluation of page segmentation in document images | |
JP4538214B2 (ja) | グラフによる画像分割 | |
US7529407B2 (en) | Segmenting an image via shortest cycles | |
JP4390523B2 (ja) | 最小領域による合成画像の分割 | |
JP2004282701A5 (ja) | ||
JPH08320914A (ja) | 表認識方法および装置 | |
EP1439485B1 (en) | Segmenting a composite image via basic rectangles | |
JP3172498B2 (ja) | イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体 | |
JP2845107B2 (ja) | 画像処理装置 | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
EP1439484B1 (en) | Segmenting an image via shortest cycles | |
Lehal et al. | A complete OCR system for Gurmukhi script | |
JP2768249B2 (ja) | 文書画像レイアウト解析装置 | |
JP2003271973A (ja) | 画像処理方法および画像処理プログラム | |
Kumar et al. | A Hybrid Approach for Complex Layout Detection of Newspapers in Gurumukhi Script Using Deep Learning | |
JP3666903B2 (ja) | 画像処理方法および装置 | |
JP2001076158A (ja) | 画像処理方法及び装置並びに媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061006 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080729 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20081023 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20081028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090129 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20090129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090915 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091006 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121016 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131016 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |