JP2004246929A - 文書画像の領域分割方法および装置 - Google Patents
文書画像の領域分割方法および装置 Download PDFInfo
- Publication number
- JP2004246929A JP2004246929A JP2004163074A JP2004163074A JP2004246929A JP 2004246929 A JP2004246929 A JP 2004246929A JP 2004163074 A JP2004163074 A JP 2004163074A JP 2004163074 A JP2004163074 A JP 2004163074A JP 2004246929 A JP2004246929 A JP 2004246929A
- Authority
- JP
- Japan
- Prior art keywords
- document image
- column
- blank portion
- columns
- dividing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
【解決手段】入力された文書画像(101)の傾きを補正(102)した後、圧縮画像を生成する(103)。小領域を抽出し(104)、行方向において小領域を文字列候補などに分類する(106)。文字列候補小領域から、長い白ランの連結成分を用いて段分割空白部を抽出する(107)。入力文書の段組の種類(1段、複数段、自由段)を判定し(108)、その種類に従って空白部を取捨選択して(109)、小領域を統合して(110)、文章領域を抽出する。
【選択図】図1
Description
(1)段組としての整合性の高い段分割線だけを利用して領域分割を行うので、高精度の領域分割処理を行うことができる。
102 傾き補正手段
103 画像圧縮手段
104 小領域抽出手段
105 行方向検出手段
106 小領域分類手段
107 段分割空白部候補抽出手段
108 段組種類判別手段
109 段分割空白部分別手段
110 小領域統合手段
111 データ記憶部
112 制御部
113 データ通信路
Claims (10)
- 文書画像の領域分割方法において、該文書画像から文字列を含む、複数の小領域を抽出し、前記文字列と平行する方向に前記小領域を分割する空白部または罫線を検出し、該空白部または罫線によって画像を文字列と平行に分割し、該分割された各画像部分毎に段組数または段組種類を求め、該結果を統合して画像全体の段組種類を決定し、該段組種類に応じて前記空白部を用いて前記小領域を統合し、前記文書画像を所定の領域に分割することを特徴とする文書画像の領域分割方法。
- 文書画像の領域分割方法において、該文書画像から文字列を含む、複数の小領域を抽出し、該複数の小領域から空白部または罫線を検出し、該検出された空白部または罫線を基に、1段組、複数段組、自由段組を含む段組種類を判別し、該段組種類に応じて、前記検出された空白部を取捨選択した空白部を用いて前記小領域を統合し、前記文書画像を所定の領域に分割することを特徴とする文書画像の領域分割方法。
- 文書画像の領域分割方法において、該文書画像から文字列を含む、複数の小領域を抽出し、該複数の小領域から、長い白ランの連結成分を空白部として検出する方法と、文字要素の射影ヒストグラムから空白部を検出する方法とを併用して空白部または罫線を検出し、該検出された空白部または罫線を基に、1段組、複数段組、自由段組を含む段組種類を判別し、該段組種類に応じて前記空白部を用いて前記小領域を統合し、前記文書画像を所定の領域に分割することを特徴とする文書画像の領域分割方法。
- 前記文書画像の段組種類は、前記空白部または罫線の本数、位置を基に判別することを特徴とする請求項1、2または3記載の文書画像の領域分割方法。
- 前記段組種類に応じて、前記小領域の統合条件を変更することを特徴とする請求項1、2または3記載の文書画像の領域分割方法。
- 前記文書画像の傾きが所定の閾値以上であるとき、前記段組種類を自由段組とすることを特徴とする請求項1、2または3記載の文書画像の領域分割方法。
- 前記段組種類は、予め指定された段組種類を含むことを特徴とする請求項1、2または3記載の文書画像の領域分割方法。
- 文書画像の領域分割装置において、該文書画像から文字列を含む、複数の小領域を抽出する手段と、前記文字列と平行する方向に前記小領域を分割する空白部または罫線を検出する手段と、該空白部または罫線によって画像を文字列と平行に分割する手段と、該分割された各画像部分毎に段組数または段組種類を求め、該結果を統合して画像全体の段組種類を決定する手段と、該段組種類に応じて前記空白部を用いて前記小領域を統合し、前記文書画像を所定の領域に分割する手段とを備えたことを特徴とする文書画像の領域分割装置。
- 文書画像の領域分割装置において、該文書画像から文字列を含む、複数の小領域を抽出する手段と、該複数の小領域から空白部または罫線を検出する手段と、該検出された空白部または罫線を基に、1段組、複数段組、自由段組を含む段組種類を判別する手段と、該段組種類に応じて、前記検出された空白部を取捨選択した空白部を用いて前記小領域を統合し、前記文書画像を所定の領域に分割する手段とを備えたことを特徴とする文書画像の領域分割装置。
- 文書画像の領域分割装置において、該文書画像から文字列を含む、複数の小領域を抽出する手段と、該複数の小領域から、長い白ランの連結成分を空白部として検出する方法と、文字要素の射影ヒストグラムから空白部を検出する方法とを併用して空白部または罫線を検出する手段と、該検出された空白部または罫線を基に、1段組、複数段組、自由段組を含む段組種類を判別する手段と、該段組種類に応じて前記空白部を用いて前記小領域を統合し、前記文書画像を所定の領域に分割する手段とを備えたことを特徴とする文書画像の領域分割装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004163074A JP2004246929A (ja) | 2004-06-01 | 2004-06-01 | 文書画像の領域分割方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004163074A JP2004246929A (ja) | 2004-06-01 | 2004-06-01 | 文書画像の領域分割方法および装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19439995A Division JP3607753B2 (ja) | 1995-07-31 | 1995-07-31 | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004246929A true JP2004246929A (ja) | 2004-09-02 |
Family
ID=33028727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004163074A Pending JP2004246929A (ja) | 2004-06-01 | 2004-06-01 | 文書画像の領域分割方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004246929A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7660014B2 (en) | 2006-01-17 | 2010-02-09 | Konica Minolta Business Technologies, Inc. | Image processing apparatus capable of extracting rule from document image with high precision |
US8208744B2 (en) | 2006-01-23 | 2012-06-26 | Konica Minolta Business Technologies, Inc. | Image processing apparatus capable of accurately and quickly determining character part included in image |
-
2004
- 2004-06-01 JP JP2004163074A patent/JP2004246929A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7660014B2 (en) | 2006-01-17 | 2010-02-09 | Konica Minolta Business Technologies, Inc. | Image processing apparatus capable of extracting rule from document image with high precision |
US8208744B2 (en) | 2006-01-23 | 2012-06-26 | Konica Minolta Business Technologies, Inc. | Image processing apparatus capable of accurately and quickly determining character part included in image |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3253356B2 (ja) | 文書画像の領域識別方法 | |
US8041113B2 (en) | Image processing device, image processing method, and computer program product | |
JP3359095B2 (ja) | 画像処理方法及び装置 | |
CN102782702B (zh) | 在光学字符识别(ocr)过程中的段落识别 | |
US20120219220A1 (en) | Method and system for preprocessing an image for optical character recognition | |
US9047655B2 (en) | Computer vision-based methods for enhanced JBIG2 and generic bitonal compression | |
JP2008217347A (ja) | ナンバープレート認識装置、その制御方法、コンピュータプログラム | |
JPH11219407A (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JPH0713995A (ja) | 自動テキスト特徴決定装置 | |
JPH0721319A (ja) | 自動アジア言語決定装置 | |
US7680329B2 (en) | Character recognition apparatus and character recognition method | |
JP2011188465A (ja) | 原稿レイアウトの方向検出方法及び装置 | |
US7769234B2 (en) | Ruled line extracting program, ruled line extracting apparatus and ruled line extracting method | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
JP3837193B2 (ja) | 文字行抽出方法および装置 | |
JP3607753B2 (ja) | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 | |
JP6468880B2 (ja) | 文字領域抽出装置及びプログラム | |
JP3285686B2 (ja) | 領域分割方法 | |
JP2004246929A (ja) | 文書画像の領域分割方法および装置 | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
JP2007066084A (ja) | 文書処理装置、文書処理方法、および文書処理用プログラム | |
Okun et al. | Robust text detection from binarized document images | |
JP2728086B2 (ja) | 文字切り出し方法 | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 | |
CN116229497A (zh) | 版面文本的识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Effective date: 20040601 Free format text: JAPANESE INTERMEDIATE CODE: A621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060816 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061016 |
|
A131 | Notification of reasons for refusal |
Effective date: 20061122 Free format text: JAPANESE INTERMEDIATE CODE: A131 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070122 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070328 |