JP4829757B2 - 罫線抽出装置および方法 - Google Patents
罫線抽出装置および方法 Download PDFInfo
- Publication number
- JP4829757B2 JP4829757B2 JP2006323625A JP2006323625A JP4829757B2 JP 4829757 B2 JP4829757 B2 JP 4829757B2 JP 2006323625 A JP2006323625 A JP 2006323625A JP 2006323625 A JP2006323625 A JP 2006323625A JP 4829757 B2 JP4829757 B2 JP 4829757B2
- Authority
- JP
- Japan
- Prior art keywords
- saturation
- ruled line
- image
- gray image
- lightness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims description 53
- 238000000034 method Methods 0.000 title claims description 25
- 238000012937 correction Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 description 18
- 239000000284 extract Substances 0.000 description 9
- 230000010365 information processing Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
図11の罫線抽出処理では、背景と罫線の明度の差が小さい場合は、罫線および背景ともに二値化により白となってしまい、罫線を抽出することができない。例えば、図12に示すように、薄い色のセル同士が明示的な境界線で区別されずに、色の変化により区別されている場合がある。以下では、このようなセル間の境界を、境界罫線と呼ぶことする。このような境界罫線を含むカラー画像が入力された場合、両方のセルが二値化により白となってしまい、罫線を抽出することができない。
本実施形態では、明度グレー画像を用いた罫線抽出処理と、彩度グレー画像を用いた罫線抽出処理に加えて、さらに彩度補正画像を用いた罫線抽出処理を組み合わせて用いる。これにより、背景との明度差が小さい罫線を、より精密に抽出することが可能になる。
すべてのセルの処理が終了すると、次に、ステップ204で抽出された各セルの領域を対象として、彩度補正画像を生成し、その彩度補正画像を二値化して、二値画像を生成する(ステップ206)。そして、その二値画像から、罫線とそれに囲まれたセルを抽出する(ステップ207)。ただし、ステップ204で罫線およびセルが抽出されなかったセルについては、ステップ202で抽出されたセルの領域を対象として処理が行われる。
I=0.299×R+0.587×G+0.114×B (1)
ステップ203では、各セル内に、従来の処理では抽出できない、明度差が小さい罫線が存在するか否かがチェックされる。まず、セル内の画素のRGB値が抽出され、次式により彩度S(0≦S≦21/2 )に変換される。
S’=(S−α)/α (5)
一方、彩度Sが閾値αより大きい場合には有彩色であると判定して、次式により中間補正値S’を算出する。
S’=(S−α)/(1−α) (6)
次に、算出された中間補正値S’を用いて、次式により補正後の彩度S”を算出する。
A=(eT −1)/(eT +1) (8)
B=1/(1+eT ) (9)
(8)式および(9)式におけるパラメータTは、例えば、T=10に設定される。
図7に示すようなカラー画像701が入力されると、明度グレー画像702が生成され、明度グレー画像702が二値化される(ステップ201)。そして、得られた二値画像から罫線およびセルが抽出される(ステップ202)。この場合、カラー画像701の領域711内には境界罫線が含まれているが、その境界罫線は抽出されていない。
前記カラー画像から明度グレー画像を生成して、前記格納手段に格納する第1の生成手段と、
前記明度グレー画像を用いて第1の罫線を抽出する第1の抽出手段と、
前記第1の罫線により囲まれたセル領域の彩度グレー画像を生成して、前記格納手段に格納する第2の生成手段と、
前記彩度グレー画像を用いて第2の罫線を抽出する第2の抽出手段と、
前記第1および第2の罫線の情報を出力する出力手段と
を備えることを特徴とする罫線抽出装置。
(付記2)カラー画像を格納手段に格納し、
前記カラー画像から明度グレー画像を生成して、前記格納手段に格納し、
前記明度グレー画像を用いて第1の罫線を抽出し、
前記第1の罫線により囲まれたセル領域の彩度グレー画像を生成して、前記格納手段に格納し、
前記彩度グレー画像を用いて第2の罫線を抽出し、
前記第1および第2の罫線の情報を出力する
処理をコンピュータに実行させることを特徴とするプログラム。
(付記3)前記明度グレー画像を二値化して、得られた第1の二値画像を前記格納手段に格納し、前記第1の二値画像を用いて前記第1の罫線を抽出し、前記彩度グレー画像を二値化して、得られた第2の二値画像を前記格納手段に格納し、前記第2の二値画像を用いて前記第2の罫線を抽出する処理を、前記コンピュータに実行させることを特徴とする付記2記載のプログラム。
(付記4)前記第1または第2の罫線により囲まれたセル領域の彩度補正画像を生成して、前記格納手段に格納し、前記彩度補正画像を用いて第3の罫線を抽出し、前記第3の罫線の情報を出力する処理を、前記コンピュータにさらに実行させることを特徴とする付記2または3記載のプログラム。
(付記5)前記第2の罫線により囲まれたセル領域の彩度を閾値と比較し、該彩度が該閾値より大きければ、該彩度を大きくする演算を行い、該彩度が該閾値より小さければ、該彩度を小さくする演算を行うことで、前記彩度補正画像を生成する処理を、前記コンピュータに実行させることを特徴とする付記4記載のプログラム。
(付記6)第1の生成手段が、格納手段に格納されたカラー画像から明度グレー画像を生成して、該格納手段に格納し、
第1の抽出手段が、前記明度グレー画像を用いて第1の罫線を抽出し、
第2の生成手段が、前記第1の罫線により囲まれたセル領域の彩度グレー画像を生成して、前記格納手段に格納し、
第2の抽出手段が、前記彩度グレー画像を用いて第2の罫線を抽出し、
出力手段が、前記第1および第2の罫線の情報を出力する
ことを特徴とする罫線抽出方法。
22、304、404、504、702、802 明度グレー画像
23、704、706 二値画像
24、803、806、807、811、812、813 抽出結果
101 格納手段
102 第1の生成手段
103 第1の抽出手段
104 第2の生成手段
105 第2の抽出手段
106 出力手段
302、402、502 色相グレー画像
303、403、503、703 彩度グレー画像
601 シグモイド曲線
610 グラフ
620 直線
705 彩度補正画像
711 領域
712、821、822、823、824、825、826、827、828 セル
901 CPU
902 メモリ
903 入力装置
904 出力装置
905 外部記憶装置
906 媒体駆動装置
907 ネットワーク接続装置
908 バス
909 可搬記録媒体
1001 サーバ
1002 情報処理装置
1011 データベース
Claims (5)
- カラー画像を格納する格納手段と、
前記カラー画像から明度グレー画像を生成して、前記格納手段に格納する第1の生成手段と、
前記明度グレー画像を用いて第1の罫線を抽出する第1の抽出手段と、
前記第1の罫線により囲まれたセル領域の彩度グレー画像を生成して、前記格納手段に格納する第2の生成手段と、
前記彩度グレー画像を用いて第2の罫線を抽出する第2の抽出手段と、
前記第1および第2の罫線の情報を出力する出力手段と
を備えることを特徴とする罫線抽出装置。 - カラー画像を格納手段に格納し、
前記カラー画像から明度グレー画像を生成して、前記格納手段に格納し、
前記明度グレー画像を用いて第1の罫線を抽出し、
前記第1の罫線により囲まれたセル領域の彩度グレー画像を生成して、前記格納手段に格納し、
前記彩度グレー画像を用いて第2の罫線を抽出し、
前記第1および第2の罫線の情報を出力する
処理をコンピュータに実行させることを特徴とするプログラム。 - 前記第1または第2の罫線により囲まれたセル領域の彩度補正画像を生成して、前記格納手段に格納し、前記彩度補正画像を用いて第3の罫線を抽出し、前記第3の罫線の情報を出力する処理を、前記コンピュータにさらに実行させることを特徴とする請求項2記載のプログラム。
- 前記第2の罫線により囲まれたセル領域の彩度を閾値と比較し、該彩度が該閾値より大きければ、該彩度を大きくする演算を行い、該彩度が該閾値より小さければ、該彩度を小さくする演算を行うことで、前記彩度補正画像を生成する処理を、前記コンピュータに実行させることを特徴とする請求項3記載のプログラム。
- 第1の生成手段が、格納手段に格納されたカラー画像から明度グレー画像を生成して、該格納手段に格納し、
第1の抽出手段が、前記明度グレー画像を用いて第1の罫線を抽出し、
第2の生成手段が、前記第1の罫線により囲まれたセル領域の彩度グレー画像を生成して、前記格納手段に格納し、
第2の抽出手段が、前記彩度グレー画像を用いて第2の罫線を抽出し、
出力手段が、前記第1および第2の罫線の情報を出力する
ことを特徴とする罫線抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006323625A JP4829757B2 (ja) | 2006-11-30 | 2006-11-30 | 罫線抽出装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006323625A JP4829757B2 (ja) | 2006-11-30 | 2006-11-30 | 罫線抽出装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008139967A JP2008139967A (ja) | 2008-06-19 |
JP4829757B2 true JP4829757B2 (ja) | 2011-12-07 |
Family
ID=39601388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006323625A Expired - Fee Related JP4829757B2 (ja) | 2006-11-30 | 2006-11-30 | 罫線抽出装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4829757B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4077094B2 (ja) * | 1998-12-11 | 2008-04-16 | 富士通株式会社 | カラー文書画像認識装置 |
-
2006
- 2006-11-30 JP JP2006323625A patent/JP4829757B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008139967A (ja) | 2008-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
JP5701182B2 (ja) | 画像処理装置、画像処理方法及びコンピュータプログラム | |
US10049291B2 (en) | Image-processing apparatus, image-processing method, and computer program product | |
US11574489B2 (en) | Image processing system, image processing method, and storage medium | |
JP5900208B2 (ja) | 画像処理装置及び画像処理方法 | |
CN114155546B (zh) | 一种图像矫正方法、装置、电子设备和存储介质 | |
US20080075381A1 (en) | Image processing apparatus, image processing method, and computer product | |
CN113344826B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN112836692A (zh) | 用于处理图像的方法、装置、设备和介质 | |
CN110210467B (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 | |
US9756220B2 (en) | Image data generating apparatus, printer, image data generating method, and non-transitory computer readable medium for extracting one or more pixels corresponding to a metallic-color region | |
US8705134B2 (en) | Method of processing an image to clarify text in the image | |
US20230316697A1 (en) | Association method, association system, and non-transitory computer-readable storage medium | |
JP2019046225A (ja) | 認識装置、認識プログラム、及び認識方法 | |
KR20150099116A (ko) | Ocr를 이용한 컬러 문자 인식 방법 및 그 장치 | |
US20170278250A1 (en) | Image processing device, non-transitory computer readable medium, and image processing method | |
JP4829757B2 (ja) | 罫線抽出装置および方法 | |
JP5979008B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN115359502A (zh) | 一种图像处理方法、装置、设备以及存储介质 | |
JP4569785B2 (ja) | 二値化装置及び二値化処理プログラム | |
JP4973603B2 (ja) | 画像処理装置および画像処理プログラム | |
US20230196519A1 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium storing program | |
WO2023013546A1 (ja) | コンピュータプログラム、生成装置、および、生成方法 | |
JP2017138742A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6701773B2 (ja) | 罫線削除装置、罫線削除方法、および罫線削除プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110913 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110916 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4829757 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |