JP2010020394A - 画像処理装置および方法 - Google Patents
画像処理装置および方法 Download PDFInfo
- Publication number
- JP2010020394A JP2010020394A JP2008177907A JP2008177907A JP2010020394A JP 2010020394 A JP2010020394 A JP 2010020394A JP 2008177907 A JP2008177907 A JP 2008177907A JP 2008177907 A JP2008177907 A JP 2008177907A JP 2010020394 A JP2010020394 A JP 2010020394A
- Authority
- JP
- Japan
- Prior art keywords
- character
- rectangle
- character rectangle
- noise
- pixel block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/164—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】文字矩形の外接枠に接する画素塊を取得する(S301,302)。取得した画素塊がノイズである可能性があるか否かの判定を行う(S303,304)。ノイズである可能性があると判定した画素塊を文字矩形から除去したノイズ候補除去文字矩形を生成する(S305,306)。ノイズ候補除去文字矩形及び前記文字矩形についてそれぞれ文字認識の妥当性を計算し、妥当性が高いほうの文字矩形を選択する(S307,308)。
【選択図】図3
Description
矩形補正値=((文字幅−平均文字幅)/平均文字幅)2+((文字高−平均文字高)/平均文字高)2
妥当性=(1−矩形補正値)×信頼度
文字矩形1の矩形補正値=((30−45)/45)2+((65−45)/45)2=0.309
文字矩形1の妥当性=(1−0.309)×90=62.2
文字矩形2の矩形補正値=((30−45)/45)2+((50−45)/45)2=0.123
文字矩形2の妥当性=(1−0.123)×60=52.6
文字矩形3の矩形補正値=((30−45)/45)2+((40−45)/45)2=0.123
文字矩形3の妥当性=(1−0.123)×90=78.9
そこで、妥当性が高い文字矩形3を最終結果として選択する。
前述した実施形態の機能を実現するように前述した実施形態の構成を動作させるプログラムを記憶媒体に記憶させ、該記憶媒体に記憶されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も上述の実施形態の範疇に含まれる。また、前述のプログラムが記憶された記憶媒体はもちろんそのプログラム自体も上述の実施形態に含まれる。
2 RAM
2.2 処理プログラム
2.3 処理結果
3 入力装置
4 外部記憶装置
4.3 外部記憶装置
5 出力装置
Claims (10)
- 画像から抽出した文字矩形の外接枠に接する画素塊を取得する手段、
該取得した画素塊がノイズである可能性があるか否かの判定を行う判定手段、
ノイズである可能性があると判定した画素塊を前記文字矩形から除去したノイズ候補除去文字矩形を生成する手段、並びに、
該ノイズ候補除去文字矩形及び前記文字矩形についてそれぞれ文字認識の妥当性を計算し、妥当性が高いほうの文字矩形を選択する選択手段
を備えることを特徴とする画像処理装置。 - 請求項1に記載の装置において、
前記判定手段は、前記画素塊の幅、前記画素塊の高さ、前記画素塊の面積、前記画素塊のアウトラインを構成するストロークの長さ、及び、前記画素塊の他の画素塊からの距離、のうち少なくとも一つに基づいて前記判定を行うことを特徴とする装置。 - 請求項1に記載の装置において、
前記選択手段は、前記ノイズ候補除去文字矩形及び前記文字矩形の形状を解析し、該文字矩形の文字幅と標準文字幅との誤差及び該文字矩形の文字高さと標準文字高さとの誤差、のうち少なくとも一つに基づいて、前記妥当性が高いほうの文字矩形を選択することを特徴とする装置。 - 請求項1または3に記載の装置において、
前記選択手段は、前記ノイズ候補除去文字矩形及び前記文字矩形に対して文字認識を行い、得られた認識類似度に基づいて、前記妥当性が高いほうの文字矩形を選択することを特徴とする装置。 - 画像から抽出した文字矩形の外接枠に接する画素塊を取得するステップ、
該取得した画素塊がノイズである可能性があるか否かの判定を行う判定ステップ、
ノイズである可能性があると判定した画素塊を前記文字矩形から除去したノイズ候補除去文字矩形を生成するステップ、並びに、
該ノイズ候補除去文字矩形及び前記文字矩形についてそれぞれ文字認識の妥当性を計算し、妥当性が高いほうの文字矩形を選択する選択ステップ
を含むことを特徴とする文字矩形抽出方法。 - 請求項5に記載の方法において、
前記判定ステップにおいて、前記画素塊の幅、前記画素塊の高さ、前記画素塊の面積、前記画素塊のアウトラインを構成するストロークの長さ、及び、前記画素塊の他の画素塊からの距離、のうち少なくとも一つに基づいて前記判定を行うことを特徴とする方法。 - 請求項5に記載の方法において、
前記選択ステップにおいて、前記ノイズ候補除去文字矩形及び前記文字矩形の形状を解析し、該文字矩形の文字幅と標準文字幅との誤差及び該文字矩形の文字高さと標準文字高さとの誤差、のうち少なくとも一つに基づいて、前記妥当性が高いほうの文字矩形を選択することを特徴とする方法。 - 請求項5または7に記載の方法において、
前記選択ステップにおいて、前記ノイズ候補除去文字矩形及び前記文字矩形に対して文字認識を行い、得られた認識類似度に基づいて、前記妥当性が高いほうの文字矩形を選択することを特徴とする方法。 - コンピュータに、
画像から抽出した文字矩形の外接枠に接する画素塊を取得する手順、
該取得した画素塊がノイズである可能性があるか否かの判定を行う手順、
ノイズである可能性があると判定した画素塊を前記文字矩形から除去したノイズ候補除去文字矩形を生成する手順、並びに、
該ノイズ候補除去文字矩形及び前記文字矩形についてそれぞれ文字認識の妥当性を計算し、妥当性が高いほうの文字矩形を選択する手順
を実行させるための、コンピュータプログラム。 - 請求項9に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008177907A JP5322517B2 (ja) | 2008-07-08 | 2008-07-08 | 画像処理装置および方法 |
US12/498,006 US8452095B2 (en) | 2008-07-08 | 2009-07-06 | Image processing for post-processing rate of character rectangle extraction and character recognition accuracy |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008177907A JP5322517B2 (ja) | 2008-07-08 | 2008-07-08 | 画像処理装置および方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010020394A true JP2010020394A (ja) | 2010-01-28 |
JP2010020394A5 JP2010020394A5 (ja) | 2011-08-25 |
JP5322517B2 JP5322517B2 (ja) | 2013-10-23 |
Family
ID=41505228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008177907A Expired - Fee Related JP5322517B2 (ja) | 2008-07-08 | 2008-07-08 | 画像処理装置および方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8452095B2 (ja) |
JP (1) | JP5322517B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013101610A (ja) * | 2011-11-08 | 2013-05-23 | Canon Inc | 平均文字幅を判定する方法及び装置、並びに文字分割方法及び装置 |
JP2013186906A (ja) * | 2012-03-09 | 2013-09-19 | Fujitsu Ltd | 画像中の文字列を認識する方法及び装置 |
JP2020119291A (ja) * | 2019-01-24 | 2020-08-06 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5280425B2 (ja) * | 2010-11-12 | 2013-09-04 | シャープ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 |
US9684844B1 (en) * | 2016-07-15 | 2017-06-20 | StradVision, Inc. | Method and apparatus for normalizing character included in an image |
JP2018088116A (ja) * | 2016-11-29 | 2018-06-07 | キヤノン株式会社 | 情報処理装置、プログラム、情報処理方法 |
JP6903966B2 (ja) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61251982A (ja) * | 1985-04-30 | 1986-11-08 | Toshiba Corp | 光学的文字読取装置 |
JPS63136181A (ja) * | 1986-11-27 | 1988-06-08 | Toshiba Corp | 文字読取装置 |
JPH05210761A (ja) * | 1992-01-30 | 1993-08-20 | Omron Corp | 文字認識装置 |
JPH0749926A (ja) * | 1993-08-04 | 1995-02-21 | Fuji Xerox Co Ltd | 文字認識装置 |
JP2002015280A (ja) * | 2000-06-28 | 2002-01-18 | Minolta Co Ltd | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4251799A (en) * | 1979-03-30 | 1981-02-17 | International Business Machines Corporation | Optical character recognition using baseline information |
US5930393A (en) * | 1997-08-11 | 1999-07-27 | Lucent Technologies Inc. | Method and apparatus for enhancing degraded document images |
US7308126B2 (en) * | 1997-08-28 | 2007-12-11 | Icad, Inc. | Use of computer-aided detection system outputs in clinical practice |
US6847734B2 (en) * | 2000-01-28 | 2005-01-25 | Kabushiki Kaisha Toshiba | Word recognition method and storage medium that stores word recognition program |
JP4204185B2 (ja) | 2000-11-17 | 2009-01-07 | 株式会社リコー | 文字認識装置、文字認識方法、および記録媒体 |
GB2370438A (en) * | 2000-12-22 | 2002-06-26 | Hewlett Packard Co | Automated image cropping using selected compositional rules. |
JP2007304864A (ja) * | 2006-05-11 | 2007-11-22 | Fuji Xerox Co Ltd | 文字認識処理システムおよび文字認識処理プログラム |
US8155444B2 (en) * | 2007-01-15 | 2012-04-10 | Microsoft Corporation | Image text to character information conversion |
-
2008
- 2008-07-08 JP JP2008177907A patent/JP5322517B2/ja not_active Expired - Fee Related
-
2009
- 2009-07-06 US US12/498,006 patent/US8452095B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61251982A (ja) * | 1985-04-30 | 1986-11-08 | Toshiba Corp | 光学的文字読取装置 |
JPS63136181A (ja) * | 1986-11-27 | 1988-06-08 | Toshiba Corp | 文字読取装置 |
JPH05210761A (ja) * | 1992-01-30 | 1993-08-20 | Omron Corp | 文字認識装置 |
JPH0749926A (ja) * | 1993-08-04 | 1995-02-21 | Fuji Xerox Co Ltd | 文字認識装置 |
JP2002015280A (ja) * | 2000-06-28 | 2002-01-18 | Minolta Co Ltd | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013101610A (ja) * | 2011-11-08 | 2013-05-23 | Canon Inc | 平均文字幅を判定する方法及び装置、並びに文字分割方法及び装置 |
JP2013186906A (ja) * | 2012-03-09 | 2013-09-19 | Fujitsu Ltd | 画像中の文字列を認識する方法及び装置 |
JP2020119291A (ja) * | 2019-01-24 | 2020-08-06 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5322517B2 (ja) | 2013-10-23 |
US8452095B2 (en) | 2013-05-28 |
US20100008587A1 (en) | 2010-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5322517B2 (ja) | 画像処理装置および方法 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP2010250425A (ja) | 下線除去装置 | |
JPH08287184A (ja) | 画像切り出し装置及び文字認識装置 | |
JP3615333B2 (ja) | 罫線消去装置 | |
WO2013121647A1 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
JP2008011484A (ja) | 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体 | |
JP2010002991A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2019036146A (ja) | 画像解析装置及び画像解析プログラム | |
JP2006155126A (ja) | 車両番号認識装置 | |
JP5761353B2 (ja) | 隆線方向抽出装置、隆線方向抽出方法、隆線方向抽出プログラム | |
JP5439069B2 (ja) | 文字認識装置及び文字認識方法 | |
JP4078045B2 (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
JP4244692B2 (ja) | 文字認識装置及び文字認識プログラム | |
JP2796561B2 (ja) | 表形式文書認識方式 | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP2003208568A (ja) | 画像処理装置、画像処理方法、及び同方法に用いるプログラム | |
JP3077929B2 (ja) | 文字切出し方式 | |
JP3133797B2 (ja) | 文字認識方法及びその装置 | |
JP4571447B2 (ja) | 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 | |
JP2009193170A (ja) | 文字認識装置及び文字認識方法 | |
JP3343305B2 (ja) | 文字切り出し装置、及び文字切り出し方法 | |
JP3024234B2 (ja) | 文書画像の罫線抽出装置 | |
JP3880091B2 (ja) | 情報処理装置及び方法 | |
JP3190794B2 (ja) | 文字切り出し装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110708 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110708 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130716 |
|
LAPS | Cancellation because of no payment of annual fees |