JP7406884B2 - 情報処理装置、プログラム及び制御方法 - Google Patents
情報処理装置、プログラム及び制御方法 Download PDFInfo
- Publication number
- JP7406884B2 JP7406884B2 JP2019120036A JP2019120036A JP7406884B2 JP 7406884 B2 JP7406884 B2 JP 7406884B2 JP 2019120036 A JP2019120036 A JP 2019120036A JP 2019120036 A JP2019120036 A JP 2019120036A JP 7406884 B2 JP7406884 B2 JP 7406884B2
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- character
- line
- pixel
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 40
- 238000000034 method Methods 0.000 title claims description 35
- 238000001514 detection method Methods 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000002372 labelling Methods 0.000 description 6
- 238000007639 printing Methods 0.000 description 3
- 240000008415 Lactuca sativa Species 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 235000012045 salad Nutrition 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 235000012489 doughnuts Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/164—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
Description
図1は、第1の実施形態に係る情報処理システムを示す図である。情報処理システムは、複写機100と、情報処理装置110とを有している。なお複写機100と、情報処理装置110は別装置である必要は無く、複写機100に情報処理装置110の構成がすべて含まれており、複写機100のみで以下の処理を行ってもよい。複写機100は、スキャナ101と、プリンタ102と、複写機側通信部103とを有している。スキャナ101は、文書のスキャンを行い、スキャン画像を生成する。プリンタ102は、印刷を実行する。複写機側通信部103は、ネットワークを介して外部装置と通信を行う。
第二の実施形態については、第一の実施形態との差分のみの説明とし、特に明記しない部分については第一の実施形態と同じ構成/手順となる。
第三の実施形態については、第一、第二の実施形態との差分のみの説明とし、特に明記しない部分については第一、第二の実施形態と同じ構成/手順となる。行接触が起こっていると、文字を構成する画素塊の一部が行分割により、異なる行に含まれてしまい文字が欠損する可能性が有る。そのため行分割の際に行領域を大きめにとって行分割することで上記のような欠損を防ぐ。
第四の実施形態については、第一、第二の実施形態との差分のみの説明とし、特に明記しない部分については第一、第二の実施形態と同じ構成/手順となる。以上の実施形態では、行分割した後に行分割位置に接する一定の条件の画素塊をノイズとして除去、結合するようにしていた。本実施形態では行分割する前に、行分割位置に接する画素塊が行分割位置のどちら側に含まれるか分類する形態を示す。
本発明は、以下の処理を実行することによっても実現される。その処理は、上述した実施例の機能を実現させるソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
110 情報処理装置
Claims (13)
- 画像データを読み込む情報処理装置であって、
前記画像データを基に文字行領域の分割位置を決定し、当該決定された分割位置で前記画像データを前記文字行領域ごとに分割する第一の分割手段と、
前記分割位置に接する文字を構成する画素の塊を検知する第一の検知手段と、
前記検知手段で検知した画素の塊が所定の条件を満たすか判断する第一の判断手段と、
前記判断手段で、所定の条件を満たすと判断した画素の塊を、当該画素の塊が接する分割位置をまたいだ隣接する文字行領域に結合させる第一の結合手段と、
を有することを特徴とする情報処理装置。 - 前記第一の分割手段は画像データ全体を横方向に射影をとり、出現する文字を構成する画素の数が閾値以上の領域を文字行領域と判定し分割を行う
ことを特徴とする請求項1に記載の情報処理装置。 - 前記所定の条件とは所定の面積以下の画素の塊、または所定の高さ以上もしくは以下の位置にある画素の塊である
ことを特徴とする請求項1又は2に記載の情報処理装置。 - 前記所定の条件とは画素の塊を当該画素の塊が接する分割位置をまたいだ隣接する文字行領域に結合させた時に、当該文字行領域にある文字を構成する画素の塊と結合すること
ことを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。 - 前記情報処理装置は
前記第一の結合手段で結合を行ったあとの画像データを用いて、文字行領域の分割位置になる可能性のある位置で再度、分割する第二の分割手段と、
当該分割位置に接する文字を構成する画素の塊を検知する第二の検知手段と
前記第二の検知手段で検知した画素の塊が所定の条件を満たすか判断する第二の判断手段と、
前記判断手段で、所定の条件を満たすと判断した画素の塊を当該画素の塊が接する分割位置をまたいだ隣接する文字行領域に結合させる第二の結合手段とをさらに有する
ことを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。 - 前記可能性のある位置とは、文字を構成する画素の塊の上端もしくは下端の位置が、当該画素の塊と同じ行に含まれる複数の文字の文字を構成する画素の塊の上端もしくは下端の位置と同じである場合の位置である
ことを特徴とする請求項5に記載の情報処理装置。 - 前記可能性は、前記第一の結合手段で結合を行った画素の塊を含む画素の塊の上端もしくは下端の位置が、当該画素の塊と同じ行に含まれる他の複数の文字の文字を構成する画素の塊の上端もしくは下端の位置と同じである場合に高いとされ、当該画素の塊と同じ行に含まれる他の文字を構成する画素の塊の上端もしくは下端の位置と異なる場合に前記可能性は低いとされる
ことを特徴とする請求項5に記載の情報処理装置。 - 前記第一の分割手段は、分割位置に文字を構成する所定以上の画素の塊が含まれる場合は、文字行領域を広げた位置に分割位置を決定し、前記第一の結合手段は結合を行わない
ことを特徴とする請求項5に記載の情報処理装置。 - 前記文字行領域を広げた位置に分割位置を決定した場合、前記第一の判断手段で判断する所定の条件は当該広げた度合いに応じて決まる
ことを特徴とする請求項8に記載の情報処理装置。 - 前記情報処理装置は
分割位置に接する文字を構成する画素の塊が当該分割位置よりも上もしくは下にある割合に応じて当該画素の塊を前記分割位置の上もしくは下の文字行領域に分類する分類手段をさらに有する
ことを特徴とする請求項5に記載の情報処理装置。 - 前記情報処理装置は前記結合手段で結合した後の画像データに含まれる文字に対して文字認識を行う文字認識手段を更に有する
ことを特徴とする請求項1から10のいずれか一項に記載の情報処理装置。 - 画像データを読み込む情報処理装置が実行する情報処理方法であって、
前記画像データを基に文字行領域の分割位置を決定し、当該決定された分割位置で前記画像データを前記文字行領域ごとに分割する第一の分割工程と、
前記分割位置に接する文字を構成する画素の塊を検知する第一の検知工程と
前記検知工程で検知した画素の塊が所定の条件を満たすか判断する第一の判断工程と、
前記判断工程で、所定の条件を満たすと判断した画素の塊を、当該画素の塊が接する分割位置をまたいだ隣接する文字行領域に結合させる第一の結合工程と
を有することを特徴とする情報処理方法。 - 請求項12に記載の情報処理方法をコンピュータに実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019120036A JP7406884B2 (ja) | 2019-06-27 | 2019-06-27 | 情報処理装置、プログラム及び制御方法 |
US16/907,000 US11501515B2 (en) | 2019-06-27 | 2020-06-19 | Apparatus, storage medium, and control method for removing a noise from a divided line image obtained by a character image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019120036A JP7406884B2 (ja) | 2019-06-27 | 2019-06-27 | 情報処理装置、プログラム及び制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021005315A JP2021005315A (ja) | 2021-01-14 |
JP7406884B2 true JP7406884B2 (ja) | 2023-12-28 |
Family
ID=74044722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019120036A Active JP7406884B2 (ja) | 2019-06-27 | 2019-06-27 | 情報処理装置、プログラム及び制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11501515B2 (ja) |
JP (1) | JP7406884B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7406884B2 (ja) * | 2019-06-27 | 2023-12-28 | キヤノン株式会社 | 情報処理装置、プログラム及び制御方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002056356A (ja) | 2000-08-11 | 2002-02-20 | Ricoh Co Ltd | 文字認識装置、文字認識方法および記録媒体 |
JP2012048621A (ja) | 2010-08-30 | 2012-03-08 | Nec Corp | 失敗回避支援システム,情報処理装置及び失敗回避支援方法 |
US20170351913A1 (en) | 2016-06-07 | 2017-12-07 | The Neat Company, Inc. d/b/a Neatreceipts, Inc. | Document Field Detection And Parsing |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5826713B2 (ja) * | 1976-06-28 | 1983-06-04 | 日本電信電話株式会社 | 2値信号の逐次境界差分符号化伝送方式 |
JPS63136181A (ja) * | 1986-11-27 | 1988-06-08 | Toshiba Corp | 文字読取装置 |
JPH05128308A (ja) * | 1991-11-08 | 1993-05-25 | Sumitomo Electric Ind Ltd | 文字認識装置 |
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
US5588072A (en) * | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
JP3805005B2 (ja) * | 1994-11-09 | 2006-08-02 | キヤノン株式会社 | 画像処理装置及び光学的文字認識装置及びそれらの方法 |
JP3409993B2 (ja) * | 1996-06-06 | 2003-05-26 | 富士通株式会社 | 接触パターンを分離するパターン分離装置および方法 |
JPH1153469A (ja) * | 1997-08-05 | 1999-02-26 | N T T Data:Kk | 文字切り出し装置、光学式文字読取装置及び記録媒体 |
JP4170441B2 (ja) * | 1997-11-28 | 2008-10-22 | 富士通株式会社 | 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体 |
JP3425408B2 (ja) * | 2000-05-31 | 2003-07-14 | 株式会社東芝 | 文書読取装置 |
US6873732B2 (en) * | 2001-07-09 | 2005-03-29 | Xerox Corporation | Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images |
US7136082B2 (en) * | 2002-01-25 | 2006-11-14 | Xerox Corporation | Method and apparatus to convert digital ink images for use in a structured text/graphics editor |
US7283669B2 (en) * | 2003-01-29 | 2007-10-16 | Lockheed Martin Corporation | Fine segmentation refinement for an optical character recognition system |
JP4384106B2 (ja) * | 2004-09-30 | 2009-12-16 | キヤノン株式会社 | 情報処理装置および情報処理方法並びに制御プログラム、地紋画像生成装置及び地紋画像生成方法 |
JP5034398B2 (ja) * | 2006-09-14 | 2012-09-26 | 富士通株式会社 | 文字認識プログラム、文字認識方法および文字認識装置 |
JP4483909B2 (ja) * | 2007-08-24 | 2010-06-16 | 富士ゼロックス株式会社 | 翻訳装置及びプログラム |
CN102375988B (zh) * | 2010-08-17 | 2013-12-25 | 富士通株式会社 | 文件图像处理方法和设备 |
US20130194448A1 (en) * | 2012-01-26 | 2013-08-01 | Qualcomm Incorporated | Rules for merging blocks of connected components in natural images |
CN106940799B (zh) * | 2016-01-05 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 文本图像处理方法和装置 |
JP7102170B2 (ja) * | 2018-02-28 | 2022-07-19 | キヤノン株式会社 | 画像処理装置、および画像処理装置の制御方法とプログラム |
JP2020123925A (ja) * | 2019-01-31 | 2020-08-13 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7406884B2 (ja) * | 2019-06-27 | 2023-12-28 | キヤノン株式会社 | 情報処理装置、プログラム及び制御方法 |
-
2019
- 2019-06-27 JP JP2019120036A patent/JP7406884B2/ja active Active
-
2020
- 2020-06-19 US US16/907,000 patent/US11501515B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002056356A (ja) | 2000-08-11 | 2002-02-20 | Ricoh Co Ltd | 文字認識装置、文字認識方法および記録媒体 |
JP2012048621A (ja) | 2010-08-30 | 2012-03-08 | Nec Corp | 失敗回避支援システム,情報処理装置及び失敗回避支援方法 |
US20170351913A1 (en) | 2016-06-07 | 2017-12-07 | The Neat Company, Inc. d/b/a Neatreceipts, Inc. | Document Field Detection And Parsing |
Also Published As
Publication number | Publication date |
---|---|
US11501515B2 (en) | 2022-11-15 |
US20200410276A1 (en) | 2020-12-31 |
JP2021005315A (ja) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US11935314B2 (en) | Apparatus for generating a binary image into a white pixel, storage medium, and method | |
US10643097B2 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP7406884B2 (ja) | 情報処理装置、プログラム及び制御方法 | |
JP4392907B2 (ja) | 文字切出し方法 | |
US11430235B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
US10049269B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
JP4420440B2 (ja) | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 | |
JP7341758B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP4078045B2 (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
US11778122B2 (en) | Apparatus, method, and storage medium for removing shading dots | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP4083723B2 (ja) | 画像処理装置 | |
KR100277831B1 (ko) | 문서 영상에서의 표 분석방법 | |
US20220383471A1 (en) | Image processing apparatus, image processing method, and medium | |
JP4810995B2 (ja) | 画像処理装置、方法及びプログラム | |
JP2002366900A (ja) | 光学式文字読取装置 | |
JP2001291058A (ja) | 文字認識装置及び記録媒体 | |
JPH05128308A (ja) | 文字認識装置 | |
JP2002074264A (ja) | 画像処理装置、画像処理方法および記録媒体 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220623 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231114 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231213 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7406884 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |