JP7417116B2 - 情報処理システム、情報処理方法、プログラム - Google Patents
情報処理システム、情報処理方法、プログラム Download PDFInfo
- Publication number
- JP7417116B2 JP7417116B2 JP2021090955A JP2021090955A JP7417116B2 JP 7417116 B2 JP7417116 B2 JP 7417116B2 JP 2021090955 A JP2021090955 A JP 2021090955A JP 2021090955 A JP2021090955 A JP 2021090955A JP 7417116 B2 JP7417116 B2 JP 7417116B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- specifying
- information processing
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 16
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000012545 processing Methods 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 28
- 238000010586 diagram Methods 0.000 description 21
- 238000001514 detection method Methods 0.000 description 18
- 238000012015 optical character recognition Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000013145 classification model Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000032823 cell division Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
・Th1>(矩形の横サイズ/縦サイズ)>Th2(Th1>1、Th2<1)という条件。
・(矩形の長辺サイズ/短辺サイズ)<Th3(>1)という条件。
・(矩形の短辺サイズ/長辺サイズ)>Th4(<1)という条件。
101 クライアントPC
102 スキャナ
103 ファイルサーバー
Claims (4)
- 文字認識の対象となる二値化された画像における、同じ画素値の画素が連続して存在することで形成される画素片を複数取得する連続画素取得手段と、
前記連続画素取得手段により取得された複数の画素片のそれぞれについて、当該画素片が取得された領域を含む矩形領域を特定する第1の特定手段と、
前記第1の特定手段により特定された矩形領域を拡張して他の矩形領域と結合させることで、1文字ごとの領域を示す文字領域を特定する第2の特定手段と、
前記第2の特定手段により特定された文字領域のうち、文字領域のアスペクト比が所定の閾値よりも1に近い特定文字領域について、水平方向に一定の距離以内であり同じ高さにある位置関係にある他の特定文字領域と結合することで、複数の文字を含む複数文字領域を特定する第3の特定手段と、
前記第3の特定手段により特定された複数文字領域ごとに、当該複数文字領域に含まれる文字の認識処理を実行する文字認識手段と、
を備えることを特徴とする情報処理システム。 - 前記複数文字領域が、表領域における複数のセルにまたがって存在する場合、当該複数文字領域を当該複数のセルの境界で分割する分割手段をさらに備え、
前記文字認識手段は、前記分割手段により複数文字領域が分割された場合、当該分割された領域ごとに、前記認識処理を実行することを特徴とする請求項1に記載の情報処理システム。 - 情報処理システムの連続画素取得手段が、文字認識の対象となる二値化された画像における、同じ画素値の画素が連続して存在することで形成される画素片を複数取得する連続画素取得工程と、
前記情報処理システムの第1の特定手段が、前記連続画素取得工程により取得された複数の画素片のそれぞれについて、当該画素片が取得された領域を含む矩形領域を特定する第1の特定工程と、
前記情報処理システムの第2の特定手段が、前記第1の特定工程により特定された矩形領域を拡張して他の矩形領域と結合させることで、1文字ごとの領域を示す文字領域を特定する第2の特定工程と、
前記情報処理システムの第3の特定手段が、前記第2の特定工程により特定された文字領域のうち、文字領域のアスペクト比が所定の閾値よりも1に近い特定文字領域について、水平方向に一定の距離以内であり同じ高さにある位置関係にある他の特定文字領域と結合することで、複数の文字を含む複数文字領域を特定する第3の特定工程と、
前記情報処理システムの文字認識手段が、前記第3の特定工程により特定された複数文字領域ごとに、当該複数文字領域に含まれる文字の認識処理を実行する文字認識工程と、
を備えることを特徴とする情報処理方法。 - コンピュータを、請求項1または2に記載の各手段として機能させるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218455 | 2020-12-28 | ||
JP2020218455 | 2020-12-28 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022104498A JP2022104498A (ja) | 2022-07-08 |
JP2022104498A5 JP2022104498A5 (ja) | 2022-07-15 |
JP7417116B2 true JP7417116B2 (ja) | 2024-01-18 |
Family
ID=82279629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021090955A Active JP7417116B2 (ja) | 2020-12-28 | 2021-05-31 | 情報処理システム、情報処理方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7417116B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006172284A (ja) | 2004-12-17 | 2006-06-29 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3425834B2 (ja) * | 1995-09-06 | 2003-07-14 | 富士通株式会社 | 文書画像からのタイトル抽出装置および方法 |
JP2007026470A (ja) * | 1996-09-27 | 2007-02-01 | Fujitsu Ltd | パターン認識装置 |
JP2001034763A (ja) * | 1999-03-01 | 2001-02-09 | Matsushita Electric Ind Co Ltd | 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法 |
JP2006092345A (ja) * | 2004-09-24 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
-
2021
- 2021-05-31 JP JP2021090955A patent/JP7417116B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006172284A (ja) | 2004-12-17 | 2006-06-29 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
Non-Patent Citations (1)
Title |
---|
広瀬 克昌 Katsumasa HIROSE,文書画像中の連結成分の模擬的拡大による各構成単位の切出し,電子情報通信学会1999年総合大会講演論文集 情報・システム2 PROCEEDINGS OF THE 1999 IEICE GENERAL CONFERENCE,日本,社団法人電子情報通信学会,1999年03月08日 |
Also Published As
Publication number | Publication date |
---|---|
JP2022104498A (ja) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8645819B2 (en) | Detection and extraction of elements constituting images in unstructured document files | |
US20150095769A1 (en) | Layout Analysis Method And System | |
JP6838209B1 (ja) | 文書画像解析装置、文書画像解析方法およびプログラム | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
JP2007317022A (ja) | 手書文字処理装置及び手書文字処理方法 | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
US9519404B2 (en) | Image segmentation for data verification | |
JP2019016350A (ja) | 電子文書における強調テキストの識別 | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
US20150139547A1 (en) | Feature calculation device and method and computer program product | |
JP2024038417A (ja) | 情報処理装置、情報処理方法、プログラム | |
JP2007310501A (ja) | 情報処理装置、その制御方法、及びプログラム | |
JP7417116B2 (ja) | 情報処理システム、情報処理方法、プログラム | |
JP2021140831A (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP2009140478A (ja) | 画像処理装置及び画像処理方法 | |
JP2001034763A (ja) | 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法 | |
JP5169648B2 (ja) | 原画像探索装置及び原画像探索プログラム | |
JP2002170079A (ja) | 文書書式識別装置および識別方法 | |
JP4136257B2 (ja) | 文字認識装置、文字認識方法および記憶媒体 | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4328511B2 (ja) | パターン認識装置、パターン認識方法、プログラムおよび記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220707 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220707 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231218 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7417116 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |