JP6963728B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP6963728B2 JP6963728B2 JP2018032607A JP2018032607A JP6963728B2 JP 6963728 B2 JP6963728 B2 JP 6963728B2 JP 2018032607 A JP2018032607 A JP 2018032607A JP 2018032607 A JP2018032607 A JP 2018032607A JP 6963728 B2 JP6963728 B2 JP 6963728B2
- Authority
- JP
- Japan
- Prior art keywords
- font type
- word
- processing unit
- character
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Computational Linguistics (AREA)
- Character Discrimination (AREA)
Description
形態1と同様であるので、その説明を省略する。
22 フォント種別特定部
Claims (5)
- 画像における所定処理単位のテキスト内の文字の文字コードを特定する文字認識部と、
前記文字のフォント種別を特定するフォント種別特定部とを備え、
前記フォント種別特定部は、フォント種別特定処理を実行し、前記フォント種別特定処理において、(a)1文字ずつフォント種別を特定していき、(b)前記所定処理単位のテキストの全文字数に対する、同一フォント種別の文字の文字数の割合が所定閾値を超えたときに、前記所定処理単位のテキスト内の文字のフォント種別をすべて前記同一フォント種別とし、
前記フォント種別特定部は、前記所定処理単位のテキストのすべての文字に対してフォント種別を特定しても、前記割合が前記所定閾値を超えているフォント種別がない場合には、前記所定処理単位のテキスト内の文字のフォント種別を、前記割合が最も多いフォント種別とすること、
を特徴とする画像処理装置。 - 前記フォント種別特定部は、前記所定処理単位が単語である場合において、(a)3文字以上の単語および1文字の単語に対しては前記フォント種別特定処理を実行し、(b)2文字の単語については、当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とすることを特徴とする請求項1記載の画像処理装置。
- 前記フォント種別特定部は、2文字の単語については、(b1)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、前記フォント種別特定処理をせずに、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とし、(b2)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが互いに異なる場合には、当該2文字の単語に対して前記フォント種別特定処理を実行することを特徴とする請求項2記載の画像処理装置。
- 前記フォント種別特定部は、前記所定処理単位に対する上位処理単位のテキストに関し、前記上位処理単位のテキストにおける前記所定処理単位のテキストの全個数に対する、同一フォント種別の前記所定処理単位のテキストの個数の割合が所定閾値を超えたときに、前記上位処理単位のテキスト内の文字のフォント種別をすべて前記同一フォント種別とすることを特徴とする請求項1から請求項3のうちのいずれか1項記載の画像処理装置。
- 前記所定処理単位は、単語であり、
前記上位処理単位は、行、または、行の集合としてのブロックであること、
を特徴とする請求項4記載の画像処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018032607A JP6963728B2 (ja) | 2018-02-26 | 2018-02-26 | 画像処理装置 |
US16/281,383 US10817759B2 (en) | 2018-02-26 | 2019-02-21 | Image processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018032607A JP6963728B2 (ja) | 2018-02-26 | 2018-02-26 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019148941A JP2019148941A (ja) | 2019-09-05 |
JP6963728B2 true JP6963728B2 (ja) | 2021-11-10 |
Family
ID=67684571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018032607A Active JP6963728B2 (ja) | 2018-02-26 | 2018-02-26 | 画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10817759B2 (ja) |
JP (1) | JP6963728B2 (ja) |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07177279A (ja) | 1993-12-16 | 1995-07-14 | Canon Inc | ファクシミリ装置 |
JPH10261048A (ja) | 1997-01-14 | 1998-09-29 | Fujitsu Ltd | 文字認識装置及び文字認識プログラムを記憶した記憶媒体 |
US6337924B1 (en) * | 1999-02-26 | 2002-01-08 | Hewlett-Packard Company | System and method for accurately recognizing text font in a document processing system |
US6853980B1 (en) * | 1999-09-07 | 2005-02-08 | Bitstream Inc. | System for selecting, distributing, and selling fonts |
JP5601027B2 (ja) * | 2010-05-24 | 2014-10-08 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
CN102385570A (zh) * | 2010-08-31 | 2012-03-21 | 国际商业机器公司 | 字体匹配方法和*** |
US9330070B2 (en) * | 2013-03-11 | 2016-05-03 | Microsoft Technology Licensing, Llc | Detection and reconstruction of east asian layout features in a fixed format document |
JP5915628B2 (ja) * | 2013-11-26 | 2016-05-11 | コニカミノルタ株式会社 | 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム |
JP6808330B2 (ja) * | 2016-02-26 | 2021-01-06 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP6624120B2 (ja) * | 2017-02-27 | 2019-12-25 | 京セラドキュメントソリューションズ株式会社 | 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 |
EP3841523A4 (en) * | 2018-08-22 | 2021-10-13 | Leverton Holding LLC | DIFFERENT FONT TEXT LINE IMAGE DIVISION |
-
2018
- 2018-02-26 JP JP2018032607A patent/JP6963728B2/ja active Active
-
2019
- 2019-02-21 US US16/281,383 patent/US10817759B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10817759B2 (en) | 2020-10-27 |
US20190266452A1 (en) | 2019-08-29 |
JP2019148941A (ja) | 2019-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009009527A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
CN106599940A (zh) | 图片文字的识别方法及装置 | |
KR20150099936A (ko) | 전자문서의 레이아웃 유지를 위한 대체폰트 적용 방법 및 그 장치 | |
CN107403123B (zh) | 识别目标图像中的条码图像的图像分析设备 | |
US8259374B2 (en) | Image processing apparatus and image forming apparatus | |
JP3021278B2 (ja) | 均一幅線の生成装置及び均一幅線の生成方法 | |
JP4470913B2 (ja) | 文字列検索装置およびプログラム | |
JP6963728B2 (ja) | 画像処理装置 | |
JP5661214B1 (ja) | 文字データ修正方法、文字データ修正装置およびプログラム | |
US6701023B1 (en) | Reducing appearance differences between coded and noncoded units of text | |
US8587837B2 (en) | Image processing apparatus embedding additional information in document data | |
CN116933728A (zh) | 文本处理方法、电子设备及存储介质 | |
JP6432179B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
JP7383882B2 (ja) | 情報処理装置、及び情報処理プログラム | |
CN106471743B (zh) | 普通ascii数据流的编码 | |
JP7302175B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP2850979B2 (ja) | 文字処理装置および方法 | |
JP2011040075A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2015184711A (ja) | 文字データ修正方法、文字データ修正装置およびプログラム | |
CN114997138B (zh) | 一种化学品说明书解析方法、装置、设备及可读存储介质 | |
CN117709298B (zh) | 一种双字符流的扫描方法、电子设备、存储介质及*** | |
KR101365404B1 (ko) | 이미지 인식 방법 및 이를 이용한 인식 장치 | |
JP2020123232A (ja) | 情報処理装置、及び情報処理プログラム | |
JP6489041B2 (ja) | 情報処理装置及びプログラム | |
JP2024004321A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210408 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210916 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210929 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6963728 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |