JP7497620B2 - 文書データ生成装置、画像形成装置、及び文書データ生成プログラム - Google Patents
文書データ生成装置、画像形成装置、及び文書データ生成プログラム Download PDFInfo
- Publication number
- JP7497620B2 JP7497620B2 JP2020095706A JP2020095706A JP7497620B2 JP 7497620 B2 JP7497620 B2 JP 7497620B2 JP 2020095706 A JP2020095706 A JP 2020095706A JP 2020095706 A JP2020095706 A JP 2020095706A JP 7497620 B2 JP7497620 B2 JP 7497620B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- document data
- recognition
- image
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 29
- 238000012545 processing Methods 0.000 description 34
- 230000006870 function Effects 0.000 description 20
- 238000004891 communication Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 13
- 238000012015 optical character recognition Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 11
- 238000007781 pre-processing Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 5
- 101000802640 Homo sapiens Lactosylceramide 4-alpha-galactosyltransferase Proteins 0.000 description 3
- 102100035838 Lactosylceramide 4-alpha-galactosyltransferase Human genes 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000007639 printing Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 206010034719 Personality change Diseases 0.000 description 1
- 238000003705 background correction Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
図1は、本実施形態のシステム構成を例示する図である。システム1は、画像形成装置110、ファイルサーバ120、2つのパーソナルコンピュータであるPC140、PC150を有し、これらが通信ネットワーク190を介して相互にデータの送受信を行う構成となっている。
図2は、画像形成装置110(MFP:Multifunction Peripheral/Product/Printer)のハードウェア構成図である。図2に示されているように、画像形成装置110は、コントローラ210、近距離通信回路220、エンジン制御部230、操作パネル240、ネットワークI/F250を備えている。
図4は、本実施形態の文書データ生成装置400の構成例を示すブロック図である。図5は、図4に示す各機能部が生成するデータを例示する図である。図6は、文書データ生成装置が実行する処理のフローチャートである。図7は、文書データ生成処理のフローチャートである。図8は、一文字出力処理のフローチャートである。図9は、文字認識部404が生成する文字コード及び認識度のリストの一例を示す図である。図10は、文書データ生成部406が生成した文書データの表示例を示す図である。
・“C(k)”は、k番目の候補の文字コード及び当該文字コードで示されるテキスト
・P(k)は、k番目の文字コードの認識度
さらに、P(k)については、以下の関係が成立しているものとする。
100 :通信ネットワーク
110 :画像形成装置
120 :ファイルサーバ
190 :通信ネットワーク
201,301 :CPU
202a,302 :ROM
202b,303 :RAM
206 :ASIC
208,305 :HDDコントローラ
209,304 HD
210 :コントローラ
220 :近距離通信回路
220a :近距離通信回路
221 :AGPバス
222 :PCIバス
230 :エンジン制御部
231 :スキャナ部
232 :プリンタ部
240 :操作パネル
240a :パネル表示部
240b :操作パネル
250,309 :ネットワークI/F
306 :ディスプレイ
308 :外部機器接続I/F
310 :データバス
311 :キーボード
312 :ポインティングデバイス
314 :RWドライブ
315 :記録メディア
316 :メディアI/F
400 :文書データ生成装置
401 :前処理部
403 :文字領域抽出部
404 :文字認識部
405 :文字消去部
406 :文書データ生成部
504 :文字消去部
1001 :テキスト領域
1002 :コメント領域
1003 :境界線
1004 :リンク線
Claims (7)
- 画像データから抽出した文字を含めた文書データを生成する文書データ生成装置であって、
文字認識処理によって、前記画像データから抽出した文字画像に対応する文字コードを特定すると共に、当該文字コードの確からしさを表す認識度を算出する文字認識部と、
前記文字認識部で算出した前記認識度に応じて、前記文字画像に対応する文字の態様を異ならせた前記文書データを生成する文書データ生成部とを備え、
前記文書データは、
レイアウトが前記画像データで示される画像に対応するテキスト領域と、
前記テキスト領域と異なるコメント領域とを含み、
前記文字認識部は、1つの前記文字画像に対して、候補となる複数の前記文字コードを特定すると共に、複数の前記文字コードそれぞれに対応する複数の前記認識度を算出し、
前記文書データ生成部は、
前記文字認識部で算出した最大の前記認識度が第1閾値以上の場合に、前記文字認識部で特定した複数の前記文字コードのうち、前記最大の認識度に対応する前記文字コードのみを前記文書データに含め、
前記最大の認識度が前記第1閾値未満で且つ前記第1閾値より小さい第2閾値以上の場合に、
前記最大の認識度に対応する前記文字コードで表される第1候補テキストを、前記テキスト領域に配置し、
他の前記文字コードで表される代替候補テキストを、前記第1候補テキストに関連付けて前記コメント領域に配置することを特徴とする文書データ生成装置。 - 前記文書データ生成部は、
前記文字認識部で特定した前記文字コードと、前記文字コードで表されるテキストの表示態様を示すフォント情報とを前記文書データに含め、
前記文字認識部で算出した前記認識度に応じて、前記フォント情報を異ならせることを特徴とする請求項1に記載の文書データ生成装置。 - 前記フォント情報は、テキストの色、テキストの書体、斜体か否か、太字か否か、下線を付加するか否か、マーカを付加するか否か、文字色及び背景色を反転させるか否か、のうちの少なくとも1つ示すことを特徴とする請求項2に記載の文書データ生成装置。
- 前記文書データ生成部は、前記最大の認識度が前記第1閾値未満で且つ前記第2閾値以上の場合に、前記画像データから抽出した前記文字画像を、前記第1候補テキストに関連付けて前記コメント領域に配置することを特徴とする請求項1に記載の文書データ生成装置。
- 前記文書データ生成部は、前記最大の認識度が前記第2閾値未満の場合に、
前記画像データから抽出した前記文字画像を、前記テキスト領域に配置し、
前記文字認識部で特定した前記文字コードのうち、前記第2閾値より小さい第3閾値以上の前記認識度に対応する前記文字コードで表される候補テキストを、前記文字画像に対応付けて前記コメント領域に配置することを特徴とする請求項1乃至4のいずれか1項に記載の文書データ生成装置。 - 原稿を読み取って前記画像データを生成するスキャナ部と、
前記スキャナ部で生成された前記画像データから前記文書データを生成する請求項1乃至5のいずれか1項に記載の文書データ生成装置とを備える画像形成装置。 - 画像データから抽出した文字を含めた文書データを生成するコンピュータによって実行される文書データ生成プログラムであって、
文字認識処理によって、前記画像データから抽出した文字画像に対応する文字コードを特定すると共に、当該文字コードの確からしさを表す認識度を算出し、
算出した前記認識度に応じて、前記文字画像に対応する文字の態様を異ならせた前記文書データを生成する文書データ生成処理を、コンピュータに実行させ、
前記文書データは、
レイアウトが前記画像データで示される画像に対応するテキスト領域と、
前記テキスト領域と異なるコメント領域とを含み、
前記文字認識処理では、1つの前記文字画像に対して、候補となる複数の前記文字コードを特定すると共に、複数の前記文字コードそれぞれに対応する複数の前記認識度を算出し、
前記文書データ生成処理では、
前記文字認識処理で算出した最大の前記認識度が第1閾値以上の場合に、前記文字認識処理で特定した複数の前記文字コードのうち、前記最大の認識度に対応する前記文字コードのみを前記文書データに含め、
前記最大の認識度が前記第1閾値未満で且つ前記第1閾値より小さい第2閾値以上の場合に、
前記最大の認識度に対応する前記文字コードで表される第1候補テキストを、前記テキスト領域に配置し、
他の前記文字コードで表される代替候補テキストを、前記第1候補テキストに関連付けて前記コメント領域に配置する文書データ生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020095706A JP7497620B2 (ja) | 2020-06-01 | 2020-06-01 | 文書データ生成装置、画像形成装置、及び文書データ生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020095706A JP7497620B2 (ja) | 2020-06-01 | 2020-06-01 | 文書データ生成装置、画像形成装置、及び文書データ生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021189859A JP2021189859A (ja) | 2021-12-13 |
JP7497620B2 true JP7497620B2 (ja) | 2024-06-11 |
Family
ID=78849902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020095706A Active JP7497620B2 (ja) | 2020-06-01 | 2020-06-01 | 文書データ生成装置、画像形成装置、及び文書データ生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7497620B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013130997A (ja) | 2011-12-21 | 2013-07-04 | Kyocera Document Solutions Inc | 画像形成装置 |
-
2020
- 2020-06-01 JP JP2020095706A patent/JP7497620B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013130997A (ja) | 2011-12-21 | 2013-07-04 | Kyocera Document Solutions Inc | 画像形成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2021189859A (ja) | 2021-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5699623B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、および、プログラム | |
JP5042562B2 (ja) | 画像処理装置、手書き情報認識方法、手書き情報認識プログラム | |
JP5121599B2 (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
US8391607B2 (en) | Image processor and computer readable medium | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
JP2008022159A (ja) | 文書処理装置及び文書処理方法 | |
JP2022074466A (ja) | 画像処理装置および画像形成装置 | |
JP4232679B2 (ja) | 画像形成装置およびプログラム | |
US11941903B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
US11146705B2 (en) | Character recognition device, method of generating document file, and storage medium | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
US7983485B2 (en) | System and method for identifying symbols for processing images | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
US20180035007A1 (en) | Image forming apparatus, storage medium, and method for digitizing document | |
US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
JP7497620B2 (ja) | 文書データ生成装置、画像形成装置、及び文書データ生成プログラム | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
US11508139B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6503850B2 (ja) | 範囲指定プログラム、範囲指定方法および範囲指定装置 | |
JP2020099030A (ja) | 情報処理装置、及び情報処理方法 | |
US11693825B2 (en) | Information processing apparatus, control method, and recording medium storing program | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
US11113521B2 (en) | Information processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230412 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240418 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20240418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7497620 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |