JP4589370B2 - 文書画像処理装置および方法 - Google Patents
文書画像処理装置および方法 Download PDFInfo
- Publication number
- JP4589370B2 JP4589370B2 JP2007260130A JP2007260130A JP4589370B2 JP 4589370 B2 JP4589370 B2 JP 4589370B2 JP 2007260130 A JP2007260130 A JP 2007260130A JP 2007260130 A JP2007260130 A JP 2007260130A JP 4589370 B2 JP4589370 B2 JP 4589370B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- document image
- recognition result
- displayed
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Description
(1)領域識別部2による領域識別処理として、個別領域の文書画像構成要素の文章、表、図、枠などの属性を、必要であれば修正して決定した後、個別領域認識部4が、属性に応じた個別の文書画像構成要素の認識を行う。文章領域であれば、個別の文字画像を決定し、文字認識する。表領域であれば、罫線抽出を行い、各セル内の文字領域を決定し、文字認識する。認識結果は、必要に応じて修正される。
(1)従来の文書画像処理は、領域識別と領域内認識という2段階から成っており、各段階でユーザの修正処理を含む構成である。このように、ユーザにとっては、2度の修正操作が必要となり、操作が煩わしい。また、領域識別の段階で識別誤りがなくても、識別誤りの有無を確認する必要があり、この確認を省略した場合、領域内認識の後で識別誤りのあった箇所を修正することはできない。この場合、正しい処理結果を得るには、最初から処理をやり直し、領域識別の段階で識別誤りを修正する必要がある。
識別手段11は、入力画像のパターン領域を識別して、パターン領域の種類を決定する。認識手段12は、パターン領域内に含まれるパターンの認識処理を行う。出力手段13は、パターン領域の種類を表す種類情報とパターンを表す個別情報とを、入力画像を構成する画像構成要素の認識結果候補として出力する。修正手段14は、認識結果候補を修正する。
抽出手段15は、入力画像から、それを構成する画像構成要素を抽出する。コード付加手段16は、画像構成要素に新たなコード情報を付加する。出力手段13は、画像構成要素に対応する画像データと既存のコード情報に対応する文字パターンが混在した文書情報を出力する。編集手段17は、新たなコード情報と既存のコード情報を用いて文書情報を編集する。
抽出手段15は、入力画像から、それを構成する画像構成要素を抽出する。認識手段12は、画像構成要素の認識処理を行う。出力手段13は、画像構成要素に対応する画像データを、入力画像から分離して、画像構成要素の認識結果における1つ以上の候補とともに出力する。
本発明では、上述した従来の問題点(1)、(2)に対応して、次のような対策を施す。
(a)文書画像構成要素の領域は、文書画像構成要素の文字・図形に対応する画素領域と定義する。
(b)文書画像構成要素の領域は、文書画像構成要素の文字・図形の外接矩形内と定義する。
(a)文書画像の指示座標を含む最も内側の文書画像構成要素を、指示対象とする。
(b)文書画像の指示座標を含む最大の文書画像構成要素を、指示対象とする。
(c)文書画像の指示座標に外接枠が最も近い文書画像構成要素を、指示対象とする。
(a)既に指示した文書画像構成要素を含む最も内側の文書画像構成要素を、指示対象とする。
(b)既に指示した文書画像構成要素内で文書画像の指示座標を含む最大の文書画像構成要素を、指示対象とする。
(a)認識結果候補第1位が「文字」の場合、文字認識を行い、文字認識結果の候補文字コードを上位の認識結果候補コードとし、「文字」以外の「表」、「図」、「枠」などの文書画像構成要素の種類コードを、下位の認識結果候補コードとする。
(b)認識結果候補第1位が「文字」以外の「文章」、「表」、「図」、「枠」などの文書画像構成要素の種類の場合、その文書画像構成要素の種類コードを第1位の認識結果候補コードとし、これ以外の文書画像構成要素の種類コードを下位の認識結果候補コードとする。
(a)認識結果候補コードとして「文字」の種類コードを修正指示した場合、該当する入力文字画像の文字認識を行い、単数あるいは複数の文字認識結果候補文字コードで、認識結果候補コードの「文字」を置き換える。
(b)認識結果候補コードとして「文字」以外の「表」、「図」、「枠」などの文書画像構成要素の種類コードを修正指示した場合、該当する入力文字画像に対して、指示された種類の文書画像構成要素としての認識を行う。
(a)文書画像構成要素画像の等倍画像を含む縮小または拡大画像を用いる。
(b)文書画像構成要素画像の輪郭をベクトル化したデータを用いる。
図2は、本発明の文書画像処理装置の第1の構成図である。図2の文書画像処理装置は、文書画像入力部21、領域識別部22、個別領域認識部23、認識結果格納部24、表示部25、および修正部26を備え、図3に示すような処理を行う。
次に、表示部46は、編集データ格納部44内のデータを用いて、編集対象の文書を画面に表示する(ステップS17)。文書画像構成要素の表示には、画像データが用いられ、既存の文字パターンの表示には、フォントデータが用いられる。
しかし、文書画像構成要素画像を、画像データのままで拡大・縮小すると、形状が崩れて表示される場合がある。そこで、文書画像構成要素の表示に、文書画像構成要素画像の輪郭をベクトル化したアウトライン・データ(アウトライン・フォント)を用いると、拡大・縮小した場合でも形状が崩れるのを防ぐことができる。
ユーザは、このような認識結果表示において、文書画像構成要素画像を選択して、その種類属性に応じた再認識処理を行わせることもできる。図32の例では、ユーザが文書画像構成要素画像54を選択して修正指示すると、右側に示すように、対応する文字パターンが文書画像構成要素画像54に置き換えられて、再度、文字認識が行われる。
図37は、図36の情報処理装置にプログラムとデータを供給することのできるコンピュータ読み取り可能な記録媒体を示している。可搬記録媒体70や外部のデータベース71に保存されたプログラムとデータは、メモリ62にロードされる。そして、CPU61は、そのデータを用いてそのプログラムを実行し、必要な処理を行う。
2、22 領域識別部
3 領域識別結果格納部
4、23 個別領域認識部
5、24 認識結果格納部
6 第1の修正部
7 第2の修正部
8、25、46 表示部
11 識別手段
12 認識手段
13 出力手段
14 修正手段
15 抽出手段
16 コード付加手段
17 編集手段
26 修正部
31、32 外接矩形
42 文書画像構成要素抽出部
43 コード付加部
44 編集データ格納部
45 文書データ格納部
47 コード文書入力部
48 編集操作入力部
49 編集部
51 表示領域
52 認識結果
53、54、55 文書画像構成要素画像
61 CPU
62 メモリ
63 入力装置
64 出力装置
65 外部記憶装置
66 媒体駆動装置
67 ネットワーク接続装置
68 光電変換装置
69 バス
70 可搬記録媒体
71 データベース
Claims (10)
- 入力画像から、該入力画像を構成する複数の画像構成要素を抽出する抽出手段と、
前記複数の画像構成要素の認識処理を行う認識手段と、
前記複数の画像構成要素の認識結果を画面上に表示し、該複数の画像構成要素のうち1つの画像構成要素の認識結果候補の表示領域内に、1つ以上の候補とともに該1つの画像構成要素に対応する画像データを表示する表示手段とを備え、
前記表示手段は、前記表示領域内の前記1つの画像構成要素に対応する前記画像データが指示されると、前記画面上に表示された認識結果中の該1つの画像構成要素の候補を指示された該画像データに置き換えて表示することを特徴とする画像処理装置。 - 前記複数の画像構成要素に複数の新たなコード情報をそれぞれ付加するコード付加手段と、
前記複数の画像構成要素と前記複数の新たなコード情報とが対応付けられ、前記1つ以上の候補の文字パターンと1つ以上の既存のコード情報とが対応付けられた、編集データを格納する格納手段と、
前記編集データを用いて編集処理を行う編集手段とをさらに備え、
前記表示手段は、前記編集データを用いて、前記複数の画像構成要素に対応する複数の画像データと前記1つ以上の候補の文字パターンが混在した文書情報を前記画面上に表示し、前記編集手段は、該画面上に表示された文書情報中の1つの画像構成要素に対応する画像データが指示されると、対応する新たなコード情報に対して編集処理を行い、該文書情報中の1つの文字パターンが指示されると、対応する既存のコード情報に対して編集処理を行うことを特徴とする請求項1記載の画像処理装置。 - 前記表示手段は、前記表示領域内に、前記1つの画像構成要素の種類情報を表示することを特徴とする請求項1記載の画像処理装置。
- 前記表示手段は、前記表示領域内に、前記1つの画像構成要素の認識結果における第1位の候補に対応する種類情報を表示することを特徴とする請求項3記載の画像処理装置。
- 前記1つの画像構成要素の種類情報を修正する修正手段をさらに備えることを特徴とする請求項3記載の画像処理装置。
- 前記認識手段は、前記1つ以上の候補の確信度を求め、前記表示手段は、前記1つの画像構成要素に対応する画像データに所定の確信度を与えて、該1つ以上の候補と画像データを確信度の高い順に順位付けして前記表示領域内に表示することを特徴とする請求項1記載の画像処理装置。
- 前記1つの画像構成要素に対応する画像データの確信度を入力する入力手段をさらに備えることを特徴とする請求項6記載の画像処理装置。
- 前記表示手段は、前記1つ以上の候補と画像データのうち第1位の情報を前記表示領域内に表示し、前記入力手段により入力された確信度に応じて、該表示領域内の該第1位の情報を変更することを特徴とする請求項7記載の画像処理装置。
- コンピュータのためのプログラムを記録した記録媒体であって、
入力画像から、該入力画像を構成する複数の画像構成要素を抽出する機能と、
前記複数の画像構成要素の認識処理を行う機能と、
前記複数の画像構成要素の認識結果を画面上に表示し、該複数の画像構成要素のうち1つの画像構成要素の認識結果候補の表示領域内に、1つ以上の候補とともに該1つの画像構成要素に対応する画像データを表示する機能と、
前記表示領域内の前記1つの画像構成要素に対応する前記画像データが指示されると、前記画面上に表示された認識結果中の該1つの画像構成要素の候補を指示された該画像データに置き換えて表示する機能と
を前記コンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 画像をコンピュータに入力し、
入力画像から、該入力画像を構成する複数の画像構成要素を抽出し、
前記複数の画像構成要素の認識処理を行い、
前記複数の画像構成要素の認識結果を画面上に表示し、該複数の画像構成要素のうち1つの画像構成要素の認識結果候補の表示領域内に、1つ以上の候補とともに該1つの画像構成要素に対応する画像データを表示し、
前記表示領域内の前記1つの画像構成要素に対応する前記画像データが指示されると、前記画面上に表示された認識結果中の該1つの画像構成要素の候補を指示された該画像データに置き換えて表示する
ことを特徴とする画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007260130A JP4589370B2 (ja) | 2007-10-03 | 2007-10-03 | 文書画像処理装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007260130A JP4589370B2 (ja) | 2007-10-03 | 2007-10-03 | 文書画像処理装置および方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP31684997A Division JP4071328B2 (ja) | 1997-11-18 | 1997-11-18 | 文書画像処理装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008033960A JP2008033960A (ja) | 2008-02-14 |
JP4589370B2 true JP4589370B2 (ja) | 2010-12-01 |
Family
ID=39123230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007260130A Expired - Fee Related JP4589370B2 (ja) | 2007-10-03 | 2007-10-03 | 文書画像処理装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4589370B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05120472A (ja) * | 1991-10-28 | 1993-05-18 | Sharp Corp | 文字認識装置 |
JPH05174125A (ja) * | 1991-12-20 | 1993-07-13 | Canon Inc | 文字認識方法及び装置 |
JPH08335248A (ja) * | 1995-06-07 | 1996-12-17 | Oki Electric Ind Co Ltd | 文書読取装置 |
JPH08335245A (ja) * | 1995-06-07 | 1996-12-17 | Oki Electric Ind Co Ltd | 文書読取装置 |
JPH09218922A (ja) * | 1996-02-14 | 1997-08-19 | Canon Inc | 文字認識装置及びその方法 |
-
2007
- 2007-10-03 JP JP2007260130A patent/JP4589370B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05120472A (ja) * | 1991-10-28 | 1993-05-18 | Sharp Corp | 文字認識装置 |
JPH05174125A (ja) * | 1991-12-20 | 1993-07-13 | Canon Inc | 文字認識方法及び装置 |
JPH08335248A (ja) * | 1995-06-07 | 1996-12-17 | Oki Electric Ind Co Ltd | 文書読取装置 |
JPH08335245A (ja) * | 1995-06-07 | 1996-12-17 | Oki Electric Ind Co Ltd | 文書読取装置 |
JPH09218922A (ja) * | 1996-02-14 | 1997-08-19 | Canon Inc | 文字認識装置及びその方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2008033960A (ja) | 2008-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4071328B2 (ja) | 文書画像処理装置および方法 | |
JP4973063B2 (ja) | 表データ処理方法及び装置 | |
EP0439951B1 (en) | Data processing | |
JP4742404B2 (ja) | 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
JP4998219B2 (ja) | 帳票認識プログラム、帳票認識装置および帳票認識方法 | |
KR20180048774A (ko) | 디지털 노트 필기의 시스템 및 방법 | |
JPH05151254A (ja) | 文書処理方法およびシステム | |
US20200104586A1 (en) | Method and system for manual editing of character recognition results | |
JP2011150466A (ja) | 文字列認識装置、文字列認識プログラムおよび文字列認識方法 | |
JP5790082B2 (ja) | 文書認識装置、文書認識方法、プログラム及び記憶媒体 | |
JP2010108208A (ja) | 文書処理装置 | |
JP4633773B2 (ja) | 文書画像処理装置および方法 | |
JP4982587B2 (ja) | データエントリシステムおよびデータエントリ方法 | |
JP4589370B2 (ja) | 文書画像処理装置および方法 | |
JP3319203B2 (ja) | 文書ファイリング方法及び装置 | |
JP7315420B2 (ja) | テキストの適合および修正の方法 | |
JP7383882B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP4698308B2 (ja) | 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体 | |
JP2020115260A (ja) | 情報処理装置、及び情報処理プログラム | |
JP7271889B2 (ja) | 情報処理装置及びプログラム | |
JP4213558B2 (ja) | 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 | |
JP4297815B2 (ja) | 情報処理装置および処理方法およびプログラムおよび記録媒体 | |
JP2000123116A (ja) | 文字認識結果修正方法 | |
JP5390880B2 (ja) | 外字ビットマップデータ抽出方法 | |
JP2874815B2 (ja) | 日本語文字読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20080128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100813 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100907 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100909 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130917 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |