JP4995507B2 - 画像処理システム、文字認識システムおよび画像処理プログラム - Google Patents

画像処理システム、文字認識システムおよび画像処理プログラム Download PDF

Info

Publication number
JP4995507B2
JP4995507B2 JP2006205784A JP2006205784A JP4995507B2 JP 4995507 B2 JP4995507 B2 JP 4995507B2 JP 2006205784 A JP2006205784 A JP 2006205784A JP 2006205784 A JP2006205784 A JP 2006205784A JP 4995507 B2 JP4995507 B2 JP 4995507B2
Authority
JP
Japan
Prior art keywords
character
feature
texture
space
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006205784A
Other languages
English (en)
Other versions
JP2008033604A (ja
Inventor
明 廣瀬
純平 小山
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
University of Tokyo NUC
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, University of Tokyo NUC, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2006205784A priority Critical patent/JP4995507B2/ja
Publication of JP2008033604A publication Critical patent/JP2008033604A/ja
Application granted granted Critical
Publication of JP4995507B2 publication Critical patent/JP4995507B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、画像処理システム、文字認識システムおよび画像処理プログラムに関する。
紙文書をスキャンして文字情報を抽出する技術として、OCR(Optical Character Recognition、光学的文字認識)が利用されている。文字は手書きされたものと活字で印字されたものに分類できるが、高い認識精度を得るためにそれぞれ専用のOCR方式を用いる必要がある。特に、手書き文字を認識するためには、予め文字が存在する領域を指定しておく必要があるため、帳票原稿など定型文書での利用に留まっている。
これに対し、人が扱う文書は、活字文字と手書き文字が混在しているものが多い。各種申請書やアンケート等が代表例である。これらをスキャンから文字情報抽出に至るまで全自動化するためには、上記活字文字と手書き文字とを自動的に判別する必要がある。
これを実現するために、従来技術では画像中から1文字毎に正確に文字を切り出し、切り出した文字外接矩形を作成してその縦辺および横辺の長さを計測し、これに基づいて縦横辺の比であるとか、辺長の分散であるとか、外接矩形間の距離のばらつきなどを評価することで、活字文字と区別を行っていた。
しかしながら、これらの方式は活字文字が確実に文字毎に外接矩形を作成できたり、並びが均等であったりすることを前提としている。しかし、実際にはこの前提を満足していない場合が多いので、この判断基準では判断を誤るケースも多い。また、これらの方法では、言語依存性が強くなる。
これらに関連する技術として、例えば、特許文献1には、手書き文字は活字文字に比べてピッチがバラつくことに着目して、文字行を切り出し、切り出した文字行においてそのピッチのバラツキを調べる技術が開示されている。
また、例えば、特許文献2には、文字の外接矩形の縦横比で判定する技術に関し、白画素に隣接する黒画素の配列様態(横/縦画素率、曲/直画素率など)で判定する技術が開示されている。
また、例えば、特許文献3には、文字の特徴パラメータと辞書により得られるそれの距離を求め、その距離の平均的なバラツキを求めて判定する技術が開示されている。
また、例えば、特許文献4には、手書き文字では水平方向に延びる線分が比較的少ないことに着目し、文字を構成する画素のうち、水平方向成分の画素の割合に基づいて判定する技術が開示されている。
また、例えば、特許文献5には、各種特徴量(文字の高さ、ピッチ、面積など)の分散に基づき総合的に判断する技術が開示されている。
また、例えば、特許文献6には、文字行に対して各ラベルの重心がほぼ直線上に並んでいるかを判定し、並んでいれば各ラベルの外接矩形の長辺方向の長さがほぼ等しいかを判定し、ほぼ等しい場合には活字文字列と判定する技術が開示されている。
また、例えば、特許文献7には、テクスチャ領域の抽出に関するものであり、テクスチャ画像の方は卓越しているパワーを持つ空間周波数が空間周波数領域において規則的に点在しており、一方テクスチャではない画像のパワースペクトルは卓越周波数の規則性は見られないことに着目したものであり、既に抽出されているテクスチャ区画の領域から外側に向かって、テクスチャ画像の画像特徴量の変化を調べ、変化の大きくなったところをエッジ部と判断し、画像特徴量として1次元のパワースペクトルを採択する技術が開示されている。
また、例えば、特許文献8には、文字領域の判定に関するものであり、一般に、文字の周辺は、文字を見やすくするために無地になっているのが普通であり、文字でない背景パターンの場合は、周辺が無地であるという傾向をもたないことに着目したものであり、画像を所定サイズのブロックに分割、直交変換を行い空間周波数分布を獲得し、このパワーが所定の閾値より大きいブロックを選択して文字領域の候補とし、この候補の周囲近傍のブロックの高空間周波数領域のパワーが所定の閾値より小さく、かつ、低空間周波数領域のパワーが互いに等しければ、当該文字領域の候補を文字領域であると判定する技術が開示されている。
特開昭57−111679号公報 特開昭58−037775号公報 特開昭60−138692号公報 特開昭63−103389号公報 特開平01−014682号公報 特開2000−339404号公報 特開平07−121699号公報 特開平09−186861号公報
本発明は、このような背景技術の状況の中でなされたもので、手書き文字領域または活字文字領域であることが不明である画像から、手書き文字領域または活字文字領域を判断することができるようにした画像処理システム、文字認識システムおよび画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
[1] 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。
[2] 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、前記指標設定手段によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。
] 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段と、
前記領域確定手段により確定された手書き文字領域または活字文字領域を用いて、前記画像からレイアウトを解析するレイアウト解析手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。
] 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段と、
前記画像からレイアウトを解析するレイアウト解析手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和であり、
前記領域確定手段は、前記レイアウト解析手段によって解析されたレイアウトをも用いて手書き文字領域または活字文字領域を確定する
ことを特徴とする画像処理システム。
] [1]、[2]、[3]または[4]記載の画像処理システムの前記領域確定手段により確定された手書き文字領域または活字文字領域を認識する手書き文字認識手段または活字文字認識手段
を具備することを特徴とする文字認識システム。
] 前記領域確定手段は、前記手書き文字認識手段により認識された文字または前記活字文字認識手段により認識された文字の確からしさをも用いて手書き文字領域または活字文字領域を確定する
ことを特徴とする[]記載の文字認識システム。
] コンピュータに、
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させ
前記特徴抽出機能が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理プログラム。
] コンピュータに、
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、前記指標設定機能によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させ
前記特徴抽出機能が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理プログラム。
本発明にかかる画像処理システム、文字認識システムおよび画像処理プログラムによれば、本構成を有していない場合に比較して、次のいずれかの効果を奏することができる。
(1)従来の文字切り出し処理が不要である。個々の文字を画像上で正確に切り出す必要がないため、判断を困難にしていた要因である文字切り出し処理に依存することがない。
(2)経験データを必ずしも必要としない。例えば、ニューラルネットワークを使用した前学習や、テンプレートのようなあらかじめ準備しておくデータを必要としない。
(3)言語依存性が低い。人が書くことにより起こる揺らぎを扱うために、それぞれの言語の特徴を扱う必要がなく、言語の種類を問うことがない。
まず、本実施の形態の概要を説明する。
本実施の形態では、言語によらず手書き文字を構成する線分は、活字文字における線分に比べて“揺らぎ”が多いという特徴に着目したものである。この揺らぎを的確に表す特徴量をも案出した。この特徴量は、画像の画素ごとまたは領域ごとに求める。なお、この特徴量は複数でもよい。求めた特徴量をテクスチャの要素としたテクスチャ情報空間を生成し、生成したテクスチャ情報空間において、所定の指標に基づき空間の境界を求め、求めた境界に基づき当該テクスチャ情報空間を複数の部分空間に分割する。手書き文字を表すと考えられる部分空間に対応した、実画像上の領域を手書き文字領域と判定する。または、活字文字を表すと考えられる部分空間に対応した、実画像上の領域を活字文字領域と判定する。
本実施の形態によれば、個々の文字を正確に切り出す必要がないため、判断をばらつかせていた要因である文字切り出し処理に依存することなく、活字文字領域と手書き文字領域の判断が可能となる。また、経験データを必ずしも必要としない。例えば、ニューラルネットワークを使用した前学習や、テンプレートのようなあらかじめ準備しておくデータを必要としない。さらに、手書き文字に固有の“線分の揺らぎ”に着目するため、様々な言語(表記文字)に対応することが可能となる。
なお、テクスチャ(texture)とは、きめ(肌理)であり、画素値の統計的な指標によって定量化され、例えば完全に周期的ではないがある統計的な性質のもとで繰返し的に配置されてできる模様のことをいう。
本実施の形態が対象とする活字文字と手書き文字とが混在する文書を図2を用いて説明する。フォームが定まっており、そのフォームに手書きで入力するようなビジネスで用いられる文書は多い。例えば、図2に示した見積回答書のような文書である。この文書は、「数量・単位」、「税抜単価(円)」、「税抜合計金額(円)」等のように、予め記入すべき項目は定まっており、その欄に手書き文字21で記入されている。この文書を、人が見れば、活字文字と手書き文字の差異は一目瞭然である。この一目瞭然である理由は、文字の揺らぎによるものである。つまり、言語を問わず手書き文字は、人が書くことに起因する揺らぎが多いという特徴がある。文字の揺らぎとは、線分の直線あるいはなめらかな曲線からのずれや、各文字の大きさの不均一性や並びのずれなどを指す。
そこで、本実施の形態では、活字文字には直線的な線分が多くあるが、手書き文字には少ないということを用いている。
図3を用いて、本実施の形態の処理手順の概要を説明する。処理手順は二つのモジュールからなり、一つ目は入力画像(文書データ)のテクスチャを解析するために2次元フーリエ変換を行うフーリエ変換モジュール31、二つ目はフーリエ変換モジュール31から出力された周波数領域画像(テクスチャ特徴量)に対して揺らぎの評価量を算出し、その評価量に応じて手書き文字か活字文字かを判断する手書き文字度評価モジュール32である。
図3に示すように、フーリエ変換モジュール31は入力画像33を入力し、周波数領域画像(テクスチャ特徴量)34を作成する。そして、手書き文字度評価モジュール32が周波数領域画像(テクスチャ特徴量)34を受け取り、手書き文字度(評価値)E35を最終的に出力する。
フーリエ変換モジュール31は、画像(文書画像データ)に二次元フーリエ変換を適用し、元データの周波数領域画像を取得する。周波数領域画像というのは、例えば文字画像があるとき、その文字が様々な周波数の波が集まって生成されていると考えて、その文字を構成するそれぞれの周波数のスペクトル強度を表した画像である。
数1に二次元フーリエ変換の定義式を記す。
Figure 0004995507
例えば、入力画像33の画像データと周波数領域画像(テクスチャ特徴量)34のサイズは共に64×64ピクセルである。画像データは画像の左下を原点とし、水平な軸をx軸、鉛直な軸をy軸とする。周波数領域画像は入力画像のx軸方向のスペクトルをu軸、y軸方向のスペクトルをv軸とし、それぞれの周波数が0となる原点を中心としている。二次元フーリエ変換を画像データに適用して得られたスペクトル強度の取りうる幅をグレースケールのビットマップ画像で表し、スペクトル強度が高ければ黒色、逆に低ければ白色と表現している(図3の周波数領域画像(テクスチャ特徴量)34参照)。
手書き文字度評価モジュール32は、周波数領域画像から揺らぎの評価量を算出し、その評価量に応じて手書き文字か活字文字かの区別を行う。
手書き文字特有の揺らぎの評価方法は以下の通りである。
例えば、人間が真横の直線を描くとき、それは完全にまっすぐな直線にはならず、揺らぎが含まれる線となる。完全に真横の直線は周波数領域画像においてv軸上にスペクトル強度の変化が現れるのだが、揺らぎが含まれると、その影響によりスペクトル強度の変化がv軸上だけでなく、その周囲にも拡散して表れるようになる。主にここでは、水平、鉛直の線成分からなる漢字を対象とし、画像及び文書データの縦横直線成分以外の成分を抽出することを説明する。その一例を数2に示す。
Figure 0004995507
Eを手書き文字度と呼ぶことにする。
この抽出方法では、二次元フーリエ変換結果の周波数領域画像において、軸周りのピクセルのスペクトル強度を除き(重みを0にし)、その重み付け後の和を取っている。軸周りのピクセル強度を除くということは、元の文字画像データにおける水平、鉛直の直線成分に起因するスペクトル強度を除くということであり、それはすなわち手書き文字の揺らぎによって生じるスペクトル強度の非集中性を検出することができることを意味している。それにより漢字について手書き文字と活字文字を区別できることとなる。
図4を用いて、活字文字と手書き文字に対して、二次元フーリエ変換を施した処理例を示す。図4(A)は、「富」の活字文字(図4(A)の左側)に対して、二次元フーリエ変換を施した結果である(図4(A)の右側)。図4(C)は、「富」の手書き文字(図4(C)の左側)に対して、二次元フーリエ変換を施した結果である(図4(C)の右側)。これらから活字文字は、U、V軸上にスペクトルが集中していることがわかり、手書き文字はU、V軸から離れた位置にスペクトルが分散していることがわかる。
なお、「富」という文字は縦横の線分から構成されているが、「研」のように斜めの線分がある文字に対しても、同様の結果が得られている(図4(B)、図4(D)参照)。
図1は、一実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システムおよび方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散または並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等で接続されて構成されるほか、1つのコンピュータによって実現される場合も含まれる。
本実施の形態は、図1に示すように、画像傾き補正モジュール101、解像度変換モジュール102、手書き文字特徴抽出モジュール103、テクスチャ空間生成モジュール104、部分空間推定モジュール105、文字種別確定モジュール106、画像二値化モジュール107、レイアウト解析モジュール108、手書き文字認識モジュール109、活字文字認識モジュール110を有している。なお、図1では、画像の流れは黒矢印で示し、情報の流れは矢印で示している。すなわち、画像傾き補正モジュール101から解像度変換モジュール102へ、画像傾き補正モジュール101から画像二値化モジュール107へ、解像度変換モジュール102から手書き文字特徴抽出モジュール103へ、テクスチャ空間生成モジュール104から部分空間推定モジュール105へ、画像二値化モジュール107からレイアウト解析モジュール108、手書き文字認識モジュール109、活字文字認識モジュール110へは、画像が渡される。その他のモジュール間は、情報が渡される。
画像傾き補正モジュール101は、解像度変換モジュール102、画像二値化モジュール107と接続されている。画像傾き補正モジュール101は、文書画像データを入力し、その文書画像データの傾きを検知して、アフィン変換によってその傾きを補正する。一般的にスキャナを用いて文書を入力した場合、傾き等が発生してしまう。その傾きは、後の処理に悪影響を与えるので、前処理として補正することを行う。傾きの検知は、例えば、文書内に存在する直線を抽出し、この傾きが微小である場合は、その直線を水平または垂直にする方向に画像全体を回転させる等の方法がある。また、ここでの入力画像は、例えばカラー画像であり、1画素が24ビットで表現されている。傾き補正処理後の画像を、解像度変換モジュール102、画像二値化モジュール107へ渡す。
解像度変換モジュール102は、画像傾き補正モジュール101、手書き文字特徴抽出モジュール103と接続されている。つまり、画像傾き補正モジュール101より文書画像データを受け取り、解像度変換を行い、その結果の画像データを手書き文字特徴抽出モジュール103へ渡す。ここでは、対象とする画像を正規化する目的で解像度変換(拡大・縮小処理)を行う。手書き文字特徴抽出モジュール103で行う特徴抽出に必要十分な解像度の画像データを渡すことになる。
手書き文字特徴抽出モジュール103は、解像度変換モジュール102、テクスチャ空間生成モジュール104と接続されている。つまり、解像度変換モジュール102より画像データを受け取り、手書き文字の揺らぎを表す特徴量(具体的には、上述の数2により計算される手書き文字度E)を抽出し、テクスチャ空間生成モジュール104へ渡す。
テクスチャ空間生成モジュール104は、手書き文字特徴抽出モジュール103、部分空間推定モジュール105と接続されている。つまり、手書き文字特徴抽出モジュール103より手書き文字の特徴量を受け取り、テクスチャ空間を生成して、そのテクスチャ空間を部分空間推定モジュール105へ渡す。ここで、テクスチャ空間生成モジュール104は、手書き文字特徴抽出モジュール103により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップする。そして、各画素または各領域の情報がマップされたテクスチャ空間を部分空間推定モジュール105へ渡す。
部分空間推定モジュール105は、テクスチャ空間生成モジュール104、文字種別確定モジュール106と接続されている。つまり、テクスチャ空間生成モジュール104より各画素または各領域の情報がマップされたテクスチャ空間を受け取り、手書き文字領域である部分空間を推定する。なお、ここでの推定とは、人間による頭脳処理のことではなく、本実施の形態において、手書き文字領域の部分空間であるとする可能性が高いものであると暫定的に定めることである。この推定は、まず手書き文字領域らしさを表す指標を設定し、テクスチャ空間生成モジュール104により生成されたテクスチャ空間にて、設定された指標に応じて手書き文字領域である部分空間を推定する。そして、手書き文字領域の可能性が高いと推定された範囲の情報を文字種別確定モジュール106へ渡す。
画像二値化モジュール107は、画像傾き補正モジュール101、レイアウト解析モジュール108、手書き文字認識モジュール109、活字文字認識モジュール110と接続されている。つまり、画像傾き補正モジュール101より渡された文書画像データを二値化処理する。レイアウト解析モジュール108、手書き文字認識モジュール109、活字文字認識モジュール110の処理では、多値画像ではなく、二値化画像が適しているからである。二値化処理は、閾値を定めて、黒画素、白画素を定める方法がとられるが、閾値を適応的に定めるようにしてもよい。この二値化画像(1画素を1ビットで表現)をレイアウト解析モジュール108、手書き文字認識モジュール109、活字文字認識モジュール110へ渡す。
レイアウト解析モジュール108は、画像二値化モジュール107、文字種別確定モジュール106、手書き文字認識モジュール109、活字文字認識モジュール110と接続されている。つまり、画像二値化モジュール107より二値化画像を受け取り、これに対して文書のレイアウト解析処理を行い、その結果を手書き文字認識モジュール109、活字文字認識モジュール110または文字種別確定モジュール106へ渡す。レイアウト解析処理とは、文書には一定の構造、つまり文字領域、図形領域、画像領域等に分けることができ、また、その中でもタイトル、段落、注等の外観によっておおよその内容を推定するものである。このレイアウト解析処理によって文字領域であると判断された領域は手書き文字認識モジュール109または活字文字認識モジュール110へ渡す。また、文字領域であると判断された領域に関する情報をレイアウト解析モジュール108へ渡すことによって、文字種別確定モジュール106による文字種別処理の参考にすることができる。また、逆に文字種別確定モジュール106から、領域内の文字種別情報を得ることによって、その情報を用いて、レイアウト解析処理の参考にすることができる。例えば、レイアウト解析処理として文字領域であるか否かの可能性があまり高いものでないが、明らかに文字領域ではないとも判断できないような場合に、文字種別確定モジュール106によって手書き文字領域である可能性が高いことが判明した場合は、その領域を文字領域として判断してもよい。
手書き文字認識モジュール109は、画像二値化モジュール107、レイアウト解析モジュール108、文字種別確定モジュール106と接続されている。つまり、画像二値化モジュール107より二値化画像を受け取り、レイアウト解析モジュール108より文字領域の座標を受け取り、さらに文字種別確定モジュール106より手書き文字領域の座標を受け取る。そして、その領域に対して、手書き文字に適した文字認識処理を行い、その結果(テキストコード)を手書き文字情報として出力する。また、文字認識の結果の確からしさ(信頼度)をレイアウト解析モジュール108または文字種別確定モジュール106へ出力してもよい。例えば、特許第2991779号公報に記載の文字の信頼度値を適用することができる。
活字文字認識モジュール110は、画像二値化モジュール107、レイアウト解析モジュール108、文字種別確定モジュール106と接続されている。つまり、画像二値化モジュール107より二値化画像を受け取り、レイアウト解析モジュール108より文字領域の座標を受け取り、さらに文字種別確定モジュール106より活字文字領域の座標を受け取る。そして、その領域に対して、活字文字に適した文字認識処理を行い、その結果(テキストコード)を活字文字情報として出力する。また、文字認識の結果の確からしさ(信頼度)をレイアウト解析モジュール108または文字種別確定モジュール106へ出力してもよい。
文字種別確定モジュール106は、部分空間推定モジュール105、レイアウト解析モジュール108、手書き文字認識モジュール109、活字文字認識モジュール110と接続されている。つまり、部分空間推定モジュール105より手書き文字領域の可能性が高いと推定された範囲の情報を受け取り、レイアウト解析モジュール108より文字領域の座標を受け取り、その領域が手書き文字領域であるか活字領域であるかを判断する。なお、手書き文字認識モジュール109、活字文字認識モジュール110から文字認識の結果の確からしさを受け取り、この情報を用いて、手書き文字であるか活字文字であるかの判断の閾値を修正するようにしてもよい。
図5を参照して、本実施の形態のハードウェア構成例について説明する。図5に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成される画像処理システムであり、スキャナ等のデータ読み取り部417と、プリンタなどのデータ出力部418を備えたハード構成例を示している。
CPU(Central Processing Unit)401は、上述の実施の形態において説明した各種のモジュール、すなわち、画像傾き補正モジュール101、解像度変換モジュール102、手書き文字特徴抽出モジュール103、テクスチャ空間生成モジュール104等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。
ROM(Read Only Memory)402は、CPU401が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)403は、CPU401の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス404により相互に接続されている。
ホストバス404は、ブリッジ405を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス406に接続されている。
キーボード408、マウス等のポインティングデバイス409は、操作者により操作される入力デバイスである。ディスプレイ410は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)411は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU401によって実行するプログラムや情報を記録または再生させる。ハードディスクは、入力された画像、二値化画像、特徴量、文字認識結果データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ412は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体413に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース407、外部バス406、ブリッジ405、およびホストバス404を介して接続されているRAM403に供給する。リムーバブル記録媒体413も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート414は、外部接続機器415を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート414は、インタフェース407、および外部バス406、ブリッジ405、ホストバス404等を介してCPU401等に接続されている。通信部416は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部417は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部418は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図5に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図5に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図5に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(多機能複写機とも呼ばれ、スキャナ、プリンタ、複写機、ファックス等の機能を有している)などに組み込まれていてもよい。
次に作用・働き(動作)を説明する。
図6を用いて、文書画像を認識する処理を説明する。
ステップS601では、画像傾き補正モジュール101が入力した文書画像の傾きを補正する。傾き補正の他、ノイズ除去等の文字認識のための前処理としての画像処理を行ってもよい。
ステップS602では、解像度変換モジュール102がステップS601で補正された文書画像に対して、解像度変換を行う。
ステップS603では、手書き文字特徴抽出モジュール103がステップS602で解像度変換された文書画像に対して、手書き文字の特徴である揺らぎの特徴量を抽出する。
ステップS604では、テクスチャ空間生成モジュール104がステップS603で抽出した特徴量を用いて、テクスチャ空間を生成する。
ステップS605では、部分空間推定モジュール105がステップS604で生成されたテクスチャ空間内で、手書き文字領域である部分空間を推定する。
ステップS606では、文字種別確定モジュール106がステップS605で推定された手書き文字領域を確定する。ただし、後にステップS611でNoの場合またはステップS614でNoの場合には繰り返し処理が行われる。その場合は、ステップS605で推定された手書き文字領域を、ステップS608でのレイアウト解析の結果、文字認識結果の確からしさ(ステップS611、ステップS614)をも用いて、手書き文字領域を修正し、確定する。
ステップS607では、画像二値化モジュール107がステップS601で補正された文書画像に対して、二値化処理を行う。
ステップS608では、レイアウト解析モジュール108がステップS607で二値化された画像を受け取り、画像全体のレイアウト解析を行う。ここで、ステップS606で確定された文字種別をも用いて、レイアウト解析を行う。これによって、レイアウト解析単独で行う結果よりも精度よく行うことができる。
ステップS609では、ステップS608でのレイアウト解析の結果、文字領域に対して、手書き文字領域であるか否か(活字文字領域であるか否かであってもよい)を判断する。かかる判断において、YesであるとステップS610へ、NoであるとステップS613へと進む。
ステップS610では、手書き文字認識モジュール109がステップS608でのレイアウト解析の結果、手書き文字領域であると判断された領域の画像に対して、手書き文字認識を行う。
ステップS611では、ステップS610での手書き文字認識の結果、その確からしさが所定の閾値以上であるか否かが判断される。かかる判断において、YesであるとステップS612へ、NoであるとステップS606へと戻る。
ステップS612では、ステップS608でのレイアウト解析の結果の全ての文字領域内の文字に対して、文字認識処理を行ったか否かを判断する。かかる判断において、Yesであると終了し、NoであるとステップS609へと戻る。
ステップS613では、活字文字認識モジュール110がステップS608でのレイアウト解析の結果、活字文字領域であると判断された領域の画像に対して、活字文字認識を行う。
ステップS614では、ステップS613での活字文字認識の結果、その確からしさが所定の閾値以上であるか否かが判断される。かかる判断において、YesであるとステップS615へ、NoであるとステップS606へと戻る。
ステップS615では、ステップS608でレイアウト解析の結果の全ての文字領域内の文字に対して、文字認識処理を行ったか否かを判断する。かかる判断において、Yesであると終了し、NoであるとステップS609へと戻る。
前記実施の形態においては、例示として漢字を示したが、他の言語による文字であってもよい。
また、前記実施の形態においては、文字の揺らぎを用いて、主に手書き文字領域と判断することを示した。逆に、文字の揺らぎが少ないということは、活字文字であることを意味している。つまり、文字領域と判定された領域に対して、算出された手書き文字度が低い場合には、当該領域は活字文字領域であると判断できる。したがって、活字文字領域の判定についても、手書き文字領域と同様に行うことが可能である。
なお、前記実施の形態においては、手書き文字の特徴として、入力画像の水平、鉛直の線分について手書き文字特有の揺らぎを検出しているが、さらに斜めの線分の揺らぎを検出するようにしてもよい。
なお、説明したプログラムについては、記録媒体に格納することも可能であり、その場合は、例えば以下の発明としても把握することができる。
コンピュータに、
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させることを特徴とする画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
コンピュータに、
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、前記指標設定機能によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させることを特徴とする画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去および書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラムまたはその一部は、上記記録媒体に記録して保存や流通等させることが可能である。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に乗せて搬送することも可能である。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。
画像処理システムの実施の形態の一構成例を示すブロック図である。 活字文字と手書き文字が混在する文書を示す説明図である。 実施の形態の概略を説明するブロック図である。 活字文字画像、手書き文字画像をフーリエ変換した例を示す説明図である。 実施の形態を実現するコンピュータのハードウェア構成の一例の説明図である。 文書画像を認識する処理を示すフローチャートである。
符号の説明
21…手書き文字
31…フーリエ変換モジュール
32…手書き文字度評価モジュール
33…入力画像
34…周波数領域画像(テクスチャ特徴量)
35…手書き文字度(評価値)E
101…画像傾き補正モジュール
102…解像度変換モジュール
103…手書き文字特徴抽出モジュール
104…テクスチャ空間生成モジュール
105…部分空間推定モジュール
106…文字種別確定モジュール
107…画像二値化モジュール
108…レイアウト解析モジュール
109…手書き文字認識モジュール
110…活字文字認識モジュール

Claims (8)

  1. 画像から所定の特徴を抽出する特徴抽出手段と、
    前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
    前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
    前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段
    を具備し、
    前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
    2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
    ことを特徴とする画像処理システム。
  2. 画像から所定の特徴を抽出する特徴抽出手段と、
    前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
    前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定手段と、
    前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、前記指標設定手段によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
    前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段
    を具備し、
    前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
    2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
    ことを特徴とする画像処理システム。
  3. 画像から所定の特徴を抽出する特徴抽出手段と、
    前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
    前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
    前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段と、
    前記領域確定手段により確定された手書き文字領域または活字文字領域を用いて、前記画像からレイアウトを解析するレイアウト解析手段
    を具備し、
    前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
    2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
    ことを特徴とする画像処理システム。
  4. 画像から所定の特徴を抽出する特徴抽出手段と、
    前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
    前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
    前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段と、
    前記画像からレイアウトを解析するレイアウト解析手段
    を具備し、
    前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
    2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和であり、
    前記領域確定手段は、前記レイアウト解析手段によって解析されたレイアウトをも用いて手書き文字領域または活字文字領域を確定する
    ことを特徴とする画像処理システム。
  5. 請求項1、2、3または4記載の画像処理システムの前記領域確定手段により確定された手書き文字領域または活字文字領域を認識する手書き文字認識手段または活字文字認識手段
    を具備することを特徴とする文字認識システム。
  6. 前記領域確定手段は、前記手書き文字認識手段により認識された文字または前記活字文字認識手段により認識された文字の確からしさをも用いて手書き文字領域または活字文字領域を確定する
    ことを特徴とする請求項記載の文字認識システム。
  7. コンピュータに、
    画像から所定の特徴を抽出する特徴抽出機能と、
    前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
    前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
    前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
    を実現させ
    前記特徴抽出機能が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
    2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
    ことを特徴とする画像処理プログラム。
  8. コンピュータに、
    画像から所定の特徴を抽出する特徴抽出機能と、
    前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
    前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定機能と、
    前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、前記指標設定機能によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
    前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
    を実現させ
    前記特徴抽出機能が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
    2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
    ことを特徴とする画像処理プログラム。
JP2006205784A 2006-07-28 2006-07-28 画像処理システム、文字認識システムおよび画像処理プログラム Expired - Fee Related JP4995507B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006205784A JP4995507B2 (ja) 2006-07-28 2006-07-28 画像処理システム、文字認識システムおよび画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006205784A JP4995507B2 (ja) 2006-07-28 2006-07-28 画像処理システム、文字認識システムおよび画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2008033604A JP2008033604A (ja) 2008-02-14
JP4995507B2 true JP4995507B2 (ja) 2012-08-08

Family

ID=39122954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006205784A Expired - Fee Related JP4995507B2 (ja) 2006-07-28 2006-07-28 画像処理システム、文字認識システムおよび画像処理プログラム

Country Status (1)

Country Link
JP (1) JP4995507B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011074067A1 (ja) 2009-12-15 2011-06-23 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793466A (ja) * 1993-09-22 1995-04-07 Toshiba Corp 文字種判別装置およびその判別方法
JPH09231291A (ja) * 1996-02-27 1997-09-05 Mitsubishi Electric Corp 帳票読取方法及びその装置
JPH10254993A (ja) * 1997-03-12 1998-09-25 Canon Inc 文字抽出装置及び文字抽出方法
JP2001143020A (ja) * 1999-11-11 2001-05-25 Fujitsu Ltd 文字認識装置、文字認識方法、および記録媒体
JP2005078233A (ja) * 2003-08-29 2005-03-24 Toudai Tlo Ltd 領域抽出法および領域抽出装置

Also Published As

Publication number Publication date
JP2008033604A (ja) 2008-02-14

Similar Documents

Publication Publication Date Title
US8965127B2 (en) Method for segmenting text words in document images
US9384409B1 (en) Word segmentation for document image using recursive segmentation
US8442319B2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
US9104940B2 (en) Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
EP2553625B1 (en) Detecting position of word breaks in a textual line image
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US9319556B2 (en) Method and apparatus for authenticating printed documents that contains both dark and halftone text
KR101248449B1 (ko) 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체
JPH1027214A (ja) 光学式文字認識コンピュータにおける接触文字の分離方法及び装置
US20120250985A1 (en) Context Constraints for Correcting Mis-Detection of Text Contents in Scanned Images
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
KR101336901B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP4995507B2 (ja) 画像処理システム、文字認識システムおよび画像処理プログラム
Chakraborty et al. Marginal Noise Reduction in Historical Handwritten Documents--A Survey
US8494272B2 (en) Image processing device, image processing method, and computer readable medium for judging if images are matched
JP5489894B2 (ja) 画像処理装置及び画像処理プログラム
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JP5039449B2 (ja) 画像処理装置及び画像処理プログラム
Dey et al. A comparative study of margin noise removal algorithms on marnr: A margin noise dataset of document images
Mahastama et al. Improving Projection Profile for Segmenting Characters from Javanese Manuscripts
JP5821648B2 (ja) 情報処理装置及び情報処理プログラム
JP4978437B2 (ja) 画像処理装置及び画像処理プログラム
JP6281309B2 (ja) 画像処理装置及び画像処理プログラム
JP4670916B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees