JP4995507B2 - 画像処理システム、文字認識システムおよび画像処理プログラム - Google Patents
画像処理システム、文字認識システムおよび画像処理プログラム Download PDFInfo
- Publication number
- JP4995507B2 JP4995507B2 JP2006205784A JP2006205784A JP4995507B2 JP 4995507 B2 JP4995507 B2 JP 4995507B2 JP 2006205784 A JP2006205784 A JP 2006205784A JP 2006205784 A JP2006205784 A JP 2006205784A JP 4995507 B2 JP4995507 B2 JP 4995507B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- feature
- texture
- space
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
これに対し、人が扱う文書は、活字文字と手書き文字が混在しているものが多い。各種申請書やアンケート等が代表例である。これらをスキャンから文字情報抽出に至るまで全自動化するためには、上記活字文字と手書き文字とを自動的に判別する必要がある。
これを実現するために、従来技術では画像中から1文字毎に正確に文字を切り出し、切り出した文字外接矩形を作成してその縦辺および横辺の長さを計測し、これに基づいて縦横辺の比であるとか、辺長の分散であるとか、外接矩形間の距離のばらつきなどを評価することで、活字文字と区別を行っていた。
しかしながら、これらの方式は活字文字が確実に文字毎に外接矩形を作成できたり、並びが均等であったりすることを前提としている。しかし、実際にはこの前提を満足していない場合が多いので、この判断基準では判断を誤るケースも多い。また、これらの方法では、言語依存性が強くなる。
また、例えば、特許文献2には、文字の外接矩形の縦横比で判定する技術に関し、白画素に隣接する黒画素の配列様態(横/縦画素率、曲/直画素率など)で判定する技術が開示されている。
また、例えば、特許文献3には、文字の特徴パラメータと辞書により得られるそれの距離を求め、その距離の平均的なバラツキを求めて判定する技術が開示されている。
また、例えば、特許文献4には、手書き文字では水平方向に延びる線分が比較的少ないことに着目し、文字を構成する画素のうち、水平方向成分の画素の割合に基づいて判定する技術が開示されている。
また、例えば、特許文献5には、各種特徴量(文字の高さ、ピッチ、面積など)の分散に基づき総合的に判断する技術が開示されている。
また、例えば、特許文献6には、文字行に対して各ラベルの重心がほぼ直線上に並んでいるかを判定し、並んでいれば各ラベルの外接矩形の長辺方向の長さがほぼ等しいかを判定し、ほぼ等しい場合には活字文字列と判定する技術が開示されている。
また、例えば、特許文献7には、テクスチャ領域の抽出に関するものであり、テクスチャ画像の方は卓越しているパワーを持つ空間周波数が空間周波数領域において規則的に点在しており、一方テクスチャではない画像のパワースペクトルは卓越周波数の規則性は見られないことに着目したものであり、既に抽出されているテクスチャ区画の領域から外側に向かって、テクスチャ画像の画像特徴量の変化を調べ、変化の大きくなったところをエッジ部と判断し、画像特徴量として1次元のパワースペクトルを採択する技術が開示されている。
また、例えば、特許文献8には、文字領域の判定に関するものであり、一般に、文字の周辺は、文字を見やすくするために無地になっているのが普通であり、文字でない背景パターンの場合は、周辺が無地であるという傾向をもたないことに着目したものであり、画像を所定サイズのブロックに分割、直交変換を行い空間周波数分布を獲得し、このパワーが所定の閾値より大きいブロックを選択して文字領域の候補とし、この候補の周囲近傍のブロックの高空間周波数領域のパワーが所定の閾値より小さく、かつ、低空間周波数領域のパワーが互いに等しければ、当該文字領域の候補を文字領域であると判定する技術が開示されている。
[1] 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、前記指標設定手段によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段と、
前記領域確定手段により確定された手書き文字領域または活字文字領域を用いて、前記画像からレイアウトを解析するレイアウト解析手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段と、
前記画像からレイアウトを解析するレイアウト解析手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和であり、
前記領域確定手段は、前記レイアウト解析手段によって解析されたレイアウトをも用いて手書き文字領域または活字文字領域を確定する
ことを特徴とする画像処理システム。
を具備することを特徴とする文字認識システム。
ことを特徴とする[5]記載の文字認識システム。
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させ、
前記特徴抽出機能が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理プログラム。
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、前記指標設定機能によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させ、
前記特徴抽出機能が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理プログラム。
(1)従来の文字切り出し処理が不要である。個々の文字を画像上で正確に切り出す必要がないため、判断を困難にしていた要因である文字切り出し処理に依存することがない。
(2)経験データを必ずしも必要としない。例えば、ニューラルネットワークを使用した前学習や、テンプレートのようなあらかじめ準備しておくデータを必要としない。
(3)言語依存性が低い。人が書くことにより起こる揺らぎを扱うために、それぞれの言語の特徴を扱う必要がなく、言語の種類を問うことがない。
本実施の形態では、言語によらず手書き文字を構成する線分は、活字文字における線分に比べて“揺らぎ”が多いという特徴に着目したものである。この揺らぎを的確に表す特徴量をも案出した。この特徴量は、画像の画素ごとまたは領域ごとに求める。なお、この特徴量は複数でもよい。求めた特徴量をテクスチャの要素としたテクスチャ情報空間を生成し、生成したテクスチャ情報空間において、所定の指標に基づき空間の境界を求め、求めた境界に基づき当該テクスチャ情報空間を複数の部分空間に分割する。手書き文字を表すと考えられる部分空間に対応した、実画像上の領域を手書き文字領域と判定する。または、活字文字を表すと考えられる部分空間に対応した、実画像上の領域を活字文字領域と判定する。
本実施の形態によれば、個々の文字を正確に切り出す必要がないため、判断をばらつかせていた要因である文字切り出し処理に依存することなく、活字文字領域と手書き文字領域の判断が可能となる。また、経験データを必ずしも必要としない。例えば、ニューラルネットワークを使用した前学習や、テンプレートのようなあらかじめ準備しておくデータを必要としない。さらに、手書き文字に固有の“線分の揺らぎ”に着目するため、様々な言語(表記文字)に対応することが可能となる。
なお、テクスチャ(texture)とは、きめ(肌理)であり、画素値の統計的な指標によって定量化され、例えば完全に周期的ではないがある統計的な性質のもとで繰返し的に配置されてできる模様のことをいう。
そこで、本実施の形態では、活字文字には直線的な線分が多くあるが、手書き文字には少ないということを用いている。
図3に示すように、フーリエ変換モジュール31は入力画像33を入力し、周波数領域画像(テクスチャ特徴量)34を作成する。そして、手書き文字度評価モジュール32が周波数領域画像(テクスチャ特徴量)34を受け取り、手書き文字度(評価値)E35を最終的に出力する。
数1に二次元フーリエ変換の定義式を記す。
手書き文字特有の揺らぎの評価方法は以下の通りである。
例えば、人間が真横の直線を描くとき、それは完全にまっすぐな直線にはならず、揺らぎが含まれる線となる。完全に真横の直線は周波数領域画像においてv軸上にスペクトル強度の変化が現れるのだが、揺らぎが含まれると、その影響によりスペクトル強度の変化がv軸上だけでなく、その周囲にも拡散して表れるようになる。主にここでは、水平、鉛直の線成分からなる漢字を対象とし、画像及び文書データの縦横直線成分以外の成分を抽出することを説明する。その一例を数2に示す。
この抽出方法では、二次元フーリエ変換結果の周波数領域画像において、軸周りのピクセルのスペクトル強度を除き(重みを0にし)、その重み付け後の和を取っている。軸周りのピクセル強度を除くということは、元の文字画像データにおける水平、鉛直の直線成分に起因するスペクトル強度を除くということであり、それはすなわち手書き文字の揺らぎによって生じるスペクトル強度の非集中性を検出することができることを意味している。それにより漢字について手書き文字と活字文字を区別できることとなる。
なお、「富」という文字は縦横の線分から構成されているが、「研」のように斜めの線分がある文字に対しても、同様の結果が得られている(図4(B)、図4(D)参照)。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システムおよび方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散または並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等で接続されて構成されるほか、1つのコンピュータによって実現される場合も含まれる。
図6を用いて、文書画像を認識する処理を説明する。
ステップS601では、画像傾き補正モジュール101が入力した文書画像の傾きを補正する。傾き補正の他、ノイズ除去等の文字認識のための前処理としての画像処理を行ってもよい。
ステップS602では、解像度変換モジュール102がステップS601で補正された文書画像に対して、解像度変換を行う。
ステップS603では、手書き文字特徴抽出モジュール103がステップS602で解像度変換された文書画像に対して、手書き文字の特徴である揺らぎの特徴量を抽出する。
ステップS605では、部分空間推定モジュール105がステップS604で生成されたテクスチャ空間内で、手書き文字領域である部分空間を推定する。
ステップS606では、文字種別確定モジュール106がステップS605で推定された手書き文字領域を確定する。ただし、後にステップS611でNoの場合またはステップS614でNoの場合には繰り返し処理が行われる。その場合は、ステップS605で推定された手書き文字領域を、ステップS608でのレイアウト解析の結果、文字認識結果の確からしさ(ステップS611、ステップS614)をも用いて、手書き文字領域を修正し、確定する。
ステップS608では、レイアウト解析モジュール108がステップS607で二値化された画像を受け取り、画像全体のレイアウト解析を行う。ここで、ステップS606で確定された文字種別をも用いて、レイアウト解析を行う。これによって、レイアウト解析単独で行う結果よりも精度よく行うことができる。
ステップS609では、ステップS608でのレイアウト解析の結果、文字領域に対して、手書き文字領域であるか否か(活字文字領域であるか否かであってもよい)を判断する。かかる判断において、YesであるとステップS610へ、NoであるとステップS613へと進む。
ステップS611では、ステップS610での手書き文字認識の結果、その確からしさが所定の閾値以上であるか否かが判断される。かかる判断において、YesであるとステップS612へ、NoであるとステップS606へと戻る。
ステップS612では、ステップS608でのレイアウト解析の結果の全ての文字領域内の文字に対して、文字認識処理を行ったか否かを判断する。かかる判断において、Yesであると終了し、NoであるとステップS609へと戻る。
ステップS614では、ステップS613での活字文字認識の結果、その確からしさが所定の閾値以上であるか否かが判断される。かかる判断において、YesであるとステップS615へ、NoであるとステップS606へと戻る。
ステップS615では、ステップS608でレイアウト解析の結果の全ての文字領域内の文字に対して、文字認識処理を行ったか否かを判断する。かかる判断において、Yesであると終了し、NoであるとステップS609へと戻る。
また、前記実施の形態においては、文字の揺らぎを用いて、主に手書き文字領域と判断することを示した。逆に、文字の揺らぎが少ないということは、活字文字であることを意味している。つまり、文字領域と判定された領域に対して、算出された手書き文字度が低い場合には、当該領域は活字文字領域であると判断できる。したがって、活字文字領域の判定についても、手書き文字領域と同様に行うことが可能である。
なお、前記実施の形態においては、手書き文字の特徴として、入力画像の水平、鉛直の線分について手書き文字特有の揺らぎを検出しているが、さらに斜めの線分の揺らぎを検出するようにしてもよい。
コンピュータに、
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させることを特徴とする画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、前記指標設定機能によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させることを特徴とする画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去および書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラムまたはその一部は、上記記録媒体に記録して保存や流通等させることが可能である。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に乗せて搬送することも可能である。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。
31…フーリエ変換モジュール
32…手書き文字度評価モジュール
33…入力画像
34…周波数領域画像(テクスチャ特徴量)
35…手書き文字度(評価値)E
101…画像傾き補正モジュール
102…解像度変換モジュール
103…手書き文字特徴抽出モジュール
104…テクスチャ空間生成モジュール
105…部分空間推定モジュール
106…文字種別確定モジュール
107…画像二値化モジュール
108…レイアウト解析モジュール
109…手書き文字認識モジュール
110…活字文字認識モジュール
Claims (8)
- 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。 - 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、前記指標設定手段によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。 - 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段と、
前記領域確定手段により確定された手書き文字領域または活字文字領域を用いて、前記画像からレイアウトを解析するレイアウト解析手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理システム。 - 画像から所定の特徴を抽出する特徴抽出手段と、
前記特徴抽出手段により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成手段と、
前記テクスチャ空間生成手段により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定手段と、
前記部分空間推定手段により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定手段と、
前記画像からレイアウトを解析するレイアウト解析手段
を具備し、
前記特徴抽出手段が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和であり、
前記領域確定手段は、前記レイアウト解析手段によって解析されたレイアウトをも用いて手書き文字領域または活字文字領域を確定する
ことを特徴とする画像処理システム。 - 請求項1、2、3または4記載の画像処理システムの前記領域確定手段により確定された手書き文字領域または活字文字領域を認識する手書き文字認識手段または活字文字認識手段
を具備することを特徴とする文字認識システム。 - 前記領域確定手段は、前記手書き文字認識手段により認識された文字または前記活字文字認識手段により認識された文字の確からしさをも用いて手書き文字領域または活字文字領域を確定する
ことを特徴とする請求項5記載の文字認識システム。 - コンピュータに、
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させ、
前記特徴抽出機能が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理プログラム。 - コンピュータに、
画像から所定の特徴を抽出する特徴抽出機能と、
前記特徴抽出機能により抽出された特徴に応じて、テクスチャ空間に各画素または各領域のテクスチャ情報をマップしたテクスチャ空間を生成するテクスチャ空間生成機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、手書き文字領域らしさまたは活字文字領域らしさを表す指標を設定する指標設定機能と、
前記テクスチャ空間生成機能により生成されたテクスチャ空間にて、前記指標設定機能によって設定された指標に応じて手書き文字領域である部分空間または活字文字領域である部分空間を推定する部分空間推定機能と、
前記部分空間推定機能により推定された部分空間に応じて、実画像上にて手書き文字領域または活字文字領域を確定する領域確定機能
を実現させ、
前記特徴抽出機能が抽出する特徴量は、手書き文字特徴を表す特徴量または活字文字特徴を表す特徴量であり、
2次元フーリエ変換結果の周波数平面にて、所定の軸からの距離で重み付けをしたスペクトル強度の和である
ことを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006205784A JP4995507B2 (ja) | 2006-07-28 | 2006-07-28 | 画像処理システム、文字認識システムおよび画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006205784A JP4995507B2 (ja) | 2006-07-28 | 2006-07-28 | 画像処理システム、文字認識システムおよび画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008033604A JP2008033604A (ja) | 2008-02-14 |
JP4995507B2 true JP4995507B2 (ja) | 2012-08-08 |
Family
ID=39122954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006205784A Expired - Fee Related JP4995507B2 (ja) | 2006-07-28 | 2006-07-28 | 画像処理システム、文字認識システムおよび画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4995507B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011074067A1 (ja) | 2009-12-15 | 2011-06-23 | 富士通フロンテック株式会社 | 文字認識方法、文字認識装置および文字認識プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0793466A (ja) * | 1993-09-22 | 1995-04-07 | Toshiba Corp | 文字種判別装置およびその判別方法 |
JPH09231291A (ja) * | 1996-02-27 | 1997-09-05 | Mitsubishi Electric Corp | 帳票読取方法及びその装置 |
JPH10254993A (ja) * | 1997-03-12 | 1998-09-25 | Canon Inc | 文字抽出装置及び文字抽出方法 |
JP2001143020A (ja) * | 1999-11-11 | 2001-05-25 | Fujitsu Ltd | 文字認識装置、文字認識方法、および記録媒体 |
JP2005078233A (ja) * | 2003-08-29 | 2005-03-24 | Toudai Tlo Ltd | 領域抽出法および領域抽出装置 |
-
2006
- 2006-07-28 JP JP2006205784A patent/JP4995507B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008033604A (ja) | 2008-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8965127B2 (en) | Method for segmenting text words in document images | |
US9384409B1 (en) | Word segmentation for document image using recursive segmentation | |
US8442319B2 (en) | System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking | |
US9104940B2 (en) | Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
EP2553625B1 (en) | Detecting position of word breaks in a textual line image | |
JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
US9319556B2 (en) | Method and apparatus for authenticating printed documents that contains both dark and halftone text | |
KR101248449B1 (ko) | 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 | |
JPH1027214A (ja) | 光学式文字認識コンピュータにおける接触文字の分離方法及び装置 | |
US20120250985A1 (en) | Context Constraints for Correcting Mis-Detection of Text Contents in Scanned Images | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101336901B1 (ko) | 화상 처리 장치, 화상 처리 방법 및 기록 매체 | |
JP4995507B2 (ja) | 画像処理システム、文字認識システムおよび画像処理プログラム | |
Chakraborty et al. | Marginal Noise Reduction in Historical Handwritten Documents--A Survey | |
US8494272B2 (en) | Image processing device, image processing method, and computer readable medium for judging if images are matched | |
JP5489894B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5039449B2 (ja) | 画像処理装置及び画像処理プログラム | |
Dey et al. | A comparative study of margin noise removal algorithms on marnr: A margin noise dataset of document images | |
Mahastama et al. | Improving Projection Profile for Segmenting Characters from Javanese Manuscripts | |
JP5821648B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4978437B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6281309B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4670916B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090619 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120424 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120510 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |