JP2006092345A - 文字認識装置、文字認識方法および文字認識プログラム - Google Patents

文字認識装置、文字認識方法および文字認識プログラム Download PDF

Info

Publication number
JP2006092345A
JP2006092345A JP2004278132A JP2004278132A JP2006092345A JP 2006092345 A JP2006092345 A JP 2006092345A JP 2004278132 A JP2004278132 A JP 2004278132A JP 2004278132 A JP2004278132 A JP 2004278132A JP 2006092345 A JP2006092345 A JP 2006092345A
Authority
JP
Japan
Prior art keywords
character
handwritten
characters
unit
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004278132A
Other languages
English (en)
Inventor
Toshiya Koyama
俊哉 小山
Teruka Saito
照花 斎藤
Shoichi Tateno
昌一 舘野
Kei Tanaka
圭 田中
Masayoshi Sakakibara
正義 榊原
Kotaro Nakamura
浩太郎 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004278132A priority Critical patent/JP2006092345A/ja
Publication of JP2006092345A publication Critical patent/JP2006092345A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 活字と手書き文字が混在した文書における手書き文字の認識率を高めることが可能な文字認識装置、文字認識方法および文字認識プログラムを提供する。
【解決手段】 活字と手書き文字が混在した文書の入力画像が画像入力部11により生成された後、2値化部12で2値化される。2値化データに対し、文字切り出し部15によって1文字単位の切り出しを行い、それぞれの文字に対する異なる複数の特徴量を特徴量算出部16によって算出する。得られた特徴量を用いて、活字手書文字分離部19により活字と手書文字の分離を行うことで、手書き文字の認識率を上げることができる。
【選択図】 図1

Description

本発明は、文書の文字認識装置、文字認識方法および文字認識プログラムに関し、特に、活字と手書き文字が混在した文書における手書き文字の認識率を高めることが可能な文字認識装置、文字認識方法および文字認識プログラムに関する。
近年、Eメールなど電子による文書の流通が増加しているが、その一方で、紙として出力される文書も多く存在する。これは、紙面への手書きによる追記が容易であるということが、理由の一つになっている。例えば、パーソナルコンピュータ(PC)などで作成した草案原稿に対する追加修正や、会議などで配布した文書に対する追記を手書きで行うことは、しばしば発生する。さらに、手書き文字が追記された文書をスキャナなどでスキャンし、OCR(Optical Character Reader:光学的文字認識)ソフトを用いて文字認識を行い、この手書き文字の認識結果を含む文書の再構成に利用するといったニーズもある。
しかし、手書きで記述した文字情報は、従来、マス目指定、数字のみ等の条件を厳しく制限しなければ、実用的な認識率が得られず、オンライン/オフライン情報変換の妨げとなっていた。そこで、活字/手書き文字両方の認識精度を向上させるため、活字部と手書き部を分離し、それぞれに対応するOCRを実行することが行われている。
活字部と手書き部を分離して文字認識を行う従来技術として、読み取りデータからフィールド(文字列)単位で文字データを切り出しフィールドバッファに格納するとともに、文字データの文字種を文字種判定部で判定し、この判定結果に基づいて認識部により、手書き辞書または活字辞書を参照してフィールドバッファ内の文字データの認識を行う光学的文字読取装置が知られている(例えば、特許文献1参照。)。
また、印刷文字認識手段と手書き文字認識手段を備え、これらにより文字データのOCRを個別に行い、確度(確からしさ)の高い方を採用する光学式文字読み取り装置も知られている(例えば、特許文献2参照。)。
また、2値化された文字情報の周囲に、それぞれ1ドット分の白画素を追加して白枠付パターンを形成し、この白枠付パターンに、2×2ドットの4画素からなり、白画素と黒画素の異なる組み合わせよりなる16種の2×2パターンをそれぞれ対応させ、白枠付パターンの2×2パターンごとの発生頻度を計数し、各2×2パターンの非直線成分と直線成分との比率より文字種を判別し、常に、文字種に適した辞書を用いて認識が行えるようにした文字種判別装置も知られている(例えば、特許文献3参照。)
また、文字切り出しを行う前段階の文字行の状態で手書き文字・活字文字の判別を行い、文字種判別後に文字毎の画像切り出しを行うとともに、縦書き・横書きの区別で、文字認識の方法を変更し、文字切り出しの誤りを無視することができ、高速かつ高精度に手書き文字・活字文字の判別を行えるようにした宛名文字認識方法も知られている(例えば、特許文献4参照。)。
特開平5−189604号公報([0008]〜[0011]、図1) 特開平7−37034号公報([0019]〜[0038]、図1〜図3) 特開平7−93466号公報([0036]〜[0053]、図4) 特開平9−212579号公報([0006]〜[0008]、図1)
しかし、従来の文字認識装置によると、特許文献1の場合、フォントの種類や人の書き癖によっては、判定閾値にばらつきが生じ、手書き文字の認識率が低下する。また、特許文献2によると、2種類の文字認識を行うため、処理に時間がかかる。さらに、特許文献3,4によると、フォントの種類によっては、活字/手書き文字の直線比率が大きく変動するため、手書き文字の認識率が低下する。
従って、本発明の目的は、活字と手書き文字が混在した文書における手書き文字の認識率を高めることが可能な文字認識装置、文字認識方法および文字認識プログラムを提供することにある。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書の入力画像に対し、1文字単位で文字の切り出しを行う文字切り出し部と、切り出された文字について1文字単位の特徴量を算出する特徴量算出部と、算出された前記1文字単位の特徴量を前記入力画像の所定の範囲に渡って集計する特徴量集計部と、前記特徴量集計部による集計結果に基づいて活字と手書き文字とを分離するための分離係数を算出する分離係数算出部と、算出された前記分離係数に基づいて前記入力画像に係る文字を前記活字と前記手書文字に分離する活字手書文字分離部とを備えたことを特徴とする文字認識装置を提供する。
1文字単位の特徴量を所定の範囲に渡って集計することにより、当該入力画像に係る文字を活字と手書き文字に分離するための分離係数を得ることができる。
上記特徴量算出部は、少なくとも文字の濃度の均一性および文字線分の直線性について特徴量を算出する構成としてもよい。文字の濃度の均一性および文字線分の直線性の特徴量は、活字と手書き文字で大きくことなることから、これらの特徴量を用いることで精度の高い分離係数を得ることができる。
また、上記特徴量算出部は、文字の大きさや高さ、幅の均一性、文字の濃度の均一性、濃度ヒストグラム、文字線分の直線性、文字線幅の均一性、および文字の傾きのうちの複数少なくとも1つについて前記特徴量を算出する構成としてもよい。多くの特徴量を用いることで精度の高い分離係数を得ることができる。
上記特徴量集計部は、入力画像全体について1文字単位の特徴量を集計してもよい。サンプル数を多くすることにより精度の高い分離係数を得ることができる。
上記活字手書文字分離部は、入力画像に係る文字を活字と手書き文字に分離した後、分離した各文字の周囲の分離結果を用いて活字/手書き文字の再判定を行うことが好ましい。この場合、その再判定を、文章の章または段落ごとに行ってもよい。
上記活字手書文字分離部は、入力画像または入力画像を2値化した画像に対して活字と手書き文字の分離を行ってもよい。
上記特徴量算出部は、1文字単位の複数種の特徴量を算出し、上記分離係数算出部は、分離係数として複数種の特徴量についてそれぞれ活字らしいあるいは手書き文字らしいという複数の中間的評価を含み、上記活字手書文字分離部は、複数の中間的評価に基づいて活字と手書き文字の分離を行うようにしてもよい。これにより、閾値によって明確に活字か手書き文字かを分離できない場合でも、分離が可能となる。例えば、複数種の特徴量の集計結果から手書き文字らしいという中間的評価が複数現れた場合は、手書き文字と決定することができる。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書の入力画像に対し、1文字単位で文字の切り出しを行い、切り出された文字について1文字単位の特徴量を算出し、算出された前記1文字単位の特徴量を前記入力画像の所定の範囲に渡って集計し、前記1文字単位の特徴量の集計結果に基づいて活字と手書き文字とを分離するための分離係数を算出し、算出された前記分離係数に基づいて前記入力画像に係る文字を前記活字と前記手書文字に分離することを特徴とする文字認識方法を提供する。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書の入力画像に対し、1文字単位で文字の切り出しを行う文字切り出し手段と、切り出された文字について1文字単位の特徴量を算出する特徴量算出手段と、算出された前記1文字単位の特徴量を前記入力画像の所定の範囲に渡って集計する特徴量集計手段と、前記特徴量集計手段による集計結果に基づいて活字と手書き文字とを分離するための分離係数を算出する分離係数算出手段と、算出された前記分離係数に基づいて前記入力画像に係る文字を前記活字と前記手書文字に分離する活字手書文字分離手段とをコンピュータに実行させるための文字認識プログラムを提供する。
本発明によれば、活字と手書き文字が混在した文書における手書き文字の認識率を向上させることができる。
(文字認識装置の構成)
図1は、本発明の実施の形態に係る文字認識装置を示す。原稿等の文書を読み取る画像入力部11と、画像入力部11による画像データを2値化する2値化部12と、2値化出力を連続する画素群の単位にまとめるラベリング部13と、ラベリング部13の結果に対して1文字を特定するラベル削除統合部14と、ラベル削除統合部14による結果から1文字単位で文字の切り出しを行う文字切り出し部15と、切り出した文字の特徴量を1文字単位で算出する特徴量算出部16と、特徴量を画像全体で集計する特徴量集計部17と、特徴量集計結果から活字/手書き文字の分離係数を算出する分離係数算出部18と、分離係数算出部18の算出結果に基づいて画像入力部11から入力された原稿画像または2値化以後の画像を活字部と手書き部に分離する活字手書文字分離部19と、分離された活字部に対してOCR処理を実行する活字認識部20と、分離された手書き部に対してOCR処理を実行する手書き認識部21と、活字認識部20の認識処理に用いられる活字辞書22と、手書き認識部21の認識処理に用いられる手書き辞書23と、活字認識部20の認識結果と手書き認識部21の認識結果を1つのファイルや、1枚の画像に合成する合成部24とを有する。
画像入力部11は、原稿が載置される透明のプラテンガラスからなる原稿台と、原稿台に載置された原稿から画像を光学的に読み取るCCD(Charge Coupled Device)等の固体撮像素子とを備える。
2値化部12は、画像入力部11から出力される画像データを、例えば、濃度に対して設定された閾値を用いて2値化する機能を有する。
ラベリング部13は、1文字単位の切り出しを容易にするため、2値化出力を連続する画素群単位にまとめて番号付けをするラベリングを行う機能を有する。
また、ラベル削除統合部14は、偏(へん)、つくり等を考慮し、どれとどれが1組の文字を形成しているかを判断する機能を有し、また、文字の切り出しが正確に行えるようにするため、文字から離れているブロックをゴミと見なして除去する処理を行う機能も有する。
特徴量算出部16は、次の要素について特徴量を算出する。
(1)切り出された文字の幅や高さによる大きさ。活字の場合、高さや幅はポイント数を変えない限り概ね一定であるのに対し、手書き文字はバラバラになることから、特徴量の1つになる。
(2)画素値のばらつき(ヒストグラム)。活字では概ね一定になるのに対し、手書き文字ではばらつきが生じるので、特徴量の1つになる。
(3)線分の直線性。手書き文字は、水平や垂直の線が書き癖により直線にならない場合が多いため、特徴量の1つになる。
(4)線幅。活字は、フォントが同じであれば線幅がほぼ一定であるのに対し、手書き文字は筆圧等によって様々になるため、特徴量の1つになる。
(5)文字の傾き。活字は、斜体文字等では傾きをもつが、傾きが一定であるのに対し、手書き文字は書いた人の癖により傾きが生じ易く、かつ傾きが様々になり易いため、これも特徴量の1つになる。
特徴量集計部17は、特徴量算出部16で取得した特徴量を画像全体で集計する機能を有する。なお、予めレイアウト解析を実施しておき、文章単位等の所定の単位で集計する構成であってもよい。
分離係数算出部18は、特徴量集計部17で集計した特徴量に対し、それが活字であるか手書き文字であるかを判定するための分離係数を算出する機能を有する。
(分離係数算出の原理)
図2は、分離係数算出部18における分離係数算出の原理を示す。ここでは、特徴量のうち、線幅について説明する。一般に、文書や本に用いられている活字の大きさは、10.5〜12ポイントの明朝体であり、線幅は比較的細い。これに対し、手書き文字は、字が大きくなりやすいとともに、通常用いるボールペンやシャープペンシルの太さは0.5ミリ以上であるため、活字と手書き文字の線幅は明瞭に異なる場合が多い。従って、画像全体について両者を集計すれば、図2(a)に示すように、2つのピークを持った特性になる。しかし、活字と手書き文字の線幅が近似していると、図2(b)に示すように、1つの緩やかな山を持ち、活字と手書き文字の区別がつかない特性になる。そこで、特徴量の評価には、図2(a)に示すような特性を有する特徴量を採用し、図2(b)に示すような特性を有する特徴量は採用しない。
また、図2(a)において、ピーク間の谷部分(グレーゾーン)の幅sを数値化し、活字側と手書き文字側の境界を活字らしいか手書き文字らしいかをファジィに判定することにより、特徴量では判定できないグレーゾーンにあるものを、活字か手書き文字かを決定することができる。このように、グレーゾーンを閾値によらず数値化していることから、ここでは分離係数と称している。なお、線幅以外の他の特徴量も、線幅と同様にして求めることができる。例えば、それぞれの特徴量の集計結果がそれぞれグレーゾーンに存在するが、いずれの特徴量も活字らいいという結果が得られれば、活字と決定することができる。
活字手書文字分離部19は、画像入力部11、ラベル削除統合部14、あるいは図示はしていないが2値化部12やラベリング部13のいずれかからの画像を、特徴量算出部16によって算出された特徴量および分離係数算出部18によって算出された分離係数に基づいて活字部と手書き部とに分離する機能を有する。
活字認識部20は、切り出された活字の文字パターンと活字辞書22に登録されている活字パターンとを、例えば、パターンマッチング法により比較し、類似度の最も高いものを活字の認識結果(文字コード)として出力するものである。
手書き認識部21は、切り出された手書き文字の文字パターンと手書き辞書23に登録されている手書き文字パターンとを、例えば、パターンマッチング法により比較し、類似度の最も高いものを活字の認識結果(文字コード)として出力するものである。
活字辞書22と手書き辞書23は、例えば、ハードディスク等の記憶媒体に格納した電子辞書を用いることができる。
合成部24は、活字認識部20の認識結果と、手書き認識部21の認識結果を、例えば1つのファイルや、1つの画像に合成する。
(文字認識装置の動作)
図3は、図1の各部における処理を模式的に示し、図4は原稿の部分拡大図、および分離して得られた活字画像と手書き画像を示す。図1〜図4を参照して、以下に文字認識装置1の動作を説明する。
画像入力部11によって活字による文書中に手書き文字が記入れた原稿が読み取られる。ここで、原稿の内容がカラー画像かグレー画像かに応じて、色変換処理が実施される。カラー画像の場合、R,G,Bをグレーに変換する処理を実施し、後工程での処理に時間がとられないようにする。R,G,Bをグレーに変換するに際しては、次のいずれかを採用する。
(a)上記グレーの値をカラー画像のGの値にする。
(b)グレーの値=0.30r+0.59g+0.11bにする。ここで、r,g,bはそれぞれカラー画像のR,G,Bの値である。
(c)グレーの値=α×r+β×g+γ×bにする。ここで、α,β,γは係数であり、このα,β,γは色判定に伴う判定色に応じて変化させる。
次に、2値化部12によって2値化が行われる。この2値化処理には、例えば、以下の方法を用いる。
(i)固定閾値2値化処理:所定閾値で2値化する。
(ii)動的閾値2値化処理:周囲画素平均値で2値化する。
次に、ラベリング部13によってラベリング処理を実施する。ここでは、2値化部12によって2値化された画像に対し、文字などの前景に相当する画素値をもつ連続画素群ごとにラベル付けをする。
次に、ラベル削除統合部14によって、ラベルの削除や統合がおこなわれる。ここでは、ノイズに相当するラベルの除去、複数ラベルに分割された同一文字のラベルの統合等が行われる。
次に、文字切り出し部15により、文字以外の領域、例えば、図/写真等を除外して、図3(a)のように、1文字単位で文字の切り出しを行う。ここでは、原稿画像30の中の活字31と手書き文字32が、ラベル33によってラベリングされている。
次に、特徴量算出部16によって、文字の大きさ(幅、高さ)、画素値のばらつき(ヒストグラム)、線分の直線性、線幅、および文字の傾きについて1文字単位で特徴量が算出される。
次に、特徴量集計部17は、レイアウト解析結果により判定された文章の章や段落ごとに、あるいは画像全体で、1文字単位の特徴量を画像全体で集計する。
次に、分離係数算出部18は、特徴量集計部17で集計した特徴量に基づいて、図2(a)に示したような特性を把握し、活字/手書文字分離係数を算出する。
活字手書文字分離部19は、活字/手書文字分離係数に基づいて、文字ごとに活字か手書き文字かを判定し、図3(b)のように、分離を行う。図3において斜線を施した文字が手書き文字と認識されたことを示す。また、図3(c)のように、元画像(ラベル画像)への展開を実施する。この結果に対しては、文字ごとに判定された結果に基づいて、文章単位、段落単位、あるいは文字の周囲の判定結果をもとに再判定を行い、図3(d)のような補正を実施する。
例えば、図3(c)の2行目の「、」の部分は、手書き文字と判定されているが、その前後は活字の判定であり、活字列の中に1文字だけ手書き文字があるのは不自然である。そこで、「、」を活字と再判定し、図3(d)のように補正する。同様に、図3(c)の3行目の「の」は、活字と判定されたが、その前後はすべて手書き文字と判定されており、活字が1文字だけ入るのは不自然である。そこで、「の」は活字ではなく、手書き文字であると再判定し、図3(d)のように補正する。なお、この補正は、レイアウト解析を行い、文章領域単位で補正を行ってもよい。この場合、文章領域内の文字の多数が活字判定であれば、手書き判定の文字を活字とし、同様に、文章領域内の文字の多数が手書き判定であれば、活字判定の文字を手書き文字とする。
次に、図3(d)のような補正が完了した画像に対して、活字認識部20と手書き認識部21により、活字辞書22および手書き辞書23を用い、活字および手書き文字のOCR処理を行い、それぞれの認識結果や認識画像を生成する。
例えば、図4(a)のような活字41と手書き文字42を含む原稿40が、画像入力部11から入力されたとすると、活字認識部20では図4(b)に示すような活字部52のみによる活字画像51が得られ、手書き認識部21では図4(c)に示すような手書き部54のみによる手書き画像53が得られる。なお、図4(c)では、手書き認識部21の認識・出力結果を、手書き部54のように手書き文字に近いフォントの活字で出力しているが、一般的な活字フォントを用いて出力してもよい。活字画像51と手書き画像53は、合成部24によって合成され、図4(a)の原稿40と同様のレイアウトによる認識画像が生成される。この認識画像をプリンタ等で出力すれば、手書き文字が活字化された文書が得られる。なお、活字認識部20および手書き認識部21での認識結果を文字情報(コード情報)として出力し、合成部24ではそれらを合成しても良い
(実施の形態の効果)
この実施の形態によれば、下記の効果を奏する。
(イ)1文字ごとに特徴量を算出し、この特徴量に基づいて活字/手書き文字の分離判定を行うようにしたため、文字認識率を高めることができる。
(ロ)異なる内容の複数の特徴量を用いているため、特徴量を確実に算出することができ、活字/手書き文字の分離判定を確実に行えるようにすることができる。
(ハ)特徴量を画像全体または所定範囲単位で集計し、これに基づいて分離係数を算出しているため、文字単位で活字/手書き文字分離が行えるため、手書き文字の文字認識率を高めることができる。
(ニ)活字手書文字分離部19では、文字切り出し部15による1文字単位の切り出した結果に対し、上下、左右等の文字周囲の判定結果を用い、あるいは文字が含む文章や段落ごとに活字/手書き文字の再判定をし、その結果に基づいて補正を行うことにより、活字と手書き文字の分離が高精度に行える結果、OCRの認識率を高めることができる。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、その要旨を変更しない範囲内で種々の変形が可能である。例えば、活字手書文字分離部19に入力する画像は、2値化部12の出力画像を含む構成にすることもできる。これにより、白黒画像に対する活字/手書文字の分離が可能になる。
本発明の実施の形態に係る文字認識装置を示すブロック図である。 図1の分離係数算出部における分離係数算出の原理を示し、(a)は活字と手書き文字の線幅が明瞭に異なるときの分離係数算出のための線幅−度数特性図、(b)は活字と手書き文字の線幅が不明瞭なときの線幅−度数特性図である。 図1の各部における処理を模式的に示し、(a)は原稿画像の一例を示す拡大図、(b)は活字/手書き文字分離後の原稿画像図、(c)は(b)の画像を元画像に展開した状態を示す画像図、(d)は(c)の画像に補正を施した後の画像図である。 活字手書文字分離部における処理過程を示し、(a)は画像入力部で読み取られる原稿の平面図、(b)は活字手書文字分離部で分離して得られた活字画像の画像図、(c)は活字手書文字分離部で分離して得られた手書き画像の画像図である。
符号の説明
1 文字認識装置
11 画像入力部
12 2値化部
13 ラベリング部
14 ラベル削除統合部
15 文字切り出し部
16 特徴量算出部
17 特徴量集計部
18 分離係数算出部
19 活字手書文字分離部
20 活字認識部
21 手書き認識部
22 活字辞書
23 手書き辞書
24 合成部
30 原稿画像
31 活字
32 手書き文字
33 ラベル
40 原稿
41 活字
42 手書き文字
51 活字画像
52 活字部
53 手書き画像
54 手書き部

Claims (10)

  1. 活字と手書き文字が混在した文書の入力画像に対し、1文字単位で文字の切り出しを行う文字切り出し部と、
    切り出された文字について1文字単位の特徴量を算出する特徴量算出部と、
    算出された前記1文字単位の特徴量を前記入力画像の所定の範囲に渡って集計する特徴量集計部と、
    前記特徴量集計部による集計結果に基づいて活字と手書き文字とを分離するための分離係数を算出する分離係数算出部と、
    算出された前記分離係数に基づいて前記入力画像に係る文字を前記活字と前記手書文字に分離する活字手書文字分離部とを備えたことを特徴とする文字認識装置。
  2. 前記特徴量算出部は、少なくとも文字の濃度の均一性および文字線分の直線性について前記特徴量を算出することを特徴とする請求項1に記載の文字認識装置。
  3. 前記特徴量算出部は、文字の大きさや高さ、幅の均一性、文字の濃度の均一性、濃度ヒストグラム、文字線分の直線性、文字線幅の均一性、および文字の傾きのうちの複数少なくとも1つについて前記特徴量を算出することを特徴とする請求項1に記載の文字認識装置。
  4. 前記特徴量集計部は、前記入力画像全体について前記1文字単位の特徴量を集計することを特徴とする請求項1に記載の文字認識装置。
  5. 前記活字手書文字分離部は、前記入力画像に係る文字を前記活字と前記手書き文字に分離した後、分離した各文字の周囲の分離結果を用いて活字/手書き文字の再判定を行うことを特徴とする請求項1に記載の文字認識装置。
  6. 前記活字手書文字分離部は、前記再判定を、文章の章または段落ごとに行うことを特徴とする請求項5に記載の文字認識装置。
  7. 前記活字手書文字分離部は、前記入力画像または前記入力画像を2値化した画像に対して活字と手書き文字の分離を行うことを特徴とする請求項1記載の文字認識装置。
  8. 前記特徴量算出部は、前記1文字単位の複数種の前記特徴量を算出し、
    前記分離係数算出部は、前記分離係数として前記複数種の特徴量についてそれぞれ活字らしいあるいは手書き文字らしいという複数の中間的評価を含み、
    前記活字手書文字分離部は、前記複数の中間的評価に基づいて活字と手書き文字の分離を行うことを特徴とする請求項1記載の文字認識装置。
  9. 活字と手書き文字が混在した文書の入力画像に対し、1文字単位で文字の切り出しを行い、
    切り出された文字について1文字単位の特徴量を算出し、
    算出された前記1文字単位の特徴量を前記入力画像の所定の範囲に渡って集計し、
    前記1文字単位の特徴量の集計結果に基づいて活字と手書き文字とを分離するための分離係数を算出し、
    算出された前記分離係数に基づいて前記入力画像に係る文字を前記活字と前記手書文字に分離することを特徴とする文字認識方法。
  10. 活字と手書き文字が混在した文書の入力画像に対し、1文字単位で文字の切り出しを行う文字切り出し手段と、
    切り出された文字について1文字単位の特徴量を算出する特徴量算出手段と、
    算出された前記1文字単位の特徴量を前記入力画像の所定の範囲に渡って集計する特徴量集計手段と、
    前記特徴量集計手段による集計結果に基づいて活字と手書き文字とを分離するための分離係数を算出する分離係数算出手段と、
    算出された前記分離係数に基づいて前記入力画像に係る文字を前記活字と前記手書文字に分離する活字手書文字分離手段とをコンピュータに実行させるための文字認識プログラム。
JP2004278132A 2004-09-24 2004-09-24 文字認識装置、文字認識方法および文字認識プログラム Withdrawn JP2006092345A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004278132A JP2006092345A (ja) 2004-09-24 2004-09-24 文字認識装置、文字認識方法および文字認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004278132A JP2006092345A (ja) 2004-09-24 2004-09-24 文字認識装置、文字認識方法および文字認識プログラム

Publications (1)

Publication Number Publication Date
JP2006092345A true JP2006092345A (ja) 2006-04-06

Family

ID=36233238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004278132A Withdrawn JP2006092345A (ja) 2004-09-24 2004-09-24 文字認識装置、文字認識方法および文字認識プログラム

Country Status (1)

Country Link
JP (1) JP2006092345A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218106A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 画像処理装置、画像処理方法及びプログラム
WO2011074067A1 (ja) 2009-12-15 2011-06-23 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
JP2012022359A (ja) * 2010-07-12 2012-02-02 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8189921B2 (en) 2008-03-31 2012-05-29 Fujitsu Frontech Limited Character recognition device
JP2022104498A (ja) * 2020-12-28 2022-07-08 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8189921B2 (en) 2008-03-31 2012-05-29 Fujitsu Frontech Limited Character recognition device
JP2010218106A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 画像処理装置、画像処理方法及びプログラム
WO2011074067A1 (ja) 2009-12-15 2011-06-23 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
US8588520B2 (en) 2009-12-15 2013-11-19 Fujitsu Frontech Limited Character recognition method, character recognition apparatus, and character recognition program
JP2012022359A (ja) * 2010-07-12 2012-02-02 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2022104498A (ja) * 2020-12-28 2022-07-08 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム

Similar Documents

Publication Publication Date Title
US7469063B2 (en) Apparatus, method and storage medium storing program for recognizing characters
US7054485B2 (en) Image processing method, apparatus and system
Shamilian et al. A retargetable table reader
US9542752B2 (en) Document image compression method and its application in document authentication
EP0544431B1 (en) Methods and apparatus for selecting semantically significant images in a document image without decoding image content
JP5379085B2 (ja) スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
US6351559B1 (en) User-enclosed region extraction from scanned document images
US20050271275A1 (en) Text character identification system and method thereof
US20120120453A1 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
Borovikov A survey of modern optical character recognition techniques
JPH07282253A (ja) 文書イメージのしきい値処理方法
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
StevensÝ et al. Automatic processing of document annotations
JP2006092345A (ja) 文字認識装置、文字認識方法および文字認識プログラム
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
Chakraborty et al. Marginal Noise Reduction in Historical Handwritten Documents--A Survey
Kumar et al. Line based robust script identification for indianlanguages
JP3142986B2 (ja) 文書情報検索装置
Aparna et al. A complete OCR system development of Tamil magazine documents
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
Dhandra et al. Morphological reconstruction for word level script identification
JP2011034454A (ja) 文字認識装置、文字認識方法、プログラム及び記録媒体
Kaur Classification of printed and handwritten Gurmukhi text using labeling and segmentation technique
Leishman Shape-free statistical information in optical character recognition
JPH08123904A (ja) 書体種類処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070816

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20100312