JPH03122773A - 画像形成装置 - Google Patents

画像形成装置

Info

Publication number
JPH03122773A
JPH03122773A JP1258899A JP25889989A JPH03122773A JP H03122773 A JPH03122773 A JP H03122773A JP 1258899 A JP1258899 A JP 1258899A JP 25889989 A JP25889989 A JP 25889989A JP H03122773 A JPH03122773 A JP H03122773A
Authority
JP
Japan
Prior art keywords
image
character
output
storage means
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1258899A
Other languages
English (en)
Other versions
JP2930612B2 (ja
Inventor
Junichi Ota
太田 準一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1258899A priority Critical patent/JP2930612B2/ja
Priority to US07/593,818 priority patent/US5111514A/en
Publication of JPH03122773A publication Critical patent/JPH03122773A/ja
Application granted granted Critical
Publication of JP2930612B2 publication Critical patent/JP2930612B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40093Modification of content of picture, e.g. retouching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、デジタル複写機、ファクシミリ、ワードプロ
セッサなどの画像形成装置に係り、特に文字情報の切り
出し1文字認識1図形認識に特徴のある画像形成装置に
関する。
〔従来の技術〕
従来のデジタル複写機には画像を認識する機能が無かっ
たので、手書きを含む罫線等の線画と文章が書かれた原
稿から、手書きの線を奇麗に(直線は直線らしく、円は
円らしく)書き直したいと言った場合、手書きの下書き
原稿を基に定規を使って原稿を書き直さなければならな
かった。
また、ワードプロセッサで、キーボードから再入力して
、あるいは漢字のOCR(光学的文字認識)装置を用い
て、原稿を作成し直す方法が知られている。
〔発明が解決しようとする課題〕
上記従来技術においては、原稿作成に要する時間がかか
り、また奇麗な原稿が作成できなかった。
また、キーボードで再入力する方法は時間と労力がかか
り、また漢字OCRは現状では未だ認識率が余り良くな
いので訂正処理が厄介となるという問題があった。
本発明の目的は、手書き原稿を自動的に修正して出力す
ることができる画像形成装置を提供することにある。
〔課題を解決するための手段〕
上記目的は、原稿を光学的に読み取り、それを光電変換
して2値の画像データを得る原稿読み取り手段と、原稿
読み取り手段により得られた2値の画像データを保持す
る第一の記憶手段と、第一の記憶手段中の文字画像を1
文字ずつ切り出し、文字画像の大きさ2分布から文字列
を抽出する文字列抽出手段と、文字列抽出手段で抽出し
た文字情報から、文字の大きさや間隔が揃い、また文字
列が水平または垂直方向の近い方に整列するように、文
字画像を拡大、縮小、移動する文字整列手段と、出力画
像を保持する第二の記憶手段と、第二の記憶手段に書き
込まれた出力画像を転写紙に像形成して出力する出力手
段とを備えることにより達成される。
〔作用〕
手書きの文章原稿中の手書き文字を整列したり、大きさ
を揃えたりすることにより、見栄えのよい原稿に変換し
てから出力する。
〔実施例〕
以下、本発明の実施例を図面を参照して説明する。
第1図は本発明による画像形成装置の一実施例の第1の
実施例の制御ブロック図であって、■は原稿読み取り手
段、2は第一の記憶手段、3は輪郭追跡手段、4は文字
/図形判別手段、5は文字列抽出手段、6は文字整列手
段、7はベクトル化手段、8はベクトル修正手段、9は
画像合成手段、10は第二の記憶手段、11は出力手段
である。
第2図は文字/図形混在原稿の説明図であって、このよ
うな原稿を図示しないデジタル複写機の原稿設置台にセ
ットしてコピー開始ボタンを押すと、原稿読み取り手段
1は原稿を光学的に読み取り、2値のデジタルデータに
変換した後、第一の記憶手段2中に入力画像データとし
て格納する。次に輪郭線追跡手段3により、第一の記憶
手段2中の入力画像データ中の連結している黒画素集合
の輪郭を追跡し、その輪郭の主走査方向、副走査方向の
最小値と長さを求める。これが黒画素集合を囲む最小の
長方形となる。その次に文字/図形判別手段4により、
その長方形の大きさから入力画像データ中の黒画素集合
が文字画像なのか、あるいは図形画像なのかを判定する
。文字画像の場合は、文字列抽出手段5により、その最
小の長方形の分布から文字列を推定し、平均文字幅、高
さ9間隔を算出した後、文字整列手段6により、文字幅
高さ1間隔が均一になるように、各文字画像の拡大・縮
小率、移動量を計算する。
また、図形の場合はベクトル化手段7により、その線画
像とベクトルで近似した後、ベクトル修正手段8により
、ベクトルの方向と予め設定された整列方向(例えば水
平・垂直方向)との角度誤差の小さい方向に修正する。
画像合成手段9は、ベクトル修正手段8で修正したベク
トルデータを第二の記憶手段10中に作画すると共に、
文字整列手段6で算出した各文字画像の拡大・縮小率、
移動量を基に、文字画像データを第二の記憶手段10中
に書き込む。最後に出力手段11は、第二の記憶手段1
0中の出力画像データを読み出して転写紙に作像し、排
出する。
第3図は、画像処理結果の説明図であって、以上の処理
により、この図に示すような出力結果が得られる。
なお、第2図、第3図中の長方形枠は、文字画像の大き
さ1位置が分かり易いように付加したものである。
ここで、現在メモリ装置がコスト高であるため、第一の
記憶手段2と第二の記憶手段10とを同一のメモリ装置
により構成することも可能である。
また本発明の機能を実行するに当たり、予め実行領域を
タブレットやマーカ等で指定することにより、原稿中の
一部だけを処理することも可能となる。あるいは文字/
図形判別手段で判別した文字画像を整列処理し、図形画
像はそのまま合成して出力するとか、文字画像だけを出
力するとかといったモードも設定可能である。
次に、第1図に示す各手段における動作を個別に説明す
る。
(1)輪郭線追跡方法 まず、入力画像をラスク走査し、追跡を開始する黒画素
を捜す。次にその追跡開始画素から外側の輪郭線の場合
には反時計回りに、内側の輪郭線の場合には時計回りに
輪郭画素を追跡し、再び追跡開始画素に戻ったら、1つ
の黒画素集合の輪郭線追跡が終了したことになる。
以上の処理を、まだ追跡が終了していない輪郭画素が無
くなるまで繰り返す。
第4図、第5図は輪郭線追跡方法の説明図であって、第
4図は1つの黒画素集合の輪郭線を追跡した例で、輪郭
線の方向としては第5図に示すような0〜7の方向とし
たものである。
まず、第4図のようにラスク走査30し、追跡開始画素
を捜す。追跡開始画素が(i+1.j)の位置に見つか
り、ラスク走査時の1つ前の画素が白画素なので外側輪
郭線と判断して、この位置より反時計回りに追跡を開始
する。次に、第5図中耕号4の方向から反時計回りに近
傍画素を調べ、最初に見つかった黒画素の方向を輪郭線
の方向とする。その次に、追跡中心画素をその黒画素に
移動し、(前回の輪郭線の方向−2)の方向から反時計
回りに近傍画素を調べ、これを追跡開始画素にたどり着
くまで繰り返す。この結果、第4図の矢印群31で示す
ような輪郭線の追跡が行えた。
第6図は輪郭データの説明図で、上記追跡結果のうち、
外側の輪郭線追跡の場合だけを輪郭データとして記憶手
段に格納する。輪郭データは第6図に示すように、輪郭
座標の最小値と最大値をとって、開始位置く最小値)と
長さく最大値−最小値)で構成されている。第6図の1
行目に示したものは第4図に示す輪郭線追跡結果である
(2)文字/図形判定方法 輪郭線追跡の結果として得られた輪郭データのうち、X
方向(主走査方向)、Y方向(副走査方向)の大きさ(
第6図参照)により、その輪郭線の内側の画像がノイズ
なのか、文字なのか、或いは図形なのかを判定する。
第7図は文字/図形判定方法の処理フローチャートであ
って、予めノイズ画像の大きさの上限、文字画像の大き
さの上限を決めておき、それぞれLl、L2とすると、
同図のフローに示すように、長さX、Yが共にLlより
小さい場合(7−1でYES)をノイズ画像、長さX、
Yが共にLlより太きく  (7−1でNo)、L2よ
り小さい場合(7−2でYES)を文字画像、それ以外
(7−2でNo)を図形画像と判定する。
第8図は輪郭データの内容の説明図であって、画像判定
データはこの判定結果をコード化して、同図のデータエ
リアに示すように第6図の輪郭データの順番に登録する
ここで、上記のLL、L2は変倍率に応じて変化させな
いと、変倍読み取り時の正確な画像判定ができないので
、 L1’=LIXR L2’=L2XR(Rは変倍率) という計算を行い、判定時にLl、L2の代わりにLl
’、L2’を用いる。
(3)文字列抽出方法 第9図、第10図は文字列抽出方法の説明図であって、
文字列の推定方法としては、例えば第9図に示すように
、ある文字画像の外枠矩形の中心を原点とし、その原点
とその近傍の文字画像の外枠矩形中心との距離を求め、
その距離の短い方向を文字列の方向と仮定し、原点を移
動する(第9図■)。
次に、この原点とその近傍の文字画像の外枠矩形中心と
の距離を求め、その距離の短い方向に原点を移動する(
第9図■)。
以上の処理を文字の中心間の距離の差が予め設定したし
きい値より大きくなった場合、または文字列の方向が変
化した場合に文字列の終わりと判断する。その結果、第
10図の例のように文字列を抽出できる。さらに1つの
文字列中の文字の高さ3幅2間隔の平均値を求め、文字
列中の文字配列が整うように、各文字画像の縦倍率、横
倍率。
移動量を算出する。このとき、文字幅が狭い文字(例え
ば数字の1)や、文字高さが低い文字(例えば記号の−
)、縦横共に小さい文字(例えばカナの小文字)は平均
値の算出に含めない。
(4)文字整列方法 第11図は文字整列結果の説明図であって、上記のよう
に文字列抽出手段5で算出した各文字画像の縦、横の変
倍率、移動量を基に、各文字画像を整列する。
第10図に示すような文字列を整列し直した結果を第1
1図に示す。このように、手書きの文字原稿でも文字の
大きさや間隔を揃えることにより、見栄えのよい原稿に
変換することができる。
(5)ベクトル化方法 第12図はベクトル化方法の説明図であって、2値の線
図形画像のベクトル化の方法としては、例えば電子通信
学会論文誌1985年4月Vol。
J68−D  No、4 (P、845〜852)や、
特開昭62−286177号公報に記載されているよう
な、線図形画像の両側の輪郭線を追跡しつつその中心線
を求め、これを折れ線ベクトルとして近似表現する方法
がある。第12図の(alから(blへの変換がベクト
ル化の例である。
(6)ベクトル修正方法 第12図の(blから(C)への変換例に示すように、
角度の差または距離の差が小さいベクトルを1つのベク
トルに統合することにより、手書きによる線の振れを吸
収して直線に変換することができる。
(7)文字整列時のエラー処理 第13図は文字整列時の説明図であって、同図(a)に
示すように、整列処理により配置し直した文字画像が図
形画像に重なった場合は、同図(blに示すように、文
字間隔を小さくして並び変えるか、あるいは同図(C1
に示すように、重なった文字を次の行の先頭に移動し、
次の行を1文字ずつ右にずらすことにより対処できる。
文字画像が印字領域外に移動された場合も同じ処理で対
処可能である。
(8)画像圧縮 現段階ではメモリ装置がコスト高であるため、少ないメ
モリで本発明の機能を実現することが望ましい。
そこで、まず、その1番目の方法としては、原稿読み取
りの際、縮小して入力し、処理後、拡大して出力する方
法がある。この方法だと入力から出力までの間の処理に
おける演算回数も減るので、処理時間も短くなるが、文
字画像の品質が劣化するという問題がある。
また、2番目の方法として、原稿を読み取った後、入力
画像データを圧縮し、処理後に復元してから出力する方
法がある。圧縮、復元の方法としては、ファクシミリ等
で使用されているMH法などでも可能であるが、黒画素
の情報のみが必要ということから、黒画素のラン・レン
グスを用いて圧縮、復元する例を説明する。
第14図は黒画素のデータ構造の説明図であって、副走
査方向(Y方向)位置、主走査方向(X方向)開始位置
、走査方向終了位置のデータからなり、ラスク走査順に
データが登録されている。
入力画像が圧縮されたデータ構造となっているため、上
記の輪郭線追跡方法は使用できず、以下のような方法と
なる。
第15図は圧縮画像の輪郭線追跡の説明図であって、 ■、圧縮された画像データを副走査方向に順に調べて、
まだ追跡していない黒画素開始点を捜す。
■、その開始点からYの正方向く副走査のライン数が増
加する方向)に、まだ追跡していない黒画素開始点を捜
す。
■、■で同じ副走査列の前の黒画素列の黒画素終了点の
方が、次の副走査列の黒画素開始点より近(にある場合
は、同じ副走査列の前の黒画素列の黒画素終了点に進み
、今度はその点からYの負方向に黒画素終了点を捜す。
■、まだ追跡していない黒画素開始点が見つからなかっ
た場合は、その黒画素列の黒画素終了点に進み、そこか
ら今度はYの負方向に黒画素終了点を捜す。
■、■又は■で同じ副走査列の次の黒画素列の黒画素開
始点の方が、次の副走査列の黒画素終了点より近くにあ
る場合は、同じ副走査列の次の黒画素列の黒画素開始点
に進み、今度はその点からYの正方向に黒画素開始点を
捜す。
■、上記■〜■を繰り返し、■の追跡開始点に戻ったら
、1つの輪郭ループの追跡が終了したことになる。再び
■に戻って次の追跡開始点を捜す。
■、上記■〜■を繰り返し、まだ追跡していない再画素
開始点がなくなったら、処理を終了する。
この方法は前記の輪郭線追跡方法に比べ、黒画素の開始
点と終了点のみを調べるので処理時間が速く、また第1
4図に示すデータ構造に黒画素のランの識別フラグを設
け、1つの輪郭ループの追跡毎に画像判定を行って判定
結果の識別コードを上記識別フラグに記入することによ
り、出力画像用のメモリが不要になると共に、隣接画像
の分離が正確にできる。
また、文字画像の移動、変倍は、まず1つの文字画検分
のラン・レングスデータを抽出した後、移動i1 (x
m、ym) 、変倍率(x r、  y r)、文字画
像の外接矩形枠の左上位置(x c s、  y cs
)、枠の大きさ(zCl、yciり、黒ランの開始位置
(xs、ys) 、長さ(xA)とすると、移動・変倍
後の黒ランの開始位置(xs’、ys′)、長さ(xA
’)は、 xs’= (xs−xcs)Xxr+ (xcs+xm
) ys’= (ys−ycs)Xxr+ (ycs十ym
) x#’=x i! Xxr の式より求めることができる。
第16図は画像形成装置の制御概念図、第17図は手書
き原稿の説明図であって、第17図に示すような原稿(
第16図の符号20)をデジタル複写機の原稿設置台に
セットし、本発明の機能のモードと直線を整列する方向
(例えば水平、垂直の4方向)の選択を行った後、コピ
ー開始ボタンを押すと、原稿読み取り手段1は原稿を光
学的に読み取り、2値のデジタルデータに変換した後、
第一の記憶手段2中に入力画像データ2aとして格納す
る。次に輪郭線追跡手段3により、第一の記憶手段2中
の入力画像データ2aを読み出して、連結している黒画
素集合の輪郭を追跡し、その輪郭の主走査方向、副走査
方向の最小値と長さを求め、それを輪郭データ2bとし
て第一の記憶手段2に格納する。入力画像データ2a全
部について輪郭線追跡が終了したら、画像判定手段12
により輪郭データ2bを読み出して、輪郭の大きさによ
り入力画像データ2a中の黒画素集合がノイズ画像なの
か、文字画像なのか、あるいは図形画像なのかを判定し
、その判定結果を画像判定データ2cとして第一の記憶
手段2に格納する。その次にベクトル化手段7により画
像判定データ2cを読み出して図形画像を抽出し、それ
をベクトル化して、その結果をベクトルデータ2dとし
て格納する。その後、図形認識手段13はベクトルデー
タ2dを読み出して、直線1円等の図形要素として認識
し、かつ図形要素間の接続関係をも認識して、それらの
認識結果を図形要素データ2eとして格納する。
図形修正手段14は、コピー開始時に設定された直線の
整列方向の情報を基に、図形要素データ2eを読み出し
て、直線要素の方向が設定された整列方向との角度誤差
の小さい方向に、図形要素間の接続関係を保持したまま
修正し、その修正後の図形要素データ2fを第一の記憶
手段2に格納する。
作画手段15は、修正後の図形要素データ2fと、画像
判定手段12により文字と判定された画像を第二の記憶
手段10中に出力画像データ10aとして格納する。最
後に出力手段11は第二の記憶手段10中の出力画像デ
ータ10aを読み出して転写紙2工に作像し、排出する
第18図は画像処理結果の説明図であって、以上により
第18図に示すような出力結果が得られる。
第19図は部分的な画像処理の説明図であって、本発明
の機能を実行するに当たり、予め実行領域を指定するこ
とにより、第19図に示すような部分的な処理も可能に
なる。この方法だと全体を処理する場合に比べ、処理速
度は速くなる。
第20図は直線の整列方向指定の画像処理の説明図であ
って、第20図(a)に示すように、直線の整列方向を
任意に指定すると、同図(b)に示すような入力原稿か
ら、同図(C)に示すような出力結果が得られる。
第21図は手書き原稿の説明図、第22図は画像処理の
途中結果の説明図、第23図は画像処理結果の説明図、
第24図は部分的な画像処理の説明図であって、この原
稿の場合、前述と同様にして、図形要素データ2eを読
み出して、直線要素の方向が設定された整列方向との角
度誤差の小さい方向に、図形要素間の接続関係を保持し
たまま修正した後(この処理による途中結果が第22図
に示されている)、それらの修正後の図形要素データの
うち、ある図形要素の端点が他の要素とある定められた
しきい値内で1接近している場合、端点をその図形要素
まで延長して修正し、その修正後のデータを第一の記憶
手段2に格納する。
作画手段15は、修正後の図形要素データ2fと、画像
判定手段12により文字と判定された画像を第二の記憶
手段10中に出力画像データ10aとして格納する。最
後に出力手段11は第二の記憶手段10中の出力画像デ
ータ10aを読み出して転写紙21に作像し、排出する
以上により第23図に示すような出力結果が得られる。
また、本発明の機能を実行するに当たり、予め実行領域
を指定することより、第24図に示すような部分的な処
理も可能になる。
第24図のように、−点鎖線等の実線以外の線種では、
本発明による処理を実行すると実線に変換されてしまう
。しかもこのような部分的な処理の場合は、全体を処理
する場合に比べ処理速度は速くなる。
第25図は手書き原稿の説明図、第26図は画像処理の
途中結果の説明図、第27図は画像処理結果の説明図、
第28図は部分的な画像処理の説明図であって、前述と
同様にして図形要素データ2eを読み出して、直線要素
の方向が設定された整列方向との角度誤差の小さい方向
に、図形要素間の接続関係を保持したまま修正した後(
この処理による途中結果が第26図に示されている)、
それらの修正後の図形要素データのうち、3つ以上の直
線要素がほぼ平行で、それらの間隔がある定められたし
きい値内であれば、それらの間隔の平均値で等間隔とな
るように、図形要素の接続関係を保持したまま直線要素
を修正し、その修正後のデータを第一の記憶手段2に格
納する。
作画手段15は、修正後の図形要素データ2fと、画像
判定手段12により文字と判定された画像を第二の記憶
手段10中に出力画像データ10aとして格納する。最
後に出力手段1.1は第二の記憶手段10中の出力画像
データ10aを読み出して転写紙21に作像し、排出す
る。
以上により第27図に示すような出力結果が得られる。
平行線の等間隔処理についてさらに詳しく説明する。第
26図に示すように、直線要素を整列した後、直線L 
Il” L r sがほぼ平行で、その間隔Y。
〜Y7がほぼ等しく、またLz + ” L z 2が
ほぼ平行で、その間隔XIとXlがほぼ等しい場合、Y
1〜Y7がそれらの平均値と等しくなるように直線り、
□〜Lll+を平行移動させ、またXlとXlがそれら
の平均値と等しくなるように、直線L z□とL23を
平行移動させる。
その結果、第27図に示すようにL+2〜L’sがり、
2′〜LI8′に修正されてその間隔Y+  ’〜Y7
は全て等しくなり、L2□〜LZ3がL2□′〜L21
に修正されて、その間隔XI  ’とXl  ’は等し
くなる。
また、本発明の機能を実行するに当たり、予め実行領域
を指定することより、第28図に示すような部分的な処
理も可能になる。
第29図は本発明による画像形成装置の第2の実施例の
制御ブロック図、第30図は手書き原稿の説明図、第3
1図は画像処理結果の説明図であって、第29図におい
て、30は文字列方向変換手段である。
本実施例も前述と同様にして、原稿を図示しないデジタ
ル複写機の原稿設置台にセットしてコピー開始ボタンを
押すと、原稿読み取り手段1は原稿を光学的に読み取り
、2値のデジタルデータに変換した後、第一の記憶手段
2中に入力画像データとして格納する。次に輪郭線追跡
手段3により、第一の記憶手段2中の入力画像データ中
の連結している黒画素集合の輪郭を追跡し、その輪郭の
主走査方向、副走査方向の最小値と長さを求める。
これが黒画素集合を囲む最小の長方形となる。その次に
文字/図形判別手段4により、その長方形の大きさから
入力画像データ中の黒画素集合が文字画像なのか、ある
いは図形画像なのかを判定する。文字画像の場合は、文
字列抽出手段5により、その最小の長方形の分布から文
字列を推定した後、文字列方向変換手段30により、文
字列方向が縦の場合には横、横の場合には縦になるよう
に、各文字画像の回転角度と移動量を決める。
また、図形の場合はベクトル化手段7により、その線画
像とベクトルで近似した後、ベクトル修正手段8により
、ベクトルの方向と予め設定された整列方向(例えば水
平・垂直方向)との角度誤差の小さい方向に修正する。
画像合成手段9は、ベクトル修正手段8で修正したベク
トルデータを第二の記憶手段10中に作画すると共に、
文字列方向変換手段30で決定した各文字画像の回転角
度と移動量を基に、文字画像データを第二の記憶手段I
O中に書き込む。最後に出力手段11は、第二の記憶手
段10中の出力画像データを読み出して転写紙に作像し
、排出する。
以上の処理により、第31図に示すような出力結果が得
られる。
各手段における制御方法は前述の通りであるが、以下に
ついて述べておく。
(1)文字列抽出方法 第32図は文字列抽出方法の説明図であって、文字列の
推定方法としては、例えばこの図に示すように、ある文
字画像の外枠矩形の中心を原点とし、その原点とその近
傍の文字画像の外枠矩形中心との距離を求め、その距離
の短い方向を文字列の方向と仮定し、原点を移動する(
第32図■)。
次に、この原点とその近傍の文字画像の外枠矩形中心と
の距離を求め、その距離の短い方向に原点を移動する(
第32図■)。
以上の処理を文字の中心間の距離の差が予め設定したし
きい値より大きくなった場合、または文字列の方向が変
化した場合に文字列の終わりと判断する。
第33図、第34図は文字列抽出結果の説明図であって
、第33図の例のように、文字列を抽出できる。さらに
1つの文字列中の各文字の高さ。
幅1間隔の平均値を求め、文字列方向変換のだめの各文
字画像の回転方向、移動量を算出する。このとき小さい
文字(例えばカナの小文字)は第33図の1011から
第34図の1111への変換の例のように、回転後の移
動量が他と異なり、この例のように、横書きから縦書き
への変換の場合は、下揃えから上揃えとなる。句読点の
場合も同様に、上揃えとなる(第33図の1107から
第34図の1107、第33図の1013から第34図
の1113への変換)。
また、記号のカッコ(第33図の1014.1018)
は回転処理を行わないので、横書きで幅の狭い文字また
は縦書きで高さの低い文字については、その文字がカッ
コかどうかを認識する手段が必要になる。簡単なシステ
ム構成にするには、この処理をオペレータに委ね、オペ
レータが回転処理しない部分を領域指定するといった方
法も可能である。
(2)文字列方向変換方法 上記のように文字列抽出手段5で算出した各文字画像の
回転角度、移動量を基に、各文字画像を再配置する。第
33図に示すような文字列を再配置した結果を第34図
に示す。このように、文章原稿中の各文字画像を回転、
移動することにより、文字列方向を変換することができ
る。
(3)画像圧縮 第35図は文字画像の回転処理の説明図であって、画像
圧縮については前述した通りであるが、文字画像の回転
処理は、例えば35図のように、まず1つの文字画検分
のラン・レングスデータを抽出し、それを副走査方向の
ラン・レングスデータに変換することにより行える。文
字画像の移動処理は、回転処理後の文字画像のラン・レ
ングスデータのY方向位置、X方向開始位置、X方向終
了位置に移動量を加算すればよい。
(4)その他 この方法によれば、例えば新聞のように縦書きの段組み
のある原稿中のある記事を領域指定して入力すると、そ
の原稿から文字列を切り出し、再配置することにより、
横書きの段組み無しの原稿を作成することも可能である
第36図は本発明による画像形成装置の第3の実施例の
制御ブロック図、第37図は被合成原稿の説明図、第3
8図は合成原稿の説明図、第39図は画像処理結果の説
明図であって、第36図において、40は領域抽出手段
、41は文字切り出し手段、42は文字配置手段である
被合成原稿に合成原稿を重ね合わせる処理について以下
説明する。
このような原稿を図示しないデジタル複写機の原稿設置
台にセットしてコピー開始ボタンを押すと、原稿読み取
り手段1は原稿を光学的に読み取り、2値のデジタルデ
ータに変換した後、第一の記憶手段2中に入力画像デー
タとして格納する。
原稿の読み取りは2枚−度に行っても、2回の読み取り
に分けてもよい。
被合成原稿の場合は、文字切り出し手段4Iにより、第
一の記憶手段2中の被合成原稿画像データ中の連結して
いる黒画素集合の輪郭を追跡し、その輪郭の主走査方向
、副走査方向の最小値と長さを求める。これが黒画素集
合を囲む最小の長方形となる。漢字等のように1文字が
複数の黒画素集合で構成される場合は、近傍にある黒画
素集合を1つの文字画像とみなす。
次に、文字列抽出手段5により、その各文字画像の分布
から文字列方向(縦書きか横書きか)を推定し、平均文
字幅、高さ2間隔を算出する。
合成原稿の場合は、領域抽出手段40により、第一の記
憶手段2中の合成原稿画像データ中の連結している黒画
素集合の輪郭を追跡し、その輪郭の主走査方向、副走査
方向の最小値と長さを求めた後、これらの黒画素集合を
囲む最小の長方形を含む最小の長方形を算出する。これ
が合成画像領域となる。
次に、文字配置手段42は、前記の文字列情報、合成画
像領域情報から、合成画像領域内にある文字画像を抽出
し、その文字画像が合成画像領域外に位置するように各
文字画像を配置し直すための移動量を算出する。
画像合成手段9は、文字配置手段42で算出した各文字
画像の移動量も基に、文字画像データを第二の記憶手段
10中に書き込むと共に、領域抽出手段40で算出した
合成画像領域内にある合成画像を第二の記憶手段10中
に書き込む。最後に出力手段11は第二の記憶手段10
中の出力画像データを読み出して転写紙に作像し、排出
する。
以上により、第39図に示すような出力結果が得られる
ここで、現在メモリ装置がコスト高であるため、第一の
記憶手段2と第二の記憶手段10とを同一のメモリ装置
により構成し、被合成原稿画像中の合成画像領域内の各
文字画像を移動した後、合成原稿画像から合成領域内に
ある画像を切り出して、被合成原稿画像中にコピーする
ようにすることも可能である。
また、前記の説明では合成画像領域を合成原稿中より自
動的に抽出したが、予め合成領域をタブレットやマーカ
等で指定することにより、より正確に速く処理すること
も可能となる。
あるいは、被合成原稿と合成原稿の両方に合成領域を指
定することより、任意領域から任意領域へ、しかも丁度
はめ込むように合成処理を行うことも可能となる。
この場合、被合成原稿画像中の合成画像領域が予め分か
つているので、被合成原稿画像を入力した後、文字配置
処理までを行い、合成原稿画像を読み取り後、直ぐに被
原稿画像中の合成画像領域に入れることにより、記憶手
段の容量を1ペ一ジ分にすることが可能になる。
前記の説明では合成画像として2値画像を例に挙げたが
、領域指定手段を用いることにより多値画像の合成処理
も容易に可能となる。
次に、前述した以外の各手段による作用を説明する。
(1)文字切り出し法 第40図、第41図は文字切り出し方法の説明図であっ
て、輪郭追跡処理で抽出した輪郭データは、例えば第4
0図のように、漢字等では1文字中に複数存在する。こ
の複数の輪郭データから1つの文字画像を抽出するには
、まず、ある輪郭データの近傍に他の輪郭データがある
かどうかを調べ、それらの距離が予め設定されたしきい
値より短い場合、1つに統合していく。この処理を順次
繰り返すことにより、第41図に示すように、文字画像
を切り出すことができる。
(2)文字列抽出方法 第42図、第43図は文字列抽出方法の説明図であって
、文字列の推定方法としては、例えば第42図に示すよ
うに、ある文字画像の外枠矩形の中心を原点とし、その
原点とその近傍の文字画像の外枠矩形中心との距離を求
め、その距離の短い方向を文字列の方向と仮定し、原点
を移動する(第42図■)。
次に、この原点とその近傍の文字画像の外゛枠矩形中心
との距離を求め、その距離の短い方向に原点を移動する
(第42図■)。
以上の処理を文字の中心間の距離の差が予め設定したし
きい値より大きくなった場合、または文字列の方向が変
化した場合に、文字列の終わりと判断する。
その結果、第42図の例のように文字列を抽出できる。
さらに1つの文字列中の文字の高さ1幅。
間隔の平均値を求めると共に、文字列の間隔(行間隔)
の平均値をも算出し、再配置処理における文字画像の移
動量の計算に用いる。
(3)文字配置方法 第44図は文字配置方法の説明図であって、上記のよう
に、文字列抽出手段5で算出した各文字画像の平均高さ
2幅1間隔2文字列の間隔を用いて、合成領域内にある
各文字画像を再配置する際の移動量を算出する。
文字配置の方法は、第44図の例に示すように、合成領
域内にある文字画像(第44図の1103〜1105.
1108〜l 110)を、その順番(1101〜11
10)が変わらないように移動する(第44図の左側か
ら右側への変換処理)。
このように文章原稿中の文章が丁度合成画像を避けるよ
うに配置することにより、合成領域部分の文字が消され
たりすることがなく、2つの原稿を合成することができ
る。
(4)合成領域抽出方法 第45図は合成領域抽出方法の説明図であって、合成原
稿中の合成画像領域を自動的に抽出する方法としては、
例えば第45図に示すように、まず原稿中の黒画素集合
の輪郭を追跡して、黒画素集合を囲む最小の長方形(第
45図左側の点線で記された部分)を得る。。
次に、これらの長方形を全て包含する最小の長方形を算
出して、これを合成領域とする(第45図の右側)。ま
た他の方法として、合成原稿画像中の黒画素のヒストグ
ラムを水平、垂直方向に算出し、黒画素の個数が予め設
定されたしきい値より大きい部分を全て包括するような
最小の長方形を求めることによっても可能である。
合成原稿画像が多値画像の場合は、予め背景濃度と画像
濃度とのしきい値濃度を設定しておき、そのしきい値濃
度より濃い部分を黒画素、低い部分を白画素として、前
記の何れかの方法により合成画像領域を抽出することが
できる。
(5)文字配置時の文字あふれ処理 第46図は文字あふれ処理の説明図であって、文字配置
処理において、配置処理後に文字画像がページからはみ
出した場合(第46図左側)、そのはみ出した文字画像
を次のページの先頭に配置する(第46図の右側)。配
置する位置は、1ページ目の文字列開始位置に揃える。
第47図は本発明による画像形成装置の第4の実施例の
制御ブロック図、第48図は原稿の説明図、第49図、
第50図は画像処理結果の説明図であって、第47図に
おいて、50は領域切り出し手段である。
以下、制御動作を説明する。
第48図に示すような原稿を図示しないデジタル複写機
の原稿設置台にセットしてコピー開始ボタンを押すと、
原稿読み取り手段1は原稿を光学的に読み取り、2値の
デジタルデータに変換した後、第一の記憶手段2中に入
力画像データとして格納する。
次に、領域切り出し手段50は、第一の記憶手段2中の
原稿画像データ中の連結している黒画素集合の輪郭を追
跡し、その輪郭の主走査方向、副走査方向の最小値と長
さを求める。これが黒画素集合を囲む最小の長方形とな
る。その次にこの長方形の大きさからその黒画素集合が
文字または文字の一部なのか、図形の一部なのかを判定
し、図形の場合はその図形領域を抜き出して第二の記憶
手段10中に書き込み、出力手段11により転写紙に作
像し、排出することにより第50図に示すような出力結
果が得られる。
第一の記憶手段2中に残った文字画像については、まず
文字切り出し手段41により黒画素集合を囲む最小の長
方形情報から各文字画像を切り出す。漢字等のように1
文字が複数の黒画素集合で構成される場合は、近傍にあ
る黒画素集合を1つの文字画像とみなす。
次に、文字列抽出手段5により、その各文字画像の分布
から文字列方面(縦書きか横書きか)を推定し、平均文
字幅、高さ2間隔を算出する。
文字配置手段42は、前記の文字列情報から領域切り出
し手段50で抜き取った領域内に文字列を延長するよう
に、各文字画像を配置し直すための移動量を算出した後
、その文字画像データを第二の記憶手段10中に書き込
む。最後に出力手段11は第二の記憶手段10中の出力
画像データを読み出して転写紙に作像し、排出する。
以上により、第49図に示すような出力結果が得られる
ここで、現在メモリ装置がコスト高であるため、第一の
記憶手段2と第二の記憶手段10とを同一のメモリ装置
により構成し、まず原稿画像中の抜き取り画像を第一の
記憶手段2から読み出して出力後、第一の記憶手段2中
の抜き取り領域内の画像を消去した後、文字画像切り出
し処理から文字配置処理までを第一の記憶手段中で行っ
た後、出力するようにすることも可能である。
また、前記の説明では合成画像領域を合成原稿中より自
動的に抽出したが、予め合成領域をタブレットやマーカ
等で指定することにより、より正確に速(処理すること
も可能となる。
次に、前述した以外の各手段による作用を述べる。
(1)文字配置方法 第51図は文字配置方法の説明図であって、文字列抽出
手段5で算出した各文字画像の平均高さ。
幅9間隔2文字列の間隔を用いて、画像を抜き取った領
域内に文字画像を再配置する際の移動量を算出する。
文字配置の方法は、第51図の例に示すように、領域外
にある文字画像を、その順番(第51図1101〜11
10)が変化しないように移動する(第51図の左側か
ら右側への変換)。
このように、原稿中の指定領域内の画像を抜き取った後
、その空白となった領域に文章構造を変化させないよう
に、文字を再配置することにより、原稿のレイアウトを
変更することができる。
(2)領域自動抽出方法 第52図は領域自動抽出方法の説明図であって、原稿中
の図形画像領域を自動的に抽出する方法としては、例え
ば第52図に示すように、まず原稿中の黒画素集合の輪
郭を追跡して、黒画素集合を囲む最小の長方形を得た後
、前記の文字/図形判定方法により図形の輪郭長方形を
抽出する(第52図左側の点線で記された部分)。
次にこれらの長方形を全て包含する最小の長方形を算出
して、これを図形画像領域とする(第52図右側)。
(3)出力処理 第53図は出力処理の説明図であって、前記の領域抜き
取り画像と文字配置処理後の画像を合わせて1ペ一ジ分
の画像に収める場合(第53図左側)、1ページ内に配
置して出力できるようにすることも可能である(第53
図右側)。これにより転写紙の無駄を少なくできる。
〔発明の効果〕
以上説明したように、本発明によれば、手書きの原稿を
見栄えのよい原稿にしたり、また元の原稿を自由にレイ
アウトしたりすることが可能な画像形成装置を提供する
ことができる。
【図面の簡単な説明】
第1図は本発明による画像形成装置の第1の実施例の制
御ブロック図、第2図は文字/図形混在原稿の説明図、
第3図は画像処理結果の説明図、第4図は1つの黒画素
集合の輪郭線を追跡した例の説明図、第5図は輪郭線の
方向の説明図、第6図は輪郭線追跡結果の説明図、第7
図は文字/図形判定方法のフローチャート、第8図は輪
郭データの内容の説明図、第9図および第10図は文字
列抽出方法の説明図、第11図は文字整列結果の説明図
、第12図はベクトル化方法の説明図、第13図は文字
整列時のエラー処理の説明図、第14図は黒画素のデー
タ構造の説明図、第15図は圧縮画像の輪郭線追跡の説
明図、第16図は画像形成装置の制御概念図、第17図
は手書き原稿の説明図、第18図は画像処理結果の説明
図、第19図は部分的な画像処理の説明図、第20図は
直線の整列方向指定の画像処理の説明図、第21図は手
書き原稿の説明図、第22図は画像処理の途中結果の説
明図、第23図は画像処理結果の説明図、第24図は部
分的な画像処理の説明図、第25図は手書き原稿の説明
図、第26図は画像処理の途中結果の説明図、第27図
は画像処理結果の説明図、第28図は部分的な画像処理
の説明図、第29図は本発明による画像形成装置の第2
の実施例の制御ブロック図、第30図は手書き原稿の説
明図、第31図は画像処理結果の説明図、第32図は文
字列抽出方法の説明図、第33図および第34図は文字
列方向変換方法の説明図、第35図は文字画像の回転処
理の説明図、第36図は本発明による画像形成装置の第
3の実施例の制御ブロック図、第37図は被合成原稿の
説明図、第38図は合成原稿の説明図、第39図は画像
処理結果の説明図、第40図および第41図は文字切り
出し方法の説明図、第42図および第43図は文字列抽
出方法の説明図、第44図は文字配置方法の説明図、第
45図は合成領域抽出方法の説明図、第46図は文字あ
ふれ処理の説明図、第47図は本発明による画像形成装
置の第4の実施例の制御ブロック図、第48図は原稿の
説明図、第49図および第50図は画像処理結果の説明
図、第51図は文字配置方法の説明図、第52図は領域
自動抽出方法の説明図、第53図は出力処理の説明図で
ある。 1・・・原稿読み取り手段、2・・・第一の記憶手段、
3・・・輪郭追跡手段、4・・・文字/図形判別手段、
5・・・文字列抽出手段、6・・・文字整列手段、7・
・・ベクトル化手段、8・・・ベクトル修正手段、9・
・・画像合成手段、10・・・第二の記憶手段、工1・
・・出力手段、30・・・文字列方向変換手段、40・
・・領域抽出手段、41・・・文字切り出し手段、42
・・・文字配置手段、50・・・領域切り出し手段。 第2図 第3図 第4図 第6図 第7図 第8図 第9図 第15図 ・・・ ・ ・・ ・・・ ・・・ 第 6図 第17図 第18図 第21図 第22図 第19図 範囲指定 第20図 (b) (C) 第23図 第24図 に1Ili1指疋 第25図 第26図 ×1 冷 第27図 第3o図 第31図 範囲指定 第32図 〉■ 第35図 第37図 第38図 第39図 r−一一−コ /−/’−−コ 派 派 第45図 第46図 第48図 第49図 第50図

Claims (4)

    【特許請求の範囲】
  1. (1)原稿を光学的に読み取り、それを光電変換して2
    値の画像データを得る原稿読み取り手段と、原稿読み取
    り手段により得られた2値の画像データを保持する第一
    の記憶手段と、第一の記憶手段中の文字画像を1文字ず
    つ切り出し、文字画像の大きさ、分布から文字列を抽出
    する文字列抽出手段と、文字列抽出手段で抽出した文字
    情報から、文字の大きさや間隔が揃い、また文字列が水
    平または垂直方向の近い方に整列するように、文字画像
    を拡大、縮小、移動する文字整列手段と、出力画像を保
    持する第二の記憶手段と、第二の記憶手段に書き込まれ
    た出力画像を転写紙に像形成して出力する出力手段とを
    備えたことを特徴とする画像形成装置。
  2. (2)請求項1において、原稿読み取り手段により読み
    取つた画像から文字画像、図形画像を判別する文字/図
    形判別手段を有し、文字画像は、文字列抽出手段、文字
    整列手段による上記の処理を行い、図形画像はそのまま
    、あるいは直線近似した後、その両者を合成して出力す
    ることを特徴とする画像形成装置。
  3. (3)原稿を光学的に読み取り、それを光電変換して2
    値の画像データを得る原稿読み取り手段と、原稿読み取
    り手段により得られた2値の画像データを保持する第一
    の記憶手段と、第一の記憶手段中の文字画像を1文字ず
    つ切り出し、文字画像の大きさ、分布から文字列を抽出
    する文字列抽出手段と、文字列抽出手段で抽出した文字
    情報から、文字列方向が縦方向の場合は、文字画像を時
    計回りに90度回転して横方向に、文字列方向が横方向
    の場合には文字画像を反時計方向に90度回転して縦方
    向に変換する文字列方向変換手段と、出力画像を保持す
    る第二の記憶手段と、第二の記憶手段に書き込まれた出
    力画像を転写紙に像形成して出力する出力手段とを備え
    たことを特徴とする画像形成装置。
  4. (4)原稿を光学的に読み取り、それを光電変換して2
    値の画像データを得る原稿読み取り手段と、原稿読み取
    り手段により得られた少なくとも原稿1枚分より大きい
    2値の画像データを保持する第一の記憶手段と、文字を
    含む被合成原稿画像データ中から文字画像を1文字ずつ
    切り出す文字切り出し手段と、文字切り出し手段で切り
    出した文字画像の大きさ、分布から文字列を抽出する文
    字列抽出手段と、被合成原稿画像中の、合成領域にある
    文字画像を合成領域外に配置し直す文字配置手段と、2
    つの原稿画像を重ね合わせる画像合成手段と、出力画像
    を保持する第二の記憶手段と、第二の記憶手段に書き込
    まれた出力画像を転写紙に像形成して出力する出力手段
    とを備えたことを特徴とする画像形成装置。(5)原稿
    を光学的に読み取り、それを光電変換して2値の画像デ
    ータを得る原稿読み取り手段と、原稿読み取り手段によ
    り得られた2値の画像データを保持する第一の記憶手段
    と、出力画像を保持する第二の記憶手段と、入力画像デ
    ータ中から画像を抜き出して第二の記憶手段中に書き込
    む領域切り出し手段と、入力画像データ中から文字画像
    を1文字ずつ切り出す文字切り出し手段と、文字切り出
    し手段で切り出した文字画像の大きさ、分布から文字列
    を抽出する文字列抽出手段と、文字列抽出手段で算出し
    た文字列情報を用いて、抜き取つた画像領域内に上記切
    り出した文字画像を配置し直す文字配置手段と、第二の
    記憶手段に書き込まれた出力画像を転写紙に像形成して
    出力する出力手段とを備えたことを特徴とする画像形成
    装置。
JP1258899A 1989-10-05 1989-10-05 画像形成装置 Expired - Fee Related JP2930612B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1258899A JP2930612B2 (ja) 1989-10-05 1989-10-05 画像形成装置
US07/593,818 US5111514A (en) 1989-10-05 1990-10-05 Apparatus for converting handwritten characters onto finely shaped characters of common size and pitch, aligned in an inferred direction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1258899A JP2930612B2 (ja) 1989-10-05 1989-10-05 画像形成装置

Publications (2)

Publication Number Publication Date
JPH03122773A true JPH03122773A (ja) 1991-05-24
JP2930612B2 JP2930612B2 (ja) 1999-08-03

Family

ID=17326581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1258899A Expired - Fee Related JP2930612B2 (ja) 1989-10-05 1989-10-05 画像形成装置

Country Status (2)

Country Link
US (1) US5111514A (ja)
JP (1) JP2930612B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07282283A (ja) * 1994-04-13 1995-10-27 Ricoh Co Ltd 文字画像編集処理装置
US5537522A (en) * 1994-01-31 1996-07-16 Fuji Xerox Co., Ltd. Document processing device for improving image quality
US5701500A (en) * 1992-06-02 1997-12-23 Fuji Xerox Co., Ltd. Document processor
US5802535A (en) * 1995-02-03 1998-09-01 Fuji Xerox Co., Ltd. Document processing apparatus for editing and generating documents
US6751779B1 (en) 1999-09-27 2004-06-15 Kabushiki Kaisha Toshiba Apparatus and method for processing document image
JP2006092048A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 画像処理装置
JP2021005173A (ja) * 2019-06-25 2021-01-14 富士通株式会社 Ocr認識結果確認支援プログラム、ocr認識結果確認支援方法およびocr認識結果確認支援システム

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3082953B2 (ja) * 1991-04-01 2000-09-04 キヤノン株式会社 画像記憶制御装置
JP3361124B2 (ja) * 1991-07-30 2003-01-07 ゼロックス・コーポレーション テキストを含む2次元画像上での画像処理方法と画像処理装置
US5235651A (en) * 1991-08-06 1993-08-10 Caere Corporation Rotation of images for optical character recognition
US5251271A (en) * 1991-10-21 1993-10-05 R. R. Donnelley & Sons Co. Method for automatic registration of digitized multi-plane images
US5293469A (en) * 1991-10-23 1994-03-08 Ricoh Company, Ltd. Apparatus for generating a graphic image having symbols whose centers and aligned with each other and whose sizes are adjusted to accord with each other
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
CA2077969C (en) * 1991-11-19 1997-03-04 Daniel P. Huttenlocher Method of deriving wordshapes for subsequent comparison
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
US5901255A (en) * 1992-02-07 1999-05-04 Canon Kabushiki Kaisha Pattern recognition method and apparatus capable of selecting another one of plural pattern recognition modes in response to a number of rejects of recognition-processed pattern segments
JP2891342B2 (ja) * 1992-03-09 1999-05-17 富士ゼロックス株式会社 画像信号処理装置
JPH0676117A (ja) * 1992-08-25 1994-03-18 Canon Inc 情報処理方法及び装置
US5396566A (en) * 1993-03-04 1995-03-07 International Business Machines Corporation Estimation of baseline, line spacing and character height for handwriting recognition
US5455898A (en) * 1993-11-24 1995-10-03 Xerox Corporation Analyzing an image showing a graphical representation of a layout
US5392130A (en) * 1993-11-24 1995-02-21 Xerox Corporation Analyzing an image showing a row/column representation
JP2842781B2 (ja) * 1993-12-24 1999-01-06 日本電気株式会社 画像情報処理方式
EP0689168B1 (en) * 1994-06-23 2002-11-27 Canon Kabushiki Kaisha Image processing method and apparatus
CA2139094C (en) * 1994-12-23 1999-04-13 Abdel Naser Al-Karmi Optical character recognition of handwritten or cursive text
IL112420A (en) * 1995-01-23 1999-05-09 Advanced Recognition Tech Handwriting recognition with reference line estimation
US5761328A (en) * 1995-05-22 1998-06-02 Solberg Creations, Inc. Computer automated system and method for converting source-documents bearing alphanumeric text relating to survey measurements
US5848186A (en) * 1995-08-11 1998-12-08 Canon Kabushiki Kaisha Feature extraction system for identifying text within a table image
US5638466A (en) * 1995-08-30 1997-06-10 Horizon Marketing Corporation Aka Wordwand Method and apparatus for deskewing images of symbols having a non-linear baseline
US5859929A (en) * 1995-12-01 1999-01-12 United Parcel Service Of America, Inc. System for character preserving guidelines removal in optically scanned text
JP3814320B2 (ja) * 1995-12-14 2006-08-30 キヤノン株式会社 画像処理方法及び装置
JPH09270902A (ja) * 1996-01-31 1997-10-14 Ricoh Co Ltd 画像ファイリング方法および画像ファイリング装置
US5867612A (en) * 1996-03-27 1999-02-02 Xerox Corporation Method and apparatus for the fast scaling of an image
KR100212318B1 (ko) * 1997-05-29 1999-08-02 윤종용 수직 얼라인먼트(Alignment)보정 장치 및 방법
FR2766286B1 (fr) * 1997-07-17 2000-09-08 Jean Pierre Alfred Arnaud Procede de creation de documents destines a etre imprimes
JP2000163044A (ja) * 1998-11-30 2000-06-16 Sharp Corp 画像表示装置
DE69924698T2 (de) * 1999-01-08 2006-03-09 Hewlett-Packard Development Co., L.P., Houston System und Verfahren zur automatischen Graphensyntaxanalyse
US7068856B2 (en) 2002-09-17 2006-06-27 Lockheed Martin Corporation Method and system for determining and correcting image orientation angle
US6918706B2 (en) * 2002-10-31 2005-07-19 Canon Kabushiki Kaisha Reducing a difference in picture quality between deteriorated and non-deteriorated images using a printing apparatus
US7848573B2 (en) * 2003-12-03 2010-12-07 Microsoft Corporation Scaled text replacement of ink
JP3997198B2 (ja) * 2003-12-05 2007-10-24 キヤノン株式会社 画像処理システム及び画像処理方法
US20050276508A1 (en) * 2004-06-15 2005-12-15 Lockheed Martin Corporation Methods and systems for reducing optical noise
US7664325B2 (en) * 2005-12-21 2010-02-16 Microsoft Corporation Framework for detecting a structured handwritten object
US7583841B2 (en) 2005-12-21 2009-09-01 Microsoft Corporation Table detection in ink notes
TWI332635B (en) * 2007-01-05 2010-11-01 Compal Electronics Inc Method for determing oriention of chinese words
KR101198769B1 (ko) * 2007-07-13 2012-11-12 삼성전자주식회사 화상형성장치 및 그 제어방법
JP5153676B2 (ja) * 2009-02-10 2013-02-27 キヤノン株式会社 画像処理装置、画像処理方法、プログラムおよび記憶媒体
US8384917B2 (en) * 2010-02-15 2013-02-26 International Business Machines Corporation Font reproduction in electronic documents
JP5482335B2 (ja) * 2010-03-16 2014-05-07 富士通株式会社 マーカ配置装置、マーカ検出装置、及びプログラム
US9734132B1 (en) * 2011-12-20 2017-08-15 Amazon Technologies, Inc. Alignment and reflow of displayed character images
JP6119366B2 (ja) * 2013-03-27 2017-04-26 ブラザー工業株式会社 補正装置
JP6094400B2 (ja) * 2013-06-25 2017-03-15 ソニー株式会社 情報処理装置、情報処理方法、および情報処理プログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54118720A (en) * 1978-03-07 1979-09-14 Mitsubishi Electric Corp Facsimile
JPS6043555B2 (ja) * 1980-02-26 1985-09-28 株式会社トキメック 印字文字切出し装置
DE3107655A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum auffinden und abgrenzen von textbereichen auf einer vorlage, die text-, graphik- und/oder bildbereiche enthalten kann
JPS5885670A (ja) * 1981-11-17 1983-05-23 Fuji Xerox Co Ltd 画像合成装置
JPS58110255A (ja) * 1981-12-25 1983-06-30 Hitachi Ltd プリンタ制御装置
JPS58134368A (ja) * 1982-02-05 1983-08-10 Ricoh Co Ltd 文書画像処理装置
US4802229A (en) * 1983-04-12 1989-01-31 Canon Kabushiki Kaisha Image processing system
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
JPS61255483A (ja) * 1985-05-08 1986-11-13 Fujitsu Ltd 文字認識装置
US4788599A (en) * 1986-04-01 1988-11-29 Canon Kabushiki Kaisha Image processing with image-slant control and/or image-size control
JPS62281082A (ja) * 1986-05-30 1987-12-05 Canon Inc 文字認識装置
JPS62290984A (ja) * 1986-06-10 1987-12-17 Canon Inc パタ−ン情報入力用紙、及び、該用紙を用いたパタ−ン情報認識方法
US4903313A (en) * 1986-07-03 1990-02-20 Ricoh Company, Ltd. Character recognition method
US4907283A (en) * 1987-03-13 1990-03-06 Canon Kabushiki Kaisha Image processing apparatus
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
US4998285A (en) * 1988-03-11 1991-03-05 Kabushiki Kaisha Toshiba Character recognition apparatus

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701500A (en) * 1992-06-02 1997-12-23 Fuji Xerox Co., Ltd. Document processor
US5537522A (en) * 1994-01-31 1996-07-16 Fuji Xerox Co., Ltd. Document processing device for improving image quality
JPH07282283A (ja) * 1994-04-13 1995-10-27 Ricoh Co Ltd 文字画像編集処理装置
US5802535A (en) * 1995-02-03 1998-09-01 Fuji Xerox Co., Ltd. Document processing apparatus for editing and generating documents
US6751779B1 (en) 1999-09-27 2004-06-15 Kabushiki Kaisha Toshiba Apparatus and method for processing document image
JP2006092048A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 画像処理装置
JP4548062B2 (ja) * 2004-09-22 2010-09-22 富士ゼロックス株式会社 画像処理装置
JP2021005173A (ja) * 2019-06-25 2021-01-14 富士通株式会社 Ocr認識結果確認支援プログラム、ocr認識結果確認支援方法およびocr認識結果確認支援システム

Also Published As

Publication number Publication date
JP2930612B2 (ja) 1999-08-03
US5111514A (en) 1992-05-05

Similar Documents

Publication Publication Date Title
JPH03122773A (ja) 画像形成装置
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
US5101448A (en) Method and apparatus for processing a document by utilizing an image
US6016361A (en) Method and apparatus for compressing binary data using pattern matching encoding
JP2940936B2 (ja) 表領域識別方法
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
US20040213458A1 (en) Image processing method and system
JP3149221B2 (ja) 画像処理装置
Ye et al. Document image matching and annotation lifting
JP4323856B2 (ja) 画像処理方法
JPH02138674A (ja) 文書処理方法及び装置
JP2616967B2 (ja) 傾き抽出装置
JPH0728934A (ja) 文書画像処理装置
JP2708604B2 (ja) 文字認識方法
JP2755299B2 (ja) 画像処理方法
JPH03268181A (ja) 文書読み取り装置
JP2000057260A (ja) 記入情報抽出方法および記入情報抽出方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JP2954218B2 (ja) 画像処理方法及び装置
JPH04241074A (ja) 自動文書清書装置
JP2002123794A (ja) フォーマットパラメータ作成装置及び文字認識装置
JPH05274472A (ja) 画像認識装置
JPH05174179A (ja) 文書画像処理装置
JPH04262660A (ja) 画像認識出力装置
JPH1040334A (ja) パターン抽出装置及びパターン領域の切り出し方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees