JP3014257B2 - 文書読み取り装置 - Google Patents

文書読み取り装置

Info

Publication number
JP3014257B2
JP3014257B2 JP5268753A JP26875393A JP3014257B2 JP 3014257 B2 JP3014257 B2 JP 3014257B2 JP 5268753 A JP5268753 A JP 5268753A JP 26875393 A JP26875393 A JP 26875393A JP 3014257 B2 JP3014257 B2 JP 3014257B2
Authority
JP
Japan
Prior art keywords
image
area
data
character
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5268753A
Other languages
English (en)
Other versions
JPH07121655A (ja
Inventor
哲夫 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5268753A priority Critical patent/JP3014257B2/ja
Publication of JPH07121655A publication Critical patent/JPH07121655A/ja
Application granted granted Critical
Publication of JP3014257B2 publication Critical patent/JP3014257B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書内に記載されてい
る文字、図形および写真等の読み取り処理を行う文書読
み取り装置に関する。
【0002】
【従来の技術】従来の、文字、図形あるいは写真等が混
在する文書の読み取りを行う文書読み取り装置は、ま
ず、入力部において文字認識を行うために文字、図形あ
るいは写真上を走査し、単純二値変換を行い画像データ
を入力する。ここで得られた画像データは、いったんメ
モリに格納される。続いて、識別部において前記メモリ
内に格納されている画像データに基づき、文字、図形あ
るいは写真等といったそれぞれの領域に識別する。そし
て、前記識別部で得られた識別結果のうち文字領域の部
分については、文字認識処理を行った後に文字コードを
出力し、残りの図形領域あるいは写真領域については、
単純二値の画像データとして出力している。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た従来の文書読み取り装置には、次のような不都合な点
があった。従来の文書読み取り装置では、写真領域をも
文字領域あるいは図形領域と同じように単純二値変換に
より画像入力しているため、モアレ縞等の画像劣化が発
生していた。ここで、モアレ縞とは、網点画像のコピー
をとる際などに入る縦横の縞のことである。また、逆に
写真領域の画質を保つために、写真領域だけでなく文字
領域や図形領域をも疑似多値変換により画像入力してし
まうと、文字領域の認識率が低下し、図形領域の画質も
劣化させてしまっていた。
【0004】本発明は、このような従来の不都合な点を
解決するためになされたもので、文字領域の認識率の低
下や図形領域の画質の劣化を招くことなく、写真領域に
おいても高画質の画像入力を行えるような文書読み取り
装置を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明の文書読み取り装
置は、記録媒体上に記録された文字、図形あるいは写真
等を走査し画像信号に変換し、さらに該画像信号をデジ
タル変換する画像入力手段と、この画像入力手段の処理
により得られる画像データを格納しておく画像メモリ
と、画像メモリ内に格納されている画像データから文
字、図形あるいは写真等のそれぞれの領域を識別処理す
る領域識別手段と、このようにして、領域識別手段にて
得られた領域識別結果のうち、文字領域に対応する前記
画像メモリ内の前記画像データから行および該行内の文
字を切り出し、いま切り出した文字一つずつの画像デー
タを認識し、文字コードを得る文字認識手段と、前記領
域識別結果のうち、図形領域に対応する前記画像メモリ
内の前記画像データを図形データとして読み出す図形デ
ータ読み出し手段と、前記領域識別結果のうち、写真領
域に対応する前記画像メモリ内の前記画像データを、前
記画像入力手段においてデジタル変換して写真データと
し、該写真データを入力する写真データ入力手段と、前
記文字コードと、前記図形データ及び前記写真データと
を任意のフォーマットの文書データとして出力する出力
手段とを備え、前記写真データ入力手段は、前記領域識
別手段にて識別された写真領域よりも広い領域を、前記
画像入力手段においてデジタル変換して得た画像データ
を入力し、前記画像メモリに格納し、さらに、該画像デ
ータ内の写真領域を前記領域識別手段にて識別し、ここ
で識別された写真領域に対応する画像データを写真デー
タとすることを特徴とするものである。
【0006】また、本発明の文書読み取り装置は、前記
写真データ入力手段が、前記領域識別手段にて識別され
た写真領域よりも広い領域を、前記画像入力手段におい
てデジタル変換して得た画像データを入力し、前記画像
メモリに格納し、さらに、該画像データ内の写真領域を
前記領域識別手段にて識別し、ここで識別された写真領
域に対応する画像データを写真データとすることを特徴
とするものである。
【0007】
【作用】本発明の文書読み取り装置によれば、記録媒体
上に記録された文字、図形、写真等といったおのおのの
領域に応じて、画像データとして取り込む際の画像入力
の手段を変えるようにする。これにより、文字領域の認
識率の低下やモアレ縞等の画像の劣化が発生することな
く、高い文字認識率かつ高画質の画像データを入出力す
ることが可能になる。また、本発明の文書読み取り装置
によれば、写真領域の検出を行う際、領域識別され、一
旦、入力処理された画像データを、さらに広い領域につ
いて領域識別を行い、これにより得られた画像データを
写真領域の画像データとして出力するようにすること
で、二度の画像入力を行うことによって生じる文書自体
のずれや、写真領域の位置の変化等に影響されることな
く、正しく認識された写真領域の画像データを入出力す
ることができるようになる。
【0008】
【実施例】以下に、本発明の第一の実施例を図面を参照
して詳細に説明する。図1は、本発明の文書読み取り装
置の実施例をあらわすブロック図であり、図2は、本発
明の文書読み取り装置の第一の実施例をあらわすフロー
チャートである。画像入力部11は、読み取りの対象の
文書上を走査し、当該文書上に記録されている文字、図
形あるいは写真等を光電変換により画像信号に変換し、
さらにこの画像信号を二値の画像データに変換する。こ
のとき、画像信号の二値の画像データへの変換は、単純
二値あるいは疑似多値変換である。加えて、画像入力部
11は画像データの画像メモリ12への転送も行う。そ
して、画像メモリ12は、画像入力部11より転送され
てきた画像データを格納しておくメモリであり、後述す
る領域識別部13、文字認識部14、結果出力部15か
らアクセス可能である。領域識別部13は、画像メモリ
12内に格納されている画像データを文字、図形あるい
は写真等といったそれぞれの領域ごとに識別し、これら
の領域識別結果を画像入力部11、文字認識部14およ
び結果出力部15へと転送する。
【0009】次に、文字認識部14は、画像メモリ12
内に格納されている画像データのうち、領域識別部13
における識別処理による領域識別結果(この場合は、文
字領域)に対応する画像データから検出した文字を文字
コードとして認識し、この文字コードの結果出力部15
への転送を行う。この結果、結果出力部15では、文字
認識部14から得た文字コードと、画像メモリ12から
読み出した、領域識別部13にて識別された領域識別結
果にもとづく図形領域および写真領域それぞれに対応す
る画像データとを任意のフォーマットの文書データに変
換し、出力装置16へ出力する。ここでいう出力装置1
6とは、図示しないが、結果出力部15から送られてき
た文書データを記憶しておく磁気ディスク装置や当該文
書データを印字するプリンタ等のことを示している。
【0010】そして、図形データ読み出し部18は、領
域識別部13から転送された領域識別結果のうちの図形
領域に対応する画像データを画像メモリ12からの読み
出しを行い、写真データ入力部19は、領域識別部13
から転送された領域識別結果のうちの写真領域をデジタ
ル変換することによって得た画像データの入力を行う。
また、制御部17は、文書読み取り装置全体の各動作を
制御している。
【0011】つづいて、以上のように構成される文書読
み取り装置における第1の実施例を示す処理動作につい
て説明する。図3は、読み取った文書の一頁全体をあら
わす画像例であり、図4は、領域識別部による領域識別
結果をあらわす説明図である。まず最初に、画像入力を
行う(ステップS1)。具体的には、画像入力部11に
よって、今回読み取りの対象である文書上に記録されて
いる一頁全体のすべての文字、図形あるいは写真等を、
光電変換により画像信号に変換し、さらに、この画像信
号を単純二値化変換により画像データを作成し、この画
像データを画像メモリ12に格納しておく。このときの
文書一頁全体の画像例が、図3に示すとおりである。画
像入力が終了すると、領域識別部13により、ステップ
S1で画像メモリに格納した画像データを図4に示すよ
うな文字領域41、図形領域42あるいは写真領域43
に識別する領域識別処理を行う(ステップS2)。この
領域識別処理は、例えば、画像データの周辺分布ヒスト
グラム(幾何的な特徴をみる)を利用する方法等を用い
て行われる。その後、領域識別部13は、領域識別結果
を画像入力部11、文字認識部12あるいは結果出力部
15へそれぞれ転送する。
【0012】次に、文字認識部14による文字認識処理
を行う(ステップS3)。文字認識部14では、領域識
別部13から転送された領域識別結果のうちの文字領域
41に対応する画像メモリ12内に格納された画像デー
タの中から行を検出し、さらに、当該行から文字を検出
する。そして、いま検出した文字一文字毎の画像データ
について再度画像メモリ12を参照し、この一文字毎の
画像データを文字認識することで文字コードを得るので
ある。これらの文字コードは、全て結果出力部15へと
転送される。つづいて、領域識別部13から転送された
領域識別結果のうちの図形領域42に対応する画像デー
タを画像メモリ12から、図形データ読み出し部18に
おいて読み出す(ステップS4)。その後、画像入力部
11において、先にステップS1で画像入力した今回読
み取り対象である文書について、領域識別部13から転
送された領域識別結果のうちの写真領域43を疑似多値
変換することによって得た画像データを写真データ入力
部19から入力し(ステップS5)、さらに、これらの
画像データ(図形、写真)を画像メモリ12を介して結
果出力部15へ転送する。
【0013】最後に、結果出力部15では、文字領域4
1についてはステップS3によって得られた文字コード
を、そして、図形領域42、写真領域43についてはそ
れぞれステップS4、ステップS5によって得られた画
像データを任意の文書フォーマットの文書データに変換
し、この文書データを出力装置16へ出力することで処
理を終了する(ステップS6)。このように、文字領域
41および図形領域42については、単純二値変換によ
って画像入力し、写真領域43については、疑似多値変
換によって画像入力するようにしたことで、高い文字認
識率および図形領域における高画質を保ったまま、写真
領域においても高画質の画像データを出力することがで
きる。
【0014】次に、本発明の第二の実施例を図面を用い
て詳細に説明する。第二の実施例を説明するにあたり、
本発明の文書読み取り装置をあらわすブロック図に示す
構成・動作等、第一の実施例の説明と重複する箇所につ
いては、説明を省略することにする。図5は、本発明の
文書読み取り装置の第二の実施例をあらわすフローチャ
ートであり、図6は、写真領域の拡大領域をあらわす説
明図であり、図7は、拡大された写真領域の画像データ
をあらわす説明図である。先に説明した、図2のステッ
プS4の図形領域42に対応する画像データの読み出し
が終了後、画像入力部11により、写真領域より広い領
域を疑似多値変換により画像入力を行う(ステップS5
1)。具体的には、ステップS1で画像入力した読み取
り対象文書について、領域識別部13における領域識別
結果である写真領域61より広い拡大領域62(図6参
照)を、疑似多値変換により、図7に示す画像データ7
2として入力しているのである。当然、この画像データ
72も画像メモリ12へ格納される。
【0015】ここで、拡大領域の求め方の一例を紹介す
る。図6に示す拡大領域62は、X方向(画像入力部1
1の主走査方向:左右方向)に、 w = W/30(Wは文書全体の画像のX方向:頁
幅) のw分だけ左右両方向に拡大し、Y方向(画像入力部1
1の副走査方向:上下方向)に、 h = H/30(Hは文書全体の画像のY方向:頁高
さ) のh分だけ上下両方向に拡大した領域をあらわしてい
る。そして、前記ステップS51で示す拡大領域62の
画像入力が終了すると、領域識別部13により、画像メ
モリ12内に格納されている画像データ72(図7参
照)から写真領域71を識別する領域識別処理を行い
(ステップS52)、ここでの識別処理結果を結果出力
部15へ転送する。これを受けた結果出力部15では、
領域識別部13から送られた領域識別結果である写真領
域71に対応する画像データを画像メモリ12から読み
出し(ステップS53)、以下第一の実施例と同様、ス
テップS53にて読み出した画像データを任意の文書フ
ォーマットの文書データに変換し、この文書データを出
力装置16へ出力することで全ての処理を終了する。
【0016】このように、本発明の第2の実施例では、
写真領域の検出を行う際に、一旦、疑似多値変換して入
力した画像データを、再び領域識別部13にて、さらに
広い領域の識別を行っている。これにより、一回目の画
像入力(ステップS1:単純二値変換による画像入力)
と二回目の画像入力(ステップS51:疑似多値変換に
よる画像入力)を実施することによって生じる文書自体
のずれや、また、一回目と二回目の光電変換時に発生す
る画像データの変化による写真領域の位置の変化等に影
響されることなく、正しく認識された写真領域の画像デ
ータを入力することができる。最後に、上記第一の実施
例、第二の実施例では、画像データを入力する手段とし
て、疑似多値変換を例に説明してきたが、本発明は、こ
れに限られるものではなく、モノクロ多値変換やカラー
による再入力等であっても有効である。
【0017】
【発明の効果】以上説明したように、本発明の文書読み
取り装置によれば、記録媒体上に記録された文字、図
形、写真等といったおのおのの領域に応じて、画像デー
タとして取り込む際の画像入力の手段を変えるようにし
たことで、文字領域の認識率の低下やモアレ縞等の画像
の劣化が発生することなく、高い文字認識率かつ高画質
の画像データを出力することができるようになった。ま
た、本発明の文書読み取り装置によれば、写真領域の検
出を行う際、領域識別され、一旦、入力処理された画像
データを、さらに広い領域について領域識別を行い、こ
れにより得られた画像データを写真領域の画像データと
して出力するようにしたので、二度の画像入力を行うこ
とによって生じる文書自体のずれや、写真領域の位置の
変化等に影響されることなく、正しく認識された写真領
域の画像データを入出力することができるようになっ
た。
【図面の簡単な説明】
【図1】本発明の文書読み取り装置の実施例をあらわす
ブロック図である。
【図2】本発明の文書読み取り装置の第一の実施例をあ
らわすフローチャートである。
【図3】読み取った文書の一頁全体をあらわす画像例で
ある。
【図4】領域識別部による領域識別結果をあらわす説明
図である。
【図5】本発明の文書読み取り装置の第二の実施例をあ
らわすフローチャートである。
【図6】写真領域の拡大領域をあらわす説明図である。
【図7】拡大された写真領域の画像データをあらわす説
明図である。
【符号の説明】
11 画像入力部 12 画像メモリ 13 領域識別部 14 文字認識部 15 結果出力部 16 出力装置 17 制御部

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 記録媒体上に記録された文字、図形ある
    いは写真等を走査し画像信号に変換し、さらに該画像信
    号をデジタル変換する画像入力手段と、 前記画像入力手段の処理により得られる画像データを格
    納しておく画像メモリと、 前記画像メモリ内に格納されている画像データから文
    字、図形あるいは写真等のそれぞれの領域を識別処理す
    る領域識別手段と、 前記領域識別手段にて得られた領域識別結果のうち、文
    字領域に対応する前記画像メモリ内の前記画像データか
    ら行および該行内の文字を切り出し、いま切り出した文
    字一つずつの画像データを認識し、文字コードを得る文
    字認識手段と、 前記領域識別結果のうち、図形領域に対応する前記画像
    メモリ内の前記画像データを図形データとして読み出す
    図形データ読み出し手段と、 前記領域識別結果のうち、写真領域に対応する前記画像
    メモリ内の前記画像データを、前記画像入力手段におい
    てデジタル変換して写真データとし、該写真データを入
    力する写真データ入力手段と、 前記文字コードと、前記図形データ及び前記写真データ
    とを文書データとして出力する出力手段とを備え、 前記写真データ入力手段は、 前記領域識別手段にて識別された写真領域よりも広い領
    域を、前記画像入力手段においてデジタル変換して得た
    画像データを入力し、前記画像メモリに格納し、 さらに、該画像データ内の写真領域を前記領域識別手段
    にて識別し、ここで識別された写真領域に対応する画像
    データを写真データとすることを特徴とする文書読み取
    り装置。
JP5268753A 1993-10-27 1993-10-27 文書読み取り装置 Expired - Fee Related JP3014257B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5268753A JP3014257B2 (ja) 1993-10-27 1993-10-27 文書読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5268753A JP3014257B2 (ja) 1993-10-27 1993-10-27 文書読み取り装置

Publications (2)

Publication Number Publication Date
JPH07121655A JPH07121655A (ja) 1995-05-12
JP3014257B2 true JP3014257B2 (ja) 2000-02-28

Family

ID=17462858

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5268753A Expired - Fee Related JP3014257B2 (ja) 1993-10-27 1993-10-27 文書読み取り装置

Country Status (1)

Country Link
JP (1) JP3014257B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2890482B2 (ja) * 1989-06-13 1999-05-17 富士ゼロックス株式会社 文書画像再配置ファイリング装置

Also Published As

Publication number Publication date
JPH07121655A (ja) 1995-05-12

Similar Documents

Publication Publication Date Title
US4924509A (en) Image processing apparatus
US5649031A (en) Image information processor for producing high-quality output image
US4786976A (en) Image processing apparatus
US5644366A (en) Image reproduction involving enlargement or reduction of extracted contour vector data for binary regions in images having both binary and halftone regions
JP3332398B2 (ja) 画像処理装置及び画像処理方法
JP3310744B2 (ja) 解像度変換装置
US6983077B2 (en) Image processor
JP3014257B2 (ja) 文書読み取り装置
US20070189638A1 (en) Image processing apparatus, image forming apparatus and image processing method
JPH07168938A (ja) デジタル複写機
JPH07221976A (ja) 2値画像データのスムージング拡大処理方法
JPH07170391A (ja) 画素密度変換装置
JPH0550187B2 (ja)
JP3147246B2 (ja) 画像処理装置及び方法
JP3363684B2 (ja) 画像処理方法及び装置及び画像形成装置
JPH1098614A (ja) 画像処理装置
JPH0766976A (ja) 画像処理装置
JP3880793B2 (ja) 画像処理装置及び画像形成装置
JP3210378B2 (ja) 画像入力装置
JP2755506B2 (ja) 画像形成装置
JPH09163127A (ja) 画像処理装置およびその方法
JPH0338782A (ja) 原稿濃度検出装置
JP3190085B2 (ja) 画像処理装置及び方法
JPS60136477A (ja) 画調識別方法
JPS63116282A (ja) 画像入力付きocr

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19991130

LAPS Cancellation because of no payment of annual fees