JP2008299778A - 画像読取装置および画像読取処理プログラム - Google Patents

画像読取装置および画像読取処理プログラム Download PDF

Info

Publication number
JP2008299778A
JP2008299778A JP2007147851A JP2007147851A JP2008299778A JP 2008299778 A JP2008299778 A JP 2008299778A JP 2007147851 A JP2007147851 A JP 2007147851A JP 2007147851 A JP2007147851 A JP 2007147851A JP 2008299778 A JP2008299778 A JP 2008299778A
Authority
JP
Japan
Prior art keywords
name
document
image reading
character data
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007147851A
Other languages
English (en)
Inventor
Yukio Shibata
行雄 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Mita Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Mita Corp filed Critical Kyocera Mita Corp
Priority to JP2007147851A priority Critical patent/JP2008299778A/ja
Publication of JP2008299778A publication Critical patent/JP2008299778A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Facsimiles In General (AREA)

Abstract


【課題】 読み取り画像データから認識した文字データに基づき、適切なファイル名を自動的に付与できるようにする。
【解決手段】 文字認識部7は文書から読み取った画像データから文字を認識して対応する文字データを出力する。記憶部11は認識された文字データを記憶する。名称制御部9は、文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別するとともに、予め文書種類に対応設定した特定名称を上記文字データに係るファイル名として付与制御する。
【選択図】 図1

Description

本発明は画像読取装置および画像読取処理プログラムに係り、特に読取り画像データから文字を認識し、認識した文字に対応した文字データ(テキストデータ)を出力する、いわゆるOCR(Optical Character Recognition)機能を有する、例えば複合機(MFP:Multi Function Peripheral)等に搭載して好適する画像読取装置および画像読取処理プログラムの改良に関する。
近年、OCR機能が搭載された複合機等では、文書原稿を読取るだけで文字データを作成して出力するので、一旦文書にされた原稿を引用したり、修正したりして新たな文書を作成するのに非常に有用である。
そして、そのOCR機能で生成された文字データは、記憶手段に記憶されたり、他の機器へ転送されることになるので、使用者が管理し易いようにファイル名を付与する必要があるが、文字データ毎に使用者がキーボード等の入力部から一々ファイル名を入力するのは煩雑である。
そこで、例えば特開2006−211261号公報(特許文献1)のような技術が提案されている。
この特許文献1は、読み取り画像から文字を認識し、出現頻度の高い文字列を読み取り原稿に対するファイル名として登録するものであり、出現頻度の高い文字列のうち予め記憶している文字列又はそれに類似した文字列をファイル名として登録し、ファイル名の入力の簡素化を図ったものである。
特開2006−211261号公報
しかしながら、上述した特許文献1では、ファイル名に出現頻度の高い文字列を使用するため、意図した名称となり難く、ファイル名から内容が分かり難いとか、ファイル名が内容を特定するものとならない場合が多々あり、改善が望まれていた。
本発明はそのような課題を解決するためになされたもので、読み取り画像データから認識した文字データに基づき、適切なファイル名を自動的に付与可能な画像読取装置および画像読取処理プログラムの提供を目的とする。
そのような課題を解決するために本発明に係る画像読取装置は、文書から読み取った画像データから文字を認識して対応する文字データを出力する文字認識部と、認識された前記文字データを記憶する記憶部と、その文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別するとともに、当該文書種類に関する特定名称を上記文字データに係るファイル名として付与制御する名称制御部とを具備している。
本発明の画像読取装置では、上記名称制御部が、複数のそれらキーワードに該当するとき文書種類を判別する構成も可能である。
本発明の画像読取装置では、上記名称制御部が、予めその文書種類に対応設定した特定名称をファイル名として付与する構成も可能である。
本発明の画像読取装置では、上記名称制御部が、その文書中にあって当該文書を一意に特定する特定符号列を、その特定名称として又は特定名称とともに上記ファイル名として付与する構成も可能である。
本発明に係る画像読取処理プログラムは、文書から読み取られた画像データから文字を認識して対応する文字データをファイルとして出力制御するコンピュータに対し、その読み取られた画像データから文字を認識して対応する文字データを出力する文字認識処理と、認識された文字データを記憶する記憶処理と、その文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別する判別処理と、当該文書種類に関する特定名称をその文字データに係るファイル名として付与制御する名称付与処理とを実行させるものである。
本発明の画像読取処理プログラムでは、上記判別処理が、複数のそれらキーワードに該当するとき文書種類を判別する構成も可能である。
本発明の画像読取処理プログラムでは、上記名称付与処理が、予め文書種類に対応設定した特定名称をそのファイル名として付与する構成も可能である。
本発明の画像読取プログラムでは、上記名称付与処理が、その文書中にあって当該文書を一意に特定する特定符号列を、その特定名称として又は特定名称とともに上記ファイル名として付与する構成も可能である。
このような本発明に係る画像読取装置および画像読取処理プログラムでは、文書から読み取られた画像データから文字を認識して対応する文字データをファイルとして出力し、認識されたそれら文字データを記憶し、その文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別し、当該文書種類に関する特定名称をその文字データに係るファイル名として付与するから、読み取った画像データから認識した文字データに対し、適切なファイル名を自動的に付与可能となる。
本発明において、複数のそれらキーワードに該当するとき文書種類を判別する構成では、認識した文字データ毎により適切なファイル名の付与が可能となる。
本発明において、予め文書種類に対応設定した特定名称をそのファイル名として付与する構成では、更により適切なファイル名の付与が可能となる。
本発明において、その文書中にあって当該文書を一意に特定する特定符号列を、その特定名称として又は特定名称とともに上記ファイル名として付与する構成では、認識した文字データ毎に一意に決まる適切なファイル名を付与可能となる。
以下、本発明の実施の形態を図面を参照して説明する。なお、本発明に係る画像読取処理プログラムは本発明の画像読取装置を説明する過程で説明する。
図1は本発明に係る画像読取装置の実施の一形態を示すブロック図であり、例えば複合機Aの一部を構成している。
図1において、画像読取部1は、文書原稿に照射した反射光から画像を光学的に読み取って電気信号に変換する撮像素子や、その電気信号を増幅してデジタル信号に変換する変換部等を有し、補正部3を介して画像信号処理部5に接続されるとともに、文字認識部7にも接続されている。
補正部3は画像信号を例えばシェーディング補正して画像信号処理部5に出力するものである。
画像信号処理部5は、CPUを主体とするマイクロコンピュータやデジタルシグナルプロセッサ等から形成されてなり、画像信号を拡大縮小、濃度調整、輪郭強調等を処理し、図示しない印刷部に出力する機能を有する。その画像信号に基づき、印刷部にて印刷用紙にモノクロ又はカラー印刷される。
文字認識部7は、後述する制御部9に制御の下、画像信号から公知の認識手法によって順次文字を認識し、対応する文字データ(テキストデータ)を作成する、いわゆるOCR機能を有しており、記憶部11に接続されている。
記憶部11は、制御部9に制御の下、認識した文字データを記憶する従来公知の例えばハードディスクであり、読み込まれた文書(原稿)1枚毎や予め定めた1纏まりの文書(文字データ)毎にファイル化し、通信部13から例えばコンピュータ又はプリンタに対して直接又はネットワークを介して出力する機能を有する。
特に、記憶部11から出力されるファイルにはファイル名として特定名称が付され、本発明ではその特定名称の付与に特徴があるが、詳細は後述する。
入力部15は、複合機Aの本体ケース(図示せず。)に配置された例えばタッチ式スイッチ入力パネルであり、制御部9の制御の下、タッチ操作等によって種々の設定を受け付ける機能を有し、受け付けた設定値を登録部17に登録する機能を有している。
表示部19は、入力部15と同様に、複合機Aの本体ケースに配置された例えば液晶表示パネルであって、登録部17に接続されており、制御部9の制御の下、これからの複合機Aの動作状態や設定状態を表示する機能を有している。
登録部17は、制御部9の制御の下、複合機Aの動作状態や設定値を記憶する他、複数の特定キーワード(文字列)の組合せに対する文書種別一覧を予め登録しており、記憶部11の一部で形成されている。
種別一覧としては、図2に示すように、複数のキーワード、例えば「公開特許公報」、「特許請求の範囲」、「出願人」、「発明者」等の組合せに対して「公開特許公報」を文書種別とし、複数のキーワード「仕様書」、「作成日」、「製図法」、「検図」等の組合せに対して「仕様書」を文書種別とした一覧等が考えられる。
しかも、種別一覧は、それら文書種別「公開特許公報」や「仕様書」に対して、ファイル名とする文字列、例えば「特許公開番号」や「仕様書番号」といった文書を一意に特定可能な特定符号列が文書種別とともにファイル名として設定されている。
制御部9は、CPU、このCPUの動作プログラムを格納したRAM等からなり、文字認識部7、記憶部11、通信部15、入力部17、表示部19その他を制御するとともに、特に、上述したキーワードに基づき文書種類を判別するとともに、当該文書を特定する特定名称を文字データに係るファイル名として付与制御する名称制御部としての機能を有している。
なお、図1では、文字認識部7、記憶部11、通信部15、入力部17および表示部19間で情報や信号が直接やり取りされるように図示されているが、実際には、制御部9を介して又はその制御下でやり取りされる。
制御部9は、記憶部11に記憶された文字データから文字列(語句)を抽出し、登録部15の種別一覧を参照し、文字データ中に複数のキーワード「公開特許公報」、「特許請求の範囲」、「出願人」、「発明者」に該当する文字列が存在すれば、文書種別として「公開特許公報」と判別し、文字データ中に複数のキーワード「仕様書」、「作成日」、「製図法」、「検図」に一致する文字列があれば、文書種別として「仕様書」と判別する機能を有する。
しかも、制御部9は、種別一覧を参照し、判別した文書種別に対応した「特許公開番号」や「仕様書番号」といった特定文字列を選択し、「公開特許公報」や「仕様書」といった文書種類に関する名称とともに「特許公開番号」や「仕様書番号」をファイル名として付加して記憶制御する機能を有している。
そのため、「特許公開番号」としては読み取り文字データ中にある「特開200X−XXXXX」が「特許公開番号」の後に付加されて「特許公開番号−特開200X−XXXXX」となり、「仕様書番号」としては読み取り文字データ中にある例えば「第YYYYY号」が「仕様書」の後に付加されて「仕様書−第YYYYY号」となり、これらが特定名称としてファイル名に付与されることになる。
文書種類に関する名称を省略し、「特許公開番号」や「仕様書番号」である「特開200X−XXXXX」や「第YYYYY号」をファイル名として付加する構成も可能である。
制御部9は、該当するキーワード組合せを判別できないとき、記憶した文字列から多頻度の文字列を抽出し、この多頻度の文字列をファイル名として付加する機能を有するとともに、キーワードの組合せから文書種別が判別できても、特定文字列の判別ができないとき、表示部19にてエラー表示制御する機能を有している。
次に、上述した本発明に係る画像読取装置の動作を図3のフローチャートを参照して説明する。
ステップS1にて画像読取部1が原稿文書を読込処理して画像データを読込み、ステップS2にて文字認識部7が画像データから文字列抽出して文字データを認識し出力処理し、ステップS3にて文字認識部7が文字データを記憶部11に記憶処理し、ステップS4にて制御部9が文書種別一覧を参照し、文字データ中の文字列に複数のキーワード組合せが存在するか否か判別する。
一致するキーワード組合せが存在してステップS4がYESであればステップS5に移って制御部9が特定名称抽出可能か否か判別し、キーワード組合せが存在せずにステップS4がNOであれば、ステップS6に移って制御部9が多頻度文字列をファイル名に付加処理してステップS10に移る。
特定名称抽出が可能であってステップS5がYESであれば、ステップS7にて制御部9が特定名称をファイル名として付与処理し、ステップS8にて表示部19がその表示処理をしてステップS10に移る。
特定名称が抽出できずにステップS5がNOであれば、ステップS9にて表示部19がエラー表示処理してステップS10に移る。
ステップS10では入力部15からの指示による決定処理を受け付け、ステップS11にて登録部17および記憶部11が記憶処理して終了する。
このような処理手順が本発明に係る画像読取処理プログラムに該当する。
このような本発明の画像読取処理では、文書から読み取った画像データから文字を認識して対応する文字データを出力する文字認識部7と、認識された文字データを記憶する記憶部11と、その文字データ中の文字列が予め設定された複数のキーワードに該当するとき、それら複数のキーワードに対応した文書種類を判別するとともに、予め文書種類に対応設定した特定名称を文字データに係るファイル名として付与制御する名称制御部9とを具備している。
そのため、読み取り画像データから認識した文字データの文字列に基づき、適切なファイル名を自動的に付与可能となり、ユーザの意図した名称をファイル名に付与することが容易で、ファイル名から内容が分かり易くなったり、ファイル名が内容を特定するものとなり易い利点がある。
しかも、予め文書種類に対応設定した特定名称であってその文書中の特定名称をファイル名として付与するから、読込んだ文書毎により適切なファイル名の付与が可能となるし、その文書中にあって当該文書を一意に特定する特定符号列を、その特定名称とともにファイル名として付与することが可能であるから、認識した文字データ毎に一意に決まる適切なファイル名を付与可能となる。
もちろん、当該文書を一意に特定する文字、記号等からなる特定符号列のみを特定名称として上記ファイル名として付与することも可能である。
また、文書種類を判別するキーワードは、必ずしも複数設定する必要はないが、複数設定してすべて一致したり複数一致したとき、文書種類を判別する構成にした方が判別精度が向上する。
さらに、本発明における文字データは、必ずしも文字テキストのみからなるデータに限らず、イメージデータを含むものもその範囲に含まれる。要は文字データを主体としたデータファイルであれば良い。
ところで、本発明に係る画像読取処理プログラムは、読み取られた画像データから文字を認識して対応する文字データを出力する文字認識処理と、認識された文字データを記憶する記憶処理と、その文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別する判別処理と、当該文書種類に関する特定名称をその文字データに係るファイル名として付与制御する名称付与処理とを、コンピュータに実行させるから、上述した画像読取装置と同様の効果を得ることが可能である。
さらに、本発明の画像読取処理プログラムにおいても、その判別処理が複数のそれらキーワードに該当するとき文書種類を判別する構成、その名称付与処理が予め文書種類に対応設定した特定名称をそのファイル名として付与する構成、更に、その名称付与処理が文書中にあって当該文書を一意に特定する特定符号列を特定名称として又は特定名称とともに上記ファイル名として付与する構成とすれば、同様に、上述した画像読取装置のような効果を得ることが可能である。
なお、本発明は、複写機Aに限らず、OCR機能を備える画像読取装置等に広く実施することが可能であり、画像読取り手段についても、ファクシミリ装置等におけるADFに密着式イメージセンサ(CIS)からなる構成でも良い。
本発明に係る画像読取装置の実施の形態を示す概略ブロック図である。 本発明に係る画像読取装置における文書種別一覧の例を説明する図である。 本発明に係る画像読取装置の動作を説明するフローチャートである。
符号の説明
1 画像読取部
3 補正部
5 画像信号処理部
7 文字認識部
9 制御部(名称制御部)
11 記憶部
13 通信部
15 入力部
17 登録部
19 表示部
A 複合機

Claims (8)

  1. 文書から読み取った画像データから文字を認識して対応する文字データを出力する文字認識部と、
    認識された前記文字データを記憶する記憶部と、
    前記文字データ中の文字列が予め設定されたキーワードに該当するとき、前記キーワードに対応した文書種類を判別するとともに、当該文書種類に関する特定名称を前記文字データに係るファイル名として付与制御する名称制御部と、
    を具備することを特徴とする画像読取装置。
  2. 前記名称制御部は、複数の前記キーワードに該当するとき前記文書種類を判別する請求項1記載の画像読取装置。
  3. 前記名称制御部は、予め前記文書種類に対応設定した特定名称を前記ファイル名として付与する請求項1又は2記載の画像読取装置。
  4. 前記名称制御部は、前記文書中にあって当該文書を一意に特定する特定符号列を、前記特定名称として又は前記特定名称とともに前記ファイル名として付与する請求項3記載の画像読取装置。
  5. 文書から読み取られた画像データから文字を認識して対応する文字データをファイルとして出力制御するコンピュータに対し、
    読み取った前記画像データから文字を認識して対応する文字データを出力する文字認識処理と、
    認識された前記文字データを記憶する記憶処理と、
    前記文字データ中の文字列が予め設定されたキーワードに該当するとき、前記キーワードに対応した文書種類を判別する判別処理と、
    当該文書種類に関する特定名称を前記文字データに係るファイル名として付与制御する名称付与処理と、
    を実行させることを特徴とする画像読取処理プログラム。
  6. 前記判別処理は、複数の前記キーワードに該当するとき前記文書種類を判別する請求項5記載の画像読取処理プログラム。
  7. 前記名称付与処理は、予め前記文書種類に対応設定した特定名称を前記ファイル名として付与する請求項5又は6記載の画像読取処理プログラム。
  8. 前記名称付与処理は、前記文書中にあって当該文書を一意に特定する特定符号列を、前記特定名称として又は前記特定名称とともに前記ファイル名として付与する請求項7記載の画像読取処理プログラム。
JP2007147851A 2007-06-04 2007-06-04 画像読取装置および画像読取処理プログラム Pending JP2008299778A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007147851A JP2008299778A (ja) 2007-06-04 2007-06-04 画像読取装置および画像読取処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007147851A JP2008299778A (ja) 2007-06-04 2007-06-04 画像読取装置および画像読取処理プログラム

Publications (1)

Publication Number Publication Date
JP2008299778A true JP2008299778A (ja) 2008-12-11

Family

ID=40173218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007147851A Pending JP2008299778A (ja) 2007-06-04 2007-06-04 画像読取装置および画像読取処理プログラム

Country Status (1)

Country Link
JP (1) JP2008299778A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017091465A (ja) * 2015-11-17 2017-05-25 株式会社あいほっと 支援装置
JP2018124657A (ja) * 2017-01-30 2018-08-09 キヤノン株式会社 画像処理装置、及びその制御方法とプログラム
JP7439553B2 (ja) 2020-02-07 2024-02-28 ブラザー工業株式会社 制御プログラム、情報処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017091465A (ja) * 2015-11-17 2017-05-25 株式会社あいほっと 支援装置
JP2018124657A (ja) * 2017-01-30 2018-08-09 キヤノン株式会社 画像処理装置、及びその制御方法とプログラム
JP7439553B2 (ja) 2020-02-07 2024-02-28 ブラザー工業株式会社 制御プログラム、情報処理装置

Similar Documents

Publication Publication Date Title
JP4789516B2 (ja) 文書変換装置、文書変換方法並びに記憶媒体
JP5046750B2 (ja) 二次元コードを含む原稿のアクセス制御を行う画像処理装置、画像処理方法、プログラム、および記憶媒体
US8508805B2 (en) Image processing apparatus, image forming apparatus, image processing system, and recording medium, for embedding digital watermark information in image data and controlling output of embedded digital watermark
US9369605B2 (en) Image processing apparatus for outputting information embedded in a code image according to version information included in the code image
US20110085198A1 (en) Image forming apparatus and document management method thereof
JP6066108B2 (ja) 電子文書生成システムおよびプログラム
EP2403228B1 (en) Image scanning apparatus, computer readable medium, and image storing method
JP7293963B2 (ja) 情報処理装置及び情報処理プログラム
JP2006331258A (ja) 訳振り装置、画像処理装置、プログラム、及び記録媒体
JP2008160810A (ja) 画像読取装置及び画像読取システム
JP2008299778A (ja) 画像読取装置および画像読取処理プログラム
JP2005063031A (ja) 画像処理装置、プログラム、これを記憶する記憶媒体、情報処理装置、プログラム及びこれを記憶する記憶媒体
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP2007079308A (ja) 画像形成装置及びその機能の使用制限方法
US20210200938A1 (en) Information processing apparatus and image forming apparatus that add modification history to modified source image, according to modification made
JP7409056B2 (ja) 情報処理装置及びコンピュータプログラム
JP2015149642A (ja) 画像処理装置
JP7218192B2 (ja) 画像形成装置
JP2022025767A (ja) プログラム、システム、およびスキャナ
JP2006331222A (ja) 画像読取装置及び情報処理装置
JP2008271047A (ja) 画像読取装置
JP2019197321A (ja) 画像処理装置及び画像形成装置
JP2010109653A (ja) 画像読取装置、画像形成装置、画像読取方法および画像読取プログラム
US20230386234A1 (en) Image processing apparatus and image processing method
JP4661525B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム