JP2008299778A - Image reading apparatus, and image reading and processing program - Google Patents

Image reading apparatus, and image reading and processing program Download PDF

Info

Publication number
JP2008299778A
JP2008299778A JP2007147851A JP2007147851A JP2008299778A JP 2008299778 A JP2008299778 A JP 2008299778A JP 2007147851 A JP2007147851 A JP 2007147851A JP 2007147851 A JP2007147851 A JP 2007147851A JP 2008299778 A JP2008299778 A JP 2008299778A
Authority
JP
Japan
Prior art keywords
name
document
image reading
character data
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007147851A
Other languages
Japanese (ja)
Inventor
Yukio Shibata
行雄 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Mita Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Mita Corp filed Critical Kyocera Mita Corp
Priority to JP2007147851A priority Critical patent/JP2008299778A/en
Publication of JP2008299778A publication Critical patent/JP2008299778A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Facsimiles In General (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To automatically give an appropriate filename on the basis of character data recognized from read-out image data. <P>SOLUTION: A character recognition part 7 outputs the corresponding character data by recognizing characters using the image data read out from documents. A storage part 11 stores the recognized character data. When a character string in the character data corresponds to a preset keyword, a name control part 9 determines the type of the document corresponding to the keyword, and also gives and controls a previously set specific name corresponding to the type of the document as a filename related to the character data. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は画像読取装置および画像読取処理プログラムに係り、特に読取り画像データから文字を認識し、認識した文字に対応した文字データ(テキストデータ)を出力する、いわゆるOCR(Optical Character Recognition)機能を有する、例えば複合機(MFP:Multi Function Peripheral)等に搭載して好適する画像読取装置および画像読取処理プログラムの改良に関する。   The present invention relates to an image reading apparatus and an image reading processing program, and particularly has a so-called OCR (Optical Character Recognition) function for recognizing characters from read image data and outputting character data (text data) corresponding to the recognized characters. For example, the present invention relates to an improvement in an image reading apparatus and an image reading processing program that are preferably mounted on a multi function peripheral (MFP) or the like.

近年、OCR機能が搭載された複合機等では、文書原稿を読取るだけで文字データを作成して出力するので、一旦文書にされた原稿を引用したり、修正したりして新たな文書を作成するのに非常に有用である。   In recent years, MFPs equipped with the OCR function create and output text data simply by reading a document document, so a new document can be created by quoting or correcting the document once documented. It is very useful to do.

そして、そのOCR機能で生成された文字データは、記憶手段に記憶されたり、他の機器へ転送されることになるので、使用者が管理し易いようにファイル名を付与する必要があるが、文字データ毎に使用者がキーボード等の入力部から一々ファイル名を入力するのは煩雑である。   And since the character data generated by the OCR function is stored in the storage means or transferred to another device, it is necessary to give a file name so that the user can easily manage it. It is complicated for the user to input the file name from the input unit such as a keyboard for each character data.

そこで、例えば特開2006−211261号公報(特許文献1)のような技術が提案されている。   Therefore, for example, a technique such as Japanese Patent Application Laid-Open No. 2006-212161 (Patent Document 1) has been proposed.

この特許文献1は、読み取り画像から文字を認識し、出現頻度の高い文字列を読み取り原稿に対するファイル名として登録するものであり、出現頻度の高い文字列のうち予め記憶している文字列又はそれに類似した文字列をファイル名として登録し、ファイル名の入力の簡素化を図ったものである。
特開2006−211261号公報
This patent document 1 recognizes a character from a read image and registers a character string having a high appearance frequency as a file name for a read document. A similar character string is registered as a file name, and the input of the file name is simplified.
JP 2006-211261 A

しかしながら、上述した特許文献1では、ファイル名に出現頻度の高い文字列を使用するため、意図した名称となり難く、ファイル名から内容が分かり難いとか、ファイル名が内容を特定するものとならない場合が多々あり、改善が望まれていた。   However, in Patent Document 1 described above, since a character string having a high appearance frequency is used for the file name, it is difficult to obtain the intended name, and it is difficult to understand the content from the file name, or the file name may not identify the content. There were many and improvements were desired.

本発明はそのような課題を解決するためになされたもので、読み取り画像データから認識した文字データに基づき、適切なファイル名を自動的に付与可能な画像読取装置および画像読取処理プログラムの提供を目的とする。   The present invention has been made to solve such a problem, and provides an image reading apparatus and an image reading processing program capable of automatically assigning an appropriate file name based on character data recognized from read image data. Objective.

そのような課題を解決するために本発明に係る画像読取装置は、文書から読み取った画像データから文字を認識して対応する文字データを出力する文字認識部と、認識された前記文字データを記憶する記憶部と、その文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別するとともに、当該文書種類に関する特定名称を上記文字データに係るファイル名として付与制御する名称制御部とを具備している。   In order to solve such a problem, an image reading apparatus according to the present invention recognizes characters from image data read from a document and outputs corresponding character data, and stores the recognized character data. And when the character string in the character data corresponds to a preset keyword, the document type corresponding to the keyword is determined, and the specific name related to the document type is used as the file name related to the character data. And a name control unit for controlling the assignment.

本発明の画像読取装置では、上記名称制御部が、複数のそれらキーワードに該当するとき文書種類を判別する構成も可能である。   In the image reading apparatus of the present invention, a configuration in which the name control unit discriminates the document type when corresponding to a plurality of these keywords is also possible.

本発明の画像読取装置では、上記名称制御部が、予めその文書種類に対応設定した特定名称をファイル名として付与する構成も可能である。   In the image reading apparatus according to the present invention, the name control unit may assign a specific name set in advance corresponding to the document type as a file name.

本発明の画像読取装置では、上記名称制御部が、その文書中にあって当該文書を一意に特定する特定符号列を、その特定名称として又は特定名称とともに上記ファイル名として付与する構成も可能である。   In the image reading apparatus according to the present invention, the name control unit may add a specific code string that uniquely identifies the document as the specific name or the file name together with the specific name. is there.

本発明に係る画像読取処理プログラムは、文書から読み取られた画像データから文字を認識して対応する文字データをファイルとして出力制御するコンピュータに対し、その読み取られた画像データから文字を認識して対応する文字データを出力する文字認識処理と、認識された文字データを記憶する記憶処理と、その文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別する判別処理と、当該文書種類に関する特定名称をその文字データに係るファイル名として付与制御する名称付与処理とを実行させるものである。   The image reading processing program according to the present invention recognizes characters from image data read from a document and outputs the corresponding character data as a file, and recognizes the characters from the read image data. Character recognition processing for outputting character data to be stored, storage processing for storing recognized character data, and when a character string in the character data corresponds to a preset keyword, the document type corresponding to the keyword is determined. And a name assignment process for controlling the assignment of a specific name related to the document type as a file name related to the character data.

本発明の画像読取処理プログラムでは、上記判別処理が、複数のそれらキーワードに該当するとき文書種類を判別する構成も可能である。   The image reading processing program of the present invention may be configured such that the document type is determined when the determination processing corresponds to a plurality of these keywords.

本発明の画像読取処理プログラムでは、上記名称付与処理が、予め文書種類に対応設定した特定名称をそのファイル名として付与する構成も可能である。   In the image reading processing program of the present invention, the name assigning process may be configured to assign a specific name set in advance corresponding to the document type as the file name.

本発明の画像読取プログラムでは、上記名称付与処理が、その文書中にあって当該文書を一意に特定する特定符号列を、その特定名称として又は特定名称とともに上記ファイル名として付与する構成も可能である。   In the image reading program of the present invention, the name assigning process may be configured to assign a specific code string that uniquely identifies the document as the specific name or the specific name as the file name. is there.

このような本発明に係る画像読取装置および画像読取処理プログラムでは、文書から読み取られた画像データから文字を認識して対応する文字データをファイルとして出力し、認識されたそれら文字データを記憶し、その文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別し、当該文書種類に関する特定名称をその文字データに係るファイル名として付与するから、読み取った画像データから認識した文字データに対し、適切なファイル名を自動的に付与可能となる。   In such an image reading apparatus and image reading processing program according to the present invention, characters are recognized from image data read from a document, corresponding character data is output as a file, and the recognized character data is stored. When the character string in the character data corresponds to a preset keyword, the document type corresponding to the keyword is determined, and a specific name related to the document type is assigned as the file name related to the character data. An appropriate file name can be automatically assigned to character data recognized from image data.

本発明において、複数のそれらキーワードに該当するとき文書種類を判別する構成では、認識した文字データ毎により適切なファイル名の付与が可能となる。   In the present invention, in the configuration in which the document type is discriminated when corresponding to a plurality of these keywords, an appropriate file name can be assigned to each recognized character data.

本発明において、予め文書種類に対応設定した特定名称をそのファイル名として付与する構成では、更により適切なファイル名の付与が可能となる。   In the present invention, in a configuration in which a specific name set in advance corresponding to a document type is assigned as the file name, a more appropriate file name can be assigned.

本発明において、その文書中にあって当該文書を一意に特定する特定符号列を、その特定名称として又は特定名称とともに上記ファイル名として付与する構成では、認識した文字データ毎に一意に決まる適切なファイル名を付与可能となる。   In the present invention, in the configuration in which the specific code string that uniquely identifies the document in the document is given as the specific name or the file name together with the specific name, the appropriate code determined uniquely for each recognized character data. A file name can be assigned.

以下、本発明の実施の形態を図面を参照して説明する。なお、本発明に係る画像読取処理プログラムは本発明の画像読取装置を説明する過程で説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. The image reading processing program according to the present invention will be described in the process of describing the image reading apparatus of the present invention.

図1は本発明に係る画像読取装置の実施の一形態を示すブロック図であり、例えば複合機Aの一部を構成している。   FIG. 1 is a block diagram showing an embodiment of an image reading apparatus according to the present invention, which constitutes a part of a multifunction peripheral A, for example.

図1において、画像読取部1は、文書原稿に照射した反射光から画像を光学的に読み取って電気信号に変換する撮像素子や、その電気信号を増幅してデジタル信号に変換する変換部等を有し、補正部3を介して画像信号処理部5に接続されるとともに、文字認識部7にも接続されている。   In FIG. 1, an image reading unit 1 includes an imaging device that optically reads an image from reflected light irradiated on a document original and converts the image into an electric signal, a conversion unit that amplifies the electric signal and converts the electric signal into a digital signal, and the like. And connected to the image signal processing unit 5 via the correction unit 3 and also to the character recognition unit 7.

補正部3は画像信号を例えばシェーディング補正して画像信号処理部5に出力するものである。   The correction unit 3 performs, for example, shading correction on the image signal and outputs it to the image signal processing unit 5.

画像信号処理部5は、CPUを主体とするマイクロコンピュータやデジタルシグナルプロセッサ等から形成されてなり、画像信号を拡大縮小、濃度調整、輪郭強調等を処理し、図示しない印刷部に出力する機能を有する。その画像信号に基づき、印刷部にて印刷用紙にモノクロ又はカラー印刷される。   The image signal processing unit 5 is formed of a microcomputer mainly including a CPU, a digital signal processor, and the like, and has a function of processing an image signal for enlargement / reduction, density adjustment, edge enhancement, and the like, and outputting the processed image signal to a printing unit (not shown). Have. Based on the image signal, the printing unit performs monochrome or color printing on the printing paper.

文字認識部7は、後述する制御部9に制御の下、画像信号から公知の認識手法によって順次文字を認識し、対応する文字データ(テキストデータ)を作成する、いわゆるOCR機能を有しており、記憶部11に接続されている。   The character recognizing unit 7 has a so-called OCR function for sequentially recognizing characters from an image signal by a known recognizing method under the control of a control unit 9 to be described later and generating corresponding character data (text data). , Connected to the storage unit 11.

記憶部11は、制御部9に制御の下、認識した文字データを記憶する従来公知の例えばハードディスクであり、読み込まれた文書(原稿)1枚毎や予め定めた1纏まりの文書(文字データ)毎にファイル化し、通信部13から例えばコンピュータ又はプリンタに対して直接又はネットワークを介して出力する機能を有する。   The storage unit 11 is a conventionally known hard disk, for example, that stores character data recognized under the control of the control unit 9, and each read document (original) or a predetermined set of documents (character data). Each file has a function of being filed and outputting from the communication unit 13 to, for example, a computer or a printer directly or via a network.

特に、記憶部11から出力されるファイルにはファイル名として特定名称が付され、本発明ではその特定名称の付与に特徴があるが、詳細は後述する。   In particular, the file output from the storage unit 11 is given a specific name as a file name. In the present invention, the specific name is given, and details will be described later.

入力部15は、複合機Aの本体ケース(図示せず。)に配置された例えばタッチ式スイッチ入力パネルであり、制御部9の制御の下、タッチ操作等によって種々の設定を受け付ける機能を有し、受け付けた設定値を登録部17に登録する機能を有している。   The input unit 15 is, for example, a touch switch input panel disposed in a main body case (not shown) of the multi-function device A, and has a function of accepting various settings by a touch operation or the like under the control of the control unit 9. The registered setting value is registered in the registration unit 17.

表示部19は、入力部15と同様に、複合機Aの本体ケースに配置された例えば液晶表示パネルであって、登録部17に接続されており、制御部9の制御の下、これからの複合機Aの動作状態や設定状態を表示する機能を有している。   Similar to the input unit 15, the display unit 19 is a liquid crystal display panel, for example, disposed in the main body case of the multifunction device A, and is connected to the registration unit 17. It has a function of displaying the operating state and setting state of the machine A.

登録部17は、制御部9の制御の下、複合機Aの動作状態や設定値を記憶する他、複数の特定キーワード(文字列)の組合せに対する文書種別一覧を予め登録しており、記憶部11の一部で形成されている。   Under the control of the control unit 9, the registration unit 17 stores the operation state and setting values of the multifunction peripheral A, and registers a document type list for a combination of a plurality of specific keywords (character strings) in advance. 11 is formed.

種別一覧としては、図2に示すように、複数のキーワード、例えば「公開特許公報」、「特許請求の範囲」、「出願人」、「発明者」等の組合せに対して「公開特許公報」を文書種別とし、複数のキーワード「仕様書」、「作成日」、「製図法」、「検図」等の組合せに対して「仕様書」を文書種別とした一覧等が考えられる。   As shown in FIG. 2, the type list includes a plurality of keywords, for example, “published patent gazette” for combinations of “published patent gazette”, “claims”, “applicant”, “inventor”, etc. Is a document type, and for a combination of a plurality of keywords “specifications”, “creation date”, “drafting method”, “examination”, etc., a list with “specifications” as the document type is conceivable.

しかも、種別一覧は、それら文書種別「公開特許公報」や「仕様書」に対して、ファイル名とする文字列、例えば「特許公開番号」や「仕様書番号」といった文書を一意に特定可能な特定符号列が文書種別とともにファイル名として設定されている。   In addition, the type list can uniquely specify a character string as a file name, for example, a document such as “patent publication number” or “specification number” with respect to the document type “public patent publication” or “specification”. The specific code string is set as the file name together with the document type.

制御部9は、CPU、このCPUの動作プログラムを格納したRAM等からなり、文字認識部7、記憶部11、通信部15、入力部17、表示部19その他を制御するとともに、特に、上述したキーワードに基づき文書種類を判別するとともに、当該文書を特定する特定名称を文字データに係るファイル名として付与制御する名称制御部としての機能を有している。   The control unit 9 includes a CPU, a RAM storing an operation program of the CPU, and the like. The control unit 9 controls the character recognition unit 7, the storage unit 11, the communication unit 15, the input unit 17, the display unit 19, and the like. It has a function as a name control unit that determines a document type based on a keyword and assigns and controls a specific name that identifies the document as a file name related to character data.

なお、図1では、文字認識部7、記憶部11、通信部15、入力部17および表示部19間で情報や信号が直接やり取りされるように図示されているが、実際には、制御部9を介して又はその制御下でやり取りされる。   In FIG. 1, it is illustrated that information and signals are directly exchanged among the character recognition unit 7, the storage unit 11, the communication unit 15, the input unit 17, and the display unit 19. 9 or under its control.

制御部9は、記憶部11に記憶された文字データから文字列(語句)を抽出し、登録部15の種別一覧を参照し、文字データ中に複数のキーワード「公開特許公報」、「特許請求の範囲」、「出願人」、「発明者」に該当する文字列が存在すれば、文書種別として「公開特許公報」と判別し、文字データ中に複数のキーワード「仕様書」、「作成日」、「製図法」、「検図」に一致する文字列があれば、文書種別として「仕様書」と判別する機能を有する。   The control unit 9 extracts a character string (word / phrase) from the character data stored in the storage unit 11, refers to the type list of the registration unit 15, and includes a plurality of keywords “public patent gazette” and “claim” in the character data. If there is a character string corresponding to “Scope”, “Applicant”, “Inventor”, it is determined that the document type is “Publication Patent Publication”, and a plurality of keywords “Specifications”, “Created Date” are included in the character data. "," Drafting method ", and" checking ", if there is a character string that matches, it has a function of determining" specification "as the document type.

しかも、制御部9は、種別一覧を参照し、判別した文書種別に対応した「特許公開番号」や「仕様書番号」といった特定文字列を選択し、「公開特許公報」や「仕様書」といった文書種類に関する名称とともに「特許公開番号」や「仕様書番号」をファイル名として付加して記憶制御する機能を有している。   In addition, the control unit 9 refers to the type list, selects a specific character string such as “patent publication number” or “specification number” corresponding to the determined document type, and displays “publication patent publication” or “specification”. A function of adding and storing a “patent publication number” and a “specification number” as a file name together with a name related to the document type is provided.

そのため、「特許公開番号」としては読み取り文字データ中にある「特開200X−XXXXX」が「特許公開番号」の後に付加されて「特許公開番号−特開200X−XXXXX」となり、「仕様書番号」としては読み取り文字データ中にある例えば「第YYYYY号」が「仕様書」の後に付加されて「仕様書−第YYYYY号」となり、これらが特定名称としてファイル名に付与されることになる。   Therefore, as the “patent publication number”, “JP200X-XXXX” in the read character data is added after “patent publication number” to become “patent publication number—JP200X-XXXX”, and “specification number” For example, “YYYYY No.” in the read character data is added after “Specification” to become “Specification-YYYYY No.”, and these are given to the file name as a specific name.

文書種類に関する名称を省略し、「特許公開番号」や「仕様書番号」である「特開200X−XXXXX」や「第YYYYY号」をファイル名として付加する構成も可能である。   It is also possible to omit the names relating to the document types and add “Patent Publication Number” and “Specification Number” “JP200X-XXXXX” and “No. YYYYY” as file names.

制御部9は、該当するキーワード組合せを判別できないとき、記憶した文字列から多頻度の文字列を抽出し、この多頻度の文字列をファイル名として付加する機能を有するとともに、キーワードの組合せから文書種別が判別できても、特定文字列の判別ができないとき、表示部19にてエラー表示制御する機能を有している。   The control unit 9 has a function of extracting a frequent character string from the stored character string and adding the frequent character string as a file name when the keyword combination cannot be determined, and from the keyword combination to the document Even if the type can be determined, when the specific character string cannot be determined, the display unit 19 has a function of performing error display control.

次に、上述した本発明に係る画像読取装置の動作を図3のフローチャートを参照して説明する。   Next, the operation of the image reading apparatus according to the present invention will be described with reference to the flowchart of FIG.

ステップS1にて画像読取部1が原稿文書を読込処理して画像データを読込み、ステップS2にて文字認識部7が画像データから文字列抽出して文字データを認識し出力処理し、ステップS3にて文字認識部7が文字データを記憶部11に記憶処理し、ステップS4にて制御部9が文書種別一覧を参照し、文字データ中の文字列に複数のキーワード組合せが存在するか否か判別する。   In step S1, the image reading unit 1 reads the original document and reads the image data. In step S2, the character recognition unit 7 extracts the character string from the image data, recognizes the character data, performs output processing, and proceeds to step S3. The character recognition unit 7 stores the character data in the storage unit 11, and the control unit 9 refers to the document type list in step S4 to determine whether a plurality of keyword combinations exist in the character string in the character data. To do.

一致するキーワード組合せが存在してステップS4がYESであればステップS5に移って制御部9が特定名称抽出可能か否か判別し、キーワード組合せが存在せずにステップS4がNOであれば、ステップS6に移って制御部9が多頻度文字列をファイル名に付加処理してステップS10に移る。   If there is a matching keyword combination and step S4 is YES, the process proceeds to step S5, and the control unit 9 determines whether the specific name can be extracted. If no keyword combination exists and step S4 is NO, step S4 is performed. In step S6, the control unit 9 adds the frequent character string to the file name and proceeds to step S10.

特定名称抽出が可能であってステップS5がYESであれば、ステップS7にて制御部9が特定名称をファイル名として付与処理し、ステップS8にて表示部19がその表示処理をしてステップS10に移る。   If specific name extraction is possible and step S5 is YES, the control part 9 will give a specific name as a file name in step S7, the display part 19 will perform the display process in step S8, and step S10 Move on.

特定名称が抽出できずにステップS5がNOであれば、ステップS9にて表示部19がエラー表示処理してステップS10に移る。   If the specific name cannot be extracted and step S5 is NO, the display unit 19 performs an error display process in step S9 and proceeds to step S10.

ステップS10では入力部15からの指示による決定処理を受け付け、ステップS11にて登録部17および記憶部11が記憶処理して終了する。   In step S10, a determination process based on an instruction from the input unit 15 is accepted, and in step S11, the registration unit 17 and the storage unit 11 perform storage processing, and the process ends.

このような処理手順が本発明に係る画像読取処理プログラムに該当する。   Such a processing procedure corresponds to the image reading processing program according to the present invention.

このような本発明の画像読取処理では、文書から読み取った画像データから文字を認識して対応する文字データを出力する文字認識部7と、認識された文字データを記憶する記憶部11と、その文字データ中の文字列が予め設定された複数のキーワードに該当するとき、それら複数のキーワードに対応した文書種類を判別するとともに、予め文書種類に対応設定した特定名称を文字データに係るファイル名として付与制御する名称制御部9とを具備している。   In such an image reading process of the present invention, a character recognition unit 7 for recognizing characters from image data read from a document and outputting corresponding character data, a storage unit 11 for storing the recognized character data, When the character string in the character data corresponds to a plurality of preset keywords, the document type corresponding to the plurality of keywords is determined, and the specific name set in advance corresponding to the document type is used as the file name related to the character data. And a name control unit 9 for controlling the assignment.

そのため、読み取り画像データから認識した文字データの文字列に基づき、適切なファイル名を自動的に付与可能となり、ユーザの意図した名称をファイル名に付与することが容易で、ファイル名から内容が分かり易くなったり、ファイル名が内容を特定するものとなり易い利点がある。   Therefore, it is possible to automatically assign an appropriate file name based on the character string of the character data recognized from the scanned image data, and it is easy to assign the name intended by the user to the file name. There is an advantage that the file name is easy to be specified, and the file name is likely to specify the contents.

しかも、予め文書種類に対応設定した特定名称であってその文書中の特定名称をファイル名として付与するから、読込んだ文書毎により適切なファイル名の付与が可能となるし、その文書中にあって当該文書を一意に特定する特定符号列を、その特定名称とともにファイル名として付与することが可能であるから、認識した文字データ毎に一意に決まる適切なファイル名を付与可能となる。   Moreover, since the specific name in the document corresponding to the document type is set in advance as the file name, an appropriate file name can be assigned for each read document. Since the specific code string for uniquely identifying the document can be given as a file name together with the specific name, an appropriate file name uniquely determined for each recognized character data can be given.

もちろん、当該文書を一意に特定する文字、記号等からなる特定符号列のみを特定名称として上記ファイル名として付与することも可能である。   Of course, it is also possible to give only the specific code string made up of characters, symbols, etc. that uniquely identify the document as the specific name as the file name.

また、文書種類を判別するキーワードは、必ずしも複数設定する必要はないが、複数設定してすべて一致したり複数一致したとき、文書種類を判別する構成にした方が判別精度が向上する。   Further, it is not always necessary to set a plurality of keywords for determining the document type. However, when a plurality of keywords are set and all match or a plurality of keywords are matched, the configuration in which the document type is determined improves the determination accuracy.

さらに、本発明における文字データは、必ずしも文字テキストのみからなるデータに限らず、イメージデータを含むものもその範囲に含まれる。要は文字データを主体としたデータファイルであれば良い。   Furthermore, the character data in the present invention is not necessarily limited to data consisting only of character text, but includes data including image data. In short, it may be a data file mainly composed of character data.

ところで、本発明に係る画像読取処理プログラムは、読み取られた画像データから文字を認識して対応する文字データを出力する文字認識処理と、認識された文字データを記憶する記憶処理と、その文字データ中の文字列が予め設定されたキーワードに該当するとき、そのキーワードに対応した文書種類を判別する判別処理と、当該文書種類に関する特定名称をその文字データに係るファイル名として付与制御する名称付与処理とを、コンピュータに実行させるから、上述した画像読取装置と同様の効果を得ることが可能である。   By the way, the image reading processing program according to the present invention includes a character recognition process for recognizing characters from the read image data and outputting corresponding character data, a storage process for storing the recognized character data, and the character data. When the character string in the text corresponds to a preset keyword, a discrimination process for discriminating a document type corresponding to the keyword, and a name giving process for giving a specific name related to the document type as a file name related to the character data Therefore, it is possible to obtain the same effect as that of the image reading apparatus described above.

さらに、本発明の画像読取処理プログラムにおいても、その判別処理が複数のそれらキーワードに該当するとき文書種類を判別する構成、その名称付与処理が予め文書種類に対応設定した特定名称をそのファイル名として付与する構成、更に、その名称付与処理が文書中にあって当該文書を一意に特定する特定符号列を特定名称として又は特定名称とともに上記ファイル名として付与する構成とすれば、同様に、上述した画像読取装置のような効果を得ることが可能である。   In the image reading processing program of the present invention, the document type is discriminated when the discriminating process corresponds to a plurality of those keywords, and the specific name that the name assigning process has previously set corresponding to the document type is used as the file name. In the same way, if the configuration for adding the name and the configuration for adding the specific code string that uniquely identifies the document as the specific name or the file name together with the specific name is present in the document An effect similar to that of an image reading apparatus can be obtained.

なお、本発明は、複写機Aに限らず、OCR機能を備える画像読取装置等に広く実施することが可能であり、画像読取り手段についても、ファクシミリ装置等におけるADFに密着式イメージセンサ(CIS)からなる構成でも良い。   The present invention is not limited to the copying machine A, and can be widely applied to an image reading apparatus or the like having an OCR function. The image reading means is also an image sensor (CIS) that is in close contact with an ADF in a facsimile apparatus or the like. The structure which consists of may be sufficient.

本発明に係る画像読取装置の実施の形態を示す概略ブロック図である。1 is a schematic block diagram illustrating an embodiment of an image reading apparatus according to the present invention. 本発明に係る画像読取装置における文書種別一覧の例を説明する図である。It is a figure explaining the example of the document classification list in the image reading apparatus which concerns on this invention. 本発明に係る画像読取装置の動作を説明するフローチャートである。6 is a flowchart illustrating an operation of the image reading apparatus according to the present invention.

符号の説明Explanation of symbols

1 画像読取部
3 補正部
5 画像信号処理部
7 文字認識部
9 制御部(名称制御部)
11 記憶部
13 通信部
15 入力部
17 登録部
19 表示部
A 複合機
DESCRIPTION OF SYMBOLS 1 Image reading part 3 Correction | amendment part 5 Image signal processing part 7 Character recognition part 9 Control part (name control part)
DESCRIPTION OF SYMBOLS 11 Memory | storage part 13 Communication part 15 Input part 17 Registration part 19 Display part A MFP

Claims (8)

文書から読み取った画像データから文字を認識して対応する文字データを出力する文字認識部と、
認識された前記文字データを記憶する記憶部と、
前記文字データ中の文字列が予め設定されたキーワードに該当するとき、前記キーワードに対応した文書種類を判別するとともに、当該文書種類に関する特定名称を前記文字データに係るファイル名として付与制御する名称制御部と、
を具備することを特徴とする画像読取装置。
A character recognition unit that recognizes characters from image data read from a document and outputs corresponding character data;
A storage unit for storing the recognized character data;
When the character string in the character data corresponds to a keyword set in advance, the name control for determining the document type corresponding to the keyword and giving a specific name related to the document type as a file name related to the character data And
An image reading apparatus comprising:
前記名称制御部は、複数の前記キーワードに該当するとき前記文書種類を判別する請求項1記載の画像読取装置。 The image reading apparatus according to claim 1, wherein the name control unit determines the document type when corresponding to a plurality of the keywords. 前記名称制御部は、予め前記文書種類に対応設定した特定名称を前記ファイル名として付与する請求項1又は2記載の画像読取装置。 The image reading apparatus according to claim 1, wherein the name control unit assigns a specific name set in advance corresponding to the document type as the file name. 前記名称制御部は、前記文書中にあって当該文書を一意に特定する特定符号列を、前記特定名称として又は前記特定名称とともに前記ファイル名として付与する請求項3記載の画像読取装置。 The image reading apparatus according to claim 3, wherein the name control unit assigns a specific code string that uniquely identifies the document in the document as the specific name or the file name together with the specific name. 文書から読み取られた画像データから文字を認識して対応する文字データをファイルとして出力制御するコンピュータに対し、
読み取った前記画像データから文字を認識して対応する文字データを出力する文字認識処理と、
認識された前記文字データを記憶する記憶処理と、
前記文字データ中の文字列が予め設定されたキーワードに該当するとき、前記キーワードに対応した文書種類を判別する判別処理と、
当該文書種類に関する特定名称を前記文字データに係るファイル名として付与制御する名称付与処理と、
を実行させることを特徴とする画像読取処理プログラム。
For a computer that recognizes characters from image data read from a document and controls the output of the corresponding character data as a file,
Character recognition processing for recognizing characters from the read image data and outputting corresponding character data;
A storage process for storing the recognized character data;
A determination process for determining a document type corresponding to the keyword when a character string in the character data corresponds to a preset keyword;
A name assignment process for giving and controlling a specific name related to the document type as a file name related to the character data;
An image reading processing program characterized in that is executed.
前記判別処理は、複数の前記キーワードに該当するとき前記文書種類を判別する請求項5記載の画像読取処理プログラム。 The image reading processing program according to claim 5, wherein the discrimination processing discriminates the document type when corresponding to a plurality of the keywords. 前記名称付与処理は、予め前記文書種類に対応設定した特定名称を前記ファイル名として付与する請求項5又は6記載の画像読取処理プログラム。 7. The image reading processing program according to claim 5, wherein the name assigning process assigns a specific name set in advance corresponding to the document type as the file name. 前記名称付与処理は、前記文書中にあって当該文書を一意に特定する特定符号列を、前記特定名称として又は前記特定名称とともに前記ファイル名として付与する請求項7記載の画像読取処理プログラム。 The image reading processing program according to claim 7, wherein the name assigning process assigns a specific code string that uniquely identifies the document as the specific name or the file name together with the specific name in the document.
JP2007147851A 2007-06-04 2007-06-04 Image reading apparatus, and image reading and processing program Pending JP2008299778A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007147851A JP2008299778A (en) 2007-06-04 2007-06-04 Image reading apparatus, and image reading and processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007147851A JP2008299778A (en) 2007-06-04 2007-06-04 Image reading apparatus, and image reading and processing program

Publications (1)

Publication Number Publication Date
JP2008299778A true JP2008299778A (en) 2008-12-11

Family

ID=40173218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007147851A Pending JP2008299778A (en) 2007-06-04 2007-06-04 Image reading apparatus, and image reading and processing program

Country Status (1)

Country Link
JP (1) JP2008299778A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017091465A (en) * 2015-11-17 2017-05-25 株式会社あいほっと Assistance device
JP2018124657A (en) * 2017-01-30 2018-08-09 キヤノン株式会社 Image processing apparatus, control method thereof and program
JP7439553B2 (en) 2020-02-07 2024-02-28 ブラザー工業株式会社 Control program, information processing device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017091465A (en) * 2015-11-17 2017-05-25 株式会社あいほっと Assistance device
JP2018124657A (en) * 2017-01-30 2018-08-09 キヤノン株式会社 Image processing apparatus, control method thereof and program
JP7439553B2 (en) 2020-02-07 2024-02-28 ブラザー工業株式会社 Control program, information processing device

Similar Documents

Publication Publication Date Title
JP4789516B2 (en) Document conversion apparatus, document conversion method, and storage medium
JP5046750B2 (en) Image processing apparatus, image processing method, program, and storage medium for performing access control of document including two-dimensional code
US8508805B2 (en) Image processing apparatus, image forming apparatus, image processing system, and recording medium, for embedding digital watermark information in image data and controlling output of embedded digital watermark
US9369605B2 (en) Image processing apparatus for outputting information embedded in a code image according to version information included in the code image
US20110085198A1 (en) Image forming apparatus and document management method thereof
JP6066108B2 (en) Electronic document generation system and program
EP2403228B1 (en) Image scanning apparatus, computer readable medium, and image storing method
JP7293963B2 (en) Information processing device and information processing program
JP2006331258A (en) Translation device, image processor, program, and recording medium
JP2008299778A (en) Image reading apparatus, and image reading and processing program
JP2017069943A (en) Image processing apparatus and composite device
JP2008160810A (en) Image scanning device, and image scanning system
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP2007079308A (en) Image forming apparatus and use limiting method for its function
US20210200938A1 (en) Information processing apparatus and image forming apparatus that add modification history to modified source image, according to modification made
JP7409056B2 (en) Information processing device and computer program
JP2015149642A (en) Image processing device
JP7218192B2 (en) image forming device
JP2007052613A (en) Translation device, translation system and translation method
JP2022025767A (en) Program, system, and scanner
JP2006331222A (en) Image reader and information processor
JP2008271047A (en) Image reader
JP2019197321A (en) Image processing apparatus and image forming apparatus
JP2010109653A (en) Image reader, image forming apparatus, image reading method, and image reading program
US20230386234A1 (en) Image processing apparatus and image processing method