JPH1125214A - Device for identifying picture - Google Patents

Device for identifying picture

Info

Publication number
JPH1125214A
JPH1125214A JP9177463A JP17746397A JPH1125214A JP H1125214 A JPH1125214 A JP H1125214A JP 9177463 A JP9177463 A JP 9177463A JP 17746397 A JP17746397 A JP 17746397A JP H1125214 A JPH1125214 A JP H1125214A
Authority
JP
Japan
Prior art keywords
image
unit
format
ruled line
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9177463A
Other languages
Japanese (ja)
Inventor
Yoshimi Nouji
善美 能塒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9177463A priority Critical patent/JPH1125214A/en
Publication of JPH1125214A publication Critical patent/JPH1125214A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a picture identifying device in which a format can be accurately identified for inputted picture data. SOLUTION: In a picture identifying device 10, the operation of a picture memory part 12, of a format selecting parts 13 and 14, and of a format storing part 15 is controlled by a controlling part 16, and picture information supplied from a picture inputting part 11 is temporarily stored in the picture memory part 12, and the candidate of a format supplied from the format storing part 15 is collated with the format selecting parts 13 and 14 so that a format can be selected.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、濃淡で表された画
像情報を画像入力手段を介して読み込み、該画像情報に
含まれる画像の特徴を検出し、得られた画像の特徴に対
応するフォーマットを識別する画像識別装置に関し、特
に、多種多様な画像データの混在している、たとえば帳
票等を光学的に読み込んで画像識別する画像識別装置に
用いて好適なものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a format for reading image information represented by shading through image input means, detecting characteristics of an image included in the image information, and corresponding to the characteristics of the obtained image. In particular, the present invention is suitable for use in an image identification device that optically reads a form or the like in which various kinds of image data are mixed, for example, and identifies the image.

【0002】[0002]

【従来の技術】多種多様な印刷物を光学的に読み取りコ
ードに変換しコンピュータの扱いやすい形態で文書を保
存する画像処理システムに、たとえばファイリング装置
がある。ファイリング装置は、ファイリングにおいて画
像データの保存および入出力を効率的に行なうため入力
された画像データの種類、すなわち文字、写真等の図
形、罫線等に応じて分類処理を行なう。
2. Description of the Related Art For example, a filing apparatus is an image processing system that optically converts a variety of printed materials into read codes and stores the documents in a form that can be easily handled by a computer. The filing apparatus performs a classification process according to the type of input image data, that is, a figure such as a character or a photograph, a ruled line, etc., in order to efficiently store and input and output image data in filing.

【0003】このファイリング装置は、画像入力装置
(たとえばイメージスキャナ等)を介してたとえば紙に
印刷されたドットによる濃淡情報を画像情報として装置
内に取り込むように構成されている。一般に、ファイリ
ング装置では上述した分類処理のため画像入力時に入力
画像の種類を識別可能にする様々な分類方法が用いられ
てきている。分類方法としては、第一に予めオペレータ
が入力画像の種類を分類してその種類を指定した上で画
像入力する方法、第二に画像の種類を判別するたとえば
バッチ票等のシートを付加して画像入力する方法、第三
に分類用のIDが貼付された画像入力シートを画像入力す
る方法等がある。
This filing apparatus is configured to take in density information by dots printed on paper, for example, as image information into the apparatus via an image input device (eg, an image scanner). In general, in the filing apparatus, various classification methods have been used for identifying the type of an input image at the time of image input for the above-described classification processing. As a classification method, first, an operator classifies the type of an input image in advance and designates the type and inputs an image. Second, a sheet such as a batch form for determining the type of the image is added. Third, there is a method of inputting an image, and thirdly, a method of inputting an image on an image input sheet to which a classification ID is attached.

【0004】ところで、第一の画像入力方法を適用した
ファイリング装置は、分類方法をオペレータに予めすべ
て記憶させ分類方法の変更もオペレータに対処してもら
わなければならないので、オペレータを専任とすること
が多くオペレータの負担が大きい。第二の画像入力方法
を用いたファイリング装置は、まずバッチ票等の付加に
よって画像データを増加させてしまう。また、バッチ票
等の作成が手間のかかる作業のため種類の異なるシート
が混在する場合ファイリング装置は効率的な装置になら
ない。第三の画像入力方法を使用したファイリング装置
も、手間なIDの付加の他、不特定なID未定義のシートの
入力には適さない。また、たとえばID未定義のシートの
画像入力を可能にするためにはID領域が確保されなけれ
ばならない。しかしながら、シートのフォーマットには
ID領域確保に伴うフォーマットの変更が許されない場合
もある。このような場合、このファイリング装置は適さ
ない。
By the way, in a filing apparatus to which the first image input method is applied, the operator has to store all the classification methods in advance and have the operator deal with the change of the classification method. The burden on the operator is large. The filing apparatus using the second image input method first increases the image data by adding a batch form or the like. In addition, the filing apparatus is not an efficient apparatus in the case where sheets of different types are mixed due to the time and effort required to create a batch form or the like. The filing apparatus using the third image input method is not suitable for inputting unspecified ID undefined sheets, in addition to troublesome ID addition. Further, for example, in order to enable image input of a sheet whose ID is undefined, an ID area must be secured. However, the format of the sheet
In some cases, the format cannot be changed due to securing the ID area. In such a case, this filing apparatus is not suitable.

【0005】このような事情から最近のファイリング装
置は、フォーマットの大きな要素を成す罫線に注目し分
類においてこの罫線の特徴を抽出し、予めこの装置に分
類かつ登録されていた複数の罫線の特徴と抽出した罫線
の特徴とを照合することによりフォーマットを特定する
分類方法を用いている。
[0005] Under these circumstances, recent filing apparatuses pay attention to ruled lines forming a large element of the format, extract the characteristics of the ruled lines in classification, and determine the characteristics of a plurality of ruled lines that have been classified and registered in advance in this apparatus. A classification method is used in which the format is specified by comparing the extracted ruled line with the features.

【0006】[0006]

【発明が解決しようとする課題】ところで、罫線の特徴
を用いたファイリング装置の画像入力部に使用されるイ
メージスキャナ等には、人間の目よりも低い解像度の装
置を使用することが多い。このため、画像入力に用いる
シートの罫線の太さ、線の色および線の濃度によって再
現時の画像データの罫線は、入力元のシートの罫線に比
べて完全には再現できない場合が生じる。したがって、
ファイリング装置は、罫線の特徴をあいまいに捉えるこ
とになる。一方、事務、会計、および為替等の業務で使
用されているシート、すなわち帳票は、罫線の特徴の似
ているものが実際、多い。罫線の特徴は非常に似ている
が異なるフォーマットのシートが画像入力されると、フ
ァイリング装置は正確な罫線の分類ができず、フォーマ
ットの特定が困難になってしまう虞れがある。
By the way, an image scanner or the like used in an image input unit of a filing apparatus using the feature of a ruled line often uses a device having a lower resolution than human eyes. For this reason, the ruled line of the image data at the time of reproduction may not be completely reproduced as compared with the ruled line of the sheet of the input source, depending on the thickness of the ruled line of the sheet used for image input, the color of the line, and the density of the line. Therefore,
The filing device will obscure the features of the ruled line. On the other hand, sheets used in business such as clerical work, accounting, and currency exchange, that is, forms, often have similar features of ruled lines. When a sheet having a very similar rule but having a different format is input as an image, the filing apparatus cannot accurately classify the ruled line, which may make it difficult to specify the format.

【0007】また、ファイリング装置には、帳票の種類
が数千種から数万種の帳票を分類しなければならない装
置もあって、このようなファイリング装置ではこの不正
確な罫線の特徴に基づく分類によってフォーマットを特
定するまでの所要時間が予定した所要時間よりかなり長
くかかり、かつフォーマットの特定の正確さも欠くこと
が懸念されている。
Further, some filing apparatuses are required to classify forms of thousands to tens of thousands of forms. In such a filing apparatus, classification based on the inaccurate ruled line characteristics is performed. There is a concern that the time required to specify the format may be significantly longer than the expected time, and that the specificity of the format may be lacking.

【0008】本発明はこのような従来技術の欠点を解消
し、入力された画像データに対して正確にフォーマット
の特定を行なうことのできる画像識別装置を提供するこ
とを目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to solve the above-mentioned drawbacks of the prior art and to provide an image discriminating apparatus capable of accurately specifying the format of input image data.

【0009】[0009]

【課題を解決するための手段】本発明は上述の課題を解
決するために、濃淡で表された画像情報を画像入力手段
を介して読み込み、この画像情報に含まれる画像の特徴
を検出し、得られた画像の特徴に対応するフォーマット
を識別する画像識別装置において、この装置は、この画
像入力手段から供給される画像情報を一時的に記憶する
画像情報記憶手段と、この画像情報から検出される第1
の画像の特徴を含むフォーマットの候補を選択する第1
のフォーマット選択手段と、この第1のフォーマット選
択手段から供給されるフォーマットの候補とこの画像情
報に含まれる第2の画像の特徴に関する検出結果とを照
合してフォーマットを選択する第2のフォーマット選択
手段と、この第1のフォーマット選択手段に供給される
複数のフォーマットの候補を記憶するフォーマット記憶
手段と、画像情報記憶手段、第1および第2のフォーマ
ット選択手段、およびフォーマット記憶手段の動作を制
御する制御手段とを有することを特徴とする。
According to the present invention, in order to solve the above-mentioned problems, image information represented by shading is read through an image input means, and features of an image included in the image information are detected. In an image identification device for identifying a format corresponding to a feature of an obtained image, the device includes image information storage means for temporarily storing image information supplied from the image input means, and image information detected from the image information. First
First to select format candidates that include the features of the image
A second format selection unit that compares a format candidate supplied from the first format selection unit with a detection result on a feature of a second image included in the image information to select a format. Means, format storage means for storing a plurality of format candidates supplied to the first format selection means, image information storage means, first and second format selection means, and operation of the format storage means. And control means for performing the control.

【0010】ここで、第1の画像の特徴には、罫線、文
字認識、字体、字種、画像のサイズ、画像の背景色、地
紋、図形パターンの少なくとも一項目を選び、第2の画
像の特徴には、この第1の画像の特徴で選んだ項目と異
なる、少なくとも一項目あるいは複数の組み合わせた項
目を選ぶことが望ましい。
Here, the characteristics of the first image include at least one of a ruled line, character recognition, font, character type, image size, image background color, copy-forgery-inhibited pattern, and graphic pattern. It is desirable to select at least one item or a combination of a plurality of items that is different from the item selected as the feature of the first image.

【0011】また、第1の画像の特徴として画像のサイ
ズ、画像の背景色、および/または地紋が選択された際
には、画像入力手段を記録媒体の色および色の分布を検
出する色検出手段として用いるとよい。
When the size of the image, the background color of the image, and / or the copy-forgery-inhibited pattern are selected as characteristics of the first image, the image input means detects the color of the recording medium and the color distribution. It is good to use as a means.

【0012】画像識別装置は、制御手段により画像情報
記憶手段、第1および第2のフォーマット選択手段、お
よびフォーマット記憶手段の動作をそれぞれ制御し、画
像入力手段から供給される画像情報を画像情報記憶手段
に一時的に記憶させ、フォーマット記憶手段から供給さ
れるフォーマットの候補と第1のフォーマット選択手段
および第2のフォーマット選択手段での検出結果とを照
合させてフォーマット選択を行なうことにより、従来よ
りも識別能力を高めることができるので、画像の特徴の
似たシートが入力されても該当するフォーマットの候補
を的確に選択する装置になる。
The image identification device controls the operations of the image information storage means, the first and second format selection means, and the format storage means by the control means, and stores the image information supplied from the image input means in the image information storage means. Means for temporarily selecting the format by comparing the format candidates supplied from the format storage means with the detection results of the first format selection means and the second format selection means. Can also improve the discrimination ability, so that even if a sheet having similar characteristics of an image is input, the apparatus can appropriately select a corresponding format candidate.

【0013】[0013]

【発明の実施の形態】次に添付図面を参照して本発明に
よる画像識別装置の一実施例を詳細に説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing an embodiment of an image discriminating apparatus according to the present invention.

【0014】本実施例は、ファイリング装置の一部に適
用された画像識別装置の構成および動作について図1〜
図8を参照しながら説明する。画像識別装置は、たとえ
ば紙に印刷された濃淡情報を光学的に読み取ってコンピ
ュータ等の扱いやすくなった画像情報を画像の特徴に応
じて分類する装置である。
In this embodiment, the configuration and operation of an image identification apparatus applied to a part of a filing apparatus are shown in FIGS.
This will be described with reference to FIG. The image identification device is a device that optically reads density information printed on paper, for example, and classifies the image information that is easy to handle by a computer or the like according to the characteristics of the image.

【0015】図1は画像識別装置10の基本的なブロック
構成を示している。この画像識別装置10は、画像入力部
11、画像メモリ部12、フォーマット選択部13、14、フォ
ーマット記憶部15および制御部16で構成されている。
FIG. 1 shows a basic block configuration of the image identification device 10. This image identification device 10 includes an image input unit
11, an image memory unit 12, format selection units 13 and 14, a format storage unit 15, and a control unit 16.

【0016】画像入力部11には、光を発光する光源およ
び光源の発光光をたとえば紙等の記録媒体に集光させこ
の記録媒体からの反射光を受光する光学系と、受光光量
を基に多値の電気信号に変換する光電変換部とを有する
スキャナがある(光学系と光電変換部は図示せず)。こ
の実施例では帳票・シート等を入力対象として用い記載
されている濃淡情報がコード変換されたときこの情報を
画像データとしている。
The image input unit 11 includes a light source that emits light, an optical system that collects light emitted from the light source on a recording medium such as paper, and receives reflected light from the recording medium. There is a scanner having a photoelectric conversion unit that converts a signal into a multi-valued electric signal (the optical system and the photoelectric conversion unit are not shown). In this embodiment, when the density information described using a form / sheet or the like as an input object is code-converted, this information is used as image data.

【0017】画像メモリ部12は、画像として取り込んだ
画像入力部11から供給される画像データを一時的に記憶
する機能を持つメモリである。
The image memory unit 12 is a memory having a function of temporarily storing image data supplied from the image input unit 11 which has been captured as an image.

【0018】フォーマット選択部13、14は、それぞれ第
1のフォーマット選択手段と第2のフォーマット選択手
段に相当している。フォーマット選択部13は、検出され
る第1の画像の特徴を含むフォーマットの候補を選択す
る機能を持っている。このためフォーマット選択部13
は、第1の画像の特徴を検出する画像特徴検出部13a
と、画像特徴検出部13a からのデータを基にデータ処理
を行なう画像の特徴データ処理部13b と、画像の特徴デ
ータ処理部13b からの処理結果を一時格納するメモリ部
13c と、メモリ部13c および後述するフォーマット記憶
部15からそれぞれ供給される画像の特徴とを照合する画
像の特徴照合部13d とを有している。
The format selection units 13 and 14 correspond to first format selection means and second format selection means, respectively. The format selection unit 13 has a function of selecting a format candidate including the feature of the detected first image. For this reason, the format selection unit 13
Is an image feature detection unit 13a that detects a feature of the first image.
An image feature data processing unit 13b that performs data processing based on data from the image feature detection unit 13a; and a memory unit that temporarily stores processing results from the image feature data processing unit 13b.
13c, and an image feature matching unit 13d for matching the features of the image supplied from the memory unit 13c and the format storage unit 15 described later.

【0019】フォーマット選択部14もフォーマット選択
部13と同様に画像特徴検出部14a 、画像の特徴データ処
理部14b 、メモリ部14c 、および画像の特徴照合部14d
を有している。ここで、画像の特徴にはたとえば罫線、
文字認識、字体、字種、画像のサイズ、画像の背景色、
地紋、図形パターン等の項目が挙げられる。これらの項
目の中からユーザの選んだ項目に応じて検出・データ処
理の手順が採られることは言うまでもない。フォーマッ
ト選択部14は選択されたフォーマットを出力端子17を介
して図示しないファイリング装置内のフォーマット確定
メモリに出力する。
Similarly to the format selection unit 13, the format selection unit 14 includes an image feature detection unit 14a, an image feature data processing unit 14b, a memory unit 14c, and an image feature comparison unit 14d.
have. Here, image features include, for example, ruled lines,
Character recognition, font, font type, image size, image background color,
Items such as copy-forgery-inhibited patterns and graphic patterns are included. It goes without saying that the procedure of detection and data processing is adopted according to the item selected by the user from these items. The format selection unit 14 outputs the selected format to a format determination memory (not shown) in the filing device via the output terminal 17.

【0020】フォーマット記憶部15は、画像の分類の対
象となる画像データから予め各項目について検出した情
報を標準フォーマットとして、たとえば図2に示すよう
な15個のフォーマットを記憶させておくメモリである。
たとえば文字を標準フォーマットの一つに用いる場合
は、画像の特徴を示す文字領域の位置・サイズ・記載内
容等の情報も一緒に登録されている。
The format storage unit 15 is a memory for storing, for example, fifteen formats as shown in FIG. 2 using information previously detected for each item from image data to be classified as a standard format. .
For example, when a character is used as one of the standard formats, information such as the position, size, and description contents of a character area indicating the characteristics of an image is also registered.

【0021】制御部16は、外部からの操作に応じて画像
入力部11、画像メモリ部12、フォーマット選択部13、1
4、およびフォーマット記憶部15の動作タイミングや異
常時の動作等を制御している。
The control unit 16 includes an image input unit 11, an image memory unit 12, a format selection unit 13, 1 according to an external operation.
4, and controls the operation timing of the format storage unit 15, the operation at the time of abnormality, and the like.

【0022】より具体的な例として帳票の識別分類例を
挙げながら本発明の画像識別装置10を説明する。この説
明に際しては図1のブロック図、図2のフォーマット候
補の説明図、図3の入力される帳票の例、および図4〜
図8の具体的な画像識別装置のブロック図を用いてい
る。
The image identification apparatus 10 of the present invention will be described with reference to a more specific example of a form identification classification. In this explanation, the block diagram in FIG. 1, the explanatory diagram of the format candidates in FIG. 2, the example of the input form in FIG.
FIG. 8 is a block diagram of a specific image identification device.

【0023】先ず、第1の具体例として画像識別装置10
には第1の画像の特徴に罫線、第2の画像の特徴に文字
認識を用いて照合する場合がある。この場合、フォーマ
ット選択部13は罫線特徴検出部131a、罫線分析部131b、
メモリ部131c、および罫線特徴照合部131dを有し、フォ
ーマット選択部14は文字検出部141a、文字認識部141b、
メモリ部141c、および文字特徴照合部141dを有してい
る。
First, as a first specific example, the image identification device 10
In some cases, matching is performed by using ruled lines for features of the first image and character recognition for features of the second image. In this case, the format selection unit 13 includes a ruled line feature detection unit 131a, a ruled line analysis unit 131b,
It has a memory unit 131c and a ruled line feature matching unit 131d, and the format selection unit 14 includes a character detection unit 141a, a character recognition unit 141b,
It has a memory unit 141c and a character feature matching unit 141d.

【0024】罫線特徴検出部131aは、画像メモリ部12か
ら供給される画像データ中にある連続した黒点をヒスト
グラムに基づいて検出する。罫線分布部131bは、罫線特
徴検出部131aからのデータに基づいて罫線分布を分析
し、たとえばこの分布をパターン化する。メモリ部131c
は、罫線分布部131bの分析結果を格納する。罫線特徴照
合部131dは、制御部16の制御によりフォーマット記憶部
15とメモリ部131cからそれぞれ供給されるデータの照合
を行なう(パターンマッチング)。
The ruled line feature detecting section 131a detects continuous black points in the image data supplied from the image memory section 12 based on the histogram. The ruled line distribution unit 131b analyzes the ruled line distribution based on the data from the ruled line feature detection unit 131a, and patterns this distribution, for example. Memory unit 131c
Stores the analysis result of the ruled line distribution unit 131b. The ruled line feature matching unit 131d is controlled by the control unit 16 to control the format storage unit.
The data supplied from the memory unit 131c and the data supplied from the memory unit 131c are collated (pattern matching).

【0025】また、文字検出部141aは、たとえば予め設
定されたサンプリング領域を文字の領域とし、この領域
毎に画像メモリ部12から供給される画像データ(の黒
点)をサンプリングする。文字認識部141bは、このサン
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出内容の認識処理
を行なう。メモリ部141cは文字認識部141bの検出位置に
対応して得られた認識結果を格納する。文字特徴照合部
141dは制御部16の制御により罫線特徴照合部131dとメモ
リ部131cからそれぞれ供給されるデータとを照合してフ
ォーマットを選択する。
The character detecting section 141a, for example, sets a sampling area set in advance as a character area, and samples (black dots) image data supplied from the image memory section 12 for each area. The character recognizing unit 141b performs recognition processing of the detected contents from the sampled data while associating the sampled data with the positions of the characters and symbols described in the form. The memory unit 141c stores the recognition result obtained corresponding to the detection position of the character recognition unit 141b. Character feature matching unit
Under control of the control unit 141d, the ruled line feature matching unit 131d and the data supplied from the memory unit 131c are compared to select a format.

【0026】ここで、図3の帳票35が画像識別装置10の
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。フォーマット選択
部13の罫線特徴検出部131aは供給される画像データに含
まれている罫線の検出を行なって罫線分布部131bに検出
データを送る。罫線分布部131bでは検出データを基に罫
線の始点・終点位置、罫線の長さ、罫線の太さ、罫線の
線種等が分析され、パターン化される。分析されたデー
タは一旦メモリ部131cに格納される。制御部16はメモリ
部131cをタイミング制御してデータを罫線特徴照合部13
1dに出力する。
Here, when the form 35 of FIG. 3 is input to the image input unit 11 of the image identification device 10, the converted image data is output to the image memory unit 12 via the image input unit 11. The image memory unit 12 supplies the image data to the format selection units 13 and 14 under the control of the control unit 16. The ruled line feature detection unit 131a of the format selection unit 13 detects a ruled line included in the supplied image data, and sends detection data to the ruled line distribution unit 131b. The ruled line distribution unit 131b analyzes the start and end positions of the ruled line, the ruled line length, the ruled line thickness, the ruled line type, and the like based on the detected data, and forms a pattern. The analyzed data is temporarily stored in the memory unit 131c. The control unit 16 controls the timing of the memory unit 131c to store the data in the ruled line feature matching unit 13
Output to 1d.

【0027】また、フォーマット記憶部15には、予め分
類対象となる一帳票の標準画像に関して得られた複数の
画像の特徴がパターン化されて登録されている(図2を
参照)。たとえば罫線の分類特徴を登録する際には、帳
票毎に帳票に含まれる文字や図等の可変要素を取り除く
ため縦/横の2方向にそれぞれ走査して得られた罫線パ
ターンを記憶させている。ここで、図2に示した帳票パ
ターン20〜34は、罫線パターンだけでなく、この他予め
帳票の標準画像で得られた複数の画像の特徴を合成して
表わしている。フォーマット記憶部15は制御部16の制御
に応じて帳票パターン20〜34を罫線特徴照合部131dに順
次供給する。
In the format storage unit 15, the features of a plurality of images obtained for a standard image of one form to be classified are registered in a pattern (see FIG. 2). For example, when registering the classification characteristics of ruled lines, ruled line patterns obtained by scanning in two directions, vertical and horizontal, are stored in order to remove variable elements such as characters and figures included in the form for each form. . Here, the form patterns 20 to 34 shown in FIG. 2 represent not only the ruled line patterns but also the characteristics of a plurality of images obtained in advance as standard forms of the form. The format storage unit 15 sequentially supplies the form patterns 20 to 34 to the ruled line feature matching unit 131d under the control of the control unit 16.

【0028】罫線特徴照合部131dはメモリ部131cからの
データにマッチングする帳票パターンの照合を行なう。
照合の結果、罫線特徴照合部131dはマッチングした6つ
の帳票パターン20,23,26,28,31,32 だけをフォーマット
選択部14の文字特徴照合部141dに供給する。
The ruled line feature matching unit 131d performs matching of a form pattern that matches data from the memory unit 131c.
As a result of the matching, the ruled line feature matching unit 131d supplies only the matched six form patterns 20, 23, 26, 28, 31, 32 to the character feature matching unit 141d of the format selection unit 14.

【0029】このように入力された帳票フォーマットは
罫線だけで確定できないので、フォーマット選択部14で
さらに帳票フォーマットの選択処理を行なう。文字検出
部141a、文字認識部141bおよびメモリ部141cは、制御部
16の制御によって罫線特徴検出部131a、罫線分析部131b
およびメモリ部131cと同時並行処理される。文字検出部
141aは、図3の帳票35から特徴となる5文字を検出す
る。文字認識部141bは検出された5文字に認識処理を施
すことによって文字記載位置とともに内容を示す“〇〇
依頼書”を得る。これらのデータがメモリ部141cに格納
される。文字特徴照合部141dは、メモリ部141cに格納さ
れているデータと罫線特徴照合部131dから供給される6
つの帳票パターン20,23,26,28,31,32 との照合を行な
う。この照合処理によって帳票35は、文字記載位置およ
び記載内容“__依頼書”の一致から、図2の帳票パタ
ーン20が帳票フォーマットとして選択される。文字特徴
照合部141dは、分類されたフォーマットを最も確からし
いものとして出力端子17を介して出力する。
Since the input form cannot be determined only by the ruled lines, the format selecting unit 14 further performs the processing of selecting the form. The character detection unit 141a, the character recognition unit 141b, and the memory unit 141c are
Under the control of 16, the ruled line feature detection unit 131a and the ruled line analysis unit 131b
And the memory unit 131c. Character detector
141a detects five characteristic characters from the form 35 of FIG. The character recognizing unit 141b performs a recognition process on the five detected characters to obtain a “$ Request Form” indicating the content together with the character description position. These data are stored in the memory unit 141c. The character feature matching unit 141d receives the data stored in the memory unit 141c and the data supplied from the ruled line feature matching unit 131d.
The collation with two form patterns 20, 23, 26, 28, 31, 32 is performed. By this collation processing, the form pattern 20 of FIG. 2 is selected as the form format of the form 35 from the coincidence of the character description position and the description content “__request”. The character feature matching unit 141d outputs the classified format as the most likely one via the output terminal 17.

【0030】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
As a result, the image identification device 10 can reduce errors in format classification, shorten the processing time even if the number of forms is increased, and improve the identification processing capability of the device.

【0031】次に第2の具体例として画像識別装置10に
は第1の画像の特徴に罫線、第2の画像の特徴に文字認
識を用いて照合する場合がある。この場合、フォーマッ
ト選択部13は第1の具体例と同じ構成の罫線特徴検出部
131a、罫線分析部131b、メモリ部131c、および罫線特徴
照合部131dを有し、フォーマット選択部14は文字検出部
141a、字体認識部142b、メモリ部141c、および字体特徴
照合部142dを有している。
Next, as a second specific example, the image discriminating apparatus 10 may collate the features of the first image using ruled lines and the features of the second image using character recognition. In this case, the format selection unit 13 includes a ruled line feature detection unit having the same configuration as that of the first specific example.
131a, a ruled line analyzing unit 131b, a memory unit 131c, and a ruled line feature matching unit 131d.
141a, a font recognition unit 142b, a memory unit 141c, and a font feature matching unit 142d.

【0032】字体認識部142bは、文字検出部141aでサン
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出された文字等の
字体認識処理を行なう。メモリ部141cは字体認識部142b
の検出位置に対応して得られた認識結果を格納する。字
体特徴照合部142dは制御部16の制御により罫線特徴照合
部131dとメモリ部131cからそれぞれ供給されるデータの
照合を行なう。
The character recognition unit 142b performs a character recognition process on the detected characters and the like from the data sampled by the character detection unit 141a while corresponding to the positions of the characters and symbols written on the form. The memory unit 141c is a font recognition unit 142b
The recognition result obtained corresponding to the detection position is stored. Under the control of the control unit 16, the font feature matching unit 142d performs matching of data supplied from the ruled line feature matching unit 131d and the data supplied from the memory unit 131c, respectively.

【0033】ここで、たとえば図3の帳票36が画像識別
装置10の画像入力部11に入力されると、画像入力部11を
介して変換された画像データが画像メモリ部12に出力さ
れる。画像メモリ部12は、制御部16の制御により画像デ
ータをフォーマット選択部13、14に供給する。
Here, for example, when the form 36 shown in FIG. 3 is input to the image input unit 11 of the image identification device 10, the converted image data is output to the image memory unit 12 via the image input unit 11. The image memory unit 12 supplies the image data to the format selection units 13 and 14 under the control of the control unit 16.

【0034】フォーマット選択部13の罫線特徴照合部13
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした5つの帳票パターン21,24,27,29,33
だけをフォーマット選択部14の字体特徴照合部142dに供
給する。このように入力された帳票フォーマットはこの
場合も罫線だけで確定できないので、フォーマット選択
部14でさらに帳票フォーマットの選択処理を行なう。文
字検出部141a、字体認識部142bおよびメモリ部141cは、
制御部16の制御によって罫線特徴検出部131a、罫線分析
部131bおよびメモリ部131cと同時並行処理される。文字
検出部141aは、図3の帳票36から特徴となる文字を検出
する。字体認識部142bは検出された文字の字体認識を行
なうことによって文字記載位置とともに文字の字体をと
して“ゴシック体”を得る。これらのデータがメモリ部
141cに格納される。字体特徴照合部142dは、メモリ部14
1cに格納されているデータと罫線特徴照合部131dから供
給される5つの帳票パターン21,24,27,29,33との照合を
行なう。この照合処理によって帳票36は、文字記載位置
および記載内容(字体:ゴシック体)の一致から、図2
の帳票パターン24が帳票フォーマットとして選択され
る。字体特徴照合部142dは、分類されたフォーマットを
最も確からしいものとして出力端子17を介して出力す
る。
Ruled line feature collating section 13 of format selecting section 13
1d performs collation of a form pattern that matches data from the memory unit 131c. Matching result, ruled line feature matching unit 13
1d is the five matched form patterns 21,24,27,29,33
Is supplied to the font feature matching unit 142d of the format selection unit 14. In this case, the form format input in this way cannot be determined only by the ruled lines, and the format selection unit 14 further performs a form format selection process. The character detection unit 141a, the font recognition unit 142b, and the memory unit 141c
Under the control of the control unit 16, the ruled line feature detection unit 131a, the ruled line analysis unit 131b, and the memory unit 131c are simultaneously processed in parallel. The character detecting unit 141a detects a character characterizing the form 36 in FIG. The font recognizing unit 142b performs the font recognition of the detected character to obtain a “Gothic font” by using the font of the character together with the character description position. These data are stored in the memory
Stored in 141c. The font feature matching unit 142d
The data stored in 1c is compared with the five form patterns 21, 24, 27, 29, and 33 supplied from the ruled line feature matching unit 131d. As a result of this collation processing, the form 36 is determined based on the matching of the character description position and the description content (font: Gothic), as shown in FIG.
Is selected as the form format. The font feature matching unit 142d outputs the classified format via the output terminal 17 as the most likely one.

【0035】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
As a result, the image identification apparatus 10 can reduce errors in format classification, shorten the processing time even if the number of forms is increased, and improve the identification processing capability of the apparatus.

【0036】次に第3の具体例として画像識別装置10に
は第1の画像の特徴に罫線、第2の画像の特徴に字種認
識を用いて照合する場合がある。この場合、フォーマッ
ト選択部13は第1の具体例と同じ構成の罫線特徴検出部
131a、罫線分析部131b、メモリ部131c、および罫線特徴
照合部131dを有し、フォーマット選択部14は文字検出部
141a、字種認識部143b、メモリ部141c、および字種特徴
照合部143dを有している。
Next, as a third specific example, there is a case where the image discriminating apparatus 10 performs collation using the ruled line for the feature of the first image and character type recognition for the feature of the second image. In this case, the format selection unit 13 includes a ruled line feature detection unit having the same configuration as that of the first specific example.
131a, a ruled line analyzing unit 131b, a memory unit 131c, and a ruled line feature matching unit 131d.
141a, a character type recognition unit 143b, a memory unit 141c, and a character type characteristic matching unit 143d.

【0037】字種認識部142bは、文字検出部141aでサン
プリングされたデータから帳票に記されていた文字およ
び記号の記載位置に対応させながら検出された文字・記
号等の字種認識処理を行なう。メモリ部141cは字種認識
部143bの検出位置に対応して得られた認識結果を格納す
る。字種特徴照合部143dは制御部16の制御により罫線特
徴照合部131dとメモリ部131cからそれぞれ供給されるデ
ータの照合を行なう。
The character type recognizing unit 142b performs character type recognizing processing of the detected characters and symbols from the data sampled by the character detecting unit 141a while corresponding to the positions of the characters and symbols written on the form. . The memory unit 141c stores the recognition result obtained corresponding to the detection position of the character type recognition unit 143b. The character type feature collating unit 143d performs collation of data supplied from the ruled line feature collating unit 131d and the memory unit 131c under the control of the control unit 16.

【0038】ここで、たとえば図3の帳票37が画像識別
装置10の画像入力部11に入力されると、画像入力部11を
介して変換された画像データが画像メモリ部12に出力さ
れる。画像メモリ部12は、制御部16の制御により画像デ
ータをフォーマット選択部13、14に供給する。
Here, for example, when the form 37 of FIG. 3 is input to the image input unit 11 of the image identification device 10, the converted image data is output to the image memory unit 12 via the image input unit 11. The image memory unit 12 supplies the image data to the format selection units 13 and 14 under the control of the control unit 16.

【0039】フォーマット選択部13の罫線特徴照合部13
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした6つの帳票パターン20,23,26,28,3
1,32 だけをフォーマット選択部14の字種特徴照合部143
dに供給する。このように入力された帳票フォーマット
はこの場合も罫線だけで確定できないので、フォーマッ
ト選択部14でさらに帳票フォーマットの選択処理を行な
う。文字検出部141a、字種認識部143bおよびメモリ部14
1cは、制御部16の制御によって罫線特徴検出部131a、罫
線分析部131bおよびメモリ部131cと同時並行処理され
る。文字検出部141aは、図3の帳票37から特徴となる文
字を検出する。字種認識部143bは検出された文字“0123
456 ”の字種認識を行なうことによって文字記載位置と
ともに字種内容として数字を得る。これらのデータがメ
モリ部141cに格納される。字種特徴照合部143dは、メモ
リ部141cに格納されているデータと罫線特徴照合部131d
から供給される6つの帳票パターン20,23,26,28,31,32
との照合を行なう。この照合処理によって帳票37は、文
字記載位置および記載内容(字種:数字)の一致から、
図2の帳票パターン26が帳票フォーマットとして選択さ
れる。字種特徴照合部143dは、分類されたフォーマット
を最も確からしいものとして出力端子17を介して出力す
る。
Ruled line feature collating section 13 of format selecting section 13
1d performs collation of a form pattern that matches data from the memory unit 131c. Matching result, ruled line feature matching unit 13
1d is the matched six form patterns 20,23,26,28,3
Character type matching section 143 of format selection section 14 for only 1 and 32
Supply d. In this case, the form format input in this way cannot be determined only by the ruled lines, and the format selection unit 14 further performs a form format selection process. Character detection unit 141a, character type recognition unit 143b, and memory unit 14
1c is processed concurrently with the ruled line feature detecting unit 131a, the ruled line analyzing unit 131b, and the memory unit 131c under the control of the control unit 16. The character detection unit 141a detects a character characterizing the form 37 in FIG. The character type recognition unit 143b detects the detected character “0123
By performing character type recognition of 456 ", a number is obtained as the character type content together with the character description position. These data are stored in the memory unit 141c. The character type characteristic matching unit 143d is stored in the memory unit 141c. Data and ruled line feature matching unit 131d
Form patterns 20, 23, 26, 28, 31, 32 supplied from
Is checked against By this collation processing, the form 37 is determined based on the matching of the character description position and the description content (character type: number).
The form pattern 26 in FIG. 2 is selected as the form format. The character type matching unit 143d outputs the classified format via the output terminal 17 as the most likely one.

【0040】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
As a result, the image identification apparatus 10 can reduce errors in format classification, shorten the processing time even if the number of forms is increased, and improve the identification processing capability of the apparatus.

【0041】次に第4の具体例として画像識別装置10に
は第1の画像の特徴に罫線、第2の画像の特徴に黒点を
用いて照合する場合がある。この場合、フォーマット選
択部13は第1の具体例と同じ構成の罫線特徴検出部131
a、罫線分析部131b、メモリ部131c、および罫線特徴照
合部131dを有し、フォーマット選択部14は黒点検出部14
4a、黒点カウント部144b、メモリ部141c、および黒点特
徴照合部144dを有している。
Next, as a fourth specific example, there is a case where the image discriminating apparatus 10 performs collation using a ruled line as a feature of the first image and a black point as a feature of the second image. In this case, the format selection unit 13 includes a ruled line feature detection unit 131 having the same configuration as that of the first specific example.
a, a rule line analyzing unit 131b, a memory unit 131c, and a rule line feature matching unit 131d, and the format selecting unit 14
4a, a black point counting section 144b, a memory section 141c, and a black point feature matching section 144d.

【0042】黒点検出部144aは、たとえば予め設定され
た検出領域を黒点の検出領域とし、この検出領域毎に画
像メモリ部12から供給される画像データ(の黒点)をサ
ンプリングする。黒点カウント部144bはこのサンプリン
グされたデータから帳票に記されていた文字および記号
等のデータを取り除き、黒点の領域位置に対応させなが
ら検出された黒点数をカウントする。メモリ部141cは黒
点カウント部144bの検出位置に対応して得られたカウン
ト結果を格納する。黒点特徴照合部144dは制御部16の制
御により罫線特徴照合部131dとメモリ部131cからそれぞ
れ供給されるデータの照合を行なう。
The black point detecting section 144a, for example, sets a predetermined detection area as a black point detection area, and samples (the black point of) the image data supplied from the image memory section 12 for each detection area. The black point counting unit 144b removes data such as characters and symbols written on the form from the sampled data, and counts the number of black points detected while corresponding to the black dot area position. The memory unit 141c stores the count result obtained corresponding to the detection position of the black point counting unit 144b. The black point feature matching unit 144d performs matching of data supplied from the ruled line feature matching unit 131d and the memory unit 131c under the control of the control unit 16.

【0043】ここで、図3の帳票38が画像識別装置10の
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。
Here, when the form 38 in FIG. 3 is input to the image input unit 11 of the image identification device 10, the converted image data is output to the image memory unit 12 via the image input unit 11. The image memory unit 12 supplies the image data to the format selection units 13 and 14 under the control of the control unit 16.

【0044】フォーマット選択部13の罫線特徴照合部13
1dはメモリ部131cからのデータにマッチングする帳票パ
ターン20,23,26,28,31,32 の照合を行なう。照合の結
果、罫線特徴照合部131dはマッチングした6つの帳票パ
ターン20,23,26,28,31,32 だけをフォーマット選択部14
の黒体特徴照合部144dに供給する。このように入力され
た帳票フォーマットはこの場合も罫線だけで確定できな
いので、フォーマット選択部14でさらに帳票フォーマッ
トの選択処理を行なう。黒点検出部144a、黒点カウント
部144bおよびメモリ部141cは、制御部16の制御によって
罫線特徴検出部131a、罫線分析部131bおよびメモリ部13
1cと同時並行処理される。黒点検出部144aは、図3の帳
票38から特徴となる黒点の検出をサンプリング領域毎に
行なう。黒点カウント部144bは黒点検出部144aで検出さ
れた黒点をカウントすることによって黒点領域38a でカ
ウント値“1050”を得る。これらのデータがメモリ部14
1cに格納される。黒点特徴照合部144dは、メモリ部141c
に格納されているデータと罫線特徴照合部131dから供給
される6つの帳票パターン20,23,26,28,31,32 との照合
を行なう。この照合処理によって黒点特徴照合部144dは
帳票38で黒点検出領域の位置およびカウント値“1050”
がカウントされたことから、図2の1000個以上の黒点を
有する帳票パターン31を帳票フォーマットとして選択す
る。黒点特徴照合部144dは、分類されたフォーマットを
最も確からしいものとして出力端子17を介して出力す
る。
The ruled line feature comparison unit 13 of the format selection unit 13
1d performs collation of the form patterns 20, 23, 26, 28, 31, 32 matching the data from the memory unit 131c. As a result of the matching, the ruled line feature matching unit 131d selects only the six matched form patterns 20, 23, 26, 28, 31, 32 in the format selecting unit 14.
Is supplied to the black body feature collating unit 144d. In this case, the form format input in this way cannot be determined only by the ruled lines, and the format selection unit 14 further performs a form format selection process. The black point detection unit 144a, the black point counting unit 144b, and the memory unit 141c are controlled by the control unit 16 to include a ruled line feature detection unit 131a, a ruled line analysis unit 131b, and a memory unit 13.
Processed concurrently with 1c. The black point detector 144a detects a characteristic black point from the form 38 in FIG. 3 for each sampling area. The black point counting section 144b counts the black points detected by the black point detecting section 144a to obtain a count value “1050” in the black point area 38a. These data are stored in the memory unit 14
Stored in 1c. The black point feature matching unit 144d is a memory unit 141c
Is compared with the six form patterns 20, 23, 26, 28, 31, 32 supplied from the ruled line feature matching unit 131d. As a result of this collation processing, the black point feature collation unit 144d uses the form 38 to determine the position of the black point detection area and the count value “1050”.
Are counted, the form pattern 31 having 1000 or more black spots in FIG. 2 is selected as the form format. The black point feature matching unit 144d outputs the classified format as the most likely one via the output terminal 17.

【0045】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
Thus, the image identification device 10 can reduce errors in format classification, shorten the processing time even if the number of forms is increased, and improve the identification processing capability of the device.

【0046】最後に第5の具体例として画像識別装置10
には第1の画像の特徴に罫線、第2の画像の特徴に図形
パターンを用いて照合する場合がある。この場合、フォ
ーマット選択部13は罫線特徴検出部131a、罫線分析部13
1b、メモリ部131c、および罫線特徴照合部131dを有し、
フォーマット選択部14は黒点検出部144a、図形パターン
認識部145b、メモリ部141c、および図形パターン特徴照
合部145dを有している。
Finally, as a fifth specific example, the image identifying apparatus 10
In some cases, matching is performed using a ruled line as a feature of the first image and a graphic pattern as a feature of the second image. In this case, the format selection unit 13 includes a ruled line feature detection unit 131a and a ruled line analysis unit 13a.
1b, a memory unit 131c, and a ruled line feature matching unit 131d,
The format selection unit 14 includes a black point detection unit 144a, a graphic pattern recognition unit 145b, a memory unit 141c, and a graphic pattern feature matching unit 145d.

【0047】黒点検出部144aは、第4の具体例で説明し
たようにたとえば予め設定された検出領域を黒点の検出
領域とし、この検出領域毎に画像メモリ部12から供給さ
れる画像データ(の黒点)をサンプリングする。図形パ
ターン認識部145bはこのサンプリングされたデータから
帳票に記されていた文字および記号等のデータを取り除
き、黒点の領域位置に対応させながら検出された黒点を
基に図形パターンの認識処理を行なう。メモリ部141cは
図形パターン認識部145bの検出位置に対応して得られた
パターン認識結果を格納する。図形パターン特徴照合部
145dは制御部16の制御により罫線特徴照合部131dとメモ
リ部131cからそれぞれ供給されるデータの照合を行な
う。
As described in the fourth specific example, the black point detection section 144a sets a predetermined detection area as a black point detection area, and outputs image data supplied from the image memory section 12 for each detection area. (Spot) is sampled. The graphic pattern recognizing unit 145b removes data such as characters and symbols recorded on the form from the sampled data, and performs a graphic pattern recognition process on the basis of the detected black point while corresponding to the black dot area position. The memory unit 141c stores a pattern recognition result obtained corresponding to the detection position of the graphic pattern recognition unit 145b. Figure pattern feature matching unit
A control unit 145d checks the data supplied from the ruled line feature checking unit 131d and the data supplied from the memory unit 131c under the control of the control unit 16.

【0048】ここで、図3の帳票39が画像識別装置10の
画像入力部11に入力されると、画像入力部11を介して変
換された画像データが画像メモリ部12に出力される。画
像メモリ部12は、制御部16の制御により画像データをフ
ォーマット選択部13、14に供給する。
Here, when the form 39 of FIG. 3 is input to the image input unit 11 of the image identification device 10, the converted image data is output to the image memory unit 12 via the image input unit 11. The image memory unit 12 supplies the image data to the format selection units 13 and 14 under the control of the control unit 16.

【0049】フォーマット選択部13の罫線特徴照合部13
1dはメモリ部131cからのデータにマッチングする帳票パ
ターンの照合を行なう。照合の結果、罫線特徴照合部13
1dはマッチングした4つの帳票パターン22,25,30,34 だ
けをフォーマット選択部14の図形パターン特徴照合部14
5dに供給する。このように入力された帳票フォーマット
はこの場合も罫線だけで確定できないので、フォーマッ
ト選択部14でさらに帳票フォーマットの選択処理を行な
う。黒点検出部144a、図形パターン認識部145bおよびメ
モリ部141cは、制御部16の制御によって罫線特徴検出部
131a、罫線分析部131bおよびメモリ部131cと同時並行処
理される。黒点検出部144aは、図3の帳票39から特徴と
なる黒点の検出を領域毎に行なう。図形パターン認識部
145bでは黒点検出部144aで検出された黒点を基にパター
ン認識することによって黒点領域39a 内にその領域に記
載された図形が得られる。これらのデータがメモリ部14
1cに格納される。図形パターン特徴照合部145dは、メモ
リ部141cに格納されているデータと罫線特徴照合部131d
から供給される4つの帳票パターン22,25,30,34 との照
合を行なう。この照合処理によって帳票39は、黒点領域
の位置および記載内容(パターン図形)の一致から、図
2の帳票パターン34が帳票フォーマットとして選択され
る。図形パターン特徴照合部145dは、分類されたフォー
マットを最も確からしいものとして出力端子17を介して
出力する。
Ruled line feature comparison unit 13 of format selection unit 13
1d performs collation of a form pattern that matches data from the memory unit 131c. Matching result, ruled line feature matching unit 13
1d designates only the matched four form patterns 22, 25, 30, and 34 as the figure pattern feature matching unit 14 of the format selecting unit 14.
Supply 5d. In this case, the form format input in this way cannot be determined only by the ruled lines, and the format selection unit 14 further performs a form format selection process. The black point detection unit 144a, the graphic pattern recognition unit 145b, and the memory unit 141c are controlled by the control unit 16 to control the ruled line feature.
131a, the ruled line analyzing unit 131b, and the memory unit 131c are processed simultaneously and in parallel. The black point detecting unit 144a detects a characteristic black point from the form 39 in FIG. 3 for each area. Figure pattern recognition unit
In 145b, a pattern described in the black point area 39a is obtained in the black point area 39a by performing pattern recognition based on the black point detected by the black point detection unit 144a. These data are stored in the memory unit 14
Stored in 1c. The graphic pattern feature matching unit 145d includes the data stored in the memory unit 141c and the ruled line feature matching unit 131d.
Is collated with the four form patterns 22, 25, 30, and 34 supplied from. As a result of this collation processing, the form pattern 34 of FIG. 2 is selected as the form format for the form 39 from the position of the black spot area and the coincidence of the description contents (pattern figure). The graphic pattern feature matching unit 145d outputs the classified format as the most likely one via the output terminal 17.

【0050】これにより、画像識別装置10はフォーマッ
ト分類の誤りを減少させ、帳票の種類を増加させても処
理時間を短縮化でき、装置の識別処理能力を向上させる
ことができる。
Thus, the image identification device 10 can reduce errors in format classification, shorten the processing time even if the number of forms is increased, and improve the identification processing capability of the device.

【0051】また、この画像識別装置10の変形例として
たとえば帳票のサイズ/色(すなわち背景色)/地紋の
識別を行なう構成を簡単に説明する。この画像識別装置
10には画像入力部11に色を含めて検出可能なカラーイメ
ージスキャナを用いる。特に、色/地紋の識別にはフォ
ーマット選択部13、14で行なう色検出を画像入力部11で
行なう。フォーマット選択部13、14のいずれか一方に設
けた色認識部は、画像メモリ部12が出力する画像データ
から罫線・文字を抽出処理し、画像データから抽出した
罫線・文字の除去されたデータを基にこのデータ内で最
も広く分布する色を帳票の色とする認識処理を行なう。
また、フォーマット選択部13、14のいずれか他方に設け
た地紋認識部は、たとえば単位面積あたりに分布する黒
点量を設定したある閾値で判定して地紋の有無の認識処
理を行なう。さらに、地紋認識部からの出力を基にパタ
ーン認識も行なって、フォーマット記憶部15に格納され
たパターンと照合させることにより、確度の高いフォー
マットの特定を可能にし、かつ特定可能なシートの種類
を増加させることが可能になる。
As a modified example of the image identification apparatus 10, a configuration for identifying, for example, the size / color (ie, background color) / background pattern of a form will be briefly described. This image identification device
For 10, a color image scanner that can detect the color including the color in the image input unit 11 is used. In particular, for color / forgery-inhibited pattern identification, the image input unit 11 performs color detection performed by the format selection units 13 and 14. The color recognition unit provided in one of the format selection units 13 and 14 performs a process of extracting ruled lines and characters from the image data output by the image memory unit 12, and extracts the data from which the ruled lines and characters extracted from the image data have been removed. Based on this, a recognition process is performed in which the most widely distributed color in the data is set as the color of the form.
In addition, the copy-forgery-inhibited pattern recognition unit provided in one of the format selection units 13 and 14 performs recognition processing of the presence or absence of a copy-forgery-inhibited pattern by determining, for example, the amount of black spots distributed per unit area using a set threshold. Further, by performing pattern recognition based on the output from the copy-forgery-inhibited pattern recognition unit and comparing it with the pattern stored in the format storage unit 15, it is possible to specify a format with high accuracy, and to specify the type of sheet that can be specified. It becomes possible to increase.

【0052】帳票のサイズを分類する場合、画像入力部
11は、たとえば黒領域(帳票のない領域)と白領域(帳
票)の境界を検出する。得られたデータを基にフォーマ
ット選択部13、14のいずれか一方では帳票サイズの算出
処理を行なう。この帳票サイズもフォーマットを照合す
るための一要素として用いることもできる。
When classifying the form size, the image input unit
11 detects a boundary between a black area (area without a form) and a white area (form), for example. Based on the obtained data, one of the format selection units 13 and 14 performs a form size calculation process. This form size can also be used as one element for collating the format.

【0053】この変形例によれば、帳票に限定されず、
帳票以外でファイル管理が要求される書類を簡単に分類
してファイリングさせることが可能になる。
According to this modification, the present invention is not limited to the form,
Documents requiring file management other than forms can be easily classified and filed.

【0054】なお、本実施例の具体例では、一方の画像
の特徴として罫線を用いさらに罫線以外のもう一つの画
像の特徴で帳票を識別し分類してきたが、罫線以外の画
像の特徴を複数組合せても帳票フォーマットを特定させ
ることができる。また、本実施例では、画像の特徴の照
合をカスケード的に行なってきたが、前述した実施例に
限定されるものでなく、各画像の特徴の検出および認識
処理を並列に行なわせ、得られたこれらの認識結果に最
も合致するフォーマットの候補をフォーマット記憶部15
から選択するような構成にしてもよい。本発明は、本発
明の概念を用いた装置、たとえばファクシミリ装置(FA
X )にも適用できることは言うまでもなく、データ受信
の結果(フォーマット、文字データおよび数値データ)
をそのまま外部記憶装置に保存させることができる。
In the specific example of this embodiment, a ruled line is used as a feature of one image, and the form is identified and classified by a feature of another image other than the ruled line. The form format can be specified by the combination. Further, in the present embodiment, the matching of the features of the images has been performed in a cascade manner. However, the present invention is not limited to the above-described embodiment. The format candidate that best matches these recognition results is stored in the format storage unit 15.
It may be configured to select from. The present invention relates to an apparatus using the concept of the present invention, for example, a facsimile apparatus (FA).
X) It goes without saying that the result of data reception (format, character data and numeric data)
Can be directly stored in the external storage device.

【0055】このように構成にすることにより、画像識
別装置10は、入力画像が有するフォーマットの識別能力
および識別の所要時間短縮を従来の能力よりも向上させ
ることができるので、たとえば大量の書類等の事務処理
に要する人件費を大幅に節約させることができる。
With this configuration, the image identification device 10 can improve the identification capability of the format of the input image and the shortening of the time required for identification as compared with the conventional capability. The labor costs required for the paperwork can be greatly reduced.

【0056】[0056]

【発明の効果】このように本発明の画像識別装置よれ
ば、制御手段により画像情報記憶手段、第1および第2
のフォーマット選択手段、およびフォーマット記憶手段
の動作をそれぞれ制御し、画像入力手段から供給される
画像情報を画像情報記憶手段に一時的に記憶させ、フォ
ーマット記憶手段から供給されるフォーマットの候補と
第1のフォーマット選択手段および第2のフォーマット
選択手段での検出結果とを照合させ、入力画像が有する
フォーマットの識別能力および識別の所要時間短縮を従
来の能力よりも向上させて、画像の特徴の似たシートが
入力されても該当するフォーマットの候補を的確に選択
することができることにより、たとえば大量の書類等の
事務処理に要する人件費を大幅に節約させることができ
る。
As described above, according to the image identification device of the present invention, the control means controls the image information storage means, the first and second image information storage means.
Controls the operations of the format selection unit and the format storage unit, and temporarily stores the image information supplied from the image input unit in the image information storage unit. And comparing the detection results of the format selection means and the second format selection means with each other, and improving the ability to identify the format of the input image and the reduction in the time required for the identification as compared with the conventional ability, so that the characteristics of the image are similar. Even if a sheet is input, the corresponding format candidate can be selected accurately, thereby greatly reducing the labor cost required for paperwork such as a large amount of documents.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る画像識別装置の一実施例の構成を
示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an embodiment of an image identification device according to the present invention.

【図2】図1に示したファイル記憶部に登録されている
フォーマットの候補の例を表す説明図である。
FIG. 2 is an explanatory diagram illustrating an example of a format candidate registered in a file storage unit illustrated in FIG. 1;

【図3】図1に示した画像識別装置の画像入力部が読み
取る帳票の例を表す説明図である。
FIG. 3 is an explanatory diagram showing an example of a form read by an image input unit of the image identification device shown in FIG.

【図4】図1に示した画像識別装置の第1の具体例を示
すブロック図である。
FIG. 4 is a block diagram illustrating a first specific example of the image identification device illustrated in FIG. 1;

【図5】同画像識別装置の第2の具体例を示すブロック
図である。
FIG. 5 is a block diagram showing a second specific example of the image identification device.

【図6】同画像識別装置の第3の具体例を示すブロック
図である。
FIG. 6 is a block diagram showing a third specific example of the image identification device.

【図7】同画像識別装置の第4の具体例を示すブロック
図である。
FIG. 7 is a block diagram showing a fourth specific example of the image identification device.

【図8】同画像識別装置の第5の具体例を示すブロック
図である。
FIG. 8 is a block diagram showing a fifth specific example of the image identification device.

【符号の説明】[Explanation of symbols]

10 画像識別装置 11 画像入力部 12 画像メモリ部 13,14 フォーマット選択部 15 フォーマット記憶部 16 制御部 10 Image identification device 11 Image input unit 12 Image memory unit 13,14 Format selection unit 15 Format storage unit 16 Control unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 濃淡で表された画像情報を画像入力手段
を介して読み込み、該画像情報に含まれる画像の特徴を
検出し、得られた画像の特徴に対応するフォーマットを
識別する画像識別装置において、該装置は、 該画像入力手段から供給される画像情報を一時的に記憶
する画像情報記憶手段と、 該画像情報から検出される第1の画像の特徴を含むフォ
ーマットの候補を選択する第1のフォーマット選択手段
と、 該第1のフォーマット選択手段から供給されるフォーマ
ットの候補と該画像情報に含まれる第2の画像の特徴に
関する検出結果とを照合してフォーマットを選択する第
2のフォーマット選択手段と、 該第1のフォーマット選択手段に供給される複数のフォ
ーマットの候補を記憶するフォーマット記憶手段と、 該画像情報記憶手段、該第1および該第2のフォーマッ
ト選択手段、および該フォーマット記憶手段の動作を制
御する制御手段とを有することを特徴とする画像識別装
置。
1. An image identification device which reads image information represented by shading via an image input means, detects characteristics of an image included in the image information, and identifies a format corresponding to the characteristics of the obtained image. , The apparatus comprises: an image information storage unit for temporarily storing image information supplied from the image input unit; and a second unit for selecting a format candidate including a feature of the first image detected from the image information. A second format for selecting a format by comparing a format candidate supplied from the first format selection unit with a detection result regarding a feature of a second image included in the image information. Selecting means, format storing means for storing a plurality of format candidates supplied to the first format selecting means, image information storing means, The first and the second format selection means, and image identification apparatus characterized by a control means for controlling the operation of said format storage means.
【請求項2】 請求項1に記載の画像識別装置におい
て、前記第1の画像の特徴には、罫線、文字認識、字
体、字種、画像のサイズ、画像の背景色、地紋、図形パ
ターンのうちの少なくとも一項目を選び、 前記第2の画像の特徴には、該第1の画像の特徴で選ん
だ項目と異なる、少なくとも一項目あるいは複数の組み
合わせた項目を選ぶことを特徴とする画像識別装置。
2. The image identification apparatus according to claim 1, wherein the features of the first image include a ruled line, character recognition, font, character type, image size, image background color, copy-forgery-inhibited pattern, and graphic pattern. Image identification, wherein at least one item is selected, and the feature of the second image is selected from at least one item or a combination of a plurality of items different from the item selected in the feature of the first image. apparatus.
【請求項3】 請求項1または2に記載の画像識別装置
において、前記第1の画像の特徴として画像のサイズ、
画像の背景色、および/または地紋が選択された際に
は、前記画像入力手段を記録媒体の色および色の分布を
検出する色検出手段として用いることを特徴とする画像
識別装置。
3. The image identification device according to claim 1, wherein a size of an image, a size of the image,
An image identification apparatus characterized in that when a background color and / or copy-forgery-inhibited pattern of an image are selected, the image input means is used as a color detection means for detecting a color and a color distribution of a recording medium.
JP9177463A 1997-07-02 1997-07-02 Device for identifying picture Withdrawn JPH1125214A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9177463A JPH1125214A (en) 1997-07-02 1997-07-02 Device for identifying picture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9177463A JPH1125214A (en) 1997-07-02 1997-07-02 Device for identifying picture

Publications (1)

Publication Number Publication Date
JPH1125214A true JPH1125214A (en) 1999-01-29

Family

ID=16031380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9177463A Withdrawn JPH1125214A (en) 1997-07-02 1997-07-02 Device for identifying picture

Country Status (1)

Country Link
JP (1) JPH1125214A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7508986B2 (en) 2003-11-28 2009-03-24 Canon Kabushiki Kaisha Document recognition device, document recognition method and program, and storage medium
JP2017090974A (en) * 2015-11-02 2017-05-25 富士ゼロックス株式会社 Image processing device and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7508986B2 (en) 2003-11-28 2009-03-24 Canon Kabushiki Kaisha Document recognition device, document recognition method and program, and storage medium
JP2017090974A (en) * 2015-11-02 2017-05-25 富士ゼロックス株式会社 Image processing device and program

Similar Documents

Publication Publication Date Title
US7295694B2 (en) MICR-based optical character recognition system and method
JP2575539B2 (en) How to locate and identify money fields on documents
EP0472313B1 (en) Image processing method and apparatus therefor
JPH03504423A (en) Document recognition and automatic indexing for optical character recognition
CN106649420A (en) Image processing apparatus and image processing method
AU658839B2 (en) Character recognition methods and apparatus for locating and extracting predetermined data from a document
CN109934213A (en) Bill image recognition methods, device, computer equipment and storage medium
US20010043742A1 (en) Communication document detector
EP1202213B1 (en) Document format identification apparatus and method
JP2003305927A (en) Printer inspection system
JPH07182448A (en) Character recognition method
JP2574994B2 (en) Optical character recognition method and apparatus
JPH1125214A (en) Device for identifying picture
JP2003087562A (en) Image processor and image processing method
JP4356908B2 (en) Automatic financial statement input device
US20130272610A1 (en) Image Processing Apparatus that Groups Objects Within Image
JP3648050B2 (en) Form image classification method, form image registration method, and form image classification apparatus
JP3435374B2 (en) Character reading device and character recognition method
US6049637A (en) System and method for automated data capture of sequential form numbers at a collator/press assembly machine using an optical reader which does not capture an image of the form number
JPH07152856A (en) Optical character reader
JP2003316802A (en) Image management system, image management method and image management program
JP3266687B2 (en) Mark recognition method
JP3412441B2 (en) Image processing device
JPS5949671A (en) Optical character reader
JP3160458B2 (en) Character reading device and character reading method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040907