JPH09146930A - Optical character recognition device - Google Patents

Optical character recognition device

Info

Publication number
JPH09146930A
JPH09146930A JP7304554A JP30455495A JPH09146930A JP H09146930 A JPH09146930 A JP H09146930A JP 7304554 A JP7304554 A JP 7304554A JP 30455495 A JP30455495 A JP 30455495A JP H09146930 A JPH09146930 A JP H09146930A
Authority
JP
Japan
Prior art keywords
page
line
document image
image pattern
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7304554A
Other languages
Japanese (ja)
Inventor
Yasuhiko Shimizu
保彦 清水
Kazuhiro Ishikawa
和弘 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7304554A priority Critical patent/JPH09146930A/en
Publication of JPH09146930A publication Critical patent/JPH09146930A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To save the time and labor for making an electronic file for storing document image in. SOLUTION: An image read means 11 reads out an information medium and stores its document image pattern in an image storage means 12. A page information input means 20 inputs a starting page number, the total number of pages, and the number of pages of one document image pattern. A page dividing means 30 divides one document image pattern into pages and records page division position information on the respective pages. A line and line- direction detecting means 40 segments a line of the page of the document image pattern and detects the line direction. A page order judging means 50 judges the giving direction of the page from the line direction. A page order giving means 60 gives page numbers to the respective pages according to the page direction. A separating and recognizing means 70 separates and recognizes characters as to the document pattern of the page according to the page division position information and a result storage means 80 stores separation and recognition results in page number order obtained newly by the page order giving means 60. The processes of the separating and recognizing means 70 and result storage means 80 are repeated as many times as all the pages.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、論文、雑誌等の一
般文書の文書画像パタンから文字を読み取り電子ファイ
ルに変換する光学式文字認識装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character recognition device for reading characters from a document image pattern of a general document such as a paper or a magazine and converting the characters into an electronic file.

【0002】[0002]

【従来の技術】従来、このような分野の技術としては、
例えば、次のような文献に記載されるものがあった。 文献;特開昭61−175851号公報 論文、雑誌等の一般文書を読み取り対象とする光学式文
字認識装置における文字認識装置では、情報媒体をイメ
ージスキャナ等の画像読取装置にセットし、その画像読
取装置を介してその情報媒体の文書画像パタンを得る。
その得られた文書画像パタンについて文字図形分離等の
処理を施し、文字と判別された領域について文字を切り
出し認識する(以下、分離認識処理と呼ぶ)。その結果
得られた分離認識処理の結果情報を出力する。画像読取
手段を介して得られた文書画像パタンから分離認識処理
を行う装置として、前記文献に記載されたものがある。
この従来装置では、画像読取装置を介して得られた文書
画像パタン全面について分離認識処理を行う構成になっ
ている。この従来装置は、1頁からなる一般文書の情報
媒体から画像読取装置を介して得られた文書画像パタン
について分離認識処理を行うのに有効である。
2. Description of the Related Art Conventionally, techniques in such a field include:
For example, some documents were described in the following documents. Reference: Japanese Patent Laid-Open No. 61-175851 DISCLOSURE OF THE INVENTION In a character recognition device in an optical character recognition device for reading general documents such as papers and magazines, an information medium is set in an image reading device such as an image scanner, and the image reading is performed. The document image pattern of the information medium is obtained via the device.
The obtained document image pattern is subjected to processing such as character / figure separation, and characters are cut out and recognized in an area determined as a character (hereinafter, referred to as separation recognition processing). The result information of the separation recognition processing obtained as a result is output. There is an apparatus described in the above document as an apparatus that performs a separation recognition process from a document image pattern obtained through an image reading unit.
In this conventional apparatus, separation recognition processing is performed on the entire document image pattern obtained through the image reading apparatus. This conventional apparatus is effective for performing a separation recognition process on a document image pattern obtained from an information medium of a general document consisting of one page through an image reading apparatus.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、従来の
光学式文字認識装置では、例えば、本のような見開き2
頁分からなった一般文書(以下、ブックタイプと呼ぶ)
の情報媒体をイメージスキャナ等の画像読取装置にセッ
トし、その画像読取装置を介して得られた文書画像パタ
ンについて分離認識処理を行うと2頁分の情報が1頁分
の結果情報として保存されてしまう。そのため、頁単位
に結果情報を整理したい場合は、人手により編集しなけ
ればならない。もしくは、ブックタイプの情報媒体をイ
メージスキャナ等の画像読取装置にセットし、その画像
取得情報を介して文書画像パタンを取得する際に1頁づ
つ頁単位に取得して分離認識処理を行わなければならな
いなどといったことが必要となり手間がかかるという問
題点があった。この発明の目的は、迅速でしかも精度良
く頁単位に結果情報の保存が行える光学式文字認識装置
を提供することにある。
However, in the conventional optical character recognition device, for example, a spread 2 such as a book is used.
A general document consisting of pages (hereinafter called the book type)
When the information medium is set in an image reading device such as an image scanner and a document image pattern obtained through the image reading device is subjected to separation recognition processing, two pages of information are saved as one page of result information. Will end up. Therefore, if the result information is to be organized page by page, it must be edited manually. Alternatively, when a book-type information medium is set in an image reading device such as an image scanner and the document image pattern is acquired through the image acquisition information, the document image pattern must be acquired page by page and the separation recognition processing must be performed. There was a problem that it took time and effort because things such as not becoming necessary. An object of the present invention is to provide an optical character recognition device that can store result information page by page quickly and accurately.

【0004】[0004]

【課題を解決するための手段】第1の発明は、前記課題
を解決するために、光学式文字認識装置において、情報
媒体を光学的に読み取って文書画像パタンを画像記憶手
段に記憶する画像読取手段と、前記1つの文書画像パタ
ンを構成する頁に分割し、その頁の頁分割位置情報を算
出する頁分割手段と、前記文書画像パタンから行を切り
出し、その切り出した行の行方向を検出する行・行方向
検出手段と、前記行方向に基づく前記文書画像パタンが
「縦書き文書」であるか「横書き文書」であるかの情報
から、前記1つの文書画像パタンを構成する頁の頁付与
方向を判定する頁順序判定手段と、前記画像記憶手段に
記憶された文書画像パタンを入力し、文字図形の分離処
理と認識処理とを施して、各文字を認識する分離・認識
手段と、前記頁付与方向の順序で前記頁分割位置情報に
基づく頁単位で分離・認識手段により分離・認識された
結果情報を保存する結果保存手段とを、備えている。第
1の発明によれば、以上のように光学式文字認識装置を
構成したので、ページ分割手段により、画像読取手段に
より読み取った1つの文書画像パタンを構成する頁に分
割して、その頁の頁分割位置情報を算出する。行・行方
向検出手段は、文書画像パタンの行方向を検出する。頁
順序判定手段は、行方向に基づいて、文書画像パタンが
「縦書き文書」であるか「横書き文書」であるかを判断
し、例えば、「縦書き文書」の場合には、右の頁から左
の頁へと頁番号の付与方向とし、「横書き文書」の場合
には、左の頁から右の頁へと頁番号の付与方向とする。
結果保存手段は、頁分割位置情報に基づく頁単位で分離
・認識手段により分離・認識された結果情報を保存す
る。従って、前記課題を解決できるのである。
In order to solve the above-mentioned problems, the first aspect of the present invention is an optical character recognition apparatus, in which image reading is performed by optically reading an information medium and storing a document image pattern in an image storage means. Means, a page dividing means for dividing the page forming the one document image pattern, and calculating page division position information of the page, a line is cut out from the document image pattern, and a line direction of the cut line is detected. Pages that form one document image pattern based on the line / line direction detection means and the information indicating whether the document image pattern based on the line direction is a “vertical writing document” or a “horizontal writing document”. A page order determination means for determining the adding direction, a document image pattern stored in the image storage means, a separation / recognition means for recognizing each character by performing character graphic separation processing and recognition processing, With page A result storage unit for storing the separated and recognized result information by the separation and recognition means in units of pages based on the page division position information in the direction of the sequence comprises. According to the first aspect of the invention, since the optical character recognition device is configured as described above, the page dividing unit divides the page into the pages forming one document image pattern read by the image reading unit, The page division position information is calculated. The line / line direction detecting means detects the line direction of the document image pattern. The page order determination means determines, based on the line direction, whether the document image pattern is a "vertical writing document" or a "horizontal writing document". For example, in the case of a "vertical writing document", the right page To the left page, the page number is given, and in the case of a "horizontal writing document", the page number is given from the left page to the right page.
The result storage means stores the result information separated / recognized by the separation / recognition means in page units based on the page division position information. Therefore, the above problem can be solved.

【0005】[0005]

【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示す光学式文字認識
装置の概略の機能ブロック図である。本第1の実施形態
の光学式文字認識装置が従来の光学式文字認識装置と異
なる点は、1つの文書画像パタン中に構成される頁数を
入力する頁情報入力手段20、入力された頁数に従っ
て、1つの文書画像パタン中を構成する頁に分割し、そ
の頁の頁分割情報を算出する頁分割手段30、文書画像
パタンの行の切り出しと切り出した行の行方向を検出す
る行・行方向検出手段40、1つの文書画像パタンの頁
の頁付与順序を判定する頁順序判定手段50、及び頁の
頁順序を付与する頁順序付与手段60を設け、結果保存
手段80は、頁付与方向の順序で頁分割位置情報に基づ
く頁単位で分離・認識手段70による分離認識処理の結
果を保存するようにしたことである。
BEST MODE FOR CARRYING OUT THE INVENTION First Embodiment FIG. 1 is a schematic functional block diagram of an optical character recognition apparatus showing a first embodiment of the present invention. The optical character recognition device of the first embodiment is different from the conventional optical character recognition device in that the page information input means 20 for inputting the number of pages formed in one document image pattern, the input page According to the number, the page is divided into pages constituting one document image pattern, the page dividing means 30 for calculating the page division information of the page, the line cutting of the document image pattern, and the line for detecting the line direction of the cut line. A line direction detection means 40, a page order determination means 50 for determining the page assignment order of pages of one document image pattern, and a page order assignment means 60 for assigning the page order of pages are provided. That is, the result of the separation and recognition processing by the separation / recognition unit 70 is stored for each page in the order of directions based on the page division position information.

【0006】図1に示すように、本第1の実施形態の光
学式文字認識装置は、前処理手段10、頁情報入力手段
20、頁分割手段30、行・行方向検出手段40、頁分
割位置記憶手段50、頁順序判定手段60、頁順序付与
手段60、分離・認識手段70、結果保存手段80、及
び全頁終了判定手段90を備えている。前処理手段10
は、画像読取手段11と画像記憶手段12とを有し、画
像読取手段11の出力側は、画像記憶手段12が接続さ
れている。前処理手段10の画像記憶手段12の出力側
は、頁分割手段30、行・行方向検出手段40、分離・
認識手段70、及び結果保存手段80が接続されてい
る。頁情報入力手段20の出力側は、頁分割手段30、
図示していないが頁順序付与手段60、及び全頁終了手
段90が接続されている。頁分割手段30は、頁分割位
置検出手段31及び頁分割位置記憶手段32を有し、頁
分割位置検出手段31の入力側は、画像記憶手段12が
接続され、頁分割位置検出手段31の出力側は、頁分割
位置記憶手段32が接続されている。頁分割手段30の
出力側は、行・行方向検出手段40及び分離・認識手段
70が接続されている。行・行方向検出手段40の出力
側は、頁順序判定手段50が接続されている。頁順序判
定手段50の出力側は、頁順序付与手段60、及び分離
・認識手段70が接続されている。頁順序付与手段60
及び分離・認識手段70の出力側は、結果保存手段80
が接続され、さらに結果保存手段80の出力側は、全頁
終了判定手段90が接続されている。
As shown in FIG. 1, the optical character recognition apparatus according to the first embodiment has a preprocessing unit 10, a page information input unit 20, a page dividing unit 30, a line / line direction detecting unit 40, and a page dividing unit. A position storage unit 50, a page order determination unit 60, a page order assignment unit 60, a separation / recognition unit 70, a result storage unit 80, and an all page end determination unit 90 are provided. Pretreatment means 10
Has an image reading unit 11 and an image storage unit 12, and the output side of the image reading unit 11 is connected to the image storage unit 12. The output side of the image storage means 12 of the preprocessing means 10 includes a page dividing means 30, a line / row direction detecting means 40, a separation /
The recognition means 70 and the result storage means 80 are connected. The output side of the page information input means 20 includes a page dividing means 30,
Although not shown, a page order giving means 60 and an all page ending means 90 are connected. The page dividing means 30 has a page dividing position detecting means 31 and a page dividing position storing means 32. An image storing means 12 is connected to an input side of the page dividing position detecting means 31 and an output of the page dividing position detecting means 31. The page division position storage means 32 is connected to the side. A row / row direction detecting means 40 and a separating / recognizing means 70 are connected to the output side of the page dividing means 30. The page order determination means 50 is connected to the output side of the line / row direction detection means 40. To the output side of the page order determination means 50, a page order assignment means 60 and a separation / recognition means 70 are connected. Page order giving means 60
The output side of the separation / recognition means 70 is the result storage means 80.
Is connected, and the output side of the result storage means 80 is connected to the all-page end determination means 90.

【0007】前処理手段10は、文書画像パタンとその
文書画像パタンの大きさを得る機能を有し、頁情報入力
手段20は、最初の頁付与番号、全体の頁付与数、取得
した1つの文書画像パタン中に構成されている頁数を人
手により入力する機能を有している。特に、以下、頁情
報入力手段20中の頁数を入力する機能に関わる手段を
頁数入力手段と呼ぶ。頁分割手段30は、入力された頁
数に従って、文書画像パタンを頁単位に分割して、頁の
分割位置情報を算出する機能を有し、行・行方向検出手
段40は、分割された各頁の行と行方向を検出する機能
を有する。分離・認識手段70は、順次分割された頁単
位の文書画像パタンについて文字画像の分離・認識処理
を行う機能を有し、結果保存手段80は、入力された最
初の頁付与番号に従って、順次、頁付与番号に対応し
て、頁単位に得られた分離認識処理の結果情報を保存す
る機能を有する。全頁終了判定手段90は、全体の頁付
与数分の結果情報が得られるまで前処理手段10、頁分
割手段30、分離・認識手段70、結果保存手段80と
を繰り返し行うように制御する機能を有する。
The preprocessing means 10 has a function of obtaining a document image pattern and the size of the document image pattern, and the page information input means 20 has a first page assignment number, the total number of page assignments, and one acquired page number. It has a function of manually inputting the number of pages configured in the document image pattern. In particular, hereinafter, means relating to the function of inputting the number of pages in the page information input means 20 will be referred to as page number input means. The page dividing unit 30 has a function of dividing the document image pattern into page units according to the input number of pages and calculating page division position information. The line / line direction detecting unit 40 divides each of the divided pages. It has the function of detecting the line and the line direction of a page. The separation / recognition means 70 has a function of performing separation / recognition processing of character images for sequentially divided page-by-page document image patterns, and the result storage means 80 sequentially according to the input first page assignment number, It has a function of storing the result information of the separation recognition processing obtained for each page corresponding to the page number. The all-page end determination unit 90 has a function of controlling the preprocessing unit 10, the page division unit 30, the separation / recognition unit 70, and the result storage unit 80 to be repeatedly executed until the result information corresponding to the total number of pages is obtained. Have.

【0008】以下、図1の動作の説明((a)〜
(i))をする。 (a) 前処理手段10 前処理手段10中の画像読取手段(例えば、イメージス
キャナなど)11は、論文や雑誌等の一般文書の情報媒
体の所定の範囲を光学的に走査し、この媒体からの光信
号を光電変換して量子化、例えば、2値化された電気信
号(文書画像パタン)を出力する。また、同時に走査し
て得た文書画像パタンの大きさ(例えば、幅及び高さの
情報)を出力する。画像記憶手段12は、その出力され
た文書画像パタンを格納する。画像記憶手段12のメモ
リ上には2次元(X,Y)の座標系を仮想的に設定し、
その座標系で表される位置の画素の画像データを画像記
憶手段12のメモリから読み出すことができるようにし
ている。 (b) 頁情報入力手段20 頁情報入力手段(例えば、キーボードなど)20に、最
初の頁付与番号、全体の頁付与数、取得した1つの文書
画像パタン中に構成されている頁数などを人手により入
力する。例えば、ブックタイプの情報媒体をイメージス
キャナ等の画像読取手段11にセットし、そのブックタ
イプの情報媒体の最初の頁付与番号、例えば、「1頁目
から」という情報と、何頁にもわたって頁をめくりなが
らその都度、画像読取手段11を介して文書画像パタン
を得、その文書画像パタンについて分割認識処理を行い
その結果情報を保存する場合における全体の頁付与数、
例えば、「全体で50頁」という情報と、画像読取手段
11を介して得られた1つの文書画像パタンについて、
その文書画像パタン中に構成されている頁数、例えば、
「2頁からなる」といった情報などを、例えば、人手に
よりキーボードなどを介して入力する。
The operation of FIG. 1 will be described below ((a)-
(I)). (A) Pre-Processing Means 10 Image reading means (for example, an image scanner) 11 in the pre-processing means 10 optically scans a predetermined range of an information medium for general documents such as papers and magazines, and reads from this medium. Of the optical signal is photoelectrically converted and quantized, for example, a binarized electric signal (document image pattern) is output. In addition, the size (for example, width and height information) of the document image pattern obtained by scanning at the same time is output. The image storage means 12 stores the output document image pattern. A two-dimensional (X, Y) coordinate system is virtually set on the memory of the image storage means 12,
The image data of the pixel at the position represented by the coordinate system can be read from the memory of the image storage means 12. (B) Page information input means 20 The page information input means (for example, keyboard) 20 is used to store the initial page number, the total number of pages, the number of pages configured in one acquired document image pattern, and the like. Input manually. For example, a book-type information medium is set on the image reading means 11 such as an image scanner, and the first page-assigned number of the book-type information medium, for example, the information "from the first page" and the number of pages are spread. The number of pages added in the case where a document image pattern is obtained through the image reading means 11 each time the page is turned over and the document image pattern is subjected to division recognition processing and the result information is stored.
For example, regarding the information “50 pages in total” and one document image pattern obtained through the image reading unit 11,
The number of pages configured in the document image pattern, for example,
Information such as "consisting of two pages" is manually input through a keyboard or the like.

【0009】(c) 頁分割手段30 頁分割手段30中の頁分割位置記憶手段31は、頁情報
入力手段20中の頁数入力手段により入力された1つの
文書画像パタン中に構成されている頁数に従って、文書
画像パタンを頁単位に分割し、その分割して得られた各
頁の頁位置情報を出力する。頁分割位置記憶手段32
は、その出力された各頁の頁位置情報(例えば、各頁の
頁左上角座標及び頁右下角座標で示される大きさ)を格
納する。ここでは、頁数入力手段により入力された頁数
に従って、頁分割しているので、頁分割が確実を行うこ
とができる(例えば、頁の局部的な汚れを頁分割位置を
判別するための画像パタンと誤って判断することがなく
なる)。頁分割は、例えば、特願平6−300502号
明細書に示す方法により可能である。 (d) 行・行方向検出手段40 頁分割手段30により得られた各頁領域の画像におい
て、文字領域の抽出処理、行検出処理、行方向検出処理
を行う。これらの検出処理技術については、例えば、特
願平6−24404号明細書に示す方法により可能であ
る。
(C) Page dividing means 30 The page dividing position storing means 31 in the page dividing means 30 is configured in one document image pattern input by the page number input means in the page information input means 20. The document image pattern is divided into pages according to the number of pages, and the page position information of each page obtained by the division is output. Page division position storage means 32
Stores the output page position information of each page (for example, the size indicated by the upper left corner coordinate and the lower right corner coordinate of each page). Here, since the page division is performed according to the number of pages input by the page number input means, the page division can be surely performed (for example, an image for discriminating the local stain of the page from the page division position). It will not be mistakenly judged as a pattern). The page division can be performed, for example, by the method described in Japanese Patent Application No. 6-300502. (D) Line / line direction detection means 40 In the image of each page area obtained by the page division means 30, character area extraction processing, line detection processing, and line direction detection processing are performed. These detection processing techniques can be performed, for example, by the method described in Japanese Patent Application No. 6-24404.

【0010】(e) 頁付与順序判定手段50 頁付与判定手段50は、一般文書は「横書きの頁付与順
序は左から右へ」、「縦書きの文書の頁付与順序は右か
ら左へ」という特徴があることに着目し、行・行方向検
出手段40により得られた文書の行方向(縦又は横)
が、縦方向の場合は分割された右の頁領域の頁番号が小
さく、左の頁領域の頁番号が大きいと判定し、横方向の
時は左の頁領域の頁番号が小さく、右の頁領域の頁番号
が大きいと判定する。 (f) 頁順序付与手段60 頁順序付与手段60は、頁分割手段30により分割され
た各頁領域に、頁情報入力手段20により入力された最
初の頁付与番号と、頁付与順序判定手段50から得られ
た頁順序に従って頁番号を付与する。 (g) 分離・認識手段70 分離・認識手段70は、頁順序判定手段50により得ら
れた頁順序付与方向に従い、頁分割手段30によって得
られた各頁の頁位置情報をもとに、画像記憶手段12に
記憶された文書画像パタンから順次各頁における1頁分
(頁左上角座標及び頁右下角座標で示される大きさ)の
頁画像パタンを得る。そして、その頁画像パタンについ
て、文字図形の分離・認識処理を行う。分離・認識処理
については、例えば、特開昭61−175875号公報
に開示されている技術により実現できる。
(E) Page addition order determination means 50 The page addition determination means 50 determines that a general document has "horizontal writing page addition order from left to right" and "vertical writing page addition order from right to left". The line direction (vertical or horizontal) of the document obtained by the line / line direction detection means 40
However, in the case of the vertical direction, the page number of the divided right page area is small, it is determined that the page number of the left page area is large, when the horizontal direction, the page number of the left page area is small, It is determined that the page number of the page area is large. (F) Page Order Assigning Unit 60 The page order assigning unit 60 includes the first page assigning number input by the page information inputting unit 20 and the page assigning order determining unit 50 in each page area divided by the page dividing unit 30. The page numbers are given according to the page order obtained from. (G) Separation / Recognition Means 70 The separation / recognition means 70 follows the page ordering direction obtained by the page order determination means 50 and based on the page position information of each page obtained by the page division means 30 From the document image patterns stored in the storage means 12, page image patterns for one page (sizes indicated by upper left corner coordinates and lower right corner coordinates of pages) are sequentially obtained. Then, with respect to the page image pattern, character / graphic separation / recognition processing is performed. The separation / recognition process can be realized by, for example, the technique disclosed in Japanese Patent Laid-Open No. 61-175875.

【0011】(h) 結果保存手段80 結果保存手段80は、頁順序付与手段60より付与され
た頁付与番号に従って、分離認識手段70で得られた各
頁の頁画像パタンについて分離・認識処理を行った結果
情報を頁単位に順次保存する。このとき、文字図形の認
識した結果情報に誤りがあれば、人手により修正すると
してもよい。結果保存手段80は、例えば、最初の頁付
与番号が例えば、「1頁目から」とし、1つの文書画像
パタン中に構成されている頁数が例えば、「2頁からな
る」とした場合、画像読取手段11を介して1回目に得
た1つの文書画像パタンにおける結果情報は頁付与方向
に従って、1頁目と2頁目の結果情報としてそれぞれ保
存し、次にまた画像読取手段11を介して2回目に得た
1つの文書画像パタンにおける結果情報は頁付与方向に
従って、3頁目と4頁目の結果情報としてそれぞれ電子
ファイルなどに保存するといった要領で順次繰り返し行
う。 (i) 全頁終了判定手段90 以上の分離認識手段70、及び結果保存手段80の処理
を1つの文書画像パタンについて、その文書画像バタン
中に構成されている頁分の頁画像パタンについて行う。
次に、頁情報入力手段20より入力された全体の頁付与
数分全てについて行ったか否かを判断し、行っていなけ
れば、次の文書画像パタンについて処理を行うために前
処理手段10に戻る。全体の頁付与数分全てについて、
行っていれば、処理を終了する。
(H) Result storage means 80 The result storage means 80 performs separation / recognition processing on the page image pattern of each page obtained by the separation recognition means 70 in accordance with the page number assigned by the page order assigning means 60. The result information obtained is sequentially stored page by page. At this time, if there is an error in the recognition result information of the character graphic, it may be manually corrected. The result storage unit 80, for example, when the first page number is "from page 1" and the number of pages configured in one document image pattern is "from page 2", The result information in one document image pattern obtained first time through the image reading means 11 is saved as the result information of the first page and the second page respectively according to the page giving direction, and then through the image reading means 11 again. The result information in the one document image pattern obtained the second time is sequentially and repeatedly stored in an electronic file or the like as the result information of the third page and the fourth page according to the page giving direction. (I) All-Page End Determination Means 90 The processes of the separation recognition means 70 and the result storage means 80 are performed for one document image pattern, and for page image patterns for the pages configured in the document image pattern.
Next, it is judged whether or not all of the page-added numbers input by the page information input unit 20 have been processed. If not, the process returns to the pre-processing unit 10 to process the next document image pattern. . For all pages added,
If so, the process ends.

【0012】また、1つの文書画像パタンについて、そ
の文書画像パタン中に構成されている各頁について処理
を行う順番は、頁順序判定手段50により判定された頁
順序に従って行う。以上説明したように、本第1の実施
形態によれば、例えば、ブックタイプの情報媒体をイメ
ージスキャナ等の画像読取手段にセットし、その画像読
取手段を介して得られた文書画像パタンについて処理を
行う場合でも、頁順序の方向を指定しなくても2頁分の
結果情報が頁単位に正しい頁順序で保存されるので、従
来のように頁単位に結果情報を整理したい場合は人手に
より編集しなければない、1頁づつ頁単位に文書画像パ
タンを取得して処理を行なわなければならない、頁の順
序を指定しなければないない、などといったことの必要
性が無くなり、手間がからかないという利点がある。
For one document image pattern, the order in which the pages formed in the document image pattern are processed is determined according to the page order determined by the page order determination means 50. As described above, according to the first embodiment, for example, a book type information medium is set in an image reading unit such as an image scanner, and a document image pattern obtained through the image reading unit is processed. Even if you do, the result information for two pages is saved in the correct page order in page units without specifying the direction of the page order, so if you want to organize the result information in page units as in the past, you must manually There is no need for editing, there is no need to acquire the document image pattern page by page, process it, and specify the order of pages. There is an advantage.

【0013】第2の実施形態 図2は、本発明の第2の実施形態を示す光学式文字認識
装置の概略の機能ブロック図であり、図1中の要素と共
通の要素には共通の符号を付してある。本第2の実施形
態の光学式文字認識装置が第1の実施形態の光学式文字
認識装置と異なる点は、前処理手段100に画像回転手
段103と、頁情報入力手段120に文書画像の天地方
向を入力する機能(以下、この機能に関わる頁情報入力
手段120の手段を天地方向入力手段と呼ぶ)を追加
し、文書画像の天地方向が画像読取手段11が上である
と認識する方向に合わせたことである。図2に示すよう
に、本第2の実施形態の光学式文字認識装置は、前処理
手段100、頁情報入力手段120、頁分割手段30、
行・行方向検出手段40、頁分割位置記憶手段50、頁
順序判定手段60、頁順序付与手段60、分離・認識手
段70、結果保存手段80、及び全頁終了判定手段90
を備えている。前処理手段100は、画像読取手段1
1、画像記憶手段12、画像回転手段103を有してい
る。画像回転手段103は、頁入力手段120中の頁天
地情報入力手段の出力側に接続されている。画像読取手
段11及び画像回転手段103の出力側は、画像記憶手
段12が接続されている。
Second Embodiment FIG. 2 is a schematic functional block diagram of an optical character recognition apparatus showing a second embodiment of the present invention. Elements common to those in FIG. Is attached. The optical character recognition device of the second embodiment is different from the optical character recognition device of the first embodiment in that the image processing means 103 in the preprocessing means 100 and the top and bottom of the document image in the page information input means 120. A function for inputting the direction (hereinafter, the means of the page information input means 120 relating to this function is referred to as the up-and-down direction input means) is added, and the up-and-down direction of the document image is set to the direction in which the image reading means 11 recognizes that it is up. It is a combination. As shown in FIG. 2, the optical character recognition device according to the second embodiment includes a preprocessing unit 100, a page information input unit 120, a page dividing unit 30,
Line / line direction detection means 40, page division position storage means 50, page order determination means 60, page order assignment means 60, separation / recognition means 70, result storage means 80, and all page end determination means 90.
It has. The preprocessing unit 100 is the image reading unit 1.
1, an image storage unit 12, and an image rotation unit 103. The image rotation means 103 is connected to the output side of the page top-bottom information input means in the page input means 120. The image storage means 12 is connected to the output side of the image reading means 11 and the image rotation means 103.

【0014】以下、図2の動作の説明((a)〜
(i))をする。 (a) 頁情報入力手段120 頁情報入力手段120に、最初の頁付与番号、全体の頁
付与数、取得した1つの文書画像パタン中に構成されて
いる頁数、文書画像の天地方向などを人手により入力す
る。例えば、ブックタイプの情報媒体をイメージスキャ
ナ等の画像読取手段11にセットし、そのブックタイプ
の情報媒体の最初の頁付与番号、例えば、「1頁目か
ら」という情報と、何頁にもわたって頁をめくりながら
その都度、画像読取手段11を介して文書画像パタンを
得、その文書画像パタンについて分割認識処理を行いそ
の結果情報を保存する場合における全体の頁付与数、例
えば、「全体で50頁」という情報と、画像読取手段1
1を介して得られた1つの文書画像パタンについて、そ
の文書画像パタン中に構成されている頁数、例えば、
「2頁からなる」といった情報と、文書画像の天地方
向、例えば、「天地方向が左」という情報などを、例え
ば、人手によりキーボードを介して入力する。ここで、
文書画像の天地方向とは、文書画像パタンの上の方向が
画像読取手段11が上として認識する上下左右のいずれ
の方向に対応するかを示す方向である。
The operation of FIG. 2 will be described below ((a)-).
(I)). (A) Page information input means 120 The page information input means 120 is used to display the initial page number, the total number of pages, the number of pages formed in one acquired document image pattern, the vertical direction of the document image, and the like. Input manually. For example, a book-type information medium is set on the image reading means 11 such as an image scanner, and the first page-assigned number of the book-type information medium, for example, the information "from the first page" and the number of pages are spread. Each time while turning pages, a document image pattern is obtained via the image reading means 11, division recognition processing is performed on the document image pattern, and the total number of pages to be added when the result information is stored, for example, "total "50 pages" and image reading means 1
For one document image pattern obtained through 1, the number of pages configured in the document image pattern, for example,
Information such as “consisting of two pages” and the vertical direction of the document image, for example, information that “the vertical direction is left” and the like are manually input through a keyboard. here,
The top-bottom direction of the document image is a direction indicating which of the up, down, left, and right directions the image reading unit 11 recognizes as the top direction of the document image pattern.

【0015】(b) 前処理手段100 画像読取手段11は、論文や雑誌等の一般文書の情報媒
体の所定の範囲を光学的に走査し、この媒体からの光信
号を光電変換して量子化、例えば、2値化された電気信
号(文書画像パタン)を出力する。また、同時に走査し
て得た文書画像パタンの大きさ(例えば、幅及び高さの
情報)を出力する。画像記憶手段12は、その出力され
た文書画像パタンを格納する。画像記憶手段12のメモ
リ上には2次元(X,Y)の座標系を仮想的に設定し、
その座標系で表される位置の画素の画像データを画像記
憶手段12のメモリから読み出すことができるようにし
ている。画像読取手段11が認識する上下左右の方向に
したがって、文書画像パタンが画像記憶手段12のメモ
リ上に格納されるため、情報媒体の上の方向と画像読取
手段11が認識する上の方向と異なる場合には、文書画
像パタンの上の方向を画像読取手段11が認識する上の
方向に合わせてやる必要がある。そこで、画像回転手段
103は、頁情報入力手段120中の天地方向入力手段
から得た文書画像の天地方向情報から、文書画像の天地
方向とメモリに設定された上の方向とを一致させるため
に、画像記憶手段12に記憶された文書画像を回転(ロ
ーテーション)(例えば、「天地方向が左」と頁情報入
力手段120より入力されたとすると、画像記憶手段1
2に記憶された文書画像パタンを90度時計回りに回
転)させる。文書画像の回転は、例えば、実願平2−3
133号明細書に示される技術で実現できる。
(B) Preprocessing means 100 The image reading means 11 optically scans a predetermined range of an information medium for general documents such as papers and magazines, photoelectrically converts an optical signal from the medium, and quantizes it. , For example, outputs a binarized electric signal (document image pattern). In addition, the size (for example, width and height information) of the document image pattern obtained by scanning at the same time is output. The image storage means 12 stores the output document image pattern. A two-dimensional (X, Y) coordinate system is virtually set on the memory of the image storage means 12,
The image data of the pixel at the position represented by the coordinate system can be read from the memory of the image storage means 12. Since the document image pattern is stored in the memory of the image storage means 12 according to the vertical, horizontal, and horizontal directions recognized by the image reading means 11, the upward direction recognized by the image reading means 11 differs from the upward direction recognized by the image reading means 11. In this case, it is necessary to match the upward direction of the document image pattern with the upward direction recognized by the image reading means 11. Therefore, the image rotation means 103 makes the vertical direction of the document image coincide with the upward direction set in the memory based on the vertical direction information of the document image obtained from the vertical direction input means in the page information input means 120. If the document image stored in the image storage means 12 is rotated (rotated) (for example, "upside down is left") is input from the page information input means 120, the image storage means 1
The document image pattern stored in 2 is rotated 90 degrees clockwise). The rotation of the document image is performed, for example, in Japanese Patent Application No. 2-3.
It can be realized by the technique described in the specification No. 133.

【0016】(c) 頁分割手段30 頁分割手段30は、第1の実施形態の頁分割手段30と
同様に動作する。 (d) 行・行方向検出手段40 行・行方向検出手段40は、第1の実施形態の行・行方
向検出手段40と同様に動作する。 (e) 頁順序判定手段50 頁順序判定手段50は、第1の実施形態の頁順序判定手
段50と同様に動作する。この時、文書画像の天地方向
とメモリに設定された上の方向とが一致するように文書
画像が回転されて画像記憶手段12に記憶されているの
で、頁順序が正しく判定される。 (f) 頁順序付与手段60 頁順序付与手段60は、第1の実施形態の頁順序付与手
段60と同様に動作する。 (g) 分離認識手段70 分離認識手段70は、第1の実施形態の分離認識手段7
0と同様に動作する。 (h) 結果保存手段80 結果保存手段80は、第1の実施形態の結果保存手段8
0と同様に動作する。 (i) 全頁終了判定手段90 以上の分離認識手段70及び結果保存手段80の処理を
1つの文書画像パタンについて、その文書画像バタン中
に構成されている頁分の頁画像パタンについて行う。
(C) Page dividing means 30 The page dividing means 30 operates in the same manner as the page dividing means 30 of the first embodiment. (D) Row / Row Direction Detection Means 40 The row / row direction detection means 40 operates in the same manner as the row / row direction detection means 40 of the first embodiment. (E) Page Order Judgment Unit 50 The page order judgment unit 50 operates in the same manner as the page order judgment unit 50 of the first embodiment. At this time, since the document image is rotated and stored in the image storage means 12 so that the vertical direction of the document image and the upward direction set in the memory match, the page order is correctly determined. (F) Page Order Assigning Unit 60 The page order assigning unit 60 operates in the same manner as the page order assigning unit 60 of the first embodiment. (G) Separation Recognition Unit 70 The separation recognition unit 70 is the separation recognition unit 7 of the first embodiment.
Operates like 0. (H) Result Saving Unit 80 The result saving unit 80 is the result saving unit 8 of the first embodiment.
Operates like 0. (I) All-Page End Determination Means 90 The processes of the separation recognition means 70 and the result storage means 80 are performed for one document image pattern and for page image patterns for the pages configured in the document image pattern.

【0017】次に、頁情報入力手段20より入力された
全体の頁付与数分全てについて行ったか否かを判断し、
行っていなければ、次の文書画像パタンについて処理を
行うために前処理手段10に戻る。全体の頁付与数分全
てについて、行っていれば、処理を終了する。以上説明
したように、本第2の実施形態では、第1の実施形態と
同様の利点に加えて、文書画像の天地方向を間違った場
合、文書画像を正しい方向で取得し直さなければならな
いといった必要性が無くなり、さらに手間がかからない
という利点がある。
Next, it is judged whether or not all the pages added by the page information input means 20 have been added,
If not, the process returns to the preprocessing unit 10 to process the next document image pattern. If all pages have been assigned, the process ends. As described above, in the second embodiment, in addition to the same advantages as in the first embodiment, if the document image is oriented upside down, the document image must be re-acquired in the correct direction. There is an advantage that the need is eliminated and it does not take much effort.

【0018】第3の実施形態 図3は、本発明の第3の実施形態を示す光学式文字認識
装置の概略の機能ブロック図であり、図1中の要素と共
通の要素には共通の符号を付してある。本第3の実施形
態の光学式文字認識装置が第1の実施形態の光学式文字
認識装置と異なる点は、各行の両端の位置を検出し、そ
の先頭の位置のばらつきと末尾位置のばらつきを検出す
る行両端ばらつき検出手段130、文書画像の天地方向
を判定する頁天地方向判定手段140、及び頁天地方向
に従って、文書画像を回転する画像回転手段103を設
け、頁順序判定手段50は、行方向と天地方向に従っ
て、頁順序を判定するようにしたことである。図3に示
すように、本第3の実施形態の光学式文字認識装置は、
頁情報入力手段20、頁分割手段30、行・行方向検出
手段40、頁順序判定手段50、頁順序付与手段60、
分離認識手段70、結果保存手段80、全頁終了判定手
段90、前処理手段100、行両端ばらつき量検出手段
130、及び頁天地方向判定手段140により構成され
ている。頁分割手段30中の頁分割位置検出手段31
は、画像読取手段11の出力側に接続されている。行・
行方向検出手段40の出力側は、頁順序判定手段50及
び行両端ばらつき量検出手段130が接続されている。
両端ばらつき量検出手段130の出力側は、頁天地方向
判定手段140が接続されている。頁天地方向判定手段
140の出力側は、頁順序判定手段50、分離・認識手
段70、及び画像回転手段103が接続されている。
Third Embodiment FIG. 3 is a schematic functional block diagram of an optical character recognizing device showing a third embodiment of the present invention. Elements common to those in FIG. Is attached. The optical character recognition device according to the third embodiment is different from the optical character recognition device according to the first embodiment in that the positions of both ends of each line are detected and the variation in the leading position and the variation in the ending position are detected. The line-end variation detecting unit 130 for detecting, the page top-and-bottom direction determining unit 140 for determining the top-and-bottom direction of the document image, and the image rotating unit 103 for rotating the document image according to the page top-and-bottom direction are provided. The page order is determined according to the direction and the vertical direction. As shown in FIG. 3, the optical character recognition device of the third embodiment is
Page information input means 20, page dividing means 30, line / line direction detecting means 40, page order determining means 50, page order giving means 60,
The separation recognition unit 70, the result storage unit 80, the all-page end determination unit 90, the preprocessing unit 100, the line-end variation amount detection unit 130, and the page top-and-bottom direction determination unit 140 are included. Page division position detection means 31 in the page division means 30
Is connected to the output side of the image reading means 11. line·
To the output side of the row direction detecting means 40, the page order determining means 50 and the line end variation detecting means 130 are connected.
To the output side of the both-end variation amount detecting means 130, the page top-bottom direction determining means 140 is connected. The output side of the page top-bottom direction determination means 140 is connected to the page order determination means 50, the separation / recognition means 70, and the image rotation means 103.

【0019】以下、図3の動作の説明((a)〜
(k))をする。 (a) 頁情報入力手段20 頁情報入力手段20は、第1の実施形態の頁情報入力手
段20と同様に動作する。 (b) 頁分割手段30 頁分割手段30は、第1の実施形態の頁分割手段30と
同様に動作する。この時、文書画像パタンの天地方向が
左、又は右の場合があるので、例えば、特願平6−30
0502号明細書に示す方法により頁分割を行う場合に
は、頁が分割される陰影部のヒストグラムを、X方向及
びY方向について、それぞれ作成して、それぞれの分布
により頁を分割を行うようにする。 (c) 行・行方向検出手段40 行・行方向検出手段40は、第1の実施形態の行・行方
向検出手段40と同様に動作する。 (d) 行両端ばらつき量検出手段130 行両端ばらつき量検出手段130は、行・行方向検出手
段40により検出された各行について、先頭位置と末尾
位置を算出し、全ての行についての先頭位置のばらつき
と末尾位置のばらつきを算出する。
The operation of FIG. 3 will be described below ((a)-).
(K)). (A) Page information input means 20 The page information input means 20 operates in the same manner as the page information input means 20 of the first embodiment. (B) Page Division Unit 30 The page division unit 30 operates in the same manner as the page division unit 30 of the first embodiment. At this time, since the vertical direction of the document image pattern may be left or right, for example, Japanese Patent Application No. 6-30
When page division is performed by the method described in No. 0502 specification, histograms of shaded areas into which the page is divided are created for the X direction and the Y direction, and the page is divided according to each distribution. To do. (C) Row / Row Direction Detection Means 40 The row / row direction detection means 40 operates similarly to the row / row direction detection means 40 of the first embodiment. (D) Line-end variation amount detecting unit 130 The line-end variation amount detecting unit 130 calculates the start position and the end position of each line detected by the line / line direction detecting unit 40, and determines the start positions of all the lines. The variation and the variation of the end position are calculated.

【0020】(e) 頁天地方向判定手段140 文書は、行の途中での改行があるので、行の長さにばら
つきが発生し、行両端のばらつきが小さい方が文字並び
の先頭方向であるという一般文書の特徴があることが分
かる。そこで、頁天地方向判定手段140は、行両端ば
らつき量検出手段130から得られた行両端のばらつき
量の小さい方を文字並びの先頭方向とする。さらに、頁
天地方向判定手段140は、文書画像が「縦書き文書」
であるか「横書き文書」であるかの情報(例えば、行方
向と文字の方向とにより得ることができる。「縦書き文
書」であれば、行方向と文字の方向が一致し、「横書き
文書」であれば、行方向と文字の方向が直交する)を得
る。文書画像が「縦書き文書」であれば、天地方向を文
字並びの先頭方向とし、文書画像が「横書き文書」であ
る場合には、天地方向を文字並びの先頭方向に対して、
時計回りに90度回転した方向とする。
(E) Page top-and-bottom direction determining means 140 Since a document has a line feed in the middle of a line, the line length varies, and the less variation at both ends of the line is the leading direction of the character arrangement. It can be seen that there is a characteristic of the general document. Therefore, the page top-and-bottom direction determination means 140 determines that the smaller variation amount at both ends of the line obtained from the both-end variation amount detection means 130 is the leading direction of the character arrangement. Further, the page upside-down direction determining unit 140 determines that the document image is “vertical writing document”.
It is possible to obtain the information whether it is a "horizontal writing document" or a "horizontal writing document" (for example, the line direction and the character direction. , The line direction and the character direction are orthogonal). If the document image is a "vertical writing document", the vertical direction is the leading direction of the character arrangement, and if the document image is a "horizontal writing document", the vertical direction is the leading direction of the character arrangement.
The direction is rotated 90 degrees clockwise.

【0021】(f) 画像回転手段103 画像回転手段103は、頁天地方向判定手段140から
得た文書画像の天地方向情報から、文書画像の天地方向
とメモリに設定された上の方向とを一致させるために、
画像記憶手段12に記憶された文書画像を回転(ローテ
ーション)(例えば、「天地方向が右」と頁天地方向判
定手段140より入力されたとすると、画像記憶手段1
2に記憶された文書画像パタンを90度反時計回りに回
転)させる。画像の回転は画像記憶手段12に割り振ら
れている二次元のアドレスを操作する画像回転技術、例
えば、実願平2−3133号明細書によって実現でき
る。 (g) 頁順序判定手段50 頁順序判定手段50は、行方向と天地方向情報とに従っ
て、縦書き文書(行方向と天地方向が平行)の時は分割
された右の頁領域の頁番号が小さく、左の頁領域の頁番
号が大きいと判定し、横書き文書(行方向と天地方向が
直交する)の時は左の頁領域の頁番号が小さく、右の頁
領域の頁番号が大きいと判定する。 (h) 頁順序付与手段60 頁順序付与手段60は、第1の実施形態の頁順序付与手
段60と同様に動作する。
(F) Image Rotation Unit 103 The image rotation unit 103 matches the vertical direction of the document image with the vertical direction set in the memory based on the vertical direction information of the document image obtained from the page vertical direction determination unit 140. To let
If the document image stored in the image storage means 12 is rotated (for example, "top and bottom direction is right" is input from the page top and bottom direction determination means 140, the image storage means 1
The document image pattern stored in 2 is rotated 90 degrees counterclockwise). The image rotation can be realized by an image rotation technique for operating a two-dimensional address assigned to the image storage means 12, for example, Japanese Patent Application No. 2-3133. (G) Page order determination means 50 The page order determination means 50 determines the page number of the right page area divided in the case of a vertically written document (the row direction and the top-bottom direction are parallel) according to the row direction and the top-bottom direction information. It is determined that the page number of the left page area is small, and the page number of the left page area is small, and the page number of the right page area is large when the document is horizontal writing (line direction and vertical direction are orthogonal to each other). judge. (H) Page Order Assigning Unit 60 The page order assigning unit 60 operates in the same manner as the page order assigning unit 60 of the first embodiment.

【0022】(i) 分離・認識手段70 分離・認識手段70は、画像回転手段103により回転
された文書画像パタンの天地方向に頁分割位置情報を一
致させるために、頁天地方向判定手段140より得られ
た天地方向を基づいて、頁分割位置情報を回転する。そ
して、頁順序判定手段50により得られた頁順序付与方
向に従い、回転して得られた各頁の頁位置情報をもと
に、画像記憶手段12に記憶された文書画像パタンから
順次各頁における1頁分(頁左上角座標及び頁右下角座
標で示される大きさ)の頁画像パタンを得る。そして、
頁画像パタンについて、文字図形の分離・認識処理を行
う。分離・認識処理については、例えば、特開昭61−
175875号公報に開示されている技術により実現で
きる。 (j) 結果保存手段80 結果保存手段80は、第1の実施形態の結果保存手段8
0と同様に動作する。 (k) 全頁終了判定手段90 以上の分離認識手段70及び結果保存手段80の処理を
1つの文書画像パタンについて、その文書画像バタン中
に構成されている頁分の頁画像パタンについて行う。
(I) Separation / recognition means 70 Separation / recognition means 70 uses page top / bottom direction determination means 140 to match page division position information with the top / bottom direction of the document image pattern rotated by the image rotation means 103. The page division position information is rotated based on the obtained vertical direction. Then, based on the page position information of each page obtained by rotating in accordance with the page order giving direction obtained by the page order determining unit 50, the document image patterns stored in the image storage unit 12 are sequentially read from each page. A page image pattern for one page (the size indicated by the upper left corner coordinate and the lower right corner coordinate of the page) is obtained. And
For page image patterns, character / figure separation / recognition processing is performed. Regarding the separation / recognition process, for example, Japanese Patent Laid-Open No. 61-
It can be realized by the technique disclosed in Japanese Patent No. 175875. (J) Result Saving Unit 80 The result saving unit 80 is the result saving unit 8 of the first embodiment.
Operates like 0. (K) All-Page End Determination Means 90 The processes of the separation recognition means 70 and the result storage means 80 described above are performed for one document image pattern and for page image patterns for the pages configured in the document image pattern.

【0023】次に、頁情報入力手段20より入力された
全体の頁付与数分全てについて行ったか否かを判断し、
行っていなければ、次の文書画像パタンについて処理を
行うために前処理手段100に戻る。全体の頁付与数分
全てについて、行っていれば、処理を終了する。以上説
明したように、本第3の実施形態の光学式文字認識装置
によれば、第1の実施形態と同様の利点がある。その
上、ブックタイプの情報媒体の天地方向を誤った場合で
も、方向を変えて画像を取り直すなどの手間がかからな
いという利点がある。
Next, it is judged whether or not all the pages added by the page information input means 20 have been added.
If not, the process returns to the preprocessing unit 100 to process the next document image pattern. If all pages have been assigned, the process ends. As described above, the optical character recognition device according to the third embodiment has the same advantages as the first embodiment. In addition, even if the vertical direction of the book type information medium is wrong, there is an advantage that it is not necessary to change the direction and retake an image.

【0024】第4の実施形態 図4は、本発明の第4の実施形態を示す光学式文字認識
装置の概略の機能ブロック図であり、図1中の要素と共
通の要素には共通の符号を付してある。本第4の実施形
態の光学式文字認識装置が第1の実施形態の光学式文字
認識装置と異なる点は、各行の重心位置を検出する行重
心位置検出手段150、行重心の平均位置を検出する行
重心平均位置検出手段160、天地方向を判定する頁天
地方向判定手段170、及び頁天地方向により画像を回
転させる画像回転手段103とを設け、頁順序判定手段
50は、行方向と天地方向に従って、頁順序を判定する
ようにしたことである。図4に示すように、本第4の実
施形態の光学式文字認識装置は、頁情報入力手段20、
頁分割手段30、行・行方向検出手段40、頁順序判定
手段50、頁順序付与手段60、分離・認識手段70、
結果保存手段80、前処理手段100、重心位置検出手
段150、行重心平均位置検出手段160、及び頁天地
方向判定手段170により構成されている。頁分割手段
30中の頁分割位置検出手段31は、画像読取手段11
の出力側に接続されている。行・行方向検出手段40の
出力側は、頁順序判定手段50及び行重心位置検出手段
150が接続されている。行重心位置検出手段150の
出力側は、行重心平均位置検出手段160が接続されて
いる。行重心位置検出手段160の出力側は、頁天地方
向判定手段170が接続されている。頁天地方向判定手
段170の出力側は、頁順序判定手段50、分離・認識
手段70、及び画像回転手段103が接続されている。
Fourth Embodiment FIG. 4 is a schematic functional block diagram of an optical character recognition apparatus showing a fourth embodiment of the present invention, in which elements common to those in FIG. Is attached. The optical character recognition device according to the fourth embodiment differs from the optical character recognition device according to the first embodiment in that a line barycentric position detecting means 150 for detecting the barycentric position of each line and an average position of the line barycentric points are detected. A line center of gravity average position detecting means 160, a page top-bottom direction determining means 170 for determining the top-bottom direction, and an image rotating means 103 for rotating an image according to the page top-bottom direction are provided. According to the above, the page order is determined. As shown in FIG. 4, the optical character recognition device according to the fourth embodiment is provided with a page information input means 20,
Page division means 30, line / row direction detection means 40, page order determination means 50, page order assignment means 60, separation / recognition means 70,
The result storage unit 80, the preprocessing unit 100, the center of gravity position detection unit 150, the row center of gravity average position detection unit 160, and the page top-and-bottom direction determination unit 170 are included. The page division position detection means 31 in the page division means 30 is the image reading means 11
Is connected to the output side. To the output side of the row / row direction detecting means 40, a page order determining means 50 and a row center of gravity position detecting means 150 are connected. The row center of gravity position detecting means 150 is connected to the row center of gravity average position detecting means 160. To the output side of the line center-of-gravity position detecting means 160, the page top-bottom direction determining means 170 is connected. To the output side of the page upside-down direction determining means 170, the page order determining means 50, the separating / recognizing means 70, and the image rotating means 103 are connected.

【0025】以下、図4の動作の説明((a)〜
(l))をする。 (a) 頁情報入力手段20 頁情報入力手段20は、第1の実施形態の頁情報入力手
段20と同様に動作する。 (b) 頁分割手段30 頁分割手段段30は、第1の実施形態の頁分割手段30
と同様に動作する。 (c) 行・行方向検出手段40 行・行方向検出手段40は、第1の実施形態の行・行方
向検出手段40と同様に動作する。 (d) 行重心位置検出手段150 行重心位置検出手段150は、検出された各行の重心位
置を調べる。行重心位置検出手段150は、例えば、特
願平6−244045号明細書に示される技術で実現で
きる。 (e) 行重心平均位置160 行重心平均位置160は、行重心位置検出手段150よ
り算出された各行の重心位置を示す二次元のアドレスの
行方向のアドレスの平均値を求める。
The operation of FIG. 4 will be described below ((a)-).
(L)) (A) Page information input means 20 The page information input means 20 operates in the same manner as the page information input means 20 of the first embodiment. (B) Page dividing means 30 The page dividing means stage 30 is the page dividing means 30 of the first embodiment.
Works the same as. (C) Row / Row Direction Detection Means 40 The row / row direction detection means 40 operates similarly to the row / row direction detection means 40 of the first embodiment. (D) Row barycentric position detecting means 150 The row barycentric position detecting means 150 checks the detected barycentric position of each row. The line center-of-gravity position detecting means 150 can be realized by, for example, the technique disclosed in Japanese Patent Application No. 6-244045. (E) Row Center of Gravity Average Position 160 The row center of gravity average position 160 is an average value of two-dimensional addresses in the row direction indicating the center of gravity of each row calculated by the row center of gravity position detection means 150.

【0026】(f) 頁天地方向判定手段170 文書は、行の途中での改行があるので、行の長さの短い
ものが発生し、行重心位置は最大の長さの行の中心位置
よりも文字並びの先頭方向にずれる。そこで、頁天地方
向判定手段170は、行重心平均位置と分割された文書
画像の行方向の中心位置を比較し、文書画像の中心位置
に対して、行重心平均位置のある方向を文字並びの先頭
方向とする。そして、「縦書き文書」の場合は行先頭方
向を文書画像の天地方向、「横書き文書」の場合は行の
先頭方向に対して、時計回りに90度の方向を文書画像
の天地方向と判定する。これらの頁天地方向判定手段1
70は、例えば、特願平6−244045号明細書に示
される技術で実現できる。 (g) 画像回転手段103 画像回転手段103は、第3の実施形態の画像回転手段
103と同様に動作する。 (h) 頁順序判定手段50 頁順序判定手段50は、第3の実施形態の頁順序判定手
段50と同様に動作する。 (i) 頁順序付与手段60 頁順序付与手段60は、第1の実施形態の頁順序付与手
段60と同様に動作する。
(F) Page top-and-bottom direction determining means 170 Since a document has a line feed in the middle of a line, a line having a short line length is generated, and the line center of gravity position is closer to the center position of the line having the maximum length. Also shifts toward the beginning of the character sequence. Therefore, the page top-bottom direction determining means 170 compares the line center of gravity average position with the center position of the divided document image in the line direction, and characterizes the direction having the line center of gravity average position with respect to the center position of the document image. Set to the beginning direction. Then, in the case of “vertical writing document”, the line head direction is determined as the vertical direction of the document image, and in the case of “horizontal writing document”, the direction 90 degrees clockwise with respect to the line head direction is determined as the vertical direction of the document image. To do. These page upside-down direction determining means 1
70 can be realized by, for example, the technique disclosed in Japanese Patent Application No. 6-244045. (G) Image Rotation Unit 103 The image rotation unit 103 operates similarly to the image rotation unit 103 of the third embodiment. (H) Page Order Determination Unit 50 The page order determination unit 50 operates in the same manner as the page order determination unit 50 of the third embodiment. (I) Page Order Assigning Unit 60 The page order assigning unit 60 operates in the same manner as the page order assigning unit 60 of the first embodiment.

【0027】(j) 分離・認識手段70 分離・認識手段70は、第3の実施形態の分離・認識手
段70と同様に動作する。 (k) 結果保存手段80 結果保存手段80は、第1の実施形態の結果保存手段8
0と同様に動作する。 (l) 全頁終了判定手段90 以上の分離認識手段70及び結果保存手段80の処理を
1つの文書画像パタンについて、その文書画像バタン中
に構成されている頁分の頁画像パタンについて行う。次
に、頁情報入力手段20より入力された全体の頁付与数
分全てについて行ったか否かを判断し、行っていなけれ
ば、次の文書画像パタンについて処理を行うために前処
理手段100に戻る。全体の頁付与数分全てについて、
行っていれば、処理を終了する。以上説明したように、
本第4の実施形態の光学式文字認識装置によれば、第3
の実施形態と同様の利点がある。
(J) Separation / Recognition Means 70 The separation / recognition means 70 operates similarly to the separation / recognition means 70 of the third embodiment. (K) Result storing means 80 The result storing means 80 is the result storing means 8 of the first embodiment.
Operates like 0. (L) All-Page End Determination Means 90 The above-described processing of the separation recognition means 70 and the result storage means 80 is performed for one document image pattern, and for page image patterns for the pages configured in the document image pattern. Next, it is judged whether or not all the page addition numbers input by the page information input unit 20 have been processed. If not, the process returns to the preprocessing unit 100 to process the next document image pattern. . For all pages added,
If so, the process ends. As explained above,
According to the optical character recognition device of the fourth embodiment,
There are similar advantages to the above embodiment.

【0028】なお、本発明は、上記実施形態に限定され
ず種々の変形が可能である。その変形例としては、例え
ば次のようなものがある。 (1) 第1〜第4の実施形態において、頁情報入力手
段20又は120での全体の頁付与数の情報はなくて
も、処理を終了させたいときは、人手により強制的に終
了できるようにしておくことにより実現できる。 (2) 第1〜第4の実施形態において、全体の頁付与
数の結果情報が得られるまで頁情報入力手段20以外の
各手段を繰り返し行うときの構成について、前処理手段
10により得られる文書画像パタンの大きさが常に同じ
であれば、頁分割手段30は最初の文書画像パタンにつ
いて処理を行い、その結果情報を記憶しておくことによ
って、2回目以降の文書画像パタンについては頁分割は
行わないとしてもよい。 (3) 第1〜第4の実施形態において、予め、光学式
文字認識装置に頁付与方向を固定して持たせることによ
り、頁付与方向の情報はなくても、同様な利点が期待で
きる。
The present invention is not limited to the above embodiment, and various modifications can be made. For example, there are the following modifications. (1) In the first to fourth embodiments, even if there is no information on the total number of pages added in the page information input means 20 or 120, when it is desired to end the processing, it is possible to manually end the processing. It can be realized by setting. (2) In the first to fourth embodiments, the document obtained by the preprocessing unit 10 has a configuration in which each unit other than the page information input unit 20 is repeatedly executed until the result information of the total number of pages added is obtained. If the size of the image pattern is always the same, the page dividing unit 30 processes the first document image pattern and stores the result information, so that the page division is not performed for the second and subsequent document image patterns. You may not do it. (3) In the first to fourth embodiments, by previously providing the optical character recognition device with a fixed page-giving direction, similar advantages can be expected even without information on the page-giving direction.

【0029】[0029]

【発明の効果】以上詳細に説明したように、第1〜第6
の発明によれば、頁順序判定手段を設けたので、頁分割
手段により1つの文書画像パタンを構成する頁が、頁順
序判定手段により判定された頁付与方向の順序で、頁分
割手段により算出された頁分割位置情報に基づく頁単位
で分離・認識手段により分離認識された結果情報を保存
するようにしたので、従来のように頁単位に結果情報を
整理したい場合は人手により編集しなければならない、
1頁づつ頁単位に文書画像パタンを取得して処理を行わ
なければならない、頁の順序を指定しなければならない
などといったことの必要性がなくなり、手間が省ける。
As described in detail above, the first to sixth embodiments
According to the invention, since the page order determining means is provided, the pages constituting one document image pattern by the page dividing means are calculated by the page dividing means in the order of the page addition direction determined by the page order determining means. Since the result information that has been separated and recognized by the separation / recognition means is stored in page units based on the page division position information that has been created, if you want to organize the result information in page units as in the past, you must edit it manually. Don't become
This eliminates the need to acquire the document image pattern page by page and perform the processing, to specify the page order, and the like, which saves labor.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施形態を示す光学式文字認識
装置の概略の機能ブロック図である。
FIG. 1 is a schematic functional block diagram of an optical character recognition device showing a first embodiment of the present invention.

【図2】本発明の第2の実施形態を示す光学式文字認識
装置の概略の機能ブロック図である。
FIG. 2 is a schematic functional block diagram of an optical character recognition device showing a second embodiment of the present invention.

【図3】本発明の第3の実施形態を示す光学式文字認識
装置の概略の機能ブロック図である。
FIG. 3 is a schematic functional block diagram of an optical character recognition device showing a third embodiment of the present invention.

【図4】本発明の第4の実施形態を示す光学式文字認識
装置の概略の機能ブロック図である。
FIG. 4 is a schematic functional block diagram of an optical character recognition device showing a fourth embodiment of the present invention.

【符号の説明】[Explanation of symbols]

10,100 前処理手段 20,120 頁情報入力手段 30 頁分割手段 40 行・行方向検出手段 50 頁順序判定手段 60 頁順序付与手段 70 分離・認識手段 80 結果保存手段 90 全頁終了判定手段 130 行両端ばらつき量検出手段 140,170 頁天地方向判定手段 150 行重心位置検出手段 160 行重心平均位置検出手段 10, 100 Pre-processing means 20, 120 Page information input means 30 Page division means 40 Line / line direction detection means 50 Page order determination means 60 Page order assignment means 70 Separation / recognition means 80 Result storage means 90 All page end determination means 130 Line end variation detection means 140, 170 Page up / down direction determination means 150 Row center of gravity position detection means 160 Row center of gravity average position detection means

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 情報媒体を光学的に読み取って文書画像
パタンを画像記憶手段に記憶する画像読取手段と、 前記1つの文書画像パタンを構成する頁に分割し、その
頁の頁分割位置情報を算出する頁分割手段と、 前記文書画像パタンから行を切り出し、その切り出した
行の行方向を検出する行・行方向検出手段と、 前記行方向に基づく前記文書画像パタンが「縦書き文
書」であるか「横書き文書」であるかの情報から、前記
1つの文書画像パタンを構成する頁の頁付与方向を判定
する頁順序判定手段と、 前記画像記憶手段に記憶された文書画像パタンを入力
し、文字図形の分離処理と認識処理とを施して、各文字
を認識する分離・認識手段と、 前記頁付与方向の順序で前記頁分割位置情報に基づく頁
単位で分離・認識手段により分離・認識された結果情報
を保存する結果保存手段とを、 備えたことを特徴とする光学式文字認識装置。
1. An image reading unit for optically reading an information medium to store a document image pattern in an image storage unit, and a page forming one document image pattern, and page division position information of the page. A page dividing unit for calculating, a line / line direction detecting unit for cutting out a line from the document image pattern and detecting the line direction of the cut out line, and the document image pattern based on the line direction being a “vertical writing document”. Based on the information whether the document is a “horizontal writing document”, the page order determination means for determining the page addition direction of the pages forming the one document image pattern, and the document image pattern stored in the image storage means are input. , Separation / recognition means for recognizing each character by performing character graphic separation processing and recognition processing, and separation / recognition by page-based separation / recognition means based on the page division position information in the order of the page giving direction. It Results and results storage means information store, optical character recognition apparatus characterized by comprising.
【請求項2】 請求項1記載の光学式文字認識装置にお
いて、 1つの文書画像パタン中に構成される頁数を入力する頁
数入力手段を設け、 前記頁分割手段は、前記頁数入力手段より入力された頁
数に基づき、前記1つの文書画像パタンを構成する頁に
分割し、その頁の頁分割位置情報を算出する構成にした
ことを特徴とする光学式文字認識装置。
2. The optical character recognition apparatus according to claim 1, further comprising: a page number input means for inputting the number of pages formed in one document image pattern, wherein the page dividing means is the page number input means. An optical character recognition device characterized in that, based on the number of pages input by the user, the document image pattern is divided into pages that constitute the one document image pattern, and page division position information of the page is calculated.
【請求項3】 請求項1又は2記載の光学式文字認識装
置において、 前記文書画像パタンの上の方向が前記画像読取手段が認
識する上下左右のいずれの方向に対応するかを示す天地
方向情報を入力する天地方向入力手段を設け、 前記頁順序判定手段は、前記行方向と前記天地方向情報
とに基づいて、前記1つの文書画像パタンを構成する頁
の頁付与方向を判定する構成にしたことを特徴とする光
学式文字認識装置。
3. The optical character recognition device according to claim 1, wherein the orientation of the document image pattern corresponds to the up, down, left, or right orientation recognized by the image reading means. A top-bottom direction input means for inputting is input, and the page order determination means is configured to determine the page-giving direction of pages forming the one document image pattern based on the row direction and the top-bottom direction information. An optical character recognition device characterized in that
【請求項4】 請求項1又は2記載の光学式文字認識装
置において、 前記文書画像パタンの上の方向が前記画像読取手段が認
識する上下左右のいずれの方向に対応するかを示す天地
方向情報を入力する天地方向入力手段と、 前記天地方向情報に基づいて、前記画像記憶手段に記憶
された文書画像パタンの天地方向と前記画像入力手段が
認識する上の方向とが一致するように、前記文書画像パ
タンを回転する画像回転手段とを設け、 前記頁分割手段及び前記行・行方向検出手段は、前記画
像回転手段により回転した文書画像パタンを入力する構
成にしたこと特徴とする光学式文字認識装置。
4. The optical character recognizing device according to claim 1, wherein the top-bottom direction information indicating which of the up, down, left, and right directions the image reading means recognizes corresponds to the upward direction of the document image pattern. A vertical direction input means for inputting, and based on the vertical direction information, the vertical direction of the document image pattern stored in the image storage means and the upper direction recognized by the image input means match, Image rotation means for rotating the document image pattern is provided, and the page dividing means and the line / line direction detecting means are configured to input the document image pattern rotated by the image rotating means. Recognition device.
【請求項5】 請求項1又は2記載の光学式文字認識装
置において、 前記行・行方向検出手段により検出される行方向に基づ
いて、前記各行の両端の位置を求め、その両端の位置の
ばらつき量を検出する行両端バラツキ量検出手段と、 前記両端の位置のばらつき量に基づき、行の先頭方向を
算出し、その行の先頭方向と、前記文書画像パタンが
「横書き文書」であるか[縦書き文書」であるかの情報
とに基づいて、前記文書画像パタンの上の方向が前記画
像読取手段が認識する上下左右のいずれの方向に対応す
るかを示す天地方向情報を出力する頁天地方向判定手段
とを設け、 前記頁順序判定手段は、前記行方向と前記天地方向情報
とに基づいて、前記1つの文書画像パタンを構成する頁
の頁付与方向を判定する構成にしたことを特徴とする光
学式文字認識装置。
5. The optical character recognition device according to claim 1, wherein the positions of both ends of each line are obtained based on the line direction detected by the line / line direction detecting means, and the positions of the both ends are determined. A line-end variation amount detecting means for detecting a variation amount, and a line head direction are calculated based on the variation amount of the both end positions, and whether the line head direction and the document image pattern are “horizontal writing documents”. A page for outputting up-and-down direction information indicating which of the up, down, left and right directions recognized by the image reading means corresponds to the upward direction of the document image pattern based on the information of "vertical writing document". An upside-down direction determining means is provided, and the page order determining means is configured to determine a page-giving direction of pages forming the one document image pattern based on the row direction and the upside-down direction information. Characterizing Optical character recognition device.
【請求項6】 請求項1又は2記載の光学式文字認識装
置において、 前記行・行方向検出手段により検出される行方向に基づ
いて、前記各行の行重心位置を検出する行重心位置検出
手段と、 前記各行重心位置に基づいて、行重心平均位置を検出す
る行重心平均位置検出手段と、 前記行重心平均位置と前記文書画像パタンの中心位置と
から、行の先頭方向を算出し、その行の先頭方向と、前
記文書画像パタンが「横書き文書」であるか「縦書き文
書」であるかの情報とに基づいて、前記文書画像パタン
の上の方向が前記画像読取手段が認識する上下左右のい
ずれの方向に対応するかを示す天地方向情報を出力する
頁天地方向判定手段とを設け、 前記頁順序判定手段は、前記行方向と前記天地方向情報
とに基づいて、前記1つの文書画像パタンを構成する頁
の頁付与方向を判定する構成にしたことを特徴とする光
学式文字認識装置。
6. The optical character recognizing device according to claim 1 or 2, wherein a line barycentric position detecting unit detects a line barycentric position of each line based on a line direction detected by the line / line direction detecting unit. A line center of gravity average position detecting means for detecting a line center of gravity average position based on each of the line center of gravity positions, and a line leading direction is calculated from the line center of gravity average position and the center position of the document image pattern, and Based on the head direction of the line and the information indicating whether the document image pattern is a “horizontal writing document” or a “vertical writing document”, the upward direction of the document image pattern is recognized by the image reading means. And a page top-bottom direction determining means for outputting top-bottom direction information indicating which of the left and right directions corresponds to, the page order determining means, based on the row direction and the top-bottom direction information, the one document Image pattern Optical character recognition apparatus characterized in that the page imparting direction of the page composing the configuration determined.
JP7304554A 1995-11-22 1995-11-22 Optical character recognition device Withdrawn JPH09146930A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7304554A JPH09146930A (en) 1995-11-22 1995-11-22 Optical character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7304554A JPH09146930A (en) 1995-11-22 1995-11-22 Optical character recognition device

Publications (1)

Publication Number Publication Date
JPH09146930A true JPH09146930A (en) 1997-06-06

Family

ID=17934396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7304554A Withdrawn JPH09146930A (en) 1995-11-22 1995-11-22 Optical character recognition device

Country Status (1)

Country Link
JP (1) JPH09146930A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146413A (en) * 2006-12-11 2008-06-26 Ricoh Co Ltd Direction determination device, image processing device, image direction determination method, and image direction determination program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146413A (en) * 2006-12-11 2008-06-26 Ricoh Co Ltd Direction determination device, image processing device, image direction determination method, and image direction determination program

Similar Documents

Publication Publication Date Title
JPS63268081A (en) Method and apparatus for recognizing character of document
US6163623A (en) Method and apparatus for recognizing images of documents and storing different types of information in different files
JP3814320B2 (en) Image processing method and apparatus
JPH07175823A (en) Image formation storing/retrieving device
JPH09146930A (en) Optical character recognition device
JPH06149898A (en) Image storage retriever
JP3458001B2 (en) Image file device
JP2004280691A (en) Document filing device
JP3122476B2 (en) Automatic document copy machine
JPH01272371A (en) Copying machine
JP6798309B2 (en) Image processing equipment, image processing methods and programs
JPH0373916B2 (en)
JP3373068B2 (en) Optical character recognition device
JP2923004B2 (en) Image generation device
JPH09128478A (en) Image processor
JP3424942B2 (en) Bilingual image forming device
JPS6343788B2 (en)
JPS6214263A (en) Document picture processing system
JPH11250179A (en) Character reocognition device and its method
JP2721415B2 (en) Character image extraction method
JP2000306043A (en) Device and method for reading medium
JPS6236274B2 (en)
JPH04348475A (en) Method and device for retrieving image information
JPS6327751B2 (en)
JPH01144181A (en) Optical character reader

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030204