JP2008134683A - Image processor and image processing program - Google Patents

Image processor and image processing program Download PDF

Info

Publication number
JP2008134683A
JP2008134683A JP2006318409A JP2006318409A JP2008134683A JP 2008134683 A JP2008134683 A JP 2008134683A JP 2006318409 A JP2006318409 A JP 2006318409A JP 2006318409 A JP2006318409 A JP 2006318409A JP 2008134683 A JP2008134683 A JP 2008134683A
Authority
JP
Japan
Prior art keywords
unit
image processing
conversion
image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006318409A
Other languages
Japanese (ja)
Inventor
Masatoshi Tagawa
昌俊 田川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006318409A priority Critical patent/JP2008134683A/en
Publication of JP2008134683A publication Critical patent/JP2008134683A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To assist comparison of numerical information in business forms issued by issuers of a plurality of areas. <P>SOLUTION: A business form recognition part 40 provided in an image processor searches use language or a unit of a numeric value by performing character recognition of a business form read by an image reading part 22. A conversion necessity decision part 52 decides whether or not the translation of language or the conversion of units are necessary by comparing the locale (area) of the image processor searched by a device locale information acquisition part 50 with the use language or units of the business form. When it is necessary to translate language, a business form information processing part 60 converts the language into language corresponding to the locale of the image processor. When it is necessary to convert the units, the business form information processing part 60 converts the numerical values on the business form into the values of the units corresponding to the locale of the image processor. Thus, the results of translation and conversion are printed out from an image output device 24. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、画像処理装置および画像処理プログラムに関する。   The present invention relates to an image processing apparatus and an image processing program.

経済のグローバル化により、個人や企業が様々な国や地域から商品を購入するようになっている。例えば企業は、商品購入の際に、様々な国や地域にいる各商品提供者から見積もりを取得し、その中で最も有利な条件を提示した提供者から商品を購入する。近年では、見積もりが電子データの形で提供される場合も多くなっているが、ファクシミリや郵便で見積書が送られてくることも多い。また、国や地域による商品の長さや重さの単位、金額の通貨単位などといった単位が異なるため、様々な国や地域の提供者が発行した見積もり同士の比較は、困難な場合がある。   With the globalization of the economy, individuals and companies are buying products from various countries and regions. For example, when purchasing a product, a company obtains an estimate from each product provider in various countries and regions, and purchases the product from the provider who presents the most advantageous conditions among them. In recent years, quotes are often provided in the form of electronic data, but quotes are often sent by facsimile or mail. In addition, since units such as product length and weight and currency units of money differ depending on the country or region, it may be difficult to compare estimates issued by providers in various countries and regions.

特許文献1に示されるシステムは、資材の契約情報、現地価格および輸出入経費基礎情報の入力を受け付ける入力部と、輸出入経費基礎情報を格納したマスターテーブルと輸出入経費率算出ロジックを格納した算出テーブルとを有する記憶部と、入力情報に基づいて資材の現地価格から輸入元での着地価格を算出する算出部と、算出された着地価格を表示する表示部と、工場調達装置へ着地価格を送信する通信部とを備える。算出部はさらに、為替情報に基づいて資材の輸入元での現地価格および着地価格の通貨単位を統一し、また、リードタイム算出情報に基づいて資材のリードタイムを算出する。   The system disclosed in Patent Document 1 stores an input unit that accepts input of material contract information, local price, and basic information on import / export expenses, a master table that stores basic information on import / export expenses, and an import / export expense ratio calculation logic. A storage unit having a calculation table, a calculation unit that calculates a landing price at the import source from the local price of the material based on input information, a display unit that displays the calculated landing price, and a landing price to the factory procurement device The communication part which transmits. The calculation unit further unifies the local currency unit and the landing price currency unit at the material import source based on the exchange information, and calculates the material lead time based on the lead time calculation information.

特開2005−228306号公報Japanese Patent Laying-Open No. 2005-228306

本発明は、このような技術背景においてなされたものであり、複数の地域の提供者が発行した文書の中の数値情報同士の比較が従来では困難であったことを課題とし、複数の地域の発行者が発行した文書の中の数値情報同士の比較の助けとなる技術を提供する画像処理装置および画像処理プログラムを提供することを目的とする。   The present invention has been made in such a technical background, and it has been a problem that comparison of numerical information in documents issued by providers in a plurality of regions has been difficult in the past. It is an object of the present invention to provide an image processing apparatus and an image processing program that provide a technique that helps to compare numerical information in documents issued by an issuer.

(1)本発明の1つの側面では、文書を読み取る読取部と、前記読取部が出力する前記文書の画像データに対して文字認識を行う文字認識部と、前記文字認識部による文字認識の結果に基づき前記文書の地域情報を判定する判定部と、前記文字認識部による文字認識の結果に基づき、前記文書中の数値情報を検出する検出部と、前記判定部が判定した前記文書の地域情報が前記画像処理装置の設置場所の地域と異なる場合、前記文書に示された前記検出部が検出した数値情報を前記画像処理装置の地域に対応する単位又は表記方式における表現へと変換する変換部と、前記変換部による変換結果をユーザに提示する提示部と、を備える画像処理装置を提供する。   (1) In one aspect of the present invention, a reading unit that reads a document, a character recognition unit that performs character recognition on image data of the document output from the reading unit, and a result of character recognition by the character recognition unit A determination unit for determining the regional information of the document based on a detection unit, a detection unit for detecting numerical information in the document based on a result of character recognition by the character recognition unit, and the regional information of the document determined by the determination unit Is different from the area where the image processing apparatus is installed, the conversion unit converts numerical information detected by the detection unit shown in the document into a representation in a unit or a notation system corresponding to the area of the image processing apparatus And a presentation unit that presents a result of conversion by the conversion unit to a user.

(2)1つの態様では、上記構成(1)において、前記提示部は、前記数値情報の前記変換部による変換結果の表現を、前記文書に示された数値情報と共に印刷する。   (2) In one aspect, in the configuration (1), the presenting unit prints a representation of the conversion result of the numerical information by the conversion unit together with the numerical information indicated in the document.

(3)別の態様は、上記構成(1)において、画像処理装置は、前記数値情報の前記変換部による変換結果と、その数値情報の基準値と、の差が所定値以上ある場合に、その旨を報知する報知部、を更に備える。   (3) According to another aspect, in the configuration (1), the image processing apparatus has a difference between the conversion result of the numerical information by the conversion unit and a reference value of the numerical information, which is a predetermined value or more. An informing unit for informing that effect is further provided.

(4)別の態様では、コンピュータに、文書の画像データに対して文字認識を行い、文字認識の結果に基づき前記文書の地域情報を判定し、文字認識の結果に基づき、前記文書中の数値情報を検出し、前記文書の地域情報が、前記コンピュータの設置場所の地域と異なる場合、前記文書に示された前記検出部が検出した数値情報を前記画像処理装置の地域に対応する単位又は表記方式における表現へと変換し、この変換の結果をユーザに提示する、処理を実行させる画像処理プログラムを提供する。   (4) In another aspect, the computer performs character recognition on the image data of the document, determines regional information of the document based on the result of character recognition, and determines a numerical value in the document based on the result of character recognition When information is detected and the area information of the document is different from the area where the computer is installed, the numerical information detected by the detection unit indicated in the document is expressed in units or notation corresponding to the area of the image processing apparatus. Provided is an image processing program for executing processing for converting into expression in a system and presenting the result of this conversion to a user.

上記(1)又は(4)の構成によれば、文書に示される数値を画像処理装置の設置場所にあった単位又は表記方式に揃えることができ、ユーザにとって分かりやすい情報を提供できる。   According to the configuration of (1) or (4) above, the numerical values shown in the document can be aligned with the unit or the notation method suitable for the installation location of the image processing apparatus, and information easy to understand for the user can be provided.

上記(2)の構成では、変換結果の表現だけでなく、文書に元々示されていた数値情報も印刷されるので、ユーザが元の数値情報も同時に知ることができる。   In the configuration of (2), not only the conversion result expression but also the numerical information originally shown in the document is printed, so that the user can know the original numerical information at the same time.

上記(3)の構成によれば、例えば為替変動のように変換部の変換係数が時間によって変動する場合において所定値を越える大幅な変動をユーザに知らせたり、例えば各見積書の見積額が見積金額の基準値から許容範囲にあるか否かをユーザに知らせたりするなど、基準値と変換結果との差が大きい場合にそれをユーザに報知することで、ユーザの注意を喚起することができる。   According to the configuration of (3) above, for example, when the conversion coefficient of the conversion unit fluctuates with time, such as exchange rate fluctuation, the user is notified of a large fluctuation exceeding a predetermined value, or the estimated amount of each quotation is estimated. If the difference between the reference value and the conversion result is large, such as notifying the user whether the amount is within the allowable range from the reference value, the user can be alerted by notifying the user of the difference. .

以下、図面を参照して本発明の好適な実施の形態を説明する。図面において、同様の構成要素又はステップには同一符号を付して、重複した説明は省略する。   Preferred embodiments of the present invention will be described below with reference to the drawings. In the drawings, similar components or steps are denoted by the same reference numerals, and redundant description is omitted.

本実施形態では、スキャナとプリンタなどの機能を併せ持つ画像処理装置(このような画像処理装置は、デジタル複合機とも呼ばれる)にて、帳票(例えば見積書)等の文書を読み取り、この読取により得られた文書画像中の数値情報をユーザにとってわかりやすい単位に変換するなどの加工を行って出力する。   In the present embodiment, a document such as a form (for example, an estimate) is read by an image processing apparatus having both functions of a scanner and a printer (such an image processing apparatus is also called a digital multi-function peripheral), and obtained by this reading. The numerical information in the obtained document image is processed and output, for example, into a unit easy to understand for the user.

このような変換のために、この例では、画像処理装置が備える像域分離機能を利用する。複写機や複合機等の画像形成装置は、印刷画質向上のために、読み取った画像中の文字領域と画像領域とを分離する像域分離の機能を備えるものが一般的になっている。また、高速な印刷処理のため、この像域分離の機能の多くの部分はASIC(Application Specific Integrated Circuit) やDSP(Digital Signal Processor)等のハードウエア回路として実装されている。この例では、このような像域分離回路に必要に応じて拡張を施したものを利用することで、変換の効率化を図る。   For this conversion, in this example, an image area separation function provided in the image processing apparatus is used. 2. Description of the Related Art Image forming apparatuses such as copiers and multifunction peripherals generally have an image area separation function for separating a character area and an image area in a read image in order to improve print image quality. For high-speed printing processing, many parts of the image area separation function are implemented as hardware circuits such as an ASIC (Application Specific Integrated Circuit) and a DSP (Digital Signal Processor). In this example, conversion efficiency is improved by using such an image area separation circuit that has been expanded as necessary.

画像処理装置の制御機構の主要部を図1に示す。図1においてROM(リード・オンリ・メモリ)12には、画像処理装置の動作制御のための制御プログラムなどのデジタル情報が格納されている。CPU(中央処理装置)10がこのROM12内の制御プログラムを実行することにより、以下に説明する画像処理装置の各部の制御が実現される。   The main part of the control mechanism of the image processing apparatus is shown in FIG. In FIG. 1, a ROM (Read Only Memory) 12 stores digital information such as a control program for controlling the operation of the image processing apparatus. When the CPU (central processing unit) 10 executes the control program in the ROM 12, control of each part of the image processing apparatus described below is realized.

RAM(ランダム・アクセス・メモリ)14は、画像処理装置の主記憶装置であり、制御プログラムの実行の際にワークメモリとしても用いられる。RAM14は、例えば、画像出力装置24に供給する1ページ分の画像データを蓄えるページバッファとして用いることもできる。   A RAM (Random Access Memory) 14 is a main storage device of the image processing apparatus, and is also used as a work memory when executing the control program. The RAM 14 can also be used, for example, as a page buffer that stores image data for one page supplied to the image output device 24.

大容量記憶装置16は、各種のデータを保存するための補助記憶装置であり、例えばハードディスクやEEPROM(Electrically Erasable Programmable Read-Only Memory)などの不揮発性の記憶装置である。   The mass storage device 16 is an auxiliary storage device for storing various data, and is a non-volatile storage device such as a hard disk or an EEPROM (Electrically Erasable Programmable Read-Only Memory).

操作パネル18は、この画像形成装置のユーザインタフェースのための表示や、ユーザからの各種指示の入力受付などのためのユーザインタフェース手段である。操作パネル18は、例えば、スタートボタンなどの機械的な操作ボタンと、GUI(グラフィカル・ユーザ・インタフェース)のための液晶タッチパネルと、を備える。液晶タッチパネルは、CPU10で実行される制御プログラムが生成したGUI画面を表示し、そのディスプレイに対するユーザのタッチ位置を検出して制御プログラムに渡す。制御プログラムは、そのタッチ位置の情報からユーザの入力内容を解釈する。   The operation panel 18 is a user interface means for displaying the user interface of the image forming apparatus and receiving input of various instructions from the user. The operation panel 18 includes, for example, mechanical operation buttons such as a start button, and a liquid crystal touch panel for GUI (graphical user interface). The liquid crystal touch panel displays a GUI screen generated by a control program executed by the CPU 10, detects a user's touch position on the display, and passes the detected position to the control program. The control program interprets the input content of the user from the information on the touch position.

通信インタフェース20は、LAN(ローカル・エリア・ネットワーク)等のネットワークを介して他の装置とデータ通信を行う際の制御を担う装置である。リモートホストからのプリント指示等は、この通信インタフェース20を介して画像形成装置内に入力される。また、ネットワーク上にある言語翻訳サーバや変換レート情報提供サーバ(詳細は後述)などにアクセスする際にも、通信インタフェース20は用いられる。   The communication interface 20 is a device responsible for control when data communication is performed with another device via a network such as a LAN (local area network). A print instruction or the like from the remote host is input into the image forming apparatus via the communication interface 20. The communication interface 20 is also used when accessing a language translation server or conversion rate information providing server (details will be described later) on the network.

画像読取装置22は、原稿を光学的に読み取って電子的な画像データを生成する装置である。例えば、ラインセンサやエリアセンサを用いたスキャナがその一例である。自動原稿送り装置(ADF)(図示省略)にセットされた原稿は、ADFの機能により1枚ずつ画像読取装置に送られ、光学的に読み取られる。   The image reading device 22 is a device that optically reads a document and generates electronic image data. For example, a scanner using a line sensor or an area sensor is an example. Documents set on an automatic document feeder (ADF) (not shown) are fed one by one to the image reading device by the ADF function and optically read.

画像出力装置24は、CPU10の制御により供給される画像データを用紙に画像形成(印刷)する装置であり、プリントエンジンとも呼ばれる。   The image output apparatus 24 is an apparatus that forms (prints) an image on paper using image data supplied under the control of the CPU 10, and is also called a print engine.

ファクシミリモジュール26は、ファクシミリデータの送受信を行うモジュールである。   The facsimile module 26 is a module that transmits and receives facsimile data.

像域分離回路28は、画像読取装置22が読み取った帳票画像の像域分離を行う回路である。よく知られるように、像域分離では、画像のエッジ強度や空間周波数などの各種の画像特徴を用いて文字や画像などの像域を判別する。従来は、像域分離回路は、もっぱら印刷などといった画像出力のためのみに用いられていたが、この像域分離回路28は、画像出力だけでなく、帳票画像の解析処理にも利用する。   The image area separating circuit 28 is a circuit that performs image area separation of the form image read by the image reading device 22. As is well known, in image area separation, image areas such as characters and images are discriminated using various image features such as edge strength and spatial frequency of the image. Conventionally, the image area separation circuit is exclusively used for image output such as printing, but the image area separation circuit 28 is used not only for image output but also for analysis processing of a form image.

画像処理回路30は、帳票画像に対し、印刷やファクシミリ送信等の用途に応じた画像処理を施す回路である。例えば、印刷を行う場合、像域分離回路28で分離された文字と画像の像域に対し、それぞれ文字用の画像処理(エッジ強調など)と画像用の画像処理(階調補正など)を施す。   The image processing circuit 30 is a circuit that performs image processing on a form image in accordance with applications such as printing and facsimile transmission. For example, when printing, character image processing (such as edge enhancement) and image processing (such as gradation correction) are performed on the character and image image regions separated by the image region separation circuit 28, respectively. .

次に、この画像処理装置の帳票処理に関する機能部分の構成及びその処理内容を、図2及び図3を参照して説明する。この画像処理装置は、帳票処理のための機能として、図2に示すように、帳票認識部40、装置ロケール情報取得部50、変換要否判定部52、帳票情報処理部60、帳票DB(データベース)70を備える。これら各モジュールは、以下に説明する機能又は手順を記述したプログラムをCPU10に実行させることにより実現できる。このプログラムは、ROM12又は大容量記憶装置16に記憶されており、CPU10により実行される。このプログラム又はその一部は、ディスク等の可搬型媒体又はネットワーク経由のダウンロードにより大容量記憶装置16にインストールしてもよい。   Next, the configuration of the functional part related to the form processing of this image processing apparatus and the processing contents will be described with reference to FIGS. As shown in FIG. 2, the image processing apparatus has a form recognition unit 40, a device locale information acquisition unit 50, a conversion necessity determination unit 52, a form information processing unit 60, a form DB (database), as shown in FIG. ) 70. Each of these modules can be realized by causing the CPU 10 to execute a program describing functions or procedures described below. This program is stored in the ROM 12 or the mass storage device 16 and is executed by the CPU 10. This program or a part thereof may be installed in the mass storage device 16 by a portable medium such as a disk or by downloading via a network.

画像処理装置は、複写やファクシミリ送信などといった一般的な機能のほかに、応用的な機能として帳票処理機能を提供する。画像処理装置の操作パネル18に表示されるメニューから帳票処理機能が選択されると、画像処理装置は以下に例示する処理機能を提供する。   The image processing apparatus provides a form processing function as an applied function in addition to general functions such as copying and facsimile transmission. When a form processing function is selected from a menu displayed on the operation panel 18 of the image processing apparatus, the image processing apparatus provides a processing function exemplified below.

装置ロケール情報取得部50は、この画像処理装置のロケール情報を取得する(S11)。よく知られるように、ロケールとは情報処理システムの地域設定のことである。ロケール情報は、情報処理システムが設置された地域で用いられる言語、文字体系、度量衡の単位や通貨単位、日付の表記パターンなど、その地域に固有の設定の集合である。ここでいう「地域」の概念には、国が含まれ、また国の中にある地域や、複数の国に跨る地域も含まれる。また、複数の国からなる領域も、「地域」の概念の中に含まれる。装置ロケール情報取得部50は、例えば画像処理装置に登録されている使用地域の情報を読み取ることにより、当該装置のロケールを特定すればよい。以上に例示したロケール情報のように、装置の設置される、或いは使用される地域を表す情報のことを、地域情報と呼ぶ。   The device locale information acquisition unit 50 acquires locale information of the image processing device (S11). As is well known, a locale is a regional setting of an information processing system. The locale information is a set of settings unique to the region such as a language, a character system, a unit of measure, a unit of currency, a date unit, and a date notation pattern used in the region where the information processing system is installed. The concept of “region” here includes a country, and also includes a region in the country and a region that spans multiple countries. An area composed of a plurality of countries is also included in the concept of “area”. The device locale information acquisition unit 50 may identify the locale of the device by, for example, reading information on the region of use registered in the image processing device. Information representing the area where the apparatus is installed or used like the locale information exemplified above is called area information.

帳票処理機能が選択された後、画像読取装置22のADF又はプラテン上に原稿がセットされ読み取られると、読み取られた画像が帳票認識部40に渡される(S12)。   After the form processing function is selected, when an original is set and read on the ADF or platen of the image reading device 22, the read image is transferred to the form recognition unit 40 (S12).

帳票認識部40は、その画像を解析し、その画像の中から各種の情報を認識する。帳票認識部40において、フォーマット認識部42は、画像読取部22が読み取った画像を解析して、その画像がどの帳票パターンに該当するかを判定する(S13)。   The form recognition unit 40 analyzes the image and recognizes various types of information from the image. In the form recognition unit 40, the format recognition unit 42 analyzes the image read by the image reading unit 22 and determines which form pattern the image corresponds to (S13).

例えば見積書、請求書、領収書などという帳票の種類により帳票に記載される内容は変わる。また同じ見積書でも発行する人や会社が異なれば、その帳票のレイアウトは変わってくる。このように、発行者と帳票種類に応じて帳票のパターンは多種多様である。画像処理装置には、このような様々な帳票のパターンが登録されており、フォーマット認識部42は、読み取られた画像がそのいずれのパターンに該当するかを判定する。この判定において、フォーマット認識部42は、像域分離回路28の像域分離結果を利用してもよい。すなわち、像域分離結果により、画像上での文字領域、図形領域、写真画像領域等の配置が分かるので、その配置構成が、登録されている各帳票パターンのうちどれに近いかに基づき、上述の判定を行うことができる。例えば、帳票パターンごとに、その帳票パターンでの文字領域、図形領域等の各種領域の配置パターンを登録しておき、読み取った画像における各種領域の配置構成と、それら各帳票パターンにおける各種領域の配置構成との類似度を求め、例えばその類似度が所定値以上で最も高い帳票パターンを、その画像に対応する帳票パターンと判定すればよい。また、帳票には、その帳票の種別を示す見出しが表示されていることが多いので、見出し解析により帳票の種別を判定することもできる。例えば、画像中の上部にある文字領域を帳票の見出しと判断し、その見出しを文字認識し、文字認識により得られた文字列から帳票種別を判別すればよい。文字認識により「見積書」との文字列が得られれば、その画像は見積書の画像であることが分かる。このような文字認識は、文字認識部44により行われる。また、帳票には、発行者の企業ロゴや社印、社名などの情報が配置される場合が多く、そのような情報の配置される位置は、だいたい決まっている。そこで、そのような候補となる位置の画像領域の画像や、文字領域の文字列を解析し、それら画像や文字列と、あらかじめ登録された企業のロゴや社印、社名の文字列のとの類似度を求め、その類似度に基づき、その画像がどの企業の発行したものかを判別してもよい。帳票パターンの認識は、以上に例示した像域の配置構成、見出し、ロゴや社名などの類似度を総合して行うようにしてもよい。   For example, the contents described in the form vary depending on the type of the form such as an estimate, an invoice, and a receipt. Also, if the person or company that issues the same estimate is different, the layout of the form will change. As described above, there are various forms of forms depending on the issuer and the form type. In the image processing apparatus, such various forms of patterns are registered, and the format recognition unit 42 determines which pattern the read image corresponds to. In this determination, the format recognition unit 42 may use the image area separation result of the image area separation circuit 28. That is, the image area separation result shows the arrangement of the character area, graphic area, photographic image area, etc. on the image. Based on which of the registered form patterns is close to the above, Judgment can be made. For example, for each form pattern, the arrangement pattern of various areas such as character areas and graphic areas in the form pattern is registered, the arrangement configuration of various areas in the read image, and the arrangement of various areas in each of these form patterns The degree of similarity with the configuration is obtained, and for example, the form pattern having the highest degree of similarity equal to or higher than a predetermined value may be determined as the form pattern corresponding to the image. Further, since a headline indicating the type of the form is often displayed on the form, the type of the form can be determined by headline analysis. For example, the character area at the top of the image may be determined as the headline of the form, the headline may be recognized, and the form type may be determined from the character string obtained by character recognition. If a character string “estimate” is obtained by character recognition, it is understood that the image is an image of the estimate. Such character recognition is performed by the character recognition unit 44. In addition, information such as the company logo, company seal, and company name of the issuer is often placed on the form, and the location where such information is placed is generally determined. Therefore, the image of the image area at such a candidate position and the character string of the character area are analyzed, and the image and the character string are registered with the company logo, company seal, and company name character string registered in advance. Similarity may be obtained, and based on the similarity, it may be determined which company issued the image. The form pattern recognition may be performed by comprehensively combining the image area arrangement configuration, headings, logos, company names, and the like exemplified above.

帳票認識部40は、フォーマット認識部42の処理の結果に基づき、読み取られた画像が帳票であるか否かを判定し(S14)、帳票でなければ、エラーメッセージを操作パネル18の画面に表示するなどといったエラー処理を実行する(S15)。   The form recognition unit 40 determines whether the read image is a form based on the processing result of the format recognition unit 42 (S14). If it is not a form, an error message is displayed on the screen of the operation panel 18. Error processing such as performing is performed (S15).

読み取られた画像が、登録されたいずれかの帳票パターンに該当すると判定された場合は、ロケール判定部48が、像域分離結果において文字領域と判定された各領域についての文字認識部44による文字認識結果を取得し(S16)、その文字認識結果に含まれる文字の種類や単語などに基づき、その帳票において使用されている言語を判定する(S17)。文字認識結果の中の文字がアルファベットのみか、漢字のみか、漢字仮名交じりか、などの区別で、欧米の言語か、中国語系か、日本語かが判別できる。また、同じアルファベットでもウムラウトやアクサンテギュが含まれるか否かで英語か、ドイツ語か、フランス語かの判別ができる。また、帳票に使われやすい代表的な単語についての各言語での表現を画像処理装置にあらかじめ登録しておき、文字認識結果にそのような登録された表現があれば、それを加味して言語の判別を行う。このような文字認識結果からの言語判定には、従来の技術を利用できる。   If it is determined that the read image corresponds to one of the registered form patterns, the character recognition unit 44 uses the character recognition unit 44 for each region determined as a character region by the image region separation result. The recognition result is acquired (S16), and the language used in the form is determined based on the character type and the word included in the character recognition result (S17). By distinguishing whether the character in the character recognition result is alphabet only, kanji only, kanji kana or the like, it can be discriminated whether it is a Western language, Chinese or Japanese. In addition, it is possible to determine whether English, German or French by the same alphabet, depending on whether umlauts or accents are included. Also, expressions in each language for typical words that are likely to be used in forms are registered in advance in the image processing device, and if there are such registered expressions in the character recognition results, To determine. A conventional technique can be used for language determination from such a character recognition result.

数値・単位抽出部46は、上記文字認識結果の中から、数値又はそれに類する概念を示す文字列や、それら数値の単位を示す文字列を抽出する。帳票中に含まれる数値又はその類似概念には、例えば商品の数量や単価、合計金額、日付などがある。   The numerical value / unit extraction unit 46 extracts a character string indicating a numerical value or a similar concept or a character string indicating a unit of the numerical value from the character recognition result. Examples of numerical values or similar concepts included in the form include the quantity and unit price of the product, the total price, and the date.

以上のようにして帳票認識部40は、求めた使用言語の情報や各文字領域の文字認識結果、数値や単位の抽出結果を変換要否判定部52及び帳票情報処理部60に提供する。   As described above, the form recognizing unit 40 provides the obtained language information, the character recognition result of each character area, and the extraction result of numerical values and units to the conversion necessity determining unit 52 and the form information processing unit 60.

変換要否判定部52は、帳票認識部40が求めた使用言語が、装置ロケール情報取得部50が求めた画像処理装置のロケールに合致するかどうかを判定する(S18)。そして、使用言語が画像処理装置のロケールに合致しなければ、帳票情報処理部60に各文字領域の情報の翻訳を行わせる(S19)。この翻訳は、帳票情報処理部60内の翻訳部62が実行する。翻訳部62は、従来から用いられている自然言語翻訳技術を利用して、帳票中の単語や文を、画像処理装置のロケールに合致した言語に翻訳する。このように画像処理装置内に翻訳機能を設ける代わりに、ネットワーク上にある翻訳サーバに翻訳を依頼し、その翻訳結果を受け取ってもよい。なお、使用言語が画像処理装置のロケールに合致していれば、翻訳処理は不要である。   The conversion necessity determination unit 52 determines whether or not the language used by the form recognition unit 40 matches the locale of the image processing device obtained by the device locale information acquisition unit 50 (S18). If the language used does not match the locale of the image processing apparatus, the form information processing unit 60 is caused to translate information on each character area (S19). This translation is executed by the translation unit 62 in the form information processing unit 60. The translation unit 62 translates words and sentences in the form into a language that matches the locale of the image processing apparatus, using a natural language translation technique that has been used conventionally. In this way, instead of providing a translation function in the image processing apparatus, translation may be requested to a translation server on the network and the translation result may be received. If the language used matches the locale of the image processing apparatus, translation processing is not necessary.

また、変換要否判定部52は、数値・単位抽出部46で抽出した数値の中に単位が画像処理装置のロケールに合致しないものがあれば、その単位を画像処理装置のロケールに合った単位に変換するよう帳票情報処理部60に指示する(S20)。例えば、画像処理装置のロケールが「日本」である一方、帳票の言語が米語であり、帳票内の金額の単位が「米ドル」である場合は、その金額の単位を「日本円」に変え、為替レートにしたがって金額の値を変換する。また、帳票に例えば長さがフィート単位で記載されていれば、それをcm単位に変換する。このような変換は、単位変換部64が行う。単位変換部64は、このような変換のために、図4に示すようなロケール情報テーブルと、図5に示すような変換テーブルを備える。   Further, if there is a unit whose unit does not match the locale of the image processing device among the numerical values extracted by the numerical value / unit extraction unit 46, the conversion necessity determining unit 52 sets the unit to a unit that matches the locale of the image processing device. The form information processing unit 60 is instructed to convert to (S20). For example, when the locale of the image processing apparatus is “Japan”, the language of the form is American, and the unit of the amount in the form is “US dollar”, the unit of the amount is changed to “Japanese yen” Convert the value of the amount according to the exchange rate. For example, if the length is described in feet in the form, it is converted into cm. Such conversion is performed by the unit converter 64. The unit conversion unit 64 includes a locale information table as shown in FIG. 4 and a conversion table as shown in FIG. 5 for such conversion.

図4に例示したロケール情報テーブルには、数値情報の変数型と、ロケール(地域)と、数値情報のパターンとの組が登録される。例えば、変数型が「date」である日付情報は、ロケールが「Ja」すなわち日本の場合は、「yyyy‘年’M‘月’d‘日’」というパターンか「yyyy/MM/dd」というパターンで表現される。ロケール「En」は英語圏を示し、「En_US」は米国、「En_GB」は英国を示す。また、このテーブルでは、変数型が「length」である長さ情報は、ロケールが日本だとcm単位で表現され、英語圏だとフィート単位で表現されることを示している。図4に示したロケール情報はあくまで一例にすぎない。テーブルには、例示した以外の変数型やロケール、パターンが登録されていてもよい。なお、日付の例のように、同じロケールに対応するパターンが複数存在する数値情報については、画像処理装置のロケールに合わせて単位変換をする場合に、それら複数のパターンのうちどれに変換するかを、画像処理装置の管理者やユーザがあらかじめ画像処理装置に設定しておけばよい。   In the locale information table illustrated in FIG. 4, a set of a variable type of numerical information, a locale (region), and a pattern of numerical information is registered. For example, the date information whose variable type is “date” is the pattern “yyyy'year'M'month'd'day '" or "yyyy / MM / dd" if the locale is "Ja", that is, Japan. Expressed with a pattern. The locale “En” indicates an English-speaking area, “En_US” indicates the United States, and “En_GB” indicates the United Kingdom. In this table, the length information whose variable type is “length” indicates that the locale is expressed in centimeters when the locale is Japan, and is expressed in feet when the locale is English-speaking. The locale information shown in FIG. 4 is merely an example. Variable types, locales, and patterns other than those exemplified may be registered in the table. In addition, as in the date example, for numerical information that has multiple patterns corresponding to the same locale, which of these multiple patterns will be converted when unit conversion is performed according to the locale of the image processing device? May be set in advance in the image processing apparatus by an administrator or user of the image processing apparatus.

図示は省略したが、小数点や桁区切りの記号も国や地域によって異なる場合があり、このような国ごとの小数点等の記号もロケール情報の一種である。   Although illustration is omitted, there are cases where a decimal point or a digit separator is different depending on the country or region, and such a symbol such as a decimal point for each country is also a kind of locale information.

図5に例示した変換係数テーブルには、変換元と変換先の単位のペアに対し、変換係数の値が登録される。図示例では米国ドルから日本円への変換係数は118である。すなわち、米ドル単位で表された金額に係数118を乗じることで日本円単位の金額になる。変換係数のうち、通貨の為替レートは変動するので、その変動に応じて値を随時変更する。なお、このような変換係数の情報は、ネットワーク上にあるサーバで管理し、画像処理装置が変換を行う都度、その時点の最新情報を取得して利用するようにしてもよい。   In the conversion coefficient table illustrated in FIG. 5, conversion coefficient values are registered for pairs of conversion source and conversion destination units. In the illustrated example, the conversion coefficient from US dollar to Japanese yen is 118. In other words, the amount expressed in US dollars is multiplied by the coefficient 118 to obtain the amount in Japanese yen units. Of the conversion coefficients, the currency exchange rate fluctuates, so the value is changed as needed according to the fluctuation. Such conversion coefficient information may be managed by a server on the network, and the latest information at that time may be acquired and used each time the image processing apparatus performs conversion.

帳票情報処理部60の出力情報生成部66は、帳票認識部40から取得した帳票の情報と、翻訳部62の翻訳結果と、単位変換部64の変換結果とに基づき、ユーザに提供する出力情報を生成する(S21)。出力情報は、例えば、帳票内の言語や数値の単位を画像処理装置のロケールに合わせて変換したものである。このような出力情報が、画像出力装置24から印刷出力されたり、帳票DB70に蓄積されたりする(S22)。   The output information generation unit 66 of the form information processing unit 60 provides output information to the user based on the form information acquired from the form recognition unit 40, the translation result of the translation unit 62, and the conversion result of the unit conversion unit 64. Is generated (S21). The output information is, for example, information obtained by converting a language or numerical unit in a form according to the locale of the image processing apparatus. Such output information is printed out from the image output device 24 or accumulated in the form DB 70 (S22).

なお、出力情報には、元の単位の数値と単位変換結果の両方を含めてもよい。この場合、元の単位の数値と単位変換結果とを同じ帳票画像中に併記した画像を印刷出力してもよい。例えば、米国企業から受け取った図6に示す見積書100を、日本に設置された画像処理装置に読み取らせると、例えば図7に示すような見積書150が印刷出力される。この見積書150では、用語が日本語に翻訳されており、数値は日本の単位に換算された値のあとに、元の米国の単位で表現した値が括弧書きで示される。変換後の数値と変換前の数値の配列順序はこの逆でもよい。両方の値を併記することで、例えば誤変換の発見が容易になる。また、この見積書150には、これを印刷した日付152とその時点の為替レート154が、例えば用紙の周縁の余白部分に示されている。これにより、ユーザは、金額の変換結果が、いつの時点のどのようなレートで変換されたものかが分かる。   The output information may include both the numerical value of the original unit and the unit conversion result. In this case, an image in which the numerical value of the original unit and the unit conversion result are written together in the same form image may be printed out. For example, when the estimate 100 shown in FIG. 6 received from a US company is read by an image processing apparatus installed in Japan, for example, an estimate 150 as shown in FIG. 7 is printed out. In the estimate 150, the term is translated into Japanese, and the numerical value is converted into Japanese units, and then the value expressed in the original US unit is shown in parentheses. The order in which the converted numerical values and the numerical values before conversion are arranged may be reversed. By writing both values together, for example, it is easy to find an erroneous conversion. Further, in this estimate sheet 150, the date 152 on which it is printed and the exchange rate 154 at that time are shown, for example, in the margin of the periphery of the paper. Thereby, the user can know the conversion result of the amount of money and the conversion rate at which time.

このように日本向けに変換した見積書150は、日本の企業が発行した同じ対象に対する見積書200(図8参照)と数値の単位が揃っているので、両者を直感的に比較しやすい。   In this way, the estimate 150 converted for Japan has the same numerical unit as the estimate 200 (see FIG. 8) for the same target issued by a Japanese company, and therefore it is easy to intuitively compare the two.

なお、図7の例のように変換前と変換後の値を併記する代わりに、1枚の用紙の表と裏に元の帳票とその変換結果とを両面印刷してもよい。また、元の帳票とその変換結果とをそれぞれ別の用紙に印刷してもよい。また、変換後の数値を通常のトナーで印刷し、併記する元の単位の数値を、可視光線は反射しないが赤外線又は紫外線などの非可視光線で読み取ることができる非可視トナーで印刷してもよい。画像処理装置が、このような複数の印刷出力方式に対応している場合は、その中でどの方式を用いるかを、ユーザがその都度指定したり、管理者がデフォルト値を画像処理装置に設定したりしておけばよい。   Instead of writing the values before and after conversion as in the example of FIG. 7, the original form and the conversion result may be printed on both sides of the front and back of one sheet. In addition, the original form and the conversion result may be printed on different sheets. Also, the converted numerical values can be printed with normal toner, and the original unit values can be printed with invisible toner that does not reflect visible light but can be read with invisible light such as infrared or ultraviolet light. Good. When the image processing apparatus supports such a plurality of print output methods, the user designates which method to use among them, or the administrator sets default values in the image processing apparatus. Just do it.

また、印刷出力する代わりに、操作パネル18の表示画面に変換結果を表示してもよい。変換結果を印刷するのか、画面表示するのか、或いはその両方を行うのかは、ユーザ又は管理者が指定しておけばよい。   Further, instead of printing out, the conversion result may be displayed on the display screen of the operation panel 18. The user or administrator may specify whether the conversion result is printed, displayed on the screen, or both.

また、出力情報生成部66が生成した出力情報を、帳票DB70に保存してもよい。帳票DB70に保存する情報は、印刷又は表示に用いる画像情報の形でもよいし、帳票の文書構造をXML(eXtensible Markup Language)等の言語で記述された構造化文書の形でもよいし、それら両方を合わせたものでもよい。構造化文書の生成のためには、例えば各帳票パターンの情報の中に、帳票中の個々の要素の要素名や値の存在する位置、要素間の論理的な構造の情報を組み込んでおけばよい。例えばフォーマット認識部42が判定した帳票画像に該当する帳票パターンに基づき、帳票情報処理部60が、その帳票パターンの情報に基づき、帳票内の各要素(例えば発行日や発行者、個々の品目の金額、合計金額など)の値を帳票の画像内から認識し、認識した値を含んだ構造化文書を作成する。   The output information generated by the output information generation unit 66 may be stored in the form DB 70. The information stored in the form DB 70 may be in the form of image information used for printing or display, or may be in the form of a structured document in which the document structure of the form is described in a language such as XML (eXtensible Markup Language). It may be a combination of In order to generate a structured document, for example, the information of the element names and values of individual elements in the form and the logical structure information between the elements should be incorporated into the information of each form pattern. Good. For example, based on the form pattern corresponding to the form image determined by the format recognizing unit 42, the form information processing unit 60 determines each element in the form (for example, issue date, issuer, individual item) based on the form pattern information. Value) and the total amount) are recognized from the form image, and a structured document including the recognized value is created.

次に、別の例について説明する。例えば海外の業者から商品を購入する場合、輸入関税その他の税がかかる場合があるが、見積書の中にそのような税が示されていない場合もある。そのような場合に、帳票情報処理部60が、読み取った帳票の発行者が所在する地域を求め、これと画像処理装置のロケールとからその商品の輸入の際にかかる税を求め、その税の情報を出力情報に追加してもよい。帳票の発行者の地域は、帳票で用いられる言語又は帳票上に示される単位又は帳票に示された発行者の住所記載など、或いはそれらの組み合わせに基づき判定できる。輸出国(すなわち帳票の発行者の国)と輸入国(画像処理装置の設置された国)の情報、及び対象となる商品の種別などの組み合わせから決まる税率をデータベース化しておき、そのデータベースを参照して帳票情報処理部60が税率を求め、これを金額に乗じて税額を計算すればよい。   Next, another example will be described. For example, when you purchase goods from overseas vendors, import duties and other taxes may be levied, but such taxes may not be indicated in the estimate. In such a case, the form information processing unit 60 obtains the area where the issuer of the read form is located, obtains the tax for importing the product from this and the locale of the image processing apparatus, Information may be added to the output information. The region of the issuer of the form can be determined based on the language used in the form, the unit shown on the form, the address of the issuer shown on the form, or the like, or a combination thereof. Create a database of tax rates determined by a combination of information on the exporting country (ie, the country that issued the form) and the importing country (the country where the image processing device is installed), and the type of the target product, and refer to that database. Then, the form information processing unit 60 calculates the tax amount by calculating the tax rate and multiplying this by the amount.

次に実施形態の変形例について説明する。変形例では、読み取った帳票の数値の単位を変換した結果とその数値の基準値との差が所定値以上となった場合に、ユーザに対して通知を行うことで、ユーザの注意を喚起する。   Next, a modification of the embodiment will be described. In the modified example, when the difference between the result of converting the numerical unit of the read form and the reference value of the numerical value is equal to or greater than a predetermined value, the user is alerted by notifying the user. .

このような変形例の1つとして、為替レート変動に対する対処がある。画像処理装置により通貨単位の変換を行って出力した見積書は、出力時点の為替レートで金額の換算がなされている。これをあとで再検討したり他社からの見積書と比較したりするときには、出力の時点から為替レートが変動しており、金額が変わっていることが一般的である。この金額の変動が大きいと、判断に悪影響を与える可能性がある。そこで、この例の画像処理装置は、図9に示すように、通貨単位の変換を行って出力された見積書を再度読み取ったときに、この時点の為替レートにしたがって再度換算を行い、換算結果の金額(例えば合計額)が読み取った見積書に示された金額から所定値以上変化しているか否かを判定する(S23)。所定値以上変化していれば、その換算結果を反映した新たな出力情報を生成し(S21)、印刷又は表示出力する(S22)。変化が所定値未満であれば、そのような更新出力は行わない。この例では、単位変換を行った見積書を印刷した時点の金額が、上述の基準値に相当する。ステップS23において、例えば図7に示したように、画像処理装置が、単位変換された見積書を印刷する際に、例えば図7に示したようにそのときの為替レート又は日時を見積書に印刷しておけば、画像処理装置がその見積書を読み取った際に、その為替レート又は日時の記載を検出することで印刷当時の為替レートを知ることができる。ステップS23で更新出力を行うか否かの判定の基準となる変化量の閾値は、ユーザ又は管理者があらかじめ画像処理装置に登録しておけばよい。また、この例では、金額の変化を閾値と比較して更新出力の有無を判定したが、この代わりに為替レートの変化がある閾値以上になった場合に更新出力を行うようにしてもよい。   One such modification is dealing with exchange rate fluctuations. The estimate that has been converted and converted by the image processing apparatus is converted into an amount at the exchange rate at the time of output. When this is reviewed later or compared with estimates from other companies, the exchange rate has fluctuated since the time of output, and the amount has generally changed. Large fluctuations in this amount can adversely affect judgment. Therefore, as shown in FIG. 9, the image processing apparatus of this example performs conversion again according to the exchange rate at this time when the estimate written by converting the currency unit is read again, and the conversion result It is determined whether or not the amount of money (for example, the total amount) has changed by a predetermined value or more from the amount indicated in the read estimate (S23). If it has changed more than the predetermined value, new output information reflecting the conversion result is generated (S21), and printed or displayed (S22). If the change is less than a predetermined value, such update output is not performed. In this example, the amount of money at the time of printing the estimate converted unit is equivalent to the above-described reference value. In step S23, for example, as shown in FIG. 7, when the image processing apparatus prints the unit-converted estimate, for example, as shown in FIG. 7, the current exchange rate or date / time is printed on the estimate. Then, when the image processing apparatus reads the estimate, it can know the exchange rate at the time of printing by detecting the exchange rate or the description of the date and time. The change threshold value used as a criterion for determining whether or not to perform the update output in step S23 may be registered in advance in the image processing apparatus by the user or the administrator. In this example, the change in the amount of money is compared with a threshold value to determine whether or not there is an update output. Instead, the update output may be performed when the change in the exchange rate exceeds a certain threshold value.

また、更に別の例として、為替レート変動により見積金額又は為替レートに大幅な変動があった場合に、ユーザが登録した連絡先に画像処理装置が電子メールその他の通知手段で通知を行ってもよい。これには、例えば画像処理装置が見積書の金額の通貨単位を変換して印刷出力した際に、見積書を入力したユーザに連絡先情報(例えば電子メールアドレス)を画像処理装置に入力させればよい。そして、その後の為替レート変動により見積金額又は為替レートがあらかじめ設定された閾値を超えた場合に、画像処理装置がその連絡先に大幅な金額の変動があった旨の通知を行えばよい。   As another example, if there is a significant fluctuation in the estimated amount or exchange rate due to exchange rate fluctuations, the image processing apparatus may notify the contact information registered by the user by e-mail or other notification means. Good. For example, when the image processing apparatus converts the currency unit of the amount of the estimate and prints it out, the user who entered the estimate can input contact information (for example, an e-mail address) to the image processing apparatus. That's fine. Then, when the estimated amount or the exchange rate exceeds a preset threshold value due to subsequent exchange rate fluctuations, the image processing apparatus may notify that the contact has undergone a significant amount fluctuation.

また更に別の例として、画像処理装置にユーザがあらかじめ見積金額の基準値を入力しておき、図10に示すように、画像処理装置が読み取った見積書の見積金額を単位変換した結果をその基準値と比較し(S24)、単位変換結果と基準値との差が所定値以上あれば、そのような差がある旨を示す情報を出力情報に組み込み(S25)、印刷出力してもよい(S22)。そのような印刷出力の代わりに、単位変換結果と基準値との差が所定値以上ある旨のメッセージを操作パネル18の画面に表示してもよい。   As yet another example, the user inputs a reference value for the estimated amount in advance to the image processing apparatus, and the result of unit conversion of the estimated amount of the estimated document read by the image processing apparatus as shown in FIG. Compared with the reference value (S24), if the difference between the unit conversion result and the reference value is greater than or equal to a predetermined value, information indicating that there is such a difference may be incorporated into the output information (S25) and printed out. (S22). Instead of such print output, a message indicating that the difference between the unit conversion result and the reference value is a predetermined value or more may be displayed on the screen of the operation panel 18.

また、図10のような処理は、見積金額の為替変動以外にも利用可能である。例えば、重さや長さその他の数値の単位変換で誤変換が起こると、帳票同士の比較が正確に行えない。そこで、変換結果の数値が、これに対応する基準値と所定値以上異なっている場合に、その旨を画面表示したり、変換結果を示す帳票にその旨のメッセージを追加して出力したりしてもよい。   Further, the processing as shown in FIG. 10 can be used in addition to the exchange rate fluctuation of the estimated amount. For example, when erroneous conversion occurs in unit conversion of weight, length, and other numerical values, it is not possible to accurately compare forms. Therefore, if the conversion result value is different from the corresponding reference value by a predetermined value or more, that fact is displayed on the screen, or a message to that effect is added to the report showing the conversion result and output. May be.

以上の例では、画像処理装置が読み取った帳票について、その画像処理装置が数値情報の変換を行ったが、そのような変換機能は、帳票を読み取った装置とは別の装置で実行されてもよい。この別の装置は、例えば、汎用のコンピュータにて上述の各部の機能又は処理内容を記述したプログラムを実行することにより実現してもよい。コンピュータは、例えば、ハードウエアとして、CPU(中央演算装置)、メモリ(一次記憶)、各種I/O(入出力)インタフェース等がバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、HDD(ハードディスクドライブ)やCDやDVD、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体を読み取るためのディスクドライブが接続される。このようなドライブは、メモリに対する外部記憶装置として機能する。実施形態の処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク経由で、HDD等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがメモリに読み出されCPUにより実行されることにより、実施形態の処理が実現される。なお、像域分離回路28による画像の領域分類の機能も、類似機能をプログラムで実現することができる。   In the above example, the image processing apparatus converts numerical information on the form read by the image processing apparatus. However, such a conversion function may be executed by a device different from the apparatus that read the form. Good. This another apparatus may be realized, for example, by executing a program describing the function or processing content of each unit described above on a general-purpose computer. For example, a computer has a circuit configuration in which a CPU (Central Processing Unit), a memory (primary storage), various I / O (input / output) interfaces, and the like are connected via a bus as hardware. Also, a disk drive for reading various types of portable non-volatile recording media such as an HDD (hard disk drive), a CD, a DVD, and a flash memory is connected to the bus via, for example, an I / O interface. Such a drive functions as an external storage device for the memory. A program in which the processing content of the embodiment is described is stored in a fixed storage device such as an HDD via a recording medium such as a CD or DVD, or via a network, and is installed in a computer. The program stored in the fixed storage device is read into the memory and executed by the CPU, whereby the processing of the embodiment is realized. A similar function can also be realized by a program for the function of classifying an image region by the image region separation circuit 28.

実施形態の画像処理装置のハードウエア構成の例を示す図である。It is a figure which shows the example of the hardware constitutions of the image processing apparatus of embodiment. 実施形態の画像処理装置の機能構成の例を示す図である。It is a figure which shows the example of a function structure of the image processing apparatus of embodiment. 実施形態の画像処理装置の処理手順の例を示すフローチャートである。6 is a flowchart illustrating an example of a processing procedure of the image processing apparatus according to the embodiment. ロケール情報テーブルの例を示す図である。It is a figure which shows the example of a locale information table. 単位変換のための変換係数テーブルの例を示す図である。It is a figure which shows the example of the conversion coefficient table for unit conversion. 変換前の帳票の例を示す図である。It is a figure which shows the example of the form before conversion. 実施形態の画像処理装置により変換された帳票の例を示す図である。It is a figure which shows the example of the form converted by the image processing apparatus of embodiment. 別の帳票の例を示す図である。It is a figure which shows the example of another form. 変形例の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of a modification. 別の変形例の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of another modification.

符号の説明Explanation of symbols

22 画像読取装置、24 画像出力装置、40 帳票認識部、42 フォーマット認識部、44 文字認識部、46 数値・単位抽出部、48 ロケール判定部、50 装置ロケール情報取得部、52 変換要否判定部、60 帳票情報処理部、62 翻訳部、64 単位変換部、66 出力情報生成部、70 帳票DB。   22 image reading device, 24 image output device, 40 form recognition unit, 42 format recognition unit, 44 character recognition unit, 46 numerical value / unit extraction unit, 48 locale determination unit, 50 device locale information acquisition unit, 52 conversion necessity determination unit , 60 form information processing part, 62 translation part, 64 unit conversion part, 66 output information generation part, 70 form DB.

Claims (4)

文書を読み取る読取部と、
前記読取部が出力する前記文書の画像データに対して文字認識を行う文字認識部と、
前記文字認識部による文字認識の結果に基づき前記文書の地域情報を判定する判定部と、
前記文字認識部による文字認識の結果に基づき、前記文書中の数値情報を検出する検出部と、
前記判定部が判定した前記文書の地域情報が前記画像処理装置の設置場所の地域と異なる場合、前記文書に示された前記検出部が検出した数値情報を前記画像処理装置の地域に対応する単位又は表記方式における表現へと変換する変換部と、
前記変換部による変換結果をユーザに提示する提示部と、
を備える画像処理装置。
A reading unit for reading a document;
A character recognition unit that performs character recognition on the image data of the document output by the reading unit;
A determination unit that determines region information of the document based on a result of character recognition by the character recognition unit;
A detection unit that detects numerical information in the document based on a result of character recognition by the character recognition unit;
When the region information of the document determined by the determination unit is different from the region of the installation location of the image processing device, the numerical information detected by the detection unit indicated in the document is a unit corresponding to the region of the image processing device Or a conversion unit for converting into expression in the notation system;
A presentation unit for presenting a conversion result by the conversion unit to a user;
An image processing apparatus comprising:
請求項1記載の画像処理装置であって、
前記提示部は、前記数値情報の前記変換部による変換結果の表現を、前記文書に示された数値情報と共に印刷する、
ことを特徴とする画像処理装置。
The image processing apparatus according to claim 1,
The presenting unit prints the representation of the conversion result by the conversion unit of the numerical information together with the numerical information indicated in the document.
An image processing apparatus.
請求項1記載の画像処理装置であって、
前記数値情報の前記変換部による変換結果と、その数値情報の基準値と、の差が所定値以上ある場合に、その旨を報知する報知部、
を更に備える画像処理装置。
The image processing apparatus according to claim 1,
A notification unit for notifying that when a difference between the conversion result of the numerical information by the conversion unit and a reference value of the numerical information is a predetermined value or more;
An image processing apparatus further comprising:
コンピュータに、
文書の画像データに対して文字認識を行い、
文字認識の結果に基づき前記文書の地域情報を判定し、
文字認識の結果に基づき、前記文書中の数値情報を検出し、
前記文書の地域情報が、前記コンピュータの設置場所の地域と異なる場合、前記文書に示された前記検出部が検出した数値情報を前記画像処理装置の地域に対応する単位又は表記方式における表現へと変換し、
この変換の結果をユーザに提示する、
処理を実行させる画像処理プログラム。
On the computer,
Character recognition is performed on document image data,
Determine the regional information of the document based on the result of character recognition;
Based on the result of character recognition, detect numerical information in the document,
When the area information of the document is different from the area where the computer is installed, the numerical information detected by the detection unit indicated in the document is expressed in a unit or a notation system corresponding to the area of the image processing apparatus. Converted,
Present the result of this conversion to the user,
An image processing program for executing processing.
JP2006318409A 2006-11-27 2006-11-27 Image processor and image processing program Pending JP2008134683A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006318409A JP2008134683A (en) 2006-11-27 2006-11-27 Image processor and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006318409A JP2008134683A (en) 2006-11-27 2006-11-27 Image processor and image processing program

Publications (1)

Publication Number Publication Date
JP2008134683A true JP2008134683A (en) 2008-06-12

Family

ID=39559523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006318409A Pending JP2008134683A (en) 2006-11-27 2006-11-27 Image processor and image processing program

Country Status (1)

Country Link
JP (1) JP2008134683A (en)

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011523150A (en) * 2008-06-13 2011-08-04 マイクロソフト コーポレーション Processing receipts received in correspondence
JP2012517637A (en) * 2009-02-10 2012-08-02 コファックス, インコーポレイテッド System, method and computer program product for determining document validity
JP5010749B1 (en) * 2011-06-02 2012-08-29 株式会社行本会計事務所 Accounting journal file data standardization system, audit system using the system, and programs thereof
JP2012194932A (en) * 2011-03-18 2012-10-11 Hitachi Ltd Document certification system and document certification method
JP2012252696A (en) * 2012-05-25 2012-12-20 Yukumoto Kaikei Jimusho Co Ltd Accounting journal file data standardization system and program for the same
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8788350B2 (en) 2008-06-13 2014-07-22 Microsoft Corporation Handling payment receipts with a receipt store
JP2014186517A (en) * 2013-03-22 2014-10-02 Kyocera Document Solutions Inc Business support system, and business support program
US8855375B2 (en) 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
US8879846B2 (en) 2009-02-10 2014-11-04 Kofax, Inc. Systems, methods and computer program products for processing financial documents
US8885229B1 (en) 2013-05-03 2014-11-11 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9141926B2 (en) 2013-04-23 2015-09-22 Kofax, Inc. Smart mobile application development platform
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
JP2015225555A (en) * 2014-05-28 2015-12-14 富士通株式会社 Output program, output apparatus and output method
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
JP5920751B1 (en) * 2015-06-18 2016-05-18 株式会社システムイン国際 Public construction totalization system and public construction totalization system that implements the totalization result check system
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
JP2017033119A (en) * 2015-07-30 2017-02-09 富士通フロンテック株式会社 Receipt destination specification program, receipt destination specification method, and information processor
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9747269B2 (en) 2009-02-10 2017-08-29 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
JP2018517222A (en) * 2015-06-12 2018-06-28 ビルトレイダー プロプライエタリー リミテッドBilltrader Pty Ltd Computer implemented multi-currency invoice acquisition, trading, access and payment system
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
JP2019082896A (en) * 2017-10-31 2019-05-30 キヤノンマーケティングジャパン株式会社 Information processing device, processing method and program of the same
CN110097040A (en) * 2018-01-31 2019-08-06 精工爱普生株式会社 Image processing apparatus and storage medium
KR20190099852A (en) * 2018-02-20 2019-08-28 삼성전자주식회사 Electronic device and method for recognizing character
JP6646308B1 (en) * 2019-03-07 2020-02-14 ファーストアカウンティング株式会社 Voucher analysis device, accounting processing system, voucher analysis method, voucher analysis program
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11610417B2 (en) 2019-08-13 2023-03-21 Canon Kabushiki Kaisha Image processing apparatus, control method thereof and storage medium

Cited By (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US8788350B2 (en) 2008-06-13 2014-07-22 Microsoft Corporation Handling payment receipts with a receipt store
JP2011523150A (en) * 2008-06-13 2011-08-04 マイクロソフト コーポレーション Processing receipts received in correspondence
US8879846B2 (en) 2009-02-10 2014-11-04 Kofax, Inc. Systems, methods and computer program products for processing financial documents
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8855425B2 (en) 2009-02-10 2014-10-07 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9747269B2 (en) 2009-02-10 2017-08-29 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
JP2012517637A (en) * 2009-02-10 2012-08-02 コファックス, インコーポレイテッド System, method and computer program product for determining document validity
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9396388B2 (en) 2009-02-10 2016-07-19 Kofax, Inc. Systems, methods and computer program products for determining document validity
JP2012194932A (en) * 2011-03-18 2012-10-11 Hitachi Ltd Document certification system and document certification method
WO2012165600A1 (en) * 2011-06-02 2012-12-06 株式会社Ykプランニング Summary journalizing file data standardization system
JP5010749B1 (en) * 2011-06-02 2012-08-29 株式会社行本会計事務所 Accounting journal file data standardization system, audit system using the system, and programs thereof
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8855375B2 (en) 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9158967B2 (en) 2012-01-12 2015-10-13 Kofax, Inc. Systems and methods for mobile image capture and processing
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US9165187B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US8971587B2 (en) 2012-01-12 2015-03-03 Kofax, Inc. Systems and methods for mobile image capture and processing
US10664919B2 (en) 2012-01-12 2020-05-26 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US8879120B2 (en) 2012-01-12 2014-11-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9342742B2 (en) 2012-01-12 2016-05-17 Kofax, Inc. Systems and methods for mobile image capture and processing
US10657600B2 (en) 2012-01-12 2020-05-19 Kofax, Inc. Systems and methods for mobile image capture and processing
US9514357B2 (en) 2012-01-12 2016-12-06 Kofax, Inc. Systems and methods for mobile image capture and processing
JP2012252696A (en) * 2012-05-25 2012-12-20 Yukumoto Kaikei Jimusho Co Ltd Accounting journal file data standardization system and program for the same
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9754164B2 (en) 2013-03-13 2017-09-05 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US10127441B2 (en) 2013-03-13 2018-11-13 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9996741B2 (en) 2013-03-13 2018-06-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
JP2014186517A (en) * 2013-03-22 2014-10-02 Kyocera Document Solutions Inc Business support system, and business support program
US10146803B2 (en) 2013-04-23 2018-12-04 Kofax, Inc Smart mobile application development platform
US9141926B2 (en) 2013-04-23 2015-09-22 Kofax, Inc. Smart mobile application development platform
US8885229B1 (en) 2013-05-03 2014-11-11 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US9584729B2 (en) 2013-05-03 2017-02-28 Kofax, Inc. Systems and methods for improving video captured using mobile devices
US9253349B2 (en) 2013-05-03 2016-02-02 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US9946954B2 (en) 2013-09-27 2018-04-17 Kofax, Inc. Determining distance between an object and a capture device based on captured image data
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9747504B2 (en) 2013-11-15 2017-08-29 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
JP2015225555A (en) * 2014-05-28 2015-12-14 富士通株式会社 Output program, output apparatus and output method
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
JP7246788B2 (en) 2015-06-12 2023-03-28 ビルトレイダー プロプライエタリー リミテッド Computer-implemented multi-currency invoice acquisition, trading, access and payment system
JP2022116218A (en) * 2015-06-12 2022-08-09 ビルトレイダー プロプライエタリー リミテッド Computer-implemented multi-currency invoice capture, trading, access and payment system
JP2018517222A (en) * 2015-06-12 2018-06-28 ビルトレイダー プロプライエタリー リミテッドBilltrader Pty Ltd Computer implemented multi-currency invoice acquisition, trading, access and payment system
JP5920751B1 (en) * 2015-06-18 2016-05-18 株式会社システムイン国際 Public construction totalization system and public construction totalization system that implements the totalization result check system
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
JP2017033119A (en) * 2015-07-30 2017-02-09 富士通フロンテック株式会社 Receipt destination specification program, receipt destination specification method, and information processor
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
JP2019082896A (en) * 2017-10-31 2019-05-30 キヤノンマーケティングジャパン株式会社 Information processing device, processing method and program of the same
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN110097040A (en) * 2018-01-31 2019-08-06 精工爱普生株式会社 Image processing apparatus and storage medium
CN110097040B (en) * 2018-01-31 2023-07-04 精工爱普生株式会社 Image processing apparatus and storage medium
US11308317B2 (en) 2018-02-20 2022-04-19 Samsung Electronics Co., Ltd. Electronic device and method for recognizing characters
WO2019164196A1 (en) * 2018-02-20 2019-08-29 삼성전자 주식회사 Electronic device and method for recognizing characters
KR20190099852A (en) * 2018-02-20 2019-08-28 삼성전자주식회사 Electronic device and method for recognizing character
KR102585645B1 (en) * 2018-02-20 2023-10-10 삼성전자주식회사 Electronic device and method for recognizing character
JP6646308B1 (en) * 2019-03-07 2020-02-14 ファーストアカウンティング株式会社 Voucher analysis device, accounting processing system, voucher analysis method, voucher analysis program
US11610417B2 (en) 2019-08-13 2023-03-21 Canon Kabushiki Kaisha Image processing apparatus, control method thereof and storage medium
JP7408313B2 (en) 2019-08-13 2024-01-05 キヤノン株式会社 Image processing device, its control method and program

Similar Documents

Publication Publication Date Title
JP2008134683A (en) Image processor and image processing program
US7797150B2 (en) Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database
US20070212143A1 (en) Print management apparatus, recording medium, and print management method
US20090112652A1 (en) Project publishing system and method
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
US8699076B2 (en) Image forming apparatus, server, image forming system, and storage medium, outputting superimposed text strings in a variable form page
JP6277921B2 (en) Glossary management device and glossary management program
JP2008257543A (en) Image processing system and program
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP2010198594A (en) Data conversion apparatus, printing apparatus, data conversion program
JP2012216083A (en) Document creation apparatus, document creation program, document creation method, and leakage source identifying system using document creation apparatus
JP2012190314A (en) Image processing device and program
US10163024B2 (en) Electronic device and electronic device control method
WO2019225007A1 (en) Input error detection apparatus, input error detection method, and input error detection program
JP6749583B2 (en) Information processing device, image processing device, and program
JP2019057137A (en) Information processing apparatus and information processing program
WO2022097189A1 (en) Data processing device, data processing method, and program
JP7247568B2 (en) Program and input format setting method
JP7317612B2 (en) Information processing device, information processing method and program
US10417488B2 (en) Re-application of filters for processing receipts and invoices
US20200273462A1 (en) Information processing apparatus and non-transitory computer readable medium
JP7114892B2 (en) image forming device
US20190012400A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2007052614A (en) Documentat management device, document management system and document management method
JP2007018158A (en) Character processor, character processing method, and recording medium