JP2008282062A - Document digitization system and program - Google Patents

Document digitization system and program Download PDF

Info

Publication number
JP2008282062A
JP2008282062A JP2007122967A JP2007122967A JP2008282062A JP 2008282062 A JP2008282062 A JP 2008282062A JP 2007122967 A JP2007122967 A JP 2007122967A JP 2007122967 A JP2007122967 A JP 2007122967A JP 2008282062 A JP2008282062 A JP 2008282062A
Authority
JP
Japan
Prior art keywords
document
entrustee
document image
level
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007122967A
Other languages
Japanese (ja)
Inventor
Masasane Yamada
匡実 山田
Kousuke Oshima
功資 大島
Tomoya Yoshimura
智也 吉村
Masakazu Murakami
正和 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2007122967A priority Critical patent/JP2008282062A/en
Publication of JP2008282062A publication Critical patent/JP2008282062A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a document digitization system and a technology related thereto, which appropriately outsources processing in consideration of various request levels. <P>SOLUTION: In the document digitization system, a request level can be changed which is related to a result of character recognition processing for a document image. Then, in the document digitization system, when determined that the result of character recognition processing for the document image does not satisfy the request level, a consignment instruction for consigning digitization processing of character information included in the document image is transmitted to a consignee apparatus. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、原稿電子化システムおよびそれに関連する技術に関する。   The present invention relates to a manuscript digitization system and related technology.

画像形成装置(例えばMFP)等を用いて原稿の画像を取得し、当該画像に含まれる文字を認識する技術が存在する。これによれば、原稿に含まれる文字情報を電子化することが可能である。   There is a technique for acquiring an image of a document using an image forming apparatus (for example, MFP) and recognizing characters included in the image. According to this, it is possible to digitize the character information included in the document.

ただし、このような文字認識における認識率は100%に満たないことが多く、十分な品質を確保することは難しい。   However, the recognition rate in such character recognition is often less than 100%, and it is difficult to ensure sufficient quality.

このような状況に応える技術として、例えば、特許文献1に記載の技術が存在する。   As a technique for responding to such a situation, for example, a technique described in Patent Document 1 exists.

特許文献1の技術では、課税計算に用いられる課税根拠資料(帳票原稿)をスキャンニングしてその画像が生成され、当該画像に関する文字認識処理が実行される。そして、当該文字認識処理における文字認識率が所定の基準値(固定値)よりも低い場合には、当該資料の文字情報の入力業務が外部に委託される。   In the technique of Patent Document 1, a tax base material (form original) used for tax calculation is scanned to generate an image, and a character recognition process for the image is executed. When the character recognition rate in the character recognition process is lower than a predetermined reference value (fixed value), the character information input work for the material is outsourced.

特開2005−266967号公報JP 2005-266967 A

ところで、文字認識処理においては、様々な要求レベルが存在する。例えば、完全な認識結果が要求される場合、すなわち100%の認識率が要求される場合もあれば、それに限らず、多少の誤認識は許容される場合もある。   By the way, there are various required levels in character recognition processing. For example, when a complete recognition result is required, that is, a recognition rate of 100% may be required, and not limited thereto, some misrecognition may be allowed.

しかしながら、特許文献1の技術においては、文字認識率に関する基準値は固定値である。   However, in the technique of Patent Document 1, the reference value regarding the character recognition rate is a fixed value.

例えば、この基準値が「100%」に固定される場合においては、認識率が100%未満であるとき(すなわち少しでも誤認識が存在するとき)には常に外部への委託処理が実行されてしまう。そのため、多少の誤認識が許容されるときであっても外部への委託処理が実行されることとなり、外部への無駄な発注が生じてしまう。一方、この基準値が比較的低い値(例えば80%)に固定される場合においては、100%の認識率が要求されるにも関わらず必ずしも十分な認識結果を得ることが出来ないことがある。   For example, when the reference value is fixed at “100%”, when the recognition rate is less than 100% (that is, when there is even a slight recognition error), outsourcing processing is always executed. End up. For this reason, even when some misrecognition is allowed, a consignment process to the outside is executed, resulting in a wasteful ordering to the outside. On the other hand, when this reference value is fixed to a relatively low value (for example, 80%), a sufficient recognition result may not always be obtained although a recognition rate of 100% is required. .

そこで、この発明の課題は、様々な要求レベルを考慮して適切な委託処理を実行することが可能な原稿電子化システムおよびそれに関連する技術を提供することにある。   SUMMARY OF THE INVENTION An object of the present invention is to provide a manuscript digitization system capable of executing an appropriate consignment process in consideration of various request levels and a technology related thereto.

上記課題を解決すべく、請求項1の発明は、原稿画像に含まれる文字情報を電子化する原稿電子化システムであって、前記原稿画像に対する文字認識処理の結果に関する要求レベルを変更することが可能な設定手段と、前記原稿画像に対する前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合に、前記原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する委託動作制御手段とを備えることを特徴とする。   In order to solve the above-mentioned problem, the invention of claim 1 is a document digitizing system that digitizes character information included in a document image, wherein a request level relating to a result of character recognition processing on the document image can be changed. And a delegation instruction for entrusting digitization processing of character information included in the document image when it is determined that the result of the character recognition processing on the document image does not satisfy the required level. It comprises a commissioning operation control means for transmitting to a commissioning party.

請求項2の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記要求レベルに応じて前記委託先の候補を抽出する抽出手段と、当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段とをさらに備えることを特徴とする。   According to a second aspect of the present invention, in the document digitizing system according to the first aspect of the present invention, an extracting means for extracting the candidate for the consignee according to the request level, and a selection for selecting the consignee from the candidates It further comprises a determining means for determining the entrustee in accordance with an operation.

請求項3の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記原稿画像の言語に応じて前記委託先の候補を抽出する抽出手段と、当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段とをさらに備えることを特徴とする。   According to a third aspect of the present invention, in the electronic document system according to the first aspect of the present invention, an extraction means for extracting the candidate of the consignee according to the language of the manuscript image, and selecting the consignee from the candidates And determining means for determining the entrustee in accordance with a selection operation to be performed.

請求項4の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記原稿画像における機密情報の有無に応じて前記委託先の候補を抽出する抽出手段と、当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段とをさらに備えることを特徴とする。   According to a fourth aspect of the present invention, there is provided the original digitizing system according to the first aspect, wherein the entrusting candidate is extracted according to presence or absence of confidential information in the original image, and the consignment is selected from the candidates. And a determination unit that determines the entrustee according to a selection operation for selecting a destination.

請求項5の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記原稿画像における機密情報の機密レベルに応じて前記委託先の候補を抽出する抽出手段と、当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段とをさらに備えることを特徴とする。   According to a fifth aspect of the present invention, in the document digitization system according to the first aspect of the present invention, an extraction unit that extracts a candidate for the entrustee in accordance with a confidential level of confidential information in the document image; It further comprises a determining means for determining the entrustee according to a selection operation for selecting the entrustee.

請求項6の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記委託動作制御手段は、前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合であっても、前記原稿画像における機密情報の機密レベルが所定レベル以上であるときには、前記原稿画像に関する前記委託指示を送信しないことを特徴とする。   A sixth aspect of the present invention is the original document digitizing system according to the first aspect of the invention, wherein the consignment operation control means determines that the result of the character recognition processing does not satisfy the required level. However, when the confidential level of the confidential information in the document image is equal to or higher than a predetermined level, the consignment instruction regarding the document image is not transmitted.

請求項7の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記委託先は、前記要求レベルに応じて変更されることを特徴とする。   According to a seventh aspect of the invention, in the electronic document system according to the first aspect of the invention, the consignee is changed according to the required level.

請求項8の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記委託動作制御手段は、前記委託先に対して前記委託指示とともに前記原稿画像を送信することを特徴とする。   According to an eighth aspect of the present invention, in the electronic document system according to the first aspect, the consignment operation control means transmits the original image together with the consignment instruction to the consignee.

請求項9の発明は、コンピュータに、a)原稿画像に対する文字認識処理の結果に関する要求レベルを設定する手順と、b)前記原稿画像に対する前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合に、前記原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する手順とを実行させるためのプログラムであることを特徴とする。   According to the ninth aspect of the present invention, a) a procedure for setting a required level related to a result of character recognition processing for a document image, and b) a result of the character recognition processing for the document image does not satisfy the required level. A program for executing a procedure for transmitting a delegation instruction for entrusting digitization processing of character information included in the document image to the entrustee.

請求項1ないし請求項9に記載の発明によれば、様々な要求レベルを考慮して適切な委託処理を実行することが可能である。   According to the first to ninth aspects of the invention, it is possible to execute an appropriate entrusting process in consideration of various request levels.

<1.第1実施形態>
<1−1.構成>
図1は、第1実施形態に係る原稿電子化システム100(100A)の構成を示す概略図である。
<1. First Embodiment>
<1-1. Configuration>
FIG. 1 is a schematic diagram showing the configuration of an electronic document system 100 (100A) according to the first embodiment.

原稿電子化システム100(100A)は、マルチ・ファンクション・ペリフェラル(MFPとも略称する)1(1A)を備えている。また、原稿電子化システム100において、MFP1は、外部委託先になり得る各事業者のコンピュータ90(90a,90b,90c,90d,...)にネットワークNWを介して接続されている。   An electronic document system 100 (100A) includes a multi-function peripheral (abbreviated as MFP) 1 (1A). Further, in the document digitizing system 100, the MFP 1 is connected to a computer 90 (90a, 90b, 90c, 90d,...) Of each business operator who can be an outsourcing party via a network NW.

この原稿電子化システム100Aは、原稿(紙文書等)を光学的に読み取って得られる画像(原稿画像とも称する)に含まれる文字情報を電子化するシステムである。詳細には、MFP1が原稿画像を生成するとともに、当該原稿画像に対するOCR(Optical Character Reader)処理を施すことによって原稿画像に含まれる文字情報を電子化する。また、MFP1は、当該OCR処理における認識結果が要求レベルを満足していないと判定される場合に、原稿画像に含まれる文字情報の電子化処理を外部委託する委託指示を、外部委託先のコンピュータ90に送信する。また特に、この「要求レベル」は、固定値ではなく、操作者の入力等に応じて変更することが可能である。この設定動作等については後に詳述する。   This document digitizing system 100A is a system that digitizes character information contained in an image (also referred to as a document image) obtained by optically reading a document (paper document or the like). Specifically, the MFP 1 generates a document image and digitizes character information included in the document image by performing an OCR (Optical Character Reader) process on the document image. In addition, when it is determined that the recognition result in the OCR process does not satisfy the required level, the MFP 1 issues a delegation instruction to outsource character information digitization processing included in the document image. 90. In particular, the “required level” is not a fixed value, and can be changed according to an operator's input or the like. This setting operation will be described in detail later.

MFP1は、スキャナ機能、プリンタ機能、コピー機能およびファクシミリ機能などを備える装置(複合機とも称する)である。具体的には、MFP1は、画像読取部2と、印刷出力部3と、通信部4と、格納部5と、入出力部6と、コントローラ9とを備えており、これらの各部を複合的に動作させることによって、上記の各機能を実現する。   The MFP 1 is a device (also referred to as a multi function device) having a scanner function, a printer function, a copy function, a facsimile function, and the like. Specifically, the MFP 1 includes an image reading unit 2, a print output unit 3, a communication unit 4, a storage unit 5, an input / output unit 6, and a controller 9, and these units are combined. The above-described functions are realized by operating the above.

画像読取部2は、MFP1の所定の位置に載置された原稿を光学的に読み取って、当該原稿の画像(原稿画像とも称する)を生成する処理部である。   The image reading unit 2 is a processing unit that optically reads a document placed at a predetermined position of the MFP 1 and generates an image (also referred to as a document image) of the document.

印刷出力部3は、対象画像に関する画像データに基づいて紙などの各種の媒体に画像を印刷出力する出力部である。   The print output unit 3 is an output unit that prints an image on various media such as paper based on image data related to the target image.

通信部4は、公衆回線等を介したファクシミリ通信を行うことが可能な処理部である。また、通信部4は、通信ネットワークNWを介したネットワーク通信が可能である。このネットワーク通信を利用することによって、MFP1は、所望の相手先との間で各種のデータを授受することが可能である。また、MFP1は、このネットワーク通信を利用することによって、電子メールの送受信を行うことも可能である。   The communication unit 4 is a processing unit capable of performing facsimile communication via a public line or the like. The communication unit 4 can perform network communication via the communication network NW. By using this network communication, the MFP 1 can exchange various data with a desired destination. The MFP 1 can also send and receive e-mails using this network communication.

格納部5は、ハードディスクドライブ(HDD)等の格納装置で構成される。この格納部5には、画像読取部2等で生成された原稿画像が格納される。また、格納部5には、委託先データ8等も格納されている。委託先データ8は、委託先になり得る事業者に関する各種のデータである。詳細には、委託先データ8には、各事業者の名称、各事業者の連絡先(電子メールアドレス等)、各事業者における委託処理単価、各事業者における処理可能言語、および各事業者と自社(MFP1が設置されている会社)等との秘密保持契約の有無等が互いに関連づけて格納されている。   The storage unit 5 includes a storage device such as a hard disk drive (HDD). The storage unit 5 stores a document image generated by the image reading unit 2 or the like. The storage unit 5 also stores outsourced data 8 and the like. The consignee data 8 is various data relating to a business operator who can be a consignee. Specifically, the contractor data 8 includes the name of each business operator, the contact information (e-mail address, etc.) of each business operator, the contract processing unit price for each business operator, the processable language for each business operator, and each business operator. And whether or not there is a confidentiality agreement with the company (the company in which MFP 1 is installed) or the like is stored in association with each other.

入出力部6は、MFP1に対する入力を受け付ける操作入力部61と、各種情報の表示出力を行う表示部62とを備えている。詳細には、MFP1には操作パネル63(図6等参照)が設けられている。この操作パネル63は、液晶表示パネルに圧電センサ等が埋め込まれて構成されており、表示部62の一部として機能するとともに、操作入力部61の一部としても機能する。   The input / output unit 6 includes an operation input unit 61 that receives input to the MFP 1 and a display unit 62 that displays and outputs various types of information. Specifically, the MFP 1 is provided with an operation panel 63 (see FIG. 6 and the like). The operation panel 63 is configured by embedding a piezoelectric sensor or the like in a liquid crystal display panel, and functions as a part of the display unit 62 and also functions as a part of the operation input unit 61.

コントローラ9は、MFP1を統括的に制御する制御装置であり、CPUと、各種の半導体メモリ(RAMおよびROM等)とを備えて構成される。コントローラ9の制御下において各種の処理部が動作することによって、MFP1の各種の機能が実現される。例えば、コントローラ9の制御下において、画像読取部2を用いて所望の画像を光学的に読み取ることによって、原稿をスキャニングした画像(原稿画像)が取得され、スキャナ機能が実現される。また、コントローラ9は、原稿画像の電子化処理に関連して、次述するような各種の処理を制御する。   The controller 9 is a control device that controls the MFP 1 in an integrated manner, and includes a CPU and various semiconductor memories (such as a RAM and a ROM). Various functions of the MFP 1 are realized by operating various processing units under the control of the controller 9. For example, by scanning a desired image optically using the image reading unit 2 under the control of the controller 9, an image (original image) obtained by scanning an original is obtained, and a scanner function is realized. Further, the controller 9 controls various processes as described below in connection with the digitization process of the document image.

図2は、コントローラ9において機能的に実現される各種の処理部を示す機能ブロック図である。詳細には、コントローラ9のCPUにおいて、コントローラ9のROM内に格納されている所定のソフトウエアプログラム(以下、単にプログラムとも称する)が実行されることによって、図2のような各種の処理部が実現される。   FIG. 2 is a functional block diagram showing various processing units that are functionally realized in the controller 9. Specifically, the CPU of the controller 9 executes a predetermined software program (hereinafter simply referred to as a program) stored in the ROM of the controller 9, so that various processing units as shown in FIG. Realized.

具体的には、要求レベル設定部11と機密情報判定部12と言語判定部13と見積価格算出部14と候補抽出部15と委託先決定部16と委託動作制御部17とを含む各種の処理部が実現される。   Specifically, various processes including the request level setting unit 11, the confidential information determination unit 12, the language determination unit 13, the estimated price calculation unit 14, the candidate extraction unit 15, the entrustee determination unit 16, and the entrustment operation control unit 17. Part is realized.

要求レベル設定部11は、原稿画像に対する文字認識処理の結果に関する要求レベルを設定する処理部である。要求レベル設定部11は、当該要求レベルを操作者からの入力等に応じて変更することが可能である。   The request level setting unit 11 is a processing unit that sets a request level related to the result of character recognition processing for a document image. The request level setting unit 11 can change the request level according to an input from the operator.

機密情報判定部12は、原稿画像における機密情報の有無および当該機密情報の機密レベルを判定する処理部である。   The confidential information determination unit 12 is a processing unit that determines the presence / absence of confidential information in the document image and the confidential level of the confidential information.

言語判定部13は、原稿画像における言語の種類を判定する処理部である。   The language determination unit 13 is a processing unit that determines the language type in the document image.

見積価格算出部14は、外部の各事業者に委託処理を依頼する際に生じる費用(見積金額)を算出する処理部である。   The estimated price calculation unit 14 is a processing unit that calculates a cost (estimated amount) that is incurred when requesting outsourcing processing to each external company.

候補抽出部15は、委託先データ8に格納された複数の事業者の中から「委託先」の候補を抽出する処理部である。この実施形態では、候補抽出部15は、要求レベル設定部11で設定された要求レベルに応じて委託先の候補を抽出するとともに、原稿言語の種類と原稿画像における機密情報の有無とにも応じて委託先の候補を抽出する。   The candidate extraction unit 15 is a processing unit that extracts “consignee” candidates from a plurality of business operators stored in the consignee data 8. In this embodiment, the candidate extraction unit 15 extracts the consignee candidates according to the request level set by the request level setting unit 11, and also according to the type of document language and the presence / absence of confidential information in the document image. Extract outsourcing candidates.

委託先決定部16は、候補抽出部15によって抽出された候補の中から委託先を選択する選択操作に応じて、委託先を決定する処理部である。   The entrustee determination unit 16 is a processing unit that determines an entrustee in accordance with a selection operation for selecting an entrustee from the candidates extracted by the candidate extraction unit 15.

委託動作制御部17は、原稿画像に含まれる文字情報の電子化処理を「委託先」に委託する動作を制御する。詳細には、委託先決定部16で決定された「委託先」に対して委託指示を送信する。この委託指示の送信動作は、原稿画像に対する文字認識処理の結果が要求レベルを満足していないと判定される場合に実行される。   The consignment operation control unit 17 controls an operation of consigning digitization processing of character information included in a document image to a “consignee”. Specifically, a commission instruction is transmitted to the “consignee” determined by the commission destination determination unit 16. The transmission operation of the consignment instruction is executed when it is determined that the result of the character recognition process for the document image does not satisfy the required level.

なお、このMFP1Aは、原稿電子化システム100Aにおいて、原稿電子化処理の主要な役割を果たしており、原稿電子化装置とも称される。   The MFP 1A plays a main role in the digitizing process in the document digitizing system 100A, and is also referred to as a document digitizing apparatus.

<1−2.動作>
図3〜図5は、MFP1(1A)の動作を示すフローチャートである。図3は原稿電子化処理の概略を示し、図4および図5はその一部動作の詳細を示している。また、図6は、操作パネル63付近の構成を示す図である。なお、図6においては、MFP1の機能選択ボタン(詳細には、ファックスボタン21、スキャンボタン22、およびコピーボタン23)とスタートボタン25とが操作パネル63の近傍に設けられている場合が例示されている。以下では、これらの図等を参照しながら、MFP1の動作について説明する。
<1-2. Operation>
3 to 5 are flowcharts showing the operation of the MFP 1 (1A). FIG. 3 shows an outline of the electronic document processing, and FIGS. 4 and 5 show details of the partial operation. FIG. 6 is a diagram showing a configuration near the operation panel 63. 6 illustrates a case where the function selection buttons (specifically, the fax button 21, the scan button 22, and the copy button 23) of the MFP 1 and the start button 25 are provided in the vicinity of the operation panel 63. ing. Hereinafter, the operation of the MFP 1 will be described with reference to these drawings and the like.

MFP1の操作者が、操作入力部61に設けられた機能選択ボタン21,22,23のうち、スキャンボタン22を押下すると、図6のような画面G11が操作パネル63に表示される。詳細には、「電子化する」および「電子化しない」の2つの選択肢にそれぞれ対応する選択ボタン31,32が操作パネル63に表示される。MFP1は、図6のような画面G11を操作パネル63に表示すると、スキャン開始指示を受け付ける待機状態に移行する(図3、ステップS11)。   When the operator of the MFP 1 presses the scan button 22 among the function selection buttons 21, 22, and 23 provided on the operation input unit 61, a screen G <b> 11 as shown in FIG. 6 is displayed on the operation panel 63. Specifically, the selection buttons 31 and 32 corresponding to the two options of “electronicize” and “not digitize” are displayed on the operation panel 63. When the screen G11 as shown in FIG. 6 is displayed on the operation panel 63, the MFP 1 shifts to a standby state for accepting a scan start instruction (step S11 in FIG. 3).

その後、操作者が2つの選択ボタン31,32のうち所望の選択肢に対応するボタンを押下しスタートボタン25を押下すると、MFP1は、スキャン開始指示が付与されたものと解するとともに、ボタン31,32に関する選択状態に応じて分岐処理を実行する。   Thereafter, when the operator depresses the button corresponding to the desired option among the two selection buttons 31 and 32 and depresses the start button 25, the MFP 1 understands that the scan start instruction is given, and the buttons 31, Branch processing is executed in accordance with the selection state relating to 32.

例えば、「電子化しない」に対応する選択ボタン32が選択された状態でスタートボタン25が押下されると、ステップS12を経てステップS10に進み、スキャン動作が実行される。この場合には、電子化処理(OCR処理)は実行されることなく、スキャン動作によって原稿画像が生成され、生成された原稿画像が所定の格納場所に格納される。以上のようにして操作者の指示に対応する一連の動作が終了する。   For example, when the start button 25 is pressed in a state where the selection button 32 corresponding to “Do not digitize” is selected, the process proceeds to step S10 through step S12, and the scan operation is executed. In this case, the digitization process (OCR process) is not executed, and the document image is generated by the scanning operation, and the generated document image is stored in a predetermined storage location. As described above, a series of operations corresponding to the operator's instruction is completed.

一方、「電子化する」に対応する選択ボタン31が選択された状態でスタートボタン25が押下されると、ステップS12を経てステップS13に進み、スキャン動作によって原稿画像が生成され、生成された原稿画像が所定の格納場所に格納される。そして、ステップS13が終了すると、次にステップS14以降の処理がさらに実行される。   On the other hand, when the start button 25 is pressed in a state where the selection button 31 corresponding to “electronicize” is selected, the process proceeds to step S13 through step S12, and a document image is generated by a scanning operation, and the generated document is generated. The image is stored in a predetermined storage location. Then, when step S13 is completed, the processing subsequent to step S14 is further executed.

ステップS14においては、電子化処理(OCR処理)、換言すれば文字認識処理、が実行される。また、このステップS14では、当該文字認識処理に加えて、当該文字認識処理における認識率R、より詳細には文字単位での認識処理率の算出処理も実行される。この文字単位での認識率R(証紙にはRcとも表記する)は、例えば、OCR処理の自動変換機能では変換不可能と判定された文字数Nnを全文字数Ntから差し引いた値を、全文字数Ntで除した値として算出される(Rc=(Nt−Nn)/Nt)。   In step S14, digitization processing (OCR processing), in other words, character recognition processing is executed. In step S14, in addition to the character recognition process, a recognition rate R in the character recognition process, more specifically, a recognition process rate calculation process for each character is also executed. The recognition rate R in character units (also expressed as Rc on the certificate) is, for example, a value obtained by subtracting, from the total number of characters Nt, the number of characters Nn determined to be unconvertible by the automatic conversion function of the OCR process. (Rc = (Nt−Nn) / Nt).

次のステップS15においては、ステップS14での文字認識処理の結果をより詳細に検証するための文法チェック処理(構文チェック処理とも称される)が実行される。文法チェック処理は、文字認識処理によって得られたテキストデータに対して、格構造等に関する文法解析処理(構文解析処理)を施すとともに、当該文法解析処理により得られた文法情報を用いて、当該テキストデータの適切性をチェックする処理である。例えば、テキストデータから抽出した名詞と動詞との対応関係の適切性を、様々な名詞と動詞との各種の対応関係を定義した辞書に基づいて判定することが可能である。また、変換後のテキストデータ中の動詞が適切な時制変化形(現在形、過去形等)に該当するか否かをチェックすることも可能である。なお、この文法チェック処理としては、種々の公知技術(例えば、特開2006−350663号公報に記載の技術等)を用いることなどが可能である。   In the next step S15, a grammar check process (also referred to as a syntax check process) for verifying the result of the character recognition process in step S14 in more detail is executed. Grammar check processing performs grammar analysis processing (syntax analysis processing) on the case structure, etc., on text data obtained by character recognition processing, and uses the grammar information obtained by the grammar analysis processing to This is a process to check the appropriateness of data. For example, the appropriateness of the correspondence between nouns and verbs extracted from text data can be determined based on a dictionary that defines various correspondences between various nouns and verbs. It is also possible to check whether the verb in the converted text data corresponds to an appropriate tense change form (present tense, past tense, etc.). As this grammar check process, various known techniques (for example, the technique described in Japanese Patent Laid-Open No. 2006-350663) can be used.

この結果、ステップS14で変換された文字の中から、誤変換であると判定される文字がさらに出現すると、文字認識処理の結果が更新される。例えば、更新後の文字認識率R(詳細にはRrとも表記する)は、文法チェック処理で誤変換と判定された文字をも含めた誤変換文字の文字数Nmを全文字数Ntから差し引いた値を、全文字数Ntで除した値として算出される(Rr=(Nt−Nm)/Nt)。この結果、文法チェック後の文字認識率Rrは文字単位での認識率Rcよりも低い値として算出される。   As a result, when a character determined to be erroneous conversion further appears from the characters converted in step S14, the result of the character recognition process is updated. For example, the updated character recognition rate R (also expressed in detail as Rr) is a value obtained by subtracting the number Nm of erroneously converted characters including characters determined to be erroneously converted by the grammar check process from the total number of characters Nt. , Calculated by dividing by the total number of characters Nt (Rr = (Nt−Nm) / Nt). As a result, the character recognition rate Rr after the grammar check is calculated as a value lower than the recognition rate Rc in character units.

また、ステップS16においては、ステップS14,S15で算出された文字認識の処理結果(例えば、認識率Rr)に基づく分岐処理が実行される。   In step S16, branch processing based on the character recognition processing result (eg, recognition rate Rr) calculated in steps S14 and S15 is executed.

文字認識処理において誤変換が存在しない、すなわち認識率Rrが100%である、と判定される場合には、ステップS17以降の処理を実行することなく、図3の処理を終了する。この場合には、後述の要求レベルの設定内容にかかわらず、原稿画像に対する文字認識処理の結果が、当該要求レベル(「100%」もしくは「80%」)を満足していると判定されるため、後述の委託処理LA,LBが実行されることなく図3のルーチンが終了する。   If it is determined that there is no erroneous conversion in the character recognition process, that is, the recognition rate Rr is 100%, the process of FIG. 3 is terminated without executing the processes after step S17. In this case, it is determined that the result of character recognition processing for the document image satisfies the required level (“100%” or “80%”) regardless of the setting content of the required level described later. The routine shown in FIG. 3 is terminated without executing the entrusting processes LA and LB described later.

一方、文字認識処理において誤変換が存在する、すなわち認識率Rrが100%未満である、と判定されるときには、ステップS17以降の処理が実行される。   On the other hand, when it is determined that there is an erroneous conversion in the character recognition process, that is, the recognition rate Rr is less than 100%, the processes after step S17 are executed.

ステップS17では、要求レベルの設定処理が実行される。図7は、要求レベルの設定処理に用いられる設定画面G12を示す図である。MFP1は、図7に示すように、操作パネル63において、「認識できない文字が有りました(現認識率=70%)。電子化処理の要求レベルを設定してください。」などの文字を表示するととともに、3つの選択ボタン35,36,37と決定ボタン38とを表示する。操作者は、これらのボタンを操作することによって、所望の要求レベルを設定することが可能である。   In step S17, a request level setting process is executed. FIG. 7 is a diagram showing a setting screen G12 used for request level setting processing. As shown in FIG. 7, the MFP 1 displays characters such as “There was a character that could not be recognized (current recognition rate = 70%). Please set the required level of digitization processing” on the operation panel 63. Then, three selection buttons 35, 36, and 37 and an enter button 38 are displayed. The operator can set a desired request level by operating these buttons.

選択ボタン35は、要求レベルを「100%」に設定するボタンであり、選択ボタン36は、要求レベルを「80%」に設定するボタンである。操作者が、選択ボタン35,36のいずれかを選択して押下しさらに決定ボタン38を押下すると、MFP1は、複数段階(ここでは2段階)のレベルのうち、被選択ボタン(35または36)に対応するレベルに「要求レベル」を設定する。これによって、操作者は、要求レベルを、複数段階のレベルのうち所望のレベルに設定することが可能である。   The selection button 35 is a button for setting the request level to “100%”, and the selection button 36 is a button for setting the request level to “80%”. When the operator selects and presses one of the selection buttons 35 and 36 and further presses the enter button 38, the MFP 1 selects the selected button (35 or 36) from among a plurality of levels (here, two levels). Set the “request level” to the level corresponding to. Thus, the operator can set the required level to a desired level among a plurality of levels.

また、選択ボタン37は、要求レベルの設定を「保留」するためのボタンである。MFP1は、選択ボタン37が押下されて決定ボタン38がさらに押下された場合には、要求レベルの設定を保留するとともに、以後の外部委託処理をも保留する。したがって、操作者は、外部委託処理を実行したくない場合等においては、このような操作(選択ボタン37および決定ボタン38の押下操作)を行えばよい。   The selection button 37 is a button for “holding” the setting of the request level. When the selection button 37 is pressed and the decision button 38 is further pressed, the MFP 1 holds the request level setting and also holds the subsequent outsourcing process. Therefore, the operator may perform such an operation (pressing operation of the selection button 37 and the determination button 38) when the operator does not want to execute the outsourcing process.

この後、ステップS18以降においては、要求レベルに応じた委託処理が実行される。   Thereafter, in step S18 and subsequent steps, a consignment process corresponding to the request level is executed.

具体的には、要求レベルが「100%」に設定され、且つ、原稿画像に対する文字認識処理の結果が要求レベル「100%」を満足していないと判定される場合には、委託処理LAが実行される(ステップS18,S30)。ここにおいて、ステップS18に進むのは、認識率が100%未満であるとの条件判定(ステップS16)を経た後である。そのため、ステップS18では、要求レベルが「100%」に設定されていることを確認すると、ステップS30の委託処理LAを実行することが決定される。   Specifically, when the required level is set to “100%” and it is determined that the result of character recognition processing for the document image does not satisfy the required level “100%”, the entrusting process LA is It is executed (steps S18 and S30). Here, the process proceeds to step S18 after a condition determination (step S16) that the recognition rate is less than 100%. Therefore, in step S18, when it is confirmed that the request level is set to “100%”, it is determined to execute the entrusting process LA in step S30.

また、要求レベルが「80%」に設定され、且つ、原稿画像に対する文字認識処理の結果が要求レベル「80%」を満足していないと判定される場合には、委託処理LBが実行される(ステップS18,S19,S20,S40)。   On the other hand, when the request level is set to “80%” and it is determined that the result of the character recognition process for the document image does not satisfy the request level “80%”, the entrustment process LB is executed. (Steps S18, S19, S20, S40).

一方、要求レベルが「80%」に設定され、且つ、原稿画像に対する文字認識処理の結果が要求レベル「80%」を満足していると判定される場合には、委託処理LA,LBがいずれも実行されることなく、このルーチンは終了する(ステップS18,S19,S20)。   On the other hand, if it is determined that the required level is set to “80%” and the result of the character recognition process for the document image satisfies the required level “80%”, the entrusted processes LA and LB are Is not executed, and this routine ends (steps S18, S19, S20).

なお、ここでは、ステップS14,S15で文字認識処理の結果を求めた後、ステップS16で当該文字認識処理の結果が「100%」を満足していないと判定される場合にのみ、要求レベルの設定操作(ステップS17)を行う場合を例示している。これによれば、文字認識処理の結果が「100%」の場合には、要求レベルの設定操作を行わずに済む。ただし、これに限定されず、文字認識処理の結果を求める前、例えばスキャン開始前に要求レベルの設定操作を予め行うようにしてもよい。   Here, after the result of the character recognition process is obtained in steps S14 and S15, only when the result of the character recognition process is determined not to satisfy “100%” in step S16, the required level is reached. The case where setting operation (step S17) is performed is illustrated. According to this, when the result of the character recognition process is “100%”, it is not necessary to perform the operation for setting the required level. However, the present invention is not limited to this, and a request level setting operation may be performed in advance before obtaining the result of the character recognition process, for example, before starting the scan.

また、後述するように、委託処理LAにおいては、原稿画像に含まれる文字を人手での入力作業を伴って入力する事業者が委託先として決定される。これによれば、高い要求レベルに応じた委託先を決定することが可能である。また、委託処理LBにおいては、比較的高度な自動文字変換処理を有料のWEBサービスで提供する事業者が委託先として決定される。これによれば、中程度の要求レベルに応じられる委託先を決定することができる。   Further, as will be described later, in the entrustment process LA, an operator that inputs characters included in the document image with manual input work is determined as the entrustee. According to this, it is possible to determine a consignee according to a high request level. In the entrustment process LB, an operator that provides a relatively advanced automatic character conversion process with a paid WEB service is determined as an entrustee. According to this, it is possible to determine a consignee that can meet a medium level of demand.

次に、ステップS30,S40の動作の詳細について図4を参照しながら説明する。ステップS30,S40においては、上述の要求レベルを考慮するとともに、原稿の言語と原稿内における機密情報の有無とをさらに考慮して、委託先を決定する場合について説明する。ステップS30とステップS40とにおいては、抽出される委託先の候補が要求レベルに応じて異なる点で相違するが、同様の動作が実行される。ここでは、説明の重複を防ぐため、ステップS30の動作を中心に説明し、ステップS40の動作の説明を適宜省略する。   Next, details of the operations in steps S30 and S40 will be described with reference to FIG. In steps S30 and S40, a case will be described in which the outsourcing destination is determined in consideration of the above-described required level and further considering the language of the document and the presence or absence of confidential information in the document. In step S30 and step S40, the same operation is executed, although the extracted consignee candidates are different depending on the request level. Here, in order to prevent duplication of explanation, the explanation will focus on the operation of step S30, and the explanation of the operation of step S40 will be omitted as appropriate.

図4に示すように、まず、ステップS31においては、原稿に含まれる文字の言語種類が判定される。   As shown in FIG. 4, first, in step S31, the language type of characters included in the document is determined.

ここにおいて、上述のステップS14においては、OCR処理に利用される言語が既に特定されている。具体的には、MFP1に内蔵される複数の言語辞書を用いて幾つかの文字を対象にOCR処理(予備処理とも称する)が施され、当該予備処理において、最も認識率が高い言語辞書に対応する言語が、当該原稿の言語(「原稿言語」とも称する)であるとして特定されている。なお、ステップS14では、このような予備処理で特定された言語の言語辞書を用いることによって、当該予備処理後の文字認識処理(本処理)も実行されている。   Here, in step S14 described above, the language used for the OCR processing has already been specified. Specifically, OCR processing (also referred to as preliminary processing) is performed on some characters using a plurality of language dictionaries built in the MFP 1, and in the preliminary processing, the language dictionary with the highest recognition rate is supported. The language to be performed is specified as the language of the document (also referred to as “document language”). In step S14, the character recognition process (main process) after the preliminary process is also executed by using the language dictionary of the language specified in the preliminary process.

このようにしてステップS14で予めMFP1が自動的に特定した言語を、次述するような確認操作を行うことなく、そのまま原稿言語として自動的に確定するようにしてもよい。   In this way, the language automatically specified in advance by the MFP 1 in step S14 may be automatically determined as the original language as it is without performing the confirmation operation described below.

ただし、ここでは、原稿言語をより正確に判定するため、ステップS31において、図8のような確認画面(設定画面)G13を用いて「原稿言語」に関する確認操作を実行する。   However, here, in order to determine the document language more accurately, in step S31, a confirmation operation related to “document language” is executed using a confirmation screen (setting screen) G13 as shown in FIG.

図8においては、ステップS14で特定された言語を先頭(リスト最上段)に配置して幾つかの選択肢が表示されている。操作者は、このような確認画面を用いて、原稿言語を確定することができる。仮に、MFP1によって特定された言語と、本来の原稿言語とが相違する場合には、本来の原稿言語(言語種類)を操作者が特定して入力することができる。詳細には、画面G13の選択リスト欄41に表示される言語の中から、本来の言語(例えば中国語)を選択して、「決定」ボタン47を押下すればよい。また、画面G13においては、上方向へのスクロールボタン45および下方向へのスクロールボタン46を用いたスクロール操作によって、さらに別の選択肢を選択リスト欄に表示させることも可能である。また「戻る」ボタン48を押下すれば、1つ前の画面に戻ることが可能である。   In FIG. 8, the language identified in step S14 is arranged at the top (top of the list), and several options are displayed. The operator can determine the document language using such a confirmation screen. If the language specified by the MFP 1 is different from the original document language, the operator can specify and input the original document language (language type). Specifically, it is only necessary to select the original language (for example, Chinese) from the languages displayed in the selection list column 41 of the screen G13 and press the “OK” button 47. Further, on the screen G13, another option can be displayed in the selection list column by a scroll operation using the scroll button 45 upward and the scroll button 46 downward. If the “return” button 48 is pressed, it is possible to return to the previous screen.

このような確定操作によれば、ステップS14での特定処理では正確に特定できなかった言語を原稿言語として確定することも可能である。   According to such a confirmation operation, it is also possible to confirm the language that could not be accurately specified by the specifying process in step S14 as the document language.

なお、図8の選択リスト欄41に表示される選択肢としては、MFP1に内蔵された言語辞書に対応する言語が例示されるが、これに限定されない。例えば、当該内蔵辞書に対応する言語だけでなく、その言語辞書がMFP1に内蔵されていない言語(非内蔵言語とも称する)をも、選択リスト欄に表示するようにしてもよい。この場合、委託先データ8として、当該非内蔵言語に対応可能な事業者に関するデータが備えられていれば、後述のステップS33において、当該非内蔵言語に対応する事業者を抽出することが可能である。   Note that examples of options displayed in the selection list column 41 in FIG. 8 include languages corresponding to the language dictionary built in the MFP 1, but are not limited thereto. For example, not only a language corresponding to the built-in dictionary but also a language in which the language dictionary is not built in the MFP 1 (also referred to as a non-built-in language) may be displayed in the selection list column. In this case, if the contractor data 8 includes data relating to a business that can handle the non-built-in language, it is possible to extract the business corresponding to the non-built-in language in step S33 described later. is there.

また、ステップS32においては、原稿内における機密情報の有無が判定される。具体的には、機密情報を含む旨のデータが原稿画像に格納されている場合には、機密情報がその原稿に存在すると判定される。   In step S32, the presence / absence of confidential information in the document is determined. Specifically, when data indicating that confidential information is included is stored in the document image, it is determined that the confidential information exists in the document.

次のステップS33においては、要求レベル等に応じた委託先の候補が抽出される。   In the next step S33, candidates for consignment according to the request level and the like are extracted.

具体的には、委託先データ8に格納された複数の事業者の中から、高レベルの仕上げ精度に対応可能な事業者が抽出される。具体的には、原稿画像に含まれる文字を人手での入力作業を伴って入力する事業者が委託先の候補としてまず抽出される。   Specifically, from a plurality of business operators stored in the consignee data 8, business operators that can handle a high level of finishing accuracy are extracted. Specifically, a business operator who inputs characters included in a document image with manual input work is first extracted as a candidate for a consignment.

また、抽出された事業者の中から、「原稿言語」に対応可能な事業者がさらに抽出される。例えば、原稿言語が日本語である場合には、「日本語」に対応可能な事業者が抽出される。   Further, from the extracted business operators, business operators that can handle the “document language” are further extracted. For example, when the document language is Japanese, a business operator that can handle “Japanese” is extracted.

さらに、抽出された事業者の中から、原稿における「機密情報」の有無に応じた事業者が抽出される。   Further, from the extracted business operators, business operators corresponding to the presence or absence of “confidential information” in the manuscript are extracted.

例えば、「機密情報」が原稿に存在する場合には、自社等(MFP1が設置された会社等)との間に秘密保持契約(NDA:Non-Disclosure Agreement)を既に締結した事業者がさらに抽出される。   For example, if “confidential information” is present in the manuscript, companies that have already signed a non-disclosure agreement (NDA) with their own company (such as the company where MFP 1 is installed) are further extracted. Is done.

なお、「機密情報」が原稿に存在しない場合には、秘密保持契約の締結の有無にかかわらず、他の条件を満たす事業者が抽出される。   When “confidential information” does not exist in the manuscript, a business that satisfies other conditions is extracted regardless of whether or not a confidentiality agreement is concluded.

以上のようにして、要求レベルと、原稿言語の種類と、原稿における機密情報の有無とに応じて、委託先の候補が抽出される。   As described above, candidates for entrustment are extracted according to the request level, the type of document language, and the presence or absence of confidential information in the document.

MFP1は、このようにして委託先の候補を抽出すると、事業者ごとの単価を考慮してソート処理を施し(ステップS34)、委託先決定用の画面G14(図9)を操作パネル63に表示する(ステップS35)。   When the MFP 1 extracts the consignee candidates in this manner, the MFP 1 performs sorting processing in consideration of the unit price for each business operator (step S34), and displays the consignee determination screen G14 (FIG. 9) on the operation panel 63. (Step S35).

図9に示すように、画面G14の候補表示欄42には、ステップS33で抽出された複数の事業者(C1,C2,...)が、委託先候補のリスト(委託先リストとも称する)として列挙される。これら複数の事業者は、上記のソート処理によってその見積金額順(昇順)に並べ換えられて表示されている。なお、この見積金額は、1頁ごとの単価を表示するものであってもよく、あるいは、全ページに対する合計額を表示するものであってもよい。あるいは、誤認識文字の文字数に応じた金額として算出されるものであってもよい。   As shown in FIG. 9, in the candidate display field 42 of the screen G14, a plurality of business operators (C1, C2,. Are listed as The plurality of businesses are rearranged in the estimated amount order (ascending order) by the above sort process and displayed. In addition, this estimated amount may display a unit price for each page, or may display a total amount for all pages. Alternatively, it may be calculated as an amount corresponding to the number of misrecognized characters.

そして、操作者は、図9の委託先リストに表示される事業者(委託先の候補)の中から、所望の事業者(委託先)を選択する選択操作を実行する。例えば、会社(事業者)C1を選択する場合には、操作パネル63において「会社C1」と表示される部分を押下した後に「委託ボタン」49を押下すればよい。   Then, the operator executes a selection operation for selecting a desired operator (consignee) from the operators (candidate candidates) displayed in the consignee list of FIG. For example, when selecting the company (business operator) C1, the “consignment button” 49 may be pressed after pressing the portion displayed as “company C1” on the operation panel 63.

MFP1は、委託ボタン49が押下されたことをステップS36で確認すると、選択された事業者を最終的な「委託先」として確定する。すなわち、MFP1は、操作者による選択操作に応じて委託先を決定する。   When the MFP 1 confirms that the consignment button 49 has been pressed in step S36, the MFP 1 determines the selected business operator as the final “consignee”. That is, the MFP 1 determines a consignee in accordance with a selection operation by the operator.

そして、ステップS37においては、原稿画像に含まれる文字情報の電子化処理を委託する「委託指示」が、確定された「委託先」に送信される。具体的には、電子メールを用いた委託指示が、当該委託先に送信される。より詳細には、当該委託に関する所定の内容(委託指示内容)がその本文に記載されるとともに、その添付ファイルとして原稿画像データが添付された電子メールが、委託先のメールアドレス宛に自動的に送信される。この際、原稿画像データが委託指示とともに送信されるので、原稿画像を別途送信する必要がない。なお、委託先のメールアドレスとしては、委託先データ8内に当該委託先に対応づけて登録されているメールアドレスを用いればよい。また、電子メールには、原告画像データのみならず、OCR処理によって得られた文字列をも含めるようにしてもよい。   In step S37, a “consignment instruction” for entrusting digitization processing of character information included in the document image is transmitted to the determined “consignee”. Specifically, a delegation instruction using electronic mail is transmitted to the delegation destination. More specifically, a predetermined content related to the entrustment (consignment instruction content) is described in the text, and an e-mail attached with the original image data as an attached file is automatically sent to the e-mail address of the entrustee Sent. At this time, since the document image data is transmitted together with the commission instruction, it is not necessary to transmit the document image separately. In addition, as an e-mail address of the entrustee, an e-mail address registered in association with the entrustee in the entrustee data 8 may be used. The e-mail may include not only the plaintiff image data but also a character string obtained by the OCR process.

また、ステップS40においても同様の動作が実行される。具体的には、ステップS41〜S47においては、それぞれ、対応するステップS31〜S37と同様の動作が実行される。ただし、ステップS43においては、委託先データ8に格納された複数の事業者の中から、「中」レベルの処理精度に対応可能な事業者が抽出される。具体的には、有料のWEBサービスで比較的高度な(具体的には80%以上の精度の)自動文字変換作業を提供する事業者が委託先として決定される。これによれば、中程度の要求レベルに応じられる委託先を決定することができる。また、ステップS43においても、ステップS33と同様に、「原稿言語」および「機密情報の有無」に応じた抽出処理が行われる。   The same operation is also performed in step S40. Specifically, in steps S41 to S47, operations similar to the corresponding steps S31 to S37 are executed, respectively. However, in step S43, business operators that can cope with the processing accuracy of the “medium” level are extracted from the plurality of business operators stored in the consignee data 8. Specifically, an operator that provides a relatively advanced (specifically, accuracy of 80% or more) automatic character conversion work with a paid WEB service is determined as a consignee. According to this, it is possible to determine a consignee that can meet a medium level of demand. Also in step S43, extraction processing according to “document language” and “presence / absence of confidential information” is performed as in step S33.

図10は、ステップS45における操作パネル63の表示画面G16を示す図である。図10に示すように、画面G16においては、要求レベルが「80%」である場合の委託先の候補(D1,D2,...)が列挙されている。操作者は、このような候補の中から所望の委託先を選択して、原稿画像に含まれる文字情報の文字入力作業(電子化処理)を当該委託先に委託することが可能である。   FIG. 10 is a diagram showing the display screen G16 of the operation panel 63 in step S45. As shown in FIG. 10, the screen G16 lists entrustee candidates (D1, D2,...) When the request level is “80%”. The operator can select a desired consignee from such candidates and entrust character input work (digitization processing) of character information included in the document image to the consignee.

以上のような動作によれば、原稿画像に対する文字認識処理の結果が要求レベル(100%または80%)を満足していないと判定される場合に、原稿画像に含まれる文字情報の電子化処理を委託する委託指示が委託先に送信される。特に、要求レベルを操作者の操作に応じて変更することが可能であるため、委託処理を行うか否かを当該要求レベルに応じて適宜に決定することが可能である。   According to the operation as described above, when it is determined that the result of the character recognition process on the document image does not satisfy the required level (100% or 80%), the digitization processing of the character information included in the document image is performed. An entrustment instruction for entrusting is sent to the entrustee. In particular, since the request level can be changed according to the operation of the operator, it is possible to appropriately determine whether or not to perform the commissioning process according to the request level.

また、上記においては、要求レベルに応じて委託先が変更される。具体的には、要求レベルが「100%」のときには、図9の委託先の候補(C1,C2,...)の中から委託先が決定され、要求レベルが「80%」のときには、図10の委託先の候補(D1,D2,...)の中から委託先が決定される。また、委託費用は、2種類の要求レベルに応じた金額に設定されている。具体的には、要求レベルが比較的高いときには委託費用は比較的高額であり、要求レベルが比較的低いときには委託費用は比較的低額である。したがって、操作者は、要求レベルとコストとを考慮して、要求レベルに応じた委託先を適切に決定することが可能である。   Further, in the above, the consignee is changed according to the request level. Specifically, when the request level is “100%”, a consignee is determined from the candidates (C1, C2,...) Of FIG. 9, and when the request level is “80%”, Outsourcing destinations are determined from the outsourcing destination candidates (D1, D2,...) In FIG. The commission fee is set to an amount corresponding to two types of request levels. Specifically, the commission cost is relatively high when the request level is relatively high, and the commission cost is relatively low when the request level is relatively low. Therefore, the operator can appropriately determine a consignee according to the request level in consideration of the request level and the cost.

また、上記においては、原稿画像の言語にも応じて委託先の候補が抽出される。図11は、原稿言語が英語の場合における委託先決定用の画面G17を示す図である。原稿言語が日本語の場合における委託先決定用の画面G14(図9)と比較すると判るように、図1では、原稿言語の種類(英語)に応じた委託先の候補(E1,E2,...)が表示されており、当該候補の中から委託先を決定することが可能である。したがって、多種多様な原稿言語に適切に対応することが可能である。   Further, in the above, entrustee candidates are extracted according to the language of the document image. FIG. 11 is a diagram showing a consignee determination screen G17 when the document language is English. As can be seen from comparison with the screen G14 (see FIG. 9) for determining the contractor when the document language is Japanese, in FIG. 1, candidate candidates (E1, E2,. ..) is displayed, and it is possible to determine the contractor from the candidates. Therefore, it is possible to appropriately cope with a wide variety of manuscript languages.

また、上記においては、原稿画像における機密情報の有無にも応じて委託先の候補が抽出される。したがって、機密情報の管理を適切に行うことが可能である。   Further, in the above, candidates for entrustment are extracted according to the presence or absence of confidential information in the document image. Therefore, it is possible to appropriately manage confidential information.

<2.第2実施形態>
上記第1実施形態においては、OCR処理、文法チェック処理、委託先候補の抽出処理、委託先の決定処理、および委託先への委託処理等をいずれもMFP1において実行する場合を例示したが、これに限定されない。例えば、MFP1とは別の装置(例えばネットワークを介して接続された情報処理装置(サーバ等))において、OCR処理および文法チェック処理を実行するようにしてもよい。
<2. Second Embodiment>
In the first embodiment, the case where the OCR process, the grammar check process, the entrustee candidate extraction process, the entrustee determination process, the entrustee entrustment process, and the like are all executed in the MFP 1 is exemplified. It is not limited to. For example, the OCR process and the grammar check process may be executed in a device different from the MFP 1 (for example, an information processing device (such as a server) connected via a network).

第2実施形態においては、このような変形例を例示する。以下、第1実施形態との相違点を中心に説明する。なお、この第2実施形態においても第1実施形態と同様に、原稿言語および機密情報に基づく委託先候補の抽出動作等が実行され得るが、ここでは説明の重複を防ぐため当該事項に関する説明を省略する。   In the second embodiment, such a modification is illustrated. Hereinafter, the difference from the first embodiment will be mainly described. In the second embodiment, as in the first embodiment, an operation for extracting candidate candidates based on the manuscript language and confidential information can be executed. Omitted.

図12は、第2実施形態に係る原稿電子化システム100(100B)のシステム構成を示す概略図である。原稿電子化システム100Bは、図1の原稿電子化システム100Aと比較すると、さらにサーバ80を有している点で相違する。   FIG. 12 is a schematic diagram showing a system configuration of the original digitizing system 100 (100B) according to the second embodiment. The document digitizing system 100B is different from the document digitizing system 100A of FIG. 1 in that it further includes a server 80.

また、図13は、原稿電子化システム100Bにおける動作を示す概念図である。図13においては、電子化処理を伴ってスキャン動作が実行される場合が示されている。   FIG. 13 is a conceptual diagram showing an operation in the document digitizing system 100B. FIG. 13 shows a case where the scanning operation is executed with the digitization process.

第2実施形態のシステム100Bにおいても、全体としては、上述のMFP1で実行されていた動作と同様の動作が実行される。ただし、この第2実施形態においては、第1実施形態ではMFP1(1A)で実行していたOCR処理および文法チェック処理(ステップS14,S15)と同様の処理がサーバ80側で実行される。   In the system 100B of the second embodiment as a whole, the same operation as that performed in the MFP 1 is executed as a whole. However, in the second embodiment, processing similar to the OCR processing and grammar check processing (steps S14 and S15) executed in the MFP 1 (1A) in the first embodiment is executed on the server 80 side.

具体的には、MFP1(1B)は、対象原稿に対するスキャン処理(ステップS53)を実行すると、スキャン処理により得られた原稿画像と当該原稿画像に対する文字認識処理の実行指令とをサーバ80に対して送出する(ステップS54)。サーバ80は、当該MFP1Bからの実行指令および原稿画像を受信すると、当該実行指令に応答して、受信した原稿画像に対するOCR処理と文法チェック処理とを実行する(ステップS55)。そして、サーバ80は、文字認識処理により得られたデータと、文字認識処理に関する判定結果とを、MFP1Bに対して返信するとともに、認識率が100%でない場合には要求レベルの設定画面を表示するためのデータをMFP1Bに返信する(ステップS56)。   Specifically, when the MFP 1 (1B) executes the scan process (step S53) on the target document, the MFP 1 (1B) sends to the server 80 a document image obtained by the scan process and a command for executing a character recognition process on the document image. It is sent out (step S54). When server 80 receives the execution command and document image from MFP 1B, server 80 executes OCR processing and grammar check processing on the received document image in response to the execution command (step S55). Then, server 80 returns the data obtained by the character recognition process and the determination result related to the character recognition process to MFP 1B, and displays a request level setting screen if the recognition rate is not 100%. Data for this is sent back to the MFP 1B (step S56).

その後は、上記第1実施形態におけるステップS17以降の処理と同様の処理がMFP1Bにおいて実行される。具体的には、MFP1Bは、原稿画像に対する文字認識処理の結果に関する要求レベルを設定する処理(ステップS57)と、要求レベルの設定に応じて委託先を決定する処理(ステップS58)とを実行する。また、MFP1Bは、原稿画像に対する文字認識処理の結果が要求レベルを満足していないと判定される場合に、原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する処理(ステップS59)等をも実行する。   Thereafter, processing similar to the processing from step S17 onward in the first embodiment is executed in MFP 1B. Specifically, the MFP 1B executes a process for setting a request level regarding the result of the character recognition process for the document image (step S57), and a process for determining a consignee according to the setting of the request level (step S58). . In addition, when it is determined that the result of the character recognition process for the document image does not satisfy the required level, the MFP 1B transmits a commission instruction for commissioning the digitization processing of the character information included in the document image to the commission destination. Processing (step S59) and the like are also executed.

このような態様によっても、第1実施形態と同様の効果を得ることが可能である。また、一部の処理をサーバ80側で実行することによって、MFP1における処理負荷を軽減することができる。   Also by such an aspect, it is possible to obtain the same effect as that of the first embodiment. Also, by executing some processing on the server 80 side, the processing load on the MFP 1 can be reduced.

<3.第3実施形態>
第3実施形態は、第2実施形態の変形例である。上記第2実施形態においては、MFP1が主な動作を実行する場合を例示したが、この第3実施形態においては、サーバ80(80C)が主な動作を実行する場合を例示する。サーバ80Cは、所定のプログラムをそのCPU等を用いて実行することによって、後述するような各種の動作を実現することができる。なお、サーバ80Cは、原稿電子化システム100Cにおいて、原稿電子化処理の主要な役割を果たしており、原稿電子化装置とも称される。
<3. Third Embodiment>
The third embodiment is a modification of the second embodiment. In the second embodiment, the case where the MFP 1 executes the main operation is illustrated, but in the third embodiment, the case where the server 80 (80C) executes the main operation is illustrated. The server 80C can implement various operations as described later by executing a predetermined program using the CPU or the like. The server 80C plays a main role in the document digitization processing in the document digitization system 100C, and is also referred to as a document digitization apparatus.

図14は、第3実施形態に係る原稿電子化システム100Cにおける動作を示す概念図である。図14は、図13と同様に、電子化処理を伴ってスキャン動作が実行される場合を示している。以下、図14を参照しながら、原稿電子化システム100Cにおける動作について、第1実施形態等との相違点を中心に説明する。なお、この第3実施形態においても第1実施形態等と同様に、原稿言語および機密情報に基づく委託先候補の抽出動作等が実行され得るが、ここでは説明の重複を防ぐため当該事項に関する説明を省略する。   FIG. 14 is a conceptual diagram showing an operation in the document digitizing system 100C according to the third embodiment. FIG. 14 shows a case where the scan operation is executed with the digitization process, as in FIG. 13. Hereinafter, the operation in the document digitizing system 100C will be described with a focus on differences from the first embodiment and the like with reference to FIG. In the third embodiment, as in the first embodiment, an operation for extracting candidate candidates based on the document language and confidential information can be executed. Is omitted.

第3実施形態においては、サーバ80(80C)はウエブサーバとして機能する。一方、MFP1(1C)は、ブラウザソフトウエアを実行することが可能であり、ウエブサーバから送信されてきたデータを用いて、操作パネル63においてブラウザを用いて適宜の設定画面等を表示することができる。また、操作者は操作パネル63のブラウザ内に表示される各種ボタン等を用いて、各種の指示をシステム100C(特にサーバ80C)に対してネットワークNWを介して付与することが可能である。   In the third embodiment, the server 80 (80C) functions as a web server. On the other hand, the MFP 1 (1C) can execute browser software and can display an appropriate setting screen or the like using the browser on the operation panel 63 using data transmitted from the web server. it can. Further, the operator can give various instructions to the system 100C (particularly the server 80C) via the network NW using various buttons displayed in the browser of the operation panel 63.

まず、MFP1Cがサーバ80Cに対してウエブページデータの要求コマンドを送信する(ステップS61)と、サーバ80CはMFP1Cに対してウエブページデータを返信する(ステップS62)。MFP1Cは、受信したウエブページデータに基づいて、操作パネル63に設定画面を表示する。具体的には、MFP1Cの操作パネル63において図6の画面G11と同様の設定画面が表示される。   First, when the MFP 1C transmits a web page data request command to the server 80C (step S61), the server 80C returns the web page data to the MFP 1C (step S62). The MFP 1C displays a setting screen on the operation panel 63 based on the received web page data. Specifically, a setting screen similar to the screen G11 in FIG. 6 is displayed on the operation panel 63 of the MFP 1C.

その後、操作者が画面G11を操作して、文字認識処理を伴うスキャン処理の開始指示を付与すると、MFP1Cはスキャン動作を実行する(ステップS63)。そして、生成されたスキャン画像(原稿画像)が、文字認識処理の実行指令とともに、MFP1Cからサーバ80Cへと送信される(ステップS64)。   Thereafter, when the operator operates the screen G11 to give an instruction to start a scanning process with a character recognition process, the MFP 1C executes a scanning operation (step S63). Then, the generated scanned image (original image) is transmitted from MFP 1C to server 80C together with the character recognition processing execution command (step S64).

サーバ80Cは、当該MFP1Cからの実行指令および原稿画像を受信すると、当該実行指令に応答して、受信した原稿画像に対するOCR処理と文法チェック処理とを実行する(ステップS65)。そして、サーバ80Cは、文字認識処理により得られたデータと、文字認識処理に関する判定結果とを、MFP1Cに対して返信する。また、サーバ80Cは、認識率が100%でない場合には、要求レベルの設定画面を表示するためのデータをMFP1Cに返信する(ステップS66)。   When server 80C receives the execution command and document image from MFP 1C, server 80C executes OCR processing and grammar check processing on the received document image in response to the execution command (step S65). Server 80C returns the data obtained by the character recognition process and the determination result related to the character recognition process to MFP 1C. If the recognition rate is not 100%, server 80C returns data for displaying a request level setting screen to MFP 1C (step S66).

MFP1Cは、サーバ80Cから受信したデータに基づき、図7の画面G12と同様の設定画面を操作パネル63に表示する。   The MFP 1C displays a setting screen similar to the screen G12 in FIG. 7 on the operation panel 63 based on the data received from the server 80C.

その後、操作者が操作パネル63を操作して、所望の要求レベルを選択して入力する(ステップS67)と、当該操作入力に応答して、「要求レベル」の選択結果に関するデータがMFP1Cからサーバ80Cへと送信される(ステップS68)。   Thereafter, when the operator operates the operation panel 63 to select and input a desired request level (step S67), in response to the operation input, data related to the selection result of “request level” is sent from the MFP 1C to the server. It is transmitted to 80C (step S68).

サーバ80Cは、MFP1Cから送信されてきたデータに基づいて、原稿画像に対する文字認識処理の結果に関する要求レベルを設定する処理(ステップS69)を実行する。   Based on the data transmitted from MFP 1C, server 80C executes a process (step S69) for setting a request level regarding the result of the character recognition process for the document image.

そして、サーバ80Cは、原稿画像に対する文字認識処理の結果が要求レベルを満足しているか否かを判定する。   Then, the server 80C determines whether or not the result of character recognition processing for the document image satisfies the required level.

要求レベルが満たされていると判定される場合には、ステップS70以降の処理は実行されず、図14の処理は終了する。   If it is determined that the required level is satisfied, the processing after step S70 is not executed, and the processing in FIG. 14 ends.

一方、原稿画像に対する文字認識処理の結果が要求レベルを満足していないと判定される場合には、次述するような動作が実行される。   On the other hand, when it is determined that the result of the character recognition process for the document image does not satisfy the required level, the following operation is executed.

まず、サーバ80Cは、要求レベルの設定に応じて委託先の候補を抽出する処理(ステップS70)を実行し、抽出結果に関するデータをMFP1Cに送信する(ステップS71)。   First, the server 80C executes processing (step S70) for extracting candidate candidates according to the setting of the request level, and transmits data related to the extraction result to the MFP 1C (step S71).

MFP1Cは、サーバ80Cから受信したデータに基づき、図9の画面G14等と同様の設定画面を操作パネル63に表示する。   Based on the data received from server 80C, MFP 1C displays a setting screen similar to screen G14 in FIG.

その後、操作者が操作パネル63を操作して、所望の委託先を複数の候補の中から選択して入力する(ステップS72)と、当該選択操作入力に応答して、「委託先」の選択結果に関するデータがMFP1Cからサーバ80Cへと送信される(ステップS73)。   After that, when the operator operates the operation panel 63 to select and input a desired entrustee from a plurality of candidates (step S72), in response to the selection operation input, the “entrustee” is selected. Data relating to the result is transmitted from the MFP 1C to the server 80C (step S73).

サーバ80Cは、MFP1Cから送信されてきたデータに基づいて、委託先を決定する処理(ステップS74)を実行する。   The server 80C executes a process for determining a consignee based on the data transmitted from the MFP 1C (step S74).

そして、サーバ80Cは、原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する処理(ステップS75)をも実行する。   Then, the server 80C also executes a process (step S75) of transmitting a delegation instruction for entrusting digitization processing of character information included in the document image to the entrustee.

以上のような態様によっても、第1実施形態および第2実施形態と同様の効果を得ることが可能である。また、各種の処理をMFP1Cとサーバ80Cとで分散して実行することによって、MFP1およびサーバ80Cのそれぞれにおける処理負荷を軽減することができる。   The same effects as those of the first embodiment and the second embodiment can also be obtained by the above-described aspects. Further, by executing various processes in a distributed manner between the MFP 1C and the server 80C, the processing load on each of the MFP 1 and the server 80C can be reduced.

なお、第3実施形態においては、ステップS65で文字認識処理の結果を求めた後、当該文字認識処理の結果が「100%」を満足していないと判定される場合にのみ、要求レベルの設定処理等(ステップS66〜S69)を行う場合を例示している。ただし、これに限定されず、文字認識処理の結果を求める前、例えばスキャン開始前(ステップS62等)において、「要求レベル」を含む各種項目に関する設定画面G12を用いて、ステップS66〜S69と同様の処理を予め行うようにしてもよい。   In the third embodiment, the request level is set only when it is determined that the result of the character recognition process does not satisfy “100%” after the result of the character recognition process is obtained in step S65. The case where processing etc. (steps S66-S69) are performed is illustrated. However, the present invention is not limited to this, and before obtaining the result of the character recognition process, for example, before the start of scanning (step S62 and the like), using the setting screen G12 related to various items including “request level”, the same as steps S66 to S69 These processes may be performed in advance.

<4.変形例>
以上、この発明の実施の形態について説明したが、この発明は上記説明した内容のものに限定されるものではない。
<4. Modification>
Although the embodiments of the present invention have been described above, the present invention is not limited to the contents described above.

たとえば、上記第3実施形態においては、MFP1Cは、サーバ80Cからのデータを受信した後は自律的に動作する態様を例示したが、これに限定されず、サーバ80Cからのデータを受信した後、サーバ80CがMFP1CをコントロールしてMFP1Cを動作させるようにしてもよい。例えば、サーバ80CがMFP1CのAPI(Application Program Interface)を利用して、MFP1Cの動作を制御することが可能である。   For example, in the third embodiment, the MFP 1C exemplifies a mode in which it operates autonomously after receiving data from the server 80C. However, the present invention is not limited to this, and after receiving data from the server 80C, The server 80C may control the MFP 1C to operate the MFP 1C. For example, the server 80C can control the operation of the MFP 1C using an API (Application Program Interface) of the MFP 1C.

また、上記各実施形態においては、要求レベルの判定要素として、文法チェック後の文字認識率Rrを用いる場合を例示したが、これに限定されず、例えば、文字単位での認識率Rcを用いるようにしてもよい。   In each of the above embodiments, the case where the character recognition rate Rr after the grammar check is used as the determination element for the required level is exemplified. However, the present invention is not limited to this. For example, the recognition rate Rc in character units is used. It may be.

また、上記各実施形態においては、文法チェック処理を認識率の再判定処理に用いる場合を例示したが、これに限定されない。例えば、文法チェック処理の結果を反映させた文字修正処理をさらに実行するようにしてもよい。この場合には、文法チェック後の文字認識率Rrが文字単位での認識率Rcよりも低くなる場合だけでなく、文法チェック処理結果を反映した文字修正処理後の文字認識率Rrが値Rcよりも大きくなる場合も想定される。   In each of the above embodiments, the case where the grammar check process is used for the recognition rate redetermination process is illustrated, but the present invention is not limited to this. For example, a character correction process reflecting the result of the grammar check process may be further executed. In this case, not only the character recognition rate Rr after the grammar check is lower than the recognition rate Rc in character units, but also the character recognition rate Rr after the character correction process reflecting the result of the grammar check process is based on the value Rc. Is also assumed to be large.

また、上記各実施形態においては、「要求レベル」が2つの段階のいずれかに設定され得る場合を例示したが、これに限定されない。例えば、「要求レベル」は、さらに多数の段階のいずれかに設定され得るものであってもよい。   Further, in each of the above embodiments, the case where the “required level” can be set to one of the two stages is exemplified, but the present invention is not limited to this. For example, the “request level” may be set to any one of a number of stages.

また、上記各実施形態においては、機密情報の有無に応じて事業者を抽出する場合を例示したが、これに限定されず、機密情報のレベルに応じて事業者を抽出するようにしてもよい。   Further, in each of the above embodiments, the case where the business operator is extracted according to the presence / absence of the confidential information is exemplified, but the present invention is not limited to this, and the business operator may be extracted according to the level of the confidential information. .

たとえば、機密情報のレベルが「高」、「中」、「低」の3段階に分類される場合を想定する。また、各事業者がその事業の信頼度等を考慮して、少なくとも所定の基準を満たしている「基準レベル事業者」と、さらに厳しい基準をも満たしている比較的優良な事業者である「優良事業者」とに区分された状態で、事業者のリストが格納されているものとする。   For example, it is assumed that the level of confidential information is classified into three levels: “high”, “medium”, and “low”. In addition, considering the reliability of the business, each business operator is a “standard-level business operator” that meets at least the prescribed standards, and a relatively good business operator that meets even more stringent standards. Assume that a list of business operators is stored in a state of being classified as “excellent business operators”.

この場合において、機密情報のレベルが「中」レベルであるときには、「上位レベル事業者」が抽出され、「低」レベルであるときには、「基準レベル事業者」が抽出されるようにすることができる。このように、原稿画像における機密情報の機密レベルに応じて委託先の候補を抽出することによれば、機密情報の管理をより適切に行うことが可能である。   In this case, when the level of confidential information is “medium” level, “higher level operator” is extracted, and when it is “low” level, “reference level operator” is extracted. it can. As described above, by extracting the candidates for the entrustee in accordance with the confidential level of the confidential information in the document image, it is possible to more appropriately manage the confidential information.

また、機密情報のレベルが比較的高位であるとき(例えば最高位の「高」レベルであるとき)には、外部委託を禁止するようにしてもよい。換言すれば、文字認識処理の結果が要求レベルを満足していないと判定される場合であっても、原稿画像における機密情報の機密レベルが「高」レベル以上であるときには、原稿画像に関する委託指示を送信しないようにしてもよい。これによれば、「高」レベルの機密情報が社外へ流出することを回避できる。   Further, when the level of confidential information is relatively high (for example, when it is the highest “high” level), outsourcing may be prohibited. In other words, even if it is determined that the result of the character recognition process does not satisfy the required level, if the confidential level of the confidential information in the original image is equal to or higher than the “high” level, the consignment instruction regarding the original image May not be transmitted. According to this, it is possible to avoid leakage of “high” level confidential information outside the company.

また、上記各実施形態においては、原稿電子化システムにおける原稿電子化装置として、MFP1およびサーバ80を例示したが、これに限定されず、スキャナ装置などのその他の装置であってもよい。   In each of the above embodiments, the MFP 1 and the server 80 are exemplified as the document digitizing device in the document digitizing system. However, the present invention is not limited to this, and other devices such as a scanner device may be used.

第1実施形態に係る原稿電子化システムの構成を示す概略図である。1 is a schematic diagram illustrating a configuration of a document digitization system according to a first embodiment. コントローラの各種処理部を示す機能ブロック図である。It is a functional block diagram which shows the various process parts of a controller. MFPのスキャン動作を示すフローチャートである。5 is a flowchart illustrating a scanning operation of the MFP. 図3の一部動作を示すフローチャートである。4 is a flowchart showing a partial operation of FIG. 3. 図3の一部動作を示すフローチャートである。4 is a flowchart showing a partial operation of FIG. 3. 操作パネル付近の構成を示す図である。It is a figure which shows the structure of an operation panel vicinity. 要求レベルの設定画面を示す図である。It is a figure which shows the setting screen of a request level. 「原稿言語」に関する設定画面を示す図である。FIG. 10 is a diagram illustrating a setting screen related to “document language”. 委託先の設定画面を示す図である。It is a figure which shows the setting screen of a consignee. 委託先の設定画面を示す図である。It is a figure which shows the setting screen of a consignee. 委託先の設定画面を示す図である。It is a figure which shows the setting screen of a consignee. 第2実施形態に係る原稿電子化システムの構成を示す概略図である。It is the schematic which shows the structure of the original digitization system which concerns on 2nd Embodiment. 原稿電子化システムにおける動作を示す概念図である。It is a conceptual diagram which shows the operation | movement in a manuscript electronic system. 第3実施形態に係る原稿電子化システムにおける動作を示す概念図である。It is a conceptual diagram which shows the operation | movement in the original digitization system which concerns on 3rd Embodiment.

符号の説明Explanation of symbols

1,1A,1B,1C マルチ・ファンクション・ペリフェラル(MFP)
100,100A,100B,100C 原稿電子化システム
22 スキャンボタン
25 スタートボタン
31,32,35,36,37 選択ボタン
42 候補表示欄
63 操作パネル
80,80B,80C サーバ
90,90a,90b,90c,90d コンピュータ(委託先)
NW 通信ネットワーク
1,1A, 1B, 1C Multi-function peripheral (MFP)
100, 100A, 100B, 100C Document digitization system 22 Scan button 25 Start button 31, 32, 35, 36, 37 Selection button 42 Candidate display field 63 Operation panel 80, 80B, 80C Server 90, 90a, 90b, 90c, 90d Computer (consignee)
NW communication network

Claims (9)

原稿画像に含まれる文字情報を電子化する原稿電子化システムであって、
前記原稿画像に対する文字認識処理の結果に関する要求レベルを変更することが可能な設定手段と、
前記原稿画像に対する前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合に、前記原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する委託動作制御手段と、
を備えることを特徴とする原稿電子化システム。
A document digitizing system that digitizes character information contained in a document image,
Setting means capable of changing a request level relating to a result of character recognition processing on the document image;
A consignment for sending a consignment instruction for consigning digitization processing of character information included in the document image to a consignee when it is determined that the result of the character recognition process for the document image does not satisfy the required level An operation control means;
An electronic document system comprising:
請求項1に記載の原稿電子化システムにおいて、
前記要求レベルに応じて前記委託先の候補を抽出する抽出手段と、
当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段と、
をさらに備えることを特徴とする原稿電子化システム。
The electronic document system according to claim 1,
Extraction means for extracting candidates for the entrustee according to the request level;
Determining means for determining the entrustee in accordance with a selection operation for selecting the entrustee from the candidates;
An electronic document system, further comprising:
請求項1に記載の原稿電子化システムにおいて、
前記原稿画像の言語に応じて前記委託先の候補を抽出する抽出手段と、
当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段と、
をさらに備えることを特徴とする原稿電子化システム。
The electronic document system according to claim 1,
Extraction means for extracting candidates for the consignee according to the language of the document image;
Determining means for determining the entrustee in accordance with a selection operation for selecting the entrustee from the candidates;
An electronic document system, further comprising:
請求項1に記載の原稿電子化システムにおいて、
前記原稿画像における機密情報の有無に応じて前記委託先の候補を抽出する抽出手段と、
当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段と、
をさらに備えることを特徴とする原稿電子化システム。
The electronic document system according to claim 1,
Extraction means for extracting candidates for the entrustee in accordance with the presence or absence of confidential information in the document image;
Determining means for determining the entrustee in accordance with a selection operation for selecting the entrustee from the candidates;
An electronic document system, further comprising:
請求項1に記載の原稿電子化システムにおいて、
前記原稿画像における機密情報の機密レベルに応じて前記委託先の候補を抽出する抽出手段と、
当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段と、
をさらに備えることを特徴とする原稿電子化システム。
The electronic document system according to claim 1,
Extraction means for extracting candidates for the entrustee in accordance with a confidential level of confidential information in the document image;
Determining means for determining the entrustee in accordance with a selection operation for selecting the entrustee from the candidates;
An electronic document system, further comprising:
請求項1に記載の原稿電子化システムにおいて、
前記委託動作制御手段は、前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合であっても、前記原稿画像における機密情報の機密レベルが所定レベル以上であるときには、前記原稿画像に関する前記委託指示を送信しないことを特徴とする原稿電子化システム。
The electronic document system according to claim 1,
Even when it is determined that the result of the character recognition processing does not satisfy the required level, the consignment operation control means, when the confidential level of confidential information in the document image is a predetermined level or higher, A document digitization system, characterized in that the consignment instruction relating to a document image is not transmitted.
請求項1に記載の原稿電子化システムにおいて、
前記委託先は、前記要求レベルに応じて変更されることを特徴とする原稿電子化システム。
The electronic document system according to claim 1,
The document digitization system, wherein the consignee is changed according to the required level.
請求項1に記載の原稿電子化システムにおいて、
前記委託動作制御手段は、前記委託先に対して前記委託指示とともに前記原稿画像を送信することを特徴とする原稿電子化システム。
The electronic document system according to claim 1,
The electronic document system according to claim 1, wherein the consignment operation control means transmits the original image together with the consignment instruction to the consignee.
コンピュータに、
a)原稿画像に対する文字認識処理の結果に関する要求レベルを設定する手順と、
b)前記原稿画像に対する前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合に、前記原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する手順と、
を実行させるためのプログラム。
On the computer,
a) a procedure for setting a required level for the result of character recognition processing on a document image;
b) When it is determined that the result of the character recognition processing for the document image does not satisfy the required level, a consignment instruction for consigning digitization processing of character information included in the document image is transmitted to the consignee And the steps to
A program for running
JP2007122967A 2007-05-08 2007-05-08 Document digitization system and program Withdrawn JP2008282062A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007122967A JP2008282062A (en) 2007-05-08 2007-05-08 Document digitization system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007122967A JP2008282062A (en) 2007-05-08 2007-05-08 Document digitization system and program

Publications (1)

Publication Number Publication Date
JP2008282062A true JP2008282062A (en) 2008-11-20

Family

ID=40142851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007122967A Withdrawn JP2008282062A (en) 2007-05-08 2007-05-08 Document digitization system and program

Country Status (1)

Country Link
JP (1) JP2008282062A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011065390A (en) * 2009-09-16 2011-03-31 Konica Minolta Business Technologies Inc Program for function simulation of image processing apparatus, information processing apparatus, and recording medium
JP2020046952A (en) * 2018-09-19 2020-03-26 富士ゼロックス株式会社 Information processing device and information processing program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011065390A (en) * 2009-09-16 2011-03-31 Konica Minolta Business Technologies Inc Program for function simulation of image processing apparatus, information processing apparatus, and recording medium
CN102025873A (en) * 2009-09-16 2011-04-20 柯尼卡美能达商用科技株式会社 Information processing apparatus and function simulation method of the same
US8368909B2 (en) 2009-09-16 2013-02-05 Konica Minolta Business Technologies, Inc. Recording medium, information processing apparatus and function simulation method of image processing apparatus
JP2020046952A (en) * 2018-09-19 2020-03-26 富士ゼロックス株式会社 Information processing device and information processing program

Similar Documents

Publication Publication Date Title
JP6891073B2 (en) A device for setting a file name, etc. on a scanned image, its control method, and a program.
US11616884B2 (en) Image processing system for computerizing document, control method thereof, and storage medium
US11842534B2 (en) Information processing apparatus for obtaining character string
US11652932B2 (en) Image processing apparatus for setting a folder path by using a character string in a document
US20240073330A1 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US20220201146A1 (en) Information processing apparatus, information processing system, control method of the same, and storage medium
US11252287B2 (en) Image processing apparatus that displays guidance for user operation, control method thereof and storage medium
US11265431B2 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11647139B2 (en) Image processing apparatus, image processing system, control method thereof, and storage medium
US11765292B2 (en) Information processing apparatus used for converting image to file, image processing system, method of controlling information processing apparatus, and storage medium
US11393234B2 (en) Image processing system for computerizing document, control method thereof, and storage medium
US11575799B2 (en) Image processing apparatus for setting property including character strings and separators to scanned image, control method thereof and storage medium
US20230156138A1 (en) Information processing apparatus, method of controlling information processing apparatus, and storage medium
US11800032B2 (en) Apparatus, information processing method, and storage medium
US11620840B2 (en) Image processing apparatus for extracting a desired character string from a scanned image
JP2008282062A (en) Document digitization system and program
JP2020178301A (en) Information processing device, control method of the same, and program
JP2021164132A (en) Image processing system and program
JP2017004455A (en) Image processing apparatus, image processing system, image processing method, and program
US20220343664A1 (en) Image processing apparatus, image processing method, and recording medium
JP2024034740A (en) Image processing apparatus, image processing system, image processing method, and program
JP2023019008A (en) Information processing system, communication system, and information processing method
JP2024040612A (en) Information processing device, method for controlling information processing device, and program
JP2023128455A (en) Image processing apparatus, image processing method, and program
JP2024032563A (en) Information processing apparatus, control method of information processing apparatus, and program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100803