JP2008282062A - Document digitization system and program - Google Patents
Document digitization system and program Download PDFInfo
- Publication number
- JP2008282062A JP2008282062A JP2007122967A JP2007122967A JP2008282062A JP 2008282062 A JP2008282062 A JP 2008282062A JP 2007122967 A JP2007122967 A JP 2007122967A JP 2007122967 A JP2007122967 A JP 2007122967A JP 2008282062 A JP2008282062 A JP 2008282062A
- Authority
- JP
- Japan
- Prior art keywords
- document
- entrustee
- document image
- level
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012545 processing Methods 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims description 111
- 230000008569 process Effects 0.000 claims description 101
- 238000000605 extraction Methods 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000012015 optical character recognition Methods 0.000 description 14
- 238000012946 outsourcing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、原稿電子化システムおよびそれに関連する技術に関する。 The present invention relates to a manuscript digitization system and related technology.
画像形成装置(例えばMFP)等を用いて原稿の画像を取得し、当該画像に含まれる文字を認識する技術が存在する。これによれば、原稿に含まれる文字情報を電子化することが可能である。 There is a technique for acquiring an image of a document using an image forming apparatus (for example, MFP) and recognizing characters included in the image. According to this, it is possible to digitize the character information included in the document.
ただし、このような文字認識における認識率は100%に満たないことが多く、十分な品質を確保することは難しい。 However, the recognition rate in such character recognition is often less than 100%, and it is difficult to ensure sufficient quality.
このような状況に応える技術として、例えば、特許文献1に記載の技術が存在する。
As a technique for responding to such a situation, for example, a technique described in
特許文献1の技術では、課税計算に用いられる課税根拠資料(帳票原稿)をスキャンニングしてその画像が生成され、当該画像に関する文字認識処理が実行される。そして、当該文字認識処理における文字認識率が所定の基準値(固定値)よりも低い場合には、当該資料の文字情報の入力業務が外部に委託される。
In the technique of
ところで、文字認識処理においては、様々な要求レベルが存在する。例えば、完全な認識結果が要求される場合、すなわち100%の認識率が要求される場合もあれば、それに限らず、多少の誤認識は許容される場合もある。 By the way, there are various required levels in character recognition processing. For example, when a complete recognition result is required, that is, a recognition rate of 100% may be required, and not limited thereto, some misrecognition may be allowed.
しかしながら、特許文献1の技術においては、文字認識率に関する基準値は固定値である。
However, in the technique of
例えば、この基準値が「100%」に固定される場合においては、認識率が100%未満であるとき(すなわち少しでも誤認識が存在するとき)には常に外部への委託処理が実行されてしまう。そのため、多少の誤認識が許容されるときであっても外部への委託処理が実行されることとなり、外部への無駄な発注が生じてしまう。一方、この基準値が比較的低い値(例えば80%)に固定される場合においては、100%の認識率が要求されるにも関わらず必ずしも十分な認識結果を得ることが出来ないことがある。 For example, when the reference value is fixed at “100%”, when the recognition rate is less than 100% (that is, when there is even a slight recognition error), outsourcing processing is always executed. End up. For this reason, even when some misrecognition is allowed, a consignment process to the outside is executed, resulting in a wasteful ordering to the outside. On the other hand, when this reference value is fixed to a relatively low value (for example, 80%), a sufficient recognition result may not always be obtained although a recognition rate of 100% is required. .
そこで、この発明の課題は、様々な要求レベルを考慮して適切な委託処理を実行することが可能な原稿電子化システムおよびそれに関連する技術を提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is to provide a manuscript digitization system capable of executing an appropriate consignment process in consideration of various request levels and a technology related thereto.
上記課題を解決すべく、請求項1の発明は、原稿画像に含まれる文字情報を電子化する原稿電子化システムであって、前記原稿画像に対する文字認識処理の結果に関する要求レベルを変更することが可能な設定手段と、前記原稿画像に対する前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合に、前記原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する委託動作制御手段とを備えることを特徴とする。
In order to solve the above-mentioned problem, the invention of
請求項2の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記要求レベルに応じて前記委託先の候補を抽出する抽出手段と、当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段とをさらに備えることを特徴とする。 According to a second aspect of the present invention, in the document digitizing system according to the first aspect of the present invention, an extracting means for extracting the candidate for the consignee according to the request level, and a selection for selecting the consignee from the candidates It further comprises a determining means for determining the entrustee in accordance with an operation.
請求項3の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記原稿画像の言語に応じて前記委託先の候補を抽出する抽出手段と、当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段とをさらに備えることを特徴とする。 According to a third aspect of the present invention, in the electronic document system according to the first aspect of the present invention, an extraction means for extracting the candidate of the consignee according to the language of the manuscript image, and selecting the consignee from the candidates And determining means for determining the entrustee in accordance with a selection operation to be performed.
請求項4の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記原稿画像における機密情報の有無に応じて前記委託先の候補を抽出する抽出手段と、当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段とをさらに備えることを特徴とする。 According to a fourth aspect of the present invention, there is provided the original digitizing system according to the first aspect, wherein the entrusting candidate is extracted according to presence or absence of confidential information in the original image, and the consignment is selected from the candidates. And a determination unit that determines the entrustee according to a selection operation for selecting a destination.
請求項5の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記原稿画像における機密情報の機密レベルに応じて前記委託先の候補を抽出する抽出手段と、当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段とをさらに備えることを特徴とする。 According to a fifth aspect of the present invention, in the document digitization system according to the first aspect of the present invention, an extraction unit that extracts a candidate for the entrustee in accordance with a confidential level of confidential information in the document image; It further comprises a determining means for determining the entrustee according to a selection operation for selecting the entrustee.
請求項6の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記委託動作制御手段は、前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合であっても、前記原稿画像における機密情報の機密レベルが所定レベル以上であるときには、前記原稿画像に関する前記委託指示を送信しないことを特徴とする。 A sixth aspect of the present invention is the original document digitizing system according to the first aspect of the invention, wherein the consignment operation control means determines that the result of the character recognition processing does not satisfy the required level. However, when the confidential level of the confidential information in the document image is equal to or higher than a predetermined level, the consignment instruction regarding the document image is not transmitted.
請求項7の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記委託先は、前記要求レベルに応じて変更されることを特徴とする。 According to a seventh aspect of the invention, in the electronic document system according to the first aspect of the invention, the consignee is changed according to the required level.
請求項8の発明は、請求項1の発明に係る原稿電子化システムにおいて、前記委託動作制御手段は、前記委託先に対して前記委託指示とともに前記原稿画像を送信することを特徴とする。 According to an eighth aspect of the present invention, in the electronic document system according to the first aspect, the consignment operation control means transmits the original image together with the consignment instruction to the consignee.
請求項9の発明は、コンピュータに、a)原稿画像に対する文字認識処理の結果に関する要求レベルを設定する手順と、b)前記原稿画像に対する前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合に、前記原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する手順とを実行させるためのプログラムであることを特徴とする。 According to the ninth aspect of the present invention, a) a procedure for setting a required level related to a result of character recognition processing for a document image, and b) a result of the character recognition processing for the document image does not satisfy the required level. A program for executing a procedure for transmitting a delegation instruction for entrusting digitization processing of character information included in the document image to the entrustee.
請求項1ないし請求項9に記載の発明によれば、様々な要求レベルを考慮して適切な委託処理を実行することが可能である。 According to the first to ninth aspects of the invention, it is possible to execute an appropriate entrusting process in consideration of various request levels.
<1.第1実施形態>
<1−1.構成>
図1は、第1実施形態に係る原稿電子化システム100(100A)の構成を示す概略図である。
<1. First Embodiment>
<1-1. Configuration>
FIG. 1 is a schematic diagram showing the configuration of an electronic document system 100 (100A) according to the first embodiment.
原稿電子化システム100(100A)は、マルチ・ファンクション・ペリフェラル(MFPとも略称する)1(1A)を備えている。また、原稿電子化システム100において、MFP1は、外部委託先になり得る各事業者のコンピュータ90(90a,90b,90c,90d,...)にネットワークNWを介して接続されている。
An electronic document system 100 (100A) includes a multi-function peripheral (abbreviated as MFP) 1 (1A). Further, in the
この原稿電子化システム100Aは、原稿(紙文書等)を光学的に読み取って得られる画像(原稿画像とも称する)に含まれる文字情報を電子化するシステムである。詳細には、MFP1が原稿画像を生成するとともに、当該原稿画像に対するOCR(Optical Character Reader)処理を施すことによって原稿画像に含まれる文字情報を電子化する。また、MFP1は、当該OCR処理における認識結果が要求レベルを満足していないと判定される場合に、原稿画像に含まれる文字情報の電子化処理を外部委託する委託指示を、外部委託先のコンピュータ90に送信する。また特に、この「要求レベル」は、固定値ではなく、操作者の入力等に応じて変更することが可能である。この設定動作等については後に詳述する。
This
MFP1は、スキャナ機能、プリンタ機能、コピー機能およびファクシミリ機能などを備える装置(複合機とも称する)である。具体的には、MFP1は、画像読取部2と、印刷出力部3と、通信部4と、格納部5と、入出力部6と、コントローラ9とを備えており、これらの各部を複合的に動作させることによって、上記の各機能を実現する。
The
画像読取部2は、MFP1の所定の位置に載置された原稿を光学的に読み取って、当該原稿の画像(原稿画像とも称する)を生成する処理部である。
The
印刷出力部3は、対象画像に関する画像データに基づいて紙などの各種の媒体に画像を印刷出力する出力部である。
The
通信部4は、公衆回線等を介したファクシミリ通信を行うことが可能な処理部である。また、通信部4は、通信ネットワークNWを介したネットワーク通信が可能である。このネットワーク通信を利用することによって、MFP1は、所望の相手先との間で各種のデータを授受することが可能である。また、MFP1は、このネットワーク通信を利用することによって、電子メールの送受信を行うことも可能である。
The
格納部5は、ハードディスクドライブ(HDD)等の格納装置で構成される。この格納部5には、画像読取部2等で生成された原稿画像が格納される。また、格納部5には、委託先データ8等も格納されている。委託先データ8は、委託先になり得る事業者に関する各種のデータである。詳細には、委託先データ8には、各事業者の名称、各事業者の連絡先(電子メールアドレス等)、各事業者における委託処理単価、各事業者における処理可能言語、および各事業者と自社(MFP1が設置されている会社)等との秘密保持契約の有無等が互いに関連づけて格納されている。
The
入出力部6は、MFP1に対する入力を受け付ける操作入力部61と、各種情報の表示出力を行う表示部62とを備えている。詳細には、MFP1には操作パネル63(図6等参照)が設けられている。この操作パネル63は、液晶表示パネルに圧電センサ等が埋め込まれて構成されており、表示部62の一部として機能するとともに、操作入力部61の一部としても機能する。
The input /
コントローラ9は、MFP1を統括的に制御する制御装置であり、CPUと、各種の半導体メモリ(RAMおよびROM等)とを備えて構成される。コントローラ9の制御下において各種の処理部が動作することによって、MFP1の各種の機能が実現される。例えば、コントローラ9の制御下において、画像読取部2を用いて所望の画像を光学的に読み取ることによって、原稿をスキャニングした画像(原稿画像)が取得され、スキャナ機能が実現される。また、コントローラ9は、原稿画像の電子化処理に関連して、次述するような各種の処理を制御する。
The
図2は、コントローラ9において機能的に実現される各種の処理部を示す機能ブロック図である。詳細には、コントローラ9のCPUにおいて、コントローラ9のROM内に格納されている所定のソフトウエアプログラム(以下、単にプログラムとも称する)が実行されることによって、図2のような各種の処理部が実現される。
FIG. 2 is a functional block diagram showing various processing units that are functionally realized in the
具体的には、要求レベル設定部11と機密情報判定部12と言語判定部13と見積価格算出部14と候補抽出部15と委託先決定部16と委託動作制御部17とを含む各種の処理部が実現される。
Specifically, various processes including the request
要求レベル設定部11は、原稿画像に対する文字認識処理の結果に関する要求レベルを設定する処理部である。要求レベル設定部11は、当該要求レベルを操作者からの入力等に応じて変更することが可能である。
The request
機密情報判定部12は、原稿画像における機密情報の有無および当該機密情報の機密レベルを判定する処理部である。
The confidential
言語判定部13は、原稿画像における言語の種類を判定する処理部である。
The
見積価格算出部14は、外部の各事業者に委託処理を依頼する際に生じる費用(見積金額)を算出する処理部である。
The estimated
候補抽出部15は、委託先データ8に格納された複数の事業者の中から「委託先」の候補を抽出する処理部である。この実施形態では、候補抽出部15は、要求レベル設定部11で設定された要求レベルに応じて委託先の候補を抽出するとともに、原稿言語の種類と原稿画像における機密情報の有無とにも応じて委託先の候補を抽出する。
The
委託先決定部16は、候補抽出部15によって抽出された候補の中から委託先を選択する選択操作に応じて、委託先を決定する処理部である。
The
委託動作制御部17は、原稿画像に含まれる文字情報の電子化処理を「委託先」に委託する動作を制御する。詳細には、委託先決定部16で決定された「委託先」に対して委託指示を送信する。この委託指示の送信動作は、原稿画像に対する文字認識処理の結果が要求レベルを満足していないと判定される場合に実行される。
The consignment
なお、このMFP1Aは、原稿電子化システム100Aにおいて、原稿電子化処理の主要な役割を果たしており、原稿電子化装置とも称される。
The MFP 1A plays a main role in the digitizing process in the
<1−2.動作>
図3〜図5は、MFP1(1A)の動作を示すフローチャートである。図3は原稿電子化処理の概略を示し、図4および図5はその一部動作の詳細を示している。また、図6は、操作パネル63付近の構成を示す図である。なお、図6においては、MFP1の機能選択ボタン(詳細には、ファックスボタン21、スキャンボタン22、およびコピーボタン23)とスタートボタン25とが操作パネル63の近傍に設けられている場合が例示されている。以下では、これらの図等を参照しながら、MFP1の動作について説明する。
<1-2. Operation>
3 to 5 are flowcharts showing the operation of the MFP 1 (1A). FIG. 3 shows an outline of the electronic document processing, and FIGS. 4 and 5 show details of the partial operation. FIG. 6 is a diagram showing a configuration near the
MFP1の操作者が、操作入力部61に設けられた機能選択ボタン21,22,23のうち、スキャンボタン22を押下すると、図6のような画面G11が操作パネル63に表示される。詳細には、「電子化する」および「電子化しない」の2つの選択肢にそれぞれ対応する選択ボタン31,32が操作パネル63に表示される。MFP1は、図6のような画面G11を操作パネル63に表示すると、スキャン開始指示を受け付ける待機状態に移行する(図3、ステップS11)。
When the operator of the
その後、操作者が2つの選択ボタン31,32のうち所望の選択肢に対応するボタンを押下しスタートボタン25を押下すると、MFP1は、スキャン開始指示が付与されたものと解するとともに、ボタン31,32に関する選択状態に応じて分岐処理を実行する。
Thereafter, when the operator depresses the button corresponding to the desired option among the two
例えば、「電子化しない」に対応する選択ボタン32が選択された状態でスタートボタン25が押下されると、ステップS12を経てステップS10に進み、スキャン動作が実行される。この場合には、電子化処理(OCR処理)は実行されることなく、スキャン動作によって原稿画像が生成され、生成された原稿画像が所定の格納場所に格納される。以上のようにして操作者の指示に対応する一連の動作が終了する。
For example, when the
一方、「電子化する」に対応する選択ボタン31が選択された状態でスタートボタン25が押下されると、ステップS12を経てステップS13に進み、スキャン動作によって原稿画像が生成され、生成された原稿画像が所定の格納場所に格納される。そして、ステップS13が終了すると、次にステップS14以降の処理がさらに実行される。
On the other hand, when the
ステップS14においては、電子化処理(OCR処理)、換言すれば文字認識処理、が実行される。また、このステップS14では、当該文字認識処理に加えて、当該文字認識処理における認識率R、より詳細には文字単位での認識処理率の算出処理も実行される。この文字単位での認識率R(証紙にはRcとも表記する)は、例えば、OCR処理の自動変換機能では変換不可能と判定された文字数Nnを全文字数Ntから差し引いた値を、全文字数Ntで除した値として算出される(Rc=(Nt−Nn)/Nt)。 In step S14, digitization processing (OCR processing), in other words, character recognition processing is executed. In step S14, in addition to the character recognition process, a recognition rate R in the character recognition process, more specifically, a recognition process rate calculation process for each character is also executed. The recognition rate R in character units (also expressed as Rc on the certificate) is, for example, a value obtained by subtracting, from the total number of characters Nt, the number of characters Nn determined to be unconvertible by the automatic conversion function of the OCR process. (Rc = (Nt−Nn) / Nt).
次のステップS15においては、ステップS14での文字認識処理の結果をより詳細に検証するための文法チェック処理(構文チェック処理とも称される)が実行される。文法チェック処理は、文字認識処理によって得られたテキストデータに対して、格構造等に関する文法解析処理(構文解析処理)を施すとともに、当該文法解析処理により得られた文法情報を用いて、当該テキストデータの適切性をチェックする処理である。例えば、テキストデータから抽出した名詞と動詞との対応関係の適切性を、様々な名詞と動詞との各種の対応関係を定義した辞書に基づいて判定することが可能である。また、変換後のテキストデータ中の動詞が適切な時制変化形(現在形、過去形等)に該当するか否かをチェックすることも可能である。なお、この文法チェック処理としては、種々の公知技術(例えば、特開2006−350663号公報に記載の技術等)を用いることなどが可能である。 In the next step S15, a grammar check process (also referred to as a syntax check process) for verifying the result of the character recognition process in step S14 in more detail is executed. Grammar check processing performs grammar analysis processing (syntax analysis processing) on the case structure, etc., on text data obtained by character recognition processing, and uses the grammar information obtained by the grammar analysis processing to This is a process to check the appropriateness of data. For example, the appropriateness of the correspondence between nouns and verbs extracted from text data can be determined based on a dictionary that defines various correspondences between various nouns and verbs. It is also possible to check whether the verb in the converted text data corresponds to an appropriate tense change form (present tense, past tense, etc.). As this grammar check process, various known techniques (for example, the technique described in Japanese Patent Laid-Open No. 2006-350663) can be used.
この結果、ステップS14で変換された文字の中から、誤変換であると判定される文字がさらに出現すると、文字認識処理の結果が更新される。例えば、更新後の文字認識率R(詳細にはRrとも表記する)は、文法チェック処理で誤変換と判定された文字をも含めた誤変換文字の文字数Nmを全文字数Ntから差し引いた値を、全文字数Ntで除した値として算出される(Rr=(Nt−Nm)/Nt)。この結果、文法チェック後の文字認識率Rrは文字単位での認識率Rcよりも低い値として算出される。 As a result, when a character determined to be erroneous conversion further appears from the characters converted in step S14, the result of the character recognition process is updated. For example, the updated character recognition rate R (also expressed in detail as Rr) is a value obtained by subtracting the number Nm of erroneously converted characters including characters determined to be erroneously converted by the grammar check process from the total number of characters Nt. , Calculated by dividing by the total number of characters Nt (Rr = (Nt−Nm) / Nt). As a result, the character recognition rate Rr after the grammar check is calculated as a value lower than the recognition rate Rc in character units.
また、ステップS16においては、ステップS14,S15で算出された文字認識の処理結果(例えば、認識率Rr)に基づく分岐処理が実行される。 In step S16, branch processing based on the character recognition processing result (eg, recognition rate Rr) calculated in steps S14 and S15 is executed.
文字認識処理において誤変換が存在しない、すなわち認識率Rrが100%である、と判定される場合には、ステップS17以降の処理を実行することなく、図3の処理を終了する。この場合には、後述の要求レベルの設定内容にかかわらず、原稿画像に対する文字認識処理の結果が、当該要求レベル(「100%」もしくは「80%」)を満足していると判定されるため、後述の委託処理LA,LBが実行されることなく図3のルーチンが終了する。 If it is determined that there is no erroneous conversion in the character recognition process, that is, the recognition rate Rr is 100%, the process of FIG. 3 is terminated without executing the processes after step S17. In this case, it is determined that the result of character recognition processing for the document image satisfies the required level (“100%” or “80%”) regardless of the setting content of the required level described later. The routine shown in FIG. 3 is terminated without executing the entrusting processes LA and LB described later.
一方、文字認識処理において誤変換が存在する、すなわち認識率Rrが100%未満である、と判定されるときには、ステップS17以降の処理が実行される。 On the other hand, when it is determined that there is an erroneous conversion in the character recognition process, that is, the recognition rate Rr is less than 100%, the processes after step S17 are executed.
ステップS17では、要求レベルの設定処理が実行される。図7は、要求レベルの設定処理に用いられる設定画面G12を示す図である。MFP1は、図7に示すように、操作パネル63において、「認識できない文字が有りました(現認識率=70%)。電子化処理の要求レベルを設定してください。」などの文字を表示するととともに、3つの選択ボタン35,36,37と決定ボタン38とを表示する。操作者は、これらのボタンを操作することによって、所望の要求レベルを設定することが可能である。
In step S17, a request level setting process is executed. FIG. 7 is a diagram showing a setting screen G12 used for request level setting processing. As shown in FIG. 7, the
選択ボタン35は、要求レベルを「100%」に設定するボタンであり、選択ボタン36は、要求レベルを「80%」に設定するボタンである。操作者が、選択ボタン35,36のいずれかを選択して押下しさらに決定ボタン38を押下すると、MFP1は、複数段階(ここでは2段階)のレベルのうち、被選択ボタン(35または36)に対応するレベルに「要求レベル」を設定する。これによって、操作者は、要求レベルを、複数段階のレベルのうち所望のレベルに設定することが可能である。
The
また、選択ボタン37は、要求レベルの設定を「保留」するためのボタンである。MFP1は、選択ボタン37が押下されて決定ボタン38がさらに押下された場合には、要求レベルの設定を保留するとともに、以後の外部委託処理をも保留する。したがって、操作者は、外部委託処理を実行したくない場合等においては、このような操作(選択ボタン37および決定ボタン38の押下操作)を行えばよい。
The
この後、ステップS18以降においては、要求レベルに応じた委託処理が実行される。 Thereafter, in step S18 and subsequent steps, a consignment process corresponding to the request level is executed.
具体的には、要求レベルが「100%」に設定され、且つ、原稿画像に対する文字認識処理の結果が要求レベル「100%」を満足していないと判定される場合には、委託処理LAが実行される(ステップS18,S30)。ここにおいて、ステップS18に進むのは、認識率が100%未満であるとの条件判定(ステップS16)を経た後である。そのため、ステップS18では、要求レベルが「100%」に設定されていることを確認すると、ステップS30の委託処理LAを実行することが決定される。 Specifically, when the required level is set to “100%” and it is determined that the result of character recognition processing for the document image does not satisfy the required level “100%”, the entrusting process LA is It is executed (steps S18 and S30). Here, the process proceeds to step S18 after a condition determination (step S16) that the recognition rate is less than 100%. Therefore, in step S18, when it is confirmed that the request level is set to “100%”, it is determined to execute the entrusting process LA in step S30.
また、要求レベルが「80%」に設定され、且つ、原稿画像に対する文字認識処理の結果が要求レベル「80%」を満足していないと判定される場合には、委託処理LBが実行される(ステップS18,S19,S20,S40)。 On the other hand, when the request level is set to “80%” and it is determined that the result of the character recognition process for the document image does not satisfy the request level “80%”, the entrustment process LB is executed. (Steps S18, S19, S20, S40).
一方、要求レベルが「80%」に設定され、且つ、原稿画像に対する文字認識処理の結果が要求レベル「80%」を満足していると判定される場合には、委託処理LA,LBがいずれも実行されることなく、このルーチンは終了する(ステップS18,S19,S20)。 On the other hand, if it is determined that the required level is set to “80%” and the result of the character recognition process for the document image satisfies the required level “80%”, the entrusted processes LA and LB are Is not executed, and this routine ends (steps S18, S19, S20).
なお、ここでは、ステップS14,S15で文字認識処理の結果を求めた後、ステップS16で当該文字認識処理の結果が「100%」を満足していないと判定される場合にのみ、要求レベルの設定操作(ステップS17)を行う場合を例示している。これによれば、文字認識処理の結果が「100%」の場合には、要求レベルの設定操作を行わずに済む。ただし、これに限定されず、文字認識処理の結果を求める前、例えばスキャン開始前に要求レベルの設定操作を予め行うようにしてもよい。 Here, after the result of the character recognition process is obtained in steps S14 and S15, only when the result of the character recognition process is determined not to satisfy “100%” in step S16, the required level is reached. The case where setting operation (step S17) is performed is illustrated. According to this, when the result of the character recognition process is “100%”, it is not necessary to perform the operation for setting the required level. However, the present invention is not limited to this, and a request level setting operation may be performed in advance before obtaining the result of the character recognition process, for example, before starting the scan.
また、後述するように、委託処理LAにおいては、原稿画像に含まれる文字を人手での入力作業を伴って入力する事業者が委託先として決定される。これによれば、高い要求レベルに応じた委託先を決定することが可能である。また、委託処理LBにおいては、比較的高度な自動文字変換処理を有料のWEBサービスで提供する事業者が委託先として決定される。これによれば、中程度の要求レベルに応じられる委託先を決定することができる。 Further, as will be described later, in the entrustment process LA, an operator that inputs characters included in the document image with manual input work is determined as the entrustee. According to this, it is possible to determine a consignee according to a high request level. In the entrustment process LB, an operator that provides a relatively advanced automatic character conversion process with a paid WEB service is determined as an entrustee. According to this, it is possible to determine a consignee that can meet a medium level of demand.
次に、ステップS30,S40の動作の詳細について図4を参照しながら説明する。ステップS30,S40においては、上述の要求レベルを考慮するとともに、原稿の言語と原稿内における機密情報の有無とをさらに考慮して、委託先を決定する場合について説明する。ステップS30とステップS40とにおいては、抽出される委託先の候補が要求レベルに応じて異なる点で相違するが、同様の動作が実行される。ここでは、説明の重複を防ぐため、ステップS30の動作を中心に説明し、ステップS40の動作の説明を適宜省略する。 Next, details of the operations in steps S30 and S40 will be described with reference to FIG. In steps S30 and S40, a case will be described in which the outsourcing destination is determined in consideration of the above-described required level and further considering the language of the document and the presence or absence of confidential information in the document. In step S30 and step S40, the same operation is executed, although the extracted consignee candidates are different depending on the request level. Here, in order to prevent duplication of explanation, the explanation will focus on the operation of step S30, and the explanation of the operation of step S40 will be omitted as appropriate.
図4に示すように、まず、ステップS31においては、原稿に含まれる文字の言語種類が判定される。 As shown in FIG. 4, first, in step S31, the language type of characters included in the document is determined.
ここにおいて、上述のステップS14においては、OCR処理に利用される言語が既に特定されている。具体的には、MFP1に内蔵される複数の言語辞書を用いて幾つかの文字を対象にOCR処理(予備処理とも称する)が施され、当該予備処理において、最も認識率が高い言語辞書に対応する言語が、当該原稿の言語(「原稿言語」とも称する)であるとして特定されている。なお、ステップS14では、このような予備処理で特定された言語の言語辞書を用いることによって、当該予備処理後の文字認識処理(本処理)も実行されている。
Here, in step S14 described above, the language used for the OCR processing has already been specified. Specifically, OCR processing (also referred to as preliminary processing) is performed on some characters using a plurality of language dictionaries built in the
このようにしてステップS14で予めMFP1が自動的に特定した言語を、次述するような確認操作を行うことなく、そのまま原稿言語として自動的に確定するようにしてもよい。
In this way, the language automatically specified in advance by the
ただし、ここでは、原稿言語をより正確に判定するため、ステップS31において、図8のような確認画面(設定画面)G13を用いて「原稿言語」に関する確認操作を実行する。 However, here, in order to determine the document language more accurately, in step S31, a confirmation operation related to “document language” is executed using a confirmation screen (setting screen) G13 as shown in FIG.
図8においては、ステップS14で特定された言語を先頭(リスト最上段)に配置して幾つかの選択肢が表示されている。操作者は、このような確認画面を用いて、原稿言語を確定することができる。仮に、MFP1によって特定された言語と、本来の原稿言語とが相違する場合には、本来の原稿言語(言語種類)を操作者が特定して入力することができる。詳細には、画面G13の選択リスト欄41に表示される言語の中から、本来の言語(例えば中国語)を選択して、「決定」ボタン47を押下すればよい。また、画面G13においては、上方向へのスクロールボタン45および下方向へのスクロールボタン46を用いたスクロール操作によって、さらに別の選択肢を選択リスト欄に表示させることも可能である。また「戻る」ボタン48を押下すれば、1つ前の画面に戻ることが可能である。
In FIG. 8, the language identified in step S14 is arranged at the top (top of the list), and several options are displayed. The operator can determine the document language using such a confirmation screen. If the language specified by the
このような確定操作によれば、ステップS14での特定処理では正確に特定できなかった言語を原稿言語として確定することも可能である。 According to such a confirmation operation, it is also possible to confirm the language that could not be accurately specified by the specifying process in step S14 as the document language.
なお、図8の選択リスト欄41に表示される選択肢としては、MFP1に内蔵された言語辞書に対応する言語が例示されるが、これに限定されない。例えば、当該内蔵辞書に対応する言語だけでなく、その言語辞書がMFP1に内蔵されていない言語(非内蔵言語とも称する)をも、選択リスト欄に表示するようにしてもよい。この場合、委託先データ8として、当該非内蔵言語に対応可能な事業者に関するデータが備えられていれば、後述のステップS33において、当該非内蔵言語に対応する事業者を抽出することが可能である。
Note that examples of options displayed in the
また、ステップS32においては、原稿内における機密情報の有無が判定される。具体的には、機密情報を含む旨のデータが原稿画像に格納されている場合には、機密情報がその原稿に存在すると判定される。 In step S32, the presence / absence of confidential information in the document is determined. Specifically, when data indicating that confidential information is included is stored in the document image, it is determined that the confidential information exists in the document.
次のステップS33においては、要求レベル等に応じた委託先の候補が抽出される。 In the next step S33, candidates for consignment according to the request level and the like are extracted.
具体的には、委託先データ8に格納された複数の事業者の中から、高レベルの仕上げ精度に対応可能な事業者が抽出される。具体的には、原稿画像に含まれる文字を人手での入力作業を伴って入力する事業者が委託先の候補としてまず抽出される。 Specifically, from a plurality of business operators stored in the consignee data 8, business operators that can handle a high level of finishing accuracy are extracted. Specifically, a business operator who inputs characters included in a document image with manual input work is first extracted as a candidate for a consignment.
また、抽出された事業者の中から、「原稿言語」に対応可能な事業者がさらに抽出される。例えば、原稿言語が日本語である場合には、「日本語」に対応可能な事業者が抽出される。 Further, from the extracted business operators, business operators that can handle the “document language” are further extracted. For example, when the document language is Japanese, a business operator that can handle “Japanese” is extracted.
さらに、抽出された事業者の中から、原稿における「機密情報」の有無に応じた事業者が抽出される。 Further, from the extracted business operators, business operators corresponding to the presence or absence of “confidential information” in the manuscript are extracted.
例えば、「機密情報」が原稿に存在する場合には、自社等(MFP1が設置された会社等)との間に秘密保持契約(NDA:Non-Disclosure Agreement)を既に締結した事業者がさらに抽出される。
For example, if “confidential information” is present in the manuscript, companies that have already signed a non-disclosure agreement (NDA) with their own company (such as the company where
なお、「機密情報」が原稿に存在しない場合には、秘密保持契約の締結の有無にかかわらず、他の条件を満たす事業者が抽出される。 When “confidential information” does not exist in the manuscript, a business that satisfies other conditions is extracted regardless of whether or not a confidentiality agreement is concluded.
以上のようにして、要求レベルと、原稿言語の種類と、原稿における機密情報の有無とに応じて、委託先の候補が抽出される。 As described above, candidates for entrustment are extracted according to the request level, the type of document language, and the presence or absence of confidential information in the document.
MFP1は、このようにして委託先の候補を抽出すると、事業者ごとの単価を考慮してソート処理を施し(ステップS34)、委託先決定用の画面G14(図9)を操作パネル63に表示する(ステップS35)。
When the
図9に示すように、画面G14の候補表示欄42には、ステップS33で抽出された複数の事業者(C1,C2,...)が、委託先候補のリスト(委託先リストとも称する)として列挙される。これら複数の事業者は、上記のソート処理によってその見積金額順(昇順)に並べ換えられて表示されている。なお、この見積金額は、1頁ごとの単価を表示するものであってもよく、あるいは、全ページに対する合計額を表示するものであってもよい。あるいは、誤認識文字の文字数に応じた金額として算出されるものであってもよい。
As shown in FIG. 9, in the
そして、操作者は、図9の委託先リストに表示される事業者(委託先の候補)の中から、所望の事業者(委託先)を選択する選択操作を実行する。例えば、会社(事業者)C1を選択する場合には、操作パネル63において「会社C1」と表示される部分を押下した後に「委託ボタン」49を押下すればよい。
Then, the operator executes a selection operation for selecting a desired operator (consignee) from the operators (candidate candidates) displayed in the consignee list of FIG. For example, when selecting the company (business operator) C1, the “consignment button” 49 may be pressed after pressing the portion displayed as “company C1” on the
MFP1は、委託ボタン49が押下されたことをステップS36で確認すると、選択された事業者を最終的な「委託先」として確定する。すなわち、MFP1は、操作者による選択操作に応じて委託先を決定する。
When the
そして、ステップS37においては、原稿画像に含まれる文字情報の電子化処理を委託する「委託指示」が、確定された「委託先」に送信される。具体的には、電子メールを用いた委託指示が、当該委託先に送信される。より詳細には、当該委託に関する所定の内容(委託指示内容)がその本文に記載されるとともに、その添付ファイルとして原稿画像データが添付された電子メールが、委託先のメールアドレス宛に自動的に送信される。この際、原稿画像データが委託指示とともに送信されるので、原稿画像を別途送信する必要がない。なお、委託先のメールアドレスとしては、委託先データ8内に当該委託先に対応づけて登録されているメールアドレスを用いればよい。また、電子メールには、原告画像データのみならず、OCR処理によって得られた文字列をも含めるようにしてもよい。 In step S37, a “consignment instruction” for entrusting digitization processing of character information included in the document image is transmitted to the determined “consignee”. Specifically, a delegation instruction using electronic mail is transmitted to the delegation destination. More specifically, a predetermined content related to the entrustment (consignment instruction content) is described in the text, and an e-mail attached with the original image data as an attached file is automatically sent to the e-mail address of the entrustee Sent. At this time, since the document image data is transmitted together with the commission instruction, it is not necessary to transmit the document image separately. In addition, as an e-mail address of the entrustee, an e-mail address registered in association with the entrustee in the entrustee data 8 may be used. The e-mail may include not only the plaintiff image data but also a character string obtained by the OCR process.
また、ステップS40においても同様の動作が実行される。具体的には、ステップS41〜S47においては、それぞれ、対応するステップS31〜S37と同様の動作が実行される。ただし、ステップS43においては、委託先データ8に格納された複数の事業者の中から、「中」レベルの処理精度に対応可能な事業者が抽出される。具体的には、有料のWEBサービスで比較的高度な(具体的には80%以上の精度の)自動文字変換作業を提供する事業者が委託先として決定される。これによれば、中程度の要求レベルに応じられる委託先を決定することができる。また、ステップS43においても、ステップS33と同様に、「原稿言語」および「機密情報の有無」に応じた抽出処理が行われる。 The same operation is also performed in step S40. Specifically, in steps S41 to S47, operations similar to the corresponding steps S31 to S37 are executed, respectively. However, in step S43, business operators that can cope with the processing accuracy of the “medium” level are extracted from the plurality of business operators stored in the consignee data 8. Specifically, an operator that provides a relatively advanced (specifically, accuracy of 80% or more) automatic character conversion work with a paid WEB service is determined as a consignee. According to this, it is possible to determine a consignee that can meet a medium level of demand. Also in step S43, extraction processing according to “document language” and “presence / absence of confidential information” is performed as in step S33.
図10は、ステップS45における操作パネル63の表示画面G16を示す図である。図10に示すように、画面G16においては、要求レベルが「80%」である場合の委託先の候補(D1,D2,...)が列挙されている。操作者は、このような候補の中から所望の委託先を選択して、原稿画像に含まれる文字情報の文字入力作業(電子化処理)を当該委託先に委託することが可能である。
FIG. 10 is a diagram showing the display screen G16 of the
以上のような動作によれば、原稿画像に対する文字認識処理の結果が要求レベル(100%または80%)を満足していないと判定される場合に、原稿画像に含まれる文字情報の電子化処理を委託する委託指示が委託先に送信される。特に、要求レベルを操作者の操作に応じて変更することが可能であるため、委託処理を行うか否かを当該要求レベルに応じて適宜に決定することが可能である。 According to the operation as described above, when it is determined that the result of the character recognition process on the document image does not satisfy the required level (100% or 80%), the digitization processing of the character information included in the document image is performed. An entrustment instruction for entrusting is sent to the entrustee. In particular, since the request level can be changed according to the operation of the operator, it is possible to appropriately determine whether or not to perform the commissioning process according to the request level.
また、上記においては、要求レベルに応じて委託先が変更される。具体的には、要求レベルが「100%」のときには、図9の委託先の候補(C1,C2,...)の中から委託先が決定され、要求レベルが「80%」のときには、図10の委託先の候補(D1,D2,...)の中から委託先が決定される。また、委託費用は、2種類の要求レベルに応じた金額に設定されている。具体的には、要求レベルが比較的高いときには委託費用は比較的高額であり、要求レベルが比較的低いときには委託費用は比較的低額である。したがって、操作者は、要求レベルとコストとを考慮して、要求レベルに応じた委託先を適切に決定することが可能である。 Further, in the above, the consignee is changed according to the request level. Specifically, when the request level is “100%”, a consignee is determined from the candidates (C1, C2,...) Of FIG. 9, and when the request level is “80%”, Outsourcing destinations are determined from the outsourcing destination candidates (D1, D2,...) In FIG. The commission fee is set to an amount corresponding to two types of request levels. Specifically, the commission cost is relatively high when the request level is relatively high, and the commission cost is relatively low when the request level is relatively low. Therefore, the operator can appropriately determine a consignee according to the request level in consideration of the request level and the cost.
また、上記においては、原稿画像の言語にも応じて委託先の候補が抽出される。図11は、原稿言語が英語の場合における委託先決定用の画面G17を示す図である。原稿言語が日本語の場合における委託先決定用の画面G14(図9)と比較すると判るように、図1では、原稿言語の種類(英語)に応じた委託先の候補(E1,E2,...)が表示されており、当該候補の中から委託先を決定することが可能である。したがって、多種多様な原稿言語に適切に対応することが可能である。 Further, in the above, entrustee candidates are extracted according to the language of the document image. FIG. 11 is a diagram showing a consignee determination screen G17 when the document language is English. As can be seen from comparison with the screen G14 (see FIG. 9) for determining the contractor when the document language is Japanese, in FIG. 1, candidate candidates (E1, E2,. ..) is displayed, and it is possible to determine the contractor from the candidates. Therefore, it is possible to appropriately cope with a wide variety of manuscript languages.
また、上記においては、原稿画像における機密情報の有無にも応じて委託先の候補が抽出される。したがって、機密情報の管理を適切に行うことが可能である。 Further, in the above, candidates for entrustment are extracted according to the presence or absence of confidential information in the document image. Therefore, it is possible to appropriately manage confidential information.
<2.第2実施形態>
上記第1実施形態においては、OCR処理、文法チェック処理、委託先候補の抽出処理、委託先の決定処理、および委託先への委託処理等をいずれもMFP1において実行する場合を例示したが、これに限定されない。例えば、MFP1とは別の装置(例えばネットワークを介して接続された情報処理装置(サーバ等))において、OCR処理および文法チェック処理を実行するようにしてもよい。
<2. Second Embodiment>
In the first embodiment, the case where the OCR process, the grammar check process, the entrustee candidate extraction process, the entrustee determination process, the entrustee entrustment process, and the like are all executed in the
第2実施形態においては、このような変形例を例示する。以下、第1実施形態との相違点を中心に説明する。なお、この第2実施形態においても第1実施形態と同様に、原稿言語および機密情報に基づく委託先候補の抽出動作等が実行され得るが、ここでは説明の重複を防ぐため当該事項に関する説明を省略する。 In the second embodiment, such a modification is illustrated. Hereinafter, the difference from the first embodiment will be mainly described. In the second embodiment, as in the first embodiment, an operation for extracting candidate candidates based on the manuscript language and confidential information can be executed. Omitted.
図12は、第2実施形態に係る原稿電子化システム100(100B)のシステム構成を示す概略図である。原稿電子化システム100Bは、図1の原稿電子化システム100Aと比較すると、さらにサーバ80を有している点で相違する。
FIG. 12 is a schematic diagram showing a system configuration of the original digitizing system 100 (100B) according to the second embodiment. The
また、図13は、原稿電子化システム100Bにおける動作を示す概念図である。図13においては、電子化処理を伴ってスキャン動作が実行される場合が示されている。
FIG. 13 is a conceptual diagram showing an operation in the
第2実施形態のシステム100Bにおいても、全体としては、上述のMFP1で実行されていた動作と同様の動作が実行される。ただし、この第2実施形態においては、第1実施形態ではMFP1(1A)で実行していたOCR処理および文法チェック処理(ステップS14,S15)と同様の処理がサーバ80側で実行される。
In the
具体的には、MFP1(1B)は、対象原稿に対するスキャン処理(ステップS53)を実行すると、スキャン処理により得られた原稿画像と当該原稿画像に対する文字認識処理の実行指令とをサーバ80に対して送出する(ステップS54)。サーバ80は、当該MFP1Bからの実行指令および原稿画像を受信すると、当該実行指令に応答して、受信した原稿画像に対するOCR処理と文法チェック処理とを実行する(ステップS55)。そして、サーバ80は、文字認識処理により得られたデータと、文字認識処理に関する判定結果とを、MFP1Bに対して返信するとともに、認識率が100%でない場合には要求レベルの設定画面を表示するためのデータをMFP1Bに返信する(ステップS56)。
Specifically, when the MFP 1 (1B) executes the scan process (step S53) on the target document, the MFP 1 (1B) sends to the server 80 a document image obtained by the scan process and a command for executing a character recognition process on the document image. It is sent out (step S54). When
その後は、上記第1実施形態におけるステップS17以降の処理と同様の処理がMFP1Bにおいて実行される。具体的には、MFP1Bは、原稿画像に対する文字認識処理の結果に関する要求レベルを設定する処理(ステップS57)と、要求レベルの設定に応じて委託先を決定する処理(ステップS58)とを実行する。また、MFP1Bは、原稿画像に対する文字認識処理の結果が要求レベルを満足していないと判定される場合に、原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する処理(ステップS59)等をも実行する。
Thereafter, processing similar to the processing from step S17 onward in the first embodiment is executed in
このような態様によっても、第1実施形態と同様の効果を得ることが可能である。また、一部の処理をサーバ80側で実行することによって、MFP1における処理負荷を軽減することができる。
Also by such an aspect, it is possible to obtain the same effect as that of the first embodiment. Also, by executing some processing on the
<3.第3実施形態>
第3実施形態は、第2実施形態の変形例である。上記第2実施形態においては、MFP1が主な動作を実行する場合を例示したが、この第3実施形態においては、サーバ80(80C)が主な動作を実行する場合を例示する。サーバ80Cは、所定のプログラムをそのCPU等を用いて実行することによって、後述するような各種の動作を実現することができる。なお、サーバ80Cは、原稿電子化システム100Cにおいて、原稿電子化処理の主要な役割を果たしており、原稿電子化装置とも称される。
<3. Third Embodiment>
The third embodiment is a modification of the second embodiment. In the second embodiment, the case where the
図14は、第3実施形態に係る原稿電子化システム100Cにおける動作を示す概念図である。図14は、図13と同様に、電子化処理を伴ってスキャン動作が実行される場合を示している。以下、図14を参照しながら、原稿電子化システム100Cにおける動作について、第1実施形態等との相違点を中心に説明する。なお、この第3実施形態においても第1実施形態等と同様に、原稿言語および機密情報に基づく委託先候補の抽出動作等が実行され得るが、ここでは説明の重複を防ぐため当該事項に関する説明を省略する。
FIG. 14 is a conceptual diagram showing an operation in the
第3実施形態においては、サーバ80(80C)はウエブサーバとして機能する。一方、MFP1(1C)は、ブラウザソフトウエアを実行することが可能であり、ウエブサーバから送信されてきたデータを用いて、操作パネル63においてブラウザを用いて適宜の設定画面等を表示することができる。また、操作者は操作パネル63のブラウザ内に表示される各種ボタン等を用いて、各種の指示をシステム100C(特にサーバ80C)に対してネットワークNWを介して付与することが可能である。
In the third embodiment, the server 80 (80C) functions as a web server. On the other hand, the MFP 1 (1C) can execute browser software and can display an appropriate setting screen or the like using the browser on the
まず、MFP1Cがサーバ80Cに対してウエブページデータの要求コマンドを送信する(ステップS61)と、サーバ80CはMFP1Cに対してウエブページデータを返信する(ステップS62)。MFP1Cは、受信したウエブページデータに基づいて、操作パネル63に設定画面を表示する。具体的には、MFP1Cの操作パネル63において図6の画面G11と同様の設定画面が表示される。
First, when the
その後、操作者が画面G11を操作して、文字認識処理を伴うスキャン処理の開始指示を付与すると、MFP1Cはスキャン動作を実行する(ステップS63)。そして、生成されたスキャン画像(原稿画像)が、文字認識処理の実行指令とともに、MFP1Cからサーバ80Cへと送信される(ステップS64)。
Thereafter, when the operator operates the screen G11 to give an instruction to start a scanning process with a character recognition process, the
サーバ80Cは、当該MFP1Cからの実行指令および原稿画像を受信すると、当該実行指令に応答して、受信した原稿画像に対するOCR処理と文法チェック処理とを実行する(ステップS65)。そして、サーバ80Cは、文字認識処理により得られたデータと、文字認識処理に関する判定結果とを、MFP1Cに対して返信する。また、サーバ80Cは、認識率が100%でない場合には、要求レベルの設定画面を表示するためのデータをMFP1Cに返信する(ステップS66)。
When
MFP1Cは、サーバ80Cから受信したデータに基づき、図7の画面G12と同様の設定画面を操作パネル63に表示する。
The
その後、操作者が操作パネル63を操作して、所望の要求レベルを選択して入力する(ステップS67)と、当該操作入力に応答して、「要求レベル」の選択結果に関するデータがMFP1Cからサーバ80Cへと送信される(ステップS68)。
Thereafter, when the operator operates the
サーバ80Cは、MFP1Cから送信されてきたデータに基づいて、原稿画像に対する文字認識処理の結果に関する要求レベルを設定する処理(ステップS69)を実行する。
Based on the data transmitted from
そして、サーバ80Cは、原稿画像に対する文字認識処理の結果が要求レベルを満足しているか否かを判定する。
Then, the
要求レベルが満たされていると判定される場合には、ステップS70以降の処理は実行されず、図14の処理は終了する。 If it is determined that the required level is satisfied, the processing after step S70 is not executed, and the processing in FIG. 14 ends.
一方、原稿画像に対する文字認識処理の結果が要求レベルを満足していないと判定される場合には、次述するような動作が実行される。 On the other hand, when it is determined that the result of the character recognition process for the document image does not satisfy the required level, the following operation is executed.
まず、サーバ80Cは、要求レベルの設定に応じて委託先の候補を抽出する処理(ステップS70)を実行し、抽出結果に関するデータをMFP1Cに送信する(ステップS71)。
First, the
MFP1Cは、サーバ80Cから受信したデータに基づき、図9の画面G14等と同様の設定画面を操作パネル63に表示する。
Based on the data received from
その後、操作者が操作パネル63を操作して、所望の委託先を複数の候補の中から選択して入力する(ステップS72)と、当該選択操作入力に応答して、「委託先」の選択結果に関するデータがMFP1Cからサーバ80Cへと送信される(ステップS73)。
After that, when the operator operates the
サーバ80Cは、MFP1Cから送信されてきたデータに基づいて、委託先を決定する処理(ステップS74)を実行する。
The
そして、サーバ80Cは、原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する処理(ステップS75)をも実行する。
Then, the
以上のような態様によっても、第1実施形態および第2実施形態と同様の効果を得ることが可能である。また、各種の処理をMFP1Cとサーバ80Cとで分散して実行することによって、MFP1およびサーバ80Cのそれぞれにおける処理負荷を軽減することができる。
The same effects as those of the first embodiment and the second embodiment can also be obtained by the above-described aspects. Further, by executing various processes in a distributed manner between the
なお、第3実施形態においては、ステップS65で文字認識処理の結果を求めた後、当該文字認識処理の結果が「100%」を満足していないと判定される場合にのみ、要求レベルの設定処理等(ステップS66〜S69)を行う場合を例示している。ただし、これに限定されず、文字認識処理の結果を求める前、例えばスキャン開始前(ステップS62等)において、「要求レベル」を含む各種項目に関する設定画面G12を用いて、ステップS66〜S69と同様の処理を予め行うようにしてもよい。 In the third embodiment, the request level is set only when it is determined that the result of the character recognition process does not satisfy “100%” after the result of the character recognition process is obtained in step S65. The case where processing etc. (steps S66-S69) are performed is illustrated. However, the present invention is not limited to this, and before obtaining the result of the character recognition process, for example, before the start of scanning (step S62 and the like), using the setting screen G12 related to various items including “request level”, the same as steps S66 to S69 These processes may be performed in advance.
<4.変形例>
以上、この発明の実施の形態について説明したが、この発明は上記説明した内容のものに限定されるものではない。
<4. Modification>
Although the embodiments of the present invention have been described above, the present invention is not limited to the contents described above.
たとえば、上記第3実施形態においては、MFP1Cは、サーバ80Cからのデータを受信した後は自律的に動作する態様を例示したが、これに限定されず、サーバ80Cからのデータを受信した後、サーバ80CがMFP1CをコントロールしてMFP1Cを動作させるようにしてもよい。例えば、サーバ80CがMFP1CのAPI(Application Program Interface)を利用して、MFP1Cの動作を制御することが可能である。
For example, in the third embodiment, the
また、上記各実施形態においては、要求レベルの判定要素として、文法チェック後の文字認識率Rrを用いる場合を例示したが、これに限定されず、例えば、文字単位での認識率Rcを用いるようにしてもよい。 In each of the above embodiments, the case where the character recognition rate Rr after the grammar check is used as the determination element for the required level is exemplified. However, the present invention is not limited to this. For example, the recognition rate Rc in character units is used. It may be.
また、上記各実施形態においては、文法チェック処理を認識率の再判定処理に用いる場合を例示したが、これに限定されない。例えば、文法チェック処理の結果を反映させた文字修正処理をさらに実行するようにしてもよい。この場合には、文法チェック後の文字認識率Rrが文字単位での認識率Rcよりも低くなる場合だけでなく、文法チェック処理結果を反映した文字修正処理後の文字認識率Rrが値Rcよりも大きくなる場合も想定される。 In each of the above embodiments, the case where the grammar check process is used for the recognition rate redetermination process is illustrated, but the present invention is not limited to this. For example, a character correction process reflecting the result of the grammar check process may be further executed. In this case, not only the character recognition rate Rr after the grammar check is lower than the recognition rate Rc in character units, but also the character recognition rate Rr after the character correction process reflecting the result of the grammar check process is based on the value Rc. Is also assumed to be large.
また、上記各実施形態においては、「要求レベル」が2つの段階のいずれかに設定され得る場合を例示したが、これに限定されない。例えば、「要求レベル」は、さらに多数の段階のいずれかに設定され得るものであってもよい。 Further, in each of the above embodiments, the case where the “required level” can be set to one of the two stages is exemplified, but the present invention is not limited to this. For example, the “request level” may be set to any one of a number of stages.
また、上記各実施形態においては、機密情報の有無に応じて事業者を抽出する場合を例示したが、これに限定されず、機密情報のレベルに応じて事業者を抽出するようにしてもよい。 Further, in each of the above embodiments, the case where the business operator is extracted according to the presence / absence of the confidential information is exemplified, but the present invention is not limited to this, and the business operator may be extracted according to the level of the confidential information. .
たとえば、機密情報のレベルが「高」、「中」、「低」の3段階に分類される場合を想定する。また、各事業者がその事業の信頼度等を考慮して、少なくとも所定の基準を満たしている「基準レベル事業者」と、さらに厳しい基準をも満たしている比較的優良な事業者である「優良事業者」とに区分された状態で、事業者のリストが格納されているものとする。 For example, it is assumed that the level of confidential information is classified into three levels: “high”, “medium”, and “low”. In addition, considering the reliability of the business, each business operator is a “standard-level business operator” that meets at least the prescribed standards, and a relatively good business operator that meets even more stringent standards. Assume that a list of business operators is stored in a state of being classified as “excellent business operators”.
この場合において、機密情報のレベルが「中」レベルであるときには、「上位レベル事業者」が抽出され、「低」レベルであるときには、「基準レベル事業者」が抽出されるようにすることができる。このように、原稿画像における機密情報の機密レベルに応じて委託先の候補を抽出することによれば、機密情報の管理をより適切に行うことが可能である。 In this case, when the level of confidential information is “medium” level, “higher level operator” is extracted, and when it is “low” level, “reference level operator” is extracted. it can. As described above, by extracting the candidates for the entrustee in accordance with the confidential level of the confidential information in the document image, it is possible to more appropriately manage the confidential information.
また、機密情報のレベルが比較的高位であるとき(例えば最高位の「高」レベルであるとき)には、外部委託を禁止するようにしてもよい。換言すれば、文字認識処理の結果が要求レベルを満足していないと判定される場合であっても、原稿画像における機密情報の機密レベルが「高」レベル以上であるときには、原稿画像に関する委託指示を送信しないようにしてもよい。これによれば、「高」レベルの機密情報が社外へ流出することを回避できる。 Further, when the level of confidential information is relatively high (for example, when it is the highest “high” level), outsourcing may be prohibited. In other words, even if it is determined that the result of the character recognition process does not satisfy the required level, if the confidential level of the confidential information in the original image is equal to or higher than the “high” level, the consignment instruction regarding the original image May not be transmitted. According to this, it is possible to avoid leakage of “high” level confidential information outside the company.
また、上記各実施形態においては、原稿電子化システムにおける原稿電子化装置として、MFP1およびサーバ80を例示したが、これに限定されず、スキャナ装置などのその他の装置であってもよい。
In each of the above embodiments, the
1,1A,1B,1C マルチ・ファンクション・ペリフェラル(MFP)
100,100A,100B,100C 原稿電子化システム
22 スキャンボタン
25 スタートボタン
31,32,35,36,37 選択ボタン
42 候補表示欄
63 操作パネル
80,80B,80C サーバ
90,90a,90b,90c,90d コンピュータ(委託先)
NW 通信ネットワーク
1,1A, 1B, 1C Multi-function peripheral (MFP)
100, 100A, 100B, 100C
NW communication network
Claims (9)
前記原稿画像に対する文字認識処理の結果に関する要求レベルを変更することが可能な設定手段と、
前記原稿画像に対する前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合に、前記原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する委託動作制御手段と、
を備えることを特徴とする原稿電子化システム。 A document digitizing system that digitizes character information contained in a document image,
Setting means capable of changing a request level relating to a result of character recognition processing on the document image;
A consignment for sending a consignment instruction for consigning digitization processing of character information included in the document image to a consignee when it is determined that the result of the character recognition process for the document image does not satisfy the required level An operation control means;
An electronic document system comprising:
前記要求レベルに応じて前記委託先の候補を抽出する抽出手段と、
当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段と、
をさらに備えることを特徴とする原稿電子化システム。 The electronic document system according to claim 1,
Extraction means for extracting candidates for the entrustee according to the request level;
Determining means for determining the entrustee in accordance with a selection operation for selecting the entrustee from the candidates;
An electronic document system, further comprising:
前記原稿画像の言語に応じて前記委託先の候補を抽出する抽出手段と、
当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段と、
をさらに備えることを特徴とする原稿電子化システム。 The electronic document system according to claim 1,
Extraction means for extracting candidates for the consignee according to the language of the document image;
Determining means for determining the entrustee in accordance with a selection operation for selecting the entrustee from the candidates;
An electronic document system, further comprising:
前記原稿画像における機密情報の有無に応じて前記委託先の候補を抽出する抽出手段と、
当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段と、
をさらに備えることを特徴とする原稿電子化システム。 The electronic document system according to claim 1,
Extraction means for extracting candidates for the entrustee in accordance with the presence or absence of confidential information in the document image;
Determining means for determining the entrustee in accordance with a selection operation for selecting the entrustee from the candidates;
An electronic document system, further comprising:
前記原稿画像における機密情報の機密レベルに応じて前記委託先の候補を抽出する抽出手段と、
当該候補の中から前記委託先を選択する選択操作に応じて前記委託先を決定する決定手段と、
をさらに備えることを特徴とする原稿電子化システム。 The electronic document system according to claim 1,
Extraction means for extracting candidates for the entrustee in accordance with a confidential level of confidential information in the document image;
Determining means for determining the entrustee in accordance with a selection operation for selecting the entrustee from the candidates;
An electronic document system, further comprising:
前記委託動作制御手段は、前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合であっても、前記原稿画像における機密情報の機密レベルが所定レベル以上であるときには、前記原稿画像に関する前記委託指示を送信しないことを特徴とする原稿電子化システム。 The electronic document system according to claim 1,
Even when it is determined that the result of the character recognition processing does not satisfy the required level, the consignment operation control means, when the confidential level of confidential information in the document image is a predetermined level or higher, A document digitization system, characterized in that the consignment instruction relating to a document image is not transmitted.
前記委託先は、前記要求レベルに応じて変更されることを特徴とする原稿電子化システム。 The electronic document system according to claim 1,
The document digitization system, wherein the consignee is changed according to the required level.
前記委託動作制御手段は、前記委託先に対して前記委託指示とともに前記原稿画像を送信することを特徴とする原稿電子化システム。 The electronic document system according to claim 1,
The electronic document system according to claim 1, wherein the consignment operation control means transmits the original image together with the consignment instruction to the consignee.
a)原稿画像に対する文字認識処理の結果に関する要求レベルを設定する手順と、
b)前記原稿画像に対する前記文字認識処理の結果が前記要求レベルを満足していないと判定される場合に、前記原稿画像に含まれる文字情報の電子化処理を委託する委託指示を委託先に送信する手順と、
を実行させるためのプログラム。 On the computer,
a) a procedure for setting a required level for the result of character recognition processing on a document image;
b) When it is determined that the result of the character recognition processing for the document image does not satisfy the required level, a consignment instruction for consigning digitization processing of character information included in the document image is transmitted to the consignee And the steps to
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007122967A JP2008282062A (en) | 2007-05-08 | 2007-05-08 | Document digitization system and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007122967A JP2008282062A (en) | 2007-05-08 | 2007-05-08 | Document digitization system and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008282062A true JP2008282062A (en) | 2008-11-20 |
Family
ID=40142851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007122967A Withdrawn JP2008282062A (en) | 2007-05-08 | 2007-05-08 | Document digitization system and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008282062A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011065390A (en) * | 2009-09-16 | 2011-03-31 | Konica Minolta Business Technologies Inc | Program for function simulation of image processing apparatus, information processing apparatus, and recording medium |
JP2020046952A (en) * | 2018-09-19 | 2020-03-26 | 富士ゼロックス株式会社 | Information processing device and information processing program |
-
2007
- 2007-05-08 JP JP2007122967A patent/JP2008282062A/en not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011065390A (en) * | 2009-09-16 | 2011-03-31 | Konica Minolta Business Technologies Inc | Program for function simulation of image processing apparatus, information processing apparatus, and recording medium |
CN102025873A (en) * | 2009-09-16 | 2011-04-20 | 柯尼卡美能达商用科技株式会社 | Information processing apparatus and function simulation method of the same |
US8368909B2 (en) | 2009-09-16 | 2013-02-05 | Konica Minolta Business Technologies, Inc. | Recording medium, information processing apparatus and function simulation method of image processing apparatus |
JP2020046952A (en) * | 2018-09-19 | 2020-03-26 | 富士ゼロックス株式会社 | Information processing device and information processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6891073B2 (en) | A device for setting a file name, etc. on a scanned image, its control method, and a program. | |
US11616884B2 (en) | Image processing system for computerizing document, control method thereof, and storage medium | |
US11842534B2 (en) | Information processing apparatus for obtaining character string | |
US11652932B2 (en) | Image processing apparatus for setting a folder path by using a character string in a document | |
US20240073330A1 (en) | Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium | |
US20220201146A1 (en) | Information processing apparatus, information processing system, control method of the same, and storage medium | |
US11252287B2 (en) | Image processing apparatus that displays guidance for user operation, control method thereof and storage medium | |
US11265431B2 (en) | Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium | |
US11647139B2 (en) | Image processing apparatus, image processing system, control method thereof, and storage medium | |
US11765292B2 (en) | Information processing apparatus used for converting image to file, image processing system, method of controlling information processing apparatus, and storage medium | |
US11393234B2 (en) | Image processing system for computerizing document, control method thereof, and storage medium | |
US11575799B2 (en) | Image processing apparatus for setting property including character strings and separators to scanned image, control method thereof and storage medium | |
US20230156138A1 (en) | Information processing apparatus, method of controlling information processing apparatus, and storage medium | |
US11800032B2 (en) | Apparatus, information processing method, and storage medium | |
US11620840B2 (en) | Image processing apparatus for extracting a desired character string from a scanned image | |
JP2008282062A (en) | Document digitization system and program | |
JP2020178301A (en) | Information processing device, control method of the same, and program | |
JP2021164132A (en) | Image processing system and program | |
JP2017004455A (en) | Image processing apparatus, image processing system, image processing method, and program | |
US20220343664A1 (en) | Image processing apparatus, image processing method, and recording medium | |
JP2024034740A (en) | Image processing apparatus, image processing system, image processing method, and program | |
JP2023019008A (en) | Information processing system, communication system, and information processing method | |
JP2024040612A (en) | Information processing device, method for controlling information processing device, and program | |
JP2023128455A (en) | Image processing apparatus, image processing method, and program | |
JP2024032563A (en) | Information processing apparatus, control method of information processing apparatus, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20100803 |