JP6981137B2 - Information processing equipment, image processing systems, image processing methods, and programs - Google Patents

Information processing equipment, image processing systems, image processing methods, and programs Download PDF

Info

Publication number
JP6981137B2
JP6981137B2 JP2017182890A JP2017182890A JP6981137B2 JP 6981137 B2 JP6981137 B2 JP 6981137B2 JP 2017182890 A JP2017182890 A JP 2017182890A JP 2017182890 A JP2017182890 A JP 2017182890A JP 6981137 B2 JP6981137 B2 JP 6981137B2
Authority
JP
Japan
Prior art keywords
image
forming apparatus
image forming
ocr
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017182890A
Other languages
Japanese (ja)
Other versions
JP2019061295A (en
Inventor
修二 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2017182890A priority Critical patent/JP6981137B2/en
Publication of JP2019061295A publication Critical patent/JP2019061295A/en
Application granted granted Critical
Publication of JP6981137B2 publication Critical patent/JP6981137B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、情報処理装置、画像処理システム、画像処理方法、およびプログラムに関する。 The present invention relates to an information processing apparatus, an image processing system, an image processing method, and a program.

MFP(Multifunction Peripheral/Printer/Product)などの画像処理装置において、スキャナによって読み取られた原稿の画像を文字に変換する光学文字認識(OCR: Optical Character Recognition)機能が実装されている。 An image processing device such as an MFP (Multifunction Peripheral / Printer / Product) is equipped with an optical character recognition (OCR) function that converts an image of a document read by a scanner into characters.

特許文献1には、画像情報を読み取る読み取り装置と、読み取られた画像情報のページ領域内文頭領域を記憶する記憶手段と、記憶された画像情報の文字方向を認識する文字方向認識手段と、認識された文字方向データに基づき画像情報の画像方向を認識する画像方向認識手段とを備えた文字方向データに基づく画像方向認識装置が開示されている。 Patent Document 1 describes a reading device for reading image information, a storage means for storing the beginning area of the page area of the read image information, and a character direction recognition means for recognizing the character direction of the stored image information. An image direction recognition device based on character direction data including an image direction recognition means for recognizing an image direction of image information based on the character direction data is disclosed.

特許文献2には、異なる角度から配達物の上面、4つの側面を撮影するスキャナが設置されており、スキャナが撮影した撮影画像から、配達先情報をOCRにより認識する配達物区分処理システムが開示されている。 Patent Document 2 discloses a delivery classification processing system that recognizes delivery destination information by OCR from the captured images taken by the scanner, in which scanners that capture the upper surface and four sides of the delivery from different angles are installed. Has been done.

しかし、特許文献1に開示された方法を用いて画像の方向を識別する場合、画像と複数の文字方向データとの照合のため処理に時間を要するという課題がある。特許文献2に開示された方法よると、画像の向きを考慮せずにOCR処理を実行するので、画像に記録された文字の向きによっては、OCR処理の判定精度が低くなるという課題がある。
However, when the direction of an image is identified by using the method disclosed in Patent Document 1, there is a problem that it takes time for processing to collate the image with a plurality of character direction data. According to the method disclosed in Patent Document 2, since executes an OCR process without considering the orientation of the image, depending on the orientation of the character recorded in the image, there is a problem that the determination accuracy of the OCR process is low ..

請求項1に係る発明の情報処理装置は、原稿の画像に対し、四方向のうちのそれぞれ異なる方向から文字認識するための要求を、それぞれ異なる画像処理装置へ送信する送信手段と、前記要求に基づいて、前記四方向のうちのそれぞれ異なる方向から文字認識された結果を示す各結果情報を受信する受信手段と、前記受信手段によって受信された各結果情報のうち、文字への変換率が最も大きい結果情報に基づいて文字認識の結果を出力する出力手段と、を有する。 The information processing apparatus of the invention according to claim 1 is a transmission means for transmitting a request for character recognition from each of the four directions to a different image processing device for an image of a manuscript, and the request. Based on this, the receiving means for receiving each result information indicating the result of character recognition from each of the four directions and the result information received by the receiving means have the highest conversion rate to characters. It has an output means for outputting a character recognition result based on a large result information.

本発明によると、OCR処理の結果を、短時間で精度よく出力できるという効果を奏する。 According to the present invention, there is an effect that the result of OCR processing can be output accurately in a short time.

一実施形態に係る通信システムの全体構成図である。It is an overall block diagram of the communication system which concerns on one Embodiment. 一実施形態に係るサーバ装置のハードウェア構成図である。It is a hardware block diagram of the server apparatus which concerns on one Embodiment. 一実施形態に係る画像形成装置のハードウェア構成図である。It is a hardware block diagram of the image forming apparatus which concerns on one Embodiment. 一実施形態に係る画像形成装置およびサーバ装置の機能ブロック図である。It is a functional block diagram of the image forming apparatus and the server apparatus which concerns on one Embodiment. OCR処理の分担先を登録する処理の一例を示すフロー図である。It is a flow diagram which shows an example of the process of registering the sharing destination of the OCR process. 分担先登録画面の一例を示す。An example of the sharing destination registration screen is shown. 文書の画像の一例を示す概念図である。It is a conceptual diagram which shows an example of the image of a document. OCR処理の一例を示すシーケンス図である。It is a sequence diagram which shows an example of OCR processing. 実施形態の変形例AにおけるOCR処理を示すシーケンス図である。It is a sequence diagram which shows the OCR processing in the modification A of embodiment. ダイアログの表示例である。This is a display example of a dialog. 実施形態の変形例Cにおける2ページ目以降の画像のOCR処理を示すシーケンス図である。It is a sequence diagram which shows the OCR processing of the image after the 2nd page in the modification C of embodiment. 実施形態の変形例Dにおける2ページ目以降の画像のOCR処理を示すシーケンス図である。It is a sequence diagram which shows the OCR processing of the image after the 2nd page in the modification D of embodiment.

以下、図面を用いて、本発明の実施形態について説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.

<<通信システム>>
図1は、一実施形態に係る通信システムの全体構成図である。図1に示されているように、通信システム1は、画像形成装置20A,20B、およびサーバ装置50A,50Bによって構築されている。画像形成装置20A,20Bのうち任意のものを画像形成装置20と表す。サーバ装置50A,50Bのうち任意のものをサーバ装置50と表す。
<< Communication system >>
FIG. 1 is an overall configuration diagram of a communication system according to an embodiment. As shown in FIG. 1, the communication system 1 is constructed by the image forming devices 20A and 20B and the server devices 50A and 50B. Any of the image forming apparatus 20A and 20B is referred to as an image forming apparatus 20. Any of the server devices 50A and 50B is referred to as the server device 50.

通信システム1において、画像形成装置20およびサーバ装置50の数は、それぞれ2台に限定されない。原稿に対し上下左右の4方向から同時に光学文字認識(OCR: Optical Character Recognition)処理を実行して、原稿の向きを特定するため、画像形成装置20およびサーバ装置50の総数は、4台以上が好ましい。以下、原稿が文書である場合について説明する。ただし、原稿は、文字を含む画像であれば特に限定されず、例えば、図面であってもよい。文字には、OCR処理により認識可能な数字、記号、およびアイコンなども含まれる。 In the communication system 1, the number of the image forming apparatus 20 and the server apparatus 50 is not limited to two, respectively. In order to identify the orientation of the document by simultaneously executing optical character recognition (OCR) processing on the document from four directions, up, down, left, and right, the total number of image forming devices 20 and server devices 50 is four or more. preferable. Hereinafter, the case where the manuscript is a document will be described. However, the manuscript is not particularly limited as long as it is an image including characters, and may be, for example, a drawing. Characters also include numbers, symbols, icons, etc. that can be recognized by OCR processing.

画像形成装置20は、例えば、MFP(Multifunction Peripheral/Printer/Product)、ファクシミリ、スキャナ、あるいはプリンタなどの画像処理機能、通信機能、およびOCR結果の出力機能を有する情報処理装置である。画像形成装置20は、OCR処理の結果(以下、OCR結果と表す)を表示画像として出力してもよいし、データとして出力してもよい。上記のスキャナは、クラウドサーバとの通信、または通信端末との通信、もしくは、外部ストレージへの書き込みにより、OCR結果をデータとして出力するハンディスキャナであってもよい。OCR結果をデータとして出力する場合、データの形式は特に限定されない。画像形成装置20は、OCR結果を、例えば、テキストデータとして出力してもよいし、PDFファイルに埋め込んで出力してもよい。以下、画像形成装置20がMFPである場合について説明する。 The image forming apparatus 20 is an information processing apparatus having, for example, an image processing function such as an MFP (Multifunction Peripheral / Printer / Product), a facsimile, a scanner, or a printer, a communication function, and an OCR result output function. The image forming apparatus 20 may output the result of the OCR processing (hereinafter referred to as an OCR result) as a display image or may output it as data. The above scanner may be a handy scanner that outputs an OCR result as data by communicating with a cloud server, communicating with a communication terminal, or writing to an external storage. When the OCR result is output as data, the format of the data is not particularly limited. The image forming apparatus 20 may output the OCR result as, for example, text data, or may embed it in a PDF file and output it. Hereinafter, a case where the image forming apparatus 20 is an MFP will be described.

画像形成装置20は、文書の画像を文字コードに変換するOCRモジュールを搭載している。ただし、OCRモジュールがオプションの機能である場合、画像形成装置20のいずれかは、OCRモジュールを搭載していない、またはOCRモジュールを搭載していても利用できない状態であってもよい。画像形成装置20は、指定された文書の画像に対し、OCR処理を要求するアプリケーションを実装している。以後、「アプリケーション」を、「アプリ」と表す。さらに、画像形成装置20は、アプリからの要求に基づいて、OCR処理を実行するサーバ機能を有する。 The image forming apparatus 20 is equipped with an OCR module that converts an image of a document into a character code. However, when the OCR module is an optional function, any of the image forming apparatus 20 may not be equipped with the OCR module, or may be in a state in which the OCR module is mounted but cannot be used. The image forming apparatus 20 implements an application that requires OCR processing for an image of a designated document. Hereinafter, the "application" will be referred to as an "app". Further, the image forming apparatus 20 has a server function for executing OCR processing based on a request from the application.

サーバ装置50は、画像処理機能および通信機能を有する情報処理装置である。サーバ装置50は、文書の画像を文字コードに変換するOCRモジュールを搭載している。サーバ装置50は、アプリからの要求に基づいて、OCR処理を実行するサーバ機能を有する。 The server device 50 is an information processing device having an image processing function and a communication function. The server device 50 is equipped with an OCR module that converts a document image into a character code. The server device 50 has a server function that executes OCR processing based on a request from the application.

画像形成装置20およびサーバ装置50Aは、LAN2L(Local Area Network)に接続している。画像形成装置20は、LAN2Lからインターネット2Iに接続し、インターネット2I上のクラウドサーバとしてのサーバ装置50Bに接続する。LAN2Lおよびインターネット2Iのうち任意のものを通信ネットワーク2と表す。通信ネットワーク2の全部又は一部には、Wi−Fi(Wireless Fidelity)などの無線による通信が行われる箇所があってもよい。 The image forming apparatus 20 and the server apparatus 50A are connected to a LAN 2L (Local Area Network). The image forming apparatus 20 connects to the Internet 2I from the LAN 2L and connects to the server apparatus 50B as a cloud server on the Internet 2I. Any of LAN 2L and Internet 2I is referred to as communication network 2. All or part of the communication network 2 may have a place where wireless communication such as Wi-Fi (Wireless Fidelity) is performed.

<<ハードウェア構成>>
図2は、一実施形態に係るサーバ装置のハードウェア構成図である。図2を用いて、サーバ装置50のハードウェア構成について説明する。
<< Hardware configuration >>
FIG. 2 is a hardware configuration diagram of the server device according to the embodiment. The hardware configuration of the server device 50 will be described with reference to FIG.

サーバ装置50は、CPU101(Central Processing Unit)と、ROM102(Read Only Memory)と、RAM103(Random Access Memory)と、HDD104(Solid State Drive)と、メディアI/F105(Interface)と、ネットワークI/F106と、操作部108と、バスライン110と、を有する。 The server device 50 includes a CPU 101 (Central Processing Unit), a ROM 102 (Read Only Memory), a RAM 103 (Random Access Memory), an HDD 104 (Solid State Drive), a media I / F105 (Interface), and a network I / F106. And an operation unit 108, and a bus line 110.

CPU101は、サーバ装置50全体の動作を制御する。ROM102は、サーバ装置50上で動作するOS(Operating System)、アプリ、SDK(Software Development Kit)、あるいはAPI(Application Programming Interface)などの各種プログラムを記憶する。RAM103は、CPU101のワークエリアとして使用される。HDD104(Hard Disk Drive)は、各種プログラムで利用されるデータを記憶する。データには、OCR処理中のデータ、OCR結果のデータも含まれる。HDD104は、SSD(Solid State Drive)などの不揮発性のストレージに置き換え可能である。メディアI/F105は、外部メモリなどの記録メディア106に記憶されている情報を読み出したり、記録メディア106に情報を書き込んだりするためのインタフェースである。ネットワークI/F106は、例えば、Ethernet(登録商標)またはWi-Fiにより通信ネットワーク2を介して他の装置と通信するための通信手段である。操作部108は、ユーザによる操作入力を受け付けるためのインタフェースである。操作部108は、例えば、タッチパネル機能を搭載した液晶表示装置または有機EL(Electro Luminescence)表示装置、もしくはキーボードおよびマウスである。バスライン110は、上記各構成要素を図2に示されているように電気的に接続するためのアドレスバスまたはデータバスである。 The CPU 101 controls the operation of the entire server device 50. The ROM 102 stores various programs such as an OS (Operating System), an application, an SDK (Software Development Kit), and an API (Application Programming Interface) that operate on the server device 50. The RAM 103 is used as a work area of the CPU 101. The HDD 104 (Hard Disk Drive) stores data used in various programs. The data also includes data during OCR processing and data of OCR results. The HDD 104 can be replaced with a non-volatile storage such as an SSD (Solid State Drive). The media I / F 105 is an interface for reading information stored in a recording medium 106 such as an external memory and writing information to the recording medium 106. The network I / F 106 is a communication means for communicating with another device via the communication network 2 by, for example, Ethernet (registered trademark) or Wi-Fi. The operation unit 108 is an interface for receiving an operation input by the user. The operation unit 108 is, for example, a liquid crystal display device or an organic EL (Electro Luminescence) display device equipped with a touch panel function, or a keyboard and a mouse. The bus line 110 is an address bus or a data bus for electrically connecting each of the above components as shown in FIG.

図3は、一実施形態に係る画像形成装置20のハードウェア構成図である。図3を用いて、画像形成装置20のハードウェア構成について説明する。 FIG. 3 is a hardware configuration diagram of the image forming apparatus 20 according to the embodiment. The hardware configuration of the image forming apparatus 20 will be described with reference to FIG.

画像形成装置20のコントローラ200は、CPU201と、ROM202と、RAM203と、NVRAM204(Non-volatile RAM)と、HDD205と、ネットワークI/F206と、エンジンI/F207と、パネルI/F208と、スキャナI/F209と、メディアI/F215と、バスライン210と、を有する。また、画像形成装置20は、プロッタエンジン211と、操作部212と、スキャナエンジン213と、を有する。 The controller 200 of the image forming apparatus 20 includes a CPU 201, a ROM 202, a RAM 203, an NVRAM 204 (Non-volatile RAM), an HDD 205, a network I / F206, an engine I / F207, a panel I / F208, and a scanner I. It has / F209, media I / F215, and bus line 210. Further, the image forming apparatus 20 includes a plotter engine 211, an operation unit 212, and a scanner engine 213.

CPU201は、画像形成装置20全体の動作を制御する。ROM202は、画像形成装置20上で動作するOS(Operating System)、アプリ、SDK(Software Development Kit)、API(Application Programming Interface)などの各種プログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。NVRAM204およびHDD205は、各種プログラムで利用されるデータを記憶する。データには、OCR処理中のデータ、OCR結果のデータも含まれる。ネットワークI/F206は、例えば、Ethernet(登録商標)またはWi-Fiにより通信ネットワーク2を介して他の装置と通信するための通信手段である。エンジンI/F207は、プロッタエンジン211と接続するためのインタフェースである。パネルI/F208は、操作部212と接続するためのインタフェースである。スキャナI/F209は、スキャナエンジン213と接続するためのインタフェースである。メディアI/F215は、外部メモリなどの記録メディア216に記憶されている情報を読み出したり、記録メディア216に情報を書き込んだりするためのインタフェースである。バスライン210は、上記各構成要素を図3に示されているように電気的に接続するためのアドレスバスまたはデータバスである。 The CPU 201 controls the operation of the entire image forming apparatus 20. The ROM 202 stores various programs such as an OS (Operating System), an application, an SDK (Software Development Kit), and an API (Application Programming Interface) that operate on the image forming apparatus 20. The RAM 203 is used as a work area of the CPU 201. The NVRAM 204 and HDD 205 store data used in various programs. The data also includes data during OCR processing and data of OCR results. The network I / F 206 is a communication means for communicating with another device via the communication network 2 by, for example, Ethernet (registered trademark) or Wi-Fi. The engine I / F 207 is an interface for connecting to the plotter engine 211. The panel I / F 208 is an interface for connecting to the operation unit 212. The scanner I / F 209 is an interface for connecting to the scanner engine 213. The media I / F 215 is an interface for reading information stored in a recording medium 216 such as an external memory and writing information to the recording medium 216. The bus line 210 is an address bus or a data bus for electrically connecting each of the above components as shown in FIG.

プロッタエンジン211は、印刷処理において、画像形成装置20におけるプロッタの動作を制御する。プロッタは、インクジェット方式の場合、例えば、インクジェットヘッドであり、レーザープリンタ方式の場合、例えば、感光体、レーザー照射装置、あるいは転写装置である。操作部212は、タッチパネル機能を搭載した液晶表示装置または有機EL表示装置であり、ユーザから設定、条件、指示などの入力を受け付ける。スキャナエンジン213は、画像形成装置20におけるスキャナの動作を制御する。なお、スキャナは、特に限定されないが、例えば、圧版、ADF(Auto Document Feeder)、および撮像素子を有し、原稿から画像を読み取る任意の装置である。 The plotter engine 211 controls the operation of the plotter in the image forming apparatus 20 in the printing process. The plotter is, for example, an inkjet head in the case of an inkjet method, and is, for example, a photoconductor, a laser irradiation device, or a transfer device in the case of a laser printer method. The operation unit 212 is a liquid crystal display device or an organic EL display device equipped with a touch panel function, and receives inputs such as settings, conditions, and instructions from the user. The scanner engine 213 controls the operation of the scanner in the image forming apparatus 20. The scanner is not particularly limited, but is, for example, an arbitrary device having a pressure plate, an ADF (Auto Document Feeder), and an image pickup device, and reading an image from a document.

<<機能構成>>
次に、画像形成装置20およびサーバ装置50の機能構成について説明する。図4は、一実施形態に係る画像形成装置20およびサーバ装置50の機能ブロック図である。図4において、画像形成装置20およびサーバ装置50は、通信ネットワーク2を介して通信可能に接続されている。
<< Functional configuration >>
Next, the functional configurations of the image forming apparatus 20 and the server apparatus 50 will be described. FIG. 4 is a functional block diagram of the image forming apparatus 20 and the server apparatus 50 according to the embodiment. In FIG. 4, the image forming apparatus 20 and the server apparatus 50 are communicably connected via the communication network 2.

画像形成装置20は、アプリ部2100と、サーバ部2200と、を有する。これら各部は、図3に示されている各構成要素のいずれかが、ROM202からRAM203上に展開された画像形成装置20用のプログラムに従ったCPU201からの命令によって動作することで実現される機能である。 The image forming apparatus 20 has an application unit 2100 and a server unit 2200. Each of these parts has a function realized by operating any of the components shown in FIG. 3 by a command from the CPU 201 according to a program for the image forming apparatus 20 developed on the RAM 203 from the ROM 202. Is.

アプリ部2100は、通信部2110と、ユーザI/F部2120と、分担制御部2130と、を有する。これら各部は、図3に示されている各構成要素のいずれかが、ROM202からRAM203上に展開された画像形成装置20用のプログラムに従ったCPU201からの命令によって動作することで実現される機能である。また、アプリ部2100は、ROM202、RAM203、NVRAM204、またはHDD205により構築される記憶部2150を有する。 The application unit 2100 includes a communication unit 2110, a user I / F unit 2120, and a sharing control unit 2130. Each of these parts has a function realized by operating any of the components shown in FIG. 3 by a command from the CPU 201 according to a program for the image forming apparatus 20 developed on the RAM 203 from the ROM 202. Is. Further, the application unit 2100 has a storage unit 2150 constructed by the ROM 202, the RAM 203, the NVRAM 204, or the HDD 205.

記憶部2150には、分担先管理テーブル2151が記憶されている。表1は、画像形成装置20Aの記憶部2150において管理される分担先管理テーブル2151の一例を示す。分担先管理テーブルには、OCR処理の分担先のサーバ部2200,5200を識別するための識別情報と、画像データをどの方向から入力してOCR処理を実行するかを示す方向情報と、が関連付けられて管理されている。画像データの入力方向については後述する。 The sharing destination management table 2151 is stored in the storage unit 2150. Table 1 shows an example of the sharing destination management table 2151 managed in the storage unit 2150 of the image forming apparatus 20A. The sharing destination management table is associated with identification information for identifying the server units 2200 and 5200 to which the OCR processing is shared and direction information indicating from which direction the image data is input to execute the OCR processing. It is managed. The input direction of the image data will be described later.

表1において、識別情報における「自機」は、画像形成装置20Aのサーバ部2200を示す。識別情報における「1.1.1.2」、「1.1.1.3」、および「2.1.1.1」は、それぞれ、画像形成装置20Bのサーバ部2200、サーバ装置50Aのサーバ部5200、サーバ装置50Bのサーバ部5200のIPアドレスである。なお、IPアドレスは、サーバ部のURL(Uniform Resource Locator)またはホスト名に置き換え可能である。 In Table 1, "own machine" in the identification information indicates the server unit 2200 of the image forming apparatus 20A. "1.1.1.2", "1.1.1.3", and "2.1.1.1" in the identification information are the server unit 2200 of the image forming apparatus 20B, the server unit 5200 of the server apparatus 50A, and the server portion 5200 of the server apparatus 50B, respectively. It is an IP address. The IP address can be replaced with the URL (Uniform Resource Locator) of the server unit or the host name.

Figure 0006981137
Figure 0006981137

通信部2110は、CPU201からの命令およびネットワークI/F206の処理により実現され、他の装置のサーバ部2200,5200との通信、もしくは自装置のサーバ部2200との通信を制御する。 The communication unit 2110 is realized by a command from the CPU 201 and processing of the network I / F 206, and controls communication with the server units 2200 and 5200 of another device or communication with the server unit 2200 of the own device.

ユーザI/F部2120は、CPU201からの命令および操作部212の処理により実現され、ユーザの操作入力を受付けたり、ディスプレイに画像を表示させたりする処理を実行する。 The user I / F unit 2120 is realized by a command from the CPU 201 and a process of the operation unit 212, and executes a process of accepting a user's operation input and displaying an image on a display.

分担制御部2130は、CPU201からの命令により実現され、OCR処理を複数のサーバ部2200,5200に分担するための制御を実行する。 The sharing control unit 2130 is realized by an instruction from the CPU 201, and executes control for sharing the OCR processing among a plurality of server units 2200 and 5200.

サーバ部2200は、通信部2210と、OCR処理部2220と、を有する。これら各部は、図3に示されている各構成要素のいずれかが、ROM202からRAM103上に展開された画像形成装置20用のプログラムに従ったCPU201からの命令によって動作することで実現される機能である。サーバ部2200は、通信部2210と、OCR処理部2220と、を有する。 The server unit 2200 includes a communication unit 2210 and an OCR processing unit 2220. Each of these parts has a function realized by operating any of the components shown in FIG. 3 by a command from the CPU 201 according to a program for the image forming apparatus 20 developed on the RAM 103 from the ROM 202. Is. The server unit 2200 includes a communication unit 2210 and an OCR processing unit 2220.

通信部2210は、CPU201からの命令およびネットワークI/F206の処理により実現され、他の画像形成装置20のアプリ部2100との通信、もしくは自装置におけるアプリ部2100との通信を制御する。 The communication unit 2210 is realized by a command from the CPU 201 and processing of the network I / F 206, and controls communication with the application unit 2100 of another image forming apparatus 20 or communication with the application unit 2100 in the own device.

OCR処理部2220は、CPU201の処理によって実現され、アプリ部2100による要求に基づいてOCR処理を実行する。 The OCR processing unit 2220 is realized by the processing of the CPU 201, and executes the OCR processing based on the request by the application unit 2100.

サーバ装置50は、サーバ部5200を有する。サーバ部5200は、図2に示されている各構成要素のいずれかが、ROM102からRAM103上に展開されたサーバ装置50用のプログラムに従ったCPU101からの命令によって動作することで実現される機能である。サーバ部5200は、通信部5210と、OCR処理部5220と、を有する。 The server device 50 has a server unit 5200. The server unit 5200 has a function realized by operating any of the components shown in FIG. 2 by an instruction from the CPU 101 according to a program for the server device 50 expanded on the RAM 103 from the ROM 102. Is. The server unit 5200 includes a communication unit 5210 and an OCR processing unit 5220.

通信部5210は、CPU101からの命令およびネットワークI/F106の処理により実現され、画像形成装置20におけるアプリ部2100との通信ネットワーク2を介した通信を制御する。 The communication unit 5210 is realized by a command from the CPU 101 and processing of the network I / F 106, and controls communication with the application unit 2100 in the image forming apparatus 20 via the communication network 2.

OCR処理部2220は、CPU101の処理によって実現され、アプリ部2100による要求に基づいてOCR処理を実行する。 The OCR processing unit 2220 is realized by the processing of the CPU 101, and executes the OCR processing based on the request by the application unit 2100.

<<処理>>
続いて、通信システム1における処理について説明する。図5は、OCR処理の分担先を登録する処理の一例を示すフロー図である。図5を用いて、画像形成装置20Aにおいて、OCR処理の分担先を登録する処理について説明する。
<< Processing >>
Subsequently, the processing in the communication system 1 will be described. FIG. 5 is a flow chart showing an example of a process of registering a shareholder of the OCR process. The process of registering the shareholder of the OCR process in the image forming apparatus 20A will be described with reference to FIG.

画像形成装置20AのユーザI/F部2120は、OCR処理の分担先の登録を受け付けるための分担先登録画面を、操作部212のディスプレイから表示させる(ステップS1)。図6は、分担先登録画面の一例を示す。図6の分担先登録画面には、画像データの入力方向(上、下、左、右)ごとに、OCR処理を実行するサーバ部2200,5200の識別情報の入力欄が設けられている。 The user I / F unit 2120 of the image forming apparatus 20A displays the sharing destination registration screen for accepting the registration of the sharing destination of the OCR process from the display of the operation unit 212 (step S1). FIG. 6 shows an example of the sharing destination registration screen. The sharing destination registration screen of FIG. 6 is provided with input fields for identification information of the server units 2200 and 5200 that execute OCR processing for each image data input direction (upper, lower, left, right).

図7は、文書の画像の一例を示す概念図である。図7の文書の画像において、矢印IRの指す向きを下に定義することで、他の3方向の矢印IU,ID,ILの指す向きを下に定義したときよりも、OCR処理でより多くの文字が認識される。すなわち、画像データを画像データによって定義される向きからOCRモジュールに入力するよりも、この向きに対し90°、180°、270°回転させた、他の3方向のいずれかから入力した方が、より多くの文字が認識されることがある。 FIG. 7 is a conceptual diagram showing an example of an image of a document. By defining the direction indicated by the arrow IR below in the image of the document of FIG. 7, more OCR processing is performed than when the direction indicated by the arrows IU, ID, IL in the other three directions is defined below. The character is recognized. That is, rather than inputting the image data into the OCR module from the direction defined by the image data, it is better to input the image data from any of the other three directions rotated by 90 °, 180 °, and 270 ° with respect to this direction. More characters may be recognized.

画像データを上、右、下、左からOCRモジュールに入力してOCR処理を実行するとは、画像データによって定義される画像に対し、それぞれ、時計回りに0°、90°、180°、270°回転させた画像をOCR処理することを示す。あるいは、画像データを上、右、下、左からOCRモジュールに入力してOCR処理を実行するとは、画像データによって示される画像と、基準に対し、それぞれ、0°、90°、180°、270°回転させたテンプレートの文字データとを用いてOCR処理することを示す。 Inputting image data from the top, right, bottom, and left into the OCR module to execute OCR processing means that the image defined by the image data is clockwise at 0 °, 90 °, 180 °, and 270 °, respectively. Indicates that the rotated image is subjected to OCR processing. Alternatively, inputting image data from the top, right, bottom, and left into the OCR module to execute OCR processing means that the image indicated by the image data and the reference are 0 °, 90 °, 180 °, and 270, respectively. ° Indicates that OCR processing is performed using the character data of the rotated template.

ユーザは、図6の分担先登録画面において、画像データの入力方向ごとにOCR処理を実行するサーバ部2200,5200の識別情報を入力し、OKボタンを押下する。これにより、ユーザI/F部2120は、画像データの入力方向ごとに、OCR処理を実行するサーバ部2200,5200の識別情報の入力を受け付ける(ステップS2)。 On the sharing destination registration screen of FIG. 6, the user inputs the identification information of the server units 2200 and 5200 that execute the OCR process for each input direction of the image data, and presses the OK button. As a result, the user I / F unit 2120 accepts the input of the identification information of the server units 2200 and 5200 that execute the OCR process for each input direction of the image data (step S2).

画像形成装置20AのユーザI/F部2120は、ステップS2において受け付けられた情報に基づいて、OCR処理を分担するサーバ部2200,5200の識別情報と、画像データの入力方向を示す方向情報と、を関連付けて分担先管理テーブル2501に登録する(ステップS3)。 Based on the information received in step S2, the user I / F unit 2120 of the image forming apparatus 20A includes identification information of the server units 2200 and 5200 that share OCR processing, direction information indicating the input direction of image data, and direction information. Is associated and registered in the shareholder management table 2501 (step S3).

図8は、OCR処理の一例を示すシーケンス図である。図8を用いて、通信システム1を用いたOCR処理について説明する。以下、画像形成装置20Aのスキャナにおいて読み取られた複数ページの文書の画像をOCR処理する場合について説明する。ただし、画像形成装置20Bにおいて読み出された画像に基づいてOCR処理を実行する場合にも、画像形成装置20A,20Bの役割が変わるだけで、同様に処理を実行することができる。 FIG. 8 is a sequence diagram showing an example of OCR processing. The OCR process using the communication system 1 will be described with reference to FIG. Hereinafter, a case where an image of a multi-page document read by the scanner of the image forming apparatus 20A is subjected to OCR processing will be described. However, even when the OCR process is executed based on the image read out by the image forming apparatus 20B, the process can be executed in the same manner only by changing the roles of the image forming apparatus 20A and 20B.

画像形成装置20Aの記憶部2000には、画像形成装置20Aのスキャナによって読み取られた複数ページの文書の画像の画像データが記憶されている。画像データの形式は、特に限定されないが、例えば、ビットマップ、JPEG、TIFF、またはPNGである。 The storage unit 2000 of the image forming apparatus 20A stores the image data of the image of the document of a plurality of pages read by the scanner of the image forming apparatus 20A. The format of the image data is not particularly limited, but is, for example, a bitmap, JPEG, TIFF, or PNG.

ユーザによる操作に応じて、画像形成装置20AのユーザI/F部2120は、スキャナによって読み取られた複数ページの文書の画像に対しOCR処理を実行するための要求の入力を受け付ける(ステップS21)。 In response to the operation by the user, the user I / F unit 2120 of the image forming apparatus 20A receives an input of a request for executing OCR processing on the image of the document of a plurality of pages read by the scanner (step S21).

画像形成装置20AのユーザI/F部2120は、複数ページの文書の画像の画像データのうち、1ページ目の画像の画像データに対しOCR処理を実行するための要求を、同じ装置の分担制御部2130へ送信する(ステップS22)。 The user I / F unit 2120 of the image forming apparatus 20A controls the sharing of the request for executing the OCR processing on the image data of the image of the first page among the image data of the image of the document of a plurality of pages. It is transmitted to the unit 2130 (step S22).

画像形成装置20Aの分担制御部2130は、OCR処理を実行するための要求を受信してから、OCR処理の分担先を決定する(ステップS23)。この処理で、分担制御部2130は、分担先管理テーブル2151をレコードごとに読み出す。分担制御部2130は、読み出されたレコードに基づいて、画像データの入力方向(上、下、左、右)ごとに、OCR処理の分担先として、それぞれ、自装置のOCR処理部2220、画像形成装置20BのOCR処理部2220、サーバ装置50AのOCR処理部5220、サーバ装置50BのOCR処理部5220に決定する。 After receiving the request for executing the OCR process, the share control unit 2130 of the image forming apparatus 20A determines the share destination of the OCR process (step S23). In this process, the sharing control unit 2130 reads the sharing destination management table 2151 for each record. Based on the read record, the sharing control unit 2130 uses the OCR processing unit 2220 and the image of its own device as the sharing destination of the OCR processing for each input direction (up, down, left, right) of the image data. The OCR processing unit 2220 of the forming device 20B, the OCR processing unit 5220 of the server device 50A, and the OCR processing unit 5220 of the server device 50B are determined.

ステップS23における決定に従い、画像形成装置20Aの分担制御部2130は、画像データを上から入力してOCR処理を実行するための要求を、通信部2110を介して自装置のOCR処理部2220へ送信する(ステップS24−1)。同様に、画像形成装置20Aの分担制御部2130は、画像データを下から入力してOCR処理を実行するための要求を、通信部2110を介して画像形成装置20BのOCR処理部2220へ送信する(ステップS24−2)。同様に、画像形成装置20Aの分担制御部2130は、画像データを左から入力してOCR処理を実行するための要求を、通信部2110を介してサーバ装置50AのOCR処理部5220へ送信する(ステップS24−3)。同様に、画像形成装置20Aの分担制御部2130は、画像データを右から入力してOCR処理を実行するための要求を、通信部2110を介してサーバ装置50のOCR処理部5220へ送信する(ステップS24−3)。なお、画像形成装置20Aの分担制御部2130は、分担先管理テーブル2151における設定に応じて、4方向に対応する各OCR処理を実行するための要求のすべてを、他の画像形成装置20またはサーバ装置50へ送信してもよい。 According to the determination in step S23, the sharing control unit 2130 of the image forming apparatus 20A transmits a request for inputting image data from above and executing the OCR processing to the OCR processing unit 2220 of the own apparatus via the communication unit 2110. (Step S24-1). Similarly, the sharing control unit 2130 of the image forming apparatus 20A transmits a request for inputting image data from below and executing the OCR processing to the OCR processing unit 2220 of the image forming apparatus 20B via the communication unit 2110. (Step S24-2). Similarly, the sharing control unit 2130 of the image forming apparatus 20A transmits a request for inputting image data from the left and executing the OCR processing to the OCR processing unit 5220 of the server apparatus 50A via the communication unit 2110. Step S24-3). Similarly, the sharing control unit 2130 of the image forming apparatus 20A transmits a request for inputting image data from the right and executing the OCR processing to the OCR processing unit 5220 of the server apparatus 50 via the communication unit 2110. Step S24-3). The sharing control unit 2130 of the image forming apparatus 20A makes all the requests for executing each OCR process corresponding to the four directions according to the setting in the sharing destination management table 2151 to the other image forming apparatus 20 or the server. It may be transmitted to the device 50.

各OCR処理を実行するための要求には、記憶部2000に記憶されている1ページ目の画像の画像データが含まれている。なお、画像形成装置20Aの分担制御部2130は、上記の画像データを変換せずに各OCR処理部2220,5220へ送信してもよいし、0°、180°、270°、90°回転させた画像データを、各OCR処理部2220,5220へ送信してもよい。 The request for executing each OCR process includes the image data of the image of the first page stored in the storage unit 2000. The shared control unit 2130 of the image forming apparatus 20A may transmit the above image data to the OCR processing units 2220 and 5220 without conversion, or rotate the image data by 0 °, 180 °, 270 °, and 90 °. The image data may be transmitted to the OCR processing units 2220 and 5220.

画像形成装置20AのOCR処理部2220は、通信部2210を介してOCR処理を実行するための要求を受信すると、要求に基づいて、1ページ目の画像の画像データを上方向から入力して、OCR処理を実行する(ステップS25−1)。例えば、1ページ目の文書の画像が図7に示すものである場合、画像形成装置20AのOCR処理部2220は、矢印IUの指す方向を下と定義してOCR処理を実行することにより、「1」、「2」に対応する文字コードを出力する。また、画像形成装置20AのOCR処理部2220は、文字コード変換数「2」をカウントする。 When the OCR processing unit 2220 of the image forming apparatus 20A receives a request for executing the OCR processing via the communication unit 2210, the image data of the image on the first page is input from above based on the request. The OCR process is executed (step S25-1). For example, when the image of the document on the first page is shown in FIG. 7, the OCR processing unit 2220 of the image forming apparatus 20A defines the direction pointed by the arrow IU as the bottom and executes the OCR processing. The character code corresponding to "1" and "2" is output. Further, the OCR processing unit 2220 of the image forming apparatus 20A counts the character code conversion number “2”.

画像形成装置20AのOCR処理部2220は、出力された「1」、「2」に対応する文字コードおよび文字コード変換数「2」を含み、OCR処理の結果を示す結果情報を、通信部2210を介して要求元の画像形成装置20Aの分担制御部2130へ送信する(ステップS26−1)。 The OCR processing unit 2220 of the image forming apparatus 20A includes the character code corresponding to the output “1” and “2” and the character code conversion number “2”, and provides the result information indicating the result of the OCR processing to the communication unit 2210. It is transmitted to the sharing control unit 2130 of the image forming apparatus 20A of the request source via the above (step S26-1).

画像形成装置20BのOCR処理部2220は、通信部2210を介してOCR処理を実行するための要求を受信すると、要求に基づいて、1ページ目の画像の画像データを下方向から入力して、OCR処理を実行する(ステップS25−2)。例えば、1ページ目の文書の画像が図7に示すものである場合、画像形成装置20BのOCR処理部2220は、矢印IDの指す方向を下と定義してOCR処理を実行することにより、「α」に対応する文字コードを出力する。また、画像形成装置20AのOCR処理部2220は、文字コード変換数「1」をカウントする。 When the OCR processing unit 2220 of the image forming apparatus 20B receives a request for executing the OCR processing via the communication unit 2210, the image data of the image on the first page is input from below based on the request. The OCR process is executed (step S25-2). For example, when the image of the document on the first page is shown in FIG. 7, the OCR processing unit 2220 of the image forming apparatus 20B defines the direction pointed to by the arrow ID as the bottom and executes the OCR processing. Output the character code corresponding to "α". Further, the OCR processing unit 2220 of the image forming apparatus 20A counts the character code conversion number “1”.

画像形成装置20BのOCR処理部2220は、出力された「α」に対応する文字コードおよび文字コード変換数「1」を含み、OCR処理の結果を示す結果情報を、通信部2210を介して要求元の画像形成装置20Aの分担制御部2130へ送信する(ステップS26−2)。 The OCR processing unit 2220 of the image forming apparatus 20B includes the character code corresponding to the output “α” and the character code conversion number “1”, and requests the result information indicating the result of the OCR processing via the communication unit 2210. It is transmitted to the sharing control unit 2130 of the original image forming apparatus 20A (step S26-2).

サーバ装置50AのOCR処理部5220は、通信部5210を介してOCR処理を実行するための要求を受信すると、要求に基づいて、1ページ目の文書の画像データを左方向から入力して、OCR処理を実行する(ステップS25−3)。例えば、1ページ目の文書の画像が図7に示すものである場合、サーバ装置50AのOCR処理部5220は、矢印ILの指す方向を下と定義してOCR処理を実行する。 When the OCR processing unit 5220 of the server device 50A receives a request for executing the OCR processing via the communication unit 5210, the OCR processing unit 5220 inputs the image data of the document on the first page from the left based on the request, and OCR. The process is executed (step S25-3). For example, when the image of the document on the first page is shown in FIG. 7, the OCR processing unit 5220 of the server device 50A defines the direction pointed by the arrow IL as the bottom and executes the OCR processing.

サーバ装置50AのOCR処理部5220は、OCR処理の結果を示す結果情報を、通信部5210を介して要求元の画像形成装置20Aの分担制御部2130へ送信する(ステップS26−3)。なお、サーバ装置50AにおけるOCR処理により、文字コードが出力されなかった場合、サーバ装置50AのOCR処理部5220は、その旨を示す結果情報を送信する。 The OCR processing unit 5220 of the server device 50A transmits the result information indicating the result of the OCR processing to the sharing control unit 2130 of the image forming device 20A of the request source via the communication unit 5210 (step S26-3). If the character code is not output by the OCR processing in the server device 50A, the OCR processing unit 5220 of the server device 50A transmits the result information indicating that fact.

サーバ装置50BのOCR処理部5220は、通信部5210を介してOCR処理を実行するための要求を受信すると、要求に基づいて、1ページ目の文書の画像データを右方向から入力して、OCR処理を実行する(ステップS25−4)。例えば、1ページ目の文書の画像が図7に示すものである場合、サーバ装置50BのOCR処理部5220は、矢印IRの指す方向を下と定義してOCR処理を実行することにより、「A」乃至「Q」に対応する文字コードを出力する。また、画像形成装置20AのOCR処理部2220は、文字コード変換数「17」をカウントする。 When the OCR processing unit 5220 of the server device 50B receives a request for executing the OCR processing via the communication unit 5210, the image data of the document on the first page is input from the right direction based on the request, and the OCR is performed. The process is executed (step S25-4). For example, when the image of the document on the first page is shown in FIG. 7, the OCR processing unit 5220 of the server device 50B defines the direction pointed by the arrow IR as the bottom and executes the OCR processing to "A". The character code corresponding to "Q" is output. Further, the OCR processing unit 2220 of the image forming apparatus 20A counts the character code conversion number “17”.

サーバ装置50BのOCR処理部5220は、出力された「A」乃至「Q」に対応する文字コードおよび文字コード変換数「17」を含み、OCR処理の結果を示す結果情報を、通信部5210を介して要求元の画像形成装置20Aの分担制御部2130へ送信する(ステップS26−4)。 The OCR processing unit 5220 of the server device 50B includes the character code corresponding to the output “A” to “Q” and the character code conversion number “17”, and provides the communication unit 5210 with the result information indicating the result of the OCR processing. It is transmitted to the sharing control unit 2130 of the image forming apparatus 20A of the requesting source via (step S26-4).

画像形成装置20Aの分担制御部2130は、通信部2110を介して、画像形成装置20AのOCR処理部2220、画像形成装置20BのOCR処理部2220、サーバ装置50AのOCR処理部5220、およびサーバ装置50BのOCR処理部5220によって送信された結果情報を受信する。 The sharing control unit 2130 of the image forming apparatus 20A is the OCR processing unit 2220 of the image forming apparatus 20A, the OCR processing unit 2220 of the image forming apparatus 20B, the OCR processing unit 5220 of the server apparatus 50A, and the server apparatus via the communication unit 2110. The result information transmitted by the OCR processing unit 5220 of 50B is received.

画像形成装置20Aの分担制御部2130は、受信された各結果情報に基づいて、各方向から画像データを入力してOCR処理を実行したときの文字コード変換率を算出する(ステップS27)。変換率は下記式によって算出される。
i方向から画像データを入力したときの文字コード変換率=i方向から画像データを入力したときの文字コード変換数/4方向から画像データを入力したときの文字コード変換総数
The sharing control unit 2130 of the image forming apparatus 20A calculates the character code conversion rate when the OCR process is executed by inputting the image data from each direction based on the received result information (step S27). The conversion rate is calculated by the following formula.
Character code conversion rate when image data is input from i direction = Number of character code conversions when image data is input from i direction / Total number of character code conversions when image data is input from 4 directions

例えば、上方向から画像データを入力したときの文字コード変換個数が「1」、「2」の2個、下方向から画像データを入力したときの文字コード変換個数が「α」の1個、左方向から画像データを入力したときの文字コード変換個数が0個、右方向から画像データを入力したときの文字コード変換個数が「A」乃至「Q」の17個であるとする。この場合、分担制御部2130は、上方向から画像データを入力したときの文字コード変換率として0.10(=2/20)、下方向から画像データを入力したときの文字コード変換率として0.05(=1/20)、左方向から画像データを入力したときの文字コード変換率として0(=0/20)、右方向から画像データを入力したときの文字コード変換率として0.85(=17/20)を算出する。 For example, the number of character code conversions when image data is input from above is "1" and "2", and the number of character code conversions when image data is input from below is one "α". It is assumed that the number of character code conversions when the image data is input from the left direction is 0, and the number of character code conversions when the image data is input from the right direction is 17 pieces of "A" to "Q". In this case, the sharing control unit 2130 has a character code conversion rate of 0.10 (= 2/20) when image data is input from above and 0 as a character code conversion rate when image data is input from below. .05 (= 1/20), 0 (= 0/20) as the character code conversion rate when image data is input from the left direction, 0.85 as the character code conversion rate when image data is input from the right direction (= 17/20) is calculated.

画像形成装置20Aの分担制御部2130は、OCR処理において、文字コード変換率が最大となる画像の入力方向に基づいて、画像の可読方向を判定する(ステップS28)。上記の例では、文字コード変換率が0.85となるときの入力方向に基づいて、分担制御部2130は、図7における矢印IRの方向を可読方向と判定する。 In the OCR process, the sharing control unit 2130 of the image forming apparatus 20A determines the readable direction of the image based on the input direction of the image having the maximum character code conversion rate (step S28). In the above example, the sharing control unit 2130 determines that the direction of the arrow IR in FIG. 7 is the readable direction based on the input direction when the character code conversion rate is 0.85.

画像形成装置20Aの分担制御部2130は、複数ページの文書における1ページ目の画像に対するOCR処理の結果として、可読方向(矢印IR)に画像を入力してOCR処理した結果、すなわち、サーバ装置50BによるOCR処理の結果情報をユーザI/F部2120へ送信する(ステップS29)。 The sharing control unit 2130 of the image forming apparatus 20A inputs an image in the readable direction (arrow IR) and performs OCR processing as a result of OCR processing on the image of the first page in a document having a plurality of pages, that is, the server device 50B. The result information of the OCR processing by the above is transmitted to the user I / F unit 2120 (step S29).

複数ページの文書における2ページ目以降の画像についても、画像形成装置20は、ページごとにステップS22乃至S29のループ処理を繰り返す。ただし、2ページ目以降のOCR処理の分担先は、1ページ目のステップS23により決定したOCR処理の分担先に従う。このため、2ページ目以降のOCR処理において、ステップS23の処理は実行されない。 The image forming apparatus 20 repeats the loop processing of steps S22 to S29 for each page of the images on the second and subsequent pages in the document having a plurality of pages. However, the OCR processing sharing destination on the second and subsequent pages follows the OCR processing sharing destination determined in step S23 on the first page. Therefore, in the OCR processing on the second and subsequent pages, the processing in step S23 is not executed.

複数ページの文書におけるすべてのページの画像に対して、OCR処理が完了すると、ユーザI/F部2120は、ステップS29で受信された各結果情報に基づいて、文字認識の結果をディスプレイから表示させる。 When the OCR processing is completed for the images of all pages in the multi-page document, the user I / F unit 2120 causes the display to display the result of character recognition based on each result information received in step S29. ..

<<実施形態の変形例A>>
続いて、実施形態の変形例Aについて、上記の実施形態と異なる点を説明する。図9は、実施形態の変形例AにおけるOCR処理を示すシーケンス図である。実施形態の変形例Aにおいて、複数ページの文書のうち1ページ目の画像に対するOCR処理は、上記の実施形態におけるステップS21乃至S29の処理と同様である。
<< Modification A of the embodiment >>
Subsequently, the modification A of the embodiment will be described with respect to the differences from the above-described embodiment. FIG. 9 is a sequence diagram showing OCR processing in the modified example A of the embodiment. In the modification A of the embodiment, the OCR processing for the image on the first page of the document having a plurality of pages is the same as the processing of steps S21 to S29 in the above embodiment.

1ページ目のOCR処理の終了後、画像形成装置20AのユーザI/F部2120は、2ページ目の画像の画像データに対しOCR処理を実行するための要求を、同じ装置の分担制御部2130へ送信する(ステップS22A)。 After the OCR processing on the first page is completed, the user I / F unit 2120 of the image forming apparatus 20A makes a request for executing the OCR processing on the image data of the image on the second page, and the sharing control unit 2130 of the same apparatus. (Step S22A).

画像形成装置20Aの分担制御部2130は、画像データを可読方向から入力してOCR処理を実行するための要求を、通信部2110を介して自装置のOCR処理部2220へ送信する(ステップS24A)。可読方向とは、1ページ目のOCR処理において、ステップS28で可読方向と判定された方向である。例えば、ステップS28において、矢印IRが可読方向と判定された場合、分担制御部2130は、画像データを右から入力する要求を送信する。OCR処理する要求には、記憶部2000に記憶されている複数ページの文書の画像の画像データのうち、2ページ目の画像の画像データが含まれる。 The sharing control unit 2130 of the image forming apparatus 20A transmits a request for inputting image data from a readable direction and executing OCR processing to the OCR processing unit 2220 of its own device via the communication unit 2110 (step S24A). .. The readable direction is the direction determined to be the readable direction in step S28 in the OCR process of the first page. For example, in step S28, when the arrow IR is determined to be in the readable direction, the sharing control unit 2130 transmits a request for inputting image data from the right. The request for OCR processing includes the image data of the image of the second page among the image data of the image of the document of a plurality of pages stored in the storage unit 2000.

画像形成装置20AのOCR処理部2220は、通信部2210を介してOCR処理を実行するための要求を受信すると、要求に基づいて、2ページ目の画像の画像データを可読方向から入力して、OCR処理を実行する(ステップS25A)。 When the OCR processing unit 2220 of the image forming apparatus 20A receives a request for executing the OCR processing via the communication unit 2210, the image data of the image on the second page is input from the readable direction based on the request. The OCR process is executed (step S25A).

画像形成装置20AのOCR処理部2220は、OCR処理により出力された文字コードを含み、OCR処理の結果を示す結果情報を、通信部2210を介して要求元の画像形成装置20Aの分担制御部2130へ送信する(ステップS26A)。 The OCR processing unit 2220 of the image forming apparatus 20A includes the character code output by the OCR processing, and the result information indicating the result of the OCR processing is transmitted via the communication unit 2210 to the sharing control unit 2130 of the image forming apparatus 20A of the request source. (Step S26A).

画像形成装置20Aの分担制御部2130は、複数ページの文書における2ページ目の画像に対するOCR処理の結果として、ステップS26Aにおいて受信された、可読方向に画像を入力してOCR処理された結果を示す結果情報をユーザI/F部2120へ送信する(ステップS29A)。 The sharing control unit 2130 of the image forming apparatus 20A indicates the result of OCR processing by inputting an image in a readable direction received in step S26A as a result of OCR processing for the image on the second page in a document having a plurality of pages. The result information is transmitted to the user I / F unit 2120 (step S29A).

複数ページの文書における3ページ目以降の画像についても、画像形成装置20は、ページごとにステップS22A乃至S29Aのループ処理を繰り返す。ループ処理後の処理は、上記の実施形態の処理と同様である。 The image forming apparatus 20 repeats the loop processing of steps S22A to S29A for each page of the images after the third page in the document having a plurality of pages. The processing after the loop processing is the same as the processing of the above-described embodiment.

<<実施形態の変形例B>>
続いて、実施形態の変形例Bについて、上記の実施形態または実施形態の変形例Aと異なる点を説明する。
<< Modification B of the embodiment >>
Subsequently, the modification B of the embodiment will be described as different from the modification A of the above embodiment or the embodiment.

OCR処理の対象となる複数ページの原稿を画像形成装置20Aのスキャナで読み取るときに、ユーザI/F部2120は、天地方向(可読方向)をそろえて原稿をADFにセットしたかを確認するためのダイアログをディスプレイから表示させる。図10は、ダイアログの表示例である。ユーザによる操作入力に応じて、ユーザI/F部2120は、ダイアログによる確認結果の入力を受け付ける。 When scanning a multi-page document to be OCR processed by the scanner of the image forming apparatus 20A, the user I / F unit 2120 confirms whether the document is set in the ADF with the top-bottom direction (readable direction) aligned. Display the dialog from the display. FIG. 10 is a display example of the dialog. In response to the operation input by the user, the user I / F unit 2120 accepts the input of the confirmation result by the dialog.

画像形成装置20Aが原稿をスキャナで読み取る際に、原稿の向きがそろっていれば、各ページの向きがそろった複数ページの文書の画像データが生成され、原稿の向きがそろっていなければ、各ページの向きがそろっていない複数ページの文書の画像データが生成される。 When the image forming apparatus 20A scans the original with a scanner, if the orientations of the originals are aligned, image data of a multi-page document with the same orientation of each page is generated, and if the orientations of the originals are not aligned, each Image data for a multi-page document with misaligned pages is generated.

画像形成装置20AのユーザI/F部2120は、ステップS22において、ダイアログによる確認結果を含めて、OCR処理する要求を送信する。 In step S22, the user I / F unit 2120 of the image forming apparatus 20A transmits a request for OCR processing including a confirmation result by a dialog.

OCRする要求に含まれる確認結果が、天地方向をそろえて原稿をセットしたことを示す場合には、画像形成装置20Aは、実施形態の変形例Aの処理を実行する。OCRする要求に含まれる確認結果が、天地方向をそろえずに原稿をセットしたことを示す場合には、画像形成装置20Aは、上記の実施形態の処理を実行する。すなわち、画像形成装置20Aは、画像データにおける各ページの画像の向きがそろっているときだけ、実施形態の変形例Aの処理を実行する。 When the confirmation result included in the OCR request indicates that the originals have been set in the vertical direction, the image forming apparatus 20A executes the process of the modification A of the embodiment. When the confirmation result included in the OCR request indicates that the originals are set without aligning the top and bottom directions, the image forming apparatus 20A executes the process of the above embodiment. That is, the image forming apparatus 20A executes the process of the modification A of the embodiment only when the orientations of the images on the pages in the image data are aligned.

<<実施形態の変形例C>>
続いて、実施形態の変形例Cについて、上記の実施形態または実施形態の変形例Aと異なる点を説明する。図11は、実施形態の変形例Cにおける2ページ目以降の画像のOCR処理を示すシーケンス図である。実施形態の変形例Cにおいて、複数ページの文書のうち1ページ目の画像に対するOCR処理は、上記の実施形態におけるステップS21乃至S29の処理と同様である。
<< Modification C of the embodiment >>
Subsequently, the modification C of the embodiment will be described as different from the modification A of the above embodiment or the embodiment. FIG. 11 is a sequence diagram showing OCR processing of images on the second and subsequent pages in the modified example C of the embodiment. In the modification C of the embodiment, the OCR processing for the image on the first page of the document having a plurality of pages is the same as the processing of steps S21 to S29 in the above embodiment.

1ページ目のOCR処理の終了後、画像形成装置20Aの分担制御部2130は、ステップS27において算出された文字コード変換率の最大値、すなわち、可読方向に画像データを入力したときの文字コード変換率が所定の閾値以上であるか判断する(ステップS31C)。所定の閾値は、処理速度、あるいは天地方向の判定の正確性に応じて適宜設定され、特に限定されないが、例えば、0.80である。 After the completion of the OCR processing on the first page, the sharing control unit 2130 of the image forming apparatus 20A has the maximum value of the character code conversion rate calculated in step S27, that is, the character code conversion when the image data is input in the readable direction. It is determined whether the rate is equal to or higher than a predetermined threshold (step S31C). The predetermined threshold value is appropriately set according to the processing speed or the accuracy of the determination in the vertical direction, and is not particularly limited, but is, for example, 0.80.

画像形成装置20AのユーザI/F部2120は、2ページ目の文書の画像の画像データに対しOCR処理を実行するための要求を、同じ装置の分担制御部2130へ送信する(ステップS22C)。 The user I / F unit 2120 of the image forming apparatus 20A transmits a request for executing OCR processing to the image data of the image of the document on the second page to the sharing control unit 2130 of the same apparatus (step S22C).

画像形成装置20Aの分担制御部2130は、ステップS31Cにおいて、文字コード変換率が所定の閾値以上であると判断した場合、実施形態の変形例Aと同様のループ処理(ステップS22C,S24C,S25C,S26C,S29C)を繰り返す。すなわち、画像形成装置20Aは、2ページ目以降の画像の画像データを、一の装置において可読方向から入力させてOCR処理を実行する。 When the sharing control unit 2130 of the image forming apparatus 20A determines in step S31C that the character code conversion rate is equal to or higher than a predetermined threshold value, the loop processing (steps S22C, S24C, S25C,) similar to that of the modified example A of the embodiment is performed. S26C, S29C) is repeated. That is, the image forming apparatus 20A inputs the image data of the images on the second and subsequent pages from the readable direction in one apparatus, and executes the OCR process.

画像形成装置20Aの分担制御部2130は、ステップS31Cにおいて、文字コード変換率が所定の閾値以上ではないと判断した場合、上記の実施形態と同様のループ処理(ステップS22C,S24−1C〜S24−4C,S25−1C〜S25−4C,S26−1C〜S26−4C,S27C,S28C,S29C)を繰り返す。すなわち、画像形成装置20Aは、2ページ目以降の画像の画像データを、複数の装置において複数方向から入力させてOCR処理する。 When the sharing control unit 2130 of the image forming apparatus 20A determines in step S31C that the character code conversion rate is not equal to or higher than a predetermined threshold value, the loop processing (steps S22C, S24-1C to S24-) similar to that of the above embodiment is performed. 4C, S25-1C to S25-4C, S26-1C to S26-4C, S27C, S28C, S29C) are repeated. That is, the image forming apparatus 20A inputs the image data of the images on the second and subsequent pages from a plurality of directions in the plurality of apparatus and performs OCR processing.

<<実施形態の変形例D>>
続いて、実施形態の変形例Dについて、上記の実施形態と異なる点を説明する。図12は、実施形態の変形例Dにおける2ページ目以降の画像のOCR処理を示すシーケンス図である。実施形態の変形例Dにおいて、複数ページの文書のうち1ページ目の画像に対するOCR処理は、上記の実施形態におけるステップS21乃至S29の処理と同様である。
<< Modification D of the embodiment >>
Subsequently, the modification D of the embodiment will be described with respect to the differences from the above-described embodiment. FIG. 12 is a sequence diagram showing OCR processing of images on the second and subsequent pages in the modified example D of the embodiment. In the modification D of the embodiment, the OCR processing for the image on the first page of the document having a plurality of pages is the same as the processing of steps S21 to S29 in the above embodiment.

実施形態の変形例Dにおいて、画像形成装置20Aの分担制御部2130は、複数ページの文書の画像データの2ページ目から所定のページまで、上記の実施形態と同様に画像データを、複数の装置において複数方向から入力させてOCR処理するループ処理(ステップS22D,S24−1D〜S24−4D,S25−1D〜S25−4D,S26−1D〜S26−4D,S27D,S28D,S29D)を繰り返す。所定のページは、特に限定されず、適宜設定されるが、例えば、3ページである。 In the modification D of the embodiment, the sharing control unit 2130 of the image forming apparatus 20A transfers the image data from the second page to the predetermined page of the image data of the document having a plurality of pages in the same manner as in the above embodiment. In, the loop processing (steps S22D, S24-1D to S24-4D, S25-1D to S25-4D, S26-1D to S26-4D, S27D, S28D, S29D) in which data is input from a plurality of directions and OCR processing is performed is repeated. The predetermined page is not particularly limited and is appropriately set, but is, for example, three pages.

所定のページのOCR処理における可読方向の判定後(ステップS28D)、画像形成装置20Aの分担制御部2130は、OCR処理の結果が下記の条件A,Bのいずれに合致するか判断する(ステップS32D)。
条件A:1ページ目から所定のページの画像のOCR処理を実行するまで、天地方向の判定結果が連続して1ページ目と同じ方向であった。
条件B:1ページ目から所定のページの画像のOCR処理を実行するまでに、天地方向の判定結果が1ページ目と異なるケースがあった。
After determining the readable direction in the OCR processing of the predetermined page (step S28D), the sharing control unit 2130 of the image forming apparatus 20A determines whether the result of the OCR processing meets the following conditions A and B (step S32D). ).
Condition A: From the first page to the execution of the OCR processing of the image of the predetermined page, the determination result in the top-bottom direction was continuously in the same direction as the first page.
Condition B: There was a case where the determination result in the vertical direction was different from that of the first page from the first page to the time when the OCR process of the image of the predetermined page was executed.

ステップS32Dにおいて、条件Bに合致した場合、分担制御部2130は、複数ページの文書のうち未処理である残りのページのOCR処理についても、ループ処理(ステップS22D,S24−1D〜S24−4D,S25−1D〜S25−4D,S26−1D〜S26−4D,S27D,S28D,S29D)を繰り返す。 If the condition B is satisfied in step S32D, the sharing control unit 2130 also performs loop processing (steps S22D, S24-1D to S24-4D,) for the OCR processing of the remaining unprocessed pages of the document having a plurality of pages. S25-1D to S25-4D, S26-1D to S26-4D, S27D, S28D, S29D) are repeated.

ステップS32Dにおいて、条件Aに合致した場合、分担制御部2130は、上記のループ処理を抜け出し、複数ページの文書のうち未処理である残りのページの画像データについては、実施形態の変形例Aと同様のループ処理により、OCR処理を繰り返す(ステップS22DA,S24DA,S25DA,S26DA,29DA)。すなわち、実施形態の変形例Dでは、所定のページまで画像の向きが同じである場合に、画像形成装置20Aは、残りのページの画像データについて、一の装置に対し可読方向と判定された方向からOCR処理を実行させる。 When the condition A is satisfied in step S32D, the sharing control unit 2130 exits the above loop processing, and the image data of the remaining unprocessed pages of the document having a plurality of pages is different from that of the modified example A of the embodiment. The OCR process is repeated by the same loop process (steps S22DA, S24DA, S25DA, S26DA, 29DA). That is, in the modification D of the embodiment, when the orientation of the image is the same up to a predetermined page, the image forming apparatus 20A determines that the image data of the remaining pages is in a readable direction with respect to one apparatus. OCR processing is executed from.

<<実施形態の主な効果>>
上記実施形態の画像処理方法によると、画像形成装置20A(情報処理装置の一例)の分担制御部2130(送信手段の一例)は、画像形成装置20Bおよびサーバ装置50A,50B(画像処理装置の一例)へ、文書の画像に対し、上下左右四方向のそれぞれ異なる方向からOCR処理を実行するための要求を送信する(送信処理の一例)。画像形成装置20Aの分担制御部2130(受信手段の一例)は、上記の要求に基づいて、文書の画像に対し、それぞれ異なる方向から文字認識した結果を示す結果情報を受信する(受信処理の一例)。画像形成装置20AのユーザI/F部2120(出力手段の一例)は、分担制御部2130によって受信された各結果情報のうち、変換された文字コードへの変換率が最も大きい結果情報に基づいて文字認識の結果を出力する(出力処理の一例)。上記実施形態の画像処理方法によると、上下左右のうち最適な方向からOCR処理を実行した結果を出力することで精度が向上し、上下左右のOCR処理を複数の装置に分担することにより、OCR処理に要する時間が短縮される。
<< Main effects of the embodiment >>
According to the image processing method of the above embodiment, the sharing control unit 2130 (an example of the transmission means) of the image forming apparatus 20A (an example of an information processing apparatus) is an image forming apparatus 20B and a server apparatus 50A, 50B (an example of an image processing apparatus). ) To transmit a request for executing OCR processing from different directions of up, down, left, and four directions to the image of the document (an example of transmission processing). Based on the above request, the sharing control unit 2130 (an example of the receiving means) of the image forming apparatus 20A receives the result information indicating the result of character recognition from different directions for the image of the document (an example of the receiving process). ). The user I / F unit 2120 (an example of the output means) of the image forming apparatus 20A is based on the result information having the highest conversion rate to the converted character code among the result information received by the sharing control unit 2130. Output the result of character recognition (an example of output processing). According to the image processing method of the above embodiment, the accuracy is improved by outputting the result of executing the OCR processing from the optimum direction from the top, bottom, left, and right, and by sharing the OCR processing of the top, bottom, left, and right to a plurality of devices, the OCR is performed. The processing time is reduced.

実施形態の変形例Aによると、画像形成装置20Aの分担制御部2130(決定手段の一例)は、それぞれ異なる方向からOCR処理した結果を示す結果情報に基づいて、画像に対し、OCR処理する方向を決定する。分担制御部2130による方向の決定後、画像形成装置20Aの分担制御部2130は、一の装置へ、決定された方向からOCR処理を実行するための要求を送信する。実施形態の変形例Aによると、OCRモジュールに入力するときの方向が決定してから、一のOCRモジュールによりOCR処理を実行することで、通信システム1(画像処理システムの一例)における処理の負荷を低減できる。 According to the modification A of the embodiment, the sharing control unit 2130 (an example of the determination means) of the image forming apparatus 20A performs OCR processing on the image based on the result information indicating the result of OCR processing from different directions. To determine. After the direction is determined by the sharing control unit 2130, the sharing control unit 2130 of the image forming apparatus 20A transmits a request for executing the OCR process from the determined direction to one device. According to the modification A of the embodiment, the processing load in the communication system 1 (an example of an image processing system) is performed by executing the OCR processing by one OCR module after the direction of input to the OCR module is determined. Can be reduced.

実施形態の変形例Bによると、画像形成装置20AのユーザI/F部2120(受付手段の一例)は、原稿の読取時に、文書の画像における各ページの画像の向きが同じであるかを特定するための特定情報の入力を受け付ける。特定情報に基づいて、各ページの画像の向きが同じであると特定される場合に、画像形成装置20Aの分担制御部2130は、一の装置へ、決定された方向からOCR処理を実行するための要求を送信する。実施形態の変形例Bによると、画像形成装置20は、ユーザによる特定情報の入力結果に応じてOCR処理の方法を選択することで、天地方向の誤判定を低減できる。 According to the modification B of the embodiment, the user I / F unit 2120 (an example of the receiving means) of the image forming apparatus 20A specifies whether the orientation of the image of each page in the image of the document is the same when the document is read. Accepts the input of specific information to do. When it is specified that the orientation of the images on each page is the same based on the specific information, the sharing control unit 2130 of the image forming apparatus 20A executes OCR processing to one apparatus from a determined direction. Send your request. According to the modification B of the embodiment, the image forming apparatus 20 can reduce the erroneous determination in the vertical direction by selecting the OCR processing method according to the input result of the specific information by the user.

実施形態の変形例Cによると、上記の文字コードへの変換率が、所定の閾値以上あるいは、所定の閾値より大きい場合に、画像形成装置20Aの分担制御部2130は、一の装置へ、決定された方向からOCR処理を実行するための要求を送信する。実施形態の変形例Cによると、画像形成装置20は、特定された可読方向の確からしさに応じて、適切にOCR処理の方法を選択することができる。 According to the modification C of the embodiment, when the conversion rate to the character code is equal to or higher than a predetermined threshold value or larger than a predetermined threshold value, the sharing control unit 2130 of the image forming apparatus 20A determines to one device. A request for executing OCR processing is transmitted from the direction in which the OCR processing is performed. According to the modification C of the embodiment, the image forming apparatus 20 can appropriately select the method of OCR processing according to the certainty of the specified readable direction.

実施形態の変形例Dによると、文書のうち連続する複数のページの各画像に対し、所定の方向からOCR処理したときの文字コードへの変換率が、各画像に対し、他の方向からOCR処理したときの文字コードへの変換率よりも大きい場合に、画像形成装置20Aの分担制御部2130は、一の装置へ、決定された方向からOCR処理を実行する要求を送信する。実施形態の変形例Dによると、画像形成装置20は、特定された可読方向の確からしさに応じて、適切にOCR処理の方法を選択することができる。 According to the modification D of the embodiment, the conversion rate to the character code when OCR processing is performed from a predetermined direction for each image of a plurality of consecutive pages of the document is OCR for each image from another direction. When the conversion rate to the character code at the time of processing is larger than the conversion rate to the character code, the sharing control unit 2130 of the image forming apparatus 20A transmits a request to execute the OCR processing from the determined direction to one apparatus. According to the modification D of the embodiment, the image forming apparatus 20 can appropriately select the method of OCR processing according to the certainty of the specified readable direction.

<<実施形態の補足>>
画像形成装置20用のプログラムは、インストール可能な形式又は実行可能な形式のファイルによって、コンピュータで読み取り可能な記録媒体に記録されて流通されるようにしてもよい。また、上記記録媒体の他の例として、CD−R(Compact Disc Recordable)、DVD(登録商標)(Digital Versatile Disk)、ブルーレイ(登録商標)ディスク等が挙げられる。また、上記記録媒体、あるいは、これらプログラムが記憶されたHD(Hard Disk)は、プログラム製品(Program Product)として、国内又は国外へ提供できる。
<< Supplement to the embodiment >>
The program for the image forming apparatus 20 may be recorded and distributed on a computer-readable recording medium by a file in an installable format or an executable format. Further, as another example of the above-mentioned recording medium, a CD-R (Compact Disc Recordable), a DVD (registered trademark) (Digital Versatile Disk), a Blu-ray (registered trademark) disc, and the like can be mentioned. Further, the above-mentioned recording medium or HD (Hard Disk) in which these programs are stored can be provided domestically or internationally as a program product.

また、上記実施形態における画像形成装置20は、単一の装置によって構築されてもよいし、各部(機能又は手段)を分割して任意に割り当てられた複数の装置によって構築されていてもよい。例えば、画像形成装置20における分担制御部2130を実現するためのユニットと、他の機能部を実現するユニットと、を複数の情報処理装置に分割して、画像形成システムを構築してもよい。 Further, the image forming apparatus 20 in the above embodiment may be constructed by a single apparatus, or may be constructed by a plurality of devices arbitrarily assigned by dividing each part (function or means). For example, the unit for realizing the sharing control unit 2130 in the image forming apparatus 20 and the unit for realizing other functional units may be divided into a plurality of information processing devices to construct an image forming system.

上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路を含むプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)や従来の回路モジュール等のデバイスを含むものとする。 Each function of the embodiment described above can be realized by one or more processing circuits. Here, the term "processing circuit" as used herein means a processor programmed to execute each function by software such as a processor including an electronic circuit, or an ASIC designed to execute each function described above. It shall include devices such as (Application Specific Integrated Circuit) and conventional circuit modules.

1 通信システム
2 通信ネットワーク
20 画像形成装置
50 サーバ装置
2100 アプリ部
2110 通信部
2120 ユーザI/F部
2130 分担制御部
2150 記憶部
2151分担先管理テーブル
2200,5200 サーバ部
2210,5210 通信部
2220,5220 OCR処理部
1 Communication system 2 Communication network 20 Image forming device 50 Server device 2100 App section 2110 Communication section 2120 User I / F section 2130 Sharing control section 2150 Storage section 2151 Sharing destination management table 2200, 5200 Server section 2210, 5210 Communication section 2220, 5220 OCR processing unit

特開平5−225382号公報Japanese Unexamined Patent Publication No. 5-225382 特開2015−167905号公報Japanese Unexamined Patent Publication No. 2015-167905

Claims (4)

原稿の各ページの向きが同じであるかを特定するための特定情報の入力を受け付ける受付手段と、
前記原稿の画像によって定義される向きに対し、当該画像を0°、90°、180°、270°回転させた四方向のうちのそれぞれ異なる方向から文字認識するための要求を、それぞれ異なる画像処理装置へ送信する送信手段と、
前記要求に基づいて、前記四方向のうちのそれぞれ異なる方向から文字認識された結果を示す各結果情報を、前記画像処理装置から受信する受信手段と、
前記受信手段によって受信された各結果情報について算出した文字への変換率が最も大きい結果情報に対応する方向を、文字認識する方向として決定する決定手段と、
前記受信手段によって受信された各結果情報のうち、前記決定手段によって決定された方向に対応する結果情報に基づいて文字認識の結果を表示装置に出力する出力手段と、
を有し、
前記送信手段は、前記特定情報に基づいて、前記各ページの向きが同じであると特定された場合、前記決定手段によって決定された方向から文字認識するための要求を一の画像処理装置へ送信する、
情報処理装置。
A reception means that accepts input of specific information to specify whether the orientation of each page of the manuscript is the same,
To the direction defined by the image of the document, the image 0 °, 90 °, 180 ° , a request to the character recognition from different directions of the four direction rotated 270 °, different image processing The means of transmission to the device and
Based on the request, the receiving means for receiving the result information indicating the result of character recognition from each of the four directions from the image processing device, and the receiving means.
A determining means for determining the direction corresponding to the result information having the largest conversion rate to characters calculated for each result information received by the receiving means as the character recognition direction.
Among the result information received by the receiving means, an output means for outputting the character recognition result to the display device based on the result information corresponding to the direction determined by the determining means.
Have a,
When the transmission means is specified to have the same orientation of the pages based on the specific information, the transmission means transmits a request for character recognition from the direction determined by the determination means to one image processing device. do,
Information processing device.
請求項1に記載の情報処理装置と、
前記画像処理装置と、
を有する画像処理システム。
The information processing apparatus according to claim 1 and
With the image processing device
Image processing system with.
情報処理装置に、
原稿の各ページの向きが同じであるかを特定するための特定情報の入力を受け付ける受付処理と、
前記原稿の画像によって定義される向きに対し、当該画像を0°、90°、180°、270°回転させた四方向のうちのそれぞれ異なる方向から文字認識するための要求を、それぞれ異なる画像処理装置へ送信する送信処理と、
前記要求に基づいて、前記四方向のうちのそれぞれ異なる方向から文字認識された結果を示す各結果情報を、前記画像処理装置から受信する受信処理と、
前記受信処理によって受信された各結果情報について算出した文字への変換率が最も大きい結果情報に対応する方向を、文字認識する方向として決定する決定処理と、
前記受信処理によって受信された各結果情報のうち、前記決定処理によって決定された方向に対応する結果情報に基づいて文字認識の結果を表示装置に出力する出力処理と、
を実行させ
前記送信処理は、前記特定情報に基づいて、前記各ページの向きが同じであると特定された場合、前記決定処理によって決定された方向から文字認識するための要求を一の画像処理装置へ送信する、
画像処理方法。
For information processing equipment
Reception processing that accepts input of specific information to specify whether the orientation of each page of the manuscript is the same,
To the direction defined by the image of the document, the image 0 °, 90 °, 180 ° , a request to the character recognition from different directions of the four direction rotated 270 °, different image processing Transmission processing to send to the device and
Based on the request, the reception process of receiving the result information indicating the result of character recognition from each of the four directions from the image processing device, and the reception process.
A determination process for determining the direction corresponding to the result information having the largest conversion rate to characters calculated for each result information received by the reception process as the character recognition direction.
Among the result information received by the reception process, the output process of outputting the character recognition result to the display device based on the result information corresponding to the direction determined by the determination process, and the output process.
To execute ,
In the transmission process, when it is specified that the orientation of each page is the same based on the specific information, a request for character recognition from the direction determined by the determination process is transmitted to one image processing device. do,
Image processing method.
情報処理装置に、
原稿の各ページの向きが同じであるかを特定するための特定情報の入力を受け付ける受付処理と、
前記原稿の画像によって定義される向きに対し、当該画像を0°、90°、180°、270°回転させた四方向のうちのそれぞれ異なる方向から文字認識するための要求を、それぞれ異なる画像処理装置へ送信する送信処理と、
前記要求に基づいて、前記四方向のうちのそれぞれ異なる方向から文字認識された結果を示す各結果情報を、前記画像処理装置から受信する受信処理と、
前記受信処理によって受信された各結果情報について算出した文字への変換率が最も大きい結果情報に対応する方向を、文字認識する方向として決定する決定処理と、
前記受信処理によって受信された各結果情報のうち、前記決定処理によって決定された方向に対応する結果情報に基づいて文字認識の結果を表示装置に出力する出力処理と、
を実行させ
前記送信処理は、前記特定情報に基づいて、前記各ページの向きが同じであると特定された場合、前記決定処理によって決定された方向から文字認識するための要求を一の画像処理装置へ送信する、
プログラム。
For information processing equipment
Reception processing that accepts input of specific information to specify whether the orientation of each page of the manuscript is the same,
To the direction defined by the image of the document, the image 0 °, 90 °, 180 ° , a request to the character recognition from different directions of the four direction rotated 270 °, different image processing Transmission processing to send to the device and
Based on the request, the reception process of receiving the result information indicating the result of character recognition from each of the four directions from the image processing device, and the reception process.
A determination process for determining the direction corresponding to the result information having the largest conversion rate to characters calculated for each result information received by the reception process as the character recognition direction.
Among the result information received by the reception process, the output process of outputting the character recognition result to the display device based on the result information corresponding to the direction determined by the determination process, and the output process.
To execute ,
In the transmission process, when it is specified that the orientation of each page is the same based on the specific information, a request for character recognition from the direction determined by the determination process is transmitted to one image processing device. do,
program.
JP2017182890A 2017-09-22 2017-09-22 Information processing equipment, image processing systems, image processing methods, and programs Active JP6981137B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017182890A JP6981137B2 (en) 2017-09-22 2017-09-22 Information processing equipment, image processing systems, image processing methods, and programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017182890A JP6981137B2 (en) 2017-09-22 2017-09-22 Information processing equipment, image processing systems, image processing methods, and programs

Publications (2)

Publication Number Publication Date
JP2019061295A JP2019061295A (en) 2019-04-18
JP6981137B2 true JP6981137B2 (en) 2021-12-15

Family

ID=66176606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017182890A Active JP6981137B2 (en) 2017-09-22 2017-09-22 Information processing equipment, image processing systems, image processing methods, and programs

Country Status (1)

Country Link
JP (1) JP6981137B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3684050B2 (en) * 1997-11-11 2005-08-17 キヤノン株式会社 Image processing method and apparatus
JP2001084333A (en) * 1999-09-13 2001-03-30 Vasara Research Inc Character reader
JP6090404B2 (en) * 2015-10-15 2017-03-08 株式会社リコー Device cooperation system, image forming apparatus, and service providing method

Also Published As

Publication number Publication date
JP2019061295A (en) 2019-04-18

Similar Documents

Publication Publication Date Title
US9158483B2 (en) Relaying device and system thereof
US9544473B2 (en) Information processing system and information processing method
US10375267B2 (en) Mediation server
US9485368B2 (en) Electronic document generation apparatus, recording medium, and electronic document generation system
US20200259965A1 (en) Image processing apparatus, image processing method, and storage medium
US20070064267A1 (en) Image processing apparatus
US9756196B2 (en) Image processing apparatus and system and method for transmitting an image
JP6331302B2 (en) Information processing system, information acquisition apparatus, server, program, and information processing method
US10432807B1 (en) Remote post-scanning workflow using scan job in scan job queue
EP2403228B1 (en) Image scanning apparatus, computer readable medium, and image storing method
US9413841B2 (en) Image processing system, image processing method, and medium
US9473650B2 (en) Image reading apparatus, image reading method, image processing system, and storage medium
JP6981137B2 (en) Information processing equipment, image processing systems, image processing methods, and programs
US10171688B2 (en) Management server to receive scanned images and align the scanned images based on page numbers included in the scanned images
US9383952B1 (en) Systems and methods for overriding a print ticket when printing from a mobile device
US20130107302A1 (en) Image processing apparatus, image processing method and memory medium
US8958108B2 (en) Apparatus and program product for processing page images with defined page order to increase editing flexibilty
JP5316271B2 (en) Image processing apparatus, image processing system, image processing method, program, and recording medium
US10264143B2 (en) Image forming apparatus
JP6485051B2 (en) Image processing system, image processing apparatus, and program
JP5882254B2 (en) Log image generation system and log image generation program
JP6946932B2 (en) Image processing system, processing equipment and programs
US10728402B2 (en) Image processing apparatus, method of controlling image processing apparatus, and storage medium
JP2016111537A (en) Data transmission/reception method and data transmission/reception device
JP2016092750A (en) Recording system, image recorder, information processing unit, and program

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180209

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211101

R151 Written notification of patent or utility model registration

Ref document number: 6981137

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151