JP7429365B1 - Data processing device, data processing method and program - Google Patents

Data processing device, data processing method and program Download PDF

Info

Publication number
JP7429365B1
JP7429365B1 JP2023519782A JP2023519782A JP7429365B1 JP 7429365 B1 JP7429365 B1 JP 7429365B1 JP 2023519782 A JP2023519782 A JP 2023519782A JP 2023519782 A JP2023519782 A JP 2023519782A JP 7429365 B1 JP7429365 B1 JP 7429365B1
Authority
JP
Japan
Prior art keywords
data
character string
vouchers
voucher
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023519782A
Other languages
Japanese (ja)
Inventor
鴻鵬 葛
顕 松田
智 小俣
啓太郎 森
将和 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fast Accounting Inc
Original Assignee
Fast Accounting Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fast Accounting Inc filed Critical Fast Accounting Inc
Application granted granted Critical
Publication of JP7429365B1 publication Critical patent/JP7429365B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

データ処理装置1は、複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部131と、証憑画像データに基づいて、複数の証憑に共通に含まれている共通文字列を特定する文字列特定部132と、複数の証憑に含まれている共通文字列以外の少なくとも一部の複数の文字列を、共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部133と、を有する。The data processing device 1 includes a data acquisition unit 131 that acquires voucher image data created by simultaneously reading a plurality of vouchers, and a data acquisition unit 131 that acquires voucher image data created by simultaneously reading a plurality of vouchers, and a common character string commonly included in a plurality of vouchers based on the voucher image data. Processed by processing at least some of the plurality of character strings other than the common character string included in the plurality of evidences based on a predetermined rule corresponding to the common character string with the character string identification unit 132 to be specified. It has a data creation unit 133 that creates data.

Description

本発明は、データ処理装置、データ処理方法及びプログラムに関する。 The present invention relates to a data processing device, a data processing method, and a program.

従来、レシート、領収書又は請求書等の証憑を読み取った画像データに基づいて、仕訳データを作成する装置が知られている(例えば、特許文献1を参照)。 2. Description of the Related Art Conventionally, there has been known a device that creates journal data based on image data obtained by reading evidence such as a receipt, a receipt, or an invoice (see, for example, Patent Document 1).

特開2021-071991号公報Japanese Patent Application Publication No. 2021-071991 特開2016-186773号公報Japanese Patent Application Publication No. 2016-186773

特許文献1に記載された装置で証憑画像データに基づく処理済データを作成するためは、ユーザが証憑を1枚ずつ読み取る操作をする必要があった。特許文献2に記載されているように、ユーザがフラットベッドスキャナ又はデジタルカメラを用いて複数の証憑をまとめて読み取る操作をすることにより、複数の証憑をまとめて処理することは可能になる。この場合、ユーザが読み取らせた複数の証憑の中に、処理をする対象でない証憑が含まれているとしても、当該証憑に記載された文字列も処理の対象にされてしまうという問題があった。 In order to create processed data based on voucher image data using the apparatus described in Patent Document 1, the user had to perform an operation to read the vouchers one by one. As described in Patent Document 2, when a user performs an operation to read a plurality of vouchers at once using a flatbed scanner or a digital camera, it becomes possible to process multiple vouchers at once. In this case, there was a problem in that even if the multiple documents read by the user included a document that was not the target of processing, the character string written on the document would also be processed. .

そこで、本発明はこれらの点に鑑みてなされたものであり、複数の証憑を同時に読み取って作成された画像データに基づいて、証憑に含まれる文字列が示す情報を適切に処理できるようにすることを目的とする。 Therefore, the present invention has been made in view of these points, and it is an object of the present invention to appropriately process information indicated by a character string included in a voucher based on image data created by simultaneously reading a plurality of vouchers. The purpose is to

本発明の第1の態様のデータ処理装置は、複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定する文字列特定部と、複数の前記証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部と、を有する。 A data processing device according to a first aspect of the present invention includes a data acquisition unit that acquires voucher image data created by simultaneously reading a plurality of vouchers; and a data processing unit that acquires voucher image data created by simultaneously reading a plurality of vouchers; a character string specifying unit that identifies a common character string included in the document; and a data creation unit that creates processed data by processing based on rules.

前記データ作成部は、前記共通文字列が含まれている複数の前記証憑に含まれているデータを含み、前記共通文字列が含まれていない前記証憑に含まれているデータを含まない前記処理済データを作成してもよい。 The data creation unit includes the data included in the plurality of evidences that include the common character string, and performs the processing that does not include data included in the evidences that do not include the common character string. You may also create completed data.

前記データ作成部は、第1の前記共通文字列が含まれている複数の前記証憑に含まれているデータに基づく第1の前記処理済データと、第2の前記共通文字列が含まれている複数の前記証憑に含まれているデータに基づく第2の前記処理済データと、を作成してもよい。 The data creation unit includes a first processed data based on data included in a plurality of evidences including the first common character string, and a second processed data including the second common character string. and the second processed data based on data included in the plurality of evidences.

前記共通文字列は、複数の前記証憑に共通する発行者名、又は複数の前記証憑に共通する同一業種の発行者名であり、前記データ作成部は、当該発行者名が含まれる複数の前記証憑に含まれている前記共通文字列以外のデータが前記発行者名に関連付けられた前記処理済データを作成してもよい。 The common character string is an issuer name common to a plurality of the vouchers, or an issuer name of the same industry common to a plurality of vouchers, and the data creation unit The processed data may be created in which data other than the common character string included in the voucher is associated with the issuer name.

前記共通文字列は、複数の前記証憑に共通する発行時期を示す文字列であり、前記データ作成部は、前記共通文字列に対応する発行時期が含まれる複数の前記証憑に含まれている前記共通文字列以外のデータが前記発行時期に関連付けられた前記処理済データを作成してもよい。 The common character string is a character string indicating an issuance time that is common to a plurality of the vouchers, and the data creation unit is a character string that indicates an issuance time that is common to a plurality of the vouchers, and the data creation unit is a character string that is included in the plurality of vouchers that include the issuance time that corresponds to the common character string. The processed data may be created in which data other than the common character string is associated with the issuance time.

前記共通文字列は、複数の前記証憑に共通する発行時期を示す文字列であり、前記データ作成部は、前記共通文字列に対応する発行時期が含まれる複数の前記証憑それぞれに含まれる金額を示す文字列を、前記発行時期の順番に配置した前記処理済データを作成してもよい。 The common character string is a character string indicating the issuance time common to the plurality of vouchers, and the data creation unit calculates the amount included in each of the plurality of vouchers including the issuance time corresponding to the common character string. The processed data may be created in which the character strings shown are arranged in the order of the publication times.

前記複数の証憑それぞれは、購入商品名と、購入商品の金額と、が記載された領収書であり、前記共通文字列は、前記購入商品名を示す文字列であり、前記データ作成部は、前記購入商品名と、前記購入商品名ごとに前記金額を合算した合計額とが関連付けられた前記処理済データを作成してもよい。 Each of the plurality of vouchers is a receipt in which the name of the purchased product and the amount of the purchased product are written, the common character string is a character string indicating the name of the purchased product, and the data creation unit: The processed data may be created in which the purchased product name is associated with a total amount obtained by adding up the amounts for each purchased product name.

前記データ作成部は、前記購入商品名に対応する勘定科目と前記合計額とが関連付けられた前記処理済データを作成してもよい。 The data creation unit may create the processed data in which the account item corresponding to the purchased product name and the total amount are associated.

前記データ作成部は、前記複数の証憑に含まれている複数の文字列が所定の条件を満たしていない場合に、警告を示すデータを作成してもよい。 The data creation unit may create data indicating a warning when a plurality of character strings included in the plurality of vouchers do not satisfy a predetermined condition.

前記データ作成部は、前記複数の証憑に含まれている前記複数の文字列の間に所定の関連性がない場合に、前記警告を示すデータを作成してもよい。 The data creation unit may create data indicating the warning when there is no predetermined relationship between the plurality of character strings included in the plurality of evidences.

前記データ処理装置は、前記証憑における所定文字列の位置と前記証憑の領域との関係を示す領域データを記憶する記憶部をさらに有し、前記文字列特定部は、特定した前記共通文字列に関連付けられた前記領域データを参照することにより特定した、前記複数の証憑それぞれの領域内に含まれている複数の文字列を、前記複数の証憑それぞれに記載されている複数の証憑別文字列として特定し、前記データ作成部は、前記文字列特定部が特定した前記複数の証憑別文字列にさらに基づいて前記処理済データを作成してもよい。 The data processing device further includes a storage unit that stores area data indicating a relationship between a position of a predetermined character string in the voucher and an area of the voucher, and the character string specifying unit specifies the specified common character string. A plurality of character strings included in the area of each of the plurality of vouchers, identified by referring to the associated area data, as a plurality of voucher-specific character strings written in each of the plurality of vouchers. and the data creation unit may create the processed data further based on the plurality of voucher-specific character strings identified by the character string identification unit.

前記領域データは、前記所定文字列の位置を基準として、前記証憑の少なくとも2つの頂点又は3つの辺の位置を示すデータであり、前記文字列特定部は、前記領域データに基づいて特定した前記証憑の3つの辺に囲まれた領域内の前記複数の証憑別文字列を特定してもよい。 The area data is data indicating the positions of at least two vertices or three sides of the evidence with respect to the position of the predetermined character string, and the character string specifying unit is configured to specify the position of the specified character string based on the area data. The plurality of voucher-specific character strings within an area surrounded by three sides of the voucher may be specified.

前記領域データは、前記証憑の中心よりも上方にある第1の前記所定文字列の位置と、前記証憑の中心よりも下方にある第2の前記所定文字列の位置と、を基準として、前記証憑の4つの頂点又は4つの辺の位置を示すデータであり、前記文字列特定部は、前記領域データに基づいて特定した前記証憑の4つの辺に囲まれた領域内の前記複数の証憑別文字列を特定してもよい。 The area data is based on the position of the first predetermined character string above the center of the voucher and the position of the second predetermined character string below the center of the voucher. The data is data indicating the positions of four vertices or four sides of the voucher, and the character string specifying unit identifies the plurality of vouchers within an area surrounded by the four sides of the voucher specified based on the area data. You can also specify a string.

本発明の第2の態様のデータ処理方法は、コンピュータが実行する、複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するステップと、前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定するステップと、前記複数の証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するステップと、を有する。 A data processing method according to a second aspect of the present invention includes the step of acquiring evidence image data created by simultaneously reading a plurality of evidences, executed by a computer; identifying a common character string commonly included in the plurality of evidences, and identifying at least some of the plurality of character strings other than the common character string included in the plurality of evidences in a predetermined manner corresponding to the common character string; creating processed data by processing based on rules.

本発明の第3の態様のプログラムは、コンピュータを、複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定する文字列特定部と、前記複数の証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部と、として機能させるためのプログラムである。 A program according to a third aspect of the present invention includes a data acquisition unit that acquires voucher image data created by simultaneously reading a plurality of vouchers; a character string specifying part that identifies a common character string included in the plurality of evidences; This is a program for functioning as a data creation unit that creates processed data by processing based on the rules.

本発明によれば、複数の証憑を同時に読み取って作成された画像データに基づいて、証憑に含まれる文字列が示す情報を適切に処理できるようになるという効果を奏する。 According to the present invention, it is possible to appropriately process information indicated by a character string included in a voucher based on image data created by simultaneously reading a plurality of vouchers.

データ処理システムSの概要を説明するための図である。1 is a diagram for explaining an overview of a data processing system S. FIG. データ処理装置1の構成を示す図である。1 is a diagram showing the configuration of a data processing device 1. FIG. 領域データの一例を示す図である。It is a figure which shows an example of area|region data. 領域データの他の例を示す図である。FIG. 7 is a diagram showing another example of area data. 複数の証憑を読み取ることにより作成された証憑画像データの例を示す図である。FIG. 3 is a diagram showing an example of evidence image data created by reading a plurality of evidences. 複数の証憑を読み取ることにより作成された証憑画像データの例を示す図である。FIG. 3 is a diagram showing an example of evidence image data created by reading a plurality of evidences. データ作成部133が作成した仕訳データの例を示す図である。3 is a diagram illustrating an example of journal data created by a data creation unit 133. FIG. データ作成部133が作成した仕訳データの他の例を示す図である。7 is a diagram showing another example of journal data created by the data creation unit 133. FIG. データ作成部133が証憑の作成順に文字列が配置された処理済データを作成した例を示す図である。13 is a diagram illustrating an example in which the data creation unit 133 creates processed data in which character strings are arranged in the order in which the vouchers were created. FIG. データ作成部133が作成した複数の処理済データの例を示す図である。3 is a diagram illustrating an example of a plurality of processed data created by a data creation unit 133. FIG. データ処理装置1の処理の流れを示すフローチャートである。3 is a flowchart showing the flow of processing of the data processing device 1. FIG. データ作成部133が実行する処理(S15)の流れを示すフローチャートである。It is a flowchart showing the flow of processing (S15) executed by the data creation unit 133.

[データ処理装置システムSの概要]
図1は、データ処理システムSの概要を説明するための図である。データ処理システムSは、領収書、レシート、納品書又は請求書等の証憑を複数枚まとめて読み取った複数の証憑に記載されているデータを処理するためのシステムである。複数の証憑それぞれは、例えば、発行者名と、発行年月日と、購入商品名と、購入商品の金額と、が記載された領収書である。データ処理システムSは、データ処理装置1及び画像読取装置2を有しており、データ処理装置1は、例えば、画像読取装置2が読み取った複数の証憑に共通して記載されている文字列(例えば、発行者名、発行年月)等に基づいて分類された処理済データを作成する。
[Overview of data processing device system S]
FIG. 1 is a diagram for explaining an overview of the data processing system S. As shown in FIG. The data processing system S is a system for processing data written on a plurality of pieces of evidence such as receipts, receipts, statements of delivery, or invoices that are read together. Each of the plurality of vouchers is, for example, a receipt in which the name of the issuer, the date of issue, the name of the purchased product, and the amount of the purchased product are written. The data processing system S includes a data processing device 1 and an image reading device 2, and the data processing device 1 stores, for example, a character string ( For example, processed data is created that is classified based on the issuer's name, issue date, month, etc.

画像読取装置2は、例えばフラットベッドタイプのスキャナ又はデジタルカメラである。データ処理装置1は、証憑画像データを画像読取装置2から直接取得してもよく、他の装置(例えばコンピュータ)から証憑画像データを取得してもよい。以下、証憑が店舗で発行されたレシートである場合を例にして説明する。 The image reading device 2 is, for example, a flatbed type scanner or a digital camera. The data processing device 1 may acquire evidence image data directly from the image reading device 2, or may acquire evidence image data from another device (for example, a computer). An example in which the voucher is a receipt issued at a store will be explained below.

[データ処理装置1の構成]
図2は、データ処理装置1の構成を示す図である。データ処理装置1は、例えばコンピュータであり、証憑を処理して処理済データを作成する企業で使用される。データ処理装置1は、クラウドサーバであってもよい。
[Configuration of data processing device 1]
FIG. 2 is a diagram showing the configuration of the data processing device 1. As shown in FIG. The data processing device 1 is, for example, a computer, and is used in a company that processes evidence and creates processed data. The data processing device 1 may be a cloud server.

データ処理装置1は、通信部11と、記憶部12と、制御部13と、を有する。制御部13は、データ取得部131と、文字列特定部132と、データ作成部133と、を有する。 The data processing device 1 includes a communication section 11, a storage section 12, and a control section 13. The control unit 13 includes a data acquisition unit 131, a character string identification unit 132, and a data creation unit 133.

通信部11は、外部装置(例えば画像読取装置2)から証憑画像データを受信するための通信インターフェースを有する。通信部11は、受信した証憑画像データをデータ取得部131に入力する。また、通信部11は、データ作成部133が作成した処理済データを外部装置(例えば、ディスプレイ、プリンタ又は経理担当者が使用するコンピュータ)に送信する。 The communication unit 11 has a communication interface for receiving evidence image data from an external device (for example, the image reading device 2). The communication unit 11 inputs the received evidence image data to the data acquisition unit 131. Furthermore, the communication unit 11 transmits the processed data created by the data creation unit 133 to an external device (for example, a display, a printer, or a computer used by an accountant).

記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)及びSSD(Solid State Drive)等の記憶媒体を有する。記憶部12は、制御部13が実行するプログラムを記憶する。また、記憶部12は、通信部11が受信した証憑画像データを一時的に記憶する。記憶部12は、制御部13が処理済データを作成するために使用する各種のデータを記憶する。 The storage unit 12 includes storage media such as ROM (Read Only Memory), RAM (Random Access Memory), and SSD (Solid State Drive). The storage unit 12 stores programs executed by the control unit 13. Furthermore, the storage unit 12 temporarily stores the evidence image data received by the communication unit 11. The storage unit 12 stores various data used by the control unit 13 to create processed data.

記憶部12は、例えば、文字列特定部132が証憑に含まれている複数の文字列を特定するために用いる文字列辞書を記憶する。文字列辞書は、文字列特定部132が文字列として認識するべき単語を含む辞書データである。文字列辞書においては、複数の単語それぞれに対して単語の種別を示す情報が含まれていてもよい。単語の種別は、例えば組織名(店名を含む)、商品名、住所、又は請求書専用用語(例えば「消費税」、「合計」)である。文字列辞書においては、1つの単語に複数の種別が関連付けられていてもよい。 The storage unit 12 stores, for example, a character string dictionary used by the character string identification unit 132 to identify a plurality of character strings included in the evidence. The character string dictionary is dictionary data that includes words that the character string specifying unit 132 should recognize as character strings. In the character string dictionary, information indicating the type of word may be included for each of a plurality of words. The type of word is, for example, an organization name (including store name), a product name, an address, or a bill-specific term (for example, "consumption tax" or "total"). In the character string dictionary, one word may be associated with a plurality of types.

記憶部12は、証憑の発行者名、発行者のロゴ、店名等のように、証憑の発行者を特定する文字列、年月日のように証憑の発行時期を示す文字列、又は商品名を示す文字列に関連付けて、複数の証憑に共通に含まれる共通文字列に対応するルールを記憶してもよい。共通文字列は、例えば、複数の証憑に共通する発行者名、証憑の発行時期、又は商品名である。 The storage unit 12 stores a character string that identifies the issuer of the voucher, such as the name of the voucher issuer, the issuer's logo, a store name, etc., a character string that indicates when the voucher was issued, such as the year, month, and day, or the product name. A rule corresponding to a common character string commonly included in a plurality of vouchers may be stored in association with a character string indicating . The common character string is, for example, the issuer's name, issue date of the voucher, or product name that is common to multiple vouchers.

共通文字列に対応するルールは、例えば、複数の証憑に共通する発行者ごと、証憑の発行時期ごと、又は商品ごとに、証憑に記載された共通文字列以外の文字列を含む処理済データをデータ作成部133が作成するためのルールである。共通文字列に対応するルールは、証憑の発行者の業種ごとにデータ作成部133が処理済データを作成するためのルールであってもよい。なお、発行時期は、年、月、日、曜日のいずれかにより表される。発行時期として年、月、日、曜日のいずれを使用するかは、データ処理装置1を用いて処理済データを作成するユーザ(例えば経理担当者)により設定されてもよい。 Rules corresponding to common character strings include, for example, processing data that includes character strings other than the common character strings written on vouchers for each issuer, each voucher issuance period, or each product that is common to multiple vouchers. These are rules for the data creation unit 133 to create. The rule corresponding to the common character string may be a rule for the data creation unit 133 to create processed data for each industry of the issuer of the voucher. Note that the publication date is expressed by year, month, day, or day of the week. Whether to use the year, month, day, or day of the week as the issuance time may be set by a user (for example, an accountant) who creates processed data using the data processing device 1.

記憶部12は、複数の異なる組織が発行した複数の証憑それぞれに関連付けて、証憑における所定文字列の位置と証憑の領域との関係を示す領域データを記憶してもよい。領域データは、共通文字列の位置を基準として、証憑の少なくとも2つの頂点又は3つの辺の位置を示すデータである。領域データは、証憑の中心よりも上方にある第1の所定文字列の位置と、証憑の中心よりも下方にある第2の所定文字列の位置と、を基準として、証憑の4つの頂点又は4つの辺の位置を示すデータであってもよい。所定文字列は、証憑の発行者を示す文字列であり、発行者名、発行者を示すマーク、発行者に特有のキャッチフレーズ等である。 The storage unit 12 may store area data indicating the relationship between the position of a predetermined character string in the voucher and the area of the voucher in association with each of a plurality of vouchers issued by a plurality of different organizations. The area data is data indicating the positions of at least two vertices or three sides of the evidence with reference to the position of the common character string. The area data is based on the position of the first predetermined character string above the center of the document and the position of the second predetermined character string below the center of the document, and the four vertices or It may also be data indicating the positions of the four sides. The predetermined character string is a character string indicating the issuer of the voucher, and includes the issuer's name, a mark indicating the issuer, a catchphrase unique to the issuer, and the like.

図3は、領域データの一例を示す図である。図3(a)に示すように、領域データにおいては、例えば、証憑の発行者名(例えば店名)を示す文字列の左端から証憑の左の辺までの距離D1と、発行者名を示す文字列の右端から証憑の右の辺までの距離D2とが含まれている。図3(b)に示すように、領域データにおいて、発行者名を示す第1の所定文字列の上端から証憑の上の辺までの距離D3と、店名と異なる第2の所定文字列(例えば「合計」)の下端から証憑の下の辺までの距離D4とが含まれていてもよい。1つの組織が発行した証憑であっても距離D1~距離D4にばらつきがある場合、領域データには、距離D1~距離D4の範囲を示す値が含まれていてもよい。 FIG. 3 is a diagram showing an example of area data. As shown in FIG. 3(a), in the area data, for example, the distance D1 from the left end of the character string indicating the name of the issuer of the voucher (for example, the store name) to the left side of the voucher, and the characters indicating the name of the issuer. The distance D2 from the right end of the column to the right side of the voucher is included. As shown in FIG. 3(b), in the area data, a distance D3 from the upper end of the first predetermined character string indicating the issuer name to the upper side of the voucher and a second predetermined character string different from the store name (for example The distance D4 from the lower end of the "total") to the lower side of the voucher may also be included. If there are variations in the distance D1 to distance D4 even for vouchers issued by one organization, the area data may include a value indicating the range of distance D1 to distance D4.

図4は、領域データの他の例を示す図である。図4(a)に示す領域データにおいては、発行者名を示す文字列の左上から証憑の左上の頂点までの横方向の距離D1と縦方向の距離D3、及び発行者名を示す文字列の右上から証憑の右上の頂点までの横方向の距離D2と縦農方向の距離D3が含まれている。2つの頂点を結ぶ線分は証憑の上の辺になり、2つの頂点それぞれを通り、2つの頂点を結ぶ線分と直交する2つの線分が証憑の左右の辺になる。 FIG. 4 is a diagram showing another example of area data. In the area data shown in FIG. 4(a), the horizontal distance D1 and the vertical distance D3 from the upper left of the character string indicating the issuer's name to the upper left vertex of the voucher, and the distance of the character string indicating the issuer's name. It includes the horizontal distance D2 from the upper right to the upper right vertex of the voucher and the vertical distance D3. The line segment connecting the two vertices becomes the upper side of the voucher, and the two line segments that pass through each of the two vertices and are perpendicular to the line segment connecting the two vertices become the left and right sides of the voucher.

図4(b)に示す領域データにおいては、第2の所定文字列である「合計」の左下から証憑の左下の頂点までの横方向の距離D5と縦方向の距離D4、及び「合計」の右下から証憑の右下の頂点までの横方向の距離D6と縦方向の距離D4がさらに含まれている。4つの頂点により形成される四辺形が証憑の輪郭線になる。 In the area data shown in FIG. 4(b), the horizontal distance D5 and the vertical distance D4 from the lower left of the second predetermined character string "total" to the lower left vertex of the voucher, and the vertical distance D4 of "total". It further includes a horizontal distance D6 and a vertical distance D4 from the lower right to the lower right vertex of the voucher. The quadrilateral formed by the four vertices becomes the outline of the evidence.

記憶部12は、データ作成部133が仕訳データを作成するために使用される仕訳用データを記憶してもよい。仕訳用データにおいては、文房具費、食料費、通信費等の勘定科目と、商品名又はサービス名とが関連付けられている。 The storage unit 12 may store journal data used by the data creation unit 133 to create journal data. In the journal data, account items such as stationery expenses, food expenses, and communication expenses are associated with product names or service names.

制御部13は、例えばCPU(Central Processing Unit)を有する。制御部13は、記憶部12に記憶されたプログラムを実行することにより、データ取得部131、文字列特定部132及びデータ作成部133として機能する。 The control unit 13 includes, for example, a CPU (Central Processing Unit). The control unit 13 functions as a data acquisition unit 131, a character string identification unit 132, and a data creation unit 133 by executing a program stored in the storage unit 12.

データ取得部131は、通信部11を介して各種のデータを取得する。データ取得部131は、例えば、複数の証憑を同時に読み取ることにより作成された証憑画像データを画像読取装置2から取得する。データ取得部131は、取得した証憑画像データを文字列特定部132に入力する。 The data acquisition unit 131 acquires various data via the communication unit 11. The data acquisition unit 131 acquires, for example, evidence image data created by simultaneously reading a plurality of vouchers from the image reading device 2. The data acquisition unit 131 inputs the acquired evidence image data to the character string identification unit 132.

データ取得部131は、通信部11を介して、ユーザの指示を示す指示データを取得してもよい。指示データは、例えば、共通文字列の種別を指定するデータである。指示データは、データ作成部133に実行させる処理の内容を示すデータであってもよい。指示データは、共通文字列に対応するルールを指定するデータであってもよい。データ取得部131は、指示データの内容を文字列特定部132又はデータ作成部133に通知する。データ取得部131は、指示データの内容を記憶部12に記憶させてもよい。 The data acquisition unit 131 may acquire instruction data indicating a user's instruction via the communication unit 11. The instruction data is, for example, data specifying the type of common character string. The instruction data may be data indicating the content of the process to be executed by the data creation unit 133. The instruction data may be data specifying a rule corresponding to a common character string. The data acquisition unit 131 notifies the character string identification unit 132 or the data creation unit 133 of the contents of the instruction data. The data acquisition unit 131 may cause the storage unit 12 to store the contents of the instruction data.

文字列特定部132は、OCR(Optical Character Recognition)処理を実行することにより、データ取得部131が取得した証憑画像データに基づいて、証憑画像に含まれている複数の文字を特定する。文字列特定部132は、記憶部12に記憶された文字列辞書を参照することにより、特定した複数の文字に基づいて複数の文字列を特定する。 The character string identifying unit 132 identifies a plurality of characters included in the voucher image based on the voucher image data acquired by the data acquiring unit 131 by executing OCR (Optical Character Recognition) processing. The character string specifying unit 132 specifies a plurality of character strings based on the specified plurality of characters by referring to a character string dictionary stored in the storage unit 12.

文字列特定部132は、特定した複数の文字列のうち、複数の証憑に共通に含まれている共通文字列を特定する。文字列特定部132は、証憑画像データに複数存在する文字列を共通文字列の候補として特定する。文字列特定部132は、共通文字列の候補のうち、例えば、複数の証憑に共通する発行者を示す文字列を共通文字列として特定する。文字列特定部132は、文字列辞書における単語の種別が会社名になっている単語と一致する文字列を、複数の証憑の発行者を示す共通文字列として特定する。共通文字列は、複数の証憑に共通する発行時期を示す文字列であってもよい。 The character string specifying unit 132 specifies a common character string that is commonly included in a plurality of pieces of evidence from among the plurality of specified character strings. The character string identifying unit 132 identifies a plurality of character strings present in the evidence image data as common character string candidates. The character string identifying unit 132 identifies, for example, a character string indicating an issuer common to a plurality of vouchers as a common character string, from among the common character string candidates. The character string identifying unit 132 identifies a character string that matches a word whose type in the character string dictionary is a company name, as a common character string indicating the issuer of a plurality of vouchers. The common character string may be a character string indicating the issuance time common to a plurality of vouchers.

文字列特定部132は、特定した複数の共通文字列の候補それぞれの間の距離が、1枚の証憑の大きさの最小値として記憶部12に記憶された大きさが示す証憑の縦方向の最小長以上であり、かつ横方向の最小長以上であることを条件として、共通文字列として特定してもよい。このようにすることで、文字列特定部132は、「円」のように、1枚の証憑に複数含まれている文字列を共通文字列として特定せず、複数の証憑それぞれに1つだけ含まれている文字列を共通文字列として特定することができる。 The character string specifying unit 132 determines the distance between the identified plurality of common character string candidates in the vertical direction of the voucher indicated by the size stored in the storage unit 12 as the minimum value of the size of one voucher. It may be specified as a common character string on condition that it is longer than the minimum length and longer than the minimum length in the horizontal direction. By doing so, the character string identifying unit 132 does not identify a character string that is included in multiple pieces of evidence, such as "yen", as a common character string, but only identifies one character string for each of multiple vouchers. The included strings can be identified as common strings.

文字列特定部132は、特定した共通文字列に関連付けられた領域データを参照することにより、特定した複数の共通文字列それぞれに対応する複数の証憑それぞれの領域を特定してもよい。文字列特定部132は、特定した複数の証憑それぞれの領域内に含まれている複数の文字列を、複数の証憑それぞれに記載されている複数の証憑別文字列として特定する。 The character string specifying unit 132 may specify the area of each of the plurality of evidences corresponding to each of the plurality of specified common character strings by referring to the area data associated with the specified common character string. The character string specifying unit 132 identifies a plurality of character strings included in the area of each of the identified plurality of vouchers as a plurality of voucher-specific character strings written in each of the plurality of vouchers.

文字列特定部132は、例えば、図3に示した領域データに基づいて特定した証憑の3つの辺に囲まれた領域内の複数の証憑別文字列を特定する。文字列特定部132は、領域データに基づいて特定した証憑の4つの辺に囲まれた領域内の複数の証憑別文字列を特定してもよい。 The character string identifying unit 132 identifies, for example, a plurality of voucher-specific character strings within an area surrounded by three sides of the voucher identified based on the area data shown in FIG. 3 . The character string specifying unit 132 may specify a plurality of voucher-specific character strings within an area surrounded by four sides of the voucher specified based on the area data.

図5及び図6は、複数の証憑を読み取ることにより作成された証憑画像データの例を示す図である。図5においては、「Aショップ」により発行された4枚のレシート(領収書)の画像が含まれている。このような場合、文字列特定部132は、「Aショップ」という共通文字列と「合計」という共通文字列とを特定し、図3又は図4に示した領域データを参照することにより、各証憑の領域として、領域R1、R2、R3、R4を特定する。文字列特定部132は、各領域に含まれている証憑別文字列を特定する。文字列特定部132がこのようにして領域を特定することにより、証憑画像データにおいて各証憑の輪郭線が不明瞭な場合であっても、各証憑の領域を正しく特定できる。その結果、文字列特定部132は、各証憑に対応する証憑別文字列を正しく特定することができる。 FIGS. 5 and 6 are diagrams showing examples of voucher image data created by reading a plurality of vouchers. In FIG. 5, images of four receipts issued by "Shop A" are included. In such a case, the character string specifying unit 132 identifies the common character string "A shop" and the common character string "total", and by referring to the area data shown in FIG. 3 or FIG. Areas R1, R2, R3, and R4 are specified as areas of evidence. The character string specifying unit 132 specifies the document-specific character strings included in each area. By specifying the area in this manner, the character string specifying unit 132 can correctly specify the area of each document even if the outline of each document is unclear in the document image data. As a result, the character string identifying unit 132 can correctly identify the voucher-specific character string corresponding to each voucher.

図6においては、領域R1、R2に含まれているレシートの発行者が「Aショップ」であり、領域R3、R4に含まれているレシートの発行者が「B商店」である。このような場合、文字列特定部132は、共通文字列「Aショップ」に対応する領域として領域R1、R2を特定し、「B商店」に対応する領域として領域R3、R4を特定する。文字列特定部132は、共通文字列「2023年3月」又は「合計」が含まれている領域として、領域R1~R4を特定してもよい。文字列特定部132は、特定した領域ごとに特定した証憑別文字列を、共通文字列に関連付けてデータ作成部133に通知する。 In FIG. 6, the issuer of the receipts included in areas R1 and R2 is "Shop A", and the issuer of the receipts included in areas R3 and R4 is "Shop B". In such a case, the character string identifying unit 132 identifies regions R1 and R2 as regions corresponding to the common character string "A shop", and identifies regions R3 and R4 as regions corresponding to "B store". The character string identifying unit 132 may identify regions R1 to R4 as regions that include the common character string "March 2023" or "total." The character string specifying unit 132 associates the evidence-specific character strings specified for each specified area with the common character string and notifies the data creating unit 133.

データ作成部133は、複数の証憑に含まれている共通文字列以外の少なくとも一部の複数の文字列(すなわち、文字列特定部132が特定した複数の証憑別文字列)を、共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成する。 The data creation unit 133 converts at least some of the plurality of character strings other than the common character string included in the plurality of vouchers (that is, the plurality of voucher-specific character strings identified by the character string identification unit 132) into a common character string. Processed data is created by processing based on a predetermined rule corresponding to.

一例として、共通文字列が、複数の証憑に共通する発行者名、又は複数の証憑に共通する同一業種の発行者名である場合、データ作成部133は、当該発行者名が含まれる複数の証憑に含まれている共通文字列以外のデータが発行者名に関連付けられた処理済データを作成する。データ作成部133は、例えば、共通文字列として特定された「Aショップ」に対応するルールにおいて抽出するべき文字列として定められた複数の文字列を、ルールにおいて定められた形式に配置した表形式の処理済データを作成する。 As an example, if the common character string is an issuer name common to multiple vouchers, or an issuer name of the same industry common to multiple vouchers, the data creation unit 133 Create processed data in which data other than the common character string included in the voucher is associated with the issuer name. The data creation unit 133 stores, for example, a table format in which a plurality of character strings defined as character strings to be extracted in a rule corresponding to "A shop" identified as a common character string are arranged in a format defined in the rule. Create processed data.

データ作成部133は、例えば、複数の証憑に共通する発行者を示す共通文字列が含まれている複数の証憑に含まれているデータを含み、共通文字列が含まれていない証憑に含まれているデータを含まない処理済データを作成する。図5に示す例の場合、データ作成部133は、発行者が「Aショップ」の4枚のレシートそれぞれに含まれている文字列を含む処理済データを作成する。図6に示す例の場合、データ作成部133は、発行者が「Aショップ」の3枚のレシートそれぞれに含まれている文字列を含み、発行者が「B商店」のレシートに含まれている文字列を含まない処理済データを作成する。 For example, the data creation unit 133 includes data included in a plurality of vouchers that include a common character string indicating an issuer that is common to multiple vouchers, and data that is included in vouchers that do not include a common character string. Create processed data that does not contain data. In the example shown in FIG. 5, the data creation unit 133 creates processed data that includes character strings included in each of the four receipts whose issuer is "Shop A." In the example shown in FIG. 6, the data creation unit 133 includes the character strings included in each of the three receipts whose issuer is "Shop A" and the character strings included in the receipt whose issuer is "Shop B". Create processed data that does not contain the specified string.

「Aショップ」と「B商店」の業種が「コンビニエンスストア」である場合、データ作成部133は、「コンビニエンスストア」に関連付けられた処理済データとして、発行者が「Aショップ」の3枚のレシートそれぞれに含まれている文字列と、発行者が「B商店」のレシートに含まれている文字列とを含む処理済データを作成してもよい。処理済データが業種ごとに作成される場合、データ作成部133は、業種に対応するルールに基づいて処理することにより処理済データを作成してもよい。 When the industry type of “Shop A” and “Shop B” is “Convenience Store”, the data creation unit 133 stores three cards whose issuer is “Shop A” as processed data associated with “Convenience Store”. Processed data may be created that includes character strings included in each receipt and character strings included in receipts whose issuer is "B store." When processed data is created for each industry, the data creation unit 133 may create the processed data by processing based on rules corresponding to the industry.

ここで、「Aショップ」に対応するルールが、「税率が10%の商品の仕訳データを作成する」であるとする。この場合、データ作成部133は、複数の領域R1~R4に含まれている文字列から、税率10%に対応する商品を示す文字列を抽出し、抽出した文字列に対応する金額に基づいて仕訳データを作成する。 Here, it is assumed that the rule corresponding to "Shop A" is "Create journal data for products with a tax rate of 10%." In this case, the data creation unit 133 extracts a character string indicating a product corresponding to a tax rate of 10% from the character strings included in the plurality of regions R1 to R4, and based on the amount corresponding to the extracted character string. Create journal data.

図7は、データ作成部133が作成した仕訳データの例を示す図である。図7(a)は、図5に示す証憑画像データに基づいてデータ作成部133が作成した仕訳データであり、図7(b)は、図6に示す証憑画像データに基づいて作成した仕訳データである。 FIG. 7 is a diagram showing an example of journal data created by the data creation unit 133. 7(a) is journal data created by the data creation unit 133 based on the voucher image data shown in FIG. 5, and FIG. 7(b) is journal data created based on the voucher image data shown in FIG. 6. It is.

図5に示す証憑画像データの場合、データ作成部133は、税率10%に対応する商品を示す文字列として、領域R1における「ボールペン ¥120」、「付箋紙 ¥300」、領域R2における「コピー用紙 ¥500」、領域R4における「プリンタインク ¥1250」を抽出する。データ作成部133は、記憶部12に記憶された仕訳用データを参照し、「ボールペン」と「付箋紙」の合計額420円を勘定科目「文具費」として分類し、「コピー用紙」と「プリンタインク」の合計額1750円を勘定科目「印刷費」として分類することにより、図7(a)に示す仕訳データを作成する。 In the case of the voucher image data shown in FIG. 5, the data creation unit 133 creates "ballpoint pen ¥120" and "sticky note ¥300" in area R1 and "copy copy" in area R2 as character strings indicating products corresponding to the 10% tax rate. ``Paper ¥500'' and ``Printer ink ¥1250'' in area R4 are extracted. The data creation unit 133 refers to the journal data stored in the storage unit 12, classifies the total amount of 420 yen of "ballpoint pen" and "sticky note" as the account item "stationery expenses", and classifies the total amount of "copy paper" and " By classifying the total amount of 1,750 yen for "printer ink" as the account item "printing expenses," journal data shown in FIG. 7(a) is created.

図6に示す証憑画像データの場合、データ作成部133は、税率10%に対応する商品を示す文字列として、領域R1における「ボールペン ¥120」、「付箋紙 ¥300」、領域R2における「コピー用紙 ¥500」を抽出する。データ作成部133は、記憶部12に記憶された仕訳用データを参照し、「ボールペン」と「付箋紙」の合計額420円を勘定科目「文具費」として分類し、「コピー用紙」の500円を勘定科目「印刷費」として分類することにより、図7(b)に示す仕訳データを作成する。 In the case of the voucher image data shown in FIG. 6, the data creation unit 133 creates "ballpoint pen ¥120" and "sticky note ¥300" in area R1 and "copy copy" in area R2 as character strings indicating products corresponding to the 10% tax rate. Extract "Paper ¥500". The data creation unit 133 refers to the journal data stored in the storage unit 12, classifies the total amount of 420 yen of “ballpoint pen” and “sticky note” as the account item “stationery expenses”, and classifies the total amount of 420 yen of “ballpoint pen” and “sticky note” as the account item “stationery expenses”, and 500 yen of “copy paper”. By classifying yen as the account item "printing expenses," journal data shown in FIG. 7(b) is created.

文字列特定部132が、複数の証憑に共通する発行時期を示す文字列を共通文字列として特定し、データ作成部133が、共通文字列に対応する発行時期が含まれる複数の証憑に含まれている共通文字列以外のデータが発行時期に関連付けられた処理済データを作成してもよい。 The character string identification unit 132 identifies a character string indicating the issuance time that is common to a plurality of vouchers as a common character string, and the data creation unit 133 identifies a character string that is included in the plurality of vouchers that includes the issuance time that corresponds to the common character string. It is also possible to create processed data in which data other than the common character strings associated with the issuance time are associated.

図8は、図6に示した証憑画像データに基づいてデータ作成部133が作成した仕訳データの他の例を示す図である。図8に示す仕訳データは、共通文字列として発行時期(年月)が指定され、文字列特定部132が共通文字列として2023年3月を特定した場合に作成されている。ここで、共通文字列が発行時期である場合のルールが、「共通文字列に対応する時期に発行された証憑に含まれている商品を勘定科目に分類して仕訳データを作成する」であるとする。 FIG. 8 is a diagram showing another example of journal data created by the data creation unit 133 based on the evidence image data shown in FIG. 6. The journal data shown in FIG. 8 is created when the publication date (year and month) is specified as a common character string, and the character string specifying unit 132 specifies March 2023 as the common character string. Here, if the common character string is the issuance time, the rule is ``Categorize the products included in the vouchers issued at the time corresponding to the common character string into account items and create journal data.'' shall be.

この場合、データ作成部133は、図6に示す証憑画像データの領域R1~R4に対応する全てのレシートに記載された商品を、それぞれに対応する勘定科目に分類することにより、図8に示す仕訳データを作成する。証憑画像データの一部に2023年3月以外の年月に発行された証憑が含まれている場合、データ作成部133は、当該証憑に対応する証憑別文字列に基づかない仕訳データを作成する。 In this case, the data creation unit 133 classifies the products listed on all the receipts corresponding to regions R1 to R4 of the voucher image data shown in FIG. 6 into the corresponding account items, as shown in FIG. 8. Create journal data. If part of the voucher image data includes a voucher issued in a year or month other than March 2023, the data creation unit 133 creates journal data that is not based on the voucher-specific character string corresponding to the voucher. .

データ作成部133は、共通文字列に対応する発行時期が含まれる複数の証憑それぞれに含まれる金額を示す文字列を、証憑の発行時期の順番に配置した処理済データを作成してもよい。図9は、図5又は図6に示した証憑画像データに基づいてデータ作成部133が証憑の作成順に文字列が配置された処理済データを作成した例を示す図である。図9に示す処理済データにおいては、証憑の発行時期(年月日)と、商品名と、金額と、消費税額とが関連付けられている。データ作成部133がこのような処理済データを作成することで、証憑画像データに含まれている複数の証憑の内容を、ユーザが容易に把握できる。このように発行時期の順番に文字列が配置された処理済データは、出張時の精算をする際に好適である。 The data creation unit 133 may create processed data in which character strings indicating amounts included in each of a plurality of vouchers that include issuance times corresponding to the common character string are arranged in the order of the issuance times of the vouchers. FIG. 9 is a diagram showing an example in which the data creation unit 133 creates processed data in which character strings are arranged in the order in which the vouchers were created, based on the voucher image data shown in FIG. 5 or 6. In the processed data shown in FIG. 9, the issuance date (year, month, and day) of the voucher, product name, amount, and consumption tax amount are associated with each other. By the data creation unit 133 creating such processed data, the user can easily understand the contents of the plurality of evidences included in the evidence image data. Processed data in which character strings are arranged in the order of issue date is suitable for making payments during business trips.

共通文字列が発行時期である場合、データ作成部133は、予め登録された商品と金額とを抜き出した処理済データを作成してもよい。予め登録された商品は、例えば、社員が会社に請求することが認められている商品である。データ作成部133がこのような処理済データを作成することで、ユーザ(例えば経理担当者)が、社員が費用を立て替えて商品を購入した場合の複数のレシートに記載された費用のうち、社員に支払うべき費用を容易に把握することができる。 When the common character string is the issuance time, the data creation unit 133 may create processed data by extracting the products and amounts registered in advance. The pre-registered products are, for example, products that employees are permitted to request from the company. By creating such processed data by the data creation unit 133, a user (for example, an accountant) can calculate the amount of the employee's expenses among the expenses listed on multiple receipts when an employee purchases a product with the expenses paid in advance. You can easily understand the costs you should pay.

共通文字列が、購入商品名を示す文字列である場合、データ作成部133は、購入商品名と、購入商品名ごとに金額を合算した合計額とが関連付けられた処理済データを作成してもよい。データ作成部133は、例えば、購入商品名に対応する勘定科目と合計額とが関連付けられた処理済データを作成する。 When the common character string is a character string indicating the name of a purchased product, the data creation unit 133 creates processed data in which the name of the purchased product is associated with the total amount of money for each purchased product name. Good too. For example, the data creation unit 133 creates processed data in which the account item corresponding to the purchased product name and the total amount are associated.

図5又は図6に示した証憑画像データの例の場合、文字列特定部132が「お茶」を共通文字列として特定し、データ作成部133は、領域R1に含まれている「お茶」の500円と、領域R3に含まれている「お茶」の200円とを合算し、「お茶」と「700円」とが関連付けられた処理済データを作成する。データ作成部133は、他の商品名と金額とがさらに含まれる処理済データを作成してもよい。データ作成部133がこのような処理済データを作成することで、ユーザは、複数の証憑に同一名の商品が含まれている場合に、当該商品の合計金額を容易に把握することができる。 In the case of the example of the evidence image data shown in FIG. 5 or 6, the character string specifying unit 132 specifies “tea” as a common character string, and the data creation unit 133 specifies “tea” included in region R1. 500 yen and 200 yen of "tea" included in area R3, and processed data in which "tea" and "700 yen" are associated is created. The data creation unit 133 may create processed data that further includes other product names and amounts. By creating such processed data by the data creation unit 133, the user can easily grasp the total price of the products when a plurality of vouchers include products with the same name.

データ作成部133は、第1の共通文字列が含まれている複数の証憑に含まれているデータに基づく第1の処理済データと、第2の共通文字列が含まれている複数の証憑に含まれているデータに基づく第2の処理済データと、を作成してもよい。共通文字列は、証憑の発行者名であってもよく、発行時期であってもよく、商品名であってもよい。 The data creation unit 133 generates first processed data based on data included in the plurality of evidences including the first common character string, and first processed data based on data included in the plurality of evidences including the second common character string. and second processed data based on data included in the second processed data. The common character string may be the name of the issuer of the voucher, the date of issue, or the name of the product.

図10は、図6に示した証憑画像データに基づいてデータ作成部133が作成した複数の処理済データの例を示す図である。図10(a)は、第1の共通文字列「Aショップ」が含まれている領域R1、R2に対応するレシートに基づく第1の処理済データの例を示す。図10(b)は、第2の共通文字列「B商店」が含まれている領域R3、R4に対応するレシートに基づく第2の処理済データの例を示す。 FIG. 10 is a diagram showing an example of a plurality of processed data created by the data creation unit 133 based on the evidence image data shown in FIG. FIG. 10A shows an example of first processed data based on receipts corresponding to regions R1 and R2 that include the first common character string "A shop". FIG. 10(b) shows an example of second processed data based on the receipts corresponding to regions R3 and R4 that include the second common character string "B store".

複数の証憑に、発行時期が2023年3月の証憑と、発行時期が2023年4月の証憑とが混在している場合、データ作成部133は、第1の共通文字列「2023年3月」が含まれている複数のレシートに基づく第1の処理済データと、第2の共通文字列「2023年4月」が含まれている複数のレシートに基づく第2の処理済データとを作成してもよい。このように、データ作成部133が複数の共通文字列それぞれに対応する処理済データを作成することで、ユーザのニーズに合わせて複数の証憑に含まれている文字列が分類された複数の処理済データが作成されるので、ユーザが証憑に含まれているデータを活用しやすくなる。 If the plurality of vouchers includes a voucher issued in March 2023 and a voucher issued in April 2023, the data creation unit 133 creates a first common character string "March 2023". ” and second processed data based on multiple receipts that include a second common character string “April 2023” are created. You may. In this way, by creating processed data corresponding to each of a plurality of common character strings by the data creation unit 133, it is possible to perform a plurality of processes in which character strings included in a plurality of vouchers are classified according to the user's needs. Since the completed data is created, it becomes easier for the user to utilize the data included in the evidence.

データ作成部133は、複数の証憑に含まれている複数の文字列が所定の条件を満たしていない場合に、警告を示すデータを作成してもよい。所定の条件は、ユーザにより指定された条件又は予め記憶部12に記憶された条件である。データ作成部133は、例えば、複数の証憑に含まれている複数の文字列の間に所定の関連性がない場合に、警告を示すデータを作成する。 The data creation unit 133 may create data indicating a warning when a plurality of character strings included in a plurality of vouchers do not satisfy a predetermined condition. The predetermined conditions are conditions specified by the user or conditions stored in the storage unit 12 in advance. For example, the data creation unit 133 creates data indicating a warning when there is no predetermined relationship between a plurality of character strings included in a plurality of vouchers.

一例として、データ作成部133は、図6に示した証憑画像データのように、一部の複数の証憑(領域R1、R2の証憑)に含まれている共通文字列(例えば「Aショップ」)が他の証憑(領域R3、R4の証憑)に含まれていない場合に、警告を示すデータを作成する。データ作成部133は、通信部11を介して、所定の条件が満たされていないことを示す警告文を出力してもよく、警告が記載された処理済データを出力してもよい。 As an example, the data creation unit 133 generates a common character string (for example, "A shop") included in some of the plurality of evidences (evidences in areas R1 and R2), as in the evidence image data shown in FIG. is not included in other evidences (evidences in areas R3 and R4), data indicating a warning is created. The data creation unit 133 may output, via the communication unit 11, a warning message indicating that a predetermined condition is not met, or may output processed data in which the warning is written.

データ作成部133は、一部の証憑に含まれている一部の商品が属する勘定科目が、他の証憑に含まれている商品が属する勘定科目と異なっている場合に、警告データを作成してもよい。例えば、データ作成部133は、証憑画像データに文房具のレシートが複数含まれており、1枚だけタクシー代のレシートが含まれている場合に警告データを作成する。データ作成部133は、証憑に記載されている住所、又は記憶部12に記憶された発行者名に対応する住所に基づいて、複数の証憑の発行者(例えば店舗)の場所間の距離が閾値以上である場合に警告データを作成してもよい。 The data creation unit 133 creates warning data when the account items to which some products included in some vouchers belong are different from the account items to which products included in other vouchers belong. You can. For example, the data creation unit 133 creates warning data when the evidence image data includes a plurality of receipts for stationery and only one receipt for a taxi fare. The data creation unit 133 determines that the distance between the locations of issuers (for example, stores) of a plurality of vouchers is a threshold based on the address written on the voucher or the address corresponding to the issuer name stored in the storage unit 12. Warning data may be created in the above cases.

データ作成部133は、所定の条件を満たしていない証憑を特定するための情報を含む警告データを出力してもよい。図6に示した証憑画像データの場合、データ作成部133は、例えば、領域R3、R4を他の領域と異なる表示態様で表示した画像データを警告データとして出力してもよい。 The data creation unit 133 may output warning data that includes information for identifying evidence that does not meet predetermined conditions. In the case of the evidence image data shown in FIG. 6, the data creation unit 133 may output, for example, image data in which regions R3 and R4 are displayed in a different display manner from other regions as warning data.

[データ処理装置1における処理の流れ]
図11は、データ処理装置1の処理の流れを示すフローチャートである。図11に示すフローチャートは、複数の証憑を受け取ったユーザが画像読取装置2を用いて複数の証憑を読み取った時点から開始している。
[Flow of processing in data processing device 1]
FIG. 11 is a flowchart showing the flow of processing of the data processing device 1. The flowchart shown in FIG. 11 starts from the time when the user who received the plurality of evidences uses the image reading device 2 to read the plurality of evidences.

データ取得部131は、画像読取装置2が作成した証憑画像データを取得する(S11)。文字列特定部132は、証憑画像データに含まれている共通文字列を特定する(S12)。文字列特定部132は、領域データを参照することにより、特定した共通文字列に対応する複数の証憑領域を特定する(S13)。続いて、文字列特定部132は、特定した複数の証憑領域それぞれに含まれる複数の文字列を証憑別文字列として特定する(S14)。 The data acquisition unit 131 acquires the evidence image data created by the image reading device 2 (S11). The character string identifying unit 132 identifies common character strings included in the evidence image data (S12). The character string specifying unit 132 specifies a plurality of evidence areas corresponding to the specified common character string by referring to the area data (S13). Subsequently, the character string specifying unit 132 specifies a plurality of character strings included in each of the specified plurality of evidence areas as a document-specific character string (S14).

続いて、データ作成部133は、特定された複数の文字列に基づく処理を実行する(S15)。データ作成部133が実行する処理の詳細については後述する。データ作成部133は、処理の結果に基づいて処理済データを作成し(S16)、通信部11を介して、作成した処理済データを出力する(S17)。 Subsequently, the data creation unit 133 executes processing based on the specified plurality of character strings (S15). Details of the processing executed by the data creation unit 133 will be described later. The data creation unit 133 creates processed data based on the processing result (S16), and outputs the created processed data via the communication unit 11 (S17).

図12は、データ作成部133が実行する処理(S15)の流れを示すフローチャートである。データ作成部133は、データ取得部131が取得した指示データに基づいて、複数の文字列を発行者別に処理するか否かを判定する(S151)。データ作成部133は、複数の文字列を発行者別に処理すると判定した場合(S151においてYES)、同一の発行者が発行した証憑に含まれている商品を示す文字列及び金額を示す文字列に基づいて、仕訳処理を実行する(S152)。 FIG. 12 is a flowchart showing the flow of the process (S15) executed by the data creation unit 133. Based on the instruction data acquired by the data acquisition unit 131, the data creation unit 133 determines whether or not to process a plurality of character strings for each issuer (S151). If the data creation unit 133 determines that multiple character strings are to be processed for each issuer (YES in S151), the data creation unit 133 processes the character strings indicating the product and the amount included in the vouchers issued by the same issuer. Based on this, journal processing is executed (S152).

データ作成部133は、複数の文字列を発行者別に処理せず、発行時期別に処理すると判定した場合(S151においてNO、S153においてYES)、発行時期が同一の複数の証憑に含まれている商品を示す文字列及び金額を示す文字列に基づいて、仕訳処理を実行する(S154)。データ作成部133は、発行時期別に処理しないと判定した場合(S153においてNO)、証憑画像データに含まれる全ての商品を示す文字列及び金額を示す文字列に基づいて、仕訳処理を実行する(S155)。 If the data creation unit 133 determines that multiple character strings are not processed by issuer but by issuance date (NO in S151, YES in S153), the product is included in multiple vouchers with the same issuance date. Journal processing is executed based on the character string indicating the amount and the character string indicating the amount (S154). If the data creation unit 133 determines that processing is not to be performed by issue date (NO in S153), the data creation unit 133 executes journal entry processing based on the character strings representing all products and the character strings representing amounts included in the voucher image data ( S155).

[データ処理装置1による効果]
以上説明したように、データ処理装置1は、複数の証憑を同時に読み取ることにより作成された証憑画像データに基づいて、複数の証憑に共通に含まれている共通文字列を特定する文字列特定部132と、複数の証憑に含まれている共通文字列以外の少なくとも一部の複数の文字列を、共通文字列に対応する所定のルールに基づいて処理することにより処理済データを作成するデータ作成部133と、を有する。
[Effects of data processing device 1]
As described above, the data processing device 1 includes a character string identification unit that identifies a common character string commonly included in a plurality of vouchers based on voucher image data created by simultaneously reading a plurality of vouchers. 132, and data creation in which processed data is created by processing at least some of the plurality of character strings other than the common character string included in the plurality of vouchers based on a predetermined rule corresponding to the common character string. 133.

以上、実施の形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes can be made within the scope of the gist. be. For example, all or part of the device can be functionally or physically distributed and integrated into arbitrary units. In addition, new embodiments created by arbitrary combinations of multiple embodiments are also included in the embodiments of the present invention. The effects of the new embodiment resulting from the combination have the effects of the original embodiment.

1 データ処理装置
2 画像読取装置
11 通信部
12 記憶部
13 制御部
131 データ取得部
132 文字列特定部
133 データ作成部
1 Data processing device 2 Image reading device 11 Communication section 12 Storage section 13 Control section 131 Data acquisition section 132 Character string specification section 133 Data creation section

Claims (15)

複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、
前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている前記証憑の発行者名、前記証憑の発行時期、又は商品名を示す文字列である共通文字列を特定する文字列特定部と、
複数の前記証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定の仕訳ルールに基づいて処理することにより、仕訳データを作成するデータ作成部と、
を有するデータ処理装置。
a data acquisition unit that acquires voucher image data created by simultaneously reading multiple vouchers;
Character string identification that identifies a common character string that is a character string indicating the name of the issuer of the voucher, the date of issue of the voucher, or the name of the product, which is commonly included in a plurality of vouchers, based on the voucher image data; Department and
Creating journal data by processing at least some of the plurality of character strings other than the common character string included in the plurality of vouchers based on a predetermined journal entry rule corresponding to the common character string. data creation department,
A data processing device having:
前記データ作成部は、前記共通文字列が含まれている複数の前記証憑に含まれているデータを含み、前記共通文字列が含まれていない前記証憑に含まれているデータを含まない前記仕訳データを作成する、
請求項1に記載のデータ処理装置。
The data creation unit generates the journal entry that includes data included in the plurality of vouchers that include the common character string, and that does not include data included in the vouchers that do not include the common character string. create data,
The data processing device according to claim 1.
前記データ作成部は、第1の前記共通文字列が含まれている複数の前記証憑に含まれているデータに基づく第1の前記仕訳データと、第2の前記共通文字列が含まれている複数の前記証憑に含まれているデータに基づく第2の前記仕訳データと、を作成する、
請求項1に記載のデータ処理装置。
The data creation unit includes the first journal data based on data included in the plurality of evidences including the first common character string, and the second common character string. creating second said journal entry data based on data included in a plurality of said vouchers;
The data processing device according to claim 1.
前記共通文字列は、複数の前記証憑に共通する発行者名、又は複数の前記証憑に共通する同一業種の発行者名であり、
前記データ作成部は、当該発行者名が含まれる複数の前記証憑に含まれている前記共通文字列以外のデータが前記発行者名に関連付けられた前記仕訳データを作成する、
請求項1に記載のデータ処理装置。
The common character string is an issuer name common to a plurality of the vouchers, or an issuer name of the same industry common to a plurality of vouchers,
The data creation unit creates the journal data in which data other than the common character string included in the plurality of vouchers including the issuer name is associated with the issuer name.
The data processing device according to claim 1.
前記共通文字列は、複数の前記証憑に共通する発行時期を示す文字列であり、
前記データ作成部は、前記共通文字列に対応する発行時期が含まれる複数の前記証憑に含まれている前記共通文字列以外のデータが前記発行時期に関連付けられた前記仕訳データを作成する、
請求項1に記載のデータ処理装置。
The common character string is a character string indicating an issuance time common to a plurality of the vouchers,
The data creation unit creates the journal data in which data other than the common character string included in the plurality of vouchers including the issuance time corresponding to the common character string is associated with the issuance time.
The data processing device according to claim 1.
前記共通文字列は、複数の前記証憑に共通する発行時期を示す文字列であり、
前記データ作成部は、前記共通文字列に対応する発行時期が含まれる複数の前記証憑それぞれに含まれる金額を示す文字列を、前記発行時期の順番に配置した前記仕訳データを作成する、
請求項1に記載のデータ処理装置。
The common character string is a character string indicating an issuance time common to a plurality of the vouchers,
The data creation unit creates the journal data in which character strings indicating amounts included in each of the plurality of vouchers including the issuance time corresponding to the common character string are arranged in the order of the issuance time.
The data processing device according to claim 1.
前記複数の証憑それぞれは、購入商品名と、購入商品の金額と、が記載された領収書であり、
前記共通文字列は、前記購入商品名を示す文字列であり、
前記データ作成部は、前記購入商品名と、前記購入商品名ごとに前記金額を合算した合計額とが関連付けられた前記仕訳データを作成する、
請求項1に記載のデータ処理装置。
Each of the plurality of vouchers is a receipt in which the name of the purchased product and the amount of the purchased product are written,
The common character string is a character string indicating the name of the purchased product,
The data creation unit creates the journal data in which the purchased product name and the total amount obtained by adding up the amount for each purchased product name are associated.
The data processing device according to claim 1.
前記データ作成部は、前記購入商品名に対応する勘定科目と前記合計額とが関連付けられた前記仕訳データを作成する、
請求項7に記載のデータ処理装置。
The data creation unit creates the journal data in which the account item corresponding to the purchased product name and the total amount are associated.
The data processing device according to claim 7.
前記データ作成部は、前記複数の証憑に含まれている複数の文字列が所定の条件を満たしていない場合に、警告を示すデータを作成する、
請求項1に記載のデータ処理装置。
The data creation unit creates data indicating a warning when a plurality of character strings included in the plurality of evidences do not satisfy a predetermined condition.
The data processing device according to claim 1.
前記データ作成部は、前記複数の証憑に含まれている前記複数の文字列の間に所定の関連性がない場合に、前記警告を示すデータを作成する、
請求項9に記載のデータ処理装置。
The data creation unit creates data indicating the warning when there is no predetermined relationship between the plurality of character strings included in the plurality of evidences.
The data processing device according to claim 9.
複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、
前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている共通文字列を特定する文字列特定部と、
複数の前記証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定の仕訳ルールに基づく仕訳データを作成するデータ作成部と、
前記証憑における所定文字列の位置と前記証憑の領域との関係を示す領域データを記憶する記憶部と、を有し、
前記文字列特定部は、特定した前記共通文字列に関連付けられた前記領域データを参照することにより特定した、前記複数の証憑それぞれの領域内に含まれている複数の文字列を、前記複数の証憑それぞれに記載されている複数の証憑別文字列として特定し、
前記データ作成部は、前記文字列特定部が特定した前記複数の証憑別文字列にさらに基づいて前記仕訳データを作成する、
データ処理装置。
a data acquisition unit that acquires voucher image data created by simultaneously reading multiple vouchers;
a character string identification unit that identifies a common character string commonly included in a plurality of the evidences based on the evidence image data;
a data creation unit that creates journal entry data based on a predetermined journal entry rule corresponding to the common character string from at least some of the plurality of character strings other than the common character string included in the plurality of vouchers;
a storage unit that stores area data indicating a relationship between a position of a predetermined character string in the voucher and an area of the voucher;
The character string specifying unit identifies a plurality of character strings included in the area of each of the plurality of vouchers, which is specified by referring to the area data associated with the specified common character string. Identified as multiple voucher-specific character strings written on each voucher,
The data creation unit creates the journal data further based on the plurality of voucher-specific character strings identified by the character string identification unit.
Data processing equipment.
前記領域データは、前記所定文字列の位置を基準として、前記証憑の少なくとも2つの頂点又は3つの辺の位置を示すデータであり、
前記文字列特定部は、前記領域データに基づいて特定した前記証憑の3つの辺に囲まれた領域内の前記複数の証憑別文字列を特定する、
請求項11に記載のデータ処理装置。
The area data is data indicating the positions of at least two vertices or three sides of the evidence with reference to the position of the predetermined character string,
The character string identification unit identifies the plurality of voucher-specific character strings within an area surrounded by three sides of the voucher identified based on the area data.
The data processing device according to claim 11.
前記領域データは、前記証憑の中心よりも上方にある第1の前記所定文字列の位置と、前記証憑の中心よりも下方にある第2の前記所定文字列の位置と、を基準として、前記証憑の4つの頂点又は4つの辺の位置を示すデータであり、
前記文字列特定部は、前記領域データに基づいて特定した前記証憑の4つの辺に囲まれた領域内の前記複数の証憑別文字列を特定する、
請求項11に記載のデータ処理装置。
The area data is based on the position of the first predetermined character string above the center of the voucher and the position of the second predetermined character string below the center of the voucher. Data indicating the positions of the four vertices or four sides of the evidence,
The character string identification unit identifies the plurality of voucher-specific character strings within an area surrounded by four sides of the voucher identified based on the area data.
The data processing device according to claim 11.
コンピュータが実行する、
複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するステップと、
前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている前記証憑の発行者名、前記証憑の発行時期、又は商品名を示す文字列である共通文字列を特定するステップと、
前記複数の証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定の仕訳ルールに基づいて処理することにより、仕訳データを作成するステップと、
を有するデータ処理方法。
computer executes
acquiring evidence image data created by simultaneously reading multiple vouchers;
identifying a common character string, which is a character string indicating the name of the issuer of the voucher, the date of issue of the voucher, or the name of the product, which is commonly included in a plurality of vouchers, based on the voucher image data;
Create journal data by processing at least some of the plurality of character strings other than the common character string included in the plurality of vouchers based on a predetermined journal entry rule corresponding to the common character string. step and
A data processing method having.
コンピュータを、
複数の証憑を同時に読み取ることにより作成された証憑画像データを取得するデータ取得部と、
前記証憑画像データに基づいて、複数の前記証憑に共通に含まれている前記証憑の発行者名、前記証憑の発行時期、又は商品名を示す文字列である共通文字列を特定する文字列特定部と、
前記複数の証憑に含まれている前記共通文字列以外の少なくとも一部の複数の文字列を、前記共通文字列に対応する所定の仕訳ルールに基づいて処理することにより、仕訳データを作成するデータ作成部と、
として機能させるためのプログラム。
computer,
a data acquisition unit that acquires voucher image data created by simultaneously reading multiple vouchers;
Character string identification that identifies a common character string that is a character string indicating the name of the issuer of the voucher, the date of issue of the voucher, or the name of the product, which is commonly included in a plurality of vouchers, based on the voucher image data; Department and
Create journal data by processing at least some of the plurality of character strings other than the common character string included in the plurality of vouchers based on a predetermined journal entry rule corresponding to the common character string. data creation department,
A program to function as
JP2023519782A 2023-03-29 2023-03-29 Data processing device, data processing method and program Active JP7429365B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023012981 2023-03-29

Publications (1)

Publication Number Publication Date
JP7429365B1 true JP7429365B1 (en) 2024-02-08

Family

ID=89771077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023519782A Active JP7429365B1 (en) 2023-03-29 2023-03-29 Data processing device, data processing method and program

Country Status (1)

Country Link
JP (1) JP7429365B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126998A (en) 2002-10-03 2004-04-22 Seiko Epson Corp Information processing system
JP2006268227A (en) 2005-03-23 2006-10-05 Hitachi Software Eng Co Ltd Electronic accounting system equipped with voucher tracing function
JP2017087572A (en) 2015-11-10 2017-05-25 株式会社リコー Duty-free sales document preparation system, duty-free sales document preparation apparatus, duty-free sales document preparation program, and duty-free sales document preparation method
JP2018173935A (en) 2017-12-05 2018-11-08 ファーストアカウンティング株式会社 Accounting processing system
JP2020184207A (en) 2019-05-08 2020-11-12 キヤノン株式会社 Image processing device, image processing method and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126998A (en) 2002-10-03 2004-04-22 Seiko Epson Corp Information processing system
JP2006268227A (en) 2005-03-23 2006-10-05 Hitachi Software Eng Co Ltd Electronic accounting system equipped with voucher tracing function
JP2017087572A (en) 2015-11-10 2017-05-25 株式会社リコー Duty-free sales document preparation system, duty-free sales document preparation apparatus, duty-free sales document preparation program, and duty-free sales document preparation method
JP2018173935A (en) 2017-12-05 2018-11-08 ファーストアカウンティング株式会社 Accounting processing system
JP2020184207A (en) 2019-05-08 2020-11-12 キヤノン株式会社 Image processing device, image processing method and program

Similar Documents

Publication Publication Date Title
US5433483A (en) Consumer-initiated, automatic classified expenditure bank check system
JPH07110841A (en) Method and apparatus for processing of securities
US20070175977A1 (en) System, method, and computer program product for processing payments with a virtual preauthorized draft
JP6504514B1 (en) Document classification system and method and accounting system and method.
JPH0736979A (en) Security exchange processor
JP2014206963A (en) Accounting processing system, program for accounting processing and financial form
JP2019016045A (en) Accounting apparatus and program
JP2022009074A (en) Information processor, program and processing method
JP6895632B1 (en) Accounting equipment, accounting systems, accounting methods and programs
US11966890B2 (en) Bill identification method, device, electronic device and computer-readable storage medium
JP7429365B1 (en) Data processing device, data processing method and program
JP6535257B2 (en) Payment notice processing system and payment notice processing method
JP2018147230A (en) Tax exemption processing apparatus and program
JP6993200B2 (en) Data display device, data display method and data display program
JP6575207B2 (en) Voucher search method, information processing apparatus, and voucher search program
JP2011227787A (en) Accounting transaction information reading device
WO2022038707A1 (en) Data processing device, data processing method, and program
US20080184108A1 (en) Editing and printing system, editing system, method and computer-readable medium
US20160379198A1 (en) Commodity sales data processing apparatus
US20230137138A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium that stores program
JP6835382B1 (en) Electronic data judgment system, electronic data judgment device, electronic data judgment method, electronic data judgment program
JP6855641B1 (en) Data processing equipment, data processing methods and programs
WO2023007612A1 (en) Data processing device, data processing method, and program
JPH08263576A (en) System for creation of document information database
Douma A Paper World: Before Finances Went Digital

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230329

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230912

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20231014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240117

R150 Certificate of patent or registration of utility model

Ref document number: 7429365

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150