JP6810303B1 - Data processing equipment, data processing method and data processing program - Google Patents
Data processing equipment, data processing method and data processing program Download PDFInfo
- Publication number
- JP6810303B1 JP6810303B1 JP2020542356A JP2020542356A JP6810303B1 JP 6810303 B1 JP6810303 B1 JP 6810303B1 JP 2020542356 A JP2020542356 A JP 2020542356A JP 2020542356 A JP2020542356 A JP 2020542356A JP 6810303 B1 JP6810303 B1 JP 6810303B1
- Authority
- JP
- Japan
- Prior art keywords
- unit
- display
- display area
- displayed
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
データ処理装置1は、証憑データを取得するデータ取得部151と、証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する領域特定部152と、表示領域に表示されている数値である表示数値を特定する数値特定部153と、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、領域特定部152が表示領域を正しく特定できたか否かを判定する判定部154と、判定部154が表示領域を正しく特定できていないと判定した場合に、領域特定部152が特定した表示領域を示す情報を表示部に表示させる受付部156と、を有する。The data processing device 1 displays in the display area: a data acquisition unit 151 for acquiring voucher data, an area specifying unit 152 for specifying a display area including a plurality of items corresponding to numerical values among the display areas indicated by the voucher data. Whether or not the area specifying unit 152 can correctly specify the display area based on the result of adding at least a part of the specified display value and the numerical value specifying unit 153 that specifies the displayed value, which is the numerical value. The determination unit 154 for determining the above, and the reception unit 156 for displaying the information indicating the display area specified by the area identification unit 152 on the display unit when the determination unit 154 determines that the display area cannot be correctly specified. Have.
Description
本発明は、証憑データを処理するデータ処理装置、データ処理方法及びデータ処理プログラムに関する。 The present invention relates to a data processing apparatus, a data processing method, and a data processing program for processing voucher data.
請求書等の証憑データの画像データから商品名及び金額を読み取り、読み取った商品名及び金額に基づいて仕訳データを作成する会計処理システムが知られている(例えば、特許文献1を参照)。 There is known an accounting system that reads a product name and amount from image data of voucher data such as an invoice and creates journal data based on the read product name and amount (see, for example, Patent Document 1).
証憑データの画像データでは、金額の表示領域が小さいことから金額の位置を正しく読み取れないことがある。この場合には、証憑データ内の金額が正しく読み取られないため、証憑データを管理するシステムに、正しい金額が登録されない。その結果、正しい金額が登録されたのかを経理担当者が逐一確認する必要があり、業務効率が低下していた。 In the image data of the voucher data, the position of the amount may not be read correctly because the display area of the amount is small. In this case, since the amount in the voucher data cannot be read correctly, the correct amount is not registered in the system for managing the voucher data. As a result, the accounting staff had to confirm whether the correct amount was registered one by one, resulting in a decrease in business efficiency.
そこで、本発明はこれらの点に鑑みてなされたものであり、経理担当者の確認作業を軽減することを目的とする。 Therefore, the present invention has been made in view of these points, and an object of the present invention is to reduce the confirmation work of the accounting staff.
本発明の第1の態様に係るデータ処理装置は、証憑データを取得するデータ取得部と、前記証憑データにおける数値に対応する複数の項目を含む表示領域を特定する領域特定部と、前記表示領域に表示されている数値である表示数値を特定する数値特定部と、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部と、前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部と、を有する。 The data processing device according to the first aspect of the present invention includes a data acquisition unit for acquiring voucher data, an area specifying unit for specifying a display area including a plurality of items corresponding to numerical values in the voucher data, and the display area. Was the area identification unit correctly specifying the display area based on the result of adding at least a part of the specified display value and the numerical value specifying unit that specifies the display value that is the numerical value displayed in? A determination unit that determines whether or not, and a display control unit that causes the display unit to display information indicating the display area specified by the area identification unit when the determination unit determines that the display area cannot be correctly specified. And have.
前記判定部は、所定列に表示されている複数の前記表示数値と、前記所定列に表示されている複数の前記表示数値を合計した数値を示す表示合計値とを特定し、前記所定列に表示されている複数の前記表示数値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。 The determination unit identifies a plurality of the displayed numerical values displayed in the predetermined column and a display total value indicating a total value of the plurality of the displayed numerical values displayed in the predetermined column, and sets the predetermined column. When the total value of the plurality of displayed numerical values and the displayed total value do not match, it may be determined that the area specifying unit cannot correctly specify the display area.
前記判定部は、所定行に表示されている複数の前記表示数値と、前記所定行に表示されている複数の前記表示数値に基づいて所定の演算を行った結果を示す表示演算値とを特定し、前記所定行に表示されている複数の前記表示数値の演算値と、前記表示演算値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。 The determination unit specifies a plurality of the displayed numerical values displayed on the predetermined line and a display calculation value indicating the result of performing a predetermined calculation based on the plurality of the displayed numerical values displayed on the predetermined line. However, even if it is determined that the area specifying unit cannot correctly specify the display area when the calculated values of the plurality of displayed numerical values displayed on the predetermined line do not match the displayed calculated values. Good.
前記判定部は、複数行のそれぞれにおいて表示されている複数の表示数値の演算値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。 In the determination unit, when the total value of the calculated values of the plurality of display values displayed in each of the plurality of lines does not match the display total value, the area identification unit can correctly specify the display area. It may be determined that there is no such thing.
前記データ処理装置は、前記表示領域の少なくとも一部を囲う一以上の枠線を前記証憑データに重畳して表示部に表示させ、前記一以上の枠線のうち、いずれかの枠線の選択を受け付ける受付部をさらに有し、前記数値特定部は、選択された前記枠線に含まれる領域内の前記表示数値を再度特定してもよい。 The data processing device superimposes one or more borders surrounding at least a part of the display area on the voucher data and displays them on the display unit, and selects one of the one or more borders. The numerical value specifying unit may further specify the displayed numerical value in the area included in the selected frame line.
前記データ処理装置は、前記証憑データに含まれている複数の文字列を特定し、前記複数の文字列のうち、正しく認識されている蓋然性が閾値以上である複数の認識文字列の位置に基づいて前記一以上の枠線を作成する枠線作成部をさらに有してもよい。 The data processing device identifies a plurality of character strings included in the voucher data, and is based on the positions of a plurality of recognized character strings whose probability of being correctly recognized is equal to or higher than a threshold value among the plurality of character strings. Further, it may have a frame line creating unit for creating one or more of the borders.
前記データ取得部が過去に取得した前記証憑データと、当該証憑データに対して正しいと判定された前記表示領域に対応する枠線とを教師データとして学習し、前記証憑データの入力に対して、複数の前記枠線を出力するモデルを記憶する記憶部を有し、前記受付部は、前記データ取得部が取得した前記証憑データを前記モデルに入力し、前記モデルから出力された複数の前記枠線を前記証憑データに重畳して表示部に表示させてもよい。 The voucher data acquired in the past by the data acquisition unit and the frame line corresponding to the display area determined to be correct for the voucher data are learned as teacher data, and the voucher data is input. The reception unit has a storage unit that stores a model that outputs a plurality of the frame lines, and the reception unit inputs the voucher data acquired by the data acquisition unit into the model, and the plurality of frames output from the model. The line may be superimposed on the voucher data and displayed on the display unit.
本発明の第2の態様に係るデータ処理方法は、コンピュータが実行する、証憑データを取得するステップと、前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定するステップと、前記表示領域に表示されている数値である表示数値を特定するステップと、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記表示領域を特定するステップにおいて前記表示領域を正しく特定できたか否かを判定するステップと、前記表示領域を正しく特定できていないと判定した場合に、前記表示領域を特定するステップにおいて特定された前記表示領域を示す情報を表示部に表示させるステップと、を有する。 The data processing method according to the second aspect of the present invention specifies a step of acquiring voucher data executed by a computer and a display area including a plurality of items corresponding to numerical values among the display areas indicated by the voucher data. In the step of specifying the display area, the step of specifying the display value which is the numerical value displayed in the display area, and the step of specifying the display area based on the result of adding at least a part of the specified plurality of display values. When it is determined that the display area can be correctly specified or not, and when it is determined that the display area cannot be specified correctly, the information indicating the display area specified in the step of specifying the display area is displayed. It has a step to be displayed on the unit.
本発明の第3の態様に係るデータ処理プログラムは、コンピュータを、証憑データを取得するデータ取得部、前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する領域特定部、前記表示領域に表示されている数値である表示数値を特定する数値特定部、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部、及び、前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部、として機能させる。 The data processing program according to the third aspect of the present invention specifies a computer as a data acquisition unit for acquiring voucher data, and a display area including a plurality of items corresponding to numerical values among the display areas indicated by the voucher data. Based on the result of adding up at least a part of the area specifying unit, the numerical value specifying unit that specifies the displayed numerical value that is the numerical value displayed in the display area, and the specified plurality of displayed numerical values, the area specifying unit displays the display. A determination unit that determines whether or not the area can be correctly specified, and when the determination unit determines that the display area cannot be correctly specified, information indicating the display area specified by the area identification unit is displayed. It functions as a display control unit to be displayed on the unit.
本発明によれば、経理担当者の確認作業を軽減することができるという効果を奏する。 According to the present invention, there is an effect that the confirmation work of the accounting staff can be reduced.
[データ処理装置1の概要]
図1は、データ処理装置1の概要を説明するための図である。データ処理装置1は、スキャナ又はデジタルカメラ等の読取装置2が証憑を読み取ることによって生成された証憑データを取得し、証憑データに含まれる文字列を解析した結果を用いて証憑を管理するための装置であり、例えばコンピュータである。データ処理装置1は、1台のコンピュータにより構成されていてもよく、複数のコンピュータにより構成されていてもよい。証憑は、例えば、請求書や発注書等の、商品の単価、数量、金額等の商品に関する数値が示された証憑である。本実施形態では、証憑が請求書である場合を例として説明を進める。[Overview of data processing device 1]
FIG. 1 is a diagram for explaining an outline of the data processing device 1. The data processing device 1 acquires voucher data generated by reading the voucher by a reading device 2 such as a scanner or a digital camera, and manages the voucher using the result of analyzing the character string included in the voucher data. It is a device, for example a computer. The data processing device 1 may be composed of one computer or a plurality of computers. A voucher is a voucher that shows numerical values related to a product such as a unit price, quantity, and amount of the product, such as an invoice or a purchase order. In the present embodiment, the description will proceed by taking the case where the voucher is an invoice as an example.
図2は、被請求者としてのデータ処理装置1のユーザが受領する請求書の一例を示す図である。図2に示す請求書には、請求書を発行した事業者、すなわち取引における代金を請求する請求者の名称、住所、連絡先が記載されている。また、請求書には、件名(図2に示す2020年1月分)、請求の対象となる商品の単価、個数及び商品の合計金額(すなわち小計)、複数の商品の合計金額(すなわち請求額)が記載されている。データ処理装置1は、これら請求書に記載された情報と、読取装置2が請求書を読み取ることによって生成された請求書データを取得した取得日とを関連付けて請求書情報データベースに登録して管理する。 FIG. 2 is a diagram showing an example of an invoice received by a user of the data processing device 1 as a demandee. The invoice shown in FIG. 2 contains the name, address, and contact information of the business operator that issued the invoice, that is, the requester who charges the price in the transaction. In addition, the invoice includes the subject (January 2020 shown in Fig. 2), the unit price of the products to be billed, the total amount of the products (that is, the subtotal), and the total amount of the plurality of products (that is, the billed amount). ) Is described. The data processing device 1 registers and manages the information described in these invoices in the invoice information database in association with the acquisition date when the invoice data generated by the reading device 2 reading the invoice is acquired. To do.
データ処理装置1は、請求書に記載された数値に関する情報を取得するにあたり、請求書の表示領域のうち、商品の単価、個数、小計、請求額等の数値に対応する複数の項目を含む表示領域を特定する。データ処理装置1は、表示領域に表示されている数値である表示数値を特定し、特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する。データ処理装置1は、表示領域を正しく特定できていないと判定した場合に、表示領域を示す情報を表示部に表示させる。 When the data processing device 1 acquires information on the numerical value described in the invoice, the data processing device 1 includes a display including a plurality of items corresponding to the numerical value such as the unit price, the number of items, the subtotal, and the invoice amount in the display area of the invoice. Identify the area. The data processing device 1 identifies a display numerical value that is a numerical value displayed in the display area, and determines whether or not the display area can be correctly specified based on the result of adding at least a part of the specified plurality of display numerical values. judge. When the data processing device 1 determines that the display area cannot be correctly specified, the data processing device 1 causes the display unit to display information indicating the display area.
このようにすることで、ユーザは、正しい金額が登録されない場合に、表示領域を確認し、表示領域が正しくないことにより表示数値を特定できなかったのか、表示領域内で表示数値を正しく特定できなかったのかを確認し、その後の対応をとることができる。これにより、データ処理装置1は、ユーザの確認作業を軽減することができる。 By doing so, when the correct amount is not registered, the user can check the display area and correctly specify the display value in the display area, whether the display value could not be specified because the display area is incorrect. You can check if it wasn't there and take further action. As a result, the data processing device 1 can reduce the confirmation work of the user.
[データ処理装置1の機能構成及び動作]
図3は、データ処理装置1の機能構成を示す図である。データ処理装置1は、通信部11と、操作部12と、表示部13と、記憶部14と、制御部15とを有する。制御部15は、データ取得部151と、領域特定部152と、数値特定部153と、判定部154と、枠線作成部155と、受付部156と、登録部157と、学習部158とを有する。[Functional configuration and operation of data processing device 1]
FIG. 3 is a diagram showing a functional configuration of the data processing device 1. The data processing device 1 includes a
通信部11は、ネットワーク(例えばイントラネット又はインターネット)に接続するための通信インターフェースであり、読取装置2からデータを受信したり、他のコンピュータとの間でデータを送受信したりするための通信コントローラを有する。
The
操作部12は、請求書に重畳して表示された一以上の枠線のうち、いずれかの枠線をユーザが選択する操作を行ったり、文字列や数値を訂正したりするためのキーボード、マウス及びディスプレイ等のデバイスを有する。
表示部13は、情報を表示するディスプレイである。表示部13は、制御部15の指示に基づいて情報を表示する。The
The
記憶部14は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部14は、制御部15が実行するプログラムを記憶する。また、記憶部14は、読取装置2が請求書を読み取ることによって生成された請求書データを記憶する。記憶部14は、さらに、請求書データから抽出された情報を管理する請求書情報データベースを記憶する。
The
図4は、請求書情報データベースの一例を示す図である。図4に示すように請求書情報データベースは、請求書を発行した事業者を識別する発行事業者名と、請求書の発行日と、請求書データが取得された取得日と、請求書の件名と、複数の商品それぞれの品名と、複数の商品それぞれの単価、購入数、及び購入金額とが関連付けられている。請求書情報データベースにおいては、請求書を特定するための請求書識別情報(例えば請求書番号)がさらに含まれていてもよい。 FIG. 4 is a diagram showing an example of an invoice information database. As shown in FIG. 4, the invoice information database contains the name of the issuing company that identifies the company that issued the invoice, the issue date of the invoice, the acquisition date when the invoice data was acquired, and the subject of the invoice. And the product name of each of the plurality of products, and the unit price, the number of purchases, and the purchase price of each of the plurality of products are associated with each other. The invoice information database may further include invoice identification information (eg, invoice number) for identifying invoices.
制御部15は、例えばCPU(Central Processing Unit)である。制御部15は、記憶部14に記憶されたプログラムを実行することにより、データ取得部151と、領域特定部152、数値特定部153、判定部154、枠線作成部155、受付部156、登録部157、及び学習部158として機能する。
The
データ取得部151は、読取装置2が請求書を読み取ることによって生成した請求書データを取得する。データ取得部151は、読取装置2から請求書データを直接取得してもよいし、データ処理装置1と通信可能に接続されている端末から請求書データを取得してもよい。
The
領域特定部152は、請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する。領域特定部152は、例えばOCR処理を実行することにより、請求書データが示す請求書に含まれている文字列を特定する。領域特定部152は、特定した文字列のうち、数字に対応する複数の項目に対応する文字列の位置を特定する。数字に対応する複数の項目は、図2に示す例では、単価、個数、金額、合計である。領域特定部152は、例えば、数値に対応する複数の項目を含む矩形領域を数値に対応する表示領域として特定する。
The
数値特定部153は、領域特定部152が特定した表示領域に表示されている数値である表示数値を特定する。具体的には、数値特定部153は、領域特定部152が特定した表示領域に表示されている表示数値を、当該数値に対応する項目と関連付けて特定する。数値特定部153は、請求書において、横に並んでいる複数の表示数値を一つの組み合わせとして特定する。数値特定部153は、図2に示す例において、単価「550」、個数「10」、金額「5500」を一つの組み合わせとして複数の表示数値を特定する。また、数値特定部153は、合計「11,100」を、請求書が示す請求合計金額として特定する。
The numerical
判定部154は、数値特定部153が特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、領域特定部152が表示領域を正しく特定できたか否かを判定する。具体的には、判定部154は、所定列に表示されている複数の表示数値と、所定列に表示されている複数の表示数値を合計した数値を示す表示合計値とを特定し、所定列に表示されている複数の表示数値の合計値と、表示合計値とが一致しない場合に、表示領域を正しく特定できていないと判定する。
The
図2に示す例では、判定部154は、「金額」列に表示されている複数の表示数値の合計値である縦計を算出する。そして、判定部154は、算出した縦計と、「合計」に対応して表示されている請求合計金額とが一致するか否かを判定する。判定部154は、縦計と、請求合計金額とが一致しない場合に、表示領域を正しく特定できていないと判定する。図2に示す例において、数値特定部153が、「金額」に対応して、「4,400」、「1,200」のみ特定し、「5,500」の数値の特定ができなかった場合、判定部154は、縦計「5,600」と、請求合計金額「11,100」とが一致せず、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、複数商品の全てに対応する金額を漏れなく取得できているか否かを判定することができる。
In the example shown in FIG. 2, the
また、判定部154は、所定行に表示されている複数の表示数値と、所定行に表示されている複数の表示数値に基づいて所定の演算を行った結果を示す表示演算値とを特定し、所定行に表示されている複数の表示数値の演算値と、表示演算値とが一致しない場合に、表示領域を正しく特定できていないと判定する。
Further, the
図2に示す例では、判定部154は、「単価」に対応する表示数値と、「個数」に対応する表示数値との乗算値を横計演算値(表示演算値)として特定する。また、判定部154は、「金額」が、「単価」と「個数」とを乗算した結果を示す横計に対応する表示数値である横計表示数値と特定する。判定部154は、数値特定部153が特定した、各行のそれぞれに対し、算出した横計演算値と、当該横計演算値に対応する横計表示数値とが一致するか否かを判定する。判定部154は、横計演算値と横計表示数値とが一致しない場合に、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、商品に対応する項目「単価」、「個数」、「金額」に対応する表示数値を正しく取得できているか否かを判定することができる。
In the example shown in FIG. 2, the
さらに、判定部154は、複数行のそれぞれにおいて表示されている複数の表示数値の演算値の合計値、すなわち横計演算値の合計値と、表示合計値とが一致しない場合に、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、全ての商品に対応する項目「単価」、「個数」、「金額」に対応する表示数値を漏れなく取得できているか否かを判定することができる。
Further, the
枠線作成部155は、請求書データに重畳して表示させる一以上の枠線を作成する。例えば、記憶部14に、過去に取得した請求書データと、当該請求書データに対して正しいと判定された表示領域を囲う矩形形状の枠線の表示位置とを教師データとして学習し、請求書データの入力に対して、複数の枠線を示す枠線情報を出力するモデルを記憶する。枠線情報は、例えば、請求書データにおける枠線の表示位置及び大きさを示す情報である。
The
枠線作成部155は、判定部154が表示領域を正しく特定できていないと判定した場合に、記憶部14に記憶されているモデルに、データ取得部151が取得した請求書データを入力し、当該モデルから出力された複数の枠線情報を取得する。そして、枠線作成部155は、取得した枠線情報に基づいて複数の枠線を作成する。
When the
なお、枠線作成部155は、記憶部14に記憶されているモデルに、データ取得部151が取得した請求書データを入力することにより、複数の枠線を取得したが、これに限らない。枠線作成部155は、請求書データに含まれている複数の文字列を特定し、複数の文字列のうち、正しく認識されている蓋然性が閾値以上である複数の認識文字列の位置に基づいて、請求書データに重畳して表示させる一以上の枠線を作成してもよい。
The
例えば、枠線作成部155は、請求書データに含まれている複数の文字列として、商品名に対応する文字列を特定する。図2に示す例では、枠線作成部155は、「コピー用紙」、「インク」、「ボールペン」を特定する。枠線作成部155は、請求書情報データベースに既に格納されている品名のうち、特定した商品名に一致又は類似する品名を特定する。そして、枠線作成部155は、請求書データから特定した商品名と、当該商品名に一致又は類似する品名との類似度を、商品名が正しく認識されている蓋然性を示す指標として算出する。
For example, the
請求書では、商品名の近傍に単価、個数、金額等の、数値が表示されている蓋然性が高い。このため、枠線作成部155は、算出した類似度が所定の閾値以上の複数の商品名の表示位置を囲うとともに、請求書データにおいて、当該複数の商品名の右側の表示位置を囲う一以上の枠線を作成する。このようにすることで、データ処理装置1は、数値が表示されている蓋然性が高い領域を囲う枠線を作成することができる。
In the invoice, it is highly probable that numerical values such as unit price, quantity, and amount of money are displayed in the vicinity of the product name. Therefore, the frame
受付部156は、表示制御部として機能し、判定部154が表示領域を正しく特定できていないと判定した場合に、領域特定部152が特定した表示領域を示す情報を表示部13に表示させる。例えば、受付部156は、判定部154が表示領域を正しく特定できていないと判定した場合に、請求書データに重畳して、領域特定部152が特定した表示領域の境界を示す枠線を表示部13に表示させる。さらに、受付部156は、判定部154が表示領域を正しく特定できていないことを示す警告情報を表示部13に表示させ、ユーザから表示数値を囲う枠線を表示させ、表示数値を再度特定するかの指示を受け付ける。なお、受付部156は、表示領域の境界を示す枠線を表示部13に表示させたが、これに限らず、表示領域をハイライト表示させる等、他の領域とは異なる態様で表示させてもよい。
The
受付部156は、ユーザから表示数値を再度特定する指示を受け付けると、枠線作成部155が作成した、当該表示領域の少なくとも一部を囲う一以上の枠線を請求書データに重畳して表示部13に表示させる。そして、受付部156は、操作部12を介して、一以上の枠線のうち、いずれかの枠線の選択をユーザから受け付ける。
When the
図5は、請求書データに複数の枠線が重畳して表示された例を示す図である。図5に示す例では、請求書データに2つの枠線L1、L2が表示されていることが確認できる。ユーザは、枠線L1、L2のうち、数値を正しく囲っている枠線を選択する。図5に示す例では、枠線L1が数値を正しく囲っていることから、ユーザは、枠線L1を選択するものとする。なお、受付部156は、操作部12を介して、ユーザから枠線の選択を受け付けた後に、選択された枠線の調整を受け付けるようにしてもよい。
FIG. 5 is a diagram showing an example in which a plurality of borders are superimposed and displayed on the invoice data. In the example shown in FIG. 5, it can be confirmed that the two borders L1 and L2 are displayed in the invoice data. The user selects a border line that correctly encloses the numerical value from the border lines L1 and L2. In the example shown in FIG. 5, since the frame line L1 correctly surrounds the numerical value, the user selects the frame line L1. The
数値特定部153は、受付部156がユーザから選択を受け付けると、選択された枠線に含まれる領域内の表示数値を再度特定する。数値特定部153は、請求書データにおいて、選択された枠線に囲まれる領域内のOCR処理を領域特定部152に行わせる。数値特定部153は、選択された枠線に囲まれる領域内において特定された数値を表示数値として特定する。その後、判定部154は、数値特定部153が再度特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを再度判定する。
When the
登録部157は、判定部154が表示領域を正しく特定できたと判定すると、複数の表示数値を請求書情報データベースに記憶させる。登録部157は、判定部154が表示領域を正しく特定できたと判定すると、ユーザから、複数の表示数値を請求書情報データベースに記憶させる登録指示を受け付けてもよい。そして、登録部157は、登録指示を受け付けたことに応じて、請求書情報データベースに複数の表示数値を記憶させてもよい。
When the
学習部158は、複数の枠線を示す枠線情報を出力するモデルの学習を行う。例えば、学習部158は、受付部156が枠線の選択を受け付けた場合、登録部157が複数の表示数値を請求書情報データベースに記憶させた後、データ取得部151が取得した請求書データと、選択された枠線を示す枠線情報とを教師データとして、当該教師データに含まれる請求書データの入力に対し、当該枠線情報を出力するようにモデルの学習を行う。
The
また、学習部158は、判定部154が、一度目の判定で表示領域を正しく特定できたと判定すると、登録部157が複数の表示数値を請求書情報データベースに記憶させた後、データ取得部151が取得した請求書データと、表示領域を囲う枠線を示す枠線情報とを教師データとして、当該教師データに含まれる請求書データの入力に対し、当該枠線情報を出力するようにモデルの学習を行う。このようにすることで、データ処理装置1においては、複数の表示数値が請求書情報データベースに登録されればされるほどモデルが学習することができるので、表示数値を囲う枠線がモデルから出力される確率を高めることができる。
Further, when the
[データ処理装置1における処理の流れ]
図6は、データ処理装置1における処理の流れを示すフローチャートである。
まず、データ取得部151は、読取装置2が請求書を読み取ることによって生成した請求書データを取得する(S1)。[Processing flow in data processing device 1]
FIG. 6 is a flowchart showing a processing flow in the data processing device 1.
First, the
続いて、領域特定部152は、請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する(S2)。
続いて、数値特定部153は、領域特定部152が特定した表示領域に表示されている数値である表示数値を特定する(S3)。Subsequently, the
Subsequently, the numerical
続いて、判定部154は、数値特定部153が特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する(S4)。判定部154は、表示領域を正しく特定できたと判定すると、S9に処理を移し、表示領域を正しく特定できていないと判定すると、S5に処理を移す。
Subsequently, the
S5において、受付部156は、表示領域の領域を示す枠線を表示部13に表示させ、ユーザに、表示領域が正しく特定されなかったことを通知する。その後、枠線作成部155は、請求書データに重畳して表示させる一以上の枠線を作成する(S6)。
続いて、受付部156は、枠線作成部155が作成した、表示領域の少なくとも一部を囲う一以上の枠線を請求書データに重畳して表示部13に表示させ(S7)、操作部12を介して、一以上の枠線のうち、いずれかの枠線の選択をユーザから受け付ける(S8)。受付部156は、枠線の選択を受け付けるとS3に処理を移す。In S5, the
Subsequently, the
S9において、登録部157は、判定部154が表示領域を正しく特定できたと判定すると、複数の表示数値を請求書情報データベースに記憶させる。
続いて、学習部158は、複数の枠線を示す枠線情報を出力するモデルの学習を行う(S10)。In S9, when the
Subsequently, the
[データ処理装置1による効果]
以上説明したように、データ処理装置1は、証憑データとしての請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定し、表示領域に表示されている数値である表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する。そして、データ処理装置1は、表示領域を正しく特定できていないと判定した場合に、表示領域を示す情報を表示部に表示させる。[Effect of data processing device 1]
As described above, the data processing device 1 identifies a display area including a plurality of items corresponding to numerical values in the display area indicated by the invoice data as voucher data, and uses the numerical values displayed in the display area. Based on the result of adding up at least a part of a certain display value, it is determined whether or not the display area can be correctly specified. Then, when the data processing device 1 determines that the display area cannot be correctly specified, the data processing device 1 causes the display unit to display information indicating the display area.
このようにすることで、ユーザは、表示領域を確認し、表示領域が正しくないことにより表示数値を特定できなかったのか、表示領域内で表示数値を正しく特定できなかったのかを確認し、その後の対応をとることができる。これにより、データ処理装置1は、ユーザの確認作業を軽減することができる。 By doing so, the user checks the display area to see if the display value could not be specified because the display area was incorrect, or if the display value could not be specified correctly within the display area, and then Can be taken. As a result, the data processing device 1 can reduce the confirmation work of the user.
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes can be made within the scope of the gist. is there. For example, all or a part of the device can be functionally or physically distributed / integrated in any unit. Also included in the embodiments of the present invention are new embodiments resulting from any combination of the plurality of embodiments. The effect of the new embodiment produced by the combination has the effect of the original embodiment.
1 データ処理装置
2 読取装置
11 通信部
12 操作部
13 表示部
14 記憶部
15 制御部
151 データ取得部
152 領域特定部
153 数値特定部
154 判定部
155 枠線作成部
156 受付部
157 登録部
158 学習部
1 Data processing device 2
Claims (9)
前記証憑データにおける数値に対応する複数の項目を含む表示領域を特定する領域特定部と、
前記表示領域に表示されている数値である表示数値を特定する数値特定部と、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部と、
前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部と、
を有するデータ処理装置。 The data acquisition department that acquires voucher data and
An area identification unit that specifies a display area including a plurality of items corresponding to numerical values in the voucher data,
A numerical value specifying unit that specifies a displayed numerical value, which is a numerical value displayed in the display area,
A determination unit that determines whether or not the area identification unit can correctly specify the display area based on the result of adding up at least a part of the specified plurality of display values.
When the determination unit determines that the display area cannot be correctly specified, the display control unit causes the display unit to display information indicating the display area specified by the area identification unit.
Data processing device with.
請求項1に記載のデータ処理装置。 The determination unit identifies a plurality of the displayed numerical values displayed in the predetermined column and a display total value indicating a total value of the plurality of the displayed numerical values displayed in the predetermined column, and sets the predetermined column. When the total value of the plurality of displayed numerical values and the displayed total value do not match, it is determined that the area specifying unit cannot correctly specify the display area.
The data processing device according to claim 1.
請求項2に記載のデータ処理装置。 The determination unit specifies a plurality of the displayed numerical values displayed on the predetermined line and a display calculation value indicating the result of performing a predetermined calculation based on the plurality of the displayed numerical values displayed on the predetermined line. Then, when the calculated values of the plurality of displayed numerical values displayed on the predetermined line do not match the displayed calculated values, it is determined that the area specifying unit cannot correctly specify the display area.
The data processing device according to claim 2.
請求項2又は3に記載のデータ処理装置。 In the determination unit, when the total value of the calculated values of the plurality of display values displayed in each of the plurality of lines does not match the display total value, the area identification unit can correctly specify the display area. Judge not,
The data processing apparatus according to claim 2 or 3.
前記数値特定部は、選択された前記枠線に含まれる領域内の前記表示数値を再度特定する、
請求項1から4のいずれか一項に記載のデータ処理装置。 A reception unit that superimposes one or more borders surrounding at least a part of the display area on the voucher data and displays them on the display unit, and accepts the selection of one or more of the one or more borders. Have and
The numerical value specifying unit respecifies the displayed numerical value in the area included in the selected frame line.
The data processing device according to any one of claims 1 to 4.
請求項5に記載のデータ処理装置。 A plurality of character strings included in the voucher data are specified, and among the plurality of character strings, the one or more frames are based on the positions of the plurality of recognition character strings whose probability of being correctly recognized is equal to or higher than the threshold value. It also has a border creation unit that creates lines,
The data processing device according to claim 5.
前記受付部は、前記データ取得部が取得した前記証憑データを前記モデルに入力し、前記モデルから出力された複数の前記枠線を前記証憑データに重畳して表示部に表示させる、
請求項5又は6に記載のデータ処理装置。 The voucher data acquired in the past by the data acquisition unit and the border corresponding to the display area determined to be correct for the voucher data are learned as teacher data, and the input of the voucher data is performed. It has a storage unit that stores a model that outputs a plurality of the borders, and has a storage unit.
The reception unit inputs the voucher data acquired by the data acquisition unit into the model, superimposes a plurality of the frame lines output from the model on the voucher data, and displays the voucher data on the display unit.
The data processing apparatus according to claim 5 or 6.
証憑データを取得するステップと、
前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定するステップと、
前記表示領域に表示されている数値である表示数値を特定するステップと、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記表示領域を特定するステップにおいて前記表示領域を正しく特定できたか否かを判定するステップと、
前記表示領域を正しく特定できていないと判定した場合に、前記表示領域を特定するステップにおいて特定された前記表示領域を示す情報を表示部に表示させるステップと、
を有するデータ処理方法。 Computer runs,
Steps to get voucher data and
Among the display areas indicated by the voucher data, a step of identifying a display area including a plurality of items corresponding to numerical values, and
A step of specifying a displayed numerical value, which is a numerical value displayed in the display area,
Based on the result of adding up at least a part of the plurality of specified display numerical values, a step of determining whether or not the display area can be correctly specified in the step of specifying the display area, and a step of determining whether or not the display area can be correctly specified.
When it is determined that the display area cannot be correctly specified, the step of displaying the information indicating the display area specified in the step of specifying the display area on the display unit, and the step of displaying the information indicating the display area.
Data processing method having.
証憑データを取得するデータ取得部、
前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する領域特定部、
前記表示領域に表示されている数値である表示数値を特定する数値特定部、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部、及び、
前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部、
として機能させるデータ処理プログラム。
Computer,
Data acquisition department that acquires voucher data,
Of the display area indicated by the voucher data, an area specifying unit that specifies a display area including a plurality of items corresponding to numerical values,
Numerical value specifying unit that specifies the displayed numerical value, which is the numerical value displayed in the display area,
A determination unit that determines whether or not the area identification unit can correctly specify the display area based on the result of adding at least a part of the specified plurality of display values, and
A display control unit that causes the display unit to display information indicating the display area specified by the area identification unit when the determination unit determines that the display area cannot be correctly specified.
A data processing program that functions as .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020205033A JP2022029398A (en) | 2020-08-04 | 2020-12-10 | Data processing device, data processing method and data processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/029777 WO2022029874A1 (en) | 2020-08-04 | 2020-08-04 | Data processing device, data processing method, and data processing program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020205033A Division JP2022029398A (en) | 2020-08-04 | 2020-12-10 | Data processing device, data processing method and data processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6810303B1 true JP6810303B1 (en) | 2021-01-06 |
JPWO2022029874A1 JPWO2022029874A1 (en) | 2022-02-10 |
Family
ID=73992887
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020542356A Active JP6810303B1 (en) | 2020-08-04 | 2020-08-04 | Data processing equipment, data processing method and data processing program |
JP2020205033A Pending JP2022029398A (en) | 2020-08-04 | 2020-12-10 | Data processing device, data processing method and data processing program |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020205033A Pending JP2022029398A (en) | 2020-08-04 | 2020-12-10 | Data processing device, data processing method and data processing program |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP6810303B1 (en) |
WO (1) | WO2022029874A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023032802A1 (en) * | 2021-09-01 | 2023-03-09 | 株式会社KPMG Ignition Tokyo | Annotation assistance device, annotation assistance method, and annotation assistance program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0737035A (en) * | 1993-07-21 | 1995-02-07 | Oki Electric Ind Co Ltd | Character recognizer |
JP2001084332A (en) * | 1999-09-10 | 2001-03-30 | Toshiba Corp | Reader and reading method |
JP2005326972A (en) * | 2004-05-12 | 2005-11-24 | Sun Corp | Purchase information management device |
JP2009188707A (en) * | 2008-02-06 | 2009-08-20 | Seiko Epson Corp | Printer and control method thereof |
WO2020012539A1 (en) * | 2018-07-09 | 2020-01-16 | ファーストアカウンティング株式会社 | Journalization element analysis device, accounting system, journalization element analysis method, and journalization element analysis program |
-
2020
- 2020-08-04 WO PCT/JP2020/029777 patent/WO2022029874A1/en active Application Filing
- 2020-08-04 JP JP2020542356A patent/JP6810303B1/en active Active
- 2020-12-10 JP JP2020205033A patent/JP2022029398A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0737035A (en) * | 1993-07-21 | 1995-02-07 | Oki Electric Ind Co Ltd | Character recognizer |
JP2001084332A (en) * | 1999-09-10 | 2001-03-30 | Toshiba Corp | Reader and reading method |
JP2005326972A (en) * | 2004-05-12 | 2005-11-24 | Sun Corp | Purchase information management device |
JP2009188707A (en) * | 2008-02-06 | 2009-08-20 | Seiko Epson Corp | Printer and control method thereof |
WO2020012539A1 (en) * | 2018-07-09 | 2020-01-16 | ファーストアカウンティング株式会社 | Journalization element analysis device, accounting system, journalization element analysis method, and journalization element analysis program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023032802A1 (en) * | 2021-09-01 | 2023-03-09 | 株式会社KPMG Ignition Tokyo | Annotation assistance device, annotation assistance method, and annotation assistance program |
Also Published As
Publication number | Publication date |
---|---|
JP2022029398A (en) | 2022-02-17 |
JPWO2022029874A1 (en) | 2022-02-10 |
WO2022029874A1 (en) | 2022-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2679209C2 (en) | Processing of electronic documents for invoices recognition | |
US20080205742A1 (en) | Generation of randomly structured forms | |
JPWO2019008766A1 (en) | Voucher processing system and voucher processing program | |
JP2019191665A (en) | Financial statements reading device, financial statements reading method and program | |
JP6810303B1 (en) | Data processing equipment, data processing method and data processing program | |
JP6810306B1 (en) | Data processing equipment, data processing methods and programs | |
JP6848134B1 (en) | Data processing equipment, data processing methods and programs | |
JP6944603B1 (en) | Data processing equipment, data processing methods and programs | |
JP6980927B1 (en) | Data processing equipment, data processing methods and programs | |
JP6993032B2 (en) | Accounting equipment, accounting systems, accounting methods and programs | |
JP2022008289A (en) | Bill management device, bill management method and program | |
JP6844076B1 (en) | Data processing equipment, data processing methods and programs | |
JP6802417B1 (en) | Data processing equipment, data processing methods and programs | |
JP2001005886A (en) | Data processor and storage medium | |
JP2022035923A (en) | Data processing device, data processing method, and program | |
JP6929487B1 (en) | Data processing equipment, data processing methods and programs | |
JP6810302B1 (en) | Data processing equipment, data processing methods and programs | |
JP6967174B1 (en) | Data processing equipment, data processing methods and programs | |
JP6855641B1 (en) | Data processing equipment, data processing methods and programs | |
JP6886083B1 (en) | Data processing equipment, data processing methods and programs | |
WO2023062798A1 (en) | Information processing system, item value extraction method, model generation method, and program | |
JP7473900B2 (en) | FORMAT CREATION DEVICE, FORMAT CREATION METHOD, AND FORMAT CREATION PROGRAM | |
US20240205348A1 (en) | Display system, display method, and display program for displaying a cotent of electronic document | |
JP6858420B1 (en) | Accounting equipment, accounting systems, accounting methods and programs | |
JP2023020842A (en) | Data processing device, data processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200804 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200804 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6810303 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |