JP2010113454A - Data collating system - Google Patents

Data collating system Download PDF

Info

Publication number
JP2010113454A
JP2010113454A JP2008284200A JP2008284200A JP2010113454A JP 2010113454 A JP2010113454 A JP 2010113454A JP 2008284200 A JP2008284200 A JP 2008284200A JP 2008284200 A JP2008284200 A JP 2008284200A JP 2010113454 A JP2010113454 A JP 2010113454A
Authority
JP
Japan
Prior art keywords
file
document
data
text data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008284200A
Other languages
Japanese (ja)
Inventor
Shozo Wagi
昌三 和木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aeon Product Finance Co Ltd
Original Assignee
Toshiba Finance Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Finance Corp filed Critical Toshiba Finance Corp
Priority to JP2008284200A priority Critical patent/JP2010113454A/en
Publication of JP2010113454A publication Critical patent/JP2010113454A/en
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a system for enhancing the degree of use of information such as reliability relevant information. <P>SOLUTION: A data collating system includes: a form storage means for storing a form file having text data and metadata; a document storage means for storing a document file which has the text data and the metadata and is not the form file; a data collation means for collating the text data and the metadata in the document file stored in the document storage means with the text data and the metadata in the form file stored in the form storage means; and an output means for displaying the collation result. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、データ照合システム、コンピュータをデータ照合システムとして機能させるためのプログラム、およびそのプログラムを記録したコンピュータ読み取り可能な記録媒体などに関する。   The present invention relates to a data verification system, a program for causing a computer to function as a data verification system, a computer-readable recording medium on which the program is recorded, and the like.

企業の与信設定の審査などの与信業務に利用される信用関連情報は、例えば、公簿閲覧、信用情報機関、ならびにニュースおよび風評などより集められる。これらの信用関連情報は、日々更新されており情報量は多いが、情報が散在している上に、従来から取引のある企業以外の企業の情報は着目しにくいことなどから、情報の活用度は低い。   Credit-related information used for credit operations such as examination of corporate credit settings is collected from, for example, public directory browsing, credit information agencies, news and reputations, and the like. These credit-related information is updated daily, and the amount of information is large. However, since information is scattered, it is difficult to focus on information from companies other than those that have traditionally engaged in transactions. Is low.

ここで、特許文献1には、帳票等の紙媒体に記録された内容を表すイメージを適当なキーワードを付して簡単にファイリングすることを可能にするシステムが開示されている。   Here, Patent Document 1 discloses a system that allows an image representing contents recorded on a paper medium such as a form to be easily filed with an appropriate keyword.

特開平10-97606号公報Japanese Patent Laid-Open No. 10-97606

このような状況の下、信用関連情報などの情報の活用度を高めるためのシステムが求められていた。   Under such circumstances, a system for increasing the utilization of information such as credit related information has been demanded.

本発明者らは、上記課題を解決するため鋭意研究を行った結果、信用関連情報などの情報の活用度を高めるには、帳票ファイルを帳票保存手段に保存し、信用関連情報などの情報を含む文書ファイルを文書保存手段に保存し、保存した帳票ファイルを保存した文書ファイルと照合すれば良いことなどに想到し、本発明を完成させた。   As a result of diligent research to solve the above problems, the inventors have saved a form file in a form storage means to increase the utilization of information such as credit related information, and stored information such as credit related information. The present invention has been completed by conceiving that it is sufficient to store the included document file in the document storage means and to compare the stored form file with the stored document file.

すなわち、本発明は、次のデータ照合システムなどに関する。
(1)テキストデータおよびメタデータを有する帳票ファイルを保存する帳票保存手段と、
テキストデータおよびメタデータを有し帳票ファイルではない文書ファイルを保存する文書保存手段と、
前記帳票保存手段に保存された帳票ファイルのテキストデータおよび/またはメタデータを前記文書保存手段に保存された文書ファイルのテキストデータおよび/またはメタデータと照合するデータ照合手段と、
照合結果を表示する出力手段と、
を含む、データ照合システム。
(2)帳票ファイルのテキストデータが、XML形式にデータフォーマットされたテキストデータである、上記(1)に記載のシステム。
(3)帳票ファイルのメタデータが、XML形式にデータフォーマットされたメタデータである、上記(1)または(2)に記載のシステム。
(4)帳票ファイル保存手段と文書保存手段が、オンラインストレージに収容される、上記(1)〜(3)のいずれか1項に記載のシステム。
(5)Web上で入力されたテキストデータおよび/または、PDF(Portable Document Format)上で入力されたテキストデータを含む帳票ファイルを作成する帳票ファイル作成手段をさらに有する、上記(1)〜(4)のいずれか1項に記載のシステム。
(6)帳票ファイルに含まれるテキストデータが、入力されたテキストデータを、さらに、PDF自動変換機能にてXML形式のデータフォーマットに変換したテキストデータである、上記(5)に記載のシステム。
(7)紙媒体をスキャンして得られたデータをOCR処理することによって、および/またはファックスで受信されたデータをOCR処理することによって得られたテキストデータを含む文書ファイルを作成する文書ファイル作成手段をさらに有する、上記(1)〜(6)のいずれか1項に記載のシステム。
(8)帳票ファイルが、さらに画像データと図形データからなる群から選ばれる1以上を有する、上記(1)〜(7)のいずれか1項に記載のシステム。
(9)帳票ファイルが、PDFファイル形式である、上記(1)〜(8)のいずれか1項に記載のシステム。
(10)文書ファイルが、PDFファイル形式である、上記(1)〜(9)のいずれか1項に記載のシステム。
(11)文書ファイルが信用関連情報を含む、上記(1)〜(10)のいずれか1項に記載のシステム。
(12)データ照合手段が、さらに、帳票ファイルのテキストデータおよび/またはメタデータを帳票ファイルのテキストデータおよび/またはメタデータと照合する、上記(1)〜(11)のいずれか1項に記載のシステム。
(13)上記(1)〜(12)のいずれか1項に記載のシステムとして機能させるためのプログラム。
(14)上記(13)に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
(15)帳票保存手段が、テキストデータおよびメタデータを有する帳票ファイルを保存するステップと、
文書保存手段が、テキストデータおよびメタデータを有し帳票ファイルではない文書ファイルを保存するステップと、
データ照合手段が、前記帳票保存手段に保存された帳票ファイルのテキストデータおよび/またはメタデータを前記文書保存手段に保存された文書ファイルのテキストデータおよび/またはメタデータと照合するステップと、
出力手段が、照合結果を表示するステップと、
を含む、データ照合方法。
(16)帳票ファイル作成手段が、Web上で入力されたテキストデータおよび/またはPDF上で入力されたテキストデータを含む帳票ファイルを作成するステップをさらに含む、上記(15)に記載の方法。
(17)文書ファイル作成手段が、紙媒体をスキャンして得られたデータをOCR処理することによって、および/またはファックスで受信されたデータをOCR処理することによって得られたテキストデータを含む文書ファイルを作成するステップをさらに含む、上記(15)または(16)に記載の方法。
(18)データ照合手段が、さらに、帳票ファイルのテキストデータおよび/またはメタデータを帳票ファイルのテキストデータおよび/またはメタデータと照合する、上記(15)〜(17)のいずれか1項に記載の方法。
That is, the present invention relates to the following data collation system and the like.
(1) a form storage means for storing a form file having text data and metadata;
Document storage means for storing a document file that has text data and metadata and is not a form file;
Data collation means for collating text data and / or metadata of a form file stored in the form storage means with text data and / or metadata of a document file stored in the document storage means;
An output means for displaying the verification result;
Including data verification system.
(2) The system according to (1) above, wherein the text data of the form file is text data formatted in an XML format.
(3) The system according to (1) or (2) above, wherein the metadata of the form file is metadata formatted in an XML format.
(4) The system according to any one of (1) to (3), wherein the form file storage unit and the document storage unit are accommodated in an online storage.
(5) The above-described (1) to (4), further comprising a form file creating means for creating a form file including text data input on the Web and / or text data input on PDF (Portable Document Format). The system according to any one of (1).
(6) The system according to (5) above, wherein the text data included in the form file is text data obtained by converting the input text data into an XML data format using the PDF automatic conversion function.
(7) Document file creation for creating a document file including text data obtained by OCR processing data obtained by scanning a paper medium and / or by OCR processing data received by fax The system according to any one of (1) to (6), further including means.
(8) The system according to any one of (1) to (7), wherein the form file further includes one or more selected from the group consisting of image data and graphic data.
(9) The system according to any one of (1) to (8), wherein the form file is in a PDF file format.
(10) The system according to any one of (1) to (9), wherein the document file is a PDF file format.
(11) The system according to any one of (1) to (10), wherein the document file includes trust related information.
(12) The data collating unit further collates the text data and / or metadata of the form file with the text data and / or metadata of the form file, according to any one of (1) to (11) above. System.
(13) A program for causing a function of the system according to any one of (1) to (12) above.
(14) A computer-readable recording medium on which the program according to (13) is recorded.
(15) a form storage means storing a form file having text data and metadata;
A document storage means for storing a document file having text data and metadata and not a form file;
A step of collating text data and / or metadata of a form file stored in the form storage unit with text data and / or metadata of a document file stored in the document storage unit;
An output means for displaying the result of matching;
Including data matching method.
(16) The method according to (15), wherein the form file creation means further includes a step of creating a form file including text data input on the Web and / or text data input on the PDF.
(17) A document file including text data obtained by the document file creating means performing OCR processing on data obtained by scanning a paper medium and / or processing received by fax. The method according to (15) or (16), further comprising the step of creating:
(18) The data collating unit further collates the text data and / or metadata of the form file with the text data and / or metadata of the form file, according to any one of (15) to (17) above. the method of.

本発明の好ましい態様のシステムにより、信用関連情報などの情報の活用度を高めることができる。   With the system according to a preferred aspect of the present invention, the utilization of information such as credit related information can be increased.

以下、本発明を詳細に説明する。
1.データ照合システム
図1に基づいて、本発明のデータ照合システムの構成を説明する。
本システムは、帳票保存手段101、文書保存手段102、データ照合手段103、および出力手段209を有する。本システムは、さらに、帳票ファイル作成手段104、および文書ファイル作成手段105を有する。
Hereinafter, the present invention will be described in detail.
1. Data collation system Based on FIG. 1, the structure of the data collation system of this invention is demonstrated.
The system includes a form storage unit 101, a document storage unit 102, a data collation unit 103, and an output unit 209. The system further includes a form file creation unit 104 and a document file creation unit 105.

1.1.帳票保存手段
帳票保存手段101には、テキストデータとメタデータを有する帳票ファイルが保存される。帳票保存手段101は、たとえば、オンラインストレージ200の外部記憶装置203等によって実行される。
1.1. Form storage means The form storage means 101 stores a form file having text data and metadata. The form storage unit 101 is executed by the external storage device 203 of the online storage 200, for example.

帳票保存手段101に保存される帳票ファイルは、本発明のデータ照合システムを利用する目的に応じて適宜選択することができる。
例えば、企業の与信設定の審査などの与信業務を行う目的で本発明のデータ照合システムを利用する場合には、保存される帳票ファイルは、例えば、取引開始時の申請書である。
また、取引先の継続的な与信管理の目的に利用するために本発明のデータ照合システムを利用する場合には、保存される帳票ファイルは、請求書、リース契約書、または割賦販売契約書など債権債務の関係が発生する契約書である。
また、少量多品種の契約書の管理を目的に利用するために本発明のデータ照合システムを利用する場合には、保存される帳票ファイルは、製造業の部品発注書、または保険業の契約書などである。
The form file stored in the form storage unit 101 can be appropriately selected according to the purpose of using the data collating system of the present invention.
For example, when the data collation system of the present invention is used for the purpose of performing a credit operation such as examination of credit setting of a company, the saved form file is, for example, an application form at the start of a transaction.
In addition, when the data collation system of the present invention is used for the purpose of continuous credit management of a business partner, the form file to be saved is an invoice, a lease contract, an installment sales contract, etc. This is a contract that involves a relationship between claims and debts.
In addition, when the data collation system of the present invention is used for the purpose of managing contracts for a small quantity and a variety of products, the form file to be saved is a parts order for the manufacturing industry or a contract for the insurance industry. Etc.

帳票保存手段101に保存される帳票ファイルは、例えば、帳票ファイル作成手段104により作成される。保存される帳票ファイルは、テキストデータとメタデータを含む。テキストデータは、帳票ファイルの本文のデータである。また、メタデータは、本文以外のデータで、帳票ファイルの作成者、作成日、タイトル、および関連キーワードなどの帳票ファイルの属性を示すデータである。メタデータは、例えば、帳票ファイルの作成時に自動作成される。本発明の1つの態様では、帳票ファイル作成手段104は、Web上で入力されたテキストデータ、および/または、PDF(Portable Document Format)上で入力されたテキストデータを含む帳票ファイルを作成する。本発明の好ましい態様では、帳票ファイルのテキストデータは、XML形式にデータフォーマットされたテキストデータ(以下、XMLデータという。)である。また、本発明の好ましい態様では、帳票ファイルのメタデータは、XML形式にデータフォーマットされたメタデータ(以下、XMLメタデータという。)である。本発明のさらに好ましい態様では、帳票ファイルに含まれるテキストデータは、前記入力されたテキストデータを、さらに、PDF自動変換機能にてXML形式のデータフォーマットに変換したテキストデータである。本発明の好ましい態様では、帳票ファイルは、さらに画像データと図形データからなる群から選ばれる1以上を有する。本発明のさらに好ましい態様では、帳票ファイルは、PDFファイル形式である。   The form file stored in the form storage unit 101 is created by the form file creation unit 104, for example. The saved form file includes text data and metadata. The text data is the text data of the form file. The metadata is data other than the text, and is data indicating attributes of the form file such as the form file creator, creation date, title, and related keywords. The metadata is automatically created when creating a form file, for example. In one aspect of the present invention, the form file creation unit 104 creates a form file including text data input on the Web and / or text data input on a PDF (Portable Document Format). In a preferred embodiment of the present invention, the text data of the form file is text data (hereinafter referred to as XML data) that is data-formatted in XML format. In a preferred embodiment of the present invention, the metadata of the form file is metadata (hereinafter referred to as XML metadata) that is data-formatted in XML format. In a further preferred aspect of the present invention, the text data included in the form file is text data obtained by further converting the input text data into an XML format data format using a PDF automatic conversion function. In a preferred aspect of the present invention, the form file further includes one or more selected from the group consisting of image data and graphic data. In a further preferred aspect of the present invention, the form file is in a PDF file format.

帳票ファイル作成手段104はたとえば、ユーザ端末202の入力手段208および出力手段209、ならびにオンラインストレージ200のアプリケーションサーバ204等によって実行される。   The form file creation unit 104 is executed by, for example, the input unit 208 and the output unit 209 of the user terminal 202, the application server 204 of the online storage 200, and the like.

1.2.文書保存手段
文書保存手段102には、テキストデータとメタデータを有する文書ファイルが保存される。保存される文書ファイルは、帳票ファイルとは異なる別のファイルである。本発明の1つの態様では、文書ファイルは、さらに画像データと図形データからなる群から選ばれる1以上を有する。本発明の好ましい態様では、文書ファイルは、PDF(Portable Document Format)ファイル形式である。
文書保存手段102は、たとえば、オンラインストレージ200の外部記憶装置203等によって実行される。
1.2. Document Storage Unit The document storage unit 102 stores a document file having text data and metadata. The saved document file is a different file from the form file. In one aspect of the present invention, the document file further includes one or more selected from the group consisting of image data and graphic data. In a preferred embodiment of the present invention, the document file is in a PDF (Portable Document Format) file format.
The document storage unit 102 is executed by, for example, the external storage device 203 of the online storage 200.

保存される文書ファイルは、本発明のデータ照合システムを利用する目的に応じて適宜選択することができる。
例えば、与信業務を行う目的で本発明のデータ照合システムを利用する場合には、保存される文書ファイルは、信用関連情報を含むファイルである。信用関連情報は、企業の信用格付、信用調査情報、倒産確率情報、IR情報、有資格者情報、および割止め情報などを含む情報であり、例えば、公簿の閲覧、信用情報機関、ならびにニュースおよび風評などより集めることができる。
また、新規取引や取引見直しの与信判断を行う目的で本発明のデータ照合システムを利用する場合には、保存される文書ファイルは、信用調査情報および/または倒産確率情報などの与信判断材料などを含むファイルである。
また、取引先の継続的な与信管理を行う目的で本発明のデータ照合システムを利用する場合には、保存される文書ファイルは、割止め情報、ニュース、および風評からなる群から選ばれる1以上を含むファイルである。
The stored document file can be selected as appropriate according to the purpose of using the data collation system of the present invention.
For example, when the data collation system of the present invention is used for the purpose of performing a credit service, the stored document file is a file including credit related information. Credit-related information is information including credit rating of companies, credit survey information, bankruptcy probability information, IR information, qualified person information, and custody information. For example, reading of public accounts, credit information agencies, and news And can be collected from the reputation.
In addition, when the data collation system of the present invention is used for the purpose of making a credit judgment for a new transaction or a transaction review, the document file to be stored includes credit judgment information such as credit investigation information and / or bankruptcy probability information. It is a file that contains.
Further, when the data collation system of the present invention is used for the purpose of continuous credit management of business partners, the document file to be stored is one or more selected from the group consisting of reservation information, news, and reputation. Is a file containing

保存される文書ファイルは、例えば、文書ファイル作成手段105により作成される。保存される文書ファイルは、テキストデータとメタデータを含む。テキストデータは、文書ファイルの本文のデータである。また、メタデータは、本文以外のデータで、文書ファイルの登録日、タイトル、および関連キーワードなどの文書ファイルの属性を示すデータである。メタデータは、例えば、文書ファイルの作成時に自動作成される。本発明の1つの態様では、文書ファイル作成手段105は、紙媒体をスキャンして得られたデータをOCR処理することによって、および/またはファックスで受信されたデータをOCR処理することによって得られたテキストデータに基づいて文書ファイルを作成する。本発明の好ましい態様では、文書ファイルのメタデータは、XML形式にデータフォーマットされたメタデータである。   The document file to be stored is created by the document file creation unit 105, for example. The saved document file includes text data and metadata. The text data is data of the text of the document file. The metadata is data other than the text, and is data indicating attributes of the document file such as the registration date, title, and related keywords of the document file. The metadata is automatically created when a document file is created, for example. In one aspect of the present invention, the document file creation means 105 is obtained by OCR processing data obtained by scanning a paper medium and / or by OCR processing data received by fax. Create a document file based on text data. In a preferred embodiment of the present invention, the metadata of the document file is metadata that is data formatted in XML format.

文書ファイル作成手段105は、たとえば、ユーザ端末202の入力手段208および出力手段209、オンラインストレージ200のアプリケーションサーバ204等によって実行される。   The document file creation unit 105 is executed by, for example, the input unit 208 and output unit 209 of the user terminal 202, the application server 204 of the online storage 200, and the like.

尚、図1では、帳票ファイル作成手段104と文書ファイル作成手段105が物理的に別れているかのように描いているが、これらは、物理的に別れている必要はなく、その構成の全部または一部を共有しても良い。構成の全部または一部を共有する場合、帳票ファイル作成手段104により作成された帳票ファイルを帳票保存手段101に、文書ファイル作成手段105により作成された文書ファイルを文書ファイル保存手段102に、それぞれ振り分けるファイル振分手段を本発明のシステムはさらに備えて良い。   In FIG. 1, the form file creation means 104 and the document file creation means 105 are drawn as if they were physically separated. However, they do not have to be physically separated, and the entire configuration or Some may be shared. When all or part of the configuration is shared, the form file created by the form file creation unit 104 is distributed to the form storage unit 101, and the document file created by the document file creation unit 105 is distributed to the document file storage unit 102. The system of the present invention may further include file distribution means.

1.3.データ照合手段
データ照合手段103は、帳票保存手段101に保存された帳票ファイルのテキストデータ(例えば、XMLデータ)および/またはメタデータ(例えば、XMLメタデータ)(以下、帳票ファイルのテキストデータ等とする。)を文書保存手段102に保存された文書ファイルのテキストデータおよび/またはメタデータ(以下、文書ファイルのテキストデータ等)と照合する。
本発明の1つの態様では、データ照合手段103は、帳票保存手段101に保存された帳票ファイルのテキストデータ(例えば、XMLデータ)およびメタデータ(例えば、XMLメタデータ)を文書保存手段102に保存された文書ファイルのテキストデータおよびメタデータと照合する。
本発明の別の態様では、データ照合手段103は、帳票保存手段101に保存された帳票ファイルのテキストデータ(例えば、XMLデータ)を文書保存手段102に保存された文書ファイルのテキストデータと照合する。
本発明のさらに別の態様では、データ照合手段103は、帳票保存手段101に保存された帳票ファイルのテキストデータ(例えば、XMLデータ)を文書保存手段102に保存された文書ファイルのメタデータと照合する。
本発明のさらに別の態様では、データ照合手段103は、帳票保存手段101に保存された帳票ファイルのメタデータ(例えば、XMLメタデータ)を文書保存手段102に保存された文書ファイルのテキストデータと照合する。
本発明のさらに別の態様では、データ照合手段103は、帳票保存手段101に保存された帳票ファイルのメタデータ(例えば、XMLメタデータ)を文書保存手段102に保存された文書ファイルのメタデータと照合する。
1.3. Data collating means The data collating means 103 includes text data (for example, XML data) and / or metadata (for example, XML metadata) (hereinafter referred to as text data of a form file) stored in the form storing means 101. Is compared with text data and / or metadata (hereinafter, text data of the document file) of the document file stored in the document storage unit 102.
In one aspect of the present invention, the data matching unit 103 stores text data (for example, XML data) and metadata (for example, XML metadata) of a form file stored in the form storage unit 101 in the document storage unit 102. Against the text data and metadata of the document file
In another aspect of the present invention, the data collating unit 103 collates the text data (for example, XML data) of the form file stored in the form storing unit 101 with the text data of the document file stored in the document storing unit 102. .
In yet another aspect of the present invention, the data collating unit 103 collates the text data (for example, XML data) of the form file stored in the form storing unit 101 with the metadata of the document file stored in the document storing unit 102. To do.
In still another aspect of the present invention, the data collating unit 103 uses the metadata (for example, XML metadata) of the form file stored in the form storing unit 101 and the text data of the document file stored in the document storing unit 102. Match.
In yet another aspect of the present invention, the data collating unit 103 uses the metadata (for example, XML metadata) of the form file stored in the form storing unit 101 and the metadata of the document file stored in the document storing unit 102. Match.

本発明の1つの態様では、データ照合手段103は、さらに、帳票保存手段101に保存された帳票ファイルAのテキストデータ等を同じく帳票保存手段101に保存された帳票ファイルBのテキストデータ等と照合することができる。また、本発明の別の態様では、文書保存手段102に保存された文書ファイルAのテキストデータ等を同じく文書保存手段102に保存された文書ファイルBのテキストデータ等と照合することもできる。   In one aspect of the present invention, the data collating unit 103 further collates the text data of the form file A stored in the form storing unit 101 with the text data of the form file B also stored in the form storing unit 101. can do. In another aspect of the present invention, the text data of the document file A stored in the document storage unit 102 can be collated with the text data of the document file B stored in the document storage unit 102.

データ照合手段103は、たとえば、オンラインストレージ200のアプリケーションサーバ204等によって実行される。   The data matching unit 103 is executed by, for example, the application server 204 of the online storage 200.

帳票ファイルのテキストデータ等と文書ファイルのテキストデータ等の照合は、具体的には、次のように行う。   Specifically, the text data of the form file and the text data of the document file are collated as follows.

例えば、与信業務を行う目的で本発明のデータ照合システムを利用する場合には、帳票ファイル(申請書)のテキストデータ等と、文書ファイル(信用関連情報)のテキストデータ等とを次のように照合する。帳票保存手段101に保存された帳票ファイル(申請書)のXMLデータおよび/またはXMLメタデータの各タグに登録されている取引先、取引先の仕入先、取引先の販売先、提携先、ならびに株主の企業名および企業コードからなる群から選ばれる1以上の情報をキー情報として、帳票ファイルのXMLデータおよび/またはXMLメタデータを、文書ファイル(信用関連情報)のテキストデータ等に登録されている企業名および/または企業コードと突き合わせ(照合し)、適合した企業名の登録されている文書ファイルを照合結果としてユーザ端末202の出力手段209に表示する。   For example, when the data collation system of the present invention is used for the purpose of performing a credit service, the text data of a form file (application) and the text data of a document file (credit related information) are as follows. Match. Suppliers, supplier suppliers, supplier sales partners, partners, registered in each tag of the XML data and / or XML metadata of the form file (application) stored in the form storage means 101 In addition, one or more information selected from the group consisting of the company name and company code of the shareholders is used as key information, and the XML data and / or XML metadata of the form file is registered in the text data of the document file (credit related information). The document file registered with the matching company name is displayed on the output means 209 of the user terminal 202 as a matching result.

また、取引の継続的な与信管理を行う目的で本発明の照合システムを利用する場合には、帳票ファイル(取引先申請書)のテキストデータ等と、文書ファイル(割止め情報、ニュース、風評からなる群から選ばれる1以上)のテキストデータ等とを次のように照合する。文書保存手段102に保存された文書ファイル(割止め情報、ニュース、風評からなる群から選ばれる1以上)のテキストデータ等に登録されている信用関連情報企業名および/または企業コードをキー企業情報として、帳票保存手段102に保存された帳票ファイル(取引先申請書)のXMLデータおよび/またはXMLメタデータの各タグに登録されている取引先、取引先の仕入先、取引先の販売先、提携先、ならびに株主の企業名および/または企業コードからなる群から選ばれる1以上の情報を、文書ファイルのテキストデータ等と突き合わせ(照合し)、適合した帳票ファイル(取引先申請書)を登録したユーザ(担当者)にアラートをメールなどで配信する。メールを受信したユーザは、ユーザ端末202の出力手段209に照合結果を表示して見ることができる。   In addition, when using the collation system of the present invention for the purpose of continuous credit management of transactions, the text data etc. of the form file (business partner application) and the document file (from discount information, news, reputation) 1 or more text data selected from the group is collated as follows. The credit-related information company name and / or company code registered in the text data etc. of the document file (one or more selected from the group consisting of indexing information, news and reputation) stored in the document storage means 102 is used as the key company information. As a business partner registered in each tag of the XML data and / or XML metadata of the business form file (business partner application form) stored in the business form storage means 102, the supplier of the business partner, the business customer of the business partner One or more pieces of information selected from the group consisting of the company name and / or company code of alliance partners and shareholders are matched (verified) with the text data etc. of the document file, and a suitable form file (business partner application) is created. Deliver alerts to registered users (persons in charge) by email. The user who has received the mail can display the collation result on the output means 209 of the user terminal 202 for viewing.

また、取引先および/または融資先の与信限度額管理を行う目的で本発明の照合システムを利用する場合には、帳票ファイルA(取引先申請書)のテキストデータ等と、帳票ファイルB(請求書および/または融資申込書)のテキストデータ等を次のように照合する。帳票保存手段101に保存された帳票ファイルB(請求書および/または融資申込書)のXMLデータおよび/またはXMLメタデータに登録されている企業名および/または企業コードをキー情報として、帳票ファイルA(取引先申請書)のXMLデータおよび/またはXMLメタデータの各タグに登録されている取引先の企業名および/または企業コードを、帳票ファイルB(請求書および/または融資申込書)のXMLデータおよび/またはXMLメタデータと突き合わせる(照合する)。適合した企業の帳票ファイルA(取引先申請書)のXMLデータおよび/またはXMLメタデータに登録されている与信限度額と、帳票ファイルB(請求書および/または融資申込書)のXMLデータおよび/またはXMLメタデータに登録されている請求金額および/または融資額とを、帳票ファイルAおよびBから取得し、与信限度額と請求金額および/または融資額とを比較し、適合した帳票ファイルA(取引先申請書)を登録したユーザ(担当者)にアラートをメールなどで配信する。メールを受信したユーザは、ユーザ端末202の出力手段209に照合結果を表示して見ることができる。   In addition, when using the collation system of the present invention for the purpose of managing the credit limit of the business partner and / or the lender, the text data of the form file A (business partner application form) and the form file B (billing) Text data and / or loan application form) is collated as follows. Form file A using the company name and / or company code registered in the XML data and / or XML metadata of form file B (invoice and / or loan application form) stored in form storage means 101 as key information (Business partner application form) XML data and / or business partner company name and / or company code registered in each tag of XML metadata, form file B (invoice and / or loan application form) XML Match (match) data and / or XML metadata. The credit limit registered in the XML data and / or XML metadata of the form file A (business partner application) of the conforming company, the XML data of the form file B (invoice and / or loan application form) and / or Alternatively, the invoice amount and / or loan amount registered in the XML metadata is acquired from the form files A and B, the credit limit amount is compared with the invoice amount and / or the loan amount, and a suitable form file A ( Deliver alerts by e-mail etc. to the user (person in charge) who registered the supplier application form. The user who has received the mail can display the collation result on the output means 209 of the user terminal 202 for viewing.

1.4.ハードウェア
図2は、本発明のデータ照合システムに用いられるハードウェアの1つの態様を示す図である。
この態様では、ユーザ端末202が、ネットワーク201を介してオンラインストレージ200に接続される。オンラインストレージ200は、インターネット通信を制御するHTTPサーバ207と、FAX送受信を制御するFAXサーバ206とファイル変換をはじめとするプログラムを制御するアプリケーションサーバ204とデータ保存をするための外部記憶装置203から構成される。そして、ユーザ端末202はデータを入力する手段208とデータを出力する手段209から構成される。
1.4. Hardware FIG. 2 is a diagram showing one aspect of hardware used in the data matching system of the present invention.
In this aspect, the user terminal 202 is connected to the online storage 200 via the network 201. The online storage 200 includes an HTTP server 207 that controls Internet communication, a FAX server 206 that controls FAX transmission / reception, an application server 204 that controls programs such as file conversion, and an external storage device 203 that stores data. Is done. The user terminal 202 includes means 208 for inputting data and means 209 for outputting data.

入力手段206としては、例えば、キーボードまたはマウス等のポインティングデバイスが挙げられる。出力手段207としては、例えば、液晶モニタ、CRTモニタ、またはプリンターが挙げられる。   Examples of the input unit 206 include a pointing device such as a keyboard or a mouse. Examples of the output unit 207 include a liquid crystal monitor, a CRT monitor, or a printer.

また、アプリケーションサーバ204のバス300には、プログラムを制御するCPU301と、プログラムやデータを格納するRAM302、ネットワークと接続可能な通信手段303、プログラムやデータを保存する記憶手段304、ユーザにブラウザを配信する手段であるHTTPサーバ207、FAXを受信するFAXサーバ206、メールを送信するメールサーバ205、およびアプリケーションサーバ204にて作成された帳票ファイルおよび文書ファイルを保存する外部記憶装置203が接続される。   Also, on the bus 300 of the application server 204, a CPU 301 for controlling the program, a RAM 302 for storing the program and data, a communication means 303 that can be connected to the network, a storage means 304 for storing the program and data, and a browser distributed to the user An HTTP server 207, which is a means for performing FAX, a FAX server 206 that receives FAX, a mail server 205 that transmits mail, and an external storage device 203 that stores form files and document files created by the application server 204 are connected.

2.本発明の使用態様
本発明の使用態様として、たとえば与信業務があげられる。与信業務において取引開始時の申請書を企業の信用関連情報に照合する目的で本発明の照合システムを利用する場合、本発明の照合システムを、例えば、図3に示すように構成することができる。
2. Use Mode of the Present Invention As a use mode of the present invention, for example, a credit service is given. When using the collation system of the present invention for the purpose of collating the application form at the start of the transaction with the credit related information of the company in the credit business, the collation system of the present invention can be configured as shown in FIG. 3, for example. .

図3に示す照合システム1は、帳票保存手段101と、文書保存手段102と、データ照合手段103と、帳票ファイル作成手段104と、文書ファイル作成手段105とを有する。帳票保存手段101と文書保存手段102は、オンラインストレージ5に収容される。データ照合手段103には、文書情報監視部37、データマイニング処理部38、項目間パターン情報データベース14、および項目間パターン情報登録部44などが含まれる。帳票ファイル作成手段104には、申請書登録部2およびファイル変換処理部6が含まれる。文書ファイル作成手段105には、文書登録部28、ファックス情報受信部3およびファイル変換処理部6が含まれる。本照合システム1の帳票ファイル作成手段104と文書ファイル作成手段105では、その構成のうち、ファイル変換処理部6を共有している。このため、本照合システム1のオンラインストレージ5には、前記で説明したファイル振分手段(ファイル振分処理部)32が含まれる。
尚、照合システム1には、さらに、契約者管理部4が含まれる。
The collation system 1 shown in FIG. 3 includes a form storage unit 101, a document storage unit 102, a data collation unit 103, a form file creation unit 104, and a document file creation unit 105. The form storage unit 101 and the document storage unit 102 are accommodated in the online storage 5. The data collating unit 103 includes a document information monitoring unit 37, a data mining processing unit 38, an inter-item pattern information database 14, an inter-item pattern information registration unit 44, and the like. The form file creation means 104 includes an application form registration unit 2 and a file conversion processing unit 6. The document file creation unit 105 includes a document registration unit 28, a fax information receiving unit 3, and a file conversion processing unit 6. The form file creation unit 104 and the document file creation unit 105 of the verification system 1 share the file conversion processing unit 6 in the configuration. Therefore, the online storage 5 of the collation system 1 includes the file distribution means (file distribution processing unit) 32 described above.
The verification system 1 further includes a contractor management unit 4.

契約者管理部4は、本システムへのログインを管理する部分であり、ログイン処理部21と契約者情報データベース10を有する。ユーザは、出力手段に表示されたログイン画面20に向って、ユーザIDおよびユーザパスワード等のユーザ認識情報を入力手段により入力する。入力されたユーザ認識情報は、ログイン処理部21において、契約者情報データベース10に保存されているユーザ認識情報と照合される。照合の結果、入力されたユーザ認識情報と契約者情報データベース10に記録されているユーザ認識情報とが一致すれば、メニュー画面表示部27に進み、本システムのメニュー画面が出力手段に表示される。本システムへのログインを管理することで、本システムのセキュリティーを高めることができる。   The contractor management unit 4 is a part that manages login to the system, and includes a login processing unit 21 and a contractor information database 10. The user inputs user recognition information such as a user ID and a user password by the input unit toward the login screen 20 displayed on the output unit. The input user recognition information is collated with the user recognition information stored in the contractor information database 10 in the login processing unit 21. As a result of the collation, if the input user recognition information matches the user recognition information recorded in the contractor information database 10, the process proceeds to the menu screen display unit 27 and the menu screen of this system is displayed on the output means. . Managing the login to this system can increase the security of this system.

帳票ファイル作成手段104に含まれる申請書登録部2は、Web上の申請書フォームに入力されたテキストデータを本システムが取得する部分であり、版下PDF登録部26、オンデマンド帳票画面自動作成部24、および入力データ取得部25を有する。ここでは、先ず、版下PDF登録部26に登録された申請書フォームが、出力手段に表示されるとともに、表示された申請書フォームの所定の項目については、オンデマンド帳票画面自動生成部24により申請書フォームに予め所定の項目の入力エリアが自動生成される。自動生成された入力エリアに含まれる項目の一部は、契約者情報データベース10からの契約者情報に基づいて自動的に入力される。予め自動的に入力される項目としては、例えば、契約者の取引先企業名、企業コード、担当者氏名、および担当者所属などが挙げられる。そして、ユーザは、予め所定の項目が自動的に入力された申請書フォームに向かって、入力エリアに含まれる残りの項目を入力手段により入力する。自動的におよびユーザにより入力されたテキストデータ、自動作成されたメタデータ、ならびに申請書フォームの画像データおよび図形データを、入力データ取得部25が取得する。   The application form registration unit 2 included in the form file creation unit 104 is a part in which the system acquires text data input to an application form on the Web. The form PDF registration unit 26, on-demand form screen automatic creation Unit 24 and input data acquisition unit 25. Here, first, the application form registered in the block PDF registration unit 26 is displayed on the output means, and predetermined items of the displayed application form are displayed by the on-demand form screen automatic generation unit 24. An input area for predetermined items is automatically generated in advance in the application form. Some of the items included in the automatically generated input area are automatically input based on the contractor information from the contractor information database 10. Items that are automatically input in advance include, for example, the contractor's business partner company name, company code, person-in-charge name, and person-in-charge affiliation. Then, the user inputs the remaining items included in the input area with the input unit toward the application form in which predetermined items are automatically input in advance. The input data acquisition unit 25 acquires the text data input automatically and by the user, the automatically created metadata, and the image data and graphic data of the application form.

尚、社内規定の改定などにより申請書フォームを変更する必要が生じた場合には、例えば、版下PDF登録部26に登録されている申請書フォームを新しいものに交換すれば良い。新しい申請書フォームへの交換後は、本システムのユーザは、自動的に、新しい申請書フォームを利用することになるので、旧申請書フォームで業務が行われるという事態を防ぐことができる。   If it is necessary to change the application form due to revision of company regulations, for example, the application form registered in the block PDF registration unit 26 may be replaced with a new one. After the replacement with the new application form, the user of this system automatically uses the new application form, so that it is possible to prevent a situation in which work is performed on the old application form.

ここで、本発明の好ましい態様では、Web上の申請書フォームに、自律型のチェック機能を埋め込む。自律型のチェック機能とは、Web上の申請書フォームに埋め込まれたスクリプトで、申請書への入力ミスを防ぐ機能である。入力ミスを防ぐために、公知のスクリプトを申請書フォームに埋め込むことができる。自律型のチェック機能によりチェックする申請書の項目としては、例えば、西暦と和暦が一致しているか、社名の法人格が正しいか、社名などを表す漢字のふりがなの仮名表記または片仮名表記に誤りがないか、資本金の単位が正しいか、あるいは、複数の記入欄の間で矛盾する点はないか、などの項目が挙げられる。   Here, in a preferred aspect of the present invention, an autonomous check function is embedded in an application form on the Web. The autonomous check function is a script embedded in an application form on the Web and is a function that prevents an input error in the application form. In order to prevent typing errors, a known script can be embedded in the application form. The items of the application form to be checked by the autonomous check function include, for example, whether the Western calendar matches the Japanese calendar, whether the corporate name of the company name is correct, or whether there is an error in the kana or katakana notation of the kanji that represents the company name. There are items such as whether there is no difference, whether the unit of capital is correct, or whether there are any inconsistencies between multiple entries.

また、本発明の好ましい態様では、申請書フォームを、2種類以上とする。申請書フォームを2種類以上とし、審査対象の企業の規模や業種などに最適化された申請書を利用することで、申請書中で曖昧になりがちな文章部分の比率を下げることができ、申請書と信用関連情報との照合結果の正確性や、申請書の検索結果の正確性を高めることができる。   Moreover, in the preferable aspect of this invention, there are two or more types of application forms. By using two or more types of application forms and using an application form optimized for the size and industry of the company to be reviewed, the ratio of sentences that tend to be ambiguous in the application form can be reduced. The accuracy of the collation result between the application form and the credit-related information and the accuracy of the retrieval result of the application form can be improved.

文書ファイル作成手段105に含まれるファックス情報受信部3は、信用関連情報などが記載された文書をファックスで受信して、文書の画像データを取得する部分であり、FAX受信部22を有する。文書をファックスで受信する場合、FAX受信部22で、文書の画像データを取得するとともに、ファックス受信日などをメタデータとして画像データに付す。メタデータが付された文書の画像データは次のファイル変換処理部6に送られる。また、本システムでは、FAX受信部22にて受信したFAX番号を、契約者情報データベース10に保存されているユーザ認識情報と照合することができ、これにより契約ユーザからのFAX送信であることをチェックすることができる。   The fax information receiving unit 3 included in the document file creation unit 105 is a part that receives a document in which credit related information and the like are described by fax and acquires image data of the document, and includes a FAX receiving unit 22. When the document is received by fax, the FAX receiving unit 22 acquires the image data of the document and attaches the fax reception date or the like as metadata to the image data. The image data of the document to which the metadata is attached is sent to the next file conversion processing unit 6. Further, in this system, the FAX number received by the FAX receiving unit 22 can be collated with the user recognition information stored in the contractor information database 10, thereby confirming that the FAX transmission from the contract user. Can be checked.

文書ファイル作成手段105に含まれる文書登録部28は、信用関連情報が記載された文書を含む紙媒体をスキャンして、文書の画像データを取得する部分である。本システム1では、文書登録部28は、メニュー画面表示部27により出力手段に表示されるメニューの中の1メニューとして表示される。   The document registration unit 28 included in the document file creation unit 105 is a part that scans a paper medium including a document in which trust-related information is described, and acquires image data of the document. In the system 1, the document registration unit 28 is displayed as one menu among the menus displayed on the output means by the menu screen display unit 27.

尚、文書参照部29は、帳票保存手段101に保存される帳票ファイルおよび/または文書保存手段102に保存される文書ファイルをユーザが参照するための部分である。文書参照部29も、メニュー画面表示部27により出力手段に表示されるメニューの中の1メニューとして表示される。   The document reference unit 29 is a part for the user to refer to the form file stored in the form storage unit 101 and / or the document file stored in the document storage unit 102. The document reference unit 29 is also displayed as one of the menus displayed on the output means by the menu screen display unit 27.

帳票ファイル作成手段104と文書ファイル作成手段105に共有されるファイル変換処理部6は、2つの役割を果たす。1つ目は、申請書登録部2で取得した申請書のXMLデータ、XMLメタデータ、画像データおよび図形データに基づいて、帳票ファイルを作成する役割である。2つ目は、ファックス情報受信部3または文書登録部28で取得した文書の画像データをOCR処理し、OCR処理によって得られたテキストデータおよびメタデータに基づいて文書ファイルを作成する役割である。ファイル変換処理部6は、OCR処理部23、テキストデータマージ部30、PDF変換処理部31を含む。   The file conversion processing unit 6 shared by the form file creation unit 104 and the document file creation unit 105 plays two roles. The first role is to create a form file based on the XML data, XML metadata, image data, and graphic data of the application form acquired by the application form registration unit 2. The second role is to perform OCR processing on the image data of the document acquired by the fax information receiving unit 3 or the document registration unit 28 and create a document file based on the text data and metadata obtained by the OCR processing. The file conversion processing unit 6 includes an OCR processing unit 23, a text data merging unit 30, and a PDF conversion processing unit 31.

申請書登録部2で取得した申請書のXMLデータ、XMLメタデータ、画像データおよび図形データは、テキストデータマージ部30において、結合される。結合したデータは、PDF変換処理部31において、XMLデータおよびXMLメタデータを有するPDFファイル形式の帳票ファイルに変換される。   The XML data, XML metadata, image data, and graphic data of the application form acquired by the application form registration unit 2 are combined in the text data merge unit 30. The combined data is converted by the PDF conversion processing unit 31 into a PDF file format form file having XML data and XML metadata.

また、ファックス情報受信部3で取得した文書の画像データは、OCR処理部23において、テキストデータに変換される。変換により得られたテキストデータおよびメタデータは、テキストデータマージ部30において、ファックス情報受信部3で取得した文書の画像データおよびメタデータと、結合される。結合したデータは、PDF変換処理部31において、テキストデータおよびXMLメタデータを有するPDFファイル形式の文書ファイルに変換される。   Further, the image data of the document acquired by the fax information receiving unit 3 is converted into text data by the OCR processing unit 23. The text data and metadata obtained by the conversion are combined with the image data and metadata of the document acquired by the fax information receiving unit 3 in the text data merging unit 30. The combined data is converted into a PDF file format document file having text data and XML metadata in the PDF conversion processing unit 31.

また、文書登録部28で取得した文書の画像データは、OCR処理部23において、テキストデータに変換される。変換により得られたテキストデータは、テキストデータマージ部30において、文書登録部28で取得した文書の画像データと、キーワード登録用インターフェース(不図示)で入力された関連キーワードおよび自動作成されたその他の属性データを含むメタデータと結合される。結合したデータは、PDF変換処理部31において、テキストデータおよびXMLメタデータを有するPDFファイル形式の文書ファイルに変換される。   The document image data acquired by the document registration unit 28 is converted into text data by the OCR processing unit 23. The text data obtained by the conversion is processed by the text data merging unit 30 in the document image data acquired by the document registration unit 28, related keywords input through a keyword registration interface (not shown), and other automatically created other data. Combined with metadata including attribute data. The combined data is converted into a PDF file format document file having text data and XML metadata in the PDF conversion processing unit 31.

オンラインストレージ5は、帳票ファイル作成手段104で作成された帳票ファイルを帳票保存手段101に、一方、文書ファイル作成手段105で作成された文書ファイルを文書保存手段102に、それぞれ振り分けて保存する部分である。オンラインストレージ5は、ファイル振分手段32、帳票保存手段101、および文書保存手段102を有する。さらに、文書検索処理部33、回覧制御機能部45、フォルダイベント監視部34、メール送信処理部35、FAX送信処理部36、および申請書版下保存部11を有する。   The online storage 5 is a part that sorts and saves the form file created by the form file creation unit 104 in the form storage unit 101 and the document file created by the document file creation unit 105 in the document storage unit 102. is there. The online storage 5 includes a file distribution unit 32, a form storage unit 101, and a document storage unit 102. Further, the document search processing unit 33, the circulation control function unit 45, the folder event monitoring unit 34, the mail transmission processing unit 35, the FAX transmission processing unit 36, and the application document version storage unit 11 are provided.

ファイル変換処理部6で作成された帳票ファイルおよび文書ファイルのデータは、ファイル振分手段32において、帳票ファイルは帳票保存手段101に、一方、文書ファイルは文書保存手段102に振り分けられる。ファイル振分手段32は、帳票ファイルまたは文書ファイルに含まれるデータ(例えば、FAX送受信番号、定型文書または準定型文書、および契約者情報データベース10に登録された契約者IDなど)に基づいて、帳票ファイルを帳票保存手段に、また、文書ファイルを文書保存手段に振り分ける。   The data of the form file and the document file created by the file conversion processing unit 6 is distributed by the file distribution unit 32 to the form storage unit 101 while the document file is distributed to the document storage unit 102. The file distribution means 32 is based on data included in the form file or document file (for example, fax transmission / reception number, fixed form document or semi-standard form document, and contractor ID registered in the contractor information database 10). The file is allocated to the form storage unit, and the document file is allocated to the document storage unit.

フォルダイベント監視部34は、帳票保存手段101のフォルダに帳票ファイルが、また、文書保存手段102のフォルダに文書ファイルが保存されたときのイベント処理を実行することができる。フォルダイベント監視部34にて設定できるイベント処理は、例えば、回覧制御機能部45が有する機能である帳票ファイルおよび/または文書ファイルの回覧機能および同報機能である。帳票ファイルおよび/または文書ファイルを回覧または同報する場合、メール送信処理部35が、帳票ファイルおよび/または文書ファイルのダイジェスト情報またはその内容の全てを、所定のユーザに向けてメール送信する。また、FAX送信処理部36が、帳票ファイルおよび/または文書ファイルのダイジェスト情報またはその内容の全てを、所定のユーザに向けてオンラインファックス送信する。メール送信またはオンラインファックス送信する所定のユーザは、契約者情報データベースに登録されている契約者の全部またはその一部である。   The folder event monitoring unit 34 can execute event processing when a form file is saved in the folder of the form saving unit 101 and a document file is saved in the folder of the document saving unit 102. The event processing that can be set by the folder event monitoring unit 34 is, for example, a circulation function and a broadcast function of a form file and / or a document file, which are functions that the circulation control function unit 45 has. When circulating or broadcasting a form file and / or document file, the mail transmission processing unit 35 sends the digest information of the form file and / or document file or all of the contents to the predetermined user by mail. Further, the FAX transmission processing unit 36 transmits the digest information of the form file and / or the document file or all the contents thereof to an online fax to a predetermined user. The predetermined users who send mail or online fax are all or part of the contractors registered in the contractor information database.

文書検索処理部33は、帳票保存手段101および/または文書保存手段102の保存内容を文書参照部29から参照するときのキー情報検索を実行する部分である。
申請書版下保存部11は、版下PDF登録部にて登録された版下PDFを契約者IDごとに保存する部分である。申請書版下保存部11に保存された版下PDFは、申請書登録部2にて帳票ファイルを作成する際に、前記のように利用される。
The document search processing unit 33 is a part that executes key information search when referring to the contents stored in the form storage unit 101 and / or the document storage unit 102 from the document reference unit 29.
The application form block storage unit 11 is a part that stores the block copy PDF registered by the block form PDF registration unit for each contractor ID. The block PDF stored in the application form block storage unit 11 is used as described above when the application form registration unit 2 creates a form file.

データ照合手段103は、帳票保存手段101に保存された帳票ファイルのXMLデータおよび/またはXMLメタデータを、文書保存手段102に保存された文書ファイルのテキストデータ等と照合する、または、文書保存手段102に保存された文書ファイルのテキストデータ等を、帳票保存手段101に保存された帳票ファイルのXMLデータおよび/またはXMLメタデータと照合する部分である。データ照合手段103は、文書情報監視部37、データマイニング処理部38、項目間パターン情報データベース14、パターン情報登録部44を有する。データ照合部103は、さらに、監視情報メール送信部39、監視情報取得部40、および監視情報表示部41を有する。   The data collating unit 103 collates the XML data and / or XML metadata of the form file stored in the form storing unit 101 with the text data of the document file stored in the document storing unit 102, or the document storing unit This is a part for collating the text data etc. of the document file stored in 102 with the XML data and / or XML metadata of the form file stored in the form storage unit 101. The data matching unit 103 includes a document information monitoring unit 37, a data mining processing unit 38, an inter-item pattern information database 14, and a pattern information registration unit 44. The data matching unit 103 further includes a monitoring information mail transmission unit 39, a monitoring information acquisition unit 40, and a monitoring information display unit 41.

文書情報監視部37は、帳票保存手段101に保存された帳票ファイルのXMLデータおよび/またはXMLメタデータに記載されている取引先をはじめとした全ての企業情報をキー情報として、帳票ファイルのXMLデータを文書保存手段102に保存された文書ファイルのテキストデータ等と照合し、帳票ファイルのXMLデータおよび/またはXMLメタデータに、文書ファイルのテキストデータ等に記載されている企業情報が含まれているか否かを監視する部分である。   The document information monitoring unit 37 uses the XML data of the form file stored in the form storage unit 101 and / or all company information including business partners described in the XML metadata as key information, and the XML of the form file. The data is collated with the text data of the document file stored in the document storage means 102, and the company information described in the text data of the document file is included in the XML data and / or XML metadata of the form file. It is a part that monitors whether or not.

データマイニング処理部38は、文書情報監視部37にて帳票ファイルのXMLデータおよび/またはXMLメタデータと照合された文書ファイルのテキストデータ等中に潜む相関関係やパターンなどを探し出し、ユーザに有効な文書情報を監視のキー情報として抽出する部分である。データマイニング処理部38に抽出された文書情報は、帳票保存手段101に帳票データを保存したユーザに更新ダイジェスト情報として、情報メール送信部39によりメールで配信される。ユーザは受信したメールの本文に記載されたアクセスURLから、更新ダイジェスト取得画面42進み、出力手段により表示された更新ダイジェスト取得画面に向って、ユーザIDおよびユーザパスワード等のユーザ認識情報を入力手段により入力する。入力されたユーザ認識情報は、ログイン処理部21において、契約者情報データベース10に保存されているユーザ認識情報と照合される。照合の結果、入力されたユーザ認識情報と契約者情報データベース10に記録されているユーザ認識情報とが一致すれば監視情報表示部41が出力手段により表示される。監視情報表示部41は、照合の結果抽出された全ての文書ファイルのリストを出力手段に表示する部分であり、監視情報取得部40では、リストに表示された文書ファイルを文書保存手段102から取得することができる。項目間パターン情報データベース14には、データマイニング処理部38がデータマイニング分析をするために必要なデータ(項目間のパターンやルールなど)が保存されている。項目間のパターンやルールなどのデータはパターン情報登録部44にて登録/修正を行うことができる。   The data mining processing unit 38 finds correlations and patterns hidden in the text data of the document file collated with the XML data and / or XML metadata of the form file by the document information monitoring unit 37, and is effective for the user. This is a part for extracting document information as monitoring key information. The document information extracted by the data mining processing unit 38 is delivered by e-mail by the information e-mail transmission unit 39 as update digest information to the user who has saved the form data in the form storage unit 101. The user proceeds from the access URL described in the text of the received mail to the update digest acquisition screen 42 and proceeds to the update digest acquisition screen displayed by the output means by using the input means for user identification information such as a user ID and a user password. input. The input user recognition information is collated with the user recognition information stored in the contractor information database 10 in the login processing unit 21. As a result of the collation, if the input user recognition information matches the user recognition information recorded in the contractor information database 10, the monitoring information display unit 41 is displayed by the output means. The monitoring information display unit 41 is a part that displays a list of all document files extracted as a result of collation on the output unit. The monitoring information acquisition unit 40 acquires the document file displayed in the list from the document storage unit 102. can do. The inter-item pattern information database 14 stores data (patterns and rules between items) necessary for the data mining processing unit 38 to perform data mining analysis. Data such as patterns and rules between items can be registered / corrected by the pattern information registration unit 44.

なお、本明細書において引用された全ての刊行物、例えば先行技術文献、及び公開公報、特許公報その他の特許文献は、参照として本明細書に組み込まれる。   It should be noted that all publications cited in the present specification, for example, prior art documents, publications, patent publications and other patent documents are incorporated herein by reference.

本発明のデータ照合システムの概略図である。It is the schematic of the data collation system of this invention. 本発明のデータ照合システムに用いられるハードウェアの1つの態様を示す図である。It is a figure which shows one aspect | mode of the hardware used for the data collation system of this invention. 本発明のデータ照合システムの一態様を示す概略図である。It is the schematic which shows the one aspect | mode of the data collation system of this invention.

符号の説明Explanation of symbols

1…照合システム
2…申請書登録部
3…ファックス情報受信部
4…契約者管理部
5…オンラインストレージ
101…帳票保存手段
102…文書保存手段
103…データ照合手段
104…帳票ファイル作成手段
105…文書ファイル作成手段
200…オンラインストレージ
201…ネットワーク
202…ユーザ端末
209…出力手段
DESCRIPTION OF SYMBOLS 1 ... Verification system 2 ... Application registration part 3 ... Fax information reception part 4 ... Contractor management part 5 ... Online storage 101 ... Form storage means 102 ... Document storage means 103 ... Data verification means 104 ... Form file creation means 105 ... Document File creation means 200 ... Online storage 201 ... Network 202 ... User terminal 209 ... Output means

Claims (13)

テキストデータおよびメタデータを有する帳票ファイルを保存する帳票保存手段と、
テキストデータおよびメタデータを有し帳票ファイルではない文書ファイルを保存する文書保存手段と、
前記帳票保存手段に保存された帳票ファイルのテキストデータおよび/またはメタデータを前記文書保存手段に保存された文書ファイルのテキストデータおよび/またはメタデータと照合するデータ照合手段と、
照合結果を表示する出力手段と、
を含む、データ照合システム。
A form storage means for storing a form file having text data and metadata;
Document storage means for storing a document file that has text data and metadata and is not a form file;
Data collation means for collating text data and / or metadata of a form file stored in the form storage means with text data and / or metadata of a document file stored in the document storage means;
An output means for displaying the verification result;
Including data verification system.
帳票ファイルのテキストデータが、XML形式にデータフォーマットされたテキストデータである、請求項1に記載のシステム。   The system according to claim 1, wherein the text data of the form file is text data formatted in an XML format. 帳票ファイルのメタデータが、XML形式にデータフォーマットされたメタデータである、請求項1または2に記載のシステム。   The system according to claim 1 or 2, wherein the metadata of the form file is metadata formatted in an XML format. 帳票ファイル保存手段と文書保存手段が、オンラインストレージに収容される、請求項1〜3のいずれか1項に記載のシステム。   The system according to claim 1, wherein the form file storage unit and the document storage unit are accommodated in an online storage. Web上で入力されたテキストデータおよび/または、PDF(Portable Document Format)上で入力されたテキストデータを含む帳票ファイルを作成する帳票ファイル作成手段をさらに有する、請求項1〜4のいずれか1項に記載のシステム。   5. The form file creation means for creating a form file including text data input on the Web and / or text data input on PDF (Portable Document Format). The system described in. 帳票ファイルに含まれるテキストデータが、入力されたテキストデータを、さらに、PDF自動変換機能にてXML形式のデータフォーマットに変換したテキストデータである、請求項5に記載のシステム。   The system according to claim 5, wherein the text data included in the form file is text data obtained by converting the input text data into an XML format using an automatic PDF conversion function. 紙媒体をスキャンして得られたデータをOCR処理することによって、および/またはファックスで受信されたデータをOCR処理することによって得られたテキストデータを含む文書ファイルを作成する文書ファイル作成手段をさらに有する、請求項1〜6のいずれか1項に記載のシステム。   Document file creation means for creating a document file containing text data obtained by OCR processing data obtained by scanning a paper medium and / or by OCR processing data received by fax The system according to any one of claims 1 to 6. 帳票ファイルが、さらに画像データと図形データからなる群から選ばれる1以上を有する、請求項1〜7のいずれか1項に記載のシステム。   The system according to claim 1, wherein the form file further includes one or more selected from the group consisting of image data and graphic data. 帳票ファイルが、PDFファイル形式である、請求項1〜8のいずれか1項に記載のシステム。   The system according to any one of claims 1 to 8, wherein the form file is in a PDF file format. 文書ファイルが、PDFファイル形式である、請求項1〜9のいずれか1項に記載のシステム。   The system according to claim 1, wherein the document file is in a PDF file format. 文書ファイルが信用関連情報を含む、請求項1〜10のいずれか1項に記載のシステム。   The system according to claim 1, wherein the document file includes trust related information. 請求項1〜11のいずれか1項に記載のシステムとして機能させるためのプログラム。   The program for functioning as a system of any one of Claims 1-11. 請求項12に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium on which the program according to claim 12 is recorded.
JP2008284200A 2008-11-05 2008-11-05 Data collating system Pending JP2010113454A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008284200A JP2010113454A (en) 2008-11-05 2008-11-05 Data collating system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008284200A JP2010113454A (en) 2008-11-05 2008-11-05 Data collating system

Publications (1)

Publication Number Publication Date
JP2010113454A true JP2010113454A (en) 2010-05-20

Family

ID=42301981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008284200A Pending JP2010113454A (en) 2008-11-05 2008-11-05 Data collating system

Country Status (1)

Country Link
JP (1) JP2010113454A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123672A (en) * 2010-12-09 2012-06-28 Canon Inc Information processor, information processing method and program
JP2015207100A (en) * 2014-04-18 2015-11-19 東芝テック株式会社 Information processing device and program
JP2016081124A (en) * 2014-10-10 2016-05-16 東芝テック株式会社 Information processing device and program
JP2018505481A (en) * 2015-02-13 2018-02-22 バリパット エス.エー.Valipat S.A. Method and system for automatic document generation from an index

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245232A (en) * 2001-02-14 2002-08-30 Cml:Kk Apparatus and system for providing business operation diagnostic information, and program
JP2005050094A (en) * 2003-07-28 2005-02-24 Toshiba Corp Optical character reader
JP2005216006A (en) * 2004-01-29 2005-08-11 Sumitomo Mitsui Banking Corp Letter of credit arrival advices system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245232A (en) * 2001-02-14 2002-08-30 Cml:Kk Apparatus and system for providing business operation diagnostic information, and program
JP2005050094A (en) * 2003-07-28 2005-02-24 Toshiba Corp Optical character reader
JP2005216006A (en) * 2004-01-29 2005-08-11 Sumitomo Mitsui Banking Corp Letter of credit arrival advices system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123672A (en) * 2010-12-09 2012-06-28 Canon Inc Information processor, information processing method and program
JP2015207100A (en) * 2014-04-18 2015-11-19 東芝テック株式会社 Information processing device and program
JP2016081124A (en) * 2014-10-10 2016-05-16 東芝テック株式会社 Information processing device and program
JP2018505481A (en) * 2015-02-13 2018-02-22 バリパット エス.エー.Valipat S.A. Method and system for automatic document generation from an index

Similar Documents

Publication Publication Date Title
US9507758B2 (en) Collaborative matter management and analysis
US7953758B2 (en) Workflow management method and workflow management apparatus
US8028231B2 (en) Document management system for searching scanned documents
US9542425B2 (en) Document management system having automatic notifications
US7917412B1 (en) Method and system for collecting information
US8090599B2 (en) Method and system for computerized insurance underwriting
US11886796B2 (en) Collaborative matter management and analysis
US20080082929A1 (en) Document-centric workflow systems, methods, and software based on document contents, metadata, and context
AU2023200114A1 (en) System, method, and interfaces for work product management
US20150012448A1 (en) Collaborative matter management and analysis
US8447731B1 (en) Method and system for information management
US20050216487A1 (en) System and method for generating tasks related to electronic image files
US20060282504A1 (en) Usage status notification system
US20070162318A1 (en) System And Method For Managing Business Processes
JP2010113454A (en) Data collating system
JP2002117215A (en) Patent management system
JP6976763B2 (en) Journal information processing device, journal information processing method, and program
US7885920B2 (en) System for managing the property of research and development
JP4944060B2 (en) Groupware server device, groupware server program, and groupware server device operating method
EP2325764A1 (en) Archiving system
JP2008250519A (en) Business negotiation support system and business negotiation support server
WO2024089910A1 (en) Information processing method, information processing program, information processing system
KR102547394B1 (en) One-stop newspaper announcement service provision system using platform
JP2023177688A (en) Electronic file storage processing apparatus, electronic file storage processing program, and electronic file storage processing method
WO2009071951A2 (en) Data processing system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111104

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120309

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120309

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20120309

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120309

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120309

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20120309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130319

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130723