JP7286121B1 - 情報処理装置、モデル構築方法及びモデル構築プログラム - Google Patents
情報処理装置、モデル構築方法及びモデル構築プログラム Download PDFInfo
- Publication number
- JP7286121B1 JP7286121B1 JP2022149139A JP2022149139A JP7286121B1 JP 7286121 B1 JP7286121 B1 JP 7286121B1 JP 2022149139 A JP2022149139 A JP 2022149139A JP 2022149139 A JP2022149139 A JP 2022149139A JP 7286121 B1 JP7286121 B1 JP 7286121B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- company
- transaction
- trading
- partner
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000010276 construction Methods 0.000 claims description 26
- 238000010801 machine learning Methods 0.000 claims 3
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 239000004065 semiconductor Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
各企業の会計情報及び属性情報を含む企業データと、取引元企業と取引先企業との間の取引量を示すデータを含む取引データと、を読み込むデータ読込部と、
前記企業データに含まれるデータのうち、前記取引データの前記取引元企業に関するデータと、前記取引データの前記取引先企業に関するデータと、を前記取引データに接続して、学習用データを構築するデータ構築部と、
前記学習用データを学習し、学習済みモデルを構築する学習処理部と、を備えるものである。
各企業の会計情報及び属性情報を含む企業データと、取引元企業と取引先企業との間の取引量を示すデータを含む取引データと、を読み込み、
前記企業データに含まれるデータのうち、前記取引データの前記取引元企業に関するデータと、前記取引データの前記取引先企業に関するデータと、を前記取引データに接続して、学習用データを構築し、
前記学習用データを学習し、学習済みモデルを構築するものである。
各企業の会計情報及び属性情報を含む企業データと、取引元企業と取引先企業との間の取引量を示すデータを含む取引データと、を読み込み処理と、
前記企業データに含まれるデータのうち、前記取引データの前記取引元企業に関するデータと、前記取引データの前記取引先企業に関するデータと、を前記取引データに接続して、学習用データを構築する処理と、
前記学習用データを学習し、学習済みモデルを構築する処理と、をコンピュータに実行させるものである。
まず、実施の形態1にかかる情報処理装置100を理解するための前提として、情報処理装置100を実現するためのシステム構成について説明する。図1に、実施の形態1にかかる情報処理装置100を実現するためのシステム構成の一例を示す。情報処理装置100は、専用コンピュータ、パーソナルコンピュータ(PC)などのコンピュータ1000により実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図1に示すように、コンピュータ1000は、CPU(Central Processing Unit)1001、ROM(Read Only Memory)1002及びRAM(Random Access Memory)1003を有し、これらがバス1004を介して相互に接続されている。尚、コンピュータを動作させるためのOSソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然有しているものとする。
データ読込部1は、企業データベース110から、学習用データの構築に用いる企業データCPR及び取引データTRDを読み込む。
データ構築部2は、取引データTRDに企業データCPRの会計データDA及び属性データDPから読み出したデータを接続する。具体的には、データ構築部2は、企業データCPRから、取引元企業及び取引先企業の売上、純利益、従業員数、業種、取扱品又は取扱役務を読み込み、それぞれの企業IDに後続するフィールドとして挿入する。ここでは、取引元ID、取引元企業の売上、純利益、従業員数、業種、取扱品又は取扱役務を取引元データ、取引先ID、取引先企業の売上、純利益、従業員数、業種、取扱品又は取扱役務を取引先データと呼称する。
データ構築部2は、企業データCPR及び取引データTRDを参照して、対比データを構成するデータを算出して、中間データINTに挿入する。ここでは、対比データを構成するデータとして、取引先該当数、取引元該当数、取引元企業と取引先企業との売上比、従業員数比及び純利益比、都道府県コードの差、及び、地域コードの差を算出する。
データ構築部2は、ステップS11~S13によって構築した学習用データLDを、学習処理部3へ出力する。
学習処理部3は、受け取った学習用データを入力データとして学習を行う。学習手法としては、例えば、ランダムフォレストを用いることができる。この場合、学習等データからサンプリングを行い、サンプルサイズnのサンプルをm個生成して、決定木を作成する。そして、m個のサンプルのそれぞれにおいて変数の一部をサンプリングして変数の候補として用い、変数の候補からデータを最もよく分割する変数及び閾値を選んで分岐条件を決定することで、学習器を作成する。最後に、各学習器の学習結果を統合することで、分類器として機能する学習済みモデルMを構築することができる。ここでは、学習処理部3は、構築した学習済みモデルMを推定部4に渡す。
データ読込部1は、企業データベース110から、取引構成先比率の推定対象となる企業データCPR及び取引データTRDを読み込む。なお、ここで読み込まれる取引データTRDの各レコードは、図7に示すデータ形式から、推定対象となる取引構成先比率を除いたレコードとなっている。
ステップS22は、ステップS12と同様であるので、説明を省略する。
ステップS23の処理は、ステップS13の学習用データLDに代えて、推定対象の入力データINが構築されることを除き、ステップS23と同様であるので、重複する説明を省略する。なお、上述したように、構築された入力データは、図10に示すデータ形式から、推定対象となる取引構成先比率を除いたデータとなる。
データ構築部2は、ステップS21~S23によって構築した入力データINを、推定部4へ出力する。
推定部4は、入力データINを学習済みモデルMによって構成される分類器に入力することで、取引構成先比率の推定結果RESを出力する。これにより、情報処理装置100は、取引先構成比率が未知である特定の取引元企業及び取引先企業の組み合わせについて、取引先構成比率を推定する。
図12に、実験条件EAでの取引データと企業データのとの接続の概要を示す。図12では、説明の簡略ため、取引先データの決算日は、取引元データの決算日と同じD1~D7とし、決算日の間隔は1年とする。取引データTRDの注目する1つのレコードの取得日は、決算日D4と次の決算日D5との間とする。
図13に、実験条件EBでの取引データと企業データのとの接続の概要を示す。図13における決算日及び取引データTRDの注目レコードの取得日は、図12と同様である。
図14に、実験条件ECでの取引データと企業データのとの接続の概要を示す。図14における決算日及び取引データTRDの注目レコードの取得日は、図13及び図14と同様である。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述の実施の形態にかかる情報処理装置が実行する処理は、ASIC(Application Specific Integrated Circuit)を含む半導体処理装置を用いて実現されてもよい。また、これらの処理は、少なくとも1つのプロセッサ(e.g. マイクロプロセッサ、CPU、GPU、MPU、DSP(Digital Signal Processor))を含むコンピュータシステムにプログラムを実行させることによって実現されてもよい。具体的には、これらの送信信号処理又は受信信号処理に関するアルゴリズムをコンピュータシステムに行わせるための命令群を含む1又は複数のプログラムを作成し、当該プログラムをコンピュータに供給すればよい。
DA 会計データ
DP 属性データ
DC 相関データ
IN 入力データ
INT 中間データ
LD 学習用データ
M 学習済みモデル
TRD 取引データ
1 データ読込部
2 データ構築部
3 学習処理部
4 推定部
5 記憶部
100 情報処理装置
1001 CPU
1002 ROM
1003 RAM
1004 バス
1005 入出力インターフェイス
1006 入力部
1007 出力部
1008 通信部
1009 記憶部
1010 ドライブ
1011 磁気ディスク
1012 光ディスク
1013 フレキシブルディスク
1014 半導体メモリ
1020 ネットワーク
1030 サーバ
1000 コンピュータ
Claims (14)
- 各企業の会計情報及び属性情報を含む企業データと、取引元企業と取引先企業との間の取引量を示すデータを含む取引データと、を読み込むデータ読込部と、
前記企業データに含まれるデータのうち、前記取引データの前記取引元企業に関するデータと、前記取引データの前記取引先企業に関するデータと、を前記取引データに接続して、学習用データを構築するデータ構築部と、
機械学習により前記学習用データを学習し、推定対象の取引元企業及び取引先企業に関する取引量以外のデータが入力データとして入力された場合に、前記推定対象の取引元企業と取引先企業との間の取引量の推定値を出力する学習済みモデルを構築する学習処理部と、を備える、
情報処理装置。 - 前記入力データを前記学習済みモデルに入力して、前記推定対象の取引元企業と取引先企業との間の前記取引量の推定値を出力する推定部を更に備え、
前記データ構築部は、前記企業データに含まれる、前記推定対象の取引元企業に関するデータと前記推定対象の取引先企業に関するデータとを接続して、前記入力データを生成する、
請求項1に記載の情報処理装置。 - 前記取引元企業と取引先企業との間の取引量を示すデータは、前記取引元企業の売上に占める、前記取引先企業に対する売り上げの比率を示す取引先構成比率であり、
前記推定部は、前記取引量の推定値として取引先構成比率を推定する、
請求項2に記載の情報処理装置。 - 前記取引データは、前記取引先構成比率の順位を示す取引先順位を含む、
請求項3に記載の情報処理装置。 - 前記取引データは、前記取引先企業が前記取引元企業の株主であるか否かを示す株主情報を含む、
請求項1又は2に記載の情報処理装置。 - 前記データ構築部は、前記取引データに基づいて、
各取引元企業について、各取引元企業がいくつの取引先企業に対して売上があるかを示す取引元該当数を算出して、前記取引データの各取引元企業のデータに接続する、
請求項1又は2に記載の情報処理装置。 - 前記データ構築部は、前記取引データに基づいて、各取引元企業について、各取引元企業がいくつの取引先企業に対して売上があるかを示す取引元該当数を算出して、前記取引データの各取引元企業のデータに接続する、
請求項1又は2に記載の情報処理装置。 - 前記データ構築部は、前記取引データに基づいて、各取引先企業について、各取引先企業に対していくつの取引元企業が売上があるかを示す取引先元該当数を算出して、前記取引データの各取引元企業のデータに接続する、
請求項1又は2に記載の情報処理装置。 - 前記データ構築部は、前記企業データに基づいて、前記取引元企業の売上に対する前記取引先企業の売上の比率を示す売上比を算出して、前記取引データの各取引元企業のデータに接続する、
請求項1又は2に記載の情報処理装置。 - 前記データ構築部は、前記企業データに基づいて、前記取引元企業の従業員数に対する前記取引先企業の従業員数の比率を示す従業員数比を算出して、前記取引データの各取引元企業のデータに接続する、
請求項1又は2に記載の情報処理装置。 - 前記データ構築部は、前記企業データに基づいて、前記取引元企業の純利益に対する前記取引先企業の純利益の比率を示す純利益比を算出して、前記取引データの各取引元企業のデータに接続する、
請求項1又は2に記載の情報処理装置。 - 前記データ構築部は、前記取引元企業の所在地を示す情報と、前記取引元企業の所在地を示す情報と、を、前記取引データに接続する、
請求項1又は2に記載の情報処理装置。 - データ読込部が、各企業の会計情報及び属性情報を含む企業データと、取引元企業と取引先企業との間の取引量を示すデータを含む取引データと、を読み込み、
データ構築部が、前記企業データに含まれるデータのうち、前記取引データの前記取引元企業に関するデータと、前記取引データの前記取引先企業に関するデータと、を前記取引データに接続して、学習用データを構築し、
学習処理部が、機械学習により前記学習用データを学習し、推定対象の取引元企業及び取引先企業に関する取引量以外のデータが入力データとして入力された場合に、前記推定対象の取引元企業と取引先企業との間の取引量の推定値を出力する学習済みモデルを構築する、
モデル構築方法。 - 各企業の会計情報及び属性情報を含む企業データと、取引元企業と取引先企業との間の取引量を示すデータを含む取引データと、を読み込む処理と、
前記企業データに含まれるデータのうち、前記取引データの前記取引元企業に関するデータと、前記取引データの前記取引先企業に関するデータと、を前記取引データに接続して、学習用データを構築する処理と、
機械学習により前記学習用データを学習し、推定対象の取引元企業及び取引先企業に関する取引量以外のデータが入力データとして入力された場合に、前記推定対象の取引元企業と取引先企業との間の取引量の推定値を出力する学習済みモデルを構築する処理と、をコンピュータに実行させる、
モデル構築プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022149139A JP7286121B1 (ja) | 2022-09-20 | 2022-09-20 | 情報処理装置、モデル構築方法及びモデル構築プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022149139A JP7286121B1 (ja) | 2022-09-20 | 2022-09-20 | 情報処理装置、モデル構築方法及びモデル構築プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7286121B1 true JP7286121B1 (ja) | 2023-06-05 |
JP2024043903A JP2024043903A (ja) | 2024-04-02 |
Family
ID=86611107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022149139A Active JP7286121B1 (ja) | 2022-09-20 | 2022-09-20 | 情報処理装置、モデル構築方法及びモデル構築プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7286121B1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019153258A (ja) | 2018-02-28 | 2019-09-12 | 毅 葉山 | 機械学習装置、予測システム、及び、プログラム |
JP2020135434A (ja) | 2019-02-20 | 2020-08-31 | 国立大学法人一橋大学 | 企業情報処理装置、企業のイベント予測方法及び予測プログラム |
JP2022015658A (ja) | 2020-07-09 | 2022-01-21 | 株式会社帝国データバンク | 取引構成比出力プログラム、取引構成比出力装置、取引構成比出力方法及びフィッティングプログラム |
-
2022
- 2022-09-20 JP JP2022149139A patent/JP7286121B1/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019153258A (ja) | 2018-02-28 | 2019-09-12 | 毅 葉山 | 機械学習装置、予測システム、及び、プログラム |
JP2020135434A (ja) | 2019-02-20 | 2020-08-31 | 国立大学法人一橋大学 | 企業情報処理装置、企業のイベント予測方法及び予測プログラム |
JP2022015658A (ja) | 2020-07-09 | 2022-01-21 | 株式会社帝国データバンク | 取引構成比出力プログラム、取引構成比出力装置、取引構成比出力方法及びフィッティングプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2024043903A (ja) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Terblanche et al. | The influence of integrated reporting and internationalisation on intellectual capital disclosures | |
US8234145B2 (en) | Automatic computation of validation metrics for global logistics processes | |
JP5566422B2 (ja) | 高リスク調達の解析およびスコアリング・システム | |
Krishnan et al. | Customer-base concentration: Implications for audit pricing and quality | |
Åstebro et al. | Predictors of the survival of innovations | |
Sun | A re-evaluation of auditors’ opinions versus statistical models in bankruptcy prediction | |
US8230268B2 (en) | Technology infrastructure failure predictor | |
Antunes et al. | Firm default probabilities revisited | |
US8121875B2 (en) | Comparing taxonomies | |
CN111652657A (zh) | 商品销量预测方法、装置、电子设备及可读存储介质 | |
US8359284B2 (en) | Organization-segment-based risk analysis model | |
Bhattacharya et al. | An exploratory study of RFID adoption in the retail sector | |
CN110738527A (zh) | 一种特征重要性排序方法、装置、设备和存储介质 | |
Mousavi et al. | Multi-criteria ranking of corporate distress prediction models: empirical evaluation and methodological contributions | |
Foreman et al. | The performance implications of planning, implementation, and evolution of firms' customer and competitor orientations | |
Yazdanfar | Predicting bankruptcy among SMEs: evidence from Swedish firm-level data | |
Haque et al. | Iron ore prices and the value of the Australian dollar | |
JP6611068B1 (ja) | 企業情報処理装置、企業のイベント予測方法及び予測プログラム | |
JP7286121B1 (ja) | 情報処理装置、モデル構築方法及びモデル構築プログラム | |
Chen et al. | Modeling recovery rate for leveraged loans | |
JP7043248B2 (ja) | 休廃業予測システム | |
Gu et al. | Evaluating the impact of COVID-19 on capesize and panamax sectors: the method of empirical mode decomposition | |
US20200286104A1 (en) | Platform for In-Memory Analysis of Network Data Applied to Profitability Modeling with Current Market Information | |
CN113870007A (zh) | 一种产品推荐方法、装置、设备及介质 | |
Granquist | An overview of methods of evaluating data editing procedures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220920 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230516 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7286121 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |