JP2018538587A - リスク評価方法およびシステム - Google Patents

リスク評価方法およびシステム Download PDF

Info

Publication number
JP2018538587A
JP2018538587A JP2018513514A JP2018513514A JP2018538587A JP 2018538587 A JP2018538587 A JP 2018538587A JP 2018513514 A JP2018513514 A JP 2018513514A JP 2018513514 A JP2018513514 A JP 2018513514A JP 2018538587 A JP2018538587 A JP 2018538587A
Authority
JP
Japan
Prior art keywords
variable
type
variable group
group
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018513514A
Other languages
English (en)
Other versions
JP6771751B2 (ja
Inventor
江 ▲劉▼
江 ▲劉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2018538587A publication Critical patent/JP2018538587A/ja
Application granted granted Critical
Publication of JP6771751B2 publication Critical patent/JP6771751B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)

Abstract

リスク評価方法およびシステム。本発明は、値を有する弱い変数を掘り起こし、その弱い変数をリスク評価モデルに追加し、リスク評価の要因がより包括的で、説明に役立ち、安定的であることを可能にし、それによって、正確性を高め、リスク評価の客観性を保証する。方法は、データソースからの変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得するステップ(110)と、少なくとも1つの第2の種類の変数グループに関連するリスク評価モデルを構築して、少なくとも1つの第2の種類の変数グループのリスク評価モデルのモデルの結果を取得するステップ(120)と、少なくとも1つの第2の種類の変数グループのモデルの結果を、少なくとも1つの第1の種類の変数グループの変数と併合するための変数として使用して、第3の種類の変数グループを形成するステップと、第3の種類の変数グループに関して統合されたリスク評価モデルを構築するステップ(130)とを含む。

Description

本出願は、中国国家知識産権局に2016年2月1日に出願された、発明の名称を「リスク評価方法およびシステム」とする中国特許出願第201610070616.5号の優先権を主張し、その全体が参照により本明細書に組み込まれる。
本開示は、コンピュータテクノロジーに基づくリスク評価テクノロジーの分野、具体的には、リスク評価方法およびシステムに関する。
リスク評価は、情報によってもたらされるリスクの可能性、たとえば、情報が直面する脅威、情報の脆弱性、および情報によって引き起こされる影響の可能性についての評価である。一般的なリスク評価方法としては、モデル法(model method)およびエキスパート法(expert method)の2つがある。
モデル法は、ロジスティック回帰、決定木、およびランダムフォレストなどの機械学習方法を使用してリスク評価モデルを構築し、モデルの結果に基づいてリスク評価を行うための方法である。実践により、一部の弱い変数(weak variable)がサービスにおいて極めて重大であり得ることが示されている。しかし、モデル法においては、弱い変数は、モデルのために選択され得ない。その結果、モデル法においては、一部の変数の機能を反映することができず、サービスの発展の将来の趨勢を反映することが難しい。
エキスパート法は、専門家の意見に従って評価の考慮事項を決定することによってリスク評価を行うための方法である。エキスパート法は、弱い変数がモデルのために選択され得ない問題を解決することができる。しかし、エキスパート法は、比較的主観的な方法であり、この方法ではデータの値が十分に掘り起こされて使用されることはない。
本発明の実施形態は、リスク評価方法を提供する。価値のある弱い変数が、掘り起こされ、リスク評価モデルに追加され、リスク評価の考慮事項をより包括的にし、解釈の容易さおよび安定性をより強くし、リスク評価の正確性を高めるのを助け、リスク評価の客観性を保証する。
本開示の第1の態様は、データソースに従って変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得するステップと、少なくとも1つの第2の種類の変数グループに関するリスク評価モデルを構築して、少なくとも1つの第2の種類の変数グループに関するリスク評価モデルのモデルの結果を取得するステップと、少なくとも1つの第2の種類の変数グループのモデルの結果を変数として使用し、その変数を少なくとも1つの第1の種類の変数グループ内の変数と組み合わせて第3の種類の変数グループを形成するステップと、第3の種類の変数グループに関する包括的なリスク評価モデルを構築するステップとを含むリスク評価方法を提供する。
本開示の第2の態様は、データソースに従って変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得するように構成された前処理モジュールと、少なくとも1つの第2の種類の変数グループに関するリスク評価モデルを構築して、少なくとも1つの第2の種類の変数グループに関するリスク評価モデルのモデルの結果を取得するように構成された第1の構築モジュールと、少なくとも1つの第2の種類の変数グループのモデルの結果を変数として使用し、その変数を少なくとも1つの第1の種類の変数グループ内の変数と組み合わせて第3の種類の変数グループを形成するように構成された変数組合せモジュールと、第3の種類の変数グループに関する包括的なリスク評価モデルを構築するように構成された第2の構築モジュールとを含むリスク評価システムを提供する。
本開示のいくつかの実現可能な実装においては、2種類の変数グループを取得するために変数がグループ分けされ、第2の種類の変数グループに関するリスク評価モデルが構築され、モデルの結果が、第3の種類の変数グループを形成するために、第1の種類の変数グループ内の変数と組み合わされる変数として使用され、最後に、第3の種類の変数グループに関する包括的なリスク評価モデルが構築される技術的な解決策が使用されることが、以上から分かり得る。
方法は、第2の種類の変数グループのデータ値を十分に掘り起こし、使用し、したがって、第2の種類の変数グループが、最終的に構築される包括的なモデルに反映される。したがって、リスク評価の考慮事項は、より包括的であり、解釈の容易さおよびモデルの安定性が、より高く、モデルの結果は、可能な限り客観的および正確であり、応用においてより堅牢であり、それによって、リスク評価の効果を改善するのに役立ち、サービスの発展の将来の趨勢を反映するのに役立つ。
本発明の実施形態の技術的な解決策をより明瞭に説明するために、以下で、実施形態を説明するために必要とされる添付の図面を簡単に紹介する。明らかに、以下の説明の添付の図面は、本発明の一部の実施形態のみを示しており、当業者は、創造的な努力なしにこれらの添付の図面からその他の図面を導き出すことがやはり可能である。
本発明の実施形態によるリスク評価方法の概略的な流れ図である。 従来のモデル法を使用することによってモデルを構築するプロセスの概略図である。 本発明の実施形態におけるリスク評価方法を使用することによってモデルを構築するプロセスの概略図である。 本発明の実施形態によるリスク評価システムの概略構造図である。 本発明の実施形態によるコンピュータデバイスの概略構造図である。
本開示の解決策を当業者により分かりやすくするために、以下で、本発明の実施形態における技術的な解決策を本発明の実施形態において添付の図面を参照して明瞭かつ十分に説明する。明らかに、説明される実施形態は、本発明の実施形態のすべてではなく一部であるに過ぎない。創造的な効果なしに本発明の実施形態に基づいて当業者によって得られるすべてのその他の実施形態は、本開示の保護範囲内に入る。
本発明の実施形態における技術的な解決策は、コンピュータシステムに基づくリスク評価方法に関する。まず、以下で、リスク評価方法において使用されるいくつかの用語を簡潔に説明する。
本明細書全体を通じて、用語「リスクスコアカード(risk scorecard)」は、リスク評価モデル、たとえば、ユーザの信用リスクを評価するために使用されるリスク評価モデルを指し、通常、2つの種類、すなわち、教師あり学習および半教師あり学習(拒絶の推定(reject inference)が存在する場合)を含む。通常、教師ありの目標(supervised target) (すなわち、目標変数(target variable))は、ユーザがある期間内に債務不履行に陥るかどうか、たとえば、ユーザがローンを期限までに返さない場合、ローンが貸し付けられた後6ヶ月以内にローンが90日より長く滞納されるかどうかである。通常、リスクスコアカードを構築するための2つの方法、すなわち、モデル法およびエキスパート法が存在する。
用語「弱い変数」は、統計的に有意でない、つまり、有意性仮説検定(significance hypothesis test)における確率(P値、Pr)が設定された基準、たとえば、0.05以上であり、そのような統計的基準に従ってリスク評価モデルのために選択され得ない変数を指す。それに比べて、用語「強い変数」は、統計的に有意である、つまり、有意性仮説検定におけるP値が設定された基準、たとえば、0.05未満であり、有意性の統計の基準を満たすことができる変数を指す。代替的に、設定された基準は、0.05と異なる値、たとえば、0.01であり得ることに留意されたい。これは、本明細書において限定されない。仮説検定は、推測統計学における重要な要素であることに留意されたい。仮説検定が専門的な統計ソフトウェアを使用することによって行われるとき、P値は、検定の判断の基礎である。P値は確率であり、イベントが起こる確率を反映する。統計においては、通常、有意性検定方法を使用することによって得られたP値は、P<0.05である、つまり、標本誤差によって引き起こされる標本の間の差の確率が0.05未満であることを意味するときに有意な変数を示し得る。
用語「変数グループ」は、同じデータソースからの変数のグループを指す。用語「強い変数グループ(strong variable group)」は、目標変数と比較的高い相関を有する、かつ/またはユーザ情報と比較的高い相関を有する変数グループを指す。用語「弱い変数グループ(weak variable group)」は、目標変数と比較的低い相関を有する、かつ/またはユーザ情報と比較的低い相関を有する変数グループを指す。相関は、P値などの相関係数を使用することによって表され得る。変数グループ内のすべての変数のP値の平均値が、計算され得る。平均値が閾値より大きいとき、変数グループは目標変数と比較的高い相関を有すると考えられ、平均値が閾値より大きくないとき、変数グループは目標変数と比較的低い相関を有すると考えられる。
用語「エキスパートスコアカード(expert scorecard)」は、業界の専門家の経験に基づいて設計されたリスクスコアカードを指す。専門家採点法(expert scoring method)は、エキスパートスコアカードに基づいて行われるリスク評価方法である。
用語「ロジスティック回帰(LR)」は、現在、思慮深く、広く応用されており、リスクスコアカードを作成するために使用される方法を指し、一般化された線形回帰法である。
用語「決定木」は、離散関数の値を近似するための方法を指す。決定木は、典型的な分類方法であり、予測モデルを構築するためにも使用され得る。まず、データが処理され、可読規則(readable rule)および決定木が帰納的アルゴリズムを使用することによって生成される。それから、決定木は、新しいデータを分析するために使用される。実質的に、決定木は、一連の規則に従ってデータを分類するプロセスである。決定木の典型的なアルゴリズムは、ID3、C4.5、分類および回帰木(CART: classification and regression tree)などを含む。
用語「階層分析法(analytic hierarchy process)」は、意思決定に常に関連する要素を階層内の目標、基準、解決策などとして決定し、階層に基づいて定性的および定量的分析を行う意思決定方法を指す。
用語「変数正規化」は、変数を標準化する操作を指し、その目的は、異なる規模の変数を比較できるようにすることである。異なる正規化方法が、存在する。本明細書においては、最小-最大正規化(minimum-maximum normalization)方法が使用され、それぞれの処理された変数の値の範囲は[0,1]である。
用語「モデル堅牢性(model robustness)」は、開発プロセスから実施プロセスまでのモデルの安定性を指す。より高い堅牢性を有するモデルは、より理想的な実施効果を有する。
用語「コルモゴロフ スミルノフ(KS)」は、スコアモデルの効果を測定するための広く知られている測定基準を指す。コルモゴロフおよびスミルノフは、2人のソビエト連邦の数学者の名前である。KSは、0から100までの範囲内にあり、より大きな値は、より優れたモデルの効果を示す。通常、約25に等しいKSが、金融機関によって許容され得るリスク評価の基準である。
以下で、モデル法を簡潔に説明する。
モデル法は、最も広く知られているリスク評価方法である。モデル法を使用することによって構築されたリスク評価モデル(論理モデル)は、リスクスコアカードと呼ばれることがある。リスクスコアカードを構築するための多くの通常の方法、たとえば、ロジスティック回帰法、決定木、およびランダムフォレストがある。ロジスティック/逐次回帰(stepwise regression)法は、現在、最も広く、思慮深く応用されている方法の1つである。以下では、リスクスコアカードの基礎的モデリングプロセスを説明するための例としてロジスティック回帰法を使用する。プロセスは、以下のステップを含む。
第1に、正規化されたモデリングワイドテーブル(modeling wide table)、たとえば、表1が、準備される。通常、表1には数百より多くの変数xが存在する。表1には合計で10000個のユーザ標本および300個の属性(すなわち、変数)が存在すると仮定される。表1は、異なるデータソースからの合計で3種類の変数、すなわち、支払い(payment)変数、インスタントメッセージング(instant messaging)変数、および社交(socialization)変数を含む。3つの種類の変数がそれぞれ100個の変数を含むと仮定すると、合計300個の変数が存在する。表1の第2の列のYは、具体的には、ユーザがローンを期限までに返さない場合、ローンが貸し付けられた後1年以内にローンが90日より長く滞納されるかどうかに関連し得る、教師ありの目標または目標変数である。表の各変数の値は、正規化された値である。したがって、各値は、[0,1]の範囲内にある。
本発明の実施形態の各変数は、たとえば、ユーザデータまたは公衆によって問い合わされ得るデータを含む法務データソースからのものであることに留意されたい。ユーザデータは、使用するためにユーザによって認証されるデータである。
Figure 2018538587
3種類の変数の中で、支払い変数が、財務と直接的に相関があり、比較的高い相関を有し、強い変数グループと考えられることが可能であり、インスタントメッセージング変数および社交変数が、それぞれ、財務と比較的低い相関を有し、弱い変数グループと考えられることが可能であることは、容易に理解される。
表1においては、第1から第15の変数が強い変数グループ内の強い変数であり、第16から第30の変数が弱い変数グループ内の強い変数であると仮定される。一連の変数の分析および変数のスクリーニングの後、通常の結果は、強い変数グループ内の最初の15個の強い変数および弱い変数グループ内の第16から第18の強い変数が最終的なロジスティック回帰モデルに入ることであり得る。得られたロジスティック回帰モデルの結果は、式(1)および(2)に示される。
Figure 2018538587
Logoddsは、ロジスティック回帰モデルの出力結果(略して、モデルの結果)であり、Probabilityは、確率パラメータであり、Probabilityは、モデルの結果Logoddsが十分に機能しない確率を表す。
弱い変数グループの中では、x16、x17、およびx18を含む3つの変数のみがモデルのために選択され、残りの変数はモデルに入らないことが分かり得る。弱い変数グループ内のその他の強い変数(たとえば、x19からx30)が選抜(select in)/除外(select out)スクリーニング基準を下げることによってまたは押し込み法(force in method)を使用することによってモデルに入れられ得るが、モデルに対する弱い変数グループの寄与は事実上反映され得ないか、またはリスクスコアカード内の弱い変数グループの重みは極端に低い。そのような手法は、重大な欠点、すなわち、基準を下げることによって新しく選択される弱い変数グループ内の変数が非常に不安定であり得るという欠点をさらに有する。
以下で、エキスパート法を簡潔に説明する。
エキスパートスコアカードは、業界の専門家の経験に基づいて設計され、形成された記号論理学的スコアモデルである。エキスパートスコアカードは、サービスの発展の初期段階において非常に有用であり、また、比較的少ない数のユーザに関連して一部の公共サービスにおいて頻繁に使用される。通常のエキスパートスコアカードに関しては、専門家の意見が前もって集められ、スコアを付けるための考慮事項、すなわち、使用される変数の範囲が決定され、それから、サービスのために必要とされるエキスパートスコアカードを最終的に得るために、各変数の重みが決定される。データおよび変数の仮定は、モデル法の表1のデータおよび変数の仮定と同じである。エキスパートスコアカードが、表2に示される。
Figure 2018538587
エキスパートスコアカードは、弱い変数グループ内のほとんどの変数がモデル法においてはモデルのために選択され得ないという問題を解決し、理解し、実施することが比較的容易である。しかし、エキスパートスコアカードは、致命的な欠陥、すなわち、データの値が十分に掘り起こされ、使用されず、比較的主観性が強いという欠陥を有する。たとえば、方法は、変数の間の相関および相乗効果を考慮せず、変数値は、比較的大きく変わる可能性があり、モデルをあまり安定しないものにする。
上述のように、既存のリスクスコアカードの構築方法は、主として、エキスパート法およびモデル法を含む。2つの方法の両方は、産業での応用において比較的成熟しているが、それらの方法の欠陥も、非常にはっきりしている。モデル法の主な欠陥は、弱い変数が選択され得ず、サービスの発展の趨勢が反映され得ないことである。エキスパート法の主な欠陥は、方法が比較的主観性が強く、データの値を最大限に掘り起こし、使用することができないことである。
したがって、本発明の実施形態は、リスク評価方法およびシステムを提供する。以下で、別々に説明を行う。
実施形態1
図1を参照すると、本発明の第1の実施形態は、リスク評価方法を提供する。方法は、以下のステップを含み得る。
S110: データソースに従って変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得する。
インターネットの急速な発展により、ますます多くの情報およびデータが存在し、リスク評価方法において使用されるデータソースがますます広く分散される。一部のデータソースは、信用リスクと比較的強い相関があり、一部のデータソースは、信用リスクと比較的弱い相関がある。本明細書においては、まず、変数が、データソースに従ってグループ分けされ、同じソースからのものである変数は、1つの変数グループと考えられる。たとえば、それぞれ支払い、インスタントメッセージング、および社交からの3種類の変数が、3つの変数グループと考えられ得る。本明細書において、変数グループは、分類され、変数グループのすべては、強い変数グループおよび弱い変数グループに分類される。ユーザの財務管理、貯金、消費、および支払いなどの一部の変数は、財源などのユーザ情報と直接的に相関があり、ユーザの信用リスクと比較的高い相関を有する。たとえば、これらの変数が、強い変数グループと呼ばれ得る。インスタントメッセージング、社交、およびゲームなどの一部の変数は、財務と直接的な相関がなく、ユーザのいくつかの社会的および行動の習性を反映するに過ぎず、したがって、信用リスクと比較的弱い相関を有する。たとえば、これらの変数が、弱い変数グループと呼ばれ得る。
変数グループを分類する要因は、以下のことを含み得るがこれらに限定されない。
1. データソースと目標変数(たとえば、債務不履行があるかどうか)との間の相関
通常、ピアソンの相関係数が、相関分析において使用されることが可能であり、そのピアソンの相関係数の計算方法は、本明細書において説明されない。通常、相関の基準は、0.6を超える値が強い相関を示し、0.4から0.6までが中間の相関を示し、0.2から0.4までが弱い相関を示し、0.2未満の値が極めて低い相関または無相関を示すというものであり得る。しかし、金融界における実際の応用のための基準は、それとはほど遠く、相関の基準は、相関係数が0.4を超えている変数が極めて珍しいため、ずっと低い。つまり、相関の基準は、要件に従って定義され得る。たとえば、支払い変数に関しては、0.1を超える値が強い相関を示し、0.1未満の値が弱い相関を示すことが定義され得る。
2. データソースとユーザ情報(たとえば、財源)との間の相関
相関は、変数の種類にも深く関連がある。通常、ユーザの財源などの情報に比較的近いローン、融資、および支払いなどの変数の相関は、比較的強く、ユーザの財源から比較的遠いインスタントメッセージングまたは社交などの変数の相関は、比較的弱い。適用中に、重要性の値が、データソースとユーザ情報との間の相関を表すために使用され、たとえば、強い、中間、および弱いであり得る。
本明細書においては、変数グループが、上述の2つの基準、すなわち、データソースと目標変数との間の相関および/またはデータソースとユーザ情報との間の相関に従って強い変数グループおよび弱い変数グループに分類され得る。強い変数グループが、第1の種類の変数グループであり、弱い変数グループが、第2の変数グループである。
一部の実施形態において、変数グループを分類するための特定の方法は、以下のステップを含み得る。
a0: 異なるデータソースに従ってすべての変数を複数の変数グループにグループ分けする。
a1: データソースと目標変数との間の相関に従って任意の変数および目標変数の相関係数を計算し、複数の変数グループの中の各変数グループの平均相関係数を計算する。相関係数は、上述のP値である。
a2: データソースとユーザ情報との間の相関に従って複数の変数グループの中の各変数グループの重要性の値を決定する。
a3: 複数の変数グループの平均相関係数および/または重要性の値に従って変数グループの分類を行い、平均相関係数が閾値より大きい、かつ/または重要性の値が最も高い変数グループを第1の種類の変数グループ、すなわち、強い変数グループとして分類し、その他の変数グループを第2の種類の変数グループ、すなわち、弱い変数グループとして分類する。
強い変数グループは目標変数と比較的高い相関を有する、かつ/またはユーザ情報と比較的高い相関を有する変数グループであり、弱い変数グループは目標変数と比較的低い相関を有する、かつ/またはユーザ情報と比較的低い相関を有する変数グループであることが、分かり得る。
図3に示されるように、図3は、アプリケーションシナリオの例における変数グループの分類の概略図である。さまざまな種類の変数に関する相関の基準も、異なる。実際の経験と組み合わせて設定される相関の基準の閾値は、支払い変数に関して0.1であり、インスタントメッセージング変数に関して0.05であり、社交変数に関して0.06であり得る。相関が閾値より大きい変数は、強い変数と考えられ、相関が閾値未満である変数は、弱い変数と考えられる。支払い変数の中で、比較的強い変数は、ユーザの支払い能力を反映するクレジットカード支払い、ユーザの支払い能力を反映する財源の大きさなどを含み、比較的弱い変数は、ユーザのトランザクションの頻度、ユーザのフォンカード(phone card)の再チャージなどを含む。インスタントメッセージング変数の中で、比較的強い変数は、ユーザの安定性を反映するよく使用されるログイン都市(login city)の数などを含み、比較的弱い変数は、送信および受信された情報の数などを含む。社交変数の中で、比較的強い変数は、比較的親密な友達の数および質を含み、比較的弱い変数は、友達の数、送信および受信された情報の量などを含む。
説明の都合で、3種類の変数の変数名は、表1の変数名に対応する。具体的には、表3の第3行および第4行を参照されたい。上述の変数の相関の基準の閾値によれば、各種類の変数の中の強い変数および弱い変数の数は、それぞれ、支払い変数に関して15および85、インスタントメッセージング変数に関して8および92、ならびに社交変数に関する7および93である。
Figure 2018538587
支払い、インスタントメッセージング、および社交からの3種類の変数は異なるデータソースに従って3つのグループ、すなわち、変数グループA、B、およびCに分類され得ることが、表3から分かり得る。変数グループAの平均相関係数および重要性の値は、最も大きい。したがって、変数グループAは、強い変数グループであり、変数グループBおよびCは、弱い変数グループである。
弱い変数グループは弱い変数とは異なることに留意されたい。弱い変数グループは、強い変数も含み得るが、目標変数との相関は、それほど強くないだけである。同様に、強い変数グループは、弱い変数も含み得る。確かに、弱い変数は、弱い変数グループに、より含まれやすく、強い変数は、強い変数グループに、より含まれやすい。弱い変数グループ内の多くの変数は統計において有意であるが、それらの変数がモデリングのために強い変数グループと一緒にされるとき、通常それらの変数のごく一部だけがモデルに入り得る。弱い変数グループの効果は、大きく薄められ、弱い変数グループは、十分な役割を果たし得ない。
S120: 少なくとも1つの第2の種類の変数グループに関するリスク評価モデルを構築して、第2の種類の変数グループに関するリスク評価モデルのモデルの結果を取得する。
このステップにおいては、それぞれの弱い変数グループに関するリスク評価モデルのモデルの結果を取得するために、上述のステップにおいて得られた少なくとも1つの第2の種類の変数グループまたは弱い変数グループの各々に関するリスク評価モデルが確立される。それぞれの弱い変数グループが、ロジスティック回帰法を使用することによってモデリングされると仮定される。弱い変数グループを考慮して、変数選択基準が適切に緩められ得る。
たとえば、インスタントメッセージングに対応する弱い変数グループBのモデリングの結果は、以下の通りである。
Figure 2018538587
式(3)において、LogoddsBは、モデルの結果であり、f(xB)は、変数グループBのモデリングを表し、xBiは、変数グループB内のi番目の変数を表し、iは、正の整数であり、a0は、切片項/定数項であり、aiは、変数xBiの重みを表す。
表3の変数名の間の対応を考慮して、式(3)は、下記のように書かれ得る。
Figure 2018538587
式(4)において、LogoddsBは、モデルの結果であり、f(xB)は、変数グループBのモデリングを表し、a0は、切片項/定数項であり、aiは、変数xiの重みを表し、iは、正の整数である。
同様に、社交に対応する弱い変数グループCのモデリングの結果は、下記のように取得され得る。
Figure 2018538587
式(5)において、LogoddsCは、モデルの結果であり、f(xC)は、変数グループCのモデリングを表し、xCiは、変数グループC内のi番目の変数を表し、iは、正の整数であり、a0は、切片項/定数項であり、aiは、変数xCiの重みを表す。
表3の変数名の間の対応を考慮して、式(5)は、下記のように書かれ得る。
Figure 2018538587
式(6)において、LogoddsCは、モデルの結果であり、f(xC)は、変数グループCのモデリングを表し、a0は、切片項/定数項であり、aiは、変数xiの重みを表し、iは、正の整数である。
上述の式によって表されるリスク評価モデルは単なる例であり、本開示を限定するように意図されていないことに留意されたい。加えて、複数の第2の種類の変数グループが存在するとき、リスク評価モデルは、第2の種類の変数グループのうちのただ1つに関して確立されることが可能であり、またはリスク評価モデルは、第2の種類の変数グループのうちのいくつかもしくは各々に関して確立されることが可能である。それらのリスク評価モデルの両方とも、対応する技術的効果を有することが可能であり、本開示は、それらの技術的効果にいかなる限定も課さない。
S130: 第2の種類の変数グループのモデルの結果を変数として使用し、その変数を少なくとも1つの第1の種類の変数グループ内の変数と組み合わせて第3の種類の変数グループを形成し、第3の種類の変数グループに関する包括的なリスク評価モデルを構築する。
たとえば、このステップにおいては、それぞれの弱い変数グループのモデルの結果が、変数として使用され、すべての強い変数グループ内のすべての変数が、第3の種類の変数グループを形成するためにすべてのモデルの結果の変数と組み合わされる。本明細書において、第3の種類の変数グループは、組合せ変数グループとも呼ばれる。少なくとも1つの弱い変数グループ内の任意の弱い変数グループXjに関するリスク評価モデルのモデルの結果は、Logoddsjと表記され、Logoddsjは、変数として使用され、少なくとも1つの強い変数グループ内の任意の変数は、xiと表記されると仮定される。すべての変数Logoddsjおよびxiが、組合せ変数グループを形成するために組み合わされることが可能であり、iとjとの両方は、正の整数である。組合せ変数グループは、[x1,x2......xi......xn......Logoddsj......Logoddsm]によって表されることが可能であり、nは、変数xiの数であり、mは、変数Logoddsjの数であり、nとmとの両方は、正の整数である。
このステップにおいては、包括的なリスク評価モデルが、組合せ変数グループに関して下記のように構築される。
Figure 2018538587
a0は、切片項/定数項であり、aiは、変数xiの重みを表し、ajは、変数Logoddsjの重みである。
上述のステップにおいて得られた2つの変数Logoddsj、すなわち、LogoddsBおよびLogoddsCが存在すると仮定すると、式(7)によって表される包括的モデルは、下記のように書かれ得る。
Figure 2018538587
さらに、確率パラメータProbabilityが、上述の包括的モデルのモデルの結果Logoddsに基づいて計算されることが可能であり、式は、下記のようになる。
Figure 2018538587
exp()は、自然定数(natural constant) eを底として使用する指数関数であり、Probabilityは、モデルの結果が十分に機能しない確率を表す。Probabilityが計算を通じて0.1に等しいと仮定すると、そのことは、モデルの結果が十分に機能しない確率が10%であることを示す。
本発明のこの実施形態における技術的な解決策によれば、既存のテクノロジーの問題が下記のように整然とした方法で解決されることが以上のことから分かり得る。
(1) まず、強い変数グループおよび弱い変数グループ、たとえば、1つの強い変数グループおよび2つの弱い変数グループを得るために、変数が、データソース、データソースと目標変数(たとえば、財務リスク)との間の相関、およびデータソースとユーザ情報(たとえば、財源情報)との間の相関に従ってグループ分けおよび分類される。
(2) 弱い変数グループが、別にモデリングされ、たとえば、2つの弱い変数グループに関する2つのモデルが構築される。
(3) 2つの弱い変数グループのモデリングの結果が、最終的な包括的リスク評価モデルを構築するために強い変数グループ内の変数と一緒にされる2つの変数として使用される。
この方法によれば、弱い変数グループ内の比較的多くの数の変数がモデルに入ることが可能であり、弱い変数グループの寄与を保証する。加えて、モデルは、サービスにおいてより解釈されやすく、実際の応用においてより堅牢である。
本発明のこの実施形態においては、リスク評価モデルがそれぞれの第2の種類の変数グループに関して確立されること、およびそれぞれのモデルの構造が第1の種類の変数グループ内の変数と組み合わされる変数として使用されることは、必須ではないことに留意されたい。代替的に、リスク評価モデルは、一部の第2の種類の変数グループに関して確立されることが可能であり(たとえば、3つの第2の種類の変数グループが存在するとき、それらの第2の種類の変数グループのうちの2つのみに関するリスク評価モデルが確立される)、一部の第2の種類の変数グループ内の変数が、第1の種類の変数グループ内の一部の変数と組み合わされる。当業者は、その点に関していかなる限定的解釈もしないものとする。
本発明のこの実施形態の技術的な解決策のより深い理解のために、以下で、リスクスコアカードのモデリングプロセス全体を添付の図面を参照して説明する。図2に示されるように、図2は、ロジスティック回帰法などの通常のモデル法を使用することによってモデルを構築するプロセスを示す。図3に示されるように、図3は、本発明のこの実施形態におけるリスク評価方法を使用することによってモデルを構築するプロセスを示す。本発明のこの実施形態においては、「変数のグループ分け」および「弱い変数グループのモデリング」の2つのプロセスがモデリングプロセスに追加されることが図2および図3から分かり得る。
実際には、本開示の発明者は、ロジスティック回帰法、エキスパートスコアカード法、および本開示の方法である3つの方法の結果を試験し、比較する。比較結果が、表4に示される。
Figure 2018538587
KSは、モデルを測定するための最も頻繁に使用される測定基準のうちの1つである。実施中のモデルの効果が、モデルを評価するための最終的な基準である。表4は、本発明のこの実施形態における方法のモデルの訓練の効果と実施の効果との両方が、ロジスティック回帰法のモデルの訓練の効果および実施の効果よりもわずかに優れており、エキスパートスコアカードのモデルの訓練の効果および実施の効果よりもずっと優れていることを示す。
本発明のこの実施形態の上述の解決策は、具体的には、たとえば、コンピュータデバイスに実装され得ることが、理解され得る。
本開示のいくつかの実現可能な実装においては、リスク評価方法が提供されることが以上のことから分かり得る。強い変数グループおよび弱い変数グループを得るために変数がグループ分けおよび分類され、それぞれの得られた弱い変数グループに関するリスク評価モデルが構築され、それぞれの弱い変数グループのモデルの結果が、組合せ変数グループを形成するために、得られた強い変数グループと組み合わされる変数として使用され、最後に、組合せ変数グループに関する包括的なリスク評価モデルが構築される解決策が、使用される。下記の技術的な効果が、得られる。
方法は、弱い変数グループのデータ値を十分に掘り起こし、使用し、それぞれの弱い変数グループ内の各変数が、対応するモデルの結果の変数を使用することによって最終的に構築された包括的なモデルに反映されることが可能であり、したがって、包括的なモデルのモデルの結果が、それぞれの弱い変数グループ内の各変数の関数を反映し得る。したがって、リスク評価の考慮事項は、より包括的であり、解釈の容易さおよびモデルの安定性が、より高く、モデルの結果は、可能な限り客観的であり、応用においてより堅牢であり、それによって、リスク評価の効果を改善するのに役立ち、サービスの発展の将来の趨勢を反映するのに役立つ。
実施形態2
本発明の実施形態の上述の解決策をより上手く実装するために、以下で、上述の解決策を協働して実装するために使用される関連する装置をさらに提供する。
図4を参照すると、本発明のこの実施形態は、リスク評価システム400を提供する。リスク評価システム400は、
データソースに従って変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得するように構成された前処理モジュール410と、
少なくとも1つの第2の種類の変数グループに関するリスク評価モデルを構築して、少なくとも1つの第2の種類の変数グループに関するリスク評価モデルのモデルの結果を取得するように構成された第1の構築モジュール420と、
少なくとも1つの第2の種類の変数グループのモデルの結果を変数として使用し、その変数を少なくとも1つの第1の種類の変数グループ内の変数と組み合わせて第3の種類の変数グループを形成するように構成された変数組合せモジュール430と、
第3の種類の変数グループに関する包括的なリスク評価モデルを構築するように構成された第2の構築モジュール440とを含み得る。
任意選択で、データソースに従った変数のグループ分けが、データソースと目標変数との間の相関および/またはデータソースとユーザ情報との間の相関に従って行われる。
一部の実施形態において、前処理モジュール410は、
異なるデータソースに従ってすべての変数を複数の変数グループにグループ分けするように構成されたグループ分けユニット4101と、
データソースと目標変数との間の相関に従って任意の変数および目標変数の相関係数を計算し、複数の変数グループの平均相関係数を計算するように構成された計算ユニット4102と、
データソースとユーザ情報との間の相関に従って複数の変数グループの重要性の値を決定するように構成された決定ユニット4103と、
複数の変数グループの平均相関係数および/または重要性の値に従って変数の分類を行い、平均相関係数が閾値より大きい、かつ/または重要性の値が最も高い変数グループを強い変数グループ、すなわち、第1の種類の変数グループとして分類し、その他の変数グループを弱い変数グループ、すなわち、第2の種類の変数グループとして分類するように構成された分類ユニット4104とを含む。
一部の実施形態において、変数組合せモジュール430は、具体的には、少なくとも1つの第2の種類の変数グループ内の任意の変数グループXjに関するリスク評価モデルのモデルの結果をLogoddsjと表記し、Logoddsjを変数として使用し、少なくとも1つの第1の種類の変数グループ内の任意の変数をxiと表記し、すべてのLogoddsjおよびxiを組み合わせて第3の種類の変数グループを形成するように構成され、iとjとの両方は、正の整数である。
一部の実施形態において、第2の構築モジュール440は、具体的には、第3の種類の変数グループに関する下記の包括的なリスク評価モデルを構築するように構成され、
Figure 2018538587
nは、変数xiの数であり、mは、変数Logoddsjの数であり、a0は、切片項/定数項であり、aiは、変数xiの重みを表し、ajは、変数Logoddsjの重みを表す。
一部の実施形態において、システム400は、第2の論理モデルのモデルの結果Logoddsに従って確率パラメータProbabilityを下記のように計算するように構成された計算モジュール450をさらに含み、
Figure 2018538587
Probabilityは、モデルの結果が十分に機能しない確率を表す。
本発明のこの実施形態のシステムのさまざまな機能モジュールの機能が上述の方法の実施形態の方法に従って具体的に実装され得ることは、理解可能であり、それらの機能の特定の実装プロセスに関しては、上述の方法の実施形態の関連する説明を参照されたい。詳細は、本明細書において再度説明されない。
本開示のいくつかの実現可能な実装においては、リスク評価システムが提供されることが以上のことから分かり得る。強い変数グループおよび弱い変数グループを得るために変数がグループ分けおよび分類され、それぞれの得られた弱い変数グループに関するリスク評価モデルが構築され、それぞれの弱い変数グループのモデルの結果が、組合せ変数グループを形成するために、得られた強い変数グループと組み合わされる変数として使用され、最後に、組合せ変数グループに関する包括的なリスク評価モデルが構築される解決策が、使用される。下記の技術的な効果が、得られる。
方法は、弱い変数グループのデータ値を十分に掘り起こし、使用し、それぞれの弱い変数グループ内の各変数が、対応するモデルの結果の変数を使用することによって最終的に構築された包括的なモデルに反映されることが可能であり、したがって、包括的なモデルのモデルの結果が、それぞれの弱い変数グループ内の各変数の機能を反映し得る。したがって、リスク評価の考慮事項は、より包括的であり、解釈の容易さおよびモデルの安定性が、より高く、モデルの結果は、可能な限り客観的であり、応用においてより堅牢であり、それによって、リスク評価の効果を改善するのに役立ち、サービスの発展の将来の趨勢を反映するのに役立つ。
実施形態3
本発明のこの実施形態は、コンピュータ記憶媒体をさらに提供する。コンピュータ記憶媒体は、プログラムを記憶し得る。プロセッサを含むコンピュータデバイスによって実行されるとき、プログラムは、コンピュータデバイスが上述の方法の実施形態のリスク評価方法の一部のまたはすべてのステップを行うことを可能にする。
実施形態4
図5を参照すると、本発明のこの実施形態は、コンピュータデバイス500をさらに提供する。
コンピュータデバイス500は、プロセッサ501、メモリ502、バス503、および通信インターフェース504を含む。メモリ502は、プログラム505を記憶するように構成される。プログラム505は、コンピュータが実行可能な命令を含む。プロセッサ501およびメモリ502は、バス503を使用することによって接続される。コンピュータデバイス500が動作するとき、プロセッサ501は、メモリ502に記憶されたプログラム505を実行し、それにより、コンピュータデバイス500が上述の方法の実施形態のリスク評価方法を行う。
具体的には、通信インターフェース504は、データを受信し得る。受信されたデータは、すべての変数を含む。メモリ502は、受信された変数を記憶し得る。プロセッサ501は、プログラム505を実行することによって以下のステップ、すなわち、データソースに従って変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得するステップと、少なくとも1つの第2の種類の変数グループに関するリスク評価モデルを構築して、少なくとも1つの第2の種類の変数グループに関するリスク評価モデルのモデルの結果を取得するステップと、少なくとも1つの第2の種類の変数グループのモデルの結果を変数として使用し、その変数を少なくとも1つの第1の種類の変数グループ内の変数(たとえば、すべての変数)と組み合わせて第3の種類の変数グループを形成するステップと、第3の種類の変数グループに関する包括的なリスク評価モデルを構築するステップとを行い得る。
バス503は、業界標準アーキテクチャ(ISA)バス、周辺装置相互接続(PCI)バス、拡張業界標準アーキテクチャ(EISA)バスなどであり得る。バスは、アドレスバス、データバス、および制御バスのうちの1つまたは複数に分類され得る。表現の都合で、図5の表現のために1つの太線のみが使用されるが、そのことは、1つのバスまたは1種類のバスのみが存在することを表さない。
メモリ502は、高速ランダムアクセスメモリ(RAM)メモリを含み得る。任意選択で、メモリ502は、不揮発性メモリをさらに含み得る。たとえば、メモリ502は、磁気ディスクメモリを含み得る。
プロセッサ501は、中央演算処理装置(CPU)であることが可能であり、またはプロセッサ501は、特定用途向け集積回路(ASIC)であることが可能であり、またはプロセッサ501は、本発明のこの実施形態を実装するための1つもしくは複数の集積回路として構成されることが可能である。
上述の実施形態において、実施形態の説明は、異なる強調点を有しており、1つの実施形態において詳細に説明されない部分に関しては、その他の実施形態の関連する説明を参照されたい。
本発明の実施形態において提供されるリスク評価方法およびシステムが、上で詳細に説明されている。本開示の原理および実装が本明細書において特定の例を使用することによって説明されているが、上述の実施形態の説明は、本開示の方法および方法の中核的な考えを理解するのに役立つように意図されているに過ぎない。一方、当業者は、本開示の考えによる特定の実装および応用の範囲に修正を行い得る。結論として、本明細書の内容は、本開示に対する限定と考えられるべきでない。
400 リスク評価システム
410 前処理モジュール
4101 グループ分けユニット
4102 計算ユニット
4103 決定ユニット
4104 分類ユニット
420 第1の構築モジュール
430 変数組合せモジュール
440 第2の構築モジュール
450 計算モジュール
500 コンピュータデバイス
501 プロセッサ
502 メモリ
503 バス
504 通信インターフェース
505 プログラム

Claims (13)

  1. データソースに従って変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得するステップと、
    前記少なくとも1つの第2の種類の変数グループに関するリスク評価モデルを構築して、前記少なくとも1つの第2の種類の変数グループに関するリスク評価モデルのモデルの結果を取得するステップと、
    前記少なくとも1つの第2の種類の変数グループの前記モデルの結果を変数として使用し、前記変数を前記少なくとも1つの第1の種類の変数グループ内の変数と組み合わせて第3の種類の変数グループを形成するステップと、
    前記第3の種類の変数グループに関する包括的なリスク評価モデルを構築するステップとを含む、リスク評価方法。
  2. データソースに従った前記変数のグループ分けが、前記データソースと目標変数との間の相関および/または前記データソースとユーザ情報との間の相関に従って行われる、請求項1に記載のリスク評価方法。
  3. 前記少なくとも1つの第1の種類の変数グループと前記目標変数との間の相関が、前記少なくとも1つの第2の種類の変数グループと前記目標変数との間の相関よりも大きい、かつ/または前記少なくとも1つの第1の種類の変数グループと前記ユーザ情報との間の相関が、前記少なくとも1つの第2の種類の変数グループと前記ユーザ情報との間の相関よりも大きい、請求項2に記載のリスク評価方法。
  4. 前記少なくとも1つの第2の種類の変数グループが、複数の第2の種類の変数グループを含み、
    前記第3の種類の変数グループに関する包括的なリスク評価モデルを構築する前に、前記方法が、
    前記第2の種類の変数グループの各々に関するリスク評価モデルを構築して、各々の第2の種類の変数グループに関する前記リスク評価モデルのモデルの結果を取得するステップと、各々の第2の種類の変数グループの前記モデルの結果を変数として使用し、前記変数を前記少なくとも1つの第1の種類の変数グループ内のすべての変数と組み合わせて前記第3の種類の変数グループを形成するステップとを含む、請求項1に記載のリスク評価方法。
  5. データソースに従って変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得する前記ステップが、
    異なるデータソースに従ってすべての変数を複数の変数グループにグループ分けすることと、
    前記データソースと目標変数との間の相関に従って任意の変数と前記目標変数の相関係数を計算し、前記複数の変数グループの中の各変数グループの平均相関係数を計算することと、
    前記データソースとユーザ情報との間の相関に従って前記複数の変数グループの中の各変数グループの重要性の値を決定することと、
    前記複数の変数グループの前記平均相関係数および/または前記重要性の値に従って変数グループの分類を行い、平均相関係数が閾値より大きい、かつ/または重要性の値が最も高い変数グループを第1の種類の変数グループとして分類し、その他の変数グループを第2の種類の変数グループとして分類することとを含む、請求項1に記載の方法。
  6. 前記少なくとも1つの第2の種類の変数グループの前記モデルの結果を変数として使用し、前記変数を前記少なくとも1つの第1の種類の変数グループ内の変数と組み合わせて第3の種類の変数グループを形成する前記ステップが、
    前記少なくとも1つの第2の種類の変数グループ内の任意の変数グループXjに関するリスク評価モデルのモデルの結果をLogoddsjと表記し、Logoddsjを変数として使用し、前記少なくとも1つの第1の種類の変数グループ内の任意の変数をxiと表記し、すべてのLogoddsjおよびxiを組み合わせて前記第3の種類の変数グループを形成することであって、iとjとの両方が、正の整数である、前記形成することを含む、請求項1から3および5のいずれか一項に記載の方法。
  7. 前記第3の種類の変数グループに関する包括的なリスク評価モデルを構築する前記ステップが、
    前記第3の種類の変数グループに関する下記の包括的なリスク評価モデルを構築することを含み、
    Figure 2018538587
    nが、変数xiの数であり、mが、変数Logoddsjの数であり、a0が、切片項/定数項であり、aiが、前記変数xiの重みを表し、ajが、前記変数Logoddsjの重みを表す、請求項6に記載の方法。
  8. 前記包括的なリスク評価モデルのモデルの結果Logoddsに従って確率パラメータProbabilityを下記のように計算するステップをさらに含み、
    Figure 2018538587
    Probabilityが、前記包括的なリスク評価モデルの前記モデルの結果が十分に機能しない確率を表す、請求項7に記載の方法。
  9. データソースに従って変数のグループ分けを行って、少なくとも1つの第1の種類の変数グループおよび少なくとも1つの第2の種類の変数グループを取得するように構成された前処理モジュールと、
    前記少なくとも1つの第2の種類の変数グループに関するリスク評価モデルを構築して、前記少なくとも1つの第2の種類の変数グループに関するリスク評価モデルのモデルの結果を取得するように構成された第1の構築モジュールと、
    前記少なくとも1つの第2の種類の変数グループの前記モデルの結果を変数として使用し、前記変数を前記少なくとも1つの第1の種類の変数グループ内の変数と組み合わせて第3の種類の変数グループを形成するように構成された変数組合せモジュールと、
    前記第3の種類の変数グループに関する包括的なリスク評価モデルを構築するように構成された第2の構築モジュールとを含む、リスク評価システム。
  10. 前記前処理モジュールが、
    異なるデータソースに従ってすべての変数を複数の変数グループにグループ分けするように構成されたグループ分けユニットと、
    前記データソースと目標変数との間の相関に従って任意の変数および前記目標変数の相関係数を計算し、前記複数の変数グループの平均相関係数を計算するように構成された計算ユニットと、
    前記データソースとユーザ情報との間の相関に従って前記複数の変数グループの重要性の値を決定するように構成された決定ユニットと、
    前記複数の変数グループの前記平均相関係数および/または前記重要性の値に従って変数の分類を行い、平均相関係数が閾値より大きい、かつ/または重要性の値が最も高い変数グループを第1の種類の変数グループとして分類し、その他の変数グループを第2の種類の変数グループとして分類するように構成された分類ユニットとを含む、請求項9に記載のシステム。
  11. 前記変数組合せモジュールが、前記少なくとも1つの第2の種類の変数グループ内の任意の変数グループXjに関するリスク評価モデルのモデルの結果をLogoddsjと表記し、Logoddsjを変数として使用し、前記少なくとも1つの第1の種類の変数グループ内の任意の変数をxiと表記し、すべてのLogoddsjおよびxiを組み合わせて前記第3の種類の変数グループを形成するように構成され、iとjとの両方が、正の整数である、請求項9または10に記載のシステム。
  12. 前記第2の構築モジュールが、前記第3の種類の変数グループに関する下記の包括的なリスク評価モデルを構築するように構成され、
    Figure 2018538587
    nが、変数xiの数であり、mが、変数Logoddsjの数であり、a0が、切片項/定数項であり、aiが、前記変数xiの重みを表し、ajが、前記変数Logoddsjの重みを表す、請求項11に記載のシステム。
  13. 第2の論理モデルのモデルの結果Logoddsに従って確率パラメータProbabilityを下記のように計算するように構成された計算モジュールをさらに含み、
    Figure 2018538587
    Probabilityが、前記モデルの結果が十分に機能しない確率を表す、請求項12に記載のシステム。
JP2018513514A 2016-02-01 2017-01-20 リスク評価方法およびシステム Active JP6771751B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610070616.5A CN107025596B (zh) 2016-02-01 2016-02-01 一种风险评估方法和***
CN201610070616.5 2016-02-01
PCT/CN2017/071920 WO2017133492A1 (zh) 2016-02-01 2017-01-20 一种风险评估方法和***

Publications (2)

Publication Number Publication Date
JP2018538587A true JP2018538587A (ja) 2018-12-27
JP6771751B2 JP6771751B2 (ja) 2020-10-21

Family

ID=59499353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018513514A Active JP6771751B2 (ja) 2016-02-01 2017-01-20 リスク評価方法およびシステム

Country Status (6)

Country Link
US (1) US20180308160A1 (ja)
EP (1) EP3413221A4 (ja)
JP (1) JP6771751B2 (ja)
KR (1) KR102061987B1 (ja)
CN (1) CN107025596B (ja)
WO (1) WO2017133492A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022002029A (ja) * 2020-06-22 2022-01-06 Tdk株式会社 データ解析システム、データ解析方法及びデータ解析プログラム
WO2023106736A1 (ko) * 2021-12-09 2023-06-15 주식회사 카카오뱅크 2단계의 로지스틱 회귀분석을 이용한 신용평가모델 운영 방법 및 이를 수행하는 서버

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10924479B2 (en) * 2016-07-20 2021-02-16 Aetna Inc. System and methods to establish user profile using multiple channels
US10404735B2 (en) * 2017-02-02 2019-09-03 Aetna Inc. Individualized cybersecurity risk detection using multiple attributes
JP2020509484A (ja) * 2017-02-17 2020-03-26 アキュウェザー, インク.Accuweather, Inc. 気象データの統計的分析を用いて経済動向を予想するシステム及び方法
US11144940B2 (en) * 2017-08-16 2021-10-12 Benjamin Jack Flora Methods and apparatus to generate highly-interactive predictive models based on ensemble models
CN107730096A (zh) * 2017-09-29 2018-02-23 北京神州绿盟信息安全科技股份有限公司 一种情报数据源的质量评估方法及装置
CN107957982B (zh) * 2017-12-05 2020-11-20 中国科学院遥感与数字地球研究所 震后次生地质灾害易发性快速评估方法和***
CN108596415B (zh) 2017-12-15 2023-11-24 创新先进技术有限公司 一种模型整合方法及装置
CN108416669A (zh) * 2018-03-13 2018-08-17 腾讯科技(深圳)有限公司 用户行为数据处理方法、装置、电子设备及计算机可读介质
CN110400208B (zh) * 2018-04-25 2021-03-12 上海方付通商务服务有限公司 一种小微风险控制模型构建方法及应用方法
CN108805692B (zh) * 2018-04-27 2021-05-28 重庆小雨点小额贷款有限公司 一种变量选择方法、装置及服务器
US10769006B2 (en) 2018-07-31 2020-09-08 Cisco Technology, Inc. Ensemble risk assessment method for networked devices
KR102203705B1 (ko) * 2018-08-21 2021-01-15 아주대학교산학협력단 연속형 변수의 계층화 그룹핑 방법 및 이를 이용한 상관관계 분석 방법 및 그 장치
KR102203711B1 (ko) 2018-08-28 2021-01-15 아주대학교산학협력단 연속형 변수의 보정 방법 및 이를 이용한 상관관계 분석 방법 및 그 장치
CN109346168A (zh) * 2018-08-31 2019-02-15 东软集团股份有限公司 一种确定数据相关性的方法及装置
CN109377083A (zh) * 2018-11-14 2019-02-22 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 风险评估方法、装置、设备和存储介质
CN109727120A (zh) * 2018-12-14 2019-05-07 深圳壹账通智能科技有限公司 风险评估模型的测试方法及装置、存储介质、计算机设备
CN109961362A (zh) * 2019-02-19 2019-07-02 合肥工业大学 P2p平台信用风险动态评价方法和***
CN110310129B (zh) * 2019-06-04 2023-08-04 创新先进技术有限公司 风险识别方法及其***
CN112116180B (zh) * 2019-06-20 2024-05-31 中科聚信信息技术(北京)有限公司 集成评分模型生成方法、装置和电子设备
CN110503566B (zh) * 2019-07-08 2024-02-09 中国平安人寿保险股份有限公司 风控模型建立方法、装置、计算机设备及存储介质
CN110490749A (zh) * 2019-07-23 2019-11-22 平安科技(深圳)有限公司 一种产品定价方法及装置
CN110413901B (zh) * 2019-08-02 2023-05-26 深圳索信达数据技术有限公司 一种基于社交网络分析的信用风险评估方法
CN110688400A (zh) * 2019-09-02 2020-01-14 深圳壹账通智能科技有限公司 数据处理方法、装置、计算机设备和存储介质
CN110751400B (zh) * 2019-10-22 2022-08-02 宜人恒业科技发展(北京)有限公司 一种风险评估方法及装置
CN111079941B (zh) * 2019-12-03 2024-02-20 武汉纺织大学 信用信息处理方法、***、终端和存储介质
CN111178756B (zh) * 2019-12-29 2024-02-27 杭州拓深科技有限公司 一种基于环境大数据的多元线性回归火灾风险评估方法
CN111430030A (zh) * 2020-04-17 2020-07-17 武汉大学 生物标志物在卵巢癌评估中的应用方法及***
CN111415247B (zh) * 2020-04-25 2023-07-28 中信银行股份有限公司 贷后信用风险评价方法、装置、存储介质及电子设备
KR102329428B1 (ko) * 2020-07-22 2021-11-24 주식회사 업데이터 딥러닝을 활용한 건물단위 화재 위험도 예측 장치 및 이를 이용한 방법
CN112365165A (zh) * 2020-11-13 2021-02-12 广东卓志跨境电商供应链服务有限公司 一种跨境电商风控管理方法及***
CN112581000A (zh) * 2020-12-24 2021-03-30 广东省电信规划设计院有限公司 企业风险指数计算方法及装置
CN113129126B (zh) * 2021-04-15 2023-04-25 算话智能科技有限公司 一种业务数据处理方法及装置
CN114021898A (zh) * 2021-10-13 2022-02-08 成都寻道数财科技有限公司 识别校外合作企业风险等级的***
CN114240097B (zh) * 2021-12-02 2024-07-12 支付宝(杭州)信息技术有限公司 一种风险评估的方法及装置
CN115396161B (zh) * 2022-08-10 2024-07-12 中国第一汽车股份有限公司 车辆网络安全的评估方法、装置以及云服务器
CN115880053B (zh) * 2022-12-05 2024-05-31 中电金信软件有限公司 一种评分卡模型的训练方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146554A (ja) * 2008-12-17 2010-07-01 Internatl Business Mach Corp <Ibm> データ処理システム、コンピュータ可読の媒体、データ・マイニング結果を分析する方法、データ・モデルを処理する方法(統計技術を使用するデータ・マイニング・モデル解釈、最適化、及びカスタマイゼーション)
JP2012003744A (ja) * 2010-05-18 2012-01-05 Toyota Technical Development Corp 制御因子特定用回帰式の生成方法
JP2013131217A (ja) * 2011-12-20 2013-07-04 National Cheng Kung Univ 予測モデルのモデル構築用サンプルのスクリーニング方法及びそのコンピュータプログラム製品
JP2013152656A (ja) * 2012-01-26 2013-08-08 Fujitsu Ltd 説明変数の決定のための情報処理装置、情報処理方法及びプログラム
WO2015145500A1 (ja) * 2014-03-27 2015-10-01 日本電気株式会社 システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1266305A2 (en) 1999-09-02 2002-12-18 Children's Medical Center Corporation A system and method for mining data from a database using relevance networks
EP1259898A2 (en) 2000-02-22 2002-11-27 Eqe International, Inc. Comprehensive risk assessment system and autonomous methods of insurance underwriting utilizing same
US20040249678A1 (en) * 2003-06-03 2004-12-09 Henderson E. Devere Systems and methods for qualifying expected risk due to contingent destructive human activities
US20070016542A1 (en) * 2005-07-01 2007-01-18 Matt Rosauer Risk modeling system
US7889318B2 (en) * 2007-09-19 2011-02-15 Asml Netherlands B.V. Methods of characterizing similarity between measurements on entities, computer programs product and data carrier
CN101131763A (zh) * 2007-09-27 2008-02-27 中国工商银行股份有限公司 一种基于web的银行信用风险检测方法与***
US8190612B2 (en) * 2008-12-17 2012-05-29 Sas Institute Inc. Computer-implemented systems and methods for variable clustering in large data sets
US20130046562A1 (en) * 2009-11-06 2013-02-21 Jeffrey Taylor Method for gathering, processing, and analyzing data to determine the risk associated with driving behavior
US8489499B2 (en) * 2010-01-13 2013-07-16 Corelogic Solutions, Llc System and method of detecting and assessing multiple types of risks related to mortgage lending
US20120078681A1 (en) 2010-09-24 2012-03-29 Fair Isaac Corporation Multi-hierarchical customer and product profiling for enhanced retail offerings
CN102117469A (zh) * 2011-01-18 2011-07-06 中国工商银行股份有限公司 一种对信用风险进行评估的***和方法
CN102663643A (zh) * 2012-03-16 2012-09-12 暨南大学 一种农户多层单向网络线性分段信用评级方法
CN103854063B (zh) * 2012-11-29 2017-04-05 中国科学院计算机网络信息中心 一种基于互联网开放信息的事件发生风险预测并预警方法
US20140365350A1 (en) * 2013-06-10 2014-12-11 Rawllin International Inc. Financial platform that facilitates management of financial services
US20150262289A1 (en) * 2014-03-14 2015-09-17 Dean S. Hettesheimer Method of Producing a Lifestyle Evaluation Report from User Attribute and Behavior Data by Executing Computer-Executable Instructions Stored On a Non-Transitory Computer-Readable Medium
US20150324922A1 (en) * 2014-05-07 2015-11-12 Guy Carpenter & Company, Llc System and method for simulating the operational claims response to a catastrophic event
CN104463673A (zh) * 2014-12-22 2015-03-25 中国科学技术大学苏州研究院 一种基于支持向量机的p2p网络贷款风险评估模型
CN104679939B (zh) * 2015-01-26 2018-11-09 北京航空航天大学 一种飞机设计经济可承受性评估过程的多准则决策方法
CN105243474A (zh) * 2015-09-24 2016-01-13 浙江省安全生产科学研究院 基于时空信息的尾矿库安全风险评估方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146554A (ja) * 2008-12-17 2010-07-01 Internatl Business Mach Corp <Ibm> データ処理システム、コンピュータ可読の媒体、データ・マイニング結果を分析する方法、データ・モデルを処理する方法(統計技術を使用するデータ・マイニング・モデル解釈、最適化、及びカスタマイゼーション)
JP2012003744A (ja) * 2010-05-18 2012-01-05 Toyota Technical Development Corp 制御因子特定用回帰式の生成方法
JP2013131217A (ja) * 2011-12-20 2013-07-04 National Cheng Kung Univ 予測モデルのモデル構築用サンプルのスクリーニング方法及びそのコンピュータプログラム製品
JP2013152656A (ja) * 2012-01-26 2013-08-08 Fujitsu Ltd 説明変数の決定のための情報処理装置、情報処理方法及びプログラム
WO2015145500A1 (ja) * 2014-03-27 2015-10-01 日本電気株式会社 システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022002029A (ja) * 2020-06-22 2022-01-06 Tdk株式会社 データ解析システム、データ解析方法及びデータ解析プログラム
JP7396213B2 (ja) 2020-06-22 2023-12-12 Tdk株式会社 データ解析システム、データ解析方法及びデータ解析プログラム
WO2023106736A1 (ko) * 2021-12-09 2023-06-15 주식회사 카카오뱅크 2단계의 로지스틱 회귀분석을 이용한 신용평가모델 운영 방법 및 이를 수행하는 서버

Also Published As

Publication number Publication date
EP3413221A4 (en) 2019-08-07
EP3413221A1 (en) 2018-12-12
CN107025596A (zh) 2017-08-08
JP6771751B2 (ja) 2020-10-21
CN107025596B (zh) 2021-07-16
US20180308160A1 (en) 2018-10-25
KR102061987B1 (ko) 2020-01-02
KR20180041174A (ko) 2018-04-23
WO2017133492A1 (zh) 2017-08-10

Similar Documents

Publication Publication Date Title
JP6771751B2 (ja) リスク評価方法およびシステム
US20200210899A1 (en) Machine learning model training method and device, and electronic device
WO2021155706A1 (zh) 利用不平衡正负样本对业务预测模型训练的方法及装置
CN107633265B (zh) 用于优化信用评估模型的数据处理方法及装置
WO2020143233A1 (zh) 评分卡模型的建立方法、装置、计算机设备和存储介质
CN110909984B (zh) 业务数据处理模型训练方法、业务数据处理方法及装置
US20180253737A1 (en) Dynamicall Evaluating Fraud Risk
US11250368B1 (en) Business prediction method and apparatus
US20190220924A1 (en) Method and device for determining key variable in model
CN113298121B (zh) 基于多数据源建模的消息发送方法、装置和电子设备
CN113221104A (zh) 用户异常行为的检测方法及用户行为重构模型的训练方法
CN113537960A (zh) 一种异常资源转移链路的确定方法、装置和设备
CN111061948B (zh) 一种用户标签推荐方法、装置、计算机设备及存储介质
CN114037518A (zh) 风险预测模型的构建方法、装置、电子设备和存储介质
CN115481694B (zh) 一种训练样本集的数据增强方法、装置、设备及存储介质
CN111026882A (zh) 一种基于知识图谱的违约确定方法、装置、设备及存储介质
Dutta et al. Aggregation of heterogeneously related information with extended geometric Bonferroni mean and its application in group decision making
CN114170000A (zh) ***用户风险类别识别方法、装置、计算机设备和介质
CN111815442A (zh) 一种链接预测的方法、装置和电子设备
CN110874667A (zh) 评分卡模型优化方法、装置、服务器及存储介质
TWI657393B (zh) 行銷客群預測系統及其方法
CN117474669A (zh) 一种贷款逾期预测方法、装置、设备及存储介质
CN117934154A (zh) 交易风险预测方法、模型训练方法、装置、设备、介质和程序产品
Li et al. A New Model for Mortgage Loss Given Default by Leveraging Time to Recovery
CN117635310A (zh) 贷款逾期风险的确定方法、装置、设备和介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190924

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200617

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20200617

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20200625

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20200629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200917

R150 Certificate of patent or registration of utility model

Ref document number: 6771751

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250