CN107194795A - 信用分数模型训练方法、信用分数计算方法及装置 - Google Patents

信用分数模型训练方法、信用分数计算方法及装置 Download PDF

Info

Publication number
CN107194795A
CN107194795A CN201610145843.XA CN201610145843A CN107194795A CN 107194795 A CN107194795 A CN 107194795A CN 201610145843 A CN201610145843 A CN 201610145843A CN 107194795 A CN107194795 A CN 107194795A
Authority
CN
China
Prior art keywords
users
credit score
sample
user
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610145843.XA
Other languages
English (en)
Inventor
陈培炫
陈谦
李霖
吴三平
庄伟亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610145843.XA priority Critical patent/CN107194795A/zh
Priority to PCT/CN2017/075131 priority patent/WO2017157165A1/zh
Priority to KR1020187007645A priority patent/KR102038237B1/ko
Priority to EP17765707.9A priority patent/EP3349171A4/en
Priority to JP2018535228A priority patent/JP6595718B2/ja
Publication of CN107194795A publication Critical patent/CN107194795A/zh
Priority to US15/954,378 priority patent/US11915311B2/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种信用分数模型训练方法、信用分数计算方法及装置,属于信用评估领域。所述方法包括:获取样本用户的第i次信用分数、第i次关系信用分数和违约标注信息;将样本用户的第i次信用分数、第i次关系信用分数和违约标注信息,输入信用分数模型,计算得到样本用户的第i+1次信用分数;在满足训练结束条件时,得到训练完毕的信用分数模型;解决了当用户个人的信息存在缺失或错误时,很难准确的计算出用户的信用分数的问题;达到了通过用户的信用分数和基于用户的社交关系所计算出的关系信用分数综合计算出该用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。

Description

信用分数模型训练方法、信用分数计算方法及装置
技术领域
本发明实施例涉及信用评估领域,特别涉及一种信用分数模型训练方法、信用分数计算方法及装置。
背景技术
信用分数是指信用评估机构利用信用分数模型对个人信用信息进行量化分析得出的分值。信用分数用于表征用户的个人信用。
现有技术中,计算信用分数的模型主要为FICO(Fair Isaac Company)信用分数模型。FICO信用分数模型主要采用logistic回归的统计模型。首先将用户个人的信用、品德和支付能力作为指标,将各个指标分成不同的档次,每个档次代表不同的分数,根据每个指标的权重和分数计算用户的信用分数。
在实现本发明实施例的过程中,发明人发现现有技术至少存在以下问题:
FICO信用分数模型中采用的数据都是针对用户个人的信息,当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数。
发明内容
为了解决当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题,本发明实施例提供了一种信用分数模型训练方法、信用分数计算方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供了一种信用分数模型训练方法,所述方法包括:
获取若干个样本用户的第i次信用分数、每个所述样本用户的第i次关系信用分数和每个所述样本用户的违约标注信息,i为正整数;
对于每个所述样本用户,将所述样本用户的第i次信用分数、所述样本用户的第i次关系信用分数和所述样本用户的违约标注信息,输入预设的信用分数模型,计算得到所述样本用户的第i+1次信用分数;
在各个所述样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的所述信用分数模型;
其中,所述样本用户的第i次关系信用分数是根据与所述样本用户存在社交关系的各个其他用户的第i次信用分数计算得到的;所述样本用户的违约标注信息用于对所述样本用户的分类。
根据本发明实施例的第二方面,提供了一种信用分数计算方法,应用于第一方面提供的信用分数模型中,所述方法包括:
获取各个用户的第一次信用分数和每个所述用户的第一次关系信用分数,所述用户的第一次关系信用分数是根据与所述用户存在社交关系的各个其他用户的第一次信用分数计算得到的;
将各个所述用户的第一次信用分数和每个所述用户的第一次关系信用分数输入训练完毕的所述信用分数模型,计算得到各个所述用户的目标信用分数。
根据本发明实施例的第三方面,提供了一种信用分数模型训练装置,所述装置包括:
信息获取模块,用于获取若干个样本用户的第i次信用分数、每个所述样本用户的第i次关系信用分数和每个所述样本用户的违约标注信息,i为正整数;
信息输入模块,用于对于每个所述样本用户,将所述样本用户的第i次信用分数、所述样本用户的第i次关系信用分数和所述样本用户的违约标注信息,输入预设的信用分数模型,计算得到所述样本用户的第i+1次信用分数;
模型训练模块,用于在各个所述样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的所述信用分数模型;
其中,所述样本用户的第i次关系信用分数是根据与所述样本用户存在社交关系的各个其他用户的第i次信用分数计算得到的;所述样本用户的违约标注信息用于对所述样本用户的分类。
根据本发明实施例的第四方面,提供了一种信用分数计算装置,应用于第三方面提供的信用分数模型中,所述装置包括:
信用获取模块,用于获取各个用户的第一次信用分数和每个所述用户的第一次关系信用分数,所述用户的第一次关系信用分数是根据与所述用户存在社交关系的各个其他用户的第一次信用分数计算得到的;
目标计算模块,用于将各个所述用户的第一次信用分数和每个所述用户的第一次关系信用分数输入训练完毕的所述信用分数模型,计算得到各个所述用户的目标信用分数。
本发明实施例提供的技术方案带来的有益效果是:
通过获取若干个样本用户的第i次信用分数、每个样本用户的第i次关系信用分数和每个样本用户的违约标注信息;对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数;在各个样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的信用分数模型;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数来综合计算出该用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个示例性实施例提供的信用分数模型训练方法的流程图;
图2A是本发明另一个示例性实施例提供的信用分数模型训练方法的流程图;
图2B是本发明一个示例性实施例提供的关系信用分数计算方法的流程图;
图2C是本发明一个示例性实施例提供的信用分数模型训练的结构示意图;
图3是本发明一个示例性实施例提供的信用分数计算方法的流程图;
图4A是本发明另一个示例性实施例提供的信用分数计算方法的流程图;
图4B是本发明一个示例性实施例提供的循环计算的结束条件的流程图;
图5是本发明一个实施例提供的信用分数模型训练装置的结构方框图;
图6是本发明另一个实施例提供的信用分数模型训练装置的结构方框图;
图7是本发明一个实施例提供的信用分数计算装置的结构方框图;
图8是本发明另一个实施例提供的信用分数计算装置的结构方框图;
图9是本发明一个实施例提供的服务器的结构方框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
信用分数是指利用数学模型对个人的信用信息进行建模得出的分数。该分数可在金融领域中用于对信贷类业务进行风险评估。个人信用信息包括针对用户个人与信用有关的信息项。
本发明实施例公开的信用分数模型主要通过用户的信用分数和基于用户的社交关系所计算出的关系信用分数综合计算出该用户的目标信用分数,实现了当用户个人的信息存在缺失或错误时,通过基于用户的社交关系计算出的关系信用分数依然可以计算出该用户的目标信用分数的效果。本发明实施例包括:信用分数模型训练方法的实施例和基于信用分数模型计算用户信用分数的实施例。其中,信用分数模型训练方法请参考图1和图2A所示的实施例,信用分数计算方法请参考图3和图4A所示的实施例。
请参考图1,其示出了本发明一个示例性实施例提供的信用分数模型训练方法的流程图。该方法包括:
步骤101,获取若干个样本用户的第i次信用分数、每个样本用户的第i次关系信用分数和每个样本用户的违约标注信息,i为正整数。
在训练信用分数模型之前,首先获取用于训练信用分数模型的样本集。
其中,样本集包括:若干个样本用户的第一次信用分数、每个样本用户对应的第一次关系信用分数以及每个样本用户的违约标注信息。
样本用户的关系信用分数是根据与样本用户存在社交关系的各个其他用户的信用分数计算得到的。
可选的,与样本用户存在社交关系的各个其他用户可以是样本集中的样本用户,也可以是样本集以外的用户。
样本用户的违约标注信息用于对样本用户的分类,确定样本用户的违约情况。
步骤102,对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数。
可选的,当i≥2时,对于每个样本用户,仅需将样本用户的第i次信用分数和样本用户第i次关系信息分数输入预设的信用分数模型中,计算得到样本用户的第i+1次信用分数。
步骤103,在各个样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的信用分数模型。
综上所述,本实施例提供的信用分数模型训练方法,通过获取若干个样本用户的第i次信用分数、每个样本用户的第i次关系信用分数和每个样本用户的违约标注信息;对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数;在各个样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的信用分数模型;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数来综合计算出该用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
请参考图2A,其示出了本发明另一个示例性实施例提供的信用分数模型训练方法的流程图。该方法包括:
步骤201,获取样本集。
其中,样本集包括:若干个样本用户的标识和每个样本用户的违约标注信息。
样本用户的标识用于对样本用户之间的区分,比如:样本集中包含有100个样本用户,每个样本用户的标识为user1、user2、user3、……user100。
样本用户的违约标注信息用于确定样本用户的违约情况,比如:样本集中包含的样本用户的违约标注信息为:user1(1)、user2(0)、user3(0)、……user100(1),其中,括号中的1表示样本用户存在违约情况,代表违约类;括号中的0表示样本用户不存在违约情况,代表未违约类。则user1(1)代表样本用户user1属于违约类,user2(0)代表样本用户user2属于未违约类,user3(0)代表样本用户user3属于未违约类,user100(1)代表样本用户user100属于违约类。
可选的,样本用户的违约标注信息可以根据样本用户的信用分数对样本用户的违约情况进行标注,也可以根据样本用户的实际违约情况进行标注。本实施例对此不作限定。
示例性地,以根据样本用户的信用分数对样本用户的违约情况进行标注举例说明。比如:利用现有技术中的FICO信用分数模型计算每个样本用户的信用分数,根据计算出的样本用户的信用分数,对样本用户的违约情况进行标注。假定FICO信用分数模型的打分范围为300-800分之间,对信用分数大于550分的样本用户标注未违约,对信用分数小于550分的样本用户标注违约。又比如:样本用户1的信用分数为580,样本用户2的信用分数为450,样本用户3的信用分数为480,样本用户4的信用分数为600,样本用户5的信用分数为700,则标注样本用户1为未违约,样本用户2为违约,样本用户3为违约,样本用户4为未违约,样本用户5为未违约。因此,可以将样本用户1、样本用户4和样本用户5分为一类即未违约类;将样本用户2和样本用户3分为另一类即违约类。
步骤202,获取若干个样本用户的第i次信用分数,i为正整数。
可选的,当i=1时,根据各个样本用户的个人信息计算得到各个样本用户的第一次信用分数;比如:根据样本用户的信用、品德和支付能力计算得到样本用户的第一次信用分数,如FICO信用分数模型的计算过程。
可选的,当存在根据个人信用信息无法计算得到第一次信用分数的样本用户时,将样本用户的第一次关系信用分数确定为样本用户的第一信用分数。其中,第一次关系信用分数是根据与样本用户存在社交关系的各个其他用户的第一次信用分数计算得到的。
当i≥2时,获取步骤208中计算得到的各个样本用户的第i次信用分数。
步骤203,获取每个样本用户的第i次关系信用分数。
样本用户的第一关系信用分数是根据与样本用户存在社交关系的各个其他用户的第一信用分数计算得到的。
可选的,与样本用户存在社交关系的各个其他用户可以是样本集中的其他样本用户,也可以是样本集以外的用户。
可选的,对于每个样本用户,与每个样本用户存在社交关系的其他用户的个数可以相同,也可以不相同。比如:与样本用户A存在社交关系的其他用户有50个,且50个用户都为样本集中的样本用户;与样本用户B存在社交关系的其他用户有60个,其中,有20个为样本集中的样本用户,有40个为样本集以外的用户;与样本用户C存在社交关系的其他用户也有60个,但有40个为样本集中的样本用户,有20个为样本集以外的用户。本实施例中,对与每个样本用户存在社交关系的其他用户的个数不作具体限定。
可选的,步骤203中获取每个样本用户的第i次关系信用分数可以通过下述的步骤得到,如图2B所示。
步骤203a,获取每个样本用户的社交关系链。
社交关系链是样本用户与其他用户之间存在的社交关系。其中,社交关系可以包括真实社会中的社交关系,如:亲属关系、同事关系和同学关系等;还可以是社交工具中的好友关系或关注关系,比如:微信好友关系、QQ好友关系、微博好友关系、同一群组中的好友关系和微博关注关系等。
根据样本集中的样本用户的标识,获取每个样本用户对应的社交关系链。
也即,获取每个样本用户与其他用户之间存在的社交关系。
步骤203b,根据社交关系链获取每个样本用户对应的各个其他用户的第i次信用分数。
对于每个样本用户,根据样本用户的社交关系链获取与样本用户对应的各个其他用户的第i次信用分数。
步骤203c,计算各个样本用户的第i次关系信用分数。
根据获取到的每个样本用户对应的各个其他用户的第i次信用分数计算各个样本用户的第i次关系信用分数。
通常情况下,计算各个样本用户的关系信用分数可以包括以下两种实现方式:
作为一种可能的实现方式,对于每个样本用户,根据获取到的各个其他用户的第i次信用分数计算与样本用户对应的各个其他用户的第i次信用分数的平均值,将计算得到的平均值确定为样本用户的第i次关系信用分数。
比如:样本用户1的第一次信用分数为350,与样本用户1存在社交关系的各个其他用户包括:其他用户1,对应的第一次信用分数为400;其他用户2,对应的第一次信用分数为400;其他用户3,对应的第一次信用分数为500;其他用户4,对应的第一次信用分数为600。则样本用户1的第一次关系信用分数为475,具体计算公式为:(400+400+500+600)/4=1900/4=475。以此类推,样本用户1的第i次关系信用分数通过与样本用户1存在社交关系的各个其他用户的第i次信用分数计算得到。同理,可以计算得出每个样本用户的第i次关系信用分数。
作为另一种可能的实现方式,可以通过与样本用户对应的各个其他用户的第i次信用分数和各个其他用户所对应的权重计算得到各个样本用户的关系信用分数,具体包括如下步骤。
第一子步骤,对于每个样本用户,根据社交关系链获取与样本用户对应的各个其他用户的第i次信用分数和各个其他用户所对应的权重。其中,各个其他用户所对应的权重是指各个其他用户的第一次信用分数在计算样本用户的关系信用分数时所占的比重。各个其他用户所对应的权重可以根据社交关系类型确定,比如:与样本用户存在亲属关系的其他用户所对应的权重大于存在同学关系的其他用户所对应的权重;还可以通过亲密度确定,比如:与样本用户通信频率高的其他用户所对应的权重大于通信频率低的其他用户所对应的权重;还可以通过社交关系存在的时间长短来确定,比如:与样本用户存在社交关系时间较长的其他用户所对应的权重大于存在社交关系时间较短的其他用户所对应的权重。本实施例中,对与样本用户存在社交关系的各个其他用户所对应的权重的确定方式不作具体限定。
第二子步骤,根据各个其他用户的第i次信用分数和各个其他用户所对应的权重计算样本用户的第i次关系信用分数。具体的计算公式如下:
其中,score_fri_avg是指样本用户的第i次关系信用分数,friend_score_j是指与样本用户存在社交关系的第j个其他用户的第i次信用分数,op_j是指与样本用户存在社交关系的第j个其他用户所对应的权重。
比如:样本用户1的第一次信用分数为350,与样本用户1存在社交关系的各个其他用户包括:其他用户1,对应的第一次信用分数为400,所对应的权重为0.2;其他用户2,对应的第一次信用分数为400,所对应的权重为0.4;其他用户3,对应的第一次信用分数为500,所对应的权重为0.3;其他用户4,对应的第一次信用分数为600,所对应的权重为0.3。则样本用户1的第一次关系信用分数为475,具体计算公式为:(400*0.2+400*0.4+500*0.3+600*0.3)/(0.2+0.4+0.3+0.3)=570/1.2=475。以此类推,样本用户1的第i次关系信用分数通过与样本用户1存在社交关系的各个其他用户的第i次信用分数和各个其他用户所对应的权重计算得到。同理,可以计算得出每个样本用户的第i次关系信用分数。
步骤204,对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数。
当i=1时,对于每个样本用户,将样本用户的第一次信用分数、样本用户的第一次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第2次信用分数。
在进行第一次迭代时,将步骤202中获取到的每个样本用户的第一次信用分数和步骤203中获取到的每个样本用户的第一次关系信用分数作为特征变量,将每个样本用户的违约标注信息作为目标变量,同时输入到预设的信用分数模型中,通过信用分数模型中的算法计算得到每个样本用户的第二次信用分数。
当i≥2时,对于每个样本用户,将样本用户的第i次信用分数和样本用户的第i次关系信用分数,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数。
可选的,在进行第i次迭代时,只需将获取到的每个样本用户的第i次信用分数和每个样本用户的第i次关系信用分数作为特征变量,同时输入到预设的信用分数模型中,通过信用分数模型中的算法计算得到每个样本用户的第i+1次信用分数,无需再次输入每个样本用户的违约标注信息。
可选的,根据样本用户的第i次信用分数和样本用户的第i次关系信用分数计算得到该样本用户的第i+1次信用分数的公式如下:
new_score=f(score,score_fri_avg)
其中,new_score是指样本用户的第i+1次信用分数,score是指样本用户的第i次信用分数,score_fri_avg是指样本用户的第i次关系信用分数。
可选的,根据通过信用分数模型中的算法计算得到的每个样本用户的第i+1次信用分数可以对样本用户进行分类。通过每个样本用户的违约标注信息和计算得到的每个样本用户的第i+1信用分数,将每个样本用户的信用分数与违约标注信息之间建立连接,以便于在使用信用分数模型时,对用户进行准确的分类。
可选的,预设的信用分数模型可以包括:逻辑回归分类模型或决策树分类模型。本实施例中,对信用分数模型的类型不作具体限定。
步骤205,计算各个样本用户的第i+1次信用分数和各个样本用户的第i次信用分数之间的相关系数。
在步骤204计算得到各个样本用户的第i+1次信用分数后,计算各个样本用户的第i+1次信用分数和各个样本用户的第i次信用分数之间的相关系数。
可选的,样本用户第i+1次信用分数和样本用户第i次信用分数之间相关系数的计算公式如下:
cor=correlation_coefficient(score,new_score)
其中,cor是指样本用户第i+1次信用分数和样本用户第i次信用分数之间的相关系数,score是指样本用户的第i次信用分数,new_score是指样本用户的第i+1次信用分数。
比如:参加训练信用分数模型的样本用户共有100个,所有样本用户的第i+1次信用分数的集合为X,所有样本用户的第i次信用分数的集合为Y,则各个样本用户的第i+1次信用分数和各个样本用户的第i次信用分数之间的相关系数是指通过相关系数计算公式计算集合X和集合Y之间的相关系数。
步骤206,检测相关系数是否大于第一阈值。
计算得到各个样本用户的第i+1次信用分数和各个样本用户的第i次信用分数之间的相关系数后,将该相关系数与第一阈值进行比较,检测各个样本用户的第i+1次信用分数与各个样本用户的第i次信用分数之间的相关性。
步骤207,若相关系数大于第一阈值,则得到训练完毕的信用分数模型。
若各个样本用户的第i+1次信用分数和各个样本用户的第i次信用分数之间的相关系数大于第一阈值,说明各个样本用户的第i次信用分数和第i+1次信用分数之间趋于相同,则模型训练过程结束,各个样本用户的第i+1次信用分数即为信用分数模型计算出的目标信用分数。
步骤208,若相关系数小于第一阈值,则令i=i+1,再次执行步骤202。
可选的,当相关系数小于第一阈值时,则将各个样本用户的第i+1次信用分数作为输入,再次根据社交关系链获取每个样本用户对应的各个其他用户的第i+1次信用分数。但是,在循环执行过程中,针对步骤204,只需输入各个样本用户的第i+1次信用分数和各个样本用户的第i+1次关系信用分数即可,各个样本用户的违约标注信息不作输入。
为了便于读者的理解,将图2实施例中的步骤201至步骤208所示的信用分数模型训练的结构示意图如图2C所示。
综上所述,本实施例提供的信用分数模型训练方法,通过获取若干个样本用户的第i次信用分数、每个样本用户的第i次关系信用分数和每个样本用户的违约标注信息;对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数;在各个样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的信用分数模型;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数综合计算出用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
另外,当存在根据个人信用信息无法计算得到第一次信用分数的样本用户时,将样本用户的第一次关系信用分数确定为样本用户的第一次信用分数,达到了在用户的个人信用分数缺失的情况下也可以根据用户的关系信用分数计算得到用户的信用分数的效果。
需要补充说明的是,在步骤203b中,根据社交关系链获取每个样本用户对应的各个其他用户的第i次信用分数,可以理解为:
当i=1时,根据社交关系链,获取每个样本用户的各个其他用户的第一次信用分数。
可选地,各个其他用户的第一次信用分数是指:在训练本实施例提供的信用分数模型之前,基于个人信息的信用分数模型所计算出的各个其他用户的信用分数。当然,若存在其它已有的信用分数模型所计算出的信用分数,也可以作为其他用户的第一次信用分数,本实施例对此不加以限定。
当i≥2时,根据社交关系链,获取每个样本用户对应的各个其他用户的第i次信用分数。
在训练信用分数模型过程中,由于与样本用户存在社交关系的其他用户可能是样本集中的其他样本用户,因此,在第i次迭代过程中,其他用户的第i次信用分数可能会发生变化,则在进行第i次迭代时,需要根据社交关系链获取每个样本用户对应的各个其他用户的第i次信用分数。当与样本用户存在社交关系的其他用户不是样本集中的其他样本用户时,则在第i次迭代过程中,其他用户的第i次信用分数不会发生变化,因此,在进行第i次迭代时,不需根据社交关系链获取该样本用户对应的各个其他用户的第i次信用分数,直接使用根据社交关系链获取到的各个其他用户的第一次信用分数即可。
比如:在训练信用分数模型过程中,获取到与样本用户A存在社交关系的其他用户1和其他用户2都是样本集中的其他样本用户;且其他用户1的第一次信用分数为350,其他用户2的第一次信用分数为400;则在经过第一次迭代后,其他用户1的第二次信用分数为380,其他用户2的第二次信用分数为390,也即,由于其他用户1和其他用户2是样本集中的其他样本用户,因此在第一次迭代过程中,其他用户1和其他用户2的第二次信用分数发生了变化。在进行第二次迭代时,需要根据社交关系链获取样本用户A对应的各个其他用户的第二次信用分数。以此类推,在进行第i次迭代时,需要根据社交关系链获取样本用户A对应的各个其他用户的第i次信用分数。
在一个具体的例子中,假定将100个借款人作为样本用户。
首先获取每个借款人的标识、与每个借款人的标识对应的第一次信用分数以及每个借款人的违约标注信息。比如:借款人1,对应的信用分数350,标注违约;借款人2,对应的信用分数400,标注违约;借款人3,对应的信用分数600,标注未违约;借款人4,对应的信用分数650,标注未违约;…;借款人100,对应的信用分数440,标注违约。
再获取与每个借款人的标识对应的各个好友的信用分数。比如:借款人1对应的各个好友包括:好友1,对应的信用分数为600,好友1的权重为0.4;好友2,对应的信用分数为400,好友1的权重为0.4;好友3,对应的信用分数为500,好友1的权重为0.2;好友4,对应的信用分数为700,好友1的权重为0.5;其中,好友1为样本用户中的借款人3,好友2为样本用户中的借款人2。同理,可以获取各个借款人对应的各个好友的信用分数和各个好友对应的权重。
根据每个借款人对应的各个好友的信用分数,计算每个借款人对应的第一次关系信用分数。比如:借款人1对应的第一次关系信用分数可以通过借款人对应的各个好友的信用分数和各个好友对应的权重计算得到,具体的计算公式为:(600*0.4+400*0.4+500*0.2+700*0.5)/(0.4+0.4+0.2+0.5)=567。因此,借款人1对应的第一次关系信用分数为567。同理,可以计算得到各个借款人对应的第一关系信用分数。
将100个借款人的第一次信用分数、100个借款人对应的第一次关系信用分数和100个借款人对应的违约标注信息输入到预设的信用分数模型中,信用分数模型根据内部的算法计算得到每个借款人对应的第二次信用分数。比如:将借款人1的第一次信用分数、第一次关系信用分数和违约标注信息、借款人2的第一次信用分数、第一次关系信用分数和违约标注信息,一直到借款人100的第一次信用分数、第一次关系信用分数和违约标注信息同时输入到预设的信用分数模型中,通过信用分数模型计算得到借款人1至借款人100各自对应的第二次信用分数。
通过计算100个借款人对应的第二次信用分数和100个借款人对应的第一次信用分数之间相关系数。比如:通过步骤206中所示的公式,计算出借款人1至借款人100各自对应的第二次信用分数和各自对应的第一次信用分数之间的相关系数。
当相关系数大于第一阈值时,得到训练完毕的信用分数模型;当相关系数小于第一阈值时,则将计算得到的借款人1至借款人100各自对应的第二次信用分数和重新计算得到的各自对应的第二次关系信用分数继续输入到预设的信用分数模型中,继续计算借款人1至借款人100各自对应的第三次信用分数。直到计算得到的每个借款人对应的第i+1次信用分数和第i次信用分数之间的相关系数大于第一阈值时,得到训练完毕的信用分数模型。
基于图2A所示的实施例,得到训练完毕的信用分数模型后,通过向信用分数模型中输入用户的信用分数和用户的关系信用分数即可计算用户的目标信用分数。具体步骤请参考图3实施例。
请参考图3,其示出了本发明一个示例性实施例提供的信用分数计算方法的流程图。该方法包括:
步骤301,获取各个用户的第一次信用分数和每个用户的第一次关系信用分数。
用户的第一次关系信用分数是根据与用户存在社交关系的各个其他用户的第一次信用分数计算得到的。用户的第一次关系信用分数的详细计算过程请参考图2A实施例中的步骤203所示。
在需要利用信用分数模型计算用户的目标信用分数时,首先获取需要计算目标信用分数的各个用户的第一次信用分数以及每个用户的第一次关系信用分数。
步骤302,将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入训练完毕的信用分数模型,计算得到各个用户的目标信用分数。
综上所述,本实施例提供的信用分数计算方法,通过获取各个用户的第一次信用分数和每个用户的第一次关系信用分数;将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入信用分数模型,计算得到各个用户的目标信用分数;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数计算用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
请参考图4A,其示出了本发明另一个示例性实施例提供的信用分数计算方法的流程图。该方法包括:
步骤401,获取各个用户的第一次信用分数和每个用户的第一次关系信用分数。
用户的第一次关系信用分数是根据与用户存在社交关系的各个其他用户的第一次信用分数计算得到的。用户的第一次关系信用分数的详细计算过程请参考图2A实施例中的步骤203所示。
在需要利用信用分数模型计算用户的目标信用分数时,首先获取需要计算目标信用分数的各个用户的第一次信用分数以及每个用户的第一次关系信用分数。
本实施例中,对用户的个数不作具体限定。
步骤402,将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入训练完毕的信用分数模型,计算得到各个用户的第x次信用分数。
将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入到训练完毕的信用分数模型中,根据信用分数模型中的算法对各个用户的第一次信用分数和第一次关系信用分数进行分析和计算,得到各个用户的第x次信用分数,x为正整数。
可选的,将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入到训练完毕的信用分数模型中,计算得到的各个用户的第x次信用分数是指经过与信用分数模型中相同次数迭代后计算得到的信用分数。
比如:图2A所示的信用分数模型训练方法中,经过100次迭代得到了训练完毕的信用分数模型,当将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入到训练完毕的信用分数模型后,计算得到的各个用户的第x次信用分数是指经过100次迭代运算后得到的各个用户的信用分数。
步骤403,在各个用户的第x次信用分数满足预设条件时,将各个用户的第x次信用分数确定为用户的目标信用分数。
当计算得到的各个用户的第x次信用分数满足预设条件时,则直接将计算得到的用户的第x次信用分数确定为用户的目标信用分数。
可选的,各个用户的第x次信用分数满足预设条件可以包括如下子步骤,如图4B所示:
步骤403a,计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值。
通过信用分数模型计算得到各个用户的第x次信用分数后,计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值。
可选的,计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值用于检测各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的相关性。比如:当用户个数较少时可以采用计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的相关系数来确定两者之间的相关性。
本实施例中,仅以计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值进行举例说明,还可以通过计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的相关系数来进行确定。
步骤403b,检测差值是否小于第二阈值。
计算得到各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值后,将该差值与第二阈值进行比较,检测各个用户的第x次信用分数与各个用户的第x-1次信用分数之间的相关性。
步骤403c,若差值小于第二阈值,则将各个用户的第x次信用分数确定为用户的目标信用分数。
若各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值小于第二阈值,则将各个用户的第x次信用分数即为信用分数模型计算出的目标信用分数。
若差值大于第二阈值,则令x=x+1,继续执行步骤402。
也即,若差值大于第二阈值,则将各个用户的第x次信用分数和各个用户的第x次关系信用分数再次输入到信用分数模型中,继续计算各个用户的第x+1次信用分数。
步骤404,在各个用户的第x次信用分数不满足预设条件时,将各个用户的第x次信用分数和每个用户的第x次关系信用分数再次输入信用分数模型,计算得到用户的第x+1次信用分数。
当用户的第x次信用分数不满足预设条件时,则重新获取用户的第x次关系信用分数,并将用户的第x次信用分数和用户的第x次关系信用分数再次输入到信用分数模型中,继续计算用户的第x+1次信用分数。
令x=x+1,再次执行计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值的步骤。
综上所述,本实施例提供的信用分数计算方法,通过获取各个用户的第一次信用分数和每个用户的第一次关系信用分数;将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入信用分数模型,计算得到各个用户的目标信用分数;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数计算用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
请参考图5,其示出了本发明一个实施例提供的信用分数模型训练装置的结构方框图。该信用分数模型训练装置可以通过软件、硬件或者两者的结合实现。该信用分数模型训练装置包括:
信息获取模块520,用于获取若干个样本用户的第i次信用分数、每个样本用户的第i次关系信用分数和每个样本用户的违约标注信息。
信息输入模块540,用于对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数。
模型训练模块560,用于在各个样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的信用分数模型。
其中,样本用户的第i次关系信用分数是根据与样本用户存在社交关系的各个其他用户的第i次信用分数计算得到的;样本用户的违约标注信息用于对样本用户的分类。
综上所述,本实施例提供的信用分数模型训练装置,通过获取若干个样本用户的第i次信用分数、每个样本用户的第i次关系信用分数和每个样本用户的违约标注信息;对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数;在各个样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的信用分数模型;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数计算用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
请参考图6,其示出了本发明另一个实施例提供的信用分数模型训练装置的结构方框图。该信用分数模型训练装置可以通过软件、硬件或者两者的结合实现。该信用分数模型训练装置包括:
信息获取模块610,用于获取若干个样本用户的第i次信用分数、每个样本用户的第i次关系信用分数和每个样本用户的违约标注信息。
可选的,信息获取模块610可以包括:第一计算单元611和第二计算单元612。
第一计算单元611,用于当i=1时,根据各个样本用户的个人信用信息计算得到样本用户的第一次信用分数。
第二计算单元612,用于当存在根据个人信用信息无法计算得到第一次信用分数的样本用户时,将样本用户的第一次关系信用分数确定为样本用户的第一次信用分数,第一次关系信用分数是根据与样本用户存在社交关系的各个其他用户的第一次信用分数计算得到的。
可选的,信息获取模块610可以包括:社交获取单元613、分数获取单元614和关系计算单元615。
社交获取单元613,用于获取每个样本用户的社交关系链,社交关系链是样本用户与其他用户之间存在的社交关系。
分数获取单元614,用于根据社交关系链获取每个样本用户对应的各个其他用户的第i次信用分数。
关系计算单元615,用于计算各个样本用户的第i次关系信用分数。
可选的,关系计算单元615,可以包括:第三计算单元615a和分数确定单元615b。
第三计算单元615a,用于对于每个样本用户,计算与样本用户对应的各个其他用户的第i次信用分数的平均值。
分数确定单元615b,用于将平均值确定为样本用户的第i次关系信用分数。
可选的,关系计算单元615,可以包括:权重获取单元615c和第四计算单元615d。
权重获取单元615c,用于对于每个样本用户,根据社交关系链获取与样本用户对应的各个其他用户的第i次信用分数和各个其他用户所对应的权重。
第四计算单元615d,用于根据各个其他用户的第i次信用分数和各个其他用户所对应的权重计算样本用户的关系信用分数,具体公式如下:
其中,score_fri_avg是指样本用户的第i次关系信用分数,friend_score_j是指与样本用户存在社交关系的第j个其他用户的第i次信用分数,op_j是指与样本用户存在社交关系的第j个其他用户所对应的权重。
信息输入模块620,用于对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数。
模型训练模块630,用于在各个样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的信用分数模型。
其中,样本用户的第i次关系信用分数是根据与样本用户存在社交关系的各个其他用户的第i次信用分数计算得到的;样本用户的违约标注信息用于对样本用户的分类。
可选的,模型训练模块630可以包括:系数计算单元631、系数检测单元632和训练完毕单元633。
系数计算单元631,用于计算各个样本用户的第i+1次信用分数和各个样本用户的第i次信用分数之间的相关系数。
系数检测单元632,用于检测相关系数是否大于第一阈值。
训练完毕单元633,用于若相关系数大于第一阈值,则得到训练完毕的信用分数模型。
可选的,信用分数模型包括逻辑回归分类模型或决策树分类模型。
综上所述,本实施例提供的信用分数模型训练装置,通过获取若干个样本用户的第i次信用分数、每个样本用户的第i次关系信用分数和每个样本用户的违约标注信息;对于每个样本用户,将样本用户的第i次信用分数、样本用户的第i次关系信用分数和样本用户的违约标注信息,输入预设的信用分数模型,计算得到样本用户的第i+1次信用分数;在各个样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的信用分数模型;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数计算用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
另外,当存在根据个人信用信息无法计算得到第一次信用分数的样本用户时,将样本用户的第一次关系信用分数确定为样本用户的第一次信用分数,达到了在用户的个人信用分数缺失的情况下也可以根据用户的关系信用分数计算得到用户的信用分数的效果。
请参考图7,其示出了本发明一个实施例提供的信用分数计算装置的结构方框图。该信用分数计算装置可以通过软件、硬件或者两者的结合实现。该信用分数计算装置包括:
信用获取模块720,用于获取各个用户的第一次信用分数和每个用户的第一次关系信用分数,用户的第一次关系信用分数是根据与用户存在社交关系的各个其他用户的第一次信用分数计算得到的。
目标计算模块740,用于将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入训练完毕的信用分数模型,计算得到各个用户的目标信用分数。
综上所述,本实施例提供的信用分数计算装置,通过获取各个用户的第一次信用分数和每个用户的第一次关系信用分数;将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入信用分数模型,计算得到各个用户的目标信用分数;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数计算用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
请参考图8,其示出了本发明另一个实施例提供的信用分数计算装置的结构方框图。该信用分数计算装置可以通过软件、硬件或者两者的结合实现。该信用分数计算装置包括:
信用获取模块820,用于获取各个用户的第一次信用分数和每个用户的第一次关系信用分数,用户的第一次关系信用分数是根据与用户存在社交关系的各个其他用户的第一次信用分数计算得到的。
目标计算模块840,用于将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入训练完毕的信用分数模型,计算得到各个用户的目标信用分数。
可选的,目标计算模块840,可以包括:待定计算单元841和目标确定单元842。
待定计算单元841,用于将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入训练完毕的信用分数模型,计算得到各个用户的第x次信用分数。
目标确定单元842,用于在各个用户的第x次信用分数满足预设条件时,将各个用户的第x次信用分数确定为用户的目标信用分数。
可选的,目标确定单元842可以包括:差值计算单元843、差值检测单元844和信用确定单元845。
差值计算单元843,用于计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值。
差值检测单元844,用于检测差值是否小于第二阈值。
信用确定单元845,用于在差值小于第二阈值时,将各个用户的第x次信用分数确定为用户的目标信用分数。
可选的,该装置,还可以包括:循环输入模块860。
循环输入模块860,用于在各个用户的第x次信用分数不满足预设条件时,将各个用户的第x次信用分数和每个用户的第x次关系信用分数再次输入信用分数模型,计算得到用户的第x+1次信用分数;
令x=x+1,再次执行计算各个用户的第x次信用分数和各个用户的第x-1次信用分数之间的差值的步骤。
综上所述,本实施例提供的信用分数计算装置,通过获取各个用户的第一次信用分数和每个用户的第一次关系信用分数;将各个用户的第一次信用分数和每个用户的第一次关系信用分数输入信用分数模型,计算得到各个用户的目标信用分数;解决了当用户个人的信息有所缺失或存在错误时,很难准确的计算出用户的信用分数的问题;达到了通过同时统计用户个人的信用分数和与用户存在社交关系的其他用户的信用分数计算用户的目标信用分数,扩大了信用分数模型的覆盖范围,提高了计算用户的信用分数的准确性的效果。
请参考图9,其示出了本发明一个实施例提供的服务器的结构示意图。所述服务器900包括中央处理单元(CPU)901、包括随机存取存储器(RAM)902和只读存储器(ROM)903的***存储器904,以及连接***存储器904和中央处理单元901的***总线905。所述服务器900还包括帮助计算机内的各个器件之间传输信息的基本输入/输出***(I/O***)906,和用于存储操作***913、应用程序914和其他程序模块915的大容量存储设备907。
所述基本输入/输出***906包括有用于显示信息的显示器908和用于用户输入信息的诸如鼠标、键盘之类的输入设备909。其中所述显示器908和输入设备907都通过连接到***总线905的输入输出控制器910连接到中央处理单元901。所述基本输入/输出***906还可以包括输入输出控制器910以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器910还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备907通过连接到***总线905的大容量存储控制器(未示出)连接到中央处理单元901。所述大容量存储设备907及其相关联的计算机可读介质为服务器900提供非易失性存储。也就是说,所述大容量存储设备907可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的***存储器904和大容量存储设备907可以统称为存储器。
根据本发明的各种实施例,所述服务器900还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器900可以通过连接在所述***总线905上的网络接口单元911连接到网络912,或者说,也可以使用网络接口单元911来连接到其他类型的网络或远程计算机***(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序用于执行上述实施例提供的信用分数模型训练方法或信用分数计算方法。
需要说明的是:上述实施例提供的信用分数模型训练的装置在训练信用分数模型时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信用分数模型训练的装置与信用分数模型训练的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
需要说明的另一点是:上述实施例提供的信用分数计算的装置在计算信用分数模型时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信用分数计算的装置与信用分数计算的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (22)

1.一种信用分数模型训练方法,其特征在于,所述方法包括:
获取若干个样本用户的第i次信用分数、每个所述样本用户的第i次关系信用分数和每个所述样本用户的违约标注信息,i为正整数;
对于每个所述样本用户,将所述样本用户的第i次信用分数、所述样本用户的第i次关系信用分数和所述样本用户的违约标注信息,输入预设的信用分数模型,计算得到所述样本用户的第i+1次信用分数;
在各个所述样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的所述信用分数模型;
其中,所述样本用户的第i次关系信用分数是根据与所述样本用户存在社交关系的各个其他用户的第i次信用分数计算得到的;所述样本用户的违约标注信息用于对所述样本用户的分类。
2.根据权利要求1所述的方法,其特征在于,所述获取若干个样本用户的第i次信用分数,包括:
当i=1时,根据各个所述样本用户的个人信用信息计算得到所述样本用户的第一次信用分数;
当存在根据所述个人信用信息无法计算得到所述第一次信用分数的样本用户时,将所述样本用户的第一次关系信用分数确定为所述样本用户的第一次信用分数,所述第一次关系信用分数是根据与所述样本用户存在社交关系的各个其他用户的第一次信用分数计算得到的。
3.根据权利要求1所述的方法,其特征在于,所述在各个所述样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的所述信用分数模型,包括:
计算各个所述样本用户的第i+1次信用分数和各个所述样本用户的第i次信用分数之间的相关系数;
检测所述相关系数是否大于第一阈值;
若所述相关系数大于所述第一阈值,则得到训练完毕的所述信用分数模型。
4.根据权利要求1至3任一所述的方法,其特征在于,所述获取每个所述样本用户的第i次关系信用分数,包括:
获取每个所述样本用户的社交关系链,所述社交关系链是所述样本用户与所述其他用户之间存在的社交关系;
根据所述社交关系链获取每个所述样本用户对应的各个所述其他用户的第i次信用分数;
计算各个所述样本用户的第i次关系信用分数。
5.根据权利要求4所述的方法,其特征在于,所述计算各个所述样本用户的第i次关系信用分数,包括:
对于每个所述样本用户,计算与所述样本用户对应的各个所述其他用户的第i次信用分数的平均值;
将所述平均值确定为所述样本用户的第i次关系信用分数。
6.根据权利要求4所述的方法,其特征在于,所述计算各个所述样本用户的第i次关系信用分数,包括:
对于每个所述样本用户,根据所述社交关系链获取与所述样本用户对应的各个所述其他用户的第i次信用分数和各个所述其他用户所对应的权重;
根据各个所述其他用户的第i次信用分数和各个所述其他用户所对应的权重计算所述样本用户的第i次关系信用分数,具体公式如下:
<mrow> <mi>s</mi> <mi>c</mi> <mi>o</mi> <mi>r</mi> <mi>e</mi> <mo>_</mo> <mi>f</mi> <mi>r</mi> <mi>i</mi> <mo>_</mo> <mi>a</mi> <mi>v</mi> <mi>g</mi> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>f</mi> <mi>r</mi> <mi>i</mi> <mi>e</mi> <mi>n</mi> <mi>d</mi> <mo>_</mo> <mi>s</mi> <mi>c</mi> <mi>o</mi> <mi>r</mi> <mi>e</mi> <mo>_</mo> <mi>j</mi> <mo>*</mo> <mi>o</mi> <mi>p</mi> <mo>_</mo> <mi>j</mi> <mo>/</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>o</mi> <mi>p</mi> <mo>_</mo> <mi>j</mi> </mrow>
其中,score_fri_avg是指所述样本用户的第i次关系信用分数,friend_score_j是指与所述样本用户存在社交关系的第j个所述其他用户的第i次信用分数,op_j是指与所述样本用户存在社交关系的第j个所述其他用户所对应的权重。
7.根据权利要求1至3任一所述的方法,其特征在于,所述信用分数模型包括逻辑回归分类模型或决策树分类模型。
8.一种信用分数计算方法,其特征在于,应用于如权利要求1至7任一所述的信用分数模型中,所述方法包括:
获取各个用户的第一次信用分数和每个所述用户的第一次关系信用分数,所述用户的第一次关系信用分数是根据与所述用户存在社交关系的各个其他用户的第一次信用分数计算得到的;
将各个所述用户的第一次信用分数和每个所述用户的第一次关系信用分数输入训练完毕的所述信用分数模型,计算得到各个所述用户的目标信用分数。
9.根据权利要求8所述的方法,其特征在于,所述将各个所述用户的第一次信用分数和每个所述用户的第一次关系信用分数输入所述信用分数模型,计算得到各个所述用户的目标信用分数,包括:
将各个所述用户的第一次信用分数和每个所述用户的第一次关系信用分数输入训练完毕的所述信用分数模型,计算得到各个所述用户的第x次信用分数;
在各个所述用户的第x次信用分数满足预设条件时,将各个所述用户的第x次信用分数确定为所述用户的目标信用分数。
10.根据权利要求9所述的方法,其特征在于,所述在各个所述用户的第x次信用分数满足预设条件时,将各个所述用户的第x次信用分数确定为所述用户的目标信用分数,包括:
计算各个所述用户的第x次信用分数和各个所述用户的第x-1次信用分数之间的差值;
检测所述差值是否小于第二阈值;
若所述差值小于所述第二阈值,则将各个所述用户的第x次信用分数确定为所述用户的目标信用分数。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
在各个所述用户的第x次信用分数不满足所述预设条件时,将各个所述用户的第x次信用分数和每个所述用户的第x次关系信用分数再次输入所述信用分数模型,计算得到所述用户的第x+1次信用分数;
令x=x+1,再次执行所述计算各个所述用户的第x次信用分数和各个所述用户的第x-1次信用分数之间的差值的步骤。
12.一种信用分数模型训练装置,其特征在于,所述装置包括:
信息获取模块,用于获取若干个样本用户的第i次信用分数、每个所述样本用户的第i次关系信用分数和每个所述样本用户的违约标注信息,i为正整数;
信息输入模块,用于对于每个所述样本用户,将所述样本用户的第i次信用分数、所述样本用户的第i次关系信用分数和所述样本用户的违约标注信息,输入预设的信用分数模型,计算得到所述样本用户的第i+1次信用分数;
模型训练模块,用于在各个所述样本用户的第i+1次信用分数满足训练结束条件时,得到训练完毕的所述信用分数模型;
其中,所述样本用户的第i次关系信用分数是根据与所述样本用户存在社交关系的各个其他用户的第i次信用分数计算得到的;所述样本用户的违约标注信息用于对所述样本用户的分类。
13.根据权利要求12所述的装置,其特征在于,所述信息获取模块,包括:
第一计算单元,用于当i=1时,根据各个所述样本用户的个人信用信息计算得到所述样本用户的第一次信用分数;
第二计算单元,用于当存在根据所述个人信用信息无法计算得到所述第一次信用分数的样本用户时,将所述样本用户的第一次关系信用分数确定为所述样本用户的第一次信用分数,所述第一次关系信用分数是根据与所述样本用户存在社交关系的各个其他用户的第一次信用分数计算得到的。
14.根据权利要求13所述的装置,其特征在于,所述模型训练模块,包括:
系数计算单元,用于计算各个所述样本用户的第i+1次信用分数和各个所述样本用户的第i次信用分数之间的相关系数;
系数检测单元,用于检测所述相关系数是否大于第一阈值;
训练完毕单元,用于若所述相关系数大于所述第一阈值,则得到训练完毕的所述信用分数模型。
15.根据权利要求12至14任一所述的装置,其特征在于,所述信息获取模块,还包括:
社交获取单元,用于获取每个所述样本用户的社交关系链,所述社交关系链是所述样本用户与所述其他用户之间存在的社交关系;
分数获取单元,用于根据所述社交关系链获取每个所述样本用户对应的各个所述其他用户的第i次信用分数;
关系计算单元,用于计算各个所述样本用户的第i次关系信用分数。
16.根据权利要求15所述的装置,其特征在于,所述关系计算单元,包括:
第三计算单元,用于对于每个所述样本用户,计算与所述样本用户对应的各个所述其他用户的第i次信用分数的平均值;
分数确定单元,用于将所述平均值确定为所述样本用户的第i次关系信用分数。
17.根据权利要求15所述的装置,其特征在于,所述关系计算单元,包括:
权重获取单元,用于对于每个所述样本用户,根据所述社交关系链获取与所述样本用户对应的各个所述其他用户的第i次信用分数和各个所述其他用户所对应的权重;
第四计算单元,用于根据各个所述其他用户的第i次信用分数和各个所述其他用户所对应的权重计算所述样本用户的关系信用分数,具体公式如下:
<mrow> <mi>s</mi> <mi>c</mi> <mi>o</mi> <mi>r</mi> <mi>e</mi> <mo>_</mo> <mi>f</mi> <mi>r</mi> <mi>i</mi> <mo>_</mo> <mi>a</mi> <mi>v</mi> <mi>g</mi> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>f</mi> <mi>r</mi> <mi>i</mi> <mi>e</mi> <mi>n</mi> <mi>d</mi> <mo>_</mo> <mi>s</mi> <mi>c</mi> <mi>o</mi> <mi>r</mi> <mi>e</mi> <mo>_</mo> <mi>j</mi> <mo>*</mo> <mi>o</mi> <mi>p</mi> <mo>_</mo> <mi>j</mi> <mo>/</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>o</mi> <mi>p</mi> <mo>_</mo> <mi>j</mi> </mrow>
其中,score_fri_avg是指所述样本用户的第i次关系信用分数,friend_score_j是指与所述样本用户存在社交关系的第j个所述其他用户的第i次信用分数,op_j是指与所述样本用户存在社交关系的第j个所述其他用户所对应的权重。
18.根据权利要求12至14任一所述的装置,其特征在于,所述信用分数模型包括逻辑回归分类模型或决策树分类模型。
19.一种信用分数计算装置,其特征在于,应用于如权利要求12至18任一所述的信用分数模型中,所述装置包括:
信用获取模块,用于获取各个用户的第一次信用分数和每个所述用户的第一次关系信用分数,所述用户的第一次关系信用分数是根据与所述用户存在社交关系的各个其他用户的第一次信用分数计算得到的;
目标计算模块,用于将各个所述用户的第一次信用分数和每个所述用户的第一次关系信用分数输入训练完毕的所述信用分数模型,计算得到各个所述用户的目标信用分数。
20.根据权利要求19所述的装置,其特征在于,所述目标计算模块,包括:
待定计算单元,用于将各个所述用户的第一次信用分数和每个所述用户的第一次关系信用分数输入训练完毕的所述信用分数模型,计算得到各个所述用户的第x次信用分数;
目标确定单元,用于在各个所述用户的第x次信用分数满足预设条件时,将各个所述用户的第x次信用分数确定为所述用户的目标信用分数。
21.根据权利要求20所述的装置,其特征在于,所述目标确定单元,包括:
差值计算单元,用于计算各个所述用户的第x次信用分数和各个所述用户的第x-1次信用分数之间的差值;
差值检测单元,用于检测所述差值是否小于第二阈值;
信用确定单元,用于在所述差值小于所述第二阈值时,将各个所述用户的第x次信用分数确定为所述用户的目标信用分数。
22.根据权利要求20所述的装置,其特征在于,所述装置,还包括:
循环输入模块,用于在各个所述用户的第x次信用分数不满足所述预设条件时,将各个所述用户的第x次信用分数和每个所述用户的第x次关系信用分数再次输入所述信用分数模型,计算得到所述用户的第x+1次信用分数;
令x=x+1,再次执行所述计算各个所述用户的第x次信用分数和各个所述用户的第x-1次信用分数之间的差值的步骤。
CN201610145843.XA 2016-03-15 2016-03-15 信用分数模型训练方法、信用分数计算方法及装置 Pending CN107194795A (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201610145843.XA CN107194795A (zh) 2016-03-15 2016-03-15 信用分数模型训练方法、信用分数计算方法及装置
PCT/CN2017/075131 WO2017157165A1 (zh) 2016-03-15 2017-02-28 信用分数模型训练方法、信用分数计算方法、装置及服务器
KR1020187007645A KR102038237B1 (ko) 2016-03-15 2017-02-28 신용점수 모델 훈련 방법,신용 점수 계산 방법,장치 및 서버
EP17765707.9A EP3349171A4 (en) 2016-03-15 2017-02-28 Credit-score model training method, and credit-score calculation method, device, and server
JP2018535228A JP6595718B2 (ja) 2016-03-15 2017-02-28 クレジット点数モデルトレーニング方法、クレジット点数計算方法、装置及びサーバー
US15/954,378 US11915311B2 (en) 2016-03-15 2018-04-16 User score model training and calculation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610145843.XA CN107194795A (zh) 2016-03-15 2016-03-15 信用分数模型训练方法、信用分数计算方法及装置

Publications (1)

Publication Number Publication Date
CN107194795A true CN107194795A (zh) 2017-09-22

Family

ID=59851922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610145843.XA Pending CN107194795A (zh) 2016-03-15 2016-03-15 信用分数模型训练方法、信用分数计算方法及装置

Country Status (6)

Country Link
US (1) US11915311B2 (zh)
EP (1) EP3349171A4 (zh)
JP (1) JP6595718B2 (zh)
KR (1) KR102038237B1 (zh)
CN (1) CN107194795A (zh)
WO (1) WO2017157165A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862339A (zh) * 2017-11-15 2018-03-30 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN108898476A (zh) * 2018-06-14 2018-11-27 中国银行股份有限公司 一种贷款客户信用评分方法和装置
CN109461043A (zh) * 2018-09-18 2019-03-12 深圳壹账通智能科技有限公司 产品推送方法、装置、计算机设备和存储介质
CN110599329A (zh) * 2019-09-09 2019-12-20 腾讯科技(深圳)有限公司 信用评估方法、信用评估装置及电子设备
CN112017062A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 基于客群细分的资源额度分配方法、装置及电子设备

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11823258B2 (en) * 2017-10-11 2023-11-21 Mx Technologies, Inc. Aggregation based credit decision
KR102400804B1 (ko) * 2019-09-05 2022-05-24 고려대학교 산학협력단 기계학습 기반 신용평가 분류 모델의 평가 이유를 설명하는 장치 및 방법

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109208A (ja) * 2000-09-29 2002-04-12 Acom Co Ltd 信用リスク管理方法、分析モデル決定方法、分析サーバ及び分析モデル決定装置
JP2002123649A (ja) * 2000-10-13 2002-04-26 Nippon Telegr & Teleph Corp <Ntt> 信用調査装置、信用調査方法及び信用調査装置における信用調査プログラムを記録した記録媒体
US20020138333A1 (en) * 2001-03-22 2002-09-26 Decotiis Allen R. System, method and article of manufacture for a weighted model to conduct propensity studies
US8302164B2 (en) * 2004-07-22 2012-10-30 Facebook, Inc. Authorization and authentication based on an individual's social network
JP5071475B2 (ja) * 2007-03-27 2012-11-14 富士通株式会社 重回帰分析による予測モデルの作成方法、作成装置、作成プログラム
US8694401B2 (en) * 2011-01-13 2014-04-08 Lenddo, Limited Systems and methods for using online social footprint for affecting lending performance and credit scoring
US20140081832A1 (en) * 2012-09-18 2014-03-20 Douglas Merrill System and method for building and validating a credit scoring function
KR20130065778A (ko) * 2011-11-29 2013-06-20 코리아크레딧뷰로 (주) 신용정보 관리 방법 및 시스템
WO2013126713A1 (en) * 2012-02-22 2013-08-29 Pave, Inc. Apparatuses, methods and systems for facilitating communities of social based investment
JP2014071532A (ja) * 2012-09-27 2014-04-21 Mycredit Kk 個人信用情報提供装置
CN103514566A (zh) * 2013-10-15 2014-01-15 国家电网公司 一种风险控制***及方法
CN104463603B (zh) * 2014-12-05 2018-02-02 中国联合网络通信集团有限公司 一种信用评估方法及***
CN104574110B (zh) * 2014-12-29 2018-04-27 上海正信方晟资信评估有限公司 一种信用数字认证方法
US20160267587A1 (en) * 2015-03-12 2016-09-15 Backed Inc. Systems and methods for online guarantorship of loans
US10387939B2 (en) * 2015-08-21 2019-08-20 Q2 Software, Inc. Method, medium, and system for surfacing recommendations

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862339A (zh) * 2017-11-15 2018-03-30 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN108898476A (zh) * 2018-06-14 2018-11-27 中国银行股份有限公司 一种贷款客户信用评分方法和装置
CN109461043A (zh) * 2018-09-18 2019-03-12 深圳壹账通智能科技有限公司 产品推送方法、装置、计算机设备和存储介质
CN110599329A (zh) * 2019-09-09 2019-12-20 腾讯科技(深圳)有限公司 信用评估方法、信用评估装置及电子设备
CN112017062A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 基于客群细分的资源额度分配方法、装置及电子设备
CN112017062B (zh) * 2020-07-15 2024-06-07 北京淇瑀信息科技有限公司 基于客群细分的资源额度分配方法、装置及电子设备

Also Published As

Publication number Publication date
KR102038237B1 (ko) 2019-10-29
EP3349171A4 (en) 2018-10-17
WO2017157165A1 (zh) 2017-09-21
JP2018530093A (ja) 2018-10-11
EP3349171A1 (en) 2018-07-18
US20180232665A1 (en) 2018-08-16
JP6595718B2 (ja) 2019-10-23
KR20180041727A (ko) 2018-04-24
US11915311B2 (en) 2024-02-27

Similar Documents

Publication Publication Date Title
CN107194795A (zh) 信用分数模型训练方法、信用分数计算方法及装置
Peng et al. Exponential operation and aggregation operator for q‐rung orthopair fuzzy set and their decision‐making method with a new score function
Sinharay Bayesian item fit analysis for unidimensional item response theory models
Baba et al. Leveraging non-expert crowdsourcing workers for improper task detection in crowdsourcing marketplaces
CN108763277B (zh) 一种数据分析方法、计算机可读存储介质及终端设备
Cai et al. Reinforcement mechanism design for fraudulent behaviour in e-commerce
WO2023000794A1 (zh) 保护数据隐私的业务预测模型训练的方法及装置
Şahin et al. Group decision making with simplified neutrosophic ordered weighted distance operator
Zhang et al. Consensus-based framework to MCGDM under multi-granular uncertain linguistic environment
Borzymek et al. Trust and distrust prediction in social network with combined graphical and review-based attributes
Zhang et al. Differentially private collaborative coupling learning for recommender systems
Leyva López et al. Accentuating the rank positions in an agreement index with reference to a consensus order
Anderson et al. Modified logistic regression using the EM algorithm for reject inference
CN105844577A (zh) 一种关系网络的识别方法及装置
Arora et al. Some distance measures for triangular fuzzy numbers under technique for order of preference by similarity to ideal solution environment
Jain et al. ANFIS and metaheuristic optimization for strategic joining policy with re-attempt and vacation
CN106815257A (zh) 一种用户可信度的计算方法及装置
CN110517104A (zh) 账户关联发现方法、装置、服务器及介质
Liu et al. [Retracted] Analysis of Efficiency of Human Resource Management Evaluation Model Based on SOM Neural Network
Khalife et al. An Integrative Approach to Analyze the Attributes Shaping the Dynamic Nature of Value in AEC.
Naidoo et al. Theory-Guided Feature Selection in Cybercrime Data Science
CN110347905B (zh) 确定信息关联度、信息推荐的方法、装置和存储介质
Roszel et al. An Analysis of Byzantine-Tolerant Aggregation Mechanisms on Model Poisoning in Federated Learning
CN106301880A (zh) 一种确定网络关系稳定度、互联网业务推荐方法和设备
Ye Macquarie University, Sydney, Australia bin. ye@ students. mq. edu. au,{yan. wang, mehmet. orgun, michael. sheng}@ mq. edu. au

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170922

RJ01 Rejection of invention patent application after publication