CN109657883A - 一种基于多源数据驱动的银行网点选址推荐方法 - Google Patents

一种基于多源数据驱动的银行网点选址推荐方法 Download PDF

Info

Publication number
CN109657883A
CN109657883A CN201910077769.6A CN201910077769A CN109657883A CN 109657883 A CN109657883 A CN 109657883A CN 201910077769 A CN201910077769 A CN 201910077769A CN 109657883 A CN109657883 A CN 109657883A
Authority
CN
China
Prior art keywords
bank
data
addressing
probability
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910077769.6A
Other languages
English (en)
Other versions
CN109657883B (zh
Inventor
冯辉宗
邓轲
范兴容
许国良
雒江涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910077769.6A priority Critical patent/CN109657883B/zh
Publication of CN109657883A publication Critical patent/CN109657883A/zh
Application granted granted Critical
Publication of CN109657883B publication Critical patent/CN109657883B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据挖掘与大数据应用领域,特别是涉及一种基于多源数据驱动的银行网点选址推荐方法,该方法包含如下步骤:获取移动信令数据和银行网点周边数据,其包括本地公交数据,网络爬取数据;根据获取的数据对目标银行网点提取人流量、用户价值、交通拥堵指数、周边竞争网点数和人均收入五个特征;利用构造的特征,训练多个选址分类模型,并构建基于概率的多模型融合的银行网点选址推荐模型;使用已构建的银行网点选址推荐模型,根据目标区域的特征,推荐该区域最佳银行网点选址分布,以实现银行网点智能化选址的目的,解决传统选址带来的选址范围不精准、人力成本高的问题,并得到更好经济效益和社会效益。

Description

一种基于多源数据驱动的银行网点选址推荐方法
技术领域
本发明涉及数据挖掘与大数据领域,具体涉及一种基于多源数据驱动的银行网点选址推荐方法。
背景技术
随着社会经济发展,各大商业银行对业务的需求,用户的积累日益增加,银行网点的选址直接关系到银行的发展及利益。因此,银行网点的选址对于银行的发展及未来规划具有重要的意义。
传统的银行选址方法主要是包括人工调研法、专家打分法、询问专业的咨询公司等。这些方法首先是通过人力大范围的收集数据,包括地点范围内的人流量、银行竞争网点数、交通流量等,最后结合这些数据,通过数据可视化的方式展示结果,再由专家根据这些结果分析进而选择出最佳地址。
但这些方法通常具有个人的偏向性,且结果不一定准确,由于不能实现自动化,因此效率低下,工作量较大,不仅导致人力经济支出负担较大,且决策时间也大大加长,无法满足现代社会高效、精确的需求。
发明内容
为解决上述问题的不足,本发明通过移动信令大数据及银行网点周边数据,其包括本地公交数据,网络爬取数据,提供一种基于多源数据驱动的银行网点选址推荐方法,能够有效解决传统方法时间长,调研成本高的问题,实现自动化银行选址的目的,且快速、精确、有效。
为实现上述目的,本发明所述的基于多源数据驱动的银行网点选址推荐方法,包括如下步骤:
步骤一、获取移动信令数据和银行网点周边数据;
步骤二、根据获取的数据对目标银行网点构造至少包括人流量、用户价值、交通拥堵指数、周边竞争网点数和人均收入中任意两个或以上的特征;
步骤三、利用构造的特征,训练多个选址分类模型,并构建基于概率的多模型融合的银行网点选址推荐模型;
步骤四、使用已构建的银行网点选址推荐模型,根据目标区域的特征,推荐该区域最佳银行网点选址分布。
进一步的,步骤一所述的移动信令数据包括但不限于银行网点基站数据、移动用户轨迹数据、移动用户工作地居住地数据、移动用户上网信息数据、移动用户所属银行数据。
步骤一所述的银行网点周边数据包括但不限于本地公交数据、网络数据、周边房价数据。
进一步的,步骤二包括:选取已有银行,以半径为r划定圆形区域,通过移动信令数据,银行网点周边数据,构造特征。其包括人流量特征、交通拥堵指数特征、周边竞争网点数特征和人均收入特征。
针对移动信令数据,据统计该范围内移动用户数,通过去重处理,统计记录条数,作为人流量特征;根据移动用户上网信息数据以及移动用户所属银行数据,支付行为信息综合考量,构造用户价值特征。
针对银行网点周边数据,通过本地公交数据,地图软件的应用程序编程接口数据,优选的,本发明选取百度地图API数据,基于路段速度计算交通拥堵状况指数特征;通过百度地图API,查询选址范围银行网点数作为周边竞争网点数特征;通过爬虫技术获取周边小区房价信息,通过该城市房价收入比ε,计算对应人均收入特征;则该范围内人均收入X计算公式为:
其中,Xi表示第i个小区的房价;n为该选址范围内的小区数。
进一步的,用户价值的计算方法包括:
建立出以上层为用户价值,下层为影响价值的三个指标的阶梯层次结构;计算下层的三个指标对用户评分的影响权重,构建对比矩阵,即对各指标的影响权重进行两两比较,得到对比矩阵A,并计算出其最大特征值λmax与其特征向量a=(a1,a2,a3)T;在具有满意的一致性检验要求下,求得用户价值val为:val=a1·b1+a2·b2+a3·b3;b1表示为移动用户使用银行金融app使用次数;b2表示为移动用户在银行的支付信息;b3表示移动用户是否属于待选址银行网点的客户;其中三个指标依次为移动用户使用银行网点金融app的次数指标,移动用户在银行的支付信息指标,移动用户是否属于待选址银行网点的客户指标;即b1表示金融app使用次数,b2表示银行支付信息(银行直接支付次数,如用某银行app直接付款,不限定于某银行,可为任意一家银行),b3表示是否属于该银行(该银行即表示模型要预测建立的银行,即判断用户是否是属于该银行的用户),其中b1,b2为归一化后的值,b3为01值,即b3的值为0或1。而a1,a2,a3则表示利用层次分析法所计算出来的三个指标的权重,a1,a2,a3的值也就是本发明中所述的特征向量。
进一步的,步骤三包括:利用所有特征数据,构建多个选址分类模型,优选的,本发明选择构建三个选址分类模型,其中,构建出的第一个选址分类模型,即采用支持向量机模型,其目标函数表示为:
经转换后,目标函数为:
s.t. yiT·xi+b)≥1,i=1,...,n (3)
式(1)~式(3)中,ω为特征参数,yi表示为步骤二中第i条训练集所对应的真实标签值;其取值为1或-1。xi为对应特征数据,n表示特征样本点总数。
进一步的,第一层中基于逻辑回归构建第二个选址模型,其预测函数表示为:
z=θT·x+b (5)
通过极大似然方法,对应的目标函数为:
式(5)~式(6)中,通过梯度下降方法求得对应解,Hθ(x)为基于逻辑回归的选址决策模型,Hθ(xi)表示为步骤二中第i条训练集数据所得结果;θ、b为拟合该公式的参数;yi表示为步骤二中第i条训练集所对应的真实标签值;然后通过梯度下降方法,求得对应解。
进一步的,基于梯度提升树(Gradient Boosting Decision Tree,简称GBDT)构建第三个选址模型,其损失函数为:
L(y,f(x))=log(1+exp(-yf(x)) (7)
其中,式(7)中,y为对应标签值,其中y∈{-1,1},f(x)为前一轮迭代的强学习器,x为对应特征。
可以理解的是,在本发明的基于多源数据驱动的银行网点选址推荐方法中,选址分类模型可以选择不同损失函数或者不同目标函数的模型,都应该属于本发明的保护范围,本领域技术人员可以根据实际情况选择合适的模型,本发明就不再枚举。
进一步的,步骤三包括:
根据上述步骤,通过选取不同的特征集,不同的模型方法,构建多个不同的模型,利用多个不同模型的差异性,构建出泛化性更好的决策选址模型,具体实现方式为:
1.选取m个不同的模型作为第一层分类器;由于本发明中选取了三个选址模型,因此,此处,m=3。
2.对第一层分类器的基础模型进行5折交叉验证,即将训练集分成5等分,选取其中1等分以及测试集作为预测集,另外4等分作为训练集,则一共需要进行5次预测,最后可以得出训练集所有记录的预测概率,以及5次测试集预测的概率;
3.将训练集预测概率以及5次测试集预测的概率的平均值作为特征,一共有m个不同模型,即有m列特征,基于逻辑回归构建第二层分类器,对测试集进行预测;所述第二层分类器的损失函数设计如下:
其中,式(8)和式(9)中,l(θ)表示为第二层分类器的损失函数;hθ(X)为第二层中基于逻辑回归的选址决策模型,hθ(xi)为第一概率特征中第i条训练集数据所得结果,xi为第一概率特征中第i条训练集所对应特征数据;yi为第一概率特征中第i条训练集所对应的真实标签值,p为其真实标签对应输出概率。
可以理解的是,本发明中第二层分类器只有一个,即逻辑回归,其特征为第一层的多个分类器输出的概率,即第一概率特征,如第一层有m个分类器,则会输出m个概率,以此作为第二层的m个第一概率特征。
hθ(x)即第二层中基于逻辑回归的分类模型,hθ(xi)中的xi表示第i条训练数据,即第i个第一概率特征,并将其输入到hθ(x)这个模型中,hθ(xi)的结果会是一个范围在0-1的一个小数,yi即为这条数据对应的真实标签值:如表1所示,
表1各类第一概率特征对应的真实标签值
Fea1 Fea2 Fea3 Fea4 Fea5 均值
0.774 0.723 0.75 0.71 0.5 0.5
0.5 0.3 0.3 0.3 0.4 0
0.4 0.1 0.2 0.5 0.5 0
Fea1~Fea5分别表示5组第一概率特征;当xi中的i=3时,即对应的数据为0.4,0.1,0.2,0.5,0.1。yi对应0。
pi即为基于逻辑回归的分类模型预测出来的概率,主要作用是为了加大优秀银行网点预测的准确性。当真实标签为1时,pi=hθ(xi);当真实标签为0时,pi=1-hθ(xi)。
进一步的,步骤四包括:根据上述预测结果,对候选地址的预测概率进行排序,设定阈值,低于该阈值的则不适合作为银行选址地点,选取排序前k个候选地点作为最终银行选址地点。
本发明中,本领域技术人员可按照实际情况进行设置,可以根据用户的需求进行定义,k可以等于1,也可以等于其他大于1的整数,从而输出一个或者多个最佳银行网点选址分布。
本发明的有益效果:
本发明通过一种基于多源数据驱动的银行网点选址推荐方法,结合移动信令大数据,银行网点周边数据,构建多模型融合的方法,实现了银行网点自动化选址的目的,相对于传统方法,解决了选址过程中过多凭借人工主观判断,没有足够数据支撑的选址问题,通过大数据与机器学习的方法计算出合理的银行网点选址位置,极大程度的降低了人为选址主观判断的影响,使得选址决策结果更加客观。
附图说明
图1为本发明的一种基于多源数据驱动的银行网点选址推荐方法的决策流程图;
图2为本发明的基于多源数据的特征构造处理流程图;
图3为本发明的一种基于概率的多模型融合方法的构建流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于多源数据驱动的银行网点选址推荐方法,其流程如图1所示,包括:
步骤一、获取移动信令数据和银行网点周边数据;
步骤二、根据获取的数据对目标银行网点构造人流量、用户价值、交通拥堵指数、周边竞争网点数和人均收入五个特征;
步骤三、利用构造的特征,训练多个选址分类模型,并构建基于概率的多模型融合的银行网点选址推荐模型;
步骤四、基于多模型融合的银行网点选址推荐方法,根据目标区域的特征,推荐该区域最佳银行网点选址分布。
进一步的,步骤一所述的移动信令数据包括但不限于银行网点基站数据、移动用户轨迹数据、移动用户工作地居住地数据、移动用户上网信息数据、移动用户所属银行数据。步骤一所述的银行网点周边数据包括但不限于本地公交数据、网络数据、周边房价数据。
进一步的,选取已有银行,以半径为r划定圆形区域,通过移动信令数据,银行网点周边数据,构造特征。其包括人流量特征、用户价值特征、交通拥堵指数特征、周边竞争网点数特征和人均收入特征。特征构造流程图如图2所示,其特征构造流程包括:
人流量特征:确定选址范围内基站信息,利用移动信令数据统计该范围内移动用户数,通过去重处理,统计记录条数,作为人流量数据。
用户价值特征:根据移动用户上网信息数据以及移动用户所属银行数据构建用户价值模型,其步骤如下:
建立阶梯层次结构,上层为用户价值,下层为影响价值的三个指标,分别为移动用户使用银行金融app的次数,移动用户在银行的支付信息,移动用户是否属于待选址银行网点的客户。
建立判断矩阵:计算底层的3个指标对用户评分的影响权重,需要构建对比矩阵,即对各要素进行两两比较,weight为各指标对应权重,两两比较后可以得到矩阵A:对矩阵A,求其最大特征向量λmax与其特征向量a=(a1,a2,a3)T,即权重向量。
引入一致性检验,即当CR≤0.1时,结果具有满意的一致性,否则,重新构建对比矩阵。此处,n为对比矩阵的阶数,即为影响价值的三个指标,n=3。
最后求得用户价值val为:
val=a1·b1+a2·b2+a3·b3
b1表示移动用户使用银行金融app的次数,b2表示移动用户在银行的支付信息,b3表示移动用户是否属于待选址银行网点的客户。交通拥堵指数特征:包括范围内公交站点数量数据、交通拥堵状况数据,通过百度地图API爬取周边公交站点数量数据,通过本地公交数据,百度地图API数据,基于路段速度计算交通拥堵状况指数。
其中基于路段速度计算交通拥堵状况指数的详细步骤如下:
本地公交数据实时上传间隔为15秒左右,故15s内路段i的拥堵指标值Aij的计算公式为:
其中RSij表示该路段i第j个间隔参考速度,CSij表示该路段i第j个间隔的计算速度,即实际的运行速度;其中路段的段数可根据道路实际情况进行设置,间隔总数可以为2880个。
根据拥堵指标值Aij,计算统计间隔内选址范围内指标值Bj,以路段的长度Li为权重系数,对各个路段的指标值Aij进行加权求平均,式中,N表示该选址范围内路段总数,Bj计算公式为:
最后求出交通拥堵指数,即每月数据仅统计该月工作日(周一至周五)的高峰时段(07:00-19:00)共12h的数据,该指标值作为交通状况指数C,其计算公式为:
其中,M为一个月内Bj所有记录条数。
周边竞争网点数特征:通过百度地图API,查询选址范围银行网点数作为周边竞争网点数据。
人均收入特征:确定选址范围,利用爬虫技术从网络爬取周边小区房价及房价收入比ε,各房价信息设为X1、X2、X3...,n为该选址范围内小区数,则该范围内人均收入X计算公式为:
本发明通过选取不同的特征集,使用不同的经典分类模型方法,可以构建出多个不同的模型;
作为一种可选方式,本实施例中选择构建出三个选址分类模型,利用所有特征数据,基于支持向量机构建第一个选址分类模型,目标函数表示为:
经转换后,目标函数为:
s.t. yiT·xi+b)≥1,i=1,...,n
其中,ω为特征参数,yi表示为步骤二中第i条训练集所对应的真实标签值;其取值范围为1或-1。xi为对应特征数据。n表示特征样本点总数。
进一步的,第一层中基于逻辑回归构造第二个选址模型,其预测函数表示为:
z=θT·x+b
其中,Hθ(x)为第一层中基于逻辑回归的选址决策模型,Hθ(xi)表示为步骤二中第i条训练集数据所得结果;θ、b为拟合该公式的参数;yi表示为步骤二中第i条训练集所对应的真实标签值;
然后通过梯度下降方法,求得对应解:
进一步的,基于梯度提升树(Gradient Boosting Decision Tree,简称GBDT)构建第三个选址模型,其损失函数为:
L(y,f(x))=log(1+exp(-yf(x))
其中,y为对应标签值,其中y∈{-1,1},f(x)为前一轮迭代的强学习器,x为对应特征。
进一步的,根据上述步骤,进行模型融合,具体实现方式如图3所示,本发明通过选取不同的特征集,不同的模型方法,构建多个不同的模型,利用多个不同模型的差异性,构建出泛化性更好的决策选址模型。
具体实现步骤为:
1.选取m个不同的模型作为第一层分类器;
2.对第一层分类器的基础模型进行5折交叉验证,即将训练集分成5等分,选取其中1等份以及测试集作为预测集,另外4等份作为训练集,则一共需要进行5次预测,最后可以得出训练集所有记录的预测概率,以及5次测试集预测的概率;
3.将训练集预测概率以及5次测试集预测的概率的平均值作为特征,一共有m个不同模型,即有m列特征,基于逻辑回归构建第二层分类器,对测试集进行预测。其中,第二层分类器的损失函数设计如下:
其中,l(θ)表示为第二层分类器的损失函数;hθ(X)为第二层中基于逻辑回归的选址决策模型,hθ(xi)为第一概率特征中第i条训练集数据所得结果,xi为第一概率特征中第i条训练集所对应特征数据;yi为第一概率特征中第i条训练集所对应的真实标签值,pi为其真实标签对应输出概率。以此保证模型中优秀银行网点所对应权重更高。
进一步的,根据上述预测结果,对候选地址的预测概率进行排序,设定阈值,低于该阈值的则不适合作为银行选址地点,选取排序前k个候选地点作为最终的银行选址地点。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.基于多源数据驱动的银行网点选址推荐方法,其特征在于,包括以下步骤:
步骤一、获取包括银行网点基站数据、移动用户轨迹数据、移动用户工作地居住地数据、移动用户上网信息数据以及移动用户所属银行数据的移动信令数据,以及获取包括本地公交数据、网络数据、地图数据以及周边房价数据的银行网点周边数据;
步骤二、根据获取的数据对目标银行网点构造包括人流量、用户价值、交通拥堵指数、周边竞争网点数和人均收入特征;
人流量特征:确定选址范围内基站信息,利用移动信令数据统计该范围内移动用户数,通过去重处理,统计记录条数,作为人流量特征;
用户价值特征:根据移动用户上网信息数据以及移动用户所属银行数据构造用户价值特征;
交通拥堵指数特征:结合本地公交数据和地图软件的应用程序编程接口数据,基于路段速度计算交通拥堵状况指数;
周边竞争网点数特征:通过地图软件的应用程序编程接口,查询选址范围内的银行网点数,并作为周边竞争网点数;
人均收入特征:确定选址范围,利用爬虫技术从网络爬取选址范围内的周边小区房价及其房价收入比ε,则该范围内人均收入X计算公式为:Xi表示第i个小区的房价;n为该选址范围内的小区数;
步骤三、利用构造的特征,训练多个选址分类模型,并构建基于概率的多模型融合的银行网点选址推荐模型;
步骤四、使用已构建的银行网点选址推荐模型,根据目标区域的特征,推荐该区域最佳银行网点选址分布。
2.根据权利要求1所述的基于多源数据驱动的银行网点选址推荐方法,其特征在于,用户价值的计算方法包括:
建立出以上层为用户价值,下层为影响价值的三个指标的阶梯层次结构;计算下层的三个指标对用户评分的影响权重,构建对比矩阵,即对各指标的影响权重进行两两比较,得到对比矩阵A,并计算出其最大特征值λmax与其特征向量a=(a1,a2,a3)T;在具有满意的一致性检验要求下,求得用户价值val为:val=a1·b1+a2·b2+a3·b3;b1表示移动用户使用银行金融app的次数,b2表示移动用户在银行的支付信息,b3表示移动用户是否属于待选址银行网点的客户,其中b1、b2为归一化后的值,b3为01值,即b3等于0或1;三个指标依次为移动用户使用银行金融app的次数指标,移动用户在该银行的支付信息指标,移动用户是否属于该银行的客户指标。
3.根据权利要求1所述的基于多源数据驱动的银行网点选址推荐方法,其特征在于,所述的交通拥堵状况指数计算方法包括本地公交数据实时上传间隔内路段的拥堵指标值Aij;根据拥堵指标值Aij,计算统计间隔内选址范围内指标值Bj,统计每月各个工作日高峰时段的指标值Bj,并求取其平均值,将该平均值作为计算交通拥堵指数C;
拥堵指标值Aij的计算公式为:
选址范围内指标值Bj计算公式为:
交通拥堵指数C计算公式为:
其中,RSij表示路段i第j个间隔内的参考速度,CSij表示路段i第j个间隔内的计算速度,即路段i第j个间隔内对应的实际运行速度;Li表示路段i的长度;N表示该选址范围内路段总数;M为一个月内Bj所有记录条数。
4.根据权利要求1所述的基于多源数据驱动的银行网点选址推荐方法,其特征在于,步骤三所述的基于概率的多模型融合的银行网点选址推荐模型包括通过选取不同的特征数据集,使用不同的经典分类模型方法,构建多个不同的选址分类模型,利用多个不同选址分类模型的输出概率,构建基于概率的多模型融合的银行网点选址推荐模型。
5.根据权利要求4所述的基于多源数据驱动的银行网点选址推荐方法,其特征在于,所述的基于概率的多模型融合的银行网点选址推荐模型具体构建过程包括:
选取m个不同的分类模型作为第一层分类器;
对第一层分类器的各个分类模型均进行五折交叉验证,即将训练集进行五等分,选取其中一份的训练集以及完整的测试集作为预测,另外四份的训练集作为训练,并在每个分类模型中进行五次预测,得出每一份训练集各自的预测概率,以及五次预测中测试集预测出的概率;
将每份训练集各自的预测概率以及五次测试集预测出的概率进行平均,并将其平均值作为第一概率特征;基于逻辑回归构建第二层分类器,对各个分类模型的第一概率特征进行融合,从而形成基于概率的多模型融合的银行网点选址推荐模型。
6.根据权利要求5所述的基于多源数据驱动的银行网点选址推荐方法,其特征在于,所述第二层分类器的损失函数设计如下:
其中,l(θ)表示为第二层分类器的损失函数;hθ(xi)为第一概率特征中第i条训练集数据所得结果,xi为第一概率特征中第i条训练集所对应特征数据;yi为第一概率特征中第i条训练集所对应的真实标签值,pi为其真实标签对应输出概率。
7.根据权利要求1所述的基于多源数据驱动的银行网点选址推荐方法,其特征在于,所述的最佳银行网点选址分布为对候选地址的预测概率进行排序,设定阈值,低于该阈值的则不适合作为银行选址地点,选取排序前k个候选地点作为最终银行选址地点。
CN201910077769.6A 2019-01-28 2019-01-28 一种基于多源数据驱动的银行网点选址推荐方法 Active CN109657883B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910077769.6A CN109657883B (zh) 2019-01-28 2019-01-28 一种基于多源数据驱动的银行网点选址推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910077769.6A CN109657883B (zh) 2019-01-28 2019-01-28 一种基于多源数据驱动的银行网点选址推荐方法

Publications (2)

Publication Number Publication Date
CN109657883A true CN109657883A (zh) 2019-04-19
CN109657883B CN109657883B (zh) 2023-04-07

Family

ID=66121486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910077769.6A Active CN109657883B (zh) 2019-01-28 2019-01-28 一种基于多源数据驱动的银行网点选址推荐方法

Country Status (1)

Country Link
CN (1) CN109657883B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111150A (zh) * 2019-05-08 2019-08-09 拉扎斯网络科技(上海)有限公司 信息处理方法、装置、存储介质和电子设备
CN110378737A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 一种网点布局评估方法及装置
CN110428196A (zh) * 2019-06-26 2019-11-08 深圳市跨越新科技有限公司 针对物流网点选址的定量分析方法及***
CN110837930A (zh) * 2019-11-07 2020-02-25 腾讯科技(深圳)有限公司 一种选址方法、装置、设备及存储介质
CN111144935A (zh) * 2019-12-17 2020-05-12 武汉海云健康科技股份有限公司 基于大数据的睡眠会员唤醒方法及***、服务器及介质
CN111145452A (zh) * 2019-12-31 2020-05-12 中国银行股份有限公司 一种可取火车票自助存取款机选址方法及装置
CN111274341A (zh) * 2020-01-16 2020-06-12 中国建设银行股份有限公司 一种网点选址方法和装置
CN111598603A (zh) * 2020-03-03 2020-08-28 深圳前海微众银行股份有限公司 仓库选址方法、装置、设备及存储介质
CN111949834A (zh) * 2019-05-17 2020-11-17 上海树融数据科技有限公司 选址方法和选址平台
CN112150187A (zh) * 2020-06-24 2020-12-29 北京化工大学 一种考虑多种顾客选择规则的竞争设施选址方法
CN112541786A (zh) * 2020-12-11 2021-03-23 中信银行股份有限公司 一种网点选址方法、装置、电子设备和存储介质
CN112561322A (zh) * 2020-12-14 2021-03-26 广东电网有限责任公司珠海供电局 一种基于机器学习的充电桩选址方法
CN112580881A (zh) * 2020-12-23 2021-03-30 平安银行股份有限公司 营业网点选址方法、装置、计算机设备及存储介质
CN112990976A (zh) * 2021-03-29 2021-06-18 华南理工大学 基于开源数据挖掘的商业网点选址方法、***、设备及介质
CN113128773A (zh) * 2021-04-23 2021-07-16 中国工商银行股份有限公司 地址预测模型的训练方法、地址预测方法及装置
CN113379462A (zh) * 2021-06-29 2021-09-10 北京百度网讯科技有限公司 一种网点选址方法、装置、设备和存储介质
CN113449922A (zh) * 2021-07-09 2021-09-28 中国银行股份有限公司 银行网点选址方法及装置
CN113793171A (zh) * 2021-08-27 2021-12-14 浙江新再灵科技股份有限公司 基于多维数据的区域划分方法、装置、存储介质及设备
CN113988628A (zh) * 2021-10-28 2022-01-28 中国银行股份有限公司 一种atm机位置确定方法及***
CN114819756A (zh) * 2022-06-24 2022-07-29 深圳众城卓越科技有限公司 基于分类模型的风电机组智能选址方法、装置及设备

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030191683A1 (en) * 1997-06-12 2003-10-09 Bailey G. William Market determination system
US20090083128A1 (en) * 2007-09-24 2009-03-26 Introspective Solutions, Llc Predicted variable analysis based on evaluation variables relating to site selection
KR20140132795A (ko) * 2013-05-06 2014-11-19 서울시립대학교 산학협력단 도시형태결정요소 기반의 공간개발 패턴 추정 시스템 및 방법
CN105516928A (zh) * 2016-01-15 2016-04-20 中国联合网络通信有限公司广东省分公司 一种基于位置人群特征的位置推荐方法和***
US20160364669A1 (en) * 2015-06-12 2016-12-15 Sap Se Dynamic location recommendation for public service vehicles
CN106454729A (zh) * 2016-10-09 2017-02-22 广州杰赛科技股份有限公司 一种城市轨道交通站点选址规划方法和装置
CN106548367A (zh) * 2016-10-12 2017-03-29 电子科技大学 多源数据的选址模型及其应用研究
CN106651392A (zh) * 2016-12-07 2017-05-10 中国联合网络通信集团有限公司 一种智能商业选址方法、装置及***
CN107301221A (zh) * 2017-06-16 2017-10-27 华南理工大学 一种多特征维度堆融合的数据挖掘方法
CN107316098A (zh) * 2017-05-19 2017-11-03 芜湖恒天易开软件科技股份有限公司 一种基于用户行为分析的汽车租赁点选址方法
CN107909433A (zh) * 2017-11-14 2018-04-13 重庆邮电大学 一种基于大数据移动电子商务的商品推荐方法
CN109242552A (zh) * 2018-08-22 2019-01-18 重庆邮电大学 一种基于大数据的商铺定位方法
CN109255538A (zh) * 2018-09-12 2019-01-22 中国联合网络通信集团有限公司 银行网点选址的评估方法和***、服务器、存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030191683A1 (en) * 1997-06-12 2003-10-09 Bailey G. William Market determination system
US20090083128A1 (en) * 2007-09-24 2009-03-26 Introspective Solutions, Llc Predicted variable analysis based on evaluation variables relating to site selection
KR20140132795A (ko) * 2013-05-06 2014-11-19 서울시립대학교 산학협력단 도시형태결정요소 기반의 공간개발 패턴 추정 시스템 및 방법
US20160364669A1 (en) * 2015-06-12 2016-12-15 Sap Se Dynamic location recommendation for public service vehicles
CN105516928A (zh) * 2016-01-15 2016-04-20 中国联合网络通信有限公司广东省分公司 一种基于位置人群特征的位置推荐方法和***
CN106454729A (zh) * 2016-10-09 2017-02-22 广州杰赛科技股份有限公司 一种城市轨道交通站点选址规划方法和装置
CN106548367A (zh) * 2016-10-12 2017-03-29 电子科技大学 多源数据的选址模型及其应用研究
CN106651392A (zh) * 2016-12-07 2017-05-10 中国联合网络通信集团有限公司 一种智能商业选址方法、装置及***
CN107316098A (zh) * 2017-05-19 2017-11-03 芜湖恒天易开软件科技股份有限公司 一种基于用户行为分析的汽车租赁点选址方法
CN107301221A (zh) * 2017-06-16 2017-10-27 华南理工大学 一种多特征维度堆融合的数据挖掘方法
CN107909433A (zh) * 2017-11-14 2018-04-13 重庆邮电大学 一种基于大数据移动电子商务的商品推荐方法
CN109242552A (zh) * 2018-08-22 2019-01-18 重庆邮电大学 一种基于大数据的商铺定位方法
CN109255538A (zh) * 2018-09-12 2019-01-22 中国联合网络通信集团有限公司 银行网点选址的评估方法和***、服务器、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐峰: "银行网点选址因素实证研究——以杭州市为例", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111150A (zh) * 2019-05-08 2019-08-09 拉扎斯网络科技(上海)有限公司 信息处理方法、装置、存储介质和电子设备
CN111949834A (zh) * 2019-05-17 2020-11-17 上海树融数据科技有限公司 选址方法和选址平台
CN111949834B (zh) * 2019-05-17 2024-04-05 嘉兴树融数据科技有限公司 选址方法和选址平台***
CN110428196A (zh) * 2019-06-26 2019-11-08 深圳市跨越新科技有限公司 针对物流网点选址的定量分析方法及***
CN110428196B (zh) * 2019-06-26 2023-04-07 深圳市跨越新科技有限公司 针对物流网点选址的定量分析方法及***
CN110378737B (zh) * 2019-07-23 2022-04-05 中国工商银行股份有限公司 一种网点选址方法及装置
CN110378737A (zh) * 2019-07-23 2019-10-25 中国工商银行股份有限公司 一种网点布局评估方法及装置
CN110837930A (zh) * 2019-11-07 2020-02-25 腾讯科技(深圳)有限公司 一种选址方法、装置、设备及存储介质
CN110837930B (zh) * 2019-11-07 2023-09-19 腾讯科技(深圳)有限公司 一种选址方法、装置、设备及存储介质
CN111144935A (zh) * 2019-12-17 2020-05-12 武汉海云健康科技股份有限公司 基于大数据的睡眠会员唤醒方法及***、服务器及介质
CN111145452A (zh) * 2019-12-31 2020-05-12 中国银行股份有限公司 一种可取火车票自助存取款机选址方法及装置
CN111274341A (zh) * 2020-01-16 2020-06-12 中国建设银行股份有限公司 一种网点选址方法和装置
CN111598603A (zh) * 2020-03-03 2020-08-28 深圳前海微众银行股份有限公司 仓库选址方法、装置、设备及存储介质
CN112150187A (zh) * 2020-06-24 2020-12-29 北京化工大学 一种考虑多种顾客选择规则的竞争设施选址方法
CN112150187B (zh) * 2020-06-24 2023-04-07 北京化工大学 一种考虑多种顾客选择规则的竞争设施选址方法
CN112541786A (zh) * 2020-12-11 2021-03-23 中信银行股份有限公司 一种网点选址方法、装置、电子设备和存储介质
CN112561322A (zh) * 2020-12-14 2021-03-26 广东电网有限责任公司珠海供电局 一种基于机器学习的充电桩选址方法
CN112580881A (zh) * 2020-12-23 2021-03-30 平安银行股份有限公司 营业网点选址方法、装置、计算机设备及存储介质
CN112580881B (zh) * 2020-12-23 2024-06-25 平安银行股份有限公司 营业网点选址方法、装置、计算机设备及存储介质
CN112990976A (zh) * 2021-03-29 2021-06-18 华南理工大学 基于开源数据挖掘的商业网点选址方法、***、设备及介质
CN113128773B (zh) * 2021-04-23 2024-03-29 中国工商银行股份有限公司 地址预测模型的训练方法、地址预测方法及装置
CN113128773A (zh) * 2021-04-23 2021-07-16 中国工商银行股份有限公司 地址预测模型的训练方法、地址预测方法及装置
CN113379462A (zh) * 2021-06-29 2021-09-10 北京百度网讯科技有限公司 一种网点选址方法、装置、设备和存储介质
CN113449922A (zh) * 2021-07-09 2021-09-28 中国银行股份有限公司 银行网点选址方法及装置
CN113793171A (zh) * 2021-08-27 2021-12-14 浙江新再灵科技股份有限公司 基于多维数据的区域划分方法、装置、存储介质及设备
CN113793171B (zh) * 2021-08-27 2023-11-07 浙江新再灵科技股份有限公司 基于多维数据的区域划分方法、装置、存储介质及设备
CN113988628A (zh) * 2021-10-28 2022-01-28 中国银行股份有限公司 一种atm机位置确定方法及***
CN114819756A (zh) * 2022-06-24 2022-07-29 深圳众城卓越科技有限公司 基于分类模型的风电机组智能选址方法、装置及设备

Also Published As

Publication number Publication date
CN109657883B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN109657883A (zh) 一种基于多源数据驱动的银行网点选址推荐方法
CN109034448B (zh) 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法
Mostafaeipour et al. Prediction of air travel demand using a hybrid artificial neural network (ANN) with Bat and Firefly algorithms: a case study
Kuo et al. A decision support system for selecting convenience store location through integration of fuzzy AHP and artificial neural network
Casado-Díaz et al. An evolutionary approach to the delimitation of labour market areas: an empirical application for Chile
CN110276393A (zh) 一种绿色建筑能耗复合预测方法
Sánchez et al. Identifying critical hotel cancellations using artificial intelligence
Ghodousi et al. Analyzing public participant data to evaluate citizen satisfaction and to prioritize their needs via K-means, FCM and ICA
CN108491956A (zh) 一种经纪人离职预估***及方法
CN108876487A (zh) 一种基于大数据及智能决策机制的工业地块估计方法
Kuo et al. An intelligent sales forecasting system through integration of artificial neural network and fuzzy neural network
Dadashpour Moghaddam et al. A GIS-based assessment of urban tourism potential with a branding approach utilizing hybrid modeling
CN115545758A (zh) 城市服务设施自适应增量选址的方法和***
Jiang et al. Pedestrian volume prediction with high spatiotemporal granularity in urban areas by the enhanced learning model
Başar et al. Location analysis in banking: a new methodology and application for a Turkish bank
Jiang et al. Dynamic pricing analysis of redundant time of sports culture hall based on big data platform
Wang et al. Computer supported data-driven decisions for service personalization: a variable-scale clustering method
Geng et al. Evaluation of urban residential land use efficiency with a neural network from the perspective of service facility capacity
CN109948926A (zh) 一种基于规划期的高速公路混凝土桥梁养护技术评选方法
CN109859087A (zh) 一种应用城市超脑的智能社区软环境配置***和方法
Ustundag et al. A Hybrid Fuzzy Risk Evaluation Model For Real Estate Investments.
CN113869990A (zh) 基于时空表示学习模型的商铺租赁定价方法
Meng et al. Biogeography-based optimisation for road recovery problem considering value of delay after urban waterlog disaster
Borhani et al. Soft computing modelling of urban evolution: Tehran metropolis
Xu et al. Metro train operation plan analysis based on station travel time reliability

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant