CN113159934A - 一种网点客流量的预测方法、***、电子设备及存储介质 - Google Patents

一种网点客流量的预测方法、***、电子设备及存储介质 Download PDF

Info

Publication number
CN113159934A
CN113159934A CN202110581305.6A CN202110581305A CN113159934A CN 113159934 A CN113159934 A CN 113159934A CN 202110581305 A CN202110581305 A CN 202110581305A CN 113159934 A CN113159934 A CN 113159934A
Authority
CN
China
Prior art keywords
passenger flow
scene
network
data
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110581305.6A
Other languages
English (en)
Inventor
李变
陈永录
朱建强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110581305.6A priority Critical patent/CN113159934A/zh
Publication of CN113159934A publication Critical patent/CN113159934A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Accounting & Taxation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种网点客流量的预测方法、***、电子设备及存储介质,应用于金融科技领域或其它领域,包括:获取各网点的历史客流量数据和场景描述数据,并据此生成各网点的历史客流量特征和场景描述特征;根据历史客流量特征和场景描述特征生成场景识别模型;将历史客流量数据划分为训练集和测试集,生成至少一个客流量预测模型;根据场景识别模型和客流量预测模型对待预测网点的客流量进行预测,并将得到的客流量数据推送给待预测网点。本公开的方法可以自动地为不同银行营业网点选择不同的客流量预测模型。本公开还提供了一种网点客流量的预测***、电子设备及计算机可读存储介质。

Description

一种网点客流量的预测方法、***、电子设备及存储介质
技术领域
本公开涉及数据处理技术领域,具体涉及一种网点客流量的预测方法、***、电子设备及存储介质。
背景技术
银行营业网点是银行对外营业的重要地方,各大银行营业网点每天需要接待成千上百的客户。为了有效为客户提供高质量的服务,需要精准预测银行营业网点客流量,合理安排银行营业网点工作人员,实现银行营业网点工作人员与顾客的匹配,提高银行营业网点的运营效率、降低客户等待时间、提高客户的满意度。
传统的银行营业网点客流量预测,通常基于业务人员的经验以及对历史数据的简单统计,或者采用一般的时间序列预测算法,如指数平滑算法、ARIMA算法等。由于各个网点的客流量受所在地区的经济环境、周边人文环境、交通环境、天气环境、国家节假日、重大事件等影响,单一的时间序列预测算法难以适用于所有银行营业网点。因此,自动地为不同银行营业网点选择不同的时间序列预测算法就显得特别重要。
发明内容
(一)要解决的技术问题
针对上述问题,本公开提供了一种网点客流量的预测方法、***、电子设备及存储介质,用于至少部分解决传统单一的时间序列预测算法难以适用于所有银行营业网点等技术问题。
(二)技术方案
本公开一方面提供了一种网点客流量的预测方法,包括:获取各网点的历史客流量数据和场景描述数据,并据此生成各网点的历史客流量特征和场景描述特征;根据历史客流量特征和场景描述特征生成场景识别模型;将历史客流量数据划分为训练集和测试集,生成至少一个客流量预测模型;根据场景识别模型和客流量预测模型对待预测网点的客流量进行预测,并将得到的客流量数据推送给待预测网点。
进一步地,生成至少一个客流量预测模型还包括:根据场景识别模型得到不同的场景类别,并根据不同的场景类别确定与之对应的客流量预测模型。
进一步地,根据不同的场景类别确定与之对应的客流量预测模型包括:计算不同的场景类别对应的各个客流量预测模型的平均预测误差,根据平均预测误差的大小确定每个场景对应的客流量预测模型。
进一步地,根据场景识别模型和客流量预测模型对待预测网点的客流量进行预测包括:获取待预测网点的历史客流量数据和场景描述数据,并据此生成待预测网点的历史客流量特征和场景描述特征;将历史客流量特征、场景描述特征输入场景识别模型,确定场景类别;根据场景类别确定对应的客流量预测模型,根据该客流量预测模型对待预测网点的客流量进行预测。
进一步地,根据场景类别确定对应的客流量预测模型包括:根据场景类别,选取该场景类别对应的平均预测误差最小的客流量预测模型,并根据该平均预测误差最小的客流量预测模型对待预测网点客流量进行预测。
进一步地,客流量预测模型包括时间序列预测算法,时间序列预测算法包括线性回归算法、指数平滑算法、ARIMA算法、SARIMA算法、LSTM算法、随机游走算法。
进一步地,据此生成各网点的历史客流量特征和场景描述特征包括:根据各网点的历史客流量数据和场景描述数据生成统计特征数据,包括均值、中位数、标准差、25%分位数、75%分位数、最小值和最大值。
进一步地,根据历史客流量特征和场景描述特征生成场景识别模型包括:将历史客流量特征和场景描述特征进行聚类分析,通过聚类算法将各网点聚类成不同的场景类别,生成场景识别模型。
进一步地,聚类算法包括层次聚类算法。
本公开另一方面提供了一种网点客流量预测***,包括:第一获取模块,用于获取各网点的历史客流量数据和场景描述数据,并据此生成各网点的历史客流量特征和场景描述特征;场景识别模块,用于根据历史客流量特征和场景描述特征生成场景识别模型;训练模块,将历史客流量数据划分为训练集和测试集,生成至少一个客流量预测模型;推送模块,用于根据场景识别模型和客流量预测模型对待预测网点的客流量进行预测,并将预测的客流量数据推送给网点。
进一步地,该***还包括:第一确定模块,用于根据场景识别模型得到不同的场景类别,并根据不同的场景类别确定与之对应的客流量预测模型。
进一步地,该***还包括:计算模块,用于计算不同的场景类别对应的各个客流量预测模型的平均预测误差,根据平均预测误差的大小确定每个场景对应的客流量预测模型。
进一步地,该***还包括:第二获取模块,用于获取待预测网点的历史客流量数据和场景描述数据,并据此生成待预测网点的历史客流量特征和场景描述特征;第二确定模块,用于根据历史客流量特征、场景描述特征输入场景识别模型,确定场景类别;预测模块,用于根据场景类别确定对应的客流量预测模型,根据该客流量预测模型对待预测网点的客流量进行预测。
本公开还有一方面提供了一种电子设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,使得处理器执行如前述的网点客流量的预测方法。
本公开还有一方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如前述的网点客流量的预测方法。
(三)有益效果
本公开提供的一种网点客流量的预测方法、***、电子设备及存储介质,通过将银行营业网点划分到不同的场景中,针对不同的场景,为其选择最佳的客流量预测算法,可以为每一个银行营业网点提供最佳的时间序列预测算法,有效地降低了银行营业网点客流量的预测误差,进而提高了银行营业网点的运营效率、降低客户等待时间,提高了客户的满意度。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例网点客流量的预测方法的应用场景示意图;
图2示意性示出了根据本公开实施例网点客流量的预测方法的流程图;
图3示意性示出了根据本公开实施例主节点与子节点的交互过程图;
图4示意性示出了根据本公开实施例对待预测网点的客流量进行预测的流程图;
图5示意性示出了根据本公开一具体实施例网点客流量的预测方法的流程图;
图6示意性示出了根据本公开一实施例的客流量预测***的方框图;
图7示意性示出了根据本公开一实施例的客流量预测***的另一种方框图;
图8示意性示出了根据本公开一实施例的适于实现上文描述的方法的电子设备方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行***使用或者结合指令执行***使用。
本公开的实施例提供了一种网点客流量的预测方法、***、电子设备及存储介质,相比于单一的时间序列预测算法,可以为每一个银行营业网点选择最佳的时间序列预测算法,进而有效地降低银行营业网点客流量的预测误差,进而提高银行营业网点的运营效率、降低客户等待时间、提高客户的满意度。
图1示意性示出了根据本公开实施例的可以应用于网点客流量的预测方法的示例性***架构100。需要注意的是,图1所示仅为可以应用本公开实施例的***架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。
如图1所示,根据该实施例的***架构100可以包括终端设备101、网络102和服务器103。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户(如开发人员)可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如各软件编程***、网页浏览器应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器103可以是提供各种服务的服务器,例如对用户利用终端设备101所按照的应用程序提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等进行分析处理,并将处理结果(例如根据用户请求获取测试案例文件、信息或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的网点客流量的预测方法一般可以由服务器103执行。相应地,本公开实施例所提供的网点客流量预测***一般可以部署于服务器103中。本公开实施例所提供的网点客流量的预测方法也可以由不同于服务器103且能够与终端设备101和/或服务器103通信的服务器或服务器集群执行。相应地,本公开实施例所提供的用于网点客流量预测的***也可以设置于不同于服务器103且能够与终端设备101和/或服务器103通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的网点客流量的预测方法的流程图。
如图2所示,该网点客流量的预测方法包括:
在操作S1,获取各网点的历史客流量数据和场景描述数据,并据此生成各网点的历史客流量特征和场景描述特征。
首先,获取银行所有营业网点的历史客流量数据和银行营业网点的描述数据;对单个营业网点来说,影响客流量的因素有多种多样,影响客流量数据的因素可能包括时间、营业网点的工作条件、营业网点周围的环境等等,这些因素都会影响到未来的客流量。在其优选实施例中,银行营业网点的场景描述数据包含且不限于:营业网点所在的城市等级、营业网点所在的区县等级、营业网点所在街道(乡镇)等级、营业网点所在街道(乡镇)的常驻人口数、营业网点的面积、营业网点的窗口数、营业网点周围500米的公交站点数、营业网点周围1000米的地铁站点数。本公开的实施例通过获取历史客流量数据和场景描述数据,生成银行营业网点的特征数据,并基于这些数据的特征属性进行客流量的预测,可更好的提高预测的精准度。
在操作S2,根据历史客流量特征和场景描述特征生成场景识别模型。
作为示例,场景识别模型可以采用各种无监督学习算法,例如层级聚类算法。
在操作S3,将历史客流量数据划分为训练集和测试集,生成至少一个客流量预测模型。
将历史客流量数据分成训练集和测试集;将训练集输入客流量预测模型中训练模型;将测试集输入训练后的客流量预测模型中,输出预测结果,检测预测结果是否小于预期值,是则输出预测结果,否则更新参数重新执行测试集输入的步骤。
在操作S4,根据场景识别模型和客流量预测模型对待预测网点的客流量进行预测,并将得到的客流量数据推送给待预测网点。
先通过银行营业网点场景识别模型识别该银行营业网点的场景类别;再根据该场景类别确定对应的最佳客流量预测模型;根据该最佳客流量预测模型预测待预测营业网点未来的客流量,并将未来的客流量预测结果发送给该待预测营业网点。图3示意性示出了主节点与子节点的交互过程图,该网点客流量的预测方法通常包括1个主节点EN和与之通信的多个子节点N1-31、N2-32、N3-33、N4-34,主节点30可为主机,用于获取各个银行营业网点子节点的历史客流量数据和场景描述数据,得到场景识别模型和客流量预测模型之后再对单个待预测网点的客流量进行预测,并将客流量预测结果返回给相应子节点;子节点31、32、33、34也可为主机,用于获取主节点转发的客流量预测结果后,合理安排银行营业网点工作人员,实现银行营业网点工作人员与顾客的匹配,提高银行营业网点的运营效率。
在上述实施例的基础上,生成至少一个客流量预测模型还包括:根据场景识别模型得到不同的场景类别,并根据不同的场景类别确定与之对应的客流量预测模型。
场景识别模型的输出结果包括多种场景类别,这里根据不同的场景类别为其匹配最佳的客流量预测模型。
本公开通过将银行营业网点划分到不同的场景中,针对不同的场景,为其选择最佳的客流量预测模型,相比于传统的单一时间序列预测算法模型,可以有效地降低银行营业网点客流量的预测误差。
在上述实施例的基础上,根据不同的场景类别确定与之对应的客流量预测模型包括:计算不同的场景类别对应的各个客流量预测模型的平均预测误差,根据平均预测误差的大小确定每个场景对应的客流量预测模型。
通过计算每个营业网点场景中每种客流量预测模型的平均预测误差来选择最佳的客流量预测模型。平均预测误差,用于预测预测模型的输出结果相对于真实值偏大或偏小的平均程度。预测误差包括且不限于:均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分比误差(Mean AbsolutePercentage Error,MAPE)等。平均预测误差的具体计算方法不是本公开的重点,此处不再赘述。
图4示意性示出了根据本公开实施例对待预测网点的客流量进行预测的流程图。
S501,获取待预测网点的历史客流量数据和场景描述数据,并据此生成待预测网点的历史客流量特征和场景描述特征。
待场景识别模型和客流量预测模型确定之后,即可对单个待预测网点的客流量数据进行预测。首先,获取该银行营业网点的历史客流量数据和银行营业网点的描述数据。需要说明的是,单一网点的数据可以与全部网点的数据一样,也可以不一样。举个例子:假设全部网点的数据是2018年1月1日至2021年5月1日,然后基于这些数据训练出来了一个场景识别模型和预测模型;如果单一网点的历史数据是2018年1月1日至2021年5月1日,那么全部网点和单一网点的历史数据跨度是一样的;如果单一网点的历史数据从2019年1月1日至2021年5月1日,那么全部网点和单一网点的历史数据跨度是不一样的,数据也不同。
S502,将历史客流量特征、场景描述特征输入场景识别模型,确定场景类别。
根据待预测网点的历史客流量特征、场景描述特征得到对应的场景类别,具体地,根据银行营业网点的历史客流量特征、场景描述特征可以将每个营业网点分为A、B、C、D等类别,每个类别的网点具有相同或相似的特征数据。
S503,根据场景类别确定对应的客流量预测模型,根据该客流量预测模型对待预测网点的客流量进行预测。
确定场景类别后,则确定了相应的客流量预测模型,该客流量预测模型即为该场景下的最佳预测模型,对待预测网点的客流量进行预测,有利于提高银行营业网点的运营效率、提高客户的满意度。
在上述实施例的基础上,根据场景类别确定对应的客流量预测模型包括:根据场景类别,选取该场景类别对应的平均预测误差最小的客流量预测模型,并根据该平均预测误差最小的客流量预测模型对待预测网点客流量进行预测。
计算每个营业网点场景中每种客流量预测模型的平均预测误差,最终确定误差最小的客流量预测模型为与该场景对应的预测模型,由此,确定场景类别之后,即可确定与之对应的客流量预测模型,用该客流量预测模型预测待预测网点的客流量,有利于得到更加准确的客流量预测结果。
在上述实施例的基础上,客流量预测模型包括时间序列预测算法,时间序列预测算法包括线性回归算法、指数平滑算法、ARIMA算法、SARIMA算法、LSTM算法、随机游走算法。
时间序列数据算法的基本思路为:针对大量的时间序列数据,根据应用的目的,选择合适的挖掘方法,进而从已有的时间序列数据中挖掘其内在隐含的规则,然后再利用这些规则对时间序列数据未来的变化趋势进行预测或描述。其中,ARIMA算法模型极具弹性,融合了时间序列分析和回归分析的优点。客流量的发生是一个动态复杂***,具有不均匀性、差异性、多样性、突发性、随机性、可预测性和规律性等复杂性的特点,单一预测模型都是基于线性或非线性数据,不能同时捕捉其发生的线性和非线性规律,很难达到理想的预测精度。采用差分自回归移动平均模型(ARIMA)预测客流发生的历史数据,使其线性规律信息包含在ARIMA模型的预测结果中,这时非线性规律包含在残差序列中,有利于提高预测的客流量的精准度。
在上述实施例的基础上,据此生成各网点的历史客流量特征和场景描述特征包括:根据各网点的历史客流量数据和场景描述数据生成统计特征数据,包括均值、中位数、标准差、25%分位数、75%分位数、最小值和最大值。
网点的历史客流量,网点的地理位置,网点的规模也影响着该网点在未来呈现的人流量趋势,这一类数据属于网点的历史统计特征和场景描述特征。历史统计特征数据可以取均值、中位数等,可根据实际情况确定具体的方法。
在上述实施例的基础上,根据历史客流量特征和场景描述特征生成场景识别模型包括:将历史客流量特征和场景描述特征进行聚类分析,通过聚类算法将各网点聚类成不同的场景类别,生成场景识别模型。
历史客流量特征和场景描述特征作为聚类的数据基础,通过聚类算法将各网点聚类成不同的场景类别,从而根据场景识别模型确定待预测网点的场景类别。
在上述实施例的基础上,聚类算法包括层次聚类算法。
聚类分析算法作为一种非监督性的学习方法,被广泛地运用到各行各业的数据处理中,例如层级聚类算法、K-均值算法等。
本公开实施例的方法通过针对不同的场景,为其选择最佳的时间序列预测算法,有效地降低银行营业网点客流量的预测误差,进而提高银行营业网点的运营效率、降低客户等待时间、提高客户的满意度。
下面结合图5对本方法各步骤进行具体实施说明。
如图5所示,本公开提供的一种银行营业网点客流量的预测方法,包括以下步骤:
第1步:获取银行所有营业网点的历史客流量数据和银行营业网点的描述数据;
在其优选实施例中,银行营业网点的描述数据包含且不限于:营业网点所在的城市等级、营业网点所在的区县等级、营业网点所在街道(乡镇)等级、营业网点所在街道(乡镇)的常驻人口数、营业网点的面积、营业网点的窗口数、营业网点周围500米的公交站点数、营业网点周围1000米的地铁站点数。
第2步:根据银行营业网点的描述数据和历史客流量数据生成银行营业网点的特征数据;
在其优选实施例中,根据历史客流量数据生成统计特征,包含且不限于:均值、中位数、标准差、25%分位数、75%分位数、最小值和最大值等;相当于前述步骤S1。
第3步:将所有营业网点的特征数据进行聚类分析,生成银行营业网点场景识别模型;
在其优选实施例中,聚类算法采用层次聚类算法。
在其优选实施例中,通过聚类算法将银行营业网点聚类成不同的场景类别;相当于前述步骤S2。
第4步:将银行营业网点的历史客流量数据划分成训练集和测试集,利用训练集和测试集对每个场景下的时间序列预测算法进行评估,确定场景对应的最佳时间序列预测模型。
在其优选实施例中,时间序列预测算法包括且不限于:线性回归算法、指数平滑算法、ARIMA算法、SARIMA算法、LATM算法、随机游走算法等。
在其优选实施例中,将每一个银行营业网点的历史时间序列拆分成训练集和测试集。
在其优选实施例中,对于每个营业网点,用训练集训练时间序列预测算法,并预测测试集对应时间点的客流量。
在其优选实施例中,通过计算每个营业网点场景中每种预测算法的平均预测误差来选择最佳的时间序列预测算法。
在其优选实施例中,预测误差包括且不限于:均方根误差、平均绝对误差、平均绝对百分比误差等;相当于前述步骤S3。
第5步:对于任何一个银行营业网点的历史客流量数据、银行营业网点的描述数据、银行营业网点场景识别模型和银行营业网点的时间序列预测模型预测银行营业网点未来的客流量。
5.1.对于每一个银行营业网点,获取该银行营业网点的历史客流量数据和银行营业网点的描述数据;
5.2.银行营业网点的描述数据和历史客流量数据生成银行营业网点的特征数据;
5.3.使用第三步生成的银行营业网点场景识别模型识别该银行营业网点的场景类别;
5.4.使用第四步生成的每个场景对应的最佳时间序列预测模型确定该银行营业网点的预测算法模型;
5.5.根据历史客流量数据和预测算法模型,预测生成银行营业网点未来的客流量;相当于前述步骤S4。
需要说明的是,单一的时间序列预测算法是所有网点都用一种算法;而本申请是不同网点用不同的预测算法。假设有2000个网点,单一时间预测算法都用算法A;本申请中可能有500个网点用算法A,有500个网点用算法B,……。另外,在第1步至第4步中,利用全部营业网点生产两个模型:场景识别模型和每个场景的预测模型;接着第5步,对于任意一个营业网点,先用场景识别模型识别出该营业网点的场景类别,根据该类别选择对应的预测模型,然后用这个预测模型预测该营业网点的的未来客流量。
图6示意性示出了根据本公开一实施例的网点客流量预测***的方框图。
如图6所示,该客流量预测***600包括:第一获取模块610、场景识别模块620、训练模块630、推送模块640。
第一获取模块610,用于获取各网点的历史客流量数据和场景描述数据,并据此生成各网点的历史客流量特征和场景描述特征;根据本公开的实施例,该第一获取模块610例如可以用于执行上文参考图2所描述的S1步骤,在此不再赘述。
场景识别模块620,用于根据历史客流量特征和场景描述特征生成场景识别模型;根据本公开的实施例,该场景识别模块620例如可以用于执行上文参考图2所描述的S2步骤。
训练模块630,将历史客流量数据划分为训练集和测试集,生成至少一个客流量预测模型;根据本公开的实施例,该训练模块630例如可以用于执行上文参考图2所描述的S3步骤。
推送模块640,用于根据场景识别模型和客流量预测模型对待预测网点的客流量进行预测,并将预测的客流量数据推送给网点。根据本公开的实施例,该推送模块640例如可以用于执行上文参考图2所描述的S4步骤。
如图7所示,该网点客流量预测***600还包括:第一确定模块650、计算模块660、第二获取模块670、第二确定模块680、预测模块690。
第一确定模块650,用于根据场景识别模型得到不同的场景类别,并根据不同的场景类别确定与之对应的客流量预测模型;根据本公开的实施例,该第一确定模块650例如可以用于执行上文所描述的根据不同的场景类别确定与之对应的客流量预测模型的步骤,在此不再赘述。
计算模块660,用于计算不同的场景类别对应的各个客流量预测模型的平均预测误差,根据平均预测误差的大小确定每个场景对应的客流量预测模型。根据本公开的实施例,该计算模块660例如可以用于执行上文所描述的计算各个客流量预测模型的平均预测误差的步骤,在此不再赘述。
第二获取模块670,用于获取待预测网点的历史客流量数据和场景描述数据,并据此生成待预测网点的历史客流量特征和场景描述特征。根据本公开的实施例,该第二获取模块670例如可以用于执行上文参考图4所描述的S501步骤。
第二确定模块680,用于根据历史客流量特征、场景描述特征输入场景识别模型,确定场景类别。根据本公开的实施例,该第二确定模块680例如可以用于执行上文参考图4所描述的S502步骤。
预测模块690,用于根据场景类别确定对应的客流量预测模型,根据该客流量预测模型对待预测网点的客流量进行预测。根据本公开的实施例,该预测模块690例如可以用于执行上文参考图4所描述的S503步骤。
需说明的是,根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块610、场景识别模块620、训练模块630、推送模块640、第一确定模块650、计算模块660、第二获取模块670、第二确定模块680、预测模块690中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获取模块610、场景识别模块620、训练模块630、推送模块640、第一确定模块650、计算模块660、第二获取模块670、第二确定模块680、预测模块690中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块610、场景识别模块620、训练模块630、推送模块640、第一确定模块650、计算模块660、第二获取模块670、第二确定模块680、预测模块690中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
本公开提供的一种网点客流量预测***及方法,可用于金融领域或其他领域,需说明的是,本公开提供的一种网点客流量预测***及方法可用于金融领域,例如金融领域中银行各业务网点的客流量预测,也可用于除金融领域之外的任意领域,本公开提供的一种网点客流量预测***及方法的应用领域不作限定。
图8示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的方框图。图8示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,本实施例中所描述的电子设备800,包括:处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 803中,存储有***800操作所需的各种程序和数据。处理器801、ROM 802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。***800还可以包括连接至I/O接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的网点客流量预测方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM802和RAM 803以外的一个或多个存储器。
需要说明的是,在本公开各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (15)

1.一种网点客流量的预测方法,其特征在于,包括:
获取各网点的历史客流量数据和场景描述数据,并据此生成所述各网点的历史客流量特征和场景描述特征;
根据所述历史客流量特征和场景描述特征生成场景识别模型;
将所述历史客流量数据划分为训练集和测试集,生成至少一个客流量预测模型;
根据所述场景识别模型和客流量预测模型对待预测网点的客流量进行预测,并将得到的客流量数据推送给所述待预测网点。
2.根据权利要求1所述的网点客流量的预测方法,其特征在于,所述生成至少一个客流量预测模型还包括:
根据所述场景识别模型得到不同的场景类别,并根据不同的场景类别确定与之对应的客流量预测模型。
3.根据权利要求2所述的网点客流量的预测方法,其特征在于,所述根据不同的场景类别确定与之对应的客流量预测模型包括:
计算不同的场景类别对应的各个客流量预测模型的平均预测误差,根据所述平均预测误差的大小确定每个场景对应的客流量预测模型。
4.根据权利要求1所述的网点客流量的预测方法,其特征在于,所述根据所述场景识别模型和客流量预测模型对待预测网点的客流量进行预测包括:
获取所述待预测网点的历史客流量数据和场景描述数据,并据此生成所述待预测网点的历史客流量特征和场景描述特征;
将所述历史客流量特征、场景描述特征输入场景识别模型,确定场景类别;
根据所述场景类别确定对应的客流量预测模型,根据该客流量预测模型对待预测网点的客流量进行预测。
5.根据权利要求4所述的网点客流量的预测方法,其特征在于,所述根据所述场景类别确定对应的客流量预测模型包括:
根据所述场景类别,选取该场景类别对应的平均预测误差最小的客流量预测模型,并根据该平均预测误差最小的客流量预测模型对待预测网点客流量进行预测。
6.根据权利要求1所述的网点客流量的预测方法,其特征在于,所述客流量预测模型包括时间序列预测算法,所述时间序列预测算法包括线性回归算法、指数平滑算法、ARIMA算法、SARIMA算法、LSTM算法、随机游走算法。
7.根据权利要求1所述的网点客流量的预测方法,其特征在于,所述据此生成所述各网点的历史客流量特征和场景描述特征包括:
根据各网点的历史客流量数据和场景描述数据生成统计特征数据,包括均值、中位数、标准差、25%分位数、75%分位数、最小值和最大值。
8.根据权利要求7所述的网点客流量的预测方法,其特征在于,所述根据所述历史客流量特征和场景描述特征生成场景识别模型包括:
将所述历史客流量特征和场景描述特征进行聚类分析,通过聚类算法将各网点聚类成不同的场景类别,生成场景识别模型。
9.根据权利要求8所述的网点客流量的预测方法,其特征在于,所述聚类算法包括层次聚类算法。
10.一种网点客流量的预测***,其特征在于,包括:
第一获取模块,用于获取各网点的历史客流量数据和场景描述数据,并据此生成所述各网点的历史客流量特征和场景描述特征;
场景识别模块,用于根据所述历史客流量特征和场景描述特征生成场景识别模型;
训练模块,将所述历史客流量数据划分为训练集和测试集,生成至少一个客流量预测模型;
推送模块,用于根据所述场景识别模型和客流量预测模型对待预测网点的客流量进行预测,并将预测的客流量数据推送给网点。
11.根据权利要求10所述的网点客流量的预测***,其特征在于,还包括:
第一确定模块,用于根据所述场景识别模型得到不同的场景类别,并根据不同的场景类别确定与之对应的客流量预测模型。
12.根据权利要求11所述的网点客流量的预测***,其特征在于,还包括:
计算模块,用于计算不同的场景类别对应的各个客流量预测模型的平均预测误差,根据所述平均预测误差的大小确定每个场景对应的客流量预测模型。
13.根据权利要求10所述的网点客流量的预测***,其特征在于,还包括:
第二获取模块,用于获取所述待预测网点的历史客流量数据和场景描述数据,并据此生成所述待预测网点的历史客流量特征和场景描述特征;
第二确定模块,用于根据所述历史客流量特征、场景描述特征输入场景识别模型,确定场景类别;
预测模块,用于根据所述场景类别确定对应的客流量预测模型,根据该客流量预测模型对待预测网点的客流量进行预测。
14.一种电子设备,包括:
处理器;
存储器,其存储有计算机可执行程序,该程序在被所述处理器执行时,使得所述处理器执行如权利要求1~9中任意一项所述的网点客流量的预测方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~9中任意一项所述的网点客流量的预测方法。
CN202110581305.6A 2021-05-26 2021-05-26 一种网点客流量的预测方法、***、电子设备及存储介质 Pending CN113159934A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110581305.6A CN113159934A (zh) 2021-05-26 2021-05-26 一种网点客流量的预测方法、***、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110581305.6A CN113159934A (zh) 2021-05-26 2021-05-26 一种网点客流量的预测方法、***、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113159934A true CN113159934A (zh) 2021-07-23

Family

ID=76877699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110581305.6A Pending CN113159934A (zh) 2021-05-26 2021-05-26 一种网点客流量的预测方法、***、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113159934A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723716A (zh) * 2021-11-02 2021-11-30 深圳市城市交通规划设计研究中心股份有限公司 一种客流分级预警异常告警方法、设备及存储介质
CN113888060A (zh) * 2021-11-24 2022-01-04 中国工商银行股份有限公司 用于确定网点运营策略的方法、装置、电子设备和介质
WO2024041325A1 (zh) * 2022-08-24 2024-02-29 华为云计算技术有限公司 时序数据分析方法、装置、计算设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443657A (zh) * 2019-08-19 2019-11-12 泰康保险集团股份有限公司 客户流量数据处理方法、装置、电子设备及可读介质
CN110633401A (zh) * 2019-07-26 2019-12-31 苏宁云计算有限公司 一种门店数据的预测模型及其建立方法
CN111091196A (zh) * 2019-11-15 2020-05-01 佳都新太科技股份有限公司 客流数据确定方法、装置、计算机设备和存储介质
CN111353620A (zh) * 2018-12-20 2020-06-30 顺丰科技有限公司 构建网点件量预测模型的方法、装置、设备及存储介质
CN111353828A (zh) * 2020-03-30 2020-06-30 中国工商银行股份有限公司 网点到店人数预测方法及装置
CN111709566A (zh) * 2020-06-09 2020-09-25 信雅达***工程股份有限公司 一种银行网点业务预测及调度方法
CN112819258A (zh) * 2021-03-24 2021-05-18 中国工商银行股份有限公司 银行网点到店客户数量预测方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353620A (zh) * 2018-12-20 2020-06-30 顺丰科技有限公司 构建网点件量预测模型的方法、装置、设备及存储介质
CN110633401A (zh) * 2019-07-26 2019-12-31 苏宁云计算有限公司 一种门店数据的预测模型及其建立方法
CN110443657A (zh) * 2019-08-19 2019-11-12 泰康保险集团股份有限公司 客户流量数据处理方法、装置、电子设备及可读介质
CN111091196A (zh) * 2019-11-15 2020-05-01 佳都新太科技股份有限公司 客流数据确定方法、装置、计算机设备和存储介质
CN111353828A (zh) * 2020-03-30 2020-06-30 中国工商银行股份有限公司 网点到店人数预测方法及装置
CN111709566A (zh) * 2020-06-09 2020-09-25 信雅达***工程股份有限公司 一种银行网点业务预测及调度方法
CN112819258A (zh) * 2021-03-24 2021-05-18 中国工商银行股份有限公司 银行网点到店客户数量预测方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723716A (zh) * 2021-11-02 2021-11-30 深圳市城市交通规划设计研究中心股份有限公司 一种客流分级预警异常告警方法、设备及存储介质
CN113888060A (zh) * 2021-11-24 2022-01-04 中国工商银行股份有限公司 用于确定网点运营策略的方法、装置、电子设备和介质
WO2024041325A1 (zh) * 2022-08-24 2024-02-29 华为云计算技术有限公司 时序数据分析方法、装置、计算设备及存储介质

Similar Documents

Publication Publication Date Title
US11386496B2 (en) Generative network based probabilistic portfolio management
US11107166B2 (en) Multi-step day sales outstanding forecasting
US10755196B2 (en) Determining retraining of predictive models
CN113159934A (zh) 一种网点客流量的预测方法、***、电子设备及存储介质
JP2023531100A (ja) エンティティがターゲットパラメータを充足しない確率を計算するための機械学習モデルアンサンブル
US11271957B2 (en) Contextual anomaly detection across assets
CN110717597A (zh) 利用机器学习模型获取时序特征的方法和装置
CN112070310A (zh) 基于人工智能的流失用户预测方法、装置及电子设备
CN114462532A (zh) 模型训练方法、预测交易风险的方法、装置、设备及介质
CN113051183A (zh) 一种测试数据的推荐方法、***、电子设备及存储介质
CN114638695A (zh) 信用评估方法、装置、设备及介质
CN113409090A (zh) 广告点击率预测模型的训练方法、预测方法及装置
CN115237804A (zh) 性能瓶颈的评估方法、装置、电子设备、介质和程序产品
CN115062163A (zh) 异常组织的识别方法、装置、电子设备和介质
CN113128773B (zh) 地址预测模型的训练方法、地址预测方法及装置
CN113191681A (zh) 网点选址方法、装置、电子设备及可读存储介质
US10824777B2 (en) Employing natural language processing to facilitate geospatial analysis
CN115795345A (zh) 信息处理方法、装置、设备及存储介质
CN115719270A (zh) 信用评价方法、装置、设备、介质和程序产品
CN115760013A (zh) 运维模型的构建方法、装置、电子设备及存储介质
US20180130077A1 (en) Automated selection and processing of financial models
CN115545088A (zh) 模型构建方法、分类方法、装置和电子设备
CN113391988A (zh) 流失用户留存的方法、装置、电子设备及存储介质
CN113344369A (zh) 画像数据的归因方法、装置、电子设备及存储介质
CN111767290A (zh) 用于更新用户画像的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination