CN111506876A - 一种数据预测分析方法、***、设备及可读存储介质 - Google Patents

一种数据预测分析方法、***、设备及可读存储介质 Download PDF

Info

Publication number
CN111506876A
CN111506876A CN202010256491.1A CN202010256491A CN111506876A CN 111506876 A CN111506876 A CN 111506876A CN 202010256491 A CN202010256491 A CN 202010256491A CN 111506876 A CN111506876 A CN 111506876A
Authority
CN
China
Prior art keywords
prediction
data
accumulation fund
public
month
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010256491.1A
Other languages
English (en)
Other versions
CN111506876B (zh
Inventor
曲大伟
汪震
丁志强
王宏栋
史宜轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Digital Cloud Technology Co ltd
Original Assignee
Shenyang Digital Cloud Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Digital Cloud Technology Co ltd filed Critical Shenyang Digital Cloud Technology Co ltd
Priority to CN202010256491.1A priority Critical patent/CN111506876B/zh
Publication of CN111506876A publication Critical patent/CN111506876A/zh
Application granted granted Critical
Publication of CN111506876B publication Critical patent/CN111506876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请实施例公开了一种数据预测分析方法、***、设备及可读存储介质,其中所述方法包括:接收客户端发送的公积金数据预测请求;根据公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;基于目标公积金数据预测模型,对公积金数据预测类型和公积金数据预测时间进行数据预测分析;将预测分析结果发送至所述客户端。提供了更加精确的公积金数据预测。

Description

一种数据预测分析方法、***、设备及可读存储介质
技术领域
本申请实施例涉及数据分析技术领域,具体涉及一种数据预测分析方法、 ***、设备及可读存储介质。
背景技术
住房公积金,是指国家机关、国有企业、城镇集体企业、外商投资企业、 城镇私营企业及其他城镇企业、事业单位、民办非企业单位、社会团体及其在 职职工缴存的长期住房储金。住房公积金制度是我国一种住房保障制度,是住 房分配货币化的一种形式,这项制度已经给广大中低收入家庭带来了利益。伴 随着时代的发展,公积金制度也在逐步完善。住房和城乡***正在联合各个 部门,研究修订公积金条例工作中,放开个人提取公积金用于支付住房租金的 规定。
目前,公积金资金的沉淀是很大的浪费。为了有效利用公积金,对公积金 进行科学管理、引进计算机技术、对公积金的汇缴、贷款回收、公积金提取进 行科学预测,结合现有的公积金数据,开发一套公积金数据预测分析***,通 过对数据的预测分析,对制定公积金政策、提高公积金的有效利用率、促进我 国房地产的健康发展起到积极的作用。
发明内容
为此,本申请实施例提供一种数据预测分析方法、***、设备及可读存储 介质,提供了更加精确的公积金数据预测。
为了实现上述目的,本申请实施例提供如下技术方案:
根据本申请实施例的第一方面,提供了一种数据预测分析方法,所述方法 包括:
接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公 积金数据预测类型和公积金数据预测时间;
根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对 应的建模基础数据;
根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;
根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确 定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据 的规律更换预测模型,再进行精度校验,直到达到精度要求;
基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金 数据预测时间进行数据预测分析;
将预测分析结果发送至所述客户端。
可选地,所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款 回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预 测。
可选地,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的 预测模型,包括:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴 金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方 程,得到季度预测值;
将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中 所占比值,得到月占比;
将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测 值。
可选地,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的 预测模型,包括:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中 的相同季度的公积金贷款回收金额取对数;
将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;
将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所 需预测季度或者月份的公积金贷款回收金额的预测模型。
可选地,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的 预测模型,包括:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数 据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始 月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初 始值S13,以所述第N+1年一季度与所述第N年一季度差值的
Figure BDA0002437535180000031
作为趋势平滑 值bt的初始值b13,按照如下公式进行所述第N+1年的下一月份的公积金支取 总量
Figure BDA0002437535180000032
的预测:
Figure BDA0002437535180000033
bt=γ(St-St-1)+(1-γ)bt-1
Figure BDA0002437535180000034
Figure BDA0002437535180000035
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
根据本申请实施例的第二方面,提供了一种数据预测分析***,所述*** 包括:
消息接收模块,用于接收客户端发送的公积金数据预测请求,所述公积金 数据预测请求携带公积金数据预测类型和公积金数据预测时间;
数据调取模块,用于根据所述公积金数据预测类型和公积金数据预测时间 从数据库中调取对应的建模基础数据;
预测模型匹配模块,用于根据所述建模基础数据匹配所述公积金数据预测 类型对应的预测模型;
精度校验模块,用于根据所述预测模型进行精度校验,若达到精度要求, 则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根 据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要 求;
预测分析模块,用于基于所述目标公积金数据预测模型,对所述公积金数 据预测类型和公积金数据预测时间进行数据预测分析;
消息发送模块,用于将预测分析结果发送至所述客户端。
可选地,所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款 回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预 测。
可选地,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴 金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方 程,得到季度预测值;
将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中 所占比值,得到月占比;
将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测 值。
可选地,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中 的相同季度的公积金贷款回收金额取对数;
将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;
将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所 需预测季度或者月份的公积金贷款回收金额的预测模型。
可选地,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数 据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始 月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初 始值S13,以所述第N+1年一季度与所述第N年一季度差值的
Figure BDA0002437535180000051
作为趋势平滑 值bt的初始值b13,按照如下公式进行所述第N+1年的下一月份的公积金支取 总量
Figure BDA0002437535180000052
的预测:
Figure BDA0002437535180000053
bt=γ(St-St-1)+(1-γ)bt-1
Figure BDA0002437535180000054
Figure BDA0002437535180000055
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
根据本申请实施例的第三方面,提供了一种数据预测分析设备,所述设备 包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指 令;所述处理器,用于执行一个或多个程序指令,用以执行上述第一方面任一 项所述的方法。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,所述计 算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行 如上述第一方面任一项所述的方法。
综上所述,本申请实施例提供了一种数据预测分析方法、***、设备及可 读存储介质,通过接收客户端发送的公积金数据预测请求,所述公积金数据预 测请求携带公积金数据预测类型和公积金数据预测时间;根据所述公积金数据 预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;根据所 述建模基础数据匹配所述公积金数据预测类型对应的预测模型;根据所述预测 模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数 据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模 型,再进行精度校验,直到达到精度要求;基于所述目标公积金数据预测模型, 对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;将预测分析结果发送至所述客户端。提供了更加精确的公积金数据预测。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对 实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下 面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创 造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内 容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条 件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调 整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明 所揭示的技术内容能涵盖的范围内。
图1为本申请实施例提供的一种数据预测分析流程示意图;
图2为本申请实施例提供的***架构示意图;
图3为本申请实施例提供的功能结构示意图;
图4为本申请实施例提供的模块内功能结构示意图;
图5为本申请实施例提供的公积金数据预测分析流程图;
图6a、图6b、图6c、图6d、图6e和图6f为本申请实施例提供的公积金 汇缴的预测实施例示意图;
图7a、图7b、图7c和图7d为本申请实施例提供的公积金贷款回收预测 实施例示意图;
图8a和图8b为本申请实施例提供的公积金支取总量的预测实施例示意 图;
图9为本申请实施例提供的一种数据预测分析***框图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由 本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的 实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。
为了实现对公积金资金数据进行科学管理,有效利用住房公积金改善广大 居民的住房条件,并且为了对公积金政策的制定提供有力依据,本申请实施例 提供的数据预测分析方法对住房公积金资金历史数据进行分析建模,并结合公 积金业务发展和政策取向建立中短期业务模拟演变数学模型。该数学模型需具 备实现虚拟与现实相结合的不断实践和不断优化的技术能力,具有收敛逼近未 来的中短期真实数据的功能,能够为公积金中短期事业发展提供辅助决策的有 力支持。本申请实施例提供的数学模型比依据同比、环比分析预测方法相比较, 速度更快,精度更高,自适应能力更强。对公积金行业相关政策的制定具有较 强的辅助指导作用。
经分析发现,公积金管理中心提供的公积金缴存、回收、提取等数据,在 平稳时期具有一定规律性,在国家、地方出台相关政策法规后,数据对政策法 规有较为灵敏的反应,所以,公积金管理中心的各项数据真实可靠,可以对其 进行分析预测。通过对历史海量数据的统计分析,得出研究对象的一般统计规 律,为以后的建模预测提供必要的准备。
进一步,确定预测所需的最小数据量。具体地需要通过大量试验得到。
接下来,针对不同类型的数据,建立相应的数学模型:对统计规律较强的 数据,根据设计原则,在保证预测精度的前提下,选择易于编程实现的模型; 对统计规律不强、随机性较大的数据,将其分解为平稳的、趋势的、季节性的 三个部分来建立模型,设置相应参数来实现平滑随机性、修正趋势性、处理季 节性。同时,设置其他参数来体现政策法规对公积金各项数据的影响。
最后,模型的检验。在应用上述建立的模型进行预测之前,先对模型进行 检验。举例来说,需要预测第n个数据,先用前n-2个数据预测出第n-1个数 据,用第n-1个数据的真实值来进行检验,如果误差在允许范围内,则加入第 n-1个数据进行预测。否则,需要对公式进行修正,根据计算结果调整参数, 达到精度才进行下一步预测,直至找到合适的参数,确定最终的模型。
本申请实施例提供的数据预测分析方法及***,可应用于公积金数据预测 分析领域。通过历史数据和分析的设计的模型,对未来一段时间产生的数据进 行预测性计算,再通过月份已发生的真实数据来计算检验模型误差。公积金数 据预测分析***具有公积金汇缴预测、公积金回收预测、公积金支取预测、新 增贷款人数预测、公积金数据运营情况分析等功能。
公积金行业的公积金汇缴、支取、回收等数据具有较强的时序性,均可以 视为时间序列,都可以建立相应的时间序列模型来进行分析和预测。但由于公 积金汇缴、支取、回收等数据时间序列的发展变化基本规律不同,所以需要依 据其自身特点建立不同的数学模型,才能准确地对其进行分析预测。对于规律 性较强的数据,可使用时间序列平滑法或趋势外推法对其进行分析预测;对于 有一定规律性,又有随机因素在内的数据,可以将其分解为趋势项、季节项、 随机项分别加以分析处理再进行预测;对更复杂的数据,可以将上述方法结合 起来进行分析预测。
图1示出了本申请实施例提供的数据预测分析方法,具体可以包括如下步 骤:
步骤101:接收客户端发送的公积金数据预测请求,所述公积金数据预测 请求携带公积金数据预测类型和公积金数据预测时间。
步骤102:根据所述公积金数据预测类型和公积金数据预测时间从数据库 中调取对应的建模基础数据。
步骤103:根据所述建模基础数据匹配所述公积金数据预测类型对应的预 测模型。
步骤104:根据所述预测模型进行精度校验,若达到精度要求,则将所述 预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建 模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求。
步骤105:基于所述目标公积金数据预测模型,对所述公积金数据预测类 型和公积金数据预测时间进行数据预测分析。
步骤106:将预测分析结果发送至所述客户端。
在一种可能的实施方式中,所述公积金数据预测类型包括公积金汇缴金额 预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测 和新增贷款人数预测。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为 公积金汇缴金额预测,具体可以包括如下步骤:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴 金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方 程,得到季度预测值;将所述公积金汇缴金额历史数据按照月度汇总,计算每 月在其所属季度中所占比值,得到月占比;将所述季度预测值乘以所述月占比, 得到所述公积金汇缴金额的每月预测值。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为 公积金贷款回收金额预测,具体可以包括如下步骤:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中 的相同季度的公积金贷款回收金额取对数;将所述取对数之后的结果进行最小 二乘法拟合,确定预测直线方程;将所述预测直线方程还原为指数方程,将所 述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的 预测模型。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为 公积金支取总量预测,具体可以包括如下步骤:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数 据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始 月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初 始值S13,以所述第N+1年一季度与所述第N年一季度差值的
Figure BDA0002437535180000101
作为趋势平滑 值bt的初始值b13,按照如下公式(1)、(2)、(3)、(4)进行所述第N+1年的 下一月份的公积金支取总量
Figure BDA0002437535180000102
的预测:
Figure BDA0002437535180000103
bt=γ(St-St-1)+(1-γ)bt-1……公式(2)
Figure BDA0002437535180000104
Figure BDA0002437535180000105
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为 公积金分项支取预测,具体可以包括如下步骤:
预测方法还是以温特斯季节预测法为主,再辅以其他预测模型。针对公积 金贷款支取,以参数设置为α=0.3,β=0.8,γ=0.025的温特斯季节预测法为主,再 辅以最小二乘直线拟合及对数差分,构成组合预测模型。
针对自有资金购房支取,以参数设置为α=0.6,β=0.9,γ=0.06的温特斯季节预测法为主,再辅以最小二乘直线拟合及隔月环比法,构成组合预测模型。
针对纯商贷支取,以参数设置为α=0.3,β=0.95,γ=0.04的温特斯季节预测法为主,再辅以最小二乘直线拟合法,构成组合预测模型。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为 新增贷款人数预测,具体可以包括如下步骤:
利用对数差分模型和加权平均模型,组合成新增贷款人数模型。
先对几年中每年前三月的新增贷款人数进行对数差分,去掉异常数据,所 述异常数据为绝对值大于等于0.9的对数差分值。然后用剩余4个数的平均值 作为第N年前三月对数差分的预测值,再换算成该月的新增贷款人数预测值。
若所述几年中4到10月新增贷款人数极不规律,即使采用对数差分也无 规律性可言,所以必须建立另一个模型来预测其申请人数。此处采用加权平均 为主的预测方法:首先对要预测月份的历史数据进行排序,目的是去掉异常数 据(如果最大值和次最大值的差大于等于150,则去掉最大值,否则所有该月 的历史数据都为有效数据)。考虑到政策调整因素,再加入政策调整因子即可 对4到10月新增贷款人数进行预测。
在公积金数据预测分析中,可能存在以下几种预测类型。
第一,中短期公积金缴存资金预测:
(1)中短期单位缴存公积金的资金测算模型:实现模拟出未来6个月的 单位公积金缴存发生资金。(2)中短期个人补缴的资金测算模型:实现模拟未 来6个月的个人补缴发生资金。(3)中短期个人转入的资金测算模型:实现模 拟未来6个月个人转入发生金额。(4)中短期公积金总体缴存测算模型:实现 模拟未来6个月公积金缴存总体发生资金。(5)政策对公积金缴存资金的扰动: 缴存比例调整的影响;缴存基数上线调整的影响;用工体制的影响;退休年龄 调整的影响。
第二,中短期公积金贷款回收本金和利息预测:
(1)存量公积金贷款回收资金:计算存量公积金贷款未来6个月的本金 回收和利息回收资金。(2)建立增量公积金贷款的资金回收模型:对未来6 个月的新增贷款人建立需求模型,模拟测算这类新增人群的贷款需求情况,测 算实际新增贷款人群的贷款本金回收和利息。
第三,公积金支取预测:
(1)中短期公积金提取总量的测算。(2)中短期公积金提取原因分类测 算:主要是公积金贷款支取、自有资金购房支取、纯商贷支取的预测。
图2示出了本申请实施例提供的***架构示意图;***采用B/S结构, 布置在服务器IIS上,在网络环境下,使用者通过账号,密码可以登录到*** 平台查看公积金资金的运营情况,选择要预测的模块,来查看计算未来的资金 走向情况。
图3示出了本申请实施例提供的功能结构示意图;公积金预测分析***包 括登录模块、资金运行情况模块、汇缴模块、贷款回收支取预测模块、贷款回 收支取预测模块、贷款新增人数预测模块、贷款新增人数预测模块和***设置 模块。其中,贷款回收支取预测模块包括商贷支取预测模块、全部支取预测模 块、公积金支取预测模块和自有资金支取预测模块。
图4示出了本申请实施例提供的模块内功能结构示意图;商贷支取预测模 块包括历史数据存储单元、数据预测单元和数据对比单元。
为了使得本申请实施例提供的数据预测分析方法更加清楚,现在结合下面 的附图进行进一步的解释说明。
图5为本申请实施例提供的公积金数据预测分析流程图,具体可以包括如 下步骤:
步骤501:获取历史数据。
步骤502:判断历史数据是否具有较强的统计规律?若不是,进入步骤 503;若是,进入步骤504。
步骤503:将数据分解为趋势性的、季节性的、随机性的三个部分来建立 模型,设置相应参数平滑随机性、修正趋势性、处理季节性,设置其他参数来 体现政策法规对公积金各项数据的影响。进一步,转入步骤504。
步骤504:确定数据量。
步骤505:初步确定预测公式。
步骤506:对所述预测公式进行应用检验:对第n个数据预测时,用第n-1 个数据作为检验数据。
步骤507:判断精度是否达标;若是,执行步骤508;若不达标,返回步 骤505。
步骤508:确定预测公式。
图6a、图6b、图6c、图6d、图6e和图6f为本申请实施例提供的公积金 汇缴的预测实施例示意图。
首先,通过大量的试验,选择建模所需的最小数据量,经试验选取2012 至2016年连续5年的数据,作为预测2017年前3个月汇缴金额的基础数据。
从图6a可以看出,2012年1月至2016年12月汇缴金额的柱状图,发现 规律性不强。但是,把2012年至2016年第一季度的汇缴金额整理出来,如图 6b所示,可以发现其具有较好的规律性。
于是,在保证预测结果准确、易于实现的原则下,选择较为简单的模型, 先预测出2017年第一季度的公积金汇缴金额,再通过历史数据计算出5年中 1、2、3月份汇缴金额在第一季度中占比的平均值,就可以预测出2017年1、 2、3月份的公积金汇缴金额,以下为预测结果及误差:
表1 2017年1、2、3月份汇缴金额预测值及误差
年月 汇缴真实值 汇缴预测值 误差
201701 150984619.1 151619399.3 0.004204271
201702 170595723.5 169803666.4 -0.004642889
201703 234398270.9 242062924 0.032699273
从表1可以看出,预测的误差在5%以内,预测精度高,预测结果具有很 高的可靠性。
经过前面的分析研究,虽然2012年1月至2016年12月住房公积金汇缴 金额规律性较差,但是,如果把2012年至2016年每个季度的汇缴金额整理出 来,可以发现其具有较好的规律性,如图6c、图6d、图6e和图6f所示。图 6c示出了2012至2016年第一季度汇缴金额,图6d示出了2012至2016年第 二季度汇缴金额,图6e示出了2012至2016年第三季度汇缴金额,图6f示出 了2012至2016年第四季度汇缴金额。
于是,采取以下方法预测2017年各月公积金汇缴金额:
第一步:先按季度进行预测。具体而言,对当前年度之前连续5年的汇缴 数据按季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,进而对于 当前年度的每个季度进行预测,得到季度预测值。
第二步:完成按月预测。计算当前年度之前连续5年的每月在其所属季度 中所占比值。
最后,用季度预测值乘以每月在其所属季度中占比均值即可得到每月的预 测值。
利用此方法对2017年一季度的三个月份汇缴金额进行预测,可得2017 年1、2、3月份公积金汇缴金额的预测误差分别为0.4%、-0.5%、3.3%。由此 可见,该预测方法预测精度高,预测结果可信度好。
图7a、图7b、图7c和图7d为本申请实施例提供的公积金贷款回收预测 实施例示意图。
对2012年至2017年各个季度的公积金贷款回收金额做图分析,可见每个 季度的贷款回收金额基本上都呈现出指数增长的趋势,如图7a、图7b、图7c 和图7d所示。图7a示出了2012至2017年第一季度贷款回收金额,图7b示 出了2012至2017年第二季度贷款回收金额,图7c示出了2012至2017年第 三季度贷款回收金额,图7d示出了2012至2017年第四季度贷款回收金额。
于是,针对每个季度,采用当前年份之前5年的公积金贷款回收金额为基 本数据,利用指数模型对其进行预测。
首先,对2013年至2017年同一季度的贷款回收金额取对数。然后,对上 一步所取的对数,利用最小二乘法拟合,求出预测的直线方程。最后,将上一 步得到的直线方程还原回最终预测的指数方程,对当前年份所需预测季度的公 积金贷款回收金额进行预测。
利用指数模型对2018年第一季度的贷款回收进行预测,预测该季度贷款 回收金额为239087138.3元,而真实值为228304335.1元,误差为4.7%,预测 精度高,该预测模型可靠度好。
关于公积金贷款回收的月份预测,公积金贷款回收的月份预测模型和季度 模型基本一样,只是把季度的贷款回收金额换成所需预测月份之前连续7个月 的贷款回收实际金额即可。
例如,要预测2018年8月的贷款回收金额,选取2018年1月至7月的贷 款回收数据,对其取对数后,进行和贷款回收季度预测相同的处理方法,可以 预测出2018年8月的公积金贷款回收金额为80097111元。而该月真实值为 76770243.1元,误差为4.3%。同时还可以根据2018年1月至7月数据直接预 测出2018年9月的数据为81000679元,而真实值为75070807.4元,误差为 7.9%,预测效果较为理想。也可以用2018年2月至8月的数据,根据这个模 型来预测9月的贷款回收金额。
图8a和图8b为本申请实施例提供的公积金支取总量的预测实施例示意 图。图8a示出了2012年1月至2017年12月公积金总支取金额柱状图,图 8b示出了2012年1月至2017年12月公积金总支取金额折线图。对2012年1 月至2017年12月公积金总支取金额分别做柱状图、折线图加以分析,发现该 数据不像汇缴、贷款回收金额那样具有较强的规律性。一方面,该数据随着时 间的推移表现出增大的总体趋势;另一方面,又存在着季节的波动性;此外, 数据还存在随机性波动。利用一般的模型对其进行预测时,误差较大,效果不 好。
温特斯(winters)季节预测法是一种较为高级的平滑预测方法,这种方法 的突出优点是对于同时具有趋势变动和季节变动的时间序列,分别对每种形式 进行指数平滑,然后将每种形式的指数平滑结果结合起来,对原时间序列进行 预测。该方法扩大了指数平滑的应用范围,提高了对兼有趋势和季节变动的时 间序列预测的准确性。温特斯季节预测法以三个方程为基础。其中,每个方程 用于平滑模型的三个组成部分(平稳的、趋势的和季节性的),且都含有一个 有关参数。这种方法可以平滑随机性、修正倾向性、处理季节性。
温特斯季节预测法的三个基本方程如下所示:公式(5)为整体平滑基本 方程,公式(6)为趋势平滑基本方程,公式(7)为季节平滑基本方程。
Figure BDA0002437535180000161
bt=γ(St-St-1)+(1-γ)bt-1……公式(6)
Figure BDA0002437535180000162
其中,p是季节长度,α,β,γ为(0,1)中的数,称为平滑参数,Yt为观测的 实际值。
选用2012年的数据为基础数据,以2012年各月与2012年全年的月均值之 比,作为1至12月的初始月份平滑值I1~I12,用2013年1月份的实际值作为一次 平滑值St的初始值S13,以2013年一季度与2012年一季度差值的
Figure BDA0002437535180000163
作为趋势平 滑值bt的初始值b13,用
Figure BDA0002437535180000164
预测2013年2月的总支取。然后按3个基 本方程计算St,bt,It,并用
Figure BDA0002437535180000165
对下个月的总支取金额进行预 测。
使用此方法时,重要的是确定平滑参数α,β,γ的取值问题,平滑参数的取 值合适与否,决定着预测的准确程度。经过大量实验和以往数据分析工作的实 践经验,此处选择α=0.382,β=0.45,γ=0.7作为该模型的平滑参数。考虑到政策 因素以及某些月份的特殊性(如春节在1月或2月份,十一长假在10月份),我 们又加入政策调整因子和月份调整因子,共计5个参数。
该模型是一个逐步修正的过程,一般需要3个季节周期就会基本稳定,前 面预测的数据可能不太准确,等数据修正基本稳定后,后面模型预测值比较理 想。
利用上述模型对2018年1至9月的总支取金额进行预测,结果见下表:
表2 2018年1至9月份总支取金额预测值及误差
年月 总支取真实值 总支取预测值 误差
201801 194555410.8 194808106 0.001298835
201802 119831278.2 109516808.9 -0.086074934
201803 176187818.7 164441449.3 -0.066669589
201804 165931701.5 153641579.1 -0.074067356
201805 169638114.3 157595752.9 -0.070988536
201806 168492050.3 167718005.3 -0.004593956
201807 243258654.6 223811449.7 -0.079944555
201808 217509745.5 223717517.5 0.028540202
201809 211637365.2 210289441.4 -0.006369026
在对公积金重要分析支取的预测中,通过对数据的分析,发现公积金贷款 支取、自有资金购房支取、纯商贷支取3项在整个公积金支取总量中,所占比 重较大,三者之和占比超过了公积金支取总量的70%,所以需要分别对这三类 支取进行预测。
预测方法还是以温特斯季节预测法为主,再辅以其他预测模型。对公积金 贷款支取,以α=0.3,β=0.8,γ=0.025的温特斯季节预测法为主,再辅以最小二 乘直线拟合及对数差分,构成组合预测模型,对2018年1至9月预测结果如 下表3:
表3 2018年1至9月份公积金贷款支取金额预测值及误差
Figure BDA0002437535180000171
Figure BDA0002437535180000181
对自有资金购房支取,以α=0.6,β=0.9,γ=0.06的温特斯季节预测法为主, 再辅以最小二乘直线拟合及隔月环比法,构成组合预测模型,对2018年1至 9月预测结果如下表4:
表4 2018年1至9月份自有资金购房支取金额预测值及误差
Figure BDA0002437535180000182
对纯商贷支取,以α=0.3,β=0.95,γ=0.04的温特斯季节预测法为主,再辅 以最小二乘直线拟合法,构成组合预测模型,对2018年1至9月预测结果如 下表:
表5 2018年1至9月份纯商贷支取金额预测值及误差
Figure BDA0002437535180000183
Figure BDA0002437535180000191
对于新增贷款人数的预测。新增贷款人数影响到了公积金的支取及贷款回 收,所以必须建立新增贷款人数模型(需求模型),模拟测算这类新增人群的 贷款需求情况。
利用对数差分模型和加权平均模型,组合成新增贷款人数模型对2018年 1至9月的新增贷款人数进行预测:
先对2012到2017年每年1,2,3月的新增贷款人数进行对数差分,去掉异 常数据(绝对值大于等于0.9的对数差分值被视为异常数据),然后用剩余4 个数的平均值作为2018年1至3月对数差分的预测值,再换算成该月的新增 贷款人数预测值。
由于2012-2017年4到10月新增贷款人数极不规律,即使采用对数差分 也无规律性可言,所以必须建立另一个模型来预测2018年4到10月的申请人 数。此处采用加权平均为主的预测方法:首先对要预测月份的历史数据进行排 序,目的是去掉异常数据(如果最大值和次最大值的差大于等于150,则去掉 最大值,否则所有该月的历史数据都为有效数据)。考虑到政策调整因素,再 加入政策调整因子即可对4到10月新增贷款人数进行预测。
采用该组合预测方法对2018年1至9月新增贷款人数进行预测,结果见 下表6:
表6 2018年1至9月份新增贷款人数预测值及误差
年月 新增贷款人数真实值 新增贷款人数预测值 误差
201801 194 188 -0.03146
201802 131 128 -0.02294
201803 235 229 -0.02432
201804 366 345 -0.05738
201805 305 319 0.045027
201806 298 276 -0.07345
201807 388 363 -0.06469
201808 412 400 -0.03058
201809 279 265 -0.0509
本申请实施例提供的数据预测分析方法中的公积金预测分析***数据库 采用MSSQL Server 2014数据库。SQL(Structured Query Language)是具有数 据操纵和数据定义等多种功能的数据库语言,这种语言具有交互性特点,能为 用户提供极大的便利,数据库管理***应充分利用SQL语言提高计算机应用 ***的工作质量与效率。SQL语言不仅能独立应用于终端,还可以作为子语 言为其他程序设计提供有效助力,该程序应用中,SQL可与其他程序语言一 起优化程序功能,进而为用户提供更多更全面的信息。
三层式数据访问机制,数据加密处理机制;数据加密处理机制主要对数据 库的访问密码和个人密码进行机密处理,采用当前较为流行的基数据加密机 制,主要方式为,采用数据技术数据方式进行加密于解密,变动加密机制时, 只需修改对应的基数位置或基数值即可,实现方式简单方便,而解密极其困难。
其中数据字典如表7所示:
表7 model_initialdata数据基础表
Figure BDA0002437535180000201
Figure BDA0002437535180000211
可以看出,本申请实施例提供的数据预测分析方法具有准确性,通过对公 积金汇缴、回收、支取等数据进行分析预测,是对公积金进行科学管理、科学 决策的重要环节,所以预测结果准确与否,至关重要。对于规律性强的数据, 本产品把误差控制在5%以内;对于随机性较大的数据,已基本将误差控制在 10%以内,极少数数据误差较大,给出了合理的解释。
还具有易实现性,建立预测模型后,需要将模型编程实现,在保证较高预 测精度的前提下,使用简单的数学模型,不涉及复杂的数学运算,模型易于实 现,运行速度快。
还具有自适应性,公积金汇缴、回收、支取等数据,受房地产市场、政府 及相关部门政策的影响较大,一旦房地产市场出现较大波动,或是力度较大的 政策出台,相关的公积金数据就会出现大幅波动。由于政策调整或其他因素影 响,个别月份与winters基本模型偏差较大,通过概率赋权、移动平滑赋权等 方法调整修正系数。需要建立的数学模型具有较强的适应性,本申请实施例提 供的数据预测分析方法将波动考虑在内,能够及时进行自适应调整,从而避免 了连续出现预测误差较大情况的发生。
综上所述,本申请实施例提供的一种数据预测分析方法,通过接收客户端 发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类 型和公积金数据预测时间;根据所述公积金数据预测类型和公积金数据预测时 间从数据库中调取对应的建模基础数据;根据所述建模基础数据匹配所述公积 金数据预测类型对应的预测模型;根据所述预测模型进行精度校验,若达到精 度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要 求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达 到精度要求;基于所述目标公积金数据预测模型,对所述公积金数据预测类型 和公积金数据预测时间进行数据预测分析;将预测分析结果发送至所述客户 端。提供了更加精确的公积金数据预测。
基于相同的技术构思,本申请实施例还提供了一种数据预测分析***,如 图9所示,所述***包括:
消息接收模块901,用于接收客户端发送的公积金数据预测请求,所述公 积金数据预测请求携带公积金数据预测类型和公积金数据预测时间。
数据调取模块902,用于根据所述公积金数据预测类型和公积金数据预测 时间从数据库中调取对应的建模基础数据。
预测模型匹配模块903,用于根据所述建模基础数据匹配所述公积金数据 预测类型对应的预测模型。
精度校验模块904,用于根据所述预测模型进行精度校验,若达到精度要 求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求, 则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精 度要求。
预测分析模块905,用于基于所述目标公积金数据预测模型,对所述公积 金数据预测类型和公积金数据预测时间进行数据预测分析。
消息发送模块906,用于将预测分析结果发送至所述客户端。
在一种可能的实施方式中,所述公积金数据预测类型包括公积金汇缴金额 预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测 和新增贷款人数预测。
在一种可能的实施方式中,所述预测模型匹配模块903,具体用于:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴 金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方 程,得到季度预测值;
将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中 所占比值,得到月占比;
将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测 值。
在一种可能的实施方式中,所述预测模型匹配模块903,具体用于:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中 的相同季度的公积金贷款回收金额取对数;
将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;
将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所 需预测季度或者月份的公积金贷款回收金额的预测模型。
在一种可能的实施方式中,所述预测模型匹配模块903,具体用于:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数 据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始 月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初 始值S13,以所述第N+1年一季度与所述第N年一季度差值的
Figure BDA0002437535180000231
作为趋势平滑 值bt的初始值b13,按照公式(1)、(2)、(3)和(4)进行所述第N+1年的下 一月份的公积金支取总量
Figure BDA0002437535180000232
的预测。
基于相同的技术构思,本申请实施例还提供了一种数据预测分析设备,所 述设备包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指 令;所述处理器,用于执行一个或多个程序指令,用以执行上述方法任一项所 述的方法。
基于相同的技术构思,本申请实施例还提供了一种计算机可读存储介质, 所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用 于执行如上述方法任一项所述的方法。
本说明书中上述方法的各个实施例均采用递进的方式描述,各个实施例之 间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的 不同之处。相关之处参见方法实施例的部分说明即可。
需要说明的是,尽管在附图中以特定顺序描述了本发明方法的操作,但这 并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所 示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个 步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然本申请提供了如实施例或流程图的方法操作步骤,但基于常规或者无 创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅 仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装 置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并 行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环 境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含, 从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而 且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的 过程、方法、产品或者设备中还存在另外的相同或等同要素。
上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实 现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以 功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同 一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模 块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如, 所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方 式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可 以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性, 机械或其它的形式。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以 外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专 用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因 此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功 能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能 的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例 如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的 例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实 践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设 备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的 本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本 申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申 请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形 式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、 光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终 端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分 所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相 似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之 处。本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计 算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、 基于微处理器的***、置顶盒、可编程的电子设备、网络PC、小型计算机、 大型计算机、包括以上任何***或设备的分布式计算环境等等。
以上所述的具体实施例,对本申请的目的、技术方案和有益效果进行了进 一步详细说明,所应理解的是,以上所述仅为本申请的具体实施例而已,并不 用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、 等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (12)

1.一种数据预测分析方法,其特征在于,所述方法包括:
接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间;
根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;
根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;
根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;
基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;
将预测分析结果发送至所述客户端。
2.如权利要求1所述的方法,其特征在于,所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预测。
3.如权利要求1或2所述的方法,其特征在于,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,得到季度预测值;
将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中所占比值,得到月占比;
将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测值。
4.如权利要求1或2所述的方法,其特征在于,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中的相同季度的公积金贷款回收金额取对数;
将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;
将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的预测模型。
5.如权利要求1或2所述的方法,其特征在于,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初始值S13,以所述第N+1年一季度与所述第N年一季度差值的
Figure FDA0002437535170000021
作为趋势平滑值bt的初始值b13,按照如下公式进行所述第N+1年的下一月份的公积金支取总量
Figure FDA0002437535170000022
的预测:
Figure FDA0002437535170000023
bt=γ(St-St-1)+(1-γ)bt-1
Figure FDA0002437535170000024
Figure FDA0002437535170000025
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
6.一种数据预测分析***,其特征在于,所述***包括:
消息接收模块,用于接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间;
数据调取模块,用于根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;
预测模型匹配模块,用于根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;
精度校验模块,用于根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;
预测分析模块,用于基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;
消息发送模块,用于将预测分析结果发送至所述客户端。
7.如权利要求6所述的***,其特征在于,所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预测。
8.如权利要求6或7所述的***,其特征在于,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,得到季度预测值;
将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中所占比值,得到月占比;
将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测值。
9.如权利要求6或7所述的***,其特征在于,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中的相同季度的公积金贷款回收金额取对数;
将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;
将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的预测模型。
10.如权利要求6或7所述的***,其特征在于,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初始值S13,以所述第N+1年一季度与所述第N年一季度差值的
Figure FDA0002437535170000041
作为趋势平滑值bt的初始值b13,按照如下公式进行所述第N+1年的下一月份的公积金支取总量
Figure FDA0002437535170000042
的预测:
Figure FDA0002437535170000043
bt=γ(St-St-1)+(1-γ)bt-1
Figure FDA0002437535170000044
Figure FDA0002437535170000045
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
11.一种数据预测分析设备,其特征在于,所述设备包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行如权利要求1-5任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行如权利要求1-5任一项所述的方法。
CN202010256491.1A 2020-04-02 2020-04-02 一种数据预测分析方法、***、设备及可读存储介质 Active CN111506876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010256491.1A CN111506876B (zh) 2020-04-02 2020-04-02 一种数据预测分析方法、***、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010256491.1A CN111506876B (zh) 2020-04-02 2020-04-02 一种数据预测分析方法、***、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN111506876A true CN111506876A (zh) 2020-08-07
CN111506876B CN111506876B (zh) 2023-09-12

Family

ID=71872678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010256491.1A Active CN111506876B (zh) 2020-04-02 2020-04-02 一种数据预测分析方法、***、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111506876B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200532A (zh) * 2020-09-16 2021-01-08 北京中宣智伟科技有限公司 一种施工工期智能计算的方法及***、计算机可读介质
CN112288158A (zh) * 2020-10-28 2021-01-29 税友软件集团股份有限公司 一种业务数据预测方法及相关装置
CN117390008A (zh) * 2023-12-11 2024-01-12 北京星球空天信息技术有限公司 多类型观测仪器的测量数据处理方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599886B1 (en) * 2006-05-15 2009-10-06 Ken Lambert System and method for allocating mortgage repayment funds
CN105120487A (zh) * 2015-09-02 2015-12-02 中国联合网络通信集团有限公司 一种业务数据预测方法及装置
CN107292429A (zh) * 2017-06-07 2017-10-24 上海欧睿供应链管理有限公司 一种基于需求特性分析的需求预测模型选择方法
CN107862476A (zh) * 2017-11-06 2018-03-30 国网山东省电力公司电力科学研究院 一种基于数据分析的计量用表需求计算方法
CN110009042A (zh) * 2019-04-08 2019-07-12 中诚信征信有限公司 一种数据预测方法、装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599886B1 (en) * 2006-05-15 2009-10-06 Ken Lambert System and method for allocating mortgage repayment funds
CN105120487A (zh) * 2015-09-02 2015-12-02 中国联合网络通信集团有限公司 一种业务数据预测方法及装置
CN107292429A (zh) * 2017-06-07 2017-10-24 上海欧睿供应链管理有限公司 一种基于需求特性分析的需求预测模型选择方法
CN107862476A (zh) * 2017-11-06 2018-03-30 国网山东省电力公司电力科学研究院 一种基于数据分析的计量用表需求计算方法
CN110009042A (zh) * 2019-04-08 2019-07-12 中诚信征信有限公司 一种数据预测方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭剑川 等: "税收收入预测的时间序列方法选择" *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200532A (zh) * 2020-09-16 2021-01-08 北京中宣智伟科技有限公司 一种施工工期智能计算的方法及***、计算机可读介质
CN112200532B (zh) * 2020-09-16 2024-07-19 北京中宣智伟科技有限公司 一种施工工期智能计算的方法及***、计算机可读介质
CN112288158A (zh) * 2020-10-28 2021-01-29 税友软件集团股份有限公司 一种业务数据预测方法及相关装置
CN117390008A (zh) * 2023-12-11 2024-01-12 北京星球空天信息技术有限公司 多类型观测仪器的测量数据处理方法和装置
CN117390008B (zh) * 2023-12-11 2024-04-12 北京星球空天信息技术有限公司 多类型观测仪器的测量数据处理方法和装置

Also Published As

Publication number Publication date
CN111506876B (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
De Fontnouvelle et al. Using loss data to quantify operational risk
CN102663650A (zh) 一种企业信用风险分析***及其使用方法
CN111506876A (zh) 一种数据预测分析方法、***、设备及可读存储介质
Dionne et al. Default risk in corporate yield spreads
WO2016084642A1 (ja) 与信審査用サーバと与信審査用システム及び与信審査用プログラム
Chen et al. A study on operational risk and credit portfolio risk estimation using data analytics
CN111709826A (zh) 目标信息确定方法和装置
CN113034046A (zh) 一种数据风险计量方法、装置、电子设备及存储介质
CN113256324A (zh) 数据资产定价方法、装置、计算机设备和存储介质
Hwang Forecasting credit ratings with the varying-coefficient model
CN111798305A (zh) 农业贷款准入评估方法、装置、设备和存储介质
CN115034654A (zh) 资产评估方法、装置、设备及存储介质
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
Zhu et al. A new structural break test for panels with common factors
Mengelkamp et al. Corporate credit risk analysis utilizing textual user generated content-a twitter based feasibility study
CN113962526A (zh) 电力交易服务费违约风险评估方法、设备和计算机可读存储介质
Zeng [Retracted] Research on Risk Measurement and Early Warning of Electronic Banking Business Based on GMDH Algorithm
Genriha et al. Entrepreneurship insolvency risk management: a case of Latvia
Hwang et al. A two-stage probit model for predicting recovery rates
CN114626940A (zh) 数据分析方法、装置及电子设备
CN113781247A (zh) 协议数据推荐方法、装置、计算机设备及存储介质
CN114240599A (zh) 贷款测算方法、装置、计算机设备和存储介质
CN113807943A (zh) 一种不良资产的多因子估值方法及***、介质、设备
CN113298642A (zh) 一种订单检测方法、装置、电子设备及存储介质
Whiteman The efficiency of developing country public financial management systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant