CN107633331A - 时间序列模型建立方法及装置 - Google Patents

时间序列模型建立方法及装置 Download PDF

Info

Publication number
CN107633331A
CN107633331A CN201710878449.1A CN201710878449A CN107633331A CN 107633331 A CN107633331 A CN 107633331A CN 201710878449 A CN201710878449 A CN 201710878449A CN 107633331 A CN107633331 A CN 107633331A
Authority
CN
China
Prior art keywords
data sequence
model
historical data
final mask
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710878449.1A
Other languages
English (en)
Inventor
张冲
王丽燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Fabro Technology Co Ltd
Original Assignee
Beijing Fabro Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Fabro Technology Co Ltd filed Critical Beijing Fabro Technology Co Ltd
Priority to CN201710878449.1A priority Critical patent/CN107633331A/zh
Publication of CN107633331A publication Critical patent/CN107633331A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及统计技术领域,提供一种时间序列模型建立方法及装置,通过获取银行的历史数据序列,并在历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;然后对最终模型群进行筛选,选择aicc值最小的作为最终模型,确保最终模型达到最好的拟合效果,最后得到的银行未来一段时间内的预测数据序列更加准确,可以有效引导银行资产负债结构的调整趋势,具有良好的应用价值。

Description

时间序列模型建立方法及装置
技术领域
本发明涉及统计技术领域,具体而言,涉及一种时间序列模型建立方法及装置。
背景技术
时间序列模型作为一种短期预测模型,是可以广泛应用于经济、医学、气象、地理、水文、地质等各个领域。但是由于该模型的算法复杂,在建模时对数据序列有着极为严格的校验过程和复杂变换过程,而在实际生活中很少有平稳数据序列,所以该模型在实际研究中很少应用。目前,常用的时间序列模型是R语言官方公布的auto.arima算法,但是auto.arima算法只包含时间序列模型中的平稳性检验、定阶和差分过程,也就是仅仅实现了平稳性检验、差分和定阶的自动化,导致auto.arima算法的实用性很差。
发明内容
本发明的目的在于提供一种时间序列模型建立方法及装置,用以改善上述问题。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明提供了一种时间序列模型建立方法,应用于银行的电子设备,用于对银行的资产负债进行预测,所述方法包括:获取所述银行的历史数据序列;判断历史数据序列是否满足预设条件;当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;对最终模型群进行筛选,得到最终模型;根据最终模型,得到银行的预测数据序列。
第二方面,本发明提供了一种时间序列模型建立装置,应用于银行的电子设备,用于对银行的资产负债进行预测,所述装置包括历史数据序列获取模块、判断模块、最终模型群获得模块、最终模型获得模块及预测数据序列获得模块。其中,历史数据序列获取模块用于获取所述银行的历史数据序列;判断模块用于判断历史数据序列是否满足预设条件;最终模型群获得模块用于当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;最终模型获得模块用于对最终模型群进行筛选,得到最终模型;根据最终模型,得到银行的预测数据序列;预测数据序列获得模块用于根据最终模型,得到银行的预测数据序列。
相对现有技术,本发明具有以下有益效果:本发明提供的一种时间序列模型建立方法及装置,通过获取银行的历史数据序列,并在历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;然后对最终模型群进行筛选,选择aicc值最小的模型作为最终模型,确保最终模型达到最好的拟合效果,最后得到的银行未来一段时间内的预测数据序列更加准确,可以有效引导银行资产负债结构的调整趋势,具有良好的应用价值。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例提供的电子设备的方框示意图。
图2示出了本发明实施例提供的时间序列模型建立方法流程图。
图3为图2示出的步骤S102的子步骤流程图。
图4为图2示出的步骤S103的子步骤流程图。
图5为图2示出的步骤S104的子步骤流程图。
图6为图5示出的子步骤S1045的子步骤流程图。
图7为图2示出的步骤S105的子步骤流程图。
图8示出了本发明实施例提供的电子设备的参数配置界面。
图9为利用本发明实施例提供的时间序列模型建立方法获得的预测值。
图10利用本发明实施例提供的时间序列模型建立方法获得的预测图。
图11示出了本发明实施例提供的时间序列模型建立装置的方框示意图。
图12为图11示出的时间序列模型建立装置中判断模块的方框示意图。
图13为图11示出的时间序列模型建立装置中最终模型群获得模块的方框示意图。
图14为图11示出的时间序列模型建立装置中最终模型获得模块的方框示意图。
图15为图14示出的最终模型获得模块中第二执行单元的方框示意图。
图16为图11示出的时间序列模型建立装置中预测数据序列获得模块的方框示意图。
图标:100-电子设备;101-存储器;102-存储控制器;103-处理器;200-时间序列模型建立装置;201-历史数据序列获取模块;202-判断模块;2021-白噪声检验单元;2022-平稳性检验单元;2023-定阶差分单元;2024-判定单元;203-最终模型群获得模块;2031-中间模型群获得单元;2032-残差获取单元;2033-最终模型群获得单元;204-最终模型获得模块;2041-aicc值计算单元;2042-备选模型获得单元;2043-显著性判断单元;2044-第一执行单元;2045-第二执行单元;20451-疏系数模型建立单元;20452-aicc值获取单元;20453-第一子执行单元;20454-第二子执行单元;205-预测数据序列获得模块;2051-模型预测单元;2052-异常值检测单元。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1示出了本发明实施例提供的电子设备100的方框示意图。电子设备100可以是,但不限于商业银行工作人员的台式机、笔记本电脑、智能手机、平板电脑等等。所述电子设备100包括时间序列模型建立装置200、存储器101、存储控制器102及处理器103。
所述存储器101、存储控制器102及处理器103各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述时间序列模型建立装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器101中或固化在所述电子设备100的操作***(operating system,OS)中的软件功能模块。所述处理器103用于执行存储器101中存储的可执行模块,例如所述时间序列模型建立装置200包括的软件功能模块或计算机程序。
其中,存储器101可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器101用于存储程序,所述处理器103在接收到执行指令后,执行所述程序,本发明任一实施例揭示的流程定义的服务器所执行的方法可以应用于处理器103中,或者由处理器103实现。
处理器103可以是一种集成电路芯片,具有信号处理能力。上述的处理器103可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)、语音处理器以及视频处理器等;还可以是数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器103也可以是任何常规的处理器等。
第一实施例
请参照图2,图2示出了本发明实施例提供的时间序列模型建立方法流程图。时间序列模型建立方法包括以下步骤:
步骤S101,获取银行的历史数据序列。
在本发明实施例中,历史数据序列可以是银行过去一段时间内的资产数据或者负债数据。过去一段时间可以是几年或者几个月,以当日为基准,例如,从当日起过去的3年、3个月等,过去一段时间的长短可以根据银行业务灵活调整。若要对银行的资产进行预测,则从银行的数据***中获取过去一段时间的资产数据;若要对银行的负债进行预测,则从银行的数据***中获取过去一段时间的负债数据。
步骤S102,判断历史数据序列是否满足预设条件。
在本发明实施例中,预设条件是历史数据序列既是平稳序列又非白噪声序列。在建立时间序列模型之前,需要先对获取的历史数据序列进行检验,检验方法可以包括:
首先,对历史数据序列进行白噪声检验,以判断历史数据序列是否为纯随机序列。若判定该历史数据序列是白噪声,即纯随机序列,则说明该历史数据序列的数据项之间不具有相关性,不能用时间序列模型,此时,利用滑动平均法对该历史数据序列进行预测;若判定该历史数据序列不是白噪声,即不是纯随机序列,则说明该历史数据序列的数据项之间具有相关性,此时对该历史数据序列进行平稳性检验。
其次,平稳性检验用于检验历史数据序列是否为平稳序列,若历史数据不是平稳序列,则对该数据序列进行定阶,并根据阶数进行差分,把该历史数据序列处理为平稳序列;此时对已得到的平稳序列再次进行白噪声检验,若该平稳序列为白噪声序列,则使用滑动平均法进行预测;若该平稳序列非白噪声序列,则进入模型拟合阶段。
请参照图3,步骤S102可以包括以下子步骤:
子步骤S1021,对历史数据序列进行白噪声检验,以判断历史数据序列是否为纯随机序列。
在本发明实施例中,对历史数据序列进行白噪声检验,可以判断该历史数据序列的数据项之间是否具有相关性,在建立时间序列模型之初,首先对历史数据序列做白噪声检验,可以确保整个运算的严谨性。
子步骤S1022,当历史数据序列不是纯随机序列时,对历史数据序列进行平稳性检验,以判断历史数据序列是否为平稳序列。
在本发明实施例中,平稳性检验可以使用ADF检验法,ADF检验要求对样本量有一定要求,但是在实际应用中,所采集到的历史数据序列的样本容量都能达到检验所需水平,有4种形式:
1.不含漂移项、截距项:
2.含有漂移项,不含截距项:
3.不含漂移项,含有截距项:
4.含有漂移项、截距项:
同时,ADF检验采用t统计量其中,T为样本总量,Φ1、Φ2…Φp为OLS估计值,的标准差估计量,Δyt表示样本的一阶差分。
作为一种实施方式,在开发过程中将这四种检验方式写成了循环,根据数据序列中漂移项和截距项的情况选择对应的检验方法,并计算相应的τ值,如果都不能通过检验,则判断存在单位根,即历史数据序列是不平稳序列。
子步骤S1023,当历史数据序列不是平稳序列时,对历史数据序列进行定阶差分,以得到平稳序列。
在本发明实施例中,可以采用作为acf函数:rk=cov(xt,xt-k)=E(xt-μ)(xt-k-μ)的相合估计,其中,i为滞后阶数,n为历史数据序列观测值,为观测平均值,自相关系数用于判断ma函数的阶数。一般来说,随着k的增长,自相关函数逐渐衰减,最终不显著异于零,绘制函数图像,如果函数是骤然下降为零,则函数截尾,如果函数是缓慢下降为零,则函数拖尾。
通过比较的值与的大小,可以判断是否显著异于零,n为样本数目。在使用R语言绘制自相关图像时会自动默认标出两条高度为的虚线,一般来说,模型阶数要尽可能少,有时候有的阶数的虽然超过了虚线,但会考虑把它当做偶然值处理,取较小的阶数。
Pacf函数:用rt-k(k>0)在两侧同时乘以p阶自回归过程
rt=Φ1rt-12rt-2+…+Φprt-p+at
得到rtrt-k=Φ1rt-1rt-k2rt-2rt-k+…+Φprt-prt-k+atrt-k
对上式两侧求期望得到γk=Φ1γk-12γk-2+…+Φpγk-p,其中,其中γk为序列滞后k期的相关系数,该方程两侧除以γ0得到Yule-Walker方程:
ρk=Φ1ρk-12ρk-2+…+Φpρk-p
对于p阶自回归过程rt=Φk1rt-1k2rt-2+…+Φkkrt-k+at,把Φkk视为历史数据序列滞后k阶的偏自相关函数,因为这恰好是滞后k阶值在排除之前滞后阶数之后对当期值的影响大小度量。此时Yule-Walker方程为:
ρj=Φk1ρk-1k2ρk-2+…+Φkkρj-k
将k=1,2,3……依次带入上式可求解偏自相关系数。
子步骤S1024,当历史数据序列是平稳序列时,判定历史数据序列满足预设条件。
步骤S103,当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群。
在本发明实施例中,得到最终模型群的过程可以包括:首先,对满足预设条件的历史数据序列进行多次模型拟合,建立多个模型,构成一个中间模型群。在模型拟合阶段,差分次数和阶数的所有组合方式一共有192种,根据这192种参数组合方式拟合192个模型,形成中间模型群;然后,获取中间模型群中每个模型的残差,并对残差进行白噪声检验,若残差不是白噪声,则将该残差对应的模型移出模型群,若残差是白噪声,则保留,得到最终模型群。
请参照图4,步骤S103可以包括以下子步骤:
子步骤S1031,对历史数据序列进行多次模型拟合,建立多个模型,构成一个中间模型群。
子步骤S1032,获取中间模型群中每个模型的残差。
子步骤S1033,对中间模型群中每个模型的残差进行残差检验,若残差为白噪声则保留该模型,若残差非白噪声则剔除该模型,以得到最终模型群。
在本发明实施例中,对中间模型群中每个模型的残差进行残差检验也就是对每个模型的残差进行白噪声检验,又称Ljung-Box检验,该检验方法检验每期残差之间与其滞后若干阶数的残差之间是否存在相关性,如果存在,则模型未被完全拟合,如果不存在,且正态性检验通过,则证明残差为白噪声序列,模型拟合成功。
Ljung-Box统计量计算方式如下:
其中,n为序列观测值个数,也叫作序列长度,lag为滞后阶数,acfi为序列i阶自相关函数值:
rt为序列第t期的随机变量值,acf函数可以用R语言中stats包来实现。
Ljung-Box统计量近似服从自由度为lag-1的卡方分布(由于是残差,减少了一个自由度,在纯随机性检验中,统计量的自由度是lag),由此可计算得到p值。
如果近期残差无自相关则远期一般来说也不会自相关,该检验可以由相关代码计算前12阶统计量的p值,当p值大于0.05时,无自相关假设成立。
步骤S104,对最终模型群进行筛选,得到最终模型。
在本发明实施例中,对最终模型群进行筛选的过程可以包括:首先,检测最终模型群是否为空,若是,则使用滑动平均法进行预测;若否,则选择aicc值最小的模型作为备选模型;然后,对该备选模型进行t检验,以判断备选模型的自回归系数是否具有显著性,若自回归系数具有显著性,则把该备选模型作为最终模型,若否,则表明历史数据序列在时间上是间隔的,此时需要进行疏系数分析,以得到最终模型。
作为一种实施方式,疏系数分析可以包括:首先,根据备选模型,建立疏系数模型;然后,对该疏系数模型的残差做白噪声检验,若残差非白噪声,则放弃该疏系数模型,返回备选模型;若残差是白噪声,则比较疏系数模型与备选模型的aicc值,并选择aicc值较小者作为最终模型。
请参照图5,步骤S104可以包括以下子步骤:
子步骤S1041,计算最终模型群中每个模型的aicc值。
子步骤S1042,获取aicc值最小的模型,并将该模型作为备选模型。
在本发明实施例中,获取aicc值(也称AICc)最小的模型采用的是AIC/AICc/BIC信息准则,AIC=-2log极大似然估计+2k,对于普通的arima模型,p、q分别为ar模型、ma模型的阶数,如果模型包含截距或者常数项,则k=p+q+1,否则k=p+q。对于含有季节项的arima模型k还要加上季节阶数。AIC估计量通过增加惩罚函数,确保选择简洁的模型,但它是一个有偏估计,对于较大的参数数量相对于数据容量的比率,偏差会相当大。
AICc在AIC中增加了一个非随机惩罚项,可以消除近似偏差,n是有效样本容量,实验证明,在k/n大于10%的情况下,AICc的表现优于许多其他模型选择准则,包括AIC、BIC。在时间序列模型建模中,选择Aicc值作为最终选择依据。
子步骤S1043,对备选模型进行t检验,以判断备选模型的自回归系数是否具有显著性。
在本发明实施例中,t检验为其中,是第i个自回归系数的估计值,是第i个自回归系数的标准误差,即标准差的估计,为第i个自回归系数的真实值,原假设备择假设先假设原假设成立,则成立,服从自由度为n-2的t分布,n为自变量观测值个数。设α为置信水平,一般α=0.05,若t*>t1-α(n-2)则原假设不成立,自回归系数显著。
子步骤S1044,当自回归系数具有显著性时,设置备选模型为最终模型。
子步骤S1045,当自回归系数不具有显著性时,对备选模型进行疏系数分析,以得到最终模型。
请参照图6,子步骤S1045可以包括以下子步骤:
子步骤S10451,根据备选模型,建立疏系数模型。
子步骤S10452,获取疏系数模型的aicc值。
子步骤S10453,当备选模型的aicc值小于疏系数模型的aicc值时,设置备选模型为最终模型。
子步骤S10454,当疏系数模型的aicc值小于备选模型的aicc值时,设置疏系数模型为最终模型。
步骤S105,根据最终模型,得到银行的预测数据序列。
在本发明实施例中,预测数据序列可以是未来的一段时间内银行的资产或负债的数据序列,可以是未来的几天或者几个月,以当日为基准,例如,从当日起为未来的30天、2个月等,具体时间长短可以根据银行业务灵活调整。根据最终模型,得到银行的预测数据序列的方法可以包括:首先,利用最终模型,输出银行的预测数据序列,预测数据序列可以包括预测值、预测图及最终模型的系数与aicc值;然后,利用Bonferroni算法,检测历史数据序列和预测数据序列中的异常值,并对异常值点进行标注。
作为一种实施方式,最终的输出包括预测数据序列及其80%和95%置信区间、预测数据序列的折线图与其80%和95%置信区间对应的面积图、最终模型的自回归系数及aicc值、最终模型群中各模型的系数与对应的aicc值。同时输出最终模型群中各模型和最终模型的自回归系数与aicc值是为了便于将最终模型与最终模型群中其他模型进行对比,以便在对比中确认模型选优的过程。
请参照图7,步骤S105可以包括以下子步骤:
子步骤S1051,利用最终模型,输出银行的预测数据序列。
子步骤S1052,利用Bonferroni算法,检测历史数据序列和预测数据序列中的异常值。
在本发明实施例中,首先,运用Bonferroni算法判断新息异常值。如果处于时间t时的误差(也称为新息)受到了扰动(即误差是e't=et1Pt T,其中et是一个零均值白噪声过程,Pt T是指在T时刻为1,其余时刻为0的脉冲响应函数),那么在t时就会出现一个新息异常值,因此,e'T=eTI,在其余情况下e'T=eT,假设在没有受到扰动的情况下:
则在受到扰动的情况下:
或者是其中,且当j为负数时因此,即便随着观测值逐渐远离异常值的发生点扰动效应渐弱,时刻T的新息异常值仍会对时刻T及其以后的所有观测值产生扰动。
用没有受到扰动的过程AR(∞)来表示残差:
at=Y't1Y't-12Y't-2-…
为简化起见,假设过程的均值为零,且所有参数已知。一般我们用估计得到的参数代替实际参数,这些结果可能受到了扰动的影响。在零假设与无异常值和大样本的情况下,这种近似替代对下述检验流程的有效性可以忽略不计。如果序列只在T时刻有新息异常值,那么残差为aT=ωI+et,其余情况下aT=et,因此ωI可为方差等于σ2。因此,用于检验时刻T上的新息异常值有如下统计量:
零假设为时间序列中没有异常值,检验统计量近似的服从标准正太分布。在T实现已知时,确定观测值为异常值的条件是在5%的显著性水平上相应标准残差的大小超过1.96。由于不知道T是哪一个时刻,故需要对全部观测值进行检验,此外还需要估计σ。简单而保守的做法是应用Bonferroni算法来控制多重检验的总体误差率,令
λ1=max|λ1,t|
最大值在t=T时刻取得,若λ1>0.025/n×100,即超过了标准正态分布的上百分位数,那么第T个观测值必然是新息异常值,该流程确保了错误认定的概率不超过5%。
然后,运用Bonferroni算法判断可加异常值。假设T时刻存在可加异常值,在其他时点没有异常值,则可证明
aT=-ωAπt-T+et,其中,π0=-1,当且仅当j为负数时πj=0,故当t<T时at=et时,aT=ωA+eT,aT+1=-ωAπ1+eT+1,aT+2=-ωAπ2+eT+2,以此类推,ωA的最小二乘估计量为:
其中,而估计量的方差为ρ2σ2,则可以定义检验统计量
零假设是预测数据序列无异常值,备择假设为预测数据序列有一个在T时的可加异常值的情况,检验统计量渐进服从标准正态分布,可应用Bonferroni算法来控制总体误差,此外异常值的性质事先无法得知。当在时间T上检验到异常值时,如果|λ1,T|>|λ2,T|,观测值为新息异常值,否则为可加异常值。
在本发明实施例中,时间序列模型建立方法已封装为时间序列函数,并可以在电子设备100设置时间序列模型建立方法的参数配置界面,请参照图8,以测算银行未来30日内负债变动情况,只需输入此前一年银行各项负债数据并选择日期,电子设备100的处理器103就可以调用时间序列函数,就可以快速测算出银行未来30日内负债预测值,并以折线图形式输出,若需要修改某项负债的数据,只需点击“编辑”便可重新输入该项资产的数据。
作为一种实施方式,假设可以得到某银行过去两年(24个月)的活期存款数据如下;
调用时间序列函数之后,请结合参照图9和图10,可以输出银行未来10期的资产预测值、预测图及其置信区间。
在本发明实施例中,与现有的时间序列模型相比,本发明提供的时间序列模型建立方法具有以下优点:第一,在时间序列模型建立之前对历史数据序列进行白噪声检验,可以确保预测结果的准确性及整个运算的严谨性;第二,实际应用中很多历史数据序列是不平稳的或是白噪声序列,因此针对纯随机序列使用滑动平均法进行预测,可以确保时间序列模型的稳健性;第三,使用了多次差分和多次定阶的相互组合的循环运算的架构,计算每一种参数组合的误差,最后选定误差最小的模型作为最终模型,输出该模型的运算结果。在这个过程中,建立了192个模型,并选择aicc值最小的作为最终模型,显著优于auto.arima只计算一次定阶和差分的运算方式;第四,本发明提供的时间序列模型建立方法,最终输出包括预测数据序列及其80%和95%置信区间、预测数据序列的折线图与其80%和95%置信区间对应的面积图、最终模型的自回归系数及aicc值、最终模型群中各模型的系数与对应的aicc值,显著优于只输出预测值和预测图的auto.arima。
需要说明的是,本发明实施例提供的时间序列模型建立方法,除了包含auto.arima算法中的平稳性检验、定阶差分过程以外,其他过程及整个时间序列模型建立方法的架构,均为创造性的内容,凡在该创造性的内容中所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
第二实施例
请参照图11,图11示出了本发明实施例提供的时间序列模型建立装置200的方框示意图。时间序列模型建立装置200包括历史数据序列获取模块201、判断模块202、最终模型群获得模块203、最终模型获得模块204及预测数据序列获得模块205。
历史数据序列获取模块201,用于获取银行的历史数据序列。
在本发明实施例中,历史数据序列获取模块201可以用于执行步骤S101。
判断模块202,用于判断历史数据序列是否满足预设条件。
在本发明实施例中,判断模块202可以用于执行步骤S102。
请参照图12,图12为图11示出的时间序列模型建立装置200中判断模块202的方框示意图。判断模块202包括白噪声检验单元2021、平稳性检验单元2022、定阶差分单元2023及判定单元2024。
白噪声检验单元2021,用于对历史数据序列进行白噪声检验,以判断历史数据序列是否为纯随机序列。
在本发明实施例中,白噪声检验单元2021可以用于执行子步骤S1021。
平稳性检验单元2022,用于当历史数据序列不是纯随机序列时,对历史数据序列进行平稳性检验,以判断历史数据序列是否为平稳序列。
在本发明实施例中,平稳性检验单元2022可以用于执行子步骤S1022。
定阶差分单元2023,用于当历史数据序列不是平稳序列时,对历史数据序列进行定阶差分,以得到平稳序列。
在本发明实施例中,定阶差分单元2023可以用于执行子步骤S1023。
判定单元2024,用于当历史数据序列是平稳序列时,判定历史数据序列满足预设条件。
在本发明实施例中,判定单元2024可以用于执行子步骤S1024。
最终模型群获得模块203,用于当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群。
在本发明实施例中,最终模型群获得模块203可以用于执行步骤S103。
请参照图13,图13为图11示出的时间序列模型建立装置200中最终模型群获得模块203的方框示意图。最终模型群获得模块203包括中间模型群获得单元2031、残差获取单元2032及最终模型群获得单元2033。
中间模型群获得单元2031,用于对历史数据序列进行多次模型拟合,建立多个模型,构成一个中间模型群。
在本发明实施例中,中间模型群获得单元2031可以用于执行子步骤S1031。
残差获取单元2032,用于获取中间模型群中每个模型的残差。
在本发明实施例中,残差获取单元2032可以用于执行子步骤S1032。
最终模型群获得单元2033,用于对中间模型群中每个模型的残差进行残差检验,若残差为白噪声则保留该模型,若残差非白噪声则剔除该模型,以得到最终模型群。
在本发明实施例中,最终模型群获得单元2033可以用于执行子步骤S1033。
最终模型获得模块204,用于对最终模型群进行筛选,得到最终模型。
在本发明实施例中,最终模型获得模块204可以用于执行步骤S104。
请参照图14,图14为图11示出的时间序列模型建立装置200中最终模型获得模块204的方框示意图。最终模型获得模块204包括aicc值计算单元2041、备选模型获得单元2042、显著性判断单元2043、第一执行单元2044及第二执行单元2045。
aicc值计算单元2041,用于计算最终模型群中每个模型的aicc值。
在本发明实施例中,aicc值计算单元2041可以用于执行子步骤S1041。
备选模型获得单元2042,用于获取aicc值最小的模型,并将该模型作为备选模型。
在本发明实施例中,备选模型获得单元2042可以用于执行子步骤S1042。
显著性判断单元2043,用于对备选模型进行t检验,以判断备选模型的自回归系数是否具有显著性。
在本发明实施例中,显著性判断单元2043可以用于执行子步骤S1043。
第一执行单元2044,用于当自回归系数具有显著性时,设置备选模型为最终模型。
在本发明实施例中,第一执行单元2044可以用于执行子步骤S1044。
第二执行单元2045,用于当自回归系数不具有显著性时,对备选模型进行疏系数分析,以得到最终模型。
在本发明实施例中,第二执行单元2045可以用于执行子步骤S1045。
图15为图14示出的最终模型获得模块204中第二执行单元2045的方框示意图。第二执行单元2045包括疏系数模型建立单元20451、aicc值获取单元20452、第一子执行单元20453及第二子执行单元20454。
疏系数模型建立单元20451,用于根据备选模型,建立疏系数模型。
在本发明实施例中,疏系数模型建立单元20451可以用于执行子步骤S10451。
aicc值获取单元20452,用于获取疏系数模型的aicc值。
在本发明实施例中,aicc值获取单元20452可以用于执行子步骤S10452。
第一子执行单元20453,用于当备选模型的aicc值小于疏系数模型的aicc值时,设置备选模型为最终模型。
在本发明实施例中,第一子执行单元20453可以用于执行子步骤S10453。
第二子执行单元20454,用于当疏系数模型的aicc值小于备选模型的aicc值时,设置疏系数模型为最终模型。
在本发明实施例中,第二子执行单元20454可以用于执行子步骤S10454。
预测数据序列获得模块205,用于根据最终模型,得到银行的预测数据序列。
在本发明实施例中,预测数据序列获得模块205可以用于执行步骤S105。
请参照图16,图16为图11示出的时间序列模型建立装置200中预测数据序列获得模块205的方框示意图。预测数据序列获得模块205包括模型预测单元2051及异常值检测单元2052。
模型预测单元2051,用于利用最终模型,输出银行的预测数据序列。
在本发明实施例中,模型预测单元2051可以用于执行子步骤S1051。
异常值检测单元2052,用于利用Bonferroni算法,检测历史数据序列和预测数据序列中的异常值。
在本发明实施例中,异常值检测单元2052可以用于执行子步骤S1052。
综上所述,本发明提供的一种时间序列模型建立方法及装置,应用于银行的电子设备,用于对银行的资产负债进行预测,所述方法包括:获取所述银行的历史数据序列;判断历史数据序列是否满足预设条件;当历史数据序列满足预设条件时,对历史数据序列进行多次模型拟合,得到最终模型群;对最终模型群进行筛选,得到最终模型;根据最终模型,得到银行的预测数据序列。本发明提供的时间序列模型建立方法,首先,在时间序列模型建立之前对历史数据序列进行白噪声检验,可以确保预测结果的准确性及整个运算的严谨性;其次,实际应用中很多历史数据序列是不平稳的或是白噪声序列,因此针对纯随机序列使用滑动平均法进行预测,可以确保时间序列模型的稳健性;再次,使用了多次差分和多次定阶的相互组合的循环运算的架构,计算每一种参数组合的误差,最后选定误差最小的模型作为最终模型,输出该模型的运算结果。在这个过程中,建立了192个模型,并选择aicc值最小的作为最终模型,显著优于auto.arima只计算一次定阶和差分的运算方式;最后,本发明提供的时间序列模型建立方法,最终输出包括预测数据序列及其80%和95%置信区间、预测数据序列的折线图与其80%和95%置信区间对应的面积图、最终模型的自回归系数及aicc值、最终模型群中各模型的系数与对应的aicc值,显著优于只输出预测值和预测图的auto.arima。因此,本发明在运算过程中可以确保最终模型达到最好的拟合效果,得到的银行未来一段时间内的预测数据序列更加准确,可以有效引导银行资产负债结构的调整趋势,具有良好的应用价值。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

Claims (10)

1.一种时间序列模型建立方法,其特征在于,应用于银行的电子设备,用于对所述银行的资产负债进行预测,所述方法包括:
获取所述银行的历史数据序列;
判断历史数据序列是否满足预设条件;
当所述历史数据序列满足预设条件时,对所述历史数据序列进行多次模型拟合,得到最终模型群;
对所述最终模型群进行筛选,得到最终模型;
根据所述最终模型,得到所述银行的预测数据序列。
2.如权利要求1所述的方法,其特征在于,所述判断历史数据序列是否满足预设条件的步骤,还包括:
对所述历史数据序列进行白噪声检验,以判断所述历史数据序列是否为纯随机序列;
当所述历史数据序列不是纯随机序列时,对所述历史数据序列进行平稳性检验,以判断所述历史数据序列是否为平稳序列;
当所述历史数据序列不是平稳序列时,对所述历史数据序列进行定阶差分,以得到平稳序列;
当所述历史数据序列是平稳序列时,判定所述历史数据序列满足预设条件。
3.如权利要求1所述的方法,其特征在于,所述对历史数据序列进行多次模型拟合,得到最终模型群的步骤,包括:
对所述历史数据序列进行多次模型拟合,建立多个模型,构成一个中间模型群;
获取所述中间模型群中每个模型的残差;
对所述中间模型群中每个模型的残差进行残差检验,若残差为白噪声则保留该模型,若残差非白噪声则剔除该模型,以得到最终模型群。
4.如权利要求1所述的方法,其特征在于,所述对最终模型群进行筛选,得到最终模型的步骤,包括:
计算最终模型群中每个模型的aicc值;
获取aicc值最小的模型,并将该模型作为备选模型;
对所述备选模型进行t检验,以判断所述备选模型的自回归系数是否具有显著性;
当所述自回归系数具有显著性时,设置所述备选模型为所述最终模型;
当所述自回归系数不具有显著性时,对所述备选模型进行疏系数分析,以得到所述最终模型。
5.如权利要求4所述的方法,其特征在于,所述对备选模型进行疏系数分析,以得到所述最终模型的步骤,包括:
根据所述备选模型,建立疏系数模型;
获取所述疏系数模型的aicc值;
当所述备选模型的aicc值小于所述疏系数模型的aicc值时,设置所述备选模型为最终模型;
当所述疏系数模型的aicc值小于所述备选模型的aicc值时,设置所述疏系数模型为最终模型。
6.如权利要求1所述的方法,其特征在于,所述根据最终模型,得到所述银行的预测数据序列的步骤,包括:
利用所述最终模型,输出所述银行的预测数据序列;
利用Bonferroni算法,检测所述历史数据序列和所述预测数据序列中的异常值。
7.一种时间序列模型建立装置,其特征在于,应用于银行的电子设备,用于对所述银行的资产负债进行预测,所述装置包括:
历史数据序列获取模块,用于获取所述银行的历史数据序列;
判断模块,用于判断历史数据序列是否满足预设条件;
最终模型群获得模块,用于当所述历史数据序列满足预设条件时,对所述历史数据序列进行多次模型拟合,得到最终模型群;
最终模型获得模块,用于对所述最终模型群进行筛选,得到最终模型;
预测数据序列获得模块,用于根据所述最终模型,得到所述银行的预测数据序列。
8.如权利要求7所述的装置,其特征在于,所述判断模块包括:
白噪声检验单元,用于对所述历史数据序列进行白噪声检验,以判断所述历史数据序列是否为纯随机序列;
平稳性检验单元,用于当所述历史数据序列不是纯随机序列时,对所述历史数据序列进行平稳性检验,以判断所述历史数据序列是否为平稳序列;
定阶差分单元,用于当所述历史数据序列不是平稳序列时,对所述历史数据序列进行定阶差分,以得到平稳序列;
判定单元,当所述历史数据序列是平稳序列时,判定所述历史数据序列满足预设条件。
9.如权利要求7所述的装置,其特征在于,所述最终模型获得模块包括:
aicc值计算单元,用于计算最终模型群中每个模型的aicc值;
备选模型获得单元,用于获取aicc值最小的模型,并将该模型作为备选模型;
显著性判断单元,用于对所述备选模型进行t检验,以判断所述备选模型的自回归系数是否具有显著性;
第一执行单元,用于当所述自回归系数具有显著性时,设置所述备选模型为所述最终模型;
第二执行单元,用于当所述自回归系数不具有显著性时,对所述备选模型进行疏系数分析,以得到所述最终模型。
10.如权利要求9所述的装置,其特征在于,所述第二执行单元包括:
疏系数模型建立单元,用于根据所述备选模型,建立疏系数模型;
aicc值获取单元,用于获取所述疏系数模型的aicc值;
第一子执行单元,用于当所述备选模型的aicc值小于所述疏系数模型的aicc值时,设置所述备选模型为最终模型;
第二子执行单元,用于当所述疏系数模型的aicc值小于所述备选模型的aicc值时,设置所述疏系数模型为最终模型。
CN201710878449.1A 2017-09-26 2017-09-26 时间序列模型建立方法及装置 Pending CN107633331A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710878449.1A CN107633331A (zh) 2017-09-26 2017-09-26 时间序列模型建立方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710878449.1A CN107633331A (zh) 2017-09-26 2017-09-26 时间序列模型建立方法及装置

Publications (1)

Publication Number Publication Date
CN107633331A true CN107633331A (zh) 2018-01-26

Family

ID=61103798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710878449.1A Pending CN107633331A (zh) 2017-09-26 2017-09-26 时间序列模型建立方法及装置

Country Status (1)

Country Link
CN (1) CN107633331A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108389631A (zh) * 2018-02-07 2018-08-10 平安科技(深圳)有限公司 水痘发病预警方法、服务器及计算机可读存储介质
CN109783877A (zh) * 2018-12-19 2019-05-21 平安科技(深圳)有限公司 时间序列模型建立方法、装置、计算机设备和存储介质
CN110163122A (zh) * 2019-04-30 2019-08-23 中国科学院西安光学精密机械研究所 一种基于半监督字典学习的拥挤人群异常检测方法及***
CN110365518A (zh) * 2019-06-05 2019-10-22 华南理工大学 OpenStack基于应用服务的虚拟机带宽分配方法
CN110378541A (zh) * 2019-08-08 2019-10-25 上海交通大学 一种风功率短期多步预测方法及装置
CN110570322A (zh) * 2019-09-17 2019-12-13 西北农林科技大学 一种基于时间序列仿真的农业气象指数保险费率厘定方法
CN110930258A (zh) * 2019-11-15 2020-03-27 安徽海汇金融投资集团有限公司 一种应收账款融资变现规模预测方法及***
CN111414999A (zh) * 2020-04-27 2020-07-14 新智数字科技有限公司 一种设备运行状态的监测方法及装置
CN112508283A (zh) * 2020-12-12 2021-03-16 广东电力信息科技有限公司 一种时间序列模型的构建方法、装置
CN117474165A (zh) * 2023-11-03 2024-01-30 太原向明智控科技有限公司 一种基于支持向量机的矿压预测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657788A (zh) * 2015-02-04 2015-05-27 国家电网公司 基于行业景气指数的重点行业用电量预测方法
CN104794112A (zh) * 2014-01-16 2015-07-22 ***通信集团山西有限公司 时间序列处理方法及装置
CN104899663A (zh) * 2015-06-17 2015-09-09 北京奇虎科技有限公司 一种数据预测方法和装置
CN105046045A (zh) * 2015-06-05 2015-11-11 河海大学 一种基于贝叶斯组合的Web服务QoS预测方法
US20160055494A1 (en) * 2014-08-19 2016-02-25 Boyi Ni Booking based demand forecast
CN105974495A (zh) * 2016-04-29 2016-09-28 中国科学院遥感与数字地球研究所 利用分类拟合法预判目标区域未来平均云量的方法
CN106295888A (zh) * 2016-08-12 2017-01-04 东南大学 一种基于实测数据的公共建筑物配建停车泊位共享时间窗口确定方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794112A (zh) * 2014-01-16 2015-07-22 ***通信集团山西有限公司 时间序列处理方法及装置
US20160055494A1 (en) * 2014-08-19 2016-02-25 Boyi Ni Booking based demand forecast
CN104657788A (zh) * 2015-02-04 2015-05-27 国家电网公司 基于行业景气指数的重点行业用电量预测方法
CN105046045A (zh) * 2015-06-05 2015-11-11 河海大学 一种基于贝叶斯组合的Web服务QoS预测方法
CN104899663A (zh) * 2015-06-17 2015-09-09 北京奇虎科技有限公司 一种数据预测方法和装置
CN105974495A (zh) * 2016-04-29 2016-09-28 中国科学院遥感与数字地球研究所 利用分类拟合法预判目标区域未来平均云量的方法
CN106295888A (zh) * 2016-08-12 2017-01-04 东南大学 一种基于实测数据的公共建筑物配建停车泊位共享时间窗口确定方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘明: "《线性回归模型基础应用问题研究》", 31 December 2016, 北京:中国统计出版社 *
孙继国等: "我国银行间同业拆借利率的时间序列预测模型", 《统计与决策》 *
王德发: "《计量经济学》", 30 September 2016, 上海:上海财经大学出版社 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108389631A (zh) * 2018-02-07 2018-08-10 平安科技(深圳)有限公司 水痘发病预警方法、服务器及计算机可读存储介质
CN109783877A (zh) * 2018-12-19 2019-05-21 平安科技(深圳)有限公司 时间序列模型建立方法、装置、计算机设备和存储介质
CN109783877B (zh) * 2018-12-19 2024-03-01 平安科技(深圳)有限公司 时间序列模型建立方法、装置、计算机设备和存储介质
CN110163122A (zh) * 2019-04-30 2019-08-23 中国科学院西安光学精密机械研究所 一种基于半监督字典学习的拥挤人群异常检测方法及***
CN110365518A (zh) * 2019-06-05 2019-10-22 华南理工大学 OpenStack基于应用服务的虚拟机带宽分配方法
CN110378541A (zh) * 2019-08-08 2019-10-25 上海交通大学 一种风功率短期多步预测方法及装置
CN110570322B (zh) * 2019-09-17 2023-09-12 西北农林科技大学 一种基于时间序列仿真的农业气象指数保险费率厘定方法
CN110570322A (zh) * 2019-09-17 2019-12-13 西北农林科技大学 一种基于时间序列仿真的农业气象指数保险费率厘定方法
CN110930258A (zh) * 2019-11-15 2020-03-27 安徽海汇金融投资集团有限公司 一种应收账款融资变现规模预测方法及***
CN111414999B (zh) * 2020-04-27 2023-08-22 新奥新智科技有限公司 一种设备运行状态的监测方法及装置
CN111414999A (zh) * 2020-04-27 2020-07-14 新智数字科技有限公司 一种设备运行状态的监测方法及装置
CN112508283A (zh) * 2020-12-12 2021-03-16 广东电力信息科技有限公司 一种时间序列模型的构建方法、装置
CN117474165A (zh) * 2023-11-03 2024-01-30 太原向明智控科技有限公司 一种基于支持向量机的矿压预测方法

Similar Documents

Publication Publication Date Title
CN107633331A (zh) 时间序列模型建立方法及装置
CN107818344B (zh) 用户行为进行分类和预测的方法和***
CN106651057B (zh) 一种基于安装包序列表的移动端用户年龄预测方法
JP6869347B2 (ja) リスク制御イベント自動処理の方法および装置
US10528533B2 (en) Anomaly detection at coarser granularity of data
WO2020078059A1 (zh) 一种异常检测的解释特征确定方法和装置
CN109976997A (zh) 测试方法和装置
CN110929799B (zh) 用于检测异常用户的方法、电子设备和计算机可读介质
CN110472802B (zh) 一种数据特征评估方法、装置及设备
CN102955902A (zh) 雷达模拟设备可信度的评估方法及评估***
CN111797861A (zh) 信息处理方法、装置、存储介质及电子设备
CN109213554A (zh) 一种图标布局方法、计算机可读存储介质及终端设备
CN112131322A (zh) 时间序列分类方法及装置
CN116684330A (zh) 基于人工智能的流量预测方法、装置、设备及存储介质
CN107067276A (zh) 确定对象影响力的方法及装置
CN109308660B (zh) 一种征信评分模型评估方法、装置、设备及存储介质
CN113626734A (zh) 用户行为引导方法、装置、电子设备及存储介质
CN114417982A (zh) 一种模型训练方法、终端设备及计算机可读存储介质
CN112927050A (zh) 待推荐金融产品确定方法、装置、电子设备及存储介质
CN111898027A (zh) 确定特征维度的方法、装置、电子设备和计算机可读介质
CN109145217A (zh) 移动终端的上网数据分析的方法、装置、设备和存储介质
Song Big Data Analysis Using Machine Learning for Social Scientists and Criminologists
Yang et al. Cluster Data Streams with Noisy Variables
CN112214387B (zh) 基于知识图谱的用户操作行为预测方法及装置
WO2023155425A1 (zh) 调货方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180126