CN110175689A - 一种概率预测的方法、模型训练的方法及装置 - Google Patents

一种概率预测的方法、模型训练的方法及装置 Download PDF

Info

Publication number
CN110175689A
CN110175689A CN201811447475.XA CN201811447475A CN110175689A CN 110175689 A CN110175689 A CN 110175689A CN 201811447475 A CN201811447475 A CN 201811447475A CN 110175689 A CN110175689 A CN 110175689A
Authority
CN
China
Prior art keywords
sequence
target
indicate
parameter
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811447475.XA
Other languages
English (en)
Inventor
严兴
张卫忠
马林
刘威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201811447475.XA priority Critical patent/CN110175689A/zh
Publication of CN110175689A publication Critical patent/CN110175689A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Optimization (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种概率预测的方法,包括:从历史时间序列中获取目标观测值序列,历史时间序列为待预测时刻之前的时间序列;根据目标观测值序列确定目标特征向量序列;通过概率预测模型获取目标特征向量序列所对应的目标变量参数集合,目标变量参数集合中包含至少一个目标变量参数;采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数,第二分位数函数用于预测待预测时刻下的概率分布,概率分布用于评估目标风险等级。本发明实施例公开了一种模型训练的方法以及服务器。本发明提供的非线性的分位数函数能够更好地表达出复杂因素对概率的影响,从而提升概率预测的准确度。

Description

一种概率预测的方法、模型训练的方法及装置
技术领域
本发明涉及人工智能领域,尤其涉及一种概率信息预测的方法、模型训练的方法及装置。
背景技术
概率跟人们日常生活和生产实践的关系非常密切,在生活的各个领域中应用范围相当广泛,包括自然科学、社会科学、工商管理、天气预报、生物学以及计算机与通信领域。工业的产品抽样调查、福利彩票、体育以及地震预告也涉及到数学科中的概率知识。
概率预测能够提供一系列的概率预测值,从而更完整地描述响应条件的分布情况。目前,通常可以利用分布参数对过去信息进行建模,由此得到线性自回归模型,采用该线性自回归模型预测概率。
然而,在实际应用中,预测概率往往需要考虑较多的因素,这些因素是非常复杂的,但是线性自回归模型难以表达出复杂因素对概率的影响,由此导致线性自回归模型在概率预测方面存在较大的局限,尤其在噪声较大或者随机性较大的条件下,不利于概率预测的准确度。
发明内容
本发明实施例提供了一种概率预测的方法、模型训练的方法及装置,对于噪声或随机性较大的复杂时间序列,可以采用模型先预测其目标变量参数,然后利用目标变量参数对线性分位数函数进行处理,由此得到非线性的分位数函数,非线性的分位数函数能够更好地表达出复杂因素对概率的影响,从而提升概率预测的准确度。
有鉴于此,本发明的第一方面提供了一种概率预测的方法,包括:
从历史时间序列中获取目标观测值序列,其中,所述历史时间序列为待预测时刻之前的时间序列,所述目标观测值序列包含L个目标观测值,所述L为大于或等于1的整数;
根据所述目标观测值序列确定目标特征向量序列,其中,所述目标特征向量序列中包含L个目标特征向量;
通过概率预测模型获取所述目标特征向量序列所对应的目标变量参数集合,其中,所述目标变量参数集合中包含至少一个目标变量参数;
采用所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,其中,所述第二分位数函数用于预测所述待预测时刻下的概率分布,所述概率分布用于评估目标风险等级。
本发明的第二方面提供了一种模型训练的方法,包括:
从待训练时间序列中获取观测值序列,其中,所述观测值序列包含L个观测值,所述L为大于或等于1的整数;
根据所述观测值序列确定特征向量序列,其中,所述特征向量序列中包含L个特征向量;
通过深层神经网络DNN模型获取所述特征向量序列所对应的变量参数集合,其中,所述变量参数集合中包含至少一个变量参数;
采用所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
根据所述第二分位数函数以及概率水平参数集合确定模型参数,其中,所述概率水平参数集合包含至少一个概率水平参数,其中,所述概率水平参数为大于或等于0,且小于或等于1的预设概率值;
采用所述模型参数对所述DNN模型进行训练,得到概率预测模型。
本发明的第三方面提供了一种概率预测装置,包括:
获取模块,用于从历史时间序列中获取目标观测值序列,其中,所述历史时间序列为待预测时刻之前的时间序列,所述目标观测值序列包含L个目标观测值,所述L为大于或等于1的整数;
确定模块,用于根据所述获取模块获取的所述目标观测值序列确定目标特征向量序列,其中,所述目标特征向量序列中包含L个目标特征向量;
所述获取模块,还用于通过概率预测模型获取所述确定模块确定的所述目标特征向量序列所对应的目标变量参数集合,其中,所述目标变量参数集合中包含至少一个目标变量参数;
处理模块,用于采用所述获取模块获取的所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,其中,所述第二分位数函数用于预测所述待预测时刻下的概率分布,所述概率分布用于评估目标风险等级。
在一种可能的设计中,在本申请实施例的第三方面的第一种实现方式中,
所述确定模块,具体用于采用如下方式计算所述目标特征向量序列:
其中,所述表示所述目标特征向量序列中的第1个目标特征向量,所述表示所述目标特征向量序列中的第L个目标特征向量,所述L表示目标观测值序列中目标观测值的总个数,所述t'表示所述待预测时刻,所述rt'-L表示所述目标观测值序列中第t'-L个时刻的观测值,所述rt'-1表示所述目标观测值序列中第t'-1个时刻的观测值,所述表示目标观测值均值,所述i为大于或等于1,且小于或等于所述L的整数。
在一种可能的设计中,在本申请实施例的第三方面的第二种实现方式中,
所述获取模块,具体用于采用如下方式计算所述目标变量参数集合:
t't',ut',vt']T=tanh(Woht'+bο);
其中,所述μt'表示所述目标变量参数集合中所述第t'个时刻的位置参数,所述σt'表示所述目标变量参数集合中所述第t'个时刻的尺度参数,所述ut'表示所述目标变量参数集合中所述第t'个时刻的右边重尾程度,所述vt'表示所述目标变量参数集合中所述第t'个时刻的左边重尾程度,所述Wο表示第一模型参数,所述bο表示所述第二模型参数,所述θ表示第三模型参数,所述ht'表示所述第t'个时刻的隐藏层向量,所述[]T表示转置计算,所述tanh()表示双曲正切函数。
在一种可能的设计中,在本申请实施例的第三方面的第三种实现方式中,
所述获取模块,具体用于采用如下方式获取所述第二分位数函数:
其中,所述Q(τ\μt't',ut',vt')表示所述第二分位数函数,所述Zτ'表示所述第一分位数函数,所述τ表示概率水平参数,所述A表示预设常数,所述e表示自然对数的底数。
在一种可能的设计中,在本申请实施例的第三方面的第四种实现方式中,所述概率预测装置还包括生成模块以及计算模块;
所述生成模块,用于所述处理模块采用所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数之后,随机生成第一模拟数据集合,其中,所述第一模拟数据集合包括至少一个第一模拟数据,所述第一模拟数据满足所述第二分位数函数;
所述计算模块,用于根据所述第二分位数函数计算所述生成模块生成的所述第一模拟数据集合对应的第二模拟数据集合,其中,所述第二模拟数据集合包括至少一个第二模拟数据,且所述第二模拟数据集合中数据个数与所述第一模拟数据集合中的数据个数相等;
所述确定模块,还用于根据所述计算模块计算得到的所述第二模拟数据集合确定目标风险等级;
其中,所述计算模块,具体用于采用如下方式计算所述第二模拟数据集合:
其中,所述μt'表示所述目标变量参数集合中所述第t'个时刻的位置参数,所述σt'表示所述目标变量参数集合中所述第t'个时刻的尺度参数,所述ut'表示所述目标变量参数集合中所述第t'个时刻的右边重尾程度,所述vt'表示所述目标变量参数集合中所述第t'个时刻的左边重尾程度,所述A表示预设常数,所述e表示自然对数的底数,所述xi表示所述第一模拟数据集合中第i个第一模拟数据,所述Yi表示所述第二模拟数据集合中第i个第二模拟数据。
在一种可能的设计中,在本申请实施例的第三方面的第五种实现方式中,
所述确定模块,具体用于根据所述第二模拟数据集合计算得到待评测数据;
按照风险评价规则确定所述待评测数据所对应的所述目标风险等级,其中,所述风险评价规则为预先设置的评测数据范围与风险等级之间的关系。
本发明的第四方面提供了一种模型训练装置,包括:
获取模块,用于从待训练时间序列中获取观测值序列,其中,所述观测值序列包含L个观测值,所述L为大于或等于1的整数;
确定模块,用于根据所述待训练时间序列以及所述获取模块获取的所述观测值序列确定特征向量序列,其中,所述特征向量序列中包含L个特征向量;
所述获取模块,还用于通过深层神经网络DNN模型获取所述确定模块确定的所述特征向量序列所对应的变量参数集合,其中,所述变量参数集合中包含至少一个变量参数;
处理模块,用于采用所述获取模块获取的所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
所述确定模块,还用于根据所述处理模块处理得到的所述第二分位数函数以及概率水平参数集合确定模型参数,其中,所述概率水平参数集合包含至少一个概率水平参数,其中,所述概率水平参数为大于或等于0,且小于或等于1的预设概率值;
训练模块,用于采用所述确定模块确定的所述模型参数对所述DNN模型进行训练,得到概率预测模型。
在一种可能的设计中,在本申请实施例的第四方面的第一种实现方式中,
所述确定模块,具体用于采用如下方式计算所述特征向量序列:
其中,所述表示所述特征向量序列中的第1个特征向量,所述表示所述特征向量序列中的第L个特征向量,所述L表示所述特征向量序列中特征向量的总个数,所述t表示所述待训练时间序列中的第t个时刻,所述rt-L表示所述观测值序列中第t-L个时刻的观测值,所述rt-1表示所述观测值序列中第t-1个时刻的观测值,所述表示观测值均值,所述i为大于或等于1,且小于或等于所述L的整数。
在一种可能的设计中,在本申请实施例的第四方面的第二种实现方式中,
所述获取模块,具体用于采用如下方式计算所述变量参数集合:
tt,ut,vt]T=tanh(W0ht+b0);
其中,所述μt表示所述变量参数集合中所述第t个时刻的位置参数,所述σt表示所述变量参数集合中所述第t个时刻的尺度参数,所述ut表示所述变量参数集合中所述第t个时刻的右边重尾程度,所述vt表示所述变量参数集合中所述第t个时刻的左边重尾程度,所述W0表示第一初始模型参数,所述b0表示所述第二初始模型参数,所述θ0表示第三初始模型参数,所述ht表示所述第t个时刻的隐藏层向量,所述[]T表示转置计算,所述tanh()表示双曲正切函数。
在一种可能的设计中,在本申请实施例的第四方面的第三种实现方式中,
所述处理模块,具体用于采用如下方式获取所述第二分位数函数:
其中,所述Q(τ\μtt,ut,vt)表示所述第二分位数函数,所述Zτ表示所述第一分位数函数,所述τ表示概率水平参数,所述A表示预设常数,所述e表示自然对数的底数。
在一种可能的设计中,在本申请实施例的第四方面的第四种实现方式中,
所述确定模块,具体用于采用如下方式计算所述模型参数:
其中,所述min表示取最小值,所述Wο表示第一模型参数,所述bο表示所述第二模型参数,所述θ表示第三模型参数,所述K表示所述概率水平参数集合中概率水平参数的总个数,所述k表示所述概率水平参数集合中的第k个概率水平参数,所述T表示所述待训练时间序列中时刻的总个数,所述t表示所述待训练时间序列中的第t个时刻,所述L表示观测值序列中观测值的总个数,所述表示针对概率水平参数为τk的损失函数,所述rt表示所述待训练时间序列,所述Q(τktt,ut,vt)表示针对概率水平参数为τk的所述第二分位数函数。
本申请第五方面提供一种服务器,包括:存储器、收发器、处理器以及总线***;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
从历史时间序列中获取目标观测值序列,其中,所述历史时间序列为待预测时刻之前的时间序列,所述目标观测值序列包含L个目标观测值,所述L为大于或等于1的整数;
根据所述目标观测值序列确定目标特征向量序列,其中,所述目标特征向量序列中包含L个目标特征向量;
通过概率预测模型获取所述目标特征向量序列所对应的目标变量参数集合,其中,所述目标变量参数集合中包含至少一个目标变量参数;
采用所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,其中,所述第二分位数函数用于预测所述待预测时刻下的概率分布,所述概率分布用于评估目标风险等级;
所述总线***用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
在一种可能的设计中,在本申请实施例的第五方面的第一种实现方式中,所述处理器具体用于执行如下步骤:
采用如下方式计算所述目标特征向量序列:
其中,所述表示所述目标特征向量序列中的第1个目标特征向量,所述表示所述目标特征向量序列中的第L个目标特征向量,所述L表示目标观测值序列中目标观测值的总个数,所述t'表示所述待预测时刻,所述rt'-L表示所述目标观测值序列中第t'-L个时刻的观测值,所述rt'-1表示所述目标观测值序列中第t'-1个时刻的观测值,所述表示目标观测值均值,所述i为大于或等于1,且小于或等于所述L的整数。
在一种可能的设计中,在本申请实施例的第五方面的第二种实现方式中,所述处理器具体用于执行如下步骤:
采用如下方式计算所述目标变量参数集合:
t't',ut',vt']T=tanh(Woht'+bο);
其中,所述μt'表示所述目标变量参数集合中所述第t'个时刻的位置参数,所述σt'表示所述目标变量参数集合中所述第t'个时刻的尺度参数,所述ut'表示所述目标变量参数集合中所述第t'个时刻的右边重尾程度,所述vt'表示所述目标变量参数集合中所述第t'个时刻的左边重尾程度,所述Wο表示第一模型参数,所述bο表示所述第二模型参数,所述θ表示第三模型参数,所述ht'表示所述第t'个时刻的隐藏层向量,所述[]T表示转置计算,所述tanh()表示双曲正切函数。
在一种可能的设计中,在本申请实施例的第五方面的第三种实现方式中,所述处理器具体用于执行如下步骤:
采用如下方式获取所述第二分位数函数:
其中,所述Q(τ\μt't',ut',vt')表示所述第二分位数函数,所述Zτ'表示所述第一分位数函数,所述τ表示概率水平参数,所述A表示预设常数,所述e表示自然对数的底数。
在一种可能的设计中,在本申请实施例的第五方面的第四种实现方式中,所述处理器还用于执行如下步骤:
随机生成第一模拟数据集合,其中,所述第一模拟数据集合包括至少一个第一模拟数据,所述第一模拟数据满足所述第二分位数函数;
根据所述第二分位数函数计算所述第一模拟数据集合对应的第二模拟数据集合,其中,所述第二模拟数据集合包括至少一个第二模拟数据,且所述第二模拟数据集合中数据个数与所述第一模拟数据集合中的数据个数相等;
根据所述第二模拟数据集合确定目标风险等级;
其中,所述根据所述第二分位数函数计算所述第一模拟数据集合对应的第二模拟数据集合,包括:
采用如下方式计算所述第二模拟数据集合:
其中,所述μt'表示所述目标变量参数集合中所述第t'个时刻的位置参数,所述σt'表示所述目标变量参数集合中所述第t'个时刻的尺度参数,所述ut'表示所述目标变量参数集合中所述第t'个时刻的右边重尾程度,所述vt'表示所述目标变量参数集合中所述第t'个时刻的左边重尾程度,所述A表示预设常数,所述e表示自然对数的底数,所述xi表示所述第一模拟数据集合中第i个第一模拟数据,所述Yi表示所述第二模拟数据集合中第i个第二模拟数据。
在一种可能的设计中,在本申请实施例的第五方面的第五种实现方式中,所述处理器具体用于执行如下步骤:
根据所述第二模拟数据集合计算得到待评测数据;
按照风险评价规则确定所述待评测数据所对应的所述目标风险等级,其中,所述风险评价规则为预先设置的评测数据范围与风险等级之间的关系。
本申请第六方面提供一种服务器,包括:存储器、收发器、处理器以及总线***;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
从待训练时间序列中获取观测值序列,其中,所述观测值序列包含L个观测值,所述L为大于或等于1的整数;
根据所述观测值序列确定特征向量序列,其中,所述特征向量序列中包含L个特征向量;
通过深层神经网络DNN模型获取所述特征向量序列所对应的变量参数集合,其中,所述变量参数集合中包含至少一个变量参数;
采用所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
根据所述第二分位数函数以及概率水平参数集合确定模型参数,其中,所述概率水平参数集合包含至少一个概率水平参数,其中,所述概率水平参数为大于或等于0,且小于或等于1的预设概率值;
采用所述模型参数对所述DNN模型进行训练,得到概率预测模型;
所述总线***用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
在一种可能的设计中,在本申请实施例的第六方面的第一种实现方式中,所述处理器具体用于执行如下步骤:
采用如下方式计算所述特征向量序列:
其中,所述表示所述特征向量序列中的第1个特征向量,所述表示所述特征向量序列中的第L个特征向量,所述L表示所述特征向量序列中特征向量的总个数,所述t表示所述待训练时间序列中的第t个时刻,所述rt-L表示所述观测值序列中第t-L个时刻的观测值,所述rt-1表示所述观测值序列中第t-1个时刻的观测值,所述表示观测值均值,所述i为大于或等于1,且小于或等于所述L的整数。
在一种可能的设计中,在本申请实施例的第六方面的第二种实现方式中,所述处理器具体用于执行如下步骤:
采用如下方式计算所述变量参数集合:
tt,ut,vt]T=tanh(W0ht+b0);
其中,所述μt表示所述变量参数集合中所述第t个时刻的位置参数,所述σt表示所述变量参数集合中所述第t个时刻的尺度参数,所述ut表示所述变量参数集合中所述第t个时刻的右边重尾程度,所述vt表示所述变量参数集合中所述第t个时刻的左边重尾程度,所述W0表示第一初始模型参数,所述b0表示所述第二初始模型参数,所述θ0表示第三初始模型参数,所述ht表示所述第t个时刻的隐藏层向量,所述[]T表示转置计算,所述tanh()表示双曲正切函数。
在一种可能的设计中,在本申请实施例的第六方面的第三种实现方式中,所述处理器具体用于执行如下步骤:
采用如下方式获取所述第二分位数函数:
其中,所述Q(τ\μtt,ut,vt)表示所述第二分位数函数,所述Zτ表示所述第一分位数函数,所述τ表示概率水平参数,所述A表示预设常数,所述e表示自然对数的底数。
在一种可能的设计中,在本申请实施例的第六方面的第四种实现方式中,所述处理器具体用于执行如下步骤:
采用如下方式计算所述模型参数:
其中,所述min表示取最小值,所述Wο表示第一模型参数,所述bο表示所述第二模型参数,所述θ表示第三模型参数,所述K表示所述概率水平参数集合中概率水平参数的总个数,所述k表示所述概率水平参数集合中的第k个概率水平参数,所述T表示所述待训练时间序列中时刻的总个数,所述t表示所述待训练时间序列中的第t个时刻,所述L表示观测值序列中观测值的总个数,所述表示针对概率水平参数为τk的损失函数,所述rt表示所述待训练时间序列,所述Q(τktt,ut,vt)表示针对概率水平参数为τk的所述第二分位数函数。
本发明的第七方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,提供了一种概率预测的方法,首先,服务器从历史时间序列中获取目标观测值序列,其中,历史时间序列为待预测时刻之前的时间序列,然后根据目标观测值序列确定目标特征向量序列,服务器再通过概率预测模型获取目标特征向量序列所对应的目标变量参数集合,最后,服务器采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数,其中,第二分位数函数用于预测待预测时刻下的概率分布,概率分布用于评估目标风险等级。通过上述方式,对于噪声或随机性较大的复杂时间序列,可以采用模型先预测其目标变量参数,然后利用目标变量参数对线性分位数函数进行处理,由此得到非线性的分位数函数,非线性的分位数函数能够更好地表达出复杂因素对概率的影响,从而提升概率预测的准确度。
附图说明
图1为本发明实施例中概率预测***的一个架构示意图;
图2为本发明实施例中模型训练***的一个框架示意图;
图3为本发明实施例中概率预测的方法一个实施例示意图;
图4为本发明实施例中评估股票风险等级的一个流程示意图;
图5为本发明实施例中模型训练的方法一个实施例示意图;
图6a为本发明实验数据中变量参数真实值与变量参数训练值的一个对比示意图;
图6b为本发明实验数据中变量参数真实值与变量参数训练值的另一个对比示意图;
图7为本发明实验数据中每日数据的标准普尔500指数一个走势示意图;
图8为本发明实验数据中5分钟钢筋数据的一个走势示意图;
图9为本发明实施例中概率预测装置一个实施例示意图;
图10为本发明实施例中概率预测装置另一个实施例示意图;
图11为本发明实施例中模型训练装置一个实施例示意图;
图12为本发明实施例中服务器一个结构示意图。
具体实施方式
本发明实施例提供了一种概率预测的方法、模型训练的方法及装置,对于噪声或随机性较大的复杂时间序列,可以采用模型先预测其目标变量参数,然后利用目标变量参数对线性分位数函数进行处理,由此得到非线性的分位数函数,非线性的分位数函数能够更好地表达出复杂因素对概率的影响,从而提升概率预测的准确度。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应理解,本发明主要用于预测噪声或随机性较大的复杂时间序列,具体可以提供时间序列的分位数预测服务,比如对股票指数、用电需求以及网络流量的某个概率水平下的分位数进行预测,也可以对网络视频的观看人数的分位数进行预测,进一步可以应用于风险管理以及紧急预案等场景。本发明定义了一种新型的分位数函数,该分位数函数对标准正态分布的分位数函数进行单调光滑的非线性变换,使得其对应的分布具有不对称的左右重尾。该分位数函数涉及到四个目标变量参数,这四个目标变量参数会随时间变化而更新,且目标变量参数的时变性是根据长短时记忆神经网络(Long Short-Term Memory,LSTM)建模得到的。具体而言,在当前时刻下,分位数函数的四个目标变量参数是由历史时间序列通过LSTM所输出的。
本发明建立了时间序列的分位数函数和目标变量参数对过去信息的依赖关系,因此能够准确地预测不同概率水平下的时间序列分位数函数。
为了便于理解,本发明提出了一种概率预测的方法,该方法应用于图1所示的概率预测***,请参阅图1,图1为本发明实施例中概率预测***的一个架构示意图,如图所示,用户登录客户端,客户端向服务器上报该用户的信息,服务器可以根据用户信息调用相应的历史数据。具体地,请参阅图2,图2为本发明实施例中模型训练***的一个框架示意图,如图所示,服务器从历史数据中提取部分数据进行建模,即获取rt-L至rt-1的数据,并将这些数据输入至LSTM中,由LSTM输出向量ht,通过双曲正切函数计算出四个目标变量参数,根据四个目标变量参数得到下一个时刻对应的rt分位数函数。我们选取若干个概率水平参数,将传统的分位数回归方法中的损失函数应用于rt的分位数函数,然后最小化求得模型中所有的未知模型参数。最后,服务器根据需求,利用模型预测下一个时刻数据,将预测得到的结果反馈至客户端,由此,用户能够得到更为准确的预测结果。需要说明的是,客户端部署于终端设备上,其中,终端设备包含但不仅限于平板电脑、笔记本电脑、掌上电脑、手机以及个人电脑(personal computer,PC),此处不做限定。
下面将对本发明中概率预测的方法进行介绍,请参阅图3,本发明实施例中概率预测的方法一个实施例包括:
101、从历史时间序列中获取目标观测值序列,其中,历史时间序列为待预测时刻之前的时间序列,目标观测值序列包含L个目标观测值,L为大于或等于1的整数;
本实施例中,首先获取历史时间序列,其中,该历史时间序列的数据量通常比较大,比如包括1000天的数据,考虑到数据量过大会降低预测的效率,因此,需要从历史时间序列中提取目标观测值序列,目标观测值序列中包括了L个目标观测值,L是大于或等于1的整数,可以取值100。
具体地,假设历史时间序列为rt'-1,rt'-2,…,rt'-1000,若取10个目标观测值,即L等于10,那么得到的目标观测值序列为rt'-1,rt'-2,rt'-3,rt'-4,rt'-5,rt'-6,rt'-7,rt'-8,rt'-9,rt'-10
102、根据目标观测值序列确定目标特征向量序列,其中,目标特征向量序列中包含L个目标特征向量;
本实施例中,接下来服务器需要根据目标观测值序列生成相应的目标特征向量序列,目标特征向量序列可以表示为即目标特征向量序列包括了L个特征向量。
103、通过概率预测模型获取目标特征向量序列所对应的目标变量参数集合,其中,目标变量参数集合中包含至少一个目标变量参数;
本实施例中,服务器通过已经训练好的概率预测模型获取目标特征向量序列所对应的目标变量参数集合,概率预测模型的学习方式可参阅图11所对应的各个实施例,此处暂不展开描述。具体地,服务器将步骤102中获取到的目标特征向量序列输入至概率预测模型,由该概率预测模型输出相应的目标变量参数集合,其中,目标变量参数集合中包含至少一个目标变量参数。
104、采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数,其中,第二分位数函数用于预测待预测时刻下的概率分布,概率分布用于评估目标风险等级。
本实施例中,服务器采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数,其中,第一分位数函数通常是线性的分位数函数,第二分位数函数则是非线性的分位数函数。在得到第二分位数函数之后,利用第二分位数函数预测下一个时刻的概率分布,最后,根据概率分布评估目标风险等级。
本发明实施例中,提供了一种概率预测的方法,首先,服务器从历史时间序列中获取目标观测值序列,其中,历史时间序列为待预测时刻之前的时间序列,然后根据目标观测值序列确定目标特征向量序列,服务器再通过概率预测模型获取目标特征向量序列所对应的目标变量参数集合,最后,服务器采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数,其中,第二分位数函数用于预测待预测时刻下的概率分布,概率分布用于评估目标风险等级。通过上述方式,对于噪声或随机性较大的复杂时间序列,可以采用模型先预测其目标变量参数,然后利用目标变量参数对线性分位数函数进行处理,由此得到非线性的分位数函数,非线性的分位数函数能够更好地表达出复杂因素对概率的影响,从而提升概率预测的准确度。
可选地,在上述图3对应的实施例的基础上,本发明实施例提供概率预测的方法第一个可选实施例中,根据目标观测值序列确定目标特征向量序列,可以包括:
采用如下方式计算目标特征向量序列:
其中,表示目标特征向量序列中的第1个目标特征向量,表示目标特征向量序列中的第L个目标特征向量,L表示目标观测值序列中目标观测值的总个数,t'表示待预测时刻,rt'-L表示目标观测值序列中第t'-L个时刻的观测值,rt'-1表示目标观测值序列中第t'-1个时刻的观测值,表示目标观测值均值,i为大于或等于1,且小于或等于L的整数。
本实施例中,将介绍如何生成目标特征向量序列。首先需要先计算得到目标观测值均值具体的计算方式如下:
其中,L表示目标特征向量序列中目标特征向量的总个数,此外,L也是目标观测值序列中目标观测值的总个数,假设L的取值为100,那么需要获取连续100天的历史数据,其中,这100天通常为最近的100天,因为距离当前时刻越近,越能够体现数据的时效性。可以理解的是,该历史数据是可以是一支或多支股票的收益情况,也可以是用电的情况,还可以是视频网站采集的播放流量等数据,此处不做限定。这些历史数据即为目标观测值序列,对整个目标观测值序列中的目标观测值做平均化处理,由此得到目标观测值均值
在选择了固定长度的子序列(即rt'-1至rt'-L的观测值序列)之后,可以构造目标特征向量序列,即得到目标特征向量序列
由此可见,目标特征向量序列的长度为L,维度为4,可以理解的是,对于特征向量序列的维度还可以进行变更,此处的维度4仅为一个示意,并不应理解为对本发明的限定。
其次,本发明实施例中,提供了一种根据目标观测值序列确定目标特征向量序列的具体方式。通过上述方式,采用目标特征向量序直截了当地表示了过去一段时间内的样本特征,并且提取四个维度的向量来表示样本,从而更完整地表达时间与数据之间的关系,有利于提升建模的可靠性。
可选地,在上述图3对应的第一个实施例的基础上,本发明实施例提供概率预测的方法第二个可选实施例中,通过概率预测模型获取目标特征向量序列所对应的目标变量参数集合,可以包括:
采用如下方式计算目标变量参数集合:
t't',ut',vt']T=tanh(Woht'+bο);
其中,μt'表示目标变量参数集合中第t'个时刻的位置参数,σt'表示目标变量参数集合中第t'个时刻的尺度参数,ut'表示目标变量参数集合中第t'个时刻的右边重尾程度,vt'表示目标变量参数集合中第t'个时刻的左边重尾程度,Wο表示第一模型参数,bο表示第二模型参数,θ表示第三模型参数,ht'表示第t'个时刻的隐藏层向量,[]T表示转置计算,tanh()表示双曲正切函数。
本实施例中,将介绍如何通过DNN模型获取目标特征向量序列所对应的目标变量参数集合,具体地,以DNN模型中的LSTM模型为例进行说明。LSTM模型具有已经生成好的模型参数,第一模型参数Wο、第二模型参数bο以及第三模型参数θ,这三个的模型参数是对最近一段时间内的数据经过训练后得到的,从而得到更加准确的模型。
将目标特征向量序列输入至LSTM模型中,由该LSTM模型输出第t'个时刻(即下一个时刻)的隐藏层向量ht'。将ht'输入至双切正切函数tanh()中,经过计算后输出四个目标变量参数,即第t'个时刻的位置参数μt',第t'个时刻的尺度参数σt',第t'个时刻的右边重尾程度ut'以及第t'个时刻的左边重尾程度vt'。其中,μt'属于实数,σt'属于正数,μt'影响函数图形的位置,而σt'影响函数图形的度量大小,ut'表示从函数中心线到右边尾部部分的概率分布情况,vt'表示从函数中心线到左边尾部部分的概率分布情况。两边尾部都比较厚的状况也被认为是一种重尾分布。
再次,本发明实施例中,提供了一种通过LSTM模型计算特征向量序列所对应的目标变量参数集合的方式。通过上述方式,采用LSTM模型输出隐藏层向量,尤其当每一个时间步长内有若干层时,隐藏层向量可以更好地反映数据在时间上的特征,而tanh()函数在特征相差明显时的效果会很好,在循环过程中会不断扩大特征效果。
可选地,在上述图3对应的第二个实施例的基础上,本发明实施例提供概率预测的方法第三个可选实施例中,采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数,可以包括:
采用如下方式获取第二分位数函数:
其中,Q(τ\μt't',ut',vt')表示第二分位数函数,Zτ'表示第一分位数函数,τ表示概率水平参数,A表示预设常数,e表示自然对数的底数。
本实施例中,介绍如何利用变量参数集合生成第二分位数函数的方式。即采用第t'个时刻的位置参数μt',第t'个时刻的尺度参数σt',第t'个时刻的右边重尾程度ut'以及第t'个时刻的左边重尾程度vt'这四个参数,对第一分位数函数Zτ'进行非线性变化。需要说明的是,第一分位数函数可以是概率密度函数(probability density function,PDF)、累积分布函数(cumulative distribution function,CDF)或者线性的分位数函数,此处不做限定。
具体地,构造一个简单的分位数函数,即表示第一分位数函数Zτ',使Zτ'在Q-Q图中具有可控形状,且为标准的正态分布。本发明提供的重尾分位数函数(Heavy-tailedQuantile Function,HTQF)具体如下形式:
其中,μt'属于位置参数,σt'属于尺度参数,A表示预设常数,通常是相对较大的常数,当ut'>0时控制第二分位数函数的“S形”上尾,即相应的分布右尾。当vt'<0时控制第二分位数函数的“S形”下尾,即相应的分布左尾。vt'和ut'越大,表示第二分位数函数的尾部越重。当vt'=ut'=0时,HTQF为正态分布的分位数函数。
基于HTQF,Zτ'先乘以两个因子,即以及然后乘以σt'并加上μt',为了便于计算,可以将μt'设置为0,并将σt'设置为1。因子fu是Zτ单调递增的凸函数,满足fu趋近于1,Zτ趋近于无穷。A的作用是让fu(0)和fv(0)接近于1,确保HTQF是随着Zτ单调递增。
进一步地,本发明实施例中,介绍了一种采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数的方式。通过上述方式,结合目标变量参数集合对概率密度函数、累积分布函数或者线性的分位数函数进行建模,从而得到非线性的分位数函数,而该非线性的分位数函数允许尾部发生变化,更贴近实际情况,且直观易懂。
可选地,在上述图3以及图3对应的第一个至第三个实施例中任一项的基础上,本发明实施例提供概率预测的方法第四个可选实施例中,采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数之后,还可以包括:
随机生成第一模拟数据集合,其中,第一模拟数据集合包括至少一个第一模拟数据,第一模拟数据满足第二分位数函数;
根据第一模拟数据集合计算得到第二模拟数据集合,其中,第二模拟数据集合包括至少一个第二模拟数据,且第二模拟数据集合中数据个数与第一模拟数据集合中的数据个数相等;
根据第二模拟数据集合确定目标风险等级;
其中,根据第二分位数函数计算第一模拟数据集合对应的第二模拟数据集合,可以包括:
采用如下方式计算第二模拟数据集合:
其中,μt'表示目标变量参数集合中第t'个时刻的位置参数,σt'表示目标变量参数集合中第t'个时刻的尺度参数,ut'表示目标变量参数集合中第t'个时刻的右边重尾程度,vt'表示目标变量参数集合中第t'个时刻的左边重尾程度,A表示预设常数,e表示自然对数的底数,xi表示第一模拟数据集合中第i个第一模拟数据,Yi表示第二模拟数据集合中第i个第二模拟数据。
本实施例中,将介绍如何利用第二分位数函数来预测数据。以预测股市指数为例,股市采用波动率和VaR来度量风险。VaR是值左尾部分位数,如分位数0.01、分位数0.05以及分位数0.1等,都用于度量价格下行风险。本发明能够预测这些分位数,所以能够预测下行风险。然而很多时候,我们需要采用标准差或者方差等数据进行预测,但是这些数据并非能够直接通过观测得,因此,本发明提供了第二分位数函数,即可以预测下一个时刻的概率分布,采用蒙特卡洛模拟,能够快速地计算出下一时刻的标准差或者方差等。
具体来说,首先,服务器可以采用计算机模拟生成十万个服从标准正态分布的随机数,比如,x1,x2,…,x100000,然后将第一模拟数据集合x1,x2,…,x100000代入到如下公式中,由此得到Y1,Y2,…,Y100000
Y1,Y2,…,Y100000这十万个数据即为第二模拟数据集合,根据第二模拟数据集合可以计算出标准差以及在险价值(Value-at-Risk,VaR),从而估计未来的波动率风险。将VaR和波动率根据历史经验进行等级划分,然后推送给用户,并提示可以进行哪些操作来管理风险。
更进一步地,本发明实施例中,在学习到模型参数之后,还可以随机生成第一模拟数据集合,然后根据第一模拟数据集合计算得到第二模拟数据集合,其中,第二模拟数据集合包括至少一个第二模拟数据,最后根据第二模拟数据集合确定目标风险等级;通过上述方式,可以利用多个随机生成的数据进行预测,这些数据满足非线性的分位数函数,因此,能够更好地模拟未来的数据走向,同时,有利于提升预测的可靠性。
可选地,在上述图3对应的第四个实施例的基础上,本发明实施例提供概率预测的方法第五个可选实施例中,根据第二模拟数据集合确定目标风险等级,可以包括:
根据第二模拟数据集合计算得到待评测数据;
按照风险评价规则确定待评测数据所对应的目标风险等级,其中,风险评价规则为预先设置的评测数据范围与风险等级之间的关系。
本实施例中,在服务器得到满足第二分位数函数的第二模拟数据集合之后,还可以根据第二模拟数据集合计算待评测数据,具体地,待评测数据可以是第二模拟数据集合的平均值,或者是第二模拟数据集合的方差,又或者是第二模拟数据集合的方差等,在实际应用中,可以根据需求计算得到相应的待评测数据,此处不做限定。服务器按照风险评价规则确定得到的待评测数据所对应的目标风险等级。其中,风险评价规则为预先设置的评测数据范围与风险等级之间的关系,请参阅表1,表1为风险评价规则的一个示意。
表1
风险等级 评测数据范围(平均值)
极端 (81,100]
严重 (61,80]
较重 (41,60]
中等 (21,40]
较轻 [0,20]
如表1所示,当待评测数据为第二模拟数据集合的平均值时,在待评测数据大于81,且小于或等于100的情况下,其目标风险等级属于“极端”等级。待评测数据大于61,且小于或等于80的情况下,其目标风险等级属于“严重”等级。待评测数据大于41,且小于或等于60的情况下,其目标风险等级属于“较重”等级。待评测数据大于21,且小于或等于40的情况下,其目标风险等级属于“中等”等级。待评测数据大于或等于0,且小于或等于20的情况下,其目标风险等级属于“较轻”等级。
为了便于理解,下面将以应用于股票软件为例进行介绍,即可以对用户所持有的股票或股票组合进行风险提示,以帮助用户管理风险,从而提高用户的投资效率。请参阅图4,图4为本发明实施例中评估股票风险等级的一个流程示意图,具体地:
步骤S1中,当用户使用股票软件获取股市行情或进行交易,并持有一只或多只股票时,我们的技术就可以提供按天更新的风险度量。首先,股票软件的后台服务器需要获取用户股票持仓情况,即在每天股市收盘后,或者第二天开盘之前,获取该用户的持仓情况。
步骤S2中,后台服务器对用户持有的每只股票,从行情数据库中获取其历史每日收益序列,对持有的所有股票按照持仓比例分配权重,算出整个股票组合的历史每日收益序列。在某一天结束或第二天开始时,用户当时持有的单个股票或股票组合的历史每日收益为rt'-1,rt'-2,…,rt'-L序列。
步骤S3中,服务器将所有的历史收益rt'-1,rt'-2,…,rt'-L序列放入已经训练好的模型中,由此得到第二天的每只股票和股票组合的收益概率分布,然后计算波动率和在险价值(Value-at-Risk,VaR)等风险度量。通常情况下,度量股票的下行风险一般用VaR,即左尾部分位数,根据计算得到的算出rt'的波动率和左尾部分位数。当这些数越大,代表风险越高。
步骤S4中,最后,根据经验划分风险等级,将结果推送给用户。若单只股票风险较高,提示卖出。若整体股票组合风险较高,则提示调整持仓比例或卖出部分。
本发明可以根据rt'-1,rt'-2,…,rt'-L序列中的信息,预测未来一天这只股票或股票组合的收益rt'的概率分布(即以分位数函数的形式给出)。在金融上,度量股票的总体风险一般用波动率,即rt'的标准差。我们可以按照历史上风险出现的情况,根据经验给风险程度划分等级,比如极端、严重、较重、中等以及较轻。然后在产品中将此信息按天更新,推送给用户,并给出操作建议如风险严重时提示卖出股票等。
再进一步地,本发明实施例中,在服务器根据第二模拟数据集合确定目标风险等级的过程中,首先需要根据第二模拟数据集合计算得到待评测数据,然后按照风险评价规则确定待评测数据所对应的目标风险等级,其中,风险评价规则为预先设置的评测数据范围与风险等级之间的关系。通过上述方式,利用第二模拟数据集合可以预测时间序列的一些概率分布特性,比如条件方差、条件不对称性以及条件重尾性等高阶矩概率特性,从而得出相应的风险等级,由此提升方案的实用性和可行性。
为了便于理解,下面将采用模拟数据对本发明提供的概率预测方法进行介绍。模拟实验的目的是验证本发明所提供的方法可以学习到真实时间。首先需要生成一个模拟时间序列,让自由度不随着时间发生变化。从r0=0和σ0=1开始,模拟时间序列{rt}和尺度参数{σt}及左边重尾程度参数{vt}通过如下方式生成:
vt=max{8-2πt,3};
rt=σtzt
其中,zt是通过t(vt)采样得到的。
基于上述计算方式,请参阅图6a,图6a为本发明实验数据中变量参数真实值与变量参数训练值的一个对比示意图,如图所示,将真实参数与本发明学习到的参数进行比较,图6a的上半部分表示在训练集中真实尺度参数与学习得到的尺度参数之间的对比示意,其中,A1指示真实尺度参数的变化曲线,A2指示学习得到的尺度参数的变化曲线。图6b的下半部分表示在测试集中真实尺度参数与学习得到的尺度参数之间的对比示意,其中,A3指示真实尺度参数的变化曲线,A4指示学习得到的尺度参数的变化曲线。
请参阅图6b,图6b为本发明实验数据中变量参数真实值与变量参数训练值的另一个对比示意图,如图所示,将真实参数与本发明学习到的参数进行比较,图6b的上半部分表示在训练集中真实左边重尾程度参数与学习得到的右边重尾程度参数之间的对比示意,其中,A5指示真实左边重尾程度参数的变化曲线,A6指示学习得到的学习得到的右边重尾程度参数变化曲线。图6b的下半部分表示在测试集中真实左边重尾程度参数与学习得到的右边重尾程度参数之间的对比示意,其中,A7指示真实左边重尾程度参数的变化曲线,A8指示学习得到的学习得到的右边重尾程度参数变化曲线。
为了便于理解,下面将采用真实的市场数据对本发明提供的概率预测方法进行介绍。首先,以世界五大具有代表性的股票指数和五个代表性的交易利率作为评价标准,包括标准普尔500指数(S&P 500Index)、纳斯达克(National Association of SecuritiesDealers Automated Quotations,NASDAQ)100指数,恒生指数(Hang Seng Index,HSI),德国法兰克福指数(Deutscher Aktienindex,DAX)指数以及日经指数(Nikkei Index)225。并根据美元汇率兑换得到美元兑换欧元(USDEUR)、美元兑换英镑(USDGBP)、美元兑换瑞士法郎(USDCHF)、美元兑换日元(USDJPY)和美元兑换澳元(USDAUD)。
在测试数据集上采用不同的模型计算得到弹球损失。损失的评估采用了两套不同的概率水平参数集合,第一套概率水平参数集合为[0.01,0.05,0.1,…,0.9,0.95,0.99],第二套概率水平参数集合为[0.01,0.05,0.1]。请参阅表2,表2为采用第一套概率水平参数集合的模型与股票指数之间的关系。
表2
方式\商品 S&P 500 NASDAQ 100 HSI DAX Nikkei 225
GARCH模型 0.2443 0.1406 0.1663 0.1999 0.2917
EGARCH-t模型 0.2443 0.1394 0.1655 0.1981 0.2900
GJR-GARCH-t模型 0.2442 0.1395 0.1654 0.1992 0.2905
AR-EGARCH-t模型 0.2441 0.1392 0.1655 0.1983 0.2897
AR-GJR-GARCH-t模型 0.2440 0.1394 0.1653 0.1994 0.2902
LSTM-TQR模型 0.2437 0.1382 0.1642 0.1964 0.2874
LSTM-HTQF模型 0.2424 0.1387 0.1639 0.1960 0.2866
请参阅表3,表3为采用第二套概率水平参数集合的模型与股票指数之间的关系。
表3
方式\商品 S&P 500 NASDAQ 100 HSI DAX Nikkei 225
GARCH模型 0.1109 0.0665 0.0732 0.0853 0.1329
EGARCH-t模型 0.1124 0.0661 0.0720 0.0832 0.1314
GJR-GARCH-t模型 0.1120 0.0661 0.0721 0.0847 0.1321
AR-EGARCH-t模型 0.1130 0.0660 0.0719 0.0834 0.1316
AR-GJR-GARCH-t模型 0.1125 0.0659 0.0719 0.0850 0.1323
LSTM-TQR模型 0.1104 0.0653 0.0716 0.0800 0.1273
LSTM-HTQF模型 0.1083 0.0641 0.0706 0.0814 0.1269
请参阅表4,表4为采用第一套概率水平参数集合的模型与交易利率之间的关系。
表4
方式\商品 USDEUR USDGBP USDCHF USDJPY USDAUD
GARCH模型 0.2260 0.2361 0.2025 0.2222 0.2329
EGARCH-t模型 0.2258 0.2352 0.2032 0.2202 0.2370
GJR-GARCH-t模型 0.2258 0.2366 0.2009 0.2206 0.2338
AR-EGARCH-t模型 0.2258 0.2353 0.2007 0.2199 0.2367
AR-GJR-GARCH-t模型 0.2259 0.2367 0.2005 0.2203 0.2346
LSTM-TQR模型 0.2253 0.2355 0.1971 0.2198 0.2320
LSTM-HTQF模型 0.2248 0.2352 0.1968 0.2193 0.2324
请参阅表5,表5为采用第二套概率水平参数集合的模型与交易利率之间的关系。
表5
方式\商品 USDEUR USDGBP USDCHF USDJPY USDAUD
GARCH模型 0.0942 0.0965 0.1041 0.0996 0.0913
EGARCH-t模型 0.0938 0.0959 0.1054 0.0975 0.1062
GJR-GARCH-t模型 0.0941 0.0984 0.1026 0.0978 0.0923
AR-EGARCH-t模型 0.0938 0.0960 0.1026 0.0976 0.1053
AR-GJR-GARCH-t模型 0.0941 0.0982 0.1026 0.0980 0.0916
LSTM-TQR模型 0.0928 0.0954 0.0977 0.0970 0.0898
LSTM-HTQF模型 0.0931 0.0948 0.0968 0.0958 0.0904
由此可见,在大多数资产中,本发明所提供的LSTM-HTQF表现优异,尤其在第二套概率水平参数集合下性能改进更为显着。弹球损失是观察和分位数之间的一种衡量标准。
下面将对本发明中模型训练的方法进行介绍,请参阅图5,本发明实施例中模型训练的方法一个实施例包括:
201、从待训练时间序列中获取观测值序列,其中,观测值序列包含L个观测值,L为大于或等于1的整数;
本实施例中,首先获取待训练时间序列,其中,该待训练时间序列的数据量通常比较大,比如包括1000天的数据,考虑到数据量过大会降低模型训练的效率,因此,需要从待训练时间序列中提取观测值序列,观测值序列中包括了L个观测值,L是大于或等于1的整数,可以取值100。
具体地,对应长度为T的待训练时间序列,包括rt-1,rt-2,…,rt-1000,若取10个观测值,即L等于10,那么得到的观测值序列为rt-1,rt-2,rt-3,rt-4,rt-5,rt-6,rt-7,rt-8,rt-9,rt-10
202、根据观测值序列确定特征向量序列,其中,特征向量序列中包含L个特征向量;
本实施例中,接下来服务器需要根据观测值序列生成相应的特征向量序列,特征向量序列可以表示为即特征向量序列包括了L个特征向量。
203、通过深层神经网络DNN模型获取特征向量序列所对应的变量参数集合,其中,变量参数集合中包含至少一个变量参数;
本实施例中,将步骤202中生成的特征向量序列输入至深层神经网络(DeepNeural Network,DNN)模型中,其中,DNN可以理解为有很多隐藏层的神经网络。从DNN按不同层的位置划分,DNN内部的神经网络层可以分为三类,输入层、隐藏层和输出层,一般来说第一层是输入层,最后一层是输出层,而中间的层数都是隐藏层。
需要说明的是,本发明实施例所采用的DNN模型可以是LSTM模型,具体地,服务器可以将特征向量序列的每个特征向量依次输入至LSTM模型,由该LSTM模型输出变量参数集合,其中,变量参数集合包括至少一个变量参数,具体可以包括四个变量参数。
204、采用变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
本实施例中,利用变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数,其中,第一分位数函数是指标准正态分位数函数,第二分位数函数是一个非线性的重尾分位数函数(heavy-tailed quantile function,HTQF)。
205、根据第二分位数函数以及概率水平参数集合确定模型参数,其中,概率水平参数集合包含至少一个概率水平参数,其中,概率水平参数为大于或等于0,且小于或等于1的预设概率值;
本实施例中,在得到非线性的第二分位数函数之后,需要选取若干个概率水平参数,即得到概率水平参数集合,其中,概率水平参数为大于或等于0,且小于或等于1的预设概率值。假设概率水平参数为0.1,则表示第二分位数函数中概率小于0.1的数值个数,概率水平参数的总个数表示分位数的个数。
结合第二分位数函数以及概率水平参数集合,最小化损失函数(loss function)可以求得模型参数。
206、采用模型参数对DNN模型进行训练,得到概率预测模型。
本实施例中,最后,服务器采用模型参数对DNN模型进行训练第二分位数函数以及概率水平参数集合,该DNN模型具体可以为LSTM模型。
本发明实施例中,提供了一种模型训练的方法,首先服务器从待训练时间序列中获取观测值序列,然后根据观测值序列确定特征向量序列,通过DNN模型获取特征向量序列所对应的变量参数集合,服务器再采用变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数,根据第二分位数函数以及概率水平参数集合确定模型参数,最后服务器采用模型参数对DNN模型进行训练,得到概率预测模型。通过上述方式,自定义简单且灵活的参数化分位数函数,结合LSTM网络完成时间序列分位数的预测,此外,采用非线性的分位数函数能够更好地表达出复杂因素对概率的影响,从而提升概率预测的准确度。
可选地,在上述图5对应的实施例的基础上,本发明实施例提供模型训练的方法第一个可选实施例中,根据观测值序列确定特征向量序列,可以包括:
采用如下方式计算特征向量序列:
其中,表示特征向量序列中的第1个特征向量,表示特征向量序列中的第L个特征向量,L表示特征向量序列中特征向量的总个数,t表示待训练时间序列中的第t个时刻,rt-L表示观测值序列中第t-L个时刻的观测值,rt-1表示观测值序列中第t-1个时刻的观测值,表示观测值均值,i为大于或等于1,且小于或等于L的整数。
本实施例中,将介绍如何生成特征向量序列。首先需要先计算得到观测值均值具体的计算方式如下:
其中,L表示特征向量序列中特征向量的总个数,此外,L也是观测值序列中观测值的总个数,假设L的取值为100,那么需要获取连续100天的历史数据,该历史数据是可以是一支或多支股票的收益情况,也可以是用电的情况,还可以是视频网站采集的播放流量等数据,此处不做限定。这些历史数据即为观测值序列,对整个观测值序列中的观测值做平均化处理,由此得到观测值均值
在选择了固定长度的子序列(即rt-1至rt-L的观测值序列)之后,可以构造特征向量序列,即得到特征向量序列
由此可见,特征向量序列的长度为L,维度为4,可以理解的是,对于特征向量序列的维度还可以进行变更,此处的维度4仅为一个示意,并不应理解为对本发明的限定。
其次,本发明实施例中,提供了一种根据观测值序列确定特征向量序列的具体方式。通过上述方式,采用特征向量序直截了当地表示了过去一段时间内的样本特征,并且提取四个维度的向量来表示样本,从而更完整地表达时间与数据之间的关系,有利于提升建模的可靠性。
可选地,在上述图5对应的第一个实施例的基础上,本发明实施例提供模型训练的方法第二个可选实施例中,通过深层神经网络DNN模型获取特征向量序列所对应的变量参数集合,可以包括:
采用如下方式计算变量参数集合:
tt,ut,vt]T=tanh(W0ht+b0);
其中,μt表示变量参数集合中第t个时刻的位置参数,σt表示变量参数集合中第t个时刻的尺度参数,ut表示变量参数集合中第t个时刻的右边重尾程度,vt表示变量参数集合中第t个时刻的左边重尾程度,W0表示第一初始模型参数,b0表示第二初始模型参数,θ0表示第三初始模型参数,ht表示第t个时刻的隐藏层向量,[]T表示转置计算,tanh()表示双曲正切函数。
本实施例中,将介绍如何通过DNN模型获取特征向量序列所对应的变量参数集合,具体地,以DNN模型中的LSTM模型为例进行说明。LSTM模型具有初始的模型参数,第一初始模型参数W0、第二初始模型参数b0以及第三初始模型参数θ0,后续需要对这三个初始的模型参数进行训练,从而得到更加准确的模型。
将特征向量序列输入至LSTM模型中,由该LSTM模型输出第t个时刻的隐藏层向量ht。将ht输入至双切正切函数tanh()中,经过计算后输出四个变量参数,即第t个时刻的位置参数μt,第t个时刻的尺度参数σt,第t个时刻的右边重尾程度ut以及第t个时刻的左边重尾程度vt。其中,μt属于实数,σt属于正数,μt影响函数图形的位置,而σt影响函数图形的度量大小,ut表示从函数中心线到右边尾部部分的概率分布情况,vt表示从函数中心线到左边尾部部分的概率分布情况。两边尾部都比较厚的状况也被认为是一种重尾分布。
再次,本发明实施例中,提供了一种通过LSTM模型计算特征向量序列所对应的变量参数集合的方式。通过上述方式,采用LSTM模型输出隐藏层向量,尤其当每一个时间步长内有若干层时,隐藏层向量可以更好地反映数据在时间上的特征,而tanh()函数在特征相差明显时的效果会很好,在循环过程中会不断扩大特征效果。
可选地,在上述图5对应的第二个实施例的基础上,本发明实施例提供模型训练的方法第三个可选实施例中,采用变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数,可以包括:
采用如下方式获取第二分位数函数:
其中,Q(τ\μtt,ut,vt)表示第二分位数函数,Zτ表示第一分位数函数,τ表示概率水平参数,A表示预设常数,e表示自然对数的底数。
本实施例中,介绍如何利用变量参数集合生成第二分位数函数的方式。即采用第t个时刻的位置参数μt,第t个时刻的尺度参数σt,第t个时刻的右边重尾程度ut以及第t个时刻的左边重尾程度vt这四个参数,对第一分位数函数Zt进行非线性变化。需要说明的是,第一分位数函数可以是PDF、CDF或者线性的分位数函数,此处不做限定。
具体地,构造一个简单的分位数函数,即表示第一分位数函数Zτ,使Zτ在Q-Q图中具有可控形状,且为标准的正态分布。本发明提供的HTQF具体如下形式:
其中,μt属于位置参数,σt属于尺度参数,A表示预设常数,通常是相对较大的常数,当ut>0时控制第二分位数函数的“S形”上尾,即相应的分布右尾。当vt<0时控制第二分位数函数的“S形”下尾,即相应的分布左尾。vt和ut越大,表示第二分位数函数的尾部越重。当vt=ut=0时,HTQF为正态分布的分位数函数。
基于HTQF,Zτ先乘以两个因子,即以及然后乘以σt并加上μt,为了便于计算,可以将μt设置为0,并将σt设置为1。因子fu是Zτ单调递增的凸函数,满足fu趋近于1,Zτ趋近于无穷。A的作用是让fu(0)和fv(0)接近于1,确保HTQF是随着Zτ单调递增。
进一步地,本发明实施例中,介绍了一种采用变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数的方式。通过上述方式,结合变量参数集合对概率密度函数、累积分布函数或者线性的分位数函数进行建模,从而得到非线性的分位数函数,而该非线性的分位数函数允许尾部发生变化,更贴近实际情况,且直观易懂。
可选地,在上述图5以及图5对应的第一个至第三个实施例中任一项的基础上,本发明实施例提供模型训练的方法第四个可选实施例中,根据第二分位数函数以及概率水平参数集合确定模型参数,可以包括:
采用如下方式计算模型参数:
其中,min表示取最小值,Wο表示第一模型参数,bο表示第二模型参数,θ表示第三模型参数,K表示概率水平参数集合中概率水平参数的总个数,k表示概率水平参数集合中的第k个概率水平参数,T表示待训练时间序列中时刻的总个数,t表示待训练时间序列中的第t个时刻,L表示观测值序列中观测值的总个数,表示针对概率水平参数为τk的损失函数,rt表示待训练时间序列,Q(τktt,ut,vt)表示针对概率水平参数为τk的第二分位数函数。
本实施例中,将介绍服务器如何计算得到模型参数。首先,服务器需要先确定概率水平参数集合,即τ1至τK,其中,τk表示τ1至τK中的任意一个概率水平参数,对于多个概率水平参数而言,其对应的数值可以为0<τ1<τ2<......<τK-1<τK<1,需要说明的是,在实际应用中,K的取值可以是21,于是,可以得到如下的概率水平参数集合,即为:[τ1,...,τ21]=[0.01,0.05,0.1,...,0.9,0.95,0.99]。
服务器可以采用损失函数评估模型性能,在损失函数最小的情况下,可以得到最为合适的模型参数,即得到第一模型参数Wo、第二模型参数bo以及第三模型参数θ,再利用这三个模型参数重新训练DNN模型,使其输出非线性分位数函数。
损失函数也可称为代价函数,主要用于衡量预测值与实际值的偏离程度。机器学习的目标就是希望预测值与实际值偏离较小,也就是希望损失函数较小,即得到最小化损失函数。下面将介绍几种可以采用的损失函数类型:
第一种为0-1损失,可用于分类问题;
第二种为绝对值损失;
第三种为平方损失;
第四种为对数损失;
第五种为Hinge损失函数,用于支持向量机(Support Vector Machine,SVM)模型。
由于参数越多,模型越复杂,而越复杂的模型往往容易过拟合。也就是说容易导致模型在训练数据上的效果远远好于在测试集上的性能。此时可以考虑正则化,来权衡损失函数和正则项,减小参数规模,达到模型简化的目的,从而使模型具有更好的泛化能力。
更进一步地,本发明实施例中,提供了一种确定模型参数的具体方式。通过损失函数最小化可以得到模型参数,即得到第一模型参数、第二模型参数以及第三模型参数,由此,再训练之前得到的DNN模型,从而对DNN模型进行优化训练,进而提升模型的可靠性和准确度,加强模型的预测能力。
下面将采用本发明所提供的概率预测方法进行实验,并由此得到如下结论:
本发明提出了一种参数化HTQF来表示非对称重尾,用于生成金融收益序列的条件分布。其中,HTQF的参数是由LSTM对过去的依赖性信息建模得到的。观测值与条件分位数之间的弹球损失使LSTM参数的学习处于分位数回归框架中,这克服了传统分位数回归的缺点。经过学习,条件分位数或VaR可以得到更好的预测精度,请参阅图7和图8,HTQF的绘制也显示了这一点。
图7为本发明实验数据中每日数据的标准普尔500指数一个走势示意图,如图所示,C1所指示的线条表示右边重尾程度u,其中,左侧数据对应于C1的参数,C2所指示的线条表示左边重尾程度v,其中,右侧数据对应于C2的参数。图8为本发明实验数据中5分钟钢筋数据的一个走势示意图,如图所示,C3所指示的线条表示右边重尾程度u,其中,右侧数据对应于C3的参数,C4所指示的线条表示左边重尾程度v,其中,右侧数据对应于C4的参数。
基于图7和图8,可以得到商品期货数据在5分钟测试数据集上的弹球损失,其中,损失的评估采用了两套不同的概率水平参数集合,第一套概率水平参数集合为[0.01,0.05,0.1,…,0.9,0.95,0.99],第二套概率水平参数集合为[0.01,0.05,0.1]。请参阅表6,表6为基于第一套概率水平参数集合下的弹球损失值一个对比示意表。其中,包括7种不同的模型下的计算方式,具体地,包括GARCH模型,EGARCH-t模型、GJR-GARCH-t模型、AR-EGARCH-t模型、AR-GJR-GARCH-t模型、LSTM-TQR模型以及LSTM-HTQF模型。
表6
方式\商品 钢筋 天然橡胶 大豆 棉花
GARCH模型 0.1770 0.1701 0.2424 0.1621 0.1958
EGARCH-t模型 0.1643 0.1564 0.2392 0.1524 0.1859
GJR-GARCH-t模型 0.1648 0.1576 0.2393 0.1526 0.1859
AR-EGARCH-t模型 0.1646 0.1572 0.2391 0.1522 0.1857
AR-GJR-GARCH-t模型 0.1652 0.1586 0.2391 0.1524 0.1857
LSTM-TQR模型 0.1644 0.1543 0.2389 0.1504 0.1844
LSTM-HTQF模型 0.1639 0.1548 0.2385 0.1501 0.1842
类似地,请参阅表7,表7为基于第二套概率水平参数集合下的弹球损失值一个对比示意表。
表7
方式\商品 钢筋 天然橡胶 大豆 棉花
GARCH模型 0.0882 0.0885 0.1077 0.0783 0.0994
EGARCH-t模型 0.0797 0.0797 0.1062 0.0720 0.0935
GJR-GARCH-t模型 0.0801 0.0797 0.1059 0.0721 0.0935
AR-EGARCH-t模型 0.0805 0.0807 0.1063 0.0719 0.0935
AR-GJR-GARCH-t模型 0.0807 0.0810 0.1060 0.0721 0.0937
LSTM-TQR模型 0.0769 0.0765 0.1059 0.0710 0.0922
LSTM-HTQF模型 0.0767 0.0070 0.1065 0.0704 0.0916
为了得到更准确的模型,还需要对金融时间序列的条件分布进行更详细的分析,例如,提高HTQF的灵活性。此外,还需了解LSTM和HTQF如何分别工作,以及它们如何对性能做出贡献改进,这对理解市场行为和风险有何影响管理。因此,很多情况下,可能需要对模型进行组件式的分析,以及根据VAR或分位数预测的统计进行反向检验。
下面对本发明中的概率预测装置进行详细描述,请参阅图9,图9为本发明实施例中概率预测装置一个实施例示意图,概率预测装置30包括:
获取模块301,用于从历史时间序列中获取目标观测值序列,其中,所述历史时间序列为待预测时刻之前的时间序列,所述目标观测值序列包含L个目标观测值,所述L为大于或等于1的整数;
确定模块302,用于根据所述获取模块301获取的所述目标观测值序列确定目标特征向量序列,其中,所述目标特征向量序列中包含L个目标特征向量;
所述获取模块301,还用于通过概率预测模型获取所述确定模块302确定的所述目标特征向量序列所对应的目标变量参数集合,其中,所述目标变量参数集合中包含至少一个目标变量参数;
处理模块303,用于采用所述获取模块301获取的所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,其中,所述第二分位数函数用于预测所述待预测时刻下的概率分布,所述概率分布用于评估目标风险等级。
本实施例中,获取模块301从历史时间序列中获取目标观测值序列,其中,所述历史时间序列为待预测时刻之前的时间序列,所述目标观测值序列包含L个目标观测值,所述L为大于或等于1的整数,确定模块302根据所述获取模块301获取的所述目标观测值序列确定目标特征向量序列,其中,所述目标特征向量序列中包含L个目标特征向量,所述获取模块301通过概率预测模型获取所述确定模块302确定的所述目标特征向量序列所对应的目标变量参数集合,其中,所述目标变量参数集合中包含至少一个目标变量参数,处理模块303采用所述获取模块301获取的所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,其中,所述第二分位数函数用于预测所述待预测时刻下的概率分布,所述概率分布用于评估目标风险等级。
本发明实施例中,提供了一种概率预测装置,首先,服务器从历史时间序列中获取目标观测值序列,其中,历史时间序列为待预测时刻之前的时间序列,然后根据目标观测值序列确定目标特征向量序列,服务器再通过概率预测模型获取目标特征向量序列所对应的目标变量参数集合,最后,服务器采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数,其中,第二分位数函数用于预测待预测时刻下的概率分布,概率分布用于评估目标风险等级。通过上述方式,对于噪声或随机性较大的复杂时间序列,可以采用模型先预测其目标变量参数,然后利用目标变量参数对线性分位数函数进行处理,由此得到非线性的分位数函数,非线性的分位数函数能够更好地表达出复杂因素对概率的影响,从而提升概率预测的准确度。
可选地,在上述图9所对应的实施例的基础上,本发明实施例提供的概率预测装置30的另一实施例中,
所述确定模块302,具体用于采用如下方式计算所述目标特征向量序列:
其中,所述表示所述目标特征向量序列中的第1个目标特征向量,所述表示所述目标特征向量序列中的第L个目标特征向量,所述L表示目标观测值序列中目标观测值的总个数,所述t'表示所述待预测时刻,所述rt'-L表示所述目标观测值序列中第t'-L个时刻的观测值,所述rt'-1表示所述目标观测值序列中第t'-1个时刻的观测值,所述表示目标观测值均值,所述i为大于或等于1,且小于或等于所述L的整数。
其次,本发明实施例中,提供了一种根据目标观测值序列确定目标特征向量序列的具体方式。通过上述方式,采用目标特征向量序直截了当地表示了过去一段时间内的样本特征,并且提取四个维度的向量来表示样本,从而更完整地表达时间与数据之间的关系,有利于提升建模的可靠性。
可选地,在上述图9所对应的实施例的基础上,本发明实施例提供的概率预测装置30的另一实施例中,
所述获取模块301,具体用于采用如下方式计算所述目标变量参数集合:
t't',ut',vt']T=tanh(Woht'+bο);
其中,所述μt'表示所述目标变量参数集合中所述第t'个时刻的位置参数,所述σt'表示所述目标变量参数集合中所述第t'个时刻的尺度参数,所述ut'表示所述目标变量参数集合中所述第t'个时刻的右边重尾程度,所述vt'表示所述目标变量参数集合中所述第t'个时刻的左边重尾程度,所述Wο表示第一模型参数,所述bο表示所述第二模型参数,所述θ表示第三模型参数,所述ht'表示所述第t'个时刻的隐藏层向量,所述[]T表示转置计算,所述tanh()表示双曲正切函数。
再次,本发明实施例中,提供了一种通过LSTM模型计算特征向量序列所对应的目标变量参数集合的方式。通过上述方式,采用LSTM模型输出隐藏层向量,尤其当每一个时间步长内有若干层时,隐藏层向量可以更好地反映数据在时间上的特征,而tanh()函数在特征相差明显时的效果会很好,在循环过程中会不断扩大特征效果。
可选地,在上述图9所对应的实施例的基础上,本发明实施例提供的概率预测装置30的另一实施例中,
所述获取模块301,具体用于采用如下方式获取所述第二分位数函数:
其中,所述Q(τ\μt't',ut',vt')表示所述第二分位数函数,所述Zτ'表示所述第一分位数函数,所述τ表示概率水平参数,所述A表示预设常数,所述e表示自然对数的底数。
进一步地,本发明实施例中,介绍了一种采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数的方式。通过上述方式,结合目标变量参数集合对概率密度函数、累积分布函数或者线性的分位数函数进行建模,从而得到非线性的分位数函数,而该非线性的分位数函数允许尾部发生变化,更贴近实际情况,且直观易懂。
可选地,在上述图9所对应的实施例的基础上,请参阅图10,本发明实施例提供的概率预测装置30的另一实施例中,所述概率预测装置30还包括生成模块304以及计算模块305;
所述生成模块304,用于所述处理模块303采用所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数之后,随机生成第一模拟数据集合,其中,所述第一模拟数据集合包括至少一个第一模拟数据,所述第一模拟数据满足所述第二分位数函数;
所述计算模块305,用于根据所述第二分位数函数计算所述生成模块生成的所述第一模拟数据集合对应的第二模拟数据集合,其中,所述第二模拟数据集合包括至少一个第二模拟数据,且所述第二模拟数据集合中数据个数与所述第一模拟数据集合中的数据个数相等;
所述确定模块302,还用于根据所述计算模块305计算得到的所述第二模拟数据集合确定目标风险等级;
其中,所述计算模块305,具体用于采用如下方式计算所述第二模拟数据集合:
其中,所述μt'表示所述目标变量参数集合中所述第t'个时刻的位置参数,所述σt'表示所述目标变量参数集合中所述第t'个时刻的尺度参数,所述ut'表示所述目标变量参数集合中所述第t'个时刻的右边重尾程度,所述vt'表示所述目标变量参数集合中所述第t'个时刻的左边重尾程度,所述A表示预设常数,所述e表示自然对数的底数,所述xi表示所述第一模拟数据集合中第i个第一模拟数据,所述Yi表示所述第二模拟数据集合中第i个第二模拟数据。
更进一步地,本发明实施例中,在学习到模型参数之后,还可以随机生成第一模拟数据集合,然后根据第一模拟数据集合计算得到第二模拟数据集合,其中,第二模拟数据集合包括至少一个第二模拟数据,最后根据第二模拟数据集合确定目标风险等级;通过上述方式,可以利用多个随机生成的数据进行预测,这些数据满足非线性的分位数函数,因此,能够更好地模拟未来的数据走向,同时,有利于提升预测的可靠性。
可选地,在上述图9或图10所对应的实施例的基础上,本发明实施例提供的概率预测装置30的另一实施例中,
所述确定模块302,具体用于根据所述第二模拟数据集合计算得到待评测数据;
按照风险评价规则确定所述待评测数据所对应的所述目标风险等级,其中,所述风险评价规则为预先设置的评测数据范围与风险等级之间的关系。
再进一步地,本发明实施例中,在服务器根据第二模拟数据集合确定目标风险等级的过程中,首先需要根据第二模拟数据集合计算得到待评测数据,然后按照风险评价规则确定待评测数据所对应的目标风险等级,其中,风险评价规则为预先设置的评测数据范围与风险等级之间的关系。通过上述方式,利用第二模拟数据集合可以预测时间序列的一些概率分布特性,比如条件方差、条件不对称性以及条件重尾性等高阶矩概率特性,从而得出相应的风险等级,由此提升方案的实用性和可行性。
下面对本发明中的模型训练装置进行详细描述,请参阅图11,图11为本发明实施例中模型训练装置一个实施例示意图,模型训练装置40包括:
获取模块401,用于从待训练时间序列中获取观测值序列,其中,所述观测值序列包含L个观测值,所述L为大于或等于1的整数;
确定模块402,用于根据所述获取模块401获取的所述观测值序列确定特征向量序列,其中,所述特征向量序列中包含L个特征向量;
所述获取模块401,还用于通过深层神经网络DNN模型获取所述确定模块402确定的所述特征向量序列所对应的变量参数集合,其中,所述变量参数集合中包含至少一个变量参数;
处理模块403,用于采用所述获取模块401获取的所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
所述确定模块402,还用于根据所述处理模块403处理得到的所述第二分位数函数以及概率水平参数集合确定模型参数,其中,所述概率水平参数集合包含至少一个概率水平参数,其中,所述概率水平参数为大于或等于0,且小于或等于1的预设概率值;
训练模块404,用于采用所述确定模块确定的所述模型参数对所述DNN模型进行训练,得到概率预测模型。
本实施例中,获取模块401从待训练时间序列中获取观测值序列,其中,所述观测值序列包含L个观测值,所述L为大于或等于1的整数,确定模块402根据所述获取模块401获取的所述观测值序列确定特征向量序列,其中,所述特征向量序列中包含L个特征向量,所述获取模块401通过深层神经网络DNN模型获取所述确定模块402确定的所述特征向量序列所对应的变量参数集合,其中,所述变量参数集合中包含至少一个变量参数,处理模块403采用所述获取模块401获取的所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数,所述确定模块402根据所述处理模块403处理得到的所述第二分位数函数以及概率水平参数集合确定模型参数,其中,所述概率水平参数集合包含至少一个概率水平参数,其中,所述概率水平参数为大于或等于0,且小于或等于1的预设概率值,训练模块404采用所述确定模块确定的所述模型参数对所述DNN模型进行训练,得到概率预测模型。
本发明实施例中,提供了一种模型训练的方法,首先服务器从待训练时间序列中获取观测值序列,然后根据观测值序列确定特征向量序列,通过DNN模型获取特征向量序列所对应的变量参数集合,服务器再采用变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数,根据第二分位数函数以及概率水平参数集合确定模型参数,最后服务器采用模型参数对DNN模型进行训练,得到概率预测模型。通过上述方式,自定义简单且灵活的参数化分位数函数,结合LSTM网络完成时间序列分位数的预测,此外,采用非线性的分位数函数能够更好地表达出复杂因素对概率的影响,从而提升概率预测的准确度。
可选地,在上述图11所对应的实施例的基础上,本发明实施例提供的模型训练装置40的另一实施例中,
所述确定模块402,具体用于采用如下方式计算所述特征向量序列:
其中,所述表示所述特征向量序列中的第1个特征向量,所述表示所述特征向量序列中的第L个特征向量,所述L表示所述特征向量序列中特征向量的总个数,所述t表示所述待训练时间序列中的第t个时刻,所述rt-L表示所述观测值序列中第t-L个时刻的观测值,所述rt-1表示所述观测值序列中第t-1个时刻的观测值,所述表示观测值均值,所述i为大于或等于1,且小于或等于所述L的整数。
其次,本发明实施例中,提供了一种根据观测值序列确定特征向量序列的具体方式。通过上述方式,采用特征向量序直截了当地表示了过去一段时间内的样本特征,并且提取四个维度的向量来表示样本,从而更完整地表达时间与数据之间的关系,有利于提升建模的可靠性。
可选地,在上述图11所对应的实施例的基础上,本发明实施例提供的模型训练装置40的另一实施例中,
所述获取模块401,具体用于采用如下方式计算所述变量参数集合:
tt,ut,vt]T=tanh(W0ht+b0);
其中,所述μt表示所述变量参数集合中所述第t个时刻的位置参数,所述σt表示所述变量参数集合中所述第t个时刻的尺度参数,所述ut表示所述变量参数集合中所述第t个时刻的右边重尾程度,所述vt表示所述变量参数集合中所述第t个时刻的左边重尾程度,所述W0表示第一初始模型参数,所述b0表示所述第二初始模型参数,所述θ0表示第三初始模型参数,所述ht表示所述第t个时刻的隐藏层向量,所述[]T表示转置计算,所述tanh()表示双曲正切函数。
再次,本发明实施例中,提供了一种通过LSTM模型计算特征向量序列所对应的变量参数集合的方式。通过上述方式,采用LSTM模型输出隐藏层向量,尤其当每一个时间步长内有若干层时,隐藏层向量可以更好地反映数据在时间上的特征,而tanh()函数在特征相差明显时的效果会很好,在循环过程中会不断扩大特征效果。
可选地,在上述图11所对应的实施例的基础上,本发明实施例提供的模型训练装置40的另一实施例中,
所述处理模块403,具体用于采用如下方式获取所述第二分位数函数:
其中,所述Q(τ\μtt,ut,vt)表示所述第二分位数函数,所述Zτ表示所述第一分位数函数,所述τ表示概率水平参数,所述A表示预设常数,所述e表示自然对数的底数。
进一步地,本发明实施例中,介绍了一种采用变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数的方式。通过上述方式,结合变量参数集合对概率密度函数、累积分布函数或者线性的分位数函数进行建模,从而得到非线性的分位数函数,而该非线性的分位数函数允许尾部发生变化,更贴近实际情况,且直观易懂。
可选地,在上述图11所对应的实施例的基础上,本发明实施例提供的模型训练装置40的另一实施例中,
所述确定模块402,具体用于采用如下方式计算所述模型参数:
其中,所述min表示取最小值,所述Wο表示第一模型参数,所述bο表示所述第二模型参数,所述θ表示第三模型参数,所述K表示所述概率水平参数集合中概率水平参数的总个数,所述k表示所述概率水平参数集合中的第k个概率水平参数,所述T表示所述待训练时间序列中时刻的总个数,所述t表示所述待训练时间序列中的第t个时刻,所述L表示观测值序列中观测值的总个数,所述lossτk表示针对概率水平参数为τk的损失函数,所述rt表示所述待训练时间序列,所述Q(τktt,ut,vt)表示针对概率水平参数为τk的所述第二分位数函数。
更进一步地,本发明实施例中,提供了一种确定模型参数的具体方式。通过损失函数最小化可以得到模型参数,即得到第一模型参数、第二模型参数以及第三模型参数,由此,再训练之前得到的DNN模型,从而对DNN模型进行优化训练,进而提升模型的可靠性和准确度,加强模型的预测能力。
图12是本发明实施例提供的一种服务器结构示意图,该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(central processingunits,CPU)522(例如,一个或一个以上处理器)和存储器532,一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器522可以设置为与存储介质530通信,在服务器500上执行存储介质530中的一系列指令操作。
服务器500还可以包括一个或一个以上电源526,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口558,和/或,一个或一个以上操作***541,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图12所示的服务器结构。
本发明实施例中,CPU 522用于执行如下步骤:
从历史时间序列中获取目标观测值序列,其中,历史时间序列为待预测时刻之前的时间序列,目标观测值序列包含L个目标观测值,L为大于或等于1的整数;
根据目标观测值序列确定目标特征向量序列,其中,目标特征向量序列中包含L个目标特征向量;
通过概率预测模型获取目标特征向量序列所对应的目标变量参数集合,其中,目标变量参数集合中包含至少一个目标变量参数;
采用目标变量参数集合对第一分位数函数进行非线性变换处理,得到待预测时刻所对应的第二分位数函数,其中,第二分位数函数用于预测待预测时刻下的概率分布,概率分布用于评估目标风险等级。
可选地,CPU 522具体用于执行如下步骤:
采用如下方式计算目标特征向量序列:
其中,表示目标特征向量序列中的第1个目标特征向量,表示目标特征向量序列中的第L个目标特征向量,L表示目标观测值序列中目标观测值的总个数,t'表示待预测时刻,rt'-L表示目标观测值序列中第t'-L个时刻的观测值,rt'-1表示目标观测值序列中第t'-1个时刻的观测值,表示目标观测值均值,i为大于或等于1,且小于或等于L的整数。
可选地,CPU 522具体用于执行如下步骤:
采用如下方式计算目标变量参数集合:
t't',ut',vt']T=tanh(Woht'+bο);
其中,μt'表示目标变量参数集合中第t'个时刻的位置参数,σt'表示目标变量参数集合中第t'个时刻的尺度参数,ut'表示目标变量参数集合中第t'个时刻的右边重尾程度,vt'表示目标变量参数集合中第t'个时刻的左边重尾程度,Wο表示第一模型参数,bο表示第二模型参数,θ表示第三模型参数,ht'表示第t'个时刻的隐藏层向量,[]T表示转置计算,tanh()表示双曲正切函数。
可选地,CPU 522具体用于执行如下步骤:
采用如下方式获取第二分位数函数:
其中,Q(τ\μt't',ut',vt')表示第二分位数函数,Zτ'表示第一分位数函数,τ表示概率水平参数,A表示预设常数,e表示自然对数的底数。
可选地,CPU 522还用于执行如下步骤:
随机生成第一模拟数据集合,其中,第一模拟数据集合包括至少一个第一模拟数据,第一模拟数据满足第二分位数函数;
根据第二分位数函数计算第一模拟数据集合对应的第二模拟数据集合,其中,第二模拟数据集合包括至少一个第二模拟数据,且第二模拟数据集合中数据个数与第一模拟数据集合中的数据个数相等;
根据第二模拟数据集合确定目标风险等级;
可选地,CPU 522具体用于执行如下步骤:
采用如下方式计算第二模拟数据集合:
其中,μt'表示目标变量参数集合中第t'个时刻的位置参数,σt'表示目标变量参数集合中第t'个时刻的尺度参数,ut'表示目标变量参数集合中第t'个时刻的右边重尾程度,vt'表示目标变量参数集合中第t'个时刻的左边重尾程度,A表示预设常数,e表示自然对数的底数,xi表示第一模拟数据集合中第i个第一模拟数据,Yi表示第二模拟数据集合中第i个第二模拟数据。
可选地,CPU 522具体用于执行如下步骤:
根据第二模拟数据集合计算得到待评测数据;
按照风险评价规则确定待评测数据所对应的目标风险等级,其中,风险评价规则为预先设置的评测数据范围与风险等级之间的关系。
本发明实施例中,CPU 522用于执行如下步骤:
从待训练时间序列中获取观测值序列,其中,观测值序列包含L个观测值,L为大于或等于1的整数;
根据观测值序列确定特征向量序列,其中,特征向量序列中包含L个特征向量;
通过深层神经网络DNN模型获取特征向量序列所对应的变量参数集合,其中,变量参数集合中包含至少一个变量参数;
采用变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
根据第二分位数函数以及概率水平参数集合确定模型参数,其中,概率水平参数集合包含至少一个概率水平参数,其中,概率水平参数为大于或等于0,且小于或等于1的预设概率值;
采用模型参数对DNN模型进行训练,得到概率预测模型。
可选地,CPU 522具体用于执行如下步骤:
采用如下方式计算特征向量序列:
其中,表示特征向量序列中的第1个特征向量,表示特征向量序列中的第L个特征向量,L表示特征向量序列中特征向量的总个数,t表示待训练时间序列中的第t个时刻,rt-L表示观测值序列中第t-L个时刻的观测值,rt-1表示观测值序列中第t-1个时刻的观测值,表示观测值均值,i为大于或等于1,且小于或等于L的整数。
可选地,CPU 522具体用于执行如下步骤:
采用如下方式计算变量参数集合:
tt,ut,vt]T=tanh(W0ht+b0);
其中,μt表示变量参数集合中第t个时刻的位置参数,σt表示变量参数集合中第t个时刻的尺度参数,ut表示变量参数集合中第t个时刻的右边重尾程度,vt表示变量参数集合中第t个时刻的左边重尾程度,W0表示第一初始模型参数,b0表示第二初始模型参数,θ0表示第三初始模型参数,ht表示第t个时刻的隐藏层向量,[]T表示转置计算,tanh()表示双曲正切函数。
可选地,CPU 522具体用于执行如下步骤:
采用如下方式获取第二分位数函数:
其中,Q(τ\μtt,ut,vt)表示第二分位数函数,Zτ表示第一分位数函数,τ表示概率水平参数,A表示预设常数,e表示自然对数的底数。
可选地,CPU 522具体用于执行如下步骤:
采用如下方式计算模型参数:
其中,min表示取最小值,Wο表示第一模型参数,bο表示第二模型参数,θ表示第三模型参数,K表示概率水平参数集合中概率水平参数的总个数,k表示概率水平参数集合中的第k个概率水平参数,T表示待训练时间序列中时刻的总个数,t表示待训练时间序列中的第t个时刻,L表示观测值序列中观测值的总个数,表示针对概率水平参数为τk的损失函数,rt表示待训练时间序列,Q(τktt,ut,vt)表示针对概率水平参数为τk的第二分位数函数。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (15)

1.一种概率预测的方法,其特征在于,包括:
从历史时间序列中获取目标观测值序列,其中,所述历史时间序列为待预测时刻之前的时间序列,所述目标观测值序列包含L个目标观测值,所述L为大于或等于1的整数;
根据所述目标观测值序列确定目标特征向量序列,其中,所述目标特征向量序列中包含L个目标特征向量;
通过概率预测模型获取所述目标特征向量序列所对应的目标变量参数集合,其中,所述目标变量参数集合中包含至少一个目标变量参数;
采用所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,其中,所述第二分位数函数用于预测所述待预测时刻下的概率分布,所述概率分布用于评估目标风险等级。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标观测值序列确定目标特征向量序列,包括:
采用如下方式计算所述目标特征向量序列:
其中,所述表示所述目标特征向量序列中的第1个目标特征向量,所述表示所述目标特征向量序列中的第L个目标特征向量,所述L表示目标观测值序列中目标观测值的总个数,所述t'表示所述待预测时刻,所述rt'-L表示所述目标观测值序列中第t'-L个时刻的观测值,所述rt'-1表示所述目标观测值序列中第t'-1个时刻的观测值,所述表示目标观测值均值,所述i为大于或等于1,且小于或等于所述L的整数。
3.根据权利要求2所述的方法,其特征在于,所述通过概率预测模型获取所述目标特征向量序列所对应的目标变量参数集合,包括:
采用如下方式计算所述目标变量参数集合:
t't',ut',vt']T=tanh(Wοht'+bο);
其中,所述μt'表示所述目标变量参数集合中所述第t'个时刻的位置参数,所述σt'表示所述目标变量参数集合中所述第t'个时刻的尺度参数,所述ut'表示所述目标变量参数集合中所述第t'个时刻的右边重尾程度,所述vt'表示所述目标变量参数集合中所述第t'个时刻的左边重尾程度,所述Wο表示第一模型参数,所述bο表示所述第二模型参数,所述θ表示第三模型参数,所述ht'表示所述第t'个时刻的隐藏层向量,所述[]T表示转置计算,所述tanh()表示双曲正切函数。
4.根据权利要求3所述的方法,其特征在于,所述采用所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,包括:
采用如下方式获取所述第二分位数函数:
其中,所述Q(τ\μt't',ut',vt')表示所述第二分位数函数,所述Zτ'表示所述第一分位数函数,所述τ表示概率水平参数,所述A表示预设常数,所述e表示自然对数的底数。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述采用所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数之后,所述方法还包括:
随机生成第一模拟数据集合,其中,所述第一模拟数据集合包括至少一个第一模拟数据,所述第一模拟数据满足所述第二分位数函数;
根据所述第二分位数函数计算所述第一模拟数据集合对应的第二模拟数据集合,其中,所述第二模拟数据集合包括至少一个第二模拟数据,且所述第二模拟数据集合中数据个数与所述第一模拟数据集合中的数据个数相等;
根据所述第二模拟数据集合确定目标风险等级;
其中,所述根据所述第二分位数函数计算所述第一模拟数据集合对应的第二模拟数据集合,包括:
采用如下方式计算所述第二模拟数据集合:
其中,所述μt'表示所述目标变量参数集合中所述第t'个时刻的位置参数,所述σt'表示所述目标变量参数集合中所述第t'个时刻的尺度参数,所述ut'表示所述目标变量参数集合中所述第t'个时刻的右边重尾程度,所述vt'表示所述目标变量参数集合中所述第t'个时刻的左边重尾程度,所述A表示预设常数,所述e表示自然对数的底数,所述xi表示所述第一模拟数据集合中第i个第一模拟数据,所述Yi表示所述第二模拟数据集合中第i个第二模拟数据。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二模拟数据集合确定目标风险等级,包括:
根据所述第二模拟数据集合计算得到待评测数据;
按照风险评价规则确定所述待评测数据所对应的所述目标风险等级,其中,所述风险评价规则为预先设置的评测数据范围与风险等级之间的关系。
7.一种模型训练的方法,其特征在于,包括:
从待训练时间序列中获取观测值序列,其中,所述观测值序列包含L个观测值,所述L为大于或等于1的整数;
根据所述观测值序列确定特征向量序列,其中,所述特征向量序列中包含L个特征向量;
通过深层神经网络DNN模型获取所述特征向量序列所对应的变量参数集合,其中,所述变量参数集合中包含至少一个变量参数;
采用所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
根据所述第二分位数函数以及概率水平参数集合确定模型参数,其中,所述概率水平参数集合包含至少一个概率水平参数,其中,所述概率水平参数为大于或等于0,且小于或等于1的预设概率值;
采用所述模型参数对所述DNN模型进行训练,得到概率预测模型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述观测值序列确定特征向量序列,包括:
采用如下方式计算所述特征向量序列:
其中,所述表示所述特征向量序列中的第1个特征向量,所述表示所述特征向量序列中的第L个特征向量,所述L表示所述特征向量序列中特征向量的总个数,所述t表示所述待训练时间序列中的第t个时刻,所述rt-L表示所述观测值序列中第t-L个时刻的观测值,所述rt-1表示所述观测值序列中第t-1个时刻的观测值,所述表示观测值均值,所述i为大于或等于1,且小于或等于所述L的整数。
9.根据权利要求8所述的方法,其特征在于,所述通过深层神经网络DNN模型获取所述特征向量序列所对应的变量参数集合,包括:
采用如下方式计算所述变量参数集合:
tt,ut,vt]T=tanh(W0ht+b0);
其中,所述μt表示所述变量参数集合中所述第t个时刻的位置参数,所述σt表示所述变量参数集合中所述第t个时刻的尺度参数,所述ut表示所述变量参数集合中所述第t个时刻的右边重尾程度,所述vt表示所述变量参数集合中所述第t个时刻的左边重尾程度,所述W0表示第一初始模型参数,所述b0表示所述第二初始模型参数,所述θ0表示第三初始模型参数,所述ht表示所述第t个时刻的隐藏层向量,所述[]T表示转置计算,所述tanh()表示双曲正切函数。
10.根据权利要求9所述的方法,其特征在于,所述采用所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数,包括:
采用如下方式获取所述第二分位数函数:
其中,所述Q(τ\μtt,ut,vt)表示所述第二分位数函数,所述Zτ表示所述第一分位数函数,所述τ表示概率水平参数,所述A表示预设常数,所述e表示自然对数的底数。
11.根据权利要求7至10中任一项所述的方法,其特征在于,所述根据所述第二分位数函数以及概率水平参数集合确定模型参数,包括:
采用如下方式计算所述模型参数:
其中,所述min表示取最小值,所述Wο表示第一模型参数,所述bο表示所述第二模型参数,所述θ表示第三模型参数,所述K表示所述概率水平参数集合中概率水平参数的总个数,所述k表示所述概率水平参数集合中的第k个概率水平参数,所述T表示所述待训练时间序列中时刻的总个数,所述t表示所述待训练时间序列中的第t个时刻,所述L表示观测值序列中观测值的总个数,所述表示针对概率水平参数为τk的损失函数,所述rt表示所述待训练时间序列,所述Q(τktt,ut,vt)表示针对概率水平参数为τk的所述第二分位数函数。
12.一种概率预测装置,其特征在于,包括:
获取模块,用于从历史时间序列中获取目标观测值序列,其中,所述历史时间序列为待预测时刻之前的时间序列,所述目标观测值序列包含L个目标观测值,所述L为大于或等于1的整数;
确定模块,用于根据所述获取模块获取的所述目标观测值序列确定目标特征向量序列,其中,所述目标特征向量序列中包含L个目标特征向量;
所述获取模块,还用于通过概率预测模型获取所述确定模块确定的所述目标特征向量序列所对应的目标变量参数集合,其中,所述目标变量参数集合中包含至少一个目标变量参数;
处理模块,用于采用所述获取模块获取的所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,其中,所述第二分位数函数用于预测所述待预测时刻下的概率分布,所述概率分布用于评估目标风险等级。
13.一种模型训练装置,其特征在于,包括:
获取模块,用于从待训练时间序列中获取观测值序列,其中,所述观测值序列包含L个观测值,所述L为大于或等于1的整数;
确定模块,用于根据所述待训练时间序列以及所述获取模块获取的所述观测值序列确定特征向量序列,其中,所述特征向量序列中包含L个特征向量;
所述获取模块,还用于通过深层神经网络DNN模型获取所述确定模块确定的所述特征向量序列所对应的变量参数集合,其中,所述变量参数集合中包含至少一个变量参数;
处理模块,用于采用所述获取模块获取的所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
所述确定模块,还用于根据所述处理模块处理得到的所述第二分位数函数以及概率水平参数集合确定模型参数,其中,所述概率水平参数集合包含至少一个概率水平参数,其中,所述概率水平参数为大于或等于0,且小于或等于1的预设概率值;
训练模块,用于采用所述确定模块确定的所述模型参数对所述DNN模型进行训练,得到概率预测模型。
14.一种服务器,其特征在于,包括:存储器、收发器、处理器以及总线***;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
从历史时间序列中获取目标观测值序列,其中,所述历史时间序列为待预测时刻之前的时间序列,所述目标观测值序列包含L个目标观测值,所述L为大于或等于1的整数;
根据所述目标观测值序列确定目标特征向量序列,其中,所述目标特征向量序列中包含L个目标特征向量;
通过概率预测模型获取所述目标特征向量序列所对应的目标变量参数集合,其中,所述目标变量参数集合中包含至少一个目标变量参数;
采用所述目标变量参数集合对第一分位数函数进行非线性变换处理,得到所述待预测时刻所对应的第二分位数函数,其中,所述第二分位数函数用于预测所述待预测时刻下的概率分布,所述概率分布用于评估目标风险等级;
所述总线***用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
15.一种服务器,其特征在于,包括:存储器、收发器、处理器以及总线***;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
从待训练时间序列中获取观测值序列,其中,所述观测值序列包含L个观测值,所述L为大于或等于1的整数;
根据所述观测值序列确定特征向量序列,其中,所述特征向量序列中包含L个特征向量;
通过深层神经网络DNN模型获取所述特征向量序列所对应的变量参数集合,其中,所述变量参数集合中包含至少一个变量参数;
采用所述变量参数集合对第一分位数函数进行非线性变换处理,得到第二分位数函数;
根据所述第二分位数函数以及概率水平参数集合确定模型参数,其中,所述概率水平参数集合包含至少一个概率水平参数,其中,所述概率水平参数为大于或等于0,且小于或等于1的预设概率值;
采用所述模型参数对所述DNN模型进行训练,得到概率预测模型;
所述总线***用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
CN201811447475.XA 2018-11-29 2018-11-29 一种概率预测的方法、模型训练的方法及装置 Pending CN110175689A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811447475.XA CN110175689A (zh) 2018-11-29 2018-11-29 一种概率预测的方法、模型训练的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811447475.XA CN110175689A (zh) 2018-11-29 2018-11-29 一种概率预测的方法、模型训练的方法及装置

Publications (1)

Publication Number Publication Date
CN110175689A true CN110175689A (zh) 2019-08-27

Family

ID=67688975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811447475.XA Pending CN110175689A (zh) 2018-11-29 2018-11-29 一种概率预测的方法、模型训练的方法及装置

Country Status (1)

Country Link
CN (1) CN110175689A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929919A (zh) * 2019-11-01 2020-03-27 南昌大学 基于超效率dea-bp神经网络的企业绿色创新效率预测方法
CN111222790A (zh) * 2020-01-06 2020-06-02 深圳前海微众银行股份有限公司 风险事件发生概率的预测方法、装置、设备及存储介质
CN112116154A (zh) * 2020-09-18 2020-12-22 北京嘀嘀无限科技发展有限公司 数据处理方法、数据处理装置、存储介质和电子设备
CN114093055A (zh) * 2021-11-26 2022-02-25 海南小鲨鱼智能科技有限公司 一种路谱生成的方法、装置、电子设备及介质
CN114692760A (zh) * 2022-03-30 2022-07-01 中国民航科学技术研究院 下降率估算模型构建、下降率估算方法、装置及电子设备
CN117688734A (zh) * 2023-11-30 2024-03-12 中国人民解放军92493部队试验训练总体研究所 基于随机模拟的设备可靠性及其寿命检测方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929919A (zh) * 2019-11-01 2020-03-27 南昌大学 基于超效率dea-bp神经网络的企业绿色创新效率预测方法
CN111222790A (zh) * 2020-01-06 2020-06-02 深圳前海微众银行股份有限公司 风险事件发生概率的预测方法、装置、设备及存储介质
CN112116154A (zh) * 2020-09-18 2020-12-22 北京嘀嘀无限科技发展有限公司 数据处理方法、数据处理装置、存储介质和电子设备
CN112116154B (zh) * 2020-09-18 2024-05-14 北京嘀嘀无限科技发展有限公司 数据处理方法、数据处理装置、存储介质和电子设备
CN114093055A (zh) * 2021-11-26 2022-02-25 海南小鲨鱼智能科技有限公司 一种路谱生成的方法、装置、电子设备及介质
CN114692760A (zh) * 2022-03-30 2022-07-01 中国民航科学技术研究院 下降率估算模型构建、下降率估算方法、装置及电子设备
CN114692760B (zh) * 2022-03-30 2023-03-24 中国民航科学技术研究院 下降率估算模型构建、下降率估算方法、装置及电子设备
CN117688734A (zh) * 2023-11-30 2024-03-12 中国人民解放军92493部队试验训练总体研究所 基于随机模拟的设备可靠性及其寿命检测方法
CN117688734B (zh) * 2023-11-30 2024-07-23 中国人民解放军92493部队试验训练总体研究所 基于随机模拟的设备可靠性及其寿命检测方法

Similar Documents

Publication Publication Date Title
Li et al. Risk prediction in financial management of listed companies based on optimized BP neural network under digital economy
Chen et al. A hybrid approach for portfolio selection with higher-order moments: Empirical evidence from Shanghai Stock Exchange
Sun et al. A new ensemble deep learning approach for exchange rates forecasting and trading
CN110175689A (zh) 一种概率预测的方法、模型训练的方法及装置
Xu et al. Composite quantile regression neural network with applications
Wu et al. Evolving RBF neural networks for rainfall prediction using hybrid particle swarm optimization and genetic algorithm
AU2022211812A1 (en) Method and system of dynamic model selection for time series forecasting
Aastveit et al. The evolution of forecast density combinations in economics
Sadaei et al. Combining ARFIMA models and fuzzy time series for the forecast of long memory time series
CN110599336B (zh) 一种金融产品购买预测方法及***
CN109118013A (zh) 一种基于神经网络的经营数据预测方法、可读存储介质和预测***
WO2021082810A1 (zh) 一种外汇时间序列预测的构建方法
Wang et al. The influence of international oil prices on the exchange rates of oil exporting countries: Based on the hybrid copula function
Li et al. Forecasting China’s sovereign CDS with a decomposition reconstruction strategy
Wang et al. Energy futures price prediction and evaluation model with deep bidirectional gated recurrent unit neural network and RIF-based algorithm
Lin et al. Tourism demand forecasting: Econometric model based on multivariate adaptive regression splines, artificial neural network and support vector regression
Zhang et al. Prediction on the highest price of the stock based on PSO-LSTM neural network
Li et al. Asset returns in deep learning methods: An empirical analysis on SSE 50 and CSI 300
Hernández-Lobato Balancing flexibility and robustness in machine learning: semi-parametric methods and sparse linear models
Prüser et al. Nonlinearities in macroeconomic tail risk through the lens of big data quantile regressions
Pradhan et al. Application of neural network in prediction financial viability
Kalaycı et al. Optimal model description of finance and human factor indices
Xie et al. Exploration of stock portfolio investment construction using deep learning neural network
Sun et al. Short-term stock price forecasting based on an SVD-LSTM model
Bakumenko et al. Synthesis method of robust neural network models of systems and processes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination