CN112734565B

CN112734565B - 流动性覆盖率预测方法及装置

Info

Publication number: CN112734565B
Application number: CN202110036773.5A
Authority: CN
Inventors: 张佩玉; 温丽明; 梁森; 钟锐填
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2021-01-12
Filing date: 2021-01-12
Publication date: 2024-03-05
Anticipated expiration: 2041-01-12
Also published as: CN112734565A

Abstract

一种流动性覆盖率预测方法及装置，属于大数据和人工智能技术领域，所述方法包含：获取历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据；根据历史时刻的业务数据和历史时刻下的流动性覆盖率数据对第一训练模型进行训练；根据预定条件筛选流动性覆盖率数据和对应时刻下的业务数据，根据筛选结果对第二训练模型进行训练；根据第一训练模型和预测的业务数据，获得流动性覆盖率预测值；将预测值与预设阈值比较，并根据比较结果将流动性覆盖率预测值带入第二训练模型获得多个业务数据配置方案数据；根据业务数据配置方案数据与预测的业务数据的比较结果，获得业务数据调整方案。

Description

流动性覆盖率预测方法及装置

技术领域

本发明涉及大数据和人工智能技术领域，可适用于银行业务数据处理领域和金融领域，尤指一种流动性覆盖率预测方法及装置。

背景技术

流动性覆盖率是监管核心指标，管理短期的流动性风险。流动性覆盖率旨在确保商业银行具有充足的合格优质流动性资产，能够在银监会规定的流动性压力情景下，通过变现这些资产满足未来的流动性需求。

现有技术中，当商业银行流动性覆盖率计算采用业务报表的形式展现，时效性和自动化程度不高，同时，无法对商业银行未来的流动性覆盖率进行预测，提高银行控制风险水平的能力。

发明内容

本发明目的在于提供一种流动性覆盖率预测方法及装置，以及时对流动性覆盖率风险进行预警，并根据预测的流动性覆盖率情况，预测得到业务数据配置优化预警；有效利用预测结果，提高控制风险水平能力，增强银行非预期损失的抵御能力；能够提高指标测算的精确度，提升指标管理的前瞻性和智能化程度。

为达上述目的，本发明所提供的流动性覆盖率预测方法，所述方法包含：获取历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据；根据所述历史时刻的业务数据和历史时刻下的流动性覆盖率数据对预先建立的机器学习模型进行训练，获得第一训练模型；根据预定条件筛选所述流动性覆盖率数据和对应时刻下的业务数据，并根据筛选结果对预先建立的机器学习模型进行训练，获得第二训练模型；根据所述第一训练模型和预测的业务数据，获得流动性覆盖率预测值；将所述预测值与预设阈值比较，并根据比较结果将所述流动性覆盖率预测值带入所述第二训练模型获得多个业务数据配置方案数据；根据所述业务数据配置方案数据与预测的业务数据的比较结果，获得业务数据调整方案。

本发明还提供一种流动性覆盖率预测装置，所述装置包含：数据获取模块、训练模块、预测模块、配置方案计算模块和匹配模块；所述数据获取模块用于获取历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据；所述训练模块用于根据所述历史时刻的业务数据和历史时刻下的流动性覆盖率数据对预先建立的机器学习模型进行训练，获得第一训练模型；以及，根据预定条件筛选所述流动性覆盖率数据和对应时刻下的业务数据，并根据筛选结果对预先建立的机器学习模型进行训练，获得第二训练模型；所述预测模块用于根据所述第一训练模型和预测的业务数据，获得流动性覆盖率预测值；以及，将所述预测值与预设阈值比较，并根据比较结果将所述流动性覆盖率预测值提供至所述第二训练模块；所述配置方案计算模块用于将所述流动性覆盖率预测值带入所述第二训练模型获得多个业务数据配置方案数据；所述匹配模块用于根据所述业务数据配置方案数据与预测的业务数据的比较结果，获得业务数据调整方案。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有执行上述方法的计算机程序。

本发明的有益技术效果在于：一方面可针对自身经营状况确定流动性覆盖率目标，另一方面，当实际流动性覆盖率偏离目标时，可主动采取调整措施以缩小偏离程度，提升对外部冲击下流动性覆盖率风险的抵御能力；再者通过对流动性覆盖率的预测，降低流动性覆盖率未达标的概率；所提及的流动性覆盖率预测，同样可以为其他新兴市场的流动性覆盖率提供了一定的研究借鉴，适用范围广，可移植性高。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。在附图中：

图1A为本发明所提供的流动性覆盖率预测方法的流程示意图；

图1B为本发明提供的流动性覆盖率预测方法的流程图；

图2为本发明提供的流动性覆盖率预测方法的流程图；

图3为本发明提供的流动性覆盖率预测方法的流程图；

图4为本发明提供的流动性覆盖率预测装置的框图；

图5为本发明提供的数据获取模块的框图；

图6为本发明提供的机器学习1模块的框图；

图7为本发明提供的机器学习2模块的框图；

图8为本发明实施例提供的流动性覆盖率计算和预测模块的框图；

图9为本发明实施例提供的业务数据配置方案计算模块的框图；

图10为本发明实施例提供的成分相似度匹配模块的框图；

图11为本发明实施例提供的数据展示模块的框图；

图12为本发明一实施例所提供的电子设备的结构示意图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式，借此对本发明如何应用技术手段来解决技术问题，并达成技术效果的实现过程能充分理解并据以实施。需要说明的是，只要不构成冲突，本发明中的各个实施例及各实施例中的各个特征可以相互结合，所形成的技术方案均在本发明的保护范围之内。

另外，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

请参考图1A所示，本发明所提供的一种本发明所提供的流动性覆盖率预测方法，所述方法包含：

S1011获取历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据；

S1012根据所述历史时刻的业务数据和历史时刻下的流动性覆盖率数据对预先建立的机器学习模型进行训练，获得第一训练模型；

S1013根据预定条件筛选所述流动性覆盖率数据和对应时刻下的业务数据，并根据筛选结果对预先建立的机器学习模型进行训练，获得第二训练模型；

S1014根据所述第一训练模型和预测的业务数据，获得流动性覆盖率预测值；

S1015将所述预测值与预设阈值比较，并根据比较结果将所述流动性覆盖率预测值带入所述第二训练模型获得多个业务数据配置方案数据；

S1016根据所述业务数据配置方案数据与预测的业务数据的比较结果，获得业务数据调整方案。

在实际工作中，上述流动性覆盖率预测方法的应用原理在于：获取历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据；根据所述历史时刻的业务数据和历史时刻下的流动性覆盖率数据对预先建立的机器学习模型1进行训练和计算，得出训练模型1；根据预先设定的条件，筛选后的历史；根据设定的条件，筛选后的历史时刻下的流动性覆盖率数据和对应时刻下的的业务数据对预先建立的机器学习模型2进行训练，得出训练模型2；利用训练后的机器学习模型1计算预测流动性覆盖率数据；分析得到的流动性覆盖率预测值，根据预先设定的阈值，形成流动性覆盖率预警；根据流动性覆盖率预测数据，利用训练后的机器学习模型2计算获得多个业务数据配置方案数据；将多个业务数据配置方案数据分别与预测的业务数据进行成分比例相似性匹配，获得多个业务数据配置方案与预测的业务数据的相似性；根据相似性和用户偏好度获得业务数据调整方案。

请参考图2所示，在本发明一实施例中，根据所述历史时刻的业务数据和历史时刻下的流动性覆盖率数据对预先建立的机器学习模型进行训练，获得第一训练模型包含：

S201将所述特征值信息和历史时刻下的流动性覆盖率数据随机分割为K个不重合的子数据集，以K-1个子数据集作为训练集，剩下1个作为验证集；

S202通过迭代的方式，分别将每次选择的训练集输入预先建立的机器学习模型中，进行训练，以对应的验证集进行模型学习优化；通过遗传算法和支持向量机回归算法的多元线性回归集成学习训练，获得第一训练模型；K为大于1的正整数。

其中，根据所述第一训练模型和预测的业务数据，获得流动性覆盖率预测值包含：通过预测的业务数据对应的特征值信息和所述第一训练模型计算获得流动性覆盖率预测值。

在实际工作中，可将原始数量的历史时刻业务数据和历史时刻流动性覆盖率数据随机分割为K个不重合的子数据集，每次选择K-1个作为训练集，剩下1个作为验证集。通过迭代的方式，分别将每次选择K-1个作为训练集输入预先建立的机器学习模型中，进行初始训练；将剩下的1个数据集作为检验样本对初始训练后的机器学习模型进行优化，通过迭代的方式生成训练后的机器学习模型。具体的，对所述的机器学习模型采取遗传算法GA模型和支持向量机回归算法(SVR)模型双重作用模型。GA算法模型用于得到未来时刻下对应预测值所对应的最优业务数据配置方案。在GA算法模型中某个时刻下，银行业务数据的特征属性集合WP表示个体，其中P是特征数据，W是对应权值，WP中的某个值W_iP_i表示个体中的一个遗传因子，i≥1。适用性评价函数为Fn。根据个体相似性划分物种(多个个体组成一个物种)。然后适应性评价函数对个体进行目标函数置信评价得到置信度评价。GA算法模型的演变过程先是生存竞争，同物种优胜劣汰保留一定百分比的个体数，然后是物竞天择，物种间遗传变异繁衍后代个体，对环境适应性高的个体生存下来。通过多次迭代演变后，使得目标函数置信评价最佳，此时的集合WP为当前时刻下最优个体遗传组合。在GA模型中以SVR模型的回归置信度作为收敛目标，即SVR模型的回归方程f(x)是所述的GA模型的目标函数。所述的SVR模型即为支持向量机回归(SVR)算法的多元线性回归，通过给定一个新的输入样本x，根据给定的数据样本推断它所对应的输出Y是多少，这个输出Y是一个实数。用数学语言可以把回归问题描述为：给定的数据样本集合为{(x_i,y_i)|x_i∈Rⁿ,y_i∈R,i＝1,2,3...,l}。寻找Rⁿ上的一个函数f(x)，得到回归方程，以便用y＝f(x)来推断任一x输入所对应的y值。

在本发明一实施例中，根据所述业务数据配置方案数据与预测的业务数据的比较结果，获得业务数据调整方案包含：将多个业务数据配置方案数据分别与预测的业务数据进行成分比例相似性匹配，获得各业务数据配置方案数据与预测的业务数据的相似性；根据所述相似性筛选所述业务数据配置方案数据，获得符合预设条件的业务数据调整方案。

请参考图3所示，在本发明一实施例中，根据筛选结果对预先建立的机器学习模型进行训练，获得第二训练模型包含：

S301获取用户的偏好度数据和筛选后的业务数据和历史时刻下的流动性覆盖率数据，将其随机分割为K个不重合的子数据集，以K-1个子数据集作为训练集，剩下1个作为验证集；

S302通过迭代的方式，分别将每次选择的训练集输入预先建立的机器学习模型中，进行训练，以对应的验证集进行模型学习优化；通过神经网络聚类算法训练获得第二训练模型；K为大于1的正整数。

由此，在后续根据比较结果将所述流动性覆盖率预测值带入所述第二训练模型获得多个业务数据配置方案数据还可包含：根据比较结果将所述流动性覆盖率预测值和所述偏好度数据带入所述第二训练模型获得多个业务数据配置方案数据。从而，将用户的喜好纳入至比例推荐，进一步增加比例调整的友好性和适用性。

在实际工作中，可将原始数量的历史时刻业务数据和历史时刻流动性覆盖率数据随机分割为K个不重合的子数据集，每次选择K-1个作为训练集，剩下1个作为验证集。通过迭代的方式，分别将每次选择K-1个作为训练集输入预先建立的机器学习模型中，进行初始训练；将剩下的1个数据集作为检验样本对初始训练后的机器学习模型进行优化，通过迭代的方式生成训练后的机器学习模型。具体的，对所述的机器学习模型采用神经网络聚类算法SOM实现数据聚类。所述用户的偏好度数据和筛选后的业务数据和历史时刻下的流动性覆盖率数据，由于数据类型复杂，形成高维数据集，作为数据样本的输入样本和输出样本。在输出样本随机选取数据作为初始值，然后再在输入样本中以随机概率选择输入向量，找到与输入向量距离最小的权重向量定义为局部最优集，然后在局部最优集附近区域内调整权重向输入向量靠拢。以收缩域半径、学习率、重复率，用户偏好度等因素作为评价函数因素。通过迭代训练，使得评价最佳，此时为最优聚合分类。所述的数据聚合分类，是一个数据集。每个时刻的历史流动性覆盖率数据可得到一个最优聚合分类数据集，就是该时间点的流动性覆盖率对应的最优业务数据配置方案。根据输入的流动性覆盖率数值和用户偏好度判断进行评判打分。

请参考图1B所示，在实际工作中，本发明所提供的流动性覆盖率预测方法可如下流程实施：

步骤S1021：银行历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据；对所述的银行历史时刻的各业务应用服务器***的业务数据进行筛选、缺失数据的处理以及异常数据剔除，作为源数据。

步骤S1022：根据所述银行历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据对预先建立的机器学习模型1进行训练。将原始数量的历史时刻业务数据和历史时刻流动性覆盖率数据随机分割为K个不重合的子数据集，每次选择K-1个作为训练集，剩下1个作为验证集。通过迭代的方式，分别将每次选择K-1个作为训练集输入预先建立的机器学习模型中，进行初始训练；将剩下的1个数据集作为检验样本对初始训练后的机器学习模型进行优化。通过遗传算法和支持向量机回归算法的多元线性回归集成学习训练得到流动性覆盖率预测模型。

步骤S1023：根据设定的条件，筛选后的银行历史时刻下的流动性覆盖率数据和对应历史时刻下的各业务应用服务器***的业务数据对预先建立的机器学习模型2进行训练。将原始数量的筛选过后的历史时刻业务数据和历史时刻流动性覆盖率数据随机分割为K个不重合的子数据集，每次选择K-1个作为训练集，剩下1个作为验证集。通过迭代的方式，分别将每次选择K-1个作为训练集输入预先建立的机器学习模型中，进行初始训练；将剩下的1个数据集作为检验样本对初始训练后的机器学习模型进行优化。通过神经网络聚类算法训练得到业务数据配置方案计算模型。

步骤S1024：利用训练后的机器学习模型1流动性覆盖率预测模型，计算预测未来时间的流动性覆盖率。对待确定流动性覆盖率的银行各业务***业务数据进行数据处理，计算预测得到未来时间的流动性覆盖率；根据预测的流动性覆盖率和预先设置的流动性覆盖率预警规则，对市场风险进行预警。

步骤S1025：根据预测的流动性覆盖率和预先设置的流动性覆盖率预警规则，对流动性覆盖率风险进行预警。

步骤S1026：根据S1025得到的未来时间流动性覆盖率预测数据，利用训练后的机器学习模型2，计算获得多个业务数据配置方案数据。

步骤S1027：将多个业务数据配置方案数据分别与预测的业务数据进行成分比例相似性匹配，获得多个业务数据配置方案与预测的业务数据的相似性。

步骤S1028：根据相似性和用户偏好度获得业务数据调整方案。

在上述实施例中，所述数据获取模块包含数据处理单元和特征值提取单元，所述数据处理单元用于对所述的银行历史时刻的各业务***的业务数据和历史时刻下的流动性覆盖率数据进行整合、筛选、缺失数据的处理以及异常数据剔除。所述特征值提取单元用于获取流动性覆盖率率预测数据基础业务数据的初始特征值属性。

在本发明一实施例中，所述训练模块可包含第一模型训练单元，所述第一模型训练单元用于将所述特征值信息和历史时刻下的流动性覆盖率数据随机分割为K个不重合的子数据集，以K-1个子数据集作为训练集，剩下1个作为验证集；通过迭代的方式，分别将每次选择的训练集输入预先建立的机器学习模型进行训练，以对应的验证集进行模型优化；通过遗传算法和支持向量机回归算法的多元线性回归训练获得第一训练模型；K为大于1的正整数。其中，所述训练模块还可包含第二模型训练单元：获取用户的偏好度数据，根据所述偏好度数据和筛选结果对预先建立的机器学习模型进行训练，通过神经网络聚类算法训练获得第二训练模型。

在本发明一实施例中，所述配置方案计算模块还包含：根据比较结果将所述流动性覆盖率预测值和所述偏好度数据带入所述第二训练模型获得多个业务数据配置方案数据。

为便于更清楚的说明本发明所提供的流动性覆盖率预测装置以下结合附图对上述实施例做进一步说明，本领域相关技术人员当可知，该实例仅为帮助理解本发明所提供的流动性覆盖率预测装置，并不对其做进一步限定。

请参考图4所示，本发明所提供的流动性覆盖率预测装置在实际应用时可包含数据获取模块201，机器学习1模块202，机器学习2模块203，流动性覆盖率计算模块204和预测模块流动性覆盖率预警模块205，业务数据配置方案计算模块206，成分相似度匹配模块207，数据展示模块208。其中，所述机器学习1模块202和所述机器学习2模块203即为训练模块，所述流动性覆盖率计算模块204和所述预测模块流动性覆盖率预警模块205即为预测模块，所述业务数据配置方案计算模块206即为配置方案计算模块，所述成分相似度匹配模块207和所述数据展示模块208即为匹配模块。

结合参考图1B所示，数据获取模块201主要用于执行上述步骤S1021，即获取银行历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据。

具体请参考图5所示，包括数据获取单元11、数据处理单元12、特征值获取单元13和数据传输单元14。

数据获取单元11：接收和加载银行各类业务***的业务数据。如存款***业务数据，贷款***业务数据，风控***业务数据，清算***业务数据，金融市场***业务数据等，形成大数据集合，作为机器学习1模块的源数据。

数据处理单元12：对所述的银行历史时刻的各业务***的业务数据和历史时刻下的流动性覆盖率数据进行整合、筛选、缺失数据的处理以及异常数据剔除。对***缺失数据进行梳理，若存在缺失的情况，则根据前后日期数据进行插值处理。插值方式可选取线性插值，即取当天特征值为前后两天数据的平均值，即x_i-1、x_i+1为前后两天的数据，x_i为当天数据；若某一日期的特征值急剧增加或减少，例如与前后某一范围内差异极大，则认为是突发事件或偶然事件导致，将这一部分数据剔除。

特征值获取单元13：导入初始特征值，如下表1所示，为本实施例中流动性覆盖率率预测数据基础业务数据的初始特征值属性和对应的属性值表格。

表1

由流动性覆盖率＝合格优质流动资产/未来30天现金净流出量*100％可知特征数据包括两种，一种是合格优质流动资产业务数据，用P1表示作为合格优质流动资产业务数据的特征值数据，权值用W1表示，则特征数据集合为W1P1；另一种是未来一段时间的现金净流出量业务数据，现金净流出量＝现金流出-现金流入，用P2表示作为未来一段时间的现金净流出量业务数据的特征值数据，权值用W2表示，则特征数据集合为W2P2。流动性覆盖率的特征值向量表示为

数据传输单元14：用于将处理得到的特征值数据传输给下一个模块。

结合参考图1B所示，机器学习1模块202主要用于执行上述步骤S1022，即根据所述银行历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据对预先建立的机器学习模型1进行训练，具体可包括特征值导入单元，历史数据导入单元，模型训练单元建立学习模型。

如图6所示，特征值数据导入单元21：导入特征值，将步骤S1021对应的装置模块201得到的特征值数据导入。

历史结果数据导入单元22：通过将历史时刻流动性覆盖率率数据作为机器学习的训练集，针对特征值数据的不同时间点，匹配历史流动性率覆盖率结果数据。

机器学习模型1训练单元23：机器学习模型1即流动性覆盖率预测模型，在此案例中是采取遗传算法GA模型和支持向量机回归算法(SVR)模型双重作用模型。GA算法模型用于得到未来时刻下对应预测值所对应的最优业务数据配置方案。在GA算法模型中某个时刻下，银行业务数据的特征属性集合WP表示个体，其中P是特征数据，W是对应权值，WP中的某个值W_iP_i表示其中一个遗传因子，i≥1。适用性评价函数为Fn。根据个体相似性划分物种(多个个体组成一个物种)。然后适应性评价函数对个体进行目标函数置信评价得到置信度评价。GA算法模型的演变过程先是生存竞争，同物种优胜劣汰保留一定百分比的个体数，然后是物竞天择，物种间遗传变异繁衍后代个体，对环境适应性高的个体生存下来。通过多次迭代演变后，使得目标函数置信评价最佳，此时的集合WP为当前时刻下最优个体遗传组合。在GA模型中以SVR模型的回归置信度作为收敛目标。即SVR模型的回归方程f(x)是所述的GA模型的目标函数。所述的SVR模型即为支持向量机回归(SVR)算法的多元线性回归，通过给定一个新的输入样本x，根据给定的数据样本推断它所对应的输出Y是多少，这个输出Y是一个实数。用数学语言可以把回归问题描述为：给定的数据样本集合为{(x_i,y_i)|x_i∈Rⁿ,y_i∈R,i＝1,2,3...,l}。寻找Rⁿ上的一个函数f(x)，得到回归方程，以便用y＝f(x)来推断任一x输入所对应的y值。

预测结果分析单元24：通过机器学习模型1训练单元23得到的预测数据和历史流动性覆盖率数据导入历史结果数据导入单元22作为样本。将全部数量的历史时刻业务数据和历史时刻流动性覆盖率数据随机分割为K个不重合的子数据集，每次选择K-1数据集个作为训练样本，剩下1个数据集作为验证样本。通过调整迭代次数和检验样本偏差得到回归方程。

流动性覆盖率计算模块204和预测模块流动性覆盖率预警模块205对应图1B中的步骤S1024和S1025，其中，流动性覆盖率预测模块，用于利用训练后的机器学习模型1预测流动性覆盖率数据，包括数据导入单元，流动性覆盖率计算预测处理单元，流动性覆盖率预警单元和数据传输单元，具体请参考图8所示。

数据导入单元41，导入待计算和预测流动性覆盖率的银行各业务***业务数据。

流动性覆盖率计算预测处理单元42，***每天加载银行业务数据服务器的数据，并形成特征值样本，用于利用训练后的机器学习模型1计算和预测流动性覆盖率，对待计算和预测流动性覆盖率的银行各业务***业务数据，预测流动性覆盖率，生成未来时间的流动性覆盖率；

通过流动性覆盖率计算预测管理单元43用于配置预警参数和预警模型。通过流动性覆盖率计算预测处理模块42调用机器学习服务器，生成未来流动性覆盖率数据，根据未来数据进行预警；所述预警模型用于通过设置流动性覆盖率预警阀值(比如监管要求流动性覆盖率不能低于100％)作为下限，低于下限则生成流动性覆盖率过低预警。

用户通过流动性覆盖率预警单元44设置流动性覆盖率预警参数，预警提醒方式及频率，并对达到预警阀值的预测数据进行预警(高亮显示、短信或邮件提醒等方式)。

其中，流动性覆盖率率预测数据结构可如下：

通过数据传输单元45传输未来流动性覆盖率的预测数据和预警信息展示出俩，并将这些信息传输到后一模块处理。

机器学习2模块203与机器学习1模块202类似，用于根据设定条件，筛选后的银行历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据对预先建立的机器学习模型2进行训练，包括特征值导入单元，历史数据导入单元，模型训练单元建立学习模型，传输单元传输数据到下一模块。

具体参考图7所示，特征值数据导入单元31将上述得到的特征值数据导入，作为数据特征值。

历史结果数据导入单元32：通过将筛选后的，历史时刻流动性覆盖率数据作为机器学习的训练集，针对特征值数据的不同时间点，匹配筛选后的历史流动性率覆盖率结果数据。

机器学习模型2训练单元33：数据分类训练：通过特征值数据导入31和历史时刻流动性覆盖率数据导入32作为样本。通过采用聚类的方式将数据进行分类，实现每个业务产品数据最优化聚合。案例中采用神经网络聚类算法SOM实现产品数据聚类，聚合过程可描述为：模块202中的得到的大数据集中由于数据类型复杂，形成高维数据集，作为数据样本的输入样本和输出样本。在输出样本随机选取数据作为初始值，然后再在输入样本中以随机概率选择输入向量，找到与输入向量距离最小的权重向量定义为局部最优集，然后在局部最优集附近区域内调整权重向输入向量靠拢。以收缩域半径、学习率、重复率，用户偏好度等因素作为评价函数因素。通过迭代重复上述过程进行模型训练，使得评价最佳，此时为最优聚合分类。数据未来预测训练：对所述的数据聚合分类，是一个数据集。每个时刻的历史流动性覆盖率数据可得到一个最优聚合分类数据集，就是该时间点的流动性覆盖率对应的最优业务数据配置方案。根据输入的流动性覆盖率数值(即对应于模块205中的到的流动覆盖率预测值)，和用户偏好度进行评价打分。一般情况下，历史时刻下的流动性覆盖率数据与输入的流动性覆盖率数据比较，值越大，则评分越高；用户对最优聚合分类的偏好越高，则评分越高。

结果传输单元34：将通过前述得到的预测数据和历史流动性覆盖率数据导入作为样本。将全部数量的历史时刻业务数据和历史时刻流动性覆盖率数据随机分割为K个不重合的子数据集，每次选择K-1数据集个作为训练样本，剩下1个数据集作为验证样本。通过调整计算次数和检验样本偏差得到最优配置方案。

业务数据配置方案计算模块206主要用于根据得到的未来时间流动性覆盖率预测数据，利用训练后的机器学习模型2，计算获得多个业务数据配置方案数据。具体可参考图9所示，包含数据导入单元51，业务数据配置方案计算单元52和数据传输单元53；所述数据导入单元51用于接收流动性覆盖率预警模块205输出的数据交由业务数据配置方案计算单元52计算获得多个业务数据配置方案数据后提供至所述数据传输单元53交由成分相似度匹配模块207。

成分相似度匹配模块207主要用于将多个业务数据配置方案数据分别与预测的业务数据进行成分比例相似性匹配，获得多个业务数据配置方案与预测的业务数据的相似性；具体如图10所示，可包含：

数据导入单元71：接收导入前一模块传输的数据。成分比例相似度匹配单元72：对配置方案进行业务成分分析，得到未来配置方案与前一模块得到的多个配置方案进行相似度分析，得到一个相似度评分值。数据传输单元73：将得到的相似度数据和对应业务配置方案传输到下一模块。

请参考图11所示，数据展示模块208主要用于根据相似性和用户偏好度获得业务数据调整方案，具体可包含：

数据导入单元81：接收前一模块传输的数据。

用户交互单元82：用于与用户交互，获取用户对业务数据配置方案的偏好度，并将此偏好度反馈给机器学习2模型，用于做后续数据训练样本。

业务数据配置调整方案展示单元83：得到的最优配置方案与未来时刻的配置方案比较得到一个业务数据配置调整方案，并将其展示出来。

如图12所示，该电子设备600还可以包括：通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是，电子设备600也并不是必须要包括图12中所示的所有部件；此外，电子设备600还可以包括图12中没有示出的部件，可以参考现有技术。

如图12所示，中央处理器100有时也称为控制器或操作控件，可以包括微处理器或其他处理器装置和/或逻辑装置，该中央处理器100接收输入并控制电子设备600的各个部件的操作。

其中，存储器140，例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息，此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序，以实现信息存储或处理等。

输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器，但并不限于此。

该存储器140可以是固态存储器，例如，只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器，其即使在断电时也保存信息，可被选择性地擦除且设有更多数据，该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142，该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。

存储器140还可以包括数据存储部143，该数据存储部143用于存储数据，例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。

通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100，以提供输入信号和接收输出信号，这可以和常规移动通信终端的情况相同。

基于不同的通信技术，在同一电子设备中，可以设置有多个通信模块110，如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132，以经由扬声器131提供音频输出，并接收来自麦克风132的音频输入，从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外，音频处理器130还耦合到中央处理器100，从而使得可以通过麦克风132能够在本机上录音，且使得可以通过扬声器131来播放本机上存储的声音。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种流动性覆盖率预测方法，其特征在于，所述方法包含：

获取历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据；

根据所述历史时刻的业务数据和历史时刻下的流动性覆盖率数据对预先建立的机器学习模型进行训练，获得第一训练模型；

根据预定条件筛选所述流动性覆盖率数据和对应时刻下的业务数据，并根据筛选结果对预先建立的机器学习模型进行训练，获得第二训练模型；

根据所述第一训练模型和预测的业务数据，获得流动性覆盖率预测值；

将所述预测值与预设阈值比较，并根据比较结果将所述流动性覆盖率预测值带入所述第二训练模型获得多个业务数据配置方案数据；

根据所述业务数据配置方案数据与预测的业务数据的比较结果，获得业务数据调整方案。

2.根据权利要求1所述的流动性覆盖率预测方法，其特征在于，获取历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据包含：

对所述业务数据中异常数据进行筛除处理，获得预处理后的业务数据，作为源数据。

3.根据权利要求1所述的流动性覆盖率预测方法，其特征在于，根据所述历史时刻的业务数据和历史时刻下的流动性覆盖率数据对预先建立的机器学习模型进行训练，获得第一训练模型包含：

将预处理后的业务数据和历史时刻下的流动性覆盖率数据随机分割为K个不重合的子数据集，以K-1个子数据集作为训练集，剩下1个作为验证集；

通过迭代的方式，分别将每次选择的训练集输入预先建立的机器学习模型中，进行训练，以对应的验证集进行模型学习优化；

通过遗传算法和支持向量机回归算法的多元线性回归集成学习训练，获得第一训练模型；

K为大于1的正整数。

4.根据权利要求1所述的流动性覆盖率预测方法，其特征在于，根据所述第一训练模型和预测的业务数据，获得流动性覆盖率预测值包含：

通过预测的业务数据对应的特征值信息和所述第一训练模型计算获得流动性覆盖率预测值。

5.根据权利要求1所述的流动性覆盖率预测方法，其特征在于，根据所述业务数据配置方案数据与预测的业务数据的比较结果，获得业务数据调整方案包含：

将多个业务数据配置方案数据分别与预测的业务数据进行成分比例相似性匹配，获得各业务数据配置方案数据与预测的业务数据的相似性；

根据所述相似性筛选所述业务数据配置方案数据，获得符合预设条件的业务数据调整方案。

6.根据权利要求1所述的流动性覆盖率预测方法，其特征在于，根据筛选结果对预先建立的机器学习模型进行训练还包含：获取用户的偏好度数据，根据所述偏好度数据和筛选结果对预先建立的机器学习模型进行训练，获得第二训练模型。

7.根据权利要求6所述的流动性覆盖率预测方法，其特征在于，根据比较结果将所述流动性覆盖率预测值带入所述第二训练模型获得多个业务数据配置方案数据还包含：根据比较结果将所述流动性覆盖率预测值和所述偏好度数据带入所述第二训练模型获得多个业务数据配置方案数据。

8.一种流动性覆盖率预测装置，其特征在于，所述装置包含：数据获取模块、训练模块、预测模块、配置方案计算模块和匹配模块；

所述数据获取模块用于获取历史时刻的各业务应用服务器***的业务数据和在历史时刻下的流动性覆盖率数据；

所述训练模块用于根据所述历史时刻的业务数据和历史时刻下的流动性覆盖率数据对预先建立的机器学习模型进行训练，获得第一训练模型；以及，根据预定条件筛选所述流动性覆盖率数据和对应时刻下的业务数据，并根据筛选结果对预先建立的机器学习模型进行训练，获得第二训练模型；

所述预测模块用于根据所述第一训练模型和预测的业务数据，获得流动性覆盖率预测值；以及，将所述预测值与预设阈值比较，并根据比较结果将所述流动性覆盖率预测值提供至所述第二训练模型；

所述配置方案计算模块用于将所述流动性覆盖率预测值带入所述第二训练模型获得多个业务数据配置方案数据；

所述匹配模块用于根据所述业务数据配置方案数据与预测的业务数据的比较结果，获得业务数据调整方案。

9.根据权利要求8所述的流动性覆盖率预测装置，其特征在于，所述数据获取模块包含数据处理单元和特征值提取单元，所述数据处理单元用于对历史时刻的各业务***的业务数据和历史时刻下的流动性覆盖率数据进行整合、筛选、缺失数据的处理以及异常数据剔除，获得预处理后的业务数据；所述特征值提取单元用于获取流动性覆盖率率预测数据基础业务数据的初始特征值属性信息。

10.根据权利要求9所述的流动性覆盖率预测装置，其特征在于，所述训练模块包含第一模型训练单元，所述第一模型训练单元用于将特征值信息和历史时刻下的流动性覆盖率数据随机分割为K个不重合的子数据集，以K-1个子数据集作为训练集，剩下1个作为验证集；通过迭代的方式，分别将每次选择的训练集输入预先建立的机器学习模型进行训练，以对应的验证集进行模型学习优化；通过遗传算法和支持向量机回归算法的多元线性回归集成学习训练获得第一训练模型；

K为大于1的正整数。

11.根据权利要求8所述的流动性覆盖率预测装置，其特征在于，所述训练模块还可包含：

获取用户的偏好度数据，根据所述偏好度数据和筛选结果对预先建立的机器学习模型进行训练，通过神经网络聚类算法学习训练获得第二训练模型。

12.根据权利要求11所述的流动性覆盖率预测装置，其特征在于，所述配置方案计算模块还包含：根据比较结果将所述流动性覆盖率预测值和所述偏好度数据带入所述第二训练模型获得多个业务数据配置方案数据。

13.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任一所述方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有执行权利要求1至7任一所述方法的计算机程序。