CN108830723A

CN108830723A - 电子装置、债券收益率分析方法及存储介质

Info

Publication number: CN108830723A
Application number: CN201810292054.8A
Authority: CN
Inventors: 李正洋; 毛小豪
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-04-03
Filing date: 2018-04-03
Publication date: 2018-11-16
Also published as: WO2019192135A1

Abstract

本发明公开了一种电子装置、债券收益率分析方法及存储介质，通过获取当前需要分析收益率的债券信息；根据获取的债券信息，在预先确定的源数据库中获取与所述债券信息相匹配的源数据文本；利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本抓取，以抓取出关键文本信息；利用预先训练完成的收益率分析模型对抓取的关键文本信息进行收益率分析，以分析出该债券信息对应的债券收益率。本发明提高了债券收益率分析的效率及准确性。

Description

电子装置、债券收益率分析方法及存储介质

技术领域

本发明涉及金融市场分析领域，尤其涉及一种电子装置、债券收益率分析方法及存储介质。

背景技术

债券是政府、企业、银行等债务人为筹集资金，按照法定程序发行并向债权人承诺于指定日期还本付息的有价证券。随着社会经济的发展，债券收益率已经成为一个国家经济发展的重要标志，例如国债收益率会直接影响一个国家金融市场的基准利率，以及国债收益率曲线在一定程度上预示着宏观经济发展周期的变化趋势等。因此，对金融市场而言，预估债券收益率变得越来越重要。

而对债券收益率的研究需要以大量的历史债券数据为依据，并由经验丰富的专业人士进行分析得到，不仅分析效率低下，且无法保证结果的准确性。

发明内容

有鉴于此，本发明提出一种电子装置、债券收益率分析方法及存储介质，能够提高债券收益率分析的效率及准确性。

首先，为实现上述目的，本发明提出一种电子装置，所述电子装置包括存储器、及与所述存储器连接的处理器，所述处理器用于执行所述存储器上存储的债券收益率分析程序，所述债券收益率分析程序被所述处理器执行时实现如下步骤：

A1、获取当前需要分析收益率的债券信息；

A2、根据获取的债券信息，在预先确定的源数据库中获取与所述债券信息相匹配的源数据文本；

A3、利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本抓取，以抓取出关键文本信息；

A4、利用预先训练完成的收益率分析模型对抓取的关键文本信息进行收益率分析，以分析出该债券信息对应的债券收益率。

优选地，所述预先训练完成的文本摘要生成模型为生成式循环神经网络模型，所述文本摘要生成模型的训练过程包括：

E1、获取预设数量的源数据文本；

F1、将获取的源数据文本分别根据预定义的数据处理规则进行预处理，以得到各个源数据文本对应的词向量，并将各个源数据文本对应的词向量分为第一预设比例的第一训练子集和第二预设比例的第一测试子集；

G1、利用第一训练子集中的各个词向量训练生成式循环神经网络，以得到训练好的文本摘要生成模型；

H1、利用第一测试子集中的各个词向量对训练好的文本摘要生成模型进行测试；

I1、若测试通过，则训练结束；或者，若测试不通过，则增加源数据文本的数量并重新执行上述步骤F1、G1、H1。

优选地，所述步骤H1包括：

利用训练好的生成式循环神经网络模型对第一测试子集中的各个词向量进行分析，以分别提取出各个词向量对应的子词向量；

根据预先确定的词向量与词之间的映射关系表，确定提取出的各个子词向量对应的词，分别将各个词向量的所有子词向量对应的词按照对应的向量顺序进行排列组合，分别得到各个词向量对应的关键文本信息；

利用预先确定的文本相似度分析规则分别分析生成式循环神经网络模型输出的各个词向量对应的关键文本信息与预先确定的各个词向量对应的源数据文本的标准关键文本信息之间的相似度；

若分析出的相似度大于预设的第一相似度阈值的概率大于或等于预设的第一概率阈值，则确定测试通过；

或者，若分析出的相似度大于预设的第一相似度阈值的概率小于预设的第一概率阈值，则确定测试不通过。

优选地，所述预先训练完成的收益率分析模型为长短记忆循环神经网络模型，所述收益率分析模型的训练过程包括：

E2、获取预设数量的源数据文本；

F2、将获取的源数据文本分别代入训练好的文本摘要生成模型，得到各个源数据文本对应的摘要文本，并将得到的各个摘要文本分为第三预设比例的第二训练子集和第四预设比例的第二测试子集；

G2、利用第二训练子集中的各个摘要文本训练长短记忆循环神经网络，以得到训练好的收益率分析模型；

H2、利用第二测试子集中的各个摘要文本对训练好的收益率分析模型进行测试；

I2、若测试通过，则训练结束；或者，若测试不通过，则增加源数据文本的数量并重复执行上述步骤F2、G2、H2。

优选地，所述步骤H2包括：

利用训练好的收益率分析模型对第二测试子集中的各个摘要文本进行分析，以分别分析出各个摘要文本对应的收益率曲线；

根据预先确定的曲线相似度分析规则，分别分析利用训练好的收益率模型分析出的各个摘要文本对应的收益率曲线与预先确定的各个摘要文本对应的收益率曲线之间的相似度；

若分析出的相似度大于预设的第二相似度阈值的概率大于或等于预设的第二概率阈值，则确定测试通过；

或者，若分析出的相似度大于预设的第二相似度阈值的概率小于预设的第二概率阈值，则确定测试不通过。

此外，为实现上述目的，本申请还提出一种债券收益率分析方法，其特征在于，所述方法包括如下步骤：

S1、获取当前需要分析收益率的债券信息；

S2、根据获取的债券信息，在预先确定的源数据库中获取与所述债券信息相匹配的源数据文本；

S3、利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本抓取，以抓取出关键文本信息；

S4、利用预先训练完成的收益率分析模型对抓取的关键文本信息进行收益率分析，以分析出该债券信息对应的债券收益率。

E1、获取预设数量的源数据文本；

优选地，所述步骤H1包括：

E2、获取预设数量的源数据文本；

所述步骤H2包括：

此外，为实现上述目的，本申请还提出一种计算机可读存储介质，所述计算机可读存储介质存储有债券收益率分析程序，所述债券收益率分析程序可被至少一个处理器执行，以使所述至少一个处理器执行如上所述的债券收益率分析方法的步骤。

相较于现有技术，本发明所提出的电子装置、债券收益率分析方法及存储介质，通过获取当前需要分析收益率的债券信息；根据获取的债券信息，在预先确定的源数据库中获取与所述债券信息相匹配的源数据文本；利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本获取，以抓取出关键文本信息；利用预先训练完成的收益率分析模型对抓取的关键文本信息进行收益率分析，以分析出该债券信息对应的债券收益率。提高了债券收益率分析的效率及准确性。

附图说明

图1是本发明提出的电子装置一可选的硬件架构的示意图；

图2是本发明电子装置一实施例中债券收益率分析程序模块示意图；

图3是本发明债券收益率分析方法较佳实施例的实施流程图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

参阅图1所示，是本发明提出的电子装置一可选的硬件架构示意图。本实施例中，电子装置10可包括，但不仅限于，可通过通信总线14相互通信连接存储器11、处理器12、网络接口13。需要指出的是，图1仅示出了具有组件11-14的电子装置10，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

其中，存储器11至少包括一种类型的计算机可读存储介质，计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器11可以是电子装置10的内部存储单元，例如电子装置10的硬盘或内存。在另一些实施例中，存储器11也可以是电子装置10的外包存储设备，例如电子装置10上配备的插接式硬盘，智能存储卡(SmartMedia Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器11还可以既包括电子装置10的内部存储单元也包括其外部存储设备。本实施例中，存储器11通常用于存储安装于电子装置10的操作***和各类应用软件，例如债券收益率分析程序等。此外，存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。处理器12通常用于控制电子装置10的总体操作。本实施例中，处理器12用于运行存储器11中存储的程序代码或者处理数据，例如运行的债券收益率分析程序等。

网络接口13可包括无线网络接口或有线网络接口，网络接口13通常用于在电子装置10与其他电子设备之间建立通信连接。

通信总线14用于实现组件11-13之间的通信连接。

图1仅示出了具有组件11-14以及债券收益率分析程序的电子装置10，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，电子装置10还可以包括用户接口(图1中未示出)，用户接口可以包括显示器、输入单元比如键盘，其中，用户接口还可以包括标准的有线接口、无线接口等。

可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED触摸器等。进一步地，显示器也可称为显示屏或显示单元，用于显示在电子装置10中处理信息以及用于显示可视化的用户界面。

在一实施例中，存储器11中存储的债券收益率分析程序被处理器12执行时，实现如下操作：

获取当前需要分析收益率的债券信息；

根据获取的债券信息，在预先确定的源数据库中获取与所述债券信息相匹配的源数据文本；

利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本抓取，以抓取出关键文本信息；

利用预先训练完成的收益率分析模型对抓取的关键文本信息进行收益率分析，以分析出该债券信息对应的债券收益率。

具体地，企业或者个人需要将大量资金投入债券市场时，需要分析当前的债券市场，而收益率的变化行情是债券市场变化的风向标。因此，债券公司的相关专业人员需要首先获取用户(企业或个人)感兴趣的债券的债券信息，并进行分析，以得到用户感兴趣债券的债券收益率。

在本实施例中，债券信息包括债券的类别，债务人、债权人等，需要说明的是，在本实施例的其他实施方式中，债券信息不仅限于包括上述内容，其还可以包括其他信息，例如债券面值、偿还期、付息期、票面利率等等。

其中，债券类别包括政府债券，金融证券，公司(企业)债券等；政府债券主要包括国债、地方政府债券等；

具体地，根据债券信息的不同，对应相匹配的源数据库也不同，例如，若债券信息包含的债券类别为国债，则与国债相匹配的源数据库为存储国债债券信息网公开的国债新闻文本、国债指数行情历史数据文本、财政部每个季度初发布的当季的国债发行计划相关的文本、国债债券信息披露细则文本等等一切与国债相关信息文本的源数据库。

获取的源数据文本为从相匹配的源数据库中获取的与债券相关的文本。

具体地，预先训练完成的文本摘要生成模型为生成式循环神经网络模型，该生成式循环神经网络模型包括模型的训练过程和测试过程，其中，文本摘要生成模型的训练过程包括：

E1、获取预设数量的源数据文本；

具体地，例如将预设数量为10000份的源数据文本对应的词向量，分为第一预设比例为7:3的第一训练子集和第一测试子集。

具体地，在步骤G1中，将训练子集中的各个词向量代入生成式循环神经网络，利用反向传播法训练该生成式循环神经网络；具体地，反向传播法是适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上。反向传播算法主要由两个环节，分别为激励传播环节和权重更新环节反复循环迭代，直到网络对输入的响应达到预定的目标范围为止。

反向传播法的学***方和作为目标函数，转入反向传播，逐层求出目标函数对各神经元权值的偏导数，构成目标函数对权值向量的梯量，作为修改权值的依据，网络的学习在权值修改过程中完成。误差达到所期望值时，网络学习结束。

具体地，生成式神经网络模型包括判别网络和生成网络。生成网络负责生成内容，判别网络负责对内容进行判别。判别网络同时接收训练数据和生成网络生成的数据。判别网络能够正确地预测数据源，然后被用做生成网络的误差部分。这样就形成了一种对抗：判别网络努力分辨真实数据与生成数据，而生成网络努力生成判别网络难以辨识的数据，最后直至生成网络生成的数据被辨别网络无法识别真假为止。

具体地，步骤H1过程，包括：

具体地，预先确定的文本相似性分析规则为余炫相似性算法；

其中，向量a为第一文本信息对应的第一向量，向量b为第二文本信息对应的第二向量，在本实施例中，向量a为训练好的生成式循环神经网络模型输出的词向量对应的关键文本信息的第一文本向量，向量b为该词向量对应的源数据文本的标准关键文本信息对应的第二文本向量

具体地，余弦相似性算法计算的相似度取值范围为0到1，余弦值越接近1，表明向量a与向量b越相似，对应地，训练好的生成式循环神经网络模型输出的词向量对应的关键文本信息与对应的源数据文本的标准关键文本信息越相似

进一步地，预定义的数据处理规则为将源数据文本中的词进行数值化。这是由于词是自然语言理解与处理的基础，而数值为计算机能够识别的符号，因此在模型训练的过程中，首先需要对词进行数值化，词向量(Word Representation，Word embeding)便是一种可行又有效的对词进行数值化的方法。进一步地，词向量是使用一个指定长度的实数向量v来表示一个词。词向量话的过程包括使用计算机对自然语言(中文，英文等)进行处理，将自然语言处理成为机器能够识别的符号，并在机器学习过程中，将其进行数值化。

具体地，预先训练完成的收益率分析模型为长短记忆循环神经网络模型，该收益率分析模型也包括模型的训练过程和测试过程；

具体地，收益率分析模型的训练过程包括：

E2、获取预设数量的源数据文本；

需要说明的是，摘要文本中通常包括影响债券收益率的关键因子，具体地，不同的债券类型影响其收益率的关键因子可能不同，例如，若债券为国债，则影响其收益率的关键因子可以是，例如中央银行的基准利率、宏观经济状况、通货膨胀率、货币供应量、股票二级市场行情、国外利率水平等；若为公司债劵，则影响其收益率的关键因子可以是，例如债券的票面利率、市场利率与债券价格、债券的投资成本、市场供求、货币政策和财政政策等。

具体地，步骤H2包括：

具体地，预先确定的曲线相似度分析规则为，利用预定义的峰值误差计算公式分别计算分析出的各个摘要文本对应的收益率曲线与预先确定的各个摘要文本对应的收益率曲线的峰值误差，其中，两条曲线之间的峰值误差计算公式为：

其中，x为两条曲线之间的峰值误差，a为第一曲线的第一方向的第一峰值，d为第二曲线的第一方向，且与第一峰值的坐标距离最近的第二峰值，b为第一曲线的第二方向，且与第一峰值的坐标距离最近的第三峰值，c为第二曲线的第二方向，且与第三峰值坐标距离最近的第四峰值。

其中，假设第一曲线，第二曲线均为以x坐标横坐标，以y为纵坐标，第一方向和第二方向均为以y为参考坐标，分别为以y坐标对应不同方向的峰值，第一峰值，第二峰值，第三峰值，第四峰值分别为以x为参考坐标。

具体的，长短记忆神经网络是一种特殊的循环神经网络，能够学习长期依赖关系。网络通过引入门结构(gate)和一个明确定义的记忆单元(memory cell)来尝试克服梯度消失或者梯度***的问题。长短记忆神经网络有能力向单元状态中移除或添加信息，通过门限结构对信息进行管理。门限有选择地让信息通过。它们由一个sifmoid神经网络层和逐点乘法运算组成。

长短记忆神经网络的每个神经元有一个记忆单元和三个门结构，三个门结构分别是：输入、输出和忘记。这些门结构的功能是通过禁止或允许信息的流动来保护信息。输入门结构决定了有多少来自上一层的信息存储于当前记忆单元。输出门结构承担了另一端的工作，决定下一层可以了解到多少这一层的信息。忘记门顾名思义，用来忘记一些不必要的信息，例如，如果长短记忆神经网络正在学习债券文本对债券收益率的影响，以分析出债券的收益率，那么忘记(删除)一些对收益率没有影响的信息是有必要的。

由上述事实施例可知，本发明提出的电子装置，通过获取当前需要分析收益率的债券信息；根据获取的债券信息，在预先确定的源数据库中获取与所述债券信息相匹配的源数据文本；利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本抓取，以抓取出关键文本信息；利用预先训练完成的收益率分析模型对抓取的关键文本信息进行收益率分析，以分析出该债券信息对应的债券收益率。提高了债券收益率分析的效率及准确性。

进一步需要说明的是，本发明的债券收益率分析程序依据其各部分所实现的功能不同，可用具有相同功能的程序模块进行描述。请参阅图2所示，是本发明电子装置一实施例中债券收益率分析程序的程序模块示意图。本实施例中，分布式任务调度程序依据其各部分所实现的功能的不同，可以被分割成获取模块201、匹配模块202、抓取模块203、以及分析模块204。由上面的描述可知，本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述债券收益率分析程序在电子装置10中的执行过程。所述模块201-204所实现的功能或操作步骤均与上文类似，此处不再详述，示例性地，例如其中：

获取模块201用于获取当前需要分析收益率的债券信息；

匹配模块202用于根据获取的债券信息，在预先确定的源数据库中获取与所述债券信息相匹配的源数据文本；

抓取模块203用于利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本获取，以抓取出关键文本信息；

分析模块204用于利用预先训练完成的收益率分析模型对抓取的关键字文本信息进行收益率分析，以分析出该债券信息对应的债券收益率。

此外，本发明还提出一种债券收益率分析方法，请参阅图3所示，所述债券收益率分析方法包括如下步骤：

S100、获取当前需要分析收益率的债券信息；

S200、根据获取的债券信息，在预先确定的源数据库中获取与所述债券信息相匹配的源数据文本；

S300、利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本获取，以抓取出关键文本信息；

S400、利用预先训练完成的收益率分析模型对抓取的关键文本信息进行收益率分析，以分析出该债券信息对应的债券收益率。

E1、获取预设数量的源数据文本；

具体地，步骤H1过程，包括：

具体地，收益率分析模型的训练过程包括：

E2、获取预设数量的源数据文本；

具体地，步骤H2包括：

由上述事实施例可知，本发明提出的债券收益率分析方法，通过获取当前需要分析收益率的债券信息；根据获取的债券信息，在预先确定的与所述债券信息相匹配的源数据库中获取相关源数据文本；将获取的源数据文本代入预先训练完成的文本摘要生成模型进行关键文本获取，以抓取出关键文本信息；将抓取的关键文本信息代入预先训练完成的收益率分析模型进行收益率分析，以分析出该债券信息对应的债券收益率。提高了债券收益率分析的效率及准确性。

此外，本发明还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有债券收益率分析程序，所述债券收益率分析程序被处理器执行时实现如下操作：

获取当前需要分析收益率的债券信息；

利用预先训练完成的文本摘要生成模型对获取的源数据文本进行关键文本获取，以抓取出关键文本信息；

本发明计算机可读存储介质具体实施方式与上述电子装置以及债券收益率风险方法各实施例基本相同，在此不作累述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种电子装置，其特征在于，所述电子装置包括存储器、及与所述存储器连接的处理器，所述处理器用于执行所述存储器上存储的债券收益率分析程序，所述债券收益率分析程序被所述处理器执行时实现如下步骤：

A1、获取当前需要分析收益率的债券信息；

2.如权利要求1所述的电子装置，其特征在于，所述预先训练完成的文本摘要生成模型为生成式循环神经网络模型，所述文本摘要生成模型的训练过程包括：

E1、获取预设数量的源数据文本；

3.如权利要求2所述的电子装置，其特征在于，所述步骤H1包括：

4.如权利要求1所述的电子装置，其特征在于，所述预先训练完成的收益率分析模型为长短记忆循环神经网络模型，所述收益率分析模型的训练过程包括：

E2、获取预设数量的源数据文本；

5.如权利要求4所述的电子装置，其特征在于，所述步骤H2包括：

6.一种债券收益率分析方法，其特征在于，所述方法包括如下步骤：

S1、获取当前需要分析收益率的债券信息；

7.如权利要求6所述的债券收益率分析方法，其特征在于，所述预先训练完成的文本摘要生成模型为生成式循环神经网络模型，所述文本摘要生成模型的训练过程包括：

E1、获取预设数量的源数据文本；

8.如权利要求6所述的债券收益率分析方法，其特征在于，所述步骤H1包括：

9.如权利要求6所述的债券收益率分析方法，其特征在于，所述预先训练完成的收益率分析模型为长短记忆循环神经网络模型，所述收益率分析模型的训练过程包括：

E2、获取预设数量的源数据文本；

所述步骤H2包括：

10.一种计算机可读存储介质，所述计算机可读存储介质存储有债券收益率分析程序，所述债券收益率分析程序可被至少一个处理器执行，以使所述至少一个处理器执行如权利要求6-9中任一项所述的债券收益率分析方法的步骤。