CN117473072A

CN117473072A - 一种金融研报生成方法、装置、设备及存储介质

Info

Publication number: CN117473072A
Application number: CN202311826541.5A
Authority: CN
Inventors: 温露露; 鲍永飞; 石兆舒; 郭昕
Original assignee: Hangzhou Tonghuashun Data Development Co ltd
Current assignee: Hangzhou Tonghuashun Data Development Co ltd
Priority date: 2023-12-28
Filing date: 2023-12-28
Publication date: 2024-01-30
Anticipated expiration: 2043-12-28
Also published as: CN117473072B

Abstract

本发明公开了一种金融研报生成方法、装置、设备及存储介质，应用于人工智能领域，该方法包括：通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型；对金融研报撰写流程进行环节划分，得到多个研报撰写环节；获取每个研报撰写环节的指令数据集，基于指令数据集通过低参微调方式训练得到基础金融大语言模型的子模型；将目标撰写环节的撰写指令发送至基础金融大语言模型及目标撰写环节对应子模型，得到模型输出的目标撰写数据；基于目标撰写数据生成金融研报。与现有技术相比，避免了缺乏对金融大语言模型在金融研报生成应用上的指令优化，导致最终得到的金融研报可用性较差的问题。

Description

一种金融研报生成方法、装置、设备及存储介质

技术领域

本发明涉及人工智能领域，特别涉及一种金融研报生成方法、金融研报生成装置、金融研报生成设备及计算机可读存储介质。

背景技术

在金融领域，研究员通过撰写研究报告，可以为客户提供投资建议。当前，国内金融机构一年撰写的研报数有几十万篇，需要研究员投入巨大的工作量。按照领域划分，研报可以分为宏观研报、行业研报、公司研报、期货研报、基金研报及债券研报等；按照报告周期又可以分为日报、周报、月报、季报及年报等。近来，随着大型生成式语言模型得到快速发展，且已被用于研报写作的中间过程里，如营销文案创作、数据查询、文本扩写等。目前，金融领域研究员一般通过直接金融大语言模型进行金融研报的生成，缺乏对金融大语言模型在金融研报生成应用上的指令优化，导致最终得到的金融研报可用性较差。

发明内容

本发明的目的在于提供一种金融研报生成方法、金融研报生成装置、金融研报生成设备及计算机可读存储介质，应用于人工智能领域，该方法对金融大语言模型在金融研报生成各环节进行指令优化，使最终得到的金融研报可用性更高，更加规范。

为解决上述技术问题，本发明提供一种金融研报生成方法，包括：

通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型；

对金融研报撰写流程进行环节划分，得到多个研报撰写环节；

获取每个所述研报撰写环节的指令数据集，基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型；

将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型，得到模型输出的目标撰写数据；

基于所述目标撰写数据生成金融研报。

可选的，所述基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型，包括：

基于研报标题生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第一子模型；

基于研报大纲生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第二子模型；

基于研报子标题内容生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第三子模型；

基于研报校对环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第四子模型。

可选的，所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型，得到模型输出的目标撰写数据，包括：

将研报标题生成指令发送至所述基础金融大语言模型及所述第一子模型，得到模型输出的研报标题数据。

将研报大纲生成指令发送至所述基础金融大语言模型及所述第二子模型，得到模型输出的研报大纲数据。

将研报子标题内容生成指令发送至所述基础金融大语言模型，获取所述基础金融大语言模型根据所述研报子标题内容生成指令检索得到的检索数据；

基于所述检索数据生成目标研报子标题内容生成指令输入所述基础金融大语言模型及所述第三子模型，得到模型输出的研报子标题内容数据。

将研报校对指令及金融研报初稿发送至所述基础金融大语言模型及所述第四子模型，得到模型输出的金融研报。

可选的，还包括：

当接收到人工修改指令时，基于所述人工修改指令修改金融研报。

为解决上述技术问题，本发明提供一种金融研报生成装置，包括：

第一模块，用于通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型；

第二模块，用于对金融研报撰写流程进行环节划分，得到多个研报撰写环节；

第三模块，用于获取每个所述研报撰写环节的指令数据集，基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型；

第四模块，用于将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型，得到模型输出的目标撰写数据；

第五模块，用于基于所述目标撰写数据生成金融研报。

为解决上述技术问题，本发明提供一种金融研报生成设备，包括：

存储器，用于储存计算机程序；

处理器，用于执行所述计算机程序时实现上述金融研报生成方法。

为解决上述技术问题，本发明提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器执行时，实现上述金融研报生成方法。

可见，本发明公开了一种金融研报生成方法、装置、设备及存储介质，应用于人工智能领域，该方法包括：通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型；对金融研报撰写流程进行环节划分，得到多个研报撰写环节；获取每个研报撰写环节的指令数据集，基于指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型；将目标撰写环节的撰写指令发送至基础金融大语言模型及目标撰写环节对应子模型，得到模型输出的目标撰写数据；基于目标撰写数据生成金融研报。与现有技术相比，该方法对金融大语言模型在金融研报生成各环节进行指令优化，使最终得到的金融研报可用性更高，更加规范，避免了未经调整直接通过金融大语言模型生成金融研报，导致最终得到的金融研报的可用性较差的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例所提供的一种金融研报生成方法的流程图；

图2为本发明实施例所提供的一种金融研报生成装置的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

以下结合图1，图1为本发明实施例所提供的一种金融研报生成方法的流程图，该方法可以包括：

S101：通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型。

本实施例可以构建一个基础金融大语言模型，首先收集金融语料与通用语料作为语料数据集，本实施例并不限定通用语料的具体内容，一般可以包括如***、新闻、书籍、论文、代码等。本实施例也不限定金融语料的具体内容，一般可以包括研报、金融知识图谱、金融政策、上市公司公告、季报、年报等。本实施例并不限定语料数据集中金融语料与通用语料的占比，为了实现模型的鲁棒性，一般金融语料与通用语料的比例可以为1:1。

本实施例可以通过语料数据集对初始模型进行预训练，本实施例中的初始模型可以为大型生成式语言模型，本实施例并不限定初始模型的架构，一般可以为基于Transformer Decoder的因果语言模型架构，Transformer是一个利用注意力机制来提高模型训练速度的模型，包含编码器（Encoder）和解码器（Decoder）两部分。本实施例中初始模型的位置编码采用ALiBi，ALiBi是Transformer模型中一种相对位置编码；注意力机制可以采用Flash Attention，Flash Attention是一种重新排序注意力计算的算法，它利用平铺、重计算等经典技术来显著提升计算速度，并将序列长度中的内存使用实现从二次到线性减少；初始模型的最大序列长度可以为4096。

在完成初始模型的预训练得到预训练模型之后，为了使预训练模型更好地适用于下游任务，需要收集的指令微调数据集对预训练模型进行指令微调，得到指令微调模型。本实施例中的指令微调数据集包含通用任务指令微调数据集及金融任务指令微调数据集，本实施例并不限定通用任务指令微调数据集及金融任务指令微调数据集的比例，一般可以为1:1。

指令微调之后，本实施例可以基于人类反馈的强化学习机制，对指令微调模型进行训练，得到本实施例中的基础金融大语言模型。本实施例中的基础金融大语言模型也可以为其余任意方式训练得到的大语言模型。

S102：对金融研报撰写流程进行环节划分，得到多个研报撰写环节。

为了使基础金融大语言模型生成的金融研报可用性更高，本实施例可以对基础金融大语言模型进一步微调。首先可以对金融研报撰写流程进行环节划分，得到多个研报撰写环节，经过全部研报撰写环节可以得到最终的金融研报。本实施例并不限定划分研报撰写环节的具体方式，一般可以根据实际应用场景进行设定。本实施例中一般可以将金融研报撰写流程划分为四个研报撰写环节，包括：研报标题生成环节、研报大纲生成环、研报子标题内容生成环节及研报校对环节。

S103：获取每个研报撰写环节的指令数据集，基于指令数据集通过低参微调方式训练得到基础金融大语言模型的子模型。

本实施例可以获取每个研报撰写环节的指令数据集，本实施例并不限定指令数据集的获取方式，一般可以通过人工标注方式收集各研报撰写环节的指令数据集。基于指令数据集通过低参微调方式训练得到基础金融大语言模型的子模型，本实施例并不限定低参微调方式的具体类型，一般可以为LoRA，LoRA是一种用于训练自定义大语言模型的高效参数微调技术。

当研报撰写环节包括研报标题生成环节、研报大纲生成环、研报子标题内容生成环节及研报校对环节时，本实施例可以基于研报标题生成环节的指令数据集通过低参微调方式训练得到基础金融大语言模型的第一子模型；基于研报大纲生成环节的指令数据集通过低参微调方式训练得到基础金融大语言模型的第二子模型；基于研报子标题内容生成环节的指令数据集通过低参微调方式训练得到基础金融大语言模型的第三子模型；基于研报校对环节的指令数据集通过低参微调方式训练得到基础金融大语言模型的第四子模型。本实施例中的每个子模型无法单独进行使用，必须与基础金融大语言模型进行融合才能使用。

S104：将目标撰写环节的撰写指令发送至基础金融大语言模型及目标撰写环节对应子模型，得到模型输出的目标撰写数据。

S105：基于目标撰写数据生成金融研报。

本实施例中将目标撰写环节的撰写指令发送至基础金融大语言模型及目标撰写环节对应子模型，得到模型输出的目标撰写数据。基于模型输出的目标撰写数据可以生成金融研报。例如，将研报标题生成指令发送至基础金融大语言模型及第一子模型，得到模型输出的研报标题数据；将研报大纲生成指令发送至基础金融大语言模型及第二子模型，得到模型输出的研报大纲数据；将研报子标题内容生成指令发送至基础金融大语言模型，获取基础金融大语言模型根据研报子标题内容生成指令检索得到的检索数据；基于检索数据生成目标研报子标题内容生成指令输入基础金融大语言模型及第三子模型，得到模型输出的研报子标题内容数据；将研报校对指令及金融研报初稿发送至基础金融大语言模型及第四子模型，得到模型输出的金融研报。

在研报子标题内容数据生成的过程中，若子标题内容为背景资料、常识性知识等，发出研报子标题内容生成指令，基础金融大语言模型首先对指令进行解析，通过搜索引擎进行查询，并输出查询参数，搜索引擎根据查询参数返回检索数据，接着根据返回的检索数据生成新的目标研报子标题内容生成指令，然后目标研报子标题内容生成指令发送给基础金融大语言模型与第三子模型，得到模型输出的研报子标题内容数据。

若子标题内容是对相关数据的分析，向基础金融大语言模型发送研报子标题内容生成指令，其中指令中要包含所要分析的数据指标的名称，基础金融大语言模型首先对指令进行解析，通过数据检索***进行数据检索，并输出待检索的数据指标名称与时间区间，数据检索***根据数据指标名称和时间区间返回检索数据，接着根据返回的检索数据生成新的目标研报子标题内容生成指令，然后目标研报子标题内容生成指令发送给基础金融大语言模型与第三子模型，得到模型输出的研报子标题内容数据。

若子标题内容为图类数据，向基础金融大语言模型发送研报子标题内容生成指令，基础金融大语言模型对用户指令进行解析，输出生成图所用的指标名称、时间区间及图的类型，然后根据指标名称与时间区间利用数据检索***进行查询并返回检索数据，接着利用返回的检索数据和上一步骤模型所输出的图的类型形成新的目标研报子标题内容生成指令，进而再把新的目标研报子标题内容生成指令输入基础金融大语言模型与第三子模型，得到模型输出的研报子标题内容数据。

本实施例中，模型输出的研报大纲数据可以填充在金融研报的研报大纲位置，研报标题数据可以填充在金融研报的研报标题位置，研报子标题内容数据可以填充在金融研报的研报子标题内容位置。填充完成之后可以得到金融研报初稿，进一步需要对金融研报初稿进行校对，最终形成本实施例所需的金融研报。

本实施例中，为了进一步提高金融研报的可用性，本实施例中各研报撰写环节生成的数据可以进行修改，如当接收到人工修改指令后，基于人工修改指令修改金融研报中的具体内容。

本实施例中还可以直接使用操作者提供的数据替换金融研报中的对应内容。如当接收到包含填充内容的内容填充指令时，将填充内容根据内容填充指令填充到金融研报中的对应位置。本实施例中，当金融研报中，某一研报撰写环节的撰写数据被填充后，便无需使用模型生成该研报撰写环节的撰写数据。

本实施例中的基础金融大语言与其子模型并不一定生成一篇完整的金融研报，也可以单独用于某一金融研报的某一环节内容的生成。

基于上述实施例，本发明方法对金融大语言模型在金融研报生成各环节进行指令优化，使最终得到的金融研报可用性更高，更加规范，避免了未经调整直接通过金融大语言模型生成金融研报，导致最终得到的金融研报的可用性较差的问题。

以下为本发明实施例所提供的一种金融研报生成方法的具体实施例，该具体实施例可以包括：

采用人工标注的方式，收集研报标题生成、研报大纲生成、研报子标题内容生成及研报内容校对环节的指令数据集；

基于指令数据集通过LoRA方法训练基础金融大语言模型的子模型；

将“我想写一篇新能源行业的研报，请帮我写一个研报大纲”这一指令发送至基础金融大语言模型及研报标题生成环节对应的第一子模型，得到模型输出的研报标题；

将“基于标题，请帮我生成研报的大纲”发送至基础金融大语言模型及研报大纲生成环节对应的第二子模型，得到模型输出的研报大纲；

将“什么是国内生产总值”发送至基础金融大语言模型，得到基础金融大语言模型检索返回的检索数据，基于检索数据生成“什么是国内生产总值+检索数据”指令发送至基础金融大语言模型及研报子标题内容生成环节对应的第三子模型，得到模型输出的研报子标题内容；

将“请帮我分析一下2022年中国的国内生产总值情况”发送至基础金融大语言模型，基础金融大语言模型对指令进行解析，并输出待检索的指标名称与时间区间，调用数据检索***根据指标名称与时间区间返回检索数据，基于检索数据生成“请帮我分析一下2022年中国的国内生产总值情况+检索数据”发送至基础金融大语言模型及第三子模型，得到模型输出的研报子标题内容；

将“请帮我分析2022年1月-12月采购经理人指数的变化情况并生成图”发送至基础金融大语言模型，基础金融大语言模型首先对指令进行解析，并输出生成图所用的指标名称与时间区间以及图的类型，然后根据指标名称及时间区间利用数据检索***进行查询并检索数据，接着利用返回的检索数据和图的类型形成新的指令“检索数据+请根据检索数据生成‘饼图’的代码”，输入基础金融大语言模型及第三子模型，得到模型生成的饼图代码，根据饼图代码生成研报子标题内容；

将模型输出的研报标题、研报大纲及研报子标题内容添加至对应金融研报中的对应位置；

当金融研报初稿完成后，基于金融研报初稿生成“金融研报初稿+请找出以上文本中的语法错误、错别字、不合规表达（如辱骂、涉黄等）”指令发送至基础大语言模型及研报校对环节对应的第四子模型进行初稿校对，得到最终的金融研报。

以下结合图2，图2为本发明实施例所提供的一种金融研报生成装置的结构框图，该装置可以包括：

第一模块100，用于通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型；

第二模块200，用于对金融研报撰写流程进行环节划分，得到多个研报撰写环节；

第三模块300，用于获取每个所述研报撰写环节的指令数据集，基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型；

第四模块400，用于将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型，得到模型输出的目标撰写数据；

第五模块500，用于基于所述目标撰写数据生成金融研报。

基于上述实施例，所述第三模块300，可以包括：

第一单元，用于基于研报标题生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第一子模型；

第二单元，用于基于研报大纲生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第二子模型；

第三单元，用于基于研报子标题内容生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第三子模型；

第四单元，用于基于研报校对环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第四子模型。

基于上述各实施例，所述第四模块400，包括：

第五单元，用于将研报标题生成指令发送至所述基础金融大语言模型及所述第一子模型，得到模型输出的研报标题数据。

基于上述各实施例，所述第四模块400，包括：

第六单元，用于将研报大纲生成指令发送至所述基础金融大语言模型及所述第二子模型，得到模型输出的研报大纲数据。

基于上述各实施例，所述第四模块400，包括：

第七单元，用于将研报子标题内容生成指令发送至所述基础金融大语言模型，获取所述基础金融大语言模型根据所述研报子标题内容生成指令检索得到的检索数据；

第八单元，用于基于所述检索数据生成目标研报子标题内容生成指令输入所述基础金融大语言模型及所述第三子模型，得到模型输出的研报子标题内容数据。

基于上述各实施例，所述第四模块400，包括：

第九单元，用于将研报校对指令及金融研报初稿发送至所述基础金融大语言模型及所述第四子模型，得到模型输出的金融研报。

基于上述各实施例，该装置还可以包括：

第六模块，用于当接收到人工修改指令时，基于所述人工修改指令修改金融研报。

基于上述实施例，本发明还提供了一种金融研报生成设备，该设备可以包括存储器和处理器，其中，该存储器中存有计算机程序，该处理器调用该存储器中的计算机程序时，可以实现上述实施例所提供的步骤。当然，该设备还可以包括各种必要的网络接口、电源以及其它零部件等。

本发明还提供了一种计算机可读存储介质，其上存有计算机程序，该计算机程序被执行终端或处理器执行时可以实现本发明实施例所提供的方法；该存储介质可以包括：U盘、移动硬盘、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random AccessMemory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种金融研报生成方法，其特征在于，包括：

基于所述目标撰写数据生成金融研报。

2.根据权利要求1所述金融研报生成方法，其特征在于，所述基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型，包括：

3.根据权利要求2所述金融研报生成方法，其特征在于，所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型，得到模型输出的目标撰写数据，包括：

4.根据权利要求2所述金融研报生成方法，其特征在于，所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型，得到模型输出的目标撰写数据，包括：

5.根据权利要求2所述金融研报生成方法，其特征在于，所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型，得到模型输出的目标撰写数据，包括：

6.根据权利要求2所述金融研报生成方法，其特征在于，所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型，得到模型输出的目标撰写数据，包括：

7.根据权利要求1所述金融研报生成方法，其特征在于，还包括：

8.一种金融研报生成装置，其特征在于，包括：

第五模块，用于基于所述目标撰写数据生成金融研报。

9.一种金融研报生成设备，其特征在于，包括：

存储器，用于储存计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述金融研报生成方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器执行时，实现如权利要求1至7任一项所述金融研报生成方法。