CN117473072A - 一种金融研报生成方法、装置、设备及存储介质 - Google Patents
一种金融研报生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117473072A CN117473072A CN202311826541.5A CN202311826541A CN117473072A CN 117473072 A CN117473072 A CN 117473072A CN 202311826541 A CN202311826541 A CN 202311826541A CN 117473072 A CN117473072 A CN 117473072A
- Authority
- CN
- China
- Prior art keywords
- model
- financial
- instruction
- report
- writing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011160 research Methods 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 39
- 230000002787 reinforcement Effects 0.000 claims abstract description 9
- 238000012937 correction Methods 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000005457 optimization Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 7
- 238000009966 trimming Methods 0.000 description 5
- 238000000227 grinding Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- QVFWZNCVPCJQOP-UHFFFAOYSA-N chloralodol Chemical compound CC(O)(C)CC(C)OC(O)C(Cl)(Cl)Cl QVFWZNCVPCJQOP-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Medical Informatics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种金融研报生成方法、装置、设备及存储介质,应用于人工智能领域,该方法包括:通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型;对金融研报撰写流程进行环节划分,得到多个研报撰写环节;获取每个研报撰写环节的指令数据集,基于指令数据集通过低参微调方式训练得到基础金融大语言模型的子模型;将目标撰写环节的撰写指令发送至基础金融大语言模型及目标撰写环节对应子模型,得到模型输出的目标撰写数据;基于目标撰写数据生成金融研报。与现有技术相比,避免了缺乏对金融大语言模型在金融研报生成应用上的指令优化,导致最终得到的金融研报可用性较差的问题。
Description
技术领域
本发明涉及人工智能领域,特别涉及一种金融研报生成方法、金融研报生成装置、金融研报生成设备及计算机可读存储介质。
背景技术
在金融领域,研究员通过撰写研究报告,可以为客户提供投资建议。当前,国内金融机构一年撰写的研报数有几十万篇,需要研究员投入巨大的工作量。按照领域划分,研报可以分为宏观研报、行业研报、公司研报、期货研报、基金研报及债券研报等;按照报告周期又可以分为日报、周报、月报、季报及年报等。近来,随着大型生成式语言模型得到快速发展,且已被用于研报写作的中间过程里,如营销文案创作、数据查询、文本扩写等。目前,金融领域研究员一般通过直接金融大语言模型进行金融研报的生成,缺乏对金融大语言模型在金融研报生成应用上的指令优化,导致最终得到的金融研报可用性较差。
发明内容
本发明的目的在于提供一种金融研报生成方法、金融研报生成装置、金融研报生成设备及计算机可读存储介质,应用于人工智能领域,该方法对金融大语言模型在金融研报生成各环节进行指令优化,使最终得到的金融研报可用性更高,更加规范。
为解决上述技术问题,本发明提供一种金融研报生成方法,包括:
通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型;
对金融研报撰写流程进行环节划分,得到多个研报撰写环节;
获取每个所述研报撰写环节的指令数据集,基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型;
将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据;
基于所述目标撰写数据生成金融研报。
可选的,所述基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型,包括:
基于研报标题生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第一子模型;
基于研报大纲生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第二子模型;
基于研报子标题内容生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第三子模型;
基于研报校对环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第四子模型。
可选的,所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据,包括:
将研报标题生成指令发送至所述基础金融大语言模型及所述第一子模型,得到模型输出的研报标题数据。
可选的,所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据,包括:
将研报大纲生成指令发送至所述基础金融大语言模型及所述第二子模型,得到模型输出的研报大纲数据。
可选的,所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据,包括:
将研报子标题内容生成指令发送至所述基础金融大语言模型,获取所述基础金融大语言模型根据所述研报子标题内容生成指令检索得到的检索数据;
基于所述检索数据生成目标研报子标题内容生成指令输入所述基础金融大语言模型及所述第三子模型,得到模型输出的研报子标题内容数据。
可选的,所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据,包括:
将研报校对指令及金融研报初稿发送至所述基础金融大语言模型及所述第四子模型,得到模型输出的金融研报。
可选的,还包括:
当接收到人工修改指令时,基于所述人工修改指令修改金融研报。
为解决上述技术问题,本发明提供一种金融研报生成装置,包括:
第一模块,用于通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型;
第二模块,用于对金融研报撰写流程进行环节划分,得到多个研报撰写环节;
第三模块,用于获取每个所述研报撰写环节的指令数据集,基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型;
第四模块,用于将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据;
第五模块,用于基于所述目标撰写数据生成金融研报。
为解决上述技术问题,本发明提供一种金融研报生成设备,包括:
存储器,用于储存计算机程序;
处理器,用于执行所述计算机程序时实现上述金融研报生成方法。
为解决上述技术问题,本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时,实现上述金融研报生成方法。
可见,本发明公开了一种金融研报生成方法、装置、设备及存储介质,应用于人工智能领域,该方法包括:通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型;对金融研报撰写流程进行环节划分,得到多个研报撰写环节;获取每个研报撰写环节的指令数据集,基于指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型;将目标撰写环节的撰写指令发送至基础金融大语言模型及目标撰写环节对应子模型,得到模型输出的目标撰写数据;基于目标撰写数据生成金融研报。与现有技术相比,该方法对金融大语言模型在金融研报生成各环节进行指令优化,使最终得到的金融研报可用性更高,更加规范,避免了未经调整直接通过金融大语言模型生成金融研报,导致最终得到的金融研报的可用性较差的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种金融研报生成方法的流程图;
图2为本发明实施例所提供的一种金融研报生成装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下结合图1,图1为本发明实施例所提供的一种金融研报生成方法的流程图,该方法可以包括:
S101:通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型。
本实施例可以构建一个基础金融大语言模型,首先收集金融语料与通用语料作为语料数据集,本实施例并不限定通用语料的具体内容,一般可以包括如***、新闻、书籍、论文、代码等。本实施例也不限定金融语料的具体内容,一般可以包括研报、金融知识图谱、金融政策、上市公司公告、季报、年报等。本实施例并不限定语料数据集中金融语料与通用语料的占比,为了实现模型的鲁棒性,一般金融语料与通用语料的比例可以为1:1。
本实施例可以通过语料数据集对初始模型进行预训练,本实施例中的初始模型可以为大型生成式语言模型,本实施例并不限定初始模型的架构,一般可以为基于Transformer Decoder的因果语言模型架构,Transformer是一个利用注意力机制来提高模型训练速度的模型,包含编码器(Encoder)和解码器(Decoder)两部分。本实施例中初始模型的位置编码采用ALiBi,ALiBi是Transformer模型中一种相对位置编码;注意力机制可以采用Flash Attention,Flash Attention是一种重新排序注意力计算的算法,它利用平铺、重计算等经典技术来显著提升计算速度,并将序列长度中的内存使用实现从二次到线性减少;初始模型的最大序列长度可以为4096。
在完成初始模型的预训练得到预训练模型之后,为了使预训练模型更好地适用于下游任务,需要收集的指令微调数据集对预训练模型进行指令微调,得到指令微调模型。本实施例中的指令微调数据集包含通用任务指令微调数据集及金融任务指令微调数据集,本实施例并不限定通用任务指令微调数据集及金融任务指令微调数据集的比例,一般可以为1:1。
指令微调之后,本实施例可以基于人类反馈的强化学习机制,对指令微调模型进行训练,得到本实施例中的基础金融大语言模型。本实施例中的基础金融大语言模型也可以为其余任意方式训练得到的大语言模型。
S102:对金融研报撰写流程进行环节划分,得到多个研报撰写环节。
为了使基础金融大语言模型生成的金融研报可用性更高,本实施例可以对基础金融大语言模型进一步微调。首先可以对金融研报撰写流程进行环节划分,得到多个研报撰写环节,经过全部研报撰写环节可以得到最终的金融研报。本实施例并不限定划分研报撰写环节的具体方式,一般可以根据实际应用场景进行设定。本实施例中一般可以将金融研报撰写流程划分为四个研报撰写环节,包括:研报标题生成环节、研报大纲生成环、研报子标题内容生成环节及研报校对环节。
S103:获取每个研报撰写环节的指令数据集,基于指令数据集通过低参微调方式训练得到基础金融大语言模型的子模型。
本实施例可以获取每个研报撰写环节的指令数据集,本实施例并不限定指令数据集的获取方式,一般可以通过人工标注方式收集各研报撰写环节的指令数据集。基于指令数据集通过低参微调方式训练得到基础金融大语言模型的子模型,本实施例并不限定低参微调方式的具体类型,一般可以为LoRA,LoRA是一种用于训练自定义大语言模型的高效参数微调技术。
当研报撰写环节包括研报标题生成环节、研报大纲生成环、研报子标题内容生成环节及研报校对环节时,本实施例可以基于研报标题生成环节的指令数据集通过低参微调方式训练得到基础金融大语言模型的第一子模型;基于研报大纲生成环节的指令数据集通过低参微调方式训练得到基础金融大语言模型的第二子模型;基于研报子标题内容生成环节的指令数据集通过低参微调方式训练得到基础金融大语言模型的第三子模型;基于研报校对环节的指令数据集通过低参微调方式训练得到基础金融大语言模型的第四子模型。本实施例中的每个子模型无法单独进行使用,必须与基础金融大语言模型进行融合才能使用。
S104:将目标撰写环节的撰写指令发送至基础金融大语言模型及目标撰写环节对应子模型,得到模型输出的目标撰写数据。
S105:基于目标撰写数据生成金融研报。
本实施例中将目标撰写环节的撰写指令发送至基础金融大语言模型及目标撰写环节对应子模型,得到模型输出的目标撰写数据。基于模型输出的目标撰写数据可以生成金融研报。例如,将研报标题生成指令发送至基础金融大语言模型及第一子模型,得到模型输出的研报标题数据;将研报大纲生成指令发送至基础金融大语言模型及第二子模型,得到模型输出的研报大纲数据;将研报子标题内容生成指令发送至基础金融大语言模型,获取基础金融大语言模型根据研报子标题内容生成指令检索得到的检索数据;基于检索数据生成目标研报子标题内容生成指令输入基础金融大语言模型及第三子模型,得到模型输出的研报子标题内容数据;将研报校对指令及金融研报初稿发送至基础金融大语言模型及第四子模型,得到模型输出的金融研报。
在研报子标题内容数据生成的过程中,若子标题内容为背景资料、常识性知识等,发出研报子标题内容生成指令,基础金融大语言模型首先对指令进行解析,通过搜索引擎进行查询,并输出查询参数,搜索引擎根据查询参数返回检索数据,接着根据返回的检索数据生成新的目标研报子标题内容生成指令,然后目标研报子标题内容生成指令发送给基础金融大语言模型与第三子模型,得到模型输出的研报子标题内容数据。
若子标题内容是对相关数据的分析,向基础金融大语言模型发送研报子标题内容生成指令,其中指令中要包含所要分析的数据指标的名称,基础金融大语言模型首先对指令进行解析,通过数据检索***进行数据检索,并输出待检索的数据指标名称与时间区间,数据检索***根据数据指标名称和时间区间返回检索数据,接着根据返回的检索数据生成新的目标研报子标题内容生成指令,然后目标研报子标题内容生成指令发送给基础金融大语言模型与第三子模型,得到模型输出的研报子标题内容数据。
若子标题内容为图类数据,向基础金融大语言模型发送研报子标题内容生成指令,基础金融大语言模型对用户指令进行解析,输出生成图所用的指标名称、时间区间及图的类型,然后根据指标名称与时间区间利用数据检索***进行查询并返回检索数据,接着利用返回的检索数据和上一步骤模型所输出的图的类型形成新的目标研报子标题内容生成指令,进而再把新的目标研报子标题内容生成指令输入基础金融大语言模型与第三子模型,得到模型输出的研报子标题内容数据。
本实施例中,模型输出的研报大纲数据可以填充在金融研报的研报大纲位置,研报标题数据可以填充在金融研报的研报标题位置,研报子标题内容数据可以填充在金融研报的研报子标题内容位置。填充完成之后可以得到金融研报初稿,进一步需要对金融研报初稿进行校对,最终形成本实施例所需的金融研报。
本实施例中,为了进一步提高金融研报的可用性,本实施例中各研报撰写环节生成的数据可以进行修改,如当接收到人工修改指令后,基于人工修改指令修改金融研报中的具体内容。
本实施例中还可以直接使用操作者提供的数据替换金融研报中的对应内容。如当接收到包含填充内容的内容填充指令时,将填充内容根据内容填充指令填充到金融研报中的对应位置。本实施例中,当金融研报中,某一研报撰写环节的撰写数据被填充后,便无需使用模型生成该研报撰写环节的撰写数据。
本实施例中的基础金融大语言与其子模型并不一定生成一篇完整的金融研报,也可以单独用于某一金融研报的某一环节内容的生成。
基于上述实施例,本发明方法对金融大语言模型在金融研报生成各环节进行指令优化,使最终得到的金融研报可用性更高,更加规范,避免了未经调整直接通过金融大语言模型生成金融研报,导致最终得到的金融研报的可用性较差的问题。
以下为本发明实施例所提供的一种金融研报生成方法的具体实施例,该具体实施例可以包括:
采用人工标注的方式,收集研报标题生成、研报大纲生成、研报子标题内容生成及研报内容校对环节的指令数据集;
基于指令数据集通过LoRA方法训练基础金融大语言模型的子模型;
将“我想写一篇新能源行业的研报,请帮我写一个研报大纲”这一指令发送至基础金融大语言模型及研报标题生成环节对应的第一子模型,得到模型输出的研报标题;
将“基于标题,请帮我生成研报的大纲”发送至基础金融大语言模型及研报大纲生成环节对应的第二子模型,得到模型输出的研报大纲;
将“什么是国内生产总值”发送至基础金融大语言模型,得到基础金融大语言模型检索返回的检索数据,基于检索数据生成“什么是国内生产总值+检索数据”指令发送至基础金融大语言模型及研报子标题内容生成环节对应的第三子模型,得到模型输出的研报子标题内容;
将“请帮我分析一下2022年中国的国内生产总值情况”发送至基础金融大语言模型,基础金融大语言模型对指令进行解析,并输出待检索的指标名称与时间区间,调用数据检索***根据指标名称与时间区间返回检索数据,基于检索数据生成“请帮我分析一下2022年中国的国内生产总值情况+检索数据”发送至基础金融大语言模型及第三子模型,得到模型输出的研报子标题内容;
将“请帮我分析2022年1月-12月采购经理人指数的变化情况并生成图”发送至基础金融大语言模型,基础金融大语言模型首先对指令进行解析,并输出生成图所用的指标名称与时间区间以及图的类型,然后根据指标名称及时间区间利用数据检索***进行查询并检索数据,接着利用返回的检索数据和图的类型形成新的指令“检索数据+请根据检索数据生成‘饼图’的代码”,输入基础金融大语言模型及第三子模型,得到模型生成的饼图代码,根据饼图代码生成研报子标题内容;
将模型输出的研报标题、研报大纲及研报子标题内容添加至对应金融研报中的对应位置;
当金融研报初稿完成后,基于金融研报初稿生成“金融研报初稿+请找出以上文本中的语法错误、错别字、不合规表达(如辱骂、涉黄等)”指令发送至基础大语言模型及研报校对环节对应的第四子模型进行初稿校对,得到最终的金融研报。
以下结合图2,图2为本发明实施例所提供的一种金融研报生成装置的结构框图,该装置可以包括:
第一模块100,用于通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型;
第二模块200,用于对金融研报撰写流程进行环节划分,得到多个研报撰写环节;
第三模块300,用于获取每个所述研报撰写环节的指令数据集,基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型;
第四模块400,用于将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据;
第五模块500,用于基于所述目标撰写数据生成金融研报。
基于上述实施例,本发明方法对金融大语言模型在金融研报生成各环节进行指令优化,使最终得到的金融研报可用性更高,更加规范,避免了未经调整直接通过金融大语言模型生成金融研报,导致最终得到的金融研报的可用性较差的问题。
基于上述实施例,所述第三模块300,可以包括:
第一单元,用于基于研报标题生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第一子模型;
第二单元,用于基于研报大纲生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第二子模型;
第三单元,用于基于研报子标题内容生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第三子模型;
第四单元,用于基于研报校对环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第四子模型。
基于上述各实施例,所述第四模块400,包括:
第五单元,用于将研报标题生成指令发送至所述基础金融大语言模型及所述第一子模型,得到模型输出的研报标题数据。
基于上述各实施例,所述第四模块400,包括:
第六单元,用于将研报大纲生成指令发送至所述基础金融大语言模型及所述第二子模型,得到模型输出的研报大纲数据。
基于上述各实施例,所述第四模块400,包括:
第七单元,用于将研报子标题内容生成指令发送至所述基础金融大语言模型,获取所述基础金融大语言模型根据所述研报子标题内容生成指令检索得到的检索数据;
第八单元,用于基于所述检索数据生成目标研报子标题内容生成指令输入所述基础金融大语言模型及所述第三子模型,得到模型输出的研报子标题内容数据。
基于上述各实施例,所述第四模块400,包括:
第九单元,用于将研报校对指令及金融研报初稿发送至所述基础金融大语言模型及所述第四子模型,得到模型输出的金融研报。
基于上述各实施例,该装置还可以包括:
第六模块,用于当接收到人工修改指令时,基于所述人工修改指令修改金融研报。
基于上述实施例,本发明还提供了一种金融研报生成设备,该设备可以包括存储器和处理器,其中,该存储器中存有计算机程序,该处理器调用该存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然,该设备还可以包括各种必要的网络接口、电源以及其它零部件等。
本发明还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行终端或处理器执行时可以实现本发明实施例所提供的方法;该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种金融研报生成方法,其特征在于,包括:
通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型;
对金融研报撰写流程进行环节划分,得到多个研报撰写环节;
获取每个所述研报撰写环节的指令数据集,基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型;
将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据;
基于所述目标撰写数据生成金融研报。
2.根据权利要求1所述金融研报生成方法,其特征在于,所述基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型,包括:
基于研报标题生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第一子模型;
基于研报大纲生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第二子模型;
基于研报子标题内容生成环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第三子模型;
基于研报校对环节的指令数据集通过所述低参微调方式训练得到所述基础金融大语言模型的第四子模型。
3.根据权利要求2所述金融研报生成方法,其特征在于,所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据,包括:
将研报标题生成指令发送至所述基础金融大语言模型及所述第一子模型,得到模型输出的研报标题数据。
4.根据权利要求2所述金融研报生成方法,其特征在于,所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据,包括:
将研报大纲生成指令发送至所述基础金融大语言模型及所述第二子模型,得到模型输出的研报大纲数据。
5.根据权利要求2所述金融研报生成方法,其特征在于,所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据,包括:
将研报子标题内容生成指令发送至所述基础金融大语言模型,获取所述基础金融大语言模型根据所述研报子标题内容生成指令检索得到的检索数据;
基于所述检索数据生成目标研报子标题内容生成指令输入所述基础金融大语言模型及所述第三子模型,得到模型输出的研报子标题内容数据。
6.根据权利要求2所述金融研报生成方法,其特征在于,所述将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据,包括:
将研报校对指令及金融研报初稿发送至所述基础金融大语言模型及所述第四子模型,得到模型输出的金融研报。
7.根据权利要求1所述金融研报生成方法,其特征在于,还包括:
当接收到人工修改指令时,基于所述人工修改指令修改金融研报。
8.一种金融研报生成装置,其特征在于,包括:
第一模块,用于通过语料数据集、指令微调数据集及强化学习方法训练初始模型得到基础金融大语言模型;
第二模块,用于对金融研报撰写流程进行环节划分,得到多个研报撰写环节;
第三模块,用于获取每个所述研报撰写环节的指令数据集,基于所述指令数据集通过低参微调方式训练得到所述基础金融大语言模型的子模型;
第四模块,用于将目标撰写环节的撰写指令发送至所述基础金融大语言模型及所述目标撰写环节对应子模型,得到模型输出的目标撰写数据;
第五模块,用于基于所述目标撰写数据生成金融研报。
9.一种金融研报生成设备,其特征在于,包括:
存储器,用于储存计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述金融研报生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时,实现如权利要求1至7任一项所述金融研报生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311826541.5A CN117473072B (zh) | 2023-12-28 | 2023-12-28 | 一种金融研报生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311826541.5A CN117473072B (zh) | 2023-12-28 | 2023-12-28 | 一种金融研报生成方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117473072A true CN117473072A (zh) | 2024-01-30 |
CN117473072B CN117473072B (zh) | 2024-03-15 |
Family
ID=89640115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311826541.5A Active CN117473072B (zh) | 2023-12-28 | 2023-12-28 | 一种金融研报生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117473072B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117807962A (zh) * | 2024-03-01 | 2024-04-02 | 之江实验室 | 一种咨政文本写作方法、装置、存储介质及电子设备 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956021A (zh) * | 2019-11-14 | 2020-04-03 | 微民保险代理有限公司 | 一种原创文章的生成方法、装置、***及服务器 |
CN112990091A (zh) * | 2021-04-09 | 2021-06-18 | 数库(上海)科技有限公司 | 基于目标检测的研报解析方法、装置、设备和存储介质 |
US20210374338A1 (en) * | 2020-05-26 | 2021-12-02 | Mastercard International Incorporated | Methods and systems for generating domain-specific text summarizations |
CN114492327A (zh) * | 2021-12-28 | 2022-05-13 | 中科曙光南京研究院有限公司 | 一种公文智能写作方法 |
US20220284187A1 (en) * | 2021-03-02 | 2022-09-08 | Beijing Colorfulclouds Technology Co., Ltd. | Language model based writing aid method, device and system |
CN115270738A (zh) * | 2022-09-30 | 2022-11-01 | 北京澜舟科技有限公司 | 一种研报生成方法、***及计算机存储介质 |
KR20230097710A (ko) * | 2021-12-24 | 2023-07-03 | 큐에라소프트(주) | 훈련된 다중 언어모델을 통한 의사결정 시뮬레이션 장치 및 방법 |
CN116402024A (zh) * | 2023-04-08 | 2023-07-07 | 北京易智联科技有限公司 | 一种基于大型语言模型的工程文件生成方法及其*** |
JP7313757B1 (ja) * | 2023-05-11 | 2023-07-25 | Spiral.AI株式会社 | 文章生成装置および文章生成方法 |
CN116842195A (zh) * | 2023-07-04 | 2023-10-03 | 北银金融科技有限责任公司 | 一种基于知识图谱和大模型自动化生成研报方法 |
CN116861921A (zh) * | 2023-07-10 | 2023-10-10 | 厦门大学 | 基于大语言模型的机器人任务解析方法、装置及可读介质 |
CN117057873A (zh) * | 2023-08-11 | 2023-11-14 | 广州商研网络科技有限公司 | 商品描述内容生成方法及其装置、设备、介质 |
CN117194637A (zh) * | 2023-09-18 | 2023-12-08 | 深圳市大数据研究院 | 基于大语言模型的多层级可视化评估报告生成方法、装置 |
CN117292783A (zh) * | 2023-09-11 | 2023-12-26 | 上海联影医疗科技股份有限公司 | 医学影像报告生成*** |
-
2023
- 2023-12-28 CN CN202311826541.5A patent/CN117473072B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956021A (zh) * | 2019-11-14 | 2020-04-03 | 微民保险代理有限公司 | 一种原创文章的生成方法、装置、***及服务器 |
US20210374338A1 (en) * | 2020-05-26 | 2021-12-02 | Mastercard International Incorporated | Methods and systems for generating domain-specific text summarizations |
US20220284187A1 (en) * | 2021-03-02 | 2022-09-08 | Beijing Colorfulclouds Technology Co., Ltd. | Language model based writing aid method, device and system |
CN112990091A (zh) * | 2021-04-09 | 2021-06-18 | 数库(上海)科技有限公司 | 基于目标检测的研报解析方法、装置、设备和存储介质 |
KR20230097710A (ko) * | 2021-12-24 | 2023-07-03 | 큐에라소프트(주) | 훈련된 다중 언어모델을 통한 의사결정 시뮬레이션 장치 및 방법 |
CN114492327A (zh) * | 2021-12-28 | 2022-05-13 | 中科曙光南京研究院有限公司 | 一种公文智能写作方法 |
CN115270738A (zh) * | 2022-09-30 | 2022-11-01 | 北京澜舟科技有限公司 | 一种研报生成方法、***及计算机存储介质 |
CN116402024A (zh) * | 2023-04-08 | 2023-07-07 | 北京易智联科技有限公司 | 一种基于大型语言模型的工程文件生成方法及其*** |
JP7313757B1 (ja) * | 2023-05-11 | 2023-07-25 | Spiral.AI株式会社 | 文章生成装置および文章生成方法 |
CN116842195A (zh) * | 2023-07-04 | 2023-10-03 | 北银金融科技有限责任公司 | 一种基于知识图谱和大模型自动化生成研报方法 |
CN116861921A (zh) * | 2023-07-10 | 2023-10-10 | 厦门大学 | 基于大语言模型的机器人任务解析方法、装置及可读介质 |
CN117057873A (zh) * | 2023-08-11 | 2023-11-14 | 广州商研网络科技有限公司 | 商品描述内容生成方法及其装置、设备、介质 |
CN117292783A (zh) * | 2023-09-11 | 2023-12-26 | 上海联影医疗科技股份有限公司 | 医学影像报告生成*** |
CN117194637A (zh) * | 2023-09-18 | 2023-12-08 | 深圳市大数据研究院 | 基于大语言模型的多层级可视化评估报告生成方法、装置 |
Non-Patent Citations (4)
Title |
---|
K H MANODNYA ETC.: "GPT-K: A GPT-based model for generation of text in Kannada", 《 2022 IEEE 4TH INTERNATIONAL CONFERENCE ON CYBERNETICS, COGNITION AND MACHINE LEARNING APPLICATIONS》, 22 November 2022 (2022-11-22), pages 534 - 538 * |
RAZA SAMAR, A ETC.: "Context-Based Narrative Generation Transformer (NGen-Transformer)", 《 2022 19TH INTERNATIONAL BHURBAN CONFERENCE ON APPLIED SCIENCES AND TECHNOLOGY》, 17 March 2023 (2023-03-17), pages 256 - 261 * |
李炎: "基于强化学习的新闻文本摘要研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》, 15 January 2022 (2022-01-15), pages 138 - 3580 * |
胡文馨: "基于深度学习的金融研报自动生成方法研究", 《万方》, 3 December 2020 (2020-12-03), pages 1 - 43 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117807962A (zh) * | 2024-03-01 | 2024-04-02 | 之江实验室 | 一种咨政文本写作方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN117473072B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117473072B (zh) | 一种金融研报生成方法、装置、设备及存储介质 | |
Cristea et al. | LAOS: Layered WWW AHS authoring model and their corresponding algebraic operators | |
Samoff et al. | Managing knowledge and storing wisdom? New forms of foreign aid? | |
CN101976235B (zh) | 基于动态网页的可扩展的Word报告自动生成方法 | |
Dehler-Holland et al. | Assessing technology legitimacy with topic models and sentiment analysis–The case of wind power in Germany | |
CN116340584A (zh) | 一种自动生成复杂图数据库查询语句服务的实现方法 | |
CN101710318A (zh) | 蔬菜供应链知识智能获取*** | |
CN109446221A (zh) | 一种基于语义分析的交互式数据探查方法 | |
CN101488086A (zh) | 一种基于领域模型的软件生成方法及装置 | |
CN113408890A (zh) | 基于人工智能的产业投资项目后评价报告生成方法和*** | |
US20090019083A1 (en) | System and method for adaptive decision making analysis and assessment | |
Lin et al. | Assessing green financing with emission reduction and green economic recovery in emerging economies | |
CN116244344A (zh) | 基于用户需求的检索方法、装置以及电子设备 | |
CN117251543A (zh) | 一种基于知识图谱的医药供应链问答方法及*** | |
CN115238710A (zh) | 一种文档智能生成与管理方法及装置 | |
Snoussi et al. | Heterogeneous web data extraction using ontology | |
CN111898351A (zh) | 基于Aviator的Excel数据自动导入方法、装置、终端设备及存储介质 | |
CN116842195A (zh) | 一种基于知识图谱和大模型自动化生成研报方法 | |
TWI645357B (zh) | 一種產生金融報告的系統與方法 | |
Panditharathna et al. | Question and answering system for investment promotion based on nlp | |
CN118210910B (zh) | 基于智能培训的ai交互会话处理方法及*** | |
Scott et al. | A process-centred experience repository for a small software organisation | |
CN118132723A (zh) | 表格问答模型的训练方法、设备、介质、软件及产品 | |
Mouromtsev et al. | Using Drool rule-platform for the optical CAD web-application development | |
CN118133946B (zh) | 一种多模态知识分层识别和受控对齐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |