CN117744804A - 基于大语言模型的金融分析任务的推理方法、终端及介质 - Google Patents

基于大语言模型的金融分析任务的推理方法、终端及介质 Download PDF

Info

Publication number
CN117744804A
CN117744804A CN202410182916.7A CN202410182916A CN117744804A CN 117744804 A CN117744804 A CN 117744804A CN 202410182916 A CN202410182916 A CN 202410182916A CN 117744804 A CN117744804 A CN 117744804A
Authority
CN
China
Prior art keywords
financial
analysis
language model
information
large language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410182916.7A
Other languages
English (en)
Inventor
徐铖晋
杨策皓
卢浩
齐逸岩
林舟驰
郭健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Digital Economy Academy IDEA
Original Assignee
International Digital Economy Academy IDEA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Digital Economy Academy IDEA filed Critical International Digital Economy Academy IDEA
Priority to CN202410182916.7A priority Critical patent/CN117744804A/zh
Publication of CN117744804A publication Critical patent/CN117744804A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了基于大语言模型的金融分析任务的推理方法、终端及介质,方法包括:识别金融分析任务,基于大语言模型抽取金融分析任务的金融关键词并获取与金融关键词所对应的金融知识信息;基于金融关键词与金融知识信息,确定目标分析工具,并基于目标分析工具确定金融分析任务所对应的目标计算结果;基于金融知识信息、目标分析工具以及目标计算结果,合成prompt,大语言模型根据prompt对金融分析任务进行推理解释。本发明基于大语言模型抽取的金融关键词在金融知识库中检索获取金融关键词所对应的金融知识信息,以便获得更为精准的目标分析工具,基于目标分析工具进行金融分析任务的推理计算,从而提高对金融分析任务的计算精确度与可信度。

Description

基于大语言模型的金融分析任务的推理方法、终端及介质
技术领域
本发明涉及金融问题分析技术领域,尤其涉及一种基于大语言模型的金融分析任务的推理方法、终端及介质。
背景技术
随着大数据技术的快速发展和金融业的规模扩大,金融行业所涉及的分析计算场景日益增多,面临的分析计算问题也变得更加复杂和多样化,涉及金融考试、投资分析、风险管理、资产评估、保险精算、宏观经济分析等多种金融场景。
目前金融场景下的分析计算问题主要依靠拥有丰富的相关金融知识的专业人员根据自己的知识储备进行计算与分析,例如拥有注册会计师证书的专业会计人员、拥有精算师证书的专业精算人员等。然而由于不同金融场景下的金融从业人员的知识也相对独立,个人实现金融全场景下的分析计算问题几乎不可能。随着大语言模型的发展,业内寄望于使用大语言模型进行金融任务推理计算,但面对较为复杂的分析计算问题,大语言模型无法给出准确的分析工具,例如,借助于大语言模型的代码生成功能来解决问题,但这些用于解决金融计算问题的代码需要结合具体的金融场景选择特定的数学计算公式进行套用,其中可能涉及特定变量的套用、特定场景的公式变形等,难以进行大范围的共享和反复利用。由此可见,现有技术中通过大语言模型难以实现对金融全场景下的分析计算问题的精确计算与高效分析。
因此,现有技术还有待改进和提高。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于大语言模型的金融分析任务的推理方法、终端及介质,旨在解决现有技术中通过大语言模型难以实现对金融全场景下的分析计算问题的精确计算与高效分析的问题。
为了解决上述技术问题,本发明所采用的技术方案如下:
第一方面,本发明提供一种基于大语言模型的金融分析任务的推理方法,其中,所述方法包括:
识别金融分析任务,基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息,其中,所述大语言模型为预先使用若干金融语料及对应的金融含义进行训练后得到的模型;
基于所述金融关键词与所述金融知识信息,确定目标分析工具,并基于所述目标分析工具确定所述金融分析任务所对应的目标计算结果;
基于所述金融知识信息、所述目标分析工具以及所述目标计算结果,合成prompt,所述大语言模型根据所述prompt对所述金融分析任务进行推理解释。
在一种实现方式中,所述识别金融分析任务,包括:
接收用户输入的金融问题,并获取所述金融问题所对应的文字信息和/或图表信息;
所述大语言模型基于所述文字信息和/或所述图表信息进行意图识别,得到所述金融分析任务。
在一种实现方式中,所述获取所述金融问题所对应的文字信息和/或图表信息,包括:
对所述金融问题中的图像进行光学字符识别,得到所述图表信息;
和/或,
基于文字识别接口对所述金融问题进行文字识别,得到所述文字信息。
在一种实现方式中,所述对所述金融问题中的图像进行光学字符识别,得到所述图表信息,包括:
基于表格字符识别接口对所述图像中的表格进行识别,得到表格信息;
基于数学公式字符识别接口对所述图像中的数学公式进行识别,得到数学公式信息;
将所述表格信息与所述数学公式信息作为所述图表片信息。
在一种实现方式中,所述基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息,包括:
基于所述大语言模型,对所述文字信息和/或所述图表信息进行场景识别,得到所述金融分析任务所对应的分析场景信息;
根据所述分析场景信息,确定分析意图信息;
获取所述金融分析任务所对应的问题描述信息,并基于所述大语言模型对所述问题描述信息进行金融词汇抽取,得到金融词汇信息;
基于所述金融词汇信息与所述分析意图信息进行匹配,得到所述金融关键词;
基于所述金融关键词,确定所述金融知识信息。
在一种实现方式中,所述基于所述金融关键词,确定所述金融知识信息,包括:
在预设的金融知识库中进行所述金融关键词的检索,得到所述金融知识信息。
在一种实现方式中,所述基于所述金融关键词与所述金融知识信息,确定目标分析工具,包括:
获取每一个所述金融关键词的金融描述信息,将每一个所述金融关键词及对应的金融描述信息进行向量编码,得到每一个所述金融关键词的第一向量信息;
将每一个所述金融关键词的第一向量信息与预设的分析工具库中的每一个分析工具所对应的第二向量信息逐一进行相似度计算,得相似度结果;
基于所述相似度结果,确定所述目标分析工具。
在一种实现方式中,所述基于所述相似度结果,确定所述目标分析工具,包括:
根据所述相似度结果,得到与每一个所述金融关键词相似度最高的分析工具,并将与每一个所述金融关键词相似度最高的分析工具作为备选分析工具;
获取所述金融分析任务所对应的问题描述信息,并确定所述问题描述信息的复杂程度信息;
所述大语言模型根据所述复杂程度信息从所述备选分析工具中确定至少一个所述目标分析工具。
在一种实现方式中,所述基于所述目标分析工具确定所述金融分析任务所对应的目标计算结果,包括:
基于预设的程序接口库,分别获取每一个所述目标分析工具所对应的应用程序接口,并确定所述应用程序接口的使用顺序;
基于所述应用程序接口的使用顺序,调用所述目标分析工具对所述金融分析任务进行分析,得到所述目标计算结果。
在一种实现方式中,所述基于所述应用程序接口的使用顺序,调用所述目标分析工具对所述金融分析任务进行分析,得到所述目标计算结果,包括:
基于所述金融分析任务所对应的问题描述信息,确定用于分析所述金融分析任务的变量数值;
基于所述应用程序接口,所述大语言模型根据所述目标分析工具生成函数代码,并将所述变量数值输入至所述函数代码中进行计算,得到所述目标计算结果。
在一种实现方式中,所述方法还包括:
获取预设的金融案例库,并从预设的金融案例库中检索出与所述金融分析任务对应的目标案例。
在一种实现方式中,所述方法还包括:
预先构建金融知识库,所述金融知识库中包括若干金融语料及对应的金融含义;
使用所述的金融知识库中的金融语料及对应的金融含义对大语言模型进行训练,以使得所述大语言模型理解每一个所述金融语料的金融含义。
在一种实现方式中,所述方法还包括:
构建由所述大语言模型驱动的多源异构数据检索引擎,所述多源异构数据检索引擎用于响应不同任务场景的数据查询需求。
在一种实现方式中,所述方法还包括:
预先构建程序接口库,所述程序接口库中包括若干应用程序接口,所述应用程序接口用于对所述目标分析工具进行调用,并根据所述目标分析工具生成函数代码,以通过所述函数代码对所述金融分析任务进行推理计算。
第二方面,本发明实施例还提供一种基于大语言模型的金融分析任务的推理装置,其中,所述装置包括:
关键词分析模块,用于识别金融分析任务,基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息,其中,所述大语言模型为预先使用若干金融语料及对应的金融含义进行训练后得到的模型;
工具确定模块,用于基于所述金融关键词与所述金融知识信息,确定目标分析工具,并基于所述目标分析工具确定所述金融分析任务所对应的目标计算结果;
任务分析模块,用于基于所述金融知识信息、所述目标分析工具以及所述目标计算结果,生合成prompt,所述大语言模型根据所述prompt对所述金融分析任务进行推理解释。
第三方面,本发明实施例还提供一种终端,其中,所述终端包括存储器、处理器及存储在存储器中并可在处理器上运行的基于大语言模型的金融分析任务的推理程序,处理器执行基于大语言模型的金融分析任务的推理程序时,实现上述方案中任一项的基于大语言模型的金融分析任务的推理方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,其中,计算机可读存储介质上存储有基于大语言模型的金融分析任务的推理程序,所述基于大语言模型的金融分析任务的推理程序被处理器执行时,实现上述方案中任一项所述的基于大语言模型的金融分析任务的推理方法的步骤。
有益效果:与现有技术相比,本发明提供了一种基于大语言模型的金融分析任务的推理方法,本发明首先识别金融分析任务,基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息。接着,本发明可基于所述金融关键词与所述金融知识信息,确定目标分析工具。由于本发明的大语言模型为预先使用若干金融语料及对应的金融含义进行训练后得到的模型,因此,该大语言模型分析出的金融关键词以及金融知识信息都是与金融领域相关的,得到的目标分析工具也是金融领域特定的分析工具,因此,基于所述目标分析工具对所述金融分析任务进行分析后,可得到精准的目标计算结果。最后,本发明可基于所述金融知识信息、所述目标分析工具以及所述目标计算结果,生成推理信息,所述大语言模型根据所述推理信息对所述金融分析任务进行推理解释。由此可见,本发明基于大语言模型确定出金融分析任务所对应的金融知识信息,便于确定出更为精准的目标分析工具,从而提高对金融分析任务的分析精确度与可信度。
附图说明
图1为本发明实施例提供的基于大语言模型的金融分析任务的推理方法的较佳实施例的流程图。
图2为本发明实施例提供的基于大语言模型的金融分析任务的推理方法的原理框架图。
图3为本发明实施例提供的基于大语言模型的金融分析任务的推理装置的示意图。
图4为本发明实施例提供的终端的原理框图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
由于通过现有技术中的大语言模型难以实现对金融全场景下的分析计算问题的精确计算与高效分析。为此,本实施例提出一种基于大语言模型的金融分析任务的推理方法,该方法可以消除采用大语言模型对金融全场景下的分析计算问题所导致的不精准、不全面等缺陷。具体应用时,本实施例首先识别金融分析任务,基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息。本实施例的金融关键词是在金融知识库中进行检索获取得到的,由于构建金融知识库时确保了数据质量,相比于传统的大语言模型直接生成的相关术语或概念的解释,检索得到的金融知识信息更加可靠且具备权威性,避免了大语言模型生成内容的“幻觉”问题,确保后续可基于所述金融关键词与所述金融知识信息,确定准确的目标分析工具。由于本实施例的大语言模型为预先使用若干金融语料及对应的金融含义进行训练后得到的模型,因此,该大语言模型分析出的金融关键词以及金融知识信息都是与金融领域相关的,得到的目标分析工具也是金融领域特定的分析工具,因此,基于所述目标分析工具对所述金融分析任务进行分析计算后,可得到精准的目标计算结果。最后,本实施例可基于所述金融知识信息、所述目标分析工具以及所述目标计算结果,合成prompt(提示词),所述大语言模型根据所述prompt对所述金融分析任务进行推理解释,包括但不限于与原始问题相关的金融术语解释、与原始问题相关的金融计算公式、分析原始问题的计算步骤、各个步骤的计算结果和最终答案。由此可见,本实施例基于大语言模型确定出金融分析任务所对应的金融知识信息,便于确定出更为精准的目标分析工具,从而提高对金融分析任务的分析精确度与可信度。
本实施例的基于大语言模型的金融分析任务的推理方法可应用于终端中,所述终端可为电脑、智能电视等智能化产品终端。具体地,如图1中所示,本实施例的基于大语言模型的金融分析任务的推理方法包括如下步骤:
步骤S100、识别金融分析任务,基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息,其中,所述大语言模型为预先使用若干金融语料及对应的金融含义进行训练后得到的模型。
本实施例首先识别金融分析任务,该金融分析任务可基于用户通过语音输入或者文本输入的方式进行提问所得到的。本实施例可采用大语言模型来对金融任务进行识别,确定金融分析任务所对应的金融关键词以及与所述金融关键词所对应的金融知识信息。
虽然目前大语言模型具备了通用的辅导解题能力,但在应对金融分析任务依然存在一定局限性。目前的大语言模型并不熟悉特定金融分析场景的知识点和考点,以至于出现严重的“幻觉”问题。例如,在推理过程中大语言模型生成并使用了错误的金融计算公式,或者沿着错误的思维链路进行延伸,从而导致无法完成金融分析任务。为此,本实施例预先构建金融知识库,构建金融知识库时可经过数据筛选、数据清洗、知识提取等步骤。所述金融知识库中包括若干金融语料及对应的金融含义。然后使用所述的金融知识库中的金融语料及对应的金融含义对现有的大语言模型进行训练,以使得大语言模型理解每一个所述金融语料的金融含义。由于金融语料及其对应的金融含义均是与金融领域相关的,因此,本实施例的大语言模型是可以从金融分析任务中提取出与金融领域相关的金融关键词及金融知识信息,以便后续步骤中精准确定目标分析工具。
具体地,本实施例可采用光学字符识别技术,对大量金融领域书籍、教材以及行业研究报告、财务报告等原始的图像、PDF等文件进行处理,提取涉及的金融实体、概念、术语、公式、案例、例题等,构建全面的金融知识库。此外,本实施例使用大语言模型理解金融知识库的各类结构化金融语料的含义,并对其条目进行丰富,例如货币、市场、财务、借贷、资产等各个方面的,包括资产回报率、杠杆率、负债率、股息支付比率等关键指标的计算公式,为其生成更为详细的描述作为文本特征,以便基于该大语言模型来对金融分析任务进行分析。
结合图2,终端首先接收到用户输入的金融问题,该金融问题可以是用户通过语音输入或文本输入方式进行提问得到的。如果采用文本输入方式进行提问,则金融问题为文本形式。如果用户采用语音输入的方式进行提问,则金融问题为语音形式,则可采用语音识别技术将语音形式的金融问题转换成文本形式的金融问题。如果文本形式的金融问题中***了图像,则本实施例需要对该金融问题中的图像进行识别,从而得到文字信息和/或图表信息。如果不存在图像,则本实施例可直接采用文字识别接口对金融问题进行文字识别,得到文字信息。当识别出文字信息和/或图表信息后,本实施例可将识别出的文字信息和/或图表信息在金融问题中的同一位置进行替换,并进行意图识别,进而得到所述金融分析任务,该金融分析任务反映的是用户提出的金融问题描述。
在一种实现方式中,本实施例在用户输入包含图像时,可采用光学字符识别技术,识别金融问题中存在的图像格式的材料。本实施例优先调用表格字符识别接口对图像中的表格进行识别,如果识别成功则返回以Markdown格式表示的表格信息;如果检测到不是表格信息,则调用数学公式字符识别接口对图像中的数学公式进行识别,如果成功识别则返回以LaTeX格式表示的数学公式信息。本实施例就可以将识别出的表格信息与数学公式信息作为所述用户输入图像的图表信息。而如果在识别用户输入图像时,既未识别出表格信息,也未识别出数学公式信息时,本实施例可调用通用文字识别接口,返回图像中的文本信息。
本实施例预先构建由所述大语言模型驱动的多源异构数据检索引擎,所述多源异构数据检索引擎用于响应不同任务场景的数据查询需求。基于此,本实施例可基于所述大语言模型,对用户输入的文字信息和/或图表信息进行场景识别,得到所述金融分析任务所对应的分析场景信息,由于本实施例的大语言模型是为金融领域特定训练的,因此得到的分析计算场景信息是与金融领域相关的场景,比如,分析计算场景信息可为财务审计、风险评估、资产定价、投资组合管理、市场研究等多个种类的金融分析技术。进一步地,可由大语言模型驱动的场景识别代理可对用户输入信息相关的金融分析计算场景进行意图识别,确定分析意图信息。同样地,该分析意图信息也是与该金融领域相关的意图,比如,该分析意图信息为辅助金融从业人员工作、金融职业证书考试、个人财务规划、教育和学术研究等。在一种实现方式中,本实施例可预先将与金融领域相关的场景提示词和意图提示词合成,并作为结构化的元数据以Json格式注入至大语言模型中,以便大语言模型驱动的场景识别代理自动识别出分析意图信息。
由于用户输入的金融问题较为丰富,问题中所涉及的金融术语或概念占比可能较小,直接使用金融问题进行金融知识的检索容易受到无关信息的影响。除此之外,用户输入的金融问题中也可能不显式包含与之相关的金融术语或概念,无法通过关键词检索来获取金融知识。为了确保用户输入的金融问题涉及的金融术语和概念与金融知识库中的信息对齐,本实施例首先获取所述金融分析任务所对应的问题描述信息,该问题描述信息反映了金融问题的具体内容。接着,本实施例基于所述大语言模型对所述问题描述信息与所述分析意图信息进行关键词抽取,得到所述金融关键词,此时的金融关键词与分析意图信息相关。在一种实现方式中,金融关键词为是一类金融术语,且本实施例得到的金融关键词可有多个,形成金融关键词列表,例如“利率”, “远期溢价”, “回报率”等。当得到金融关键词后,本实施例在预设的金融知识库中检索出与金融关键词相关的金融知识信息,该金融知识信息即为对用户输入的金融问题的详细解释。本实施例通过构建金融知识库,确保了数据质量,相比于使用大语言模型直接生成的相关术语或概念的解释,检索得到的金融知识信息更加可靠且具备权威性,避免了大模型生成内容的“幻觉”问题,确保后续检索得到准确的目标分析工具。
步骤S200、基于所述金融关键词与所述金融知识信息,确定目标分析工具,并基于所述目标分析工具确定所述金融分析任务所对应的目标计算结果。
在得到金融关键词和金融知识信息后,本实施例可确定目标分析工具。本实施例中用户输入的金融问题为金融计算问题,对应的金融分析任务是针对各种金融场景下的分析计算任务,因此目标分析工具为用于计算该金融计算问题的金融计算公式。也就是说,本实施例所得到的目标分析工具为最为准确的金融计算公式,因此,基于该金融计算公式可对金融分析任务进行准确计算,得到的目标计算结果也是更为准确的计算结果。
具体地,本实施例预先构建分析工具库,该分析工具库中包括了若干个分析工具以及与每个分析工具相关的金融术语与详细解释。在实际应用时,该分析工具库可为金融计算公式库。并且,本实施例还采用文本向量化模型理解金融知识库中各条目的金融语料并生成文本向量,存储于向量数据库中并内置用于检索的相似度查询底层算法中,以便对于待查询的问题向量返回N个余弦相似度最高的知识条目。基于此,本实施例可获取每一个金融关键词的金融描述信息,将每一个金融关键词及对应的金融描述信息进行向量编码,得到每一个金融关键词的第一向量信息。然后将每一个金融关键词的第一向量信息与预设的分析工具库中的每一个分析工具所对应的第二向量信息逐一进行相似度计算,得相似度结果。接着,根据所述相似度结果,得到与每一个所述金融关键词相似度最高的分析工具,并将与每一个所述金融关键词相似度最高的分析工具作为备选分析工具。比如,金融关键词为“升水”,也被称为“远期溢价”,即远期合约价格高于即期价格,那么金融关键词“升水”及具体描述将纳入到金融关键词列表中,在进行相似度分析时,可将金融关键词“升水”及具体描述进行向量编码,得到第一向量信息,然后将该第一向量信息与分析工具库中的每一个分析工具所对应的第二向量信息逐一进行相似度计算,筛选出相似度最稿的分析工具,作为备选分析工具,比如,筛选得到的备选分析工具为“远期溢价”的计算公式。
进一步地,本实施例可获取所述金融分析任务所对应的问题描述信息,并确定所述问题描述信息的复杂程度信息,该复杂程度信息反映的是该金融分析任务的分析难度。接着,所述大语言模型根据所述复杂程度信息从所述备选分析工具中确定至少一个所述目标分析工具。本实施例中,目标分析工具为检索到的相关金融计算公式,该金融计算公式可以作为金融知识呈现给用户,以帮助用户理解分析原始问题所需要的计算公式,但不能直接用于计算。
在一种实现方式中,本实施例预先构建程序接口库,所述程序接口库中包括若干应用程序接口(API),所述应用程序接口用于对所述目标分析工具进行调用,并根据所述目标分析工具生成函数代码,以通过所述函数代码对所述金融分析任务进行推理计算。基于此,本实施例根据该程序接口库,分别获取每一个所述目标分析工具所对应的应用程序接口,形成金融计算API列表,并确定所述应用程序接口的使用顺序。接着,本实施例基于所述应用程序接口的使用顺序,依次调用对应的所述目标分析工具对所述金融分析任务进行分析,得到所述目标计算结果,具体地,本实施例可基于所述金融分析任务所对应的问题描述信息,确定用于分析所述金融分析任务的变量数值。然后基于所述应用程序接口,根据所述目标分析工具生成函数代码,并将所述变量数值输入至所述函数代码中,得到所述目标计算结果,该目标计算结果为金融分析任务的问题解答。
在具体应用时,对于复杂金融计算问题,大语言模型可以从备选分析工具中确定至少一个所述目标分析工具,并确定每个目标分析工具的应用程序接口,即得到至少一个金融计算公式以及对应的金融计算API。接着,在计算时,本实施例可确定金融计算API的使用顺序,以便根据该使用顺序来调用对应的金融计算公式,本实施例的金融计算API的使用顺序反映的是计算逻辑规划计算顺序,例如金融场景为外汇交易时,对于“远期溢价”的计算任务所得到的数值结果,可用于下一阶段的“投资回报率”的计算。接着,本实施例调用大语言模型从金融分析任务所对应的问题描述信息中抽取计算可能需要的各类参数的具体取值(即变量数值),具体来说,由大语言模型驱动的金融分析计算代理需要对每个金融计算公式需要输入的变量数值进行判断,是否在用户输入中已经给定,或者需要执行某些计算公式作为前置步骤,如果已经给定,可自动化地调取金融计算API以及金融计算公式,将给定的变量数值填入到对应的金融计算公式的参数列表中,从而得到目标计算结果。如果无法从金融分析任务所对应的问题描述信息及相关图表信息中获取所需的变量数值,且也无法从流程中间过程的计算公式计算得出,智能分析计算代理将提示用户补充所需要的参数的取值。
步骤S300、基于所述金融知识信息、所述目标分析工具以及所述目标计算结果,合成prompt,所述大语言模型根据所述prompt对所述金融分析任务进行推理解释。
本实施例根据所述金融知识信息、所述目标分析工具以及所述目标计算结果合成prompt(提示词)。大语言模型根据prompt(提示词)将对金融分析任务对应的问题描述信息生成全面的推理解释,包括但不限于与问题描述信息相关的金融术语解释、与问题描述信息相关的金融计算公式、分析原始问题的计算步骤、各个步骤的计算结果和最终答案。
此外,本实施还预先构建金融案例库,构建金融案例库时可经过数据筛选、数据清洗、案例提取等步骤。具体地,使用大语言模型对金融知识库的非结构化语料的条目进行抽取和总结,例如来源金融教材、考试的金融例题或涉及经济法、税法等场景的现实金融案例,生成相应摘要。本实施例可从预设的金融案例库中检索出与所述金融分析任务对应的目标案例,展示给用户,以便对金融分析任务进行全方位的解释。
综上,本实施例的基于大语言模型的金融分析任务的推理方法,至少具有以下效果:
(1)本实施例通过外部金融知识的注入帮助大语言模型克服在缺乏特定金融领域知识时解决相关问题容易产生“幻觉”的难点;
(2)本实施例通过提出由大语言模型驱动的金融计算公式库的检索范式解决大语言模型执行数学计算的不可信、不可解释性的难点;
(3)本实施例通过引入已封装的程序接口库来解决大语言模型在金融领域代码生成能力不足的难点;
(4)本实施例提出智能代理辅助外部工具调用的方案帮助大语言模型克服无法响应复杂金融分析计算需求的难点。
基于上述实施例,本发明还提供一种基于大语言模型的金融分析任务的推理装置,如图3中所示,所述装置包括:关键词分析模块10、工具确定模块20以及任务分析模块30。具体地,所述关键词分析模块10,用于识别金融分析任务,基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息,其中,所述大语言模型为预先使用若干金融语料及对应的金融含义进行训练后得到的模型。所述工具确定模块20,用于基于所述金融关键词与所述金融知识信息,确定目标分析工具,并基于所述目标分析工具确定所述金融分析任务所对应的目标计算结果。所述任务分析模块30,用于基于所述金融知识信息、所述目标分析工具以及所述目标计算结果,合成prompt,所述大语言模型根据所述prompt对所述金融分析任务进行推理解释。
在一种实现方式中,所述关键词分析模块10包括:
信息获取单元,用于接收用户输入的金融问题,并获取所述金融问题所对应的文字信息和/或图表信息;
任务确定单元,用于所述大语言模型基于所述文字信息和/或所述图表信息进行意图识别,得到所述金融分析任务。
在一种实现方式中,所述信息获取单元,包括:
图表识别子单元,用于对所述金融问题中的图像进行光学字符识别,得到所述图表信息;
和/或,
文字识别子单元,用于基于文字识别接口对所述金融问题进行文字识别,得到所述文字信息。
在一种实现方式中,所述图表识别子单元,包括:
表格识别子单元,用于基于表格字符识别接口对所述图像中的表格进行识别,得到表格信息;
公式识别子单元,用于基于数学公式字符识别接口对所述图像中的数学公式进行识别,得到数学公式信息;
图表确定子单元,用于将所述表格信息与所述数学公式信息作为所述图表信息。
在一种实现方式中,所述关键词分析模块10,还包括:
场景分析单元,用于基于所述大语言模型,对所述文字信息和/或所述图表信息进行场景识别,得到所述金融分析任务所对应的分析场景信息;
关键词分析单元,用于根据所述分析场景信息,确定分析意图信息;
词汇抽取子单元,用于获取所述金融分析任务所对应的问题描述信息,并基于所述大语言模型对所述问题描述信息进行金融词汇抽取,得到金融词汇信息;
关键词匹配子单元,用于基于所述金融词汇信息与所述分析意图信息进行匹配,得到所述金融关键词。
金融知识确定单元,用于基于所述金融关键词,确定所述金融知识信息。
在一种实现方式中,所述金融知识确定单元,包括:
金融知识匹配子单元,用于在预设的金融知识库中进行所述金融关键词的检索,得到所述金融知识信息。
在一种实现方式中,所述工具确定模块20,包括:
向量编码单元,用于获取每一个所述金融关键词的金融描述信息,将每一个所述金融关键词及对应的金融描述信息进行向量编码,得到每一个所述金融关键词的第一向量信息;
相似度计算单元,用于将每一个所述金融关键词的第一向量信息与预设的分析工具库中的每一个分析工具所对应的第二向量信息逐一进行相似度计算,得相似度结果;
分析工具确定单元,用于基于所述相似度结果,确定所述目标分析工具。
在一种实现方式中,所述分析工具确定单元,包括:
备选工具确定子单元,用于根据所述相似度结果,得到与每一个所述金融关键词相似度最高的分析工具,并将与每一个所述金融关键词相似度最高的分析工具作为备选分析工具;
复杂程度分析子单元,用于获取所述金融分析任务所对应的问题描述信息,并确定所述问题描述信息的复杂程度信息;
目标工具筛选子单元,用于所述大语言模型根据所述复杂程度信息从所述备选分析工具中确定至少一个所述目标分析工具。
在一种实现方式中,所述工具确定模块20,还包括:
使用顺序确定单元,用于基于预设的程序接口库,分别获取每一个所述目标分析工具所对应的应用程序接口,并确定所述应用程序接口的使用顺序;
计算结果确定单元,用于基于所述应用程序接口的使用顺序,调用所述目标分析工具对所述金融分析任务进行分析,得到所述目标计算结果。
在一种实现方式中,所述计算结果确定单元,包括:
变量数值确定子单元,用于基于所述金融分析任务所对应的问题描述信息,确定用于分析所述金融分析任务的变量数值;
数据分析子单元,用于基于所述应用程序接口,所述大语言模型根据所述目标分析工具生成函数代码,并将所述变量数值输入至所述函数代码中进行计算,得到所述目标计算结果。
在一种实现方式中,所述装置还包括:
案例匹配模块,用于获取预设的金融案例库,并从预设的金融案例库中检索出与所述金融分析任务对应的目标案例。
在一种实现方式中,所述装置还包括:
金融知识库构建模块,用于预先构建金融知识库,所述金融知识库中包括若干金融语料及对应的金融含义;
大语言模型训练模块,用于使用所述的金融知识库中的金融语料及对应的金融含义对大语言模型进行训练,以使得所述大语言模型理解每一个所述金融语料的金融含义。
在一种实现方式中,所述装置还包括:
搜索引擎构建模块,用于构建由所述大语言模型驱动的多源异构数据检索引擎,所述多源异构数据检索引擎用于响应不同任务场景的数据查询需求。
在一种实现方式中,所述装置还包括:
程序接口库构建模块,用于预先构建程序接口库,所述程序接口库中包括若干应用程序接口,所述应用程序接口用于对所述目标分析工具进行调用,并根据所述目标分析工具生成函数代码,以通过所述函数代码对所述金融分析任务进行推理计算。
本实施例的基于大语言模型的金融分析任务的推理装置中各个模块的工作原理与上述方法实施例中各个步骤的原理相同,此处不再赘述。
基于上述实施例,本发明还提供了一种终端,所述终端的原理框图可以如图4所示。终端可以包括一个或多个处理器100(图4中仅示出一个),存储器101以及存储在存储器101中并可在一个或多个处理器100上运行的计算机程序102,例如,基于大语言模型的金融分析任务的推理装置的数据交互程序。一个或多个处理器100执行计算机程序102时可以实现基于大语言模型的金融分析任务的推理装置的数据交互方法实施例中的各个步骤。或者,一个或多个处理器100执行计算机程序102时可以实现基于大语言模型的金融分析任务的推理装置的数据交互方法实施例中各模块/单元的功能,此处不作限制。
在一个实施例中,所称处理器100可以是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在一个实施例中,存储器101可以是电子设备的内部存储单元,例如电子设备的硬盘或内存。存储器101也可以是电子设备的外部存储设备,例如电子设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,存储器101还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器101用于存储计算机程序以及终端所需的其他程序和数据。存储器101还可以用于暂时地存储已经输出或者将要输出的数据。
本领域技术人员可以理解,图4中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的终端的限定,具体的终端以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、运营数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双运营数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (17)

1.一种基于大语言模型的金融分析任务的推理方法,其特征在于,所述方法包括:
识别金融分析任务,基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息,其中,所述大语言模型为预先使用若干金融语料及对应的金融含义进行训练后得到的模型;
基于所述金融关键词与所述金融知识信息,确定目标分析工具,并基于所述目标分析工具确定所述金融分析任务所对应的目标计算结果;
基于所述金融知识信息、所述目标分析工具以及所述目标计算结果,合成prompt,所述大语言模型根据所述prompt对所述金融分析任务进行推理解释。
2.根据权利要求1所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述识别金融分析任务,包括:
接收用户输入的金融问题,并获取所述金融问题所对应的文字信息和/或图表信息;
所述大语言模型基于所述文字信息和/或所述图表信息进行意图识别,得到所述金融分析任务。
3.根据权利要求2所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述获取所述金融问题所对应的文字信息和/或图表信息,包括:
对所述金融问题中的图像进行光学字符识别,得到所述图表信息;
和/或,
基于文字识别接口对所述金融问题进行文字识别,得到所述文字信息。
4.根据权利要求3所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述对所述金融问题中的图像进行光学字符识别,得到所述图表信息,包括:
基于表格字符识别接口对所述图像中的表格进行识别,得到表格信息;
基于数学公式字符识别接口对所述图像中的数学公式进行识别,得到数学公式信息;
将所述表格信息与所述数学公式信息作为所述图表信息。
5.根据权利要求2所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息,包括:
基于所述大语言模型,对所述文字信息和/或所述图表信息进行场景识别,得到所述金融分析任务所对应的分析场景信息;
根据所述分析场景信息,确定分析意图信息;
获取所述金融分析任务所对应的问题描述信息,并基于所述大语言模型对所述问题描述信息进行金融词汇抽取,得到金融词汇信息;
基于所述金融词汇信息与所述分析意图信息进行匹配,得到所述金融关键词;
基于所述金融关键词,确定所述金融知识信息。
6.根据权利要求5所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述基于所述金融关键词,确定所述金融知识信息,包括:
在预设的金融知识库中进行所述金融关键词的检索,得到所述金融知识信息。
7.根据权利要求1所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述基于所述金融关键词与所述金融知识信息,确定目标分析工具,包括:
获取每一个所述金融关键词的金融描述信息,将每一个所述金融关键词及对应的金融描述信息进行向量编码,得到每一个所述金融关键词的第一向量信息;
将每一个所述金融关键词的第一向量信息与预设的分析工具库中的每一个分析工具所对应的第二向量信息逐一进行相似度计算,得相似度结果;
基于所述相似度结果,确定所述目标分析工具。
8.根据权利要求7所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述基于所述相似度结果,确定所述目标分析工具,包括:
根据所述相似度结果,得到与每一个所述金融关键词相似度最高的分析工具,并将与每一个所述金融关键词相似度最高的分析工具作为备选分析工具;
获取所述金融分析任务所对应的问题描述信息,并确定所述问题描述信息的复杂程度信息;
所述大语言模型根据所述复杂程度信息从所述备选分析工具中确定至少一个所述目标分析工具。
9.根据权利要求8所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述基于所述目标分析工具确定所述金融分析任务所对应的目标计算结果,包括:
基于预设的程序接口库,分别获取每一个所述目标分析工具所对应的应用程序接口,并确定所述应用程序接口的使用顺序;
基于所述应用程序接口的使用顺序,调用所述目标分析工具对所述金融分析任务进行分析,得到所述目标计算结果。
10.根据权利要求9所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述基于所述应用程序接口的使用顺序,调用所述目标分析工具对所述金融分析任务进行分析,得到所述目标计算结果,包括:
基于所述金融分析任务所对应的问题描述信息,确定用于分析所述金融分析任务的变量数值;
基于所述应用程序接口,所述大语言模型根据所述目标分析工具生成函数代码,并将所述变量数值输入至所述函数代码中进行计算,得到所述目标计算结果。
11.根据权利要求1所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述方法还包括:
获取预设的金融案例库,并从预设的金融案例库中检索出与所述金融分析任务对应的目标案例。
12.根据权利要求1所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述方法还包括:
预先构建金融知识库,所述金融知识库中包括若干金融语料及对应的金融含义;
使用所述的金融知识库中的金融语料及对应的金融含义对大语言模型进行训练,以使得所述大语言模型理解每一个所述金融语料的金融含义。
13.根据权利要求12所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述方法还包括:
构建由所述大语言模型驱动的多源异构数据检索引擎,所述多源异构数据检索引擎用于响应不同任务场景的数据查询需求。
14.根据权利要求1所述的基于大语言模型的金融分析任务的推理方法,其特征在于,所述方法还包括:
预先构建程序接口库,所述程序接口库中包括若干应用程序接口,所述应用程序接口用于对所述目标分析工具进行调用,并根据所述目标分析工具生成函数代码,以通过所述函数代码对所述金融分析任务进行推理计算。
15.一种基于大语言模型的金融分析任务的推理装置,其特征在于,所述装置包括:
关键词分析模块,用于识别金融分析任务,基于大语言模型抽取所述金融分析任务的金融关键词并获取与所述金融关键词所对应的金融知识信息,其中,所述大语言模型为预先使用若干金融语料及对应的金融含义进行训练后得到的模型;
工具确定模块,用于基于所述金融关键词与所述金融知识信息,确定目标分析工具,并基于所述目标分析工具确定所述金融分析任务所对应的目标计算结果;
任务分析模块,用于基于所述金融知识信息、所述目标分析工具以及所述目标计算结果,合成prompt,所述大语言模型根据所述prompt对所述金融分析任务进行推理解释。
16.一种终端,其特征在于,所述终端包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的基于大语言模型的金融分析任务的推理程序,所述处理器执行基于大语言模型的金融分析任务的推理程序时,实现如权利要求1-14任一项所述的基于大语言模型的金融分析任务的推理方法的步骤。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于大语言模型的金融分析任务的推理程序,所述基于大语言模型的金融分析任务的推理程序被处理器执行时,实现如权利要求1-14任一项所述的基于大语言模型的金融分析任务的推理方法的步骤。
CN202410182916.7A 2024-02-19 2024-02-19 基于大语言模型的金融分析任务的推理方法、终端及介质 Pending CN117744804A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410182916.7A CN117744804A (zh) 2024-02-19 2024-02-19 基于大语言模型的金融分析任务的推理方法、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410182916.7A CN117744804A (zh) 2024-02-19 2024-02-19 基于大语言模型的金融分析任务的推理方法、终端及介质

Publications (1)

Publication Number Publication Date
CN117744804A true CN117744804A (zh) 2024-03-22

Family

ID=90281717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410182916.7A Pending CN117744804A (zh) 2024-02-19 2024-02-19 基于大语言模型的金融分析任务的推理方法、终端及介质

Country Status (1)

Country Link
CN (1) CN117744804A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118093635A (zh) * 2024-04-23 2024-05-28 杭州同花顺数据开发有限公司 一种数据查询方法、装置、设备及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151943A (zh) * 2022-11-22 2023-05-23 中国银行股份有限公司 手机银行中金融产品的利息数据获取方法及装置
CN117520503A (zh) * 2023-11-09 2024-02-06 中国平安人寿保险股份有限公司 基于llm模型的金融客服对话生成方法、装置、设备及介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151943A (zh) * 2022-11-22 2023-05-23 中国银行股份有限公司 手机银行中金融产品的利息数据获取方法及装置
CN117520503A (zh) * 2023-11-09 2024-02-06 中国平安人寿保险股份有限公司 基于llm模型的金融客服对话生成方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曹雷 等: "《指挥信息***》", 31 January 2012, 国防工业出版社, pages: 71 *
杨纪成: "《互联网软件应用于开发》", 30 September 2006, 经济科学出版社, pages: 209 - 210 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118093635A (zh) * 2024-04-23 2024-05-28 杭州同花顺数据开发有限公司 一种数据查询方法、装置、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN111368049B (zh) 信息获取方法、装置、电子设备及计算机可读存储介质
CN110457431B (zh) 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN112527999B (zh) 引入农业领域知识的抽取式智能问答方法及***
CN110532397B (zh) 基于人工智能的问答方法、装置、计算机设备及存储介质
US8924197B2 (en) System and method for converting a natural language query into a logical query
CN111027327A (zh) 机器阅读理解方法、设备、存储介质及装置
WO2020233131A1 (zh) 问答处理方法、装置、计算机设备和存储介质
CN110929038A (zh) 基于知识图谱的实体链接方法、装置、设备和存储介质
CN110737756B (zh) 确定针对用户输入数据的应答的方法、装置、设备和介质
CN111309881A (zh) 智能问答中未知问题处理方法、装置、计算机设备和介质
CN114693215A (zh) 采购请求处理方法、装置、计算机设备及存储介质
CN112100401A (zh) 面向科技服务的知识图谱构建方法、装置、设备及存储介质
CN114647713A (zh) 基于虚拟对抗的知识图谱问答方法、设备及存储介质
CN113064980A (zh) 一种智能问答方法、装置、计算机设备及存储介质
CN113220862A (zh) 标准问识别方法、装置及计算机设备及存储介质
CN117473057A (zh) 问答处理方法、***、设备和存储介质
CN113761124A (zh) 文本编码模型的训练方法、信息检索方法及设备
CN112182126A (zh) 用于确定匹配度的模型训练方法、装置、电子设备及可读存储介质
CN117349515A (zh) 搜索处理方法、电子设备和存储介质
CN117009113A (zh) 人工智能模型的调用方法、装置、计算机设备及存储介质
CN117131155A (zh) 多类目识别方法、装置、电子设备及储存介质
CN116719915A (zh) 智能问答方法、装置、设备及存储介质
CN116701593A (zh) 基于GraphQL的中文问答模型训练方法及其相关设备
CN116662495A (zh) 问答处理方法、训练问答处理模型的方法及装置
EP3964980A1 (en) Automatically recommending an existing machine learning project as adaptable for use in a new machine learning project

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination