CN117521606B - 用于财务数据的智能报表生成***及方法 - Google Patents

用于财务数据的智能报表生成***及方法 Download PDF

Info

Publication number
CN117521606B
CN117521606B CN202410010642.3A CN202410010642A CN117521606B CN 117521606 B CN117521606 B CN 117521606B CN 202410010642 A CN202410010642 A CN 202410010642A CN 117521606 B CN117521606 B CN 117521606B
Authority
CN
China
Prior art keywords
financial data
semantic
financial
report
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410010642.3A
Other languages
English (en)
Other versions
CN117521606A (zh
Inventor
张严心
徐冬茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun Vocational Institute of Technology
Original Assignee
Changchun Vocational Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun Vocational Institute of Technology filed Critical Changchun Vocational Institute of Technology
Priority to CN202410010642.3A priority Critical patent/CN117521606B/zh
Publication of CN117521606A publication Critical patent/CN117521606A/zh
Application granted granted Critical
Publication of CN117521606B publication Critical patent/CN117521606B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种用于财务数据的智能报表生成***及方法。其首先对财务数据进行数据清洗以得到清洗后财务数据,然后,对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量,接着,对财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列,然后,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求‑财务数据语义响应融合特征向量作为报表请求‑财务数据语义响应融合特征,最后,基于所述报表请求‑财务数据语义响应融合特征,生成财务数据报表。这样,可以满足不同行业和场景的报表生成需求。

Description

用于财务数据的智能报表生成***及方法
技术领域
本申请涉及智能报表生成领域,且更为具体地,涉及一种用于财务数据的智能报表生成***及方法。
背景技术
财务数据是企业经营管理的重要依据,也是投资者和监管机构的关注焦点。财务报表是用于展示和分析企业的财务状况和业绩的依据,财务报表生成的准确性对于企业的经营和管理至关重要。然而,传统的财务数据报表生成***通常需要人工参与报表生成的过程,包括数据提取、整理和报表设计等环节,这种人工干预容易引入错误,例如数据录入错误、计算错误或者格式错误等。并且,人工处理和整理大量的财务数据是一项繁琐的任务,需要投入大量的人力和时间。此外,传统的财务数据报表生成***通常是基于固定的模板和规则,只能生成固定格式和预定义的报表,无法灵活适应不同行业和场景的需求。如果用户需要定制化的报表或者根据特定指标进行分析,传统***往往无法满足。
因此,期望一种优化的用于财务数据的智能报表生成***。
发明内容
有鉴于此,本申请提出了一种用于财务数据的智能报表生成***及方法,其可以提高财务数据报表的生成质量和效率,并减少人工干预和错误,从而满足不同行业和场景的报表生成需求。
根据本申请的一方面,提供了一种用于财务数据的智能报表生成方法,其包括:
获取从网络数据源采集的财务数据;
对所述财务数据进行数据清洗以得到清洗后财务数据;
对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量;
获取用户提交的财务报表请求描述;
对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列;
对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征;以及
基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表。
进一步地,对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量,包括:
将所述清洗后财务数据分别通过上下文编码器的嵌入层以将所述清洗后财务数据分别转化为嵌入向量以得到财务数据嵌入向量的序列;
将所述财务数据嵌入向量的序列输入所述上下文编码器的转换器以得到多个财务数据语义理解特征向量;以及
将所述多个财务数据语义理解特征向量进行级联以得到所述财务数据语义特征向量。
进一步地,对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列,包括:
将所述财务报表请求描述进行基于词粒度的划分以得到财务报表请求描述词的序列;以及
将所述财务报表请求描述词的序列通过所述上下文编码器以得到所述报表请求描述词粒度语义特征向量的序列。
进一步地,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征,包括:
以如下基于类注意力机制的响应性融合公式对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到所述报表请求-财务数据语义响应融合特征向量;
其中,所述基于类注意力机制的响应性融合公式为: 其中,/>表示所述财务数据语义特征向量,/>表示1×/>的矩阵,/>等于所述财务数据语义特征向量的尺度,/>是1×/>的矩阵,/>等于所述报表请求描述词粒度语义特征向量的序列中报表请求描述词粒度语义特征向量的数量,是Sigmoid函数,/>为权重系数,/>和/>表示1×1卷积核的卷积操作,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量的尺度,/>表示所述报表请求-财务数据语义响应融合特征向量。
进一步地,基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表,包括:
对所述报表请求-财务数据语义响应融合特征向量进行特征分布优化以得到优化报表请求-财务数据语义响应融合特征向量;以及
将所述优化报表请求-财务数据语义响应融合特征向量通过基于AIGC的报表生成器以得到生成
财务数据报表。
进一步地,对所述报表请求-财务数据语义响应融合特征向量进行特征分布优化以得到优化报表请求-财务数据语义响应融合特征向量,包括:
对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行特征校正以得到校正特征向量;以及
将所述校正特征向量与所述报表请求-财务数据语义响应融合特征向量进行融合以得到所述优化报表请求-财务数据语义响应融合特征向量。
根据本申请的另一方面,提供了一种用于财务数据的智能报表生成***,其包括:
财务数据获取模块,用于获取从网络数据源采集的财务数据;
数据清洗模块,用于对所述财务数据进行数据清洗以得到清洗后财务数据;
财务数据语义编码模块,用于对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量;
财务报表获取模块,用于获取用户提交的财务报表请求描述;
财务报表语义编码模块,用于对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列;
融合模块,用于对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征;以及
财务数据报表生成模块,用于基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表。
进一步地,所述财务数据语义编码模块,包括:
财务数据嵌入编码单元,用于将所述清洗后财务数据分别通过上下文编码器的嵌入层以将所述清洗后财务数据分别转化为嵌入向量以得到财务数据嵌入向量的序列;
财务数据转换单元,用于将所述财务数据嵌入向量的序列输入所述上下文编码器的转换器以得到多个财务数据语义理解特征向量;以及
级联单元,用于将所述多个财务数据语义理解特征向量进行级联以得到所述财务数据语义特征向量。
进一步地,所述财务报表语义编码模块,包括:
词粒度划分单元,用于将所述的财务报表请求描述进行基于词粒度的划分以得到财务报表请求描述词的序列;以及
财务报表上下文编码单元,用于将所述财务报表请求描述词的序列通过所述上下文编码器以得到所述报表请求描述词粒度语义特征向量的序列。
进一步地,所述融合模块,用于:
以如下基于类注意力机制的响应性融合公式对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到所述报表请求-财务数据语义响应融合特征向量;
其中,所述基于类注意力机制的响应性融合公式为: 其中,/>表示所述财务数据语义特征向量,/>表示1×/>的矩阵,/>等于所述财务数据语义特征向量的尺度,/>是1×/>的矩阵,/>等于所述报表请求描述词粒度语义特征向量的序列中报表请求描述词粒度语义特征向量的数量,是Sigmoid函数,/>为权重系数,/>和/>表示1×1卷积核的卷积操作,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量的尺度,/>表示所述报表请求-财务数据语义响应融合特征向量。
本申请首先对财务数据进行数据清洗以得到清洗后财务数据,然后,对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量,接着,对财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列,然后,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征,最后,基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表。这样,可以满足不同行业和场景的报表生成需求。
根据下面参考附图对示例性实施例的详细说明,本申请的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本申请的示例性实施例、特征和方面,并且用于解释本申请的原理。
图1示出根据本申请的实施例的用于财务数据的智能报表生成方法的流程图。
图2示出根据本申请的实施例的用于财务数据的智能报表生成方法的架构示意图。
图3示出根据本申请的实施例的用于财务数据的智能报表生成方法的子步骤S170的流程图。
图4示出根据本申请的实施例的用于财务数据的智能报表生成方法的子步骤S171的流程图。
图5示出根据本申请的实施例的用于财务数据的智能报表生成***的框图。
图6示出根据本申请的实施例的用于财务数据的智能报表生成方法的应用场景图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本申请的部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本申请保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
针对上述技术问题,本申请的技术构思为通过从网络数据源采集财务数据,同时获取用户提交的财务报表请求描述,并在后端引入数据处理和语义理解算法来进行所述财务数据和所述财务报表请求描述的语义分析,以此根据财务数据和用户需求自动生成不同类型、格式和风格的财务数据报表,通过这样的方式,能够提高财务数据报表的生成质量和效率,并减少人工干预和错误,从而满足不同行业和场景的报表生成需求。
图1示出根据本申请的实施例的用于财务数据的智能报表生成方法的流程图。图2示出根据本申请的实施例的用于财务数据的智能报表生成方法的架构示意图。如图1和图2所示,根据本申请实施例的用于财务数据的智能报表生成方法,包括步骤:S110,获取从网络数据源采集的财务数据;S120,对所述财务数据进行数据清洗以得到清洗后财务数据;S130,对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量;S140,获取用户提交的财务报表请求描述;S150,对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列;S160,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征;以及,S170,基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表。
应可以理解,步骤S110的目的是从网络数据源中采集财务数据,这些数据可能包括公司的财务报表、财务指标、交易数据等,这些数据是生成财务报表的基础。在步骤S120中,对从网络数据源采集到的财务数据进行清洗和预处理,清洗后的数据应该去除错误、缺失或冗余的数据,确保数据的准确性和完整性,以便后续的处理和分析。在步骤S130中,对清洗后的财务数据进行语义编码,将其转化为财务数据的语义特征向量,语义编码的目的是将财务数据转化为机器可理解和处理的形式,以便后续的分析和应用。在步骤S140中,获取用户提交的财务报表请求描述,用户可以通过输入文字或其他形式来描述所需的财务报表内容和要求。在步骤S150中,对用户提交的财务报表请求描述进行语义编码,将其转化为报表请求描述词粒度的语义特征向量序列,这样可以将用户的请求转化为机器可理解和处理的形式。在步骤S160中,将报表请求描述词粒度语义特征向量的序列和财务数据语义特征向量进行基于类注意力机制的响应性融合,这个融合过程可以将用户的报表请求与财务数据进行关联和匹配,以得到报表请求-财务数据的语义响应融合特征,这些特征可以帮助生成符合用户需求的财务数据报表。在步骤S170中,基于报表请求-财务数据语义响应融合特征,生成符合用户需求的财务数据报表,根据用户的报表请求和财务数据的语义响应融合特征,***可以进行相应的计算和处理,生成包含所需财务数据的报表,并将其呈现给用户。通过以上步骤的执行,可以实现从财务数据的采集、清洗、编码到用户报表请求的处理和生成财务数据报表的完整流程。
具体地,在本申请的技术方案中,首先,获取从网络数据源,例如数据库、文件和网页等数据源中采集的财务数据。应可以理解,财务数据的准确性对于财务数据报表生成的准确性至关重要,然而,财务数据来自不同的***或部门,存在格式和标准的差异,同时财务数据可能存在错误值、缺失值和异常值。因此,在进行财务数据的语义理解前需要对于所述财务数据进行数据清洗以得到清洗后财务数据。
接着,在进行财务数据清洗后,为了能够进行财务数据的语义理解,以捕捉财务数据中各个数据项之间的语义关联关系,需要对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量。通过对所述清洗后财务数据进行语义编码,可以捕捉到所述财务数据中的各个数据项之间的语义关系,如指标之间的相似性、相关性和层次结构等。这有助于***更好地理解财务数据,并在后续的报表生成和分析中进行准确的计算和推理,为后续的报表生成和数据分析提供基础。
相应地,在步骤S130中,对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量,包括:将所述清洗后财务数据分别通过上下文编码器的嵌入层以将所述清洗后财务数据分别转化为嵌入向量以得到财务数据嵌入向量的序列;将所述财务数据嵌入向量的序列输入所述上下文编码器的转换器以得到多个财务数据语义理解特征向量;以及,将所述多个财务数据语义理解特征向量进行级联以得到所述财务数据语义特征向量。
值得一提的是,嵌入层(Embedding Layer)是一种神经网络层,用于将输入数据(在这种情况下是清洗后的财务数据)转化为嵌入向量。嵌入向量是一种低维表示,它可以将高维的离散数据(如单词、符号或数据点)映射到连续的向量空间中。嵌入层通过学习数据的分布和语义关系,将每个数据点映射为一个向量,从而捕捉数据的语义特征。转换器(Transformer)是一种用于序列数据处理的神经网络模型。在这个上下文中,转换器被用作上下文编码器,用于将财务数据嵌入向量的序列转化为多个财务数据语义理解特征向量。转换器模型由多个注意力机制组成,通过自注意力机制和多头注意力机制来捕捉序列中不同位置的语义关系和依赖关系。转换器模型具有较强的建模能力,能够对序列数据进行有效的语义理解和编码。因此,在步骤130中,嵌入层用于将清洗后的财务数据转化为嵌入向量序列,而转换器用于将嵌入向量序列转化为多个财务数据语义理解特征向量,最后,这些特征向量通过级联操作,得到财务数据的语义特征向量,其中包含了清洗后财务数据的语义信息。
然后,为了了解用户的需求和要求,以便生成符合用户期望的财务报表,需要首先获取用户提交的财务报表请求描述。特别地,在本申请的一个具体示例中,用户可能通过文字描述、语音输入或其他形式提交他们对财务报表的需求,例如需要生成某个时间段的利润表、现金流量表或者特定指标的分析报告等。继而,再对所述财务报表请求描述进行语义编码,以提取出所述财务报表请求描述中基于词粒度的上下文语义关联特征信息,从而得到报表请求描述词粒度语义特征向量的序列。这样,可以帮助***更为准确地理解用户的报表请求描述,例如理解用户需要生成的报表类型、时间范围、指标要求等,从而有利于生成符合用户期望的报表。
相应地,在步骤S150中,对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列,包括:将所述财务报表请求描述进行基于词粒度的划分以得到所述财务报表请求描述词的序列;以及,将所述财务报表请求描述词的序列通过所述上下文编码器以得到所述报表请求描述词粒度语义特征向量的序列。
应可以理解,基于词粒度的划分是将财务报表请求描述划分为单词的序列,这样做的目的是将描述的文本信息分解为单个词语,以便后续的语义编码和处理。基于词粒度的划分有以下几个用途:1.语义理解:将财务报表请求描述划分为单词可以帮助***理解每个词语的含义和语义。每个词语都可以表示一个特定的概念或要求,通过对每个词语进行语义编码,***可以更好地理解用户的意图和需求。2.上下文建模:划分为单词的序列可以帮助***建模上下文信息。每个词语都可以根据其前后的词语来推断其含义和语义。通过将财务报表请求描述划分为词语的序列,并将其输入到上下文编码器中,***可以捕捉到词语之间的上下文关系和依赖关系,从而更好地理解整个报表请求的语义。3.特征提取:基于词粒度的划分可以将财务报表请求描述转化为一系列词语,每个词语都可以表示一个特定的特征或需求。通过对每个词语进行语义编码,可以将其转化为语义特征向量,这些特征向量可以用于后续的特征提取和匹配,以生成符合用户需求的财务数据报表。综合来说,基于词粒度的划分可以将财务报表请求描述转化为可处理的单词序列,从而帮助***理解用户的需求、建模上下文信息,并提取语义特征,以生成财务数据报表。
进一步地,由于所述报表请求描述词粒度语义特征向量的序列提供了关于用户输入的报表请求描述词粒度语义特征信息,所述财务数据语义特征向量提供了有关于财务报表数据的语义关联特征信息。为了将报表请求和财务数据之间的语义特征进行有效地融合,以帮助***更好地理解用户需求,并将其映射到相应的财务数据上来生成符合用户期望的报表,在本申请的技术方案中,进一步对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量。特别地,所述基于类注意力机制的响应性融合的方式可以根据报表请求描述的词粒度语义特征对财务数据的语义特征进行加权,使得***能够关注与报表请求相关的财务数据,忽略与请求无关的数据,这有助于提高***对用户需求的理解和响应能力。
相应地,在步骤S160中,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征,包括:以如下基于类注意力机制的响应性融合公式对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到所述报表请求-财务数据语义响应融合特征向量;其中,所述基于类注意力机制的响应性融合公式为: 其中,/>表示所述财务数据语义特征向量,/>表示1×/>的矩阵,/>等于所述财务数据语义特征向量的尺度,/>是1×/>的矩阵,/>等于所述报表请求描述词粒度语义特征向量的序列中报表请求描述词粒度语义特征向量的数量,/>是Sigmoid函数,/>为权重系数,/>和/>表示1×1卷积核的卷积操作,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量的尺度,/>表示所述报表请求-财务数据语义响应融合特征向量。
继而,再将所述报表请求-财务数据语义响应融合特征向量通过基于AIGC的报表生成器以得到生成财务数据报表。这样,能够根据财务数据和用户需求自动生成不同类型、格式和风格的财务数据报表,从而提高财务数据报表的生成质量和效率,并减少人工干预和错误。
相应地,在步骤S170中,如图3所示,基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表,包括:S171,对所述报表请求-财务数据语义响应融合特征向量进行特征分布优化以得到优化报表请求-财务数据语义响应融合特征向量;以及,S172,将所述优化报表请求-财务数据语义响应融合特征向量通过基于AIGC的报表生成器以得到生成财务数据报表。
应可以理解,在步骤S171中,对报表请求-财务数据语义响应融合特征向量进行特征分布优化的目的是通过调整特征向量的权重和分布,使其更加符合生成财务数据报表的需求。通过优化特征向量的分布,可以提高报表请求与财务数据之间的匹配程度,从而生成更准确和有用的财务数据报表。在步骤S172中,优化的报表请求-财务数据语义响应融合特征向量被输入到基于AIGC(Artificial Intelligence for Generating Content 即人工智能生成内容)的报表生成器中,以生成最终的财务数据报表。AIGC是基于人工智能的内容生成技术,它利用机器学习和自然语言处理等技术,根据输入的特征向量和规则,自动地生成符合要求的财务数据报表。通过AIGC的报表生成器,可以根据优化的特征向量快速生成财务数据报表,提高生成效率和准确性。综合来说,步骤S171通过特征分布优化,调整报表请求-财务数据语义响应融合特征向量的权重和分布,以提高匹配程度,步骤S172利用基于AIGC的报表生成器,根据优化的特征向量生成最终的财务数据报表,这两个步骤共同用于生成准确、有用的财务数据报表。
其中,在步骤S171中,如图4所示,对所述报表请求-财务数据语义响应融合特征向量进行特征分布优化以得到优化报表请求-财务数据语义响应融合特征向量,包括:S1711,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行特征校正以得到校正特征向量;以及,S1712,将所述校正特征向量与所述报表请求-财务数据语义响应融合特征向量进行融合以得到所述优化报表请求-财务数据语义响应融合特征向量。
特别地,在上述技术方案中,所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量分别表达财务报表请求描述的词粒度文本语义特征和财务数据的编码语义特征,由此,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合时,需要提升所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量的基于不同数据模态的语义特征融合效果。
也就是,考虑到所述财务报表请求描述和所述财务数据的源数据模态,在其到高维特征空间内的基于高维几何变换的特征融合时,期望抑制由于源数据模态差异导致的与不同特征分布方向对应的高维几何变化,从而提升融合效果。
基于此,本申请的申请人对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进一步进行基于旋转控制的融合特征几何变化校正,以获得校正特征向量。
相应地,在一个示例中,在步骤S1711中,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行特征校正以得到校正特征向量,包括:以如下校正公式对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行特征校正以得到所述校正特征向量;其中,所述校正公式为:其中,/>是所述报表请求描述词粒度语义特征向量的序列级联后的级联特征向量,/>是所述财务数据语义特征向量,/>、/>和/>分别是所述级联特征向量、所述财务数据语义特征向量和所述校正特征向量的特征值,/>和/>分别是特征向量的1范数和2范数,/>是特征向量的长度,且/>是权重超参数,/>表示数值的指数运算,所述数值的指数运算表示计算以所述数值为幂的自然指数函数值。
具体地,为了在进行基于类注意力机制的响应性融合时提升特征对不同特征分布对应的空间变换的感知和认知能力,基于所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量的距离结构参数来从向量尺度维度进行特征向量的特征分布在不同方向上的旋转控制,以通过相对旋转解缠来保留融合特征的旋转不变性,从而避免融合特征时在高维特征空间内的几何变换导致的特征分布的高维几何变化。这样,再将所述校正特征向量与所述报表请求-财务数据语义响应融合特征向量进行融合,就可以提升所述报表请求-财务数据语义响应融合特征向量的融合表达效果,从而改进其通过基于AIGC的报表生成器得到的生成财务数据报表的数据质量。这样,能够根据财务数据和用户需求自动生成不同类型、格式和风格的财务数据报表,从而提高财务数据报表的生成质量和效率,并减少人工干预和错误,以满足不同行业和场景的报表生成需求。
综上,基于本申请实施例的用于财务数据的智能报表生成方法,其可以提高财务数据报表的生成质量和效率,并减少人工干预和错误,从而满足不同行业和场景的报表生成需求。
图5示出根据本申请的实施例的用于财务数据的智能报表生成***100的框图。如图5所示,根据本申请实施例的用于财务数据的智能报表生成***100,包括:财务数据获取模块110,用于获取从网络数据源采集的财务数据;数据清洗模块120,用于对所述财务数据进行数据清洗以得到清洗后财务数据;财务数据语义编码模块130,用于对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量;财务报表获取模块140,用于获取用户提交的财务报表请求描述;财务报表语义编码模块150,用于对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列;融合模块160,用于对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征;以及,财务数据报表生成模块170,用于基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表。
在一种可能的实现方式中,所述财务数据语义编码模块130,包括:财务数据嵌入编码单元,用于将所述清洗后财务数据分别通过上下文编码器的嵌入层以将所述清洗后财务数据分别转化为嵌入向量以得到财务数据嵌入向量的序列;财务数据转换单元,用于将所述财务数据嵌入向量的序列输入所述上下文编码器的转换器以得到多个财务数据语义理解特征向量;以及,级联单元,用于将所述多个财务数据语义理解特征向量进行级联以得到所述财务数据语义特征向量。
在一种可能的实现方式中,所述财务报表语义编码模块150,包括:词粒度划分单元,用于将所述财务报表请求描述进行基于词粒度的划分以得到所述财务报表请求描述词的序列;以及,财务报表上下文编码单元,用于将所述财务报表请求描述词的序列通过所述上下文编码器以得到所述报表请求描述词粒度语义特征向量的序列。
在一种可能的实现方式中,所述融合模块160,用于:以如下基于类注意力机制的响应性融合公式对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到所述报表请求-财务数据语义响应融合特征向量;其中,所述基于类注意力机制的响应性融合公式为: 其中,/>表示所述财务数据语义特征向量,/>表示1×/>的矩阵,/>等于所述财务数据语义特征向量的尺度,/>是1×/>的矩阵,/>等于所述报表请求描述词粒度语义特征向量的序列中报表请求描述词粒度语义特征向量的数量,/>是Sigmoid函数,/>为权重系数,/>和/>表示1×1卷积核的卷积操作,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量的尺度,/>表示所述报表请求-财务数据语义响应融合特征向量。
这里,本领域技术人员可以理解,上述用于财务数据的智能报表生成***100中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的用于财务数据的智能报表生成方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的用于财务数据的智能报表生成***100可以实现在各种无线终端中,例如具有用于财务数据的智能报表生成算法的服务器等。在一种可能的实现方式中,根据本申请实施例的用于财务数据的智能报表生成***100可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该用于财务数据的智能报表生成***100可以是该无线终端的操作***中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该用于财务数据的智能报表生成***100同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该用于财务数据的智能报表生成***100与该无线终端也可以是分立的设备,并且该用于财务数据的智能报表生成***100可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
图6示出根据本申请的实施例的用于财务数据的智能报表生成方法的应用场景图。如图6所示,在该应用场景中,首先,获取从网络数据源采集的财务数据(例如,图6中所示意的D1)以及用户提交的财务报表请求描述(例如,图6中所示意的D2),然后,将所述财务数据和所述财务报表请求描述输入至部署有用于财务数据的智能报表生成算法的服务器(例如,图6中所示意的S)中,其中,所述服务器能够使用所述用于财务数据的智能报表生成算法对所述财务数据和所述财务报表请求描述进行处理以生成财务数据报表。
附图中的流程图和框图显示了根据本申请的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (8)

1.一种用于财务数据的智能报表生成方法,其特征在于,包括:
获取从网络数据源采集的财务数据;
对所述财务数据进行数据清洗以得到清洗后财务数据;
对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量;
获取用户提交的财务报表请求描述;
对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列;
对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征;以及
基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表;
其中,对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征,包括:
以如下基于类注意力机制的响应性融合公式对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到所述报表请求-财务数据语义响应融合特征向量;
其中,所述基于类注意力机制的响应性融合公式为: 其中,/>表示所述财务数据语义特征向量,/>表示1×/>的矩阵,/>等于所述财务数据语义特征向量的尺度,/>是1×/>的矩阵,/>等于所述报表请求描述词粒度语义特征向量的序列中报表请求描述词粒度语义特征向量的数量,是Sigmoid函数,/>为权重系数,/>和/>表示1×1卷积核的卷积操作,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量的尺度,/>表示所述报表请求-财务数据语义响应融合特征向量。
2.根据权利要求1所述的用于财务数据的智能报表生成方法,其特征在于,对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量,包括:
将所述清洗后财务数据分别通过上下文编码器的嵌入层以将所述清洗后财务数据分别转化为嵌入向量以得到财务数据嵌入向量的序列;
将所述财务数据嵌入向量的序列输入所述上下文编码器的转换器以得到多个财务数据语义理解特征向量;以及
将所述多个财务数据语义理解特征向量进行级联以得到所述财务数据语义特征向量。
3.根据权利要求2所述的用于财务数据的智能报表生成方法,其特征在于,对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列,包括:
将所述财务报表请求描述进行基于词粒度的划分以得到财务报表请求描述词的序列;以及
将所述财务报表请求描述词的序列通过所述上下文编码器以得到所述报表请求描述词粒度语义特征向量的序列。
4.根据权利要求3所述的用于财务数据的智能报表生成方法,其特征在于,基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表,包括:
对所述报表请求-财务数据语义响应融合特征向量进行特征分布优化以得到优化报表请求-财务数据语义响应融合特征向量;以及
将所述优化报表请求-财务数据语义响应融合特征向量通过基于AIGC的报表生成器以得到生成财务数据报表。
5.根据权利要求4所述的用于财务数据的智能报表生成方法,其特征在于,对所述报表请求-财务数据语义响应融合特征向量进行特征分布优化以得到优化报表请求-财务数据语义响应融合特征向量,包括:
对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行特征校正以得到校正特征向量;以及
将所述校正特征向量与所述报表请求-财务数据语义响应融合特征向量进行融合以得到所述优化报表请求-财务数据语义响应融合特征向量。
6.一种用于财务数据的智能报表生成***,其特征在于,包括:
财务数据获取模块,用于获取从网络数据源采集的财务数据;
数据清洗模块,用于对所述财务数据进行数据清洗以得到清洗后财务数据;
财务数据语义编码模块,用于对所述清洗后财务数据进行语义编码以得到财务数据语义特征向量;
财务报表获取模块,用于获取用户提交的财务报表请求描述;
财务报表语义编码模块,用于对所述财务报表请求描述进行语义编码以得到报表请求描述词粒度语义特征向量的序列;
融合模块,用于对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到报表请求-财务数据语义响应融合特征向量作为报表请求-财务数据语义响应融合特征;以及
财务数据报表生成模块,用于基于所述报表请求-财务数据语义响应融合特征,生成财务数据报表;
其中,所述融合模块,用于:
以如下基于类注意力机制的响应性融合公式对所述报表请求描述词粒度语义特征向量的序列和所述财务数据语义特征向量进行基于类注意力机制的响应性融合以得到所述报表请求-财务数据语义响应融合特征向量;
其中,所述基于类注意力机制的响应性融合公式为: 其中,/>表示所述财务数据语义特征向量,/>表示1×/>的矩阵,/>等于所述财务数据语义特征向量的尺度,/>是1×/>的矩阵,/>等于所述报表请求描述词粒度语义特征向量的序列中报表请求描述词粒度语义特征向量的数量,是Sigmoid函数,/>为权重系数,/>和/>表示1×1卷积核的卷积操作,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量,/>表示所述报表请求描述词粒度语义特征向量的序列中的各个报表请求描述词粒度语义特征向量的尺度,/>表示所述报表请求-财务数据语义响应融合特征向量。
7.根据权利要求6所述的用于财务数据的智能报表生成***,其特征在于,所述财务数据语义编码模块,包括:
财务数据嵌入编码单元,用于将所述清洗后财务数据分别通过上下文编码器的嵌入层以将所述清洗后财务数据分别转化为嵌入向量以得到财务数据嵌入向量的序列;
财务数据转换单元,用于将所述财务数据嵌入向量的序列输入所述上下文编码器的转换器以得到多个财务数据语义理解特征向量;以及
级联单元,用于将所述多个财务数据语义理解特征向量进行级联以得到所述财务数据语义特征向量。
8.根据权利要求7所述的用于财务数据的智能报表生成***,其特征在于,所述财务报表语义编码模块,包括:
词粒度划分单元,用于将所述的财务报表请求描述进行基于词粒度的划分以得到财务报表请求描述词的序列;以及
财务报表上下文编码单元,用于将所述财务报表请求描述词的序列通过所述上下文编码器以得到所述报表请求描述词粒度语义特征向量的序列。
CN202410010642.3A 2024-01-04 2024-01-04 用于财务数据的智能报表生成***及方法 Active CN117521606B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410010642.3A CN117521606B (zh) 2024-01-04 2024-01-04 用于财务数据的智能报表生成***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410010642.3A CN117521606B (zh) 2024-01-04 2024-01-04 用于财务数据的智能报表生成***及方法

Publications (2)

Publication Number Publication Date
CN117521606A CN117521606A (zh) 2024-02-06
CN117521606B true CN117521606B (zh) 2024-03-19

Family

ID=89753423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410010642.3A Active CN117521606B (zh) 2024-01-04 2024-01-04 用于财务数据的智能报表生成***及方法

Country Status (1)

Country Link
CN (1) CN117521606B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2303886A1 (en) * 1997-09-19 1999-03-25 William J. Clancey Creating and editing electronic documents
EP1705606A1 (en) * 2005-03-21 2006-09-27 Li-Chih Lu Automatic bookkeeping system
US7610233B1 (en) * 1999-12-22 2009-10-27 Accenture, Llp System, method and article of manufacture for initiation of bidding in a virtual trade financial environment
JP2011076557A (ja) * 2009-10-02 2011-04-14 Pronexus Inc 企業財務情報データベースおよび企業財務情報提供システム
WO2012090222A1 (en) * 2010-12-29 2012-07-05 Esssar Investments Limited System and method for converting & presenting financial information
KR20220101817A (ko) * 2021-01-12 2022-07-19 최희준 금융 정보 예측을 위한 인공 지능 시스템과 이를 이용한 금융 정보 예측 방법
CN116150361A (zh) * 2022-12-27 2023-05-23 暨南大学 一种财务报表附注的事件抽取方法、***及存储介质
CN116610803A (zh) * 2023-07-19 2023-08-18 北京每日信动科技有限公司 基于大数据的产业链优企信息管理方法及***
CN116842964A (zh) * 2023-07-18 2023-10-03 杭州鑫策科技有限公司 一种基于语义分析的业务流程生成方法和***

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050086135A1 (en) * 2003-10-20 2005-04-21 Li-Chin Lu Automatic bookkeeping system
US20210201359A1 (en) * 2019-12-30 2021-07-01 Genesys Telecommunications Laboratories, Inc. Systems and methods relating to automation for personalizing the customer experience
US11423304B2 (en) * 2020-01-15 2022-08-23 Beijing Jingdong Shangke Information Technology Co., Ltd. System and method for semantic analysis of multimedia data using attention-based fusion network

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2303886A1 (en) * 1997-09-19 1999-03-25 William J. Clancey Creating and editing electronic documents
US7610233B1 (en) * 1999-12-22 2009-10-27 Accenture, Llp System, method and article of manufacture for initiation of bidding in a virtual trade financial environment
EP1705606A1 (en) * 2005-03-21 2006-09-27 Li-Chih Lu Automatic bookkeeping system
JP2011076557A (ja) * 2009-10-02 2011-04-14 Pronexus Inc 企業財務情報データベースおよび企業財務情報提供システム
WO2012090222A1 (en) * 2010-12-29 2012-07-05 Esssar Investments Limited System and method for converting & presenting financial information
KR20220101817A (ko) * 2021-01-12 2022-07-19 최희준 금융 정보 예측을 위한 인공 지능 시스템과 이를 이용한 금융 정보 예측 방법
CN116150361A (zh) * 2022-12-27 2023-05-23 暨南大学 一种财务报表附注的事件抽取方法、***及存储介质
CN116842964A (zh) * 2023-07-18 2023-10-03 杭州鑫策科技有限公司 一种基于语义分析的业务流程生成方法和***
CN116610803A (zh) * 2023-07-19 2023-08-18 北京每日信动科技有限公司 基于大数据的产业链优企信息管理方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种整合语义对象特征的视觉注意力模型;李娜;赵歆波;;哈尔滨工业大学学报;20200510(第05期);全文 *

Also Published As

Publication number Publication date
CN117521606A (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
CN109033068B (zh) 基于注意力机制的用于阅读理解的方法、装置和电子设备
CN115203380A (zh) 基于多模态数据融合的文本处理***及其方法
CN115783923B (zh) 基于大数据的电梯故障模式识别***
CN115796173A (zh) 针对监管报送需求的数据处理方法和***
CN115146488A (zh) 基于大数据的可变业务流程智能建模***及其方法
CN112052684A (zh) 电力计量的命名实体识别方法、装置、设备和存储介质
CN113987187B (zh) 基于多标签嵌入的舆情文本分类方法、***、终端及介质
CN115878003B (zh) 一种基于Transformer的RPA网页操作自动化方法及***
CN116610803B (zh) 基于大数据的产业链优企信息管理方法及***
CN116245513B (zh) 基于规则库的自动化运维***及其方法
CN116911929B (zh) 基于大数据的广告服务终端及方法
CN115269882A (zh) 基于语义理解的知识产权检索***及其方法
CN116842194A (zh) 一种电力语义知识图谱***及方法
CN116151845A (zh) 基于工业物联网技术的产品全生命周期管理***及其方法
CN115409018A (zh) 基于大数据的公司舆情监测***及其方法
CN112784580A (zh) 基于事件抽取的金融数据分析方法及装置
CN117171413B (zh) 用于数字藏品管理的数据处理***及其方法
CN117610658A (zh) 一种基于人工智能的知识图谱数据动态更新方法及***
CN117744855A (zh) 基于机器学习的负荷预测***及方法
CN117521606B (zh) 用于财务数据的智能报表生成***及方法
CN117316462A (zh) 一种医疗数据管理方法
CN117078007A (zh) 一种融合尺度标签的多尺度风控***及其方法
CN115309895A (zh) 基于研发项目文本描述的进度管理***及其管理方法
CN116681428B (zh) 电子设备的智能回收管理***及方法
Sun et al. Text sentiment polarity classification method based on word embedding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant