CN116542801B - 一种财务数据分析方法及*** - Google Patents
一种财务数据分析方法及*** Download PDFInfo
- Publication number
- CN116542801B CN116542801B CN202310828436.9A CN202310828436A CN116542801B CN 116542801 B CN116542801 B CN 116542801B CN 202310828436 A CN202310828436 A CN 202310828436A CN 116542801 B CN116542801 B CN 116542801B
- Authority
- CN
- China
- Prior art keywords
- data
- financial
- enterprise
- model
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000007405 data analysis Methods 0.000 title claims abstract description 20
- 230000006399 behavior Effects 0.000 claims abstract description 117
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000004088 simulation Methods 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 18
- 238000004519 manufacturing process Methods 0.000 claims description 9
- 230000003542 behavioural effect Effects 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了一种财务数据分析方法及***,方法包括:获取目标企业的企业类型,并从模型库中选取对应企业类型的执行模型作为预设执行模型;获取目标企业目标年度的财务数据并进行特征提取形成当前财务特征数据,并获取目标企业目标年度的上一年度的财务数据并进行特征提取形成历史财务特征数据;将历史财务特征数据和当前财务特征数据输入预设执行模型获取预设执行模型的输出数据作为目标年度行为数据。本发明一种财务数据分析方法及***,可以通过连续两个年度的财务数据拟真出企业在年度中所执行过的主要行为,一方面可以为企业在后续年度的决策提供依据,另一方面可以让企业对其竞争对手的分析提供可靠的参考。
Description
技术领域
本发明涉及数据信息化技术,具体涉及一种财务数据分析方法及***。
背景技术
财务数据是指企业经营活动和财务结果的数据记录,它不仅反映了企业在当下的经营状况,更可以作为过去的重要参考,有助于分析企业的历史业绩及其发展趋势。财务数据可以衡量企业盈利能力、偿债能力和回报能力等,为企业管理决策提供重要的参考。
目前对于财务数据的研究主要集中在数据挖掘和数据挖掘后对企业前景或信用相关的分析;而根据财务数据进行企业决策行为的分析则缺少研究,不利于为企业决策提供帮助。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供一种财务数据分析方法及***。
第一方面,本申请实施例提供了一种财务数据分析方法,包括:
获取目标企业的企业类型,并从模型库中选取对应所述企业类型的执行模型作为预设执行模型;
获取所述目标企业目标年度的财务数据并进行特征提取形成当前财务特征数据,并获取目标企业目标年度的上一年度的财务数据并进行特征提取形成历史财务特征数据;
将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据。
本申请实施例实施时,企业类型是指企业所处的细分行业,如:冶钢业、涂料产业等,细分方式可以根据预设执行模型相关训练方式进行确定,即根据训练样本之间的差异进行确定,也可以根据国家工业分类进行确定。模型库是预先训练好的多个执行模型组成的模型数据库,其中的执行模型需要对应上述的细分行业。财务数据主要包括资产负债表、存量数据、价格数据等等与企业经营相关的数据。对于财务数据的特征提取,主要是提取预设执行模型中需要进行数据输入的特征,如净收益额、特定产品单价等等内容。通过预设执行模型对历史财务特征数据和当前财务特征数据进行分析,可以生成目标年度行为数据,目标年度行为数据是指预测的目标企业在目标年度中所执行的主要行为,如提高或降低生产规模、前端市场扩充或萎缩、引入或减少外部投资等。本申请实施例通过上述技术方案,可以通过连续两个年度的财务数据拟真出企业在年度中所执行过的主要行为,一方面可以为企业在后续年度的决策提供依据,另一方面可以让企业对其竞争对手的分析提供可靠的参考。
在一种可能的实现方式中,所述预设执行模型包括残差模型和行为模拟模型;
将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据包括:
根据所述目标企业的企业类型获取所述目标企业在所述目标年度可能采取的商业和生产行为作为行为数据;
将多个所述行为数据进行数值组合形成多组综合行为数据;不同的综合行为数据之间至少存在一个行为数据对应的数值不同;
将所述历史财务特征数据和所述综合行为数据输入所述行为模拟模型获取对应不同的综合行为数据的多组预期财务特征数据;
将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据;
将所述基准财务特征数据对应的综合行为数据作为所述目标年度行为数据。
在一种可能的实现方式中,将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据包括:
获取目标年度所述企业类型对应行业的经济环境数据作为当前经济数据,并获取目标年度的上一年度所述企业类型对应行业的经济环境数据作为历史经济数据;
根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据;
当将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型时,将新的当前财务特征数据作为所述当前财务特征数据输入所述残差模型。
在一种可能的实现方式中,根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据包括:
将所述当前财务特征数据划分为固定特征数据和变动特征数据;所述固定特征数据为受经济数据直接影响小于预设值的数据,所述变动特征数据为受经济数据直接影响大于或等于预设值的数据;
比较所述当前经济数据和所述历史经济数据,并选出差异大于阈值的数据项形成差异数据组;
根据所述差异数据组和所述变动特征数据之间的关联关系计算所述差异数据组中每个数据项对所述变动特征数据的影响因子;
根据所述影响因子对所述差异数据组进行加权修正所述变动特征数据;
将所述固定特征数据和修正后的所述变动特征数据作为新的当前财务特征数据。
在一种可能的实现方式中,所述行为模拟模型的获取包括:
获取同一个行业内多家企业在多年的财务数据和每个年度的行为数据;
根据所述财务数据和所述行为数据建立三元组;所述三元组的第一元素为企业在任意年度的财务数据,所述三元组的第二元素为企业在所述任意年度的行为数据,所述三元组的第三元素为企业在所述任意年度的下一年度的财务数据;
根据所述三元组中三个元素的对应关系建立聚类空间,并在所述聚类空间中将所有的三元组进行聚类分析;
提取聚类分析结果中占所有三元组数量最大的类别作为基准类别,并提取所述基准类别的中心作为基准核心;
根据所述基准核心对所有的三元组进行二次聚类;
重复提取基准核心和二次聚类,直至所述聚类分析的基准类别中三元组的数量占所有三元组数量的比例超过预设值时,将当前占所有三元组数量最大的类别作为样本类别;
将所述样本类别的三元组的第一元素和第二元素作为输入数据,将所述样本类别的三元组的第三元素作为输出数据训练神经网络模型形成所述行为模拟模型。
在一种可能的实现方式中,所述残差模型的获取包括:
根据多组财务特征数据构建财务特征数据中相同数据项之间的距离函数;所述距离函数采用余弦距离;
根据多个相同数据项对应的距离函数构建损失函数;所述损失函数的输出为不同财务特征数据之间的差异。
第二方面,本申请实施例提供了一种财务数据分析***,包括:
获取单元,被配置为获取目标企业的企业类型,并从模型库中选取对应所述企业类型的执行模型作为预设执行模型;
特征提取单元,被配置为获取所述目标企业目标年度的财务数据并进行特征提取形成当前财务特征数据,并获取目标企业目标年度的上一年度的财务数据并进行特征提取形成历史财务特征数据;
执行单元,被配置为将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据。
在一种可能的实现方式中,所述预设执行模型包括残差模型和行为模拟模型;
所述执行单元还被配置为:
根据所述目标企业的企业类型获取所述目标企业在所述目标年度可能采取的商业和生产行为作为行为数据;
将多个所述行为数据进行数值组合形成多组综合行为数据;不同的综合行为数据之间至少存在一个行为数据对应的数值不同;
将所述历史财务特征数据和所述综合行为数据输入所述行为模拟模型获取对应不同的综合行为数据的多组预期财务特征数据;
将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据;
将所述基准财务特征数据对应的综合行为数据作为所述目标年度行为数据。
在一种可能的实现方式中,所述执行单元还被配置为:
获取目标年度所述企业类型对应行业的经济环境数据作为当前经济数据,并获取目标年度的上一年度所述企业类型对应行业的经济环境数据作为历史经济数据;
根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据;
当将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型时,将新的当前财务特征数据作为所述当前财务特征数据输入所述残差模型。
在一种可能的实现方式中,所述执行单元还被配置为:
将所述当前财务特征数据划分为固定特征数据和变动特征数据;所述固定特征数据为受经济数据直接影响小于预设值的数据,所述变动特征数据为受经济数据直接影响大于或等于预设值的数据;
比较所述当前经济数据和所述历史经济数据,并选出差异大于阈值的数据项形成差异数据组;
根据所述差异数据组和所述变动特征数据之间的关联关系计算所述差异数据组中每个数据项对所述变动特征数据的影响因子;
根据所述影响因子对所述差异数据组进行加权修正所述变动特征数据;
将所述固定特征数据和修正后的所述变动特征数据作为新的当前财务特征数据。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明一种财务数据分析方法及***,可以通过连续两个年度的财务数据拟真出企业在年度中所执行过的主要行为,一方面可以为企业在后续年度的决策提供依据,另一方面可以让企业对其竞争对手的分析提供可靠的参考。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本申请实施例方法步骤示意图;
图2为本申请实施例***架构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请实施例的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其它操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本申请保护的范围。
请结合参阅图1,为本发明实施例所提供的一种财务数据分析方法的流程示意图,所述一种财务数据分析方法可以应用于图2中的一种财务数据分析***,进一步地,所述一种财务数据分析方法具体可以包括以下步骤S1-步骤S3所描述的内容。
S1:获取目标企业的企业类型,并从模型库中选取对应所述企业类型的执行模型作为预设执行模型;
S2:获取所述目标企业目标年度的财务数据并进行特征提取形成当前财务特征数据,并获取目标企业目标年度的上一年度的财务数据并进行特征提取形成历史财务特征数据;
S3:将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据。
本申请实施例实施时,企业类型是指企业所处的细分行业,如:冶钢业、涂料产业等,细分方式可以根据预设执行模型相关训练方式进行确定,即根据训练样本之间的差异进行确定,也可以根据国家工业分类进行确定。模型库是预先训练好的多个执行模型组成的模型数据库,其中的执行模型需要对应上述的细分行业。财务数据主要包括资产负债表、存量数据、价格数据等等与企业经营相关的数据。对于财务数据的特征提取,主要是提取预设执行模型中需要进行数据输入的特征,如净收益额、特定产品单价等等内容。通过预设执行模型对历史财务特征数据和当前财务特征数据进行分析,可以生成目标年度行为数据,目标年度行为数据是指预测的目标企业在目标年度中所执行的主要行为,如提高或降低生产规模、前端市场扩充或萎缩、引入或减少外部投资等。本申请实施例通过上述技术方案,可以通过连续两个年度的财务数据拟真出企业在年度中所执行过的主要行为,一方面可以为企业在后续年度的决策提供依据,另一方面可以让企业对其竞争对手的分析提供可靠的参考。
在一种可能的实现方式中,所述预设执行模型包括残差模型和行为模拟模型;
将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据包括:
根据所述目标企业的企业类型获取所述目标企业在所述目标年度可能采取的商业和生产行为作为行为数据;
将多个所述行为数据进行数值组合形成多组综合行为数据;不同的综合行为数据之间至少存在一个行为数据对应的数值不同;
将所述历史财务特征数据和所述综合行为数据输入所述行为模拟模型获取对应不同的综合行为数据的多组预期财务特征数据;
将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据;
将所述基准财务特征数据对应的综合行为数据作为所述目标年度行为数据。
本申请实施例实施时,预设执行模型需要包括残差模型和行为模拟模型;其中行为模拟模型在模型库中需要对应不同的细分行业,而残差模型则可以采用统一的残差模型即可。考虑到模型训练过程中,如果将行为数据直接作为样本输出结果,训练过程是非常难以收敛的,因为行为数据往往是较为复杂的内容,无论通过神经网络模型还是随机森林模型,输出数据的维度过高会导致模型训练难以达到预期效果。所以在本申请实施例中,训练出的行为模拟模型的输入数据为行为数据和历史财务特征数据,输出数据为在当前年度执行了行为数据后的财务特征数据。
在本申请实施例中,需要先生成行为数据,为了保证行为数据的统一性,需要将行为数据都进行归一化处理,其属于现有技术,本申请实施例不多做复述,示例的,可以将所有的行为数据变为百分比数据,如外部投资增加15%等。二将行为数据进行数值组合,是为了模拟企业的行为,需要进行数值组合,本申请实施例中的数值组合是将每个行为数据都选出可能的数值,如外部投资增加1%、2%、3%;扩大生产规模5%、15%、20%等。然后进行组合形成大量的综合行为数据。应当理解的是,数值组合的方式可以根据企业类型进行选择,如冶钢行业中扩大生产规模的比例可以采用1%的数值间隔,而对于芯片加工企业中扩大生产规模的比例可以采用5%的数值间隔,以更准确的进行不同企业类型的表征。
将上述大量的综合行为数据配合历史财务特征数据输入到行为模拟模型,每个综合行为数据会生成一组预期财务特征数据,再通过残差模型将这些预期财务特征数据与当前财务特征数据进行比对,找出差异最小的预期财务特征数据对应的综合行为数据作为预估的目标年度行为数据。
在一种可能的实现方式中,将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据包括:
获取目标年度所述企业类型对应行业的经济环境数据作为当前经济数据,并获取目标年度的上一年度所述企业类型对应行业的经济环境数据作为历史经济数据;
根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据;
当将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型时,将新的当前财务特征数据作为所述当前财务特征数据输入所述残差模型。
本申请实施例实施时,由于实际使用过程中,企业的相关财务数据还会受到经济数据的影响,比如一些经济指标CPI、GDP等,以及一些行业指标行业成本增长、行业出口增长等。所以在进行残差模型的比对时,还可以根据经济数据的变化对财务特征数据进行修正,以提高检测的准确率。
在一种可能的实现方式中,根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据包括:
将所述当前财务特征数据划分为固定特征数据和变动特征数据;所述固定特征数据为受经济数据直接影响小于预设值的数据,所述变动特征数据为受经济数据直接影响大于或等于预设值的数据;
比较所述当前经济数据和所述历史经济数据,并选出差异大于阈值的数据项形成差异数据组;
根据所述差异数据组和所述变动特征数据之间的关联关系计算所述差异数据组中每个数据项对所述变动特征数据的影响因子;
根据所述影响因子对所述差异数据组进行加权修正所述变动特征数据;
将所述固定特征数据和修正后的所述变动特征数据作为新的当前财务特征数据。
本申请实施例实施时,为了减少修正数据的维度,将财务特征数据划分为固定特征数据和变动特征数据,固定特征数据是受经济数据直接影响较小的数据,而变动特征数据为受经济数据影响较大的数据。而对于经济数据来说,需要选出变动较大的数据项以进一步降低数据维度,再根据这些数据项对变动特征数据的影响,进行基于影响因子的加权计算完成修正。
在一种可能的实现方式中,所述行为模拟模型的获取包括:
获取同一个行业内多家企业在多年的财务数据和每个年度的行为数据;
根据所述财务数据和所述行为数据建立三元组;所述三元组的第一元素为企业在任意年度的财务数据,所述三元组的第二元素为企业在所述任意年度的行为数据,所述三元组的第三元素为企业在所述任意年度的下一年度的财务数据;
根据所述三元组中三个元素的对应关系建立聚类空间,并在所述聚类空间中将所有的三元组进行聚类分析;
提取聚类分析结果中占所有三元组数量最大的类别作为基准类别,并提取所述基准类别的中心作为基准核心;
根据所述基准核心对所有的三元组进行二次聚类;
重复提取基准核心和二次聚类,直至所述聚类分析的基准类别中三元组的数量占所有三元组数量的比例超过预设值时,将当前占所有三元组数量最大的类别作为样本类别;
将所述样本类别的三元组的第一元素和第二元素作为输入数据,将所述样本类别的三元组的第三元素作为输出数据训练神经网络模型形成所述行为模拟模型。
本申请实施例实施时,进行行为模拟模型的生成时,由于样本数据的复杂性,需要寻找出三个数据关联性最强的三元组作为学习样本,具体的技术方案采用聚类进行。其中需要以三个元素的对应关系建立聚类空间和相应的核函数,然后进行一次聚类分析,然后选取占比最大的类别的中心点进行再次聚类,重复进行二次聚类,直至基准类别中三元组数量达到一定数量后将其作为样本进行模型训练。这样的方式可以保证训练的样本中,三元组中元素之间的关系具有较强的关联性,可以提高模型精度和模型收敛速度。
在一种可能的实现方式中,所述残差模型的获取包括:
根据多组财务特征数据构建财务特征数据中相同数据项之间的距离函数;所述距离函数采用余弦距离;
根据多个相同数据项对应的距离函数构建损失函数;所述损失函数的输出为不同财务特征数据之间的差异。
请参阅图2,基于同样的发明构思,还提供了一种财务数据分析***,包括:
获取单元,被配置为获取目标企业的企业类型,并从模型库中选取对应所述企业类型的执行模型作为预设执行模型;
特征提取单元,被配置为获取所述目标企业目标年度的财务数据并进行特征提取形成当前财务特征数据,并获取目标企业目标年度的上一年度的财务数据并进行特征提取形成历史财务特征数据;
执行单元,被配置为将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据。
在一种可能的实现方式中,所述预设执行模型包括残差模型和行为模拟模型;
所述执行单元还被配置为:
根据所述目标企业的企业类型获取所述目标企业在所述目标年度可能采取的商业和生产行为作为行为数据;
将多个所述行为数据进行数值组合形成多组综合行为数据;不同的综合行为数据之间至少存在一个行为数据对应的数值不同;
将所述历史财务特征数据和所述综合行为数据输入所述行为模拟模型获取对应不同的综合行为数据的多组预期财务特征数据;
将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据;
将所述基准财务特征数据对应的综合行为数据作为所述目标年度行为数据。
在一种可能的实现方式中,所述执行单元还被配置为:
获取目标年度所述企业类型对应行业的经济环境数据作为当前经济数据,并获取目标年度的上一年度所述企业类型对应行业的经济环境数据作为历史经济数据;
根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据;
当将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型时,将新的当前财务特征数据作为所述当前财务特征数据输入所述残差模型。
在一种可能的实现方式中,所述执行单元还被配置为:
将所述当前财务特征数据划分为固定特征数据和变动特征数据;所述固定特征数据为受经济数据直接影响小于预设值的数据,所述变动特征数据为受经济数据直接影响大于或等于预设值的数据;
比较所述当前经济数据和所述历史经济数据,并选出差异大于阈值的数据项形成差异数据组;
根据所述差异数据组和所述变动特征数据之间的关联关系计算所述差异数据组中每个数据项对所述变动特征数据的影响因子;
根据所述影响因子对所述差异数据组进行加权修正所述变动特征数据;
将所述固定特征数据和修正后的所述变动特征数据作为新的当前财务特征数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显然本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网格设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种财务数据分析方法,其特征在于,包括:
获取目标企业的企业类型,并从模型库中选取对应所述企业类型的执行模型作为预设执行模型;
获取所述目标企业目标年度的财务数据并进行特征提取形成当前财务特征数据,并获取目标企业目标年度的上一年度的财务数据并进行特征提取形成历史财务特征数据;
将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据;
所述预设执行模型包括残差模型和行为模拟模型;
将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据包括:
根据所述目标企业的企业类型获取所述目标企业在所述目标年度可能采取的商业和生产行为作为行为数据;
将多个所述行为数据进行数值组合形成多组综合行为数据;不同的综合行为数据之间至少存在一个行为数据对应的数值不同;
将所述历史财务特征数据和所述综合行为数据输入所述行为模拟模型获取对应不同的综合行为数据的多组预期财务特征数据;
将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据;
将所述基准财务特征数据对应的综合行为数据作为所述目标年度行为数据;
所述行为模拟模型的获取包括:
获取同一个行业内多家企业在多年的财务数据和每个年度的行为数据;
根据所述财务数据和所述行为数据建立三元组;所述三元组的第一元素为企业在任意年度的财务数据,所述三元组的第二元素为企业在所述任意年度的行为数据,所述三元组的第三元素为企业在所述任意年度的下一年度的财务数据;
根据所述三元组中三个元素的对应关系建立聚类空间,并在所述聚类空间中将所有的三元组进行聚类分析;
提取聚类分析结果中占所有三元组数量最大的类别作为基准类别,并提取所述基准类别的中心作为基准核心;
根据所述基准核心对所有的三元组进行二次聚类;
重复提取基准核心和二次聚类,直至所述基准类别中三元组的数量占所有三元组数量的比例超过预设值时,将当前占所有三元组数量最大的类别作为样本类别;
将所述样本类别的三元组的第一元素和第二元素作为输入数据,将所述样本类别的三元组的第三元素作为输出数据训练神经网络模型形成所述行为模拟模型;
所述残差模型的获取包括:
根据多组财务特征数据构建财务特征数据中相同数据项之间的距离函数;所述距离函数采用余弦距离;
根据多个相同数据项对应的距离函数构建损失函数;所述损失函数的输出为不同财务特征数据之间的差异。
2.根据权利要求1所述的一种财务数据分析方法,其特征在于,将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据包括:
获取目标年度所述企业类型对应行业的经济环境数据作为当前经济数据,并获取目标年度的上一年度所述企业类型对应行业的经济环境数据作为历史经济数据;
根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据;
当将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型时,将新的当前财务特征数据作为所述当前财务特征数据输入所述残差模型。
3.根据权利要求2所述的一种财务数据分析方法,其特征在于,根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据包括:
将所述当前财务特征数据划分为固定特征数据和变动特征数据;所述固定特征数据为受经济数据直接影响小于预设值的数据,所述变动特征数据为受经济数据直接影响大于或等于预设值的数据;
比较所述当前经济数据和所述历史经济数据,并选出差异大于阈值的数据项形成差异数据组;
根据所述差异数据组和所述变动特征数据之间的关联关系计算所述差异数据组中每个数据项对所述变动特征数据的影响因子;
根据所述影响因子对所述差异数据组进行加权修正所述变动特征数据;
将所述固定特征数据和修正后的所述变动特征数据作为新的当前财务特征数据。
4.使用权利要求1~3任意一项所述方法的一种财务数据分析***,其特征在于,包括:
获取单元,被配置为获取目标企业的企业类型,并从模型库中选取对应所述企业类型的执行模型作为预设执行模型;
特征提取单元,被配置为获取所述目标企业目标年度的财务数据并进行特征提取形成当前财务特征数据,并获取目标企业目标年度的上一年度的财务数据并进行特征提取形成历史财务特征数据;
执行单元,被配置为将所述历史财务特征数据和所述当前财务特征数据输入所述预设执行模型获取所述预设执行模型的输出数据作为目标年度行为数据。
5.根据权利要求4所述的一种财务数据分析***,其特征在于,所述预设执行模型包括残差模型和行为模拟模型;
所述执行单元还被配置为:
根据所述目标企业的企业类型获取所述目标企业在所述目标年度可能采取的商业和生产行为作为行为数据;
将多个所述行为数据进行数值组合形成多组综合行为数据;不同的综合行为数据之间至少存在一个行为数据对应的数值不同;
将所述历史财务特征数据和所述综合行为数据输入所述行为模拟模型获取对应不同的综合行为数据的多组预期财务特征数据;
将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型,并计算出与所述当前财务特征数据差异最小的预期财务特征数据作为基准财务特征数据;
将所述基准财务特征数据对应的综合行为数据作为所述目标年度行为数据。
6.根据权利要求5所述的一种财务数据分析***,其特征在于,所述执行单元还被配置为:
获取目标年度所述企业类型对应行业的经济环境数据作为当前经济数据,并获取目标年度的上一年度所述企业类型对应行业的经济环境数据作为历史经济数据;
根据所述当前经济数据和所述历史经济数据将所述当前财务特征数据修正为新的当前财务特征数据;
当将多组预期财务特征数据和所述当前财务特征数据输入所述残差模型时,将新的当前财务特征数据作为所述当前财务特征数据输入所述残差模型。
7.根据权利要求6所述的一种财务数据分析***,其特征在于,所述执行单元还被配置为:
将所述当前财务特征数据划分为固定特征数据和变动特征数据;所述固定特征数据为受经济数据直接影响小于预设值的数据,所述变动特征数据为受经济数据直接影响大于或等于预设值的数据;
比较所述当前经济数据和所述历史经济数据,并选出差异大于阈值的数据项形成差异数据组;
根据所述差异数据组和所述变动特征数据之间的关联关系计算所述差异数据组中每个数据项对所述变动特征数据的影响因子;
根据所述影响因子对所述差异数据组进行加权修正所述变动特征数据;
将所述固定特征数据和修正后的所述变动特征数据作为新的当前财务特征数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310828436.9A CN116542801B (zh) | 2023-07-07 | 2023-07-07 | 一种财务数据分析方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310828436.9A CN116542801B (zh) | 2023-07-07 | 2023-07-07 | 一种财务数据分析方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116542801A CN116542801A (zh) | 2023-08-04 |
CN116542801B true CN116542801B (zh) | 2023-09-22 |
Family
ID=87456462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310828436.9A Active CN116542801B (zh) | 2023-07-07 | 2023-07-07 | 一种财务数据分析方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116542801B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084493A (zh) * | 2019-04-11 | 2019-08-02 | 企家有道网络技术(北京)有限公司 | 基于人工智能的企业诊断、预测方法及装置、服务器 |
CN110097216A (zh) * | 2019-04-11 | 2019-08-06 | 企家有道网络技术(北京)有限公司 | 用于企业发展的预测方法以及装置、服务器 |
WO2019196210A1 (zh) * | 2018-04-10 | 2019-10-17 | 平安科技(深圳)有限公司 | 数据分析方法、计算机可读存储介质、终端设备及装置 |
KR20200111518A (ko) * | 2019-03-19 | 2020-09-29 | 주식회사 포스코아이씨티 | 상거래데이터를 이용한 ai기반의 평가모델을 포함하는 기업의 채무상환능력 평가시스템 |
CN113269623A (zh) * | 2021-04-29 | 2021-08-17 | 朱雪松 | 一种企业财务分析方法及*** |
CN113962486A (zh) * | 2021-11-22 | 2022-01-21 | 中国建设银行股份有限公司 | 企业财务数据的预测方法、装置、电子设备和存储介质 |
CN114048436A (zh) * | 2021-11-11 | 2022-02-15 | 北京道口金科科技有限公司 | 一种预测企业财务数据模型构建方法及构建装置 |
CN114612208A (zh) * | 2022-04-22 | 2022-06-10 | 郑州升达经贸管理学院 | 一种财务数据处理*** |
CN116245670A (zh) * | 2023-05-12 | 2023-06-09 | 辽联(北京)数据科技开发有限公司 | 基于双标签模型处理财税数据的方法、装置、介质和设备 |
-
2023
- 2023-07-07 CN CN202310828436.9A patent/CN116542801B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019196210A1 (zh) * | 2018-04-10 | 2019-10-17 | 平安科技(深圳)有限公司 | 数据分析方法、计算机可读存储介质、终端设备及装置 |
KR20200111518A (ko) * | 2019-03-19 | 2020-09-29 | 주식회사 포스코아이씨티 | 상거래데이터를 이용한 ai기반의 평가모델을 포함하는 기업의 채무상환능력 평가시스템 |
CN110084493A (zh) * | 2019-04-11 | 2019-08-02 | 企家有道网络技术(北京)有限公司 | 基于人工智能的企业诊断、预测方法及装置、服务器 |
CN110097216A (zh) * | 2019-04-11 | 2019-08-06 | 企家有道网络技术(北京)有限公司 | 用于企业发展的预测方法以及装置、服务器 |
CN113269623A (zh) * | 2021-04-29 | 2021-08-17 | 朱雪松 | 一种企业财务分析方法及*** |
CN114048436A (zh) * | 2021-11-11 | 2022-02-15 | 北京道口金科科技有限公司 | 一种预测企业财务数据模型构建方法及构建装置 |
CN113962486A (zh) * | 2021-11-22 | 2022-01-21 | 中国建设银行股份有限公司 | 企业财务数据的预测方法、装置、电子设备和存储介质 |
CN114612208A (zh) * | 2022-04-22 | 2022-06-10 | 郑州升达经贸管理学院 | 一种财务数据处理*** |
CN116245670A (zh) * | 2023-05-12 | 2023-06-09 | 辽联(北京)数据科技开发有限公司 | 基于双标签模型处理财税数据的方法、装置、介质和设备 |
Non-Patent Citations (3)
Title |
---|
A Generalized Linear Mixed Model for Data Breaches and Its Application in Cyber Insurance;Meng Sun 等;《 Risks 》;第第10卷卷(第第12期期);1-23 * |
创新型中小企业危机预警模型算法改进研究;宋丽平 等;《科技与管理》;第16卷(第06期);96-100 * |
基于标准模型库的企业财务风险分析方法探析;何有世 等;《中国安全科学学报》;第14卷(第05期);28-31 * |
Also Published As
Publication number | Publication date |
---|---|
CN116542801A (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101983538B1 (ko) | 카테고리 비율들을 계산하기 위한 시스템들 및 방법들 | |
CN113535963B (zh) | 一种长文本事件抽取方法、装置、计算机设备及存储介质 | |
CN110852856A (zh) | 一种基于动态网络表征的***虚开识别方法 | |
Chen et al. | An alternative model for the analysis of detecting electronic industries earnings management using stepwise regression, random forest, and decision tree | |
CN111695938B (zh) | 产品推送方法及*** | |
CN112785377B (zh) | 基于数据分布的订单完工期预测模型构建方法及预测方法 | |
Golay et al. | Unsupervised feature selection based on the Morisita estimator of intrinsic dimension | |
Xu et al. | Novel key indicators selection method of financial fraud prediction model based on machine learning hybrid mode | |
CN110634060A (zh) | 一种用户信用风险的评估方法、***、装置及存储介质 | |
CN115063035A (zh) | 基于神经网络的客户评估方法、***、设备及存储介质 | |
Pan et al. | A sequential addressing subsampling method for massive data analysis under memory constraint | |
Zhang et al. | Can sentiment analysis help mimic decision-making process of loan granting? A novel credit risk evaluation approach using GMKL model | |
CN116542801B (zh) | 一种财务数据分析方法及*** | |
CN111046947A (zh) | 分类器的训练***及方法、异常样本的识别方法 | |
Jeyaraman et al. | Practical Machine Learning with R: Define, build, and evaluate machine learning models for real-world applications | |
Ting et al. | What is missing? Using data mining techniques with business cycle phases for predicting company financial crises | |
CN114626940A (zh) | 数据分析方法、装置及电子设备 | |
AlKhatib et al. | On the use of arabic tweets to predict stock market changes in the arab world | |
CN114693428A (zh) | 数据确定方法、装置、计算机可读存储介质及电子设备 | |
Siregar et al. | Classification data for direct marketing using deep learning | |
Li et al. | No stock is an island: Learning internal and relational attributes of stocks with contrastive learning | |
CN113744042A (zh) | 基于优化Boruta和XGBoost的信贷违约预测方法及*** | |
Kacar et al. | Price Rank Prediction of a Company by Utilizing Data Mining Methods on Financial Disclosures | |
Nirob et al. | Predicting Stock Price from Historical Data using LSTM Technique | |
CN113064944A (zh) | 数据的处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |