CN117422573A

CN117422573A - 基于动态神经网络的财税数据预测方法及***

Info

Publication number: CN117422573A
Application number: CN202311427892.9A
Authority: CN
Inventors: 庞宇雄; 龚禹铭; 庞智尹; 卢炜军
Original assignee: Guangzhou Jincai Zhilian Digital Technology Co ltd
Current assignee: Guangzhou Jincai Zhilian Digital Technology Co ltd
Priority date: 2023-10-30
Filing date: 2023-10-30
Publication date: 2024-01-19

Abstract

本发明提出了一种基于动态神经网络的财税数据预测方法及***，方法包括：采集财税样本数据进行数据预处理，创建财税数据集；创建动态神经网络模型，配置早退机制和跳跃机制，通过置信度准则提供分类决策；初始化动态神经网络模型并设定模型训练参数，调用财税数据集进行迭代，基于多步学习率策略和随机梯度下降法进行模型训练直至损失函数的曲线收敛；调用数据集作为输入，标准化处理输出的预测结果，根据预设的目标变量计算预测结果的准确率，进行预测结果的可视化展示。本发明通过动态神经网络配置早退机制和跳跃机制处理具有时序数据特点的财税数据，提高模型泛化能力，提升预测准确性，适用于复杂场景的财税数据分析和预测。

Description

基于动态神经网络的财税数据预测方法及***

技术领域

本发明涉及计算机技术领域，具体涉及一种基于动态神经网络的财税数据预测方法及***。

背景技术

在当前经济背景下，财税科技创新和智能化逐渐成为业界共识和企业的新挑战。在此背后需要大量合理结构化数据作为数据分析的支撑，财税与大数据的进一步紧密结合，将推动智慧税务改革的步伐，财税数据的分析可以帮助企业或个人更好地管理财务和税务，提高效率和收益，同时也是一个重要的决策支持工具。

财税数据分析通常采用机器学习模型进行风险预测同时提供解决办法，而机器学习模型性能取决于算法的参数选择和训练集，不同参数的选择和模型对于训练集的依赖使得训练过程中产生过拟合或欠拟合的问题，容易出现泛化能力不足的情况，从而导致模型的预测结果不准确，现有的机器学习模型在参数选择和训练集依赖上处于静态推理范式阶段，模型在完成训练后，深度网络的结构和参数在测试阶段无法满足参数和训练集动态变化的需求，严重限制了模型的表征能力、推理效率以及可解释性。

因此，亟需一种基于动态神经网络的财税数据预测方法，以解决上述模型性能受限的问题。

发明内容

针对现有技术的不足，本发明提出一种基于动态神经网络的财税数据预测方法及***。

本发明第一方面公开了一种基于动态神经网络的财税数据预测方法，包括：

S1:采集财税样本数据进行数据预处理，根据时间信息和财税信息的二维结构创建财税数据集，所述财税数据集包括数据训练集、数据验证集以及数据测试集；

S2：创建时间自适应动态神经网络模型，配置用于对所述样本数据进行分配计算的早退机制和跳跃机制，并通过置信度准则为所述早退机制和跳跃机制提供分类决策；

S3：初始化所述时间自适应动态神经网络模型并设定模型训练参数，调用所述财税数据集输入模型进行迭代，基于多步学习率策略和随机梯度下降法进行模型训练直至损失函数的曲线收敛；

S4：调用所述数据测试集作为训练好的时间自适应动态神经网络模型的输入，对输出数据测试集的预测结果进行标准化处理后，根据预设的目标变量计算所述数据测试集对应预测结果的准确率，通过目标变量的实际值与预测值的对比图进行预测结果的可视化展示。

在一个可选的实施例中，所述采集财税样本数据进行数据预处理包括：

S11：根据财务报表中包括的利润表、资产负债表以及现金流表采集财税样本数据，所述财税样本数据包括财务样本数据和税务样本数据；

S12：对采集的所述财税样本数据进行真实性检验，若样本数据同数据来源的原始数据未保持一致，则重新进行样本数据采样；

S13：将通过真实性检验的财税样本数据根据标准正态分布方法进行标准化处理，调整财税样本的数量级和权重；

S14：将标准化处理后的财税样本数据进行异常值处理，所述异常值处理包括：剔除重复数据、填充缺失数据以及转换数据类型。

在一个可选的实施例中，所述根据时间信息和财税信息的二维结构创建财税数据集包括：

S15：将每个样本数据以时间和财税信息的两个维度方向的二维结构进行财税数据集的创建，并将创建数据集中75％的数据集划分为用于模型训练的数据训练集，将数据集中15％的数据划分为数据验证集，最后将其余数据集作为用于模型测试的数据测试集。

在一个可选的实施例中，所述配置用于对所述样本数据进行分配计算的早退机制和跳跃机制包括：

S21：根据早退机制判断时序数据处理过程某一时刻更新的隐状态是否满足用于解决目标任务，若是，则提前终止运算，若否，则继续进行运算；

S22：根据跳跃机制在模型选择输入数据的前一时刻基于目标任务选择下一时刻输入模型数据的读取位置，所述读取位置包括数据训练集的空间采样位置和时间采样位置。

在一个可选的实施例中，所述置信度准则为模型时序数据处理中间过程估计预测的置信度，所述置信度通过SoftMax输出的最大元素表示，通过将估计预测的置信度同预设决策阈值进行比较，若置信度大于决策阈值，则判定模型能够通过早退机制提前结束运算和/或跳跃机制能够选择数据读取位置。

在一个可选的实施例中，所述初始化所述时间自适应动态神经网络模型并设定模型训练参数中，所述模型训练参数包括模型隐含层数、神经元数、时延系数、学习率以及迭代次数。

在一个可选的实施例中，所述基于多步学习率策略和随机梯度下降法进行模型训练直至损失函数的曲线收敛包括：

S31：将正则项作为约束项添加到所述时间自适应动态神经网络模型进行稀疏正则化，将模型训练目标变更为L＝L_task+γL_sparse，其中γL_sparse表示正则项，γ表示正则项系数。

本发明第二方面公开了一种基于动态神经网络的财税数据预测***，所述***包括：

数据采集模块,用于采集财税样本数据进行数据预处理，根据时间信息和财税信息的二维结构创建财税数据集，所述财税数据集包括数据训练集、数据验证集以及数据测试集；

模型创建模块，用于创建时间自适应动态神经网络模型，配置用于对所述样本数据进行分配计算的早退机制和跳跃机制，并通过置信度准则为所述早退机制和跳跃机制提供分类决策；

模型训练模块，用于初始化所述时间自适应动态神经网络模型并设定模型训练参数，调用所述财税数据集输入模型进行迭代，基于多步学习率策略和随机梯度下降法进行模型训练直至损失函数的曲线收敛；

模型预测模块，用于调用所述数据测试集作为训练好的时间自适应动态神经网络模型的输入，对输出数据测试集的预测结果进行标准化处理后，根据预设的目标变量计算所述数据测试集对应预测结果的准确率，通过目标变量的实际值与预测值的对比图进行预测结果的可视化展示。

本发明第三方面公开了一种基于动态神经网络的财税数据预测设备，包括：

至少一个处理器，以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如本发明第一方面公开的任一项所述的基于动态神经网络的财税数据预测方法。

本发明第四方面公开了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如本发明第一方面公开的任一项所述的基于动态神经网络的财税数据预测方法。

与现有技术相比，本发明具有以下优点：

本发明通过动态神经网络模型代替深度网络的静态推理范式，针对财税数具备时序数据中时间顺序关系的特点，能够更好捕捉数据中的演化规律，基于早退机制和跳跃机制自适应调整模型训练过程的网络结构和参数选择，模型能够适应不同的输入和任务，避免模型因参数选择问题和训练集数据的依赖导致训练过程发生过拟合以及欠拟合的问题，提高模型的泛化能力和预测结果的准确性，可适用于更复杂场景下财税数据的分析和预测，同时模型中预测准确度和计算成本的动态权衡，可以有效地节省网络调试成本，提高模型预测的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明基于动态神经网络的财税数据预测方法的流程图；

图2为本发明基于动态神经网络的财税数据预测***的示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行描述和说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。基于本申请提供的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

显而易见地，下面描述中的附图仅仅是本申请的一些示例或实施例，对于本领域的普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图将本申请应用于其他类似情景。此外，还可以理解的是，虽然这种开发过程中所作出的努力可能是复杂并且冗长的，然而对于与本申请公开的内容相关的本领域的普通技术人员而言，在本申请揭露的技术内容的基础上进行的一些设计，制造或者生产等变更只是常规的技术手段，不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是，本申请所描述的实施例在不冲突的情况下，可以与其它实施例相结合。

除非另作定义，本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制，可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形，意图在于覆盖不排他的包含；例如包含了一系列步骤或模块(单元)的过程、方法、***、产品或设备没有限定于已列出的步骤或单元，而是可以还包括没有列出的步骤或单元，或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电气的连接，不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象，不代表针对对象的特定排序。

实施例1

参见图1，本发明实施方式公开了一种基于动态神经网络的财税数据预测方法，包括：

需要说明的是，采集财税样本数据为财税数据相关的历史数据的收集和整理，通过财税样本数据进行分析和预测包括：

收入和支出分析，通过对历史记录的收入和支出数据进行分析，了解企业或个人的经济状况和趋势，并预测未来的收入和支出变化；

税务筹划分析，通过对税务数据的分析，帮助企业或个人合理规划税务策略，降低税收成本，提高资金利用效率；

财务预测分析，通过对财务数据的趋势分析和模型预测，预测企业或个人未来的财务状况和表现，为后续的决策制定提供依据；

经营效率分析，通过对财务数据和经营数据的比较分析，评估企业或个人的经营效率，找出潜在的优化方案，提高经营效益和竞争力。

需要说明的是，财税样本数据的采集可以通过多个数据来源获取，例如电子会计档案***，银行以及税务局等，需要确认获取的财税样本数据的真实性才能进行后续的财税数据分析和预测。

需要说明的是，财税样本数据中存在不同的参数，且不同参数间的数量级差别较大，若部分模型的输入数量级较大容易导致对应数据的权重调整量同样较大，在模型学***均值)/标准差的方式进行调整，使得后续的样本数据不影响模型的鲁棒性。

需要说明的是，动态神经网络可以按照不同输入自适应调整自身结构或者参数量，导致了精度、计算效率、自适应等方面的显著优势，而财务数据构建的时序数据在时间维度上具有较大的冗余性，因此需要动态神经网络模型针对不同时间位置的数据进行自适应计算，将模型计算量分配到目标任务的输入位置执行运算，而非目标任务的输入位置可以分配较少的计算量，可以知晓的是，目标任务与非目标任务之间可以通过等级排序划分。

需要说明的是，在静态神经网络模型中对于长度为Y的时序数据处理流程通常为迭代式地更新时序数据的隐状态，即可表示为：h_t＝F(x_t,h_t-1),t＝1,2,…,T，其中不同信息的输入存在任务贡献度不同的问题，若对于每个时刻的输入都采用相同复杂的处理方式将产生无法避免的冗余计算度，严重影响模型性能，而动态神经网络模型的设计可以将不同时刻的输入自适应地分配计算，基于任务贡献度不同选择不同复杂程度的计算方式，首先，构建“早退”机制，即在某一中间时刻，判断当前隐状态是否可以用于解决所需任务。如是，则提前终止。其次，建立动态“跳跃”机制，即在每一时刻，模型可以自适应地决定下一时刻输入模型的数据从何位置读取。

需要说明的是，动态神经网络模型具有可以在推理阶段来调整模型结构和参数的特点，亦或是根据目标任务自适应决定对于样本数据中时间位置和空间位置的运算，可以将置信度准则作为决策方式引入动态神经网络模型中，因为置信度准则可以用于具有早退机制的分类网络中，可以通过对比设定阈值为模型提供决策，是否在运算过程中提前终止运算并输出“简单”样本

需要说明的是，动态网络利用不可微函数做出离散决策，使其能够从输入中采样时间位置，然而这些函数不可以直接通过反向传播进行训练，因此需要采用梯度估计来近似不可微函数的梯度，进而实现反向传播，可以知晓的是，通过利用直通估计器(STE)直接启发式地复制关于随机输出的梯度作为关于Sigmoid自变量的梯度的估计器，可以解决不可为函数无法实现反向传播的问题。

需要说明的是，对于具备动态结构以及通过空间位置和时间位置进行采样的动态神经网络模型，在不添加额外约束项的前提下，模型可能会为了极小化训练误差，自适应模型将倾向于激活所有的计算模块以及采样样本数据的全部位置进行计算，这样会产生大量的冗余计算影响模型性能，因此需要在动态神经网络中添加一项正则项以鼓励稀疏度，正则项与模型的权重有关，通过最小化模型的权重值，使得模型更加稀疏。

需要说明的是，将测试数据输入已训练好的模型，输出测试集预测结果，然后对结果进行标准化还原。根据设定的目标变量，计算在各自测试集上的模型预测准确率，绘制目标变量实际值与预测值的曲线对比图，根据测试结果，在税收预测方面，动态神经网络能够根据历史数据和当前经济环境等因素，预测未来税收收入，在财务数据处理方面，动态神经网络能够自动地处理和分类大量的财务会计数据，提高会计处理效率和准确性。

如图2所示，本发明第二方面公开了一种基于动态神经网络的财税数据预测***，所述***包括：

至少一个处理器，以及，

与所述至少一个处理器通信连接的存储器；其中，

该计算机设备可以是终端，该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现基于动态神经网络的财税数据预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各通过基于动态神经网络的财税数据预测方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

或者，本发明上述模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、终端、或者网络设备等)执行本发明各个实施例方法的全部或部分。而前述的存储介质包括：移动存储设备、RAM、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于动态神经网络的财税数据预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于动态神经网络的财税数据预测方法，其特征在于，所述采集财税样本数据进行数据预处理包括：

3.根据权利要求1所述的基于动态神经网络的财税数据预测方法，其特征在于，所述根据时间信息和财税信息的二维结构创建财税数据集包括：

4.根据权利要求1所述的基于动态神经网络的财税数据预测方法，其特征在于，所述配置用于对所述样本数据进行分配计算的早退机制和跳跃机制包括：

5.根据权利要求4所述的基于动态神经网络的财税数据预测方法，其特征在于，所述置信度准则为模型时序数据处理中间过程估计预测的置信度，所述置信度通过SoftMax输出的最大元素表示，通过将估计预测的置信度同预设决策阈值进行比较，若置信度大于决策阈值，则判定模型能够通过早退机制提前结束运算和/或跳跃机制能够选择数据读取位置。

6.根据权利要求1所述的基于动态神经网络的财税数据预测方法，其特征在于，所述初始化所述时间自适应动态神经网络模型并设定模型训练参数中，所述模型训练参数包括模型隐含层数、神经元数、时延系数、学习率以及迭代次数。

7.根据权利要求1所述的基于动态神经网络的财税数据预测方法，其特征在于，所述基于多步学习率策略和随机梯度下降法进行模型训练直至损失函数的曲线收敛包括：

8.一种基于动态神经网络的财税数据预测***，其特征在于，所述***包括：

9.一种基于动态神经网络的财税数据预测设备，其特征在于，包括：

至少一个处理器，以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至7任一项所述的基于动态神经网络的财税数据预测方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的基于动态神经网络的财税数据预测方法。