CN113554223A - 一种获得税收预测结果的方法、装置及电子设备 - Google Patents

一种获得税收预测结果的方法、装置及电子设备 Download PDF

Info

Publication number
CN113554223A
CN113554223A CN202110820897.2A CN202110820897A CN113554223A CN 113554223 A CN113554223 A CN 113554223A CN 202110820897 A CN202110820897 A CN 202110820897A CN 113554223 A CN113554223 A CN 113554223A
Authority
CN
China
Prior art keywords
features
training
feature
tax
feature group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110820897.2A
Other languages
English (en)
Inventor
刘振宇
刘芬
***
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN202110820897.2A priority Critical patent/CN113554223A/zh
Publication of CN113554223A publication Critical patent/CN113554223A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/10Tax strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Computational Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Technology Law (AREA)
  • Evolutionary Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)

Abstract

一种获得税收预测结果的方法、装置及电子设备,该方法包括:根据获取到的基础特征、生成特征、组合特征生成初始特征组,初始特征组经过预设规则进行筛选,得到训练特征组,将所述训练特征组输入指定训练模型,得到税收预测模型,在预测模型中输入税收的特征数据,得到预测结果。通过上述方法,将不同特征选择优势相互结合,筛选出大量无效特征,并删除无效特征,提高了预测结果的精度。

Description

一种获得税收预测结果的方法、装置及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种获得税收预测结果的方法、装置及电子设备。
背景技术
以往,对地区税收收入的预测主要是通过对重点税源进行调查,将数据进行整理汇总后完成税收估计,这种处理方法需要耗费大量人力并且缺乏对纳税整体的把握。由于纳税申报的延迟性等原因,税局通过汇总预测的方式往往无法及时获得企业或地区的税收情况因此需要通过税收收入预测模型完成宏观税收预测。
目前,在预测经济运行领域,采用的是灰色理论、生长曲线、ARMA模型、最小二乘模型,这些模型通过时间序列的方式对经济长期趋势有一定预测,但是,这些模型需要耗费大量人力数据处理,处理数据方式不完善,不能精准的预测结果;并且在数据处理过程中产生了大量的无效特征,降低了运行效率和识别的准确率。
发明内容
本申请提供了一种获得税收预测结果的方法、装置及电子设备,用以提高税收预测结果的精度,完成宏观税收预测,帮助各地政府了解本地区经济发展情况、制定地区财政预算。
第一方面,本申请提供了一种获得税收预测结果的方法,所述方法包括:
根据获取到的基础特征、生成特征、组合特征生成初始特征组;
按照预设规则对初始特征组中的特征进行筛选,得到训练特征组;
将所述训练特征组输入指定训练模型,得到税收预测模型;
根据所述税收预测模型中输入的税收特征数据,得到所述税收预测模型输出的税收预测结果。
在一种可能的设计中,在获得初始特征组前,包括:
对基础特征进行线性组合,获得生成特征;
生成特征和基础特征按照预设规则组合,获得组合特征。
在一种可能的设计中,按照预设规则对初始特征中的特征进行筛选,得到训练特征组,包括:
计算所述初始特征组中每个特征对应的方差值,将方差值小于第一阈值的特征进行删除,得到第一特征组;
计算所述第一特征组中关联特征之间的卡方检验值,确定出小于第二阈值的卡方检验值对应的特征,其中,所述关联特征为具有相同基础特征的多个特征;
将确定出的特征中非相同基础特征删除,得到所述训练特征组。
在一种可能的设计中,将训练特征组输入指定模型,得到税收预测模型,包括:
将训练特征组输入到第一训练模型中,对计算出的每个特征对应的权重值进行排序,删除权重值最小的特征,得到第一训练特征组;
分别将替换了特征值第一训练特征组输入到第二训练模型中,得到多个预测结果,将多个预测结果与实际结果进行比较得到多个差值,选出数值最大的差值,将最大差值对应的特征值替换原来的特征值,得到第二训练特征组;
根据预测结果对第二训练特征组的特征值进行调整,将调整后的第二训练特征组输入到第二训练模型中进行训练,得到预测模型。
第二方面,本申请提供了一种获得税收预测结果的装置,所述装置包括:
生成模块,用于根据获取到的基础特征、生成特征、组合特征生成初始特征组;
筛选模块,用于按照预设规则对初始特征组中的特征进行筛选,得到训练特征组;
获得模块,用于将所述训练特征组输入指定训练模型,得到税收预测模型;
处理模块,用于根据所述税收预测模型中输入的税收特征数据,得到所述税收预测模型输出的税收预测结果。
在一种可能的设计中,所述生成模块,具体用于对基础特征进行线性组合,获得生成特征;生成特征和基础特征按照预设规则组合,获得组合特征。
在一种可能的设计中,所述筛选模块,具体用于计算所述初始特征组中每个特征对应的方差值,将方差值小于第一阈值的特征进行删除,得到第一特征组;计算所述第一特征组中关联特征之间的卡方检验值,确定出小于第二阈值的卡方检验值对应的特征,其中,所述关联特征为具有相同基础特征的多个特征;将确定出的特征中非相同基础特征删除,得到所述训练特征组。
在一种可能的设计中,所述获得模块,具体用于将训练特征组输入到第一训练模型中,对计算出的每个特征对应的权重值进行排序,删除权重值最小的特征,得到第一训练特征组;分别将替换了特征值第一训练特征组输入到第二训练模型中,得到多个预测结果,将多个预测结果与实际结果进行比较得到多个差值,选出数值最大的差值,将最大差值对应的特征值替换原来的特征值,得到第二训练特征组;根据预测结果对第二训练特征组的特征值进行调整,将调整后的第二训练特征组输入到第二训练模型中进行训练,得到预测模型。
第三方面,本申请提供了一种电子设备,包括:
存储器,用于存放计算机程序;
处理器,用于执行所述存储器上所存放的计算机程序时,实现上述的一种获得税收预测结果的方法步骤。
第四方面,一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种获得税收预测结果的方法步骤。
上述第一方面至第四方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面或第一方面中的各种可能方案可以达到的技术效果说明,这里不再重复赘述。
附图说明
图1为本申请提供的一种获得税收预测结果的方法的流程图;
图2为本申请提供的一种获得税收预测结果的装置的结构示意图;
图3为本申请提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。方法实施例中的具体操作方法也可以应用于装置实施例或***实施例中。需要说明的是,在本申请的描述中“多个”理解为“至少两个”。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。A与B连接,可以表示:A与B直接连接和A与B通过C连接这两种情况。另外,在本申请的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
下面结合附图,对本申请实施例进行详细描述。
本申请实施例提供的获得税收预测结果的方法,用以提高税收预测结果的精度。其中,本申请实施例所述方法和装置基于同一技术构思,由于方法及装置所解决问题的原理相似,因此装置与方法的实施例可以相互参见,重复之处不再赘述。
参照图1,本申请提供了一种获得税收预测结果的方法,该方法可以提高税收预测结果的准确度,该方法的实现流程如下:
步骤S1:根据获取到的基础特征、生成特征、组合特征,生成初始特征组。
初始特征组由是由基础特征、生成特征、组合特征组成。
基础特征由各个与预测模型相关的信息单独组成,各个特征之间不具有线性关系,比如基础特征可以为:税额、利润等,基础特征也可以为a、b、c,特征a和特征b经过四则运算不能得到特征c。
生成特征:将各个基础特征进行线性组合,得到生成特征,比如生成特征可以为:税负率、税额/收入获得税负率、今年利润/去年利润获得同比增长率、(上月***销项税额-上月***进项税额)/上月***销项税额等。
组合特征由基础特征和生成特征按照以下公式进行组合的特征。
公式为:
Figure BDA0003171945250000051
其中k表示第k个组合特征,i表示输入X的第i维特征。Cki表示这个第i维度特征是否要参与第k个组合特征的构造。d表示由人工选取的需要组合的输入X的特征维度。
比如:初始特征组为{a、c、b/c、{a、b/c}、b/c、{a、c}},其中a、c为基础特征,b/c为生成特征,{a、b/c},{b/c、{a、c}}为组合特征。
步骤S2:按照预设规则对初始特征组进行筛选,得到训练特征组。
对于初始特征组,用方差选择法,计算各个特征对应的方差值,然后根据设定的方差阈值,删除方差值小于方差阈值的特征,得到第一特征组。
比如:初始特征组为{a、b、c、d、e},计算a、b、c、d、e每一个特征的方差,如果计算出的结果依次为1、3、6、8、2,设定的方差阈值为3,则删除a、e特征,剩下的第一特征组为{b、c、d}。
对于第一特征组,使用卡方检验的方式,计算第一特征组所有特征的卡方值,将得到的卡方值和设定的卡方阈值进行比较,对于小于阈值的特征组,删除非基础特征以外的特征,得到训练特征组。
比如:相关特征为{a/b、a/c、b/d},卡方检验值为{0.1,0.3,0.6},假设卡方检验预设值为0.5,此时a/b、a/c对应的卡方检验值低于预设值,删除非基础特征,基础特征为多组生成特征中共同特征以外的特征,则删除特征b、特征c,此时,剩下的特征组为{a、b/d}。
经过上述过程的筛选,筛选出大量的无效特征,并将无效特征进行删除,有利于提高预测模型推荐算法的精确度。
步骤S3:将训练特征组输入到指定模型,得到税收预测模型。
将训练特征组输入到线性回归预测模型中,计算训练特征组中每个特征的权重值,先进行四轮计算,使得到的结果更趋于实际值,在第五轮计算后,对每组特征值的权重值进行排序,删除最小权重值对应的特征,重复这个过程,直到剩下的特征数量与所需要的特征数量相等时停止,得到第一训练特征组。
比如:初始特征组为{A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P},放入线性回归模型中,计算每一个特征对应的权重值,经过四次计算,使计算结果靠近实际权重值,经过第五次计算,计算出来的权重值依次为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16,删除权重值最小的特征A,剩下的特征为{B、C、D、E、F、G、H、I、J、K、L、M、N、O、P},此时,特征数量为15个,需要的特征数量为15,此时,不再进行权重值的计算,得到第一训练特征组。
举例来说,通过多特征选择后的增值税税收预测选用如下15个特征作为自变量用于长短期记忆网络模型预测本月税收:1.上月***销项税额、2.上月***销项金额、3.上月***进项税额、4.上月***进项金额、5.(上月***销项税额-上月***进项税额)/上月***销项税额、6.环比***销项税额增长比例(上月***销项额/上上月***销项额)、7.环比***进项金额增长比例(上月***进项金额/上上月***进项金额)、8.同比***销项税额比例(上月***销项税额/去年同期***税额)、9.同比***进项金额比例(上月***进项金额/去年同期***进项金额)、10.申报上月销项税额、11.申报上月实际抵扣税额、12.申报上月应纳税额、13.去年同期应纳税额、14.实际上月净入库税额、15.去年同期净入库税额。
将第一训练特征组放入第二训练模型中,对第一训练特征组的特征值进行多次替换,分别计算出替换后的结果,将得到的预测结果与实际结果进行比较得到一系列差值,选出数据最大的差值,将最大差值所对应的特征值与原来的特征值进行替换,重复这个过程,遍历每一个特征值,得到第二训练特征组。
比如:第一训练特征组为{a、b、c、d},对应的特征值集合为{1、2、3、4},通过长短期记忆网络训练模型预测结果为8;用5、6、7替换a的特征值依次得到特征值集合{5、2、3、4}、{6、2、3、4}、{7、2、3、4},预测结果依次为10、11、12,与预测结果8相比,差值依次为2、3、4,最大差值为4,对应的特征值为7,用7替换掉原来的1;重复这个过程,遍历b、c、d特征,最后得到特征值集合为{7、5、6、9},生成第二训练特征组。
根据Softmax函数将第二训练特征组对应的一系列特征值,进行归一化处理,每一个特征值将得到一个归一化之后的概率,将归一化后的概率进行加权计算,并将加权计算后的结果反归一化获得最后的预测值。
比如:第二训练特征组为{2、3、4},归一化后得到{0.09,0.24,0.65},加权处理后,得到的权重依次为{0.1、0.2、0.4},计算加权平均数,得到最终的预测值为0.317。
经过上述过程的描述,进一步对无效特征组进行删除,留下需要的特征组,提高了预测结果的精度。
为了降低预测模型的过拟合的风险,并且避免训练预测效果好,实际预测效果差的问题,在本申请实施例中对第二训练特征组的特征值进行L2范数正则化处理,调整第二训练特征组中的特征值,然后使用调整特征值的第二训练特征组对模型进行训练,得到预测模型。
步骤S4:根据所述税收预测模型中输入的税收特征数据,得到所述税收预测模型输出的税收预测结果。
本申请使用平均绝对百分比误差(MAPE)作为评价标准,通过多个特征选择融合的长短期记忆网络税收预测模型预测的税收结果MAPE小于15%,比不使用特征筛选的方法MAPE降低了30%,比单独使用线性回归模型和长短期记忆网络模型的MAPE分别降低了85%和50%。
基于本申请所提供的方法,根据获取到的基础特征、生成特征、组合特征生成初始特征组,初始特征组经过预设规则进行筛选,得到训练特征组,将所述训练特征组输入指定训练模型,得到税收预测模型,在预测模型中输入税收的特征数据,得到预测结果,将不同特征选择优势相互结合,筛选出大量无效特征,并删除无效特征,从而提高了税务预测结果的准确性。
基于同一发明构思,本申请实施例中还提供了一种获得税收预测结果的装置,该获得税收预测结果的装置用于实现一种获得税收预测结果的方法的功能,提升预测结果的准确性,参照图2,所述装置包括:
生成模块201,用于根据获取到的基础特征、生成特征、组合特征生成初始特征组;
筛选模块202,用于按照预设规则对初始特征组中的特征进行筛选,得到训练特征组;
获得模块203,用于将所述训练特征组输入指定训练模型,得到税收预测模型;
处理模块204,用于根据所述税收预测模型中输入的税收特征数据,得到所述税收预测模型输出的税收预测结果。
在一种可能的设计中,所述生成模块201,具体用于对基础特征进行线性组合,获得生成特征;生成特征和基础特征按照一定规则进行组合,获得组合特征。
基于同一发明构思,本申请实施例中还提供了一种电子设备,所述电子设备可以实现前述一种获得税收预测结果的装置的功能,参考图3,所述电子设备包括:
至少一个处理器301,以及与至少一个处理器301连接的存储器302,本申请实施例中不限定处理器301与存储器302之间的具体连接介质,图3中是以处理器301和存储器302之间通过总线300连接为例。总线300在图3中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线300可以分为地址总线、数据总线、控制总线等,为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。或者,处理器301也可以称为控制器,对于名称不做限制。
在本申请实施例中,存储器302存储有可被至少一个处理器301执行的指令,至少一个处理器301通过执行存储器302存储的指令,可以执行前文论述的一种获得税收预测结果的方法。处理器301可以实现图3所示的装置中各个模块的功能。
其中,处理器301是该装置的控制中心,可以利用各种接口和线路连接整个该控制设备的各个部分,通过运行或执行存储在存储器302内的指令以及调用存储在存储器302内的数据,该装置的各种功能和处理数据,从而对该装置进行整体监控。
在一种可能的设计中,处理器301可包括一个或多个处理单元,处理器301可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器301中。在一些实施例中,处理器301和存储器302可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器301可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的一种获得税收预测结果的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器302可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器302是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器302还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
通过对处理器301进行设计编程,可以将前述实施例中介绍的一种获得税收预测结果的方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行图3所示的实施例的一种获得税收预测结果的方法的步骤。如何对处理器301进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
基于同一发明构思,本申请实施例还提供一种存储介质,该存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行前文论述的一种获得税收预测结果的方法。
在一些可能的实施方式中,本申请提供一种获得税收预测结果的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在装置上运行时,程序代码用于使该控制设备执行本说明书上述描述的根据本申请各种示例性实施方式的一种获得税收预测结果的方法中的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种获得税收预测结果的方法,其特征在于,所述方法包括:
根据获取到的基础特征、生成特征、组合特征生成初始特征组;
按照预设规则对初始特征组中的特征进行筛选,得到训练特征组;
将所述训练特征组输入指定训练模型,得到税收预测模型;
根据所述税收预测模型中输入的税收特征数据,得到所述税收预测模型输出的税收预测结果。
2.如权利要求1所述的方法,其特征在于,在获得初始特征组前,包括:
对基础特征进行线性组合,获得生成特征;
生成特征和基础特征按照预设规则组合,获得组合特征。
3.如权利要求1所述的方法,其特征在于,按照预设规则对初始特征中的特征进行筛选,得到训练特征组,包括:
计算所述初始特征组中每个特征对应的方差值,将方差值小于第一阈值的特征进行删除,得到第一特征组;
计算所述第一特征组中关联特征之间的卡方检验值,确定出小于第二阈值的卡方检验值对应的特征,其中,所述关联特征为具有相同基础特征的多个特征;
将确定出的特征中非相同基础特征删除,得到所述训练特征组。
4.如权利要求1所述的方法,其特征在于,将训练特征组输入指定模型,得到税收预测模型,包括:
将训练特征组输入到第一训练模型中,对计算出的每个特征对应的权重值进行排序,删除权重值最小的特征,得到第一训练特征组;
分别将替换了特征值的第一训练特征组输入到第二训练模型中,得到多个预测结果,将多个预测结果与实际结果进行比较得到多个差值,选出数值最大的差值,将最大差值对应的特征值替换原来的特征值,得到第二训练特征组;
根据预测结果对第二训练特征组的特征值进行调整,将调整后的第二训练特征组输入到第二训练模型中进行训练,得到预测模型。
5.一种获得税收预测结果的装置,其特征在于,所述装置包括:
生成模块,用于根据获取到的基础特征、生成特征、组合特征生成初始特征组;
筛选模块,用于按照预设规则对初始特征组中的特征进行筛选,得到训练特征组;
获得模块,用于将所述训练特征组输入指定训练模型,得到税收预测模型;
处理模块,用于根据所述税收预测模型中输入的税收特征数据,得到所述税收预测模型输出的税收预测结果。
6.权利要求5所述的装置,其特征在于,所诉生成模块,具体用于对基础特征进行线性组合,获得生成特征;生成特征和基础特征按照预设规则组合,获得组合特征。
7.权利要求5所述的装置,其特征在于,所诉筛选模块,具体用于计算所述初始特征组中每个特征对应的方差值,将方差值小于第一阈值的特征进行删除,得到第一特征组;计算所述第一特征组中关联特征之间的卡方检验值,确定出小于第二阈值的卡方检验值对应的特征,其中,所述关联特征为具有相同基础特征的多个特征;将确定出的特征中非相同基础特征删除,得到所述训练特征组。
8.利要求5所述装置,其特征在于,所诉获得模块,具体用于将训练特征组输入到第一训练模型中,对计算出的每个特征对应的权重值进行排序,删除权重值最小的特征,得到第一训练特征组;分别将替换了特征值的第一训练特征组输入到第二训练模型中,得到多个预测结果,将多个预测结果与实际结果进行比较得到多个差值,选出数值最大的差值,将最大差值对应的特征值替换原来的特征值,得到第二训练特征组;根据预测结果对第二训练特征组的特征值进行调整,将调整后的第二训练特征组输入到第二训练模型中进行训练,得到预测模型。
9.一种电子设备,其特征在于,包括:
存储器,用于存放计算机程序;
处理器,用于执行所述存储器上所存放的计算机程序时,实现权利要求1-4中任一项所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一项所述的方法步骤。
CN202110820897.2A 2021-07-20 2021-07-20 一种获得税收预测结果的方法、装置及电子设备 Pending CN113554223A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110820897.2A CN113554223A (zh) 2021-07-20 2021-07-20 一种获得税收预测结果的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110820897.2A CN113554223A (zh) 2021-07-20 2021-07-20 一种获得税收预测结果的方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN113554223A true CN113554223A (zh) 2021-10-26

Family

ID=78103526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110820897.2A Pending CN113554223A (zh) 2021-07-20 2021-07-20 一种获得税收预测结果的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113554223A (zh)

Similar Documents

Publication Publication Date Title
CN106251174A (zh) 信息推荐方法及装置
CN105446988B (zh) 预测类别的方法和装置
CN107885796A (zh) 信息推荐方法及装置、设备
CN111080360B (zh) 行为预测方法、模型训练方法、装置、服务器及存储介质
US11087344B2 (en) Method and system for predicting and indexing real estate demand and pricing
CN111401940A (zh) 特征预测方法、装置、电子设备及存储介质
CN110688433B (zh) 一种基于路径的特征生成方法及装置
CN115391561A (zh) 图网络数据集的处理方法、装置、电子设备、程序及介质
CN113205230A (zh) 基于模型集合的数据预测方法、装置、设备及存储介质
CN112365156A (zh) 一种数据处理方法、数据处理装置、终端及存储介质
CN113837783A (zh) 时间序列模型参数优化方法、装置、计算机设备
CN116977091A (zh) 个股投资组合的确定方法、装置、电子设备及可读存储介质
WO2022222230A1 (zh) 基于机器学习的指标预测方法、装置、设备及存储介质
CN113554223A (zh) 一种获得税收预测结果的方法、装置及电子设备
CN113837782B (zh) 时间序列模型的周期项参数优化方法、装置、计算机设备
CN111984637B (zh) 数据建模中的缺失值处理方法和装置、设备及存储介质
CN113850427A (zh) 时间序列的预测方法和电子设备,及计算机存储介质
CN114418776A (zh) 一种数据处理方法、装置、终端设备及介质
CN110264306B (zh) 基于大数据的产品推荐方法、装置、服务器及介质
CN112232945A (zh) 一种确定个人客户授信的方法及装置
CN112668784A (zh) 基于大数据的区域宏观经济预测模型及方法
CN111160929A (zh) 一种客户类型的确定方法及装置
CN111563548B (zh) 一种基于强化学习的数据预处理方法、***及相关设备
CN113837183B (zh) 基于实时挖掘的多阶段凭证智能生成方法、***及介质
CN114066491A (zh) 基于多周期的预测总销量确定物品补货策略的方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination