CN109583682A - 企业财务造假风险的识别方法、装置以及计算机设备 - Google Patents

企业财务造假风险的识别方法、装置以及计算机设备 Download PDF

Info

Publication number
CN109583682A
CN109583682A CN201811184234.0A CN201811184234A CN109583682A CN 109583682 A CN109583682 A CN 109583682A CN 201811184234 A CN201811184234 A CN 201811184234A CN 109583682 A CN109583682 A CN 109583682A
Authority
CN
China
Prior art keywords
financial
data
sample
fraud
enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811184234.0A
Other languages
English (en)
Inventor
徐力
汪伟
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811184234.0A priority Critical patent/CN109583682A/zh
Publication of CN109583682A publication Critical patent/CN109583682A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种企业财务造假风险的识别方法、装置、计算机设备和存储介质。所述方法包括:获取待预测企业的财务数据,并根据财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据,并计算第一财务特征数据的同比增长率以及环比增长率;获取同行业企业的财务特征数据平均值,根据财务特征数据平均值以及第一财务特征数据获取第一财务特征数据的平均增长率;将第一财务特征数据、同比增长率、环比增长率以及平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据输出值得到待预测企业财务数据的造假概率。本方法基于机器学习实现企业财务造假风险的识别,提高企业财务造假风险的识别的效率。

Description

企业财务造假风险的识别方法、装置以及计算机设备
技术领域
本申请涉及数据处理技术领域,特别是涉及一种企业财务造假风险的识别方法、装置、计算机设备和存储介质。
背景技术
目前,对于企业财务造假的分析,主要基于财务专家多年的会计经验从企业的财务报表中判断出会计科目的异常,进而判断企业的财务报表中是否存在财务造假的嫌疑;在判断企业财务数据是否造假的过程中,往往需要对大量财务数据进行分析,且依赖于财务专家过往的经验进行判断,导致企业财务数据造假的判断效率低、可靠性差。
发明内容
基于此,有必要针对上述技术问题,提供一种企业财务造假风险的识别方法、装置、计算机设备和存储介质。
一种企业财务造假风险的识别方法,所述方法包括:
获取待预测企业的财务数据,并根据所述财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
根据所述第一特征指标以及所述第二财务特征数据计算所述第一财务特征数据的同比增长率以及环比增长率;
获取同行业企业的财务特征数据平均值,根据所述财务特征数据平均值以及所述第一财务特征数据获取所述第一财务特征数据的平均增长率;
将所述第一财务特征数据、所述同比增长率、所述环比增长率以及所述平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据所述输出值得到所述待预测企业财务数据的造假概率。
在其中一个实施例中,所述获取待预测企业的财务数据的步骤之前,还包括:
获取样本企业的原始财务数据,所述企业样本包括财务造假企业以及非财务造假企业;
从所述原始财务数据中获取各所述样本企业在多个单位时段内的第三财务特征数据,并获取所述第三财务特征数据的同比增长率、环比增长率以及平均增长率,生成所述样本企业的第一样本数据;
对所述样本企业中的财务造假企业的第一样本数据添加坏样本标签,对所述样本企业中的非财务造假企业的第一样本数据添加好样本标签,获得目标样本数据;
利用目标样本数据对预设的第一Xgboot模型进行有监督训练,得到第一财务造假预测模型。
在其中一个实施例中,所述获取样本企业的原始财务数据的步骤之后,还包括:
从所述原始财务数据中获取所述样本企业在多个单位时段内的财务指标数据;
对所述样本企业中的财务造假企业的财务指标数据添加坏样本标签,对所述样本企业中的非财务造假企业的财务指标数据添加好样本标签,获得第二样本数据;
将所述第二样本数据随机划分为训练样本数据以及测试样本数据;
利用所述训练样本数据对预设的第二Xgboot模型进行有监督训练,得到第二财务造假预测模型;
将所述测试样本数据输入至所述第二财务造假预测模型,获得所述测试样本数据的第一财务造假概率,根据所述第一财务造假概率计算所述第二财务造假预测模型第一误差率;
随机对所述测试样本数据的预选财务指标数据加入噪声,将加入噪声后的测试样本数据输入至所述第二财务造假预测模型,获得所述测试样本数据的第二财务造假概率,并根据所述第二财务造假概率计算所述第二财务造假预测模型第二误差率;
当所述第一误差率与所述第二误差率的差值大于预设阈值,则将所述预选财务指标数据选取为财务特征数据。
在其中一个实施例中,所述根据所述财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据的步骤,包括:
根据财务特征数据确定对应的会计科目;其中,所述财务特征数据包括所述第一财务特征数据以及所述第二财务特征数据;
从所述财务数据中读取所述会计科目下的目标财务数据;
根据所述目标财务数据计算所述财务特征数据。
在其中一个实施例中,所述得到所述待预测企业财务数据的造假概率的步骤之后,还包括:
根据所述财务造假概率确定所述待预测企业对应的风险等级,将所述风险等级确定所述待预测企业对应的风险分值。
一种企业财务造假风险的识别装置,所述装置包括:
财务特征数据获取模块,用于获取待预测企业的财务数据,并根据所述财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
第一增长率获取模型,用于根据所述第一特征指标以及所述第二财务特征数据计算所述第一财务特征数据的同比增长率以及环比增长率;
第二增长率获取模块,用于获取同行业企业的财务特征数据平均值,根据所述财务特征数据平均值以及所述第一财务特征数据获取所述第一财务特征数据的平均增长率;
造假概率获取模块,用于将所述第一财务特征数据、所述同比增长率、所述环比增长率以及所述平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据所述输出值得到所述待预测企业财务数据的造假概率。
在其中一个实施例中,所述装置还包括财务造假预测模型构建模块,用于获取样本企业的原始财务数据,所述企业样本包括财务造假企业以及非财务造假企业;从所述原始财务数据中获取各所述样本企业在多个单位时段内的第三财务特征数据,并获取所述第三财务特征数据的同比增长率、环比增长率以及平均增长率,生成所述样本企业的第一样本数据;对所述样本企业中的财务造假企业的第一样本数据添加坏样本标签,对所述样本企业中的非财务造假企业的第一样本数据添加好样本标签,获得目标样本数据;利用目标样本数据对预设的第一Xgboot模型进行有监督训练,得到第一财务造假预测模型。
在其中一个实施例中,财务特征数据获取模块用于根据财务特征数据确定对应的会计科目;其中,所述财务特征数据包括所述第一财务特征数据以及所述第二财务特征数据;从所述财务数据中读取所述会计科目下的目标财务数据;根据所述目标财务数据计算所述财务特征数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待预测企业的财务数据,并根据所述财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
根据所述第一特征指标以及所述第二财务特征数据计算所述第一财务特征数据的同比增长率以及环比增长率;
获取同行业企业的财务特征数据平均值,根据所述财务特征数据平均值以及所述第一财务特征数据获取所述第一财务特征数据的平均增长率;
将所述第一财务特征数据、所述同比增长率、所述环比增长率以及所述平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据所述输出值得到所述待预测企业财务数据的造假概率。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待预测企业的财务数据,并根据所述财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
根据所述第一特征指标以及所述第二财务特征数据计算所述第一财务特征数据的同比增长率以及环比增长率;
获取同行业企业的财务特征数据平均值,根据所述财务特征数据平均值以及所述第一财务特征数据获取所述第一财务特征数据的平均增长率;
将所述第一财务特征数据、所述同比增长率、所述环比增长率以及所述平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据所述输出值得到所述待预测企业财务数据的造假概率。
上述企业财务造假风险的识别方法、装置、计算机设备和存储介质,上述企业财务造假风险的识别方法中,通过从预设时间段内财务数据中获取反映待预测企业的总体经营与财务状况的财务特征数据以及这些财务特征数据的同比、环比、和行业平均值对比的比率,作为待预测企业的特征数据,以此分析待预测企业的财务造假概率,有效减少企业财务造假风险识别需要处理的数据量,提高企业财务数据造假的判断效率,同时通过加入财务特征数据的同比、环比以及和行业平均值对比的比率作为特征数据进行财务造假的分析因素,能够有效提高企业财务造假风险识别的准确率。
附图说明
图1为一个实施例中企业财务造假风险的识别方法的应用场景图;
图2为一个实施例中企业财务造假风险的识别方法的流程示意图;
图3为一个实施例中第一财务造假预测模型的构建方法的流程示意图;
图4为一个实施例中企业财务造假风险的识别装置的结构框图;
图5为另一个实施例中企业财务造假风险的识别装置的结构框图;
图6为又一个实施例中企业财务造假风险的识别装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的企业财务造假风险的识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104预先获取样本企业的历史财务数据,利用这些历史财务数据创建基于Xgboot模型的财务造假预测模型,在用户通过终端102将某一待预测企业的近期的财务数据发送至服务器104后,服务器104将根据从财务数据中提取出特征数据,输入至财务造假预测模型中,得到待预测企业财务数据的造假概率,并将该造假概率返回至终端102中,为用户提供直观的风险评判,辅助用户进行投资决策。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种企业财务造假风险的识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S210:获取待预测企业的财务数据,并根据财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据。
本步骤中,财务数据包括但不限于资产类财务数据、成本类财务数据、负债类财务数据以及损益类财务数据;可以将在财务数据造假时变化较大的财务数据作为财务特征数据,具体的,财务特征数据包括但不限于销售净利率、销售毛利率、资产净利率、历史特征指标、流动比率以及流动资产周转率;预设时间段内的第一财务特征数据可以是待预测企业近期单位时间段内的财务数据,单位时间段可以是一季度的时长,也可以是一个月的时长;以预设时间段为标准,历史时间段的第二财务特征数据可以包括往年同一单位时间段的财务数据以及上一个单位时间段的财务数据,例如,假设预设时间段内的第一财务特征数据为2018年6月份的财务特征数据,其历史时间段的第二财务特征数据包括2017年6月份的财务特征数据以及2018年5月份的财务特征数据;服务器获得待预测企业的财务数据后,从财务数据中获取不同单位时间段内的财务特征数据。
步骤S220:根据第一特征指标以及第二财务特征数据计算第一财务特征数据的同比增长率以及环比增长率。
具体的,服务器从财务数据中获得第一财务特征数据以及第二特征数据以后,根据第一财务特征数据以及往年同一单位时间段的第二财务特征数据计算第一财务特征数据的同比增长率,根据第一财务特征数据以及上一个单位时间段的第二财务特征数据计算第一财务特征数据的环比增长率。由于财务指标的突变和剧烈波动是财务造假开始或爆发的重要信号,计算第一财务特征数据的同比增长率以及环比增长率可以得到该财务特征数据随时间的变化趋势和比例,通过加入第一财务特征数据的同比增长率以及环比增长率作为判断财务数据造假风险的考虑因素中,可以有效提高企业财务数据造假的判断的准确率。
步骤S230:获取同行业企业的财务特征数据平均值,根据财务特征数据平均值以及第一财务特征数据获取第一财务特征数据的平均增长率。
本步骤中,服务器获取同行业企业的财务特征数据平均值,通过计算财务特征数据平均值以及第一财务特征数据之间的差值,根据差值与财务特征数据平均值的比值计算第一财务特征数据的平均增长率。计算第一财务特征数据与同行业企业的财务特征数据的平均值间的增长率,以获取待检测企业的财务特征数据与同行业企业的财务特征数据的差距,可以检测出远远高于同行业企业的平均水平的财务造假风险企业,将该增长率加入到财务数据造假风险的考虑因素中,可以提高企业财务数据造假的判断的准确率。
步骤S240:将第一财务特征数据、同比增长率、环比增长率以及平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据输出值得到待预测企业财务数据的造假概率。
本步骤中,第一财务造假预测模型可以由神经网络模型、随机森林模型、朴素贝叶斯模型中任意一种模型训练获得;服务器将第一财务特征数据、第一财务特征数据的同比增长率、第一财务特征数据的环比增长率以及第一财务特征数据的平均增长率作为特征数据,输入至该第一财务造假预测模型中,第一财务造假预测模型根据各个特征数据计算待预测企业的财务数据为造假财务数据的概率值,服务器将第一财务造假预测模型输出的概率值确定为在预设时间段内待预测企业的财务数据造假的概率。
上述企业财务造假风险的识别方法中,通过从预设时间段内财务数据中获取反映待预测企业的总体经营与财务状况的财务特征数据以及这些财务特征数据的同比、环比、和行业平均值对比的比率,作为待预测企业的特征数据,以此分析待预测企业的财务造假概率,有效减少企业财务造假风险识别需要处理的数据量,提高企业财务数据造假概率的获取效率,同时通过加入财务特征数据的同比、环比以及和行业平均值对比的比率作为特征数据进行财务造假的分析因素,能够有效提高企业财务造假风险识别的准确率。
在一个实施例中,如图3所示,图3为第一财务造假预测模型的构建方法的流程图;在获取待预测企业的财务数据的步骤之前,还包括:
步骤S310:获取样本企业的原始财务数据,企业样本包括财务造假企业以及非财务造假企业。
步骤S320:从原始财务数据中获取各样本企业在多个单位时段内的第三财务特征数据,并获取第三财务特征数据的同比增长率、环比增长率以及平均增长率,生成样本企业的第一样本数据。
步骤S330:对样本企业中的财务造假企业的第一样本数据添加坏样本标签,对样本企业中的非财务造假企业的第一样本数据添加好样本标签,获得目标样本数据。
步骤S340:利用目标样本数据对预设的第一Xgboot模型进行有监督训练,得到第一财务造假预测模型。
本实施例为财务造假预测模型的构建过程,服务器获取样本企业的原始财务数据,其中原始财务数据既包括财务造假企业的财务数据,又包括上市企业的财务数据,并从原始财务数据中获取各个样本企业的财务特征数据以及这些财务特征数据的同比、环比、和行业平均值对比的比率,作为各个样本企业对应的第一样本数据,即样本企业在一个单位时段内的财务特征数据及其同比、环比以及和行业平均值对比的增长率作为一个第一样本数据;然后通过对各个样本数据添加相应的坏样本标签或者好样本标签,生成目标样本数据;利用这些目标样本数据对Xgboot(Extreme Gradient Boosting)模型进行监督学习,得到第一财务造假预测模型;其中Xgboot模型是基于树的Boosting算法,在其优化目标函数中加了正则化项,利用Xgboot模型可以有效提高企业财务造假风险识别的准确率。
进一步的,在一个实施例中,获取样本企业的原始财务数据的步骤之后,还包括:从原始财务数据中获取样本企业在多个单位时段内的财务指标数据;对样本企业中的财务造假企业的财务指标数据添加坏样本标签,对样本企业中的非财务造假企业的财务指标数据添加好样本标签,获得第二样本数据;将第二样本数据随机划分为训练样本数据以及测试样本数据;利用训练样本数据对预设的第二Xgboot模型进行有监督训练,得到第二财务造假预测模型;将测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第一财务造假概率,根据第一财务造假概率计算第二财务造假预测模型第一误差率;随机对测试样本数据的预选财务指标数据加入噪声,将加入噪声后的测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第二财务造假概率,并根据第二财务造假概率计算第二财务造假预测模型第二误差率;当第一误差率与第二误差率的差值大于预设阈值,则将预选财务指标数据选取为财务特征数据。
本实施例中,对于从财务数据中提取到的财务特征数据可以通过Xgboost模型验证这些特征指标的有效性,从而选出在统计意义和经济意义上都能明显区别好样本以及坏样本的财务特征数据;具体的,服务器获得样本企业的原始财务数据以后,从原始财务数据中获取各个样本企业在多个单位时段内的财务指标数据,并根据样本企业的属性对这些财务指标数据添加对应的坏样本标签或好样本标签,以得到第二样本数据,即样本企业一个单位时段内的财务指标数据及其标签作为一个第二样本数据;服务器将第二样本数据分成训练样本数据以及测试样本数据,利用训练样本数据对Xgboot模型进行监督学习得到第二财务造假预测模型;将测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第一财务造假概率,并根据该概率获取测试样本数据所对应的预测标签,根据测试样本标签对应的预测标签以及预先添加的标签计算的第一误差率errA;随机的对测试样本数据的某一个的财务指标数据加入噪声干扰,利用加入噪声干扰后的测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第二财务造假概率,并根据该概率获取测试样本数据所对应的预测标签,根据测试样本标签对应的预测标签以及预先添加的标签计算的第一误差率errB;当(errA-errB)大于阈值,则将该财务指标选取为目标特征指标。
在一个实施例中,根据财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据的步骤,包括:根据财务特征数据确定对应的会计科目;其中,财务特征数据包括第一财务特征数据以及第二财务特征数据;从财务数据中读取会计科目下的目标财务数据;根据目标财务数据计算财务特征数据。
本实施例中,财务特征数据包括但不限于销售净利率、销售毛利率、资产净利率、历史特征指标、流动比率以及流动资产周转率等财务数据;具体的,财务特征数据可以利用财务数据中对应的会计科目的数据进行计算获得的;例如销售净利率=净利润/[(初期资产总额+期末资产总额)/2],则服务器可以读取财务数据中会计科目“净利润”、“初期资产总额”以及“期末资产总额”下的数据,计算财务特征数据销售净利率。在无法在待预测企业的财务数据中直接读取到财务特征数据时,可以根据对应的会计科目下的基础数据计算财务特征数据,避免财务特征数据的缺失导致企业财务造假风险识别准确率的下降。
在一个实施例中,根据输出值得到待预测企业财务数据的造假概率的步骤之后,还包括:根据所述财务造假概率确定所述待预测企业对应的风险等级,将所述风险等级确定所述待预测企业对应的风险分值。
本实施例中,服务器将待预测企业的财务造假概率量化为风险分值,从而实现对待预测企业财务状况的打分,为众多投资者提供目标企业的直观的风险评判,辅助投资决策。具体的,服务器可以将财务造假概率量化为1-10的分值,例如,当某一待预测企业的财务造假概率为1%至10%,则该待预测企业对应的风险等级为1级,其风险分值为1分,当某一待预测企业的财务造假概率为91%至100%,则该待预测企业对应的风险等级为10级,其风险分值为10分。通过对财务风险状况打分,可以为众多投资者提供待预测企业直观的风险评判,辅助投资决策。
应该理解的是,虽然图2以及图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2以及图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种企业财务造假风险的识别装置,包括:财务特征数据获取模块410、第一增长率获取模型420、第二增长率获取模块430和造假概率获取模块440,其中:
财务特征数据获取模块410,用于获取待预测企业的财务数据,并根据财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
第一增长率获取模型420,用于根据第一特征指标以及第二财务特征数据计算第一财务特征数据的同比增长率以及环比增长率;
第二增长率获取模块430,用于获取同行业企业的财务特征数据平均值,根据财务特征数据平均值以及第一财务特征数据获取第一财务特征数据的平均增长率;
造假概率获取模块440,用于将第一财务特征数据、同比增长率、环比增长率以及平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据输出值得到待预测企业财务数据的造假概率。
在一个实施例中,如图5所示,提供了一种企业财务造假风险的识别装置,企业财务造假风险的识别装置还包括财务造假预测模型构建模块450,用于获取样本企业的原始财务数据,企业样本包括财务造假企业以及非财务造假企业;从原始财务数据中获取各样本企业在多个单位时段内的第三财务特征数据,并获取第三财务特征数据的同比增长率、环比增长率以及平均增长率,生成样本企业的第一样本数据;对样本企业中的财务造假企业的第一样本数据添加坏样本标签,对样本企业中的非财务造假企业的第一样本数据添加好样本标签,获得目标样本数据;利用目标样本数据对预设的第一Xgboot模型进行有监督训练,得到第一财务造假预测模型。
在一个实施例中,财务特征数据获取模块410用于根据财务特征数据确定对应的会计科目;其中,财务特征数据包括第一财务特征数据以及第二财务特征数据;从财务数据中读取会计科目下的目标财务数据;根据目标财务数据计算财务特征数据。
在一个实施例中,财务造假预测模型构建模块450还用于从原始财务数据中获取样本企业在多个单位时段内的财务指标数据;对样本企业中的财务造假企业的财务指标数据添加坏样本标签,对样本企业中的非财务造假企业的财务指标数据添加好样本标签,获得第二样本数据;将第二样本数据随机划分为训练样本数据以及测试样本数据;利用训练样本数据对预设的第二Xgboot模型进行有监督训练,得到第二财务造假预测模型;将测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第一财务造假概率,根据第一财务造假概率计算第二财务造假预测模型第一误差率;随机对测试样本数据的预选财务指标数据加入噪声,将加入噪声后的测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第二财务造假概率,并根据第二财务造假概率计算第二财务造假预测模型第二误差率;当第一误差率与第二误差率的差值大于预设阈值,则将预选财务指标数据选取为财务特征数据。
在一个实施例中,如图6所示,提供了一种企业财务造假风险的识别装置,企业财务造假风险的识别装置还包括风险分值获取模块460,用于根据所述财务造假概率确定所述待预测企业对应的风险等级,将所述风险等级确定所述待预测企业对应的风险分值。
关于企业财务造假风险的识别装置的具体限定可以参见上文中对于企业财务造假风险的识别方法的限定,在此不再赘述。上述企业财务造假风险的识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储财务数据以及第一财务造假预测模型的参数等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种企业财务造假风险的识别方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待预测企业的财务数据,并根据财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
根据第一特征指标以及第二财务特征数据计算第一财务特征数据的同比增长率以及环比增长率;
获取同行业企业的财务特征数据平均值,根据财务特征数据平均值以及第一财务特征数据获取第一财务特征数据的平均增长率;
将第一财务特征数据、同比增长率、环比增长率以及平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据输出值得到待预测企业财务数据的造假概率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取样本企业的原始财务数据,企业样本包括财务造假企业以及非财务造假企业;从原始财务数据中获取各样本企业在多个单位时段内的第三财务特征数据,并获取第三财务特征数据的同比增长率、环比增长率以及平均增长率,生成样本企业的第一样本数据;对样本企业中的财务造假企业的第一样本数据添加坏样本标签,对样本企业中的非财务造假企业的第一样本数据添加好样本标签,获得目标样本数据;利用目标样本数据对预设的第一Xgboot模型进行有监督训练,得到第一财务造假预测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从原始财务数据中获取样本企业在多个单位时段内的财务指标数据;对样本企业中的财务造假企业的财务指标数据添加坏样本标签,对样本企业中的非财务造假企业的财务指标数据添加好样本标签,获得第二样本数据;将第二样本数据随机划分为训练样本数据以及测试样本数据;利用训练样本数据对预设的第二Xgboot模型进行有监督训练,得到第二财务造假预测模型;将测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第一财务造假概率,根据第一财务造假概率计算第二财务造假预测模型第一误差率;随机对测试样本数据的预选财务指标数据加入噪声,将加入噪声后的测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第二财务造假概率,并根据第二财务造假概率计算第二财务造假预测模型第二误差率;当第一误差率与第二误差率的差值大于预设阈值,则将预选财务指标数据选取为财务特征数据。
在一个实施例中,处理器执行计算机程序实现根据财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据的步骤时,具体实现以下步骤:根据财务特征数据确定对应的会计科目;其中,财务特征数据包括第一财务特征数据以及第二财务特征数据;从财务数据中读取会计科目下的目标财务数据;根据目标财务数据计算财务特征数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据所述财务造假概率确定所述待预测企业对应的风险等级,将所述风险等级确定所述待预测企业对应的风险分值。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待预测企业的财务数据,并根据财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
根据第一特征指标以及第二财务特征数据计算第一财务特征数据的同比增长率以及环比增长率;
获取同行业企业的财务特征数据平均值,根据财务特征数据平均值以及第一财务特征数据获取第一财务特征数据的平均增长率;
将第一财务特征数据、同比增长率、环比增长率以及平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据输出值得到待预测企业财务数据的造假概率。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取样本企业的原始财务数据,企业样本包括财务造假企业以及非财务造假企业;从原始财务数据中获取各样本企业在多个单位时段内的第三财务特征数据,并获取第三财务特征数据的同比增长率、环比增长率以及平均增长率,生成样本企业的第一样本数据;对样本企业中的财务造假企业的第一样本数据添加坏样本标签,对样本企业中的非财务造假企业的第一样本数据添加好样本标签,获得目标样本数据;利用目标样本数据对预设的第一Xgboot模型进行有监督训练,得到第一财务造假预测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从原始财务数据中获取样本企业在多个单位时段内的财务指标数据;对样本企业中的财务造假企业的财务指标数据添加坏样本标签,对样本企业中的非财务造假企业的财务指标数据添加好样本标签,获得第二样本数据;将第二样本数据随机划分为训练样本数据以及测试样本数据;利用训练样本数据对预设的第二Xgboot模型进行有监督训练,得到第二财务造假预测模型;将测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第一财务造假概率,根据第一财务造假概率计算第二财务造假预测模型第一误差率;随机对测试样本数据的预选财务指标数据加入噪声,将加入噪声后的测试样本数据输入至第二财务造假预测模型,获得测试样本数据的第二财务造假概率,并根据第二财务造假概率计算第二财务造假预测模型第二误差率;当第一误差率与第二误差率的差值大于预设阈值,则将预选财务指标数据选取为财务特征数据。
在一个实施例中,计算机程序被处理器执行实现根据财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据的步骤时,具体实现以下步骤:根据财务特征数据确定对应的会计科目;其中,财务特征数据包括第一财务特征数据以及第二财务特征数据;从财务数据中读取会计科目下的目标财务数据;根据目标财务数据计算财务特征数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据所述财务造假概率确定所述待预测企业对应的风险等级,将所述风险等级确定所述待预测企业对应的风险分值。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种企业财务造假风险的识别方法,所述方法包括:
获取待预测企业的财务数据,并根据所述财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
根据所述第一特征指标以及所述第二财务特征数据计算所述第一财务特征数据的同比增长率以及环比增长率;
获取同行业企业的财务特征数据平均值,根据所述财务特征数据平均值以及所述第一财务特征数据获取所述第一财务特征数据的平均增长率;
将所述第一财务特征数据、所述同比增长率、所述环比增长率以及所述平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据所述输出值得到所述待预测企业财务数据的造假概率。
2.根据权利要求1所述的方法,其特征在于,所述获取待预测企业的财务数据的步骤之前,还包括:
获取样本企业的原始财务数据,所述企业样本包括财务造假企业以及非财务造假企业;
从所述原始财务数据中获取各所述样本企业在多个单位时段内的第三财务特征数据,并获取所述第三财务特征数据的同比增长率、环比增长率以及平均增长率,生成所述样本企业的第一样本数据;
对所述样本企业中的财务造假企业的第一样本数据添加坏样本标签,对所述样本企业中的非财务造假企业的第一样本数据添加好样本标签,获得目标样本数据;
利用目标样本数据对预设的第一Xgboot模型进行有监督训练,得到第一财务造假预测模型。
3.根据权利要求2所述的方法,其特征在于,所述获取样本企业的原始财务数据的步骤之后,还包括:
从所述原始财务数据中获取所述样本企业在多个单位时段内的财务指标数据;
对所述样本企业中的财务造假企业的财务指标数据添加坏样本标签,对所述样本企业中的非财务造假企业的财务指标数据添加好样本标签,获得第二样本数据;
将所述第二样本数据随机划分为训练样本数据以及测试样本数据;
利用所述训练样本数据对预设的第二Xgboot模型进行有监督训练,得到第二财务造假预测模型;
将所述测试样本数据输入至所述第二财务造假预测模型,获得所述测试样本数据的第一财务造假概率,根据所述第一财务造假概率计算所述第二财务造假预测模型第一误差率;
随机对所述测试样本数据的预选财务指标数据加入噪声,将加入噪声后的测试样本数据输入至所述第二财务造假预测模型,获得所述测试样本数据的第二财务造假概率,并根据所述第二财务造假概率计算所述第二财务造假预测模型第二误差率;
当所述第一误差率与所述第二误差率的差值大于预设阈值,则将所述预选财务指标数据选取为财务特征数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据的步骤,包括:
根据财务特征数据确定对应的会计科目;其中,所述财务特征数据包括所述第一财务特征数据以及所述第二财务特征数据;
从所述财务数据中读取所述会计科目下的目标财务数据;
根据所述目标财务数据计算所述财务特征数据。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述得到所述待预测企业财务数据的造假概率的步骤之后,还包括:
根据所述财务造假概率确定所述待预测企业对应的风险等级,将所述风险等级确定所述待预测企业对应的风险分值。
6.一种企业财务造假风险的识别装置,其特征在于,所述装置包括:
财务特征数据获取模块,用于获取待预测企业的财务数据,并根据所述财务数据获取在预设时间段内的第一财务特征数据以及历史时间段内的第二财务特征数据;
第一增长率获取模型,用于根据所述第一特征指标以及所述第二财务特征数据计算所述第一财务特征数据的同比增长率以及环比增长率;
第二增长率获取模块,用于获取同行业企业的财务特征数据平均值,根据所述财务特征数据平均值以及所述第一财务特征数据获取所述第一财务特征数据的平均增长率;
造假概率获取模块,用于将所述第一财务特征数据、所述同比增长率、所述环比增长率以及所述平均增长率输入至预先构建的第一财务造假预测模型中获取输出值,根据所述输出值得到所述待预测企业财务数据的造假概率。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括财务造假预测模型构建模块,用于获取样本企业的原始财务数据,所述企业样本包括财务造假企业以及非财务造假企业;从所述原始财务数据中获取各所述样本企业在多个单位时段内的第三财务特征数据,并获取所述第三财务特征数据的同比增长率、环比增长率以及平均增长率,生成所述样本企业的第一样本数据;对所述样本企业中的财务造假企业的第一样本数据添加坏样本标签,对所述样本企业中的非财务造假企业的第一样本数据添加好样本标签,获得目标样本数据;利用目标样本数据对预设的第一Xgboot模型进行有监督训练,得到第一财务造假预测模型。
8.根据权利要求6所述的装置,其特征在于,财务特征数据获取模块用于根据财务特征数据确定对应的会计科目;其中,所述财务特征数据包括所述第一财务特征数据以及所述第二财务特征数据;从所述财务数据中读取所述会计科目下的目标财务数据;根据所述目标财务数据计算所述财务特征数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN201811184234.0A 2018-10-11 2018-10-11 企业财务造假风险的识别方法、装置以及计算机设备 Pending CN109583682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811184234.0A CN109583682A (zh) 2018-10-11 2018-10-11 企业财务造假风险的识别方法、装置以及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811184234.0A CN109583682A (zh) 2018-10-11 2018-10-11 企业财务造假风险的识别方法、装置以及计算机设备

Publications (1)

Publication Number Publication Date
CN109583682A true CN109583682A (zh) 2019-04-05

Family

ID=65919982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811184234.0A Pending CN109583682A (zh) 2018-10-11 2018-10-11 企业财务造假风险的识别方法、装置以及计算机设备

Country Status (1)

Country Link
CN (1) CN109583682A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543904A (zh) * 2019-08-26 2019-12-06 河北航天信息技术有限公司 一种基于贝叶斯的企业风险分类模型构建方法
CN111292007A (zh) * 2020-02-28 2020-06-16 中国工商银行股份有限公司 供应商财务风险预测方法及装置
CN111553597A (zh) * 2020-04-29 2020-08-18 支付宝(杭州)信息技术有限公司 一种对企业进行财务舞弊风险识别的方法及装置
CN111612610A (zh) * 2020-05-27 2020-09-01 深圳壹账通智能科技有限公司 风险预警方法及***、电子设备及存储介质
CN112150265A (zh) * 2020-10-15 2020-12-29 信阳农林学院 一种基于大数据的企业财务造假识别***
CN112801529A (zh) * 2021-02-05 2021-05-14 北京同邦卓益科技有限公司 财务数据分析方法及装置、电子设备及介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543904A (zh) * 2019-08-26 2019-12-06 河北航天信息技术有限公司 一种基于贝叶斯的企业风险分类模型构建方法
CN111292007A (zh) * 2020-02-28 2020-06-16 中国工商银行股份有限公司 供应商财务风险预测方法及装置
CN111553597A (zh) * 2020-04-29 2020-08-18 支付宝(杭州)信息技术有限公司 一种对企业进行财务舞弊风险识别的方法及装置
CN111612610A (zh) * 2020-05-27 2020-09-01 深圳壹账通智能科技有限公司 风险预警方法及***、电子设备及存储介质
CN112150265A (zh) * 2020-10-15 2020-12-29 信阳农林学院 一种基于大数据的企业财务造假识别***
CN112801529A (zh) * 2021-02-05 2021-05-14 北京同邦卓益科技有限公司 财务数据分析方法及装置、电子设备及介质
CN112801529B (zh) * 2021-02-05 2024-05-17 北京同邦卓益科技有限公司 财务数据分析方法及装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN109583682A (zh) 企业财务造假风险的识别方法、装置以及计算机设备
Kapinos et al. A top-down approach to stress-testing banks
López-Espinosa et al. Systemic risk and asymmetric responses in the financial industry
CN109636607A (zh) 基于模型部署的业务数据处理方法、装置和计算机设备
CN110490720A (zh) 财务数据分析预警方法、装置、计算机设备和存储介质
CN108509485A (zh) 数据的预处理方法、装置、计算机设备和存储介质
US20110153536A1 (en) Computer-Implemented Systems And Methods For Dynamic Model Switching Simulation Of Risk Factors
US8984022B1 (en) Automating growth and evaluation of segmentation trees
CN109615280A (zh) 员工数据处理方法、装置、计算机设备和存储介质
CN108182633A (zh) 贷款数据处理方法、装置、计算机设备和存储介质
CN110474871A (zh) 一种异常账号检测方法、装置、计算机设备及存储介质
CN110008119A (zh) 报表测试方法、装置、计算机设备和存储介质
CN110110884A (zh) 信息预测方法、装置、计算机设备和存储介质
Faria-e-Castro et al. Evergreening
CN110110886A (zh) 信息预测方法、装置、计算机设备和存储介质
CN109767226A (zh) 基于大数据的可疑交易统计视图生成方法和装置
CN111046947B (zh) 分类器的训练***及方法、异常样本的识别方法
CN111310931A (zh) 参数生成方法、装置、计算机设备及存储介质
US20230186385A1 (en) Computer-implemented system and method of facilitating artificial intelligence based lending strategies and business revenue management
Hamidieh Estimating the tail shape parameter from option prices
CN110135695A (zh) 资产分配风险评估方法、装置、计算机设备和存储介质
CN110232463A (zh) 信息预测方法、装置、计算机设备和存储介质
Nezakati et al. Do local banks credits to private sector and domestic direct investments affect FDI inflow?(Malaysia evidence)
CN114418776A (zh) 一种数据处理方法、装置、终端设备及介质
CN109389426A (zh) 商品价格层次的获取方法、***、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination