CN112783948A - 区域经济运行数据分析方法、设备及存储介质 - Google Patents

区域经济运行数据分析方法、设备及存储介质 Download PDF

Info

Publication number
CN112783948A
CN112783948A CN202110098182.0A CN202110098182A CN112783948A CN 112783948 A CN112783948 A CN 112783948A CN 202110098182 A CN202110098182 A CN 202110098182A CN 112783948 A CN112783948 A CN 112783948A
Authority
CN
China
Prior art keywords
data
index
regional economic
economic operation
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110098182.0A
Other languages
English (en)
Inventor
裴来辉
房辉
黄海阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Dimension Data Technology Co Ltd
Original Assignee
Shenzhen Dimension Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Dimension Data Technology Co Ltd filed Critical Shenzhen Dimension Data Technology Co Ltd
Priority to CN202110098182.0A priority Critical patent/CN112783948A/zh
Publication of CN112783948A publication Critical patent/CN112783948A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种区域经济运行数据分析方法、设备及存储介质。本发明的一种区域经济运行数据分析方法,包括,获取初始数据;对所述初始数据进行预处理,得到预处理数据;根据预设的审核策略对所述预处理数据进行审核,得到区域经济运行数据;基于所述区域经济运行数据进行分析,得到分析结果。本发明能够对数据进一步挖掘,统一评价标准,并提供了规范化的对区域经济运行数据进行分析的体系,更易于理解及使用。

Description

区域经济运行数据分析方法、设备及存储介质
技术领域
本发明涉及数据分析挖掘领域,尤其是涉及一种区域经济运行数据分析方法、设备及存储介质。
背景技术
目前,我国不同地区的区域经济运行相关指标数据较为相似,均涉及地区生产总值、产业增加值、固定资产投资、社会消费品零售总额、进出口贸易情况、能源消耗、研发投入等方面。但不同地区就经济运行情况进行分析时,存在两点主要问题:一是不同地区对于经济运行指标的评判标准、关注重点不一致,增加了地区间横向对比的难度;二是缺乏对指标进行二次开发,深入挖掘数据信息的***方法,难以体现数据价值;三是相关的分析方法主要聚焦于模型分析部分,对于数据预处理、审核、结果输出部分关注较少。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提供一种区域经济运行数据分析方法、设备及存储介质。
本发明解决其问题所采用的技术方案是:
本发明的第一方面,一种区域经济运行数据分析方法,包括:
获取初始数据;
对所述初始数据进行预处理,得到预处理数据;
根据预设的审核策略对所述预处理数据进行审核,得到区域经济运行数据;
基于所述区域经济运行数据进行分析,得到分析结果。
根据本发明的第一方面,所述对所述初始数据进行预处理,得到所述预处理数据,包括:
获取预设的预处理策略和所述初始数据中的初始指标数据;
根据所述预处理策略对所述初始指标数据进行预处理,得到所述预处理数据。
根据本发明的第一方面,所述根据预设的审核策略对所述预处理数据进行审核,得到所述区域经济运行数据,包括:
根据预设的审核策略对所述预处理数据进行审核,获取所述预处理数据的异常数据;
对所述异常数据进行标注处理,得到异常标识;
根据所述异常标识对所述异常数据进行修正,得到所述区域经济运行数据。
根据本发明的第一方面,所述根据所述异常标识对所述异常数据进行修正,得到所述区域经济运行数据,包括:
根据所述异常标识确定所述异常数据的异常类型;
根据所述异常类型获取运行指标数据在预设时间段所述异常数据的异常平均值;
基于所述异常平均值对所述异常数据进行修正,得到所述区域经济运行数据。
根据本发明的第一方面,所述基于对所述区域经济运行数据进行分析,得到分析结果,包括:
获取所述区域经济运行数据的多个运行指标数据;
根据所述多个运行指标数据得到所述多个运行指标数据对应的第一数据参数;
基于所述第一数据参数和预设的第一数据阈值进行比对;
若所述第一数据参数大于所述第一数据阈值,则基于所述第一数据参数进行预警。
根据本发明的第一方面,所述基于对所述区域经济运行数据进行分析,得到分析结果,包括:
获取所述区域经济运行数据的单个运行指标数据;
根据所述单个运行指标数据得到所述单个运行指标数据对应的第二数据参数;
根据所述第二数据参数进行预测分析,得到所述单个运行指标数据的预测数据参数;
基于所述预测数据参数和预设的第二数据阈值进行比对;
若所述预测数据参数大于所述第二数据阈值,则基于所述预测数据参数进行预警。
根据本发明的第一方面,所述基于对所述区域经济运行数据进行分析,得到分析结果,包括:
获取所述区域经济运行数据的多个运行指标数据;
获取所述多个运行指标数据的计算关系;
基于所述指标计算关系对所述多个运行指标数据进行计算处理,得到对应的第三数据参数。
根据本发明的第一方面,所述基于对所述区域经济运行数据进行分析,得到分析结果,包括:
获取所述区域经济运行数据的多个运行指标数据;
基于所述多个运行指标数据获取第一映射指标数据和第二映射指标数据,所述第一映射指标数据包括所述多个运行指标数据,所述第二映射指标数据包括单个运行指标数据;
对所述第一映射指标数据和所述第二映射指标数据分别进行标准化处理;
获取标准化处理后的所述第一映射指标数据与所述第二映射指标数据的映射关系。
本发明的第二方面,一种区域经济运行数据分析设备,包括:
处理器;
存储器,用于存储可执行程序;
当所述可执行程序被所述处理器执行时,使得一种区域经济运行数据分析设备实现如本发明第一方面所述的一种区域经济运行数据分析方法。
本发明的第三方面,一种存储介质,所述存储介质存储有可执行指令,可执行指令能被计算机执行,使所述计算机执行如本发明第一方面所述的一种区域经济运行数据分析方法。
上述一种区域经济运行数据分析方法、设备及存储介质,至少具有以下有益效果:本发明采用描述统计的方式规范化经济运行指标的描述及评价标准,易于不同地区间的横向比较;并且引入经典经济指数、数学模型等,以此对现有数据更进一步开展分析,发掘数据之间的内部联系、表现良好的指标及表现较差的指标,增加区域经济运行数据观测维度,为管理者发现问题和决策部署提供数据支撑;通过构建区域经济运行分析预警方法体系,规范化从原始数据录入阶段到分析结果生成阶段的全流程,更易于理解及使用,以统一体系就不同区域的经济运行势态开展分析,令不同区域间的经济运行势态具备可比性,对于不同区域提供具有参考意义的分析体系。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
下面结合附图和实施例对本发明做进一步的说明,其中:
图1为本发明提供的区域经济运行数据分析方法的一具体流程示意图;
图2为本发明提供的区域经济运行数据分析方法中步骤S200的一具体流程示意图;
图3为本发明提供的区域经济运行数据分析方法中步骤S300的一具体流程示意图;
图4为本发明提供的区域经济运行数据分析方法中步骤S400的第一具体流程示意图;
图5为本发明提供的区域经济运行数据分析方法中步骤S400的第二具体流程示意图;
图6为本发明提供的区域经济运行数据分析方法中步骤S400的第三具体流程示意图;
图7为本发明提供的区域经济运行数据分析方法中步骤S400的第四具体流程示意图;
图8为本发明提供的区域经济运行数据分析方法的一具体应用实例示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个以上,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
本发明的描述中,参考术语“一个实施例”的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
参考图1,根据本发明的实施例,提供了一种区域经济运行数据分析方法,包括以下步骤:
S100,获取初始数据;
S200,对所述初始数据进行预处理,得到预处理数据;
S300,根据预设的审核策略对所述预处理数据进行审核,得到区域经济运行数据;
S400,基于所述区域经济运行数据进行分析,得到分析结果。
在步骤S100中,通过编写的代码指令文件采集并获取初始数据,其中初始数据为预先准备分析的任一地区在一定时间段内的多个经济指标所对应的指标数据;获取的初始数据可以基于月度、季度或年度等时间段周期进行获取;初始数据可以根据重要程度不同进行分类,分为必要指标数据和非必要指标数据,其中必要指标数据用于进行指标数据的基本情况分析、指数测算、发展情况分析、影响效应分析,例如必要指标数据包括地区生产总值、规模以上工业各行业总产值、规模以上各行业企业增加值及从业人数,非必要指标数据用于继续基本情况分析,例如非必要指标数据包括固定资产投资总额、社会消费品零售总额、工业企业综合能耗、规模以上各行业企业数量、营业收入、营业利润、研发经费支出。其中,指标数据的基本情况分析是指对选定的多个指标数据进行计算,得出指标分析结果;指标数据的发展情况分析指,选定单个指标数据,计算它的当期值,并根据ARIMA(自回归求和移动平均)模型,对指标数据未来走势进行预测,得出预测分析结果;指标数据的指数测算指选定多个指标数据,通过指标间的映射关系进行计算,得到新的指标数据,即指数测算结果;指标数据的影响效应分析指选定多个指标数据为自变量,单个指标数据为因变量,并通过线性回归、逻辑回归、决策树模型对指标数据进行分析,得到指标数据变量间不同影响结果;实际应用中,指标数据所对应的经济指标可以根据实际分析需求进行选用,本申请实施例不做特定的选用。
在步骤S200中,对初始数据进行预处理,得到预处理数据,其中预处理是指在主要的处理以前对数据进行的一些处理,对所获取的数据进行分类或分组前所做的审核、筛选、排序等必要的处理;预处理数据即初始数据通过上述预处理后获取的指标数据。
在一些实施例中,参考图2,步骤S200具体还包括步骤:
S210,获取预设的预处理策略和初始数据中的初始指标数据;
S220,根据预处理策略对初始指标数据进行预处理,得到预处理数据。
在步骤S210中,预处理策略即根据指标数据之间的映射关系对指标数据进行处理,其中预处理方法包括但不限于:数据清理,数据集成,数据变换,数据归约;初始指标数据为在步骤S100中所表述的初始数据中的必要指标数据和非必要指标数据。
在步骤S220中,根据预处理策略对初始指标数据进行预处理,在一些实施方式中,主要通过对两个指标数据之间的比率进行简单计算,得到对应的新的指标数据,即得到预处理数据。在实际应用中,为了方便对预处理数据汇集及管理,可将根据预处理策略进行预处理后的预处理数据存储在数据库中,该数据库可定义为基本数据库。
在一些实施方式中,本申请实施例中所提到的根据预处理策略对初始指标数据进行预处理,具体可以通过对两个指标数据之间的比率进行简单计算,以初始指标数据包括营业利润、营业收入、研发经费支出、营业收入、工业企业综合能耗(吨标准煤)、工业增加值(万元)、规模以上各行业经济指标、规模以上各行业企业数量、规模以上各行业从业人数为例,具体预处理如下包括:
营业利润/营业收入=营业利润率;
研发经费支出/营业收入=研发投入强度;
工业企业综合能耗(吨标准煤)/工业增加值(万元)=万元增加值综合能耗;
规模以上各行业经济指标/规模以上各行业企业数量=规模以上各行业经济指标户均值;
规模以上各行业经济指标/规模以上各行业从业人数=规模以上各行业经济指标人均值。
在步骤S300中,根据预设的审核策略对预处理数据进行审核,得到区域经济运行数据,其中审核是指对预处理数据从完整性和准确性进行审核,具体为:
完整性审核是指对预处理数据是否完整进行审核,例如预处理数据是否遗漏或缺失。
准确性审核是指对经过预处理的指标数据是否准确进行审核,例如指标数据之间的关系错误或者指标指标数据本身异常。
区域经济运行数据是指通过预先的审核策略审核通过的数据,以用于后续的分析。在实际应用中,为了方便对审核通过的区域经济运行数据进行汇集管理,可以将其存放在对应的数据库中,该数据库可定义为区域经济运行数据库。
在一些实施例中,参考图3,步骤S300具体还包括步骤:
S310,根据预设的审核策略对预处理数据进行审核,获取预处理数据的异常数据;
S320,对异常数据进行标注处理,得到异常标识;
S330,根据异常标识对异常数据进行修正,并得到异常类型;
S340,根据异常类型获取运行指标数据在预设时间段异常数据的异常平均值;
S350,根据异常平均值对异常数据进行修正,得到区域经济运行数据。
在步骤S310中,预设的审核策略指对经过预处理的预处理数据从完整性和准确性两个方面进行审核。
异常数据指通过审核策略对基本数据库中的数据进行审核后,未通过审核的预处理数据,通常,在实际应用中,异常数据的异常类型包括但不限于:数据格式异常、数据数值异常、数据空值异常。
通常来说,审核数据准确性的方法主要有逻辑检查和计算检查。逻辑检查主要是审核数据是否符合逻辑,内容是否合理;计算检查是检查各项指标数据在计算结果和计算方法上有无错误。
此外,还要对数据的时效性进行审核,对于有些时效性较强的问题,如果取得的数据过于滞后,可能失去了研究的意义。一般来说,应尽可能使用最新的统计数据。数据经审核后,确认适合于实际需要,才有必要做进一步的加工整理。
通过上述审核方式对其进行审核得到异常数据。
在步骤S320中,对异常数据进行标注处理,得到异常标识,其中标注处理,指对异常数据进行标注,以方便筛选出来。
在一些实施例中,数值异常包括:指标数据本身出现异常,例如生产总值、增加值等非负数的指标数据出现负值,同比、环比等指标数据的数据值过大、过小或出现空值;
指标数据之间的关联关系出现错误,例如行业增加值等分项指标数据的总和大于地区生产总值等汇总类的指标数据。
在步骤S330中,根据异常标识确定异常数据的异常类型,根据上述异常标识对异常数据进行分类,得到不同的异常类型,例如格式异常和数值异常,其中数值异常包括指:标本身出现异常和指标之间的关系错误。
在步骤S340中,根据异常类型获取运行指标数据在预设时间段异常数据的异常平均值,其中异常平均值指在一段时间周期内该指标数据前、后时期的移动平均值,其中对异常数据的调取是根据异常类型对其进行快速的调用。
在步骤S350中,根据异常平均值对异常数据进行修正,得到区域经济运行数据,其中根据异常数据的数量,有不同的修正方式,在一些实施方式中,若存在少量的异常数据,可直接在基本数据库内部直接进行修正;若存在大量的异常数据,先批量导出成表,对其进行修正。
具体地说,若存在缺失数据,例如指标xi缺少一段间内的数值,则可以通过获取异常平均值进行修正,具体如下:
使用该指标前、后时期的移动平均值进行补充;
使用该指标的上一期数据的增长率进行补充;
使用该指标的平均增长率进行补充。
对修正后的数据重新执行S310至S350进行审核,直至数据全部通过审核,得到对应的区域经济运行数据,可以将其存储在区域经济运行数据库中,以进行汇集管理。
S400,基于区域经济运行数据进行分析,得到分析结果,该区域经济运行数据指通过审核的预处理数据。
在一些实施例中,参考图4,在步骤S400中,
S411,获取区域经济运行数据的多个运行指标数据;
S412,根据多个运行指标数据得到多个运行指标数据对应的第一数据参数;
S413,基于第一数据参数和预设的第一数据阈值进行比对;
S414,若第一数据参数大于第一数据阈值,则基于第一数据参数进行预警;
S415,若第一数据参数不大于第一数据阈值,则不进行预警。
第一数据参数是指对获取的多个指标数据进行计算,得到多个指标数据对应的计算值;阈值又叫临界值,是指一个效应能够产生的最低值或最高值,在这里,第一数据阈值指基于数据分析结果,对不同指标数据设置阈值,通过计算得到的指标当期数据数值,即第一数据参数,若第一数据参数超过第一数据阈值,则认为该指标数据为异常指标数据,并基于第一数据参数进行预警;若第一数据参数不超过第一数据阈值,则认为该指标数据为正常指标数据,则不进行预警。
在一些实施方式中,首先绘制经济运行数据的指标数据的基本情况表格,从区域经济运行数据库中选择p个经济运行指标,并计算p个指标当期数据、指标累计数据、指标累计同比数据,将得到的对应指标数据数值填入表格中;其中得到的数据分析结果,即第一数据参数,根据第一数据参数对不同指标数据设置第一数据阈值,若第一数据参数超过第一数据阈值,则认为该指标数据为异常指标数据,该区域经济运行指标数据已经出现或可能出现异常,并将该指标数据标注为异常指标数据,如下表表1所示。
指标 当期数 累计数 累计同比增长
X<sub>1</sub>
X<sub>2</sub>
X<sub>p</sub>
表1
在上述实施方式中,计算多个指标数据,并将得到的对应的数据参数值填入上述表格中,以便于直观的观察分析结果,并将其与预先设定好的第一数据阈值进行比较。
在一些实施例中,基于数据分析结果,对不同数据指标设置阈值,当指标当期数据超过第一数据阈值,则认为该区域经济在该方面已经出现或可能出现异常,并将该指标标注为异常指标,当第一数据参数超过第一数据阈值,则认为该指标数据为异常指标数据,并基于第一数据参数进行预警。
在一些实施例中,参考图5,在步骤S400中,
S421,获取区域经济运行数据的单个运行指标数据;
S422,根据单个运行指标数据得到单个运行指标数据对应的第二数据参数;
S423,根据第二数据参数进行预测分析,得到单个运行指标数据的预测数据参数;
S424,对预测数据参数和预设的第二数据阈值进行比对;
S425,若预测数据参数大于第二数据阈值,则根据预测数据参数进行预警;
S426,若预测数据参数不大于第二数据阈值,则不进行预警。
其中,获取单个运行指标数据即选取某一经济运行指标,得到的第二数据参数即根据单个指标数据计算出其在一段周期内的当期同比增长和当期环比增长数值,把单个运行指标数据的第二数据参数代入ARIMA(自回归求和移动平均)模型,得到对应的新的数值,即单个运行指标数据的预测数据参数;当预测数据参数和第二数据阈值进行比较时,如果预测数据参数超过第二数据阈值,则根据预测数据参数进行预警;如果预测数据参数不超过第二数据阈值,则不进行预警;阈值又叫临界值,是指一个效应能够产生的最低值或最高值,在这里,第二数据阈值是指根据数据分析结果,对不同指标数据数值及不同模型数值设置阈值。
将单个运行指标数据通过计算得到对应的指标数据参数,即对选定的计算指标计算它的指标当期值的时间序列及各期同比、环比等数据值,将数据值以表格的形式进行展示,如下表表2所示;
Figure BDA0002914734980000091
表2
并根据填入表格的数据值,对其进行预测分析,其中预测分析是指通过自回归求和移动平均模型对其进行计算,得到新的数值即预测数据参数,并将这些预测数据参数值以表格的形式进行展示,如下表表3所示:
Figure BDA0002914734980000092
表3
在一些实施例中,对于区域经济运行数据的发展情况分析,选定某一经济运行指标Xt,计算指标当期值的时间序列及各期同比、环比等数据,得到表格;根据指标当期值的时间序列数据,通过构建ARIMA(自回归求和移动平均)模型,观察指标数据的未来走势,其中ARIMA模型表达式为:
Figure BDA0002914734980000093
其中,Xt为经济运行指标n期数据,p、d、q为模型参数,L是滞后算子(Lagoperator);
模型建立完成后,对未来k期的指标数据进行预测,得到指标Xt未来k期预测值及其置信区间。
ARIMA模型,是差分整合移动平均自回归模型,又称整合移动平均自回归模型(移动也可称作滑动),是时间序列预测分析方法之一。ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。
基于数据分析结果,对不同指标及不同模型设置阈值,当指标当期数据数值或模型测算数据数值在阈值,则认为区域经济在该方面已经出现或可能出现异常,并标注异常指标数据;对于指标下期数据分析:例如,基于ARIMA模型,对于未来k期数据预测出现下滑的指标数据,及未来k期模型数据预测波动较大或置信区间范围超过指标当期数据20%的指标数据,认为其需要进行预警。
其中,通常来说,置信区间是指由样本统计量所构造的总体参数的估计区间,置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的测量值的可信程度。
在一些实施例中,参考图6,在步骤S400中,
S431,获取区域经济运行数据的多个运行指标数据;
S432,获取多个运行指标数据的计算关系;
S433,基于指标计算关系对多个运行指标数据进行计算处理,得到对应的第三数据参数。
其中,计算关系是指对于区域经济运行数据的指数测算,选定某些指标数据,计算运行指标数据的贡献率、产业结构偏离度、区位熵数值,从而得到多个运行指标数据对应的第三数据参数,贡献率数值、产业结构偏离度数值、区位熵数值即第三数据参数,其中:
经济增长贡献率:选择指标贡献率=i行业当期增加值/地区生产总值当期增量×100%;
产业结构偏离度:地区生产总值的产业构成百分比/从业人数的产业构成百分比-1;
区位熵:某地区某一行业的经济指标在该地区上一级产业经济指标中所占的比重与全国该行业经济指标在全国其上一级产业经济指标中所占比重的比重;
Figure BDA0002914734980000101
其中:eij表示j地区i行业的经济指标;
Figure BDA0002914734980000111
表示j地区全部行业的经济指标;
Figure BDA0002914734980000112
表示j地区i行业上一级产业的经济指标。
通常,经济增长贡献率是指三次产业贡献率,即第一、第二、第三产业对国民生产总值增长的贡献程度。
当产业结构偏离度趋于0时,表明就业结构与产业结构关系处于均衡状态;当结构偏离度为正数,表明产业产值比重大于就业结构比重;当结构偏离度为负数,表明产业产值比重小于就业结构比重;偏离度的数值越大,表明结构越失衡;偏离度的数值越小,表明结构越均衡。
在一些实施例中,参考图7,在步骤S400中,
S441,获取区域经济运行数据的多个运行指标数据;
S442,基于多个运行指标数据获取第一映射指标数据和第二映射指标数据,其中第一映射指标数据包括多个运行指标数据,第二映射指标数据包括单个运行指标数据;
S443,对第一映射指标数据和第二映射指标数据分别进行标准化处理;
S444,获取标准化处理后的第一映射指标数据与第二映射指标数据的映射关系。
其中,对于区域经济运行数据的影响效应分析,第一映射指标数据即选定多个指标个指标作为自变量,第二映射指标数据选定指标Xj作为因变量,对其进行数据标准化处理,并且通过构建线性回归、逻辑回归、决策树等监督学习模型,将指标带入监督学习模型进行计算,根据计算得到的数值判断其映射关系,从而用以反映自变量指标对因变量指标的影响。
标准化处理:若选定自变量、因变量为地区生产总值、规模以上工业各行业总产值、规模以上各行业企业增加值、固定资产投资总额、社会消费品零售总额、规模以上各行业营业收入、营业利润、研发经费支出其中的一种,则需对该指标数据进行Log函数转换标准化,由于变量中部分数据可能存在0值,因此采用x’=Log(x+1)进行转化,以避免0值造成计算错误。
线性回归模型:xj=β01x12x2+…+βqxq,比较各项自变量的p值,将p值小于0.05的自变量指标认为其能够对因变量指标Xj造成显著影响。
其中,Xj为选定的指标数据作为因变量,β0,......,βq为回归系数,X1,......Xq为自变量,线性回归模型是一种确定变量之间的相关关系的一种数学回归模型。
决策树模型:经济指标多为连续变量,因此采用基于回归树的随机森林搭建模型,采用的原则是最小均方差,对于任意划分特征A,对应的任意划分点s两边划分成的数据集D1和D2,求出使D1和D2各自集合的均方差最小,同时D1和D2的均方差之和最小所对应的特征和特征值划分点;表达式为:
Figure BDA0002914734980000121
其中,c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值,预测结果是随机森林中所有回归树预测值的平均值。
比较构建的多个模型中表现显著的自变量,当自变量指标在越多的模型中表现显著,则其对因变量指标Xj造成较强有效影响;当自变量指标在越少的模型中表现显著,则其对因变量指标Xj影响较弱。
在一些实施例中,参考图8,获取初始指标数据,然后对初始指标数据进行预处理,得到预处理数据,在实际应用中,为了方便管理数据,可将预处理数据存放于基本数据库中,通过预先设定的审核策略对预处理数据进行审核,未通过审核的预处理数据,则将其标注为异常指标数据,并根据异常原因对异常指标数据进行修正,直到得到全部通过审核策略审核的预处理数据为止,从而得到区域经济运行数据,在实际应用中,为了方便管理数据,可将区域经济运行数据存放于区域经济运行数据库中;在一些实施例中,对存放在区域经济运行数据库中的区域经济运行数据进行基本情况分析、发展情况分析、指数测算以及影响效应分析,得到分析图表、测算结果、分析结果和预警结果。
在一些实施方式中,区域经济运行数据分析设备,包括:处理器和存储器,其中存储器用于存储可执行程序,可执行程序在被运行时执行如上所述的方法。
在一些实施方式中,所述存储介质存储有可执行指令,可执行指令能被计算机执行。
存储器用来存储信息,保存计算机工作所必须的程序和数据。它包括内存储器和外存储器。
本部分将详细描述本发明的具体实施例,附图的作用在于用图形使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范围的限制。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,上述的具体方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可作出很多形式,这些均属于本发明的保护之内,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。

Claims (10)

1.一种区域经济运行数据分析方法,其特征在于,包括:
获取初始数据;
对所述初始数据进行预处理,得到预处理数据;
根据预设的审核策略对所述预处理数据进行审核,得到区域经济运行数据;
基于所述区域经济运行数据进行分析,得到分析结果。
2.根据权利要求1所述的一种区域经济运行数据分析方法,其特征在于,所述对所述初始数据进行预处理,得到所述预处理数据,包括:
获取预设的预处理策略和所述初始数据中的初始指标数据;
根据所述预处理策略对所述初始指标数据进行预处理,得到所述预处理数据。
3.根据权利要求1所述的一种区域经济运行数据分析方法,其特征在于,所述根据预设的审核策略对所述预处理数据进行审核,得到所述区域经济运行数据,包括:
根据预设的审核策略对所述预处理数据进行审核,获取所述预处理数据的异常数据;
对所述异常数据进行标注处理,得到异常标识;
根据所述异常标识对所述异常数据进行修正,得到所述区域经济运行数据。
4.根据权利要求3所述的一种区域经济运行数据分析方法,其特征在于,所述根据所述异常标识对所述异常数据进行修正,得到所述区域经济运行数据,包括:
根据所述异常标识确定所述异常数据的异常类型;
根据所述异常类型获取运行指标数据在预设时间段所述异常数据的异常平均值;
基于所述异常平均值对所述异常数据进行修正,得到所述区域经济运行数据。
5.根据权利要求1所述的一种区域经济运行数据分析方法,其特征在于,所述基于对所述区域经济运行数据进行分析,得到分析结果,包括:
获取所述区域经济运行数据的多个运行指标数据;
根据所述多个运行指标数据得到所述多个运行指标数据对应的第一数据参数;
基于所述第一数据参数和预设的第一数据阈值进行比对;
若所述第一数据参数大于所述第一数据阈值,则基于所述第一数据参数进行预警。
6.根据权利要求1所述的一种区域经济运行数据分析方法,其特征在于,所述基于对所述区域经济运行数据进行分析,得到分析结果,包括:
获取所述区域经济运行数据的单个运行指标数据;
根据所述单个运行指标数据得到所述单个运行指标数据对应的第二数据参数;
根据所述第二数据参数进行预测分析,得到所述单个运行指标数据的预测数据参数;
基于所述预测数据参数和预设的第二数据阈值进行比对;
若所述预测数据参数大于所述第二数据阈值,则基于所述预测数据参数进行预警。
7.根据权利要求1所述的一种区域经济运行数据分析方法,其特征在于,所述基于对所述区域经济运行数据进行分析,得到分析结果,包括:
获取所述区域经济运行数据的多个运行指标数据;
获取所述多个运行指标数据的计算关系;
基于所述指标计算关系对所述多个运行指标数据进行计算处理,得到对应的第三数据参数。
8.根据权利要求1所述的一种区域经济运行数据分析方法,其特征在于,所述基于对所述区域经济运行数据进行分析,得到分析结果,包括:
获取所述区域经济运行数据的多个运行指标数据;
基于所述多个运行指标数据获取第一映射指标数据和第二映射指标数据,所述第一映射指标数据包括所述多个运行指标数据,所述第二映射指标数据包括单个运行指标数据;
对所述第一映射指标数据和所述第二映射指标数据分别进行标准化处理;
获取标准化处理后的所述第一映射指标数据与所述第二映射指标数据的映射关系。
9.一种区域经济运行数据分析设备,其特征在于,包括:
处理器:
存储器,用于存储可执行程序;
当所述可执行程序被所述处理器执行时,得到一种区域经济运行数据分析设备实现如权利要求1至8任一项所述的一种区域经济运行数据分析方法。
10.一种存储介质,其特征在于,所述存储介质存储有可执行指令,可执行指令能被计算机执行,使所述计算机执行如权利要求1至8任一项所述的一种区域经济运行数据分析方法。
CN202110098182.0A 2021-01-25 2021-01-25 区域经济运行数据分析方法、设备及存储介质 Pending CN112783948A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110098182.0A CN112783948A (zh) 2021-01-25 2021-01-25 区域经济运行数据分析方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110098182.0A CN112783948A (zh) 2021-01-25 2021-01-25 区域经济运行数据分析方法、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112783948A true CN112783948A (zh) 2021-05-11

Family

ID=75759010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110098182.0A Pending CN112783948A (zh) 2021-01-25 2021-01-25 区域经济运行数据分析方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112783948A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434448A (zh) * 2021-06-09 2021-09-24 湖州市吴兴区数字经济技术研究院 一种基于5g通信的数字经济数据采集***和方法
CN115409436A (zh) * 2022-11-03 2022-11-29 博和利统计大数据(天津)集团有限公司 经济运行目标设定方法、装置、设备及可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434448A (zh) * 2021-06-09 2021-09-24 湖州市吴兴区数字经济技术研究院 一种基于5g通信的数字经济数据采集***和方法
CN115409436A (zh) * 2022-11-03 2022-11-29 博和利统计大数据(天津)集团有限公司 经济运行目标设定方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
US11093519B2 (en) Artificial intelligence (AI) based automatic data remediation
CN106067094A (zh) 一种动态评估方法及***
TW202030685A (zh) 電腦執行的事件風險評估的方法及裝置
CN113191926B (zh) 基于深度集成学习网络的粮油农作物供应链危害物辨识方法及***
CN112783948A (zh) 区域经济运行数据分析方法、设备及存储介质
CN113849542A (zh) 基于人工智能的区域温室气体排放清单核算***与方法
CN111126865B (zh) 一种基于科技大数据的技术成熟度判断方法和***
CN110826237B (zh) 基于贝叶斯信念网络的风电设备可靠性分析方法及装置
Chang et al. Integrating in-process software defect prediction with association mining to discover defect pattern
CN116307928A (zh) 一种目标督查督办管理***
CN111476274B (zh) 一种大数据预测分析的方法、***、装置及存储介质
CN114638498A (zh) Esg评价方法、***、电子设备及存储设备
CN112256681A (zh) 一种空管数字化指标应用***及方法
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN116365519A (zh) 一种电力负荷预测方法、***、存储介质及设备
US6782376B2 (en) Reasoning method based on similarity of cases
CN113642669B (zh) 基于特征分析的防欺诈检测方法、装置、设备及存储介质
CN115952914A (zh) 一种基于大数据的电力计量运维工作判别规划方法
CN115809236A (zh) 具有复杂数据源的交通工程材料质量数据分析方法及***
KR102543211B1 (ko) 비정형 기업 데이터를 이용한 기업성장 예측 시스템
CN109886288A (zh) 一种用于电力变压器的状态评价方法及装置
CN109376898A (zh) 一种基于内外部指标影响的电量分析预测方法
Wang et al. Stock price prediction methods based on FCM and DNN Algorithms
CN113077189A (zh) 一种小微企业生命周期评估的方法和装置
Meng et al. The practice study of consumer credit risk based on random forest

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination