CN108846567A - 基于大数据多因素关联的企业上下规监管分析方法及*** - Google Patents

基于大数据多因素关联的企业上下规监管分析方法及*** Download PDF

Info

Publication number
CN108846567A
CN108846567A CN201810568233.XA CN201810568233A CN108846567A CN 108846567 A CN108846567 A CN 108846567A CN 201810568233 A CN201810568233 A CN 201810568233A CN 108846567 A CN108846567 A CN 108846567A
Authority
CN
China
Prior art keywords
analysis
data
model
enterprise
regulatory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810568233.XA
Other languages
English (en)
Inventor
王济平
黎刚
周健雄
汤克云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Jingxin Software Technology Co Ltd
Original Assignee
Guangdong Jingxin Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Jingxin Software Technology Co Ltd filed Critical Guangdong Jingxin Software Technology Co Ltd
Priority to CN201810568233.XA priority Critical patent/CN108846567A/zh
Publication of CN108846567A publication Critical patent/CN108846567A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出基于大数据多因素关联的企业上下规监管分析方法及***,所述方法包括以下步骤:构建可视化展示及操作界面,进行分析任务创造、数据输入和分析结果输出;构建有包含多种已配置好的参数化模型的分析模型库,构建用于大数据分析处理的若干分析组件,根据用户选择的条件范围、调用的参数化模型、分析组件建立对应的数据分析任务,并调动底层的资源执行数据分析任务。所述***包括界面层、处理层和分析模型层。通过模型参数化、展示可视化的方式实现企业上下规监管分析,可更直观、更便捷、更高效、更科学地开展企业上下规监管工作,大大降低使用大数据技术及多因素关联企业监管分析的难度,对辅助企业上下规监管工作有重要的作用。

Description

基于大数据多因素关联的企业上下规监管分析方法及***
技术领域
本发明涉及一种基于大数据多因素关联的企业上下规监管分析方法及***。
背景技术
规上企业的持续做强做大能够推动城市经济的持续发展,同时,也起到了维护社会稳定的作用。由于市场主体数量庞大,相关部门对于企业的监管难度也逐年增大,传统的监管方式如通过电话和实地走访,定期汇总整理及上报企业名称、法人股东情况、就业人数、年营业收入、员工人数等企业基本信息,调查摸底结果的真实可靠性未能得到保证,另外对多因素影响下的企业情况判断不够全面科学。传统的监管工作量大,效率低,考核体系相对落后,在当今面临诸多挑战。
随着大数据技术的快速发展,社会对大数据技术的应用已越来越普及。大数据的出现和以云计算为平台的数据分析技术的发展,为城市产业经济发展应对旧问题、迎接新挑战带来新的机遇。然而大数据作为一门技术含量较高的应用,往往需要使用大数据的政企拥有自己的技术基础,这使得大数据技术在政府部门对城市经济发展及企业监管的应用上有很大的难度。
另一方面,科学的评估监管模型建设需要专业统计分析理论基础。通过与大数据技术实现的数据采集、数据处理及分析有机结合,针对城市经济发展中不同产业与主题的不同特征,是一个理论支撑实践,实践验证并优化模型的长期过程。
发明内容
基于上述背景,本发明提出基于大数据多因素关联的企业上下规监管分析方法,目的在于实现通过结合大数据技术及科学建模,让企业上下规监管工作更科学,更简单,其具体技术内容如下:
一种基于大数据多因素关联的企业上下规监管分析方法,其包括以下步骤:构建可视化展示及操作界面,进行分析任务创造、数据输入和分析结果输出;构建有包含多种已配置好的参数化模型的分析模型库,构建用于大数据分析处理的若干分析组件,根据用户选择的条件范围、调用的参数化模型、分析组件建立对应的数据分析任务,并调动底层的资源执行数据分析任务,在建立数据分析任务时指定任务的执行策略。所述可视化展示及操作界面支撑对参数化模型、分析组件及数据分析任务的条件查询,以及自定义模型参数。在数据处理过程中,执行值映射、去除重复记录、增加校验列、拆分字段和数值范围步骤;在模型选择与数据分析中,执行模型参数化、***自动调优、大数据分析和统计步骤。在结果输出过程中,执行配置数据源、配置数据处理方式和配置输出结果步骤。调动底层的资源进行处理计算是通过hive数据挖掘,数据清洗,R语言和Spark MLlib对数据的分类和进行数据的训练从而得出并支持调整模型的参数,来达到数据的分析和预测。
在相同构思下,本发明还提出一种基于大数据多因素关联的企业上下规监管分析***,其包括界面层、处理层和分析模型层;所述界面层是指企业上下规监管分析任务构建的平台界面,其中处理层及分析模型层的内容会在平台界面以定制化预设的可视化多图表形式展示;同时支持条件查询、自定义分析,通过引用参数化的模型快速构建起分析任务,使用户可在统一的界面查看基于大数据技术及算法模型构建的企业上下规监管分析结果;所述分析模型层包含多种已配置好的参数化模型,实现用户只需要选择条件范围及模型,即可快速构建对应的数据分析任务,同时支持根据需求自定义模型的参数,分析模型层为数据处理层提供参考标准;所述处理层包括大数据分析处理过程的各个分析组件,通过使用每个分析环节的组件去构建分析任务,并可指定任务的执行策略,以调动底层的资源进行数据分析任务的执行,所述处理层为实现模型的自动调优提供数据基础。所述处理层通过数据输入建立有数据源,并执行配置数据源、配置数据处理方式和配置输出结果。所述处理层的底层处理计算是通过hive数据挖掘,数据清洗,R语言和Spark MLlib对数据的分类和进行数据的训练从而得出并支持调整模型的参数,来达到数据的分析和预测。
本发明的有益效果是:通过模型参数化、展示可视化的方式实现企业上下规监管分析,可更直观、更便捷、更高效、更科学地开展企业上下规监管工作,大大降低使用大数据技术及多因素关联企业监管分析的难度,对辅助企业上下规监管工作有重要的作用。具体包括如下优点:
1)丰富的可视化展示的方式。用户通过丰富的可视化图表形式,更宏观了解城市产业经济及企业发展情况及趋势,对分析结果导出使用。实现多维度、多主题,更直接的企业上下规监管;
2)支持数据多源采集与及时更新。根据实际构建情况及使用需求,数据源渠道广,更可实现定期匹配更新。用户输入的数据也被保存并科学分析比对及处理后采用,使的***数据源不断扩大。
3)模型参数化、***自动调优。用户可以根据自己的需求,直接选择条件范围及模型的方式,构建符合实际需求的分析任务,无需进行代码的编写,有效降低户进行关联因素多、数据量大、复杂程度高、专业性强的企业上下规监管分析成本。***可根据数据处理及数据更新结果,自动对模型进行调优,使得整个分析的构建更加科学与严谨。
附图说明
图1为基于大数据多因素关联的企业上下规监管分析方法的流程图。
图2为基于大数据多因素关联的企业上下规监管分析***的框架图。
图3为人均销售额异常企业分布的结果截图。
图4为用电效益异常企业分布情况的结果截图。
图5为数据异常企业名单的结果截图。
图6为企业详情截图一。
图7为企业关系截图一。
图8为收入估算企业名单的结果截图。
图9为收入估算企业的条件查询界面截图。
图10为企业详情截图二。
图11为企业关系截图二。
具体实施方式
如下结合附图,对本申请方案作进一步描述:
参见附图1,一种基于大数据多因素关联的企业上下规监管分析方法,其包括以下步骤:构建可视化展示及操作界面,进行分析任务创造、数据输入和分析结果输出;构建有包含多种已配置好的参数化模型的分析模型库,构建用于大数据分析处理的若干分析组件,根据用户选择的条件范围、调用的参数化模型、分析组件建立对应的数据分析任务,并调动底层的资源执行数据分析任务。在建立数据分析任务时指定任务的执行策略。所述可视化展示及操作界面支撑对参数化模型、分析组件及数据分析任务的条件查询,以及自定义模型参数。在数据处理过程中,执行值映射、去除重复记录、增加校验列、拆分字段和数值范围步骤;在模型选择与数据分析中,执行模型参数化、***自动调优、大数据分析和统计步骤。在结果输出过程中,执行配置数据源、配置数据处理方式和配置输出结果步骤。调动底层的资源进行处理计算是通过hive数据挖掘,数据清洗,R语言和Spark MLlib对数据的分类和进行数据的训练从而得出并支持调整模型的参数,来达到数据的分析和预测。
具体的,构成企业上下规监管分析的任务一般包括数据源的输入、数据的处理、模型选择与数据分析及结果输出四个步骤,在本技术中,四个步骤都提供了多种的处理方式,如下表所示:
参见附图,通过可视化的操作界面去构建多因素关联的企业上下规监管分析的流程,模型参数化的特点,仅需在构建过程中匹配条件范围及模型进行数据的分析,可选择数据范围或支持自定义相关参数,构建完毕后通过底层计算资源进行数据处理计算,最终将结果反馈到可视化界面进行查看或实现结果导出,在数据处理分析的过程,同时也为模型的自助调优提供了基础。
参见附图2,一种基于大数据多因素关联的企业上下规监管分析***,其包括界面层、处理层和分析模型层;所述界面层是指企业上下规监管分析任务构建的平台界面,其中处理层及分析模型层的内容会在平台界面以定制化预设的可视化多图表形式展示;同时支持条件查询、自定义分析,通过引用参数化的模型快速构建起分析任务,使用户可在统一的界面查看基于大数据技术及算法模型构建的企业上下规监管分析结果;所述分析模型层包含多种已配置好的参数化模型,实现用户只需要选择条件范围及模型,即可快速构建对应的数据分析任务,同时支持根据需求自定义模型的参数,分析模型层为数据处理层提供参考标准;所述处理层包括大数据分析处理过程的各个分析组件,通过使用每个分析环节的组件去构建分析任务,并可指定任务的执行策略,以调动底层的资源进行数据分析任务的执行,所述处理层为实现模型的自动调优提供数据基础。所述处理层通过数据输入建立有数据源,并执行配置数据源、配置数据处理方式和配置输出结果。所述处理层的底层处理计算是通过hive数据挖掘,数据清洗,R语言和Spark MLlib对数据的分类和进行数据的训练从而得出并支持调整模型的参数,来达到数据的分析和预测。
企业上下规监管的构建案例
一,数据异常企业分析
数据异常企业分析是通过计算城市当前规上企业分行业人均销售额及用电效益异常值范围(即数值超过行业的最小最或最大值范围),从而排查出城市规上企业中存在数据异常的企业。
它的规则如下:
企业人均销售额=企业当年应税销售额/企业当年期末用工人数。
企业用电效益=企业当年应税销售额/企业当年用电量。
分行业上四分位数=3(n+1)/4
分行业下四分位数=(n+1)/4
内四分位距=3(n+1)/4-(n+1)/4
分行业最大值公式=行业上四位数+1.5×行业内四分位距,范围内的最大数据。
分行业最小值公式=行业下四分位数-1.5×行业内四分位距,范围内的最小数据。
以某市家用电力器具制造业的数据异常企业分析则为例:
1)行业分析结果
2)人均销售额异常企业分布,参见附图3。
3)用电效益异常企业分布情况,参见附图4。
下面说明通过本专利实现数据异常企业分析的流程:
在条件选择区域选择需要查询企业的条件,包含所属镇区、大类行业、中类行业、异常类型。支持输入企业名称、关键字模糊匹配、统一社会信用代码或工商注册号快速匹配查询企业信息,实现快捷自定义查询并支持导出EXCEL文件,参见附图5。
点击查询后,可查看条件范围的企业基本及相关异常信息,点击企业详情或企业关系图按钮,可查看数据异常企业的详细信息、发展趋势及法人股东股权结构与投资情况,实现多维度对企业异常原因进行关联深挖,为提高对规上企业监管力度提供了依据,参见附图6和7。
二,企业收入估算分析
本专利已提供针对企业收入预估的分析模型,依托大数据技术对城市各产业经济及企业数据的整合,结合统计分析模型,对城市各行业的企业估算分析配置多个参数化模型,实现全面、多维度分析企业销售额估算服务,对各个行业销售额未上规的企业根据行业算法分析进行收入估算,挖掘更多符合上规条件企业。
以某市家用电力器具制造业的企业收入估算分析模型算法规则为例:
1)模型摘要
2)变量系数
下面说明通过本专利企业收入估算分析的流程:
在条件选择区域,选择需查询企业的基本条件,包括镇区、所属行业、企业类型。支持输入企业名称、关键字模糊匹配、统一社会信用代码或工商注册号快速匹配查询企业情况,实现自定义查询并支持导出EXCEL文件,参见附图9。
点击自定义估算按钮,下拉出扩展选择区域,在该行业预设的分析模型中选择一种,如:用工人数模型、用电量模型、增值税额模型、综合模型等。输入相关数据,实现更全面更多维度的企业收入估算分析,参见附图9。
点击目标企业详情或企业关系图按钮,可查看企业的详细信息、发展趋势及法人股东股权结构与投资情况,更多维、全面判断企业情况,科学挖掘更多符合上规条件企业,参见附图10和11。
上述优选实施方式应视为本申请方案实施方式的举例说明,凡与本申请方案雷同、近似或以此为基础作出的技术推演、替换、改进等,均应视为本专利的保护范围。

Claims (9)

1.一种基于大数据多因素关联的企业上下规监管分析方法,其特征在于:构建可视化展示及操作界面,进行分析任务创造、数据输入和分析结果输出;构建有包含多种已配置好的参数化模型的分析模型库,构建用于大数据分析处理的若干分析组件,根据用户选择的条件范围、调用的参数化模型、分析组件建立对应的数据分析任务,并调动底层的资源执行数据分析任务。
2.根据权利要求1所述的基于大数据多因素关联的企业上下规监管分析方法,其特征在于:在建立数据分析任务时指定任务的执行策略。
3.根据权利要求2所述的基于大数据多因素关联的企业上下规监管分析方法,其特征在于:所述可视化展示及操作界面支撑对参数化模型、分析组件及数据分析任务的条件查询,以及自定义模型参数。
4.根据权利要求3所述的基于大数据多因素关联的企业上下规监管分析方法,其特征在于:在数据处理过程中,执行值映射、去除重复记录、增加校验列、拆分字段和数值范围步骤;在模型选择与数据分析中,执行模型参数化、***自动调优、大数据分析和统计步骤。
5.根据权利要求4所述的基于大数据多因素关联的企业上下规监管分析方法,其特征在于:在结果输出过程中,执行配置数据源、配置数据处理方式和配置输出结果步骤。
6.根据权利要求1至5任一项所述的基于大数据多因素关联的企业上下规监管分析方法,其特征在于:调动底层的资源进行处理计算是通过hive数据挖掘,数据清洗,R语言和Spark MLlib对数据的分类和进行数据的训练从而得出并支持调整模型的参数,来达到数据的分析和预测。
7.一种基于大数据多因素关联的企业上下规监管分析***,其特征在于:包括界面层、处理层和分析模型层;
所述界面层是指企业上下规监管分析任务构建的平台界面,其中处理层及分析模型层的内容会在平台界面以定制化预设的可视化多图表形式展示;同时支持条件查询、自定义分析,通过引用参数化的模型快速构建起分析任务,使用户可在统一的界面查看基于大数据技术及算法模型构建的企业上下规监管分析结果;
所述分析模型层包含多种已配置好的参数化模型,实现用户只需要选择条件范围及模型,即可快速构建对应的数据分析任务,同时支持根据需求自定义模型的参数,分析模型层为数据处理层提供参考标准;
所述处理层包括大数据分析处理过程的各个分析组件,通过使用每个分析环节的组件去构建分析任务,并可指定任务的执行策略,以调动底层的资源进行数据分析任务的执行,所述处理层为实现模型的自动调优提供数据基础。
8.根据权利要求7所述的基于大数据多因素关联的企业上下规监管分析***,其特征在于:所述处理层通过数据输入建立有数据源,并执行配置数据源、配置数据处理方式和配置输出结果。
9.根据权利要求8所述的基于大数据多因素关联的企业上下规监管分析***,其特征在于:所述处理层的底层处理计算是通过hive数据挖掘,数据清洗,R语言和Spark MLlib对数据的分类和进行数据的训练从而得出并支持调整模型的参数,来达到数据的分析和预测。
CN201810568233.XA 2018-06-04 2018-06-04 基于大数据多因素关联的企业上下规监管分析方法及*** Pending CN108846567A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810568233.XA CN108846567A (zh) 2018-06-04 2018-06-04 基于大数据多因素关联的企业上下规监管分析方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810568233.XA CN108846567A (zh) 2018-06-04 2018-06-04 基于大数据多因素关联的企业上下规监管分析方法及***

Publications (1)

Publication Number Publication Date
CN108846567A true CN108846567A (zh) 2018-11-20

Family

ID=64211461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810568233.XA Pending CN108846567A (zh) 2018-06-04 2018-06-04 基于大数据多因素关联的企业上下规监管分析方法及***

Country Status (1)

Country Link
CN (1) CN108846567A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710653A (zh) * 2018-12-29 2019-05-03 北京航天数据股份有限公司 一种测试数据源配置方法及装置
CN109948887A (zh) * 2019-01-23 2019-06-28 石化盈科信息技术有限责任公司 炼化企业经营管理分析方法、存储介质和计算设备
CN111339375A (zh) * 2020-03-19 2020-06-26 中国海洋石油集团有限公司 一种通用的大数据模型配置和分析方法
CN111708774A (zh) * 2020-04-16 2020-09-25 上海华东电信研究院 一种基于大数据的产业分析***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573071A (zh) * 2015-01-26 2015-04-29 湖南大学 一种基于大数据技术的校情智能分析***及方法
CN104572929A (zh) * 2014-12-26 2015-04-29 深圳市科漫达智能管理科技有限公司 数据挖掘方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572929A (zh) * 2014-12-26 2015-04-29 深圳市科漫达智能管理科技有限公司 数据挖掘方法及装置
CN104573071A (zh) * 2015-01-26 2015-04-29 湖南大学 一种基于大数据技术的校情智能分析***及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710653A (zh) * 2018-12-29 2019-05-03 北京航天数据股份有限公司 一种测试数据源配置方法及装置
CN109948887A (zh) * 2019-01-23 2019-06-28 石化盈科信息技术有限责任公司 炼化企业经营管理分析方法、存储介质和计算设备
CN111339375A (zh) * 2020-03-19 2020-06-26 中国海洋石油集团有限公司 一种通用的大数据模型配置和分析方法
CN111708774A (zh) * 2020-04-16 2020-09-25 上海华东电信研究院 一种基于大数据的产业分析***
CN111708774B (zh) * 2020-04-16 2023-03-10 上海华东电信研究院 一种基于大数据的产业分析***

Similar Documents

Publication Publication Date Title
CN108846567A (zh) 基于大数据多因素关联的企业上下规监管分析方法及***
Aryal et al. How much do we know about trade-offs in ecosystem services? A systematic review of empirical research observations
CN103679373B (zh) 生产基建标准成本体系的全链条预算数据处理***及方法
Krüger Productivity and structural change: a review of the literature
CN111104394A (zh) 一种能源数据仓库***构建方法及装置
CN111291076A (zh) 基于大数据的异常用水监测报警***及其构建方法
CN107346502A (zh) 一种基于大数据的迭代产品销售预测方法
US20070254740A1 (en) Concerted coordination of multidimensional scorecards
CN108694599A (zh) 确定商品价格的方法、装置、电子设备和存储介质
Nourani et al. Business excellence: the managerial and value-creation efficiencies of the insurance companies
CN109242170A (zh) 一种基于数据挖掘技术的城市道路管理***及方法
CN110941797B (zh) 基于业务指标的经营指标监控及趋势预测***
Huang et al. Dynamic analysis method to open the “black box” of urban metabolism
CN117557078B (zh) 一种基于时间节点的智能生产计划管理方法及***
CN111221868A (zh) 一种应用于电力客户渠道偏好的数据挖掘与分析方法
CN114398669A (zh) 基于隐私保护计算和跨组织的联合信用评分方法及装置
CN112328577A (zh) 一种基于县域的农业大数据管理***及方法
CN115470195A (zh) 一种融合维度模型的指标数据自动化计算方法及装置
Wang Energy efficiency in China's industry sectors: A non-parametric production frontier approach analysis
CN116701965A (zh) 一种基于birch聚类算法的企业用户全景碳画像方法
CN115907665A (zh) 一种电网公司智能催费行为决策方法
Tai et al. Determining worker training time for precast component production in construction: Empirical study in Taiwan
CN103701850A (zh) 一种农事黄历云管理***及其方法
Fang et al. A game theoretical model for the stimulation of public cooperation in environmental collaborative governance
Erdal et al. Which economic freedoms contribute income per capita? Are results sensitive to the indicators and the estimation methods?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181120

RJ01 Rejection of invention patent application after publication