CN112950047A - 一种疑似污染场地的渐进识别方法 - Google Patents

一种疑似污染场地的渐进识别方法 Download PDF

Info

Publication number
CN112950047A
CN112950047A CN202110290595.9A CN202110290595A CN112950047A CN 112950047 A CN112950047 A CN 112950047A CN 202110290595 A CN202110290595 A CN 202110290595A CN 112950047 A CN112950047 A CN 112950047A
Authority
CN
China
Prior art keywords
data
pollution
technology
land
suspected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110290595.9A
Other languages
English (en)
Inventor
周睿
杨典华
展明旭
王彩云
朱云翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingshi Tianqi Beijing Technology Co ltd
Original Assignee
Jingshi Tianqi Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingshi Tianqi Beijing Technology Co ltd filed Critical Jingshi Tianqi Beijing Technology Co ltd
Priority to CN202110290595.9A priority Critical patent/CN112950047A/zh
Publication of CN112950047A publication Critical patent/CN112950047A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Primary Health Care (AREA)
  • Astronomy & Astrophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种疑似污染场地的渐进识别方法。基于我国当前工业用地的基本属性、地表纹理、空间分布等特征,运用大数据技术结合遥感技术,以及本公司所研发的污染潜势模型技术手段,面向工业用地,开展疑似污染场地渐进识别的研究,以实现大规模面上疑似污染场地快速筛查与判别的目的。本发明优化了我国传统的基于现场调查取样的方法,极大节约了对疑似污染现场调查取样而产生的高额成本。通过运用该方法识别出的疑似污染场地结果,可以有效填补疑似污染场地时空数据库,为管理决策部门充分掌握本地疑似污染场地名录提供有益补充。

Description

一种疑似污染场地的渐进识别方法
技术领域
本发明涉及数据识别领域,尤其涉及一种疑似污染场地的渐进识别方法。
背景技术
伴随着社会经济的发展,我国建设用地数量不断增多,并呈现出分布广泛、潜在污染风险增加的趋势,并越来越显示出其危害性,危害生态环境安全与人民生活质量。并且,传统的污染场地识别方法依赖于现场调查采样,不仅耗时耗力,而且严重影响决策效率。
随着大数据时代来临,数据已成为国家基础性战略资源,对生产、消费以及国家治理能力产生重要影响。大数据技术在能源、教育、科研、制造、金融、电子政务、企业经营管理、信息管理等领域的应用日益广泛,给环境领域也带来了新的机遇与发展。因其具备海量信息存储和处理能力,数据信息的来源和类型得到大幅扩展,并使用数据挖掘、人工智能、模拟仿真、关联分析等现代技术手段,在解决复杂污染问题方面展示出明显优势。网络上大量关于工业场地的历史数据、污染突发事件新闻、统计数据;各部门发布的污染企业数据、动态更新的监测数据、遥感数据以及水文气象、土地利用、土壤类型等。集成这些海量信息,可为疑似污染场地的渐进识别提供数据基础。其中,遥感作为一门新兴的技术,目前已深入应用到人类的工作和生活中,在农业、林业、地质、地理、海洋、水文、气象、测绘、环境保护和军事侦察等许多领域发挥越来越重要的作用,为人类认识国土、开发资源、监测环境、研究灾害以及环境保护提供了新途径,为解决人类面临的资源紧缺、环境恶化、人口剧增、灾害频发等一系列严峻挑战提供重要信息。数据的空间分辨率已从公里级发展到亚米级,重复观测频率从月周期发展到几小时,光谱分辨率从多波段发展到超光谱,遥感数据获取技术正走向实时化和精确化。基于遥感数据的疑似污染场地识别技术,从传统的目视解译,到基于像元的自动解译,以及新兴的面向对象分类、智能化专家***和深度学习等,识别技术得到迅猛发展。
在大数据技术和遥感技术基础上,结合污染潜势模型模拟,分析计算工业用地污染潜势,能够为疑似污染场地的渐进识别提供技术支撑。
针对我国当前严重依赖现场调查取样方法来识别疑似污染场地,且费时费力等系列问题是目前亟待解决的问题。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种疑似污染场地的渐进识别方法。
为了解决以上技术问题,本发明采用的技术方案是:一种疑似污染场地的渐进识别方法,方法的步骤为:
步骤一,运用大数据技术采集网络公开的工业用地相关的多源异构数据,并对多源异构数据进行加工融合处理;
步骤二,结合遥感技术对选取对工业用地进行筛选,运用面向对象识别技术对原始影像数据进行分割,采用深度学习技术从训练集中自动学习有效特征;
步骤三,基于大数据技术和遥感技术获得工业用地指标,输入污染潜势模型,计算单个工业用地地块的污染潜势值,筛选出疑似污染场地;
步骤四,将计算得到工业用地的污染潜势值导入工业用地信息数据库中,进行结果验证确认污染场地点。
进一步地,步骤一大数据技术,包括大数据采集技术和大数据处理技术,借助大数据采集技术和网络爬虫技术爬取网络公开的工业用地相关的多源异构数据,利用大数据处理技术对多源异构数据进行加工融合处理。
进一步地,步骤二大数据采集技术的手段,包括卫星遥感、传感器、射频识别、物联网以及移动平台。
进一步地,大数据处理技术对多源异构数据进行加工融合处理的步骤分为:数据存储、数据预处理、数据深入处理与数据挖掘。
进一步地,步骤二中结合遥感技术对选取和爬取的工业用地进行筛选,建立遥感影像样本库,运用面向对象识别技术,采用多尺度影像分割对原始影像数据进行分割,实现从基于像元的遥感影像分类过渡到基于对象的遥感影像分类;深度学习技术通过对网络的学习,模拟人类大脑处理数据的过程,采用预训练的深度学习模型构建网络基本卷积层和池化层,然后利用样本对模型进行训练,提取各类敏感用地的特征,再利用精度评估函数对模型进行优化,得到最终的深度学习模型。
进一步地,数据存储基于Hadoop的技术扩展和封装,将爬取网络获取的多源异构数据存储为统一的本地数据文件并以结构化方式进行存储;数据预处理对多源异构数据进行数据清理,将其转换为单一或便于处理的结构,数据清理包括遗漏值处理、噪音数据处理、不一致数据处理,遗漏值处理采用全局常量、属性均值、可能值填充或者直接忽略该数据方法处理;噪音数据处理采用分箱、聚类、计算机人工检查和回归方法去除噪音;不一致数据处理不一致数据处理采用手动更正,经过数据清理后,所有数据信息都被整合为一套以企业用地为对象的数据清单;数据深入处理包括机器学习、智能算法、统计分析和***建模,数据深入处理将清理后的企业用地的数据清单结合地理信息大数据,进一步获取单个企业用地的地理属性特征,丰富企业用地为对象清单的内容;数据挖掘采用Meta分析方法、基于数据驱动的挖掘方法以及基于过程机理的模型-数据融合方法对大数据进行整合挖掘获得科学性、融合性和有效性信息,将丰富后的企业用地的数据清单,根据单一企业用地在产或停用情况、规模现状、产排污信息,借助相关分析、回归分析、聚类分析以及主成分分析,分析单个工业用地地块形成的驱动力因子,并形成区域内所有工业用地地块的空间分布热地区,从点到面,分层次分尺度地分析工业用地形成机制。
进一步地,步骤三中污染潜势模型包括模型构建、指标体系、量化标准以及汇总赋分。
进一步地,指标体系以污染扩散基本路径、污染源、传输途径、受体承载为依据,构建包含污染潜势特性维度、传输途径维度、受体风险维度在内的指标体系;污染潜势特征维度包括企业规模、行业类别、生产年限、注册资本、污染物种类、是否为国控污染源、是否为全口径涉重金属行业企业、是否具有危险废物经营许可证、是否进去地方检索用地土壤污染风险管控和修复名录、是否具有排污许可证书、是否有异常经营记录、是否有媒体报道污染事件、行政处罚、环保处罚;传输途径维度包括地形坡度、土壤质地、土壤PH值、土壤介质、地下水埋深、水里传到系数、净入渗量;受体风险维度包括人口密度、边界1km以内是否有城镇、是否有水源保护地、是否位于生态红线区、是否有基本农田保护区、是否有敏感受体。
进一步地,量化标准依据污染潜势特征维度、传输途径维度、受体风险维度,污染潜势特征维度是根据行业类别来客观量化数据,再依据本土化高污染潜势行业类别特征污染物向环境的平均释放量,结合专家专业判断,估算了各行业类别代表的原始分;根据行业类别调整,结合企业工艺流程、潜在污染设施以及厂区现状调整因子,对各行业类别基础分作进一步调整,以真正反映目标建设用地的实际污染风险潜势;根据规模、营运年限、主体变更系数判别;传输途径维度是以污染物经环境介质中或传输途径的快慢或停留时间长短来决定其风险大小,评估地下水环境受污染潜势的脆弱度。
进一步地,汇总赋分是将通过大数据技术和遥感技术获得的数据结果,根据指标体系中的权重逐一进行赋值,经过加权计算后得到工业用地的污染潜势得分,对高风险等级的疑似污染场地开展现场调查,以确认是否为污染场地点。
本发明公开了一种疑似污染场地的渐进识别方法,本发明基于我国当前工业用地基本属性、地表纹理、空间分布等特征,利用大数据、高分遥感影像,污染潜势模型技术手段,开展疑似污染场地渐进识别研究,实现大规模面上疑似污染场地快速筛查与判别的目的。第一,疑似污染场地渐进识别方法,完善了我国传统上结合现场取样监测完成的模式,极大节约了疑似污染场地信息获取的成本。第二,运用该方法识别出的疑似污染场地结果可以有效填补疑似污染场地时空数据库,为管理决策部门充分掌握本地疑似污染场地名录提供有益补充。
具体实施方式
下面结合具体实施方式对本发明作进一步详细的说明。
一种疑似污染场地的渐进识别方法,首先,运用大数据采集技术采集数据并利用网络爬虫爬取网络公开的工业用地上的多源异构数据,利用大数据处理技术对多源异构数据进行加工融合处理;数据采集技术的手段包括卫星遥感、传感器、射频识别、物联网以及移动平台技术手段进行采集的各种类型的结构化、半结构化及非结构化的数据;网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,给予爬虫初始URL,爬虫将网页中所需要提取的资源进行提取并保存,同时提取出网站中存在的其他网站链接,经过发送请求,接收网站响应以及再次解析页面,提取所需资源并保存,再将网页中所需资源进行提取,在该环节,主要借助网络爬虫或网站公开的API等方式,从各省市环保部门公开网站上获取企业用地、排污企业、污染地块等基础数据信息多源异构数据包括企业用地数据、疑似污染场地数据、污染突发事件新闻、统计数据、监测数据、排污企业数据;大数据处理技术结合水文气象、土地利用、地质土壤条件对多源异构数据进行加工融合处理,大数据处理技术功能主要为分析和处理数据,并获得有用信息,基于大数据技术的储存、处理、分析、融合等特点,将大数据处理流程划分为四步:数据存储、数据预处理、数据深入处理与数据挖掘。
数据存储是大数据处理的基础,具备良好的兼容性、拓展性、先进性、稳定性和安全性,并能满足复杂条件下的不同需求,数据存储基于Hadoop的技术扩展和封装,能够满足对于非结构、半结构化数据处理、复杂的ETL流程、复杂的数据挖掘和计算模型的处理要求,将爬取网络获取的多源异构数据存储为统一的本地数据文件并以结构化方式进行存储;
由于数据来源结构复杂、类型多样,需要对采集到的原始数据进行清洗、填补、平滑、合并、规格化以及检查一致性等,将那些杂乱无章的数据转化为相对单一且便于处理的构型,以便为后期的数据分析奠定基础。数据预处理采用Data Stage、Data Flux、Informatica Power Center等方法对源数据进行清理,将其转换为单一或便于处理的结构,数据清理包括遗漏值处理、噪音数据处理、不一致数据处理,遗漏值处理采用全局常量、属性均值、可能值填充或者直接忽略该数据方法处理;噪音数据处理采用分箱、聚类、计算机人工检查和回归方法去除噪音;不一致数据处理不一致数据处理采用手动更正,经过数据清理后,所有数据信息都被整合为一套以企业用地为对象的数据清单;
在数据预处理后,进一步对数据进行数据深入处理数据深入处理包括机器学习、智能算法、统计分析和***建模,数据深入处理将清理后的企业用地的数据清单结合地理信息大数据,如POI热点、地形地貌、土壤地质等,进一步获取单个企业用地的地理属性特征,丰富企业用地为对象清单的内容;
在数据进行深入处理后,为了把隐藏在一大批看来杂乱无章的数据中的信息集中起来,进行萃取、提炼,以找出潜在有用的信息和所研究对象的内在规律的过程,采用Meta分析方法、基于数据驱动的挖掘方法和基于过程机理的模型-数据融合方法对大数据进行整合挖掘获得科学性、融合性和有效性信息;在此环节中,将丰富后的企业用地数据清单,根据单一企业用地在产或停用情况、规模现状、产排污等信息,借助相关分析、回归分析、聚类分析以及主成分分析等,分析单个企业用地形成的驱动力因子,并形成区域内所有行业企业用地的空间分布热地区,从点到面,分层次分尺度地分析企业用地形成机制。
其次,结合遥感技术对选取对爬取的工业用地进行筛选,遥感影像的选取中,由于我国幅员辽阔,区域差异显著,研究过程中不仅需要考虑不同卫星传感器的覆盖区域,还需要考虑我国南北方气候差异,主要是植被、积雪、降雨、云层等因素;如江苏省、云南省等南方地区,由于夏季较长,雨水、云较多,很难获取质量较好的影像,因此,影像数据一般选择在当年的11月至次年3月初内;北京市、内蒙古自治区等北方地区,由于受天气影响较小,可选择全年范围内的遥感数据,但考虑植被对建筑物的影响,积雪对所有敏感用地的影响,最好选择在积雪融化后且植被未覆盖的时间段内,如每年的2月末至5月初;以云南省个旧市研究区为例,通过查看陆地观测卫星数据服务平台发现,GF-1卫星的PMS传感器2018年、2019年没有包含个旧市的影像;GF-2卫星的PMS传感器2018年没有涵盖个旧市的遥感影像,从2019年1月13日至2019年6月5日期间共获取涵盖个旧市的遥感影像31景,其中11景质量较好,主要集中在1月份和2月份;GF-6卫星的PMS传感器从2018年7月4日至2019年5月3日期间共获取涵盖个旧市的遥感影像16景,其中质量较好、云量较少的影像为5景,获取时间为2018年11月底-2019年2月底;ZY3卫星的MUX传感器在2018年1月4日至2019年5月1日期间共获取涵盖个旧市的遥感影像22景,其中质量较好的10景,获取时间主要集中在3月初;因此,对于云南省个旧市来说,截止2019年6月上旬,选取GF-6卫星、时相为2018年11月初至2019年3月中旬的遥感影像数据比较合适建立遥感影像样本库;
以石油化工行业企业为例,样本的建立主要是根据遥感影像的色调、色彩、形状、阴影、纹理、大小、空间位置、图形等,建立各种地物与卫星影像特征的对应关系;经过人工现场调查获得各类敏感用地现场图片,经过人工现场调查和POI数据通过目视解译的方法获取工业用地的空间位置,在影像数据上进行标注,获取遥感影像上的工业用地的样本,并通过提取各类样本的光谱特征、几何结构、纹理特征以及其他自定义特征等建立工业用地的遥感解译样本特征库;随机抽取样本库中70%样本作为训练集,深度学习技术开展疑似污染场地的研究,并利用剩余30%样本作为测试集,进行模型的有效性评估;
运用面向对象识别技术,采用多尺度影像分割对原始影像数据进行分割,实现从基于像元的遥感影像分类过渡到基于对象的遥感影像分类,采用深度学习技术从训练集中自动学习有效特征;面向对象的识别技术基于对象的分类方法是在影像分割的基础上,利用其光谱特征、纹理特征、形状特征空间几何属性信息以及语义信息进行图像处理,以影像分割生成的影像对象为研究对象,影像分割就是生成影像对象的过程,即通过影像分割算法将影像分割成若干个同质的、在空间上连续的并且具有特定专题意义的对象,多尺度影像分割基于光谱特征、形状特征相结合的异质性最小原则的区域合并,计算每一对空间相邻区域的相异准则之,确定最小的相异准则之为阙值,若两相邻区域的相异准则值等于阙值则合并两个相邻区域;深度学习技术通过对网络的学习,模拟人类大脑处理数据的过程,由深度网络获得数据的本质特征,并通过对低层特征整合,来表达高层特征,采用预训练的深度学习模型构建网络基本卷积层和池化层,然后利用样本对模型进行训练,提取各类敏感用地的特征,再利用精度评估函数对模型进行优化,得到最终的深度学习模型。
然后,基于大数据技术和遥感技术获得工业用地指标,输入污染潜势模型,计算工业用地的污染潜势值,从而实现疑似污染场地的渐进识别;污染潜势模型包括模型构建、指标体系、量化标准以及汇总赋分。
污染潜势模型是本技术中的重点及难点。模型构建初期参考了以下资料:(1)国内相关技术规范:建设用地土壤污染风险评估技术导则、建设用地土壤污染状况调查技术导则等;(2)国内相关做法:生态环境部与经济政策研究中心“环境污染责任保险风险评估指南”;(3)国际相关经验参考:美国联邦有毒物质释放清册(Toxics Release Inventory,简称TRI)数据库各行业类别企业每年地下水及土壤释放量&人体毒性潜势(HTP)分析;国际工厂土壤及地下水污染潜势评估及调查计划之污染潜势分级/筛选计量模式;欧盟环境责任指令强化保险可持续发展解决方案、职业活动所致污染的概念模型等;国际再保险人与环境损害责任保险风险评估实务;
指标体系以污染扩散基本路径、污染源、传输途径、受体承载为依据,构建包含污染潜势特性维度、传输途径维度、受体风险维度在内的指标体系;污染潜势特征维度包括企业规模、行业类别、生产年限、注册资本、污染物种类、是否为国控污染源、是否为全口径涉重金属行业企业、是否具有危险废物经营许可证、是否进去地方检索用地土壤污染风险管控和修复名录、是否具有排污许可证书、是否有异常经营记录、是否有媒体报道污染事件、行政处罚、环保处罚;传输途径维度包括地形坡度、土壤质地、土壤PH值、土壤介质、地下水埋深、水里传到系数、净入渗量;受体风险维度包括人口密度、边界1km以内是否有城镇、是否有水源保护地、是否位于生态红线区、是否有基本农田保护区、是否有敏感受体。
量化标准依据污染潜势特征维度、传输途径维度、受体风险维度,污染潜势特征维度是根据行业类别来客观量化数据,再依据本土化高污染潜势行业类别特征污染物向环境的平均释放量,结合专家专业判断,估算了各行业类别代表的原始分,参考表1;
表1
Figure BDA0002981906050000091
Figure BDA0002981906050000101
根据行业类别调整,结合企业工艺流程、潜在污染设施以及厂区现状调整因子,对各行业类别基础分作进一步调整,以真正反映目标建设用地的实际污染风险潜势,参考表2;
表2
Figure BDA0002981906050000102
*高污染潜势制程主要指电镀、冶炼、热解、铸造、活性树脂生产、水或油溶性洗涤剂之金属脱脂等
*高污染潜势设施储存含重金属固体储槽、柴油、加热燃料储槽、矿物油储槽、有害固体废弃物储存设施、强酸液体储槽与加油设施等
*调整总分范围:-2≤X+8,且不得大于所属行业代表原始分。
根据规模、营运年限、主体变更系数判别:企业规模结合数据可获取情况分为大、中、小、小微型、微型五种;不同规模结合不同营运年限等级产生S2-1(初步规模&营运年限系数),再乘以S2-2(主体变更风险影响调整系数)取得S2,参考表3、表4;
表3
Figure BDA0002981906050000103
Figure BDA0002981906050000111
表4
Figure BDA0002981906050000112
传输途径维度:环境传输途径(Pathway)评析是以污染物经环境介质中或传输途径的快慢或停留时间长短来决定其风险大小,并参考美国环保署委托美国水井协会(National Water Well Association)研拟之地下水污染潜势评估(DRASTIC)***,评估地下水环境受污染潜势的脆弱度,参考表5;
表5
Figure BDA0002981906050000113
Figure BDA0002981906050000121
受体风险维度,参考表6;
表6
Figure BDA0002981906050000122
汇总赋分:将通过大数据技术和遥感技术获得的数据结果,根据上述指标体系中的权重逐一进行赋值,经过加权计算后得到工业用地的污染潜势得分。并且,只需要对高风险等级(风险等级为5或6)的疑似污染场地开展现场调查,以确认是否为污染场地,参考表7和表8;
表7
Figure BDA0002981906050000123
表8
Figure BDA0002981906050000124
最后,将计算得到工业用地的污染潜势值,与国家生态环境部门发布的污染地块名录进行结果比对,高潜势得分的疑似污染场地中,有85%以上与国家名录中的污染地块名单相吻合,说明该方法的验证效果较好,可使用性较高。
本发明公开了一种疑似污染场地的渐进识别方法,本发明基于我国当前工业用地基本属性、地表纹理、空间分布等特征,利用大数据、高分遥感影像,污染潜势模型技术手段,开展疑似污染场地渐进识别研究,实现大规模面上疑似污染场地快速筛查与判别的目的。第一,疑似污染场地渐进识别方法,完善了我国传统上结合现场取样监测完成的模式,极大节约了疑似污染场地信息获取的成本。第二,运用该方法识别出的疑似污染场地结果可以有效填补疑似污染场地时空数据库,为管理决策部门充分掌握本地疑似污染场地名录提供有益补充。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。

Claims (10)

1.一种疑似污染场地的渐进识别方法,其特征在于:所述方法的步骤为:
步骤一,运用大数据技术采集网络公开的工业用地相关的多源异构数据,并对多源异构数据进行加工融合处理;
步骤二,结合遥感技术对选取对工业用地进行筛选,运用面向对象识别技术对原始影像数据进行分割,采用深度学习技术从训练集中自动学习有效特征;
步骤三,基于大数据技术和遥感技术获得工业用地指标,输入污染潜势模型,计算单个工业用地地块的污染潜势值,筛选出疑似污染场地;
步骤四,将计算得到工业用地的污染潜势值导入工业用地信息数据库中,进行结果验证确认污染场地点。
2.根据权利要求1所述的疑似污染场地的渐进识别方法,其特征在于:所述步骤一大数据技术,包括大数据采集技术和大数据处理技术,借助大数据采集技术和网络爬虫技术爬取网络公开的工业用地相关的多源异构数据,利用大数据处理技术对多源异构数据进行加工融合处理。
3.根据权利要求2所述的疑似污染场地的渐进识别方法,其特征在于:所述步骤二大数据采集技术的手段,包括卫星遥感、传感器、射频识别、物联网以及移动平台。
4.根据权利要求2或3所述的疑似污染场地的渐进识别方法,其特征在于:所述大数据处理技术对多源异构数据进行加工融合处理的步骤分为:数据存储、数据预处理、数据深入处理与数据挖掘。
5.根据权利要求4所述的疑似污染场地的渐进识别方法,其特征在于:所述步骤二中结合遥感技术对选取和爬取的工业用地进行筛选,建立遥感影像样本库,运用面向对象识别技术,采用多尺度影像分割对原始影像数据进行分割,实现从基于像元的遥感影像分类过渡到基于对象的遥感影像分类;深度学习技术通过对网络的学习,模拟人类大脑处理数据的过程,采用预训练的深度学习模型构建网络基本卷积层和池化层,然后利用样本对模型进行训练,提取各类敏感用地的特征,再利用精度评估函数对模型进行优化,得到最终的深度学习模型。
6.根据权利要求5所述的疑似污染场地的渐进识别方法,其特征在于:所述数据存储基于Hadoop的技术扩展和封装,将爬取网络获取的多源异构数据存储为统一的本地数据文件并以结构化方式进行存储;所述数据预处理对多源异构数据进行数据清理,将其转换为单一或便于处理的结构,数据清理包括遗漏值处理、噪音数据处理、不一致数据处理,遗漏值处理采用全局常量、属性均值、可能值填充或者直接忽略该数据方法处理;噪音数据处理采用分箱、聚类、计算机人工检查和回归方法去除噪音;不一致数据处理不一致数据处理采用手动更正,经过数据清理后,所有数据信息都被整合为一套以企业用地为对象的数据清单;所述数据深入处理包括机器学习、智能算法、统计分析和***建模,数据深入处理将清理后的企业用地的数据清单结合地理信息大数据,进一步获取单个企业用地的地理属性特征,丰富企业用地为对象清单的内容;所述数据挖掘采用Meta分析方法、基于数据驱动的挖掘方法以及基于过程机理的模型-数据融合方法对大数据进行整合挖掘获得科学性、融合性和有效性信息,将丰富后的企业用地的数据清单,根据单一企业用地在产或停用情况、规模现状、产排污信息,借助相关分析、回归分析、聚类分析以及主成分分析,分析单个工业用地地块形成的驱动力因子,并形成区域内所有工业用地地块的空间分布热地区,从点到面,分层次分尺度地分析工业用地形成机制。
7.根据权利要求6所述的疑似污染场地的渐进识别方法,其特征在于:所述步骤三中污染潜势模型包括模型构建、指标体系、量化标准以及汇总赋分。
8.根据权利要求7所述的疑似污染场地的渐进识别方法,其特征在于:所述指标体系以污染扩散基本路径、污染源、传输途径、受体承载为依据,构建包含污染潜势特性维度、传输途径维度、受体风险维度在内的指标体系;污染潜势特征维度包括企业规模、行业类别、生产年限、注册资本、污染物种类、是否为国控污染源、是否为全口径涉重金属行业企业、是否具有危险废物经营许可证、是否进去地方检索用地土壤污染风险管控和修复名录、是否具有排污许可证书、是否有异常经营记录、是否有媒体报道污染事件、行政处罚、环保处罚;传输途径维度包括地形坡度、土壤质地、土壤PH值、土壤介质、地下水埋深、水里传到系数、净入渗量;受体风险维度包括人口密度、边界1km以内是否有城镇、是否有水源保护地、是否位于生态红线区、是否有基本农田保护区、是否有敏感受体。
9.根据权利要求8所述的疑似污染场地的渐进识别方法,其特征在于:所述量化标准依据污染潜势特征维度、传输途径维度、受体风险维度,污染潜势特征维度是根据行业类别来客观量化数据,再依据本土化高污染潜势行业类别特征污染物向环境的平均释放量,结合专家专业判断,估算了各行业类别代表的原始分;根据行业类别调整,结合企业工艺流程、潜在污染设施以及厂区现状调整因子,对各行业类别基础分作进一步调整,以真正反映目标建设用地的实际污染风险潜势;根据规模、营运年限、主体变更系数判别;传输途径维度是以污染物经环境介质中或传输途径的快慢或停留时间长短来决定其风险大小,评估地下水环境受污染潜势的脆弱度。
10.根据权利要求9所述的疑似污染场地的渐进识别方法,其特征在于:所述汇总赋分是将通过大数据技术和遥感技术获得的数据结果,根据所述指标体系中的权重逐一进行赋值,经过加权计算后得到工业用地的污染潜势得分,对高风险等级的疑似污染场地开展现场调查,以确认是否为污染场地点。
CN202110290595.9A 2021-03-18 2021-03-18 一种疑似污染场地的渐进识别方法 Pending CN112950047A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110290595.9A CN112950047A (zh) 2021-03-18 2021-03-18 一种疑似污染场地的渐进识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110290595.9A CN112950047A (zh) 2021-03-18 2021-03-18 一种疑似污染场地的渐进识别方法

Publications (1)

Publication Number Publication Date
CN112950047A true CN112950047A (zh) 2021-06-11

Family

ID=76226570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110290595.9A Pending CN112950047A (zh) 2021-03-18 2021-03-18 一种疑似污染场地的渐进识别方法

Country Status (1)

Country Link
CN (1) CN112950047A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241326A (zh) * 2022-02-24 2022-03-25 自然资源部第三地理信息制图院 一种渐进式遥感影像地物要素智能生产方法及***
CN116385689A (zh) * 2023-06-02 2023-07-04 北京建工环境修复股份有限公司 一种场地污染数据的可视化信息管理方法、***及介质
CN117591506A (zh) * 2024-01-12 2024-02-23 南京大学 基于融合模型的场地土壤与地下水环境监测数据清洗方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107340364A (zh) * 2017-05-31 2017-11-10 北京市环境保护监测中心 基于海量大气污染浓度数据的污染空间分析方法及装置
CN110096490A (zh) * 2018-10-18 2019-08-06 苏州科技大学 污染场地数据库及其构建方法
CN111651432A (zh) * 2020-06-11 2020-09-11 中科山水(北京)科技信息有限公司 一种疑似污染场地时空信息识别方法
CN111666909A (zh) * 2020-06-11 2020-09-15 中科山水(北京)科技信息有限公司 基于面向对象和深度学习的疑似污染场地空间识别方法
CN111915197A (zh) * 2020-08-07 2020-11-10 厦门青霭信息科技有限公司 一种基于多源地理大数据的企业环境损害潜势评估方法
CN112070056A (zh) * 2020-09-17 2020-12-11 京师天启(北京)科技有限公司 一种基于面向对象和深度学习的敏感用地识别方法
CN112329706A (zh) * 2020-11-23 2021-02-05 京师天启(北京)科技有限公司 一种基于遥感技术的采矿用地识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107340364A (zh) * 2017-05-31 2017-11-10 北京市环境保护监测中心 基于海量大气污染浓度数据的污染空间分析方法及装置
CN110096490A (zh) * 2018-10-18 2019-08-06 苏州科技大学 污染场地数据库及其构建方法
CN111651432A (zh) * 2020-06-11 2020-09-11 中科山水(北京)科技信息有限公司 一种疑似污染场地时空信息识别方法
CN111666909A (zh) * 2020-06-11 2020-09-15 中科山水(北京)科技信息有限公司 基于面向对象和深度学习的疑似污染场地空间识别方法
CN111915197A (zh) * 2020-08-07 2020-11-10 厦门青霭信息科技有限公司 一种基于多源地理大数据的企业环境损害潜势评估方法
CN112070056A (zh) * 2020-09-17 2020-12-11 京师天启(北京)科技有限公司 一种基于面向对象和深度学习的敏感用地识别方法
CN112329706A (zh) * 2020-11-23 2021-02-05 京师天启(北京)科技有限公司 一种基于遥感技术的采矿用地识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王夏晖;黄国鑫;朱文会;季国华;: "大数据支持场地污染风险管控的总体技术策略", 环境保护, vol. 47, no. 13, pages 14 *
申敏夏: "精准治霾进入大数据时代", 中国气象报, pages 1 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241326A (zh) * 2022-02-24 2022-03-25 自然资源部第三地理信息制图院 一种渐进式遥感影像地物要素智能生产方法及***
CN116385689A (zh) * 2023-06-02 2023-07-04 北京建工环境修复股份有限公司 一种场地污染数据的可视化信息管理方法、***及介质
CN116385689B (zh) * 2023-06-02 2023-08-04 北京建工环境修复股份有限公司 一种场地污染数据的可视化信息管理方法、***及介质
CN117591506A (zh) * 2024-01-12 2024-02-23 南京大学 基于融合模型的场地土壤与地下水环境监测数据清洗方法
CN117591506B (zh) * 2024-01-12 2024-03-22 南京大学 基于融合模型的场地土壤与地下水环境监测数据清洗方法

Similar Documents

Publication Publication Date Title
Kumar et al. Appraising the accuracy of GIS-based multi-criteria decision making technique for delineation of groundwater potential zones
Khodaparast et al. Municipal solid waste landfill siting by using GIS and analytical hierarchy process (AHP): a case study in Qom city, Iran
Zamorano et al. Evaluation of a municipal landfill site in Southern Spain with GIS-aided methodology
CN112950047A (zh) 一种疑似污染场地的渐进识别方法
Rajput et al. Modification and optimization of DRASTIC model for groundwater vulnerability and contamination risk assessment for Bhiwadi region of Rajasthan, India
Kazuva et al. GIS-and MCD-based suitability assessment for optimized location of solid waste landfills in Dar es Salaam, Tanzania
CN112070056A (zh) 一种基于面向对象和深度学习的敏感用地识别方法
CN111666909A (zh) 基于面向对象和深度学习的疑似污染场地空间识别方法
Werz et al. Groundwater risk intensity mapping in semi-arid regions using optical remote sensing data as an additional tool
Vaezihir et al. Total vulnerability estimation for the Tabriz aquifer (Iran) by combining a new model with DRASTIC
Ren et al. Analysis of the spatial characteristics of inhalable particulate matter concentrations under the influence of a three-dimensional landscape pattern in Xi'an, China
Taubenböck et al. Remote sensing—An effective data source for urban monitoring
Zhou Application of artificial intelligence in geography
Fodor et al. Application of environmental information systems in environmental impact assessment (in Hungary)
Rosli et al. Sustainable urban forestry potential based quantitative and qualitative measurement using geospatial technique
Hossain et al. Neural network based estimation of service life of different metal culverts in Arkansas
CN107885833A (zh) 基于Web新闻文本快速检测地表覆盖变化的方法及***
Baki et al. A modified DRASTIC model for groundwater vulnerability assessment using connecting path and analytic hierarchy process methods
CN113360835A (zh) 一种面向疑似污染地块的污染潜势评估方法
Haghparast et al. Comprehensive Environmental Monitoring based on Stations of Environmental Pollutants (Air, Water and Soil) in Tehran
Carver et al. Wildness Study in the Cairngorms National Park
Kherde et al. Integrating Geographical Information Systems (GIS) with Hydrological Modelling—Applicability and Limitations
Tapia-McClung et al. Defining city boundaries through percolation theory: the case of the mexican urban system
Xiang-zheng et al. Internet based environmental monitoring information system and its application in Yili Prefecture
Dhaoui Urban sprawl: The GIS and remote sensing data assessments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination