CN111651432A - 一种疑似污染场地时空信息识别方法 - Google Patents
一种疑似污染场地时空信息识别方法 Download PDFInfo
- Publication number
- CN111651432A CN111651432A CN202010532408.9A CN202010532408A CN111651432A CN 111651432 A CN111651432 A CN 111651432A CN 202010532408 A CN202010532408 A CN 202010532408A CN 111651432 A CN111651432 A CN 111651432A
- Authority
- CN
- China
- Prior art keywords
- suspected
- data
- site
- directory
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 239000013589 supplement Substances 0.000 claims abstract description 6
- 238000012795 verification Methods 0.000 claims abstract description 4
- 238000004458 analytical method Methods 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 19
- 238000007726 management method Methods 0.000 claims description 14
- 238000004140 cleaning Methods 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 claims description 13
- 230000009193 crawling Effects 0.000 claims description 11
- 238000011835 investigation Methods 0.000 claims description 8
- 238000005065 mining Methods 0.000 claims description 7
- 239000000047 product Substances 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 6
- 238000012482 interaction analysis Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 239000003344 environmental pollutant Substances 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 4
- 231100000719 pollutant Toxicity 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000013523 data management Methods 0.000 claims description 3
- 238000012938 design process Methods 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 230000008676 import Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 1
- 239000000463 material Substances 0.000 abstract description 4
- 239000002689 soil Substances 0.000 abstract description 3
- 238000010276 construction Methods 0.000 description 11
- 238000003900 soil pollution Methods 0.000 description 4
- 238000012550 audit Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 210000001520 comb Anatomy 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Operations Research (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种疑似污染场地时空信息识别方法,包括以下步骤:步骤一、设计疑似污染地名录数据库表结构;步骤二、分析疑似污染场地表征的各项指标的数据源;步骤三、获取疑似污染场地名录指标;步骤四、对初步获取的疑似污染场地名录进行信息验证与补充;步骤五、建立疑似污染场地动态名录库。本发明完善了我国传统上结合统计上报疑似污染场地信息的模式,极大节约了疑似污染场地名录信息获取的成本,并保障了信息的全面性和***性;基于发明成果建立的疑似污染场地时空数据库,为实现疑似污染场地相关数据源共享,提升土壤环境保护相关部门的协同工作能力,节约时间和经济成本,减少了人力物力和成本提供了可能。
Description
技术领域
本发明涉及一种识别方法,尤其涉及一种疑似污染场地时空信息识别方法。
背景技术
伴随着社会经济的发展,我国存在潜在污染的建设用地数量巨大、分布广泛,并逐步显示出其危害性,与当前生态文明建设要求严重不符,亟需摸清污染场地台账,加强污染场地管理。由于我国对污染场地问题关注的比较晚,污染场地的调查与管理尚处于起步阶段,缺乏全国尺度的污染场地基础台账信息;结合欧美发达国家经验,污染场地调查评估需要花费较大的人力、物力和财力,在开展现场调查之前掌握准确的疑似污染场地名录信息能够极大的压缩污染场地调查评估成本;当前我国疑似污染场地名录的建立,包括正在开展的“第二次全国污染源普查”,主要是结合各种不同业务目标,通过行政管理方法,由各级管理机构逐级统计上报,在全面性方面存在较大的不足。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种疑似污染场地时空信息识别方法。
为了解决以上技术问题,本发明采用的技术方案是:一种疑似污染场地时空信息识别方法,包括以下步骤:
步骤一、设计疑似污染地名录数据库表结构,实现疑似污染地时空信息表征;
步骤二、分析疑似污染场地名录各项指标的数据源;
步骤三、结合步骤二的疑似污染场地数据源分析,实现疑似污染场地名录指标信息的初步挖掘;
步骤四、对初步挖掘的疑似污染场地名录进行信息验证与补充;
步骤五、建立疑似污染场地动态名录库。
进一步地,步骤一中,疑似污染地名录数据库表结构的设计过程为:
通过收集与研究相关文件和文献资料,分析我国污染场地管理的业务需求,构建以地块为基础的疑似污染场地数据管理模型;结合国家、行业标准,利用对象编码规则以及数据库表结构化表达,并保持相关术语的语义一致,设计疑似污染地名录数据库表结构。
进一步地,疑似污染地名录数据库的名录表中包括的字段有:对象唯一标识指标,如对象名称、对象编码;对象时空信息指标,如所在位置、经纬度、成立时间、投产时间、关停时间;对象管理属性指标,如企业规模、行政处罚及环境处罚信息、经营信息、信用指标;对象污染属性指标,如行业类别、主要污染物、污染类别。
进一步地,步骤二中疑似污染场地数据的分析过程为:
在我国污染场地管理的业务需求分析成果基础上,进一步通过对相关业务部门调研、行业专家咨询以及资料检索、收集、分析,确定疑似污染场地各项表征指标的数据来源。
进一步地,疑似污染场地各个指标的数据源包括:已有可共享数据库、生态环境部门网站、政府及其他部门网站、专业企业工商信息网站、相关社会组织网站以及公共地图网站。
进一步地,步骤三中,结合疑似污染场地数据源分析,针对不同的数据源、原始数据存在形式采用不同的数据获取策略,获取疑似污染场地的名录指标,包括:
(1)对于已有可共享的数据库,通过ETL数据抽取转换技术获取相关名录指标;
(2)对于网页中的文件,先将文件下载到本地,再结合数据处理工具,结合分类、对比等方法,通过计算机自动分析和人机交互分析实现对象去重,整合形成统一的对象,同时提取部分关键指标;
(3)对于网页中的某个指标,结合语义分析,利用数据爬取工具,辅以编码工作,实现对应指标的信息爬取;
(4)对于对象的空间位置信息,结合反地理编码以及人机交互分析获取其经纬度坐标;
通过以上数据指标挖掘方法,从多源地理大数据数据源中,分析、提取、融合得到疑似污染场地的名录指标,初步形成疑似污染场地时空信息数据库。
进一步地,步骤四中,结合潜在污染行业、工艺流程和工艺产品的知识、相关数据清洗技术和遥感数据人机交互识别技术,对初步形成的疑似污染场地时空信息进行数据清洗、质量审核以及补充,包括以下环节:
(1)对于下载文件的数据融合成果,通过抽样审查的方法,分地区抽取疑似污染场地名录信息,对包括对象一致性判别、对象指标语义理解是否准确等进行分析与审查;
(2)对于通过数据爬取工具爬取的成果,通过抽样审查方法,随机抽取疑似污染场地名录信息,结合潜在污染行业、工艺流程和工艺产品以及对象的经营范围,分析所爬取的对象是否为疑似污染场地,并结合分析成果提出数据清洗策略,开展批量清洗;
(3)抽取部分对象,与区域土地利用类别数据进行对比,对所属行业类别对应土地利用不一致的提出质疑与完善;
(4)抽取部分对象,结合高精度遥感影像进行判别,分析对象在指定空间位置存在的客观性。
进一步地,通过数据库物理建库、数据导入等方式建立疑似污染场地数据库;同步构建疑似污染场地名录更新机制,包括明确数据更新频率,明确不同区域、不同行业疑似污染场地名录更新数据源,明确具体名录指标的数据源获取顺序,从而构建全国尺度的疑似污染场地动态名录库。
本发明公开了一种疑似污染场地时空信息识别方法,获取我国建设用地中疑似污染场地名录信息,识别场地空间位置和存续时间,以及行业类别、主要污染物等重要属性信息,发挥了全国尺度疑似污染场地时空信息建设、更新维护的目的,完善了我国传统上结合统计上报疑似污染场地信息的模式,极大节约了疑似污染场地名录信息获取的成本,并保障了信息的全面性和***性;基于发明成果建立的疑似污染场地时空数据库,为实现疑似污染场地相关数据源共享,提升土壤环境保护相关部门的协同工作能力,节约时间和经济成本,减少了人力物力和成本提供了可能。
具体实施方式
下面结合具体实施方式对本发明作进一步详细的说明。
本发明公开了一种疑似污染场地时空信息识别方法,基于对存在潜在污染的行业、工艺的研究,结合同时期的污染场地行业数据、网络数据以及基础地理信息,融合自然语言处理、时空数据挖掘、高分辨率遥感场景分类和云计算等技术,实现全国尺度疑似污染场地名录及其时间、空间等重要属性信息的自动识别,保障名录信息的全面性和***性,为提升我国污染场地环境监管能力提供技术支持。
对于本发明所公开的疑似污染场地时空信息识别方法,其采用的技术方案主要包括以下步骤:
步骤一、设计疑似污染地名录数据库表结构,实现疑似污染地时空信息表征;
步骤二、分析疑似污染场地各项指标的数据源;
步骤三、结合步骤二的疑似污染场地数据源分析,实现疑似污染场地名录指标信息的初步挖掘;
步骤四、对初步挖掘的疑似污染场地名录进行信息验证与补充;
步骤五、建立疑似污染场地动态名录库。
其中,步骤一中,疑似污染地名录数据库的设计过程为:
通过收集与研究相关文件和文献资料,分析我国污染场地管理的业务需求,构建以地块为基础的疑似污染场地数据管理模型;结合国家、行业标准,利用对象编码规则以及数据库表结构化表达,并保持相关术语的语义一致,设计疑似污染地名录数据库,设计成功邀请相关专家咨询、会议评审;通常,使用的文件和文献资料有《土壤污染防治行动计划》、《建设用地土壤污染风险管控和修复术语》、《建设用地土壤污染状况调查技术导则》、《建设用地土壤污染风险评估技术导则》等;设计好后的疑似污染地名录数据库的名录表中包括的字段有:对象唯一标识指标,如对象名称、对象编码;对象时空信息指标,如所在位置、经纬度、成立时间、投产时间、关停时间;对象管理属性指标,如企业规模、行政处罚及环境处罚信息、经营信息、信用指标;对象污染属性指标,如行业类别、主要污染物、污染类别等。
步骤二中疑似污染场地数据的分析过程为:
在我国污染场地管理的业务需求分析成果基础上,进一步通过对相关业务部门调研、行业专家咨询以及资料检索、收集、分析,确定疑似污染场地各个指标的数据来源。经分析,本发明确定的疑似污染场地各个指标的数据源包括:已有可共享数据库、生态环境部门网站、政府及其他部门网站、专业企业工商信息网站、相关社会组织网站以及公共地图网站等。
步骤三中,疑似污染场地名录指标获取的过程为:结合疑似污染场地数据源分析,针对不同的数据源、原始数据存在形式采用不同的数据获取策略,获取疑似污染场地的名录指标,具体的为:
(1)对于已有可分享的数据库,通过ETL数据抽取转换技术获取相关名录指标;
(2)对于网页中的文件,先将文件下载到本地,再结合数据处理工具,结合分类、对比等方法,通过计算机自动分析和人机交互分析实现对象去重,整合形成统一的对象,同时提取部分关键指标;
(3)对于网页中的某个指标,结合语义分析,利用数据爬取工具,辅以必要的编码工作,对于数据爬取工具无法直接获取的指标,例如从非结构化命名的文件中获取特定业务需求的文件,或者从文件中分析、提取特定业务意义的指标等,最终,实现对应指标的信息爬取;
(4)对于对象的空间位置信息,结合反地理编码以及人机交互分析获取其经纬度坐标;
通过以上数据指标获取方法,从多源地理大数据数据源中,分析、提取、融合得到疑似污染场地的名录指标,初步形成疑似污染场地时空信息数据库。
获取了疑似污染场地名录指标后,需对初步的疑似污染场地名录信息进行验证与补充,具体过程为:
结合以上疑似污染场地多源数据源分析以及对象指标数值获取,潜在的误差原因主要是人机交互判别时数据处理人员的自由裁量权以及数据源本身数据质量的问题;由此,本发明在结合潜在污染行业、工艺流程和工艺产品的知识、相关数据清洗技术和遥感数据人机交互识别技术,对初步形成疑似污染场地名录信息进行数据清洗、质量审核,以及必要的补充。主要环节包括:
(1)对于下载文件的数据融合成果,通过抽样审查的方法,分地区抽取一定数量的疑似污染场地名录信息,对包括对象一致性判别、对象指标语义理解是否准确等进行分析与审查;通常抽取的数量根据具体样本总数的多少,按比例进行抽取;
(2)对于通过数据爬取工具爬取的成果,通过抽样审查方法,随机抽取一定数量的疑似污染场地名录信息,结合潜在污染行业、工艺流程和工艺产品以及对象的经营范围,分析所爬取的对象是否为疑似污染场地,并结合分析成果提出数据清洗策略,开展批量数据清洗;同样抽取的数量根据具体样本总数的多少,按比例进行抽取;
(3)抽取部分对象,与区域土地利用类别数据对比,对于所属行业类别对应土地利用不一致的提出质疑与完善;
(4)抽取部分对象,结合高精度遥感影像进行判别,分析对象在指定空间位置存在的客观性。
最终,在以上成功的基础上,进行步骤五,即疑似污染地动态名录库的建立,通过数据库物理建库、数据导入等方式建立疑似污染场地数据库;同步构建疑似污染场地名录更新机制,包括明确数据更新频率,明确不同区域、不同行业疑似污染场地名录更新数据源,明确具体名录指标的数据源获取顺序,从而构建全国尺度的疑似污染场地动态名录库。
本发明所公开的疑似污染场地时空信息识别方法,针对我国当前基于统计上报方式建立疑似污染场地名录存在名录建设工作不***、名录范围不全面的问题,基于对存在潜在污染的国民经济行业和工业生产工艺的研究,利用多源地理大数据,结合信息化技术手段,研发实现疑似污染场地名录信息识别技术方法,保障我国疑似污染场地名录信息建设的全面性和完整性。
该疑似污染场地时空信息识别方法是在研究我国当前污染场地管理目标的基础上,设计疑似污染场地名录数据库,实现疑似污染场地时空信息的表征;***梳理疑似污染场地表征的各项指标的数据源,重点结合生态环境部门相关网站信息、工商企业信息和网络地图POI信息等,结合语义分析、数据爬取方法和数据清洗技术的应用,获取疑似污染场地名录指标;结合对潜在污染行业、工艺流程和产品的认识,以及疑似污染场地的纹理、光谱等特征,结合信息挖掘和遥感识别的技术,对初步获取的疑似污染场地进行补充完善与验证,最终建立全国尺度疑似污染场地名录动态数据库。
本发明所建立的疑似污染场地的技术方法,完善了我国传统上结合统计上报疑似污染场地信息的模式,极大节约了疑似污染场地名录信息获取的成本,并保障了信息的全面性和***性;基于发明成果建立的疑似污染场地时空数据库,为实现疑似污染场地相关数据源共享,提升土壤环境保护相关部门的协同工作能力,节约时间和经济成本,减少了人力物力和成本提供了可能。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。
Claims (8)
1.一种疑似污染场地时空信息识别方法,其特征在于:所述的方法包括以下步骤:
步骤一、设计疑似污染地名录数据库表结构,实现疑似污染地时空信息表征;
步骤二、分析疑似污染场地名录各项指标的数据源;
步骤三、结合步骤二的疑似污染场地数据源分析,实现疑似污染场地名录指标信息的初步挖掘;
步骤四、对初步挖掘的疑似污染场地名录进行信息验证与补充;
步骤五、建立疑似污染场地动态名录库。
2.根据权利要求1所述的疑似污染场地时空信息识别方法,其特征在于:步骤一中,疑似污染地名录数据库表结构的设计过程为:
通过收集与研充相关文件和文献资料,分析我国污染场地管理的业务需求,构建以地块为基础的疑似污染场地数据管理模型;结合国家、行业标准,利用对象编码规则以及数据库表结构化表达,并保持相关术语的语义一致,设计疑似污染地名录数据库表结构。
3.根据权利要求2所述的疑似污染场地时空信息识别方法,其特征在于:疑似污染地名录数据库表结构中包括的字段有:对象唯一标识指标,如对象名称、对象编码;对象时空信息指标,如所在位置、经纬度、成立时间、投产时间、关停时间;对象管理属性指标,如企业规模、行政处罚及环境处罚信息、经营信息、信用指标;对象污染属性指标,如行业类别、主要污染物、污染类别。
4.根据权利要求3所述的疑似污染场地时空信息识别方法,其特征在于:步骤二中疑似污染场地数据的分析过程为:
在我国污染场地管理业务需求分析成果基础上,进一步通过对相关业务部门调研、行业专家咨询以及资料检索、收集、分析,确定疑似污染场地各项表征指标的数据来源。
5.根据权利要求4所述的疑似污染场地时空信息识别方法,其特征在于:疑似污染场地各项表征指标的数据源包括:已有可共享数据库、生态环境部门网站、政府及其他部门网站、专业企业工商信息网站、相关社会组织网站以及公共地图网站。
6.根据权利要求5所述的疑似污染场地时空信息识别方法,其特征在于:步骤三中,结合疑似污染场地数据源分析,针对不同的数据源、原始数据存在形式采用不同的数据获取策略,初步实现疑似污染场地的名录指标信息挖掘,包括:
(1)对于已有可共享的数据库,通过ETL数据抽取转换技术获取相关名录指标;
(2)对于网页中的文件,先将文件下载到本地,再结合数据处理工具,结合分类、对比等方法,通过计算机自动分析和人机交互分析实现对象去重,整合形成统一的对象名录,同时提取部分关键指标;
(3)对于网页中的某个指标,结合语义分析,利用数据爬取工具,辅以编码工作,实现对应指标的信息爬取;
(4)对于对象的空间位置信息,结合反地理编码以及人机交互分析获取其经纬度坐标;
通过以上数据指标挖掘方法,从多源地理大数据数据源中,分析、提取、融合得到疑似污染场地的名录指标,初步形成疑似污染场地时空信息数据库。
7.根据权利要求6所述的疑似污染场地时空信息识别方法,其特征在于:步骤四中,结合潜在污染行业、工艺流程和工艺产品的知识、相关数据清洗技术和遥感数据人机交互识别技术,对初步形成疑似污染场地名录信息进行数据清洗、质量审核以及补充,包括以下环节:
(1)对于下载文件的数据融合成果,通过抽杆审查的方法,分地区抽取疑似污染场地名录信息,对包括对象一致性判别、对象指标语义理解是否准确等进行分析与审查;
(2)对于通过数据爬取工具爬取的成果,通过抽样审查方法,随机抽取的疑似污染场地名录信息,结合潜在污染行业、工艺流程和工艺产品以及对象的经营范围,分析所爬取的对象是否为疑似污染场地,并结合分析成果提出数据清洗策略,开展批量数据清洗;
(3)抽取部分对象,与区域土地利用类别数据进行对比,对所属行业类别对应土地利用不一致的提出质疑与完善;
(4)抽取部分对象,结合高精度遥感影像进行判别,分析对象在指定空间位置存在的客观性。
8.根据权利要求7所述的疑似污染场地时空信息识别方法,其特征在于:通过数据库物理建库、数据导入等方式建立疑似污染场地数据库;同步构建疑似污染场地名录更新机制,包括明确数据更新频率,明确不同区域、不同行业疑似污染场地名录更新数据源,明确具体名录指标的数据源获取顺序,从而构建全国尺度的疑似污染场地动态名录库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010532408.9A CN111651432B (zh) | 2020-06-11 | 2020-06-11 | 一种疑似污染场地时空信息识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010532408.9A CN111651432B (zh) | 2020-06-11 | 2020-06-11 | 一种疑似污染场地时空信息识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111651432A true CN111651432A (zh) | 2020-09-11 |
CN111651432B CN111651432B (zh) | 2024-04-23 |
Family
ID=72351412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010532408.9A Active CN111651432B (zh) | 2020-06-11 | 2020-06-11 | 一种疑似污染场地时空信息识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111651432B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329706A (zh) * | 2020-11-23 | 2021-02-05 | 京师天启(北京)科技有限公司 | 一种基于遥感技术的采矿用地识别方法 |
CN112950047A (zh) * | 2021-03-18 | 2021-06-11 | 京师天启(北京)科技有限公司 | 一种疑似污染场地的渐进识别方法 |
CN115495499A (zh) * | 2022-09-22 | 2022-12-20 | 生态环境部南京环境科学研究所 | 一种基于污染场地同介质多批次海量数据的整合统计方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101706904A (zh) * | 2009-11-25 | 2010-05-12 | 国家海洋环境监测中心 | 我国近岸海域优先控制污染物名录确定方法 |
CN106599396A (zh) * | 2016-11-25 | 2017-04-26 | 北京佳业佳境环保科技有限公司 | 针对污染场地修复的3d模型模拟方法 |
CN107967313A (zh) * | 2017-11-21 | 2018-04-27 | 中科宇图科技股份有限公司 | 一种基于字段数据和坐标共性合并不同行业数据的方法 |
CN108932574A (zh) * | 2017-05-27 | 2018-12-04 | 华北电力大学 | 基于地质统计学场地土壤污染信息*** |
US20190303785A1 (en) * | 2018-03-29 | 2019-10-03 | Azimuth1, LLC | Forecasting soil and groundwater contamination migration |
-
2020
- 2020-06-11 CN CN202010532408.9A patent/CN111651432B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101706904A (zh) * | 2009-11-25 | 2010-05-12 | 国家海洋环境监测中心 | 我国近岸海域优先控制污染物名录确定方法 |
CN106599396A (zh) * | 2016-11-25 | 2017-04-26 | 北京佳业佳境环保科技有限公司 | 针对污染场地修复的3d模型模拟方法 |
CN108932574A (zh) * | 2017-05-27 | 2018-12-04 | 华北电力大学 | 基于地质统计学场地土壤污染信息*** |
CN107967313A (zh) * | 2017-11-21 | 2018-04-27 | 中科宇图科技股份有限公司 | 一种基于字段数据和坐标共性合并不同行业数据的方法 |
US20190303785A1 (en) * | 2018-03-29 | 2019-10-03 | Azimuth1, LLC | Forecasting soil and groundwater contamination migration |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329706A (zh) * | 2020-11-23 | 2021-02-05 | 京师天启(北京)科技有限公司 | 一种基于遥感技术的采矿用地识别方法 |
CN112950047A (zh) * | 2021-03-18 | 2021-06-11 | 京师天启(北京)科技有限公司 | 一种疑似污染场地的渐进识别方法 |
CN115495499A (zh) * | 2022-09-22 | 2022-12-20 | 生态环境部南京环境科学研究所 | 一种基于污染场地同介质多批次海量数据的整合统计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111651432B (zh) | 2024-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111651432A (zh) | 一种疑似污染场地时空信息识别方法 | |
CA2712028C (en) | Geospatial database integration using business models | |
Garcillán et al. | Sampling procedures and species estimation: testing the effectiveness of herbarium data against vegetation sampling in an oceanic island | |
CN112288247B (zh) | 一种基于空间交互关系的土壤重金属风险识别方法 | |
Liao et al. | Applying crowdsourcing techniques in urban planning: A bibliometric analysis of research and practice prospects | |
CN111522955B (zh) | 诉讼案件分类方法、装置、计算机设备及存储介质 | |
Dong et al. | A gridded establishment dataset as a proxy for economic activity in China | |
CN116384889A (zh) | 基于自然语言处理技术的情报大数据智能分析方法 | |
CN112926852A (zh) | 一种基于数据融合的大气生态环境分析方法 | |
Manase et al. | A GIS analytical approach for exploring construction health and safety information | |
Wicquart et al. | A workflow to integrate ecological monitoring data from different sources | |
Hao et al. | Enhancing repository fungal data for biogeographic analyses | |
CN109388649B (zh) | 一种土地智能推荐方法及*** | |
Li et al. | The microgeo: an R package rapidly displays the biogeographic traits of soil microbial communities on maps | |
Holler et al. | Mainstreaming metadata into research workflows to advance reproducibility and open geographic information science | |
Altman | Designing community tracking indicators for open and inclusive scholarship | |
Noaeen et al. | Transportation engineering on social question and answer websites: an empirical case study | |
Correa et al. | Open science-based framework to reveal open data publishing: an experience from using Common Crawl | |
CN115934749B (zh) | 一种自然灾害综合风险普查数据一体化处理方法及应用 | |
CN110704604A (zh) | 一种基于incopat的土壤重金属修复专利技术分析方法 | |
Turner et al. | Defining and Measuring Traffic Data Quality: White Paper | |
Patra et al. | Design of an environmental information system for monitoring water and air quality in urban areas | |
Wooten | The US Nuclear Test History | |
Rahmah et al. | Open Government Data for Urban Management in Indonesia’s Smart Cities | |
McCarthy et al. | SEEDIS project: a summary overview of the Social, Economic, Environmental, Demographic Information System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |