CN111339392B - 一种基于气象要素的天空蓝指数确定方法及*** - Google Patents

一种基于气象要素的天空蓝指数确定方法及*** Download PDF

Info

Publication number
CN111339392B
CN111339392B CN202010226425.XA CN202010226425A CN111339392B CN 111339392 B CN111339392 B CN 111339392B CN 202010226425 A CN202010226425 A CN 202010226425A CN 111339392 B CN111339392 B CN 111339392B
Authority
CN
China
Prior art keywords
blue
sky
date
meteorological
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010226425.XA
Other languages
English (en)
Other versions
CN111339392A (zh
Inventor
黄刚
王素
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Atmospheric Physics of CAS
Original Assignee
Institute of Atmospheric Physics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Atmospheric Physics of CAS filed Critical Institute of Atmospheric Physics of CAS
Priority to CN202010226425.XA priority Critical patent/CN111339392B/zh
Publication of CN111339392A publication Critical patent/CN111339392A/zh
Application granted granted Critical
Publication of CN111339392B publication Critical patent/CN111339392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于气象要素的天空蓝指数确定方法及***,该方法包括:收集气象观测站点的气象观测数据,对气象观测数据进行质量控制后得到气象要素数据库;采用语义引擎技术对蓝天关键词进行网页搜索,通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期;将蓝天日期传输至气象要素数据库中进行气象定位,提取蓝天日期所对应的气象要素,利用神经网络模型挑选出与蓝天相关联的气象要素以及气象要素的满足条件,得到备选天空蓝指数;采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数。该方法实现提高天空蓝指数的准确性。

Description

一种基于气象要素的天空蓝指数确定方法及***
技术领域
本发明涉及计算机技术领域,特别是涉及一种基于气象要素的天空蓝指数确定方法及***。
背景技术
随着中国经济的快速发展和城市化进程的加速,大气污染问题愈发显著。气象局对霾这样的污染现象进行了定义,便于对重霾时间进行研究,帮助政府决策并解决污染问题。但是随着《大气污染防治行动计划》的开展,蓝天正在越来越多的出现在民众的视野中。“北京蓝”跃然走红的背后,是人们对蓝天的巨大向往。在党关于建设美丽中国的全新理念下,在实施蓝天保卫战三年行动计划后,人们渴望一个更加直接简明的定义,能包含新时期他们对好天气和好空气的双重渴望。对政府而言,为了检验“蓝天中国”计划的有效性,反映中国蓝长期变化及与经济发展之间的关系并服务于未来政策,需建立一个基于长期记录的蓝直接指标。
当讨论蓝天时,气象学家只考虑云量,而环境学家只关注空气质量。但人们追求的“蓝天”指的不仅是天蓝,还是空气质量优良的一天,它在概念上应结合这两个因素的影响。但是比起霾这种污染天气,蓝作为大概率事件,被研究人员忽视,因此始终缺乏一个准确的定义。
由于目前仅有对霾的定义,缺乏对蓝的准确统一定义即天空蓝指数,因此,如何获取天空蓝指数,提高天空蓝指数的准确性是亟待解决的问题。
发明内容
本发明的目的是提供一种基于气象要素的天空蓝指数确定方法及***,以实现提高天空蓝指数的准确性。
为解决上述技术问题,本发明提供一种基于气象要素的天空蓝指数确定方法,包括:
收集气象观测站点的气象观测数据,对气象观测数据进行质量控制后得到气象要素数据库;
设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期,并通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期;
将蓝天日期传输至气象要素数据库中进行气象定位,提取蓝天日期所对应的气象要素,利用气象要素从蓝天日期中再次排除雨雪日期,并利用神经网络模型挑选出与蓝天相关联的气象要素以及气象要素的满足条件,得到备选天空蓝指数;
获取城市空气质量数据,采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数。
优选的,所述对气象观测数据进行质量控制后得到气象要素数据库,包括:
利用R语言对气象观测数据进行质量控制,将能见度转换为干能见度;
利用matlab软件对质量控制后的气象观测数据进行预处理,建立气象要素数据库。
优选的,所述通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期,包括:
利用Python爬虫技术下载气象观测站点的历史天气现象数据,查找出记录为晴天且无雨雪的日期并作为参考日期,将从网页搜索结果中获取的蓝天日期与所述参考日期进行比对,将蓝天日期与参考日期中相同的日期作为标准蓝天日期。
优选的,所述获取城市空气质量数据,采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数,包括:
利用Python爬虫技术下载气象观测站点的城市空气质量数据,形成对应日期长度的空气质量指数AQI记录,查找出AQI小于等于100的日期并作为标记日期;
利用预报质量检验方法计算每个备选天空蓝指数在标记日期的预报准确率、空报率以及漏报率,通过权重评分方式从所有备选天空蓝指数中选择出最优的备选天空蓝指数并作为标准天空蓝指数。
本发明还提供一种基于气象要素的天空蓝指数确定***,用于实现上述方法,包括:
前处理***,用于收集气象观测站点的气象观测数据,对气象观测数据进行质量控制后得到气象要素数据库;
语义选择***,用于设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期,并通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期;
气象定位***,用于将蓝天日期传输至气象要素数据库中进行气象定位,提取蓝天日期所对应的气象要素,利用气象要素从蓝天日期中再次排除雨雪日期,并利用神经网络模型挑选出与蓝天相关联的气象要素以及气象要素的满足条件,得到备选天空蓝指数;
验证***,用于获取城市空气质量数据,采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数。
优选的,所述前处理***包括:
收集模块,用于收集气象观测站点的气象观测数据;
转换模块,用于利用R语言对气象观测数据进行质量控制,将能见度转换为干能见度;
建立模块,用于利用matlab软件对质量控制后的气象观测数据进行预处理,建立气象要素数据库。
优选的,所述语义选择***包括:
设置模块,用于设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期;
下载模块,用于利用Python爬虫技术下载气象观测站点的历史天气现象数据,查找出记录为晴天且无雨雪的日期并作为参考日期;
比对模块,用于将从网页搜索结果中获取的蓝天日期与所述参考日期进行比对,将蓝天日期与参考日期中相同的日期作为标准蓝天日期。
优选的,所述验证***包括:
下载模块,用于利用Python爬虫技术下载气象观测站点的城市空气质量数据,形成对应日期长度的空气质量指数AQI记录,查找出AQI小于等于100的日期并作为标记日期;
计算模块,用于利用预报质量检验方法计算每个备选天空蓝指数在标记日期的预报准确率、空报率以及漏报率,通过权重评分方式从所有备选天空蓝指数中选择出最优的备选天空蓝指数并作为标准天空蓝指数。
本发明所提供的一种基于气象要素的天空蓝指数确定方法及***,收集气象观测站点的气象观测数据,对气象观测数据进行质量控制后得到气象要素数据库;设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期,并通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期;将蓝天日期传输至气象要素数据库中进行气象定位,提取蓝天日期所对应的气象要素,利用气象要素从蓝天日期中再次排除雨雪日期,并利用神经网络模型挑选出与蓝天相关联的气象要素以及气象要素的满足条件,得到备选天空蓝指数;获取城市空气质量数据,采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数。可见,根据现有气象观测站点,环保局公布的空气质量数据和历史天气现象数据,基于各站点利用多因素综合评定来定义蓝指数,能根据各站点长期气象监测情况和空气污染演变情况定义出最适宜于本地的天空蓝指数,实现获取城市天空蓝模型和长期蓝数据集,并且提高天空蓝指数的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明所提供的一种基于气象要素的天空蓝指数确定方法的流程图;
图2为单站蓝实现***的流程示意图;
图3为区域/全国蓝实现***的流程示意图;
图4为蓝动态检测***的流程示意图;
图5为中国气象观测站点分布图;
图6为历史天气现象及空气质量数据记录网站形式示意图;
图7为气象数据原始格式示意图;
图8为本发明所提供的一种基于气象要素的天空蓝指数确定***结构示意图。
具体实施方式
本发明的核心是提供一种基于气象要素的天空蓝指数确定方法及***,以实现提高天空蓝指数的准确性。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的一种基于气象要素的天空蓝指数确定方法的流程图,该方法包括以下步骤:
S11:收集气象观测站点的气象观测数据,对气象观测数据进行质量控制后得到气象要素数据库;
S12:设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期,并通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期;
S13:将蓝天日期传输至气象要素数据库中进行气象定位,提取蓝天日期所对应的气象要素,利用气象要素从蓝天日期中再次排除雨雪日期,并利用神经网络模型挑选出与蓝天相关联的气象要素以及气象要素的满足条件,得到备选天空蓝指数;
S14:获取城市空气质量数据,采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数。
可见,本方法中,根据现有气象观测站点,环保局公布的空气质量数据和历史天气现象数据,基于各站点利用多因素综合评定来定义蓝指数,能根据各站点长期气象监测情况和空气污染演变情况定义出最适宜于本地的天空蓝指数,实现获取城市天空蓝模型和长期蓝数据集,并且提高天空蓝指数的准确性。
基于上述方法,进一步的,步骤S11中,对气象观测数据进行质量控制后得到气象要素数据库的过程包括以下步骤:
S21:利用R语言对气象观测数据进行质量控制,将能见度转换为干能见度;
S22:利用matlab软件对质量控制后的气象观测数据进行预处理,建立气象要素数据库。
进一步的,步骤S12中,通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期的过程具体为:利用Python爬虫技术下载气象观测站点的历史天气现象数据,查找出记录为晴天且无雨雪的日期并作为参考日期,将从网页搜索结果中获取的蓝天日期与所述参考日期进行比对,将蓝天日期与参考日期中相同的日期作为标准蓝天日期。
进一步的,步骤S14的过程具体包括以下步骤:
S31:利用Python爬虫技术下载气象观测站点的城市空气质量数据,形成对应日期长度的空气质量指数AQI记录,查找出AQI小于等于100的日期并作为标记日期;
S32:利用预报质量检验方法计算每个备选天空蓝指数在标记日期的预报准确率、空报率以及漏报率,通过权重评分方式从所有备选天空蓝指数中选择出最优的备选天空蓝指数并作为标准天空蓝指数。
进一步的,步骤S14之后,还包括以下步骤:
S15:获取实时预报气象数据,依据标准天空蓝指数对实时预报气象数据进行分析,得到天空蓝的判断结果并对判断结果进行发布。
进一步的,步骤S15之后,还包括以下步骤:
S16:对于每个城市,根据天空蓝指数建立长期蓝日记录数据库,根据每天的气象要素实时更新每个城市的天空蓝判定结果,将天空蓝判定结果上传至网页。
如此,通过步骤S16实现全国蓝时空分布的网页实时更新。
为了满足对蓝的长期研究和实时预报需求,本方法根据现有气象观测站点,环保局公布的空气质量数据和历史天气现象数据,基于各站点利用多因素综合评定来定义蓝指数,本方法能根据各站点长期气象监测情况和空气污染演变情况定义出最适宜于本地的蓝指数,并通过该指数对本地蓝进行实时预报,得到更加令人信服的结果。同时,由于空气质量观测时间过短,为了得到蓝的长期时间演变,采用能见度数据代替空气质量数据作为“好空气”的替代。
由于现有记录的限制,2011年以后才有网站对中国城市历史天气现象进行记录,2013年以后空气质量监测才在全国开展,缺乏对晴天和空气质量数据的长时间的实际观测记录,因此建立长期模型时本方法主要通过分析已有蓝事件选取气象要素,本方法依然能较为准确、清晰的对蓝做出判定,具有可操作性。
本方法基于地面气象观测资料、空气质量监测数据及相关技术和算法,可以动态判定各城市实时蓝天情况,建立各城市蓝模型和长期数据集,并实现对站点进行需求挑选。
需要说明的是,本方法中,步骤S11的执行者为前处理***,步骤S12的执行者为语义选择***,步骤S13的执行者为气象定位***,步骤S14的执行者为验证***,步骤S15的执行者为实时预报***。
请参考图2,图2为单站蓝实现***的流程示意图。对于单站蓝实现***,指数的确定主要是满足“好天气”和“好空气”两部分的定义。处理方法主要分为前处理***,语义选择***,气象定位***,验证***,实时预报***。
在前处理***中,基于步骤S11,具体的,首先与有关气象部门对接,收集全国地面气象观测站点数据,包括能见度、云量、温度、降水、日照时数、相对湿度等常用数据。利用R语言对数据进行质量控制后,将能见度转化为干能见度,以消除湿度对能见度观测数据的影响。利用matlab等处理软件对以上数据进行预处理,建立基于单站点的气象要素数据库。
语义选择***中,基于步骤S12,具体的,利用语义引擎技术以“XX(即城市名)蓝天”、“XX蓝”、“XX好天气”等关键词进行网页搜索,找出涉及到的新闻报道及微博信息等,以人工智能***对数据进行分析提炼,并确定记录为蓝的日期。同时利用Python爬虫技术下载该站点历史天气现象数据,定位到记录为“晴”、且无雨雪的日期,与出现蓝日期进行比对,确定提取蓝日期具备可靠性。该***可在确保信息来源较为准确的情况下充分反映满足人们期望。
气象定位***中,基于步骤S13,具体的,将以上找到日期传输到已建立的数据库,进行气象定位。定位城市后调取对应日期的气象要素,首先排除所有白天产生降水或者雪的天气,这是为了防止历史天气现象记录有误,利用神经网络模型,在确定挑选日期满足能见度等级良好以上(由气象局定义)、空气质量优良以上(由环保局定义)的前提下,挑选出与蓝日出现显著相关的气象要素及满足条件,如判定出提取蓝日满足的云量阈值、绝对值,能见度阈值、绝对值。从而得到该站点备选定义,备选天空蓝指数包括气象要素的绝对值和阈值的各种可能组合,即备选天空蓝指数为多个,包括气象要素的绝对值的限制范围,和/或,气象要素的阈值的限制范围。气象要素为天空蓝对应的气象要素。
在验证***中,基于步骤S14,具体的,首先基于以上备选定义指数各建立一套该站点的长期蓝记录。然后利用Python爬虫技术下载该城市空气质量数据,形成对应时间长度的AQI(即空气质量指数)记录。利用建立气象数据库标记AQI级别为良好(即AQI<=100)、无雨雪的日期。利用预报质量检验方法计算各备选指数对标记日期的预报率,确保对“好空气”的解释方差。最后利用TS*0.6+PO*0.2+FAR*0.2的权重对各备选指数进行评分。得分率最高的为该地的蓝指数,对应蓝记录数据集为该地长期蓝记录。其中,预报质量检验方法的计算公式如下:
对于预报准确率TS,
Figure GDA0003902032740000091
NA+ND为预报正确次数,NB为空报次数,NC为漏报次数;
对于漏报率PO,
Figure GDA0003902032740000092
对于空报率FAR,
Figure GDA0003902032740000093
请参考图3,图3为区域/全国蓝实现***的流程示意图。对于区域/全国蓝实现***,在需要对区域(如全省,全区域)或者全国进行统一标准的分析时,本方法同样适用,对于不同需求可以实现定制方案,以下以中国蓝指数的实现为例。
前处理***完成后,以全国32个省会城市作为该省代表,利用语义引擎技术以上述关键词对32省市进行网页搜索,并分析提炼,完成语义选择。在气象定位中,对神经网络模型得到的全国满足记录为“晴”的蓝日对应的主要气象要素,利用箱形图对蓝当日数值进行无区别重组并判定出上四分位数、下四分位数及中位数,帮助判定在全国范围内最为适用的气象要素及满足条件。
在验证***中,挑选代表站点AQI验证备选指数的准确性。对得到的32城市质量检验结果取平均值,再进行加权评分,得到结果。
请参考图4,图4为蓝动态检测***的流程示意图。对于蓝动态检测***,得到该地蓝指数后,结合当天实时预报气象数据和Python爬虫技术下载的空气质量数据可以实现对蓝的实时判定,同时,利用2013年以后空气质量数据的全国普及预报,对有误判定进行及时更改,并利用实时预报***将结果及时发布到网站。
由于目前只对霾这样的恶劣天气现象进行报道,而蓝的报道才能直接反映人民需求,满足人们出行、工作的需要。但是对于蓝,气象局只关注云量,以云的面积占据天空的百分比作为判别依据。而另一方面,环保局只关注空气质量,将AQI作为是否是好天气的唯一判定标准。然而,气象局的定义未考虑到随着国家经济发展导致的大气污染现象,环保局的定义未考虑到人们对蓝天白云的渴求。蓝的出现,是一个气象与空气质量的双重概念,属于交叉学科的范畴,已有的两种定义无法准确反映“蓝天”,更无法反应人们的直接期望。本方法第一次提出“蓝”的交叉概念,建立针对各地不同情况,不同需求的蓝模型,得到实时和长期中国蓝数据集。请参考图5、图6和图7,图5为中国气象观测站点分布图,图6为历史天气现象及空气质量数据记录网站形式示意图,图7为气象数据原始格式示意图。
本方法具有重要的应用前景,如下:
(1)一方面制定蓝指数,实现对蓝的动态监测,建立实时播报平台和历史数据平台,给予民众实时信息,利于特定人群出行,即时服务于各行业需要,提升民众幸福感;
(2)实现对全国蓝分布的统计和蓝信息的追踪更新,作为政府监测指标,能定量化检验蓝天中国的执行程度,为政策制定提供参考,为大型赛事、活动提供选择服务,例如指定城市选择最适宜举办赛事时间,或指定时间选择最适宜举办赛事城市,另外对太阳能清洁能源应用方面,为国家能源战略提供参考;
(3)对蓝分布的理解能够帮助人们更好的制定节能减排清单,帮助判别自然和人为在污染产生中的占比,可服务于过去污染产生的研究,对重大活动赛事举办前的人为调控服务,更利于国家的可持续发展;
(4)天空蓝指数同样具备商业价值,对定义按照不同需求修改后,可以作为旅游指数,作为城市旅游名片,在大型城市霾污染严重的当下,适宜旅游健康的城市悄然改变,对追求好天气和好空气的旅游者而言城市蓝程度尤为重要;同时,各城市地区蓝的分布和出现频次不同,适宜旅游季节不同,蓝指数的应用能为判定电影拍摄时间、旅游节设计、对城市旅游经济发展决策等都可以提供有利信息;
(5)由于我国老龄化问题严重,养老社区在未来是重大发展前景,城市蓝对社区选址建设能提供关键参考,因此能为养老院的城市选择服务,可推动中小型城市保险业、夕阳产业的发展;
(6)蓝长期记录的建立有助于宜居城市的评定,未来由于大城市人口饱和,青年将趋于向中小型城市流动,因此蓝指数对推动中小型城市的发展有重要意义;
(7)已建立的蓝指数模型通过建模已具备一定的预测能力,同时作为潜在预测指标,通过与气象模式建立关系,能够更准确的做出对我国蓝未来发展趋势的预测,将有助于今后政策的制定;
(8)目前各地没有一个统一的蓝天判定标准,为国家开展各地蓝天检测工作,政策执行力度评判检查工作带来了困难;利用该定义有利于统一全国定义,便于比较不同城市执行力度和达标天数,使得对比更为严格化;
(9)随着全球化经济贸易的开展,全球移民移居可能是未来一个高速发展的方向。将中国蓝扩展为全球蓝将为移民移居以及国际旅游业服务,为移居国家、城市的选择提供参考;
(10)通过提高时间和空间分辨率,拓展到小时和全球尺度,对蓝的长期时空分布进行更精细的描述,根据历史数据,能够服务于国家工农业布局,便于进行产业化结构调整;
(11)该定义计算简单,可移植性强,通过引入人工智能,可以进行临近及长时间快速预报。扩展性强,服务于各行业需求;
(12)该指数根据各行业需求可转换为各种衍生指数,例如旅游指数,农业开展指数,移民指数等。
在2011年后,已有网站数据对中国城市天气现象进行记录。2013年以后,该方法得以结合空气质量数据。那么在缺乏需求站点气象数据时,即缺乏空气质量数据时,应该如何实现在缺乏空气质量数据情况下对长期蓝指数的定义,可选的,本方法利用距离权重插值以临近站点数据替代,通过以下方案实现蓝指数的提取,主要方案如下:
首先,对于蓝指数的确定,处理方法主要分为前处理***,语义选择***,气象定位***,验证***,实时预报***。
其次,在前处理***中,首先与有关气象部门数据对接,收集全国地面气象观测站点数据,包括能见度、云量、温度、降水、日照时数、相对湿度等常用数据。利用R语言对数据进行质量控制后,将能见度转化为干能见度,以消除湿度对能见度观测数据的影响。利用matlab等处理软件对以上数据进行预处理,建立基于单站点的气象要素数据库。通过半径搜索找到缺乏气象数据的站点(AA)附近20KM(这里具体数字由城市规模确定)以内的其他站点(XX)及气象数据,通过距离权重插值作为该站点气象数据的参考。
其中,语义选择***中,利用语义引擎技术以“XX/AA(城市名)蓝天”、“XX/AA蓝”、“XX/AA好天气”等关键词进行网页搜索,找出涉及到的新闻报道及微博信息等,以人工智能***对数据进行分析提炼,并确定记录为蓝的日期。同时利用Python爬虫技术下载该站点AA历史天气现象数据,若无该站点同样通过距离加权法用XX进行替代,定位到记录为“晴”、且无雨雪的日期,与出现蓝日期进行比对,确定提取蓝日期具备可靠性。
其中,在定位气象***中,将以上找到日期传输到已建立的数据库,进行气象定位。定位城市后调取对应日期的气象要素,首先排除所有白天产生降水或雪的天气,利用神经网络模型,在确定挑选日期满足能见度等级良好以上(由气象局定义)、空气质量优良以上(由环保局定义)的前提下,挑选出与蓝日出现显著相关的气象要素及满足条件,如判定出提取蓝日满足的云量阈值、绝对值,能见度阈值、绝对值,从而得到该站点备选定义。备选天空蓝指数包括气象要素的绝对值和阈值的各种可能组合。
最后在验证***中,首先基于以上备选定义指数各建立一套该站点的长期蓝记录。然后利用Python爬虫技术下载该城市空气质量数据,若无该站点同样通过距离加权法用XX进行替代,形成对应时间长度的AQI(即空气质量指数)记录。利用建立气象数据库标记AQI级别为良好(即AQI<=100)、无雨雪的日期。利用预报质量检验方法计算各备选指数对标记日期的预报率,确保对“好空气”的解释方差。最后利用TS*0.6+PO*0.2+FAR*0.2的权重对各备选指数进行评分。得分率最高的为该地的蓝指数,对应蓝记录数据集为该地长期蓝记录。
其中,当无法取得气象数据,但需要高精度的蓝分布情况,或需要大范围实时蓝检测时。利用Python爬虫技术,下载高分卫星数据(例如MODIS卫星,HIMAWARI-8卫星),利用反演算法进行数据融合,克服卫星数据缺测过多的缺陷,进行预处理后对AOD进行反演,结合Python爬虫技术定位到范围内所有站点的空气质量数据和天气现象记录。将以上数据传输到蓝判定***,通过AOD数据结合空气质量指数(AQI<=100)和天气现象(无降水、降雪)三者共同满足判定出实时蓝分布情况。并将数据在实时预报***中以图像和单站点预报形式动态播报。
请参考图8,图8为本发明所提供的一种基于气象要素的天空蓝指数确定***结构示意图,该天空蓝指数确定***用于实现上述方法,包括:
前处理***101,用于收集气象观测站点的气象观测数据,对气象观测数据进行质量控制后得到气象要素数据库;
语义选择***102,用于设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期,并通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期;
气象定位***103,用于将蓝天日期传输至气象要素数据库中进行气象定位,提取蓝天日期所对应的气象要素,利用气象要素从蓝天日期中再次排除雨雪日期,并利用神经网络模型挑选出与蓝天相关联的气象要素以及气象要素的满足条件,得到备选天空蓝指数;
验证***104,用于获取城市空气质量数据,采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数。
可见,本***中,根据现有气象观测站点,环保局公布的空气质量数据和历史天气现象数据,基于各站点利用多因素综合评定来定义蓝指数,能根据各站点长期气象监测情况和空气污染演变情况定义出最适宜于本地的天空蓝指数,实现获取城市天空蓝模型和长期蓝数据集,并且提高天空蓝指数的准确性。
基于天空蓝指数确定***,进一步的,所述前处理***包括:
收集模块,用于收集气象观测站点的气象观测数据;
转换模块,用于利用R语言对气象观测数据进行质量控制,将能见度转换为干能见度;
第一建立模块,用于利用matlab软件对质量控制后的气象观测数据进行预处理,建立气象要素数据库。
进一步的,所述语义选择***包括:
设置模块,用于设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期;
下载模块,用于利用Python爬虫技术下载气象观测站点的历史天气现象数据,查找出记录为晴天且无雨雪的日期并作为参考日期;
比对模块,用于将从网页搜索结果中获取的蓝天日期与所述参考日期进行比对,将蓝天日期与参考日期中相同的日期作为标准蓝天日期。
进一步的,所述验证***包括:
下载模块,用于利用Python爬虫技术下载气象观测站点的城市空气质量数据,形成对应日期长度的空气质量指数AQI记录,查找出AQI小于等于100的日期并作为标记日期;
计算模块,用于利用预报质量检验方法计算每个备选天空蓝指数在标记日期的预报准确率、空报率以及漏报率,通过权重评分方式从所有备选天空蓝指数中选择出最优的备选天空蓝指数并作为标准天空蓝指数。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种基于气象要素的天空蓝指数确定方法及***进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (4)

1.一种基于气象要素的天空蓝指数确定方法,其特征在于,该方法使用基于气象要素的天空蓝指数确定***和实时预报***,方法步骤包括:
S11:收集气象观测站点的气象观测数据,对气象观测数据进行质量控制后得到气象要素数据库;
S12:设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期,并通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期;
S13:将蓝天日期传输至气象要素数据库中进行气象定位,提取蓝天日期所对应的气象要素,利用气象要素从蓝天日期中再次排除雨雪日期,并利用神经网络模型挑选出与蓝天相关联的气象要素以及气象要素的满足条件,得到备选天空蓝指数;
S14:获取城市空气质量数据,采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数;
步骤S11中,对气象观测数据进行质量控制后得到气象要素数据库,包括:
S21:利用R语言对气象观测数据进行质量控制,将能见度转换为干能见度;
S22:利用matlab软件对质量控制后的气象观测数据进行预处理,建立气象要素数据库;
步骤S12中,通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期,包括:
利用Python爬虫技术下载气象观测站点的历史天气现象数据,查找出记录为晴天且无雨雪的日期并作为参考日期,将从网页搜索结果中获取的蓝天日期与所述参考日期进行比对,将蓝天日期与参考日期中相同的日期作为标准蓝天日期;
步骤S14的过程具体包括以下步骤:
S31:利用Python爬虫技术下载气象观测站点的城市空气质量数据,形成对应日期长度的空气质量指数AQI记录,查找出AQI小于等于100的日期并作为标记日期;
S32:利用预报质量检验方法计算每个备选天空蓝指数在标记日期的预报准确率、空报率以及漏报率,通过权重评分方式从所有备选天空蓝指数中选择出最优的备选天空蓝指数并作为标准天空蓝指数;
步骤S14之后,还包括以下步骤:
S15:获取实时预报气象数据,依据标准天空蓝指数对实时预报气象数据进行分析,得到天空蓝的判断结果并对判断结果进行发布;
步骤S15之后,还包括以下步骤:
S16:对于每个城市,根据天空蓝指数建立长期蓝日记录数据库,根据每天的气象要素实时更新每个城市的天空蓝判定结果,将天空蓝判定结果上传至网页;
如此,通过步骤S16实现全国蓝时空分布的网页实时更新;
该基于气象要素的天空蓝指数确定***包括以下模块:
前处理***,用于收集气象观测站点的气象观测数据,对气象观测数据进行质量控制后得到气象要素数据库;
语义选择***,用于设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期,并通过网络爬虫技术下载气象观测站点的历史天气现象数据,利用历史天气现象数据从蓝天日期中排除雨雪日期;
气象定位***,用于将蓝天日期传输至气象要素数据库中进行气象定位,提取蓝天日期所对应的气象要素,利用气象要素从蓝天日期中再次排除雨雪日期,并利用神经网络模型挑选出与蓝天相关联的气象要素以及气象要素的满足条件,得到备选天空蓝指数;
验证***,用于获取城市空气质量数据,采用预报质量检验方法并结合城市空气质量数据从备选天空蓝指数中选择出最优的天空蓝指数作为城市标准天空蓝指数;
在验证***中,预报质量检验方法的计算公式如下:
对于预报准确率TS,
Figure FDA0003902032730000031
NA+ND为预报正确次数,NB为空报次数,NC为漏报次数;
对于漏报率PO,
Figure FDA0003902032730000032
对于空报率FAR,
Figure FDA0003902032730000033
其中,步骤S11的执行者为前处理***,步骤S12的执行者为语义选择***,步骤S13的执行者为气象定位***,步骤S14的执行者为验证***,步骤S15的执行者为实时预报***。
2.如权利要求1所述的天空蓝指数确定方法,其特征在于,所述前处理***包括:
收集模块,用于收集气象观测站点的气象观测数据;
转换模块,用于利用R语言对气象观测数据进行质量控制,将能见度转换为干能见度;
建立模块,用于利用matlab软件对质量控制后的气象观测数据进行预处理,建立气象要素数据库。
3.如权利要求1所述的天空蓝指数确定方法,其特征在于,所述语义选择***包括:
设置模块,用于设置蓝天关键词,采用语义引擎技术对蓝天关键词进行网页搜索,从网页搜索结果中获取蓝天日期;
下载模块,用于利用Python爬虫技术下载气象观测站点的历史天气现象数据,查找出记录为晴天且无雨雪的日期并作为参考日期;
比对模块,用于将从网页搜索结果中获取的蓝天日期与所述参考日期进行比对,将蓝天日期与参考日期中相同的日期作为标准蓝天日期。
4.如权利要求1所述的天空蓝指数确定方法,其特征在于,所述验证***包括:
下载模块,用于利用Python爬虫技术下载气象观测站点的城市空气质量数据,形成对应日期长度的空气质量指数AQI记录,查找出AQI小于等于100的日期并作为标记日期;
计算模块,用于利用预报质量检验方法计算每个备选天空蓝指数在标记日期的预报准确率、空报率以及漏报率,通过权重评分方式从所有备选天空蓝指数中选择出最优的备选天空蓝指数并作为标准天空蓝指数。
CN202010226425.XA 2020-03-27 2020-03-27 一种基于气象要素的天空蓝指数确定方法及*** Active CN111339392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010226425.XA CN111339392B (zh) 2020-03-27 2020-03-27 一种基于气象要素的天空蓝指数确定方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010226425.XA CN111339392B (zh) 2020-03-27 2020-03-27 一种基于气象要素的天空蓝指数确定方法及***

Publications (2)

Publication Number Publication Date
CN111339392A CN111339392A (zh) 2020-06-26
CN111339392B true CN111339392B (zh) 2023-02-03

Family

ID=71182788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010226425.XA Active CN111339392B (zh) 2020-03-27 2020-03-27 一种基于气象要素的天空蓝指数确定方法及***

Country Status (1)

Country Link
CN (1) CN111339392B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115796402B (zh) * 2023-02-08 2023-05-12 成都理工大学 一种基于组合模型的空气质量指数预测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108196317A (zh) * 2018-02-06 2018-06-22 南京邮电大学 一种用于微电网***的气象预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108701274B (zh) * 2017-05-24 2021-10-08 北京质享科技有限公司 一种城市小尺度空气质量指数预测方法与***
CN108563739B (zh) * 2018-04-11 2021-05-04 平安科技(深圳)有限公司 天气数据获取方法及装置、计算机装置及可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108196317A (zh) * 2018-02-06 2018-06-22 南京邮电大学 一种用于微电网***的气象预测方法

Also Published As

Publication number Publication date
CN111339392A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN112800634B (zh) 耦合干湿状态辨识与多源信息融合的降水估计方法及***
CN102520464B (zh) 区域积涝预报***及其预报方法
CN111696369B (zh) 一种基于多源地理空间大数据的全市道路分时分车型交通流预测方法
CN109782373B (zh) 一种基于改进的Naive Bayesian-CNN多目标分类算法的沙尘暴预测方法
CN113487123B (zh) 高光谱监测与gis耦合山洪灾害动态风险评估方法
CN109165693B (zh) 一种适用于露、霜和结冰的天气现象的自动判识方法
CN101673369A (zh) 基于投影寻踪的排水管网洪涝风险评价方法
CN110750516B (zh) 基于雷达图的降雨分析模型构建方法、构建***及分析方法
CN112949953B (zh) 基于pp理论和af模型的暴雨预报方法
CN114997499A (zh) 一种半监督学习下的城市颗粒物浓度时空预测方法
Bi et al. The impact of urban green space morphology on PM2. 5 pollution in Wuhan, China: A novel multiscale spatiotemporal analytical framework
CN111445116A (zh) 国土空间规划辅助编制***
He et al. Comparative performance of the LUR, ANN, and BME techniques in the multiscale spatiotemporal mapping of PM 2.5 concentrations in North China
CN115412857B (zh) 一种居民出行信息预测方法
CN111339392B (zh) 一种基于气象要素的天空蓝指数确定方法及***
Wang et al. Spatiotemporal characterization of the urban sprawl and its impacts on urban island in China with DMSP/OLS and MODIS measurements
CN115575601A (zh) 基于水汽通量散度的植被旱灾指数评估方法和***
CN115236770B (zh) 基于时空堆叠和样本重构的非线性短时临近降水预报方法
Chen et al. Spatio-temporal evolution and future scenario prediction of karst rocky desertification based on CA–Markov model
Jia et al. Monitoring of UN sustainable development goal SDG-9.1. 1: Study of Algerian “Belt and Road” expressways constructed by China
AU2021100350A4 (en) Method for Predicting Reclamation Potential of Homestead
CN114139984A (zh) 基于流量与事故协同感知的城市交通事故风险预测方法
CN113780880A (zh) 一种基于空间代表性的pm2.5观测站点布局评价方法
CN112818923A (zh) 一种城市群居住空间建成时间识别方法
Zhang et al. Air pollution estimation under air stagnation—A case study of Beijing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Huang Gang

Inventor after: Wang Su

Inventor before: Wang Su

Inventor before: Huang Gang

GR01 Patent grant
GR01 Patent grant