CN113704558A - 一种以差分序列为基础的自动气象站自动集群方法及*** - Google Patents

一种以差分序列为基础的自动气象站自动集群方法及*** Download PDF

Info

Publication number
CN113704558A
CN113704558A CN202110982065.0A CN202110982065A CN113704558A CN 113704558 A CN113704558 A CN 113704558A CN 202110982065 A CN202110982065 A CN 202110982065A CN 113704558 A CN113704558 A CN 113704558A
Authority
CN
China
Prior art keywords
differential sequence
characteristic quantity
automatic
stations
station
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110982065.0A
Other languages
English (en)
Other versions
CN113704558B (zh
Inventor
文斌
汪波
张志强
袁正国
段卿
曾正茂
邱丽霞
张华琳
贺南
张�杰
冯正全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Meteorological Information Center Fujian Meteorological Archives
Chengdu University of Information Technology
Original Assignee
Fujian Meteorological Information Center Fujian Meteorological Archives
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Meteorological Information Center Fujian Meteorological Archives, Chengdu University of Information Technology filed Critical Fujian Meteorological Information Center Fujian Meteorological Archives
Priority to CN202110982065.0A priority Critical patent/CN113704558B/zh
Publication of CN113704558A publication Critical patent/CN113704558A/zh
Application granted granted Critical
Publication of CN113704558B publication Critical patent/CN113704558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于差分序列可比性高的自动气象站自动集群方法及***,属于气象技术领域。本发明根据自动气象站近地层大气能量变化规律,建立站点间大气要素值差分序列,采用数字信号分析和处理方法,提取差分序列信号特征量,建立下垫面相似性高的自动气象站的自动集群算法。本发明利用站群内气象要素值可比性高特点,建立气象要素值平衡体系,根据平衡体系,计算出下垫面人为改变或季节变化引起数据飘移的站点,通过平衡体系,建立更精细的气象数据质控算法,利用可比性,为多源气象数据、空地一体气象信息等的融合分析提供有效地面数据。

Description

一种以差分序列为基础的自动气象站自动集群方法及***
技术领域
本发明属于气象技术领域,尤其涉及一种以差分序列为基础的自动气象站自动集群方法。
背景技术
在气象观测业务大力发展下,全国自动气象站网格化布局已全部建成,10年来积累了大量的气象数据。在大力推进气象社会化服务现代化过程中,自动气象站资料的作用和地位不断提升和加强。但在实际运维和日常管理过程中,由于位置偏远、站点分散、人为与技术能力等诸多因素,大量自动气象站数据的可用性、可靠性、连续性没有得到保障。在网格化天气预报、气候分析、环境监测、精细化的气象服务及科学研究等众多气象数据应用中,自动气象站数据作用没有得到最大发挥。终其原因主要如下:
1、自动气象站与国家地面观测站的管理规范和标准相差较大,自动气象站的大气数据的质量标准下降,数据应用范围受到限制。
2、由于站点下垫面的改变,引起的数据飘移无法识别。网络化自动气象站相似垫面的特性,在空间一至性的质控上,作用没有得到充分发挥。
发明内容
针对现有技术中的上述不足,本发明提供的一种以差分序列为基础的自动气象站自动集群方法及***,以解决上述问题。
为了达到以上目的,本发明采用的技术方案为:
本方案提供一种以差分序列为基础的自动气象站自动集群方法,包括以下步骤:
S1、以在100公里内的所有国家地面观测站间每天最低温度时刻的气象数据形成第一差分序列,并提取第一差分序列信号特征量;
S2、分别取所述第一差分序列信号特征量的最大值和最小值,以最小值作为第一集群参考特征量,以最小值与最大值的中间值作为第二集群参考特征量;
S3、判断100公里内的所有国家地面观测站是否选取完成,若是,则进入步骤S6,否则,进入步骤S4;
S4、选取与国家气象站相距50公里的自动气象站,建立第二差分序列,并提取第二差分序列信号特征量;
S5、集合小于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第一站点集群,以及集合大于等于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第二站点集群,完成对自动气象站的自动集群处理;
S6、判断在选取的区域内自动气象站是否选取完成,若是,则完成自动气象站的自动集群处理,否则,进入步骤S7;
S7、选取与国家气象站相距30公里的自动气象站,建立第三差分序列,并提取第三差分序列信号特征量;
S8、集合大于等于所述第二集群参考特征量的第三差分序列信号特征量的所有自动气象站,形成第三站点集群,完成对自动气象站的自动集群处理。
本发明的有益效果是:本发明判断站点间下垫面相似度和气象数据可比性高的站点,根据自动气象站近地层大气能量变化原理,建立站点间关联大气要素差分数据分析序列,数据分析序列以季节为单位,形成90个长度的分析数据序列。如此数据序列满足正态分布特性,计算序列信号特征量,根据特征量越大,其两站点下垫面相似性高、两站气象数据可比性高,自动将两站集合一起。在同一集群内,建立站点间气象要素值平衡体系,监视下垫面人为改变或传感器引起数据飘移,通过站点间气象要素值平衡体系,建立更精细的集群内各自动气象站数据的质控算法,本发明根据该算法形成数据可比性强的站点集合,为气象要素质控、区域气气候分析、格点化气象预报、气象大数据服务等应用提供支撑。
进一步地,所述提取第一差分序列信号特征量、提取第二差分序列信号特征量以及提取第三差分序列信号特征量的流程均相同,其均包括以下步骤:
A1、以在固定区域内任意两个国家地面观测站间或自动气象站间每天最低温度时刻的气象数据,形成差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列;
A2、判断所述差分序列是否满足正态分布,若是,则进入步骤A3,否则,输出错误提示,并结束流程;
A3、计算所述差分序列的区间概率,并根据所述区间概率计算得到差分序列信号特征量,所述差分序列信号特征量为第一差分序列信号特征量、第二差分序列信号特征量或第三差分序列信号特征量。
上述进一步方案的有益效果是:本发明通过采用两站间同一时间点上对应的大气要素值作差,形成差分序列信号,以及通过计算正态分布在误差范围内测算两站变化的相似程度,若相似程序越大,则两站关联性越大,则可比性越强。
进一步地,所述步骤A1包括以下步骤:
A101、根据国家地面观测站或自动气象站近地层的大气能量变化规律,在固定区域内选取任意两个国家地面观测站或自动气象站点在最低温度时的气象观测要素值,确定近地层大气能量与气象观测要素值的关联;
A102、根据所述关联,对两个国家地面观测站或自动气象站间同一时间点上的气象观测要素值进行两两差值计算,并以季度为时间长度,形成差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列。
上述进一步方案的有益效果是:本发明根据自动气象站近地层大气能量变化规律,建立站点间大气要素值差分序列,采用数字信号分析和处理方法,提取差分序列信号特征,以建立下垫面相似性高的自动气象站的自动集群算法。
再进一步地,所述步骤A102中差分序列的表达式如下:
Figure BDA0003229340390000041
Figure BDA0003229340390000042
其中,∑Δηi表示差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列,γi表示β、k和Ri归一化后的参变量,Ri表示每天的日照时数,β和k均表示常数,Hi1表示某一国家地面观测站或自动气象站每天最低温度时刻的湿度值,Tmin(i1)表示某一国家地面观测站或自动气象站每天的最低温度值,Hi2表示另一国家地面观测站或自动气象站每天最低温度时刻的湿度值,Tmin(i2)表示另一国家地面观测站或自动气象站每天的最低温度值。
上述进一步方案的有益效果是:本发明中取自动气象两站间每天温度最低时刻的气象要素值作差,其差分序列减少了由于时间长,下垫面环境变化对数据带来的影响,以使差分序列信号提取到的特征量,更明显和稳定。
再进一步地,所述步骤A3中差分序列信号特征量的表达式如下:
Figure BDA0003229340390000043
Figure BDA0003229340390000044
其中,col表示差分序列信号特征量,所述差分序列信号特征量为第一差分序列信号特征量、第二差分序列信号特征量或第三差分序列信号特征量,fΔη表示正态分布函数,e表示观测误差范围,Δη两自动气象站最低温度时刻近地大气能量差,dΔη表示Δη的积分变量,σ表示方差,a两站差分数据序列平均值。
上述进一步方案的有益效果是:本发明通过计算得到变化相似度来判断可比性,变化相似度越大则两站关联性越大,可比性越强。
本发明还提供了一种以差分序列为基础的自动气象站自动集群***,包括:
第一差分序列信号特征量提取模块,用于以在100公里内的所有国家地面观测站间每天最低温度时刻的气象数据形成第一差分序列,并提取第一差分序列信号特征量;
集群参考特征量确认模块,用于分别取所述第一差分序列信号特征量的最大值和最小值,以最小值作为第一集群参考特征量,以最小值与最大值的中间值作为第二集群参考特征量;
第一判断模块,用于判断100公里内的所有国家地面观测站是否选取完成;
第二差分序列信号特征量提取模块,用于选取与国家气象站相距50公里的自动气象站,建立第二差分序列,并提取第二差分序列信号特征量;
第一分类模块,用于集合小于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第一站点集群,以及集合大于等于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第二站点集群,完成对自动气象站的自动集群处理;
第二判断模块,用于判断在选取的区域内自动气象站是否选取完成;
第三差分序列信号特征量提取模块,用于选取与国家气象站相距30公里的自动气象站,建立第三差分序列,并提取第三差分序列信号特征量;
第二分类模块,用于集合大于等于所述第二集群参考特征量的第三差分序列信号特征量的所有自动气象站,形成第三站点集群,完成对自动气象站的自动集群处理。
本发明的有益效果是:本发明以国家地面观测站间特征量大小为分群的依据,由于距离远近,大间站间特征量有最大值和最小值,以最小值作为分量的参考量,每个国家地面观测站对预设范围内的自动站的间作差分数据分析序列,提取特征量,大于参考量的站点形成一个站点集群,小于参考量的形成一个站点集群,分在同一个集群内的站点,其下垫面性质相似,站到点气象数据可比性高。本发明利用站点集合内气象要素值可比性高特点,为地面或空地一体化多源气象数据的融合分析提供有效地面站点支持,在同一集群内,建立站点间气象要素值平衡体系,监视下垫面人为改变或传感器引起数据飘移。通过站点间气象要素值平衡体系,建立更精细的集群内各自动气象站数据的质控算法。
附图说明
图1为本发明的方法流程图。
图2为本发明的***结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例1
自动气象站所观测的大气要素值,主要是近地层大气数据,也是近地层大气能量变化规律的体现,近地层大气能量随日出日落呈周期性变化,其大小由能量收支情况决定,根据能量守恒原则,任何时刻大气能量向平衡点逼近,大气气象要素值在平衡点趋于稳定。在一个日周期中,大气能量最明显的两个平衡点为近地层大气温度最高和最低两个时刻,在温度最低时刻,近地层大气能量最低,邻近气团能量交换最少,下垫面能量辐射最小,此时站点近地层大气受干扰最小,其采集到的大气要素值较稳定,数据的准确度主要由传感器本身和采集器处理算法决定,其要素值大小直接关联下垫面特性。
自动气象站下垫面环境随季节变化,近地层大气能量也相应改变,但在一定范围内的自动气象站中相似下垫面环境变化有极大趋同性。自动气象站点间最低能量差值也就趋于恒定,这种差值的恒定性,也会反应到站点间对应大气要素值的差值上。由此,采用自动气象站点每天能量最低时刻,站点间对应气象要素差值,形成差分信号序列,对差分信号进行分析、研究,找到差分信号特征,辨识站点下垫面的相似性,建立站点自动集群算法,形成一个数据可比性强的站点集合。
由此,发明一种以差分序列为基础的自动气象站自动集群方法,根据自动气象站自动集群算法形成数据可比性强的站点集合,建立集合内自适应下垫面环境变化的气象要素值动态平衡体系,为气象要素质控、区域气气候分析、格点化气象预报、气象大数据服务等应用提供支撑。其中,数据可比性差是指站点下垫面差异大,气象要素值差异明显、变化规律不统一,数据可比性强是指站点下垫面相似度高,气要素值变化小,变化规律相似。本发明根据判断站点间下垫面相似度和气象数据可比性高的站点,根据自动气象站近地层大气能量变化原理,建立站点间关联大气要素差分序列。差分序列以季节为单位,形成90个长度的差分序列,如此差分序列满足正态分布特性,计算差分序列信号特征量,根据特征量越大,其两站点下垫面相似性高、两站气象数据可比性高,自动将两站集合一起。同时利用站点集合内气象要素值可比性高特点,为地面或空地一体化多源气象数据的融合分析提供有效地面站点支持,在同一集群内,建立站点间气象要素值平衡体系,监视下垫面人为改变或传感器引起数据飘移,通过站点间气象要素值平衡体系,建立更精细的集群内各自动气象站数据的质控算法。
有鉴于此,如图1所示,本发明提供了一种以差分序列为基础的自动气象站自动集群方法,其实现方法如下:
S1、以在100公里内的所有国家地面观测站间每天最低温度时刻的气象数据形成第一差分序列,并提取第一差分序列信号特征量;
S2、分别取所述第一差分序列信号特征量的最大值和最小值,以最小值作为第一集群参考特征量,以最小值与最大值的中间值作为第二集群参考特征量;
S3、判断100公里内的所有国家地面观测站是否选取完成,若是,则进入步骤S6,否则,进入步骤S4;
S4、选取与国家气象站相距50公里的自动气象站,建立第二差分序列,并提取第二差分序列信号特征量;
S5、集合小于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第一站点集群,以及集合大于等于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第二站点集群,完成对自动气象站的自动集群处理;
S6、判断在选取的区域内自动气象站是否选取完成,若是,则完成自动气象站的自动集群处理,否则,进入步骤S7;
S7、选取与国家气象站相距30公里的自动气象站,建立第三差分序列,并提取第三差分序列信号特征量;
S8、集合大于等于所述第二集群参考特征量的第三差分序列信号特征量的所有自动气象站,形成第三站点集群,完成对自动气象站的自动集群处理。
本实施例中,所述提取第一差分序列信号特征量、提取第二差分序列信号特征量以及提取第三差分序列信号特征量的流程均相同,其均包括以下步骤:
A1、以在固定区域内任意两个国家地面观测站间或自动气象站间每天最低温度时刻的气象数据,形成差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列,其实现方法如下:
A101、根据国家地面观测站或自动气象站近地层的大气能量变化规律,在固定区域内选取任意两个国家地面观测站或自动气象站点在最低温度时的气象观测要素值,确定近地层大气能量与气象观测要素值的关联;
A102、根据所述关联,对两个国家地面观测站或自动气象站间同一时间点上的气象观测要素值进行两两差值计算,并以季度为时间长度,形成差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列;所述差分序列的表达式如下:
Figure BDA0003229340390000091
Figure BDA0003229340390000092
其中,∑Δηi表示差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列,γi表示β、k和Ri归一化后的参变量,Ri表示每天的日照时数,β和k均表示常数,Hi1表示某一国家地面观测站或自动气象站每天最低温度时刻的湿度值,Tmin(i1)表示某一国家地面观测站或自动气象站每天的最低温度值,Hi2表示另一国家地面观测站或自动气象站每天最低温度时刻的湿度值,Tmin(i2)表示另一国家地面观测站或自动气象站每天的最低温度值
A2、判断所述差分序列是否满足正态分布,若是,则进入步骤A3,否则,输出错误提示,并结束流程;
A3、计算所述差分序列的区间概率,并根据所述区间概率计算得到差分序列信号特征量,所述差分序列信号特征量为第一差分序列信号特征量、第二差分序列信号特征量或第三差分序列信号特征量,所述差分序列信号特征量的表达式如下:
Figure BDA0003229340390000101
Figure BDA0003229340390000102
其中,col表示差分序列信号特征量,所述差分序列信号特征量为第一差分序列信号特征量、第二差分序列信号特征量或第三差分序列信号特征量,fΔη表示正态分布函数,e表示观测误差范围,Δη两自动气象站最低温度时刻近地大气能量差,dΔη表示Δη的积分变量,σ表示方差,a两站差分数据序列平均值。
本实施例中,近地层是陆地与大气进行物质与能量交换的主要场所,这些交换直接影响着大气运动并改变地表的环境状况,进而影响大气环流和天气气候变化,近地层大气能量的周期性变化,也是自动气象站所采集大气要素值大小不断变化的主要原因。指示近地层大气能量变化的主要气候要素有温度、湿度、风、雨、气压等,最核心的气候要素为温度、湿度、日照、辐射等。为了分析简单和方便,对近地层大气能量变化的规律通过气候要素值温度、湿度、日照的变化来分析,近地层大气能量U与气象要素值的关系如下式所示。
U∝(H、T、R、P)
上式表明大气能量可用H、T、R值的关联性来指示。其中,U为近地层大气能量,H为大气湿度、T为大气温度、R为日照、P为近地大气压强。在常规的自动气象站中,一般没有采集辐射信号,用国家地面观测站日照数据近似代表一定区域范围内大气所内获取的总能量。
任何时刻开放气团能量大小无法计算,但当大气要素值变化时,能计算出此气团单位体积能量变化量。任意一时间段内,自动气象站近地气团能量变化都反映在温度、湿度、气压等大气要素的变化上,但能量变化的快慢多少与站点的下垫面直接关联。为此,可用在一定时长内近地气团能量变化率来反映不同自动区域气象站气象要素值的变化与下垫面的关系。其能量变化率如下式所示:
Figure BDA0003229340390000111
其中,η表示能量变化率,λ表示温度能量转换比,ΔT为一定时长内温度的变化量,Cψ为温度的湿热容,它是温度h的函数,Cψ=1.01+1.88h,式中,h为空气绝对温度,而在大采集到的大气湿度素采为相对湿度,通过湿空气的湿度图可获得不同温度、不同相对湿度(H)下一一对应的绝对湿度(h)。在实际情况中,表示近地层大气中水气含量对能量变化的影响,湿气团与干气团相比,相同的温度变化,湿度大的气团能量变化大。分母中的k为地区日照时数能量转换系数,R为一定时间日照时数,kR近似作为本时段内的总能量,η表示不同下垫面,相同的日照情况下,能量变化率的不同。因为在一定区域内近地大气压强P变化不大,在计算时没有引入。
从上式可以看出,在一定时间内,近地大气能量变化与温湿度变化量成正比。上式中温度从0℃时开始计算,可直接某一时刻的温度T表示ΔT;用习惯上的H(相对湿度)代表Cψ中的h(绝对温度),因为在一个温度T时,通过湿空气的湿度图由h可查得唯一对应的H。上式可演变为:
Figure BDA0003229340390000112
上式中,β为a和Cψ一体化后的变化系数。但在上式中没有考虑到其它要素对能量变化的影响,也很难保证不同站点的日照时数相同,所以在实现自动站自动集群算法时,不能直接用能量变化率进行设计。但在上式中表明能量变化率与大气要素值有直接的相关性,换句话说,可通过H(湿度)、T(湿度)、R(日照时数)、P(大气压)等大气要素值的关联特征可反映自动气象站下垫面的特征。
由于数据采集误差,大气***的变化、生产活动的影响,不可能由一个点的数据或几个点的数据进行数据特征分析,便可区分不同自动气象站下点子面的性质。为了消除各类误差或偶然因素的影响,需选取不同时间点的数据,形成一定长度数据序列,进行综合分析与计算,提取序列信号特征量,通过特征量区分不同下垫面。
时间长度设定方法:
通过大数据分析方法进行确定与验证,一般数据选取以天为单位,时间长度以季节变化为依据进行确定。
时间点的选取方法:
由于自动气象站所归档的数据资料有分钟数据、小时数据、天数据。选取天数据中每天温度最低时刻,受环境干扰小、信号更稳定时所对应大气要素值,形成数据序列。为此,上式推演为:
Figure BDA0003229340390000121
上式中在一个相似的区域内β和k可以近似认为是一个常数,i为天,Hi为每天最低温度时刻湿度值、Tmin(i)为每天的最低温度值,Ri为每天的日照时数,∑ηi为能量差序列。
在上面的分析中,可知道,站点近地层大气要素值与下垫面的有较强的相关性,通过大气要素值序列可提取数据信号特征,来区分不同的下垫面。但数据序列时间变长,每个站点的下垫面环境情况又在变化,从单站点数据序列中所取信号特征的稳定性也发生变化,给相似下垫面站点自动集群算法带来困难。
在一定范围及相同时段内,相似下垫面的环境变化有极大趋同性,也就是说在一定区域和时间段内自动站点间的最低能量差值趋于恒定,这种能量差值的恒定性,也会反应到同区域同时段,对应大气要素间的差值上。为此,采用两站间同一时间点上对应大气要素值作差,形成一个新的差分数据序列,其公式如下式所示:
Figure BDA0003229340390000131
上式中,∑Δηi为两站能量差值序列,在两站处于一定区域内,可将上式作似计算,变为公式:
Figure BDA0003229340390000132
上式中,
Figure BDA0003229340390000133
∑Δηi为差分数据分析列,取于两站间每天温度最低时刻的气象要素值作差。其差分数据分析法,降低了由于时间长,下垫面环境变化对数据分析带来的影响,差值数据序列信号提取到的特征量,更明显和稳定。通过样本数据的研究和分析表明,当两站的下垫面相似度较高时,两站点差值向某一个值集中。当数据天数i取到一定长度时,差值序列数据服从正态分布。可以证明,如果是同一地点两站同时采集相同要素的大气数据,这两站间的数据差只与采集误差相关,其差值序列长度很短就可显现出正态分布特性,但在相同下垫面的自动气象站间,由于多种因素影响,数据差分序列要达到一定长度时,正态分布特征才明显。目前对10个国家地面观测站50年、40个自动气象站10年小时数据样本分析,下垫面相似站点差分序列数据长度为90左右(i的总数取90天左右,即以季节为单位)进行数据分析,数据的正态分布特性较明显。
本实施例中,当两站的基本变化规律一致时(即可比站),其数据差分值应该只受传感器噪声分布影响,因此该序列应该服从正态分布,则在误差范围内(目前温度传感器的误差在±0.1,而湿度传感器误差较大,可以扩展计算范围)计算误差范围内概率即可以测算两站变化相似程度。定义:设Δη序列均值为a,方差为σ,其分布函数为:
Figure BDA0003229340390000141
则两站相似系数(特征量)Col为:
Figure BDA0003229340390000142
dΔη为Δη的积分变量,e为观测误差范围,仅温度取0.1,如果考虑湿度等误差可以扩展到0.3。col越大则两站关联性越大,可比性越强。
下面举例对本发明作进一步的说明
(1)站点间数据差分信号特征量提取流程
以100公里内的所有国家地面观测站数据,取每天最低温度时刻H、T的数据,两两作差,且以季度为时间长度,形成要素差分序列,并计算出对应国家地面观测站的差分序列信号特征量,以国家地面观测站间特征量作分群的依据和参考,再进行国家地面观测站与50公里以内自动气象站分别进行差分序列特征量计算。
站点间数据信号特征量提取流程为:首先选取两站点最低温度时刻的H、T等气象要素值作差,形成差分序列,其次检验温蔼差分数据序列的分布特性。最后计数区间概率,提出差分序列信号特征量。
(2)可比站集合分类算法
在一定范围内以季节数据为基础,形成国家地面观测站间、国家地面观测站与自动气象站的数据差分序列,采用信号分析方法提取差分序列信号的特征量,构成站点间分类特征量集合,以国家地面观测站间特征量大小为分群的依据,由于距离远近,大间站间特征量有最大值和最小值,以最小值作为分量的参考量,每个国家地面观测站对50公里范围内的自动站的间作差分序列,提取差分序列信号特征量,大于参考量的站点形成一个站点集群,小于参考量的形成一个站点集群,分在同一个集群内的站点,其下垫面性质相似,站到点气象数据可比性高。
综上所述,可比站集合分类中,计算站点间的特征量方法为:
在一定区域内任意两气象采集站间取每天最低温度时刻的大气要素(温度、湿度、气压、日照等)形成差分序列。差分序列为一个季为单位共90个数据,判断此差分序列是否满足正态分布特性,如不满足表明两站下垫面差异性大,数据可比性低,如果符合正态特性,根据计算出两站差分序列信号特征量。
站点集群的基础是站点间差分序列的特征量的大小,在一定范围内有国家气象站、自动气象站,国家气象站有严格的数据质量管理、维护标准,其数据质量较好,作为本区域内其它自动气象站数据比对、分析的标准。由此以本区域内100公里内所有国家地面观测站间形成差分序列,并提取差分序列特征量。由于站点站距离远近,地埋位置不同等因素,国家地面观测站间的特征量也有最大值和最小值,以最小值作为本区域自动观测站分集合的第一集群参考特征量,以最小最大的中间值作为本区域自动观测站分集合的第二集群参考特征量。每个国家地面观测站对50公里范围内的自动站的间作差分序列,提取差分序列信号特征量,大于第一集群参考特征量的站点形成一个站点集群,小于第一集群参考特征量的形成另一个站点集群,分在同一个集群内的站点,其下垫面性质相似,站到点气象数据可比性高。在本区域30公里内的自动气象站间作差分数据分析序列,提取特征量,大于等于大于第二集群参考特征量形成一个站点集群,作为一个辅助应用群。
实施例2
如图2所示,本发明提供了一种以差分序列为基础的自动气象站自动集群***,包括:
第一差分序列信号特征量提取模块,用于以在100公里内的所有国家地面观测站间每天最低温度时刻的气象数据形成第一差分序列,并提取第一差分序列信号特征量;
集群参考特征量确认模块,用于分别取所述第一差分序列信号特征量的最大值和最小值,以最小值作为第一集群参考特征量,以最小值与最大值的中间值作为第二集群参考特征量;
第一判断模块,用于判断100公里内的所有国家地面观测站是否选取完成;
第二差分序列信号特征量提取模块,用于选取与国家气象站相距50公里的自动气象站,建立第二差分序列,并提取第二差分序列信号特征量;
第一分类模块,用于集合小于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第一站点集群,以及集合大于等于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第二站点集群,完成对自动气象站的自动集群处理;
第二判断模块,用于判断在选取的区域内自动气象站是否选取完成;
第三差分序列信号特征量提取模块,用于选取与国家气象站相距30公里的自动气象站,建立第三差分序列,并提取第三差分序列信号特征量;
第二分类模块,用于集合大于等于所述第二集群参考特征量的第三差分序列信号特征量的所有自动气象站,形成第三站点集群,完成对自动气象站的自动集群处理。
如图2所示,实施例提供的自动气象站自动集群***可以执行上述方法实施例所示的技术方案,其实现原理与有益效果类似,此处不再赘述。

Claims (6)

1.一种以差分序列为基础的自动气象站自动集群方法,其特征在于,包括以下步骤:
S1、以在100公里内的所有国家地面观测站间每天最低温度时刻的气象数据形成第一差分序列,并提取第一差分序列信号特征量;
S2、分别取所述第一差分序列信号特征量的最大值和最小值,以最小值作为第一集群参考特征量,以最小值与最大值的中间值作为第二集群参考特征量;
S3、判断100公里内的所有国家地面观测站是否选取完成,若是,则进入步骤S6,否则,进入步骤S4;
S4、选取与国家气象站相距50公里的自动气象站,建立第二差分序列,并提取第二差分序列信号特征量;
S5、集合小于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第一站点集群,以及集合大于等于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第二站点集群,完成对自动气象站的自动集群处理;
S6、判断在选取的区域内自动气象站是否选取完成,若是,则完成自动气象站的自动集群处理,否则,进入步骤S7;
S7、选取与国家气象站相距30公里的自动气象站,建立第三差分序列,并提取第三差分序列信号特征量;
S8、集合大于等于所述第二集群参考特征量的第三差分序列信号特征量的所有自动气象站,形成第三站点集群,完成对自动气象站的自动集群处理。
2.根据权利要求1所述的以差分序列为基础的自动气象站自动集群方法,其特征在于,所述提取第一差分序列信号特征量、提取第二差分序列信号特征量以及提取第三差分序列信号特征量的流程均相同,其均包括以下步骤:
A1、以在固定区域内任意两个国家地面观测站间或自动气象站间每天最低温度时刻的气象数据,形成差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列;
A2、判断所述差分序列是否满足正态分布,若是,则进入步骤A3,否则,输出错误提示,并结束流程;
A3、计算所述差分序列的区间概率,并根据所述区间概率计算得到差分序列信号特征量,所述差分序列信号特征量为第一差分序列信号特征量、第二差分序列信号特征量或第三差分序列信号特征量。
3.根据权利要求2所述的以差分序列为基础的自动气象站自动集群方法,其特征在于,所述步骤A1包括以下步骤:
A101、根据国家地面观测站或自动气象站近地层的大气能量变化规律,在固定区域内选取任意两个国家地面观测站或自动气象站点在最低温度时的气象观测要素值,确定近地层大气能量与气象观测要素值的关联;
A102、根据所述关联,对两个国家地面观测站或自动气象站间同一时间点上的气象观测要素值进行两两差值计算,并以季度为时间长度,形成差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列。
4.根据权利要求3所述的以差分序列为基础的自动气象站自动集群方法,其特征在于,所述步骤A102中差分序列的表达式如下:
Figure FDA0003229340380000021
Figure FDA0003229340380000022
其中,∑Δηi表示差分序列,所述差分序列为第一差分序列、第二差分序列或第三差分序列,γi表示β、k和Ri归一化后的参变量,Ri表示每天的日照时数,β和k均表示常数,Hi1表示某一国家地面观测站或自动气象站每天最低温度时刻的湿度值,Tmin(i1)表示某一国家地面观测站或自动气象站每天的最低温度值,Hi2表示另一国家地面观测站或自动气象站每天最低温度时刻的湿度值,Tmin(i2)表示另一国家地面观测站或自动气象站每天的最低温度值。
5.根据权利要求4所述的以差分序列为基础的自动气象站自动集群方法,其特征在于,所述步骤A3中差分序列信号特征量的表达式如下:
Figure FDA0003229340380000031
Figure FDA0003229340380000032
其中,col表示差分序列信号特征量,所述差分序列信号特征量为第一差分序列信号特征量、第二差分序列信号特征量或第三差分序列信号特征量,fΔη表示正态分布函数,e表示观测误差范围,Δη两自动气象站最低温度时刻近地大气能量差,dΔη表示Δη的积分变量,σ表示方差,a两站差分数据序列平均值。
6.一种以差分序列为基础的自动气象站自动集群***,其特征在于,包括:
第一差分序列信号特征量提取模块,用于以在100公里内的所有国家地面观测站间每天最低温度时刻的气象数据形成第一差分序列,并提取第一差分序列信号特征量;
集群参考特征量确认模块,用于分别取所述第一差分序列信号特征量的最大值和最小值,以最小值作为第一集群参考特征量,以最小值与最大值的中间值作为第二集群参考特征量;
第一判断模块,用于判断100公里内的所有国家地面观测站是否选取完成;
第二差分序列信号特征量提取模块,用于选取与国家气象站相距50公里的自动气象站,建立第二差分序列,并提取第二差分序列信号特征量;
第一分类模块,用于集合小于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第一站点集群,以及集合大于等于所述第一集群参考特征量的第二差分序列特征量的所有自动气象站,形成第二站点集群,完成对自动气象站的自动集群处理;
第二判断模块,用于判断在选取的区域内自动气象站是否选取完成;
第三差分序列信号特征量提取模块,用于选取与国家气象站相距30公里的自动气象站,建立第三差分序列,并提取第三差分序列信号特征量;
第二分类模块,用于集合大于等于所述第二集群参考特征量的第三差分序列信号特征量的所有自动气象站,形成第三站点集群,完成对自动气象站的自动集群处理。
CN202110982065.0A 2021-08-25 2021-08-25 一种以差分序列为基础的自动气象站自动集群方法及*** Active CN113704558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110982065.0A CN113704558B (zh) 2021-08-25 2021-08-25 一种以差分序列为基础的自动气象站自动集群方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110982065.0A CN113704558B (zh) 2021-08-25 2021-08-25 一种以差分序列为基础的自动气象站自动集群方法及***

Publications (2)

Publication Number Publication Date
CN113704558A true CN113704558A (zh) 2021-11-26
CN113704558B CN113704558B (zh) 2022-10-14

Family

ID=78654724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110982065.0A Active CN113704558B (zh) 2021-08-25 2021-08-25 一种以差分序列为基础的自动气象站自动集群方法及***

Country Status (1)

Country Link
CN (1) CN113704558B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130073387A1 (en) * 2011-09-15 2013-03-21 Stephan HEATH System and method for providing educational related social/geo/promo link promotional data sets for end user display of interactive ad links, promotions and sale of products, goods, and/or services integrated with 3d spatial geomapping, company and local information for selected worldwide locations and social networking
CN104156777A (zh) * 2014-05-08 2014-11-19 南方电网科学研究院有限责任公司 一种基于城市天气预报的低成本光伏发电功率预测方法
CN107007290A (zh) * 2017-03-27 2017-08-04 广州视源电子科技股份有限公司 基于时域及相空间的脑电放松度识别方法及装置
CN107507097A (zh) * 2017-07-03 2017-12-22 上海电力学院 一种风电功率短期预测方法
CN109919353A (zh) * 2019-01-11 2019-06-21 杭州电子科技大学 一种基于空间相关性的arima模型的分布式光伏预测方法
US20200228872A1 (en) * 2010-11-01 2020-07-16 Gracenote, Inc. Method and system for presenting additional content at a media system
CN112380499A (zh) * 2020-11-11 2021-02-19 成都市气象局 一种区域自动气象站客观分群方法
CN112559588A (zh) * 2020-12-08 2021-03-26 天津市气象信息中心(天津市气象档案馆) 地面气象站观测的百年均一化气温日值序列的构建方法
CN112880634A (zh) * 2021-01-15 2021-06-01 山东省国土测绘院 一种基于cors站网的高程参考框架动态监测方法
CN112907062A (zh) * 2021-02-08 2021-06-04 国网安徽省电力有限公司蚌埠供电公司 融合温度特征的电网电量预测方法、装置、介质及终端

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200228872A1 (en) * 2010-11-01 2020-07-16 Gracenote, Inc. Method and system for presenting additional content at a media system
US20130073387A1 (en) * 2011-09-15 2013-03-21 Stephan HEATH System and method for providing educational related social/geo/promo link promotional data sets for end user display of interactive ad links, promotions and sale of products, goods, and/or services integrated with 3d spatial geomapping, company and local information for selected worldwide locations and social networking
CN104156777A (zh) * 2014-05-08 2014-11-19 南方电网科学研究院有限责任公司 一种基于城市天气预报的低成本光伏发电功率预测方法
CN107007290A (zh) * 2017-03-27 2017-08-04 广州视源电子科技股份有限公司 基于时域及相空间的脑电放松度识别方法及装置
CN107507097A (zh) * 2017-07-03 2017-12-22 上海电力学院 一种风电功率短期预测方法
CN109919353A (zh) * 2019-01-11 2019-06-21 杭州电子科技大学 一种基于空间相关性的arima模型的分布式光伏预测方法
CN112380499A (zh) * 2020-11-11 2021-02-19 成都市气象局 一种区域自动气象站客观分群方法
CN112559588A (zh) * 2020-12-08 2021-03-26 天津市气象信息中心(天津市气象档案馆) 地面气象站观测的百年均一化气温日值序列的构建方法
CN112880634A (zh) * 2021-01-15 2021-06-01 山东省国土测绘院 一种基于cors站网的高程参考框架动态监测方法
CN112907062A (zh) * 2021-02-08 2021-06-04 国网安徽省电力有限公司蚌埠供电公司 融合温度特征的电网电量预测方法、装置、介质及终端

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PENG YIN 等: "SeqSphereVLAD: Sequence Matching Enhanced Orientation-invariant Place Recognition", 《2020 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS)》 *
张久山 等: "由地面温度极值观测差值序列分析谈自动气象站质量控制", 《第28届中国气象学会年会——S1第四届气象综合探测技术研讨会》 *
贺南 等: "一种新的气象数据分析和误差诊断方法", 《成都信息工程大学学报》 *

Also Published As

Publication number Publication date
CN113704558B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
CN110008982B (zh) 一种基于光伏发电出力聚类的气象监测点选择方法
CN105184423B (zh) 一种风电场集群风速预测方法
CN109165693B (zh) 一种适用于露、霜和结冰的天气现象的自动判识方法
CN107607692B (zh) 基于土壤最大储水容量的土壤水分监测优化布点方法
CN109740195B (zh) 一种基于气象站观测数据的极值台风风速概率分布模型及设计台风风速的评估方法
CN114429053B (zh) 流域尺度wefe***适配性模拟优化方法
CN110009385B (zh) 一种基于多因素映射的光伏发电用户群划分方法
CN106897957B (zh) 一种基于pca和pso-elm的自动气象站实时数据质量控制方法
CN112348264A (zh) 一种基于随机森林算法的碳钢腐蚀速率预测方法
CN112114384A (zh) 一种输电线覆冰发生概率预报方法
CN114996943B (zh) 一种用于水库蓄水气候效应评估的中尺度数值模拟方法
CN111598337A (zh) 一种分布式光伏短期出力预测的方法
CN114021830A (zh) 一种基于cnn-lstm的多时间范围风速预测方法
CN112394424A (zh) 一种区域极端降水事件的监测方法
CN113435630A (zh) 一种产流模式自适应的流域水文预报方法及***
CN112380499B (zh) 一种区域自动气象站客观分群方法
CN114609698A (zh) 一种基于配料法思想和二分法的短时强降水概率预报方法
CN116800172B (zh) 一种光电转换方法及储能***
CN116961575B (zh) 一种基于数字孪生的茶光互补光伏电站监测***及方法
CN113704558B (zh) 一种以差分序列为基础的自动气象站自动集群方法及***
CN108876060B (zh) 一种基于大数据的样本采集风电出力概率预测方法
CN112766581A (zh) 一种计算机自动识别预报人工防雹作业潜势的方法
CN109766937B (zh) 一种掩星数据的质量控制方法、装置、设备及存储介质
CN115456440A (zh) 分布式光伏电站发电特性的评估方法、装置及***
CN112116127A (zh) 一种基于气象过程与功率波动关联的光伏功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant