CN110020409B - 基于自适应核密度估计算法的地面气温观测资料分析方法 - Google Patents

基于自适应核密度估计算法的地面气温观测资料分析方法 Download PDF

Info

Publication number
CN110020409B
CN110020409B CN201910256176.6A CN201910256176A CN110020409B CN 110020409 B CN110020409 B CN 110020409B CN 201910256176 A CN201910256176 A CN 201910256176A CN 110020409 B CN110020409 B CN 110020409B
Authority
CN
China
Prior art keywords
window width
density estimation
air temperature
kernel density
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910256176.6A
Other languages
English (en)
Other versions
CN110020409A (zh
Inventor
叶小岭
阚亚进
熊雄
陈昕
王佐鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201910256176.6A priority Critical patent/CN110020409B/zh
Publication of CN110020409A publication Critical patent/CN110020409A/zh
Application granted granted Critical
Publication of CN110020409B publication Critical patent/CN110020409B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Monitoring And Testing Of Nuclear Reactors (AREA)
  • Investigating Or Analyzing Materials Using Thermal Means (AREA)

Abstract

本发明涉及一种基于自适应核密度估计算法的地面气温观测资料分析方法,属于地面气温观测资料分析领域,该方法在传统的固定窗宽核密度估计算法挤出上引入自适应算法,即在窗宽参数中引入自适应系数,能够有效反应样本观测值的稀疏程度所带来的影响,然后再对自适应算法进行改进,将窗宽参数替换为最优窗宽,使地面气温观测数据下得出的结果满足所有均方误差均为最小,使得改进后的自适应方法完全适用于地面气温观测资料。

Description

基于自适应核密度估计算法的地面气温观测资料分析方法
技术领域
本发明涉及地面气温观测资料分析领域,特别发明了一种改进的核密度估计算法对地面气温要素进行分析。
背景技术
近年来,全球变暖的趋势愈发明显,气温变化给社会带来了严重的影响,因此得到了各国学者的广泛关注,以此为研究得到了许多有意义的结论。就我国而言,对地理位置特殊的地区如高原、盆地等研究较多,取得了许多成果,而气温较为稳定的东南地区研究不足。传统气温分析方法多数建立在时间序列的基础上来预测并分析未来的变化趋势,在空间角度上各国专家学者也进行了一系列的研究,但是影响气温变化的因素非常复杂,且存在明显的区域性与季节性差异。已有的研究对造成气温变化的原因分析不足。
发明内容
本发明为了解决现有技术中存在的问题,提供一种用于地面气温观测资料分析的方法。
为了达到上述目的,本发明提出的技术方案为:一种基于自适应核密度估计算法的地面气温观测资料分析方法,包括如下步骤:
步骤1、选取目标地区地面气温观测资料的一段时间序列内的站点数据样本,第i个站点数据为Xi=(xi1,xi2,…xij,…,xin)T
步骤2、根据核密度估计公式
Figure GDA0004124627160000011
计算核密度估计值;其中K(x)为核函数,h为窗宽,hi为第i个站点对应的窗宽,n为样本容量;
步骤3、设计窗宽系数
Figure GDA0004124627160000012
则自适应窗宽为hi *=λihi,将自由适应窗宽替换核密度估计公式中的窗宽,得到自适应核密度估计公式
Figure GDA0004124627160000013
其中g为
Figure GDA0004124627160000014
的算数平均值;α为灵敏参数,满足0≤α≤1;
步骤4、设计最优窗宽
Figure GDA0004124627160000015
将最优窗宽替代自适应核密度估计公式中的窗宽,得到
Figure GDA0004124627160000016
其中,c为参数,
Figure GDA0004124627160000017
为站点数据样本的标准差。
对上述技术方案的进一步设计为:所述核函数采用Gaussian函数。
采用调整的粒子群算法分别对参数c与α进行选取,则步骤4中最优窗宽公式调整为:
Figure GDA0004124627160000021
得到改进的自适应核密度估计公式:
Figure GDA0004124627160000022
其中,ω与μ为参数,取值范围分别在[-0.5,0.5]和[-0.1,0.5]之间。
参数c与α初值设定为1.06与0.2。
本发明相比于现有技术所产生的有益效果为:
本发明的自适应核密度估计算法无论是精度还是拟合程度都比传统的固定窗宽算法好,另外本发明提出的算法在多尺度下均具有良好的预测精度与拟合程度,而传统算法只能在小尺度下进行应用。
从原理层面上来看,了解气温的变化特征以及多时间尺度下各个区域的变化特点,有助于对气温变化趋势及其影响因素的深入理解,因此需要剖析地面气温观测资料的频次、数值大小、趋势等属性以及在多时间尺度下气候、位置对于气温的影响,进而能够深入进行分析与研究。本发明提出的算法可以很好的分析了我国地面气温观测资料的统计特性,为进一步研究地面气温观测资料提供理论基础。
本发明提出的方法可以有效的分析地面气温观测资料的统计特性,并且对其影响原因也可进行进一步的分析,因此可以有效的应用于地面气温观测资料的分析与应用。
附图说明
图1为本发明实施例流程图;
图2a为本发明方法与传统固定窗宽的核密度估计算法的MAE效果对比柱形图;
图2b为本发明方法与传统固定窗宽的核密度估计算法的RMSE效果对比柱形图;
图2c为本发明方法与传统固定窗宽的核密度估计算法的NSC效果对比柱形图;
图2d为本发明方法与传统固定窗宽的核密度估计算法的IOA效果对比柱形图;
图2e为本发明方法与传统固定窗宽的核密度估计算法的MAE效果对比折线图;
图2f为本发明方法与传统固定窗宽的核密度估计算法的RMSE效果对比折线图;
图2g为本发明方法与传统固定窗宽的核密度估计算法的NSC效果对比折线图;
图2h为本发明方法与传统固定窗宽的核密度估计算法的IOA效果对比折线图;
图3a为本发明方法在徐州站点的核密度估计算法试验结果图;
图3b为本发明方法在宿迁站点的核密度估计算法试验结果图;
图3c为本发明方法在连云港站点的核密度估计算法试验结果图;
图3d为本发明方法在淮安站点的核密度估计算法试验结果图;
图3e为本发明方法在扬州站点的核密度估计算法试验结果图;
图3f为本发明方法在南京站点的核密度估计算法试验结果图;
图3g为本发明方法在镇江站点的核密度估计算法试验结果图;
图3h为本发明方法在常州站点的核密度估计算法试验结果图;
图3i为本发明方法在盐城站点的核密度估计算法试验结果图;
图3j为本发明方法在无锡站点的核密度估计算法试验结果图;
图3k为本发明方法在苏州站点的核密度估计算法试验结果图;
图3l为本发明方法在南通站点的核密度估计算法试验结果图;
图4为江苏省12站点分布图。
具体实施方式
下面结合附图以及具体实施例对本发明进行详细说明。
按照本发明实施例方法的流程图,如图1所示,首先要采集所需站点在一定时间序列内的气温资料,然后对数据进行基本的预处理,接着,分别进行不同的核密度估计试验,采用不同的评价指标进行评价,最后利用本文提出的算法进行江苏省12站点的试验并进行分析。
以下将对江苏省徐州(站号:58027)、宿迁(站号:58131)、连云港(站号:58044)、淮安(站号:58141)、扬州(站号:58245)、南京(站号:58238)、镇江(站号:58248)、常州(站号:58343)、盐城(站号:58154)、无锡(站号:58354)、苏州(站号:58349)、南通(站号:58259)共计12个站点1988年到2007年日、夜、季度平均气温值作为观测资料进行实施例分析,进一步说明本发明:
对比例一
选取江苏省12个站点地面气温观测资料1988年到2007年气温六小时数据以及月平均数据作为观测资料,对以上获取的资料进行预处理,预处理数据为:取其中08时与14时气温的平均值作为日均温,取20时与02时气温的平均值作为夜均温,取1-3月为第一季度,4-6月为第二季度,7-9月为第三季度,10-12月为第四季度,得到相应的时间序列X=(X1,X2,…,X12),其中第i个站点数据为Xi=(xi1,xi2,…xij,…,xin)T
采用固定窗宽的传统核密度估计算法进行试验,根据核密度估计的公式
Figure GDA0004124627160000031
进行计算,其中K(x)为核函数,h>0为窗宽参数,固定值一般选取1.8~2,n为样本容量。
选取数学性质较好的Gaussian核函数:
Figure GDA0004124627160000032
作为核函数。
基于最小平方差(LSCV)的思想,根据积分均方误差(MISE)最小,推导求出最优的固定窗宽,具体推理过程如下:根据积分均方误差公式
Figure GDA0004124627160000041
其中偏差公式为
Figure GDA0004124627160000042
方差/>
Figure GDA0004124627160000043
对偏差公式进一步化简可得:
Figure GDA0004124627160000044
以及/>
Figure GDA0004124627160000045
将其偏差与方差代入积分均方误差公式/>
Figure GDA0004124627160000046
其中,k2=∫x2K(x)dx,令/>
Figure GDA0004124627160000047
如果需要MISE最小,则AMISE达到最小,所以对AMIS求一阶导数令其等于0,求出最优窗宽h。推导出的最优窗宽h为:
Figure GDA0004124627160000048
当核函数确定为高斯核后,可推得:/>
Figure GDA0004124627160000049
其中
Figure GDA00041246271600000410
为样本的标准差。
对比例二
对比例一所采用的窗宽均为固定窗宽,不能够有效反应样本观测值的稀疏程度所带来的影响,本对比例在对比例一的基础上加入了自适应算法。
根据对比例一得到的核密度估计值
Figure GDA00041246271600000411
在hi与/>
Figure GDA00041246271600000412
成比例的基础上,通过设计窗宽系数/>
Figure GDA00041246271600000413
来改进,其中g为/>
Figure GDA00041246271600000414
的算术平均:即/>
Figure GDA00041246271600000415
α为灵敏参数,满足0≤α≤1,实际应用中α为0.5时效果最好,因此自适应窗宽为hi *=λihi,替换对比例一中的hi,即可求得自适应核密度估计/>
Figure GDA00041246271600000416
但是上述方法直接应用到地面气温观测资料分析上并不合适,其中初始h缺乏一个选择标准,通过代入最优窗宽的选择方法,针对不同站点选取不同的初始窗宽hi,结合自适应参数得出适用于地面气温观测资料的自适应核密度估计公式:
Figure GDA00041246271600000417
实施例
通过对比例二的算法在地面气温观测数据下得出的结果不能满足所有均方误差均为最小,说明该方法不完全适用于地面气温观测资料,因此需要重新确定最优窗宽的选取方法,本实施例提出优化方法为:基于最优窗宽公式给出新的窗宽公式:
Figure GDA0004124627160000051
其中c跟a参数均为可变量,为了使得得出的核密度估计曲线图贴近于数据真实情况,采用智能寻优算法来确定其中的参数c与a,使得RMSE值越小越好,改进后的公式为:
Figure GDA0004124627160000052
其中n为样本容量,K(x)为高斯核,
Figure GDA0004124627160000053
为自适应窗宽系数,参数c与α待定。本实施例采用调整的粒子群算法分别对参数c与α进行选取:以核密度估计函数为目标函数,假设一个N维空间,由多个站点的气温数据组成的粒子种群X=(X1,X2,…,Xd),其中第i个粒子数据Xi=(xi1,xi2,…xij,…,xin)T通过目标函数/>
Figure GDA0004124627160000054
计算可以得出核密度估计的一组潜在解:/>
Figure GDA0004124627160000055
再以均方根误差RMSE为适应度函数,其中,初始解中参数c与α参照固定窗宽算法中的最优窗宽
Figure GDA0004124627160000056
来设定,为1.06与0.2,将传统PSO的速度V调整为双重变化因子ω与μ,位置X调整为窗宽/>
Figure GDA0004124627160000057
则其公式调整为:/>
Figure GDA0004124627160000058
同时将参数ω与μ范围限制在[-0.5,0.5]以及[-0.1,0.5]之间,通过以上方法得到改进的自适应核密度估计公式:
Figure GDA0004124627160000059
本实施例对于真实数据的拟合程度更好,能够展现出数据本身的趋势。
如图2所示,选取四个常用评价参数:平均绝对误差(MAE)、均方根误差(RMSE)、纳什系数(NSC)和一致性指标(IOA)来描述在固定窗宽、最优固定窗宽以及改进的自适应窗宽下的试验效果:
Figure GDA00041246271600000510
Figure GDA00041246271600000511
Figure GDA0004124627160000061
其中,n为样本点数,
Figure GDA0004124627160000062
为第ij个核密度估计值,y(xij)为第ij个原始数据频率直方图每个直方的均值,/>
Figure GDA0004124627160000063
为频率直方图均值。
如图3所示,将改进的核密度估计算法应用于江苏省12站地面气温观测资料进行试验,并结合位置(图4所示)以及气候特征对其试验结果图分析并总结。
上述三种算法的试验效果在指标MAE、RMSE、NSC和IOA对比下,说明了在精度与拟合程度上传统固定窗宽算法在江苏省地面气温观测资料季度气温方面的应用并不合适,而改进过后的自适应核密度估计算法无论是精度还是拟合程度都较好。进一步发现,本发明实施例提出的算法在多尺度下的精度以及拟合效果都是最优,而对比例一中传统固定窗宽算法只能应用在小尺度数据的试验,综上本文提出的方法就精度与拟合方面在多站点与多尺度下相较于传统方法都有足够优良的效果。
气候特征的影响因子大于位置特征,在季度尺度下,位置越往南部,整体均温越高,温度变化越稳定,以15℃代表的春秋季均温加长,海洋的调节作用一定程度上弥补了位置偏南带来的影响;在日夜尺度下,对以20℃-30℃代表的夏季,气候影响均温的变化趋势,位置则影响均温的持续时长,气候中海洋性气候与季风性气候带来的影响差别不大,海洋调节会提高均温的大小与时长;对以10℃-20℃代表的春秋季,越靠近东南沿海地区,日夜均温曲线间差异越大;对以0℃-10℃代表的冬季,位置越偏西北,夜均温持续时间越长且始终高于日均温,由此可以发现在不同的时间尺度下,气候与位置对气温变化的影响方式与影响能力都不相同,因此在分析不同特征对气温的影响有助于后续研究的深入。
本发明的方法不局限于上述各实施例,凡采用等同替换方式得到的技术方案均落在本发明要求保护的范围内。

Claims (4)

1.基于自适应核密度估计算法的地面气温观测资料分析方法,其特征在于,包括如下步骤:
步骤1、选取目标地区地面气温观测资料的一段时间序列内的站点数据样本,第i个站点数据为Xi=(xi1,xi2,…xij,…,xin)T
步骤2、根据核密度估计公式
Figure FDA0004124627150000011
计算核密度估计值;其中K(x)为核函数,h为窗宽,hi为第i个站点对应的窗宽,n为样本容量;
步骤3、设计窗宽系数
Figure FDA0004124627150000012
则自适应窗宽为hi *=λihi,将自由适应窗宽替换核密度估计公式中的窗宽,得到自适应核密度估计公式
Figure FDA0004124627150000013
其中g为
Figure FDA0004124627150000014
的算数平均值;α为灵敏参数,满足0≤α≤1;
步骤4、设计最优窗宽
Figure FDA0004124627150000015
将最优窗宽替代自适应核密度估计公式中的窗宽,得到
Figure FDA0004124627150000016
其中,c为参数,
Figure FDA0004124627150000017
为站点数据样本的标准差。
2.根据权利要求1所述基于自适应核密度估计算法的地面气温观测资料分析方法,其特征在于:所述核函数采用Gaussian函数,
Figure FDA0004124627150000018
3.根据权利要求2所述基于自适应核密度估计算法的地面气温观测资料分析方法,其特征在于:采用调整的粒子群算法分别对参数c与α进行选取,则步骤4中最优窗宽公式调整为:
Figure FDA0004124627150000019
得到改进的自适应核密度估计公式:
Figure FDA00041246271500000110
其中,ω与μ为参数,取值范围分别在[-0.5,0.5]和[-0.1,0.5]之间。
4.根据权利要求3所述基于自适应核密度估计算法的地面气温观测资料分析方法,其特征在于:参数c与α初值设定为1.06与0.2。
CN201910256176.6A 2019-04-01 2019-04-01 基于自适应核密度估计算法的地面气温观测资料分析方法 Active CN110020409B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910256176.6A CN110020409B (zh) 2019-04-01 2019-04-01 基于自适应核密度估计算法的地面气温观测资料分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910256176.6A CN110020409B (zh) 2019-04-01 2019-04-01 基于自适应核密度估计算法的地面气温观测资料分析方法

Publications (2)

Publication Number Publication Date
CN110020409A CN110020409A (zh) 2019-07-16
CN110020409B true CN110020409B (zh) 2023-06-27

Family

ID=67190299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910256176.6A Active CN110020409B (zh) 2019-04-01 2019-04-01 基于自适应核密度估计算法的地面气温观测资料分析方法

Country Status (1)

Country Link
CN (1) CN110020409B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815155A (zh) * 2020-07-07 2020-10-23 南京信息工程大学 一种改进后的核回归地面气温观测资料质量控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012351980A1 (en) * 2011-12-14 2014-07-03 Arrow International, Inc. Silicone hydrogel contact lens modified using Lanthanide or Transition metal oxidants
CN108549117A (zh) * 2018-03-29 2018-09-18 南京信息工程大学 一种基于eemd-ces的地面气温观测资料质量控制方法
CN109063128A (zh) * 2018-08-02 2018-12-21 深圳大学 集成核密度估计器窗口参数优化方法、装置及终端设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012351980A1 (en) * 2011-12-14 2014-07-03 Arrow International, Inc. Silicone hydrogel contact lens modified using Lanthanide or Transition metal oxidants
CN108549117A (zh) * 2018-03-29 2018-09-18 南京信息工程大学 一种基于eemd-ces的地面气温观测资料质量控制方法
CN109063128A (zh) * 2018-08-02 2018-12-21 深圳大学 集成核密度估计器窗口参数优化方法、装置及终端设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
浙江省极端气温事件年代际变化特征及城乡差异分析;郁珍艳 等;《气象科技》;20161215;第972-978页 *

Also Published As

Publication number Publication date
CN110020409A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN106055918B (zh) 一种电力***负荷数据的辨识及修正方法
CN110555561B (zh) 一种中长期径流集合预报方法
CN107038292B (zh) 一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法
CN112288164B (zh) 一种计及空间相关性和修正数值天气预报的风功率组合预测方法
CN111967688B (zh) 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法
Firat et al. Missing data analysis and homogeneity test for Turkish precipitation series
CN105719023A (zh) 一种基于混合高斯分布的风电功率实时预测误差分析方法
CN106600037B (zh) 一种基于主成分分析的多参量辅助负荷预测方法
CN113743013A (zh) 一种基于XGBoost气温预测数据修正的方法
CN112819312A (zh) 气候变化情景下干旱社会经济暴露度评估方法和***
CN116128141B (zh) 风暴潮预测方法、装置、存储介质及电子设备
CN105809321A (zh) 地面气象观测站采集气温数据的质量控制方法
CN113360854A (zh) 基于自适应协方差膨胀的资料同化方法
CN110298765B (zh) 一种基于客观关联因素的配电网用电功率异常检测方法
CN115689051A (zh) 一种基于GA算法耦合Morris和GLUE的SWMM模型参数自动率定方法
CN110020409B (zh) 基于自适应核密度估计算法的地面气温观测资料分析方法
CN114357737B (zh) 针对大尺度水文模型时变参数的代理优化率定方法
CN109388863B (zh) 一种基于arima模型的分布式光伏出力功率预测方法
CN117290810B (zh) 基于循环卷积神经网络的短时强降水概率预报融合方法
CN112926772A (zh) 一种基于lstm-gpr混合模型的光能预测方法
CN110765420A (zh) 一种基于pso-fi的地面自动气象站气温观测资料质量控制方法
CN113742929B (zh) 一种针对格点气象实况的数据质量评价方法
CN114819382B (zh) 一种基于lstm的光伏功率预测方法
CN115983511A (zh) 基于改进统计降尺度方法的降水预估方法和***
CN110188964A (zh) 一种基于相关性的光伏出力预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant