CN113269805B - 降水事件引导的遥感降水反演训练样本自适应选取方法 - Google Patents

降水事件引导的遥感降水反演训练样本自适应选取方法 Download PDF

Info

Publication number
CN113269805B
CN113269805B CN202110655233.5A CN202110655233A CN113269805B CN 113269805 B CN113269805 B CN 113269805B CN 202110655233 A CN202110655233 A CN 202110655233A CN 113269805 B CN113269805 B CN 113269805B
Authority
CN
China
Prior art keywords
precipitation
connected domain
sample
pixel
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110655233.5A
Other languages
English (en)
Other versions
CN113269805A (zh
Inventor
马自强
朱思宇
张玉浩
洪阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202110655233.5A priority Critical patent/CN113269805B/zh
Publication of CN113269805A publication Critical patent/CN113269805A/zh
Application granted granted Critical
Publication of CN113269805B publication Critical patent/CN113269805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种降水事件引导的遥感降水反演训练样本自适应选取方法。所述方法包括:获取降水二值图,采用分类算法对降水区域进行连通域划分得到多个降水连通域;对于任意一个降水连通域,根据降水连通域的像素数、降水区域的像素数和预设降水样本数量得到降水连通域的取样数量;根据降水连通域的取样数量和降水连通域的像素数对降水连通域的像素进行取样,得到降水连通域的降水样本;对非降水区域的像素进行随机取样得到非降水样本;确定所有降水连通域的降水样本和非降水样本为降水反演训练样本。本发明能够同时满足训练样本的代表性和反演模型的普适性,以提高反演模型的反演精度。

Description

降水事件引导的遥感降水反演训练样本自适应选取方法
技术领域
本发明涉及降水反演领域,特别是涉及一种降水事件引导的遥感降水反演训练样本自适应选取方法及***。
背景技术
降水在水文学、气象学、生态学以及农业研究等领域担任了重要角色,特别是全球尺度物质能量交换主要驱动力之一。因此利用卫星数据进行降水反演来获取高精度和高时空分辨率的降水数据是十分重要的。降水反演是利用卫星观测数据进行降水值估测的数学过程,该方法常采用模型法,如拟合公式求参,机器学习等。而无论是拟合公式求参还是机器学习,模型法均需要输入实测降水值和卫星所观测的特征值(常为云顶亮温)作为训练数据,通过一定的方法确定了参数之后,训练好的模型则可用来进行降水反演,即输入新观测值,可得到反演的估计值。那么该过程中训练样本的选择对于最终的反演结果则有十分直接的影响,即样本选择的策略能够觉得模型最终的训练结果。
优秀的样本选择策略应该同时满足样本具有代表性和模型具有普适性的特点。所谓代表性,指的是样本选择过程中可以覆盖到各种特殊的情况,并且各类情况均有足够数量的样本,这样模型在训练过程中才可以不缺少有效信息。而普适性,意为模型对于不同的或者新的输入均有较高的稳定性,而非局限于样本集所提供的种类和情况中。
现有的样本选择策略主要包括三种大类型:随机选取法、数值分布控制法以及基于相似度(一致性)判断的样本选择法。
随机选取法为对于所有样本,根据一定的随机数原则,或者在打乱顺序的情况下根据一定的间隔步长进行选取,保证样本选取的随机性。随机选取法方法简单,易于实现,选择的样本在数量足够的情况下,具有一定的普适性,即通过选择出来样本进行模型训练,所得到的训练模型能够应对大部分情况,能够识别大部分特征。但缺乏一定的代表性,因为随机性选取往往会选取大量重复特征样本,或者无效特征样本,导致样本集在相同数量的样本下,对整体事件的代表能力大大降低,产生较大的数据冗余。
数值分布控制法为在整体事件集中根据数值分布规律,通过划分数值区域的方式,在每一个数值区域中选取一定数量的样本加入样本集。这样选取的样本集能够有较强的代表性,由于样本来自不同的规定数值区间,这样对每一个数值区间均有一定样本数量的保证,以此使得样本集能够代表大多数出现的情况。但由于数值区间的划分和名额的分配是先验的,所以此为有监督的样本选取,人为因素不可避免地加入样本集中,则会降低一定的普适性,导致最终训练好的模型仅能反映人为考虑到的样本情况。
基于相似度(一致性)判断的样本选择法是一类更加复杂的方法,这类方法通常通过样本间相似度判断,然后通过不断迭代的方法去精进样本集的分类,使得最终的样本间有较高的一致性。这类方法较为复杂,对于相似度的定义也有多种,迭代方法更是有较多备选。但总而言之,其能够增加样本的代表性,即能够通过数量较少的样本集,代表整体事件的出现情况和特征,大大降低无效样本和重复样本的比例。但是由于对于不一致样本的剔除,会导致针对复杂情况样本的丢失,模型训练过程中容易过拟合,最终导致模型的普适性降低。
综上所述,现有的样本选择策略无法同时满足样本具有代表性和模型具有普适性。
发明内容
本发明的目的是提供一种降水事件引导的遥感降水反演训练样本自适应选取方法,能够同时满足训练样本的代表性和反演模型的普适性,以提高反演模型的反演精度。
为实现上述目的,本发明提供了如下方案:
一种降水事件引导的遥感降水反演训练样本自适应选取方法,包括:
获取降水二值图,所述降水二值图包括降水区域和非降水区域;
采用分类算法对所述降水区域进行连通域划分得到多个降水连通域;
对于任意一个降水连通域,根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量;
根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本;
对所述非降水区域的像素进行随机取样得到非降水样本;
确定所有降水连通域的降水样本和所述非降水样本为降水反演训练样本。
可选的,所述获取降水二值图,具体包括:
获取降水情况图,所述降水情况图的像素值为降水量,所述降水情况图的像素位置为像素对应的地理位置;
对所述降水情况图进行阈值分割得到降水二值图。
可选的,所述在所述采用分类算法对所述降水区域进行连通域划分得到多个降水连通域之前还包括:
对所述降水二值图进行图像掩膜处理得到处理后的降水区域。
可选的,所述根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量,具体为:
根据公式Mi=(Ni/Ntotal)*Mtotal计算第i个降水连通域的取样数量,其中,Mi为第i个降水连通域的取样数量,Mtotal为预设降水样本数量;Ni为第i个降水连通域的像素数,Ntotal为降水区域的像素数。
可选的,所述根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本,具体为:
根据公式Si={Pk|k=[(t-0.5)/Mi*Ni],t∈N+,1≤t≤Mi}得到第i个降水连通域的降水样本,其中Si为第i个降水连通域的降水样本,Pk为第i个降水连通域的降水样本中第k个降水像素,t为降水连通域的样本序号,Mi为第i个降水连通域的取样数量,Ni为第i个降水连通域的像素数。
可选的,所述对所述非降水区域的像素进行随机取样得到非降水样本,具体包括:
根据所述非降水区域中各像素的位置对所述非降水区域中各像素进行标号得到所述非降水区域各像素的像素序号;
根据预设非降水样本数量和各像素的像素序号对所述非降水区域的像素进行随机取样得到非降水样本。
一种降水事件引导的遥感降水反演训练样本自适应选取***,包括:
获取模块,用于获取降水二值图,所述降水二值图包括降水区域和非降水区域;
降水连通域确定模块,用于采用分类算法对所述降水区域进行连通域划分得到多个降水连通域;
数量确定模块,用于对于任意一个降水连通域,根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量;
降水样本确定模块,用于根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本;
非降水样本确定模块,用于对所述非降水区域的像素进行随机取样得到非降水样本;
反演训练样本确定模块,用于确定所有降水连通域的降水样本和所述非降水样本为降水反演训练样本。
可选的,所述获取模块包括:
获取单元,用于获取降水情况图,所述降水情况图的像素值为降水量,所述降水情况图的像素位置为像素对应的地理位置;
二值图确定单元,用于对所述降水情况图进行阈值分割得到降水二值图。
可选的,所述降水事件引导的遥感降水反演训练样本自适应选取***还包括:处理模块,用于对所述降水二值图进行图像掩膜处理得到处理后的降水区域。
可选的,所述非降水样本确定模块包括:
序号确定单元,用于根据所述非降水区域中各像素的位置对所述非降水区域中各像素进行标号得到所述非降水区域各像素的像素序号;
非降水样本确定单元,用于根据预设非降水样本数量和各像素的像素序号对所述非降水区域的像素进行随机取样得到非降水样本。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明根据各降水连通域的像素数、降水区域的像素数和预设降水样本数量得到各降水连通域的取样数量,使得各降水连通域均可以被采样,并且由于覆盖到每个降水连通域,使得提取的样本数量无大量重复和冗余,能够大大弥补随机选取法代表性不足的问题,而且根据降水连通域的取样数量和像素数对降水连通域的像素进行取样,使得样本选择不会过于集中也有足够的变异性,能够有效代表不同情况、不同特征的降水,以此来提高根据其训练出的模型的普适性避免过拟合。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的降水事件引导的遥感降水反演训练样本自适应选取方法的流程图;
图2为应用降水事件引导的遥感降水反演训练样本自适应选取方法进行实验的具体流程图;
图3为本发明中不同算法结果的对比图,图3(a)为随机平均样本取样法的取样结果图,图3(b)为采用本发明提出的基于降水事件的样本自适应选取方法的取样结果图;
图4为本发明实施例提供的降水事件引导的遥感降水反演训练样本自适应选取***的框图;
图5为本发明实施例提供的更为具体的降水事件引导的遥感降水反演训练样本自适应选取方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
目前的训练样本选取方法主要有随机法、数值分布控制法以及基于相似度(一致性)判断的样本选择法。不同样本集选取下模型的代表性和普适性各有侧重,其特点罗列如下:
不同样本选择策略下模型的代表性由强至弱为:基于相似度判断的样本选择法、数值分布控制法、随机选择法;而不同样本选择策略下模型的普适性由强至弱为:随机选择法、数值分布控制法、基于相似度判断的样本选择法;而由于先验设定导致的人为干扰对样本集的影响程度由强至弱为:数值分布控制法、基于相似度判断的样本选择法、随机选择法。
其中随机选择法优点是实现简单,但是缺乏对正样本的代表性;数值分布控制法能有效提升对正样本的代表性,但其中的监督性大大增强,其结果很容易受到先验设定参数的影响;而基于相似度判断的样本选择方法能够显著提升样本集的集内一致性,但该过程需要不断迭代,计算过程较慢,同时由于集内一致性的提高,导致过拟合的可能性显著增强,而过拟合则会显著降低训练模型的普适性,可能导致模型无法使用。代表性强,普适性弱的模型对于样本集中代表的情况模拟较好,但是对于样本集中未出现或者出现较少的情况,会出现奇异值结果,对于整体模拟结果影响较大。
本实施例提供的样本确定方法根据实际的降水事件,将样本选取名额分配至各个降水事件中,最终生成具有较高代表性和普适性的降水样本集,供降水反演模型训练和学习,本实施例克服已有样本选择方法存在的明显缺陷,基于物理事实和现象选择合适的样本,最终使得该样本集具有较高的代表性和普适性,同时摆脱对于先验参数的严重依赖,如图1所示,本实施例提供的降水事件引导的遥感降水反演训练样本自适应选取方法过程如下:
步骤101:获取降水二值图。所述降水二值图包括降水区域和非降水区域。
步骤102:采用分类算法对所述降水区域进行连通域划分得到多个降水连通域。
步骤103:对于任意一个降水连通域,根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量。
步骤104:根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本。
步骤105:对所述非降水区域的像素进行随机取样得到非降水样本。对于非降水区域,由于其往往面积较大并且连接成片,所以其方法较为简单,仅需要根据像素位置序号平均选取即可。
步骤106:确定所有降水连通域的降水样本和所述非降水样本为降水反演训练样本。
输入的降水情况图需要进行阈值分割以产生降水事件的分布图(降水二值图),因为降水预测往往存在大量接近0的小估计值,这类估计值是否需要被判断成为降水事件需要通过阈值分割来实现。在实际应用中,步骤101具体包括:
获取降水情况图,该图为栅格格式,所述降水情况图的像素值为降水量,所述降水情况图的像素位置为像素对应的地理位置。
对所述降水情况图进行阈值分割得到降水二值图。此处本方法采用国际上较为通用的值(0.1mm/hour)作为阈值,对降水事件进行判断:即大于等于该阈值像素的标记为1,判断为降水,相似的,小于该阈值的像素标记为0,判断为无降水。
在实际应用中,所述采用分类算法对所述降水区域进行连通域划分得到多个降水连通域是基于连通域原理,即相邻相近的像素会被判断为同一个连通域下面的子集,这样提取出来的相邻连通域中不会出现像素独立的情况,采用的邻近判断为4-邻近判断,即当某一个像素处于另一个像素的正上,正下,正左,或正右的情况下,这两个像素才会被判断为相邻。因此通过这种方式,一张降水分布图将会被分割为多个连通域,每一个连通域则标志着其为一次地理连续的降水事件。
图像的膨胀与腐蚀是图形学操作中一个基本步骤。在实际应用中,在所述采用分类算法对所述降水区域进行连通域划分得到多个降水连通域之前还包括:
对所述降水二值图进行图像掩膜处理得到处理后的降水区域,最终能够使得连通域的范围扩大或缩小。此处图形膨胀或腐蚀的阈值选择为4连通域,同时仅操作一次,先腐蚀后膨胀,该步骤的目的是为了减少单个降水像素的影响,减少随机噪声的影响,使得整个算法专注于规模较大的降水事件上。
在实际应用中,所述根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量,具体为:
根据Mi=(Ni/Ntotal)*Mtotal 公式(1)
计算第i个降水连通域的取样数量,其中,Mi为第i个降水连通域的取样数量,Mtotal为预设降水样本数量;Ni为第i个降水连通域的像素数,Ntotal为降水区域的像素数。
在实际应用中,所述根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本,具体为:
根据Si={Pk|k=[(t-0.5)/Mi*Ni],t∈N+,1≤t≤Mi} 公式(2)
得到第i个降水连通域的降水样本,其中Si为第i个降水连通域的降水样本,Pk为第i个降水连通域的降水样本中第k个降水像素,t为降水连通域的样本序号,Mi为第i个降水连通域的取样数量,Ni为第i个降水连通域的像素数。
在实际应用中,所述对所述非降水区域的像素进行随机取样得到非降水样本,具体包括:
根据所述非降水区域中各像素的位置对所述非降水区域中各像素进行标号得到所述非降水区域各像素的像素序号。
根据预设非降水样本数量和各像素的像素序号对所述非降水区域的像素进行随机取样得到非降水样本。
如图2所示,本实施例还提供了应用上述方法对2018年6月1日经纬度为(105.0° -130.0°E,18.2° -38.0°N)的降雨量进行实验,最终得到与预设名额一致的150个降水样本与450个非降水样本,具体步骤为:
步骤S210:对降水图进行阈值分割,得到降水区域与非降水区域的二值图像。
步骤S220:对于非降水区域进行根据地理位置的平均取样选取方法。
步骤S230:对降水区域进行图像腐蚀和图像膨胀操作。
步骤S240:对降水区域进行降水事件连通域划分。
步骤S250:对于已经划分好的降水区域,根据其面积进行降水名额分配。具体为根据公式(1)进行降水名额分配根据公式(2)降水样本选取。
步骤S260:将降水事件样本与非降水事件样本整合为最终降水样本集。
其效果对比如图3所示,其中图3(a)为常见的平均随机取样法得到的结果图,而图3(b)则为应用本发明提供的基于降水事件的自适应样本选择方法得到的结果图,通过图3可知,本实施例提供的方法可替代原先常见的平均随机样本取样法,生成具有降水事件特征,同时代表性高普适性高的,可以根据预设名额调整降水与非降水样本数量的降水训练样本集。而后将此数据集输入机器学习框架,即可进行降水反演。
如图4所示,本实施例还提供了一种与上述方法对应的降水事件引导的遥感降水反演训练样本自适应选取***,所述***包括:
获取模块A1,用于获取降水二值图,所述降水二值图包括降水区域和非降水区域。
降水连通域确定模块A2,用于采用分类算法对所述降水区域进行连通域划分得到多个降水连通域。
数量确定模块A3,用于对于任意一个降水连通域,根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量。
降水样本确定模块A4,用于根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本。
非降水样本确定模块A5,用于对所述非降水区域的像素进行随机取样得到非降水样本。
反演训练样本确定模块A6,用于确定所有降水连通域的降水样本和所述非降水样本为降水反演训练样本。
作为一种可选的实施方式,所述获取模块包括:
获取单元,用于获取降水情况图,所述降水情况图的像素值为降水量,所述降水情况图的像素位置为像素对应的地理位置。
二值图确定单元,用于对所述降水情况图进行阈值分割得到降水二值图。
作为一种可选的实施方式,所述降水事件引导的遥感降水反演训练样本自适应选取***还包括:处理模块,用于对所述降水二值图进行图像掩膜处理得到处理后的降水区域。
作为一种可选的实施方式,所述非降水样本确定模块包括:
序号确定单元,用于根据所述非降水区域中各像素的位置对所述非降水区域中各像素进行标号得到所述非降水区域各像素的像素序号。
非降水样本确定单元,用于根据预设非降水样本数量和各像素的像素序号对所述非降水区域的像素进行随机取样得到非降水样本。
图5为本实施例提供的更为具体的降水事件引导的遥感降水反演训练样本自适应选取方法的流程图,对于实际降水图,首先通过阈值分割得到二值图,根据二值图中的像素值判断此像素是否有降水,得到降水区域与非降水区域,对非降水区域通过简单的平均取样,对降水区域进行图像腐蚀并膨胀,然后通过降水事件的划分得到彼此独立但内部连通的连通域,然后按分位点选取得到降水样本,将降水样本和非降水样本确定为样本位置集。
本发明有以下优点:
1、本发明先根据图形学中连通域的概念将整体降水划分为各个降水区域,然后再在每一个降水区域中根据所分配名额和分位数选取样本能够有效平衡不同方法间的劣势,因为样本选择时根据降水事件作为基础,根据名额分配至降水事件中,并无大量重复和冗余,所以能够大大弥补随机选取法代表性不足的问题
2、由于该方法所选取的样本集是根据降水名额分配至各个降水事件中,不会使得样本选择过于集中,使其也有足够的变异性,能够有效代表不同情况、不同特征的降水事件,以此来提高其训练出的模型的普适性避免过拟合,优于基于相似度的判别法。
3、无太多关键参数需要输入,仅有降水名额需要事先输入,而该参数仅基本影响数据的体量,对于数据的分布和选择策略并无直接影响,所以相对数值分布控制法,对于人为先验参数设定并无严重依赖,是一个鲁棒性较高的样本选择方法。
4、能够定向寻找降水事件,根据降水事件来划分样本名额并选择,可以有效提高样本集的代表性;并且先验参数对样本选择结果影响不大,具有足够的稳定性;同时由于根据降水团的选择,样本集具有足够的变异性,能够有效防止过拟合,增加样本集的普适性。
5、本发明能够应用图像腐蚀技术,有效减少噪音点对于最终样本选择的影响。
6、本发明能够根据每个降水事件内的分位数进行样本选择,使得最终选择的降水样本集具有普适性,对于最终的样本生成结果并不敏感,可以摆脱对于先验参数的依赖。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种降水事件引导的遥感降水反演训练样本自适应选取方法,其特征在于,包括:
获取降水二值图,所述降水二值图包括降水区域和非降水区域;
采用分类算法对所述降水区域进行连通域划分得到多个降水连通域;
对于任意一个降水连通域,根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量;
根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本;
对所述非降水区域的像素进行随机取样得到非降水样本;
确定所有降水连通域的降水样本和所述非降水样本为降水反演训练样本;
所述根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量,具体为:
根据公式Mi=(Ni/Ntotal)*Mtotal计算第i个降水连通域的取样数量,其中,Mi为第i个降水连通域的取样数量,Mtotal为预设降水样本数量;Ni为第i个降水连通域的像素数,Ntotal为降水区域的像素数;
所述根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本,具体为:
根据公式Si={Pk|k=[(t-0.5)/Mi*Ni],t∈N+,1≤t≤Mi}得到第i个降水连通域的降水样本,其中Si为第i个降水连通域的降水样本,Pk为第i个降水连通域的降水样本中第k个降水像素,t为降水连通域的样本序号,Mi为第i个降水连通域的取样数量,Ni为第i个降水连通域的像素数。
2.根据权利要求1所述的一种降水事件引导的遥感降水反演训练样本自适应选取方法,其特征在于,所述获取降水二值图,具体包括:
获取降水情况图,所述降水情况图的像素值为降水量,所述降水情况图的像素位置为像素对应的地理位置;
对所述降水情况图进行阈值分割得到降水二值图。
3.根据权利要求1所述的一种降水事件引导的遥感降水反演训练样本自适应选取方法,其特征在于,在所述采用分类算法对所述降水区域进行连通域划分得到多个降水连通域之前还包括:
对所述降水二值图进行图像掩膜处理得到处理后的降水区域。
4.根据权利要求1所述的一种降水事件引导的遥感降水反演训练样本自适应选取方法,其特征在于,所述对所述非降水区域的像素进行随机取样得到非降水样本,具体包括:
根据所述非降水区域中各像素的位置对所述非降水区域中各像素进行标号得到所述非降水区域各像素的像素序号;
根据预设非降水样本数量和各像素的像素序号对所述非降水区域的像素进行随机取样得到非降水样本。
5.一种降水事件引导的遥感降水反演训练样本自适应选取***,其特征在于,包括:
获取模块,用于获取降水二值图,所述降水二值图包括降水区域和非降水区域;
降水连通域确定模块,用于采用分类算法对所述降水区域进行连通域划分得到多个降水连通域;
数量确定模块,用于对于任意一个降水连通域,根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量;
降水样本确定模块,用于根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本;
非降水样本确定模块,用于对所述非降水区域的像素进行随机取样得到非降水样本;
反演训练样本确定模块,用于确定所有降水连通域的降水样本和所述非降水样本为降水反演训练样本;
所述根据所述降水连通域的像素数、所述降水区域的像素数和预设降水样本数量得到所述降水连通域的取样数量,具体为:
根据公式Mi=(Ni/Ntotal)*Mtotal计算第i个降水连通域的取样数量,其中,Mi为第i个降水连通域的取样数量,Mtotal为预设降水样本数量;Ni为第i个降水连通域的像素数,Ntotal为降水区域的像素数;
所述根据所述降水连通域的取样数量和所述降水连通域的像素数对所述降水连通域的像素进行取样,得到所述降水连通域的降水样本,具体为:
根据公式Si={Pk|k=[(t-0.5)/Mi*Ni],t∈N+,1≤t≤Mi}得到第i个降水连通域的降水样本,其中Si为第i个降水连通域的降水样本,Pk为第i个降水连通域的降水样本中第k个降水像素,t为降水连通域的样本序号,Mi为第i个降水连通域的取样数量,Ni为第i个降水连通域的像素数。
6.根据权利要求5所述的一种降水事件引导的遥感降水反演训练样本自适应选取***,其特征在于,所述获取模块包括:
获取单元,用于获取降水情况图,所述降水情况图的像素值为降水量,所述降水情况图的像素位置为像素对应的地理位置;
二值图确定单元,用于对所述降水情况图进行阈值分割得到降水二值图。
7.根据权利要求5所述的一种降水事件引导的遥感降水反演训练样本自适应选取***,其特征在于,还包括:处理模块,用于对所述降水二值图进行图像掩膜处理得到处理后的降水区域。
8.根据权利要求5所述的一种降水事件引导的遥感降水反演训练样本自适应选取***,其特征在于,所述非降水样本确定模块包括:
序号确定单元,用于根据所述非降水区域中各像素的位置对所述非降水区域中各像素进行标号得到所述非降水区域各像素的像素序号;
非降水样本确定单元,用于根据预设非降水样本数量和各像素的像素序号对所述非降水区域的像素进行随机取样得到非降水样本。
CN202110655233.5A 2021-06-11 2021-06-11 降水事件引导的遥感降水反演训练样本自适应选取方法 Active CN113269805B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110655233.5A CN113269805B (zh) 2021-06-11 2021-06-11 降水事件引导的遥感降水反演训练样本自适应选取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110655233.5A CN113269805B (zh) 2021-06-11 2021-06-11 降水事件引导的遥感降水反演训练样本自适应选取方法

Publications (2)

Publication Number Publication Date
CN113269805A CN113269805A (zh) 2021-08-17
CN113269805B true CN113269805B (zh) 2022-06-28

Family

ID=77234884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110655233.5A Active CN113269805B (zh) 2021-06-11 2021-06-11 降水事件引导的遥感降水反演训练样本自适应选取方法

Country Status (1)

Country Link
CN (1) CN113269805B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115034317A (zh) * 2022-06-17 2022-09-09 中国平安人寿保险股份有限公司 保单识别模型的训练方法和装置、保单识别方法和装置
CN116468737A (zh) * 2023-04-10 2023-07-21 华能澜沧江水电股份有限公司 降雨信息获取方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053371A (zh) * 2020-09-29 2020-12-08 成都星时代宇航科技有限公司 一种遥感图像中的水体提取方法和装置
WO2021094753A1 (en) * 2019-11-11 2021-05-20 University Of Newcastle Upon Tyne Configuration of global satellite navigation system infrastructure

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021094753A1 (en) * 2019-11-11 2021-05-20 University Of Newcastle Upon Tyne Configuration of global satellite navigation system infrastructure
CN112053371A (zh) * 2020-09-29 2020-12-08 成都星时代宇航科技有限公司 一种遥感图像中的水体提取方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A Method for Detecting Rainfall From X-Band Marine Radar Images;Yan Zheng et al.;《IEEE Access》;20200122;第08卷;全文 *
Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究;王根等;《红外与毫米波学报》;20200415(第02期);全文 *
KNN不同距离度量对FY-4A/ AGRI红外亮温反演降水的影响研究;王根等;《红外》;20200425(第04期);全文 *

Also Published As

Publication number Publication date
CN113269805A (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
US20220043182A1 (en) Spatial autocorrelation machine learning-based downscaling method and system of satellite precipitation data
CN113496104B (zh) 基于深度学习的降水预报订正方法及***
CN113269805B (zh) 降水事件引导的遥感降水反演训练样本自适应选取方法
CN109636171A (zh) 一种区域植被恢复的综合诊断与风险评价方法
CN111382929A (zh) 一种构建河流硅藻水华预警模型的方法及装置
CN111915058B (zh) 基于长短时记忆网络和迁移学习的洪水预测方法与装置
CN110706213B (zh) 基于应变响应累积分布函数差的桥梁集群结构损伤判别方法
CN107230214B (zh) 基于递归otsu算法的sar图像水域自动检测方法
CN111105068B (zh) 基于序回归学习的数值模式订正的方法
CN112598248A (zh) 负荷预测方法、装置、计算机设备和存储介质
CN115423163A (zh) 一种流域短期洪水事件预测方法、装置及终端设备
CN111767517A (zh) 一种应用于洪水预测的BiGRU多步预测方法、***及存储介质
CN108399430A (zh) 一种基于超像素和随机森林的sar图像舰船目标检测方法
CN112907970A (zh) 一种基于车辆排队长度变化率的可变车道转向控制方法
Chen et al. Tempee: Temporal-spatial parallel transformer for radar echo extrapolation beyond auto-regression
CN116861306A (zh) 一种基于用电趋势量化网络的异常用电检测方法
CN117494871A (zh) 一种考虑船舶交互影响的船舶轨迹预测方法
CN113591608A (zh) 一种基于深度学习的高分辨率遥感影像不透水面提取方法
Noor et al. Prediction map of rainfall classification using random forest and inverse distance weighted (IDW)
CN116739172A (zh) 一种基于爬坡识别的海上风电功率超短期预测方法及装置
Zhu et al. The optimal bias correction for daily extreme precipitation indices over the Yangtze-Huaihe River Basin, insight from BCC-CSM1. 1-m
Shaw et al. A methodology for preserving channel flow networks and connectivity patterns in large‐scale distributed hydrological models
Wang et al. Perceptual loss function for generating high-resolution climate data
CN111752976A (zh) 气象数据处理方法、装置、计算机设备及可读存储介质
CN111914751A (zh) 一种图像人群密度识别检测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant