CN117542034A - 一种降水自记纸图片降水量数据自动提取方法 - Google Patents

一种降水自记纸图片降水量数据自动提取方法 Download PDF

Info

Publication number
CN117542034A
CN117542034A CN202311447744.3A CN202311447744A CN117542034A CN 117542034 A CN117542034 A CN 117542034A CN 202311447744 A CN202311447744 A CN 202311447744A CN 117542034 A CN117542034 A CN 117542034A
Authority
CN
China
Prior art keywords
precipitation
trace
pixel
self
recording paper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311447744.3A
Other languages
English (en)
Inventor
叶海波
易文林
俞汇
韦浩
聂源
文啸
束冬
李琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hydrological Master Station
Nanjing University of Aeronautics and Astronautics
Original Assignee
Shanghai Hydrological Master Station
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hydrological Master Station, Nanjing University of Aeronautics and Astronautics filed Critical Shanghai Hydrological Master Station
Priority to CN202311447744.3A priority Critical patent/CN117542034A/zh
Publication of CN117542034A publication Critical patent/CN117542034A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种降水自记纸图片降水量数据自动提取方法,属于水文处理技术。首先基于典型降水迹线颜色特征、位置特征识别降水迹线像素提取降水自记纸上由降水自记仪器添加的有效降水图像信息,然后根据降水迹线局部方向选取合适识别方向对降水迹线边界进行标记;根据降水迹线的单调性和连续性修复降水迹线存在的锯齿、空白等问题,并计算修复完成后降水迹线的中心位置;通过探针组探测并确定表格的上、下、左、右边缘,重建出降水迹线所在表格区域的表格线;最后是对降水迹线的每个像素点,利用其在表格横轴上的位置计算此像素点代表的时间,利用其在表格纵轴上的位置计算此像素点代表的降水量。

Description

一种降水自记纸图片降水量数据自动提取方法
技术领域
本发明属于水文行业数据与图像处理领域,具体为基于图像处理技术,尤其是一种降水自记纸图片降水量数据自动提取方法。
背景技术
水文资料是水旱灾害防御、水资源管理、水工程建设的重要依据。我国自19世纪40年代,开始采用标准雨量器观测积累降水量资料。建国至90年代期间,随着虹吸式自记雨量计的普及应用,水文测站降水量观测由人工分段制观测转变为雨量计连续自记观测,在规格统一的降水自记纸上记录每日降水量的变化过程,形成了大量水文档案记录。这些记录反映了特定区域降水量随时间的变化过程,在水文时空规律分析中具有重要价值。当前,大量降水自记资料经水文资料整编和自记纸扫描,以逐日降水量成果和图片记录形式保存。在暴雨、台风等极端天气的水文深度分析应用中,每场降水的过程资料尤为重要。然而这些降水自记纸图片中包含的过程降水量数据难以直接读取应用,如何将非结构化的图片形式数据转换为可直接应用的数字数据是亟需解决的问题。
目前,多数降水自记纸图片数据提取采用人工读取的方式,然而由于水文档案数量巨大,且不同应用对水文数据读取粒度要求多样,人工读取效率低。同时,降水自记纸图片实际情况较为复杂,图片统一的规律性不强,例如经常存在一张降水自记纸重复记录多日降水量数据,降水迹线因仪器问题颜色过淡甚至部分缺失、降水迹线因墨团、人为添加标注、仪器调试等污染等,因此需要采用信息化技术,构建一种高效、准确的自动化提取方法,读取降水自记图片中的过程降雨量数据。
经检索得知,可实际应用的降水自记纸图片降水量数据自动提取方法所见公开的极少。熊传圣、艾萍、袁定波等提出了一种雨量计自记纸数据采集方法(CN 111523382A),其首先识别和定位降水自记纸图片的表格区域,将此区域非表格线部分作为降水迹线,然后基于纵向上降水迹线的位置确定当前时间的降水量数据。然而此方法不能有效应对相对复杂的降水自记纸图片。
发明内容
发明目的:针对现有水文观测中对于降水自记仪器自动绘制的降水迹线图无法准确的识别降水量等问题,本发明提供一种降水自记纸图片降水量数据自动提取方法。
技术方案:一种降水自记纸图片降水量数据自动提取方法,所述方法应用于降水自记纸上由降水自记仪器添加的图像信息,还包括依据识别的降水迹线对监测地区各时间点降水量的计算,步骤包括:
S1、降水迹线识别:首先是基于典型降水迹线颜色特征识别降水迹线像素,包括对因与表格线、标注重合导致颜色变化的疑似降水迹线像素的识别,接着基于空间邻域特征消除图片中污染等因素的干扰,进一步识别降水迹线,最后将降水自记纸图片二值化处理,只显示黑色降水迹线;
S2、降水迹线提取:删除降水迹线中与降水量无关的无效迹线部分,根据降水迹线局部方向确定识别方向对降水迹线边界进行标记,然后根据降水迹线的单调性和连续性修复降水迹线存在的锯齿、空白;并且通计算修复完成后降水迹线的中心位置;
S3、表格线还原:通过在表格的边缘位置添加探针组,探测并确定表格的上、下、左、右边缘;基于降水自记纸中水平和垂直表格线均匀分布的排列规则,重建出降水迹线所在表格区域的表格线;
S4、降水量计算:对降水迹线的每个像素点,利用其在表格横轴上的位置计算此像素点代表的时间,利用其在表格纵轴上的位置计算此像素点代表的降水量。
进一步的,步骤S1具体如下:
S11、根据降水自记仪器绘制的降水自记纸图片,采集像素点,且确定不同颜色之间的色差值以识别降水迹线,且包括通过采集不同深浅的降水迹线以得到降水迹线的RGB颜色范围值;
S12、将降水迹线中部分像素点与表格网格线或降水自记仪器墨迹重合像素点的RGB与步骤S11已经得到的范围值进行比较,还包括依据迹线颜色确定R、G、B值中任意两者差值范围,然后据此判定疑似降水迹线的像素,接着基于空间领域确定疑似降水迹线的像素是否为降水迹线;
S13、对降水自记纸图片二值化,其中降水迹线为黑色,其他元素为白色;
S14、构造一个左右贯穿迹线区域的矩形窗口,让窗口自下而上遍历整个迹线区域,每次遍历时计算窗口区域内降水数据迹线在水平方向上的投影像素数量;若像素投影数量大于指定阈值,且其上方仍存在其他降水迹线,则判定窗口内存在水平无效数据线;
S15、删除无效降水迹线,但保留水平降水迹线与目标降水迹线交叉部分,矩形窗口从左到右遍历水平降水迹线下沿像素点,自下而上垂直探索像素点上方两倍窗口高度内是否存在足够的黑色像素点;若存在足够的黑色像素点,则判定该像素点为水平降水迹线与正常降水迹线交叉部分,保留该位置的水平数据线部分;如不存在足够的黑色像素点,则删除当前位置水平数据线上的黑色像素;
S16、从左向右扫描降水迹线,若降水迹线像素纵向位置下降超过降水迹线高度最大值的1/3,则疑似为翻折线位置;在此位置基础上,选择此位置之前的翻折线并将其在水平方向进行投影,若投影长度大于阈值,则说明降水迹线正确上升到最高点,即疑似位置确实是翻折线所在位置;
S17、对每条翻折线进行分段处理,分为上下两段,分别找到上、下端降水迹线与翻折线的分岔点,将分岔点之间的翻折线删除,以保留更多的降水迹线。
进一步的,步骤S2具体包括:
S21、识别降水迹线,对于倾向于垂直方向的迹线段,采用横向识别的方式识别边界;对于倾向于水平方向的迹线段,则采用纵向识别的方式识别边界;
S22、基于识别的降水迹线边界,根据降水迹线的单调性和连续性修复边界,包括根据降水迹线段的单调上升性修复降水迹线边界中后继像素纵向位置低于前驱像素的情况,还根据降水迹线的连续性,修复降水迹线中存在的空白;
S23、根据提取与修复的降水迹线上下边界,依据降水迹线的水平与垂直倾向,从纵向和横向计算降水迹线的中心位置。
更进一步的,步骤S22具体的计算如下:
将某段降水迹线边界视为直角坐标系中的函数y=f(x),对于函数定义域内任意相邻两点x1、x2,若x1<x2,且在区间(x1,x2)内y=f(x)无定义,即不符合函数具有连续性的性质,需要进行修复;
首先计算f(x2)和f(x1)的差值及x2和x1的差值:
将Δx和Δy构成直角三角形的两条直角边,并根据三角函数计算出斜率:
根据斜率计算出f(x)随x变化的变化量,将f(x)的变化量Δf(x)与起始点f(x1)相加,得到最终的f(x),起点和终点的f(x1)、f(x2)保持不变:
进一步的,步骤S3具体包括:
S31、在表格上下边界选择n处探针基础位置,在每处探针基础位置附近使用m个探针探测表格线的上、下沿坐标;
获取表格的上沿坐标时,沿x正方向向下扫描,当扫描到的像素点为图片的背景像素点,则继续向下探测,直到找到1个像素点的值不在背景像素点的RGB值范围内时,则停止探测;通过比较m根探针探测结束处的坐标值,取最大的x轴坐标值作为该区间段表格线的上沿x坐标;相反,获取表格的下沿坐标时,沿x轴负方向向上扫描,直到扫描到1个像素点的值不在背景像素点的RGB值范围内时,停止探测;通过比较m根探针探测结束处的坐标值,取最小的x轴坐标值作为该区间段表格线的下沿x坐标;
S32、在表格左右边界选择n处探针基础位置,依据步骤S31的方式获取到表格左右边界;
S33、基于探测出表格的上下左右边界线,基于降水自记纸中水平和垂直表格线均匀分布的排列规则,重建出降水迹线所在表格区域的表格线。
进一步的,步骤S4的计算具体如下:
确定横轴每n分钟对应的像素个数countn,第i段降水迹线在横轴上的起始确定横轴上的开始位置xleft,计算出横轴上第j个n分钟的位置:
xj=xleft+countn×j
找出当前表格纵线的起点yfloor与终点ytop,遍历当前的表格纵线,若当前位置竖线位置ynow处有降水迹线像素点,则记录下该像素点对应的时间t,表示为:
t=tstart+n×j
其中,start为降水量记录开始实践;
由于表格纵线各像素的纵坐标代表的降水量范围为-0.5到10.5,因此可以根据降水迹线像素的纵坐标ynow计算出与时间信息t对应的降水量信息datat,计算公式如下:
有益效果:本发明提出的方法可非常高效、较为准确地提取降水量数据,可在全国推广应用。同时,该方法可移植于水文行业内的水位自记图片过程数据提取,提取成果可为历史重大洪涝灾害、典型台风水情反演分析提供重要数据支撑。
附图说明
图1是本发明所述方法的流程示意图;
图2是由降水自仪器绘制的降水自记图;
图3是降水迹线识别的结果示意图;
图4是无线降水迹线删除的结果;
图5是翻折线定位的处理结果;
图6是翻折线删除的处理结果;
图7是步骤S21中的步进检测降水迹线倾斜方向以识别边界的示意图;
图8是降水迹线中心位置的示意;
图9是表格上、下边界线探测结果,其中图9(a)是表格上边界线的探测结果,图9(b)表格下边界线的探测结果。
具体实施方式
为详细说明本发明所公开的技术方案,下面结合说明书附图做进一步的介绍。
首先如图2所示的是由降水自仪器绘制的降水自记图,也是目前较为常见的降水自记方式,结合图2可知:
由降水自仪器绘制的降水自记图存在相当多的降水自记纸存在记录多条降水迹线的情况。例如其中曲线(a)所示,因为晴天降水迹线为水平线,通常会复用此降水自记纸继续记录,现有技术目前未记载有相关方法能够很好的在纵向确定目标降水迹线的位置,因而无法提取降水量数据;暴雨天气会造成降水自记纸存在多处翻折迹线,如图2中的曲线(b)所示;还存在一些在仪器结束记录时人为造成一条垂直迹线,如图2中的曲线(c)所示,这均会造成已有方法无法确定降水迹线的位置,因而无法提取降水量数据。另外,暴雨天气会造成降水自记纸上的降水迹线非常陡峭,如图2中的曲线(d)所示,这会造成降水迹线在纵向上跨度较大,已有方法难以确定降水迹线的纵向中心位置,因而难以准确读取数据。
为解决上述问题,本发明提供的一种降水自记纸图片降水量数据自动提取方法,可以针对较为复杂的降水自记图片,自动提取降水量数据。图1所示的是本发明提出的降水自记纸图片降水量数据自动提取方法的流程图。
本发明所述方法自动提取降水自记图片中降水量数据的流程,包括降水迹线识别,降水迹线提取、表格线还原、降水量计算。
S1、降水迹线识别,首先是基于典型降水迹线颜色特征识别降水迹线像素,包括对因与表格线、标注重合导致颜色变化的疑似降水迹线像素的识别,接着基于空间邻域特征消除图片中污染等因素的干扰,进一步识别降水迹线,最后将降水自记纸图片二值化处理,只显示黑色降水迹线;
S2、降水迹线还原,删除降水迹线中与降水量无关的无效迹线部分,即只保留读取降水量数据需要的降水迹线部分,并计算降水迹线(存在一定宽度)的中心位置。
根据降水迹线局部方向(倾向于水平还是垂直)选取合适识别方向对降水迹线边界进行标记;根据降水迹线的单调性和连续性,修复降水迹线存在的锯齿、空白等问题;计算修复完成后降水迹线的中心位置。
S3、表格线还原,即还原降水自记纸表格区域的表格线。
通过在表格的上、下、左、右边缘的多个位置添加探针组,探测并确定表格的上、下、左、右边缘;基于降水自记纸中水平和垂直表格线均匀分布的排列规则,重建出降水迹线所在表格区域的表格线。
S4、降水量计算,对降水迹线的每个像素点,利用其在表格横轴上的位置计算此像素点代表的时间,利用其在表格纵轴上的位置计算此像素点代表的降水量。
具体的,该方法的步骤具体如下:
S1、降水迹线识别
S11、基于典型颜色提取降水迹线。由于降水自记仪器使用的紫色(或蓝色)墨水统一,因此首先基于不同深浅的降水迹线采样1000个像素点,得出像素点的RGB颜色范围。以紫色降水迹线为例,其RGB颜色范围为|R值-G值>20,24<R值<220,且B值>32。
S12、基于空间邻域进一步提取降水迹线。降水迹线中部分像素点与表格网格线或铅笔字迹重合像素重合,导致其颜色不在典型降水迹线RGB颜色范围内,从而造成提取的降水迹线断续。
S121、根据颜色提取疑似降水迹线像素,若像素RGB颜色满足B值为R、G、B值中的最小值、G值-B值<20、R值-B值<20、24<R值<190且B值>32,或者G值-B值的绝对值<=8,200<R值<220且B值>32,则判定为疑似降水迹线像素。
S122、查看以当前疑似降水数据迹线像素点为中心3*3的空间邻域内是否存在降水数据迹线点。若存在,则将此疑似降水迹线像素标记为降水迹线像素。重复此步骤,直到降水迹线像素集合不再变化。
S13、将降水自记纸图片二值化,降水迹线为黑色,其他元素为白色,形成图3所示的结果。
S14、查找无效降水迹线。构造一个左右贯穿迹线区域、高度为24个像素的矩形窗口,让窗口自下而上遍历整个迹线区域。每次遍历时计算窗口区域内降水数据迹线在水平方向上的投影像素数量。若像素投影数量大于指定阈值,且其上方仍存在其他降水迹线(即可探测到大量黑色像素),则可以判定窗口内存在水平无效数据线。
S15、删除无效降水迹线:在识别出所有水平降水迹线后需要将其删除,需要注意不能删除水平降水迹线与目标降水迹线交叉部分,否则将造成目标降水数据迹线断裂。使用高度为16、宽度为8的矩形窗口从左到右遍历水平降水迹线下沿像素点,自下而上垂直探索像素点上方两倍窗口高度内是否存在足够的黑色像素点。若存在足够的黑色像素点,则判定该像素点为水平降水迹线与正常降水迹线交叉部分,保留该位置的水平数据线部分。如不存在足够的黑色像素点,则删除当前位置水平数据线上的黑色像素。图4展示了删除无效降水迹线后的结果。
S16、查找翻折线:如图5所示,从左向右扫描降水迹线,若降水迹线像素纵向位置下降了360个像素,则疑似为翻折线位置。在此位置基础上,选择此位置之前(即此位置左侧12个像素的位置)的翻折线并将其在水平方向进行投影,若投影长度大于阈值,则说明降水迹线正确上升到最高点,即疑似位置确实是翻折线所在位置。
S17:删除翻折线。对每条翻折线进行分段处理,分为上下两段。分别找到上、下端降水迹线与翻折线的分岔点,将分岔点之间的翻折线删除,以保留更多的降水迹线。删除翻折线后的降水迹线如图6所示。
S2、降水迹线的提取
S21、降水迹线边界识别:降水迹线的斜率经常不断变化,对于倾向于垂直方向的迹线段,采用横向识别的方式能够完成较好地识别边界;对于倾向于水平方向的迹线段,则适宜采用纵向识别的方式。如图7所示,本发明所述方法可根据矩形检测框内迹线段的倾斜方向自动调整识别方向,从而更好地识别降水迹线边界。
S22、降水迹线修复:基于识别的降水迹线边界,根据降水迹线的单调性和连续性修复边界。以修复倾向水平方向的降水迹线为例,首先根据降水迹线段的单调上升性,修复降水迹线边界中后继像素纵向位置低于前驱像素的情况。根据降水迹线的连续性,修复降水迹线中存在的空白。从前一个迹线像素点开始,经过空白区域,到后一个迹线像素点结束,采用线性平滑方式进行处理。
将某段降水迹线边界视为直角坐标系中的函数y=f(x),对于函数定义域内任意相邻两点x1、x2,若x1<x2,且在区间(x1,x2)内y=f(x)无定义,即不符合函数具有连续性的性质,需要进行修复。
首先计算f(x2)和f(x1)的差值及x2和x1的差值:
将Δx和Δy构成直角三角形的两条直角边,并根据三角函数计算出斜率:
根据斜率计算出f(x)随x变化的变化量,将f(x)的变化量Δf(x)与起始点f(x1)相加,得到最终的f(x),起点和终点的f(x1)、f(x2)保持不变:
S23、降水迹线中心位置计算。根据提取与修复的降水迹线上下边界,依据降水迹线的水平与垂直倾向,从纵向和横向计算降水迹线的中心位置,如图8所示。
S3、表格线还原
S31、表格上下边界获取:如图9所示,在表格上下边界选择n处探针基础位置,在每处探针基础位置附近使用6个探针探测表格线的上、下沿坐标。获取表格的上沿坐标时,沿x正方向向下扫描,当扫描到的像素点为图片的背景像素点,则继续向下探测,直到找到1个像素点的值不在背景像素点的RGB值范围内时,则停止探测。通过比较6根探针探测结束处的坐标值,取最大的x轴坐标值作为该区间段表格线的上沿x坐标。相反,获取表格的下沿坐标时,沿x轴负方向向上扫描,直到扫描到1个像素点的值不在背景像素点的RGB值范围内时,停止探测。通过比较6根探针探测结束处的坐标值,取最小的x轴坐标值作为该区间段表格线的下沿x坐标。
S32、表格左右边界获取。表格左右边界获取方法需要在表格左右边界选择n处探针基础位置,具体步骤与S21相同。
S33、表格线重建。基于探测出表格的上下左右边界线,基于降水自记纸中水平和垂直表格线均匀分布的排列规则,重建出降水迹线所在表格区域的表格线。
S4、降水量计算
确定横轴每5分钟对应的像素个数countn(其中的n=5),第i段降水迹线在横轴上的起始确定横轴上的开始位置xleft,计算出横轴上第j个n分钟的位置:
xj=xleft+countn×j
找出当前表格纵线的起点yfloor与终点ytop,遍历当前的表格纵线,若当前位置竖线位置ynow处有降水迹线像素点,则记录下该像素点对应的时间t,表示为:
t=tstart+5·j由于表格纵线总高度固定且被平均划分为11份(读数从-0.5到10.5),可以计算出与时间信息t对应的降水量信息datat,计算公式如下:
最后,综上所述,本发明采用上述自动提取降水自记图片中降水量数据的方法,完成25个站点51888张图片的过程降水量数据提取,平均每43秒完成一张图片处理,提取出288组数据,成功识别比例为96.74%。分析结果表明,除存在大范围污染、仪器问题造成降水迹线严重错误等极少情况,本发明提出的方法均能自动进行降水量数据提取。对25个站点共91242个日降雨量数据(存在一张降水自记纸记录多日数据的情况)与已有逐日整编成果数据进行比对,识别误差在1.0毫米内的数据占比93.1%,识别误差在5.0毫米内的数据占比97.3%,结果表明,本发明提出的方法可非常高效、较为准确地提取降水量数据,可在全国推广应用。同时,该方法可移植于水文行业内的水位自记图片过程数据提取,提取成果可为历史重大洪涝灾害、典型台风水情反演分析提供重要数据支撑。

Claims (6)

1.一种降水自记纸图片降水量数据自动提取方法,所述方法应用于降水自记纸上由降水自记仪器添加的图像信息,还包括依据识别的降水迹线对监测地区各时间点降水量的计算,其特征在于,步骤包括:
S1、降水迹线识别:首先是基于典型降水迹线颜色特征识别降水迹线像素,包括对因与表格线、标注重合导致颜色变化的疑似降水迹线像素的识别,接着基于空间邻域特征消除图片中污染在内的因素的干扰,进一步识别降水迹线,最后将降水自记纸图片二值化处理,只显示黑色降水迹线;
S2、降水迹线提取:删除降水迹线中与降水量无关的无效迹线部分,根据降水迹线局部方向确定识别方向对降水迹线边界进行标记,然后根据降水迹线的单调性和连续性修复降水迹线存在的锯齿、空白;并且通计算修复完成后降水迹线的中心位置;
S3、表格线还原:通过在表格的边缘位置添加探针组,探测并确定表格的上、下、左、右边缘;基于降水自记纸中水平和垂直表格线均匀分布的排列规则,重建出降水迹线所在表格区域的表格线;
S4、降水量计算:对降水迹线的每个像素点,利用其在表格横轴上的位置计算此像素点代表的时间,利用其在表格纵轴上的位置计算此像素点代表的降水量。
2.根据权利要求1所述的降水自记纸图片降水量数据自动提取方法,其特征在于:步骤S1具体如下:
S11、根据降水自记仪器绘制的降水自记纸图片,采集像素点,且确定不同颜色之间的色差值以识别降水迹线,且包括通过采集不同深浅的降水迹线以得到降水迹线的RGB颜色范围值;
S12、将降水迹线中部分像素点与表格网格线或降水自记仪器墨迹重合像素点的RGB与步骤S11已经得到的范围值进行比较,还包括依据迹线颜色确定R、G、B值中任意两者差值范围,然后据此判定疑似降水迹线的像素,接着基于空间领域确定疑似降水迹线的像素是否为降水迹线;
S13、对降水自记纸图片二值化,其中降水迹线为黑色,其他元素为白色;
S14、构造一个左右贯穿迹线区域的矩形窗口,让窗口自下而上遍历整个迹线区域,每次遍历时计算窗口区域内降水数据迹线在水平方向上的投影像素数量;若像素投影数量大于指定阈值,且其上方仍存在其他降水迹线,则判定窗口内存在水平无效数据线;
S15、删除无效降水迹线,但保留水平降水迹线与目标降水迹线交叉部分,矩形窗口从左到右遍历水平降水迹线下沿像素点,自下而上垂直探索像素点上方两倍窗口高度内是否存在足够的黑色像素点;若存在足够的黑色像素点,则判定该像素点为水平降水迹线与正常降水迹线交叉部分,保留该位置的水平数据线部分;如不存在足够的黑色像素点,则删除当前位置水平数据线上的黑色像素;
S16、从左向右扫描降水迹线,若降水迹线像素纵向位置下降超过降水迹线高度最大值的1/3,则疑似为翻折线位置;在此位置基础上,选择此位置之前的翻折线并将其在水平方向进行投影,若投影长度大于阈值,则说明降水迹线正确上升到最高点,即疑似位置确实是翻折线所在位置;
S17、对每条翻折线进行分段处理,分为上下两段,分别找到上、下端降水迹线与翻折线的分岔点,将分岔点之间的翻折线删除,以保留更多的降水迹线。
3.根据权利要求1所述的降水自记纸图片降水量数据自动提取方法,其特征在于:步骤S2具体包括:
S21、识别降水迹线,对于倾向于垂直方向的迹线段,采用横向识别的方式识别边界;对于倾向于水平方向的迹线段,则采用纵向识别的方式识别边界;
S22、基于识别的降水迹线边界,根据降水迹线的单调性和连续性修复边界,包括根据降水迹线段的单调上升性修复降水迹线边界中后继像素纵向位置低于前驱像素的情况,还根据降水迹线的连续性,修复降水迹线中存在的空白;
S23、根据提取与修复的降水迹线上下边界,依据降水迹线的水平与垂直倾向,从纵向和横向计算降水迹线的中心位置。
4.根据权利要求3所述的降水自记纸图片降水量数据自动提取方法,其特征在于:步骤S22具体的计算如下:
将某段降水迹线边界视为直角坐标系中的函数y=f(x),对于函数定义域内任意相邻两点x1、x2,若x1<x2,且在区间(x1,x2)内y=f(x)无定义,即不符合函数具有连续性的性质,需要进行修复;
首先计算f(x2)和f(x1)的差值及x2和x1的差值:
将Δx和Δy构成直角三角形的两条直角边,并根据三角函数计算出斜率:
根据斜率计算出f(x)随x变化的变化量,将f(x)的变化量Δf(x)与起始点f(x1)相加,得到最终的f(x),起点和终点的f(x1)、f(x2)保持不变:
5.根据权利要求1所述的降水自记纸图片降水量数据自动提取方法,其特征在于:步骤S3具体包括:
S31、在表格上下边界选择n处探针基础位置,在每处探针基础位置附近使用m个探针探测表格线的上、下沿坐标;
获取表格的上沿坐标时,沿x正方向向下扫描,当扫描到的像素点为图片的背景像素点,则继续向下探测,直到找到1个像素点的值不在背景像素点的RGB值范围内时,则停止探测;通过比较m根探针探测结束处的坐标值,取最大的x轴坐标值作为该区间段表格线的上沿x坐标;相反,获取表格的下沿坐标时,沿x轴负方向向上扫描,直到扫描到1个像素点的值不在背景像素点的RGB值范围内时,停止探测;通过比较m根探针探测结束处的坐标值,取最小的x轴坐标值作为该区间段表格线的下沿x坐标;
S32、在表格左右边界选择n处探针基础位置,依据步骤S31的方式获取到表格左右边界;
S33、基于探测出表格的上下左右边界线,基于降水自记纸中水平和垂直表格线均匀分布的排列规则,重建出降水迹线所在表格区域的表格线。
6.根据权利要求1所述的降水自记纸图片降水量数据自动提取方法,其特征在于:步骤S4的计算具体如下:
确定横轴每n分钟对应的像素个数countn,第i段降水迹线在横轴上的起始确定横轴上的开始位置xleft,计算出横轴上第j个n分钟的位置:
xj=xleft+countn×j
找出当前表格纵线的起点yfloor与终点ytop,遍历当前的表格纵线,若当前位置竖线位置ynow处有降水迹线像素点,则记录下该像素点对应的时间t,表示为:
t=tstart+n×j
其中,tstart为降水量记录开始实践;
由于表格纵线各像素的纵坐标代表的降水量范围为-0.5到10.5,因此可以根据降水迹线像素的纵坐标ynow计算出与时间信息t对应的降水量信息datat,计算公式如下:
CN202311447744.3A 2023-11-02 2023-11-02 一种降水自记纸图片降水量数据自动提取方法 Pending CN117542034A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311447744.3A CN117542034A (zh) 2023-11-02 2023-11-02 一种降水自记纸图片降水量数据自动提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311447744.3A CN117542034A (zh) 2023-11-02 2023-11-02 一种降水自记纸图片降水量数据自动提取方法

Publications (1)

Publication Number Publication Date
CN117542034A true CN117542034A (zh) 2024-02-09

Family

ID=89789014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311447744.3A Pending CN117542034A (zh) 2023-11-02 2023-11-02 一种降水自记纸图片降水量数据自动提取方法

Country Status (1)

Country Link
CN (1) CN117542034A (zh)

Similar Documents

Publication Publication Date Title
CN107633516B (zh) 一种识别路面变形类病害的方法和装置
CN109977723B (zh) 大票据图片文字识别方法
JP6790210B1 (ja) 道路損傷判定装置、道路損傷判定方法及び道路損傷判定プログラム
CN115880304B (zh) 基于复杂场景下的枕轨缺陷识别方法
CN103559490A (zh) 基于二值图像连通域统计的答题卡自动评分方法
JP5380000B2 (ja) トロリ線摩耗量測定方法および測定システム
CN111724354B (zh) 一种基于图像处理的多株小麦穗长与小穗数的测量方法
CN108830871B (zh) 基于高分辨率遥感影像和dem的黄土浅沟自动化提取方法
CN112184725B (zh) 一种沥青路面图像的结构光光条中心提取方法
CN111145157A (zh) 基于高分辨率遥感影像的路网数据自动化质量检查方法
CN108445009A (zh) 一种太阳能电池板裂纹检测方法
CN104598907A (zh) 一种基于笔画宽度图的图像中文字数据提取方法
CN111968079B (zh) 基于断面局部极值及分段稀疏的三维路面裂缝提取方法
CN109766892A (zh) 一种基于边缘检测的射线检测图像标记信息字符分割方法
WO1989004018A1 (en) Method of processing image data on road surface cracks
CN117542034A (zh) 一种降水自记纸图片降水量数据自动提取方法
CN103106663A (zh) 计算机***中基于图像处理实现sim卡缺陷检测的方法
CN112950562A (zh) 一种基于线结构光的扣件检测算法
CN116336939A (zh) 一种基于自动化检测的路面车辙指标即时分析方法
Van Piggelen et al. Automatic curve extraction for digitizing rainfall strip charts
CN115345854B (zh) 一种基于多区域搜索的水位识别方法
CN110135426B (zh) 样本标注方法及计算机存储介质
KR101387384B1 (ko) 조위관측 기록지 독취시스템 및 방법
CN105930813A (zh) 一种在任意自然场景下检测行文本的方法
CN113837996B (zh) 一种支持人工校验的地铁隧道病害自动检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination