CN112651315A - 折线图的信息提取方法、装置、计算机设备和存储介质 - Google Patents
折线图的信息提取方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112651315A CN112651315A CN202011498428.5A CN202011498428A CN112651315A CN 112651315 A CN112651315 A CN 112651315A CN 202011498428 A CN202011498428 A CN 202011498428A CN 112651315 A CN112651315 A CN 112651315A
- Authority
- CN
- China
- Prior art keywords
- coordinate
- pixel
- detected
- line graph
- actual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000004590 computer program Methods 0.000 claims description 29
- 238000001514 detection method Methods 0.000 claims description 29
- 238000012015 optical character recognition Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 208000003464 asthenopia Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种折线图的信息提取方法、装置、计算机设备和存储介质。所述方法包括:通过识别待检测折线图,获取待检测折线图中坐标轴的属性信息以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,并根据待检测折线图中坐标轴的属性信息,确定待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系,基于该关联关系以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定待检测折线图中各类别的数据标记对应的实际坐标。从而实现基于计算机视觉技术自动提取折线图中信息的方法,不仅提高了信息提取的效率,且能够确保信息提取的准确度。
Description
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种折线图的信息提取方法、装置、计算机设备和存储介质。
背景技术
折线图是在很多领域都会用到的基础图表,常用来观察数据在一段连续时间内的变化,其可以反映事物随时间变化的趋势。一些企业或一些专业领域为了在折线图中表达比较全面的信息,通常会使用多种数据标记来表达不同数据的类别或含义。
传统技术中,对于这类带有多种数据标记的折线图的信息提取,目前采用较多的仍然是通过人眼观察来区分数据标记,并估算数据标记的横纵轴坐标。然而,在对批量的该类折线图进行信息提取时,通过人眼观察的方式进行信息提取不仅费时费力,且容易因人眼疲劳而导致信息提取错误。
发明内容
基于此,有必要针对上述通过人眼观察的方式进行折线图信息提取费时费力且容易导致信息提取错误的问题,提供一种能够提高信息提取效率及准确度的折线图的信息提取方法、装置、计算机设备和存储介质。
一种折线图的信息提取方法,所述方法包括:
识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;
根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系;
基于所述关联关系以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定所述待检测折线图中各类别的数据标记对应的实际坐标。
在其中一个实施例中,所述坐标轴的属性信息包括所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,以及所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应纵坐标点的第二实际坐标;所述根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系,包括:根据所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系;根据所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在其中一个实施例中,所述根据所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系,包括:获取所述坐标轴中横坐标上任意坐标点的第一像素坐标与所述横坐标上其他坐标点的第一像素坐标之间的第一像素坐标差值以及相应两个坐标点对应的第一实际坐标之间的第一实际坐标差值;计算所述第一实际坐标差值与所述第一像素坐标差值之间的第一比值,获取所述坐标轴中横坐标上任意两个坐标点对应的所述第一比值;对于任意一个第一比值,计算所述第一比值与其他每一个第一比值之间差值的绝对值,确定所述绝对值小于阈值的次数;确定所述次数最多的第一比值,以及所述第一比值对应的坐标点中第一像素坐标最小的坐标点;基于所述次数最多的第一比值和所述第一像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系。
在其中一个实施例中,所述确定所述次数最多的第一比值,以及所述第一比值对应的坐标点中第一像素坐标最小的坐标点,包括:若存在次数最多的多个第一比值,则将所述多个第一比值的平均值确定为所述次数最多的第一比值;基于所述多个第一比值分别对应的多对坐标点,从所述多对坐标点中确定第一像素坐标最小的坐标点。
在其中一个实施例中,所述基于所述次数最多的第一比值和所述第一像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系,包括:若所述次数最多的第一比值为rx,所述第一像素坐标最小的坐标点对应的第一像素坐标为x0’,所述第一像素坐标最小的坐标点对应的第一实际坐标为x0,所述待检测折线图中任意位置处的像素横坐标为x’,则对于所述待检测折线图中任意位置处的实际横坐标x=x0+(x’-x0’)×rx。
在其中一个实施例中,所述根据所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系,包括:获取所述坐标轴中纵坐标上任意坐标点的第二像素坐标与所述纵坐标上其他坐标点的第二像素坐标之间的第二像素坐标差值以及相应两个坐标点对应的第二实际坐标之间的第二实际坐标差值;计算所述第二实际坐标差值与所述第二像素坐标差值之间的第二比值,获取所述坐标轴中纵坐标上任意两个坐标点对应的所述第二比值;对于任意一个第二比值,计算所述第二比值与其他每一个第二比值之间差值的绝对值,确定所述绝对值小于阈值的次数;确定所述次数最多的第二比值,以及所述第二比值对应的坐标点中第二像素坐标最小的坐标点;基于所述次数最多的第二比值和所述第二像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在其中一个实施例中,所述确定所述次数最多的第二比值,以及所述第二比值对应的坐标点中第二像素坐标最小的坐标点,包括:若存在次数最多的多个第二比值,则将所述多个第二比值的平均值确定为所述次数最多的第二比值;基于所述多个第二比值分别对应的多对坐标点,从所述多对坐标点中确定第二像素坐标最小的坐标点。
在其中一个实施例中,所述基于所述次数最多的第二比值和所述第二像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系,包括:若所述次数最多的第二比值为ry,所述第二像素坐标最小的坐标点对应的第二像素坐标为y0’,所述第二像素坐标最小的坐标点对应的第二实际坐标为y0,所述待检测折线图中任意位置处的像素纵坐标为y’,则对于所述待检测折线图中任意位置处的实际纵坐标y=y0+(y’-y0’)×ry。
在其中一个实施例中,所述识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,包括:通过预训练的目标检测模型对所述待检测折线图进行目标检测,获取所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;对所述待检测折线图进行光学字符识别,获取所述待检测折线图中坐标轴的属性信息。
一种折线图的信息提取装置,所述装置包括:
图像检测模块,用于识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;
关联关系确定模块,用于根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系;
实际坐标确定模块,用于基于所述关联关系以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定所述待检测折线图中各类别的数据标记对应的实际坐标。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。
上述折线图的信息提取方法、装置、计算机设备和存储介质,通过识别待检测折线图,获取待检测折线图中坐标轴的属性信息以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,并根据待检测折线图中坐标轴的属性信息,确定待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系,基于该关联关系以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定待检测折线图中各类别的数据标记对应的实际坐标。从而实现基于计算机视觉技术自动提取折线图中信息的方法,不仅提高了信息提取的效率,且能够确保信息提取的准确度。
附图说明
图1为一个实施例中折线图的信息提取方法的流程示意图;
图2为一个实施例中识别待检测折线图步骤的流程示意图;
图3为一个实施例中待检测折线图的示意图;
图4为一个实施例中对图3进行目标检测后得到的示意图;
图5为另一个实施例中待检测折线图的示意图;
图6为一个实施例中对图5进行目标检测后得到的示意图;
图7为一个实施例中对图3进行文本检测后得到的示意图;
图8为一个实施例中进行文字识别的示意图;
图9为一个实施例中确定像素横坐标与实际横坐标之间关联关系步骤的流程示意图;
图10为一个实施例中确定像素纵坐标与实际纵坐标之间关联关系步骤的流程示意图;
图11为一个实施例中折线图的信息提取装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种折线图的信息提取方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的***,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤102,识别待检测折线图,获取待检测折线图中坐标轴的属性信息以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标。
其中,折线图是可以显示随时间(根据常用比例设置)而变化的连续数据,在折线图中,类别数据通常沿横坐标均匀分布,所有值数据则沿纵坐标均匀分布。待检测折线图则是指待进行机器识别以提取相关数据或信息的折线图。坐标轴的属性信息则包括待检测折线图中横坐标上每一个坐标点的位置信息以及纵坐标上每一个坐标点的位置信息。具体地,每一个坐标点的位置信息包括每一个坐标点的实际坐标和该坐标点对应的像素坐标。数据标记是用于区分不同类别数据或不同含义数据的标记或标识。像素坐标是指像素在图像中的位置,由于图像都是由像素组成的,因此,对于待检测折线图中的每一个数据标记,在图像坐标系中均能找到其对应的像素坐标。具体地,图像坐标系是以图像左上角为原点建立的以像素为单位的直接坐标系。
在本实施例中,通过对待检测折线图进行机器识别,从而获取待检测折线图中横坐标上每一个坐标点的位置信息以及纵坐标上每一个坐标点的位置信息,并获取待检测折线图中每一个数据标记以及对应数据标记的类别和数据标记位于图像中的像素坐标。
步骤104,根据待检测折线图中坐标轴的属性信息,确定待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系。
其中,像素坐标是指像素在图像中的位置。实际坐标则是基于待检测折线图中的横坐标和纵坐标而确定的某一位置处的坐标。像素坐标与实际坐标之间的关联关系可以是指像素坐标与实际坐标之间的对应关系或转换关系。在本实施例中,基于待检测折线图中坐标轴的属性信息,可以确定待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系。
步骤106,基于关联关系以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定待检测折线图中各类别的数据标记对应的实际坐标。
具体地,根据待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,以及上述确定的待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系,可以得到待检测折线图中各类别的数据标记对应的实际坐标。
上述实施例中,通过识别待检测折线图,获取待检测折线图中坐标轴的属性信息以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,并根据待检测折线图中坐标轴的属性信息,确定待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系,基于该关联关系以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定待检测折线图中各类别的数据标记对应的实际坐标。从而实现基于计算机视觉技术自动提取折线图中信息的方法,不仅提高了信息提取的效率,且能够确保信息提取的准确度。
在一个实施例中,如图2所示,上述步骤102中,识别待检测折线图,获取待检测折线图中坐标轴的属性信息以及待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,具体包括如下步骤:
步骤202,通过预训练的目标检测模型对待检测折线图进行目标检测,获取待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标。
其中,目标检测模型是用于对待检测折线图中的数据进行检测的神经网络模型。其通常需要经过一定数量样本的定制化训练,使其能够具备检测某几类感兴趣目标的能力。在本实施例中,通过将待检测折线图输入到预先训练好的目标检测模型,从而可以检测出感兴趣数据的类别及目标边框在图像中的位置。其中,感兴趣边框是指检测到的数据所对应的边框。
比如图3所示的这类折线图,不同类别的数据需要用不同的数据标记进行表示,图中用△标记代表A类数据,用○标记代表B类数据。假设已经用该类样本训练好了可以检测△标记和○标记的目标检测模型,则将图3所示的折线图输入到该目标检测模型中进行预测,就可以得到每个数据标记的类别及对应数据标记在图像中的位置。例如,如果是△标记就预测为A类,如果是○标记就预测为B类,预测的位置信息包括数据标识边框的左上角像素坐标(x1,y1)和右下角像素坐标(x2,y2),一般像素坐标的原点(x0,y0)取在图像的左上角位置。在本实施例中,可以取左上角和右下角像素坐标的均值(即(x1+x2)/2,(y1+y2)/2)作为对应数据标记的像素坐标。
图4就是根据预测的数据标记的类别和位置信息(即对应数据标记的像素坐标)进行可视化的效果图,其中数据标记的边框C是根据预测的数据标记边框的左上角和右下角像素坐标进行绘制的,边框C左上角的字母就是预测的数据标记的类别。
再比如图5所示的这类折线图,同一类数据需要用不同的数据标记来表示不同的含义。若图中用△标记代表A种含义,用○标记代表B种含义。假设已经用该类样本训练好了可以检测△标记和○标记的目标检测模型,将图5所示的折线图输入到该目标检测模型中进行预测,就可以得到每个数据标记代表的含义及数据标记边框在图像中的位置。如果识别的是△标记就预测为A含义,如果识别的是○标记就预测为B含义,预测的位置信息包括数据标记边框的左上角像素坐标(x1,y1)和右下角像素坐标(x2,y2)。如图6所示,就是根据预测的数据标记含义和数据标记位置信息进行可视化的效果图,其中边框C是根据预测的数据标记边框的左上角和右下角像素坐标进行绘制的,边框C左上角的字母就是预测的数据标记的含义。
步骤204,对待检测折线图进行光学字符识别,获取待检测折线图中坐标轴的属性信息。
其中,待检测折线图中坐标轴的属性信息包括坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,以及坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应纵坐标点的第二实际坐标。而实际坐标是基于坐标刻度而确定的坐标轴上每一个坐标点的实际坐标数据,其通常在对应的坐标点旁通过数字进行标识。因此,在本实施例中,光学识别包括文本检测和文字识别两方面。
具体地,文本检测负责对待检测折线图中的文本区域进行检测,并给出相应的位置信息;文字识别则负责对检测出的文本区域进行识别,并给出相应的文本内容。仍以图3所示的折线图为例,对该图进行文本检测后,可以得到文本区域在图像中所在的位置,如图7所示,位置信息包括文本边框D的左上角像素坐标(x1,y1),右上角像素坐标(x2,y2),左下角像素坐标(x3,y3),右下角像素坐标(x4,y4)。在本实施例中取四个角点像素坐标的均值((x1+x2+x3+x4)/4,(y1+y2+y3+y4)/4)作为文本区域的像素坐标。
其中,图7就是根据文本检测后预测的文本边框D的位置信息进行可视化的效果图,其中文本边框D是根据预测的文本边框的四个角的像素坐标进行绘制的。在本实施例中,根据检测出的文本区域四个角的像素坐标将文本区域从折线图中裁剪出来,可以得到一个个的文本条图像,然后将这些文本条图像输入到文字识别算法中,就可以得到各个文本条图像对应的文本内容。如图8所示,左边带有"60"和带有"-10"的图像就是其中的两个文本条图像,经过文字识别算法预测后,得到对应的文本内容"60"和"-10",也就是该文本区域对应的真实坐标值,即坐标轴上坐标点的实际坐标。
在一个实施例中,由上述步骤获取到待检测折线图中坐标轴的属性信息,即获取到坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,以及坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应纵坐标点的第二实际坐标。其中,第一、第二是为了区分不同坐标轴(即横坐标轴和纵坐标轴)上的坐标点。则上述步骤104中,根据待检测折线图中坐标轴的属性信息,确定待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系,具体包括:根据坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系;根据坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
由于折线图通常包括横坐标轴和纵坐标轴,而位于横坐标轴上的点的位置由一个横坐标值所唯一确定,位于纵坐标轴上的点的位置则由一个纵坐标值所唯一确定。每一个坐标轴上会根据实际应用场景的不同而以不同刻度等间距地设置多个坐标点,因此,基于坐标刻度而确定的坐标轴上每一个坐标点的位置则为对应坐标点的实际坐标。相应地,对于坐标轴上每一个坐标点其具有对应的像素坐标。基于此,本实施例根据坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系;根据坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在一个实施例中,如图9所示,根据坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系,包括如下步骤:
步骤902,获取坐标轴中横坐标上任意坐标点的第一像素坐标与横坐标上其他坐标点的第一像素坐标之间的第一像素坐标差值以及相应两个坐标点对应的第一实际坐标之间的第一实际坐标差值。
通常为了便于数据的标记与读取,横坐标上或纵坐标上会等间距地设置多个坐标点,而每一个坐标点具有对应的像素坐标和实际坐标。在本实施例中,基于坐标轴中横坐标上每一个坐标点的第一像素坐标,计算横坐标上任意两个坐标点的第一像素坐标之间的第一像素坐标差值。基于坐标轴中横坐标上每一个坐标点的第一实际坐标,计算横坐标上任意两个坐标点的第一实际坐标之间的第一实际坐标差值。即计算横坐标上任意一个坐标点的第一像素坐标分别与该横坐标上其他每一个坐标点的第一像素坐标之间的差,从而得到横坐标上任意两个坐标点之间的第一像素坐标差值。计算横坐标上任意一个坐标点的第一实际坐标分别与该横坐标上其他每一个坐标点的第一实际坐标之间的差,从而得到横坐标上任意两个坐标点之间的第一实际坐标差值。
步骤904,计算第一实际坐标差值与第一像素坐标差值之间的第一比值,获取坐标轴中横坐标上任意两个坐标点对应的第一比值。
具体地,对于横坐标上任意两个坐标点,计算该两个坐标点之间的第一实际坐标差值与第一像素坐标差值之间的比值,从而得到该两个坐标点对应的第一比值。对于待检测折线图中横坐标上所有的坐标点,则可以分别计算出任意两个坐标点对应的第一比值。
步骤906,对于任意一个第一比值,计算第一比值与其他每一个第一比值之间差值的绝对值,确定绝对值小于阈值的次数。
其中,阈值是预先设置的一个趋于零的数。在本实施例中,对于上述获取的待检测折线图中横坐标上任意两个坐标点的第一比值,计算任意一个第一比值与其他每一个第一比值之间的差值,并确定该差值的绝对值,将绝对值与阈值进行比较,以确定绝对值小于阈值的次数。
举例来说,若待检测折线图中横坐标上具有4个坐标点X1、X2、X3以及X4,若坐标点X1与X2的第一比值为Rx12,其中,Rx12为坐标点X1与坐标点X2之间的实际坐标差值与像素坐标差值之间的比值。则坐标点X1与X3的第一比值为Rx13,坐标点X1与X4的第一比值为Rx14,坐标点X2与X3的第一比值为Rx23,坐标点X2与X4的第一比值为Rx24,坐标点X3与X4的第一比值为Rx34。对于任意一个第一比值Rx12,计算其与其他每一个第一比值之间差值的绝对值,即分别计算|Rx12-Rx13|、|Rx12-Rx14|、|Rx12-Rx23|、|Rx12-Rx24|以及|Rx12-Rx34|,并将每一次计算得到的绝对值与阈值进行比较,并统计绝对值小于阈值的次数。例如,对于第一比值Rx12,若上述计算的5个绝对值中有3个绝对值是小于阈值的,则对于第一比值Rx12,其对应绝对值小于阈值的次数为3。同理,对于待检测折线图中横坐标上任意两个坐标点对应的第一比值,都可以确定其对应绝对值小于阈值的次数。
步骤908,确定次数最多的第一比值,以及第一比值对应的坐标点中第一像素坐标最小的坐标点。
基于上述计算的数据,可以确定其对应绝对值小于阈值的次数最多的第一比值。由于每一个第一比值又涉及两个坐标点,在本实施例中,从次数最多的第一比值涉及的两个坐标点分别对应的第一像素坐标中,确定第一像素坐标最小的坐标点。
进一步地,若存在次数最多的多个第一比值,则将多个第一比值的平均值确定为次数最多的第一比值。进而基于该多个第一比值分别对应的多对坐标点,从多对坐标点中确定第一像素坐标最小的坐标点。
步骤910,基于次数最多的第一比值和第一像素坐标最小的坐标点,建立待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系。
举例来说,若设次数最多的第一比值为rx,第一像素坐标最小的坐标点对应的第一像素坐标为x0’,第一像素坐标最小的坐标点对应的第一实际坐标为x0,待检测折线图中任意位置处的像素横坐标为x’,则对于待检测折线图中该任意位置处的实际横坐标x=x0+(x’-x0’)×rx。由于通过上述步骤已知rx、x0’以及x0,则对于待检测折线图中任意位置处的像素横坐标x’,通过上述关系式,可以快速计算出该位置处的实际横坐标x,即可以得到该位置处的实际横坐标值。
在一个实施例中,如图10所示,根据坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系,包括如下步骤:
步骤1002,获取坐标轴中纵坐标上任意坐标点的第二像素坐标与纵坐标上其他坐标点的第二像素坐标之间的第二像素坐标差值以及相应两个坐标点对应的第二实际坐标之间的第二实际坐标差值。
步骤1004,计算第二实际坐标差值与第二像素坐标差值之间的第二比值,获取坐标轴中纵坐标上任意两个坐标点对应的所述第二比值。
步骤1006,对于任意一个第二比值,计算第二比值与其他每一个第二比值之间差值的绝对值,确定绝对值小于阈值的次数。
步骤1008,确定次数最多的第二比值,以及第二比值对应的坐标点中第二像素坐标最小的坐标点。
进一步地,若存在次数最多的多个第二比值,则将多个第二比值的平均值确定为次数最多的第二比值,并基于多个第二比值分别对应的多对坐标点,从多对坐标点中确定第二像素坐标最小的坐标点。
步骤1010,基于次数最多的第二比值和第二像素坐标最小的坐标点,建立待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
举例来说,若次数最多的第二比值为ry,第二像素坐标最小的坐标点对应的第二像素坐标为y0’,第二像素坐标最小的坐标点对应的第二实际坐标为y0,待检测折线图中任意位置处的像素纵坐标为y’,则对于待检测折线图中任意位置处的实际纵坐标y=y0+(y’-y0’)×ry。由于通过上述步骤已知ry、y0’以及y0,则对于待检测折线图中任意位置处的像素横坐标y’,通过上述关系式,可以快速计算出该位置处的实际纵坐标y,即可以得到该位置处的实际纵坐标值。
可以理解的是,上述实施例的具体实现过程与图9所示的实施例相类似,在此不再赘述。
应该理解的是,虽然图1-图10的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-图10中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图11所示,提供了一种折线图的信息提取装置,包括:图像检测模块1101、关联关系确定模块1102和实际坐标确定模块1103,其中:
图像检测模块1101,用于识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;
关联关系确定模块1102,用于根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系;
实际坐标确定模块1103,用于基于所述关联关系以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定所述待检测折线图中各类别的数据标记对应的实际坐标。
在一个实施例中,所述坐标轴的属性信息包括所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,以及所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应纵坐标点的第二实际坐标;所述关联关系确定模块具体包括:横坐标关联关系确定单元,用于根据所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系;纵坐标关联关系确定单元,用于根据所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在一个实施例中,所述横坐标关联关系确定单元具体用于:获取所述坐标轴中横坐标上任意坐标点的第一像素坐标与所述横坐标上其他坐标点的第一像素坐标之间的第一像素坐标差值以及相应两个坐标点对应的第一实际坐标之间的第一实际坐标差值;计算所述第一实际坐标差值与所述第一像素坐标差值之间的第一比值,获取所述坐标轴中横坐标上任意两个坐标点对应的所述第一比值;对于任意一个第一比值,计算所述第一比值与其他每一个第一比值之间差值的绝对值,确定所述绝对值小于阈值的次数;确定所述次数最多的第一比值,以及所述第一比值对应的坐标点中第一像素坐标最小的坐标点;基于所述次数最多的第一比值和所述第一像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系。
在一个实施例中,所述横坐标关联关系确定单元还用于:若存在次数最多的多个第一比值,则将所述多个第一比值的平均值确定为所述次数最多的第一比值;基于所述多个第一比值分别对应的多对坐标点,从所述多对坐标点中确定第一像素坐标最小的坐标点。
在一个实施例中,所述横坐标关联关系确定单元具体还用于:若所述次数最多的第一比值为rx,所述第一像素坐标最小的坐标点对应的第一像素坐标为x0’,所述第一像素坐标最小的坐标点对应的第一实际坐标为x0,所述待检测折线图中任意位置处的像素横坐标为x’,则对于所述待检测折线图中任意位置处的实际横坐标x=x0+(x’-x0’)×rx。
在一个实施例中,所述纵坐标关联关系确定单元具体用于:获取所述坐标轴中纵坐标上任意坐标点的第二像素坐标与所述纵坐标上其他坐标点的第二像素坐标之间的第二像素坐标差值以及相应两个坐标点对应的第二实际坐标之间的第二实际坐标差值;计算所述第二实际坐标差值与所述第二像素坐标差值之间的第二比值,获取所述坐标轴中纵坐标上任意两个坐标点对应的所述第二比值;对于任意一个第二比值,计算所述第二比值与其他每一个第二比值之间差值的绝对值,确定所述绝对值小于阈值的次数;确定所述次数最多的第二比值,以及所述第二比值对应的坐标点中第二像素坐标最小的坐标点;基于所述次数最多的第二比值和所述第二像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在一个实施例中,所述纵坐标关联关系确定单元还用于:若存在次数最多的多个第二比值,则将所述多个第二比值的平均值确定为所述次数最多的第二比值;基于所述多个第二比值分别对应的多对坐标点,从所述多对坐标点中确定第二像素坐标最小的坐标点。
在一个实施例中,所述纵坐标关联关系确定单元具体还用于:若所述次数最多的第二比值为ry,所述第二像素坐标最小的坐标点对应的第二像素坐标为y0’,所述第二像素坐标最小的坐标点对应的第二实际坐标为y0,所述待检测折线图中任意位置处的像素纵坐标为y’,则对于所述待检测折线图中任意位置处的实际纵坐标y=y0+(y’-y0’)×ry。
在一个实施例中,图像检测模块具体用于:通过预训练的目标检测模型对所述待检测折线图进行目标检测,获取所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;对所述待检测折线图进行光学字符识别,获取所述待检测折线图中坐标轴的属性信息。
关于折线图的信息提取装置的具体限定可以参见上文中对于折线图的信息提取方法的限定,在此不再赘述。上述折线图的信息提取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图12所示。该计算机设备包括通过***总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种折线图的信息提取方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;
根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系;
基于所述关联关系以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定所述待检测折线图中各类别的数据标记对应的实际坐标。
在一个实施例中,所述坐标轴的属性信息包括所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,以及所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应纵坐标点的第二实际坐标;处理器执行计算机程序时还实现以下步骤:根据所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系;根据所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取所述坐标轴中横坐标上任意坐标点的第一像素坐标与所述横坐标上其他坐标点的第一像素坐标之间的第一像素坐标差值以及相应两个坐标点对应的第一实际坐标之间的第一实际坐标差值;计算所述第一实际坐标差值与所述第一像素坐标差值之间的第一比值,获取所述坐标轴中横坐标上任意两个坐标点对应的所述第一比值;对于任意一个第一比值,计算所述第一比值与其他每一个第一比值之间差值的绝对值,确定所述绝对值小于阈值的次数;确定所述次数最多的第一比值,以及所述第一比值对应的坐标点中第一像素坐标最小的坐标点;基于所述次数最多的第一比值和所述第一像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若存在次数最多的多个第一比值,则将所述多个第一比值的平均值确定为所述次数最多的第一比值;基于所述多个第一比值分别对应的多对坐标点,从所述多对坐标点中确定第一像素坐标最小的坐标点。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若所述次数最多的第一比值为rx,所述第一像素坐标最小的坐标点对应的第一像素坐标为x0’,所述第一像素坐标最小的坐标点对应的第一实际坐标为x0,所述待检测折线图中任意位置处的像素横坐标为x’,则对于所述待检测折线图中任意位置处的实际横坐标x=x0+(x’-x0’)×rx。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取所述坐标轴中纵坐标上任意坐标点的第二像素坐标与所述纵坐标上其他坐标点的第二像素坐标之间的第二像素坐标差值以及相应两个坐标点对应的第二实际坐标之间的第二实际坐标差值;计算所述第二实际坐标差值与所述第二像素坐标差值之间的第二比值,获取所述坐标轴中纵坐标上任意两个坐标点对应的所述第二比值;对于任意一个第二比值,计算所述第二比值与其他每一个第二比值之间差值的绝对值,确定所述绝对值小于阈值的次数;确定所述次数最多的第二比值,以及所述第二比值对应的坐标点中第二像素坐标最小的坐标点;基于所述次数最多的第二比值和所述第二像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若存在次数最多的多个第二比值,则将所述多个第二比值的平均值确定为所述次数最多的第二比值;基于所述多个第二比值分别对应的多对坐标点,从所述多对坐标点中确定第二像素坐标最小的坐标点。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若所述次数最多的第二比值为ry,所述第二像素坐标最小的坐标点对应的第二像素坐标为y0’,所述第二像素坐标最小的坐标点对应的第二实际坐标为y0,所述待检测折线图中任意位置处的像素纵坐标为y’,则对于所述待检测折线图中任意位置处的实际纵坐标y=y0+(y’-y0’)×ry。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过预训练的目标检测模型对所述待检测折线图进行目标检测,获取所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;对所述待检测折线图进行光学字符识别,获取所述待检测折线图中坐标轴的属性信息。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;
根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系;
基于所述关联关系以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定所述待检测折线图中各类别的数据标记对应的实际坐标。
在一个实施例中,所述坐标轴的属性信息包括所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,以及所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应纵坐标点的第二实际坐标;计算机程序被处理器执行时还实现以下步骤:根据所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系;根据所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取所述坐标轴中横坐标上任意坐标点的第一像素坐标与所述横坐标上其他坐标点的第一像素坐标之间的第一像素坐标差值以及相应两个坐标点对应的第一实际坐标之间的第一实际坐标差值;计算所述第一实际坐标差值与所述第一像素坐标差值之间的第一比值,获取所述坐标轴中横坐标上任意两个坐标点对应的所述第一比值;对于任意一个第一比值,计算所述第一比值与其他每一个第一比值之间差值的绝对值,确定所述绝对值小于阈值的次数;确定所述次数最多的第一比值,以及所述第一比值对应的坐标点中第一像素坐标最小的坐标点;基于所述次数最多的第一比值和所述第一像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:若存在次数最多的多个第一比值,则将所述多个第一比值的平均值确定为所述次数最多的第一比值;基于所述多个第一比值分别对应的多对坐标点,从所述多对坐标点中确定第一像素坐标最小的坐标点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:若所述次数最多的第一比值为rx,所述第一像素坐标最小的坐标点对应的第一像素坐标为x0’,所述第一像素坐标最小的坐标点对应的第一实际坐标为x0,所述待检测折线图中任意位置处的像素横坐标为x’,则对于所述待检测折线图中任意位置处的实际横坐标x=x0+(x’-x0’)×rx。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取所述坐标轴中纵坐标上任意坐标点的第二像素坐标与所述纵坐标上其他坐标点的第二像素坐标之间的第二像素坐标差值以及相应两个坐标点对应的第二实际坐标之间的第二实际坐标差值;计算所述第二实际坐标差值与所述第二像素坐标差值之间的第二比值,获取所述坐标轴中纵坐标上任意两个坐标点对应的所述第二比值;对于任意一个第二比值,计算所述第二比值与其他每一个第二比值之间差值的绝对值,确定所述绝对值小于阈值的次数;确定所述次数最多的第二比值,以及所述第二比值对应的坐标点中第二像素坐标最小的坐标点;基于所述次数最多的第二比值和所述第二像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:若存在次数最多的多个第二比值,则将所述多个第二比值的平均值确定为所述次数最多的第二比值;基于所述多个第二比值分别对应的多对坐标点,从所述多对坐标点中确定第二像素坐标最小的坐标点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:若所述次数最多的第二比值为ry,所述第二像素坐标最小的坐标点对应的第二像素坐标为y0’,所述第二像素坐标最小的坐标点对应的第二实际坐标为y0,所述待检测折线图中任意位置处的像素纵坐标为y’,则对于所述待检测折线图中任意位置处的实际纵坐标y=y0+(y’-y0’)×ry。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过预训练的目标检测模型对所述待检测折线图进行目标检测,获取所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;对所述待检测折线图进行光学字符识别,获取所述待检测折线图中坐标轴的属性信息。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种折线图的信息提取方法,其特征在于,所述方法包括:
识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;
根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系;
基于所述关联关系以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定所述待检测折线图中各类别的数据标记对应的实际坐标。
2.根据权利要求1所述的方法,其特征在于,所述坐标轴的属性信息包括所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,以及所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应纵坐标点的第二实际坐标;所述根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系,包括:
根据所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系;
根据所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
3.根据权利要求2所述的方法,其特征在于,所述根据所述坐标轴中横坐标上每一个坐标点的第一像素坐标和对应坐标点的第一实际坐标,确定所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系,包括:
获取所述坐标轴中横坐标上任意坐标点的第一像素坐标与所述横坐标上其他坐标点的第一像素坐标之间的第一像素坐标差值以及相应两个坐标点对应的第一实际坐标之间的第一实际坐标差值;
计算所述第一实际坐标差值与所述第一像素坐标差值之间的第一比值,获取所述坐标轴中横坐标上任意两个坐标点对应的所述第一比值;
对于任意一个第一比值,计算所述第一比值与其他每一个第一比值之间差值的绝对值,确定所述绝对值小于阈值的次数;
确定所述次数最多的第一比值,以及所述第一比值对应的坐标点中第一像素坐标最小的坐标点;
基于所述次数最多的第一比值和所述第一像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系。
4.根据权利要求3所述的方法,其特征在于,所述确定所述次数最多的第一比值,以及所述第一比值对应的坐标点中第一像素坐标最小的坐标点,包括:
若存在次数最多的多个第一比值,则将所述多个第一比值的平均值确定为所述次数最多的第一比值;
基于所述多个第一比值分别对应的多对坐标点,从所述多对坐标点中确定第一像素坐标最小的坐标点。
5.根据权利要求3所述的方法,其特征在于,所述基于所述次数最多的第一比值和所述第一像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素横坐标与实际横坐标之间的关联关系,包括:
若所述次数最多的第一比值为rx,所述第一像素坐标最小的坐标点对应的第一像素坐标为x0’,所述第一像素坐标最小的坐标点对应的第一实际坐标为x0,所述待检测折线图中任意位置处的像素横坐标为x’,则对于所述待检测折线图中任意位置处的实际横坐标x=x0+(x’-x0’)×rx。
6.根据权利要求2所述的方法,其特征在于,所述根据所述坐标轴中纵坐标上每一个坐标点的第二像素坐标和对应坐标点的第二实际坐标,确定所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系,包括:
获取所述坐标轴中纵坐标上任意坐标点的第二像素坐标与所述纵坐标上其他坐标点的第二像素坐标之间的第二像素坐标差值以及相应两个坐标点对应的第二实际坐标之间的第二实际坐标差值;
计算所述第二实际坐标差值与所述第二像素坐标差值之间的第二比值,获取所述坐标轴中纵坐标上任意两个坐标点对应的所述第二比值;
对于任意一个第二比值,计算所述第二比值与其他每一个第二比值之间差值的绝对值,确定所述绝对值小于阈值的次数;
确定所述次数最多的第二比值,以及所述第二比值对应的坐标点中第二像素坐标最小的坐标点;
基于所述次数最多的第二比值和所述第二像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系。
7.根据权利要求6所述的方法,其特征在于,所述确定所述次数最多的第二比值,以及所述第二比值对应的坐标点中第二像素坐标最小的坐标点,包括:
若存在次数最多的多个第二比值,则将所述多个第二比值的平均值确定为所述次数最多的第二比值;
基于所述多个第二比值分别对应的多对坐标点,从所述多对坐标点中确定第二像素坐标最小的坐标点。
8.根据权利要求6所述的方法,其特征在于,所述基于所述次数最多的第二比值和所述第二像素坐标最小的坐标点,建立所述待检测折线图中任意位置处的像素纵坐标与实际纵坐标之间的关联关系,包括:
若所述次数最多的第二比值为ry,所述第二像素坐标最小的坐标点对应的第二像素坐标为y0’,所述第二像素坐标最小的坐标点对应的第二实际坐标为y0,所述待检测折线图中任意位置处的像素纵坐标为y’,则对于所述待检测折线图中任意位置处的实际纵坐标y=y0+(y’-y0’)×ry。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,包括:
通过预训练的目标检测模型对所述待检测折线图进行目标检测,获取所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;
对所述待检测折线图进行光学字符识别,获取所述待检测折线图中坐标轴的属性信息。
10.一种折线图的信息提取装置,其特征在于,所述装置包括:
图像检测模块,用于识别待检测折线图,获取所述待检测折线图中坐标轴的属性信息以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标;
关联关系确定模块,用于根据所述待检测折线图中坐标轴的属性信息,确定所述待检测折线图中任意位置处的像素坐标与实际坐标之间的关联关系;
实际坐标确定模块,用于基于所述关联关系以及所述待检测折线图中每一个数据标记的类别和对应数据标记的像素坐标,确定所述待检测折线图中各类别的数据标记对应的实际坐标。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011498428.5A CN112651315A (zh) | 2020-12-17 | 2020-12-17 | 折线图的信息提取方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011498428.5A CN112651315A (zh) | 2020-12-17 | 2020-12-17 | 折线图的信息提取方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112651315A true CN112651315A (zh) | 2021-04-13 |
Family
ID=75354790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011498428.5A Pending CN112651315A (zh) | 2020-12-17 | 2020-12-17 | 折线图的信息提取方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651315A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313038A (zh) * | 2021-06-02 | 2021-08-27 | 上海又为智能科技有限公司 | 一种用于识别图表的方法、装置及存储介质 |
CN115331013A (zh) * | 2022-10-17 | 2022-11-11 | 杭州恒生聚源信息技术有限公司 | 折线图的数据提取方法及处理设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1062245A (ja) * | 1996-08-22 | 1998-03-06 | Hitachi Ltd | 複数折れ線グラフのトレース方法及びそのトレース機能を備えた分光光度計 |
US20170344849A1 (en) * | 2016-05-26 | 2017-11-30 | Panton, Inc., | Methods for automated chart analysis |
CN108038426A (zh) * | 2017-11-29 | 2018-05-15 | 阿博茨德(北京)科技有限公司 | 一种提取文件中图表信息的方法及装置 |
CN108229097A (zh) * | 2016-12-09 | 2018-06-29 | 深圳市瀚海基因生物科技有限公司 | 单分子的识别、计数方法及装置 |
CN108470350A (zh) * | 2018-02-26 | 2018-08-31 | 阿博茨德(北京)科技有限公司 | 折线图中的折线分割方法及装置 |
CN109189997A (zh) * | 2018-08-10 | 2019-01-11 | 武汉优品楚鼎科技有限公司 | 一种折线图数据提取的方法、装置及设备 |
CN110189345A (zh) * | 2019-04-28 | 2019-08-30 | 浙江大学 | 一种数据图中数据点坐标信息的提取方法 |
CN110569774A (zh) * | 2019-08-30 | 2019-12-13 | 武汉大学 | 基于图像处理与模式识别的折线图图像自动数字化方法 |
CN110781648A (zh) * | 2019-10-12 | 2020-02-11 | 安徽七天教育科技有限公司 | 一种基于深度学习的试卷自动转录***及方法 |
-
2020
- 2020-12-17 CN CN202011498428.5A patent/CN112651315A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1062245A (ja) * | 1996-08-22 | 1998-03-06 | Hitachi Ltd | 複数折れ線グラフのトレース方法及びそのトレース機能を備えた分光光度計 |
US20170344849A1 (en) * | 2016-05-26 | 2017-11-30 | Panton, Inc., | Methods for automated chart analysis |
CN108229097A (zh) * | 2016-12-09 | 2018-06-29 | 深圳市瀚海基因生物科技有限公司 | 单分子的识别、计数方法及装置 |
CN108038426A (zh) * | 2017-11-29 | 2018-05-15 | 阿博茨德(北京)科技有限公司 | 一种提取文件中图表信息的方法及装置 |
CN108470350A (zh) * | 2018-02-26 | 2018-08-31 | 阿博茨德(北京)科技有限公司 | 折线图中的折线分割方法及装置 |
CN109189997A (zh) * | 2018-08-10 | 2019-01-11 | 武汉优品楚鼎科技有限公司 | 一种折线图数据提取的方法、装置及设备 |
CN110189345A (zh) * | 2019-04-28 | 2019-08-30 | 浙江大学 | 一种数据图中数据点坐标信息的提取方法 |
CN110569774A (zh) * | 2019-08-30 | 2019-12-13 | 武汉大学 | 基于图像处理与模式识别的折线图图像自动数字化方法 |
CN110781648A (zh) * | 2019-10-12 | 2020-02-11 | 安徽七天教育科技有限公司 | 一种基于深度学习的试卷自动转录***及方法 |
Non-Patent Citations (2)
Title |
---|
CEM KOSEMEN 等: "Multi-label classification of line chart images using convolutional neural networks", 《SN APPLIED SCIENCES》, 19 June 2020 (2020-06-19), pages 1 - 20 * |
刘翔宇: "《基于Vue的数据可视化***的设计与实现》", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 October 2018 (2018-10-15), pages 138 - 99 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313038A (zh) * | 2021-06-02 | 2021-08-27 | 上海又为智能科技有限公司 | 一种用于识别图表的方法、装置及存储介质 |
WO2022253024A1 (en) * | 2021-06-02 | 2022-12-08 | Evoco Labs Co., Ltd. | Method, device and storage medium for recognizing chart |
CN115331013A (zh) * | 2022-10-17 | 2022-11-11 | 杭州恒生聚源信息技术有限公司 | 折线图的数据提取方法及处理设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190266434A1 (en) | Method and device for extracting information from pie chart | |
CN108447061B (zh) | 商品信息处理方法、装置、计算机设备和存储介质 | |
CN111625668B (zh) | 对象检测和候选过滤*** | |
CN111259889A (zh) | 图像文本识别方法、装置、计算机设备及计算机存储介质 | |
CN110675940A (zh) | 病理图像标注方法、装置、计算机设备及存储介质 | |
CN112070079B (zh) | 基于特征图重赋权的x光违禁品包裹检测方法及装置 | |
CN111429482A (zh) | 目标跟踪方法、装置、计算机设备和存储介质 | |
CN112001406A (zh) | 一种文本区域检测方法及装置 | |
CN111274848A (zh) | 一种图像检测方法、装置、电子设备及存储介质 | |
CN112651315A (zh) | 折线图的信息提取方法、装置、计算机设备和存储介质 | |
CN111899237A (zh) | 标尺精度测量方法、装置、计算机设备和存储介质 | |
CN113554008B (zh) | 静态物体区域内检测方法、装置、电子设备及存储介质 | |
TW202201275A (zh) | 手部作業動作評分裝置、方法及電腦可讀取存儲介質 | |
CN112215811A (zh) | 一种图像检测方法、装置、电子设备及存储介质 | |
CN111738252B (zh) | 图像中的文本行检测方法、装置及计算机*** | |
CN117115823A (zh) | 一种篡改识别方法、装置、计算机设备和存储介质 | |
CN112434582A (zh) | 一种车道线颜色识别方法、***、电子设备及存储介质 | |
CN117197479A (zh) | 一种应用玉米果穗外表面的图像分析方法、装置、计算机设备及存储介质 | |
CN111241974A (zh) | 票据信息获取方法、装置、计算机设备和存储介质 | |
CN115953463A (zh) | 一种包裹打标识方法、装置、设备以及存储介质 | |
CN116168192A (zh) | 图像检测区域的确定方法、装置、电子设备及存储介质 | |
US20210286709A1 (en) | Screen test apparatus and computer readable medium | |
CN115035129A (zh) | 货物的识别方法、装置、电子设备和存储介质 | |
CN111414866A (zh) | 车辆申请表的检测方法、装置、计算机设备和存储介质 | |
CN114297720A (zh) | 一种图像脱敏方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |