CN107464245B - 一种图像结构边缘的定位方法及装置 - Google Patents

一种图像结构边缘的定位方法及装置 Download PDF

Info

Publication number
CN107464245B
CN107464245B CN201710517455.4A CN201710517455A CN107464245B CN 107464245 B CN107464245 B CN 107464245B CN 201710517455 A CN201710517455 A CN 201710517455A CN 107464245 B CN107464245 B CN 107464245B
Authority
CN
China
Prior art keywords
edge
image
straight line
channel characteristics
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710517455.4A
Other languages
English (en)
Other versions
CN107464245A (zh
Inventor
伍更新
高大帅
李健
张连毅
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sinovoice Technology Co Ltd
Original Assignee
Beijing Sinovoice Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sinovoice Technology Co Ltd filed Critical Beijing Sinovoice Technology Co Ltd
Priority to CN201710517455.4A priority Critical patent/CN107464245B/zh
Publication of CN107464245A publication Critical patent/CN107464245A/zh
Application granted granted Critical
Publication of CN107464245B publication Critical patent/CN107464245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种图像结构边缘的定位方法及装置,所述方法通过边缘检测模型,对待检测图像的结构边缘进行检测,生成一个与待检测图像大小一样的边缘得分矩阵,感兴趣的结构边缘像素点得分高,不感兴趣的结构边缘和非结构边缘像素点得分低;再对边缘得分矩阵进行直线检测,根据直线检测结果获得候选结构边缘;再根据预设的约束条件,在候选结构边缘中最终确定目标结构边缘;此方法根据边缘得分矩阵、直线检测以及约束条件对结构边缘进行定位,对光照和阴影等具有较强的鲁棒性,使图像结构边缘的定位更准确。

Description

一种图像结构边缘的定位方法及装置
技术领域
本发明涉及计算机科学技术领域,特别是涉及一种图像结构边缘的定位方法和一种图像结构边缘的定位装置。
背景技术
在现有的图像文本识别中,无论是拍照图像还是扫描图像,在文本识别前往往需要将图像中的结构边缘分离出来,然后再进行四点透视变换和版面分析。因此图像结构边缘的定位具有重要的意义。
现有的图像结构边缘检测往往使用颜色或灰度梯度检测方法确定二值化图像,如Canny算子、sobel算子等,然后从二值化图像中检测直线并定位结构边缘。根据梯度确定二值化图像的过程中往往需要设定二值化阈值参数,而这些阈值参数对光照和阴影等因素非常敏感,往往产生漏检和误检的情况,导致其在自然场景下的应用受到很大的局限。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:如何使图像结构边缘的定位更准确。
发明内容
本发明实施例所要解决的技术问题是提供一种图像结构边缘的定位方法,使图像结构边缘的定位更准确。
相应的,本发明实施例还提供了一种图像结构边缘的定位装置,用以保证上述方法的实现及应用。
为了解决上述问题,本发明公开了一种图像结构边缘的定位方法,所述方法包括:
获取待检测图像;
采用预先训练好的边缘检测模型,对所述待检测图像进行边缘检测,得到边缘得分矩阵;
对所述边缘得分矩阵进行直线检测;
根据所述直线检测结果确定候选结构边缘;
根据预设的约束条件,在所述候选结构边缘中确定目标结构边缘。
优选地,所述根据所述直线检测结果确定候选结构边缘的步骤,包括:
根据所述直线检测结果,确定潜在直线;
根据所述潜在直线的角度,确定水平线和垂直线;
根据所述水平线和所述垂直线,获得候选结构边缘。
优选地,所述根据所述潜在直线的角度,确定水平线和垂直线的步骤,包括:
当所述潜在直线与预设参考直线的夹角大于45度时,确定所述潜在直线为垂直线;
当所述潜在直线与预设参考直线的夹角小于或等于45度时,确定所述潜在直线为水平线。
优选地,所述根据所述水平线和所述垂直线,获得候选结构边缘的步骤,包括:
根据任意两条所述水平线和任意两条所述垂直线,获得候选结构边缘,所述候选结构边缘的形状为四边形。
优选地,所述直线检测的方法,包括:hough变换或radon变换。
优选地,所述约束条件至少包括:角度约束、长宽比约束、面积约束、推荐区域约束和得分矩阵约束中的一种。
优选地,获取所述边缘检测模型的步骤,包括:
获取图像样本;
对所述图像样本进行标注,确定以结构边缘像素点为中心的图像块为正样本,以非结构边缘像素点为中心的图像块为负样本;
获取所述正样本和负样本的多通道特征;
根据所述图像样本,以及所述正样本和负样本的多通道特征,对机器学习分类器进行训练得到边缘检测模型。
优选地,所述机器学习分类器包括随机森林分类器或CNN卷积神经网络分类器。
优选地,当所述机器学习分类器为随机森林分类器时,所述多通道特征包括:颜色通道特征,梯度幅值通道特征,梯度方向通道特征。
相应的,本发明实施例还提供了一种图像结构边缘的定位装置,所述装置包括:
图像获取模块,用于获取待检测图像;
边缘检测模块,用于采用预先训练好的边缘检测模型,对所述待检测图像进行边缘检测,得到边缘得分矩阵;
直线检测模块,用于对所述边缘得分矩阵进行直线检测;
边缘候选模块,用于根据所述直线检测模块的结果确定候选结构边缘;
边缘确定模块,用于根据预设的约束条件,在所述候选结构边缘中确定目标结构边缘。
优选地,所述边缘候选模块,包括:
直线确定子模块,用于根据所述直线检测模块的结果,确定潜在直线;
直线分类子模块,用于根据所述潜在直线的角度,确定水平线和垂直线;
边缘构成子模块,用于根据所述水平线和所述垂直线,获得候选结构边缘。
优选地,所述直线分类子模块,包括:
垂直线确定子模块,用于当所述潜在直线与预设参考直线的夹角大于45度时,确定所述潜在直线为垂直线;
水平线确定子模块,用于当所述潜在直线与预设参考直线的夹角小于或等于45度时,确定所述潜在直线为水平线。
优选地,所述边缘构成子模块,包括:
四边形构成子模块,用于根据任意两条所述水平线和任意两条所述垂直线,获得候选结构边缘,所述候选结构边缘的形状为四边形。
优选地,所述直线检测模块,包括:hough变换子模块,或radon变换子模块。
优选地,所述约束条件至少包括:角度约束、长宽比约束、面积约束、推荐区域约束和得分矩阵约束中的一种。
优选地,所述装置还包括模型训练模块,所述模型训练模块包括:
样本获取子模块,用于获取图像样本;
样本标注子模块,用于对所述图像样本进行标注,确定以结构边缘像素点为中心的图像块为正样本,以非结构边缘像素点为中心的图像块为负样本;
特征获取子模块,用于获取所述正样本和负样本的多通道特征;
模型获得子模块,用于根据所述图像样本,以及所述正样本和负样本的多通道特征,对机器学习分类器进行训练得到边缘检测模型。
优选地,所述机器学习分类器包括随机森林分类器或CNN分类器。
优选地,当所述机器学习分类器为随机森林分类器时,所述多通道特征包括:颜色通道特征,梯度幅值通道特征,梯度方向通道特征。
与现有技术相比,本发明实施例包括以下优点:
本发明实施例通过边缘检测模型,对待检测图像的结构边缘进行检测,生成一个与待检测图像大小一样的边缘得分矩阵,感兴趣的结构边缘像素点得分高,不感兴趣的结构边缘和非结构边缘像素点得分低;再对边缘得分矩阵进行直线检测,根据直线检测结果获得候选结构边缘;再根据预设的约束条件,在候选结构边缘中最终确定目标结构边缘;此方法根据边缘得分矩阵、直线检测以及约束条件对结构边缘进行定位,对光照和阴影等具有较强的鲁棒性,使图像结构边缘的定位更准确。
附图说明
图1是本发明实施例一种图像结构边缘的定位方法的步骤流程图;
图2是本发明实施例一种图像结构边缘的定位方法中确定候选结构边缘的步骤流程图;
图3是本发明实施例一种图像结构边缘的定位方法中直线分类的步骤流程图;
图4是本发明实施例一种图像结构边缘的定位方法中获取边缘检测模型的步骤流程图;
图5是本发明实施例一种图像结构边缘的定位装置的结构框图;
图6是本发明实施例一种图像结构边缘的定位装置中边缘候选模块的结构框图;
图7是本发明实施例一种图像结构边缘的定位装置中直线分类子模块的结构框图;
图8是本发明实施例一种图像结构边缘的定位装置中边缘构成子模块的结构框图;
图9是本发明实施例一种图像结构边缘的定位装置中模型训练模块的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明实施例一种图像结构边缘的定位方法的步骤流程图,具体可以包括如下步骤:
步骤101:获取待检测图像。
待检测图像可以是如名片、身份证、行驶证、驾驶证等证件的拍照图像或扫描图像。在光学字符识别图像预处理过程中,经常需要首先从图像中提取结构边缘,为后续透视变换和版面分析做铺垫。结构边缘是图像中可能出现的固有边缘模式,如横线、竖线、T型、Y型等边缘。
在执行此步骤时,也可以同时获得待检测图像的结构边缘形状信息,以便缩小后续目标结构边缘的候选范围。
步骤102:采用预先训练好的边缘检测模型,对待检测图像进行边缘检测,得到边缘得分矩阵。
边缘检测模型可以首先通过收集自然场景下各种图像,并对其结构边缘进行精确的人工标注;再选择合适的边缘特征向量,使用机器学习分类器来有监督的学习这些特征,获得边缘检测模型。使用该边缘检测模型对步骤101获得的待检测图像进行边缘检测,图像中每个像素点对应一个边缘得分,得到一个与待检测图像大小相同的得分矩阵,即边缘得分矩阵,感兴趣的结构边缘像素点得分高,不感兴趣的结构边缘和非结构边缘像素点得分低。
步骤103:对边缘得分矩阵进行直线检测。
对步骤102获得的边缘得分矩阵进行直线检测方法有多种。可选地,直线检测的方法可以包括:hough变换或radon变换。
Hough变换是将笛卡尔坐标系下的直线表示转换为Hough空间中的点表示,其累积值超过某阈值则认为是直线。Radon变换是沿特定角度的图像像素线积分,当线积分的值超过某阈值则认为是直线。
具体地可根据实际应用来确定方法,本发明实施例对此不做限定。
步骤104:根据直线检测结果确定候选结构边缘。
在实际应用中,可以首先根据上述步骤103直线检测的结果确定出直线,再通过直线之间的任意组合得到多种多边形结构,作为候选结构边缘。
步骤105:根据预设的约束条件,在候选结构边缘中确定目标结构边缘。
可选地,上述约束条件可以至少包括:角度约束、长宽比约束、面积约束、推荐区域约束和得分矩阵约束中的一种。
在实际应用中,可以根据推荐区域约束条件来过滤候选结构边缘。推荐区域约束即当候选结构边缘区域与推荐区域重合比例大于预设的重合阈值则保留;其中推荐区域可以由edgebox算法根据边缘得分矩阵及边缘特征向量来确定,预设的重合阈值可以根据历史经验来确定。edgebox算法是一种快速的感兴趣区域推荐算法。
在实际应用中,还可以根据得分矩阵约束条件来过滤候选结构边缘。得分矩阵约束条件即当候选结构边缘中边缘得分大于预设得分阈值的则保留,其中预设得分阈值可以根据历史经验来确定。
在实际应用中,对于预先获得了待检测图像的结构边缘形状的情况,还可以根据待检测图像的结构边缘形状预置对应的约束条件,以便在候选结构边缘中更快捷地选出目标结构边缘。例如可以预置与待检测图像的结构边缘形状对应的角度约束条件、长宽比约束条件、面积约束条件等,根据预置的约束条件来过滤候选结构边缘。
角度约束即当候选结构边缘的各角度满足一定条件则保留,例如对于待检测图像的结构边缘形状为矩形的情况,角度约束条件可以设定为候选四边形的四个角度都在70度~110度的范围内则保留,其中任一角度不满足此条件则过滤掉。
长宽比约束即当候选结构边缘的长宽比在一定范围内则保留;例如对于待检测图像的结构边缘形状为矩形的情况,长宽比约束条件可以规定为当候选结构边缘的长宽比在预先获得的标准长宽比的±30%浮动范围内则保留,超出标准长宽比的±30%浮动范围则过滤掉。
面积约束即当候选结构边缘的面积在一定范围内则保留;例如,面积约束条件可以规定为当候选结构边缘的面积在预先获得的标准结构面积的±30%浮动范围内则保留,超出标准结构面积的±30%浮动范围则过滤掉。
在实际应用中,约束条件可以根据实际应用情况来选定,本发明实施例对此不做限定。
对于经以上约束条件过滤后仍保留多个候选结构边缘的情况,可以使用约束条件的加权组合来确定最优的目标结构边缘。
例如对于预先确定了待检测图像的结构边缘形状为矩形的情况,可以首先经约束条件过滤只保留四边形的候选结构边缘,然后可以定义角度约束权重为w1
Figure BDA0001336944710000071
其中,αi为候选结构边缘的第i个夹角。当4个夹角都接近于90度时,w1接近于1。四个角度的权重相乘得到角度约束权重;
还可以定义长宽比约束权重为w2:
Figure BDA0001336944710000072
其中,R为待检测图像的矩形结构边缘的标准长宽比,w和h分别为候选四边形的两条长边和短边的平均值。当候选四边形的长宽比越接近于标准长宽比时,w2越接近于1;
还可以定义候选四边形的边缘得分E:
Figure BDA0001336944710000081
其中Li为候选四边形的边得分,边得分即边上所有像素点的得分和;
可以定义候选四边形最终得分S:
S=w1w2E
最终得分S最高的候选四边形即为目标结构边缘。
在实际应用中,约束条件的加权组合方式可以根据实际情况来选择和定义,本发明实施例对此不做限定。
本发明实施例通过边缘检测模型,对待检测图像的结构边缘进行检测,生成一个与待检测图像大小一样的边缘得分矩阵,感兴趣的结构边缘像素点得分高,不感兴趣的结构边缘和非结构边缘像素点得分低;再对边缘得分矩阵进行直线检测,根据直线检测结果获得候选结构边缘;再根据预设的约束条件,在候选结构边缘中最终确定目标结构边缘;此方法根据边缘得分矩阵、直线检测以及约束条件对结构边缘进行定位,对光照和阴影等具有较强的鲁棒性,使图像结构边缘的定位更准确。
在本申请的另一个实施例中,参照图2,上述步骤104还可以进一步包括:
步骤201:根据直线检测结果,确定潜在直线。
根据步骤103中直线检测的结果,例如可以根据hough变换或radon变换的结果确定出潜在直线,即候选结构边缘的潜在边。
步骤202:根据潜在直线的角度,确定水平线和垂直线。
在实际应用中,可以预先定义一参考直线或者参考平面,根据潜在直线与参考直线或参考平面的夹角大小,将潜在直线分为水平线和垂直线两组。具体地可根据实际应用来确定,本发明实施例对此不做限定。
步骤203:根据水平线和垂直线,获得候选结构边缘。
在实际应用中,可以将水平线和垂直线任意组合得到多种多边形,作为候选的结构边缘。例如,可以根据任意一条水平线和任意两条垂直线组成三角形,作为候选结构边缘;还可以根据任意两条水平线和任意两条垂直线组成的四边形作为候选结构边缘。
在本申请的另一个实施例中,参照图3,上述步骤202还可以进一步包括:
步骤301:当所述潜在直线与预设参考直线的夹角大于45度时,确定所述潜在直线为垂直线。
步骤302:当所述潜在直线与预设参考直线的夹角小于或等于45度时,确定所述潜在直线为水平线。
在实际应用中,预设参考直线可以是在待检测图像平面内,且与水平面平行的一条直线。由于两条直线的夹角范围为0度~90度,可以定义与预设参考直线的夹角大于45度的潜在直线为垂直线,与预设参考直线的夹角小于或等于45度的潜在直线为水平线。
在本申请的另一个实施例中,上述步骤203还可以进一步包括:
根据任意两条水平线和任意两条垂直线,获得候选结构边缘,候选结构边缘的形状为四边形。
具体地,可以由任意两条水平线和任意两条垂直线优先组成多种四边形,作为候选四边形,后续再根据预先设定的约束条件来判断是否保留。
在本申请的另一个实施例中,参照图4,获取上述步骤102中边缘检测模型的步骤可以包括:
步骤401:获取图像样本。
在实际应用中,可以收集数千张自然场景下常见的名片、身份证、行驶证、驾驶证等含有结构边缘的拍照图像或扫描图像作为样本,其中样本数量越大训练得到的边缘检测模型越精确。
步骤402:对图像样本进行标注,确定以结构边缘像素点为中心的图像块为正样本,以非结构边缘像素点为中心的图像块为负样本。
在实际应用中,可以对图像样本的结构边缘进行精确的人工标注,以结构边缘上的像素点为中心构造合适大小的图像块作为正样本,以非结构边缘的像素点为中心构造合适大小的图像块作为负样本。图像块的大小可以根据图像本身的大小以及经验确定。其中负样本图像块的中心可以距离边缘像素点至少8个像素点。
步骤403:获取正样本和负样本的多通道特征。
在实际应用中,可以分别提取正样本和负样本图像块的多通道特征,采用多通道融合的方式产生结构边缘特征向量。一个图像块提取完的特征向量代表的是以图像块中心点为代表的特征值,也就是可以用块信息来表示是否是边缘点。
步骤404:根据图像样本,以及正样本和负样本的多通道特征,对机器学习分类器进行训练得到边缘检测模型。
在实际应用中,将多通道特征输入机器学习分类器,可以得到分类结果的置信度即边缘得分,可以使用机器学习分类器来有监督地学习人工标注的结构边缘的多通道特征,最终得到边缘检测模型。
在本实施例中,可选地,机器学习分类器包括随机森林分类器或CNN卷积神经网络分类器。
在本实施例中,可选地,当机器学习分类器为随机森林分类器时,多通道特征包括:颜色通道特征,梯度幅值通道特征,梯度方向通道特征。
具体地,随机森林分类器是将多个随机的分类决策树组合起来构成森林,从而提升单个决策树的鲁棒性和准确性。在实际应用中,当机器学习分类器为随机森林分类器时,多通道特征可以由颜色通道特征,梯度幅值通道特征和梯度方向通道特征组成。例如对于32*32图像块,多通道特征可以包括R、G、B三个颜色通道特征或者是其他对光照更鲁棒的ycbcr或lab颜色通道特征;梯度幅值特征和梯度方向特征可以由gabor滤波器提取,例如可以选用两个波长两个方向组合共生成四个幅值特征通道和四个方向特征通道。在使用随机森林分类器进行模型训练之前,还可以使用主成分分析法或kmeans法对提取到的高维多通道特征进行降维。其中主成份分析法是一种数据降维的常用方法,能够保证降维后的特征向量间相互独立,并保存了原始数据绝大多数的方差。Kmeans法是一种常用聚类算法,通过不断迭代更新聚类中心降低loss函数以实现聚类或降维。
在实际应用中,机器学***均值或最大值,这种聚合统计过程即池化(pooling)。通过池化不但可以降低多通道特征的维度,还会避免过拟合现象。在实际应用中,对于32*32的图像块,一般可以使用3个堆栈式卷积层和一个全连接层即可很好的完成特征提取及分类任务,其中堆栈式卷积层包含卷积层,线性整流单元和池化层,卷积核的大小可以统一为3*3,特征层数可以为8、16、32,pooling层大小可以为2*2。
以上描述的一种图像结构边缘的定位方法可以应用于任何具有多边形特征的结构边缘定位,日常生活中应用对象较多的是矩形,例如名片、身份证、行驶证、驾驶证等证件的边缘都具有明显的矩形特征。对于待检测图像的结构边缘为矩形的情况,可以通过上述预置与矩形对应的约束条件的方法来更准确、快速地从候选结构边缘中选出目标结构边缘;还可以在确定候选结构边缘时,限定只由任意两条水平线和任意两条垂直线构成的四边形作为候选结构边缘,再结合约束条件最终确定目标结构边缘。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图5,示出了本发明实施例一种图像结构边缘的定位装置的结构框图,具体可以包括如下模块:
图像获取模块501,用于获取待检测图像;
边缘检测模块502,用于采用预先训练好的边缘检测模型,对所述待检测图像进行边缘检测,得到边缘得分矩阵;
直线检测模块503,用于对所述边缘得分矩阵进行直线检测;
边缘候选模块504,用于根据所述直线检测模块503的结果确定候选结构边缘;
边缘确定模块505,用于根据预设的约束条件,在所述候选结构边缘中确定目标结构边缘。
在本实施例中,可选地,上述直线检测模块503可以包括:hough变换子模块,或radon变换子模块。
在本实施例中,可选地,上述边缘确定模块505中的约束条件可以至少包括:角度约束、长宽比约束、面积约束、推荐区域约束和得分矩阵约束中的一种。
在本申请的另一个实施例中,参照图6,上述边缘候选模块504还可以进一步包括:
直线确定子模块601,用于根据所述直线检测模块503的结果,确定潜在直线;
直线分类子模块602,用于根据所述潜在直线的角度,确定水平线和垂直线;
边缘构成子模块603,用于根据所述水平线和所述垂直线,获得候选结构边缘。
在本申请的另一个实施例中,参照图7,上述直线分类子模块602还可以进一步包括:
垂直线确定子模块701,用于当潜在直线与预设参考直线的夹角大于45度时,确定潜在直线为垂直线;
水平线确定子模块702,用于当潜在直线与预设参考直线的夹角小于或等于45度时,确定潜在直线为水平线。
在本申请的另一个实施例中,参照图8,上述边缘构成子模块603还可以进一步包括:
四边形构成子模块801,用于根据任意两条水平线和任意两条垂直线,获得候选结构边缘,候选结构边缘的形状为四边形。
在本申请的另一个实施例中,参照图9,上述边缘检测模块502还可以包括模型训练模块900,该模型训练模块900可以包括:
样本获取子模块901,用于获取图像样本;
样本标注子模块902,用于对图像样本进行标注,确定以结构边缘像素点为中心的图像块为正样本,以非结构边缘像素点为中心的图像块为负样本;
特征获取子模块903,用于获取正样本和负样本的多通道特征;
模型获得子模块904,用于根据图像样本,以及正样本和负样本的多通道特征,对机器学习分类器进行训练得到边缘检测模型。
在本实施例中,可选地,上述模型获得子模块904中机器学习分类器可以包括随机森林分类器或CNN分类器。
在本实施例中,可选地,当机器学习分类器为随机森林分类器时,上述特征获取子模块903中的多通道特征可以包括:颜色通道特征,梯度幅值通道特征,梯度方向通道特征。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种图像结构边缘的定位方法和一种图像结构边缘的定位装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种图像结构边缘的定位方法,其特征在于,所述方法包括:
获取待检测图像;
采用预先训练好的边缘检测模型,对所述待检测图像进行边缘检测,得到边缘得分矩阵;
对所述边缘得分矩阵进行直线检测;
根据所述直线检测结果确定候选结构边缘;
根据预设的约束条件,在所述候选结构边缘中确定目标结构边缘;
其中,训练所述边缘检测模型的步骤为:获取图像样本;
对所述图像样本进行标注,确定以结构边缘像素点为中心的图像块为正样本,以非结构边缘像素点为中心的图像块为负样本;
获取所述正样本和负样本的多通道特征,所述多通道特征由颜色通道特征,梯度幅值通道特征和梯度方向通道特征组成,所述颜色通道特征为ycbcr或lab颜色通道特征;
根据所述图像样本,以及所述正样本和负样本的多通道特征,对机器学习分类器进行训练得到边缘检测模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述直线检测结果确定候选结构边缘的步骤,包括:
根据所述直线检测结果,确定潜在直线;
根据所述潜在直线的角度,确定水平线和垂直线;
根据所述水平线和所述垂直线,获得候选结构边缘。
3.根据权利要求2所述的方法,其特征在于,所述根据所述水平线和所述垂直线,获得候选结构边缘的步骤,包括:
根据任意两条所述水平线和任意两条所述垂直线,获得候选结构边缘,所述候选结构边缘的形状为四边形。
4.一种图像结构边缘的定位装置,其特征在于,所述装置包括:
图像获取模块,用于获取待检测图像;
边缘检测模块,用于采用预先训练好的边缘检测模型,对所述待检测图像进行边缘检测,得到边缘得分矩阵;
直线检测模块,用于对所述边缘得分矩阵进行直线检测;
边缘候选模块,用于根据所述直线检测模块的结果确定候选结构边缘;
边缘确定模块,用于根据预设的约束条件,在所述候选结构边缘中确定目标结构边缘;
所述装置还包括模型训练模块,所述模型训练模块包括:
样本获取子模块,用于获取图像样本;
样本标注子模块,用于对所述图像样本进行标注,确定以结构边缘像素点为中心的图像块为正样本,以非结构边缘像素点为中心的图像块为负样本;
特征获取子模块,用于获取所述正样本和负样本的多通道特征;所述多通道特征由颜色通道特征,梯度幅值通道特征和梯度方向通道特征组成,所述颜色通道特征为ycbcr或lab颜色通道特征;
模型获得子模块,用于根据所述图像样本,以及所述正样本和负样本的多通道特征,对机器学习分类器进行训练得到边缘检测模型。
5.根据权利要求4所述的装置,其特征在于,所述边缘候选模块,包括:
直线确定子模块,用于根据所述直线检测模块的结果,确定潜在直线;
直线分类子模块,用于根据所述潜在直线的角度,确定水平线和垂直线;
边缘构成子模块,用于根据所述水平线和所述垂直线,获得候选结构边缘。
6.根据权利要求5所述的装置,其特征在于,所述边缘构成子模块,包括:
四边形构成子模块,用于根据任意两条所述水平线和任意两条所述垂直线,获得候选结构边缘,所述候选结构边缘的形状为四边形。
CN201710517455.4A 2017-06-29 2017-06-29 一种图像结构边缘的定位方法及装置 Active CN107464245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710517455.4A CN107464245B (zh) 2017-06-29 2017-06-29 一种图像结构边缘的定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710517455.4A CN107464245B (zh) 2017-06-29 2017-06-29 一种图像结构边缘的定位方法及装置

Publications (2)

Publication Number Publication Date
CN107464245A CN107464245A (zh) 2017-12-12
CN107464245B true CN107464245B (zh) 2020-08-18

Family

ID=60544060

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710517455.4A Active CN107464245B (zh) 2017-06-29 2017-06-29 一种图像结构边缘的定位方法及装置

Country Status (1)

Country Link
CN (1) CN107464245B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921864B (zh) * 2018-06-22 2022-02-15 广东工业大学 一种光条中心提取方法及装置
CN111260876B (zh) * 2018-11-30 2022-02-25 北京欣奕华科技有限公司 一种图像处理方法及装置
CN109598737B (zh) * 2018-12-04 2021-01-12 广东智媒云图科技股份有限公司 一种图像边缘识别方法及***
CN109886302A (zh) * 2019-01-21 2019-06-14 河北新兴铸管有限公司 基于机器学习的管径判断方法及终端设备
CN110276346B (zh) * 2019-06-06 2023-10-10 北京字节跳动网络技术有限公司 目标区域识别模型训练方法、装置和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065140A (zh) * 2012-12-30 2013-04-24 信帧电子技术(北京)有限公司 车标的定位方法及装置
CN103425984A (zh) * 2013-08-15 2013-12-04 北京京北方信息技术有限公司 一种检测票据中正多边形***的方法和装置
CN105488791A (zh) * 2015-11-25 2016-04-13 北京奇虎科技有限公司 自然背景中图像边缘的定位方法及装置
CN106157308A (zh) * 2016-06-30 2016-11-23 北京大学 矩形目标物检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006059663B4 (de) * 2006-12-18 2008-07-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zum Identifizieren eines Verkehrszeichens in einem Bild

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065140A (zh) * 2012-12-30 2013-04-24 信帧电子技术(北京)有限公司 车标的定位方法及装置
CN103425984A (zh) * 2013-08-15 2013-12-04 北京京北方信息技术有限公司 一种检测票据中正多边形***的方法和装置
CN105488791A (zh) * 2015-11-25 2016-04-13 北京奇虎科技有限公司 自然背景中图像边缘的定位方法及装置
CN106157308A (zh) * 2016-06-30 2016-11-23 北京大学 矩形目标物检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于机器学习的边缘检测方法研究";赵彤洲,王海晖,徐迪迪;《湖北大学学报(自然科学版)》;20110930;第33卷(第3期);第370-372页 *

Also Published As

Publication number Publication date
CN107464245A (zh) 2017-12-12

Similar Documents

Publication Publication Date Title
CN107464245B (zh) 一种图像结构边缘的定位方法及装置
CN110414507B (zh) 车牌识别方法、装置、计算机设备和存储介质
TWI774659B (zh) 圖像文字的識別方法和裝置
WO2019169532A1 (zh) 车牌识别方法及云***
CN112686812B (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
CN109711264B (zh) 一种公交车道占道检测方法及装置
JP6192271B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN104834933A (zh) 一种图像显著性区域的检测方法和装置
CN108197644A (zh) 一种图像识别方法和装置
US9740965B2 (en) Information processing apparatus and control method thereof
CN111160169B (zh) 人脸检测方法、装置、设备及计算机可读存储介质
CN109409384A (zh) 基于细粒度图像的图像识别方法、装置、介质及设备
CN105760858A (zh) 一种基于类Haar中间层滤波特征的行人检测方法及装置
CN103456003A (zh) 对象跟踪装置及方法以及错误特征点剔除装置及方法
Wang et al. Recognition and localization of occluded apples using K-means clustering algorithm and convex hull theory: a comparison
CN107844737B (zh) 虹膜图像的检测方法和装置
CN111860309A (zh) 一种人脸识别方法及***
CN112686248B (zh) 证件增减类别检测方法、装置、可读存储介质和终端
CN111695373B (zh) 斑马线的定位方法、***、介质及设备
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN108256520B (zh) 一种识别硬币年份的方法、终端设备及计算机可读存储介质
Yingthawornsuk et al. Automatic Thai Coin Calculation System by Using SIFT
CN111144270B (zh) 基于神经网络的手写文本工整度的评测方法与评测装置
CN116342525A (zh) 基于Lenet-5模型的SOP芯片引脚缺陷检测方法及***
CN108960246B (zh) 一种用于图像识别的二值化处理装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant