CN111222508B - 基于roi的户型图比例尺识别方法、装置、计算机设备 - Google Patents
基于roi的户型图比例尺识别方法、装置、计算机设备 Download PDFInfo
- Publication number
- CN111222508B CN111222508B CN202010031972.2A CN202010031972A CN111222508B CN 111222508 B CN111222508 B CN 111222508B CN 202010031972 A CN202010031972 A CN 202010031972A CN 111222508 B CN111222508 B CN 111222508B
- Authority
- CN
- China
- Prior art keywords
- roi
- line
- scale
- column
- row
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明公开了一种基于ROI的户型图比例尺识别方法、装置、计算机设备和存储介质,上述基于ROI的户型图比例尺识别方法包括:S110,提取户型图的ROI区域;S120,在所述ROI区域中提取数字框,根据所述数字框在所述ROI区域中提取比例尺线段;S130,对所述数字框及比例尺线段进行修正;S140,根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺。其可以准确确定相应户型图的比例尺,提高比例尺的确定效率。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于ROI的户型图比例尺识别方法、装置、计算机设备和存储介质。
背景技术
在室内家具自动布局领域,自动布局算法模型往往需要大量的户型图相关数据进行训练,户型图中一项基本信息便是比例尺,提高户型图的比例尺识别效率和准确率是产出高质量的训练数据的基础。传统的户型图比例尺通常依据相应户型图中特定的边界线等表征相应尺寸的线条确定,所确定的户型图比例尺往往存在准确度低的问题。
发明内容
针对以上问题,本发明提出一种基于ROI的户型图比例尺识别方法、计算机设备和存储介质。
为实现本发明的目的,提供一种基于ROI的户型图比例尺识别方法,包括如下步骤:
S110,提取户型图的ROI区域;
S120,在所述ROI区域中提取数字框,根据所述数字框在所述ROI区域中提取比例尺线段;
S130,对所述数字框及比例尺线段进行修正;
S140,根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺。
在一个实施例中,所述提取户型图的ROI区域包括:
提取户型图的梯度二值化图Ib;
在梯度二值化图Ib中,按照第0行至第h行的顺序搜索梯度二值化图Ib的第一区域的第一初始ROI长线,按照第h行至第0行的顺序搜索梯度二值化图Ib的第二区域的第二初始ROI长线,按照第0列到第w列顺序搜索梯度二值化图Ib的第三区域的第三初始ROI长线,按照第w列到第0列的顺序搜索梯度二值化图Ib的第四区域的第四初始ROI长线;其中,第0行指梯度二值化图Ib的首行,第h行指梯度二值化图Ib的最后一行,第0列指梯度二值化图Ib的首列,第h列指梯度二值化图Ib的最后一列;
提取第一初始ROI长线的有效线,得到第一有效ROI长线,提取第二初始ROI长线的有效线,得到第二有效ROI长线,提取第三初始ROI长线的有效线,得到第三有效ROI长线,提取第四初始ROI长线的有效线,得到第四有效ROI长线;
将第一有效ROI长线分别向首行和末行所在的方向扩展,将第二有效ROI长线分别向首行和末行所在的方向扩展,得到行ROI线,将第三有效ROI长线分别向首列和最后一列所在的方向扩展,将第四有效ROI长线分别向首列和最后一列所在的方向扩展,得到列ROI线,根据所述行ROI线和列ROI线确定户型图的ROI区域。
作为一个实施例,在所述ROI区域中提取数字框的过程包括:
对行ROI线,按列统计像素分布ci,对列ROI线,统计像素分布ri;ci表示第i列中像素值为255的像素数量,ri表示第i行中像素值为255的像素数量;
提取满足条件ci>dt的列,得到列集合Da={i|ci>dt},提取满足条件ri>dt的行,得到行集合Db={i|ri>dt},根据列集合Da和行集合Db确定候选数字列集合D;其中dt为数字尺寸高度阈值;
对候选数字列及数字行集合D进行切分,得到多个子集,确定各个子集分别对应数字框Bk;其中切分条件包括:max(Di)-min(Di)>dw,min(Dk)-max(Dk-1)>dgap,dw表示数字宽度阈值,dgap表示两个相邻的数字框间距阈值,max(Di)表示子集Di中最大的列序号或行序号,min(Di)表示子集Di中最小的列序号或行序号,min(Dk)表示子集Dk中最小的列序号或行序号,max(Dk-1)表示子集Dk-1中最大的列序号或行序号。
作为一个实施例,根据所述数字框在所述ROI区域中提取比例尺线段的过程包括:
对行ROI线,提取满足ci>st且不属于任何一个数字框的列,得到列集合对列ROI线,提取满足条件ri>st且不属于任何一个数字框的行,得到行集合将Sa和Sb中与对应的ROI中心线相交的点确定为比例尺分割点;其中st表示比例尺分割点的高度阈值,D'a表示行ROI中数字框包含的列的集合,D'b表示列ROI中数字框包含的行的结合;
采用分割点将ROI区域的中心线进行分割得到比例尺线段。
在一个实施例中,对所述数字框及比例尺线段进行修正包括:
对数字框按尺寸聚类,得到多个第一数字框簇,去除掉存在数字框数量小于数量阈值、和/或数字框尺寸不在预设尺寸范围内的第一数字框簇;
对剩余的第一数字框簇的数字框按照位置聚类,得到多个第二数字框簇,去除掉与中心线之间的距离超过距离阈值的第二数字框簇,将剩余的第二数字框簇中的数字框确定为目标数字框;
剔除掉没有目标数字框对应的比例尺线段,以及不在比例尺线段中间位置的目标数字框。
在一个实施例中,对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺包括:
采用一个训练好的神经网络模型将修正后的数字框对应的图片翻译成数字信号;
根据数字信号和数字信号对应的比例尺线段,计算数字信号对应的比例尺;
统计行方向和列方向的比例尺的值出现次数,将行方向出现次数最高的比例尺值确定为行标准值,将列方向出现次数最高的比例尺值确定为列标准值,根据行标准值和列标准值确定户型图的比例尺。
作为一个实施例,上述基于ROI的户型图比例尺识别方法,还包括:
若行标准值和列标准值相等,判定户型图水平方向和竖直方向的比例尺一致,否则,判定户型图的比例尺无效。
一种基于ROI的户型图比例尺识别装置,包括:
第一提取模块,用于提取户型图的ROI区域;
第二提取模块,用于在所述ROI区域中提取数字框,根据所述数字框在所述ROI区域中提取比例尺线段;
修正模块,用于对所述数字框及比例尺线段进行修正;
识别模块,用于根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例的基于ROI的户型图比例尺识别方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例的基于ROI的户型图比例尺识别方法的步骤。
上述基于ROI的户型图比例尺识别方法、装置、计算机设备和存储介质,通过提取户型图的ROI区域,在ROI区域中提取数字框,根据数字框在ROI区域中提取比例尺线段,对数字框及比例尺线段进行修正,根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺,以准确确定相应户型图的比例尺,提高比例尺的确定效率。
附图说明
图1是一个实施例的基于ROI的户型图比例尺识别方法流程图;
图2是一个实施例的基于ROI的比例尺识别技术流程图;
图3是一个实施例的图像的ROI提取流程图;
图4是一个实施例的从ROI中提取数字框的流程图;
图5是一个实施例的数字框和比例尺线段修正流程图;
图6是一个实施例的数字框和比例尺线段修正流程图;
图7是一个实施例的基于ROI的户型图比例尺识别装置结构示意图;
图8为一个实施例的计算机设备示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在一个实施例中,如图1所示,提供了一种基于ROI的户型图比例尺识别方法,包括以下步骤:
S110,提取户型图的ROI区域。
S120,在所述ROI区域中提取数字框,根据所述数字框在所述ROI区域中提取比例尺线段。
S130,对所述数字框及比例尺线段进行修正。
S140,根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺。
户型图的ROI区域指比例尺标识区域,比例尺标识区域通常包含水平或竖直的长线(如第一初始ROI长线、第二初始ROI长线、第三初始ROI长线和第四初始ROI长线等)、长线上的分割点、若干个数字框。户型图的ROI区域提取首先需要对图像I进行预处理,提取户型图的梯度二值化图Ib,其中Shape(Ib)=(h,w),表示二值图的高度为h,宽度为w。然后统计Ib中每行和每列的像素分布ri、ci,ri表示第i行中像素值为255的像素数量为ri,ci表示第i列中像素值为255的像素数量为ci。
进一步地,相应比例尺计算时可以用“识别的数字”除以“对应的线段的长度”即像素数量,得到图片中一个像素对应实际长度,因此数字框和比例尺线段是相互对应的。步骤S120中,提取数字框和比例尺线段的过程中,可能有噪声的影响,因而在步骤S130中分别对数字框及比例尺线段进行修正;此处进行修正主要是过滤掉部分位置和尺寸不合理的数字框,同时过滤掉部分无法保证对应关系的线段,修正流程主要目的是“去噪”和“保持一一对应关系”,以使后续进行更为准确的OCR识别。
上述基于ROI的户型图比例尺识别方法,通过提取户型图的ROI区域,在ROI区域中提取数字框,根据数字框在ROI区域中提取比例尺线段,对数字框及比例尺线段进行修正,根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺,以准确确定相应户型图的比例尺,提高比例尺的确定效率。
在一个实施例中,所述提取户型图的ROI区域包括:
提取户型图的梯度二值化图Ib;
在梯度二值化图Ib中,按照第0行至第h行的顺序搜索梯度二值化图Ib的第一区域的第一初始ROI长线,按照第h行至第0行的顺序搜索梯度二值化图Ib的第二区域的第二初始ROI长线,按照第0列到第w列顺序搜索梯度二值化图Ib的第三区域的第三初始ROI长线,按照第w列到第0列的顺序搜索梯度二值化图Ib的第四区域的第四初始ROI长线;其中,第0行指梯度二值化图Ib的首行,第h行指梯度二值化图Ib的最后一行,第0列指梯度二值化图Ib的首列,第h列指梯度二值化图Ib的最后一列;
提取第一初始ROI长线的有效线,得到第一有效ROI长线,提取第二初始ROI长线的有效线,得到第二有效ROI长线,提取第三初始ROI长线的有效线,得到第三有效ROI长线,提取第四初始ROI长线的有效线,得到第四有效ROI长线;
将第一有效ROI长线分别向首行和末行所在的方向扩展,将第二有效ROI长线分别向首行和末行所在的方向扩展,得到行ROI线,将第三有效ROI长线分别向首列和最后一列所在的方向扩展,将第四有效ROI长线分别向首列和最后一列所在的方向扩展,得到列ROI线,根据所述行ROI线和列ROI线确定户型图的ROI区域。
在相应初始ROI长线中提取有效线的过程可以包括:初始ROI长线中长度大于相应长度阈值,且长线两侧像素存在跳跃现象的线条为有效线。如第一初始ROI长线中长度大于相应长度阈值,且长线两侧像素存在跳跃现象的线条为第一有效ROI长线;第二初始ROI长线中长度大于相应长度阈值,且长线两侧像素存在跳跃现象的线条为第二有效ROI长线;等等。
具体地,提取户型图的ROI区域也可以通过如下过程描述:
(1)在二值图(梯度二值化图)Ib中,按照第0至第h行的顺序从上向下开始搜索户型图上方“ROI长线”,称为“上方ROI长线”(第一初始ROI长线),按照第h行至第0行的顺序从下向上搜索户型图的下方“ROI长线”,称为“下方ROI长线”(第二初始ROI长线),类似地按照第0列到第w列顺序搜索“左侧ROI长线”(第三初始ROI长线),按照第w列到第0列的顺序搜索“右侧ROI长线”(第四初始ROI长线);
(2)水平方向的“ROI长线”满足ri>t1,ri-ri-step>t2,ri-ri+step>t2;竖直方向的“ROI长线”满足ci>t1,ci-ci-step>t2,ci-ci+step>t2;其中t1为长度阈值,t2为跳跃阈值,表示长线所在的行或列的像素数量要超过长度阈值,并且和长线i平行且距离为step的行或列的像素数量要足够少。记录长线为[x1,y1,x2,y2],其中x1表示长线所在的列的最小值,x2表示长线所在的列的最大值,y1表示长线所在的行的最小值,y2表示长线所在的行的最大值,水平方向的长线y1=y2,竖直方向的长线x1=x2;
(3)对“ROI长线”进行过滤,户型图的墙体外侧在二值图中也是一条长线,需要对其进行过滤。对检测到的“ROI长线”两侧的彩色图像素分布进行分析,针对水平长线[x1,y1,x2,y2],分别提取原彩色图像的第y1-gap到第y1行、第x1到第x2列作为上方区域UpColorRegion,提取第y2到第y2+gap行、第x1到第x2列作为上方区域DownColorRegion,计算两个区域的像素均值之差,即|avg(UpColorRegion)-avg(DownColorRegion)|<t3(t3是一个较小的阈值)时认为长线有效;竖直方向长线检测同理;
(4)从图像上、下、左、右方开始检测水平长线UpLines、DownLines、LeftLines、RightLines,每个方向的长线数量不超过设定阈值且同一个方向的长线间距不超过设定阈值;
(5)将搜索到的四个方向的“ROI长线”向两侧扩展,对水平长线[x1,y1,x2,y2]分别向上、下扩展n行,即[x1,y1-n,x2,y2+n],形成一个“水平ROI”,对竖直长线[x1,y1,x2,y2]分别向左、右扩展n列,即[x1-n,y1,x2+n,y2],形成一个“竖直ROI”,户型图中的“ROI长线”扩展后,形成ROI列表,作为比例尺识别的参考区域,“ROI长线”作为该ROI区域的中心线。
作为一个实施例,在所述ROI区域中提取数字框的过程包括:
对行ROI线,按列统计像素分布ci,对列ROI线,统计像素分布ri;ci表示第i列中像素值为255的像素数量,ri表示第i行中像素值为255的像素数量;
提取满足条件ci>dt的列,得到列集合Da={i|ci>dt},提取满足条件ri>dt的行,得到行集合Db={i|ri>dt},根据列集合Da和行集合Db确定候选数字列集合D;其中dt为数字尺寸高度阈值;
对候选数字列及数字行集合D进行切分,得到多个子集,确定各个子集分别对应数字框Bk;其中切分条件包括:max(Di)-min(Di)>dw,min(Dk)-max(Dk-1)>dgap,dw表示数字宽度阈值,dgap表示两个相邻的数字框间距阈值,max(Di)表示子集Di中最大的列序号或行序号,min(Di)表示子集Di中最小的列序号或行序号,min(Dk)表示子集Dk中最小的列序号或行序号,max(Dk-1)表示子集Dk-1中最大的列序号或行序号。
具体地,本实施例在ROI区域中提取数字框主要基于局部的二值图进行像素统计分析,可以包括如下过程:
(1)对水平方向的ROI(行ROI线),在局部二值图中按列统计像素分布ci,表示第i列中像素值为255的像素数量,为减少干扰像素,统计时针对一列可根据需要只统计靠近中心线且像素连续度较高的行;对竖直方向的ROI(列ROI线),在局部二值图中按行统计像素分布ri,表示第i行中像素值为255的像素数量,同理,统计时针对一行可根据需要只统计靠近中心线且像素连续度较高的列;
(2)对水平方向的ROI,根据局部二值图的按列统计结果ci,提取满足条件ci>dt的列,记作集合D={i|ci>dt},对竖直方向的ROI,根据局部二值图的按行统计结果ri,提取满足条件ri>dt的行,记作集合D={i|ri>dt};其中dt为数字尺寸阈值,表示超过此阈值才可能是图像中的数字部分。
(3)对候选数字列集合D进行切分,形成子集D1、D2……Dn,切分条件满足:max(Di)-min(Di)>dw,min(Dk)-max(Dk-1)>dgap,每个子集Dk形成一个数字框Bk。
进一步地,在ROI区域中提取比例尺线段主要从中心线所在的行或列进行提取,首先沿着中心线将数字框区域排除,在剩余的行或列搜索比例尺分割点,比例尺分割点满足:和中心线相交;统计图中呈现规律的峰值分布。采用类似数字框提取的方式得当分割点集合P,分割点将ROI的中心线进行分割得当比例尺线段集合S。
作为一个实施例,根据所述数字框在所述ROI区域中提取比例尺线段的过程包括:
对行ROI线,提取满足ci>st且不属于任何一个数字框的列,得到列集合对列ROI线,提取满足条件ri>st且不属于任何一个数字框的行,得到行集合将Sa和Sb中与对应的ROI中心线相交的点确定为比例尺分割点;其中st表示比例尺分割点的高度阈值,D'a表示行ROI中数字框包含的列的集合,D'b表示列ROI中数字框包含的行的结合;
采用分割点将ROI区域的中心线进行分割得到比例尺线段。
本实施例中,比例尺分割点的提取与数字框提取的流程类似,区别是分割点搜索时避开数字框所在的列/行,只在剩余的列或行进行搜索,以水平ROI(行ROI线)为例,分割点列的连续像素与中心线相交,且连续度超过分割点设定阈值,在二值统计图中分割点呈现局部窄峰值,且所有分割点的窄峰值数值波动不超过阈值,最终得到分割点序列P,利用分割点将ROI的中心线切分成比例尺线段集合S。
在一个实施例中,对所述数字框及比例尺线段进行修正包括:
对数字框按尺寸聚类,得到多个第一数字框簇,去除掉存在数字框数量小于数量阈值、和/或数字框尺寸不在预设尺寸范围内的第一数字框簇;
对剩余的第一数字框簇的数字框按照位置聚类,得到多个第二数字框簇,去除掉与中心线之间的距离超过距离阈值的第二数字框簇,将剩余的第二数字框簇中的数字框确定为目标数字框;
剔除掉没有目标数字框对应的比例尺线段,以及不在比例尺线段中间位置的目标数字框。
上述数量阈值和预设尺寸范围均可以依据户型图比例尺的识别精度确定。比如可以将数量阈值设为2,将预设尺寸范围可以设为某参考范围指的50%至该参考范围指的150%等等。
本实施例可以对一个ROI区域中的数字框和比例尺线段进行修正,去除掉不合理的数字框和比例尺线段,具体步骤如下:
(1)数字框的尺寸的高度通常都保持一致,将数字框按尺寸聚类,去除掉数量小于阈值、尺寸严重偏离阈值的数字框簇;
(2)水平方向数字框位置通常在在一行上和中心线平行,竖直方向数字框位置通常在一列上和中心线平行,将数字框按照位置聚类,去除掉远离中心线的数字框;
(3)数字框通常在比例尺线段的中间位置,去除掉没有数字框对应的比例尺线段和不在比例尺线段中间位置的数字框。
在一个实施例中,对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺包括:
采用一个训练好的神经网络模型将修正后的数字框对应的图片翻译成数字信号;
根据数字信号和数字信号对应的比例尺线段,计算数字信号对应的比例尺;
统计行方向和列方向的比例尺的值出现次数,将行方向出现次数最高的比例尺值确定为行标准值,将列方向出现次数最高的比例尺值确定为列标准值,根据行标准值和列标准值确定户型图的比例尺。
作为一个实施例,上述基于ROI的户型图比例尺识别方法,还包括:
若行标准值和列标准值相等,判定户型图水平方向和竖直方向的比例尺一致,否则,判定户型图的比例尺无效。
具体地,比例尺综合计算需将水平方向和竖直方向的比例尺计算信息进行整合投票,同时去除掉由于数字框旋转进行OCR识别产生的冗余信息,具体步骤如下:
(1)对识别的数字框和其对应的比例尺线段,分别计算出其对应的比例尺的值;
(2)统计水平方向和竖直方向的比例尺的值出现次数,获取出现次数最高的比例尺值,作为“标准值”,投票得到的比例尺“标准值”能够过滤掉错误的OCR识别结果、方向错误的数字框的比例尺值、异常的数字框及异常的比例尺线段产生的结果。
(3)分别从水平方向和竖直方向取和“标准值”最接近的比例尺竖直作为“比例尺最终值”,得到水平方向的比例尺Vhorizontal和竖直方向的比例尺Vvertical,根据配置判断二者是否相等,若相等,认为户型图水平和竖直方向的比例尺一致,反之,认为图片的比例尺不符合要求。判断比例尺相等可根据用户需要进行检查判断,一种方法是判断二者相等的条件是|Vhorizontal-Vvertical|<thres1,thres1是一个接近0的值,另一种判断二者相等的条件是min(Vhorizontal,Vvertical)/max(Vhorizontal,Vvertical)>thres2,thres2是一个接近1的值。
本实施例采用一个训练好的神经网络模型,可以输入40×15像素的图片等户型图,输出图片中的数字,用于将提取的数字框对应的图片翻译成计算机可进行计算的数字。在进行数字框的OCR识别时,由于在户型图中数字框的朝向可能不同,如竖直方向的数字框可能朝左、朝右、朝上,事先并不清楚数字的朝向,可将每个待识别的数字框进行旋转得到多个方向的数字框,其中只有一个方向的数字框正确,方向错误的数字框对应的图片输入到OCR模块后,输出的数字也是错误的,计算得到的比例尺值也是错误的,经过后面比例尺水平方向和竖直方向整合计算投票,会将错误的信息过滤掉,得到正确的比例尺值。
在一个实施例中,彩色图像基于ROI的比例尺识别技术整体工作流程如图2所示。首先输入一张彩色户型图(步骤10);然后对彩色图像进行预处理,计算其梯度图,并将梯度图二值化(步骤11),本示例采用梯度图全局阈值进行二值化;对二值图进行像素分布分析,分别按行和按列统计像素数量,提取出比例尺长线ROI区域;然后在图像的局部ROI区域内部进行像素分布分析,提取数字框和比例尺分割点(步骤13);对提取的数字框和比例尺线段进行过滤修正,得到待识别的数字框和比例尺线段(步骤14);对竖直方向的数字框进行旋转,得到多个方向的数字框输入到OCR模块,将数字识别结果结合比例尺线段长度计算得到多个比例尺竖直,综合水平方向和竖直方向的计算结果,过滤掉无效的冗余数值(步骤15),得到最终的比例尺识别结果。
图像的ROI提取流程和结果如图3所示,输入户型图原图及二值图(30),分别按行和按列统计二值图的像素分布(31),按照长线峰值分布规则提取疑似长线(32),长线所在的行或列的像素数量超过设定阈值,具体实施时会同时检测长线的近似长度,长度需超过设定阈值,且长线两侧有像素投影的跳变,根据长线两侧彩色图像素分布对长线进行过滤(33),防止搜索到房间或装饰区域,限定一个方向的长线数量和范围(34),降低计算复杂度,然后将长线向两侧进行扩展形成ROI,长线作为中心线(35),得到户型图的ROI列表。
对于户型图下方ROI二值图的像素分布,如水平方向的ROI,像素分布按列统计,比例尺线段分割点和数字区域在像素分布图上呈现出局部峰值,且位置一一对应。
从ROI中提取数字框的流程如图4所示,对一个ROI的二值图,首先对二值图像素分布进行分析统计(51),统计时可根据配置只统计一列或一行上连续的像素数量,根据阈值提取出疑似数字的列/行的集合D(52),然后将集合D根据列/行的位置进行切分(53),得到数字列/行的子集集合,将每个子集根据位置形成数字框(54),得到当前ROI的数字框列表(55)。对步骤51中的连续像素处理可以提取数字列时根据断裂阈值和连续度进行检测,像素为0的地方表示断开处,设置断裂阈值为5,连续度阈值为10时,局部区域中有3列为非数字列,其他均被识别为数字列。
比例尺分割点的提取与数字框提取的流程类似,区别是分割点搜索时避开数字框所在的列/行,只在剩余的列或行进行搜索,以水平ROI为例,分割点列的连续像素与中心线相交,且连续度超过分割点设定阈值,在二值统计图中分割点呈现局部窄峰值,且所有分割点的窄峰值数值波动不超过阈值,最终得到分割点序列P,利用分割点将ROI的中心线切分成比例尺线段集合S。
数字框和比例尺线段修正流程如图5所示,对输入的数字框列表按照尺寸聚类,将数量和尺寸不符合预设条件的簇去掉,得到尺寸过滤后的数字框列表(61),然后对数字框按照位置进行聚类,水平ROI按照数字框中心所在的行进行聚类,竖直ROI的数字框按照数字框中心所在的列进行聚类,将远离中心线的簇去除,得到位置过滤后的数字框列表(62),然后结合比例尺线段分布,将不在比例尺线段中间的数字框去除(63),同时将没有数字框对应的比例尺线段和有超过一个数字框对应的比例尺线段去除(64),得到最终待识别数字框列表和比例尺线段列表(65)。
将数字框和比例尺线段组成Pair,由于户型图的数字朝向不确定,尤其是竖直方向的数字朝向,将竖直ROI提取的Pair中的数字框进行旋转,对一个竖直方向的数字框分别顺时针旋转90°、180°、270°,加上原始角度共扩展生成4个方向的数字框,结合其对应的比例尺线段形成4个Pair,然后将每个Pair中的数字框输入到OCR模块进行数字识别,由于旋转产生的冗余错误信息将有比例尺综合计算模块进行处理。
数字框和比例尺线段修正流程如图6所示,将所有Pair中的数字框输入到OCR模块识别出数字,结合比例尺线段的长度,计算出每个Pair的比例尺数值v(71),统计水平方向和竖直方向比例尺数值出现的次数,由于比例尺数值是连续的实数,可以量化成整数或根据配置量化成更粗粒度的整数进行统计,获取出现次数最高的比例尺数值vs作为“标准值”(72),分别从水平和竖直方向接近“标准值”的比例尺数值中找到和“标准值”最接近的数值作为“比例尺最终值”(73),判断水平和竖直方向的“比例尺最终值”是否近似相等(74),若二者近似相等,认为比例尺识别成功(75),反之认为比例尺识别失败(76)。
本实施例采用以上技术方案,具有以下技术效果:
具有通用性,对不同风格、色彩的户型图兼容效果较好,在一个网络爬取的532张模式、风格各异的彩色图片库中,比例尺识别准确率达到90%以上,平均每张图片耗时1s以内。
在一个实施例中,参考图7所示,提供一种基于ROI的户型图比例尺识别装置,包括:
第一提取模块110,用于提取户型图的ROI区域;
第二提取模块120,用于在所述ROI区域中提取数字框,根据所述数字框在所述ROI区域中提取比例尺线段;
修正模块130,用于对所述数字框及比例尺线段进行修正;
识别模块140,用于根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信号,根据数字信号确定户型图的比例尺。
关于基于ROI的户型图比例尺识别装置的具体限定可以参见上文中对于基于ROI的户型图比例尺识别方法的限定,在此不再赘述。上述基于ROI的户型图比例尺识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于ROI的户型图比例尺识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
基于如上所述的示例,在一个实施例中还提供一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现如上述各实施例中的任意一种基于ROI的户型图比例尺识别方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机***的存储介质中,并被该计算机***中的至少一个处理器执行,以实现包括如上述基于ROI的户型图比例尺识别方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
据此,在一个实施例中还提供一种计算机存储介质计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如上述各实施例中的任意一种基于ROI的户型图比例尺识别方法。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本申请实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种基于ROI的户型图比例尺识别方法,其特征在于,包括如下步骤:
S110,提取户型图的ROI区域;ROI区域指比例尺标识区域;
S120,在所述ROI区域中提取数字框,根据所述数字框在所述ROI区域中提取比例尺线段;
S130,对所述数字框及比例尺线段进行修正;
S140,根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信息,根据数字信息确定户型图的比例尺;
所述提取户型图的ROI区域包括:
提取户型图的梯度二值化图Ib;
在梯度二值化图Ib中,按照第0行至第h行的顺序搜索梯度二值化图Ib的第一区域的第一初始ROI长线,按照第h行至第0行的顺序搜索梯度二值化图Ib的第二区域的第二初始ROI长线,按照第0列到第w列顺序搜索梯度二值化图Ib的第三区域的第三初始ROI长线,按照第w列到第0列的顺序搜索梯度二值化图Ib的第四区域的第四初始ROI长线;其中,第0行指梯度二值化图Ib的首行,第h行指梯度二值化图Ib的最后一行,第0列指梯度二值化图Ib的首列,第w列指梯度二值化图Ib的最后一列;
提取第一初始ROI长线的有效线,得到第一有效ROI长线,提取第二初始ROI长线的有效线,得到第二有效ROI长线,提取第三初始ROI长线的有效线,得到第三有效ROI长线,提取第四初始ROI长线的有效线,得到第四有效ROI长线;
将第一有效ROI长线分别向首行和末行所在的方向扩展,将第二有效ROI长线分别向首行和末行所在的方向扩展,得到行ROI线,将第三有效ROI长线分别向首列和最后一列所在的方向扩展,将第四有效ROI长线分别向首列和最后一列所在的方向扩展,得到列ROI线,根据所述行ROI线和列ROI线确定户型图的ROI区域。
2.根据权利要求1所述的基于ROI的户型图比例尺识别方法,其特征在于,在所述ROI区域中提取数字框的过程包括:
对行ROI线,按列统计像素分布ci,对列ROI线,统计像素分布ri;ci表示第i列中像素值为255的像素数量,ri表示第i行中像素值为255的像素数量;
提取满足条件ci>dt的列,得到列集合Da={i|ci>dt},提取满足条件ri>dt的行,得到行集合Db={i|ri>dt},根据列集合Da和行集合Db确定候选数字列集合D;其中dt为数字尺寸高度阈值;
对候选数字列及数字行集合D进行切分,得到多个子集,确定各个子集分别对应数字框Bk;其中切分条件包括:max(Di)-min(Di)>dw,min(Dk)-max(Dk-1)>dgap,dw表示数字宽度阈值,dgap表示两个相邻的数字框间距阈值,max(Di)表示子集Di中最大的列序号或行序号,min(Di)表示子集Di中最小的列序号或行序号,min(Dk)表示子集Dk中最小的列序号或行序号,max(Dk-1)表示子集Dk-1中最大的列序号或行序号。
4.根据权利要求1至3任一项所述的基于ROI的户型图比例尺识别方法,其特征在于,对所述数字框及比例尺线段进行修正包括:
对数字框按尺寸聚类,得到多个第一数字框簇,去除掉存在数字框数量小于数量阈值、和/或数字框尺寸不在预设尺寸范围内的第一数字框簇;
对剩余的第一数字框簇的数字框按照位置聚类,得到多个第二数字框簇,去除掉与中心线之间的距离超过距离阈值的第二数字框簇,将剩余的第二数字框簇中的数字框确定为目标数字框;
剔除掉没有目标数字框对应的比例尺线段,以及不在比例尺线段中间位置的目标数字框。
5.根据权利要求1至3任一项所述的基于ROI的户型图比例尺识别方法,其特征在于,对修正后的数字框进行OCR识别,得到数字框对应的数字信息,根据数字信息确定户型图的比例尺包括:
采用一个训练好的神经网络模型将修正后的数字框对应的图片翻译成数字信息;
根据数字信息和数字信息对应的比例尺线段,计算数字信息对应的比例尺;
统计行方向和列方向的比例尺的值出现次数,将行方向出现次数最高的比例尺值确定为行标准值,将列方向出现次数最高的比例尺值确定为列标准值,根据行标准值和列标准值确定户型图的比例尺。
6.根据权利要求5所述的基于ROI的户型图比例尺识别方法,其特征在于,还包括:
若行标准值和列标准值相等,判定户型图水平方向和竖直方向的比例尺一致,否则,判定户型图的比例尺无效。
7.一种基于ROI的户型图比例尺识别装置,其特征在于,包括:
第一提取模块,用于提取户型图的ROI区域;ROI区域指比例尺标识区域;
第二提取模块,用于在所述ROI区域中提取数字框,根据所述数字框在所述ROI区域中提取比例尺线段;
修正模块,用于对所述数字框及比例尺线段进行修正;
识别模块,用于根据修正后的比例尺线段对修正后的数字框进行OCR识别,得到数字框对应的数字信息,根据数字信息确定户型图的比例尺;
所述提取户型图的ROI区域包括:
提取户型图的梯度二值化图Ib;
在梯度二值化图Ib中,按照第0行至第h行的顺序搜索梯度二值化图Ib的第一区域的第一初始ROI长线,按照第h行至第0行的顺序搜索梯度二值化图Ib的第二区域的第二初始ROI长线,按照第0列到第w列顺序搜索梯度二值化图Ib的第三区域的第三初始ROI长线,按照第w列到第0列的顺序搜索梯度二值化图Ib的第四区域的第四初始ROI长线;其中,第0行指梯度二值化图Ib的首行,第h行指梯度二值化图Ib的最后一行,第0列指梯度二值化图Ib的首列,第w列指梯度二值化图Ib的最后一列;
提取第一初始ROI长线的有效线,得到第一有效ROI长线,提取第二初始ROI长线的有效线,得到第二有效ROI长线,提取第三初始ROI长线的有效线,得到第三有效ROI长线,提取第四初始ROI长线的有效线,得到第四有效ROI长线;
将第一有效ROI长线分别向首行和末行所在的方向扩展,将第二有效ROI长线分别向首行和末行所在的方向扩展,得到行ROI线,将第三有效ROI长线分别向首列和最后一列所在的方向扩展,将第四有效ROI长线分别向首列和最后一列所在的方向扩展,得到列ROI线,根据所述行ROI线和列ROI线确定户型图的ROI区域。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1所述的基于ROI的户型图比例尺识别方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1所述的基于ROI的户型图比例尺识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010031972.2A CN111222508B (zh) | 2020-01-13 | 2020-01-13 | 基于roi的户型图比例尺识别方法、装置、计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010031972.2A CN111222508B (zh) | 2020-01-13 | 2020-01-13 | 基于roi的户型图比例尺识别方法、装置、计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111222508A CN111222508A (zh) | 2020-06-02 |
CN111222508B true CN111222508B (zh) | 2022-08-12 |
Family
ID=70828258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010031972.2A Active CN111222508B (zh) | 2020-01-13 | 2020-01-13 | 基于roi的户型图比例尺识别方法、装置、计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111222508B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814619A (zh) * | 2020-06-28 | 2020-10-23 | 北京比邻弘科科技有限公司 | 一种户型图的比例尺值获取方法 |
CN113112514B (zh) * | 2021-04-27 | 2024-05-17 | 汇鸿智能科技(辽宁)有限公司 | Ai识别石墨大小的方法、装置、计算机设备及存储介质 |
CN113392455B (zh) * | 2021-06-11 | 2024-06-25 | 百安居信息技术(上海)有限公司 | 基于深度学习的户型图比例尺检测方法、装置及电子设备 |
CN114882306B (zh) * | 2022-04-06 | 2023-08-18 | 国家基础地理信息中心 | 地形图比例尺鉴别方法、装置、存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763606A (zh) * | 2018-03-12 | 2018-11-06 | 江苏艾佳家居用品有限公司 | 一种基于机器视觉的户型图元素自动提取方法与*** |
CN109993166A (zh) * | 2019-04-03 | 2019-07-09 | 同济大学 | 基于刻度查找的指针式仪表读数自动识别方法 |
CN110111298A (zh) * | 2019-03-16 | 2019-08-09 | 平安城市建设科技(深圳)有限公司 | 智能户型尺寸验证方法、装置、设备及可读存储介质 |
CN110414477A (zh) * | 2019-08-06 | 2019-11-05 | 广东三维家信息科技有限公司 | 图像比例尺检测方法及装置 |
-
2020
- 2020-01-13 CN CN202010031972.2A patent/CN111222508B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763606A (zh) * | 2018-03-12 | 2018-11-06 | 江苏艾佳家居用品有限公司 | 一种基于机器视觉的户型图元素自动提取方法与*** |
CN110111298A (zh) * | 2019-03-16 | 2019-08-09 | 平安城市建设科技(深圳)有限公司 | 智能户型尺寸验证方法、装置、设备及可读存储介质 |
CN109993166A (zh) * | 2019-04-03 | 2019-07-09 | 同济大学 | 基于刻度查找的指针式仪表读数自动识别方法 |
CN110414477A (zh) * | 2019-08-06 | 2019-11-05 | 广东三维家信息科技有限公司 | 图像比例尺检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111222508A (zh) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111222508B (zh) | 基于roi的户型图比例尺识别方法、装置、计算机设备 | |
US9349062B2 (en) | Character recognition method and device | |
CN108171104B (zh) | 一种文字检测方法及装置 | |
JP4976608B2 (ja) | 画像をイベントに自動的に分類する方法 | |
CN102426647B (zh) | 一种台标识别的方法、装置 | |
US9311533B2 (en) | Device and method for detecting the presence of a logo in a picture | |
CN107590447A (zh) | 一种文字标题识别方法及装置 | |
EP2034426A1 (en) | Moving image analyzing, method and system | |
CN101122953A (zh) | 一种图片文字分割的方法 | |
US10169673B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
CN108268823A (zh) | 目标再识别方法和装置 | |
US11074443B2 (en) | Method and device for acquiring slant value of slant image, terminal and storage medium | |
CN110765903A (zh) | 行人重识别方法、装置及存储介质 | |
CN110378351B (zh) | ***鉴别方法及装置 | |
CN109145906B (zh) | 目标对象的图像确定方法、装置、设备及存储介质 | |
CN111275040A (zh) | 定位方法及装置、电子设备、计算机可读存储介质 | |
CN110807457A (zh) | Osd字符识别方法、装置及存储装置 | |
CN114494775A (zh) | 视频切分方法、装置、设备及存储介质 | |
CN110472561B (zh) | 足球进球类型识别方法、装置、***及存储介质 | |
CN113840135B (zh) | 色偏检测方法、装置、设备及存储介质 | |
CN111160107A (zh) | 一种基于特征匹配的动态区域检测方法 | |
CN107832732B (zh) | 基于三叉树遍历的车道线检测方法 | |
JP5027201B2 (ja) | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム | |
CN106156774A (zh) | 影像处理方法及影像处理*** | |
JP4967045B2 (ja) | 背景判別装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 211100 floor 5, block a, China Merchants high speed rail Plaza project, No. 9, Jiangnan Road, Jiangning District, Nanjing, Jiangsu (South Station area) Applicant after: JIANGSU AIJIA HOUSEHOLD PRODUCTS Co.,Ltd. Address before: 211100 No. 18 Zhilan Road, Science Park, Jiangning District, Nanjing City, Jiangsu Province Applicant before: JIANGSU AIJIA HOUSEHOLD PRODUCTS Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |