CN111625549A - 一种不动产登记空间数据户落幢快速模糊匹配方法 - Google Patents

一种不动产登记空间数据户落幢快速模糊匹配方法 Download PDF

Info

Publication number
CN111625549A
CN111625549A CN202010356805.5A CN202010356805A CN111625549A CN 111625549 A CN111625549 A CN 111625549A CN 202010356805 A CN202010356805 A CN 202010356805A CN 111625549 A CN111625549 A CN 111625549A
Authority
CN
China
Prior art keywords
house
similarity
data
graph
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010356805.5A
Other languages
English (en)
Other versions
CN111625549B (zh
Inventor
黄锦丞
朱江洪
刘越岩
王宇
宫子强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202010356805.5A priority Critical patent/CN111625549B/zh
Publication of CN111625549A publication Critical patent/CN111625549A/zh
Application granted granted Critical
Publication of CN111625549B publication Critical patent/CN111625549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供了一种不动产登记空间数据户落幢快速模糊匹配方法,包括:首先数据获取,然后进行数据预处理,最后进行数据处理,即要素模糊匹配;对各分层分户图分别进行快速匹配关联。本发明的有益效果是:本发明所提出的技术方案通过快速模糊匹配模型匹配分层分户图与房产管理空间数据集的自然幢基底外轮廓,将地理位置信息不详的分层分户图与房产登记空间数据集进行快速匹配关联,在保证精度的前提下,提高效率,降低时间成本和人力成本。

Description

一种不动产登记空间数据户落幢快速模糊匹配方法
技术领域
本发明涉及计算机图形匹配技术领域,尤其涉及一种不动产登记空间数据户落幢快速模糊匹配方法。
背景技术
依据国家出台的不动产统一登记相关通知及技术标准,各地区政府开展收集现存的不动产登记空间数据资料,着手构建科学可行的不动产登记数据清理整合技术方法,形成“宗落地、幢落宗、户落幢、证归户”的不动产登记空间数据关联模式。由于历史原因现有房产信息囊括房屋权属信息和房屋测量信息,归属于房屋测量信息的房屋位置坐落信息随着近年来街道的分离与合并、街道名称改变而不再准确或者缺失,无法与原房产登记空间数据集匹配。为满足信息时代社会高速发展的需要,配合不动产确权登记发证,需将房产登记簿册中未进行图库管理的分层分户图与房产登记空间数据集中的房屋测量信息、地理位置信息进行匹配,完成户落幢的不动产登记空间数据与权属信息关联,形成一个完整统一且内部有联系的不动产登记数据库。
目前,对于房屋测量信息的房屋位置坐落信息发生变更的房屋数据查找其现地址比较常见的方法为人工目视识别匹配,需要工作人员在其行政辖区内将其原有分层分户图纸与现有房产登记空间数据集进行人工比对,此项工作需要耗费大量时间和人力,因此实现不动产户落幢空间数据自动化匹配具有极强的现实意义。
发明内容
为了解决上述问题,本发明提供了一种不动产登记空间数据户落幢快速模糊匹配方法;包括以下步骤:
S101:数据获取;包括:获取现有的分层分户图、房产登记空间数据集及地名地址信息;
S102:数据预处理;筛选出无法与地址名数据库中的地址信息进行关联的分层分户图,并将筛选出的无法关联地名信息的分层分户图进行矢量化处理,得到各分层分户图的形状指数SI、狭长度AR、房屋面积S、楼层数N及所属辖区;
并根据各分层分户图的所属辖区,从房产登记空间数据集中提取出各分层分户图所属辖区内的所有房屋数据作为各分层分户图要素匹配阶段的待匹配对象,同时设置误差容许范围Δ;
S103:数据处理,即要素模糊匹配;对各分层分户图分别进行快速匹配关联:将各分层分户图中房屋的房屋面积S、楼层数N、形状指数SI和狭长度AR作为相似度因子E逐个进行相似度计算。
进一步地,步骤S102中,在ArcGIS软件中自动计算出各分层分户图对应矢量图形的形状指数SI和狭长度AR,并提取出房屋面积S、楼层数N以及房屋所属辖区。
进一步地,步骤S103中,将各分层分户图中房屋的房屋面积S、楼层数N、形状指数SI和狭长度AR作为相似度因子E逐个进行相似度计算,包括5个阶段,依次为:面积相似度匹配、楼层数相似度匹配、形状相似度匹配、狭长度相似度匹配和总相似度匹配。
进一步地,步骤S103中,针对某无法关联地址信息的分层分户图,具体要素模糊匹配方法如下:
S1阶段,面积相似度匹配:提取房产登记空间数据集中该分层分户图所属辖区内的所有房屋数据,作为该分层分户图的第一待匹配房屋数据集;并根据下式计算提取的各房屋数据与该分层分户图之间的面积相似度SFS
Figure BDA0002473741290000021
上式中,S1为无法管理地址信息的分层分户图的房屋面积,S2为房产登记空间数据集中该分层分户图所属辖区内的房屋数据的房屋面积;房屋面积的计算公式如下:
Figure BDA0002473741290000022
其中,(Xk,Yk)为构成矢量图形的第k个转折点的坐标;k=1,2,...,n,表示构成矢量图形的第1至第n个转折点坐标;n为矢量图形转折点总个数;
遍历该分层分户图所属辖区内的所有房屋数据,得到该分层分户图所属辖区内的各房屋数据与该分层分户图的房屋之间的面积相似度,并保留面积相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第二待匹配房屋数据集,参与S2阶段的匹配;剔除面积相似度不在误差容许范围Δ内的房屋数据;
S2阶段,楼层数相似度匹配:根据下式计算第二待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的楼层相似度SFF
Figure BDA0002473741290000031
上式中,F1为该分层分户图中房屋的楼层数,F2为第二待匹配房屋数据集中的房屋数据的楼层数;
遍历第二待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第二待匹配房屋数据集中的各房屋数据之间的楼层数相似度,并保留楼层数相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第三待匹配房屋数据集,参与S3阶段的匹配;剔除楼层数相似度不在误差容许范围Δ内的房屋数据;
S3阶段,形状相似度匹配:根据下式计算第三待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的形状相似度SFSI
Figure BDA0002473741290000032
上式中,SI1为该分层分户图中房屋的形状指数,SI2为第三待匹配房屋数据集中的房屋数据的形状指数;形状指数SI(Shape Index)的计算公式如下:
Figure BDA0002473741290000033
Figure BDA0002473741290000034
上式中,L为矢量图形的周长,S为矢量图形的面积;(Xi,Yi)为构成矢量图形的第i个转折点的坐标;n为矢量图形转折点总个数;
遍历第三待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第三待匹配房屋数据集中的各房屋数据之间的形状相似度,并保留形状相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第四待匹配房屋数据集,参与S4阶段的匹配;剔除形状相似度不在误差容许范围Δ内的房屋数据;
S4阶段,狭长度相似度匹配:根据下式计算第四待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的狭长度相似度SFAR
Figure BDA0002473741290000041
上式中,AR1为该分层分户图中房屋的狭长度,AR2为第四待匹配房屋数据集中的房屋数据的狭长度;狭长度的计算公式如下:
Figure BDA0002473741290000042
上式中,AR(Aspect Ratio)为狭长度,即矢量图形的最小外接矩形的长宽比;L为矢量图形的最小外接矩形的长,W为矢量图形的最小外接矩形的宽;
遍历第四待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第四待匹配房屋数据集中的各房屋数据之间的狭长度相似度,并保留狭长度相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第五待匹配房屋数据集,参与S5阶段的匹配;剔除狭长度相似度不在误差容许范围Δ内的房屋数据;
S5阶段,总相似度匹配:根据下式计算第五待匹配房屋数据集中各房屋数据与该分层分户图中的房屋之间的总相似度SM:
Figure BDA0002473741290000043
上式中,n=4,为相似度因子的总个数;Ai为第i个相似度因子对应的权重系数,为预设值,SFi为第i个相似度因子对应的相似度;i=1,2,3,4,分别对应房屋面积、楼层数、形状指数和狭长度四个相似度因子;
遍历第五待匹配房屋数据集中所有的房屋数据,得到该分层分户图中的房屋与第五待匹配房屋数据集中各房屋数据之间的总相似度,并将所有总相似度进行从大到小的排序,选取总相似度值最大的房屋数据作为该分层分户图的要素模糊匹配结果。
进一步地,若第五待匹配房屋数据库中仅有一个房屋数据,则将该房屋数据作为该分层分户图的要素模糊匹配结果。
进一步地,数据处理还包括:数据输出阶段,技术人员根据所述要素模糊匹配结果查阅相关档案确定对应分层分户图中的房屋坐落并进行外业调查核实坐落信息后,最终将要素模糊匹配结果整理录入不动产登记数据库。
步骤S102中,误差容许范围Δ为[0.9,1.1]。
本发明提供的技术方案带来的有益效果是:本发明所提出的技术方案通过快速模糊匹配模型匹配分层分户图与房产登记空间数据集的自然幢基底外轮廓,在保证匹配精度的前提下,将地理位置信息不详的地理位置信息的分层分户图与房产登记空间数据集进行快速匹配关联,提高工作效率,降低时间成本和人力成本。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例中一种不动产登记空间数据户落幢快速模糊匹配方法的流程图;
图2是本发明实施例中一种不动产登记空间数据户落撞快速模糊匹配方法的详细流程示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
本发明的实施例提供了一种不动产登记空间数据户落幢快速模糊匹配方法;请参考图1,图1是本发明实施例中一种不动产登记空间数据户落幢快速模糊匹配方法的流程图,具体包括如下步骤:
S101:数据获取;包括:获取现有的分层分户图、房产登记空间数据集及地名地址信息;
S102:数据预处理;筛选出无法与地名地址信息进行关联的分层分户图,并将筛选出的无法关联地名信息的分层分户图进行矢量化处理,得到各分层分户图的形状指数SI(Shape Index)、狭长度AR(Aspect Ratio)、房屋面积S、楼层数N及所属辖区;
并根据各分层分户图的所属辖区,从房产登记空间数据集中提取出各分层分户图所属辖区内的所有房屋数据作为各分层分户图要素匹配阶段的待匹配对象,同时设置误差容许范围Δ为[0.9,1.1];
S103:数据处理,即要素模糊匹配;对各分层分户图分别进行快速匹配关联:将各分层分户图中房屋的房屋面积S、楼层数N、形状指数SI和狭长度AR作为相似度因子E逐个进行相似度计算,包括5个阶段,依次为:面积相似度匹配、楼层数相似度匹配、形状相似度匹配、狭长度相似度匹配和总相似度匹配。
步骤S102中,在ArcGIS软件中自动计算出各分层分户图对应矢量图形的形状指数SI和狭长度AR,并提取出房屋面积S、楼层数N以及房屋所属辖区。
如图2所示,为本发明实施例中一种不动产登记空间数据户撞快速模糊匹配方法的详细流程示意图;步骤S103中,针对某无法关联地址信息的分层分户图,具体要素模糊匹配方法如下:
S1阶段,面积相似度匹配:提取房产登记空间数据集中该分层分户图所属辖区内的所有房屋数据,作为该分层分户图的第一待匹配房屋数据集;并根据下式计算提取的各房屋数据与该分层分户图之间的面积相似度SFS
Figure BDA0002473741290000061
上式中,S1为无法管理地名信息的分层分户图的房屋面积,S2为房产登记空间数据集中该分层分户图所属辖区内的房屋数据的房屋面积;房屋面积的计算公式如下:
Figure BDA0002473741290000062
其中,(Xk,Yk)为构成矢量图形的第k个转折点的坐标;k=1,2,...,n,表示构成矢量图形的第1至第n个转折点坐标;n为矢量图形转折点总个数;
遍历该分层分户图所属辖区内的所有房屋数据,得到该分层分户图所属辖区内的各房屋数据与该分层分户图的房屋之间的面积相似度,并保留面积相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第二待匹配房屋数据集,参与S2阶段的匹配;剔除面积相似度不在误差容许范围Δ内的房屋数据;
S2阶段,楼层数相似度匹配:根据下式计算第二待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的楼层相似度SFF
Figure BDA0002473741290000063
上式中,F1为该分层分户图中房屋的楼层数,F2为第二待匹配房屋数据集中的房屋数据的楼层数;分层分户图与房产登记空间数据集的楼层属性也有可能会存在不一致的情况,故需对楼层数设置误差容许范围Δ。在特征数提取的基础上,遍历所有的楼层字段,然后判断房产登记空间数据集的楼层数是否在误差容许范围内,是则为真,保留所选记录并将结果输出,否则为假,删除所选记录:
遍历第二待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第二待匹配房屋数据集中的各房屋数据之间的楼层数相似度,并保留楼层数相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第三待匹配房屋数据集,参与S3阶段的匹配;剔除楼层数相似度不在误差容许范围Δ内的房屋数据;
S3阶段,形状相似度匹配:根据下式计算第三待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的形状相似度SFSI
Figure BDA0002473741290000071
上式中,SI1为该分层分户图中房屋的形状指数,SI2为第三待匹配房屋数据集中的房屋数据的形状指数;形状指数SI(Shape Index)的计算公式如下:
Figure BDA0002473741290000072
Figure BDA0002473741290000073
上式中,L为矢量图形的周长,S为矢量图形的面积;(Xi,Yi)为构成矢量图形的第i个转折点的坐标;n为矢量图形转折点总个数;SI越接近1,则表明分层分户图对应的多边形与标准形状的偏离程度越小,反之则形状越复杂,SFSI越接近1,则表明两个多边形相似度也就越高。测量仪器的差别、测量标准的不一致等原因,会造成测量的误差,在绘图时也会出现房产图不完全一致的情况,例如阳台、垃圾道的有无等,这些绘图的差异会对整体面积造成一定的影响,为了消除误差,故需设置误差容许范围。首先分别计算分层分户图与房产登记空间数据集中图形的周长L与面积S,代入公式计算出各自的形状指数,然后判断房产登记空间数据集的SFSI是否在误差容许范围内,不在为假则删除所选记录,反之则保留记录。
遍历第三待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第三待匹配房屋数据集中的各房屋数据之间的形状相似度,并保留形状相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第四待匹配房屋数据集,参与S4阶段的匹配;剔除形状相似度不在误差容许范围Δ内的房屋数据;
S4阶段,狭长度相似度匹配:根据下式计算第四待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的狭长度相似度SFAR
Figure BDA0002473741290000081
上式中,AR1为该分层分户图中房屋的狭长度,AR2为第四待匹配房屋数据集中的房屋数据的狭长度;狭长度的计算公式如下:
Figure BDA0002473741290000082
上式中,AR(Aspect Ratio)为狭长度,即矢量图形的最小外接矩形的长宽比;L为矢量图形的最小外接矩形的长,W为矢量图形的最小外接矩形的宽;
遍历第四待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第四待匹配房屋数据集中的各房屋数据之间的狭长度相似度,并保留狭长度相似度在误差容许范围Δ内的所有房屋数据;剔除狭长度相似度不在误差容许范围Δ内的房屋数据;
分层分户图在测绘时,图纸上标注的正北方向并非都是统一向上,因此造成房屋的正北方向在图纸上的标注不一致,在矢量提取时,由于无法分辨图纸标注的方向,故提取出来的图形在方向上不一定是正确的,可以将部分图形看作经过一定角度旋转而成的结果。为了消除这种图形旋转所带来的匹配误差,选择多边形狭长度作为相似度因子,该相似度因子具有旋转不变性,一个图形不论如何旋转,只要不改变大致的形状,其狭长度就是一个固定的值,能够很好地满足模型精度的需要。首先,计算各个图形的中心点,并使所有坐标点以中心点为原点进行旋转,在旋转过程中计算其外接矩形的面积,直到外接矩形的面积最小,此时的外接矩形就是最小外接矩形,然后,通过计算最小外接矩形的长宽比,判断房产登记空间数据集中的长宽比是否在误差容许范围内,不在为假则删除所选记录,反之则保留记录。
S5阶段,总相似度匹配:为防止出现历史分层分户图和房产登记空间数据集之间由于绘图标准不一致存在的图形数据差异,在保证精度的前提下,为尽可能提升运算速度,选取的四个参数作为相似度因子E,通过比对分层分户图和房产登记空间数据集之间的相似度因子E,计算它们之间的相似度,其权重配比按照各个相似度因子在模型中所做贡献的重要程度进行分配,根据下式计算模型匹配的总相似度SM:
Figure BDA0002473741290000091
上式中,n=4,为相似度因子的总个数;Ai为第i个相似度因子对应的权重系数,为预设值,SFi为第i个相似度因子对应的相似度;i=1,2,3,4,分别对应房屋面积、楼层数、形状指数和狭长度四个相似度因子;
遍历第五待匹配房屋数据集中所有的房屋数据,得到该分层分户图中的房屋与第五待匹配房屋数据集中各房屋数据之间的总相似度,并将所有总相似度进行从大到小的排序,选取总相似度值最大的房屋数据作为该分层分户图的要素模糊匹配结果。若第五待匹配房屋数据集中仅有一个房屋数据,则将该房屋数据作为该分层分户图的要素模糊匹配结果。
最后,数据输出阶段,技术人员根据所述要素模糊匹配结果查阅相关档案确定对应分层分户图中的房屋坐落并进行外业调查核实坐落信息后,最终将要素模糊匹配结果整理录入不动产空间数据库。
本发明实施例中,分别对九份实验数据进行快速模糊匹配,通过对比模型在九个实验数据中的运行表现情况,对其精度与效率方面进行评价。
为了模型的精准性,提高模型的运行效率,本模型先将误差容许范围分设为5个范围,以第五份数据作为实验数据,实验结果如表1所示,由表1可以看出,模型匹配的准确率是一个先升后降的过程,误差容许范围过大时,匹配的正确率会缓慢下降,匹配结果里开始出现不正确的图形,而当误差容许范围过小时,匹配的正确率会骤然下降,这是由于本模型是模糊匹配模型,而非精准匹配模型,图形与图形之间存在着一定的误差,无法做到完全精准匹配,只能对其相似度进行衡量。根据表1所示结果,本发明实施例中选取0.9-1.1作为本次模型的误差容许范围,不仅有着极高的正确率,同时匹配所耗费的时间也是相对较少的,满足模型的精度和效率需求。
表1快速模糊匹配误差容许范围查询结果
Tab 1 Fast Fuzzy Matching Error Tolerance Range Query Results
Figure BDA0002473741290000092
Figure BDA0002473741290000101
对九份数据的分层分户图,在各自对应的房产登记空间数据集中进行查询匹配,九份分层分户图数据的形状差异很大,均为不规则几何图形,快速模糊匹配查询结果如表2所示,为了更好地反映快速模糊匹配模型的运行情况,九份数据的匹配数量皆为不同。快速模糊匹配模型在九份数据中运行的情况良好,相似度按照五级分类的标准,以20%为等间区间,分别为低、较低、中、较高以及高。本次匹配的相似度均在70%以上,其中平均匹配相似度为82.186%,属于高相似度类别。
表2快速模糊匹配查询结果
Tab 2 Fast Fuzzy Matching Query Results
Figure BDA0002473741290000102
在精度匹配方面,如表3所示,误差容许范围设为0.9-1.1,九份数据的选取数和实际结果完全一致,匹配结果均达到了100%的准确率,完全满足模型对精度方面的需求,为以后的不动产登记空间数据清理做好了数据关联的基础工作。
在匹配效率方面,九份数据完成一次匹配所耗费的平均时间为16.8208s,而人工匹配,匹配一份数据所耗费的时间为1天左右,相比于人工匹配,计算机自动化匹配更为迅捷便利。
表3快速模糊匹配精度与效率查询结果
Tab 4.3 Query Results of Fast Fuzzy Matching Accuracy and Efficiency
Figure BDA0002473741290000103
Figure BDA0002473741290000111
请参考图2,图2是本发明实施例中基于python实现的流程示意图。
本发明的有益效果是:本发明所提出的技术方案通过快速模糊匹配模型匹配分层分户图与房产登记空间数据集的自然幢基底外轮廓,在保证匹配精度的前提下,将缺失具体地理位置信息的分层分户图与房产登记空间数据集进行快速匹配关联,提高效率,减少人工劳动力。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种不动产登记空间数据户落幢快速模糊匹配方法,其特征在于:包括以下步骤:
S101:数据获取;包括:获取现有的分层分户图、房产登记空间数据集及地名地址信息;
S102:数据预处理;筛选出无法与地名地址信息中的地址信息进行关联的分层分户图,并将筛选出的无法关联地名信息的分层分户图进行矢量化处理,得到各分层分户图的形状指数SI、狭长度AR、房屋面积S、楼层数N及所属辖区;
并根据各分层分户图的所属辖区,从房产登记空间数据集中提取出各分层分户图所属辖区内的所有房屋数据作为各分层分户图要素匹配阶段的待匹配对象,同时设置误差容许范围Δ;
S103:数据处理,即要素模糊匹配;对各分层分户图分别进行快速匹配关联:将各分层分户图中房屋的房屋面积S、楼层数N、形状指数SI和狭长度AR作为相似度因子E逐个进行相似度计算。
2.如权利要求1所述的一种不动产登记空间数据户落幢快速模糊匹配方法,其特征在于:步骤S102中,在ArcGIS软件中自动计算出各分层分户图对应矢量图形的形状指数SI和狭长度AR,并提取出房屋面积S、楼层数N以及房屋所属辖区。
3.如权利要求1所述的一种不动产登记空间数据户落幢快速模糊匹配方法,其特征在于:步骤S103中,将各分层分户图中房屋的房屋面积S、楼层数N、形状指数SI和狭长度AR作为相似度因子E逐个进行相似度计算,包括5个阶段,依次为:面积相似度匹配、楼层数相似度匹配、形状相似度匹配、狭长度相似度匹配和总相似度匹配。
4.如权利要求1所述的一种不动产登记空间数据户落幢快速模糊匹配方法,其特征在于:步骤S103中,针对某无法关联地名信息的分层分户图,具体要素模糊匹配方法如下:
S1阶段,面积相似度匹配:提取房产登记空间数据集中该分层分户图所属辖区内的所有房屋数据,作为该分层分户图的第一待匹配房屋数据集;并根据下式计算提取的各房屋数据与该分层分户图之间的面积相似度SFS
Figure FDA0002473741280000021
上式中,S1为无法管理地址信息的分层分户图的房屋面积,S2为房产登记空间数据集中该分层分户图所属辖区内的房屋数据的房屋面积;房屋面积的计算公式如下:
Figure FDA0002473741280000022
其中,(Xk,Yk)为构成矢量图形的第k个转折点的坐标;k=1,2,...,n,表示构成矢量图形的第1至第n个转折点坐标;n为矢量图形转折点总个数;
遍历该分层分户图所属辖区内的所有房屋数据,得到该分层分户图所属辖区内的各房屋数据与该分层分户图的房屋之间的面积相似度,并保留面积相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第二待匹配房屋数据集,参与S2阶段的匹配;剔除面积相似度不在误差容许范围Δ内的房屋数据;
S2阶段,楼层数相似度匹配:根据下式计算第二待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的楼层相似度SFF
Figure FDA0002473741280000023
上式中,F1为该分层分户图中房屋的楼层数,F2为第二待匹配房屋数据集中的房屋数据的楼层数;
遍历第二待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第二待匹配房屋数据集中的各房屋数据之间的楼层数相似度,并保留楼层数相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第三待匹配房屋数据集,参与S3阶段的匹配;剔除楼层数相似度不在误差容许范围Δ内的房屋数据;
S3阶段,形状相似度匹配:根据下式计算第三待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的形状相似度SFSI
Figure FDA0002473741280000024
上式中,SI1为该分层分户图中房屋的形状指数,SI2为第三待匹配房屋数据集中的房屋数据的形状指数;形状指数SI(Shape Index)的计算公式如下:
Figure FDA0002473741280000031
Figure FDA0002473741280000032
上式中,L为矢量图形的周长,S为矢量图形的面积;(Xi,Yi)为构成矢量图形的第i个转折点的坐标;n为矢量图形转折点总个数;
遍历第三待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第三待匹配房屋数据集中的各房屋数据之间的形状相似度,并保留形状相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第四待匹配房屋数据集,参与S4阶段的匹配;剔除形状相似度不在误差容许范围Δ内的房屋数据;
S4阶段,狭长度相似度匹配:根据下式计算第四待匹配房屋数据集中的各房屋数据与该分层分户图中的房屋之间的狭长度相似度SFAR
Figure FDA0002473741280000033
上式中,AR1为该分层分户图中房屋的狭长度,AR2为第四待匹配房屋数据集中的房屋数据的狭长度;狭长度的计算公式如下:
Figure FDA0002473741280000034
上式中,AR(Aspect Ratio)为狭长度,即矢量图形的最小外接矩形的长宽比;L为矢量图形的最小外接矩形的长,W为矢量图形的最小外接矩形的宽;
遍历第四待匹配房屋数据集中的所有房屋数据,得到该分层分户图中的房屋与第四待匹配房屋数据集中的各房屋数据之间的狭长度相似度,并保留狭长度相似度在误差容许范围Δ内的所有房屋数据,作为该分层分户图的第五待匹配房屋数据集,参与S5阶段的匹配;剔除狭长度相似度不在误差容许范围Δ内的房屋数据;
S5阶段,总相似度匹配:根据下式计算第五待匹配房屋数据集中各房屋数据与该分层分户图中的房屋之间的最终相似度SM:
Figure FDA0002473741280000035
上式中,n=4,为相似度因子的总个数;Ai为第i个相似度因子对应的权重系数,为预设值,SFi为第i个相似度因子对应的相似度;i=1,2,3,4,分别对应房屋面积、楼层数、形状指数和狭长度四个相似度因子;
遍历第五待匹配房屋数据库中所有的房屋数据,得到该分层分户图中的房屋与第五待匹配房屋数据集中各房屋数据之间的总相似度,并将所有总相似度进行从大到小的排序,选取总相似度值最大的房屋数据作为该分层分户图的要素模糊匹配结果。
5.如权利要求4所述的一种不动产登记空间数据户落幢快速模糊匹配方法,其特征在于:若第五待匹配房屋数据集中仅有一个房屋数据,则将该房屋数据作为该分层分户图的要素模糊匹配结果。
6.如权利要求4所述的一种不动产登记空间数据户落幢快速模糊匹配方法,其特征在于:数据处理还包括:数据输出阶段,技术人员根据所述要素模糊匹配结果查阅相关档案确定对应分层分户图中的房屋坐落并进行外业调查核实坐落信息后,最终,在不动产登记数据库中将不动产登记权属信息与自然幢数据关联。
7.如权利要求1所述的一种不动产登记空间数据户落幢快速模糊匹配方法,其特征在于:步骤S102中,误差容许范围Δ为[0.9,1.1]。
CN202010356805.5A 2020-04-29 2020-04-29 一种不动产登记空间数据户落幢快速模糊匹配方法 Active CN111625549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010356805.5A CN111625549B (zh) 2020-04-29 2020-04-29 一种不动产登记空间数据户落幢快速模糊匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010356805.5A CN111625549B (zh) 2020-04-29 2020-04-29 一种不动产登记空间数据户落幢快速模糊匹配方法

Publications (2)

Publication Number Publication Date
CN111625549A true CN111625549A (zh) 2020-09-04
CN111625549B CN111625549B (zh) 2023-09-22

Family

ID=72260615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010356805.5A Active CN111625549B (zh) 2020-04-29 2020-04-29 一种不动产登记空间数据户落幢快速模糊匹配方法

Country Status (1)

Country Link
CN (1) CN111625549B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114118285A (zh) * 2021-12-01 2022-03-01 深圳须弥云图空间科技有限公司 建筑数据匹配方法、装置及电子设备
CN116089541A (zh) * 2022-12-21 2023-05-09 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) 一种海量不动产登记数据异常识别方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001034736A (ja) * 1999-07-21 2001-02-09 Suehiro Era 地図作成管理システムおよび家屋図作成管理システム
JP2002236720A (ja) * 2001-02-13 2002-08-23 Ben System:Kk 建築データ管理システム
US20040098269A1 (en) * 2001-02-05 2004-05-20 Mark Wise Method, system and apparatus for creating and accessing a hierarchical database in a format optimally suited to real estate listings
CN105069718A (zh) * 2015-07-27 2015-11-18 华南师范大学 基于移动物联网的智慧国土不动产自助监测方法和***
FR3033910A1 (fr) * 2015-03-17 2016-09-23 Magilog Sas Procede de localisation de biens immobiliers recherches a partir de donnees cadastrales
CN106204358A (zh) * 2016-06-30 2016-12-07 广东新禾道信息科技有限公司 不动产统一登记信息管理***
CN108153917A (zh) * 2018-01-31 2018-06-12 福州市勘测院 一种可视化定义人地房关系的不动产调查建库方法
CN108427714A (zh) * 2018-02-02 2018-08-21 北京邮电大学 基于机器学习的房源重复记录识别方法及***
CN109460446A (zh) * 2019-01-29 2019-03-12 江苏省测绘工程院 一种房产宗地的整合方法
CN109816767A (zh) * 2017-11-17 2019-05-28 南京国图信息产业有限公司 一种基于正切空间的三维楼盘模型房屋分层分户图模糊匹配方法
CN109886844A (zh) * 2019-03-21 2019-06-14 中国电建集团昆明勘测设计研究院有限公司 基于贝叶斯网络模型的房屋登记数据关联楼盘表方法
CN111028119A (zh) * 2019-12-09 2020-04-17 南京苏测测绘科技有限公司 一种基于gis的不动产数据整合方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001034736A (ja) * 1999-07-21 2001-02-09 Suehiro Era 地図作成管理システムおよび家屋図作成管理システム
US20040098269A1 (en) * 2001-02-05 2004-05-20 Mark Wise Method, system and apparatus for creating and accessing a hierarchical database in a format optimally suited to real estate listings
JP2002236720A (ja) * 2001-02-13 2002-08-23 Ben System:Kk 建築データ管理システム
FR3033910A1 (fr) * 2015-03-17 2016-09-23 Magilog Sas Procede de localisation de biens immobiliers recherches a partir de donnees cadastrales
CN105069718A (zh) * 2015-07-27 2015-11-18 华南师范大学 基于移动物联网的智慧国土不动产自助监测方法和***
CN106204358A (zh) * 2016-06-30 2016-12-07 广东新禾道信息科技有限公司 不动产统一登记信息管理***
CN109816767A (zh) * 2017-11-17 2019-05-28 南京国图信息产业有限公司 一种基于正切空间的三维楼盘模型房屋分层分户图模糊匹配方法
CN108153917A (zh) * 2018-01-31 2018-06-12 福州市勘测院 一种可视化定义人地房关系的不动产调查建库方法
CN108427714A (zh) * 2018-02-02 2018-08-21 北京邮电大学 基于机器学习的房源重复记录识别方法及***
CN109460446A (zh) * 2019-01-29 2019-03-12 江苏省测绘工程院 一种房产宗地的整合方法
CN109886844A (zh) * 2019-03-21 2019-06-14 中国电建集团昆明勘测设计研究院有限公司 基于贝叶斯网络模型的房屋登记数据关联楼盘表方法
CN111028119A (zh) * 2019-12-09 2020-04-17 南京苏测测绘科技有限公司 一种基于gis的不动产数据整合方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑举汉等: "房产测绘成果共享利用模式的创新性探索-以武汉市历史房产测绘成果清理工作", no. 2, pages 96 - 97 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114118285A (zh) * 2021-12-01 2022-03-01 深圳须弥云图空间科技有限公司 建筑数据匹配方法、装置及电子设备
CN114118285B (zh) * 2021-12-01 2024-08-20 深圳须弥云图空间科技有限公司 建筑数据匹配方法、装置及电子设备
CN116089541A (zh) * 2022-12-21 2023-05-09 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) 一种海量不动产登记数据异常识别方法
CN116089541B (zh) * 2022-12-21 2023-09-12 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) 一种海量不动产登记数据异常识别方法

Also Published As

Publication number Publication date
CN111625549B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
EP3916668A1 (en) Urban land automatic identification system integrating industrial big data and building forms
US20060041375A1 (en) Automated georeferencing of digitized map images
CN112347222A (zh) 一种基于知识库推理的将非标准地址转换为标准地址的方法及***
CN111625549A (zh) 一种不动产登记空间数据户落幢快速模糊匹配方法
CN111782741A (zh) 兴趣点挖掘方法、装置、电子设备及存储介质
CN106874384A (zh) 一种异构地址标准转换及匹配方法
CN110046661A (zh) 一种基于上下文特征和图割算法的车载点云聚类方法
CN103177189B (zh) 一种众源位置签到数据质量分析方法
CN113780459B (zh) 一种基于空间谱系的城乡聚落类型自动识别的方法与***
CN113379269B (zh) 多因素空间聚类的城市商业功能区划方法、装置及介质
KR20100025144A (ko) 지리 정보 시스템과 건축도면을 기반으로 하는 건축물 전산관리 시스템 및 그 방법
CN111325235B (zh) 面向多语种的通用地名语义相似度计算方法及其应用
CN114201480A (zh) 一种基于nlp技术的多源poi融合方法、装置及可读存储介质
CN114168705A (zh) 一种基于地址要素索引的中文地址匹配方法
Liu et al. M: N Object matching on multiscale datasets based on MBR combinatorial optimization algorithm and spatial district
CN111105124A (zh) 一种基于距离约束的多地标影响力的计算方法
CN111090630A (zh) 基于多源空间点数据的数据融合处理方法
CN115457386A (zh) 一种村庄用地信息化生成方法
CN115186074A (zh) 基于Meta分析的模拟土壤pH值空间分布格局的方法
CN110609874B (zh) 一种基于密度聚类算法的地址实体共指消解方法
CN110727793B (zh) 区域识别的方法、装置、终端和计算机可读存储介质
CN114925151B (zh) 一种城市poi地址信息实时自动生成方法
Choi et al. Developing an alias management method based on word similarity measurement for POI application
CN116578676B (zh) 一种地名时空演化查询方法及***
Santos et al. Knowledge discovery in spatial databases: the PADRÃO’s qualitative approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant