CN116049501A - 一种空间场景空间关系自然语言描述生成方法 - Google Patents

一种空间场景空间关系自然语言描述生成方法 Download PDF

Info

Publication number
CN116049501A
CN116049501A CN202310045574.XA CN202310045574A CN116049501A CN 116049501 A CN116049501 A CN 116049501A CN 202310045574 A CN202310045574 A CN 202310045574A CN 116049501 A CN116049501 A CN 116049501A
Authority
CN
China
Prior art keywords
spatial
space
relation
information
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310045574.XA
Other languages
English (en)
Inventor
郭旦怀
郑楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Chemical Technology
Original Assignee
Beijing University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Chemical Technology filed Critical Beijing University of Chemical Technology
Priority to CN202310045574.XA priority Critical patent/CN116049501A/zh
Publication of CN116049501A publication Critical patent/CN116049501A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种从空间场景中计算并存储描述空间对象关系信息的方法,该方法采用网格划分辅助空间场景中点、线、面三种不同类型的空间对象间的关系计算,并使用知识图存储空间场景中的关系以备后续空间场景描述文本的生成。本发明与现有技术相比在于利用网格将不同空间对象类型之间的复杂空间计算转换成了面对象与面对象间的拓扑关系、方位关系和距离关系计算,并使用知识图的方式结构化存储各空间对象的属性及其间关系,方法清晰、高效,并且能够在地理信息领域具有广泛的实用意义,能够为生成丰富的空间场景描述文本、空间场景重建等应用提供有效的初期技术支撑。

Description

一种空间场景空间关系自然语言描述生成方法
技术领域
本发明涉及地理信息中空间计算领域和数据处理技术领域,更具体地说是一种涉及网格空间计算的自然语言描述知识提取的方法。
背景技术
信息时代,由于计算机行业的飞速发展,信息技术继续向高性能、低成本、普适计算和智能化等主要方向发展,重点研究基于生物特征、以自然语言和动态图像的理解为基础的“以人为中心”的智能信息处理控制技术和中文信息处理。以文本或图片为依托的信息成为描述人类生产生活所在空间场景的主要途径。如何让计算机如人脑一般具有从图形信息中构建自然语言的能力,使计算机具有空间认知思维和自然语言描述能力是当前地理信息技术的主要科学问题。
在空间场景描述文本生成任务中,相较全面的对象描述,过往的研究更专注于点对象与点对象间的关系计算,其依赖两点的经纬度信息计算空间对象点间距离和方位角,以此基于规则生成简单的空间场景中兴趣点间空间关系的描述。这种方式虽然准确性高,但忽视了在现实空间场景中面对象和线对象间的空间关系。同时,该方法需要进行大量的数学计算,使获得空间场景中空间对象的关系变得复杂。
由于空间关系的计算结果是一个个孤立的空间对象和空间关系信息,在对这些海量的复杂空间信息数据做聚类分析或文本生成等任务时,利用关系型数据库对空间场景进行存储和处理方法不仅需要大规模算力支持,且每次都需要消耗大量的内存资源与重复计算时间,遍历空间关系并抽取空间信息能力非常弱,其实际上无法应对海量复杂空间信息数据的结构化、便捷获取——需要一种空间场景中各类型对象关系计算及存储方法以满足丰富语义的快速生成需求。
图数据库是一种以图结构进行存储和查询的数据库,其关键概念是实体(即点数据)和关系(即边数据),通过边将顶点连接在一起,从而进行快速的图检索操作。使用图结构数据可以很自然的表达现实世界中的空间对象实体及其间各种空间关系,并适应不断变化的业务需求,灵活的图查询语言也可保持常数级时间复杂度,轻松实现复杂空间信息数据做聚类分析或文本生成等任务。
基于上述研究现状,针对空间场景中对象关系计算及存储存在以下问题:第一、传统的空间关系计算方法无法支撑针对多空间对象类型间的海量关系计算,造成全面获取某空间场景中的全部空间关系信息成为首要困难。第二,空间关系信息的非结构化存储难以满足准确的描述文本生成、空间场景重构等工作的迫切需求。
发明内容
本发明的目的是针对现有技术方法的不足而设计的一种空间场景空间关系自然语言描述生成方法,利用网格将不同空间对象类型间的空间计算转换为针对面对象与面对象间的拓扑关系、方位关系和距离关系计算,并利用知识图对空间场景中的空间对象固有属性和其间关系信息进行结构化存储。在地理信息研究中具有广泛的实用意义,为空间场景描述文本生成、场景重建等应用提供有效的初期技术支撑。
本发明的目的是这样实现的:
一种空间场景空间关系自然语言描述生成方法,该方法包括:
选取地图片段,解析其中的点对象、线对象和面对象基本属性信息,包含对象唯一识别码、对象名称、对象类型、组成当前对象的点的位置信息等;此外,针对线对象还需进行相交点的计算,通过相交点经过的线的个数以及其作为线端点的个数,确认相交点在空间场景中作为路口时的名称,并保存该信息作为点对象参与到后续的空间计算任务中;
依据目标地图片段的尺度,将目标地图片段均匀分割成适合当前尺度大小的网格矩阵,确定每个格网的位置信息并为网格进行编码以进行更准确的空间计算;
根据网格信息与空间场景中点线面对象的位置信息,进行地理空间关系连接与分析,确定空间场景中各类型空间对象在网格矩阵中的从属关系,更新空间对象的属性信息;
基于网格依次计算空间对象间的拓扑关系、方位关系和距离关系,生成空间信息三元组;重复执行当前操作,直到完成目标片段中任意两个空间对象间的全部空间关系计算,得到空间信息三元组集;
建立空间信息知识图数据库,在数据库中构建不同类型空间对象实体,并通过空间信息三元组集确认任意两个空间对象实体间的自然语言定性空间关系表达,建立各对象间的自然语言关系信息表达以完成该片段的空间信息知识图构建。
本发明与现有技术相比,针对现有机器学习生成的空间场景描述文本只考虑点对象间的空间关系而忽视线对象和面对象的空间关系描述,且传统方法针对多类型空间对象间空间关系计算需要算力大,无法统一度量的问题,设计一种空间场景中对象关系计算及场景描述知识图构建方法,利用网格将不同空间对象类型间的空间计算转换为针对面对象与面对象间的拓扑关系、方位关系和距离关系计算,提高定性空间计算的效率和准确性,并利用知识图对空间场景中的空间对象固有属性和其间关系信息进行结构化存储,为丰富的空间场景描述文本生成任务提供清晰明了的知识储备。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明公开的一种空间场景中对象关系计算及场景描述知识图构建方法执行流程图;
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
参阅附图1,本发明按下述步骤进行空间场景中对象关系计算及场景描述知识图表示
(一)获取地图片段,解析并存储片段中的点线面对象信息
根据地图片段数据,解析该空间场景中点、线、面对象的数量和属性信息,具体如下:
该空间场景中的点对象用集合P={p1,p2,...,pn}表示,其中n表示点对象的数量,对于
Figure BDA0004055270460000031
pi包含的属性如表1所示。
表1 点对象属性信息
属性名 描述
point_id 点对象唯一识别id
name 点对象名称
category 点对象类别
location 点对象位置坐标
线对象用集合L={L1,L2,...,Lm}表示,其中m表示线对象的数量,对于
Figure BDA0004055270460000032
Figure BDA0004055270460000033
Li包含的属性如表2所示,其中category包含“有相交线”、“无相交线”、“环形线”等;conn属性中的点对象位置坐标按照顺序存放,第一个点对象和最后一个点对象为该线对象的两个端点。
表2 线对象属性信息
属性名 描述
line_id 线对象唯一识别id
name 线对象名称
category 线对象类别
conn 组成线的点对象位置坐标集合
面对象用集合S={s1,s2,...,sq}表示,其中q表示面对象的数量,对于
Figure BDA0004055270460000034
Figure BDA0004055270460000035
si包含的属性如表3所示,其中conn属性中的点对象信息按照顺序存放,满足第一个点对象与最后一个点对象位置坐标相同这一性质以确定该对象为闭合面。
表3 面对象属性信息
属性名 描述
polygons_id 面对象唯一识别id
name 面对象名称
category 面对象类别
conn 组成多边形面的点对象位置坐标集合
除以上基本的点线面信息外,为满足后续自然语言对该空间场景的描述习惯,还需计算线对象间的相交情况以确定场景中的路口信息,并将路口点与场景中其他空间对象的关系加入空间计算中,路口点包含的属性如表4所示,其中name属性的判定规则如表5所示。
表4 路口属性信息
属性名 描述
crossing_id 路口点唯一识别id
location 路口点位置坐标
lines_id 经过该路口点的线对象id集合
lines_count 经过该路口点的线对象数量
name 路口点名称
表5 路口点名称判定规则
Figure BDA0004055270460000041
(二)根据地图片段创建格网
空间数据是根据基本比例尺进行采集,不同比例尺下的数据具有不同的空间分辨率和空间对象表达精度。根据地图片段的尺度差异,需创建对应尺度的网格以进行更准确的空间计算,设当前地图片段的比例尺大小为scale,每个网格的宽度计算公式为:
width=scale×10-3
网格编码和位置信息确定:在获得网格大小后,需要充分利用地图片段的范围信息获取每个网格的位置以及唯一识别编码。设地图片段边界西北角坐标(xNW,yNW),东南角坐标(xSE,ySE),则每行有
Figure BDA0004055270460000042
个网格,每列有
Figure BDA0004055270460000043
个网络,对于坐标为第i行,第j列的网格,其唯一识别码计算公式为:
Figure BDA0004055270460000044
其位置信息为(xNW+j×width,yNW-i×width)
(三)确定空间对象与网格的从属关系
构建网格并对片段找那个每个空间对象所在网格进行统计,实际上是建立空间对象与网格间的从属关系。在网格属性表中,除了要记录网格的基本信息,还要记录该网格内的空间实体唯一识别编码,如表6所示。
表6 网格属性表
属性名 描述
Grid_ID 网格唯一识别码
Grid_X 网格行数
Grid_Y 网格列数
Grid_size 网格大小
Grid_loc 网格坐标信息
Object_ID 网格内空间对象id
(四)基于网格进行空间对象间关系计算
设参考对象所在网格的集合为O={o1,o2,...,oi,...,o|O|},主对象所在网格的集合为P={p1,p2,...,pj,...,p|P|},空间对象总数N,任意一个空间对象都需要作为参考对象分别依次计算其与该片段中其他空间对象间的拓扑关系r_topo、方位关系r_pos和距离r_dis关系,并将计算求得的空间信息存入三元组集合R={(Ok,r,Pk)}中,其中k∈[1,N×(N-1)],r=(r_topo,r_pos,r_dis)。
O、P两个空间对象间的拓扑关系r_topo由其所在的网格集合之间的关系描述。首先需要对8种网格数量进行定义并计算,如表7所示。主对象P针对参考对象O的8种基本拓扑关系计算模型如下表8所示。
表7 8种网格数量的定义与计算
定义 描述
Num_O O所占网格的数量
Num_P P所占网格的数量
Num_OP 在O所占网格中与P共同占有的网格数量
Num_PO 在P所占网格中与O共同占有的网格数量
Num_OP_border O中与P共同占有的网格中含对象边界网格的数量
Num_OP_inside O中与P共同占有的网格中含对象内部网格的数量
Num_PO_border P中与O共同占有的网格中含对象边界网格的数量
Num_PO_inside P中与O共同占有的网格中含对象内部网格的数量
方位关系r_pos需要分别计算任意主对象网格pj与任意参考对象网格Oi的方位关系,并对其求得加权平均,以此获得更准确的方位关系。公式如下:
Figure BDA0004055270460000051
其中pos(oi,pj)为主对象网格pj针对参考对象网格oi的方向矩阵并将其初始化为零矩阵:
表8主对象P针对参考对象O的8种基本拓扑关系计算模型
Figure BDA0004055270460000061
Figure BDA0004055270460000062
Figure BDA0004055270460000063
矩阵中各值的计算如表9所示
距离关系r_dis需要分别计算任意主对象网格pj与任意参考对象网格Oi的距离关系,并对其求得加权平均,以此获得更准确的距离关系。公式如下:
Figure BDA0004055270460000071
其中dis(oi,pj)为主对象网格pj针对参考对象网格oi的欧式距离:
Figure BDA0004055270460000072
表9 方向矩阵计算表
Figure BDA0004055270460000073
(五)建立空间信息知识图数据库
针对每一地图片段建立空间信息知识图,该空间信息知识图应为全连接图。首先确认空间信息知识图的顶点,即空间“实体”对象为当前片段中全部点对象、线对象、面对象以及各个线对象的交点,每两个空间对象间的“关系”由上一步中计算的结果加以转换成自然语言的定性表达确认。更具体地,在自然语言描述中少有对拓扑关系r_topo的准确描述,常以“旁”、“里”等字眼隐式表达空间中重要的拓扑关系。当拓扑关系为相交时,自然语言中常用“相邻”/“旁”表达;当拓扑关系为覆盖或包含时,自然语言中常用“在其外”表达;当拓扑关系为被覆盖或内含时,自然语言中常用“在其内”表达。
方位关系由上述求得的r_pos方向矩阵最大值所在方位决定,并在两个空间对象间的关系边权中添加对应的自然语言定性方位表达结果。
距离关系由地图片段大小map_width以及上述求得的r_dis共同决定,设
Figure BDA0004055270460000081
Figure BDA0004055270460000082
则定量距离与自然语言中的定性表达间的映射如表10所示,并在两个空间对象间的关系边权重添加对应的自然语言定性表达结果。
表10 定量距离与自然语言中的定性表达间的映射
Figure BDA0004055270460000083
重复执行当前操作,直到在空间信息知识图数据库中,完成同一地图片段中空间对象间的方位和距离“关系”的创建,得到包含拓扑关系、方位关系和距离关系使用自然语言表达的知识图数据模型。
以上只是对本发明作进一步的说明,并非用以限制本发明,凡为本发明等效实施,均应包含于本发明的权利要求范围之内。

Claims (1)

1.一种空间场景空间关系自然语言描述生成方法,其特征在于,该方法包括:
选取地图片段,解析其中的点对象、线对象和面对象基本属性信息,包含对象唯一识别码、对象名称、对象类型、组成当前对象的点的位置信息;针对线对象进行相交点的计算,通过相交点经过的线的个数以及其作为线端点的个数,确认相交点在空间场景中作为路口时的名称,并保存该名称作为点对象参与到后续的空间计算任务中;
依据目标地图片段的尺度,将目标地图片段均匀分割成适合当前尺度大小的网格矩阵,确定每个格网的位置信息并为网格进行编码以进行空间计算;
根据网格信息与空间场景中点线面对象的位置信息,进行地理空间关系连接与分析,确定空间场景中各类型空间对象在网格矩阵中的从属关系,更新空间对象的属性信息;
基于网格依次计算空间对象间的拓扑关系、方位关系和距离关系,生成空间信息三元组;重复执行当前操作,直到完成目标片段中任意两个空间对象间的全部空间关系计算,得到空间信息三元组集;
建立空间信息知识图数据库,在数据库中构建不同类型空间对象实体,并通过空间信息三元组集确认任意两个空间对象实体间的自然语言定性空间关系表达,建立各对象间的自然语言关系信息表达以完成空间信息知识图构建。
CN202310045574.XA 2023-01-30 2023-01-30 一种空间场景空间关系自然语言描述生成方法 Pending CN116049501A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310045574.XA CN116049501A (zh) 2023-01-30 2023-01-30 一种空间场景空间关系自然语言描述生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310045574.XA CN116049501A (zh) 2023-01-30 2023-01-30 一种空间场景空间关系自然语言描述生成方法

Publications (1)

Publication Number Publication Date
CN116049501A true CN116049501A (zh) 2023-05-02

Family

ID=86132746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310045574.XA Pending CN116049501A (zh) 2023-01-30 2023-01-30 一种空间场景空间关系自然语言描述生成方法

Country Status (1)

Country Link
CN (1) CN116049501A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821692A (zh) * 2023-08-28 2023-09-29 北京化工大学 描述文本和空间场景样本集的构建方法、装置及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364137A (zh) * 2020-09-03 2021-02-12 中国人民解放军战略支援部队信息工程大学 一种空间目标态势的知识图谱构建方法
CN113112595A (zh) * 2021-04-28 2021-07-13 中国科学院沈阳应用生态研究所 综合体实景三维模型的点线面混合立体路网自动构建方法
CN113515525A (zh) * 2021-07-29 2021-10-19 郑州众合景轩信息技术有限公司 一种基于全球多尺度格网的空间数据组织方法
WO2021254457A1 (zh) * 2020-06-17 2021-12-23 第四范式(北京)技术有限公司 构建知识图谱的方法及装置、计算机装置及存储介质
CN114153928A (zh) * 2021-12-03 2022-03-08 中国电信股份有限公司 城市地理语义知识网络的构建方法、***、设备及介质
CN114564966A (zh) * 2022-03-04 2022-05-31 中国科学院地理科学与资源研究所 一种基于知识图谱的空间关系语义分析的方法
CN114926611A (zh) * 2022-05-30 2022-08-19 武汉理工大学 一种基于本体的全息航行场景图知识推理方法及装置
CN115269751A (zh) * 2022-05-10 2022-11-01 泰瑞数创科技(北京)股份有限公司 地理实体时空知识图谱本体库构建方法
CN115344707A (zh) * 2022-08-01 2022-11-15 南京航空航天大学 一种城市交通知识图谱构建方法
CN115495584A (zh) * 2022-06-30 2022-12-20 中国人民解放军战略支援部队信息工程大学 一种基于知识图谱的地图知识表示方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021254457A1 (zh) * 2020-06-17 2021-12-23 第四范式(北京)技术有限公司 构建知识图谱的方法及装置、计算机装置及存储介质
CN112364137A (zh) * 2020-09-03 2021-02-12 中国人民解放军战略支援部队信息工程大学 一种空间目标态势的知识图谱构建方法
CN113112595A (zh) * 2021-04-28 2021-07-13 中国科学院沈阳应用生态研究所 综合体实景三维模型的点线面混合立体路网自动构建方法
CN113515525A (zh) * 2021-07-29 2021-10-19 郑州众合景轩信息技术有限公司 一种基于全球多尺度格网的空间数据组织方法
CN114153928A (zh) * 2021-12-03 2022-03-08 中国电信股份有限公司 城市地理语义知识网络的构建方法、***、设备及介质
CN114564966A (zh) * 2022-03-04 2022-05-31 中国科学院地理科学与资源研究所 一种基于知识图谱的空间关系语义分析的方法
CN115269751A (zh) * 2022-05-10 2022-11-01 泰瑞数创科技(北京)股份有限公司 地理实体时空知识图谱本体库构建方法
CN114926611A (zh) * 2022-05-30 2022-08-19 武汉理工大学 一种基于本体的全息航行场景图知识推理方法及装置
CN115495584A (zh) * 2022-06-30 2022-12-20 中国人民解放军战略支援部队信息工程大学 一种基于知识图谱的地图知识表示方法
CN115344707A (zh) * 2022-08-01 2022-11-15 南京航空航天大学 一种城市交通知识图谱构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王益尧;: "基于HBase的RDF数据的存储与查询***研究", 无线通信技术, no. 01, 15 March 2018 (2018-03-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821692A (zh) * 2023-08-28 2023-09-29 北京化工大学 描述文本和空间场景样本集的构建方法、装置及存储介质

Similar Documents

Publication Publication Date Title
De Smith et al. Geospatial analysis: a comprehensive guide to principles, techniques and software tools
CA2436312C (en) Close-packed, uniformly adjacent, multiresolutional, overlapping spatial data ordering
Robertson et al. An integrated environmental analytics system (IDEAS) based on a DGGS
De Floriani et al. Intervisibility on terrains
CN108376183B (zh) 一种基于最大熵原理的城市ca模型构建方法
CN115661374B (zh) 一种基于空间划分和模型体素化的快速检索方法
CN116049501A (zh) 一种空间场景空间关系自然语言描述生成方法
KR20150113870A (ko) 관리 프로그램, 관리 장치 및 관리 방법
CN111159451B (zh) 一种基于空间数据库的电力线路点云动态单体化方法
CN115017348A (zh) 一种网格数据图实现方法和装置
KR100450631B1 (ko) 보간법을 이용한 격자형 디이엠 생성방법
Wang et al. A hexagon-based method for polygon generalization using morphological operators
CN111446968A (zh) 矢量空间数据多级压缩方法
CN110555189A (zh) 一种基于反向计算思维的空间插值方法
CN116342724A (zh) 热力图对象生成方法、装置以及计算机可读存储介质
CN115964599A (zh) 一种大规模土地利用/覆被变化转移矩阵装置及使用方法
CN116091715A (zh) 一种基于三维gis引擎的poi点聚合方法
Kim et al. Efficient encoding and decoding extended geocodes for massive point cloud data
CN113360586B (zh) 地址聚集度查询方法、装置、设备及计算机可读存储介质
KR101091061B1 (ko) 수치지도 상 공간객체의 위치유사도 측정방법 및 이를 이용한 지도 매칭방법
CN110019632A (zh) 一种基于形状树的地理要素形状分析方法
CN111241221B (zh) 一种受损地形坐标数据的自动化匹配及高精度修复方法
Deeprasertkul et al. An internet gis system to support the water resource management
Feld et al. Approximated environment features with application to trajectory annotation
Giofandi et al. The comparison of vector and raster data for the calculation of landscape environment using a geographic information system approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination