CN114116864A - 多源时空数据融合方法、装置、计算机设备及存储介质 - Google Patents

多源时空数据融合方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114116864A
CN114116864A CN202111326030.8A CN202111326030A CN114116864A CN 114116864 A CN114116864 A CN 114116864A CN 202111326030 A CN202111326030 A CN 202111326030A CN 114116864 A CN114116864 A CN 114116864A
Authority
CN
China
Prior art keywords
data
spatio
spatiotemporal
source
temporal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111326030.8A
Other languages
English (en)
Inventor
张帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Beidou Intelligence Technology Co ltd
Original Assignee
Shenzhen Beidou Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Beidou Intelligence Technology Co ltd filed Critical Shenzhen Beidou Intelligence Technology Co ltd
Priority to CN202111326030.8A priority Critical patent/CN114116864A/zh
Publication of CN114116864A publication Critical patent/CN114116864A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/256Integrating or interfacing systems involving database management systems in federated or virtual databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种多源时空数据融合方法、装置、计算机设备及存储介质。该方法包括:获取多源的时空信息,并将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据;分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度;根据所述相似度对不同数据源之间的所述时空数据进行匹配;根据匹配结果对各个数据源的所述时空数据进行融合。本发明实施例所提供的技术方案,实现了对多源时空数据的融合,降低了针对每个用户的时空数据的冗余,从而可以更好的利用时空数据进行城市安全管理以及城市规划等项目中。

Description

多源时空数据融合方法、装置、计算机设备及存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种多源时空数据融合方法、装置、计算机设备及存储介质。
背景技术
随着移动互联网和无线技术的迅速发展,以及北斗定位***的完善,公交、出租、网约车以及共享单车让时空数据呈现爆发式的增长,如何利用历史轨迹数据和人工智能技术来把个人多源轨迹ID统一对应起来,形成基于时空的多源ID库,对于提高城市安全管理以及城市规划都具有指导意义。
目前整个城市的规模巨大,特大城市的人口量级能达到千万级别,随之产生的数据量也是巨量,目前的云计算平台,还不能很好的支持时空大数据。
发明内容
本发明实施例提供一种多源时空数据融合方法、装置、计算机设备及存储介质,以实现对多源时空数据的融合,降低时空数据的冗余。
第一方面,本发明实施例提供了一种多源时空数据融合方法,该方法包括:
获取多源的时空信息,并将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据;
分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度;
根据所述相似度对不同数据源之间的所述时空数据进行匹配;
根据匹配结果对各个数据源的所述时空数据进行融合。
第二方面,本发明实施例还提供了一种多源时空数据融合装置,该装置包括:
数据获取模块,用于获取多源的时空信息,并将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据;
相似度计算模块,用于分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度;
数据匹配模块,用于根据所述相似度对不同数据源之间的所述时空数据进行匹配;
数据融合模块,用于根据匹配结果对各个数据源的所述时空数据进行融合。
第三方面,本发明实施例还提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的多源时空数据融合方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的多源时空数据融合方法。
本发明实施例提供了一种多源时空数据融合方法,首先获取多源的时空信息,并将各个时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据,然后分别计算每个数据源中的每个时空数据与其他数据源中的每个时空数据之间的相似度,再根据所得的相似度对不同数据源之间的时空数据进行匹配,最后即可根据匹配结果对各个数据源的时空数据进行融合。本发明实施例所提供的多源时空数据融合方法,实现了对多源时空数据的融合,降低了针对每个用户的时空数据的冗余,从而可以更好的利用时空数据进行城市安全管理以及城市规划等项目中。
附图说明
图1为本发明实施例一提供的多源时空数据融合方法的流程图;
图2为本发明实施例一提供的示例性矩阵表示的示意图;
图3为本发明实施例一提供的示例性编码前矩阵的示意图;
图4为本发明实施例一提供的示例性编码后矩阵的示意图;
图5为本发明实施例二提供的多源时空数据融合装置的结构示意图;
图6为本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的多源时空数据融合方法的流程图。本实施例可适用于对从不同数据源获取的时空信息进行融合的情况,该方法可以由本发明实施例所提供的多源时空数据融合装置来执行,该装置可以由硬件和/或软件的方式来实现,一般可集成于计算机设备中。如图1所示,具体包括如下步骤:
S11、获取多源的时空信息,并将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据。
具体的,可以从不同的数据源分别获取到各种时空信息,其中的数据源可以来源于公交、出租、网约车以及共享单车等等,每条时空信息可以对应某个用户,也可以对应某个用户的一次出行,则可以从每个数据源获取到多条时空信息。由于不同的数据源存储数据的格式可能不同,为了便于后续的处理,可以首先将获取到的各种时空信息按照统一的预设数据格式进行转换,从而得到统一格式的时空数据。其中,可选的,所述预设数据格式包括数据标识、时间点、经度、纬度和区域名称。具体的,对于时空信息的表示,最核心的字段就是数据标识、时间点以及经纬度等,而经纬度是一个精确型的信息,对于同一地点的表示可能不太容易,因此,可以通过空间的聚合,将经纬度信息统一到地理空间中,并可以通过区域名称进行标识,示例性的,地理空间可以划分为地铁站或小区等等。数据标识可用于标识某条时空数据具体所属的数据源,以及在该数据源中对应所属的用户等信息。
可选的,在所述将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据之后,还包括:对所述时空数据进行矩阵表示,其中,矩阵的行表示所述时空数据出现的区域,矩阵的列表示根据预设时间粒度所划分的时间段,若在目标时间段内在目标区域内出现,则矩阵中所述目标时间段以及所述目标区域对应的数据点的值为1,否则值为0。具体的,首先可以确定所需的时间粒度,以划分时间段,即多长时间进行一次统计,从而确定某用户是否在某时间段出现在某个区域,时间粒度越小,所划分的结果越精细,同时数据量也会越大。示例性的,假设ID1在9:01出现在区域A,在9:04出现在区域A,在8:57出现在区域B,设时间起点为8:55,则预设时间粒度分别为5分钟和2分钟的矩阵表示可以如图2所示,当预设时间粒度为5分钟时,可以表示为2*2矩阵,当预设时间粒度为2分钟时,可以表示为2*5矩阵,其中矩阵的行即表示区域,矩阵的列即表示具体的时间段,值为0则代表在对应的目标时间段ID1未出现在对应的目标区域中,值为1则代表在对应的目标时间段ID1出现在对应的目标区域中。通过对时空数据进行矩阵表示,可以方便后续对不同ID进行基于时空的比较。
进一步可选的,在所述对所述时空数据进行矩阵表示之后,还包括:对每个所述时空数据对应的矩阵分别进行前后性编码,以获得每个所述时空数据对应的编码集。具体的,在对时空数据进行矩阵表示之后,可以对所得到的所有时空数据对应的矩阵进行前后性编码,即分别通过将矩阵整体前移和整体后移来得到两个新的矩阵,并可与原矩阵共同构成时空数据对应的编码集。由于在实际情况中,通过不同设备采集到的时空信息之间可能存在时间差,但实际可能是由同一用户在同一时刻产生的数据,而由于时间差可能会导致无法正确匹配的问题,因此,通过进行前后性编码,可以修正因时间差错开的编码,从而使得不同数据源的时空信息能够得到正确的匹配。示例性的,假设ID1在8:58出现在区域A,ID2在9:01出现在区域A,预设时间粒度为2分钟,起始时间为8:58,则ID1的矩阵表示和ID2的矩阵表示可以如图3所示,在对ID2进行了前后性编码之后,得到的矩阵表示如图4所示,可见,通过前后性编码,使得ID2的其中一个矩阵表示可以命中ID1的矩阵表示,而ID1和ID2可能是同一次出行,则如此可以提高匹配的成功率。
S12、分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度。
具体的,时空数据之间的相似度越高,则匹配的概率将会越高,具体可以利用jaccard相似系数来计算时空数据之间的相似度,其中,jaccard相似系数为:
jaccard=ID1∩ID2/ID1∪ID2
其中,ID1表示第一数据源中的第一时空数据,ID2表示第二数据源中的第二时空数据,ID1∩ID2表示第一时空数据中的记录与第二时空数据中的记录命中的数量,ID1∪ID2表示第一时空数据和第二时空数据的记录总数之和减去命中的数量。示例性的,假设ID1在区域A产生3条记录,ID2在区域A产生100条记录,同时ID1与ID2有三条记录命中,则ID1与ID2的相似度为3/100=0.03。
可选的,所述分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度,包括:利用kulc相似系数计算所述相似度,所述kulc相似系数为:
kulc=0.5*(ID1∩ID2/|ID1|+ID1∩ID2/|ID2|)
其中,ID1表示第一数据源中的第一时空数据,ID2表示第二数据源中的第二时空数据,ID1∩ID2表示所述第一时空数据中的记录与所述第二时空数据中的记录命中的数量,|ID1|表示所述第一时空数据中的记录总数,|ID2|表示所述第二时空数据中的记录总数。示例性的,假设ID1在区域A产生3条记录,ID2在区域A产生100条记录,同时ID1与ID2有三条记录命中,则ID1与ID2的相似度为0.5*(3/3+3/100)=0.515。经过多次实验,根据时空数据之间实际的相似性情况,采用kulc相似系数计算得到的相似度更加准确合理。
可选的,在所述分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度之前,还包括:若第一数据源中的第一时空数据与第二数据源中的第二时空数据之间存在时空冲突,则确定所述第一时空数据与所述第二时空数据非相似,其中,所述时空冲突表示在同一时段出现在不同区域。具体的,对时空数据的矩阵表示可以采用稀疏矩阵,其中的行表示区域,列表示时间段,则当第一时空数据对应的矩阵与第二时空数据对应的矩阵中存在同一时间段不同区域的值均为1时,如第一时空数据对应的矩阵在某一时间段与区域A对应的值为1,而第二时空数据对应的矩阵在同一时间段与区域B对应的值为1时,则可以确定第一时空数据与第二时空数据存在时空冲突。当确定第一时空数据与第二时空数据之间存在时空冲突时,则可以确定第一时空数据与第二时空数据非相似,后续可不再计算两者之间的相似度,还可以将两者之间的相似度设置为0等,以便后续确定第一时空数据与第二时空数据不匹配。
S13、根据所述相似度对不同数据源之间的所述时空数据进行匹配。
具体的,在确定了各个时空数据之间的相似度之后,即可根据所得的相似度结果对不同数据源之间的时空数据进行匹配,具体可以设置相似度阈值,并将相似度高于相似度阈值的两个时空数据相互之间确定为匹配。
可选的,所述根据所述相似度对不同数据源之间的所述时空数据进行匹配,包括:采用TopN cross模式对所述时空数据进行匹配,若第一数据源中的第一时空数据与第二数据源中相似度TopN的时空数据中包括第二时空数据,同时所述第二时空数据与所述第一数据源中相似度TopN的时空数据中包括所述第一时空数据,则确定所述第一时空数据与所述第二时空数据成功匹配。示例性的,针对两个数据源A和B,分别确定A中的每个时空数据在B中匹配的TopN(即相似度最大的N个)时空数据,以及B中的每个时空数据在A中匹配的TopN时空数据,如果A中的某个时空数据ID1的TopN包括了B中的某个时空数据ID2,同时B中的ID2的TopN包括了A中的ID1,则可以认定ID1与ID2匹配成功。通过采用TopN cross模式进行匹配,可以大大提高匹配结果的准确率。
S14、根据匹配结果对各个数据源的所述时空数据进行融合。
具体的,在完成时空数据的匹配之后,即可根据匹配结果对各个数据源的时空数据进行融合,具体可以是将相互匹配的时空数据进行合并,以去除冗余的数据。
本发明实施例所提供的技术方案,首先获取多源的时空信息,并将各个时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据,然后分别计算每个数据源中的每个时空数据与其他数据源中的每个时空数据之间的相似度,再根据所得的相似度对不同数据源之间的时空数据进行匹配,最后即可根据匹配结果对各个数据源的时空数据进行融合。实现了对多源时空数据的融合,降低了针对每个用户的时空数据的冗余,从而可以更好的利用时空数据进行城市安全管理以及城市规划等项目中。
实施例二
图5为本发明实施例二提供的多源时空数据融合装置的结构示意图,该装置可以由硬件和/或软件的方式来实现,一般可集成于计算机设备中,用于执行本发明任意实施例所提供的多源时空数据融合方法。如图5所示,该装置包括:
数据获取模块51,用于获取多源的时空信息,并将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据;
相似度计算模块52,用于分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度;
数据匹配模块53,用于根据所述相似度对不同数据源之间的所述时空数据进行匹配;
数据融合模块54,用于根据匹配结果对各个数据源的所述时空数据进行融合。
本发明实施例所提供的技术方案,首先获取多源的时空信息,并将各个时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据,然后分别计算每个数据源中的每个时空数据与其他数据源中的每个时空数据之间的相似度,再根据所得的相似度对不同数据源之间的时空数据进行匹配,最后即可根据匹配结果对各个数据源的时空数据进行融合。实现了对多源时空数据的融合,降低了针对每个用户的时空数据的冗余,从而可以更好的利用时空数据进行城市安全管理以及城市规划等项目中。
在上述技术方案的基础上,可选的,该多源时空数据融合装置,还包括:
矩阵表示模块,用于在所述将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据之后,对所述时空数据进行矩阵表示,其中,矩阵的行表示所述时空数据出现的区域,矩阵的列表示根据预设时间粒度所划分的时间段,若在目标时间段内在目标区域内出现,则矩阵中所述目标时间段以及所述目标区域对应的数据点的值为1,否则值为0。
在上述技术方案的基础上,可选的,该多源时空数据融合装置,还包括:
重编码模块,用于在所述对所述时空数据进行矩阵表示之后,对每个所述时空数据对应的矩阵分别进行前后性编码,以获得每个所述时空数据对应的编码集。
在上述技术方案的基础上,可选的,相似度计算模块52具体用于:
利用kulc相似系数计算所述相似度,所述kulc相似系数为:
kulc=0.5*(ID1∩ID2/|ID1|+ID1∩ID2/|ID2|)
其中,ID1表示第一数据源中的第一时空数据,ID2表示第二数据源中的第二时空数据,ID1∩ID2表示所述第一时空数据中的记录与所述第二时空数据中的记录命中的数量,|ID1|表示所述第一时空数据中的记录总数,|ID2|表示所述第二时空数据中的记录总数。
在上述技术方案的基础上,可选的,数据匹配模块53具体用于:
采用TopN cross模式对所述时空数据进行匹配,若第一数据源中的第一时空数据与第二数据源中相似度TopN的时空数据中包括第二时空数据,同时所述第二时空数据与所述第一数据源中相似度TopN的时空数据中包括所述第一时空数据,则确定所述第一时空数据与所述第二时空数据成功匹配。
在上述技术方案的基础上,可选的,该多源时空数据融合装置,还包括:
时空冲突判定模块,用于在所述分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度之前,若第一数据源中的第一时空数据与第二数据源中的第二时空数据之间存在时空冲突,则确定所述第一时空数据与所述第二时空数据非相似,其中,所述时空冲突表示在同一时段出现在不同区域。
在上述技术方案的基础上,可选的,所述预设数据格式包括数据标识、时间点、经度、纬度和区域名称。
本发明实施例所提供的多源时空数据融合装置可执行本发明任意实施例所提供的多源时空数据融合方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,在上述多源时空数据融合装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例三
图6为本发明实施例三提供的计算机设备的结构示意图,示出了适于用来实现本发明实施方式的示例性计算机设备的框图。图6显示的计算机设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图6所示,该计算机设备包括处理器61、存储器62、输入装置63及输出装置64;计算机设备中处理器61的数量可以是一个或多个,图6中以一个处理器61为例,计算机设备中的处理器61、存储器62、输入装置63及输出装置64可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器62作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的多源时空数据融合方法对应的程序指令/模块(例如,多源时空数据融合装置中的数据获取模块51、相似度计算模块52、数据匹配模块53及数据融合模块54)。处理器61通过运行存储在存储器62中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的多源时空数据融合方法。
存储器62可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器62可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器62可进一步包括相对于处理器61远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置63可用于获取多源的时空信息,以及产生与计算机设备的用户设置和功能控制有关的键信号输入等。输出装置64可包括显示屏等设备,可便于用户查看或查询最终的数据融合结果。
实施例四
本发明实施例四还提供一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机处理器执行时用于执行一种多源时空数据融合方法,该方法包括:
获取多源的时空信息,并将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据;
分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度;
根据所述相似度对不同数据源之间的所述时空数据进行匹配;
根据匹配结果对各个数据源的所述时空数据进行融合。
存储介质可以是任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机***存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM、兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机***中,或者可以位于不同的第二计算机***中,第二计算机***通过网络(诸如因特网)连接到计算机***。第二计算机***可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机***中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的多源时空数据融合方法中的相关操作。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种多源时空数据融合方法,其特征在于,包括:
获取多源的时空信息,并将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据;
分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度;
根据所述相似度对不同数据源之间的所述时空数据进行匹配;
根据匹配结果对各个数据源的所述时空数据进行融合。
2.根据权利要求1所述的多源时空数据融合方法,其特征在于,在所述将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据之后,还包括:
对所述时空数据进行矩阵表示,其中,矩阵的行表示所述时空数据出现的区域,矩阵的列表示根据预设时间粒度所划分的时间段,若在目标时间段内在目标区域内出现,则矩阵中所述目标时间段以及所述目标区域对应的数据点的值为1,否则值为0。
3.根据权利要求2所述的多源时空数据融合方法,其特征在于,在所述对所述时空数据进行矩阵表示之后,还包括:
对每个所述时空数据对应的矩阵分别进行前后性编码,以获得每个所述时空数据对应的编码集。
4.根据权利要求1所述的多源时空数据融合方法,其特征在于,所述分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度,包括:
利用kulc相似系数计算所述相似度,所述kulc相似系数为:
kulc=0.5*(ID1∩ID2/|ID1|+ID1∩ID2/|ID2|)
其中,ID1表示第一数据源中的第一时空数据,ID2表示第二数据源中的第二时空数据,ID1∩ID2表示所述第一时空数据中的记录与所述第二时空数据中的记录命中的数量,|ID1|表示所述第一时空数据中的记录总数,|ID2|表示所述第二时空数据中的记录总数。
5.根据权利要求1所述的多源时空数据融合方法,其特征在于,所述根据所述相似度对不同数据源之间的所述时空数据进行匹配,包括:
采用TopN cross模式对所述时空数据进行匹配,若第一数据源中的第一时空数据与第二数据源中相似度TopN的时空数据中包括第二时空数据,同时所述第二时空数据与所述第一数据源中相似度TopN的时空数据中包括所述第一时空数据,则确定所述第一时空数据与所述第二时空数据成功匹配。
6.根据权利要求1所述的多源时空数据融合方法,其特征在于,在所述分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度之前,还包括:
若第一数据源中的第一时空数据与第二数据源中的第二时空数据之间存在时空冲突,则确定所述第一时空数据与所述第二时空数据非相似,其中,所述时空冲突表示在同一时段出现在不同区域。
7.根据权利要求1所述的多源时空数据融合方法,其特征在于,所述预设数据格式包括数据标识、时间点、经度、纬度和区域名称。
8.一种多源时空数据融合装置,其特征在于,包括:
数据获取模块,用于获取多源的时空信息,并将各个所述时空信息按照统一的预设数据格式进行转换,以得到各个数据源的时空数据;
相似度计算模块,用于分别计算每个数据源中的每个所述时空数据与其他数据源中的每个所述时空数据之间的相似度;
数据匹配模块,用于根据所述相似度对不同数据源之间的所述时空数据进行匹配;
数据融合模块,用于根据匹配结果对各个数据源的所述时空数据进行融合。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的多源时空数据融合方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的多源时空数据融合方法。
CN202111326030.8A 2021-11-10 2021-11-10 多源时空数据融合方法、装置、计算机设备及存储介质 Pending CN114116864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111326030.8A CN114116864A (zh) 2021-11-10 2021-11-10 多源时空数据融合方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111326030.8A CN114116864A (zh) 2021-11-10 2021-11-10 多源时空数据融合方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114116864A true CN114116864A (zh) 2022-03-01

Family

ID=80378106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111326030.8A Pending CN114116864A (zh) 2021-11-10 2021-11-10 多源时空数据融合方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114116864A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114861839A (zh) * 2022-07-07 2022-08-05 三亚海兰寰宇海洋信息科技有限公司 一种目标数据的处理方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114861839A (zh) * 2022-07-07 2022-08-05 三亚海兰寰宇海洋信息科技有限公司 一种目标数据的处理方法、装置及设备
CN114861839B (zh) * 2022-07-07 2022-10-21 三亚海兰寰宇海洋信息科技有限公司 一种目标数据的处理方法、装置及设备

Similar Documents

Publication Publication Date Title
CN110728317A (zh) 决策树模型的训练方法、***、存储介质及预测方法
US20220101189A1 (en) Federated inference
CN111523577A (zh) 一种基于改进的lcss算法的海量轨迹相似度计算方法
CN106897338A (zh) 一种针对数据库的数据修改请求处理方法及装置
CN114116864A (zh) 多源时空数据融合方法、装置、计算机设备及存储介质
CN113392864A (zh) 模型生成方法及视频筛选方法、相关装置、存储介质
CN114925853A (zh) 一种梯度提升树模型的构建方法、装置、设备和介质
US11977993B2 (en) Data source correlation techniques for machine learning and convolutional neural models
CN114428692A (zh) 数据发送、数据接收方法、装置、计算机设备和存储介质
CN113806466A (zh) 路径时间查询方法、装置、电子设备和可读存储介质
US20240192015A1 (en) Method and apparatus for updating associated information of guide point
CN112214484B (zh) 一种无人机数据监测***、方法、服务器和存储介质
CN115878592A (zh) 一种政务数据治理方法、装置、存储介质及电子设备
CN114331299B (zh) 数据处理方法、装置、电子设备和计算机可读存储介质
WO2022078149A1 (zh) 信息处理方法、装置、设备及计算机可读存储介质
CN110297842B (zh) 一种数据比对方法、装置、终端和存储介质
CN117033997A (zh) 数据切分方法、装置、电子设备和介质
CN111709767B (zh) 一种数据处理方法及装置
Taşyürek A novel approach to improve the performance of the database storing big data with time information
KR20220115859A (ko) 프로세스의 에지 테이블 표현
Hunter et al. Large scale estimation in cyberphysical systems using streaming data: A case study with smartphone traces
CN112307047A (zh) 生产问题处理方法、装置、设备和存储介质
CN112131291A (zh) 基于json数据的结构化解析方法、装置、设备及存储介质
CN110727538A (zh) 一种基于模型命中概率分布的故障定位***及方法
CN109614506A (zh) 一种基于rocksdb排重数据导入图库的方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination