CN115049159B - 人口分布预测方法和装置、存储介质及电子设备 - Google Patents

人口分布预测方法和装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115049159B
CN115049159B CN202210965718.9A CN202210965718A CN115049159B CN 115049159 B CN115049159 B CN 115049159B CN 202210965718 A CN202210965718 A CN 202210965718A CN 115049159 B CN115049159 B CN 115049159B
Authority
CN
China
Prior art keywords
population
target
data
traffic cell
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210965718.9A
Other languages
English (en)
Other versions
CN115049159A (zh
Inventor
赵鹏军
司子黄
陈霄依
万婕
万丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202210965718.9A priority Critical patent/CN115049159B/zh
Publication of CN115049159A publication Critical patent/CN115049159A/zh
Application granted granted Critical
Publication of CN115049159B publication Critical patent/CN115049159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Library & Information Science (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种人口分布预测方法和装置、存储介质及电子设备。其中,所述方法包括:从多源时空大数据库中获取目标城市的多源时空大数据,多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量。本发明解决了相关技术中无法精准预测城市人口分布的技术问题。

Description

人口分布预测方法和装置、存储介质及电子设备
技术领域
本发明涉及通信技术领域,具体而言,涉及一种人口分布预测方法和装置、存储介质及电子设备。
背景技术
精准预测城市居住人口分布对于城市规划与管理具有极其重要的价值,相关技术中的城市居住人口分布模拟预测技术主要是采用人口总量及分布统计调查数据、社会经济及环境设施数据、手机信令数据;应用简单线性回归模型(SLR)、地理加权回归(GWR)模型、多智能体模型(ABM)、重力模型(Gravity Model)、空间增量模型(Incremental SpaceModel)、机器学习与人工神经网络(Machine Learning and Artificial Neural Network)模型等,进行当期人口数据空间化或基于社会经济及环境设施数据进行人口数量分布模拟测算,为学术研究和政府规划提供人口分布底图数据。然而相关技术中存在如下问题:
(1)缺乏对人口分布因素相互作用关系和作用机理的量化测定。无论是简单线性回归模型、地理加权回归模型,抑或是机器学习如人工神经网络等,对居住人口数量与人口分布因素之间的相互关系基本是通过数值拟合人口分布与影响因素关系,其对于城市居住人口分布因素之间的互相作用关系缺乏较为精准且详尽的精确计量。
(2)缺乏能同时准确模拟影响城市居住人口分布多个关键因素的***化模拟模型。现有模型往往仅针对某一方面问题,模型假设条件较为理想化,不够贴近城市复杂***真实情况,缺乏同时考虑人口社会经济属性和地理信息等众多影响人口分布的关键性要素,且准确进行城市***化模拟的模型。
(3)缺乏对城市居住人口分布的实时动态预测。现有模型大多是在人口分布总量基础上进行人口数据空间化,基本是基于当期社会经济属性和地理信息数据进行当期人口分布测算,并非沿时间轴向未来进行时序预测。无法对城市居住人口分布进行实时化、动态化模拟预测,导致模拟结果难以及时反映真实情况,模拟结果应用范围较窄。
发明内容
本发明实施例提供了一种人口分布预测方法和装置、存储介质及电子设备,以至少解决相关技术中无法精准预测城市人口分布的技术问题。
根据本发明实施例的一个方面,提供了一种人口分布预测方法,包括:从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量。
根据本发明实施例的另一方面,还提供了一种人口分布预测装置,包括:第一获取单元,用于从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;第二获取单元,用于基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;第三获取单元,用于基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;确定单元,用于基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过上述计算机程序执行上述的人口分布预测方法。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述人口分布预测方法。
在本发明实施例中,采用了从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量的方法,在上述方法中,由于通过多维因素构建人口分别预测模型,可以实现居住人口分布实时动态预测,进而解决了相关技术中无法精准预测城市人口分布的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的人口分布预测方法的应用环境的示意图;
图2是根据本发明实施例的另一种可选的人口分布预测方法的应用环境的示意图;
图3是根据本发明实施例的一种可选的人口分布预测方法的流程示意图;
图4是根据本发明实施例的另一种可选的人口分布预测方法的流程示意图;
图5是根据本发明实施例的一种可选的人口分布格局预测示意图;
图6是根据本发明实施例的另一种可选的人口分布格局预测示意图;
图7是根据本发明实施例的一种可选的人口分布格局空间分区预测结果示意图;
图8是根据本发明实施例的另一种可选的人口分布格局空间分区预测结果示意图;
图9是根据本发明实施例的一种可选的人口分布预测装置的结构示意图;
图10是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本发明实施例领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种人口分布预测方法,作为一种可选地实施方式,上述人口分布预测方法可以但不限于应用于如图1所示的应用环境中。与用户进行人机交互的终端设备102、网络104、服务器106。用户108与终端设备102之间可以进行人机交互,终端设备102中运行有人口分布预测应用客户端。上述终端设备102中包括人机交互屏幕1022,处理器1024及存储器1026。人机交互屏幕1022用于呈现目标城市人口分布的界面;处理器1024用于获取电力运维的多源异构数据集。存储器1026用于存储多源时空大数据。
此外,服务器106中包括数据库1062及处理引擎1064,数据库1062中用于存储多源时空大数据。处理引擎1064用于:基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量。
作为另一种可选的实施方式,本申请上述知识图谱构建上述方法可以应用于图2中。如图2所示,用户202与电子设备204之间可以进行人机交互。电子设备204中包含有存储器206和处理器208。本实施例中电子设备204可以但不限于参考执行上述终端设备102所执行的操作,确定目标小区在所述目标时段的居住人口数量。
可选地,上述终端设备102和电子设备204可以但不限于为手机、平板电脑、笔记本电脑、PC机等终端,上述网络104可以包括但不限于无线网络或有线网络。其中,该无线网络包括:WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器106可以包括但不限于任何可以进行计算的硬件设备。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
为了解决上述技术问题,作为一种可选地实施方式,如图3所示,本发明实施例提供了一种人口分布预测方法,包括如下步骤:
S302,从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;
S304,基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;
S306,基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;
S308,基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量。
在本发明实施例中,采用了从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量的方法,在上述方法中,由于通过多维因素构建人口分别预测模型,可以实现居住人口分布实时动态预测,进而解决了相关技术中无法精准预测城市人口的技术问题。
在一个或多个实施例中,根据所述手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据构建所述多源时空大数据库;
其中,所述手机信令数据包括:年龄标签、性别标签、驻留信息、居住地网格编号、网格居住人口数量;
所述卫星遥感大数据主要包括遥感与土地利用数据;
所述基础地理信息数据包括所述目标城市各级行政区划图和道路网络数据;
所述统计普查数据包括人口、土地、交通和社会经济数据;
所述互联网POI数据包括如商业设施、工业设施、公共服务设施的数量分布数据和房价数据。在一个或多个实施例中,所述基于参数回归分析模型获取目标时段所述目标城市的居住人口,包括:
通过公式(1)获取目标时段所述目标城市的居住人口:
Figure 136807DEST_PATH_IMAGE001
(1)
其中,Rt为t时段的城市居住人口数量,Rt-1为(t-1)时段的城市居住人口数量,
Figure 863455DEST_PATH_IMAGE002
为(t-1)时段全市人口抚养比,ρLARt-1为(t-1)时段相对于建设用地面积的人口密度;
Figure 762141DEST_PATH_IMAGE003
为历史时间段当前城市的国内生产总值年均增长率,
Figure 738187DEST_PATH_IMAGE004
为t时段当前城市的建设用地面积总量,
Figure 996999DEST_PATH_IMAGE005
依次为模型常数、(t-1)时段的城市居住人口数量的回归拟合参数、(t-1)时段全市人口抚养比的回归拟合参数、(t-1)时段相对于建设用地面积的人口密度的回归拟合参数、历史时间段城市的国内生产总值年均增长率的回归拟合参数、t时段城市的建设用地面积总量的回归拟合参数。
在一个或多个实施例中,所述基于时序预测模型确定所述居住人口的年龄结构,包括:
基于公式(2)确定所述居住人口的年龄结构:
Figure 109311DEST_PATH_IMAGE006
(2)
其中,
Figure 444478DEST_PATH_IMAGE007
表示为从t时段到t-p时段的随机变量,
Figure 376662DEST_PATH_IMAGE008
为t时段到t-q时段的扰动项,且序列为随机序列;
Figure 455476DEST_PATH_IMAGE009
为随机变量的回归参数,
Figure 156716DEST_PATH_IMAGE010
为随机序列的回归参数;
当模型用于计算老龄化率时,随机变
Figure 912051DEST_PATH_IMAGE011
表示t时段,t-1时段…t-p时段老龄化率;当模型用于计算未成年人百分比时
Figure 597110DEST_PATH_IMAGE012
依次为t时段,t-1时段...t-p时段未成年人百分比;
Figure 948457DEST_PATH_IMAGE013
中,WN为纯随机序列白噪声,
Figure 35362DEST_PATH_IMAGE014
为该白噪声的方差。
在一个或多个实施例中,所述基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量,包括:
通过公式(3)获取所述目标时段内目标类型居民选择从交通小区i迁移到交通小区j的概率:
Figure 712331DEST_PATH_IMAGE015
(3)
其中,A=
Figure 619107DEST_PATH_IMAGE016
,B=
Figure 29272DEST_PATH_IMAGE017
,C=
Figure 970683DEST_PATH_IMAGE018
,
D=
Figure 818553DEST_PATH_IMAGE019
,E=
Figure 212626DEST_PATH_IMAGE020
F=
Figure 171354DEST_PATH_IMAGE021
;
Figure 216540DEST_PATH_IMAGE022
表示(t-1)到t时段内目标组别居民比较交通小区i和交通小区j时选择继续居住在交通小区i的概率,
Figure 969732DEST_PATH_IMAGE023
为t-1时段交通小区i的住房价格,
Figure 851100DEST_PATH_IMAGE024
为t-1时段交通小区j的住房价格,
Figure 613520DEST_PATH_IMAGE025
为交通小区i的区位可达性,
Figure 529523DEST_PATH_IMAGE026
为交通小区j的区位可达性,
Figure 453617DEST_PATH_IMAGE027
为交通小区i公交站线路数量,
Figure 71549DEST_PATH_IMAGE028
为交通小区j公交站线路数量,
Figure 106501DEST_PATH_IMAGE029
为t-1时段交通小区i的就业岗位数量,
Figure 142590DEST_PATH_IMAGE030
为t-1时段交通小区j的就业岗位数量,
Figure 503164DEST_PATH_IMAGE031
为交通小区i职住关系系数,
Figure 93546DEST_PATH_IMAGE032
为交通小区j职住关系系数,Li,j为交通小区i到j的距离,BUPoii为t-1时段交通小区i的商业类型POI密度,BUPoij为t-1时段交通小区j的商业类型POI密度,
Figure 197768DEST_PATH_IMAGE033
为通过最大似然估计标定生成的回归系数;
基于所述交通小区i迁移到交通小区j的概率,获取则从交通小区i迁移到交通小区j的居住人口数。
在一个或多个实施例中,所述人口分布预测方法还包括:
根据年龄阶段和性别将居民划分为以下六种组别:包括18岁以下未成年男性的第一组别;
包括18岁以下未成年女性的第二组别
包括19-59岁男性居民的第三组别
包括19-59岁女性居民的第四组别
包括60岁以上男性老年人的第五组别
包括60岁以上女性老年人的第六组别。
在一个或多个实施例中,所述基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量,包括:
获取t-1到t时段不同组别的新增居住人口;
基于公式(4)确定t-1到t时段交通小区i分配迁入的目标组别居住人口数量
Figure 72052DEST_PATH_IMAGE034
Figure 603527DEST_PATH_IMAGE035
(4)
其中,
Figure 946784DEST_PATH_IMAGE036
为t-1到t时段分配迁入所述目标城市的目标组别居住人口数量,
Figure 323539DEST_PATH_IMAGE037
为根据空间增量模型得到的吸引函数的比例;
根据公式(5)获取所述
Figure 68641DEST_PATH_IMAGE038
Figure 754706DEST_PATH_IMAGE039
(5)
其中,所述
Figure 585259DEST_PATH_IMAGE040
为交通小区i的居住吸引力系数,i∈[1,27101];
所述居住吸引力系数通过公式(6)获取:
Figure 31284DEST_PATH_IMAGE041
(6)
其中,
Figure 365313DEST_PATH_IMAGE042
为t-1时段交通区i的住房价格,
Figure 238591DEST_PATH_IMAGE043
为t时刻交通小区i的区位可达性,
Figure 290861DEST_PATH_IMAGE044
为t-1时刻交通小区i的就业岗位数量,
Figure 789844DEST_PATH_IMAGE045
为t-1时刻交通小区i的居住人口数量,BUPoii为t-1时刻交通小区i的商业POI密度,
Figure 978380DEST_PATH_IMAGE046
依次为经验估计变量参数;
基于所述
Figure 22559DEST_PATH_IMAGE034
,通过公式(7)和(8)获取交通小区i在t时段不同组别的居住人口数量
Figure 562125DEST_PATH_IMAGE047
,和交通小区i在t时点的居住人口数量
Figure 349952DEST_PATH_IMAGE048
Figure 924153DEST_PATH_IMAGE049
(7)
Figure 122922DEST_PATH_IMAGE050
(8)
其中,i∈[1,6]。
基于上述实施例,在一应用实施例中,如图4所示,上述人口分布预测方法包括如下内容:
(1)本发明实施例基于经济普查数据、手机信令大数据、房价交易数据、POI数据、城市建设统计年鉴数据、OSM路网数据等通过数据清洗、集成、变换、规约构建多源时空大数据库。
(2)基于多元时空大数据库,应用多源时空大数据量化测定居住人口分布主要因素之间的关系与作用机理。研究城市人口总量规模增长、城市人口年龄结构、城市居住人口迁居行为选择影响要素、城市居住吸引力评价指标等的时空格局与变化规律,并通过相关性分析、主成分分析、因子分析等选取主要影响因素,并通过现有数据进行影响效应与作用机理研究。
(3)构建基于多源时空大数据的居住人口分布***模拟模型。首先基于基准年多源时空大数据对居民进行不同特征人群分类,并基于随机效用理论、***动力学和效用最大化原则,考虑房价、可达性、就业活力、居住活力、商业活力、公共设施等主要居住地选择影响因素,对于不同人群居住迁移选择这一微观行为活动分别建立离散选择模型预测模型并求解,得到基准场景下的城市存量人口迁移选择时空动态演变结果。再考虑城市间人口迁移流动与城市人口总量自然增长,构建居住吸引力系数,并借鉴空间增量分配模型,构建新增人口空间增量分布模型,对城市新增人口进行空间分配,同时考虑政府规划和单元人口密度限制,对部分地区通过政策调控因子控制新增人口,综合以上,建立基于多源时空大数据的居住人口分布***模拟模型,模拟仿真城市居住人口格局形成及演变。
(4)通过时空大数据库,特别是其中的手机信令数据实现数据时空颗粒度提高,综合考虑某些影响因素的滞后效应和某些即时性影响因素,构建时空动态预测模型,并基于高刷新的数据源和模型架构,实现居住人口分布实时动态预测。
具体地,以2015年作为基准年,2020年作为预测年的XX市人口预测为例,上述的人口分布预测方法还包括:
(1)应用多源时空大数据量化测定居住人口分布主要因素:
多源时空大数据主要包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网POI数据。
本发明实施例中,手机信令数据主要用于获取城市分类别常住人口分布数据和城市分类别常住人口居住迁移数据,具体包括年龄标签(未成年人口、劳动力人口、老年人口)、性别标签(男性、女性)、驻留信息、居住地网格编号、网格居住人口数量等信息,并识别不同类型常住人口、人口居住地分布和人口迁移情况。基础地理信息数据包括XX市各级行政区划底图和道路网络数据,并基于路网统计交通设施水平相关指标(道路网络密度、道路交叉口密度、交通小区内公交站点个数和地铁线路条数)和区位可达性。统计、普查数据主要包括人口、土地、交通、社会经济数据,如第七次人口普查数据,GDP总量、GDP增长率、建设用地面积、老龄化率、未成年比例等。互联网POI数据主要包括如商业设施、工业设施、公共服务设施等数量分布数据和房价数据。卫星遥感大数据主要包括遥感与土地利用数据产品。
本发明实施例基于中心地理论、劳动地域分工理论建立城市居住人口总量与劳动力供给、城市经济状况和建设用地供给等因素的影响作用关系;基于人地关系理论、竞租理论、行为学、人口学理论等构建城市人口居住选择行为与房价、交通设施与可达性、商业设施等之间的响应关系,基于城市圈层结构、城市设施布局及行为科学研究构建考虑职住、商业活力、交通可达性及住房价格的居住吸引力测定函数。综合人口-土地-交通-经济等多子***,基于时空大数据库海量数据支持测定城市居住人口主要因素作用及机理。
(2)基于多源时空大数据的居住人口分布***模拟模型与实时预测:
①对于案例城市,采用参数回归法预测t时点城市的居住人口总量
Figure 415363DEST_PATH_IMAGE052
,模型如下:
Figure 475723DEST_PATH_IMAGE053
其中,Rt为t时段的城市居住人口数量,Rt-1为(t-1)时段的城市居住人口数量,
Figure 904431DEST_PATH_IMAGE054
为(t-1)时段全市人口抚养比,ρLARt-1为(t-1)时段相对于建设用地面积的人口密度;
Figure 290413DEST_PATH_IMAGE055
为历史时间段当前城市的国内生产总值年均增长率,
Figure 53838DEST_PATH_IMAGE056
为t时段当前城市的建设用地面积总量,
Figure 183468DEST_PATH_IMAGE057
依次为模型常数、(t-1)时点的城市居住人口数量、(t-1)时点全市人口抚养比、(t-1)时点相对于建设用地面积的人口密度、过去5年城市的国内生产总值年均增长率、t时点城市的建设用地面积总量的回归拟合参数。
②采用时序预测法对城市居住人口的年龄结构进行预测,因变量为:
t时点城市居住人口的老龄化率
Figure 466682DEST_PATH_IMAGE058
(60岁以上居民在人口总规模中的占比);
t时点城市居住人口的未成年人百分比
Figure 23565DEST_PATH_IMAGE059
(18岁以下居民在人口总规模中的占比结构等)。
基于过去数年的人口老龄化率和未成年人百分比,采用时间序列模型进行预测拟合。依据实际数据的偏自相关函数(PACF)和自相关函数(ACF)检验结果确定滞后阶数,采用自回归移动平均方法,建立ARMA(p, q)模型,模型函数如下:
Figure 759440DEST_PATH_IMAGE060
其中,
Figure 692761DEST_PATH_IMAGE061
表示为从t时段到t-p时段的随机变量,
Figure 97327DEST_PATH_IMAGE062
为t时段到t-q时段的扰动项,且序列为随机序列;
Figure 825112DEST_PATH_IMAGE063
为随机变量的回归参数,
Figure 313862DEST_PATH_IMAGE064
为随机序列的回归参数;
当模型用于计算老龄化率时,随机变量
Figure 519715DEST_PATH_IMAGE065
表示t时段,t-1时段…t-p时段老龄化率;当模型用于计算未成年人百分比时
Figure 777521DEST_PATH_IMAGE066
依次为t时段,t-1时段...t-p时段未成年人百分比;
Figure 925475DEST_PATH_IMAGE067
中,WN为纯随机序列白噪声,
Figure 901521DEST_PATH_IMAGE014
为该白噪声的方差。
③迁居随机效用选择模型构建
对于(t-1)时刻(即基准年)的各组别存量居民分别构建logit模型进行是否迁居的选择:
居民按社会经济特征划分为以下6类:(t-1)时期区域i的第a组别居住人口数量为
Figure 645486DEST_PATH_IMAGE068
,其中i∈[1,27101],且为整数。
1)18岁以下男性未成年;
2)18岁以下女性未成年;
3)19-59岁男性居民;
4)19-59岁女性居民;
5)60岁以上男性老年人;
6)60岁以上女性老年人;
被解释变量
Figure 23378DEST_PATH_IMAGE069
表示(t-1)到t(预测年)时段内a(a=1,2,…6)类居民比较交通小区i和j时选择继续居住在交通小区i的概率(迁居为0,不迁居为1)。解释变量包括:
Figure 92965DEST_PATH_IMAGE023
为t-1时段交通小区i的住房价格,
Figure 290728DEST_PATH_IMAGE070
为t-1时段交通小区j的住房价格,
Figure 353231DEST_PATH_IMAGE071
为交通小区i的区位可达性,
Figure 585629DEST_PATH_IMAGE026
为交通小区j的区位可达性,
Figure 826117DEST_PATH_IMAGE072
为交通小区i公交站线路数量,
Figure 511177DEST_PATH_IMAGE028
为交通小区j公交站线路数量,
Figure 862524DEST_PATH_IMAGE073
为t-1时段交通小区i的就业岗位数量,
Figure 933117DEST_PATH_IMAGE074
为t-1时段交通小区j的就业岗位数量,
Figure 610086DEST_PATH_IMAGE075
为交通小区i职住关系系数,
Figure 782441DEST_PATH_IMAGE076
为交通小区j职住关系系数,Li,j为交通小区i到j的距离,BUPoii为t-1时段交通小区i的商业类型POI密度,BUPoij为t-1时段交通小区j的商业类型POI密度,
Figure 671900DEST_PATH_IMAGE077
为通过最大似然估计标定生成的回归系数,通过最大似然估计标定生成。得到以概率形式表达的logistic模型:
Figure 613311DEST_PATH_IMAGE078
其中,A=
Figure 461181DEST_PATH_IMAGE016
,B=
Figure 104521DEST_PATH_IMAGE079
,C=
Figure 63250DEST_PATH_IMAGE018
,
D=
Figure 859167DEST_PATH_IMAGE019
,E=
Figure 877939DEST_PATH_IMAGE080
F=
Figure 759307DEST_PATH_IMAGE081
;
依据现有不同组别居民在空间上的分布状态,使用此回归模型,得到(t-1)到t时段内a类居民选择从交通小区i迁移到交通小区j的概率
Figure 521727DEST_PATH_IMAGE082
,以该概A率作为从交通小区i现有居住人口中迁居到交通小区j的比例。则从交通小区i迁移到交通小区j的居住人口数为:
Figure 421419DEST_PATH_IMAGE083
④基于居住吸引力系数的人口空间增量分布模型构建
对于城市(t-1)到t时段总新增居住人口
Figure 345512DEST_PATH_IMAGE084
,考虑居民的组别结构。由外生给定的全市新增人口的老龄化百分比Agt、未成年人百分比UAgt,以及给定的人口性别结构,男性人口占比SRt计算得到总新增人口中的1至6类,其中6类人群数量,通如下公式来获取不同类别人群占比:
Figure 714177DEST_PATH_IMAGE085
1)18岁以下未成年男性;
2)18岁以下未成年女性;
3)19-59岁男性居民;
4)19-59岁女性居民;
5)60岁以上老年人男性;
6)60岁以上老年人女性;
再将全市待分配各组别居住人口分别依据居住吸引力进行居住区位分配,(t-1)到t时段交通小区i分配迁入的组别a居住人口数量
Figure 14708DEST_PATH_IMAGE034
为:
Figure 50797DEST_PATH_IMAGE086
根据空间增量模型而来的吸引函数的比例将全局增量分配给各个区域,吸引函数的比例为
Figure 129480DEST_PATH_IMAGE087
其中,
Figure 251020DEST_PATH_IMAGE040
为交通小区i的居住吸引力系数,吸引力变量由柯布-道格拉斯函数形式的多元公式表达,即参数幂的乘积形式:
Figure 89663DEST_PATH_IMAGE088
Figure 714680DEST_PATH_IMAGE042
为t-1时段交通区i的住房价格,
Figure 980576DEST_PATH_IMAGE043
为t时刻交通小区i的区位可达性,
Figure 323833DEST_PATH_IMAGE089
为t-1时刻交通小区i的就业岗位数量,
Figure 481013DEST_PATH_IMAGE090
为t-1时刻交通小区i的居住人口数量,BUPoii为t-1时刻交通小区i的商业POI密度,
Figure 960536DEST_PATH_IMAGE046
依次为经验估计变量参数。
综合增量分配和存量选择后,得到本发明最终输出结果,即交通小区i在t时点分组别的居住人口数量
Figure 662913DEST_PATH_IMAGE047
和交通小区i在t时点的居住人口数量
Figure 493466DEST_PATH_IMAGE048
Figure 673911DEST_PATH_IMAGE091
Figure 273520DEST_PATH_IMAGE092
;其中,i∈[1,6]。
在一实施例中,基于多源时空大数据的城市居住人口分布动态模拟预测技术,对XX市展开实例应用,具体内容如下:
(1)应用多源时空大数据量化测定居住人口分布主要因素:
2020年XX市常住人口居住分布格局模拟预测的具体时空大数据来源如表1所示,主要包括手机信令数据,基础地理信息数据,统计、普查数据和互联网POI数据。
基于统计学、城市地理学方法、过往研究及上文,分别计算量化并提取形成居住人口分布主要影响因素如房价、交通设施、可达性、商业设施、职住等。
Figure 401925DEST_PATH_IMAGE093
(2)城市居住人口分布的动态化模型建立与模拟预测
基于时空大数据及居住人口分布主要影响因素及作用机理,构建线性回归模型及自回归滑动平均模型,对城市人口总量和年龄结构进行建模预测,再利用“基于区位选择模型和增量分布模型的城市人口时空分布动态预测模型”,分别模拟计算XX市存量人口居住迁移流动格局和新增人口空间分配格局,并综合得到2020年XX市居住人口分布格局模拟预测结果。
(3)预测结果
将2020年居住人口分布预测结果同基于2020年第7次人口普查数据校正的某运营商居住人口分布真值进行比较,如图5和图6所示,从XX市全局居住人口分布量预测精度上看,2020年XX市居住人口分布格局模拟预测结果与实际结果较为吻合,预测精度达71.3%,较为准确地预测出了XX市常住人口居住分布格局;如图7和图8所示,从不同区域空间尺度居住人口分布预测精度角度分析,五环内预测精度可达69.2%,六环内预测精度为68.8%;从行政区尺度,中心城区如A区预测精度可达74.1%,B区69.7%,C区78.1%,D区91.1%。总体预测精度和空间区域预测精度均较好,特别是在中心城区等预测精度最高。
本发明实施例还具有以下有益的技术效果:
基于多源时空大数据,结合人口分布数据,揭示人口分布形成及演变时空规律特征。多源时空大数据具有样本量大、时效性强、覆盖范围广、获取成本低、时空粒度精细等优势特点,能够克服传统统计数据和调查数据在数据量、时效性、人力物力投入及实践过程等方面的局限性。本发明实施例基于多源时空大数据,量化测定居住人口分布主要因素之间的相互关系,其次,构建基于多源时空大数据的居住人口分布***模拟模型后,实时动态预测居住人口分布。
在居住人口分布主要因素之间相互关系的量化测定中,区别于以往对于居住人口分布主要因素及相互关系和作用机理研究不全面,不透彻的方式,本发明实施例基于人口学、***动力学及城市***复杂规律等,全面、科学的挖掘出人口、社会经济、交通、土地等多***维度与人口分布及居住迁移流动的内在规律,准确认识和厘清居住人口分布主要因素及作用机理,为一切基于人口分布与人类活动的社会实践和科学研究提供基底。
在构建居住人口分布***模拟模型过程中,相较于现有传统方法无法兼顾简单实用原则、科学合理原则以及精准模拟原则的特点。本发明实施例将居住人口格局从静态切片提升至动态演变,从存量更新迁移和增量空间分配角度,基于随即效用理论、距离衰减效应、居住吸引力原则和效用最大化原则,同时考虑居住人口主要因素及作用机理,分别构建居民离散选择和增量分布模型,优化了模型算法设计合理性,提高模型空间精度和模拟结果准确度,突破了既有模型的局限性。
在居住人口分布的实时动态预测中,不同于既有研究及技术中不考虑居住人口分布演变规律,仅基于自回归进行时序预测,或是只基于当期其他数据通过数值拟合测算居住人口分布,无法进行时序预测的情况。本发明实施例构建基于多源时空大数据,综合考虑往期和当期居住人口分布和自然、社会经济等复杂***相互影响规律,构建高时空分辨率、高动态刷新、可变尺度和调控灵活的居住人口分布实时动态预测技术,突破既有技术仅进行静态模拟的缺陷,真正做到居住人口分布实时动态演化、生长与预测。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述人口分布预测方法的人口分布预测装置。如图9所示,该装置包括:
第一获取单元902,用于从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;
第二获取单元904,用于基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;
第三获取单元906,用于基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;
确定单元908,用于基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量。
在本发明实施例中,采用了从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量的方法,在上述方法中,由于通过多维因素构建人口分别预测模型,可以实现居住人口分布实时动态预测,进而解决了相关技术中无法精准预测城市人口的技术问题。
在一个或多个实施例中,上述人口分布预测装置,还包括:
构建单元,用于根据所述手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据构建所述多源时空大数据库;
其中,所述手机信令数据包括:年龄标签、性别标签、驻留信息、居住地网格编号、网格居住人口数量;
所述卫星遥感大数据主要包括遥感与土地利用数据;
所述基础地理信息数据包括所述目标城市各级行政区划图和道路网络数据;
所述统计普查数据包括人口、土地、交通和社会经济数据;
所述互联网POI数据包括如商业设施、工业设施、公共服务设施的数量分布数据和房价数据。
在一个或多个实施例中,所述第二获取单元904,包括:
第一获取模块,用于通过公式(1)获取目标时段所述目标城市的居住人口:
Figure 719774DEST_PATH_IMAGE053
(1)
其中,Rt为t时段的城市居住人口数量,Rt-1为(t-1)时段的城市居住人口数量,
Figure 438331DEST_PATH_IMAGE094
为(t-1)时段全市人口抚养比,ρLARt-1为(t-1)时段相对于建设用地面积的人口密度;
Figure 892446DEST_PATH_IMAGE055
为历史时间段当前城市的国内生产总值年均增长率,
Figure 936626DEST_PATH_IMAGE056
为t时段当前城市的建设用地面积总量,
Figure 725459DEST_PATH_IMAGE057
依次为模型常数、(t-1)时段的城市居住人口数量的回归拟合参数、(t-1)时段全市人口抚养比的回归拟合参数、(t-1)时段相对于建设用地面积的人口密度的回归拟合参数、历史时间段城市的国内生产总值年均增长率的回归拟合参数、t时段城市的建设用地面积总量的回归拟合参数。
在一个或多个实施例中,所述第三获取单元906,还包括:
第一确定模块,用于基于公式(2)确定所述居住人口的年龄结构:
Figure 513286DEST_PATH_IMAGE060
(2)
其中,
Figure 821908DEST_PATH_IMAGE061
表示为从t时段到t-p时段的随机变量,
Figure 36989DEST_PATH_IMAGE062
为t时段到t-q时段的扰动项,且序列为随机序列;
Figure 63850DEST_PATH_IMAGE063
为随机变量的回归参数,
Figure 389790DEST_PATH_IMAGE064
为随机序列的回归参数;
当模型用于计算老龄化率时,随机变
Figure 67764DEST_PATH_IMAGE065
表示t时段,t-1时段…t-p时段老龄化率;当模型用于计算未成年人百分比时
Figure 188167DEST_PATH_IMAGE066
依次为t时段,t-1时段...t-p时段未成年人百分比;
Figure 967904DEST_PATH_IMAGE095
中,WN为纯随机序列白噪声,
Figure 97534DEST_PATH_IMAGE014
为该白噪声的方差。
在一个或多个实施例中,所述第三获取单元906,包括:
第二获取模块,用于通过公式(3)获取所述目标时段内目标类型居民选择从交通小区i迁移到交通小区j的概率:
Figure 115169DEST_PATH_IMAGE078
(3)
其中,A=
Figure 921320DEST_PATH_IMAGE016
,B=
Figure 922774DEST_PATH_IMAGE079
,C=
Figure 856095DEST_PATH_IMAGE018
,
D=
Figure 728236DEST_PATH_IMAGE019
,E=
Figure 721600DEST_PATH_IMAGE096
F=
Figure 944771DEST_PATH_IMAGE081
;
Figure 399892DEST_PATH_IMAGE097
表示(t-1)到t时段内目标组别居民比较交通小区i和交通小区j时选择继续居住在交通小区i的概率,
Figure 657698DEST_PATH_IMAGE023
为t-1时段交通小区i的住房价格,
Figure 821963DEST_PATH_IMAGE024
为t-1时段交通小区j的住房价格,
Figure 266851DEST_PATH_IMAGE025
为交通小区i的区位可达性,
Figure 541974DEST_PATH_IMAGE026
为交通小区j的区位可达性,
Figure 903554DEST_PATH_IMAGE027
为交通小区i公交站线路数量,
Figure 973141DEST_PATH_IMAGE028
为交通小区j公交站线路数量,
Figure 905325DEST_PATH_IMAGE029
为t-1时段交通小区i的就业岗位数量,
Figure 718560DEST_PATH_IMAGE030
为t-1时段交通小区j的就业岗位数量,
Figure 685379DEST_PATH_IMAGE098
为交通小区i职住关系系数,
Figure 175135DEST_PATH_IMAGE076
为交通小区j职住关系系数,Li,j为交通小区i到j的距离,BUPoii为t-1时段交通小区i的商业类型POI密度,BUPoij为t-1时段交通小区j的商业类型POI密度,
Figure 860195DEST_PATH_IMAGE033
为通过最大似然估计标定生成的回归系数;
第三获取模块,用于基于所述交通小区i迁移到交通小区j的概率,获取则从交通小区i迁移到交通小区j的居住人口数。
在一个或多个实施例中,上述人口分布预测装置,还包括:
划分单元,用于根据年龄阶段和性别将居民划分为以下六种组别:包括18岁以下未成年男性的第一组别;
包括18岁以下未成年女性的第二组别
包括19-59岁男性居民的第三组别
包括19-59岁女性居民的第四组别
包括60岁以上男性老年人的第五组别
包括60岁以上女性老年人的第六组别。
在一个或多个实施例中,所述确定单元908,包括:
第四获取模块,用于获取t-1到t时段不同组别的新增居住人口;
基于公式(4)确定t-1到t时段交通小区i分配迁入的目标组别居住人口数量
Figure 477121DEST_PATH_IMAGE099
Figure 564026DEST_PATH_IMAGE100
(4)
其中,
Figure 975415DEST_PATH_IMAGE036
为t-1到t时段分配迁入所述目标城市的目标组别居住人口数量,
Figure 131459DEST_PATH_IMAGE037
为根据空间增量模型得到的吸引函数的比例;
根据公式(5)获取所述
Figure 286497DEST_PATH_IMAGE038
Figure 493487DEST_PATH_IMAGE039
(5)
其中,所述
Figure 810199DEST_PATH_IMAGE040
为交通小区i的居住吸引力系数,i∈[1,27101];
所述居住吸引力系数通过公式(6)获取:
Figure 469851DEST_PATH_IMAGE041
(6)
其中,
Figure 163000DEST_PATH_IMAGE042
为t-1时段交通区i的住房价格,
Figure 467905DEST_PATH_IMAGE043
为t时刻交通小区i的区位可达性,
Figure 221098DEST_PATH_IMAGE044
为t-1时刻交通小区i的就业岗位数量,
Figure 368045DEST_PATH_IMAGE045
为t-1时刻交通小区i的居住人口数量,BUPoii为t-1时刻交通小区i的商业POI密度,
Figure 599306DEST_PATH_IMAGE046
依次为经验估计变量参数;
基于所述
Figure 515310DEST_PATH_IMAGE034
,通过公式(7)和(8)获取交通小区i在t时段不同组别的居住人口数量
Figure 688671DEST_PATH_IMAGE047
,和交通小区i在t时点的居住人口数量
Figure 322915DEST_PATH_IMAGE048
Figure 357867DEST_PATH_IMAGE049
(7)
Figure 862797DEST_PATH_IMAGE050
(8)
其中,i∈[1,6]。
根据本发明实施例的又一个方面,还提供了一种用于实施上述人口分布预测方法的电子设备,该电子设备可以是图1所示的客户端或服务器。本实施例以该电子设备为服务器为例来说明。如图10所示,该电子设备包括存储器1002和处理器1004,该存储器1002中存储有计算机程序,该处理器1004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;
S2,基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;
S3,基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;
S4,基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量。
可选地,本领域普通技术人员可以理解,图10所示的结构仅为示意,电子装置电子设备也可以是具备网络安全检测功能的智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置电子设备的结构造成限定。例如,电子装置电子设备还可包括比图10中所示更多或者更少的组件(如网络接口等),或者具有与图10所示不同的配置。
其中,存储器1002可用于存储软件程序以及模块,如本发明实施例中的人口分布预测方法和装置对应的程序指令/模块,处理器1004通过运行存储在存储器1002内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的人口分布预测方法。存储器1002可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1002可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1002具体可以但不限于用于存储多源时空大数据等信息。作为一种示例,如图10所示,上述存储器1002中可以但不限于包括上述人口分布预测装置中的第一获取单元902、第二获取单元904、第三获取单元906与确定单元908此外,还可以包括但不限于上述人口分布预测装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1006为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器1008,用于显示上述协议解析插件的置位状态值;和连接总线1010,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述电子设备可以是一个分布式***中的一个节点,其中,该分布式***可以为区块链***,该区块链***可以是由该多个节点通过网络通信的形式连接形成的分布式***。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链***中的一个节点。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述人口分布预测方法,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;
S2,基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;
S3,基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;
S4,基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅是本发明的优选实施方式,应当指出,对于本发明实施例领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种人口分布预测方法,其特征在于,包括:
从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;
基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;
基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;
基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量,包括:
获取t-1到t时段不同组别的新增居住人口;
基于公式(4)确定t-1到t时段交通小区i分配迁入的目标组别居住人口数量
Figure 173769DEST_PATH_IMAGE001
Figure 766424DEST_PATH_IMAGE002
(4)
其中,
Figure 598245DEST_PATH_IMAGE003
为t-1到t时段分配迁入所述目标城市的目标组别居住人口数量,
Figure 541930DEST_PATH_IMAGE004
为根据空间增量模型得到的吸引函数的比例;
根据公式(5)获取所述
Figure 304350DEST_PATH_IMAGE005
Figure 17091DEST_PATH_IMAGE006
(5)
其中,所述
Figure 3502DEST_PATH_IMAGE007
为交通小区i的居住吸引力系数,i∈[1,27101];
所述居住吸引力系数通过公式(6)获取:
Figure 683751DEST_PATH_IMAGE008
(6)
其中,
Figure 984282DEST_PATH_IMAGE009
为t-1时段交通区i的住房价格,
Figure 613846DEST_PATH_IMAGE010
为t时刻交通小区i的区位可达性,
Figure 505579DEST_PATH_IMAGE011
为t-1时刻交通小区i的就业岗位数量,
Figure 174589DEST_PATH_IMAGE012
为t-1时刻交通小区i的居住人口数量,BUPoii为t-1时刻交通小区i的商业POI密度,
Figure 278811DEST_PATH_IMAGE013
依次为经验估计变量参数;
基于所述
Figure 700565DEST_PATH_IMAGE001
,通过公式(7)和(8)获取交通小区i在t时段不同组别的居住人口数量
Figure 294358DEST_PATH_IMAGE014
,和交通小区i在t时点的居住人口数量
Figure 434352DEST_PATH_IMAGE015
Figure 342265DEST_PATH_IMAGE016
(7)
Figure 136302DEST_PATH_IMAGE017
(8)
其中,i∈[1,6]。
2.根据权利要求1所述的方法,其特征在于,所述从多源时空大数据库中获取目标城市的多源时空大数据之前,还包括:
根据所述手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据构建所述多源时空大数据库;
其中,所述手机信令数据包括:年龄标签、性别标签、驻留信息、居住地网格编号、网格居住人口数量;
所述卫星遥感大数据主要包括遥感与土地利用数据;
所述基础地理信息数据包括所述目标城市各级行政区划图和道路网络数据;
所述统计普查数据包括人口、土地、交通和社会经济数据;
所述互联网POI数据包括商业设施、工业设施、公共服务设施的数量分布数据和房价数据。
3.根据权利要求1所述的方法,其特征在于,所述基于参数回归分析模型获取目标时段所述目标城市的居住人口,包括:
通过公式(1)获取目标时段所述目标城市的居住人口:
Figure 900996DEST_PATH_IMAGE018
(1)
其中,Rt为t时段的城市居住人口数量,Rt-1为(t-1)时段的城市居住人口数量,
Figure 528286DEST_PATH_IMAGE019
为(t-1)时段全市人口抚养比,ρLARt-1为(t-1)时段相对于建设用地面积的人口密度;
Figure 974311DEST_PATH_IMAGE020
为历史时间段当前城市的国内生产总值年均增长率,
Figure 636237DEST_PATH_IMAGE021
为t时段当前城市的建设用地面积总量,
Figure 56985DEST_PATH_IMAGE022
依次为模型常数、(t-1)时段的城市居住人口数量的回归拟合参数、(t-1)时段全市人口抚养比的回归拟合参数、(t-1)时段相对于建设用地面积的人口密度的回归拟合参数、历史时间段城市的国内生产总值年均增长率的回归拟合参数、t时段城市的建设用地面积总量的回归拟合参数。
4.根据权利要求1所述的方法,其特征在于,所述基于时序预测模型确定所述居住人口的年龄结构,包括:
基于公式(2)确定所述居住人口的年龄结构:
Figure 171571DEST_PATH_IMAGE023
(2)
其中,
Figure 155708DEST_PATH_IMAGE024
表示为从t时段到t-p时段的随机变量,
Figure 672140DEST_PATH_IMAGE025
为t时段到t-q时段的扰动项,且序列为随机序列;
Figure 559062DEST_PATH_IMAGE026
为随机变量的回归参数,
Figure 160945DEST_PATH_IMAGE027
为随机序列的回归参数;
当模型用于计算老龄化率时,随机变量
Figure 745510DEST_PATH_IMAGE028
表示t时段,t-1时段…t-p时段老龄化率;当模型用于计算未成年人百分比时
Figure 116448DEST_PATH_IMAGE029
依次为t时段,t-1时段...t-p时段未成年人百分比;
Figure 331529DEST_PATH_IMAGE030
中,WN为纯随机序列白噪声,
Figure 905861DEST_PATH_IMAGE031
为该白噪声的方差。
5.根据权利要求1所述的方法,其特征在于,所述基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量,包括:
通过公式(3)获取所述目标时段内目标类型居民选择从交通小区i迁移到交通小区j的概率:
Figure 294117DEST_PATH_IMAGE032
(3)
其中,A=
Figure 785141DEST_PATH_IMAGE033
,B=
Figure 967861DEST_PATH_IMAGE034
,C=
Figure 747598DEST_PATH_IMAGE035
,
D=
Figure 926163DEST_PATH_IMAGE036
,E=
Figure 6114DEST_PATH_IMAGE037
F=
Figure 625315DEST_PATH_IMAGE038
;
Figure 423506DEST_PATH_IMAGE039
表示(t-1)到t时段内目标组别居民比较交通小区i和交通小区j时选择继续居住在交通小区i的概率,
Figure 904297DEST_PATH_IMAGE040
为t-1时段交通小区i的住房价格,
Figure 104335DEST_PATH_IMAGE041
为t-1时段交通小区j的住房价格,
Figure 628857DEST_PATH_IMAGE042
为交通小区i的区位可达性,
Figure 179924DEST_PATH_IMAGE043
为交通小区j的区位可达性,
Figure 697362DEST_PATH_IMAGE044
为交通小区i公交站线路数量,
Figure 955168DEST_PATH_IMAGE045
为交通小区j公交站线路数量,
Figure 181750DEST_PATH_IMAGE046
为t-1时段交通小区i的就业岗位数量,
Figure 688954DEST_PATH_IMAGE047
为t-1时段交通小区j的就业岗位数量,
Figure 964078DEST_PATH_IMAGE048
为交通小区i职住关系系数,
Figure 138707DEST_PATH_IMAGE049
为交通小区j职住关系系数,Li,j为交通小区i到j的距离,BUPoii为t-1时段交通小区i的商业类型POI密度,BUPoij为t-1时段交通小区j的商业类型POI密度,
Figure 21344DEST_PATH_IMAGE050
为通过最大似然估计标定生成的回归系数;
基于所述交通小区i迁移到交通小区j的概率,获取则从交通小区i迁移到交通小区j的居住人口数。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据年龄阶段和性别将居民划分为以下六种组别:
包括18岁以下未成年男性的第一组别;
包括18岁以下未成年女性的第二组别;
包括19-59岁男性居民的第三组别;
包括19-59岁女性居民的第四组别;
包括60岁以上男性老年人的第五组别;
包括60岁以上女性老年人的第六组别。
7.一种人口分布预测装置,其特征在于,包括:
第一获取单元,用于从多源时空大数据库中获取目标城市的多源时空大数据,所述多源时空大数据包括手机信令数据、卫星遥感大数据、基础地理信息数据、统计普查数据、互联网兴趣点POI数据;
第二获取单元,用于基于参数回归分析模型获取目标时段所述目标城市的居住人口,并基于时序预测模型确定所述居住人口的年龄结构;
第三获取单元,用于基于迁居随机效用选择模型获取所目标城市在所述目标时段内在不同小区间的人口流动数量;
确定单元,用于基于人口空间增量分布模型以及所述居住人口、所述居住人口的年龄结构和所述人口流动数量,确定目标小区在所述目标时段的居住人口数量,包括:
获取t-1到t时段不同组别的新增居住人口;
基于公式(4)确定t-1到t时段交通小区i分配迁入的目标组别居住人口数量
Figure 281424DEST_PATH_IMAGE051
Figure 891397DEST_PATH_IMAGE002
(4)
其中,
Figure 920533DEST_PATH_IMAGE052
为t-1到t时段分配迁入所述目标城市的目标组别居住人口数量,
Figure 161021DEST_PATH_IMAGE053
为根据空间增量模型得到的吸引函数的比例;
根据公式(5)获取所述
Figure 449611DEST_PATH_IMAGE054
Figure 863275DEST_PATH_IMAGE055
(5)
其中,所述
Figure 950180DEST_PATH_IMAGE056
为交通小区i的居住吸引力系数,i∈[1,27101];
所述居住吸引力系数通过公式(6)获取:
Figure 423886DEST_PATH_IMAGE008
(6)
其中,
Figure 658559DEST_PATH_IMAGE057
为t-1时段交通区i的住房价格,
Figure 361067DEST_PATH_IMAGE058
为t时刻交通小区i的区位可达性,
Figure 364795DEST_PATH_IMAGE059
为t-1时刻交通小区i的就业岗位数量,
Figure 743823DEST_PATH_IMAGE060
为t-1时刻交通小区i的居住人口数量,BUPoii为t-1时刻交通小区i的商业POI密度,
Figure 200213DEST_PATH_IMAGE061
依次为经验估计变量参数;
基于所述
Figure 204947DEST_PATH_IMAGE051
,通过公式(7)和(8)获取交通小区i在t时段不同组别的居住人口数量
Figure 266443DEST_PATH_IMAGE062
,和交通小区i在t时点的居住人口数量
Figure 878690DEST_PATH_IMAGE063
Figure 822376DEST_PATH_IMAGE016
(7)
Figure 319216DEST_PATH_IMAGE064
(8)
其中,i∈[1,6]。
8.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至6任一项中所述的方法。
CN202210965718.9A 2022-08-12 2022-08-12 人口分布预测方法和装置、存储介质及电子设备 Active CN115049159B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210965718.9A CN115049159B (zh) 2022-08-12 2022-08-12 人口分布预测方法和装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210965718.9A CN115049159B (zh) 2022-08-12 2022-08-12 人口分布预测方法和装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN115049159A CN115049159A (zh) 2022-09-13
CN115049159B true CN115049159B (zh) 2022-10-21

Family

ID=83168198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210965718.9A Active CN115049159B (zh) 2022-08-12 2022-08-12 人口分布预测方法和装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115049159B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115525872B (zh) * 2022-10-13 2023-09-15 北京城建交通设计研究院有限公司 一种融合位置数据的建筑体尺度人口两步贝叶斯估计方法
CN115878964B (zh) * 2023-03-01 2023-11-24 北京市城市规划设计研究院 常住人口确定方法、装置、设备和存储介质
CN116150230B (zh) * 2023-03-02 2023-08-29 重庆市规划和自然资源信息中心 基于多空间尺度进行动态住房人口登记监测方法
CN117151322B (zh) * 2023-06-21 2024-06-04 中国联合网络通信有限公司深圳市分公司 城市属性的获取方法、装置及计算机可读存储介质
CN117151344B (zh) * 2023-10-26 2024-02-02 乘木科技(珠海)有限公司 一种数字孪生城市人口管理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190066137A1 (en) * 2017-04-24 2019-02-28 The Chicago TREND Corporation Systems and methods for modeling impact of commercial development on a geographic area
CN110490787A (zh) * 2019-07-25 2019-11-22 沈振江 一种居住区位选择的多智能体模型的建立方法
CN111126678B (zh) * 2019-12-09 2023-03-31 深圳市市政设计研究院有限公司 一种基于大数据的交通生成预测方法

Also Published As

Publication number Publication date
CN115049159A (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN115049159B (zh) 人口分布预测方法和装置、存储介质及电子设备
Long et al. Mapping block-level urban areas for all Chinese cities
Samat et al. Modelling land use changes at the peri-urban areas using geographic information systems and cellular automata model
CN113191023B (zh) 群智感知的任务分配和用户招募模型交叉验证方法及***
Pinto et al. A cellular automata model based on irregular cells: application to small urban areas
Zhao et al. LandSys: an agent-based Cellular Automata model of land use change developed for transportation analysis
CN109214863B (zh) 一种基于快递数据预测城市房屋需求的方法
Doyle et al. Population mobility dynamics estimated from mobile telephony data
CN102750411A (zh) 基于多智能体离散选择模型城市动态微观仿真方法
Li et al. Agent-based modelling of the spatial pattern of leisure visitation in forests: a case study in Wallonia, south Belgium
CN116437291B (zh) 一种基于手机信令的文化圈规划方法和***
Nejadshamsi et al. Data sources and approaches for building occupancy profiles at the urban scale–A review
Jivraj et al. Modelling spatial variation in the determinants of neighbourhood family migration in England with geographically weighted regression
Malleson et al. Optimising an agent-based model to explore the behaviour of simulated burglars
Tanton Spatial microsimulation: developments and potential future directions
Leprêtre et al. Fitness landscapes analysis and adaptive algorithms design for traffic lights optimization on SIALAC benchmark
CN110276387A (zh) 一种模型的生成方法及装置
Tu et al. Spatial cooperative simulation of land use-population-economy in the Greater Bay Area, China
Lei et al. Effects of local, network and systemic dependence on urban development
Wu et al. A BP Neural Network‐Based GIS‐Data‐Driven Automated Valuation Framework for Benchmark Land Price
Alhmoud et al. Short-term load forecasting for Jordan’s power system using neural network based different
CN115049158B (zh) 城市***运行状态的预测方法、***、存储介质及终端
Correia et al. Applying a structured simulation-based methodology to assess carpooling time–space potential
CN116167254A (zh) 基于城市大数据的多维城市仿真推演方法和***
CN111008730A (zh) 基于城市空间结构的人群聚集度预测模型构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant