CN111062000B - 一种基于离散选择模型的犯罪者作案地识别方法 - Google Patents

一种基于离散选择模型的犯罪者作案地识别方法 Download PDF

Info

Publication number
CN111062000B
CN111062000B CN201911269327.8A CN201911269327A CN111062000B CN 111062000 B CN111062000 B CN 111062000B CN 201911269327 A CN201911269327 A CN 201911269327A CN 111062000 B CN111062000 B CN 111062000B
Authority
CN
China
Prior art keywords
community
criminal
perpetrator
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911269327.8A
Other languages
English (en)
Other versions
CN111062000A (zh
Inventor
龙冬平
徐铭恩
徐冲
肖露子
宋广文
***
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou University
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN201911269327.8A priority Critical patent/CN111062000B/zh
Publication of CN111062000A publication Critical patent/CN111062000A/zh
Application granted granted Critical
Publication of CN111062000B publication Critical patent/CN111062000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Mathematical Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种基于离散选择模型的犯罪者作案地识别方法,主要应用于公共安全和犯罪地理的技术领域。该方法融合了警情数据和抓捕数据、POI数据和手机信令数据等多源时空数据,基于离散选择模型原理,增加人群流动环境、犯罪防控环境等数据对犯罪者作案地的量化模型进行了精度优化。相比基本模型,全模型对犯罪者作案地选择的拟合精度提高了8.63%。此方法还通过效应函数和概率函数来计算犯罪者对作案地社区的预期效应以及犯罪者作案地选择的概率,从而准确识别出犯罪者对作案地选择的偏好。采用本发明提供的实施例,能够实现对犯罪者作案地选择精准识别,提高了识别的有效性和准确性,并对警务防控具有重要的参考作用。

Description

一种基于离散选择模型的犯罪者作案地识别方法
技术领域
本发明涉及公共安全和犯罪地理技术领域,尤其涉及一种基于离散选择模型的犯罪者作案地识别方法。
背景技术
如何创造公众安全、社会稳定、优质高效的社会环境,一直是中国社会治安综合治理的主要挑战。在我国当前城市化过程中,如何吸取过去大量的经验和教训,运用大数据分析犯罪者的选择行为,从中找出规律或趋势,并进行犯罪防控,以解决犯罪问题的传统思路,是社会各界所关注的焦点。
离散空间选择模型(Discrete Spatial Choice Modling)广泛用于分析微观经济学中的选择行为。它以随机效用为理论基础,设想一个决策者必须对一组离散的选择做出一个选择。同时,决策者评估每个可替代选择的相对效用。考虑到作案地选择与以上选择类似,Bernasco和Nieuwbeerta将该方法引入到犯罪研究领域,并验证了荷兰海牙地区入室盗窃者的作案地选择。随后,Clare,Baudains,Johnson,Bernasco等学者研究采用这种方法对一系列犯罪类型进行了分析。
然而,整体而言,国内外关于作案地选择的研究仍存在部分不足之处,如在影响因素的验证分析方面,缺乏考虑人群流动环境和社区犯罪防控的影响,导致模型对犯罪者作案地选择的拟合度较差。在如何优化模型、提高拟合精度和有效识别犯罪者作案地选择偏好是一个亟待解决的问题。
发明内容
本发明实施例的目的是提供一种基于离散选择模型的犯罪者作案地识别方法,能够实现对犯罪者作案地选择精准识别,提高了识别的有效性和准确性,并对警务防控具有重要的参考作用。
为实现上述目的,本发明实施例提供了一种基于离散选择模型的犯罪者作案地识别方法,包括以下步骤:
获取多源时空数据,并对所述多源时空数据进行集成处理,生成各社区的社区属性集;
获取所述待识别区域地址文本对应的编码结果,通过基于规则与聚类的多源地理编码分类优化模型对所述编码结果进行优化处理,生成优化后地址文本数据对应的编码信息以构建犯罪者的作案地数据集;
根据所述犯罪者的作案地数据集和所述各社区的社区属性集,匹配得到所述犯罪者作案地所属的第一社区属性集,并将所述第一社区属性集和所述作案地数据集融合,生成模型样本;
通过对所述模型样本进行共线性诊断处理,得到符合要求的变量,并通过离散选择模型拟合所述犯罪者作案地选择偏好,得到所述犯罪者作案地选择的预期效应,以及识别所述犯罪者实行作案能够获得最大预期效应的社区;
根据条件逻辑模型和所述离散选择模型拟合所述犯罪者得到的结果,构建作案地选择概率函数,并根据所述作案地概率函数得到所述犯罪者作案地选择的概率。
进一步的,所述多源时空数据包括原始的公安部门数据、手机信令数据、人口普查数据。
进一步的,所述对所述多源时空数据进行集成处理,具体为:
根据所述手机信令数据,计算得到各社区的基站人口数;
根据各社区的基站人口数生成各社区对应的泰森多边形,并计算各社区完整的泰森多边形面积;
通过各社区的shp文件对对应的泰森多边形进行裁切,得到各社区对应的碎片化的泰森多边形;
根据人群流动密度公式、各社区的基站人口数、各社区完整的泰森多边形面积、各社区对应的碎片化的泰森多边形,计算得到各社区对应的人群流动密度;
根据社会经济异质性公式、所述人口普查数据中的不同社会经济群体的个数,计算得到各社区的社会经济异质性。
进一步的,所述人群流动密度公式为:
Figure BDA0002313730990000031
其中,Di为第i个社区的人群流动密度,n为涉及第i个社区泰森多边形的个数,Pk为第k个泰森多边形人口数,Sji为第i个社区中碎片j的面积,Ski为与第i个社区相关的第k个泰森多边形的总面积,Si为第i个社区的面积。
进一步的,所述社会经济异质性公式为:
Figure BDA0002313730990000032
其中,n为不同社会经济群体的个数,Pki为居住在第i个社区下第k个社会经济群体的比例,SEi的数值越大表示社区群体越异质。
进一步的,所述通过对所述模型样本进行共线性诊断处理,得到符合要求的变量,并通过离散选择模型拟合所述犯罪者作案地选择偏好,得到所述犯罪者作案地选择的预期效应,以及识别所述犯罪者实行作案能够获得最大预期效应的社区,具体为:
从所述模型样本中筛选出影响作案地选择的变量,并通过方差膨胀公式对所述变量进行共线性诊断,得到方差膨胀小于10的变量;其中,变量包括建成环境因素、社会环境因素、人群流动环境因素,以及犯罪防控因素变量;
通过预期效应计算公式,计算犯罪者对各社区选择的预期效应,得到犯罪者实行作案得到最大预期效应的社区。
进一步的,所述方差膨胀公式为:
Figure BDA0002313730990000041
其中,Ri为变量xi对其余变量作回归分析的负相关系数,VIF为方差膨胀系数。
进一步的,所述预期效应计算公式为:
Uij=βxijij
其中,Uij为第i个犯罪者选择在第j个社区实行犯罪的预期效应,xij为与第i个犯罪者和第j个社区相关的解释变量的值,β为解释变量的估计系数,εij为模型的随机误差。
进一步的,所述作案地选择概率函数为Prob概率函数。
进一步的,所述Prob概率函数的计算公式为:
Figure BDA0002313730990000042
其中,Yi是为第i个犯罪者的选择,xij为与第i个犯罪者和第j个社区相关的解释变量的值,β为解释变量的估计系数。
实施本发明实施例,具有如下有益效果:
与现有技术相比,本发明实施例提供的基于离散选择模型的犯罪者作案地识别方法,通过获取多源时空数据,并对所述多源时空数据进行集成处理,生成各社区的社区属性集;然后获取所述待识别区域地址文本对应的编码结果,通过基于规则与聚类的多源地理编码分类优化模型对所述编码结果进行优化处理,生成优化后地址文本数据对应的编码信息以构建犯罪者的作案地数据集;再根据所述犯罪者的作案地数据集和所述各社区的社区属性集,匹配得到所述犯罪者作案地所属的第一社区属性集,并将所述第一社区属性集和所述作案地数据集融合,生成模型样本;然后通过对所述模型样本进行共线性诊断处理,得到符合要求的变量,并通过离散选择模型拟合所述犯罪者作案地选择偏好,得到所述犯罪者作案地选择的预期效应,以及识别所述犯罪者实行作案能够获得最大预期效应的社区;最后根据条件逻辑模型和所述离散选择模型拟合所述犯罪者得到的结果,构建作案地选择概率函数,并根据所述作案地概率函数得到所述犯罪者作案地选择的概率。
本发明提供的实施例,融合了警情数据和抓捕数据、POI数据和手机信令数据等多源时空数据,基于离散选择模型原理,增加人群流动环境、犯罪防控环境等数据对犯罪者作案地的量化模型进行了精度优化。相比基本模型,全模型对犯罪者作案地选择的拟合精度提高了8.63%。
本发明提供的实施例,还通过效应函数和概率函数来计算犯罪者对作案地社区的预期效应以及犯罪者作案地选择的概率,从而准确识别出犯罪者对作案地选择的偏好,能够实现对犯罪者作案地选择精准识别,提高了识别的有效性和准确性,并对警务防控具有重要的参考作用。
附图说明
图1是本发明实施例提供的基于离散选择模型的犯罪者作案地识别方法的流程示意图;
图2是本发明另一实施例提供的基于离散选择模型的犯罪者作案地识别方法的流程示意图;
图3是本发明实施例提供的基于规则与聚类的多源地理编码分类优化模型流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明提供的基于离散选择模型的犯罪者作案地识别方法的一个实施例的流程示意图;本发明实施例提供一种基于离散选择模型的犯罪者作案地识别方法,包括步骤S1至S5;
S1,获取多源时空数据,并对所述多源时空数据进行集成处理,生成各社区的社区属性集。
在本发明实施例中,所述多源时空数据包括原始的公安部门数据(警情数据和抓捕数据)、建成环境数据、手机信令数据、人口普查数据等数据,并利用ArcGIS软件对多源异构大数据进行有效集成,生成各社区的社区属性集。
其中,公安部门数据具有案件信息数据和犯罪者个体信息数据,分别包括报案时间、地址文本、案情记录、案发地址、现居住地、案发时间、抓捕时间、抢劫对象、抢劫场所、作案工具、抢劫方式、被劫物品等信息以及姓名、民族、性别、籍贯、出生日期、职业、吸毒与否等信息。
步骤S3具体为:根据所述手机信令数据,计算得到各社区的基站人口数;根据各社区的基站人口数生成各社区对应的泰森多边形,并计算各社区完整的泰森多边形面积;通过各社区的shp文件对对应的泰森多边形进行裁切,得到各社区对应的碎片化的泰森多边形;根据人群流动密度公式、各社区的基站人口数、各社区完整的泰森多边形面积、各社区对应的碎片化的泰森多边形,计算得到各社区对应的人群流动密度;根据社会经济异质性公式、所述人口普查数据中的不同社会经济群体的个数,计算得到各社区的社会经济异质性。
在本发明的一个具体实施例中,使用手机信令数据测算人群流动密度,并当作人群流动环境指标。首先根据不同时间段的基站人口数生成泰森多边形,再计算完整的泰森多边形面积,然后用社区的shp文件对泰森多边形进行裁切,得到碎片化的泰森多边形,以及每个碎片所属的社区,再计算碎片的面积,最后除以社区面积,得到人群流动密度。计算公式如下:
Figure BDA0002313730990000071
其中,Di为第i个社区的人群流动密度,n为涉及第i个社区泰森多边形的个数,Pk为第k个泰森多边形人口数,Sji为第i个社区中碎片j的面积,Ski为与第i个社区相关的第k个泰森多边形的总面积,Si为第i个社区的面积。
然后利用人口普查数据中的住房产权差异刻画社会经济异质性,计算公式如下:
Figure BDA0002313730990000072
其中,n为不同社会经济群体的个数,Pki为居住在第i个社区下第k个社会经济群体的比例,SEi的数值越大表示社区群体越异质。
S2,获取所述待识别区域地址文本对应的编码结果,通过基于规则与聚类的多源地理编码分类优化模型对所述编码结果进行优化处理,生成优化后地址文本数据对应的编码信息以构建犯罪者的作案地数据集。
S3,根据所述犯罪者的作案地数据集和所述各社区的社区属性集,匹配得到所述犯罪者作案地所属的第一社区属性集,并将所述第一社区属性集和所述作案地数据集融合,生成模型样本。
S4,通过对所述模型样本进行共线性诊断处理,得到符合要求的变量,并通过离散选择模型拟合所述犯罪者作案地选择偏好,得到所述犯罪者作案地选择的预期效应,以及识别所述犯罪者实行作案能够获得最大预期效应的社区。
步骤S4具体为:从所述模型样本中筛选出影响作案地选择的变量,并通过方差膨胀公式对所述变量进行共线性诊断,得到方差膨胀小于10的变量;其中,变量包括建成环境因素、社会环境因素、人群流动环境因素,以及犯罪防控因素变量;通过预期效应计算公式,计算犯罪者对各社区选择的预期效应,得到犯罪者实行作案得到最大预期效应的社区。
在本发明的另一个具体实施例中,筛选影响作案地选择的自变量,并进行共线性诊断。自变量包含建成环境、社会环境、人群流动环境和犯罪防控各因素。共线性诊断使用方差膨胀系数,计算公式如下:
Figure BDA0002313730990000081
其中,Ri为变量xi对其余变量作回归分析的负相关系数,VIF为方差膨胀系数,并且要求在VIF<10下尽可能小。
然后根据步骤上述筛选得到的自变量,基于离散选择模型原理,通过效应函数计算犯罪者作案地选择的社区的预期效应,得到犯罪者实行作案得到最大预期效应的社区,计算公式如下:
Uij=βxijij
其中,Uij为第i个犯罪者选择在第j个社区实行犯罪的预期效应,xij为与第i个犯罪者和第j个社区相关的解释变量的值,β为解释变量的估计系数,εij为模型的随机误差。
S5,根据条件逻辑模型和所述离散选择模型拟合所述犯罪者得到的结果,构建作案地选择概率函数,并根据所述作案地概率函数得到所述犯罪者作案地选择的概率。
在本实施例中,所述作案地选择概率函数为Prob概率函数,所述Prob概率函数的计算公式为:
Figure BDA0002313730990000082
其中,Yi是为第i个犯罪者的选择,xij为与第i个犯罪者和第j个社区相关的解释变量的值,β为解释变量的估计系数。
为了更好说明本发明方法的原理,以下为采用本发明提供的方法进行的具体实施例:
请参见图2,首先获取ZG市公安部门数据、建成环境数据、手机信令数据、人口普查数据等数据信息,通过人群流动密度公式与社会经济异质性公式等计算归类ZG市犯罪数据、建成环境数据、社会环境数据、人群流动数据、犯罪防控数据等,并用ArcGIS软件对多源异构大数据进行有效集成,生成需识别区域各社区属性集。使用的数据包含但不限于:ZG市公安部门提供的数据有两类,第一类是2012-2016年ZG市街头抢劫的警情数据。该类数据共有85,898条警情记录,记录了街头抢劫的案件信息,如抢劫时间和抢劫地址,以及被抢对象及损失财物等内容。第二类是2012-2016年ZG市街头抢劫者的抓捕数据,共有14,863条记录。该类数据记录了街头抢劫者详细的个体信息及其案件信息。个体信息如街头抢劫者的姓名、性别、民族、户籍地址、出生日期、文化程度以及吸毒与否等属性;案件信息如抢劫时间,抢劫地址和抢劫时的居住地,以及犯罪对象、犯罪场所、作案工具、作案手段和损失财物或金额等。ZG市建成环境数据包括2014年POI数据(点坐标)、2014年交通路网矢量地图数据、2015年基于百度API抓取的公交站点数据(点坐标)等。手机信令数据采取的是2016年1周(5月12日-5月18日)ZG市2G、3G的手机信令数据,该数据来源于中国ZG市某通信公司。人口普查数据为ZG市2010年第六次人口普查数据,该数据以社区为尺度,主要统计社区总人口、社区外来人口、社区青少年人口、社区人均住房面积、社区住房产权等社会属性。
然后利用Geocoding API获得地址文本的编码结果,利用简单的规则对编码结果的可信度进行初步判断,再利用基于规则与聚类的多源地理编码分类优化模型对编码结果进行清洗与优化,得到优化后地址文本数据对应的编码信息,形成作案地数据集。
根据图3原理,利用Stata软件数据集相交功能,匹配该犯罪作案地所属的社区属性集,进行社区属性集与作案地数据集的有效融合,由此构建样本。ZG市街头抢劫者选择1,971个社区中的1个社区作案,被选中的社区记作“1”,反之,未被选中的社区均记作“0”。每个社区择取了19个属性,1,971行一一对应了27,949个作案地,在Stata软件中采用“crossing”编码实现,由此构建了55,087,479个样本。
利用共线性诊断筛选符合VIF<10的变量,基于离散选择模型拟合犯罪者作案地选择偏好,得到第i个犯罪者选择第j个社区作为作案地的预期效应。
根据条件逻辑模型形式得到Prob概率函数,计算第i个犯罪者选择在第j个社区作案的概率。
通过本方法模拟犯罪者作案地选择的全模型(Full Model,下面简称FM),与基础模型(Normal Model,下面简称NM)、在基础模型上分别只融入人流环境维度的变量和犯罪防控维度的变量的组合模型1、组合模型2(Combining Model1、Combining Model2,下面简称CM1,CM2)进行伪R方拟合度检验对比。拟合度检验要求伪R方大于0.20,否则不具有完美拟合度。基于离散选择模型的各模型与基础模型拟合度效果对比,如下表所示:
Figure BDA0002313730990000101
综上所述,本发明实施例提供的基于离散选择模型的犯罪者作案地识别方法,与现有技术相比,具有如下有益效果:
(1)通过融合警情数据和抓捕数据、POI数据和手机信令数据等多源时空数据,增加人群流动环境、犯罪防控环境等数据对犯罪者作案地选择的量化模型进行了优化。相比基本模型,全模型对犯罪者作案地选择的拟合精度提高了8.63%,对提高犯罪者作案地选择的拟合精度具有重要作用。
(2)基于离散选择模型,利用效应函数和概率函数计算犯罪者选择作案地社区的预期效益与概率,实现了对犯罪者作案地选择的精准识别,提高了有效性和准确性,对警务防控具有重要的参考作用。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (6)

1.一种基于离散选择模型的犯罪者作案地识别方法,其特征在于,包括以下步骤:
获取多源时空数据,并对所述多源时空数据进行集成处理;
根据手机信令数据,计算得到各社区的基站人口数;
根据各社区的基站人口数生成各社区对应的泰森多边形,并计算各社区完整的泰森多边形面积;
通过各社区的shp文件对对应的泰森多边形进行裁切,得到各社区对应的碎片化的泰森多边形;
根据人群流动密度公式、各社区的基站人口数、各社区完整的泰森多边形面积、各社区对应的碎片化的泰森多边形,计算得到各社区对应的人群流动密度;
根据社会经济异质性公式、人口普查数据中的不同社会经济群体的个数,生成各社区的社区属性集;其中,
所述人群流动密度公式为:
Figure FDA0004130187190000011
式中,Di为第i个社区的人群流动密度,n为涉及第i个社区泰森多边形的个数,Pk为第k个泰森多边形人口数,Sji为第i个社区中碎片j的面积,Ski为与第i个社区相关的第k个泰森多边形的总面积,Si为第i个社区的面积;
所述社会经济异质性公式为:
Figure FDA0004130187190000021
式中,n为不同社会经济群体的个数,Pki为居住在第i个社区下第k个社会经济群体的比例,SEi的数值越大表示社区群体越异质;
获取待识别区域地址文本对应的编码结果,通过基于规则与聚类的多源地理编码分类优化模型对所述编码结果进行优化处理,生成优化后地址文本数据对应的编码信息以构建犯罪者的作案地数据集;
根据所述犯罪者的作案地数据集和所述各社区的社区属性集,匹配得到所述犯罪者作案地所属的第一社区属性集,并将所述第一社区属性集和所述作案地数据集融合,生成模型样本;
从所述模型样本中筛选出影响作案地选择的变量,并通过方差膨胀公式对所述变量进行共线性诊断,得到方差膨胀小于10的变量;其中,变量包括建成环境因素、社会环境因素、人群流动环境因素,以及犯罪防控因素变量;
并通过离散选择模型拟合所述犯罪者作案地选择偏好,通过预期效应计算公式,计算犯罪者对各社区选择的预期效应,得到犯罪者实行作案得到最大预期效应的社区;
根据条件逻辑模型和所述离散选择模型拟合所述犯罪者得到的结果,构建作案地选择概率函数,并根据所述作案地概率函数得到所述犯罪者作案地选择的概率。
2.如权利要求1所述的基于离散选择模型的犯罪者作案地识别方法,其特征在于,所述多源时空数据包括原始的公安部门数据、所述手机信令数据、所述人口普查数据。
3.如权利要求1所述的基于离散选择模型的犯罪者作案地识别方法,其特征在于,所述方差膨胀公式为:
Figure FDA0004130187190000031
其中,Ri为变量xi对其余变量作回归分析的负相关系数,VIF为方差膨胀系数。
4.如权利要求1所述的基于离散选择模型的犯罪者作案地识别方法,其特征在于,所述预期效应计算公式为:
Uij=βxijij
其中,Uij为第i个犯罪者选择在第j个社区实行犯罪的预期效应,xij为与第i个犯罪者和第j个社区相关的解释变量的值,β为解释变量的估计系数,εij为模型的随机误差。
5.如权利要求1所述的基于离散选择模型的犯罪者作案地识别方法,其特征在于,所述作案地选择概率函数为Prob概率函数。
6.如权利要求5所述的基于离散选择模型的犯罪者作案地识别方法,其特征在于,所述Prob概率函数的计算公式为:
Figure FDA0004130187190000032
其中,Yi是为第i个犯罪者的选择,xij为与第i个犯罪者和第j个社区相关的解释变量的值,β为解释变量的估计系数。
CN201911269327.8A 2019-12-11 2019-12-11 一种基于离散选择模型的犯罪者作案地识别方法 Active CN111062000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911269327.8A CN111062000B (zh) 2019-12-11 2019-12-11 一种基于离散选择模型的犯罪者作案地识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911269327.8A CN111062000B (zh) 2019-12-11 2019-12-11 一种基于离散选择模型的犯罪者作案地识别方法

Publications (2)

Publication Number Publication Date
CN111062000A CN111062000A (zh) 2020-04-24
CN111062000B true CN111062000B (zh) 2023-06-27

Family

ID=70298863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911269327.8A Active CN111062000B (zh) 2019-12-11 2019-12-11 一种基于离散选择模型的犯罪者作案地识别方法

Country Status (1)

Country Link
CN (1) CN111062000B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180015A (zh) * 2017-05-16 2017-09-19 安徽工业大学 一种系列犯罪案件地理目标预测方法
CN110472775A (zh) * 2019-07-26 2019-11-19 广州大学 一种系列案件疑犯落脚点预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180015A (zh) * 2017-05-16 2017-09-19 安徽工业大学 一种系列犯罪案件地理目标预测方法
CN110472775A (zh) * 2019-07-26 2019-11-19 广州大学 一种系列案件疑犯落脚点预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Dongping Long 等.Assessing the Influence of Prior on Subsequent Street Robbery Location Choices: A Case Study in ZG City, China.《Sustainability》.2018,第1-17页. *
肖露子 等.ZG市工作日地铁站点扒窃案件的时空分布及其影响因素.《地理科学》.2018,第38卷(第8期),第1227-1234页. *

Also Published As

Publication number Publication date
CN111062000A (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
Ali et al. A data-driven approach for multi-scale GIS-based building energy modeling for analysis, planning and support decision making
Biljecki A scientometric analysis of selected GIScience journals
WO2019200752A1 (zh) 基于语义理解的兴趣点查询方法、装置和计算机设备
Lu et al. Bayesian areal wombling for geographical boundary analysis
Ballesteros et al. Safe cities. A participatory sensing approach
Li et al. A new urban typology model adapting data mining analytics to examine dominant trajectories of neighborhood change: a case of metro detroit
CN105404890A (zh) 一种顾及轨迹时空语义的犯罪团伙判别方法
CN109918674B (zh) 一种基于案件要素相似性建模的案件串并方法
US8825624B2 (en) Life arcs as an entity resolution feature
CN107578277A (zh) 用于电力营销的出租房客户定位方法
Huang et al. Research on urban modern architectural art based on artificial intelligence and GIS image recognition system
CN114912717B (zh) 基于物联网的智慧城市保障住房申请风险评估方法和***
He et al. Persistence of crime hot spots: an ordered probit analysis
Curtis‐Ham et al. A new Geographic Profiling Suspect Mapping And Ranking Technique for crime investigations: GP‐SMART
Morshed et al. Viscrimepredict: a system for crime trajectory prediction and visualisation from heterogeneous data sources
Abowd et al. Optimal probabilistic record linkage: Best practice for linking employers in survey and administrative data
Ramakers et al. Escaping the family tradition: A multi-generation study of occupational status and criminal behaviour
CN111062000B (zh) 一种基于离散选择模型的犯罪者作案地识别方法
Benito et al. Efficiency in the Provision of Public Municipal Cultural Facilities.
Fariñas et al. Multinational activity of European firms and heterogeneity
Ristea et al. Geosocial Media Data as Predictors in a GWR Application to Forecast Crime Hotspots (Short Paper)
CN111768031B (zh) 一种基于arma算法预测人群聚集趋势的方法
Jin et al. Research on the evaluation model of rural information demand based on big data
CN112580992B (zh) 类金融企业的非法集资风险监测***
Hirama et al. Geographical profiling incorporating neighbourhood‐level factors using spatial interaction modelling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Long Dongping

Inventor after: Xu Mingen

Inventor after: Xu Chong

Inventor after: Xiao Luzi

Inventor after: Song Guangwen

Inventor after: Chen Jianguo

Inventor before: Long Dongping

Inventor before: Liu Lin

Inventor before: Xu Mingen

Inventor before: Xu Chong

Inventor before: Xiao Luzi

Inventor before: Song Guangwen

Inventor before: Chen Jianguo

GR01 Patent grant
GR01 Patent grant