CN111159418A - 一种公安专题知识图谱***的构建方法 - Google Patents

一种公安专题知识图谱***的构建方法 Download PDF

Info

Publication number
CN111159418A
CN111159418A CN201811326924.5A CN201811326924A CN111159418A CN 111159418 A CN111159418 A CN 111159418A CN 201811326924 A CN201811326924 A CN 201811326924A CN 111159418 A CN111159418 A CN 111159418A
Authority
CN
China
Prior art keywords
knowledge
data
public security
knowledge map
construction method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811326924.5A
Other languages
English (en)
Inventor
朱彤
张丹普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Changfeng Science Technology Industry Group Corp
Original Assignee
China Changfeng Science Technology Industry Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Changfeng Science Technology Industry Group Corp filed Critical China Changfeng Science Technology Industry Group Corp
Priority to CN201811326924.5A priority Critical patent/CN111159418A/zh
Publication of CN111159418A publication Critical patent/CN111159418A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种公安专题知识图谱***的构建方法,基于人、事、地、物、组织构建包含社会关系网络与事件的知识图谱,实现高效线索研判和深度挖掘预警,包括案件线索解析、人案关系智能推演、犯罪团伙挖掘、时空轨迹比对、高危人员预测预警、情报数据挖掘分析等,降低公安人员与后期研发人员工作量。

Description

一种公安专题知识图谱***的构建方法
技术领域
本发明涉及公共安全技术领域,具体涉及一种公安专题知识图谱***的构建方法。
背景技术
公安部门的网络普遍存在业务数据机密性要求高、业务连续性要求强、网络结构相对封闭、信息***架构形式多样等特点,而公安内部网络中不同业务功能模块的信息安全需求又各不相同:如面向互联网的便民服务信息***具有相对开放的结构特点,用户一般为普通民众,便民服务业务对数据的可用性和完整性要求往往大于其对机密性要求;而独立运行的业务信息***具有相对封闭的结构特点,用户一般为内部用户,用户对数据的完整性和保密性要求往往大于可用性要求。
因此,公安网络安全风险贯穿公安内部网络和互联网,可以认为:外部网络面临的服务中断、外部攻击、非法入侵、安全漏洞等威胁的概率比较大;而内部网络面临的敏感数据泄露、监管审计不到位等威胁概率比较大。
目前公安内部网络和外部网络的安全控制与措施大多独立考虑,导致只解决了局部问题,未能从整体解决安全问题,从而降低了整体的安全效率,导致多个信息安全孤岛。因此,传统的安全防护***已经难以满足内控与合规管理要求,主要面临以下新的问题:
安全架构日趋复杂、新型技术不断涌现;
不但有传统物理服务器、网络设备和安全设备,也有虚拟服务器和虚拟设备;不仅有C/S,B/S架构传统应用,也有云平台和大数据应用;
安全数据快速增长,数据快速处理能力不足;
每台物理设备每天生成5万至50万条安全事件,全网带宽也从百兆提升至千兆,每年需处理的安全数据在10TB数量级,而现有安防***的处理能力仍停留在1TB数量级,无法快速提取有价值的数据进行分析;
安全处理能力分散,未能形成整合优势;
现有安全处理方式仍然按照防火墙、病毒防范、行为审计等独立事件进行处理,未能整合安全事件之间的相互关系、行为关联来产生总体安全态势,缺乏科学决策依据。
发明内容
本发明的目的在于针对公安安全面临的诸多问题,采用大数据整合公安方面海量数据,构建面向实战的全息画像和知识图谱***。
本发明的技术方案如下:
一种公安专题知识图谱***的构建方法,其特征在于,包括:
(1)数据抽取:使用基于kettle的ETL平台,将分布的、异构数据源中的数据如关系数据、平面数据文件抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库Hive中,作为知识图谱的数据源;
(2)知识表示:根据数据源中表结构与先验业务知识,将数据抽象为RDF知识三元组表示;
(3)知识存储:使用Jane与neo4j图数据库,配合Hbase、Hive大数据存储技术,实现基于图数据库的混合存储技术实现大规模知识图谱数据存储;
(4)知识融合:使用Limes度量空间的链接发现框架,实现对RDF等知识结构中对相同实体结构进行关联;
(5)知识推理:构建各类群体、事件的社会化关系网络知识图谱,根据搜索关键字进行本体知识的因果分析获得新的知识推论,具体方案使用Jena处理RDFS的规则引擎接口;
(6)搜索分词:使用THULAC中文词法分析工具包,对搜索内容进行分词,支持中文语言直接搜索知识图谱知识关系。
本发明基于人、事、地、物、组织构建的社会关系网,有助于实现公共安全领域的高效线索研判和深度挖掘预警。实现人案关系可视化的智能推演分析,提供精准高效的可疑团伙和高危人员预测预警。业务上达到大案快破、小案多破、提前预警,实时管控的作战效果。
具体实施方式
本发明基于人、事、地、物、组织构建包含社会关系网络与事件的知识图谱,实现高效线索研判和深度挖掘预警,其能力包括案件线索解析、人案关系智能推演、犯罪团伙挖掘、时空轨迹比对、高危人员预测预警、情报数据挖掘分析等,降低公安人员与后期研发人员工作量。
具体包括如下步骤:
(1)数据抽取:使用基于kettle的ETL平台,将分布的、异构数据源中的数据如关系数据、平面数据文件抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库Hive中,作为知识图谱的数据源;
(2)知识表示:根据数据源中表结构与先验业务知识,将数据抽象为RDF知识三元组表示;
(3)知识存储:使用Jane与neo4j图数据库,配合Hbase、Hive大数据存储技术,实现基于图数据库的混合存储技术实现大规模知识图谱数据存储;
(4)知识融合:使用Limes度量空间的链接发现框架,实现对RDF等知识结构中对相同实体结构进行关联;
(5)知识推理:构建各类群体、事件的社会化关系网络知识图谱,根据搜索关键字进行本体知识的因果分析获得新的知识推论,具体方案使用Jena处理RDFS的规则引擎接口;
(6)搜索分词:使用THULAC中文词法分析工具包,对搜索内容进行分词,支持中文语言直接搜索知识图谱知识关系。

Claims (1)

1.一种公安专题知识图谱***的构建方法,其特征在于,包括:
(1)数据抽取:使用基于kettle的ETL平台,将分布的、异构数据源中的数据如关系数据、平面数据文件抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库Hive中,作为知识图谱的数据源;
(2)知识表示:根据数据源中表结构与先验业务知识,将数据抽象为RDF知识三元组表示;
(3)知识存储:使用Jane与neo4j图数据库,配合Hbase、Hive大数据存储技术,实现基于图数据库的混合存储技术实现大规模知识图谱数据存储;
(4)知识融合:使用Limes度量空间的链接发现框架,实现对RDF等知识结构中对相同实体结构进行关联;
(5)知识推理:构建各类群体、事件的社会化关系网络知识图谱,根据搜索关键字进行本体知识的因果分析获得新的知识推论,具体方案使用Jena处理RDFS的规则引擎接口;
(6)搜索分词:使用THULAC中文词法分析工具包,对搜索内容进行分词,支持中文语言直接搜索知识图谱知识关系。
CN201811326924.5A 2018-11-08 2018-11-08 一种公安专题知识图谱***的构建方法 Pending CN111159418A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811326924.5A CN111159418A (zh) 2018-11-08 2018-11-08 一种公安专题知识图谱***的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811326924.5A CN111159418A (zh) 2018-11-08 2018-11-08 一种公安专题知识图谱***的构建方法

Publications (1)

Publication Number Publication Date
CN111159418A true CN111159418A (zh) 2020-05-15

Family

ID=70555144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811326924.5A Pending CN111159418A (zh) 2018-11-08 2018-11-08 一种公安专题知识图谱***的构建方法

Country Status (1)

Country Link
CN (1) CN111159418A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111754337A (zh) * 2020-06-30 2020-10-09 上海观安信息技术股份有限公司 一种***养卡套现团体识别的方法及***
CN111949696A (zh) * 2020-07-08 2020-11-17 国家计算机网络与信息安全管理中心 一种全要素关联分析方法及装置
CN111950282A (zh) * 2020-07-08 2020-11-17 国家计算机网络与信息安全管理中心 一种基于网络行为特征的扩线分析方法及装置
CN113468255A (zh) * 2021-06-25 2021-10-01 西安电子科技大学 基于知识图谱的社会治安综合治理领域数据融合方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111754337A (zh) * 2020-06-30 2020-10-09 上海观安信息技术股份有限公司 一种***养卡套现团体识别的方法及***
CN111754337B (zh) * 2020-06-30 2024-02-23 上海观安信息技术股份有限公司 一种***养卡套现团体识别的方法及***
CN111949696A (zh) * 2020-07-08 2020-11-17 国家计算机网络与信息安全管理中心 一种全要素关联分析方法及装置
CN111950282A (zh) * 2020-07-08 2020-11-17 国家计算机网络与信息安全管理中心 一种基于网络行为特征的扩线分析方法及装置
CN113468255A (zh) * 2021-06-25 2021-10-01 西安电子科技大学 基于知识图谱的社会治安综合治理领域数据融合方法

Similar Documents

Publication Publication Date Title
CN111159418A (zh) 一种公安专题知识图谱***的构建方法
CN108270785B (zh) 一种基于知识图谱的分布式安全事件关联分析方法
Akgun et al. A new DDoS attacks intrusion detection model based on deep learning for cybersecurity
Matturdi et al. Big Data security and privacy: A review
Wang et al. A network gene-based framework for detecting advanced persistent threats
CN109902297B (zh) 一种威胁情报生成方法及装置
CN111371830A (zh) 一种万网融合场景下基于数据驱动的智能协同云架构
CN111090779A (zh) 一种办案勘查取证数据云存储及检索分析方法
CN106778253A (zh) 基于大数据的威胁情景感知信息安全主动防御模型
JP2017516411A (ja) サイバーセキュリティシステム
CN105184642A (zh) 一种综合治税平台
Du Application of information communication network security management and control based on big data technology
Liu et al. Context2Vector: Accelerating security event triage via context representation learning
Bhuyan et al. Crime predictive model using big data analytics
Hemdan et al. A cloud forensic strategy for investigation of cybercrime
Yu et al. A police big data analytics platform: framework and implications
CN112769755A (zh) 一种面向威胁检测的dns日志统计特征抽取方法
Jin et al. An adaptive analysis framework for correlating cyber-security-related data
Chen et al. Research on ontology-based network security knowledge map
管泽礼 et al. Personalized public safety event detection method based on reinforcement federated graph neural network
Kapil et al. Big data security and privacy issues
Johri et al. Crime investigation using Big Data on CDR
Vittapu Design Approach to Big Data Systems in Developing and Maintaining the Information Security Systems
Shukla et al. Role Of Cloud Security in Big Data Processing for Healthcare System
Li A Study on Intrusion Detection Algorithms for User Data Cloud Computing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200515