CN110109908A

CN110109908A - 基于社会基础信息挖掘人物潜在关系的分析***及方法

Info

Publication number: CN110109908A
Application number: CN201711470003.1A
Authority: CN
Inventors: 徐福利
Original assignee: Chengdu Shu Letter Credit Service Co Ltd
Current assignee: Chen Rui Corp
Priority date: 2017-12-29
Filing date: 2017-12-29
Publication date: 2019-08-09
Anticipated expiration: 2037-12-29
Also published as: CN110109908B

Abstract

本发明公开了一种基于社会基础信息挖掘人物潜在关系的分析***。该***中社会基础信息主要涉及人员旅店住宿信息、人员出入境信息、人员民航订票信息、人员铁路运输信息，上述信息通过本发明中的数据源配置管理模块、数据表接入映射模块、数据整合模块被整合、集中到了***中，再利用数据统计分析模块的分析计算，得到了数据中每个已存在人物间的关系亲密度分值来体现每个人物间的关系亲密程度；人物关系展示模块以人物的证件信息为检索入口，以列表或图形化的形式展现给用户。本发明***将零散、杂乱、无关的人物社会信息，通过数据再造、集中处理、统计运算得出人与人之间的潜在联系，对特殊领域有较高的应用效果，提高了数据的价值。

Description

基于社会基础信息挖掘人物潜在关系的分析***及方法

技术领域

本发明涉及数据库、数据仓库、统计计算、数据图形化，尤其涉及一种基于社会基础信息挖掘人物潜在关系的分析系统。

背景技术

数据改变了、改变着并将更加深刻地改变人们的生活，它是整个信息技术革命的一个部分和一个角度。随着人类社会科学技术的不断进步，互联网技术、计算机技术的快速发展，在各个行业、政府部门都积累了大量的人物数据，数据也从简单的处理对象开始转变为一种基础性资源，如何更好地管理和利用数据已经成为普遍关注的话题。

当前的社会治安形势日益复杂和严峻，公安机关侦查破案工作面临极大的压力。数据挖掘技术应用于刑侦工作，对于公安机关提高执法效率具有十分重要的意义。在公安机关侦查破案时，经常需要通过案件关系人查找与之密切相关的人员，或者通过某嫌疑人查找相关嫌疑人，或者通过确定的犯罪者查找犯罪同伙。然而，公安机关在查找上述相关人员时，各个行业、政府部门积累的数据资源，既可提供信息线索，但由于信息数量繁且杂而为线索识别也带来了难度。

由于上述问题的存在，本发明人对数据库、数据整合、统计计算等相关技术进行研究和分析，以期待研制出一种基于社会基础信息来挖掘人物潜在关系的分析***及方法，通过筛选有效数据，以有效数据为基础，对数据进行等级划分，整合形成相关度数据，为公安机关侦查或其他行业提供信息明确的人物潜在关系数据信息。

发明内容

为了克服上述问题，本发明人经过长年工作积累，通过项目实践，以四类可有效挖掘潜在关系的社会基础数据(人员旅店住宿信息、人员民航订票信息、人员出入境信息和人员铁路运输信息)作为出发点，进行了研究和分析，将零散、杂乱、无关的人物社会信息，通过数据再造、集中处理、统计运算得出人与人之间的潜在联系，对特殊(如警务刑侦)领域有较高的应用效果，提高了数据的价值，从而完成本发明。

本发明的目的在于提供以下技术方案：

(1)一种基于社会基础信息挖掘人物潜在关系的分析系统，其特征在于，该***包括展现体系100、应用体系200和数据体系300；

其中，应用体系200包括：

数据源配置管理模块210：其用于配置接收与社会基础信息相关的业务数据库310的数据表信息，包括建立访问远程数据库的数据库连接，形成数据源表，以及配置接入数据表的信息，形成接入数据表；

数据表接入映射模块220：用于将业务数据库310中数据表与预先定义的数据模型进行属性字段映射；

数据整合模块230：其用于接收抽取业务数据库310中数据表数据，根据数据表接入映射情况，将属性字段数据值抽取传送至动态行踪库330，通过设定的数据处理程序，将数据再造存储，获取同行人详细资料；

数据统计分析模块240，用于根据数据整合模块230对数据整合的结果，进行分类统计，依据关系亲密等级计算两个人物间的关系亲密度分值，生成同行人报表；

展现体系100包括：

人物关系展示模块110，用于以人物的固有属性信息为检索入口，通过检索***分析结果，以表格或图形的形式对人物关系进行展现。

(2)一种基于社会基础信息挖掘人物潜在关系的分析方法，该方法包括以下步骤：

步骤1)，配置接收与社会基础信息相关的业务数据库的数据表信息，包括建立访问远程数据库的数据库连接，形成数据源表，以及配置接入数据表的信息，形成接入数据表；

步骤2)，数据表接入映射，将业务数据库中数据表与预先定义的数据模型进行属性字段映射；

步骤3)，根据数据表接入映射的信息，在配置库自动建立将接入的数据表转化为指定结构的转化视图，并将转化视图名称保存至接入数据表；

步骤4)，接收抽取业务数据库中数据表数据，根据数据表接入映射情况，将属性字段数据值抽取传送至动态行踪库，通过设定的数据处理程序，将数据再造存储，获取同行人详细信息；

步骤5)，根据***数据整合的结果，进行分类统计，依据关系亲密等级计算两个人物间的关系亲密度分值，生成同行人报表；

步骤6)，以固有属性信息为检索入口，通过检索***分析结果，以表格或图形的形式对人物关系进行展现。

根据本发明提供的一种基于社会基础信息挖掘人物潜在关系的分析***及方法，具有以下有益效果：

第一、本发明根据以四类可有效挖掘潜在关系的社会基础数据(人员旅店住宿信息、人员民航订票信息、人员出入境信息和人员铁路运输信息)作为出发点，为人物间潜在关系的获得提供了有力的数据基础。

第二、本发明通过属性字段映射将业务数据库数据表中的字段经属性字段映射与预先定义的数据模型中的模型字段进行关联，使得业务库数据表中字段可被本***识别，且通过以预先定义的数据模型为模板，保留与模型字段相对应的字段信息，排除与模型字段不相关的信息，对数据进行了筛选，提高了数据利用率，并且降低了数据操作繁琐程度。

第三、本发明将抽取的数据根据设定的同行人验正规则，对两个人物在相同事件中的关系亲密程度做等级标识，基于与各事件类型相关的同行人详细资料中各类亲密等级的出现次数，通过关系亲密度分值公式，计算两个人物间关系亲密度分值；以定量的方式展示人物间的潜在关系，信息价值更高，展示效果更直接。

第四、本发明中各模块之间的配合连接，将零散、杂乱、无关的人物社会信息，通过数据再造、集中处理、统计运算得出人与人之间的潜在联系，对特殊领域(如警务刑侦)有较高的应用效果(如通过确定与某嫌疑人在某时间段共同出入某宾馆获得同伙人信息)，提高了现有数据的价值。

附图说明

图1示出根据本发明中基于社会基础信息挖掘人物潜在关系的分析***的结构示意图；

图2示出根据本发明中四种事件类型的转化视图；

图3示出根据本发明中迭代循环数据的实施方式结构示意图；

图4示出根据本发明一种优选实施方式中数据统计分析模块的业务流程图；

图5示出根据本发明一种优选实施方式中存储于数据体系中的各数据表的信息示意图；

图6示出根据本发明一种优选实施方式中基于社会基础信息挖掘人物潜在关系的分析方法流程示意图。

附图标号说明：

100-展现体系

110-人物关系展示模块

200-应用体系

210-数据源配置管理模块

211-数据源子模块

212-数据表子模块

220-数据表接入映射模块

221-表字段映射配置子模块

222-表字段映射关联子模块

223-数据类型核查子模块

230-数据整合模块

231-数据抽取子模块

232-数据加载子模块

233-数据转换子模块

234-日志记录子模块

235-数据管理子模块

236-作业监控子模块

240-数据统计分析模块

241-汇总统计子模块

242-积分运算子模块

243-分析作业监控子模块

300-数据体系

310-业务数据库

320-***配置库

330-动态行踪库

具体实施方式

下面通过附图和实施例对本发明进一步详细说明。通过这些说明，本发明的特点和优点将变得更为清楚明确。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

为将大规模效应的数据，从数据存储、管理以及数据分析的角度进行有效的开发，以获取人物间的潜在关系，以清晰、量化的方式展现出来，本发明提供了一种基于社会基础信息挖掘人物潜在关系的分析***，如图1所示，该分析***包括展现体系100、应用体系200和数据体系300；

其中，应用体系200包括：

数据源配置管理模块210：其用于配置接收与社会基础信息相关的业务数据库310的数据表信息，包括建立访问远程数据库的数据库连接，形成数据源表，以及配置接入数据表的信息，形成接入数据表。

具体地，数据源配置管理模块210包括数据源子模块211和数据表子模块212，数据源子模块211，用于建立和维护抽取数据表的数据源信息；数据表子模块212，用于建立和维护抽取数据表的相关信息，即接入数据表信息。

如表1所示，数据源表中存储有数据源信息，数据源信息包括数据源描述、数据库连接信息和创建时间等。数据源配置管理模块210通过添加、删除或修改方式完成对各条数据源信息的配置。

表1数据源表

字段名称	数据类型	属性	说明
				唯一标识码	数值型	主键
数据源描述	字符型
				数据库连接信息	字符型
创建时间	日期型		默认SYS日期型

如表2所示，接入数据表中包括表名称、表注释、表唯一标识码字段、事件类型、视图名称、增量字段、已处理的数据最大值、状态标识和创建时间等。

表2接入数据表

字段名称	数据类型	属性	说明
				唯一标识码	数值型	主键
数据源唯一标识码	数值型	外键	数据源表的主键
				表名称	字符型
表注释	字符型
				表唯一标识码字段	字符型
事件类型	字符型
				视图名称	字符型
增量字段	字符型
				已处理的数据最大值	数值型		已被处理过的数据最大主键值，初始化为0
状态标识	字符型		0无效；1有效
				创建时间	日期型		默认SYS日期型

具体地，数据源配置管理模块210通过数据表子模块212：

(i)指定已存在的数据源，记录数据源唯一标识码；

(ii)选择数据源下的数据表名称；

(iii)对选择的数据表添加数据表注释；

(iv)指定数据表唯一标识码字段；

(v)指定数据表所属事件类型(本发明中事件类型包括旅客住宿、出入境、民航订票和铁路运输)；

(vi)指定数据增量字段。

数据表接入映射模块220：用于将业务数据库310中数据表与预先定义的数据模型进行属性字段映射，即将业务数据库310 数据表中的字段经属性字段映射与预先定义的数据模型中的模型字段进行关联，该预先定义的数据模型中的模型字段可被本 ***识别。

数据表接入映射模块220包括表字段映射配置子模块221和表字段映射关联子模块222：

表字段映射配置子模块221：建立并维护业务数据库310中数据表与预先定义的数据模型的属性字段映射关系，形成接入表字段模型映射表，如表3所示；

表字段映射关联子模块222：依据接入表字段模型映射表来接入映射的信息，在配置库中自动建立将接入的数据表转化为指定结构的转化视图(图2)，并将转化视图名称保存至接入数据表(表2)。转化视图中显示的与事件类型信息相关的字段即为预先定义的数据模型中的模型字段。

转化视图将作为整合数据的实际数据源(业务数据库310 中数据表为原始数据源)，以可被本***识别的统一属性字段命名，为后续数据操作提供便利。

需要说明的是，针对不同的事件类型，接入表字段模型映射表的属性字段映射信息必然不同，即针对不同的事件类型，需要独立设置相对的预先定义的数据模型，产生相应的接入表字段模型映射表，从而获得具有不同视图名称的转化视图。举例说明，当事件类型为“旅客住宿”时，预先定义的数据模型中的模型字段包括旅客姓名、旅客证件号码、旅客性别、旅客出生日期、旅客国家地区、入住酒店、入住酒店行政区划、入住酒店流水号、入住房号、入住时间、退房时间等。事件类型“出入境”、“民航订票”和“铁路运输”在各自预先定义的数据模型下的模型字段同样如图2中相应的转化视图所示。

表3接入表字段模型映射表

字段名称	数据类型	属性	说明
				唯一标识码	数值型	主键
接入数据表唯一标识码	数值型	外键
				字段名称	字符型		业务数据库310中数据表
字段描述	字符型
				字段类型	字符型
模型字段	字符型		映射后字段名称
				创建时间	日期型		默认SYS日期型

我们知道，即使经营相同业务的企业对该业务的数据信息的表现也不同，体现在数据表字段命名和字段数目。

针对字段名称，数据表接入映射模块220通过属性字段映射，得到可被本***识别的模型字段。

针对字段数目，数据表接入映射模块220以预先定义的数据模型中的模型字段为依据，获取原数据表中部分价值更高、与事件类型相关性较高的字段，而不映射与事件类型相关性不密切的字段，即实现了数据的筛选，这为后续的数据整合提供了有效的数据基础。

在一种优选的实施方式中，数据表接入映射模块220还包括数据类型核查子模块223，其根据业务数据库310中数据表中属性字段的定义情况，进行数据类型核查，将不符合定义情况的字段信息进行标注或其他处理，在后续整合处理时不予采用。

数据整合模块230：其用于接收抽取业务数据库310中数据表数据，根据数据表接入映射情况，将属性字段数据值抽取传送至动态行踪库330，通过设定的数据处理程序，将数据再造存储，获取同行人详细资料。

其中，设定的数据处理程序是指根据设定的同行人规则，对同一事件类型数据表中任意两个人物的对应字段信息进行亲密程度验证，并对两个人物在相同事件(如入住同一家宾馆) 中的关系亲密程度做等级标识。同行人规则如表4所示，其中的亲密等级划分标准示例如表5所示。

表4同行人规则

表5亲密等级划分标准

标识码	事件类型	同行人规则描述	亲密等级	细类标识码
					1	住宿	同一天入住同一宾馆且流水号相同	A	1
2	住宿	同一天入住同一宾馆且房间号相同	A	2
					3	住宿	同一天入住同一宾馆且团体标识相同	A	3
4	住宿	同入住且同退房(入住退房时间相差10分钟)	B	4
					5	出入境	同一天出入同一口岸且团体标识相同	A	1
6	出入境	同一天出入同一口岸且出入时间相差10分钟	B	2
					7	民航	同一天乘坐同一航班且订票号相同	A	1
8	民航	同一天乘坐同一航班且团体标识相同	A	2
					9	铁路	同一天同一车次且团体标识相同	A	1
10	铁路	同一天同一车次且始发站与到达站相同	B	2
					11	铁路	同一天同一车次且始发站或到达站相同	C	3
12	铁路	同一天同一车次	D	4
					……	……	……	……	……

具体地，本发明中，数据整合模块230包括：

数据抽取子模块231，其启动对业务数据库310中数据表的抽取程序；其中，数据抽取子模块231可以通过***内定数据抽取时间自动运行，***自动运行参数如表6***字典所示；

数据加载子模块232，根据接入表字段模型映射表的映射规则，将经过映射后的业务库的数据值传送至动态行踪库330，产生同行人详细资料，如表7所示；

数据转换子模块233，通过设定的数据处理程序，将数据再造存储。所述设定的数据处理程序是指根据设定的同行人规则，对同一事件类型数据表中任意两个人物的对应字段信息进行亲密程度验证，对两个人物在相同事件中的关系亲密程度做等级标识；

日志记录子模块234，用于记录每次数据抽取、加载、转换过程中产生的操作情况，形成日志记录，如表8所示；

数据管理子模块235，通过数据整合中产生的日志记录，用于展示***每天数据的更新情况；

作业监控子模块236，通过数据整合中产生的日志记录，跟踪数据整合模块230的运行情况，当出现异常时，通过消息框的方式告警。

表6***字典

字段名称	数据类型	属性	说明
				唯一标识码	数值型	主键
区段	字符型
				ID	字符型
值	字符型
				状态标识	字符型		0无效；1有效

表7同行人详细资料表

表8日志记录

字段名称	数据类型	属性	说明
				唯一标识码	数值型	主键
产生的时间	日期型
				日志类别	字符型
接口程序的名称	字符型
				日志内容	字符型
状态	字符型		默认SYS日期型

在本发明中，由于同一类型下数据表中信息量巨大，或者数据表中数据有更新，或者由于其他情况，可能导致***在数据整合时不可能一次全部整合完毕。

本发明中***针对上述情况，允许进行多次整合。此时数据整合模块230还包括以下操作：

数据抽取子模块231，获取接入数据表中有效状态的数据信息，重要信息有视图名称(即转化视图名称)、增量字段和已处理的数据最大值；

数据加载子模块232，根据接入数据表设定的增量字段以及已处理的数据最大值，确定接入数据的加载范围，起点为已处理的数据最大值，终点为当前视图中增量字段的最大值，加载完成后，记录此次处理数据的最大值，将已处理的数据最大值保存至接入数据表中，作为下次数据加载的启始值。

在一种优选的实施方式中，数据转换子模块233运行时，设定的数据处理程序通过迭代循环数据的实施方式，对任意两个人物的对应字段信息进行亲密程度验证。迭代循环数据的实施方式如图3所示。

其中，主体人员信息按主键顺序依次分析，方便为下次启动设置标签，与主体人员进行亲密程度验证的客体由小于主体人员主键的数据产生。

如表7所示，两个同行人信息在存入动态行踪库330时，A、 B位置的原则是证件号码排序大的在A，小的在B；目的是排出两人交叉错位，产生重复数据。

数据统计分析模块240，用于根据***数据整合的结果，进行分类统计，依据关系亲密等级计算两个人物间的关系亲密度分值，生成同行人报表。同行人报表结构如9所示，包括：唯一标识码、人物A姓名、人物A证件号码、人物A性别、人物A出生日期、人物B姓名、人物B证件号码、人物B性别、人物B出生日期、亲密等级A、亲密等级B、亲密等级C、亲密等级D、关系亲密度分值、创建时间。

表9同行人报表

字段名称	数据类型	属性	说明
				唯一标识码	数值型	主键
人物A姓名	字符型
				人物A证件号码	字符型
人物A性别	字符型
				人物A出生日期	日期型
人物B姓名	字符型
				人物B证件号码	字符型
人物B性别	字符型
				人物B出生日期	日期型
亲密等级A	数值型		亲密等级A的次数
				亲密等级B	数值型		亲密等级B的次数
亲密等级C	数值型		亲密等级C的次数
				亲密等级D	数值型		亲密等级D的次数
关系亲密度分值	数值型
				创建时间	日期型		默认SYS日期型

在一种优选的实施方式中，数据统计分析模块240包括：

汇总统计子模块241，增量统计，产生同行人报表；

积分运算子模块242，基于各事件类型相关的同行人详细资料中各类亲密等级的出现次数，通过关系亲密度分值公式，计算两个人物的关系亲密度分值；

关系亲密度分值公式：

A:N+Trunc(B:N/3,1)+Trunc(C:N/5,1)+Trunc(D:N/10,1)，其中，N代表次数，A:N表示亲密等级A类的出现次数。

分析作业监控子模块243，用于跟踪数据统计分析模块240 中各子部分的运行情况。

在一种优选的实施方式中，数据抽取子模块231可以通过系统内定数据抽取时间自动运行，相应的，汇总统计子模块241 也可以通过***内定数据抽取时间自动运行。

在一种优选的实施方式中，积分运算子模块242运行时，通过迭代循环数据的实施方式，对任意两个人物的亲密等级信息进行计算，得到关系亲密度分值。

数据统计分析模块240业务流程图如图4所示：

汇总统计子模块241依据***字典中信息和同行人详细资料表中信息进行自动运行，增量统计，产生同行人报表；积分运算子模块242计算并于同行人报表中记录两个人物的关系亲密度分值，保存同行人报表；

若同行人报表中存在两个同行人的数据，则进行更新数据，若同行人报表中不存在两个同行人的数据，则进行数据增加；

每批次运行完毕后记录被处理数据的最大主键值，即已处理的数据最大值，并存入***字典中。

其中，如图1和图5所示，数据体系300包括：

业务数据库310，用于存储社会基础信息。本发明中业务数据库310用于存储人员旅店住宿信息、人员民航订票信息、人员出入境信息和人员铁路运输信息；

***配置库320，用于存储***内部产生的数据信息，包括数据源表、接入数据表和接入表字段模型映射表；

动态行踪库330，用于存储数据整合过程中产生的同行人详细资料表、数据统计分析模块240统计产生的同行人报表，以及同行人规则、***日志和***字典。

其中，如图1所示，展现体系100包括:

人物关系展示模块110，其用于以人物的固有属性信息为检索入口，通过检索***分析结果，以表格或图形的形式对人物关系进行展现。其中，所述固有属性信息如人物的证件信息、姓名等可用于唯一标识人物的信息。

本发明的另一方面在于提供一种基于社会基础信息挖掘人物潜在关系的分析方法，如图6所示，该方法包括以下步骤：

需要配置接入数据表的信息包括：

(i)指定已存在的数据源；

(ii)选择数据源下的数据表名称；

(iii)对选择的数据表添加数据表注释；

(iv)指定数据表唯一标识码字段；

(vi)指定数据增量字段。

步骤2)，数据表接入映射，将业务数据库中数据表与预先定义的数据模型进行属性字段映射；即将业务数据库中数据表中的字段经属性字段映射与预先定义的数据模型中的模型字段进行关联；

步骤4)，接收抽取业务数据库中数据表数据，根据数据表接入映射情况，将属性字段数据值抽取传送至动态行踪库330，通过设定的数据处理程序，将数据再造存储，获取同行人详细信息。

具体地，步骤4)包括以下子步骤：

步骤4.1)，启动对业务数据库中数据表的抽取程序；其中，数据抽取子模块可以通过***内定数据抽取时间自动运行；

步骤4.2)，根据接入表字段模型映射表的映射规则，将经过映射后的业务库的数据值传送至动态行踪库，产生同行人详细资料；

步骤4.3)，通过设定的数据处理程序，将数据再造存储；所述设定的数据处理程序是指根据设定的同行人规则，对同一事件类型数据表中任意两个人物的对应字段信息进行亲密程度验证，对两个人物在相同事件中的关系亲密程度做等级标识；

步骤4.4)，记录每次数据抽取、加载、转换过程中产生的操作情况，形成日志记录；

步骤4.5)，通过数据整合中产生的日志记录，用于展示系统每天数据的更新情况；

步骤4.6)，通过数据整合中产生的日志记录，跟踪数据整合模块的运行情况，当出现异常时，通过消息框的方式告警。

步骤5)，根据***数据整合的结果，进行分类统计，依据关系亲密等级计算两个人物间的关系亲密度分值，生成同行人报表。

具体地，步骤5)包括以下子步骤：

步骤5.1)，增量统计，产生同行人报表；

步骤5.2)，基于各类亲密等级的出现次数，通过关系亲密值公式，计算两个人物的关系亲密度分值；

关系亲密度分析值公式:

步骤5.3)，跟踪数据统计分析模块中各子部分的运行情况。

实施例

实施例1

在某案件中，确定尚小海为嫌疑人，通过分析2017-08-31 至2017-12-20日旅客住宿信息，希望确定在此时间段内是否存在与尚小海行为关系亲密的人，以确定是否存在其他可能的同伙人员。

在IP为172.168.10.10的Oracle数据库服器(业务数据库)上，有一张旅客住宿信息表，接入***进行分析。数据结构如下表 10：

表10旅客住宿信息表

数据源配置管理模块，建立访问远程数据库的数据库连接，形成数据源表，见表11；

表11配置数据源

唯一标识码	数据源描述	数据库连接信息	创建时间
				1	121服务器	172.168.10.10:1521/orcl	2017-12-19

数据源配置管理模块，配置接入数据表的信息，形成接入数据表，见表12；

表12接入数据表

数据表接入映射模块建立并维护业务数据库中数据表与预先定义的数据模型的属性字段映射关系，形成接入表字段模型映射表，见表13；

表13接入表字段模型映射表

数据表接入映射模块依据接入表字段模型映射表来接入映射的信息，在配置库中自动建立将接入的数据表转化为指定结构的转化视图，并将转化视图名称保存至接入数据表；转化视图内容见表14；

表14转化视图VM_LKZS_171219121512

数据整合模块，接收抽取业务数据库中数据表数据，根据数据表接入映射情况，将属性字段数据值抽取传送至动态行踪库，通过设定的数据处理程序，将数据再造存储，获取同行人详细资料，见表15；

表15同行人详细资料表

数据统计分析模块240，用于根据***数据整合的结果，进行分类统计，依据关系亲密等级计算两个人物间的关系亲密度分值，生成同行人报表，见表16；

表16同行人报表

以尚小海的身份证为检索入口，获得与尚小海相关的信息，由于尚小海和尚大海的关系亲密度分值为2，相关性较高，确定尚大海为与尚小海为亲密关系，尚大海可能为相关嫌疑人。

以上结合了优选的实施方式对本发明进行了说明，不过这些实施方式仅是范例性的，仅起到说明性的作用。在此基础上，可以对本发明进行多种替换和改进，这些均落入本发明的保护范围内。

Claims

1.一种基于社会基础信息挖掘人物潜在关系的分析***，其特征在于，该***包括展现体系(100)、应用体系(200)和数据体系(300)；

其中，应用体系(200)包括：

数据源配置管理模块(210)：其用于配置接收与社会基础信息相关的业务数据库(310)的数据表信息；

数据表接入映射模块(220)：用于将业务数据库(310)中数据表与预先定义的数据模型进行属性字段映射；

数据整合模块(230)：其用于接收抽取业务数据库(310)中数据表数据，根据数据表接入映射情况，将属性字段数据值抽取传送至动态行踪库(330)，通过设定的数据处理程序，将数据再造存储，获取同行人详细资料；

数据统计分析模块(240)，用于根据数据整合模块(230)对数据整合的结果，进行分类统计，依据关系亲密等级计算两个人物间的关系亲密度分值，生成同行人报表；

展现体系(100)包括：

人物关系展示模块(110)，其用于以人物的固有属性信息为检索入口，通过检索***分析结果，以表格或图形的形式对人物关系进行展现。

2.根据权利要求1所述的分析***，其特征在于，数据源配置管理模块(210)包括以下子模块，

数据源子模块(211)，用于建立和维护抽取数据表的数据源信息，即数据源表中信息；

数据表子模块(212)，用于建立和维护抽取数据表的相关信息，即接入数据表信息；

优选地，接入数据表中信息包括表名称、表注释、表唯一标识码字段、事件类型、视图名称、增量字段、已处理的数据最大值、状态标识和创建时间。

3.根据权利要求1所述的分析***，其特征在于，数据表接入映射模块(220)包括以下子模块，

表字段映射配置子模块(221)：建立并维护业务数据库(310)中数据表与预先定义的数据模型的属性字段映射关系，形成接入表字段模型映射表；

表字段映射关联子模块(222)：依据接入表字段模型映射表来接入映射的信息，在配置库中自动建立将接入的数据表转化为指定结构的转化视图，并将转化视图名称保存至接入数据表。

4.根据权利要求1所述的分析***，其特征在于，数据整合模块(230)包括以下子模块：

数据抽取子模块(231)，其启动对业务数据库(310)中数据表的抽取程序；

数据加载子模块(232)，根据接入表字段模型映射表的映射规则，将经过映射后的业务库的数据值传送至动态行踪库(330)，产生同行人详细资料；

数据转换子模块(233)，通过设定的数据处理程序，将数据再造存储；所述设定的数据处理程序是指根据设定的同行人规则，对同一事件类型数据表中任意两个人物的对应字段信息进行亲密程度验证，并对两个人物在相同事件中的关系亲密程度做等级标识。

5.根据权利要求1所述的分析***，其特征在于，据整合模块(230)能够根据业务数据库(310)中数据表信息的更新，进行多次整合，此时，

数据抽取子模块(231)，还用于获取接入数据表中有效状态的数据信息，该数据信息包括视图名称、增量字段和已处理的数据最大值；

数据加载子模块(232)，还用于根据接入数据表设定的增量字段以及已处理的数据最大值，确定接入数据的加载范围，起点为已处理的数据最大值，终点为当前视图中增量字段的最大值，加载完成后，记录此次处理数据的最大值并保存至接入数据表中，作为下次数据加载的启始值。

6.根据权利要求1所述的分析***，其特征在于，同行人详细资料包括：唯一标识码、事件类型、事件时间、人物A姓名、人物A证件号码、人物A性别、人物A出生日期、人物B姓名、人物B证件号码、人物B性别、人物B出生日期、亲密等级、亲密等级细类标识、数据溯源信息、创建时间；其中，

事件类型为：旅客住宿、出入境、民航订票、以及铁路运输；

亲密等级包括：A级：同行人；B级：一级疑似同行人；C级：二级疑似同行人；D级：三级疑似同行人；

数据溯源信息为：表名、唯一标识字段、人物A唯一标识值、人物B唯一标识值。

7.根据权利要求1所述的分析***，其特征在于，数据统计分析模块(240)包括以下子模块：

汇总统计子模块(241)，增量统计，产生同行人报表；

积分运算子模块(242)，基于各事件类型相关的同行人详细资料中各类亲密等级的出现次数，通过关系亲密度分值公式，计算两个人物的关系亲密度分值；

关系亲密度分值公式:

8.根据权利要求1所述的分析***，其特征在于，数据体系(300)包括：

业务数据库(310)，用于存储社会基础信息，社会基础信息包括人员旅店住宿信息、人员民航订票信息、人员出入境信息和人员铁路运输信息；

***配置库(320)，用于存储***内部产生的数据信息，包括数据源表、接入数据表和接入表字段模型映射表；

动态行踪库(330)，用于存储数据整合和统计分析过程中产生的数据，包括同行人详细资料表和同行人报表；

展现体系(100)包括:

人物关系展示模块(110)，其用于以人物的固有属性信息为检索入口，通过检索***分析结果，以表格或图形的形式对人物关系进行展现；其中，所述固有属性信息为唯一标识人物的信息。

9.一种基于社会基础信息挖掘人物潜在关系的分析方法，该方法包括以下步骤：

10.根据权利要求9所述的分析方法，其特征在于，步骤1)中，需要配置接入数据表的信息包括：

(i)指定已存在的数据源；

(ii)选择数据源下的数据表名称；

(iii)对选择的数据表添加数据表注释；

(iv)指定数据表唯一标识码字段；

(v)指定数据表所属事件类型；

(vi)指定数据增量字段。