CN104050239B - 多个对象之间的相关性匹配分析方法 - Google Patents

多个对象之间的相关性匹配分析方法 Download PDF

Info

Publication number
CN104050239B
CN104050239B CN201410225694.9A CN201410225694A CN104050239B CN 104050239 B CN104050239 B CN 104050239B CN 201410225694 A CN201410225694 A CN 201410225694A CN 104050239 B CN104050239 B CN 104050239B
Authority
CN
China
Prior art keywords
record
matching
data
criterion
relevant matches
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410225694.9A
Other languages
English (en)
Other versions
CN104050239A (zh
Inventor
王小鉴
艾彬
曾勤
杨炜明
邓新民
李红波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisi Technology (Chongqing) Group Co.,Ltd.
CHONGQING ZHIDUOXIN INFORMATION DEVELOPMENT Co.,Ltd.
Original Assignee
ZHIDUO INFORMATION DEVELOPMENT CO LTD CHONGQING
CHONGQING AISI WANG'AN INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHIDUO INFORMATION DEVELOPMENT CO LTD CHONGQING, CHONGQING AISI WANG'AN INFORMATION TECHNOLOGY Co Ltd filed Critical ZHIDUO INFORMATION DEVELOPMENT CO LTD CHONGQING
Priority to CN201410225694.9A priority Critical patent/CN104050239B/zh
Publication of CN104050239A publication Critical patent/CN104050239A/zh
Application granted granted Critical
Publication of CN104050239B publication Critical patent/CN104050239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/2448Query languages for particular applications; for extensibility, e.g. user defined types

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种多个对象之间的相关性匹配分析方法,包括:步骤1,对给定的数据记录集合进行整理,并根据应用场景定义记录匹配判定法f;步骤2,对给定的n个对象和匹配次数m,根据能否从数据记录集合中提取满足匹配判定法f*的m组匹配记录集,判断所述n个对象是否符合相关性匹配判定法f(m)的要求,其中所述的n≥3,m≥2。

Description

多个对象之间的相关性匹配分析方法
技术领域
本发明涉及计算机领域,尤其涉及一种多个对象之间的相关性匹配分析方法。
背景技术
在包含交通往来或旅店入住等行踪记录的数据中,对象之间的相关性匹配分析方法对分析哪些对象多次乘坐相同的车船、飞机班次,或在相近的时间经过、入住或离开某一场所这类同行同住问题具有重要意义。在反恐侦查、打击贩毒、传销网络等领域,需要分析和判断达到一定规模的群体是否具有同行或同住关系或其他相关性行为,即研究多个对象之间的相关性匹配问题。而当前的对象相关性匹配分析技术通常是指定一个对象,分析有哪些对象与他匹配给定的次数以上,或在给定的范围内,找出所有对象相关性匹配次数超过给定值两两组合。这些分析方式都属于二元关系分析,其核心是判断两个对象之间是否匹配。由于对象之间分别匹配的参照点可能是不同的,即使对象两两匹配,也不能证明三个以上的对象之间具有匹配关系。这意味着,现有的对象相关性匹配分析方法并不能满足反恐侦查、打击贩毒、传销网络等领域对多人同行同住行为分析判断的需要。因此,需要基于多个对象来研究相关性匹配问题。而研究多个对象之间的相关性匹配,面临匹配判定法规则、匹配次数和对象数量的三重不确定及对象之间匹配组合的多样性,且计算量随数据的规模呈指数级增长,需要本领域技术人员付出创造性劳动,才能解决相应的技术问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种多个对象之间的相关性匹配分析方法。
为了实现本发明的上述目的,本发明提供了一种多个对象之间的相关性匹配分析方法,其关键在于:包括如下步骤:
步骤1,对给定的数据记录集合进行整理,并根据应用场景定义记录匹配判定法f;
步骤2,对给定的n个对象和匹配次数m,根据能否从数据记录集合中提取满足匹配判定法f*的m组匹配记录集,判断所述n个对象是否符合相关性匹配判定法f(m)的要求,其中所述的n≥3,m≥2。
上述技术方案的有益效果为:本发明通过精确的筛选匹配工作之后,能够定位达到阈值范围的数据,对应的对象会准确无误的体现出来,无需人为操作即可实现准确匹配。
在数据匹配的过程中采用迭代方法进行计算,能够更好地筛选对象数据进行相关性匹配。
所述的多个对象之间的相关性匹配分析方法,优选的,包括:所述数据记录集合中的每条数据记录为其中一个对象p拥有,R(p)表示对象p拥有的数据记录的集合;
记录匹配判定法f为基于数据记录的二元关系的布尔函数,设两条记录分别为ri和rj,则f(ri,rj)=true表示ri和rj匹配,f(ri,rj)=false表示ri和rj不匹配,其中对记录匹配判定法f的定义应满足自反性和对称性,即对同一条数据记录r,f(r,r)≡true,对任意两条数据记录ri和rj,有f(ri,rj)≡f(rj,ri);
所述匹配判定法f*为基于数据记录的多元关系的布尔函数,其输入为一记录集,要求记录集中的各条数据记录分属不同的对象,对记录集R,若R中的任意两条记录ri和rj,都有f(ri,rj)=true,则称R满足匹配判定法f*,记为f*(R)=true,并称R为一组匹配记录集;
所述相关性匹配判定法f(m)为基于对象的多元关系的布尔函数,其输入为一对象集合,设对象集合为P,若能找到m组不同的满足匹配判定法f*的记录集Ri,且Ri中的数据记录分别属于P中的各个对象,即
则称P中的对象满足相关性匹配判定法f(m),记为f(m)(P)=true。
上述技术方案的有益效果为:通过对象匹配法计算出需要匹配的数据,对数据进行运算,能够更准确的进行对象匹配。
所述的多个对象之间的相关性匹配分析方法,优选的,所述步骤2包括如下步骤:
步骤2-1,定义包含指定n个对象的集合P,从数据记录集合中筛选出P中各个对象的所有数据记录,转步骤2-2;
步骤2-2,如果某个对象拥有的数据记录的数量小于m,则判断这n个对象不满足相关性匹配判定法f(m),结束,否则转步骤2-3;
步骤2-3,若基于数据记录的匹配判定法f还满足传递性,即对于任意3条数据记录r1、r2、r3,有
则转步骤2-4,否则转步骤2-7;
步骤2-4,将筛选出的数据记录划分为若干子集,要求对每个子集Ri,满足f*(Ri)=true,转步骤2-5;
步骤2-5,初始置计数为0,对每个子集Ri,若对P中的任意对象p,均有则计数加1,转步骤2-6;
步骤2-6,根据总计数是否不小于m,判断所述n个对象是否符合相关性匹配判定法f(m)的要求,结束;
步骤2-7,从P中选择一个对象p0,创建临时对象集合P'={p0},为p0拥有的每条数据记录r分别创建一个匹配记录集R={r},转步骤2-8;
步骤2-8,如果P'=P,则判断该n个对象相关性匹配判定法f(m)的要求,否则从P中再选择另一对象p,转步骤2-9;
步骤2-9,逐一检查各匹配记录集R,从R(p)中选择一条数据记录r满足f*(R∪{r})=true,令R=R∪{r},如果从R(p)中找不到这样的数据记录,则删除R,待所有匹配记录集检查完毕后转步骤2-10;
步骤2-10,如果当前匹配记录集的数量不小于m,则令P'=P'∪{p},转步骤2-8,否则判断这n个对象不符合相关性匹配要求,结束。
上述技术方案的有益效果为:通过精确的筛选匹配工作之后,能够定位达到阈值范围的数据,对应的对象会准确无误的体现出来,无需人为操作即可实现准确匹配。运用多个对象之间的相关性匹配分析方法,有利于发现对象之间密切相关的行为轨迹。
所述的多个对象之间的相关性匹配分析方法,优选的,还包括:
把n个对象按包含记录的数量从少到多排序,记录较少的对象被先添加到临时对象集合P'中。
上述技术方案的有益效果为:运用多个对象之间的相关性匹配分析方法,有利于发现对象之间密切相关的行为轨迹。
所述的多个对象之间的相关性匹配分析方法,优选的,还包括:
如果数据记录匹配判定法f是基于时间相邻原则进行判断的,即每条数据记录r有时间属性τ(r)和允许时间域δ(r),对于满足f(ri,rj)=true的两条数据记录ri和rj,仅当τ(ri)∈δ(rj)且τ(rj)∈δ(ri),由此,为每组匹配记录集R维护其中所有记录的允许时间域的交集δ*(R),对任意记录r判断f*(R∪{r})=true是否成立时先检查是否有τ(r)∈δ*(R),则可避免r与R中的记录一一比较。
上述技术方案的有益效果为:运用多个对象之间的相关性匹配分析方法,有利于发现对象之间密切相关的行为轨迹。
所述的多个对象之间的相关性匹配分析方法,优选的,还包括:
在多线程或分布式环境中,把待判断的对象划分为若干子集分别判断,再合并后判断所有对象是否符合相关性匹配要求。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明通过精确的筛选匹配工作之后,能够定位达到阈值范围的数据,对应的对象会准确无误的体现出来,无需人为操作即可实现准确匹配。
在数据匹配的过程中采用迭代方法进行计算,能够更好地筛选对象数据进行相关性匹配。
本发明已经把多个对象相关性匹配分析应用到铁路公安部门和网络监察公安部门。
运用多个对象之间的相关性匹配分析方法,有利于发现对象之间密切相关的行为轨迹。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明多个对象之间的相关性匹配分析方法的示意图;
图2是本发明多个对象之间的相关性匹配分析方法具体实施方式的示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
如图1、2所示,本发明提供了一种多个对象之间的相关性匹配分析方法,其关键在于:包括如下步骤:
步骤1,对给定的数据记录集合进行整理,并根据应用场景定义记录匹配判定法f;
步骤2,对给定的n个对象和匹配次数m,根据能否从数据记录集合中提取满足匹配判定法f*的m组匹配记录集,判断所述n个对象是否符合相关性匹配判定法f(m)的要求,其中所述的n≥3,m≥2。
上述技术方案的有益效果为:本发明通过精确的筛选匹配工作之后,能够定位达到阈值范围的数据,对应的对象会准确无误的体现出来,无需人为操作即可实现准确匹配。
在数据匹配的过程中采用迭代方法进行计算,能够更好地筛选对象数据进行相关性匹配。
所述的多个对象之间的相关性匹配分析方法,优选的,包括:所述数据记录集合中的每条数据记录为其中一个对象p拥有,R(p)表示对象p拥有的数据记录的集合;
所述记录匹配判定法f为基于数据记录的二元关系的布尔函数,设两条记录分别为ri和rj,则f(ri,rj)=true表示ri和rj匹配,f(ri,rj)=false表示ri和rj不匹配,其中对记录匹配判定法f的定义应满足自反性和对称性,即对同一条数据记录r,f(r,r)≡true,对任意两条数据记录ri和rj,有f(ri,rj)≡f(rj,ri);
所述匹配判定法f*为基于数据记录的多元关系的布尔函数,其输入为一记录集,要求记录集中的各条数据记录分属不同的对象,对记录集R,若R中的任意两条记录ri和rj,都有f(ri,rj)=true,则称R满足匹配判定法f*,记为f*(R)=true,并称R为一组匹配记录集;
所述相关性匹配判定法f(m)为基于对象的多元关系的布尔函数,其输入为一对象集合,设对象集合为P,若能找到m组不同的满足匹配判定法f*的记录集Ri,且Ri中的数据记录分别属于P中的各个对象,即
则称P中的对象满足相关性匹配判定法f(m),记为f(m)(P)=true。
上述技术方案的有益效果为:通过对象匹配法计算出需要匹配的数据,对数据进行运算,能够更准确的进行对象匹配。
所述的多个对象之间的相关性匹配分析方法,优选的,所述步骤2包括如下步骤:
步骤2-1,定义包含指定n个对象的集合P,从数据记录集合中筛选出P中各个对象的所有数据记录,转步骤2-2;
步骤2-2,如果某个对象拥有的数据记录的数量小于m,则判断这n个对象不满足相关性匹配判定法f(m),结束,否则转步骤2-3;
步骤2-3,若基于数据记录的匹配判定法f还满足传递性,即对于任意3条数据记录r1、r2、r3,有
则转步骤2-4,否则转步骤2-7;
步骤2-4,将筛选出的数据记录划分为若干子集,要求对每个子集Ri,满足f*(Ri)=true,转步骤2-5;
步骤2-5,初始置计数为0,对每个子集Ri,若对P中的任意对象p,均有则计数加1,转步骤2-6;
步骤2-6,根据总计数是否不小于m,判断所述n个对象是否符合相关性匹配判定法f(m)的要求,结束;
步骤2-7,从P中选择一个对象p0,创建临时对象集合P'={p0},为p0拥有的每条数据记录r分别创建一个匹配记录集R={r},转步骤2-8;
步骤2-8,如果P'=P,则判断该n个对象相关性匹配判定法f(m)的要求,否则从P中再选择另一对象p,转步骤2-9;
步骤2-9,逐一检查各匹配记录集R,从R(p)中选择一条数据记录r满足f*(R∪{r})=true,令R=R∪{r},如果从R(p)中找不到这样的数据记录,则删除R,待所有匹配记录集检查完毕后转步骤2-10;
步骤2-10,如果当前匹配记录集的数量不小于m,则令P'=P'∪{p},转步骤2-8,否则判断这n个对象不符合相关性匹配要求,结束。
上述技术方案的有益效果为:通过精确的筛选匹配工作之后,能够定位达到阈值范围的数据,对应的对象会准确无误的体现出来,无需人为操作即可实现准确匹配。运用多个对象之间的相关性匹配分析方法,有利于发现对象之间密切相关的行为轨迹。
所述的多个对象之间的相关性匹配分析方法,优选的,还包括:
把n个对象按包含记录的数量从少到多排序,记录较少的对象被先添加到临时对象集合P'中。
上述技术方案的有益效果为:运用多个对象之间的相关性匹配分析方法,有利于发现对象之间密切相关的行为轨迹。
所述的多个对象之间的相关性匹配分析方法,优选的,还包括:
如果数据记录匹配判定法f是基于时间相邻原则进行判断的,即每条数据记录r有时间属性τ(r)和允许时间域δ(r),对于满足f(ri,rj)=true的两条数据记录ri和rj,仅当τ(ri)∈δ(rj)且τ(rj)∈δ(ri),由此,为每组匹配记录集R维护其中所有记录的允许时间域的交集δ*(R),对任意记录r判断f*(R∪{r})=true是否成立时先检查是否有τ(r)∈δ*(R),则可避免r与R中的记录一一比较。
上述技术方案的有益效果为:运用多个对象之间的相关性匹配分析方法,有利于发现对象之间密切相关的行为轨迹。
所述的多个对象之间的相关性匹配分析方法,优选的,还包括:
在多线程或分布式环境中,把待判断的对象划分为若干子集分别判断,再合并后判断所有对象是否符合相关性匹配要求。
所述步骤1之前包括:
在多个对象之间进行对象认证时,将对象认证信息传输到云端服务器,所述云端服务器将所述多个对象的身份信息传输到分析终端,由分析终端对所述多个对象进行行为匹配。
在步骤2之后还包括:
将判断匹配后的匹配记录集中的数据传输到管理终端,当所述多个对象匹配程度达到相应阈值之后,提醒管理人员。
本发明创造是关于多个对象之间的相关性匹配分析方法。如果一组对象多次一同乘坐相同的车船、飞机班次,或在相近的时间经过、入住或离开某一场所(各次的班次、地点可以不同),则我们称该组对象具有记录相关性匹配关系。判断和发现多个对象之间的相关性匹配关系的过程即为多个对象之间的相关性匹配分析方法。
多个对象之间的相关性匹配分析方法的条件如下:
1.被考察的所有对象的集合和所有对象行踪的集合,每条行踪记录包含时间、地点(或班次)等要素。如在公共上网场所匹配分析的数据中,每条记录包含上网人身份信息、上下网时间、所在网吧等信息。
2.任意两条记录是否满足对象相关性匹配的判断规则。如在航班同行分析中,判断规则通常为航班相同。又如在铁路购票同行分析中,其中一种判断规则为乘坐的火车班次相同且购票时间相差30秒以内。
3.记录相关性匹配的最少次数(设为m),通常应在2次以上。
其中多个对象行为轨迹的数据采集到对象数据库中,通过云端服务器随时调用这些对象数据,而对象数据行为轨迹的采集通过,航班数据***连接云端服务器,所述云端服务器连接对象数据库,铁路数据***连接云端服务器,所述云端服务器连接对象数据库,客运数据***连接云端服务器,所述云端服务器连接对象数据库,高速公路数据***连接云端服务器,所述云端服务器连接对象数据库,银行数据***连接云端服务器,所述云端服务器连接对象数据库。
上述的数据***采集对象的行为轨迹数据信息,传输到对象数据库中,对象数据库根据用户的需求,选择出需要筛选匹配的对象,进行多个对象之间的相关性匹配分析。
上述对象的数据信息,能够通过身份证扫描的信息,或者指纹信息,瞳孔信息进行对象确认。
多个对象之间的相关性匹配分析方法的判断方法如下:
1.对给定的一组对象,如果我们找出一一对应的一组行踪记录,且这些记录中任意两条都满足上述记录相关性匹配的判断规则,则我们称该组人有过一次相关性匹配,称该组行踪记录为这组对象的一组匹配记录集。
2.如果我们能为该组对象找出m组完全不同的匹配记录集对应行踪记录,且每组中的任意两条都满足上述记录相关性匹配的判断规则,则我们称该组对象具有多个对象之间的相关性匹配。
验证多个对象(设为n)是否具有相关性匹配关系的判断方法:
1.直接根据规则进行判断,为这n个人依次找出m组匹配记录集。
2.以迭代的方式进行判断。
先判断是否能为其中的2个对象找到至少m个匹配记录集,然后再看添加另外一个对象后,是否仍能为这些对象找到至少m个匹配记录集。就这样,把对象逐一添加到集合中。如果始终能找到至少m个匹配记录集,则我们判断这n个对象具有多个对象之间的相关性匹配分析。
现在我们来看添加一个对象后如何找匹配记录集。设前k-1个对象有m1次相关性匹配,即有m1组匹配记录集(m1不小于m)。现在我们来判断这k个对象的相关性匹配关系是否成立。对前k-1个对象的每组匹配记录集,我们从后一个对象的行为轨迹记录中,查找与这组匹配记录集中每条记录都满足的记录。k大于等于1。
如果找得到,则把这条记录与该组匹配记录集中的其他记录合在一起,作为这k个对象的一组匹配记录集。如果可找到至少m组匹配记录集,则这k个对象的相关性匹配关系成立。
整个判断过程请参见图2。
S1,输入待判定的n个对象,所述n大于等于3;
S2,获取每个对象的行为轨迹记录;
S3,设置k=1,所述k为对象的行为轨迹记录;
S4,为每个对象每条记录创建包含该记录的匹配记录集,设匹配记录集数量为m1;
3.把这n个对象划分为若干子集,先检查各子集是否满足多个对象之间的相关性匹配分析的关系,然后再检查子集之间的相关性匹配关系。这种方法便于实现并行计算。
根据使用环境的不同,判断方法可以从以下几个方面考虑进行优化:
1.行踪记录可以按时间或班次进行排序,这意味着可以在瞬间定位指定时间范围或指定班次的行踪记录。
2.如果记录之间的相关性匹配关系的判断是基于班次的,则对应记录数不足x条的班次可以忽略掉。类似地,如果记录之间的相关性匹配关系的判断是基于时间相邻原则的,则相邻时间范围内记录数不足x条的记录可以被忽略掉。所述x大于等于2。
3.通常情况下,行为轨迹较多的对象与其他对象相关性匹配的可能性更高。由此,若判断n个对象是否具有相关性匹配关系,可把这n个对象按行踪记录的数量从少到多排序,先判断记录较少的对象之间是否具有相关性匹配关系。
4.如果记录之间的相关性匹配关系的判断是基于属性(如日期、班次、地点)相等原则的,则一组匹配记录集中所有记录的这些属性是相同的。我们可以为每组匹配记录集记录这些属性。这样,新添加一个对象时,我们只需要将他的行踪记录中的这些属性与匹配记录集的这些属性进行比较就可以了,而不需要与匹配记录集中的记录一一比较。
5.如果记录之间的相关性匹配关系的判断是基于时间相邻原则的,则每条记录都对应一个允许时间范围,在该范围内的记录才能与之满足相关性匹配关系。由此,我们可以为每组匹配记录集维护一个允许时间范围,它是该记录集中所有记录的允许时间范围的交集。这样,新添加一个对象时,我们只需要检查该对象的行踪记录是否属于前k-1对象的匹配记录集的允许时间范围,而不需要与匹配记录集中的记录一一比较。
本发明的有益效果是:
本发明通过精确的筛选匹配工作之后,能够定位达到阈值范围的数据,对应的对象会准确无误的体现出来,无需人为操作即可实现准确匹配。
在数据匹配的过程中采用迭代方法进行计算,能够更好地筛选对象数据进行相关性匹配。
本发明已经把多个对象相关性匹配分析应用到***门。
运用多个对象之间的相关性匹配分析方法,有利于发现对象之间密切相关的行为轨迹,从而能准确无误的判断出相关性匹配数据。
现列举如下实施例:
在行踪记录中,每条记录包含3个字段:记录编号、日期及记录当事人姓名。其中赵某、钱某、孙某、李某分别有6、6、5、4条记录。设要求同行同住的最少次数为3,两条记录之间具有同行同住关系的判断标准有两种情况:1、日期相同;2、日期相差一天以内。通过本发明能够清晰的匹配出相应对象的行为轨迹,便于发现对象之间行为的匹配程度。
记录编号 日期 姓名
1 2014-03-02 赵某
2 2014-03-02 钱某
3 2014-03-02 孙某
4 2014-03-26 赵某
5 2014-03-26 钱某
6 2014-03-26 李某
7 2014-04-16 赵某
8 2014-04-16 孙某
9 2014-04-16 李某
10 2014-05-01 赵某
11 2014-05-01 钱某
12 2014-05-01 孙某
13 2014-05-21 钱某
14 2014-05-21 孙某
15 2014-05-21 李某
16 2014-06-18 赵某
17 2014-06-18 钱某
18 2014-06-18 李某
19 2014-06-30 赵某
20 2014-06-30 钱某
21 2014-06-30 孙某
1.当以日期相同作为记录之间的匹配判断标准时
此时记录之间的匹配判定规则满足可传递性,可采用划分子集的方式进行分析。
对于赵某、钱某、孙某3人,我们把他们的记录按日期划分为6个子集,其中可以找出3组匹配记录集,第一组含记录1、2、3,第二组含记录10、11、12,第三组含记录19、20、21,因此赵某、孙某、钱某3人具有多人同行同住关系。
对于赵某、钱某、李某,我们把他们的记录按日期划分为6个子集,其中仅能找出2组匹配记录集,第一组含记录4、5、6,第二组含记录16、17、18,因此该三人不具有多人同行关系。
2.当以日期相差一天以内作为记录之间的匹配判断标准时
此时记录之间的匹配判定规则不满足可传递性,可采用迭代的进行分析。
判断赵某、钱某、孙某3人是否具有多人同行同住关系。我们从赵某开始,先创建6个匹配记录集A1、B1、C1、D1、E1、F1,分别包含记录1、4、7、10、16、19。我们再把钱某添加进来。对匹配记录集A1、B1、D1、E1、F1,我们找到满足同行同住规则的记录2、5、11、17、20,由此为赵某和钱某创建5个匹配记录集A2、B2、D2、E2、F2,其中A2包含记录1、2,B2包含记录4、5,D2包含记录10、11,E2包含记录16、17,F2包含记录19、20。然后我们把孙某添加进来。对匹配记录集A2、D2、F2,我们找到对应的记录3、12、21,由此为赵某、钱某、孙某创建3个匹配记录集A3、D3、F3,其中A3包含记录1、2、3,D3包含记录10、11、12,F3包含记录19、20、21。由此可知,赵某、孙某、钱某3人具有多人同行同住关系。
本领域技术人员可以理解,上述的方法和装置可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本实施例的安全性设定和检查装置及其单元、组件可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合实现。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (5)

1.一种多个对象之间的相关性匹配分析方法,其特征在于:包括如下步骤:
步骤1,对给定的数据记录集合进行整理,并根据应用场景定义记录匹配判定法f;
步骤2,对给定的n个对象和匹配次数m,根据能否从数据记录集合中提取满足匹配判定法f*的m组匹配记录集,判断所述n个对象是否符合相关性匹配判定法f(m)的要求,其中所述的n≥3,m≥2;
所述数据记录集合中的每条数据记录为其中一个对象p拥有,R(p)表示对象p拥有的数据记录的集合;
记录匹配判定法f为基于数据记录的二元关系的布尔函数,设两条记录分别为ri和rj,则f(ri,rj)=true表示ri和rj匹配,f(ri,rj)=false表示ri和rj不匹配,其中对记录匹配判定法f的定义应满足自反性和对称性,即对同一条数据记录r,f(r,r)≡true,对任意两条数据记录ri和rj,有f(ri,rj)≡f(rj,ri);
所述匹配判定法f*为基于数据记录的多元关系的布尔函数,其输入为一记录集,要求记录集中的各条数据记录分属不同的对象,对记录集R,若R中的任意两条记录ri和rj,都有f(ri,rj)=true,则称R满足匹配判定法f*,记为f*(R)=true,并称R为一组匹配记录集;
所述相关性匹配判定法f(m)为基于对象的多元关系的布尔函数,其输入为一对象集合,设对象集合为P,若能找到m组不同的满足匹配判定法f*的记录集Ri,且Ri中的数据记录分别属于P中的各个对象,即
则称P中的对象满足相关性匹配判定法f(m),记为f(m)(P)=true。
2.根据权利要求1所述的多个对象之间的相关性匹配分析方法,其特征在于,所述步骤2包括如下步骤:
步骤2-1,定义包含指定n个对象的集合P,从数据记录集合中筛选出P中各个对象的所有数据记录,转步骤2-2;
步骤2-2,如果某个对象拥有的数据记录的数量小于m,则判断这n个对象不满足相关性匹配判定法f(m),结束,否则转步骤2-3;
步骤2-3,若基于数据记录的匹配判定法f还满足传递性,即对于任意3条数据记录r1、r2、r3,有
f ( r 1 , r 2 ) = t r u e f ( r 2 , r 3 ) = t r u e ⇒ f ( r 1 , r 3 ) = t r u e ,
则转步骤2-4,否则转步骤2-7;
步骤2-4,将筛选出的数据记录划分为若干子集,要求对每个子集Ri,满足f*(Ri)=true,转步骤2-5;
步骤2-5,初始置计数为0,对每个子集Ri,若对P中的任意对象p,均有则计数加1,转步骤2-6;
步骤2-6,根据总计数是否不小于m,判断所述n个对象是否符合相关性匹配判定法f(m)的要求,结束;
步骤2-7,从P中选择一个对象p0,创建临时对象集合P'={p0},为p0拥有的每条数据记录r分别创建一个匹配记录集R={r},转步骤2-8;
步骤2-8,如果P'=P,则判断该n个对象相关性匹配判定法f(m)的要求,否则从P中再选择另一对象p,转步骤2-9;
步骤2-9,逐一检查各匹配记录集R,从R(p)中选择一条数据记录r满足f*(R∪{r})=true,令R=R∪{r},如果从R(p)中找不到这样的数据记录,则删除R,待所有匹配记录集检查完毕后转步骤2-10;
步骤2-10,如果当前匹配记录集的数量不小于m,则令P'=P'∪{p},转步骤2-8,否则判断这n个对象不符合相关性匹配要求,结束。
3.根据权利要求2所述的多个对象之间的相关性匹配分析方法,其特征在于,还包括:
把n个对象按包含记录的数量从少到多排序,记录较少的对象被先添加到临时对象集合P'中。
4.根据权利要求2所述的多个对象之间的相关性匹配分析方法,其特征在于,还包括:
如果数据记录匹配判定法f是基于时间相邻原则进行判断的,即每条数据记录r有时间属性τ(r)和允许时间域δ(r),对于满足f(ri,rj)=true的两条数据记录ri和rj,仅当τ(ri)∈δ(rj)且τ(rj)∈δ(ri),由此,为每组匹配记录集R维护其中所有记录的允许时间域的交集δ*(R),对任意记录r判断f*(R∪{r})=true是否成立时先检查是否有τ(r)∈δ*(R),则可避免r与R中的记录一一比较。
5.根据权利要求2所述的多个对象之间的相关性匹配分析方法,其特征在于,还包括:
在多线程或分布式环境中,把待判断的对象划分为若干子集分别判断,再合并后判断所有对象是否符合相关性匹配要求。
CN201410225694.9A 2014-05-27 2014-05-27 多个对象之间的相关性匹配分析方法 Active CN104050239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410225694.9A CN104050239B (zh) 2014-05-27 2014-05-27 多个对象之间的相关性匹配分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410225694.9A CN104050239B (zh) 2014-05-27 2014-05-27 多个对象之间的相关性匹配分析方法

Publications (2)

Publication Number Publication Date
CN104050239A CN104050239A (zh) 2014-09-17
CN104050239B true CN104050239B (zh) 2017-04-12

Family

ID=51503072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410225694.9A Active CN104050239B (zh) 2014-05-27 2014-05-27 多个对象之间的相关性匹配分析方法

Country Status (1)

Country Link
CN (1) CN104050239B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107871111B (zh) * 2016-09-28 2021-11-26 苏宁易购集团股份有限公司 一种行为分析方法及***
CN108197140A (zh) * 2017-11-24 2018-06-22 中国电子科技集团公司电子科学研究院 时空同现的挖掘方法、服务器及计算机可读存储介质
CN108196885B (zh) * 2017-11-27 2021-07-27 腾讯科技(上海)有限公司 对象组的确定方法和装置、存储介质、电子装置
CN111723616B (zh) * 2019-03-20 2023-06-02 杭州海康威视***技术有限公司 一种人员相关性度量方法及装置
CN110636258B (zh) * 2019-09-09 2021-03-02 四川东方网力科技有限公司 同行人员分析方法、装置、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177066A (zh) * 2011-12-20 2013-06-26 Sap门户以色列有限公司 分析和表示人际关系
CN103428164A (zh) * 2012-05-15 2013-12-04 腾讯科技(深圳)有限公司 用户社交网络关系圈划分方法和***
CN103778151A (zh) * 2012-10-23 2014-05-07 阿里巴巴集团控股有限公司 一种识别特征群体的方法及装置和搜索方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080201314A1 (en) * 2007-02-20 2008-08-21 John Richard Smith Method and apparatus for using multiple channels of disseminated data content in responding to information requests

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177066A (zh) * 2011-12-20 2013-06-26 Sap门户以色列有限公司 分析和表示人际关系
CN103428164A (zh) * 2012-05-15 2013-12-04 腾讯科技(深圳)有限公司 用户社交网络关系圈划分方法和***
CN103778151A (zh) * 2012-10-23 2014-05-07 阿里巴巴集团控股有限公司 一种识别特征群体的方法及装置和搜索方法及装置

Also Published As

Publication number Publication date
CN104050239A (zh) 2014-09-17

Similar Documents

Publication Publication Date Title
Bordier et al. Graph analysis and modularity of brain functional connectivity networks: searching for the optimal threshold
CN104050239B (zh) 多个对象之间的相关性匹配分析方法
Qiu et al. Clustering passenger trip data for the potential passenger investigation and line design of customized commuter bus
Sidone et al. Scholarly publication and collaboration in B razil: The role of geography
Xu et al. Uncovering collusive spammers in Chinese review websites
Munizaga et al. Validating travel behavior estimated from smartcard data
CN106650273B (zh) 一种行为预测方法和装置
Sherly et al. BOAT adaptive credit card fraud detection system
Faroqi et al. Inferring trip purpose by clustering sequences of smart card records
Oliveira et al. Automated monitoring of construction sites of electric power substations using deep learning
Yu et al. Data-driven approach for solving the route choice problem with traveling backward behavior in congested metro systems
Gorodnichy et al. Automated border control: Problem formalization
Xie et al. Testing the proportionality condition with taxi trajectory data
Won et al. Knowledge-based system for estimating incident clearance duration for Maryland I-95
Kwayu Determinants of a political party’s social media strategy: A comparative analysis of Tanzania’s opposition political parties’ Twitter practices
Mota et al. Analysis of security lines policies for improving capacity in airports: Mexico City Case
Farkas et al. Voluntary Associations' Impact on the Composition of Active Members' Social Networks: Not an Either/or Matter
Ermagun et al. Multiple-drones-multiple-trucks routing problem for disruption assessment
Yanushkevich et al. Understanding and taxonomy of uncertainty in modeling, simulation, and risk profiling for border control automation
Acosta et al. Predicting city safety perception based on visual image content
Carvalho et al. Using political party affiliation data to measure civil servants' risk of corruption
Ruiz et al. Simulation model to support security screening checkpoint operations in airport terminals
CN109472694A (zh) 一种可疑交易行为发现***
Wang et al. A multi-tier inspection queueing system with finite capacity for differentiated border control measures
Tsai et al. Simulation optimization in security screening systems subject to budget and waiting time constraints

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Correlation matching analyzing method among multiple objects

Effective date of registration: 20180116

Granted publication date: 20170412

Pledgee: Chongqing Fumin bank Limited by Share Ltd

Pledgor: Chongqing Aisi Wang'an Information Technology Co., Ltd.|Zhiduo Information Development Co Ltd, Chongqing

Registration number: 2018990000046

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20190319

Granted publication date: 20170412

Pledgee: Chongqing Fumin bank Limited by Share Ltd

Pledgor: Chongqing Aisi Wang'an Information Technology Co., Ltd.|Zhiduo Information Development Co Ltd, Chongqing

Registration number: 2018990000046

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Correlation matching analyzing method among multiple objects

Effective date of registration: 20200110

Granted publication date: 20170412

Pledgee: Chongqing Fumin bank Limited by Share Ltd

Pledgor: Chongqing AISI Network Information Technology Co., Ltd.|Chongqing Zhiduo Information Development Co., Ltd

Registration number: Y2020990000035

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 401121 left, 7th floor, building A5, development area, No. 30, Qingfeng North Road, new North District, Chongqing

Patentee after: Aisi Technology (Chongqing) Group Co.,Ltd.

Patentee after: CHONGQING ZHIDUOXIN INFORMATION DEVELOPMENT Co.,Ltd.

Address before: 401121 left, 7th floor, building A5, development area, No. 30, Qingfeng North Road, new North District, Chongqing

Patentee before: CHONGQING ISOFT TECHNOLOGY Co.,Ltd.

Patentee before: CHONGQING ZHIDUOXIN INFORMATION DEVELOPMENT Co.,Ltd.

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20210324

Granted publication date: 20170412

Pledgee: CHONGQING FUMIN BANK Co.,Ltd.

Pledgor: CHONGQING ISOFT TECHNOLOGY Co.,Ltd.|CHONGQING ZHIDUOXIN INFORMATION DEVELOPMENT Co.,Ltd.

Registration number: Y2020990000035