CN108600414B - 设备指纹的构建方法、装置、存储介质及终端 - Google Patents
设备指纹的构建方法、装置、存储介质及终端 Download PDFInfo
- Publication number
- CN108600414B CN108600414B CN201810435845.1A CN201810435845A CN108600414B CN 108600414 B CN108600414 B CN 108600414B CN 201810435845 A CN201810435845 A CN 201810435845A CN 108600414 B CN108600414 B CN 108600414B
- Authority
- CN
- China
- Prior art keywords
- equipment
- records
- field information
- cluster
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/30—Managing network names, e.g. use of aliases or nicknames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/604—Address structures or formats
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/618—Details of network addresses
- H04L2101/622—Layer-2 addresses, e.g. medium access control [MAC] addresses
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明适用于通信技术领域,提供了一种设备指纹的构建方法,所述方法包括:获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息;获取所述多个设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征;根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录;遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹。本发明提高了设备指纹的质量,解决了现有设备指纹构建算法得到的设备指纹质量低、容易被篡改的问题。
Description
技术领域
本发明属于通信技术领域,尤其涉及一种设备指纹的构建方法、装置、存储介质及终端。
背景技术
设备指纹是指可以用于唯一标识出设备的设备特征或者独特的设备标识。设备指纹应当是固有的、较难篡改的、唯一的设备标识。现有技术主要使用单一的设备特征来标识设备,比如设备的硬件ID、移动终端的IME编号、网卡的MAC地址等。这些设备指纹的组成要素单一,被篡改的可能性较高。而业内构建设备指纹的供应商,在构建设备指纹时,主要通过埋点的方式获取设备特征,所获取的信息数据质量较低,基于这些设备特征的设备指纹构建算法的精度较低,满足不了对大批量设备数据的验证及分析要求,所构建出来的设备指纹仍然容易被篡改,且篡改成本低,从而阻碍了基于设备维度的指纹分析及应用的发展。
发明内容
本发明实施例提供了一种设备指纹的构建方法、装置、存储介质及终端,以解决现有技术所构建的设备指纹质量低、容易被篡改的问题。
本发明实施例提供了一种设备指纹的构建方法,所述构建方法包括:
获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息;
获取所述多个设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征;
根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录;
遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹。
进一步地,所述根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录包括:
遍历每一类设备特征,获取该类设备特征在聚类分析后得到的簇及簇的个数;
遍历每一个簇,获取该簇中的每一个字段信息与该簇的聚类中心之间的相似性度量值,若所述相似性度量值在相似阈值范围内时,在该字段信息所在的设备记录中保留该字段信息;否则,将设备记录中的所述字段信息替换为聚类中心;
获取簇的个数大于第一数量阈值或小于第二数量阈值的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
其中,所述第一数量阈值大于所述第二数量阈值。
进一步地,所述对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录包括:
从所述过滤后的设备记录中随机抽取M个设备记录初始化M个簇的聚类中心;
遍历初始化后剩下的设备记录中的每一个设备记录,计算该设备记录与M个所述聚类中心之间的相似性度量值,将该设备记录划分到相似性度量值最小的簇中,得到设备记录的聚类结果;
根据所述设备记录的聚类结果重新计算M个簇的聚类中心,并将所述设备记录按照重新计算得到的聚类中心进行聚类,重复迭代多次;
当每个簇的聚类中心的变化小于指定阈值时,结束迭代过程,并输出最后一次聚类得到的M个簇,得到M组设备记录,其中M为正整数。
进一步地,所述遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹包括:
采用MD5信息-摘要算法对每个簇所包括的设备记录进行加密,生成该簇对应的设备指纹;
遍历所述M个簇中的每一个簇,得到M个设备指纹。
进一步地,在获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息之后,所述构建方法包括:
遍历每一类设备特征,删除设备记录中所述设备特征对应的字段信息中的异常值,以及填充所述设备特征对应的字段信息中的空缺值。
本发明实施例还提供了一种设备指纹的构建装置,所述构建装置包括:
获取模块,用于获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息;
第一聚类模块,用于获取所述多个设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征;
剔除模块,用于根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
第二聚类模块,用于对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录;
指纹生成模块,用于遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹。
进一步地,所述剔除模块包括:
获取单元,用于遍历每一类设备特征,获取该类设备特征在聚类分析后得到的簇及簇的个数;
字段信息处理单元,用于遍历每一个簇,获取该簇中的每一个字段信息到该簇的聚类中心之间的相似性度量值,若所述相似性度量值在相似阈值范围内时,在该字段信息所在的设备记录中保留该字段信息;否则,将设备记录中的所述字段信息替换为聚类中心;
设备特征剔除单元,用于获取簇的个数大于第一数量阈值或小于第二数量阈值的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
其中,所述第一数量阈值大于所述第二数量阈值。
进一步地,所述构建装置还包括:
预处理模块,用于遍历每一类设备特征,删除设备记录中所述设备特征对应的字段信息中的异常值,以及填充所述设备特征对应的字段信息中的空缺值。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序由处理器执行时实现如上所述的设备指纹的构建方法所述的步骤。
本发明实施例还提供了一种终端,所述终端包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的设备指纹的构建方法所述的步骤。
与现有技术相比,本发明实施例通过获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息,以扩展设备指纹的组成要素;然后获取所述设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征;接着根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录,以对所述若干类设备特征进行初步净化,筛选出高质量的数据信息;最后对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录;并遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹;从而提供了一套相对于计算机网络中的黑色产业篡改成本较高的设备指纹构建算法,所构建出来的设备指纹基于对多个设备特征的筛选和组合得到,有效地提高了设备指纹的质量且降低了设备指纹被篡改的概率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1是本发明实施例提供的设备指纹的构建方法的第一实现流程图;
图2是本发明实施例提供的设备指纹的构建方法的第二实现流程图;
图3是本发明实施例提供的设备指纹的构建方法的第三实现流程图;
图4是本发明实施例提供的设备指纹的构建方法的第四实现流程图;
图5是本发明实施例提供的设备指纹的构建装置的组成结构图;
图6是本发明实施例提供的终端的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明实施例提供的设备指纹的构建方法的第一实现流程。本发明实施例提供的所述设备指纹的构建方法应用于终端,包括但不限于计算机、服务器。参阅图1,所述设备指纹的构建方法包括:
在步骤S101中,获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息。
现有设备指纹构建算法的输入数据包括比如IP地址(Internet ProtocolAddress)、ID信息(deveice id)、mac地址(Media Access Control或者Medium AccessControl)等设备特征。本发明实施例在此基础上,从设备基础信息维度、位置信息维度、网络信息维度、***信息维度以及APP信息维度上做了进一步的扩展,除了上述设备特征外,还包括比如:设备基础信息中的移动设备国际识别码imei(International MobileEquipment Identity,又称为国际移动设备标识)、国际移动用户识别码imsi(International Mobile Subscriber Identification Number)、设备号,位置信息维度中的GPS(Global Positioning System,全球定位***)地址,网络信息维度中的热点信息、运营商,ios***信息维度中的广告标示符IDFA(identifier For Identifier)、Vendor标示符IDFV(identifier For Vendor),唯一识别码UDID(Unique Device Identifier),APP信息维度中的APP版本号,从而得到若干类设备特征。
然后通过SDK软件开发包工具对随机的若干个设备进行采集,针对每一个设备收集上述若干类设备特征对应的字段信息,得到每一个设备对应的一个设备记录,从而得到待分析的多个设备记录。
可选地,作为本发明的一个优选示例,在步骤S101获取待分析的多个设备记录之后,所述构建方法还可以对所述设备记录对应的字段信息进行清洗,所述构建方法还包括:
遍历每一类设备特征,删除设备记录中所述设备特征对应的字段信息中的异常值,以及填充所述设备特征对应的字段信息中的空缺值。
在删除异常值时,主要根据字段信息的长度、格式、组成要素等删除其中明显错误的字段,所述组成要素包括但不限于字母、数字、符号。示例性地,以下以设备特征MAC地址为例进行说明,MAC地址为电脑网卡的物理地址,每个网卡拥有全球唯一的MAC,以示区别。格式通常为6个字节的二进制代码(以6组16进制数表示),即XX-XX-XX-XX-XX-XX。若一个具体的设备记录中的MAC地址对应的字段信息的长度只有XX-XX-XX-XX,共4个字节,通过比对字节长度可以知道这个字段信息存在明显的错误,属于异常值,则删除该字段信息。
在填充空缺值时,主要查找内容为空的字段信息,然后通过关联场景来填充该字段信息。本发明实施例可以通过数据宽表的主键,比如用户账号,来关联同一用户在不同场景下的数据进行分析。若字段信息为字符型数据,则取主键关联到的不同场景下该设备特征的众数来进行填充,示例性地,以下以设备特征中的IP地址为例进行说明。若用户账号001在绑定场景下的IP地址为空,而在登录场景、注册场景下的IP地址为123.456.789.000,则可以将绑定场景的IP地址填充为登录场景、注册场景下的IP地址123.456.789.000。又比如,以下以设备特征中的Vendor标示符IDFV为例进行说明。在这里,Vendor是指应用的提供商,IDFV是由数字和字母组成的用来标识唯一设备的字符串,是给Vendor标识用户用的,每个设备中属于同一个Vender的应用都有相同的值。根据vendor的值,如果vendor相同,则返回同一字符串;如果vendor不同,则返回不同的字符串。对于BundleID(BundleIdentifier,iOS应用的唯一标识),若存在一个BundleID(com.somecompany.appone),其Vendor标示符IDFV为95966F33-BFBD-48BA-A630-855D2DAE482D,若同时存在另一个BundleID(com.somecompany.apptwo),其Vendor标示符IDFV为空缺值,基于关联场景分析,即通过BundleID的DNS反转的前两部分进行匹配,具有相同的com.somecompany,可以得到这两个BundleID属于同一个Vender,则用BundleID(com.somecompany.appone)的Vendor标示符IDFV来填充该另一个BundleID(com.somecompany.apptwo)的Vendor标示符IDFV。若字段信息为数值型数据,则取主键关联到的不同场景的均值来进行填充,以下以设备特征中的手机内存值为例进行说明。若用户账号001在绑定场景下的手机内存值为空,而在登录场景、注册场景下获取到的手机内存值为16g,则可以将绑定场景下的手机内存值填充为10g。
本发明实施例通过对字段信息进行清洗,进一步提高了字段信息的参考价值。
在步骤S102中,获取所述多个设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征。
在这里,针对每一类设备特征,本发明实施例从所述待分析的多个设备记录中取出该类设备特征对应的字段信息,得到该类设备特征对应的一组字段信息。然后针对每一类设备特征对应的一组字段信息独立地执行聚类分析,每一类设备特征之间的聚类分析互不相关。
示例性地,以所述若干类设备特征包括IP地址、ID信息、mac地址、imei码、imsi码、GPS地址、热点信息、运营商为示例,步骤S102对所述IP地址信息对应的字段信息进行一次聚类,对所述ID信息对应的字段信息进行一次聚类,对所述mac地址对应的字段信息进行一次聚类……以此类推,遍历每一类设备特征,得到每一类设备特征对应的聚类结果,即每一类设备特征在聚类后得到的簇以及簇的个数。
在步骤S103中,根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录。
通过对设备特征进行聚类分析,可以得到每类设备特征的离散性。本发明实施例根据每一类设备特征的离散性来对所述若干类设备特征进行过滤。所谓过滤是指剔除所述若干类设备特征中离散性未满足预设条件的设备特征及其字段信息。其中,聚类后设备特征的离散性过高或过低,均表明该设备特征对设备指纹的覆盖范围的贡献越小,该设备特征的质量越低。
本发明实施例通过剔除所述若干类设备特征中离散性未满足预设条件的设备特征,对所述若干类设备特征进行过滤,实现了对所收集到的设备特征的初步净化,有利于提高用于构建设备指纹的设备记录的质量,减少了离散性过高或过低的设备特征参与指纹构建。
在步骤S104中,对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录。
在这里,本发明实施例以净化后的设备记录作为数据集,进行聚类分析,生成若干个簇,以将所述设备记录划分为若干个组别,将相同或相似的设备记录划归到同一个组别中。其中,每一个簇表示一个设备,簇中所包括的设备记录均属于该簇所表示的设备,为该设备的设备记录的变动范围。
可选地,对设备记录进行聚类分析的算法可以采用比如k-means(K均值)算法、SVM(支持向量机)、KNN(K最近邻)算法等无监督聚类算法。在实际应用中,具体选择哪种算法,通过比较不同算法的精度,选择精度较高的算法来进行聚类。
在步骤S105中,遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹。
上述步骤S104将设备记录划分为若干个簇,该簇中所包括的设备记录可理解为该设备的设备记录的变动范围,即通过识别落在该簇内的设备记录均可以找到该设备,因此,所述若干个簇表示若干个设备对应的一组设备记录。本发明实施例进一步基于每一个设备对应的一组设备记录进行加密,生成该设备的唯一的设备指纹,从而提高了所构建出来的设备指纹的唯一性,提高了设备指纹的质量与安全性。
综上所述,本发明实施例通过获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息,以扩展设备指纹的组成要素;然后获取所述设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征;接着根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录,以对所述若干类设备特征进行初步净化,筛选出高质量的数据信息;最后对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录;并遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹;从而提供了一套相对于计算机网络中的黑色产业篡改成本较高的设备指纹构建算法,所构建出来的设备指纹基于对若干类设备特征的筛选和组合得到,有效地保证了设备指纹的唯一性校验,提高了设备指纹的质量且降低了设备指纹被篡改的概率。
进一步地,基于图1提供的设备指纹的构建方法的第一实现流程的基础上,提出本发明实施例提供的设备指纹的构建方法的第二实现流程。
在本发明实施例中,步骤S102中所述的聚类分析可以采用相似性度量(Similarity)来进行聚类分析。通过将每个字段信息转换为向量,计算向量之间的距离,得到两个字段信息之间的相似程度,然后根据所述相似程度进行相似性分析,以将这些字段信息进行归类,从而完成对同类设备特征对应的多个字段信息的聚类,得到该类设备特征对应的若干个簇。可选地,所述相似性度量包括但不限于余弦相似度(CosineSimilarity)、皮尔森相关系数(Pearson Correlation Coefficient)、杰卡德相似系数(Jaccard Similarity Coefficient)、欧氏距离(Euclidean Distance)。步骤S103则基于步骤S102的聚类结果来过滤所述设备特征。
如图2所示,是本发明实施例提供的设备指纹的构建方法的第二实现流程示意图。步骤S103所述的根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录包括:
在步骤S1031中,遍历每一类设备特征,获取该类设备特征在聚类分析后得到的簇及簇的个数。
在步骤1032中,遍历每一个簇,获取该簇中的每一个字段信息与该簇的聚类中心之间的相似性度量值,若所述相似性度量值在相似阈值范围内时,在该字段信息所在的设备记录中保留该字段信息;否则,将设备记录中的所述字段信息替换为聚类中心。
在本发明实施例中,对设备特征进行聚类分析后的结果包括所述设备特征对应的字段信息聚类得到的簇以及簇的个数。对于每一个簇,本发明实施例获取落在该簇中的字段信息到该簇的聚类中心之间的相似性度量值。在这里,所述相似性度量值反映了字段信息与聚类中心之间的差异。
本发明实施例预先设置了相似性阈值,所述相似性阈值用作字段信息在聚类分析后是否唯一的判断标准。对于一个具体的设备特征A在聚类分析后得到的一个具体的簇C1,若落在该簇C1的一个具体的设备记录中的字段信息A1,到该簇C1的聚类中心M1之间的相似性度量值小于或等于所述相似性阈值时,表明所述字段信息A1与聚类中心M1之间的差异非常小,该字段信息A1具备唯一性,则在该字段信息A1所在的设备记录中保留该字段信息A1;否则,若字段信息A1到该簇C1的聚类中心M1之间的相似性度量值大于所述相似性阈值时,表明所述字段信息A1与聚类中心M1之间的差异较大,该字段信息A1不具备唯一性,则将该字段信息A1所在的设备记录的所述字段信息A1替换为聚类中心M1,即替换为聚类中心表示的字段信息。
上述步骤S1032通过相似性阈值过滤掉差异明显的字段信息,有利于降低字段信息的维度,进而简化对设备记录的聚类过程。
在步骤S1033中,获取簇的个数大于第一数量阈值或小于第二数量阈值的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录。
如前所述,本发明实施例根据每一类设备特征在聚类分析后的离散性来对所述若干类设备特征进行过滤。所谓过滤是指剔除所述若干类设备特征中离散性未满足预设条件的字段信息。在本发明实施例中,离散性通过聚类分析得到的簇的个数来衡量,存在一个经验范围,包括上限值第一数量阈值和下限值第二数量阈值,所述第一数量阈值大于所述第二数量阈值。若设备特征在聚类后的簇的个数在所述经验范围内,即小于或等于第一数量阈值且大于或等于第二数量阈值,则认为该设备特征的离散性满足预设条件,保留该设备特征。否则,若设备特征在聚类后的簇的个数不在所述经验范围内,比如大于第一数量阈值,或者小于第二数量阈值,则认为该设备特征的离散性不佳,均未满足预设条件,剔除该设备特征及其对应的多个字段信息。
示例性地,以设备特征APP版本号为示例,假设在聚类后的簇的个数的经验范围为10到20个。若从100个设备采集APP版本号得到100条字段信息,在对所述100条字段信息聚类后,如果只聚类成2个簇,则小于所述经验范围的第二数量阈值10,该APP版本号在聚类后的簇的个数不在所述经验范围内,离散性过低;如果聚类成100个簇,则大于所述经验范围的第一数量阈值20,该APP版本号在聚类后簇的个数也不在所述经验范围内,离散性过高。这两种情况下该APP版本号对指纹构建的参考意义较低,剔除该APP版本号,以对所收集到的设备特征进行初步净化,提高用于构建设备指纹的字段信息的质量。
进一步地,基于图1提供的设备指纹的构建方法的第二实现流程的基础上,提出本发明实施例提供的设备指纹的构建方法的第三实现流程。
如图3所示,是本发明实施例提供的设备指纹的构建方法的第三实现流程示意图。步骤S104所述的对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录包括:
在步骤S1041中,从所述过滤后的设备记录中随机抽取M个设备记录初始化M个簇的聚类中心。
在这里,本发明实施例首先指定聚类后簇的个数为M,M为正整数。然后从所述过滤后的设备记录中随机抽取M条设备记录,作为第一次迭代的中心点,以初始化M个簇的聚类中心。可选地,随机抽取的M条设备记录也可以通过人工的方式根据所述过滤后的设备记录的分布情况来进行选择。
在步骤S1042中,遍历初始化后剩下的设备记录中的每一个设备记录,计算该设备记录与M个所述聚类中心之间的相似性度量值,将该设备记录划分到相似性度量值最小的簇中,得到设备记录的聚类结果。
在初始化M个簇的聚类中心之后,进入第一次迭代。可选地,可以选择相似性度量(Similarity)来进行聚类分析,将剩余的样本集中的样本值按照最小距离原则分配到最领近的聚类中。可选地,本发明实施例采用的所述相似性度量包括但不限于余弦相似度(Cosine Similarity)、皮尔森相关系数(Pearson Correlation Coefficient)、杰卡德相似系数(Jaccard Similarity Coefficient)、欧氏距离(Euclidean Distance)。
示例性地,假设所述过滤后的设备记录有N个,则遍历剩下的N-M个设备记录中的每一个设备记录,计算该设备记录到所述M个聚类中心的相似性度量值,得到该设备记录对应的M个相似性度量值。
针对每一个设备记录,比较其对应的M个相似性度量值,从中选取相似性度量值中的最小值对应的聚类中心及簇,以所述簇作为最邻近的聚类,将该设备记录分配到该最领近的聚类中,从而得到所述N-M个设备记录的聚类结果,完成对所述N个设备记录的第一次迭代聚类。
在步骤S1043中,根据所述设备记录的聚类结果重新计算M个簇的聚类中心,并将所述设备记录按照重新计算得到的聚类中心进行聚类,重复迭代多次。
如前所述,在得到对所述N个设备记录的第一次迭代的聚类结果后,使用所得到的M个簇中的设备记录进行下一次迭代,即求取每个簇中的设备记录对应的向量的均值,作为该簇的新的聚类中心。遍历所述M个簇,得到M个新的聚类中心。再以所述M个新的聚类中心,将所述N个设备记录按照最小距离原则分配到最领近的聚类中。
以上一次聚类得到的聚类中心重复执行步骤S1043,进行多次迭代,以提高聚类的效果。
在步骤S1044中,当每个簇的聚类中心的变化小于指定阈值时,结束迭代过程,并输出最后一次聚类得到的M个簇,得到M组设备记录。
在这里,本发明实施例预先指定可接受误差对应的阈值。每次迭代完后,计算本次迭代的聚类结果中每个簇的聚类中心,通过求取该簇所包括的设备记录对应的向量的均值得到。若本次迭代后每个簇的聚类中心与上一次迭代的聚类中心之间的距离小于所述指定阈值时,则认为簇的聚类中心均不再变化,结束迭代的过程。获取最后一次聚类得到的M个簇,得到M组设备记录。
在本发明实施例中,所得到的每一个簇表示一个设备,同一个簇中的设备记录是相同或相似的,该簇中所包括的设备记录可理解为该簇所表示设备的设备记录的可变化范围,即通过识别落在该簇内的设备记录均可以找到该设备。
进一步地,基于图3提供的设备指纹的构建方法的第三实现流程的基础上,提出本发明实施例提供的设备指纹的构建方法的第四实现流程。
如图4所示,是本发明实施例提供的设备指纹的构建方法的第四实现流程示意图。作为本发明的一个优选示例,在上述图3提供的设备指纹的构建方法的实现流程的基础上,步骤S105所述的所述遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹包括:
在步骤S1051中,采用MD5信息-摘要算法对每个簇所包括的设备记录进行加密,生成该簇对应的设备指纹。
在步骤S1052中,遍历所述M个簇中的每一个簇,得到M个设备指纹。
在这里,MD5的全称是Message-Digest Algorithm 5,中文名称为信息-摘要算法,属Hash算法一类。MD5算法通过对输入任意长度的消息进行运算,产生一个128位的消息摘要。在本发明实施例中所述任意长度的消息指每个簇所包括的设备记录,具体为将每个簇内的设备记录以512位分组来处理,每一分组又划分为16个32位子分组,经过一系列的处理后,输出四个32位分组,将这四个32位分组级联后产生一个128位的消息摘要,从而得到唯一的设备指纹。
由于MD5算法是一个不可逆的字符串变化算法,即使看到源程序和算法的描述,也无法将一个MD5算法得到的值变换为原始的字符串,从而保证了不同簇间所生成的设备指纹是不相同的,不法分子难以对设备指纹进行篡改,保证了所生成的设备指纹的唯一性,有效地进一步提高了设备指纹的质量且降低了设备指纹被篡改的概率。
应理解,在上述实施例中,各步骤的序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例2
图5示出了本发明实施例提供的设备指纹的构建装置的组成结构图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本发明实施例中,所述设备指纹的构建装置用于实现上述图1、图2、图3或图4实施例中所述的设备指纹的构建方法,可以是内置于终端的软件单元、硬件单元或者软硬件结合的单元。
参阅图5,所述设备指纹的构建装置包括:
获取模块51,用于获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息;
第一聚类模块52,用于获取所述多个设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征;
剔除模块53,用于根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
第二聚类模块54,用于对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录;
指纹生成模块55,用于遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹。
可选地,所述剔除模块53包括:
获取单元531,用于遍历每一类设备特征,获取该类设备特征在聚类分析后得到的簇及簇的个数;
字段信息处理单元532,用于遍历每一个簇,获取该簇中的每一个字段信息到该簇的聚类中心之间的相似性度量值,若所述相似性度量值在相似阈值范围内时,在该字段信息所在的设备记录中保留该字段信息;否则,将设备记录中的所述字段信息替换为聚类中心;
设备特征剔除单元533,用于获取簇的个数大于第一数量阈值或小于第二数量阈值的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
其中,所述第一数量阈值大于所述第二数量阈值。
可选地,所述第二聚类模块54包括:
初始化单元541,用于从所述过滤后的设备记录中随机抽取M个设备记录初始化M个簇的聚类中心;
初始聚类单元542,用于遍历初始化后剩下的设备记录中的每一个设备记录,计算该设备记录与M个所述聚类中心之间的相似性度量值,将该设备记录划分到相似性度量值最小的簇中,得到设备记录的聚类结果;
迭代聚类单元543,用于根据所述设备记录的聚类结果重新计算M个簇的聚类中心,并将所述设备记录按照重新计算得到的聚类中心进行聚类,重复迭代多次;
结果输出单元544,用于当每个簇的聚类中心的变化小于指定阈值时,结束迭代过程,并输出最后一次聚类得到的M个簇,得到M组设备记录,其中M为正整数。
可选地,所述指纹生成模块55包括:
加密单元551,用于采用MD5信息-摘要算法对每个簇所包括的设备记录进行加密,生成该簇对应的设备指纹;
遍历单元552,用于遍历所述M个簇中的每一个簇,得到M个设备指纹。
可选地,在获取待分析的若干类设备特征及每一类设备特征对应的多个字段信息之后,所述构建装置还包括:
预处理模块56,用于遍历每一类设备特征,删除设备记录中所述设备特征对应的字段信息中的异常值,以及填充所述设备特征对应的字段信息中的空缺值。
需要说明的是,本发明实施例中的各模块/单元可以用于实现上述方法实施例中的全部技术方案,其具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
实施例3
本实施例提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现实施例1中设备指纹的构建方法,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现实施例2中设备指纹的构建装置中各模块/单元的功能,为避免重复,这里不再赘述。
实施例4
图6是本发明实施例提供的一种终端的示意图,所述终端包括但不限于服务器、移动终端。如图6所示,该实施例的终端6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62。所述处理器60执行所述计算机程序62时实现上述设备指纹的构建方法实施例中的步骤,例如图1所示的步骤S101至S105,图2实施例中所述的步骤S1031至S1033,图3实施例中所述的步骤S1041至S1044以及图4实施例中所述的步骤S1051至步骤S1052,或者,所述处理器60执行所述计算机程序62时实现上述设备指纹的构建装置实施例中各模块/单元的功能,例如图5所示模块51至55的功能。
示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述终端6中的执行过程。例如,所述计算机程序62可以被分割成获取模块、第一聚类模块、剔除模块、第二聚类模块、指纹生成模块,各模块具体功能请参见上述实施例的叙述,此处不再赘述。
所述终端6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端6的示例,并不构成对终端6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述终端的控制中心,利用各种接口和线路连接整个终端的各个部分。
所述存储器61可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述终端的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart MediaCard,SMC)、安全数字卡(Secure Digital,SD)、闪存卡(Flash Card),至少一个磁盘存储器件、闪存器件或其他易失性固态存储器件。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种设备指纹的构建方法,其特征在于,所述构建方法包括:
获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息;
获取所述多个设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征;根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录;
遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹;
其中,离散性通过聚类分析得到的簇的个数来衡量,存在一个经验范围,包括上限值第一数量阈值和下限值第二数量阈值,所述第一数量阈值大于所述第二数量阈值;
若设备特征在聚类后的簇的个数在所述经验范围内,即小于或等于第一数量阈值且大于或等于第二数量阈值,则认为该设备特征的离散性满足预设条件,保留该设备特征。
2.如权利要求1所述的设备指纹的构建方法,其特征在于,所述根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录包括:
遍历每一类设备特征,获取该类设备特征在聚类分析后得到的簇及簇的个数;
遍历每一个簇,获取该簇中的每一个字段信息与该簇的聚类中心之间的相似性度量值,若所述相似性度量值在相似阈值范围内时,在该字段信息所在的设备记录中保留该字段信息;否则,将设备记录中的所述字段信息替换为聚类中心;
获取簇的个数大于第一数量阈值或小于第二数量阈值的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
其中,所述第一数量阈值大于所述第二数量阈值。
5.如权利要求1至4任一项所述的设备指纹的构建方法,其特征在于,在获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息之后,所述构建方法包括:
遍历每一类设备特征,删除设备记录中所述设备特征对应的字段信息中的异常值,以及填充所述设备特征对应的字段信息中的空缺值。
6.一种设备指纹的构建装置,其特征在于,所述构建装置包括:
获取模块,用于获取待分析的多个设备记录,每一个设备记录包括若干类设备特征对应的一个字段信息;
第一聚类模块,用于获取所述多个设备记录中的同类设备特征对应的字段信息,对所述字段信息进行聚类分析,遍历每一类设备特征;
剔除模块,用于根据聚类分析的结果获取离散性未满足预设条件的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
第二聚类模块,用于对所述过滤后的设备记录进行聚类分析,得到至少一个组别的设备记录;
指纹生成模块,用于遍历每一个组别,根据该组别内的设备记录生成对应的一个设备指纹;
其中,离散性通过聚类分析得到的簇的个数来衡量,存在一个经验范围,包括上限值第一数量阈值和下限值第二数量阈值,所述第一数量阈值大于所述第二数量阈值;
若设备特征在聚类后的簇的个数在所述经验范围内,即小于或等于第一数量阈值且大于或等于第二数量阈值,则认为该设备特征的离散性满足预设条件,保留该设备特征。
7.如权利要求6所述的设备指纹的构建装置,其特征在于,所述剔除模块包括:
获取单元,用于遍历每一类设备特征,获取该类设备特征在聚类分析后得到的簇及簇的个数;
字段信息处理单元,用于遍历每一个簇,获取该簇中的每一个字段信息与该簇的聚类中心之间的相似性度量值,若所述相似性度量值在相似阈值范围内时,在该字段信息所在的设备记录中保留该字段信息;否则,将设备记录中的所述字段信息替换为聚类中心;
设备特征剔除单元,用于获取簇的个数大于第一数量阈值或小于第二数量阈值的设备特征,从所述多个设备记录中剔除该类设备特征对应的字段信息,得到过滤后的设备记录;
其中,所述第一数量阈值大于所述第二数量阈值。
8.如权利要求6或7所述的设备指纹的构建装置,其特征在于,所述构建装置还包括:
预处理模块,用于遍历每一类设备特征,删除设备记录中所述设备特征对应的字段信息中的异常值,以及填充所述设备特征对应的字段信息中的空缺值。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序由处理器执行时实现权利要求1至5任一项的设备指纹的构建方法所述的步骤。
10.一种终端,所述终端包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述权利要求1至5任一项的设备指纹的构建方法所述的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810435845.1A CN108600414B (zh) | 2018-05-09 | 2018-05-09 | 设备指纹的构建方法、装置、存储介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810435845.1A CN108600414B (zh) | 2018-05-09 | 2018-05-09 | 设备指纹的构建方法、装置、存储介质及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108600414A CN108600414A (zh) | 2018-09-28 |
CN108600414B true CN108600414B (zh) | 2022-04-26 |
Family
ID=63635993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810435845.1A Active CN108600414B (zh) | 2018-05-09 | 2018-05-09 | 设备指纹的构建方法、装置、存储介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108600414B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109523565B (zh) * | 2018-11-15 | 2020-07-10 | 湖北工业大学 | 一种无衍射光莫尔条纹中心定位方法和*** |
CN110738396B (zh) * | 2019-09-18 | 2024-06-14 | 创新先进技术有限公司 | 一种针对设备的特征提取方法、装置及设备 |
CN111680286B (zh) * | 2020-02-27 | 2022-06-10 | 中国科学院信息工程研究所 | 物联网设备指纹库的精细化方法 |
CN111400695B (zh) * | 2020-04-09 | 2024-05-10 | 中国建设银行股份有限公司 | 一种设备指纹生成方法、装置、设备和介质 |
CN111709010B (zh) * | 2020-06-19 | 2021-05-07 | 山东省计算中心(国家超级计算济南中心) | 基于国密算法的终端认证信息提取和验证方法及*** |
CN112073407A (zh) * | 2020-09-04 | 2020-12-11 | 上海浦东发展银行股份有限公司 | 高并发业务中实时判断异常设备的***、方法及存储介质 |
US11770402B2 (en) * | 2021-02-25 | 2023-09-26 | Fortinet, Inc. | Systems and methods for network device discovery and vulnerability assessment |
CN114338600B (zh) * | 2021-12-28 | 2023-09-05 | 深信服科技股份有限公司 | 一种设备指纹的推选方法、装置、电子设备和介质 |
CN115766204B (zh) * | 2022-11-14 | 2024-04-26 | 电子科技大学 | 一种针对加密流量的动态ip设备标识***及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101882216A (zh) * | 2009-05-08 | 2010-11-10 | 成都市华为赛门铁克科技有限公司 | 构建数据指纹的方法、装置及电子设备 |
EP2269391A1 (en) * | 2008-04-25 | 2011-01-05 | Telefonaktiebolaget LM Ericsson (publ) | Radio fingerprint method in a positioning node for providing geographic region data |
CN106936667A (zh) * | 2017-04-17 | 2017-07-07 | 东南大学 | 一种基于应用程序流量分布式分析的主机实时识别方法 |
CN107392121A (zh) * | 2017-07-06 | 2017-11-24 | 同济大学 | 一种基于指纹识别的自适应设备识别方法及*** |
CN107819569A (zh) * | 2017-12-14 | 2018-03-20 | 平安科技(深圳)有限公司 | 登录信息的加密方法及终端设备 |
CN107832333A (zh) * | 2017-09-29 | 2018-03-23 | 北京邮电大学 | 基于分布式处理和dpi数据构建用户网络数据指纹的方法和*** |
-
2018
- 2018-05-09 CN CN201810435845.1A patent/CN108600414B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2269391A1 (en) * | 2008-04-25 | 2011-01-05 | Telefonaktiebolaget LM Ericsson (publ) | Radio fingerprint method in a positioning node for providing geographic region data |
CN101882216A (zh) * | 2009-05-08 | 2010-11-10 | 成都市华为赛门铁克科技有限公司 | 构建数据指纹的方法、装置及电子设备 |
CN106936667A (zh) * | 2017-04-17 | 2017-07-07 | 东南大学 | 一种基于应用程序流量分布式分析的主机实时识别方法 |
CN107392121A (zh) * | 2017-07-06 | 2017-11-24 | 同济大学 | 一种基于指纹识别的自适应设备识别方法及*** |
CN107832333A (zh) * | 2017-09-29 | 2018-03-23 | 北京邮电大学 | 基于分布式处理和dpi数据构建用户网络数据指纹的方法和*** |
CN107819569A (zh) * | 2017-12-14 | 2018-03-20 | 平安科技(深圳)有限公司 | 登录信息的加密方法及终端设备 |
Non-Patent Citations (1)
Title |
---|
基于设备识别的认证***设计;应治;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;20150630;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108600414A (zh) | 2018-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108600414B (zh) | 设备指纹的构建方法、装置、存储介质及终端 | |
CN110213227B (zh) | 一种网络数据流检测方法及装置 | |
CN107222511B (zh) | 恶意软件的检测方法及装置、计算机装置及可读存储介质 | |
CN106649831B (zh) | 一种数据过滤方法及装置 | |
CN108985954B (zh) | 一种建立各标识的关联关系的方法以及相关设备 | |
WO2012005765A1 (en) | Data analysis using multiple systems | |
CN110855761A (zh) | 一种基于区块链***的数据处理方法及装置 | |
CN108173781B (zh) | Https流量识别方法、装置、终端设备及存储介质 | |
CN111953552B (zh) | 数据流的分类方法和报文转发设备 | |
CN113328985B (zh) | 一种被动物联网设备识别方法、***、介质及设备 | |
WO2017101652A1 (zh) | 网站页面间访问路径的确定方法及装置 | |
CN113176992B (zh) | A/b实验分流方法、装置和计算机可读存储介质 | |
CN103618733A (zh) | 一种应用于移动互联网的数据过滤***及方法 | |
CN108876644B (zh) | 一种基于社交网络的相似账号计算方法及装置 | |
CN104424331A (zh) | 数据抽样方法及装置 | |
CN112564991A (zh) | 应用识别方法、装置及存储介质 | |
CN103746851A (zh) | 一种实现独立用户数统计的方法及装置 | |
CN108596271B (zh) | 指纹构建算法的评估方法、装置、存储介质及终端 | |
CN110876072B (zh) | 一种批量注册用户识别方法、存储介质、电子设备及*** | |
CN108924089B (zh) | 一种客户端设备识别方法、装置及客户端设备 | |
CN114785567A (zh) | 一种流量识别方法、装置、设备及介质 | |
CN108363740B (zh) | Ip地址的分析方法、装置、存储介质及终端 | |
CN110019400B (zh) | 数据存储方法、电子设备及存储介质 | |
CN109995798B (zh) | 一种信息推送的方法及其设备 | |
CN113572721B (zh) | 一种异常访问检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |