CN109995576A - 上网设备的识别方法、装置及存储介质、计算机设备 - Google Patents

上网设备的识别方法、装置及存储介质、计算机设备 Download PDF

Info

Publication number
CN109995576A
CN109995576A CN201910113122.4A CN201910113122A CN109995576A CN 109995576 A CN109995576 A CN 109995576A CN 201910113122 A CN201910113122 A CN 201910113122A CN 109995576 A CN109995576 A CN 109995576A
Authority
CN
China
Prior art keywords
equipment
browser
surfing
net
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910113122.4A
Other languages
English (en)
Inventor
黎立桂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910113122.4A priority Critical patent/CN109995576A/zh
Publication of CN109995576A publication Critical patent/CN109995576A/zh
Priority to PCT/CN2019/117866 priority patent/WO2020164272A1/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提供一种上网设备的识别方法、装置及存储介质、计算机设备,所述方法包括:获取上网设备的浏览器特征;获取所述浏览器特征的哈希值及对应的权重;根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串;将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备;其中,所述***历史数据包括多个设备的浏览器特征对应的数值串。上述方法采用上网设备对应浏览器特征,通过simhash计算,以准确识别出上网设备,从而可实现对上网设备的准确记录与跟踪。

Description

上网设备的识别方法、装置及存储介质、计算机设备
技术领域
本发明涉及上网设备研究技术领域,具体而言,本发明涉及一种上网设备的识别方法、装置及存储介质、计算机设备。
背景技术
目前市面上的浏览器设备指纹主要为两种,一种在Cookie中种入UUID;另外一种则利用Canvas绘制图形取CRC校验码(图像处理引擎,不同的导出选项,不同的压缩等级),给用户设备分配特定编号(指纹),特定编号用于识别不同设备。
其中,Cookie缺点:随着互联网对个人隐私的重视,Cookie越来越不受待见,不少安全工具甚至是浏览器都开始允许或引导用户关闭Cookie功能,这就导致使用Cookie的收效甚微。
Canvas缺点:准确性上有局限性,可能存在相同型号相同浏览器的不同设备出现相同的Canvas,导致设备指纹重复。
发明内容
本发明提出一种上网设备的识别方法、装置及存储介质、计算机设备,以准确识别出用户端中的上网设备,从而可实现对上网设备的准确记录与跟踪。
本发明提供以下方案:
一种上网设备的识别方法,包括:获取上网设备的浏览器特征;获取所述浏览器特征的哈希值及对应的权重;根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串;将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备;其中,所述***历史数据包括多个设备的浏览器特征对应的数值串。
在一实施例中,所述上网设备的浏览器特征包括通过浏览器获取的上网设备的设备特征以及浏览器的客户端特征;所述获取上网设备的浏览器特征,包括:通过所述浏览器向所述上网设备发送SDK包,利用所述SDK包获取所述上网设备的设备特征;通过读取所述浏览器的客户端数据获取所述客户端特征;所述获取所述浏览器特征的哈希值及对应的权重,包括:获取所述设备特征的哈希值以及所述设备特征的权重;获取所述客户端特征的哈希值以及所述客户端特征的权重;将所述设备特征的哈希值与所述设备特征的权重,以及所述客户端特征的哈希值以及所述客户端特征的权重作为所述浏览器特征的哈希值及对应的权重。。
在一实施例中,所述获取所述浏览器特征对应的权重,包括:根据每个所述浏览器特征的缺失值获取每个所述浏览器特征的权重;或,根据每个所述浏览器特征的熵值获取每个所述浏览器特征的权重。
在一实施例中,所述浏览器特征为多个;所述获取所述浏览器特征的哈希值及对应的权重,根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串,包括:对每个所述浏览器特征进行哈希处理,得到每个所述浏览器特征的哈希值;获取每个所述浏览器特征对应的权重;根据每个所述浏览器特征的权重对对应的哈希值进行加权处理,得到加权后的数值;将多个浏览器特征对应的加权后的数值进行合并累加,得到累加后的数值;将累加后的数值进行降维处理,得到所述浏览器特征数值串。
在一实施例中,所述将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备,包括:判断所述***历史数据中是否包含有所述浏览器特征对应的数据;若有,将所述浏览器特征数值串与所述***历史数据中数值串集合进行两两比较,计算两者之间的海明距离值;若所述海明距离值在阈值范围内,则确定所述上网设备与***中该数值串对应的设备为相同设备,可将两者设置相同的设备指纹;若无,对所述上网设备设置设备指纹,并将该设备指纹与所述浏览器特征数值串关联。
在一实施例中,所述阈值范围根据以下方式确定:获取***历史数据中多个标记有与浏览器特征相关的数值串的上网设备;分别获取该多个上网设备中每个上网设备的浏览器特征的哈希值以及每个浏览器特征对应的权重;根据每个上网设备对应的哈希值以及权重进行simhash计算,得到每个上网设备对应的浏览器特征数值串;分别将每个上网设备对应的浏览器特征数值串与***中标记的对应的数值串进行海明距离值计算,根据计算结果确定出所述阈值范围。
在一实施例中,所述根据计算结果确定出所述阈值范围,包括:获取每个上网设备对应的浏览器特征数值串与***中标记的对应的数值串的海明距离值,得到多个海明距离值;从所述多个海明距离值中筛选出最大值和最小值;将所述最小值和所述最大值之间的自然数值形成的数值范围作为所述阈值范围。
一种上网设备的识别装置,包括:第一获取模块,用于获取上网设备的浏览器特征;第二获取模块,用于获取所述浏览器特征的哈希值及对应的权重;计算模块,用于根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串;识别模块,用于将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备;其中,所述***历史数据包括多个设备的浏览器特征对应的数值串。
一种存储介质,其上存储有计算机程序;所述计算机程序适于由处理器加载并执行上述任一实施例所述的上网设备的识别方法。
一种计算机设备,其包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据上述任一实施例所述的上网设备的识别方法。
上述实施例提供的上网设备的识别方法,获取上网设备浏览器特征对应的权重以及浏览器特征的哈希值,根据这两者进行simhash计算,以通过simhash算法对浏览器特征进行去重,得到对应的浏览器特征数值串。最终根据浏览器特征数值串与***历史数据的对比结果,识别出上网设备。上述方法采用上网设备对应浏览器特征,通过simhash计算,以准确识别出上网设备,从而可实现对上网设备的准确记录与跟踪。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明提供的服务器与上网设备之间的一实施例中的交互示意图;
图2为本发明提供的一种上网设备的识别方法的一实施例中的方法流程图;
图3为本发明提供的一种上网设备的识别方法的另一实施例中的方法流程图;
图4为本发明提供的一种上网设备的识别方法的一具体实施方式中的流程示意图;
图5为本发明提供的步骤S400的一实施例中的方法流程图;
图6为本发明提供的一种上网设备的识别装置的一实施例中的结构框图;
图7为本发明提供的一种计算机设备的一实施例中的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式,这里使用的“第一”、“第二”仅用于区别同一技术特征,并不对该技术特征的顺序和数量等加以限定。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本发明提供的一种上网设备的识别方法,适用于各种向前端提供浏览器,并通过浏览器识别用户端的上网设备属性的服务器***。在一实施例中,该上网设备的识别方法应用于如图1所示的应用环境中。
如图1所示,服务器100与用户端的上网设备300位于同一个网络200环境中,服务器100与用户端的上网设备300通过网络200进行数据信息的交互。在本实施例中,用户端的上网设备300与服务器100进行网络通信。服务器100与用户终端300的数量不作限定,图1所示只作为示例说明。用户端的上网设备300中安装有浏览器客户端,用于对服务器100进行网络访问。用户可以通过上网设备300中的浏览器客户端与对应的服务器100进行信息交互。浏览器客户端与服务器(Server)端相对应,共同遵循同一套数据协议,使得服务器端跟浏览器客户端能够互相解析出对方的数据。
服务器100可以是,但不限于,网络服务器、管理服务器、应用程序服务器、数据库服务器、云端服务器等等。用户端的上网设备300可以是,但不限于智能手机、个人电脑(personal computer,PC)、平板电脑、个人数字助理(personal digital assistant,PDA)、移动上网设备(mobile Internet device,MID)等。用户端的上网设备300的操作***可以是,但不限于,安卓(Android)***、IOS(IPhone operating system)***、Windows phone***、Windows***等。
本发明提供一种上网设备的识别方法。在一实施例中,如图2所示,该上网设备的识别方法,包括以下步骤:
S100,获取上网设备的浏览器特征。
在本实施例中,服务器获取上网设备的多个浏览器特征。浏览器特征可包括设备可用屏幕分辨率、设备实际屏幕分辨率、设备可触控的点的个数、音频栈指纹、***对用户代理可用的逻辑处理器总数、浏览器插件、浏览器安装字体、Canvas、WebGL等。具体地,服务器通过JavaScript访问浏览器API获取多个浏览器特征。多个浏览器特征包含有反馈浏览器本身特性的特征,也包含有反馈操作***软硬件特性。在一具体实施方式中,可获取上网设备的至少50个浏览器特征。因此,可使用多个浏览器特征进行组合以提高特征的熵值,避免单个特征信息低熵值,从而确定出准确的唯一设备指纹。在一实施方式中,所述上网设备的浏览器特征包括设备可用屏幕分辨率、设备实际屏幕分辨率、设备可触控的点的个数、音频栈指纹、***对用户代理可用的逻辑处理器总数、浏览器插件、浏览器安装字体、Canvas、WebGL中的一个或多个。
具体地,设备实际屏幕分辨率是指设备屏幕宽和高的像素,如1920*1080。设备可用屏幕分辨率,是指应用可以使用的屏幕宽和高像素,如windows任务栏高度为40px,那么他的可用屏幕分辨率为1920*(1080-40)=1920*1040。音频栈指纹则由7部分组成的串,如:48000_2_1_0_2_explicit_speakers。其中,
第一位:取样频率。
第二位:最大频道数。
第三位:输入字节数。
第四位:输出字节数。
第五位:频道数。
第六位:ETS如何计算内部值时,向上或向下混合连接到音频输入。
第七位:表示描述通道含义的枚举值。将定义音频上混合和下混合将如何发生。
S200,获取所述浏览器特征的哈希值及对应的权重。
在本实施例中,服务器将获取到的浏览器特征进行哈希处理,得到对应的哈希值。同时,确定每个浏览器特征的权重。其中,浏览器特征的权重根据数据统计确定,如浏览器特征的稳定性(缺失值多少)和浏览器特征的熵大小等。
在一实施例中,所述上网设备的浏览器特征包括通过浏览器获取的上网设备的设备特征以及浏览器的客户端特征。此时,步骤S100包括:通过所述浏览器向所述上网设备发送SDK包,利用所述SDK包获取所述上网设备的设备特征;通过读取所述浏览器的客户端数据获取所述客户端特征。步骤S200包括:获取所述设备特征的哈希值以及所述设备特征的权重;获取所述客户端特征的哈希值以及所述客户端特征的权重;将所述设备特征的哈希值与所述设备特征的权重,以及所述客户端特征的哈希值以及所述客户端特征的权重作为所述浏览器特征的哈希值及对应的权重。
在该实施例中,通过浏览器获取的上网设备的设备特征包括设备可用屏幕分辨率、设备实际屏幕分辨率以及设备可触控的点的个数等。浏览器的客户端特征包括音频栈指纹、***对用户代理可用的逻辑处理器总数、浏览器插件、浏览器安装字体、Canvas、WebGL等。***可通过浏览器向上网设备发送SDK包,通过SDK包读取上网设备的设备特征。其中,SDK包用于解析上网设备的设备特征,并将所述设备特征发送给***。此外,***通过读取前端浏览器的相关数据,获取浏览器的客户端特征数据。进一步地,将上网设备的设备特征的哈希值和其权重、客户端特征的哈希值和其权重,作为所述浏览器特征的哈希值及对应的权重,以进行步骤S300的计算。
在一实施方式中,步骤S200中,所述获取所述浏览器特征对应的权重,包括:根据每个所述浏览器特征的缺失值获取每个所述浏览器特征的权重。或者,包括:根据每个所述浏览器特征的熵值获取每个所述浏览器特征的权重。
S300,根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串。
在本实施例中,服务器根据浏览器特征的哈希值及对应的权重进行simhash计算,得到浏览器特征对应的浏览器特征数值串。需要说明的是,服务器对历史设备的浏览器特征的字段进行数值化处理,并把关系保存在***对应的字典中。此步骤中,也是采用同样的数值化处理方法,得到所述浏览器特征数值串。其中,simhash算法是LSH(Locality-Sensitive Hashing,局部敏感哈希)算法的一种。simhash计算为通过降维的方式,将高维的特征向量映射成低维的特征向量,再根据降维后的两个向量的海明距离确定两向量的相似性。
在一实施例中,所述浏览器特征为多个。如图3所示,所述获取所述浏览器特征的哈希值及对应的权重,根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串,包括:
S201,对每个所述浏览器特征进行哈希处理,得到每个所述浏览器特征的哈希值。
S203,获取每个所述浏览器特征对应的权重。
S301,根据每个所述浏览器特征的权重对对应的哈希值进行加权处理,得到加权后的数值。
S303,将多个浏览器特征对应的加权后的数值进行合并累加,得到累加后的数值。
S305,将累加后的数值进行降维处理,得到所述浏览器特征数值串。
在该实施例中,每个浏览器特征对于识别所述上网设备的影响度不同,服务器根据每个浏览器特征对识别所述上网设备的影响度设置不同的权重。进一步地,根据每个所述浏览器特征的权重对浏览器特征的哈希值进行加权处理,并将加权后的数值进行累加,最后将累加后的数值进行降维处理后得到所述浏览器特征数值串。在一具体实施方式中,举例4个特征分别为屏幕分辨率、可触点个数、音频栈指纹以及WebGL,其权重分别为(1、2、3、4),计算逻辑如下参见图4所示。
S400,将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备;其中,所述***历史数据包括多个设备的浏览器特征对应的数值串。
在本实施例中,服务器将浏览器特征数值串与***历史数据进行对比。此处,当服务器获取到浏览器特征数值串之后,获取服务器中对应类型设备的浏览器特征数值串。若检测到服务器存储对应数值串的字典中不存在该类型设备的浏览器特征数值串,则直接将获取到的浏览器特征数值串存储在字典中,并标准该类型的设备。反之,与服务器字典中历史存在的数值串集合进行两两比较,以识别出所述上网设备。
在一实施例中,如图5所示,步骤S400,包括以下步骤:
S410,判断所述***历史数据中是否包含有所述浏览器特征对应的数据。
S420,若有,将所述浏览器特征数值串与所述***历史数据中数值串集合进行两两比较,计算两者之间的海明距离值;若所述海明距离值在阈值范围内,则确定所述上网设备与***中该数值串对应的设备为相同设备,可将两者设置相同的设备指纹。
S430,若无,对所述上网设备设置设备指纹,并将该设备指纹与所述浏览器特征数值串关联。
在该实施例中,服务器获取到浏览器特征数值串时,先确定***中是否存在该浏览器特征对应的数值串。若有,则将该浏览器数值串与历史已经存在的数值串集合进行两两比较,计算两数值串之间的海明距离(即异或运算后,得到1的个数为距离),距离相同且在阈值范围内,则认为当前的上网设备与***中浏览器特征数值串对应的设备为相同设备,***将采用相同的设备指纹ID。反之,则存储该浏览器特征数值串,并关联该设备指纹。因此,通过以上计算逻辑对新的上网设备会得到新的设备指纹fingerprint,相同设备得到相同的设备指纹fingerprint,达到对目标上网设备的记录与跟踪。
进一步地,所述阈值范围根据以下方式确定:
获取***历史数据中多个标记有与浏览器特征相关的数值串的上网设备;分别获取该多个上网设备中每个上网设备的浏览器特征的哈希值以及每个浏览器特征对应的权重;根据每个上网设备对应的哈希值以及权重进行simhash计算,得到每个上网设备对应的浏览器特征数值串;分别将每个上网设备对应的浏览器特征数值串与***中标记的对应的数值串进行海明距离值计算,根据计算结果确定出所述阈值范围。
具体***对于阈值范围的确定,可获取***中多个标记有浏览器特征相关的数值串的上网设备。同时,将每个上网设备对应浏览器特征的哈希值以及权重进行simhash计算,分别得到每个浏览器特征数值串。进一步分别将每个浏览器特征数值串与***中存储的对应的数值串进行海明距离值计算,得到多个计算结果值。分析该多个计算结果值的取值范围,将该取值范围作为所述阈值范围。
在一实施例中,所述根据计算结果确定出所述阈值范围,包括:获取每个上网设备对应的浏览器特征数值串与***中标记的对应的数值串的海明距离值,得到多个海明距离值;从所述多个海明距离值中筛选出最大值和最小值;将所述最小值和所述最大值之间的自然数值形成的数值范围作为所述阈值范围。
具体地,将根据***中多个标记有浏览器特征相关的数值串的上网设备得到的多个海明距离值作为训练样本值,获取训练样本值中海明距离值的最大值和最小值。所述阈值范围为所述最大值和所述最小值之间的自然数值范围。
上述实施例提供的上网设备的识别方法,获取上网设备浏览器特征对应的权重以及浏览器特征的哈希值,根据这两者进行simhash计算,以通过simhash算法对浏览器特征进行去重,得到对应的浏览器特征数值串。最终根据浏览器特征数值串与***历史数据的对比结果,识别出上网设备。上述方法采用上网设备对应浏览器特征,通过simhash计算,以准确识别出上网设备,从而可实现对上网设备的准确记录与跟踪。并且,对于不同上网设备,通过算法得到不同的设备浏览器指纹。相同上网设备,通过算法得到相同的设备浏览器指纹,因此,可实现对用户进行无感知的跟踪与标识。
本发明还提供一种上网设备的识别装置。在一实施例中,如图6所示,该上网设备的识别装置包括第一获取模块10、第二获取模块20、计算模块30以及识别模块40。
第一获取模块10用于获取上网设备的浏览器特征。在本实施例中,服务器获取上网设备的多个浏览器特征。浏览器特征可包括设备可用屏幕分辨率、设备实际屏幕分辨率、设备可触控的点的个数、音频栈指纹、***对用户代理可用的逻辑处理器总数、浏览器插件、浏览器安装字体、Canvas、WebGL等。具体地,服务器通过JavaScript访问浏览器API获取多个浏览器特征。多个浏览器特征包含有反馈浏览器本身特性的特征,也包含有反馈操作***软硬件特性。在一具体实施方式中,可获取上网设备的至少50个浏览器特征。因此,可使用多个浏览器特征进行组合以提高特征的熵值,避免单个特征信息低熵值,从而确定出准确的唯一设备指纹。
第二获取模块20用于获取所述浏览器特征的哈希值及对应的权重。在本实施例中,服务器将获取到的浏览器特征进行哈希处理,得到对应的哈希值。同时,确定每个浏览器特征的权重。其中,浏览器特征的权重根据数据统计确定,如浏览器特征的稳定性(缺失值多少)和浏览器特征的熵大小等。
计算模块30用于根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串。在本实施例中,服务器根据浏览器特征的哈希值及对应的权重进行simhash计算,得到浏览器特征对应的浏览器特征数值串。需要说明的是,服务器对历史设备的浏览器特征的字段进行数值化处理,并把关系保存在***对应的字典中。此模块中,也是采用同样的数值化处理方法,得到所述浏览器特征数值串。
识别模块40用于将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备;其中,所述***历史数据包括多个设备的浏览器特征对应的数值串。在本实施例中,服务器将浏览器特征数值串与***历史数据进行对比。此处,当服务器获取到浏览器特征数值串之后,获取服务器中对应类型设备的浏览器特征数值串。若检测到服务器存储对应数值串的字典中不存在该类型设备的浏览器特征数值串,则直接将获取到的浏览器特征数值串存储在字典中,并标准该类型的设备。反之,与服务器字典中历史存在的数值串集合进行两两比较,以识别出所述上网设备。
在其他实施例中,本发明提供的上网设备的识别装置中的各个模块还用于执行本发明所述的上网设备的识别方法中,对应各个步骤执行的操作,在此不再做详细的说明。
本发明还提供一种存储介质。该存储介质上存储有计算机程序;所述计算机程序被处理器执行时,实现上述任一实施例所述的上网设备的识别方法。该存储介质可以是存储器。例如,内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储介质包括但不限于这些类型的存储器。本发明所公开的存储器只作为例子而非作为限定。
本发明还提供一种计算机设备。一种计算机设备包括:一个或多个处理器;存储器;一个或多个应用程序。其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述任一实施例所述的上网设备的识别方法。
图7为本发明一实施例中的计算机设备的结构示意图。本实施例所述计算机设备可以是服务器、个人计算机以及网络设备。如图7所示,设备包括处理器703、存储器705、输入单元707以及显示单元709等器件。本领域技术人员可以理解,图7示出的设备结构器件并不构成对所有设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储器705可用于存储应用程序701以及各功能模块,处理器703运行存储在存储器705的应用程序701,从而执行设备的各种功能应用以及数据处理。存储器可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储器包括但不限于这些类型的存储器。本发明所公开的存储器只作为例子而非作为限定。
输入单元707用于接收信号的输入,以及接收用户输入的关键字。输入单元707可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元709可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元709可采用液晶显示器、有机发光二极管等形式。处理器703是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器705内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。
在一实施方式中,设备包括一个或多个处理器703,以及一个或多个存储器705,一个或多个应用程序701。其中所述一个或多个应用程序701被存储在存储器705中并被配置为由所述一个或多个处理器703执行,所述一个或多个应用程序701配置用于执行以上实施例所述的上网设备的识别方法。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括存储器、磁盘或光盘等。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
应该理解的是,在本发明各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种上网设备的识别方法,其特征在于,包括:
获取上网设备的浏览器特征;
获取所述浏览器特征的哈希值及对应的权重;
根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串;
将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备;其中,所述***历史数据包括多个设备的浏览器特征对应的数值串。
2.根据权利要求1所述的方法,其特征在于,所述上网设备的浏览器特征包括通过浏览器获取的上网设备的设备特征以及浏览器的客户端特征;
所述获取上网设备的浏览器特征,包括:
通过所述浏览器向所述上网设备发送SDK包,利用所述SDK包获取所述上网设备的设备特征;
通过读取所述浏览器的客户端数据获取所述客户端特征;
所述获取所述浏览器特征的哈希值及对应的权重,包括:
获取所述设备特征的哈希值以及所述设备特征的权重;
获取所述客户端特征的哈希值以及所述客户端特征的权重;
将所述设备特征的哈希值与所述设备特征的权重,以及所述客户端特征的哈希值以及所述客户端特征的权重作为所述浏览器特征的哈希值及对应的权重。
3.根据权利要求1所述的方法,其特征在于,所述获取所述浏览器特征对应的权重,包括:
根据每个所述浏览器特征的缺失值获取每个所述浏览器特征的权重;或,
根据每个所述浏览器特征的熵值获取每个所述浏览器特征的权重。
4.根据权利要求1所述的方法,其特征在于,所述浏览器特征为多个;所述获取所述浏览器特征的哈希值及对应的权重,根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串,包括:
对每个所述浏览器特征进行哈希处理,得到每个所述浏览器特征的哈希值;
获取每个所述浏览器特征对应的权重;
根据每个所述浏览器特征的权重对对应的哈希值进行加权处理,得到加权后的数值;
将多个浏览器特征对应的加权后的数值进行合并累加,得到累加后的数值;
将累加后的数值进行降维处理,得到所述浏览器特征数值串。
5.根据权利要求1所述的方法,其特征在于,所述将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备,包括:
判断所述***历史数据中是否包含有所述浏览器特征对应的数据;
若有,将所述浏览器特征数值串与所述***历史数据中数值串集合进行两两比较,计算两者之间的海明距离值;若所述海明距离值在阈值范围内,则确定所述上网设备与***中该数值串对应的设备为相同设备,可将两者设置相同的设备指纹;
若无,对所述上网设备设置设备指纹,并将该设备指纹与所述浏览器特征数值串关联。
6.根据权利要求5所述的方法,其特征在于,所述阈值范围根据以下方式确定:
获取***历史数据中多个标记有与浏览器特征相关的数值串的上网设备;
分别获取该多个上网设备中每个上网设备的浏览器特征的哈希值以及每个浏览器特征对应的权重;
根据每个上网设备对应的哈希值以及权重进行simhash计算,得到每个上网设备对应的浏览器特征数值串;
分别将每个上网设备对应的浏览器特征数值串与***中标记的对应的数值串进行海明距离值计算,根据计算结果确定出所述阈值范围。
7.根据权利要求6所述的方法,其特征在于,所述根据计算结果确定出所述阈值范围,包括:
获取每个上网设备对应的浏览器特征数值串与***中标记的对应的数值串的海明距离值,得到多个海明距离值;
从所述多个海明距离值中筛选出最大值和最小值;
将所述最小值和所述最大值之间的自然数值形成的数值范围作为所述阈值范围。
8.一种上网设备的识别装置,其特征在于,包括:
第一获取模块,用于获取上网设备的浏览器特征;
第二获取模块,用于获取所述浏览器特征的哈希值及对应的权重;
计算模块,用于根据所述哈希值及对应的权重进行simhash计算,得到所述浏览器特征对应的浏览器特征数值串;
识别模块,用于将所述浏览器特征数值串与***历史数据进行对比,识别所述上网设备;其中,所述***历史数据包括多个设备的浏览器特征对应的数值串。
9.一种存储介质,其特征在于,其上存储有计算机程序;所述计算机程序适于由处理器加载并执行上述权利要求1至7中任一项所述的上网设备的识别方法。
10.一种计算机设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据权利要求1至7任一项所述的上网设备的识别方法。
CN201910113122.4A 2019-02-13 2019-02-13 上网设备的识别方法、装置及存储介质、计算机设备 Pending CN109995576A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910113122.4A CN109995576A (zh) 2019-02-13 2019-02-13 上网设备的识别方法、装置及存储介质、计算机设备
PCT/CN2019/117866 WO2020164272A1 (zh) 2019-02-13 2019-11-13 上网设备的识别方法、装置及存储介质、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910113122.4A CN109995576A (zh) 2019-02-13 2019-02-13 上网设备的识别方法、装置及存储介质、计算机设备

Publications (1)

Publication Number Publication Date
CN109995576A true CN109995576A (zh) 2019-07-09

Family

ID=67129297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910113122.4A Pending CN109995576A (zh) 2019-02-13 2019-02-13 上网设备的识别方法、装置及存储介质、计算机设备

Country Status (2)

Country Link
CN (1) CN109995576A (zh)
WO (1) WO2020164272A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111181912A (zh) * 2019-08-27 2020-05-19 腾讯科技(深圳)有限公司 浏览器标识的处理方法、装置、电子设备及存储介质
CN111400695A (zh) * 2020-04-09 2020-07-10 中国建设银行股份有限公司 一种设备指纹生成方法、装置、设备和介质
WO2020164272A1 (zh) * 2019-02-13 2020-08-20 平安科技(深圳)有限公司 上网设备的识别方法、装置及存储介质、计算机设备
CN112765578A (zh) * 2021-01-26 2021-05-07 上海黔易数据科技有限公司 一种基于浏览器客户端的安全隐私计算的实现方法
CN113177144A (zh) * 2021-04-28 2021-07-27 Oppo广东移动通信有限公司 用户识别方法、用户识别装置、电子设备及介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056912B (zh) * 2023-08-15 2024-06-11 浙江齐安信息科技有限公司 基于canvas指纹的操作***识别方法、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110288940A1 (en) * 2010-05-24 2011-11-24 Horadan Peter H Method and Apparatus for Correlating Multiple Cookies as Having Originated from the Same Device Using Device Fingerprinting
CN105100164A (zh) * 2014-05-20 2015-11-25 深圳市腾讯计算机***有限公司 网络服务推荐方法和装置
CN106650382A (zh) * 2016-12-30 2017-05-10 北京工业大学 一种基于浏览器的高性能用户追踪方法
CN107770805A (zh) * 2016-08-22 2018-03-06 腾讯科技(深圳)有限公司 终端的标识信息的判定方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9298757B1 (en) * 2013-03-13 2016-03-29 International Business Machines Corporation Determining similarity of linguistic objects
CN106407203A (zh) * 2015-07-29 2017-02-15 阿里巴巴集团控股有限公司 一种对目标终端进行识别的方法和设备
CN106599227B (zh) * 2016-12-19 2020-04-17 北京天广汇通科技有限公司 用于获取基于属性值的对象之间的相似度的方法与装置
CN106453437B (zh) * 2016-12-22 2019-12-06 ***股份有限公司 一种设备识别码获取方法及装置
CN108363811A (zh) * 2018-03-09 2018-08-03 北京京东金融科技控股有限公司 设备识别方法及装置、电子设备、存储介质
CN108881513B (zh) * 2018-06-29 2021-07-27 深圳鼎盛电脑科技有限公司 一种设备码生成的方法、装置、设备及存储介质
CN109995576A (zh) * 2019-02-13 2019-07-09 平安科技(深圳)有限公司 上网设备的识别方法、装置及存储介质、计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110288940A1 (en) * 2010-05-24 2011-11-24 Horadan Peter H Method and Apparatus for Correlating Multiple Cookies as Having Originated from the Same Device Using Device Fingerprinting
CN105100164A (zh) * 2014-05-20 2015-11-25 深圳市腾讯计算机***有限公司 网络服务推荐方法和装置
CN107770805A (zh) * 2016-08-22 2018-03-06 腾讯科技(深圳)有限公司 终端的标识信息的判定方法及装置
CN106650382A (zh) * 2016-12-30 2017-05-10 北京工业大学 一种基于浏览器的高性能用户追踪方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020164272A1 (zh) * 2019-02-13 2020-08-20 平安科技(深圳)有限公司 上网设备的识别方法、装置及存储介质、计算机设备
CN111181912A (zh) * 2019-08-27 2020-05-19 腾讯科技(深圳)有限公司 浏览器标识的处理方法、装置、电子设备及存储介质
CN111181912B (zh) * 2019-08-27 2021-10-15 腾讯科技(深圳)有限公司 浏览器标识的处理方法、装置、电子设备及存储介质
CN111400695A (zh) * 2020-04-09 2020-07-10 中国建设银行股份有限公司 一种设备指纹生成方法、装置、设备和介质
CN111400695B (zh) * 2020-04-09 2024-05-10 中国建设银行股份有限公司 一种设备指纹生成方法、装置、设备和介质
CN112765578A (zh) * 2021-01-26 2021-05-07 上海黔易数据科技有限公司 一种基于浏览器客户端的安全隐私计算的实现方法
CN113177144A (zh) * 2021-04-28 2021-07-27 Oppo广东移动通信有限公司 用户识别方法、用户识别装置、电子设备及介质

Also Published As

Publication number Publication date
WO2020164272A1 (zh) 2020-08-20

Similar Documents

Publication Publication Date Title
CN109995576A (zh) 上网设备的识别方法、装置及存储介质、计算机设备
CN109145219A (zh) 基于互联网文本挖掘的兴趣点有效性判断方法和装置
CN112863683B (zh) 基于人工智能的病历质控方法、装置、计算机设备及存储介质
US20120204257A1 (en) Detecting fraud using touchscreen interaction behavior
CN109918892A (zh) 验证码生成方法、装置及存储介质、计算机设备
WO2007149341A2 (en) System to associate a demographic to a user of an electronic system
Acien et al. Active detection of age groups based on touch interaction
CN113220734A (zh) 课程推荐方法、装置、计算机设备及存储介质
CN111600874B (zh) 用户账号检测方法、装置、电子设备、介质
CN110503506A (zh) 基于评分数据的物品推荐方法、装置及介质
CN110263824A (zh) 模型的训练方法、装置、计算设备及计算机可读存储介质
CN110827112A (zh) 深度学习的商品推荐方法、装置、计算机设备及存储介质
US20170287023A1 (en) Blacklisting Based on Image Feature Analysis and Collaborative Filtering
CN106537387B (zh) 检索/存储与事件相关联的图像
CN111275205A (zh) 虚拟样本的生成方法、终端设备及存储介质
Maiorana et al. Mobile keystroke dynamics for biometric recognition: An overview
CN106910135A (zh) 用户推荐方法及装置
CN109995751A (zh) 上网设备标记方法、装置及存储介质、计算机设备
CN107404491B (zh) 终端环境异常检测方法、检测装置及计算机可读存储介质
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
Panagiotakis et al. Detection of hurriedly created abnormal profiles in recommender systems
CN107786376B (zh) 内容推送方法、装置及计算机设备
CN110009056A (zh) 一种社交账号的分类方法及分类装置
CN110008787A (zh) 从视频中确定人的装置和方法以及搜索人的装置
CN111897936B (zh) 一种问答***的召回准确度的评测方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190709

RJ01 Rejection of invention patent application after publication