CN114626104A - 一种设备标识选择方法及装置 - Google Patents
一种设备标识选择方法及装置 Download PDFInfo
- Publication number
- CN114626104A CN114626104A CN202210241738.1A CN202210241738A CN114626104A CN 114626104 A CN114626104 A CN 114626104A CN 202210241738 A CN202210241738 A CN 202210241738A CN 114626104 A CN114626104 A CN 114626104A
- Authority
- CN
- China
- Prior art keywords
- candidate
- identifier
- candidate identifier
- determining
- classification type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010187 selection method Methods 0.000 title claims description 15
- 238000004364 calculation method Methods 0.000 claims abstract description 93
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 16
- 230000006399 behavior Effects 0.000 claims description 25
- 238000010606 normalization Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 14
- 230000001680 brushing effect Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000001960 triggered effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/70—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
- G06F21/71—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information
- G06F21/73—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information by creating or determining hardware identification, e.g. serial numbers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种设备标识选择方法及装置,涉及数据处理技术领域,上述方法包括:获得设备的多个候选标识;针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值;针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型;针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到加权计算结果;根据各个候选标识的加权计算结果,从各个候选标识中确定设备的目标设备标识。应用本发明实施例提供的方案选择设备标识,能够提高设备标识选择的准确性。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种设备标识选择方法及装置。
背景技术
一台设备可以具有多种设备标识,每一种设备标识均可以用于识别该设备,例如,上述设备标识可以是IMEI(International Mobile Equipment Identity,国际移动设备识别码)、OAID(Open Anonymous Device Identifier,匿名设备标识符)等。服务器在向客户端推送信息时,通常需要首先获得该客户端所在设备的一个或多个设备标识,从中选择一个设备标识作为目标设备标识,用于识别待接收信息的设备,然后向该设备上的客户端推送信息,实现信息的精准推送。
然而,服务器所获取的设备标识可能会出现缺失、被篡改等异常情况,并且服务器通常难以判断出设备标识是否出现异常,这就难以保证服务器从多个设备标识中选择正常的设备标识作为目标设备标识的准确性,从而降低信息推送的准确性。因此,为了实现信息的精准推送,需要一种设备标识选择方案,以提高选择目标设备标识的准确性。
发明内容
本发明实施例的目的在于提供一种设备标识选择方案,以提高选择目标设备标识的准确性。具体技术方案如下:
第一方面,本发明实施例提供了一种设备标识选择方法,所述方法包括:
获得设备的多个候选标识;
针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值,其中,所述特征参数用于反映该候选标识为目标设备标识的可靠程度;
针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型;
针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果;
根据各个候选标识的加权计算结果,从各个候选标识中确定所述设备的目标设备标识。
本发明的一个实施例中,所述特征参数包括以下参数:所述数据日志中记录的不同地域的地域数量、不同网站的网站数量以及所述数据日志中的信息浏览日志的浏览数量、信息点击日志的点击数量;
所述根据该候选标识的特征参数,确定该候选标识所属的分类类型,包括:
若该候选标识的信息浏览日志的数量小于第一预设阈值、且信息点击日志的数量小于第二预设阈值,则确定该候选标识属于第一正常分类类型;
否则,根据该候选标识的特征参数中不同地域的数量、不同网站的数量,确定该候选标识所属的其他分类类型。
本发明的一个实施例中,所述根据该候选标识的特征参数中不同地域的数量、不同网站的数量,确定该候选标识所属的其他分类类型,包括:
若该候选标识的特征参数中不同地域的数量大于第三预设阈值、且不同网站的数量大于第四预设阈值,则确定所述候选标识属于异常分类类型;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第一分类类型,其中,所述第一分类类型中标识对应的设备存在疑似刷量行为;
若所述不同地域的数量大于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第二分类类型,其中,所述第二分类类型中标识对应的设备存在高级刷量行为;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量大于第四预设阈值,则确定所述候选标识属于第二正常分类类型。
本发明的一个实施例中,所述候选标识的特征参数还包括附加参数,所述附加参数包括以下参数中的至少一种:
所述数据日志中记录的不同设备型号的型号数量;
在所述数据日志记录有多种类型的标识的情况下,除该候选标识所属类型外、其他类型的不同标识的标识数量。
所述针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果,包括:
针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数、不同附加参数的权重系数,对该候选标识的各特征参数、各附加参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果。
本发明的一个实施例中,在针对每一候选标识,基于该候选标识所属的预设分类类型对应的特征参数的权重系数,对该候选标识的特征参数的参数值进行加权计算之前,所述方法还包括:
针对每一特征参数,对各个候选标识的该特征参数的参数值进行归一化处理。
第二方面,本发明实施例还提供了一种设备标识选择装置,所述装置包括:
标识获得模块,用于获得设备的多个候选标识;
特征统计模块,用于针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值,其中,所述特征参数用于反映该候选标识为目标设备标识的可靠程度;
标识分类模块,用于针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型;
参数计算模块,用于针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果;
目标确定模块,用于根据各个候选标识的加权计算结果,从各个候选标识中确定所述设备的目标设备标识。
本发明的一个实施例中,所述特征参数包括以下参数:所述数据日志中记录的不同地域的地域数量、不同网站的网站数量以及所述数据日志中的信息浏览日志的浏览数量、信息点击日志的点击数量;
所述标识分类模块,包括:
阈值判断子模块,用于针对每一候选标识,判断该候选标识的信息浏览日志的数量是否小于第一预设阈值、且信息点击日志的数量小于第二预设阈值,若为是,则触发第一确定子模块,若为否,则触发第二确定子模块;
所述第一确定子模块,用于确定该候选标识属于第一正常分类类型;
所述第二确定子模块,用于根据该候选标识的特征参数中不同地域的数量、不同网站的数量,确定该候选标识所属的其他分类类型;
本发明的一个实施例中,所述第二确定子模块,具体用于:
若该候选标识的特征参数中不同地域的数量大于第三预设阈值、且不同网站的数量大于第四预设阈值,则确定所述候选标识属于异常分类类型;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第一分类类型,其中,所述第一分类类型中标识对应的设备存在疑似刷量行为;
若所述不同地域的数量大于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第二分类类型,其中,所述第二分类类型中标识对应的设备存在高级刷量行为;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量大于第四预设阈值,则确定所述候选标识属于第二正常分类类型。
本发明的一个实施例中,所述候选标识的特征参数还包括附加参数,所述附加参数包括以下参数中的至少一种:
所述数据日志中记录的不同设备型号的型号数量;
在所述数据日志记录有多种类型的标识的情况下,除该候选标识所属类型外、其他类型的不同标识的标识数量。
所述参数计算模块,具体用于:
针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数、不同附加参数的权重系数,对该候选标识的各特征参数、各附加参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果。
本发明的一个实施例中,所述装置还包括:
归一化处理模块,用于在针对每一候选标识,基于该候选标识所属的预设分类类型对应的特征参数的权重系数,对该候选标识的特征参数的参数值进行加权计算之前,针对每一特征参数,对各个候选标识的该特征参数的参数值进行归一化处理。
第三方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的设备标识选择方法。
第四方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的设备标识选择方法。
由以上可见,应用本发明实施例提供的方案选择设备标识时,在每一候选标识的数据日志中统计该候选标识的特征参数的参数值,并根据该候选标识的特征参数,确定该候选标识所属的分类类型,再基于所确定的分类类型对应的特征参数的权重系数,对该候选标识的特征参数的参数值进行加权计算,获得加权计算结果。由于每一特征参数均可反映候选标识为目标设备标识的可靠程度,因此,加权计算得到的结果同样可以反映候选标识为目标设备标识的可靠程度,从而根据各个候选标识的加权计算结果,能够准确可靠的从各个候选标识中确定出目标设备标识。
另外,通过对候选标识的各个特征参数的参数值进行加权计算,可以理解为从多个方面综合考虑候选标识为目标设备标识的可靠程度,因此候选标识的加权计算结果能够更加准确的反映候选标识为目标设备标识的可靠程度,从而进一步提高设备标识选择的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的第一种设备标识选择方法的流程示意图;
图2为本发明实施例提供的第二种设备标识选择方法的流程示意图;
图3为本发明实施例提供的第三种设备标识选择方法的流程示意图;
图4为本发明实施例提供的第四种设备标识选择方法的流程示意图;
图5为本发明实施例提供的第五种设备标识选择方法的流程示意图;
图6为本发明实施例提供的第六种设备标识选择方法的流程示意图;
图7为本发明实施例提供的第一种设备标识选择装置的结构示意图;
图8为本发明实施例提供的第二种设备标识选择装置的结构示意图;
图9为本发明实施例提供的第三种设备标识选择装置的结构示意图;
图10为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
应用现有技术,在多个设备标识中选择目标设备标识的准确性较低,为解决这一技术问题,本发明实施例提供了一种设备标识选择方法及装置。
本发明的一个实施例中,提供了一种设备标识选择方法,上述方法包括:
获得设备的多个候选标识;
针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值,其中,特征参数用于反映该候选标识为目标设备标识的可靠程度;
针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型;
针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果;
根据各个候选标识的加权计算结果,从各个候选标识中确定设备的目标设备标识。
由以上可见,应用本发明实施例提供的方案选择设备标识时,在每一候选标识的数据日志中统计该候选标识的特征参数的参数值,并根据该候选标识的特征参数,确定该候选标识所属的分类类型,再基于所确定的分类类型对应的特征参数的权重系数,对该候选标识的特征参数的参数值进行加权计算,获得加权计算结果。由于每一特征参数均可反映候选标识为目标设备标识的可靠程度,因此,加权计算得到的结果同样可以反映候选标识为目标设备标识的可靠程度,从而根据各个候选标识的加权计算结果,能够准确可靠的从各个候选标识中确定出目标设备标识。
另外,通过对候选标识的各个特征参数的参数值进行加权计算,可以理解为从多个方面综合考虑候选标识为目标设备标识的可靠程度,因此候选标识的加权计算结果能够更加准确的反映候选标识为目标设备标识的可靠程度,从而提高设备标识选择的准确性。
下面先对本发明实施例所提供方案的执行主体以及应用场景进行说明。
本发明实施例所提供方案的执行主体为服务器、电子计算机等电子设备,这种情况下,上述电子设备可以应用本发明实施例提供的方案从多个候选标识中选择出目标设备标识,然后向该目标设备标识对应的设备推送信息。
本发明实施例所提供的方案可以应用在信息推送场景中,用于向用户所使用的设备推送信息的电子设备可以应用本发明实施例所提供的方案确定目标设备标识,从而根据该目标设备标识,将信息精准推送给用户所使用的设备。上述信息可以是广告、新闻、即时消息等。
下面通过具体实施例对本发明实施例提供的设备标识选择方法、装置、电子设备及存储介质进行详细说明。
参见图1,提供了第一种设备标识选择方法的流程示意图,上述方法包括以下步骤S101-S105。
步骤S101:获得设备的多个候选标识。
其中,上述候选标识的类型可以是IMEI、OAID、MAC(Media Access Control,媒体控制访问)地址或者其他设备标识类型。
上述多个候选标识可以是同一类型的设备标识,例如,若存在两个候选标识,这两个候选标识可以均为IMEI类型的设备标识。除此之外,上述多个候选标识中部分或者全部标识也可以是不同类型的设备标识,例如,若存在三个候选标识,其中一个可以为IMEI类型的设备标识,另外两个可以为OAID类型的设备标识。
具体的,上述多个候选标识可以理解为疑似属于同一设备的设备标识,获得设备的多个候选标识,也就是在获得疑似属于同一设备的多个设备标识,因此,若存在多个设备标识被认为可能是属于同一设备的设备标识,则可以确定该多个设备标识为该同一设备的候选标识。
本发明的一个实施例中,获得上述候选标识的实现方式至少存在以下三种:
第一种实现方式中,可以获得用户手动输入的、用户主观认为可能属于同一设备的设备标识,作为候选标识。
第二种实现方式中,可以首先获得多个数据日志,每一数据日志中可以包含一个或多个设备标识,若不同数据日志中包含一个或多个相同的设备标识,则该不同数据日志可能是同一设备进行数据访问时生成的日志,该不同数据日志中记录的各个设备标识均可能是同一设备的设备标识,此时,可以确定该不同数据日志中记录的各个设备标识为同一设备的候选标识。
例如,假设存在数据日志1和数据日志2,其中,数据日志1中包含设备标识A、B、C,数据日志2中包含设备标识A、D,由于数据日志1和数据日志2均包含设备标识A,因此可以确定上述设备标识A、B、C、D为同一设备的候选标识。
第三种实现方式中,数据日志中还可以包含用户的用户标识,且用户所使用的设备通常是固定不变的,因此,在获得多个数据日志后,可以将包含相同用户标识的多个数据日志中记录的各个设备标识确定为同一设备候选标识。
例如,假设存在数据日志3和数据日志4,其中,数据日志3中包含用户标识X和设备标识M,数据日志4中包含用户标识X和设备标识N,由于数据日志3和数据日志4中均包含用户标识X,因此可以确定上述设备标识M、N为同一设备的候选标识。
除此之外,还可以通过其他方式获得设备的候选标识,本发明实施例对此并不限定。
步骤S102:针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值。
其中,当用户使用上述设备时,服务器可以检测到该设备上用户的使用情况,生成并存储记录用户行为的数据日志。数据日志中可以包含设备的设备标识、用户行为、用户访问的网站、访问网站时使用的IP地址、设备所在的地域、设备的型号等等。
例如,上述用户行为可以是信息浏览行为,也可以是信息点击行为等。
上述地域可以是省份、城市、地理坐标等等。
上述特征参数用于反映该候选标识为目标设备标识的可靠程度。上述目标设备标识指的是:设备真实的标识。
例如,上述特征参数可以是数据日志中记录的不同地域的地域数量,若不同地域的地域数量越大,则说明这一候选标识越有可能被多个设备使用,该候选设备标识为目标设备标识的可靠程度越低;若不同地域的地域数量越小,则说明这一候选标识越有可能被一台设备使用,该候选设备标识为目标设备标识的可靠程度越高。
又例如,上述特征参数还可以是数据日志中记录的不同网站的网站数量,若不同网站的网站数量越小,则说明该候选标识对应的设备越有可能存在反复观看同一网站、故意刷量的行为,该候选设备标识为目标设备标识的可靠程度越低;若不同网站的网站数量越大,则说明这一候选标识对应的设备越有可能正在被用户正常使用,该候选设备标识为目标设备标识的可靠程度越高。
具体的,针对每一候选标识,可以在所存储的多个数据日志中检索包含该候选标识的数据日志,检索到包含该候选标识的数据日志后,可以在数据日志中分别统计各个特征参数的参数值。
例如,上述特征参数可以是不同网站的网站数量,若检索到三个数据日志,分别为日志1、日志2和日志3,日志1和日志2中均记录有网站1,日志3中记录有网站2,则可以在这三个数据日志中统计不同网站的网站数量为2。
另外,确定包含候选标识的数据日志存在以下两种情况:
第一种情况:在获得上述多个候选标识后,可以首先检索所存储的所有数据日志,从所存储的数据日志中确定包含各个候选标识的数据日志,然后再针对每一候选日志时,从所确定的数据日志中找出包含该候选标识的数据日志。
第二种情况:针对每一候选标识,从所存储的数据日志中检索出包含该候选标识的数据日志,对于多个候选标识,则可以多次检索所存储的数据日志。
步骤S103:针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型。
其中,上述分类类型可以是预先设定好的分类类型,例如,上述分类类型可以是根据设备标识为目标设备标识的可靠程度划分的分类类型。
本发明的一个实施例中,可以预设针对上述特征参数的参数阈值,然后根据候选标识的特征参数的参数值以及该参数阈值,将候选标识划分至不同分类类型中。
例如,若特征参数的参数值大于参数阈值,则确定候选标识属于多种预设分类类型中其中一种分类类型,若特征参数的参数值小于参数阈值,则确定候选标识属于另一种分类类型。
另外,由于候选标识可以有多种特征参数,因此,可以综合多种特征参数将候选标识划分至不同分类类型。
根据多种特征参数将候选标识划分至不同分类类型的实现方式可参见后续图2所示实施例中步骤S103A-S103C的描述,这里暂不详述。
步骤S104:针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果。
具体的,可以预先设置各个分类类型对应的特征参数的权重系数,然后在确定候选标识所属的分类类型之后,从所设置的各个分类类型对应的权重系数中确定候选标识所属的分类类型对应的权重系数,进而基于所确定的权重系数,对候选标识的各特征参数的参数值进行加权计算。
例如,若存在两个分类类型,分别为类型a和类型b,候选标识具有特征a和特征b,则可以预先设置属于类型a的候选标识的特征a的权重系数为Q1,特征b的权重系数为Q2,设置属于类型b的候选标识的特征a的权重系数为Q3,特征b的权重系数为Q4,此时,若确定一候选标识属于类型b,且该候选标识的特征a的参数值为P1,特征b的参数值为P2,则可以利用Q3、Q4对该候选标识的各特征参数的参数值进行加权计算,得到加权计算结果=Q3*P1+Q4*P2。
候选标识的特征参数可以反映候选标识为目标设备标识的可靠程度,对候选标识的特征参数的参数值进行加权计算后,得到的加权计算结果同样也可以反映候选标识的可靠程度,并且由于加权计算结果来源于候选标识的各个特征参数,因此,候选标识的加权计算结果更能准确反映该可靠程度。
另外,由于候选标识的特征参数可能为多种,因此,在设置分类类型对应的特征参数的权重系数时,可以针对每一种特征参数,设置该特征参数的权重系数,针对多种特征参数则设置多个权重系数。并且针对同一种特征参数,不同分类类型下的该种特征参数的权重系数可能相同,也可能不同。
本发明的一个实施例中,可以人为设置各个分类类型对应的各个特征参数的权重系数。
本发明的另一个实施例中,上述步骤S103和步骤S104可以基于训练完成的加权模型实现。该加权模型可以是双层结构的网络模型,第一层网络层可以是用于实现上述步骤S103的分类层,第二层网络层可以是用于实现上述步骤S104的加权层。上述加权层可以包含多个分支,每一分支对应一个分类类型,每一分支中存在反映各个特征参数的权重系数的模型参数,且该模型参数为可调整的参数。
在加权模型的训练过程中,可以利用样本日志数据中样本设备的样本标识的各个特征参数的参数值为输入信息、以样本标识为样本设备的真实标识的可靠程度为标注信息,对加权模型进行训练,不断调整上述模型参数,直至模型训练完成,得到训练后的加权模型,特征参数的权重系数可以根据训练后的加权模型中所调整的模型参数确定。
步骤S105:根据各个候选标识的加权计算结果,从各个候选标识中确定设备的目标设备标识。
具体的,候选标识的加权计算结果的数值能够直观的反映出候选标识为目标设备标识的可靠程度,在计算得到各个候选标识的加权计算结果后,可以比较各个加权计算结果的数值,并确定数值最大的加权计算结果对应的候选标识为目标设备标识。
例如,若存在候选标识a的加权计算结果为M1,候选标识b的加权计算结果为M2,且M1>M2,则可以从这两个候选标识中选择加权计算结果较大的候选标识a作为目标设备标识。
由以上可见,应用本发明实施例提供的方案选择设备标识时,在每一候选标识的数据日志中统计该候选标识的特征参数的参数值,并根据该候选标识的特征参数,确定该候选标识所属的分类类型,再基于所确定的分类类型对应的特征参数的权重系数,对该候选标识的特征参数的参数值进行加权计算,获得加权计算结果。由于每一特征参数均可反映候选标识为目标设备标识的可靠程度,因此,加权计算得到的结果同样可以反映候选标识为目标设备标识的可靠程度,从而根据各个候选标识的加权计算结果,能够准确可靠的从各个候选标识中确定出目标设备标识。
另外,通过对候选标识的各个特征参数的参数值进行加权计算,可以理解为从多个方面综合考虑候选标识为目标设备标识的可靠程度,因此候选标识的加权计算结果能够更加准确的反映候选标识为目标设备标识的可靠程度,从而进一步提高设备标识选择的准确性。
下面对上述步骤S103中提及的根据多种特征参数将候选标识划分至不同分类类型的实现方式进行说明。
本发明的一个实施例中,参见图2,提供了第二种设备标识选择方法的流程示意图,本实施例中,特征参数包括以下参数:数据日志中记录的不同地域的地域数量、不同网站的网站数量以及数据日志中的信息浏览日志的浏览数量、信息点击日志的点击数量。
其中,上述信息浏览日志为所记录的用户行为为信息浏览的数据日志,上述信息点击日志为所记录的用户行为为信息点击的数据日志。
本发明实施例中,可以通过以下步骤S103A-S103C实现上述步骤S103。
步骤S103A:针对每一候选标识,判断该候选标识的信息浏览日志的数量是否小于第一预设阈值、且信息点击日志的数量是否小于第二预设阈值,若为是,则执行步骤S103B,若为否,则执行步骤S103C。
其中,上述第一预设阈值和第二预设阈值可以是人为预设的阈值,上述第一预设阈值和第二预设阈值可以相同,也可以不同。
具体的,在信息推送场景中,信息的提供商通常期望能够向使用频率较高的设备推送信息。设备的使用频率越高,则该设备产生的流量则越大,向该设备推送信息而产生的效益则越大。若上述信息浏览日志的数量小于第一预设阈值,且上述信息点击日志的数量小于第二预设阈值,则说明该候选标识对应的设备被使用的频率较低,向该设备推送信息产生的效益不大,此时,执行步骤S103B。
若上述信息浏览日志的数量大于第一预设阈值和/或上述信息点击日志的数量大于第二预设阈值,则说明该候选标识对应的设备产生的流量较大,此时可以根据候选标识的其他特征参数,进一步对候选标识进行划分,确定候选标识所属的分类类型。
步骤S103B:确定该候选标识属于第一正常分类类型。
由于候选标识对应的设备的流量较少时,向该设备推送信息的效益不大,则可以认为该候选标识为正常的设备标识,此时,确定该候选标识属于第一正常分类类型。
步骤S103C:根据该候选标识的特征参数中不同地域的数量、不同网站的数量,确定该候选标识所属的其他分类类型。
具体的,上述不同地域的数量越大,则说明候选标识为目标设备标识的可靠程度越低,反之则越高;上述不同网站的数量越大,则说明候选标识为目标设备标识的可靠程度越高,反之则越低。利用这一原则,可以预设针对这两个特征参数的参数阈值,并结合这两个特征参数的参数值,确定候选标识所属的分类类型。
本发明的一个实施例中,若上述不同地域的数量大于预设的针对不同地域的阈值、且上述不同网站的数量小于预设的针对不同网站的阈值,则说明该候选标识被位于不同地域的多台设备使用的可能性较大,此时,可以将该候选标识划分至一种分类类型。
若上述不同地域的数量小于预设的针对不同地域的阈值、且上述不同网站的数量大于预设的针对不同网站的阈值,则说明该候选标识对应的设备被用户正常使用的可能性较大,此时,可以将该候选标识划分至另一种分类类型。
若上述不同地域的数量小于预设的针对不同地域的阈值、且上述不同网站的数量小于预设的针对不同网站的阈值,或者是,上述不同地域的数量大于预设的针对不同地域的阈值、且上述不同网站的数量大于预设的针对不同网站的阈值,则可以将该候选标识划分至第三种分类类型。
本发明的另一个实施例中,还可以通过后续图4所示实施例中步骤S103C1-S103C4确定候选标识所属的分类类型,这里暂不详述。
另外,除上述两个实施例提供的确定候选标识所属的分类类型的方式外,还可以根据上述不同地域的数量、不同网站的数量,应用其他的分类方式,确定候选标识所属的分类类型,本发明实施例对此并不限定。
由以上可见,应用本发明实施例提供的方案选择设备标识时,利用数据日志中记录的不同地域的数量、不同网站的数量以及数据日志中的信息浏览日志的数量、信息点击日志的数量,能够准确的确定候选标识所属的分类类型,从而在确定候选标识所属的分类类型之后,能够准确获得候选标识的加权计算结果,进而提高设备标识选择的准确性。
上述特征参数除了可以包含不同地域的地域数量、不同网站的网站数量以及信息浏览日志的浏览数量、信息点击日志的点击数量之外,还可以包含其他参数。
本发明的一个实施例中,参见图3,提供了第三种设备标识选择方法的流程示意图,本实施例中,上述候选标识的特征参数还包括附加参数,且上述步骤S104可以通过以下步骤S104A实现。
步骤S104A:针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数、不同附加参数的权重系数,对该候选标识的各特征参数、各附加参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果。
本发明的一个实施例中,上述附加参数包括上述数据日志中记录的不同设备型号的型号数量。
一个设备标识通常仅对应一个设备,且一个设备的设备型号通常是固定不变的,若包含候选标识的数据日志中记录的不同设备型号的型号数量越小,则说明该候选标识为目标设备标识的可靠程度越高;若上述型号数量越大,则说明该候选标识为目标设备标识的可靠程度越低。
具体的,可以从上述数据日志中统计不同设备型号的型号数量这一附加参数的参数值,并且在确定候选标识所属的分类类型后,在预设的各个分类类型对应的权重系数中,确定与所确定的分类类型对应的不同特征参数的权重系数以及型号数量这一附加参数的权重系数,进而基于所确定的权重系数,对候选标识的各特征系数以及型号数量的参数值进行加权计算。
本发明的另一个实施例中,在数据日志记录有多种类型的标识的情况下,上述附加参数包括除该候选标识所属类型外、其他类型的不同标识的标识数量。
设备通常具有多种设备标识,数据日志中可以记录有设备的多种设备标识,若包含候选标识的数据日志中记录的除该候选标识所属类型外、其他类型的不同标识的标识数量越大,则说明该候选标识为目标设备标识的可靠程度越低;若上述标识数量越小,则说明该候选标识为目标设备标识的可靠程度越高。
具体的,可以从上述数据日志中统计除候选标识所属类型外、其他类型的不同标识的标识数量这一附加参数的参数值,并且在确定候选标识所属的分类类型后,在预设的各个分类类型对应的权重系数中,确定与所确定的分类类型对应的不同特征参数的权重系数以及标识数量这一附加参数的权重系数,进而基于所确定的权重系数,对候选标识的各特征系数以及标识数量的参数值进行加权计算。
统计该标识数量存在以下两种情况:
第一种情况:针对同一种其他类型,可以统计该类型的不同标识的标识数量,若存在多种其他类型,则可以统计得到多个标识数量。
例如,针对候选标识IMEI1,若存在三个包含该候选标识的数据日志,分别为日志a、日志b、日志c,日志a中记录有IMEI1、OAID1、MAC地址1,日志b中记录有IMEI1、OAID2、MAC地址2,日志c中记录有IMEI1、OAID2、MAC地址3,除候选标识所属类型外还存在其他两种标识类型OAID以及MAC地址,针对OAID,可以在这三个数据日志中统计出OAID类型的不同标识的标识数量为2,针对MAC地址,也可以统计出MAC地址类型的不同标识的标识数量为3,因此,最终统计得到的标识数量为2和3。
第二种情况:可以统计所有其他类型的不同标识的标识数量。
例如,在上述第一种情况的举例中,OAID类型的不同标识的数量为2,MAC地址类型的不同标识的数量为3,则可以得出上述标识数量为2+3=5。
本发明的另一个实施例中,上述附加参数包括上述型号数量以及上述标识数量这两种参数。
具体的,可以从上述数据日志中分别统计上述型号数量以及标识数量这两种附件参数的参数值,并在确定候选标识所属的分类类型后,在预设的各个分类类型对应的权重系数中,确定与所确定的分类类型对应的不同特征参数的权重系数,以及型号数量、标识数量这两种附加参数的权重系数,进而基于所确定的权重系数,对候选标识的各特征系数、型号数量以及标识数量的参数值进行加权计算。
另外,在根据候选标识的特征参数确定该候选标识所属的分类类型时,除了利用上述实施例中提及的地域数量、网站数量、浏览数量以及点击数量这四种特征参数确定分类类型之外,还可以结合上述特征参数以及上述附加参数,对候选标识进行分类。例如,在判断候选标识所属的分类类型时,可以利用不同型号的数量、不同网站的数量以及信息浏览日志数量、信息点击日志数量,确定候选标识所属的分类类型。本发明实施例对此并不限定。
由以上可见,应用本发明实施例提供的方案选择设备标识时,候选标识的特征参数还包括不同设备型号的型号数量和其他类型的不同标识的标识数量中至少一种,由于每一种特征参数均能反映候选标识为目标设备标识的可靠程度,因此,候选标识的特征参数越多,所得到的该候选标识的加权计算结果反映候选标识为目标设备标识的可靠程度越准确。因此,应用本发明实施例提供的设备标识选择方案,能够提高设备标识选择的准确性。
根据特征参数中不同地域的数量、不同网站的数量,确定候选标识所属的分类类型时,除了应用上述图2所示实施例中步骤S103C提及的方式外,还可以通过以下图4所示实施例中步骤S103C1-S103C4确定候选标识所属的分类类型。
本发明的一个实施例中,参见图4,提供了第四种设备标识选择方法的流程示意图,本实施例中,可以通过以下步骤S103C1-S103C4实现上述步骤S103C。
步骤S103C1:若该候选标识的特征参数中不同地域的数量大于第三预设阈值、且不同网站的数量大于第四预设阈值,则确定候选标识属于异常分类类型。
若该候选标识的特征参数中不同地域的数量大于第三预设阈值、且不同网站的数量大于第四预设阈值,则说明该候选标识对应多个设备的可能性较大,可以认为这一候选标识为异常的设备标识,此时,确定该候选标识属于异常分类类型。
步骤S103C2:若不同地域的数量小于第三预设阈值、且不同网站的数量小于第四预设阈值,则确定候选标识属于第一分类类型。
其中,第一分类类型中标识对应的设备存在疑似刷量行为。
若不同地域的数量小于第三预设阈值、且不同网站的数量小于第四预设阈值,则说明该候选标识对应的设备在少数网站上产生了大量的用户行为,此时可以认为该候选标识对应的设备存在疑似刷量行为,此时,确定该候选标识属于第一分类类型。
步骤S103C3:若不同地域的数量大于第三预设阈值、且不同网站的数量小于第四预设阈值,则确定候选标识属于第二分类类型。
其中,第二分类类型中标识对应的设备存在高级刷量行为。
若不同地域的数量大于第三预设阈值、且不同网站的数量小于第四预设阈值,则说明候选标识中记录的网站可能出现***问题,导致访问该网站的设备的设备标识出现异常,或者是高级的刷量行为,例如在不同地域的多台设备上使用代理设备标识,此时,确定该候选标识属于第二分类类型。
步骤S103C4:若不同地域的数量小于第三预设阈值、且不同网站的数量大于第四预设阈值,则确定候选标识属于第二正常分类类型。
若不同地域的数量小于第三预设阈值、且不同网站的数量大于第四预设阈值,则说明该候选标识对应一台设备,且正在被用户正常使用的可能性较高,可以认为该候选标识为正常的设备标识,此时,确定该候选标识属于第二正常分类类型。
另外,由于属于第一正常分类类型的设备标识和属于第二正常分类类型的设备标识均可认为是正常的设备标识,因此,在设备这两种分类类型对应的特征参数的权重系数时,对于各个特征参数,可以设置相同的权重系数,也可以设备不同的权重系数。
由以上可见,应用本发明实施例提供的方案选择设备标识时,利用特征参数中不同地域的数量、不同网站的数量,能够准确确定出候选标识属于四种分类类型中的其中一种,从而能够提高设备标识选择的准确性。
本发明的一个实施例中,参见图5,提供了第五种设备标识选择方法的流程示意图,本实施例中,在对候选标识的特征参数的参数值进行加权计算之前,还可以执行以下步骤S106。
步骤S106:针对每一特征参数,对各个候选标识的该特征参数的参数值进行归一化处理。
由上述发明实施例的描述可以得知,每一候选标识均可以具有多个特征参数,例如,特征参数可以是不同地域的地域数量、不同网站的网站数量,不同候选标识可以具有相同的特征参数,针对同一特征参数,不同候选标识的该特征参数具有各自的参数值。每一次归一化处理的数据为各个候选标识的同一特征参数的参数值。
本发明的一个实施例中,针对每一特征参数,可以预设该特征参数的参数值阈值N,然后利用以下公式实现对各个候选标识的该特征参数的参数值进行归一化处理:
其中,n为特征参数的参数值,f为归一化处理后得到的特征参数的参数值。
另外,对特征参数的参数值进行归一化处理还可以基于现有的归一化算法实现,这里不再详述。
由以上可见,应用本发明实施例提供的方案选择设备标识时,在对候选标识的特征参数的参数值进行加权计算之前,对各个候选标识的每一特征参数的参数值进行归一化处理,由于归一化处理能够消除极端值对数据处理的影响,加快数据处理效率,因此,应用本发明实施例提供的设备标识选择方案,能够提高选择设备标识的效率及准确性。
本发明的一个实施例中,参见图6,提供了第六种设备标识选择方法的流程示意图,上述方法包括以下步骤S601-S607。
步骤S601:获得设备的多个候选标识。
本步骤与上述步骤S101相类似,这里不再详述。
步骤S602:针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值。
其中,特征参数用于反映该候选标识为目标设备标识的可靠程度,特征参数包括以下参数:数据日志中记录的不同地域的地域数量、不同网站的网站数量以及数据日志中的信息浏览日志的浏览数量、信息点击日志的点击数量。
本步骤的具体实施内容可参见前述实施例中的描述,这里不再详述。
步骤S603:针对每一候选标识,若该候选标识的信息浏览日志的数量小于第一预设阈值、且信息点击日志的数量小于第二预设阈值,则确定该候选标识属于第一正常分类类型。
本步骤的具体实施内容可参见前述图2所示实施例中步骤S103A、S103B的描述,这里不再详述。
步骤S604:否则,若该候选标识的地域数量大于第三预设阈值、且网站数量大于第四预设阈值,则确定候选标识属于异常分类类型;若该候选标识的地域数量小于第三预设阈值、且网站数量小于第四预设阈值,则确定候选标识属于第一分类类型;若该候选标识的地域数量大于第三预设阈值、且网站数量小于第四预设阈值,则确定候选标识属于第二分类类型;若该候选标识的地域数量小于第三预设阈值、且网站数量大于第四预设阈值,则确定候选标识属于第二正常分类类型。
其中,地域数量为该候选标识的特征参数中不同地域的数量,网站数量为该候选标识的特征参数中不同网站的数量,第一分类类型中标识对应的设备存在疑似刷量行为,第二分类类型中标识对应的设备存在高级刷量行为。
本步骤的具体实施内容可参见前述图4所示实施例中步骤S103C1-S103C4的描述,这里不再详述。
步骤S605:针对每一特征参数,对各个候选标识的该特征参数的参数值进行归一化处理。
本步骤的具体实施内容可参见前述图5所示实施例中步骤S106的描述,这里不再详述。
步骤S606:针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果。
其中,特征参数的权重系数根据标识选择模型中的模型参数确定,标识选择模型:利用样本日志、以及样本日志中所包含的设备的样本标识的可靠参数,对用于对象选择的模型进行训练得到的模型,可靠参数用于反映样本标识为目标设备标识的可靠程度。
本步骤的具体实施内容可参见前述实施例中的描述,这里不再详述。
步骤S607:根据各个候选标识的加权计算结果,从各个候选标识中确定设备的目标设备标识。
本步骤与上述步骤S105相类似,这里不再详述。
与上述设备标识选择方法相对应,本发明实施例还提供了一种设备标识选择装置。
参见图7,提供了第一种设备标识选择装置的结构示意图,所述装置包括:
标识获得模块701,用于获得设备的多个候选标识;
特征统计模块702,用于针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值,其中,所述特征参数用于反映该候选标识为目标设备标识的可靠程度;
标识分类模块703,用于针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型;
参数计算模块704,用于针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果;
目标确定模块705,用于根据各个候选标识的加权计算结果,从各个候选标识中确定所述设备的目标设备标识。
由以上可见,应用本发明实施例提供的方案选择设备标识时,在每一候选标识的数据日志中统计该候选标识的特征参数的参数值,并根据该候选标识的特征参数,确定该候选标识所属的分类类型,再基于所确定的分类类型对应的特征参数的权重系数,对该候选标识的特征参数的参数值进行加权计算,获得加权计算结果。由于每一特征参数均可反映候选标识为目标设备标识的可靠程度,因此,加权计算得到的结果同样可以反映候选标识为目标设备标识的可靠程度,从而根据各个候选标识的加权计算结果,能够准确可靠的从各个候选标识中确定出目标设备标识。
另外,通过对候选标识的各个特征参数的参数值进行加权计算,可以理解为从多个方面综合考虑候选标识为目标设备标识的可靠程度,因此候选标识的加权计算结果能够更加准确的反映候选标识为目标设备标识的可靠程度,从而进一步提高设备标识选择的准确性。
本发明的一个实施例中,参见图8,提供了第二种设备标识选择装置的结构示意图,本实施例中,所述特征参数包括以下参数:所述数据日志中记录的不同地域的地域数量、不同网站的网站数量以及所述数据日志中的信息浏览日志的浏览数量、信息点击日志的点击数量;
所述标识分类模块703,包括:
阈值判断子模块703A,用于针对每一候选标识,判断该候选标识的信息浏览日志的数量是否小于第一预设阈值、且信息点击日志的数量小于第二预设阈值,若为是,则触发第一确定子模块703B,若为否,则触发第二确定子模块703C;
所述第一确定子模块703B,用于确定该候选标识属于第一正常分类类型;
所述第二确定子模块703C,用于根据该候选标识的特征参数中不同地域的数量、不同网站的数量,确定该候选标识所属的其他分类类型。
由以上可见,应用本发明实施例提供的方案选择设备标识时,利用数据日志中记录的不同地域的数量、不同网站的数量以及数据日志中的信息浏览日志的数量、信息点击日志的数量,能够准确的确定候选标识所属的分类类型,从而在确定候选标识所属的分类类型之后,能够准确获得候选标识的加权计算结果,进而提高设备标识选择的准确性。
本发明的一个实施例中,所述第二确定子模块703C,具体用于:
若该候选标识的特征参数中不同地域的数量大于第三预设阈值、且不同网站的数量大于第四预设阈值,则确定所述候选标识属于异常分类类型;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第一分类类型,其中,所述第一分类类型中标识对应的设备存在疑似刷量行为;
若所述不同地域的数量大于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第二分类类型,其中,所述第二分类类型中标识对应的设备存在高级刷量行为;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量大于第四预设阈值,则确定所述候选标识属于第二正常分类类型。
由以上可见,应用本发明实施例提供的方案选择设备标识时,利用特征参数中不同地域的数量、不同网站的数量,能够准确确定出候选标识属于四种分类类型中的其中一种,从而能够提高设备标识选择的准确性。
本发明的一个实施例中,所述候选标识的特征参数还包括附加参数,所述附加参数包括以下参数中的至少一种:
所述数据日志中记录的不同设备型号的型号数量;
在所述数据日志记录有多种类型的标识的情况下,除该候选标识所属类型外、其他类型的不同标识的标识数量。
所述参数计算模块704,具体用于:
针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数、不同附加参数的权重系数,对该候选标识的各特征参数、各附加参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果。
由以上可见,应用本发明实施例提供的方案选择设备标识时,候选标识的特征参数还包括不同设备型号的型号数量和其他类型的不同标识的标识数量中至少一种,由于每一种特征参数均能反映候选标识为目标设备标识的可靠程度,因此,候选标识的特征参数越多,所得到的该候选标识的加权计算结果反映候选标识为目标设备标识的可靠程度越准确。因此,应用本发明实施例提供的设备标识选择方案,能够提高设备标识选择的准确性。
本发明的一个实施例中,参见图9,提供了第三种设备标识选择装置的结构示意图,本实施例中,所述装置还包括:
归一化处理模块706,用于在针对每一候选标识,基于该候选标识所属的预设分类类型对应的特征参数的权重系数,对该候选标识的特征参数的参数值进行加权计算之前,针对每一特征参数,对各个候选标识的该特征参数的参数值进行归一化处理。
由以上可见,应用本发明实施例提供的方案选择设备标识时,在对候选标识的特征参数的参数值进行加权计算之前,对各个候选标识的每一特征参数的参数值进行归一化处理,由于归一化处理能够消除极端值对数据处理的影响,加快数据处理效率,因此,应用本发明实施例提供的设备标识选择方案,能够提高选择设备标识的效率及准确性。
本发明实施例还提供了一种电子设备,如图10所示,包括处理器1001、通信接口1002、存储器1003和通信总线1004,其中,处理器1001,通信接口1002,存储器1003通过通信总线1004完成相互间的通信,
存储器1003,用于存放计算机程序;
处理器1001,用于执行存储器1003上所存放的程序时,实现如下步骤:
获得设备的多个候选标识;
针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值,其中,所述特征参数用于反映该候选标识为目标设备标识的可靠程度;
针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型;
针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果;
根据各个候选标识的加权计算结果,从各个候选标识中确定所述设备的目标设备标识。
除此之外,上述电子设备还可以实现如前方法实施例部分所述的其他设备标识选择方法,这里不再详述。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的设备标识选择方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的设备标识选择方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种设备标识选择方法,其特征在于,所述方法包括:
获得设备的多个候选标识;
针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值,其中,所述特征参数用于反映该候选标识为目标设备标识的可靠程度;
针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型;
针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果;
根据各个候选标识的加权计算结果,从各个候选标识中确定所述设备的目标设备标识。
2.根据权利要求1所述的方法,其特征在于,所述特征参数包括以下参数:所述数据日志中记录的不同地域的地域数量、不同网站的网站数量以及所述数据日志中的信息浏览日志的浏览数量、信息点击日志的点击数量;
所述根据该候选标识的特征参数,确定该候选标识所属的分类类型,包括:
若该候选标识的信息浏览日志的数量小于第一预设阈值、且信息点击日志的数量小于第二预设阈值,则确定该候选标识属于第一正常分类类型;
否则,根据该候选标识的特征参数中不同地域的数量、不同网站的数量,确定该候选标识所属的其他分类类型。
3.根据权利要求2所述的方法,其特征在于,所述根据该候选标识的特征参数中不同地域的数量、不同网站的数量,确定该候选标识所属的其他分类类型,包括:
若该候选标识的特征参数中不同地域的数量大于第三预设阈值、且不同网站的数量大于第四预设阈值,则确定所述候选标识属于异常分类类型;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第一分类类型,其中,所述第一分类类型中标识对应的设备存在疑似刷量行为;
若所述不同地域的数量大于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第二分类类型,其中,所述第二分类类型中标识对应的设备存在高级刷量行为;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量大于第四预设阈值,则确定所述候选标识属于第二正常分类类型。
4.根据权利要求2或3所述的方法,其特征在于,所述候选标识的特征参数还包括附加参数,所述附加参数包括以下参数中的至少一种:
所述数据日志中记录的不同设备型号的型号数量;
在所述数据日志记录有多种类型的标识的情况下,除该候选标识所属类型外、其他类型的不同标识的标识数量;
所述针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果,包括:
针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数、不同附加参数的权重系数,对该候选标识的各特征参数、各附加参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果。
5.根据权利要求1-3中任一项所述的方法,其特征在于,在针对每一候选标识,基于该候选标识所属的预设分类类型对应的特征参数的权重系数,对该候选标识的特征参数的参数值进行加权计算之前,所述方法还包括:
针对每一特征参数,对各个候选标识的该特征参数的参数值进行归一化处理。
6.一种设备标识选择装置,其特征在于,所述装置包括:
标识获得模块,用于获得设备的多个候选标识;
特征统计模块,用于针对每一候选标识,确定包含该候选标识的数据日志,并在所确定的数据日志中统计该候选标识的特征参数的参数值,其中,所述特征参数用于反映该候选标识为目标设备标识的可靠程度;
标识分类模块,用于针对每一候选标识,根据该候选标识的特征参数,确定该候选标识所属的分类类型;
参数计算模块,用于针对每一候选标识,基于该候选标识所属的分类类型对应的不同特征参数的权重系数,对该候选标识的各特征参数的参数值进行加权计算,得到反映该候选标识为目标设备标识的可靠程度的加权计算结果;
目标确定模块,用于根据各个候选标识的加权计算结果,从各个候选标识中确定所述设备的目标设备标识。
7.根据权利要求6所述的装置,其特征在于,所述特征参数包括以下参数:所述数据日志中记录的不同地域的地域数量、不同网站的网站数量以及所述数据日志中的信息浏览日志的浏览数量、信息点击日志的点击数量;
所述标识分类模块,包括:
阈值判断子模块,用于针对每一候选标识,判断该候选标识的信息浏览日志的数量是否小于第一预设阈值、且信息点击日志的数量小于第二预设阈值,若为是,则触发第一确定子模块,若为否,则触发第二确定子模块;
所述第一确定子模块,用于确定该候选标识属于第一正常分类类型;
所述第二确定子模块,用于根据该候选标识的特征参数中不同地域的数量、不同网站的数量,确定该候选标识所属的其他分类类型。
8.根据权利要求7所述的装置,其特征在于,所述第二确定子模块,具体用于:
若该候选标识的特征参数中不同地域的数量大于第三预设阈值、且不同网站的数量大于第四预设阈值,则确定所述候选标识属于异常分类类型;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第一分类类型,其中,所述第一分类类型中标识对应的设备存在疑似刷量行为;
若所述不同地域的数量大于第三预设阈值、且所述不同网站的数量小于第四预设阈值,则确定所述候选标识属于第二分类类型,其中,所述第二分类类型中标识对应的设备存在高级刷量行为;
若所述不同地域的数量小于第三预设阈值、且所述不同网站的数量大于第四预设阈值,则确定所述候选标识属于第二正常分类类型。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的设备标识选择方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的设备标识选择方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210241738.1A CN114626104B (zh) | 2022-03-11 | 2022-03-11 | 一种设备标识选择方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210241738.1A CN114626104B (zh) | 2022-03-11 | 2022-03-11 | 一种设备标识选择方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114626104A true CN114626104A (zh) | 2022-06-14 |
CN114626104B CN114626104B (zh) | 2024-07-19 |
Family
ID=81901983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210241738.1A Active CN114626104B (zh) | 2022-03-11 | 2022-03-11 | 一种设备标识选择方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114626104B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447148A (zh) * | 2015-11-26 | 2016-03-30 | 上海晶赞科技发展有限公司 | 一种Cookie标识关联方法及装置 |
CN108491720A (zh) * | 2018-03-20 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 一种应用识别方法、***以及相关设备 |
CN109582906A (zh) * | 2018-11-30 | 2019-04-05 | 北京锐安科技有限公司 | 数据可靠度的确定方法、装置、设备和存储介质 |
CN110807148A (zh) * | 2019-10-08 | 2020-02-18 | 北京百度网讯科技有限公司 | 设备标识过滤方法、装置、电子设备和存储介质 |
US20200394564A1 (en) * | 2016-03-24 | 2020-12-17 | Accenture Global Solutions Limited | Self-learning analytical attribute and clustering segmentation system |
-
2022
- 2022-03-11 CN CN202210241738.1A patent/CN114626104B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447148A (zh) * | 2015-11-26 | 2016-03-30 | 上海晶赞科技发展有限公司 | 一种Cookie标识关联方法及装置 |
US20200394564A1 (en) * | 2016-03-24 | 2020-12-17 | Accenture Global Solutions Limited | Self-learning analytical attribute and clustering segmentation system |
CN108491720A (zh) * | 2018-03-20 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 一种应用识别方法、***以及相关设备 |
CN109582906A (zh) * | 2018-11-30 | 2019-04-05 | 北京锐安科技有限公司 | 数据可靠度的确定方法、装置、设备和存储介质 |
CN110807148A (zh) * | 2019-10-08 | 2020-02-18 | 北京百度网讯科技有限公司 | 设备标识过滤方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114626104B (zh) | 2024-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017113677A1 (zh) | 处理用户行为数据的方法和*** | |
CN107911397B (zh) | 一种威胁评估方法及装置 | |
WO2021012509A1 (zh) | 一种异常账号检测方法、装置及计算机存储介质 | |
CN109165691B (zh) | 用于识别作弊用户的模型的训练方法、装置及电子设备 | |
CN108366012B (zh) | 一种社交关系建立方法、装置及电子设备 | |
CN110417747B (zh) | 一种暴力破解行为的检测方法及装置 | |
CN108390856B (zh) | 一种DDoS攻击检测方法、装置及电子设备 | |
CN105404631B (zh) | 图片识别方法和装置 | |
CN108768743B (zh) | 一种用户识别方法、装置及服务器 | |
CN111225246A (zh) | 一种视频推荐方法、装置及电子设备 | |
CN109067794B (zh) | 一种网络行为的检测方法和装置 | |
US10742668B2 (en) | Network attack pattern determination apparatus, determination method, and non-transitory computer readable storage medium thereof | |
CN107612946B (zh) | Ip地址的检测方法、检测装置和电子设备 | |
CN113743963A (zh) | 异常识别模型训练、异常对象识别方法、装置及电子设备 | |
CN110996142B (zh) | 视频召回方法及装置、电子设备及存储介质 | |
CN109756762B (zh) | 一种终端类别的确定方法及装置 | |
CN114626104B (zh) | 一种设备标识选择方法及装置 | |
CN111240948A (zh) | 一种体验数据处理方法、装置、计算机设备及存储介质 | |
CN111080349A (zh) | 识别同一用户的多个设备的方法、装置、服务器及介质 | |
CN116069591A (zh) | 一种接口性能监控方法、装置、设备以及存储介质 | |
CN111698765A (zh) | 一种ip地址的校验方法、装置、电子设备及存储介质 | |
CN116708013B (zh) | 一种DDoS防护方法及装置 | |
CN111612550A (zh) | 广告触发作弊识别方法、装置、电子设备及存储介质 | |
CN110113228B (zh) | 一种网络连接检测方法及装置 | |
CN113660277B (zh) | 一种基于复用埋点信息的反爬虫方法及处理终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |