CN108628721A - 用户数据值的异常检测方法、装置、存储介质及电子装置 - Google Patents

用户数据值的异常检测方法、装置、存储介质及电子装置 Download PDF

Info

Publication number
CN108628721A
CN108628721A CN201810411145.9A CN201810411145A CN108628721A CN 108628721 A CN108628721 A CN 108628721A CN 201810411145 A CN201810411145 A CN 201810411145A CN 108628721 A CN108628721 A CN 108628721A
Authority
CN
China
Prior art keywords
data value
value
data
user
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810411145.9A
Other languages
English (en)
Other versions
CN108628721B (zh
Inventor
侯静华
丁冲
王憧生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shanghai Co Ltd
Original Assignee
Tencent Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shanghai Co Ltd filed Critical Tencent Technology Shanghai Co Ltd
Priority to CN201810411145.9A priority Critical patent/CN108628721B/zh
Publication of CN108628721A publication Critical patent/CN108628721A/zh
Application granted granted Critical
Publication of CN108628721B publication Critical patent/CN108628721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种用户数据值的异常检测方法、装置、存储介质及电子装置。其中,该方法包括:从用户日志文件中提取待检测的用户数据值;从待检测的用户数据值中获取未落入目标数据范围内的第一数据值;确定第一数据值中每个数据值对应的偏离值,其中,偏离值用于指示每个数据值偏离第二数据值的偏离程度,第二数据值为第一数据值中与每个数据值之间的距离满足目标条件的数据值,偏离值越大偏离程度越高;将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。本发明解决了相关技术中对异常的用户数据值的检测效率较低的技术问题。

Description

用户数据值的异常检测方法、装置、存储介质及电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种用户数据值的异常检测方法、装置、存储介质及电子装置。
背景技术
传统的用户数据值的异常检测,是通过数据抽查、数据分布、数据区间分布等方式来统计数据,再结合运营者经验及业务含义判断是否有异常值。这种方式对异常值的检测效率较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种用户数据值的异常检测方法、装置、存储介质及电子装置,以至少解决相关技术中对异常的用户数据值的检测效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种用户数据值的异常检测方法,包括:从用户日志文件中提取待检测的用户数据值;从所述待检测的用户数据值中获取未落入目标数据范围内的第一数据值;确定所述第一数据值中每个数据值对应的偏离值,其中,所述偏离值用于指示所述每个数据值偏离第二数据值的偏离程度,所述第二数据值为所述第一数据值中与所述每个数据值之间的距离满足目标条件的数据值,所述偏离值越大所述偏离程度越高;将所述第一数据值中所述偏离值高于或者等于目标值的数据值确定为所述用户数据值中的异常数据值。
根据本发明实施例的另一方面,还提供了一种用户数据值的异常检测装置,包括:提取模块,用于从用户日志文件中提取待检测的用户数据值;第一获取模块,用于从所述待检测的用户数据值中获取未落入目标数据范围内的第一数据值;第一确定模块,用于确定所述第一数据值中每个数据值对应的偏离值,其中,所述偏离值用于指示所述每个数据值偏离第二数据值的偏离程度,所述第二数据值为所述第一数据值中与所述每个数据值之间的距离满足目标条件的数据值,所述偏离值越大所述偏离程度越高;第二确定模块,用于将所述第一数据值中所述偏离值高于或者等于目标值的数据值确定为所述用户数据值中的异常数据值。
根据本发明实施例的另一方面,还提供了一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项中所述的方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行上述任一项中所述的方法。
在本发明实施例中,采用从用户日志文件中提取待检测的用户数据值;从待检测的用户数据值中获取未落入目标数据范围内的第一数据值;确定第一数据值中每个数据值对应的偏离值,其中,偏离值用于指示每个数据值偏离第二数据值的偏离程度,第二数据值为第一数据值中与每个数据值之间的距离满足目标条件的数据值,偏离值越大偏离程度越高;将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值的方式,将从用户日志文件中提取的待检测的用户数据值中未落入目标数据范围内的第一数据值判定为可能存在异常的数据值,初步减小异常数据值筛选的范围,再确定第一数据值中每个数据值对应的偏离值,根据该偏离值从第一数据值中确定偏离值高于或者等于目标值的数据值为异常数据值,从而精确提取出用户数据值中的异常数据值,从而实现了提高对异常的用户数据值进行检测的检测效率的技术效果的同时,也实现了对海量用户数据值的异常检测,进而解决了相关技术中对异常的用户数据值的检测效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的用户数据值的异常检测方法的示意图;
图2是根据本发明实施例的一种可选的用户数据值的异常检测方法的应用环境示意图;
图3是根据本发明实施例的另一种可选的用户数据值的异常检测方法的应用环境示意图;
图4是根据本发明可选的实施方式的一种可选的用户数据值的异常检测方法的示意图;
图5是根据本发明实施例的一种可选的用户数据值的异常检测装置的示意图;
图6是根据本发明实施例的一种可选的用户数据值的异常检测方法的应用场景示意图一;
图7是根据本发明实施例的一种可选的用户数据值的异常检测方法的应用场景示意图二;以及
图8是根据本发明实施例的一种可选的电子装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种用户数据值的异常检测方法,如图1所示,该方法包括:
S102,从用户日志文件中提取待检测的用户数据值;
S104,从待检测的用户数据值中获取未落入目标数据范围内的第一数据值;
S106,确定第一数据值中每个数据值对应的偏离值,其中,偏离值用于指示每个数据值偏离第二数据值的偏离程度,第二数据值为第一数据值中与每个数据值之间的距离满足目标条件的数据值,偏离值越大偏离程度越高;
S108,将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。
可选地,在本实施例中,上述用户数据值的异常检测方法可以应用于如图2所示的服务器202所构成的硬件环境中。如图2所示,服务器202从用户日志文件中提取待检测的用户数据值,从待检测的用户数据值中获取未落入目标数据范围内的第一数据值,确定第一数据值中每个数据值对应的偏离值,将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。
可选地,在本实施例中,上述用户数据值的异常检测方法可以应用于如图3所示的应用服务器302、用户日志服务器304和异常检测服务器306所构成的硬件环境中。如图3所示,应用服务器302将采集到的用户数据上报到日志服务器304中。日志服务器304生成用户日志文件。异常检测服务器306从用户日志文件中提取待检测的用户数据值,从待检测的用户数据值中获取未落入目标数据范围内的第一数据值,确定第一数据值中每个数据值对应的偏离值,将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。
可选地,在本实施例中,上述用户数据值的异常检测方法可以但不限于应用于对用户数据值进行异常检测的场景中。其中,上述用户数据值的异常检测方法可以但不限于应用于各种类型的应用,例如,在线教育应用、即时通讯应用、社区空间应用、游戏应用、购物应用、浏览器应用、金融应用、多媒体应用、直播应用等。具体的,可以但不限于应用于在上述游戏应用中对用户数据值进行异常检测的场景中,或还可以但不限于应用于在上述即时通讯应用中对用户数据值进行异常检测的场景中,以提高对异常的用户数据值进行检测的检测效率。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,用户数据值可以但不限于为连续型变量的数据。例如:用户数据值可以但不限于包括:用户在线时长、用户参与次数、用户付费金额、用户产出消耗等等。
可选地,在本实施例中,目标数据范围可以但不限于是预先设定的,也可以但不限于是根据待检测的用户数据值自动识别的。比如:根据历史检测结果训练人工智能模型,由训练后的模型自动识别与待检测的用户数据值适配的目标数据范围。
可选地,在本实施例中,每个数据值对应的偏离值可以但不限于用局部异常因子(Local Outlier Factor,简称为LOF)来表示,局部异常因子通过检查对象相对于其邻域的偏离度(局部偏离度)来判断离群点,进而根据偏离情况检测出异常点。
可选地,在本实施例中,目标值可以但不限于是预先设定的,也可以但不限于是根据待检测的用户数据值自动识别的。比如:根据历史检测数据中的偏离度训练人工智能模型,由训练后的模型自动识别与待检测的用户数据值适配的目标值。
在一个可选的实施方式中,以对用户一年内的在线时长进行异常检测为例,从用户日志文件中提取用户的在线时长数据值,从用户的在线时长数据值中获取小于1小时或者大于6570小时的第一数据值分别是用户1对应的0.5小时,用户2对应的0.75小时,……,用户i对应的6600小时,用户i+1对应的6659小时,……,用户N对应的7800小时,确定第一数据值中每个数据值对应的偏离值,例如:用户1对应的偏离值为2,用户2对应的偏离值为4,……,用户i对应的偏离值为5.5,用户i+1对应的偏离值为2.8,……,用户N对应的偏离值为7,将第一数据值中偏离值高于或者等于4的数据值确定为用户的在线时长数据值中的异常数据值。
可见,通过上述步骤,将从用户日志文件中提取的待检测的用户数据值中未落入目标数据范围内的第一数据值判定为可能存在异常的数据值,初步减小异常数据值筛选的范围,再确定第一数据值中每个数据值对应的偏离值,根据该偏离值从第一数据值中确定偏离值高于或者等于目标值的数据值为异常数据值,从而精确提取出用户数据值中的异常数据值,从而实现了提高对异常的用户数据值进行检测的检测效率的技术效果的同时,也实现了对海量用户数据值的异常检测,进而解决了相关技术中对异常的用户数据值的检测效率较低的技术问题。
作为一种可选的方案,从待检测的用户数据值中获取未落入目标数据范围内的第一数据值包括:
S1,根据待检测的用户数据值中的第一最大值和第一最小值确定目标数据范围;
S2,将待检测的用户数据值中未落入目标数据范围内的数据值确定为第一数据值;
S3,从待检测的用户数据值中提取第一数据值。
可选地,在本实施例中,目标数据范围可以但不限于是根据待检测的用户数据值确定的。例如:根据用户数据值中的第一最大值和第一最小值来确定目标数据范围。
例如:以游戏用户的在线时长为例,获取到的一年内的游戏用户的在线时长数据中第一最大值为7000小时,第一最小值为3小时,则可以根据第一最大值为7000和第一最小值为3确定目标数据范围。
作为一种可选的方案,根据待检测的用户数据值中的最大值和最小值确定目标数据范围包括:
S1,确定第一最大值和第一最小值之间的差值;
S2,将第一最大值和第一最小值之间的差值划分为第一数量的等份,得到个数为第二数量的分割点;
S3,将第二数量的分割点对应的数值中的第二最大值和第二最小值之间的差值确定为待检测的用户数据值的分位距;
S4,确定第一最小值与目标倍数的分位距之间的目标差值,以及第一最大值与目标倍数的分位距之间的目标和值;
S5,将落入目标差值和目标和值之间确定为落入目标数据范围。
可选地,在本实施例中,第一数量可以但不限于为大于或者等于3的正整数。本实施例中以第一数量为4为例。
可选地,在本实施例中,第二数量可以但不限于为大于或者等于2的正整数。本实施例中以第二数量为3为例。
可选地,在本实施例中,目标倍数可以但不限于为正数。在本实施例中以目标倍数为1.5为例。
在一个可选的实施方式中,对用户数据值作箱线图。找出内限以外的用户对应的数据值,作为可能异常的用户对应的用户数据值。具体来讲,将用户数据值从小到大排列并分为四等份。三个分隔点依次为第一四分位数(Q1)、第二四分位数(Q2)、第三四分位数(Q3)。计算出内限,分别为Q1-1.5IQR和Q3+1.5IQR。位于内限之间的为正常数据,位于内限以外(小于Q1-1.5IQR或大于Q3+1.5IQR)的为可能的异常值。其中,箱线图中1.5倍是经过大量分析和经验积累起来的标准。具有统计学意义,是有参考价值的。
作为一种可选的方案,确定第一数据值中每个数据值对应的偏离值包括:
S1,将第一数据值中与每个数据值之间的距离最小的第三数量的数据值确定为每个数据值对应的第二数据值;
S2,确定每个第二数据值与每个数据值之间的可达距离;
S3,根据可达距离确定每个数据值与每个第二数据值之间的局部可达密度;
S4,根据局部可达密度确定每个数据值对应的局部异常因子,将局部异常因子确定为每个数据值对应的偏离值。
可选地,在本实施例中,通过将第一数据值中与每个数据值之间的距离最小的第三数量的数据值确定为每个数据值对应的第二数据值来找出每个数据值的邻域。比如:对于第一数据值中的数据值A,将第一数据值中与数据A之间的距离最小的10个数据值(数据值1到数据值10)确定为数据值A对应的第二数据值,这10个数据值(数据值1到数据值10)构成了数据值A的邻域。
可选地,在本实施例中,根据每个数据值与其邻域内的各个第二数据值之间的可达距离确定每个数据值与其邻域内每个第二数据值之间的局部可达密度,再根据局部可达密度确定每个数据值对应的局部异常因子,该局部异常因子即可表示每个数据值的偏离值。
例如:在上述可选的实施方式中,对内限以外的可能异常的用户作基于邻域的密度方法(LOF),通过局部异常因子LOF判断是否局部异常,进而找出异常数据值。具体过程如下:
计算每个用户A与最近的第m个用户的距离,记为m-distance(A)。计算点p到A的可达距离reachability-distance(p,A)=max(m-distance(A),d(p,A))。其中d(p,A)代表用户A与p的欧式距离。例如,如图4所示,设定m=3时,由于点D到A的距离比较远,所以D到A的可达距离可以是两者之间的欧式距离,C离A很近,所以将m-distance(A)作为二者之间的可达距离。计算用户A的局部可达密度lrd(q)为对象A与它的k-邻域内所有点的平均可达距离的倒数。用户A对应的局部可达密度lrd(q)的公式如下:
其中,|Nk(A)|表示邻域内k个点的之间的可达距离。为邻域内每个用户B与用户A之间的可达距离的和。
计算局部异常因子LOF,判断其是否偏离邻域,是否异常。局部异常因子LOF的公式如下:
作为一种可选的方案,将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值包括:
S1,将局部异常因子高于或者等于4的数据值确定为异常数据值。
可选地,在本实施例中,将局部异常因子高于或者等于4的数据值确定为异常数据值,能够更加准确地确定出异常数据值。
作为一种可选的方案,在将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值之后,还包括:
S1,从具有对应关系的数据类型和操作中获取待检测的用户数据值的目标数据类型对应的目标操作;
S2,对异常数据值对应的用户执行目标操作。
可选地,在本实施例中,对于确定出的异常数据值可以但不限于根据用户数据值的数据类型确定对这些异常数据值对应的用户进行的后续操作。例如:对于用户的在线时长数据值中的异常数据值,可以对具有这些异常数据值的用户进行监测,以确定其是否存在非法操作等等。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种用于实施上述用户数据值的异常检测方法的用户数据值的异常检测装置,如图5所示,该装置包括:
提取模块52,用于从用户日志文件中提取待检测的用户数据值;
第一获取模块54,用于从待检测的用户数据值中获取未落入目标数据范围内的第一数据值;
第一确定模块56,用于确定第一数据值中每个数据值对应的偏离值,其中,偏离值用于指示每个数据值偏离第二数据值的偏离程度,第二数据值为第一数据值中与每个数据值之间的距离满足目标条件的数据值,偏离值越大偏离程度越高;
第二确定模块58,用于将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。
可选地,在本实施例中,上述用户数据值的异常检测装置可以应用于如图2所示的服务器202所构成的硬件环境中。如图2所示,服务器202从用户日志文件中提取待检测的用户数据值,从待检测的用户数据值中获取未落入目标数据范围内的第一数据值,确定第一数据值中每个数据值对应的偏离值,将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。
可选地,在本实施例中,上述用户数据值的异常检测装置可以应用于如图3所示的应用服务器302、用户日志服务器304和异常检测服务器306所构成的硬件环境中。如图3所示,应用服务器302将采集到的用户数据上报到日志服务器304中。日志服务器304生成用户日志文件。异常检测服务器306从用户日志文件中提取待检测的用户数据值,从待检测的用户数据值中获取未落入目标数据范围内的第一数据值,确定第一数据值中每个数据值对应的偏离值,将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。
可选地,在本实施例中,上述用户数据值的异常检测装置可以但不限于应用于对用户数据值进行异常检测的场景中。其中,上述用户数据值的异常检测方法可以但不限于应用于各种类型的应用,例如,在线教育应用、即时通讯应用、社区空间应用、游戏应用、购物应用、浏览器应用、金融应用、多媒体应用、直播应用等。具体的,可以但不限于应用于在上述游戏应用中对用户数据值进行异常检测的场景中,或还可以但不限于应用于在上述即时通讯应用中对用户数据值进行异常检测的场景中,以提高对异常的用户数据值进行检测的检测效率。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,用户数据值可以但不限于为连续型变量的数据。例如:用户数据值可以但不限于包括:用户在线时长、用户参与次数、用户付费金额、用户产出消耗等等。
可选地,在本实施例中,目标数据范围可以但不限于是预先设定的,也可以但不限于是根据待检测的用户数据值自动识别的。比如:根据历史检测结果训练人工智能模型,由训练后的模型自动识别与待检测的用户数据值适配的目标数据范围。
可选地,在本实施例中,每个数据值对应的偏离值可以但不限于用局部异常因子(Local Outlier Factor,简称为LOF)来表示,局部异常因子通过检查对象相对于其邻域的偏离度(局部偏离度)来判断离群点,进而根据偏离情况检测出异常点。
可选地,在本实施例中,目标值可以但不限于是预先设定的,也可以但不限于是根据待检测的用户数据值自动识别的。比如:根据历史检测数据中的偏离度训练人工智能模型,由训练后的模型自动识别与待检测的用户数据值适配的目标值。
在一个可选的实施方式中,以对用户一年内的在线时长进行异常检测为例,从用户日志文件中提取用户的在线时长数据值,从用户的在线时长数据值中获取小于1小时或者大于6570小时的第一数据值分别是用户1对应的0.5小时,用户2对应的0.75小时,……,用户i对应的6600小时,用户i+1对应的6659小时,……,用户N对应的7800小时,确定第一数据值中每个数据值对应的偏离值,例如:用户1对应的偏离值为2,用户2对应的偏离值为4,……,用户i对应的偏离值为5.5,用户i+1对应的偏离值为2.8,……,用户N对应的偏离值为7,将第一数据值中偏离值高于或者等于4的数据值确定为用户的在线时长数据值中的异常数据值。
可见,通过上述装置,将从用户日志文件中提取的待检测的用户数据值中未落入目标数据范围内的第一数据值判定为可能存在异常的数据值,初步减小异常数据值筛选的范围,再确定第一数据值中每个数据值对应的偏离值,根据该偏离值从第一数据值中确定偏离值高于或者等于目标值的数据值为异常数据值,从而精确提取出用户数据值中的异常数据值,从而实现了提高对异常的用户数据值进行检测的检测效率的技术效果的同时,也实现了对海量用户数据值的异常检测,进而解决了相关技术中对异常的用户数据值的检测效率较低的技术问题。
作为一种可选的方案,获取模块包括:
第一确定单元,用于根据待检测的用户数据值中的第一最大值和第一最小值确定目标数据范围;
第二确定单元,用于将待检测的用户数据值中未落入目标数据范围内的数据值确定为第一数据值;
提取单元,用于从待检测的用户数据值中提取第一数据值。
可选地,在本实施例中,目标数据范围可以但不限于是根据待检测的用户数据值确定的。例如:根据用户数据值中的第一最大值和第一最小值来确定目标数据范围。
例如:以游戏用户的在线时长为例,获取到的一年内的游戏用户的在线时长数据中第一最大值为7000小时,第一最小值为3小时,则可以根据第一最大值为7000和第一最小值为3确定目标数据范围。
作为一种可选的方案,确定单元包括:
第一确定子单元,用于确定第一最大值和第一最小值之间的差值;
划分子单元,用于将第一最大值和第一最小值之间的差值划分为第一数量的等份,得到个数为第二数量的分割点;
第二确定子单元,用于将第二数量的分割点对应的数值中的第二最大值和第二最小值之间的差值确定为待检测的用户数据值的分位距;
第三确定子单元,用于确定第一最小值与目标倍数的分位距之间的目标差值,以及第一最大值与目标倍数的分位距之间的目标和值;
第四确定子单元,用于将落入目标差值和目标和值之间确定为落入目标数据范围。
可选地,在本实施例中,第一数量可以但不限于为大于或者等于3的正整数。本实施例中以第一数量为4为例。
可选地,在本实施例中,第二数量可以但不限于为大于或者等于2的正整数。本实施例中以第二数量为3为例。
可选地,在本实施例中,目标倍数可以但不限于为正数。在本实施例中以目标倍数为1.5为例。
在一个可选的实施方式中,对用户数据值作箱线图。找出内限以外的用户对应的数据值,作为可能异常的用户对应的用户数据值。具体来讲,将用户数据值从小到大排列并分为四等份。三个分隔点依次为第一四分位数(Q1)、第二四分位数(Q2)、第三四分位数(Q3)。计算出内限,分别为Q1-1.5IQR和Q3+1.5IQR。位于内限之间的为正常数据,位于内限以外(小于Q1-1.5IQR或大于Q3+1.5IQR)的为可能的异常值。其中,箱线图中1.5倍是经过大量分析和经验积累起来的标准。具有统计学意义,是有参考价值的。
作为一种可选的方案,第一确定模块包括:
第三确定单元,用于将第一数据值中与每个数据值之间的距离最小的第三数量的数据值确定为每个数据值对应的第二数据值;
第四确定单元,用于确定每个第二数据值与每个数据值之间的可达距离;
第五确定单元,用于根据可达距离确定每个数据值与每个第二数据值之间的局部可达密度;
第六确定单元,用于根据局部可达密度确定每个数据值对应的局部异常因子,将局部异常因子确定为每个数据值对应的上述偏离值。
可选地,在本实施例中,通过将第一数据值中与每个数据值之间的距离最小的第三数量的数据值确定为每个数据值对应的第二数据值来找出每个数据值的邻域。比如:对于第一数据值中的数据值A,将第一数据值中与数据A之间的距离最小的10个数据值(数据值1到数据值10)确定为数据值A对应的第二数据值,这10个数据值(数据值1到数据值10)构成了数据值A的邻域。
可选地,在本实施例中,根据每个数据值与其邻域内的各个第二数据值之间的可达距离确定每个数据值与其邻域内每个第二数据值之间的局部可达密度,再根据局部可达密度确定每个数据值对应的局部异常因子,该局部异常因子即可表示每个数据值的偏离值。
例如:在上述可选的实施方式中,对内限以外的可能异常的用户作基于邻域的密度方法(LOF),通过局部异常因子LOF判断是否局部异常,进而找出异常数据值。具体过程如下:
计算每个用户A与最近的第m个用户的距离,记为m-distance(A)。计算点p到A的可达距离reachability-distance(p,A)=max(m-distance(A),d(p,A))。其中d(p,A)代表用户A与p的欧式距离。例如,如图4所示,设定m=3时,由于点D到A的距离比较远,所以D到A的可达距离可以是两者之间的欧式距离,C离A很近,所以将m-distance(A)作为二者之间的可达距离。计算用户A的局部可达密度lrd(q)为对象A与它的k-邻域内所有点的平均可达距离的倒数。用户A对应的局部可达密度lrd(q)的公式如下:
其中,|Nk(A)|表示邻域内k个点的之间的可达距离。为邻域内每个用户B与用户A之间的可达距离的和。
计算局部异常因子LOF,判断其是否偏离邻域,是否异常。局部异常因子LOF的公式如下:
作为一种可选的方案,第二确定模块用于:
将局部异常因子高于或者等于4的数据值确定为异常数据值。
可选地,在本实施例中,将局部异常因子高于或者等于4的数据值确定为异常数据值,能够更加准确地确定出异常数据值。
作为一种可选的方案,上述装置还包括:
第二获取模块,用于从具有对应关系的数据类型和操作中获取待检测的用户数据值的目标数据类型对应的目标操作;
执行模块,用于对异常数据值对应的用户执行目标操作。
可选地,在本实施例中,对于确定出的异常数据值可以但不限于根据用户数据值的数据类型确定对这些异常数据值对应的用户进行的后续操作。例如:对于用户的在线时长数据值中的异常数据值,可以对具有这些异常数据值的用户进行监测,以确定其是否存在非法操作等等。
本发明实施例的应用环境可以但不限于参照上述实施例中的应用环境,本实施例中对此不再赘述。本发明实施例提供了用于实施上述实时通信的连接方法的一种可选的具体应用示例。
作为一种可选的实施例,上述用户数据值的异常检测方法可以但不限于应用于如图6所示的对游戏中用户的增幅强化次数指标进行异常检测的场景中。在本场景中,如图6所示,获取用户指标数据,再对指标数据进行箱线图判断,判断用户指标数据在箱线图的内限之内或者之外,如果在之内,则判断用户正常,如果在之外,则进行LOF判断,判断每个用户指标数据对应的LOF是否偏大,如果偏小,则确定用户正常,如果偏大,则确定用户异常。
在一个可选的实施方式中,针对用户近一年在游戏活动中的增幅强化次数指标分析是否存在异常。针对所有用户的增幅强化次数指标进行依次排序,并对其作箱线图,将排序后的数据分为四等份。三个分割点分别为Q1=2;Q2=7;Q3=34。四分位距为Q3-Q1=32。内限分别为Q1-1.5IQR=-46,Q3+1.5IQR=82。数据小于-46及数据大于82的均为异常数据A。将数据A通过基于邻域的密度方法,选择基于最近10个邻域的点(k=10),计算出局部异常因子(LOF),找出LOF>4的点,判断为异常用户。如图7所示,增幅强化次数大于40万时,数据明显异常。
根据本发明实施例的又一个方面,还提供了一种用于实施上述用户数据值的异常检测的电子装置,如图8所示,该电子装置包括:一个或多个(图中仅示出一个)处理器802、存储器804、传感器806、编码器808以及传输装置810,该存储器中存储有计算机程序,该处理器被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,从用户日志文件中提取待检测的用户数据值;
S2,从待检测的用户数据值中获取未落入目标数据范围内的第一数据值;
S3,确定第一数据值中每个数据值对应的偏离值,其中,偏离值用于指示每个数据值偏离第二数据值的偏离程度,第二数据值为第一数据值中与每个数据值之间的距离满足目标条件的数据值,偏离值越大偏离程度越高;
S4,将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。
可选地,本领域普通技术人员可以理解,图8所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图8其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图8中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图8所示不同的配置。
其中,存储器802可用于存储软件程序以及模块,如本发明实施例中的用户数据值的异常检测方法和装置对应的程序指令/模块,处理器804通过运行存储在存储器802内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的目标组件的控制方法。存储器802可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器802可进一步包括相对于处理器804远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置810用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置810包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置810为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器802用于存储应用程序。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,从用户日志文件中提取待检测的用户数据值;
S2,从待检测的用户数据值中获取未落入目标数据范围内的第一数据值;
S3,确定第一数据值中每个数据值对应的偏离值,其中,偏离值用于指示每个数据值偏离第二数据值的偏离程度,第二数据值为第一数据值中与每个数据值之间的距离满足目标条件的数据值,偏离值越大偏离程度越高;
S4,将第一数据值中偏离值高于或者等于目标值的数据值确定为用户数据值中的异常数据值。
可选地,存储介质还被设置为存储用于执行上述实施例中的方法中所包括的步骤的计算机程序,本实施例中对此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种用户数据值的异常检测方法,其特征在于,包括:
从用户日志文件中提取待检测的用户数据值;
从所述待检测的用户数据值中获取未落入目标数据范围内的第一数据值;
确定所述第一数据值中每个数据值对应的偏离值,其中,所述偏离值用于指示所述每个数据值偏离第二数据值的偏离程度,所述第二数据值为所述第一数据值中与所述每个数据值之间的距离满足目标条件的数据值,所述偏离值越大所述偏离程度越高;
将所述第一数据值中所述偏离值高于或者等于目标值的数据值确定为所述用户数据值中的异常数据值。
2.根据权利要求1所述的方法,其特征在于,从所述待检测的用户数据值中获取未落入目标数据范围内的第一数据值包括:
根据所述待检测的用户数据值中的第一最大值和第一最小值确定所述目标数据范围;
将所述待检测的用户数据值中未落入目标数据范围内的数据值确定为所述第一数据值;
从所述待检测的用户数据值中提取所述第一数据值。
3.根据权利要求2所述的方法,其特征在于,根据所述待检测的用户数据值中的最大值和最小值确定所述目标数据范围包括:
确定所述第一最大值和所述第一最小值之间的差值;
将所述第一最大值和所述第一最小值之间的差值划分为第一数量的等份,得到个数为第二数量的分割点;
将所述第二数量的分割点对应的数值中的第二最大值和第二最小值之间的差值确定为所述待检测的用户数据值的分位距;
确定所述第一最小值与目标倍数的所述分位距之间的目标差值,以及所述第一最大值与所述目标倍数的所述分位距之间的目标和值;
将落入所述目标差值和所述目标和值之间确定为落入所述目标数据范围。
4.根据权利要求1所述的方法,其特征在于,确定所述第一数据值中每个数据值对应的偏离值包括:
将所述第一数据值中与所述每个数据值之间的距离最小的第三数量的数据值确定为所述每个数据值对应的所述第二数据值;
确定每个所述第二数据值与所述每个数据值之间的可达距离;
根据所述可达距离确定所述每个数据值与每个所述第二数据值之间的局部可达密度;
根据所述局部可达密度确定所述每个数据值对应的局部异常因子,将所述局部异常因子确定为所述每个数据值对应的所述偏离值。
5.根据权利要求4所述的方法,其特征在于,将所述第一数据值中所述偏离值高于或者等于目标值的数据值确定为所述用户数据值中的异常数据值包括:
将所述局部异常因子高于或者等于4的数据值确定为所述异常数据值。
6.根据权利要求1所述的方法,其特征在于,在将所述第一数据值中所述偏离值高于或者等于目标值的数据值确定为所述用户数据值中的异常数据值之后,所述方法还包括:
从具有对应关系的数据类型和操作中获取所述待检测的用户数据值的目标数据类型对应的目标操作;
对所述异常数据值对应的用户执行所述目标操作。
7.一种用户数据值的异常检测装置,其特征在于,包括:
提取模块,用于从用户日志文件中提取待检测的用户数据值;
第一获取模块,用于从所述待检测的用户数据值中获取未落入目标数据范围内的第一数据值;
第一确定模块,用于确定所述第一数据值中每个数据值对应的偏离值,其中,所述偏离值用于指示所述每个数据值偏离第二数据值的偏离程度,所述第二数据值为所述第一数据值中与所述每个数据值之间的距离满足目标条件的数据值,所述偏离值越大所述偏离程度越高;
第二确定模块,用于将所述第一数据值中所述偏离值高于或者等于目标值的数据值确定为所述用户数据值中的异常数据值。
8.根据权利要求7所述的装置,其特征在于,所述获取模块包括:
第一确定单元,用于根据所述待检测的用户数据值中的第一最大值和第一最小值确定所述目标数据范围;
第二确定单元,用于将所述待检测的用户数据值中未落入目标数据范围内的数据值确定为所述第一数据值;
提取单元,用于从所述待检测的用户数据值中提取所述第一数据值。
9.根据权利要求8所述的装置,其特征在于,所述确定单元包括:
第一确定子单元,用于确定所述第一最大值和所述第一最小值之间的差值;
划分子单元,用于将所述第一最大值和所述第一最小值之间的差值划分为第一数量的等份,得到个数为第二数量的分割点;
第二确定子单元,用于将所述第二数量的分割点对应的数值中的第二最大值和第二最小值之间的差值确定为所述待检测的用户数据值的分位距;
第三确定子单元,用于确定所述第一最小值与目标倍数的所述分位距之间的目标差值,以及所述第一最大值与所述目标倍数的所述分位距之间的目标和值;
第四确定子单元,用于将落入所述目标差值和所述目标和值之间确定为落入所述目标数据范围。
10.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:
第三确定单元,用于将所述第一数据值中与所述每个数据值之间的距离最小的第三数量的数据值确定为所述每个数据值对应的所述第二数据值;
第四确定单元,用于确定每个所述第二数据值与所述每个数据值之间的可达距离;
第五确定单元,用于根据所述可达距离确定所述每个数据值与每个所述第二数据值之间的局部可达密度;
第六确定单元,用于根据所述局部可达密度确定所述每个数据值对应的局部异常因子,将所述局部异常因子确定为所述每个数据值对应的所述偏离值。
11.根据权利要求10所述的装置,其特征在于,第二确定模块用于:
将所述局部异常因子高于或者等于4的数据值确定为所述异常数据值。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于从具有对应关系的数据类型和操作中获取所述待检测的用户数据值的目标数据类型对应的目标操作;
执行模块,用于对所述异常数据值对应的用户执行所述目标操作。
13.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的方法。
14.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
CN201810411145.9A 2018-05-02 2018-05-02 用户数据值的异常检测方法、装置、存储介质及电子装置 Active CN108628721B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810411145.9A CN108628721B (zh) 2018-05-02 2018-05-02 用户数据值的异常检测方法、装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810411145.9A CN108628721B (zh) 2018-05-02 2018-05-02 用户数据值的异常检测方法、装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN108628721A true CN108628721A (zh) 2018-10-09
CN108628721B CN108628721B (zh) 2021-07-27

Family

ID=63695129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810411145.9A Active CN108628721B (zh) 2018-05-02 2018-05-02 用户数据值的异常检测方法、装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN108628721B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109304034A (zh) * 2018-10-25 2019-02-05 珠海市君天电子科技有限公司 一种游戏作弊检测方法及相关设备
CN110223102A (zh) * 2019-05-08 2019-09-10 五八有限公司 客户推荐方法、装置、电子设备及存储介质
CN110491106A (zh) * 2019-07-22 2019-11-22 深圳壹账通智能科技有限公司 基于知识图谱的数据预警方法、装置和计算机设备
CN112532972A (zh) * 2020-11-26 2021-03-19 北京百度网讯科技有限公司 直播业务的故障检测方法、装置、电子设备及可读存储介质
CN113343056A (zh) * 2021-05-21 2021-09-03 北京市燃气集团有限责任公司 一种用户用气量异常检测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014104622A1 (ko) * 2012-12-24 2014-07-03 한국과학기술정보연구원 이용통계데이터의 이상 자동 탐지 시스템 및 그 방법 그리고 이에 적용되는 장치
US20160140151A1 (en) * 2014-11-18 2016-05-19 International Business Machines Corporation Data Resource Anomaly Detection
CN107193824A (zh) * 2016-03-14 2017-09-22 阿里巴巴集团控股有限公司 异常数据检测方法及装置
CN107256237A (zh) * 2017-05-23 2017-10-17 中国电子科技集团公司第二十八研究所 基于动态网格优化的lof聚类数据异常点检测方法和检测***
US20170339168A1 (en) * 2016-05-20 2017-11-23 Informatica Llc Method, apparatus, and computer-readable medium for detecting anomalous user behavior
CN107733921A (zh) * 2017-11-14 2018-02-23 深圳中兴网信科技有限公司 网络流量异常检测方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014104622A1 (ko) * 2012-12-24 2014-07-03 한국과학기술정보연구원 이용통계데이터의 이상 자동 탐지 시스템 및 그 방법 그리고 이에 적용되는 장치
US20160140151A1 (en) * 2014-11-18 2016-05-19 International Business Machines Corporation Data Resource Anomaly Detection
CN107193824A (zh) * 2016-03-14 2017-09-22 阿里巴巴集团控股有限公司 异常数据检测方法及装置
US20170339168A1 (en) * 2016-05-20 2017-11-23 Informatica Llc Method, apparatus, and computer-readable medium for detecting anomalous user behavior
CN107256237A (zh) * 2017-05-23 2017-10-17 中国电子科技集团公司第二十八研究所 基于动态网格优化的lof聚类数据异常点检测方法和检测***
CN107733921A (zh) * 2017-11-14 2018-02-23 深圳中兴网信科技有限公司 网络流量异常检测方法、装置、计算机设备和存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SAM-X: "异常值检测", 《HTTPS://BLOG.CSDN.NET/U010945683/ARTICLE/DETAILS/79639664》 *
王茹雪等: "基于瀑布型混合技术的异常检测算法", 《吉林大学学报(信息科学版)》 *
秦浩: "基于密度的局部离群点挖掘及在入侵检测中应用研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
赵新想: "基于密度的局部离群点检测算法的研究与改进", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109304034A (zh) * 2018-10-25 2019-02-05 珠海市君天电子科技有限公司 一种游戏作弊检测方法及相关设备
CN110223102A (zh) * 2019-05-08 2019-09-10 五八有限公司 客户推荐方法、装置、电子设备及存储介质
CN110491106A (zh) * 2019-07-22 2019-11-22 深圳壹账通智能科技有限公司 基于知识图谱的数据预警方法、装置和计算机设备
CN110491106B (zh) * 2019-07-22 2022-03-18 深圳壹账通智能科技有限公司 基于知识图谱的数据预警方法、装置和计算机设备
CN112532972A (zh) * 2020-11-26 2021-03-19 北京百度网讯科技有限公司 直播业务的故障检测方法、装置、电子设备及可读存储介质
CN112532972B (zh) * 2020-11-26 2023-10-03 北京百度网讯科技有限公司 直播业务的故障检测方法、装置、电子设备及可读存储介质
CN113343056A (zh) * 2021-05-21 2021-09-03 北京市燃气集团有限责任公司 一种用户用气量异常检测方法及装置

Also Published As

Publication number Publication date
CN108628721B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN108628721A (zh) 用户数据值的异常检测方法、装置、存储介质及电子装置
CN108229555A (zh) 样本权重分配方法、模型训练方法、电子设备及存储介质
CN107798027B (zh) 一种信息热度预测方法、信息推荐方法及装置
CN106228386A (zh) 一种信息推送方法及装置
CN109889512B (zh) 一种充电桩can报文的异常检测方法及装置
CN109685785A (zh) 一种图像质量评估方法、装置及电子设备
CN108319974A (zh) 数据处理方法、装置、存储介质和电子装置
CN112100221B (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
CN104954528B (zh) 终端设备的耗电信息的检测方法和装置
CN112949733A (zh) 故障因子数据的获取方法、装置、电子装置及存储介质
CN115484112B (zh) 支付大数据安全防护方法、***及云平台
CN108121943A (zh) 基于图片的判别方法及装置和计算设备
CN108366012A (zh) 一种社交关系建立方法、装置及电子设备
CN108268357A (zh) 实时数据处理方法和装置
CN114817425A (zh) 一种冷热数据分类的方法、装置、设备及可读存储介质
CN113537248B (zh) 图像识别方法和装置、电子设备和存储介质
CN106257507A (zh) 用户行为的风险评估方法及装置
CN115118447A (zh) 工控网络流量的安全判别方法、装置、电子装置和介质
CN109726808B (zh) 神经网络训练方法和装置、存储介质及电子装置
CN104933178B (zh) 官方网站确定方法和***及官方网站的排序方法
CN109120955A (zh) 一种直播间的推荐方法以及相关设备
CN109819128A (zh) 一种电话录音的质检方法和装置
CN108335008A (zh) 网络信息处理方法和装置、存储介质及电子装置
CN110276283A (zh) 图片识别方法、目标识别模型训练方法及装置
CN113435642A (zh) 食用策略的确定方法及装置、存储介质、电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant