CN112583801B - 基于大数据的网络异常行为检测***及其方法 - Google Patents

基于大数据的网络异常行为检测***及其方法 Download PDF

Info

Publication number
CN112583801B
CN112583801B CN202011400161.1A CN202011400161A CN112583801B CN 112583801 B CN112583801 B CN 112583801B CN 202011400161 A CN202011400161 A CN 202011400161A CN 112583801 B CN112583801 B CN 112583801B
Authority
CN
China
Prior art keywords
video
abnormal
playing
module
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011400161.1A
Other languages
English (en)
Other versions
CN112583801A (zh
Inventor
张仕文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dyxnet Of Shenzhen Communication Co ltd
Original Assignee
Dyxnet Of Shenzhen Communication Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dyxnet Of Shenzhen Communication Co ltd filed Critical Dyxnet Of Shenzhen Communication Co ltd
Priority to CN202210414622.3A priority Critical patent/CN114979778A/zh
Priority to CN202011400161.1A priority patent/CN112583801B/zh
Publication of CN112583801A publication Critical patent/CN112583801A/zh
Application granted granted Critical
Publication of CN112583801B publication Critical patent/CN112583801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64723Monitoring of network processes or resources, e.g. monitoring of network load
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种基于大数据的网络异常行为检测***及其方法,所述检测***包括第一疑似异常视频判断模块和预标识添加判断模块,所述第一疑似异常视频判断模块用户在检测到某个视频的播放量满足一定条件时,获取当前时间与该视频文件上传的时间的时间间隔,在时间间隔小于等于时间间隔阈值时,判断该视频文件为第一疑似异常视频,所述预标识添加判断模块采集第一疑似异常视频的上传者的历史视频的播放情况以及在预设时间段内每次播放第一疑似异常视频的情况,据此判断是否给第一疑似异常视频添加异常预标识。

Description

基于大数据的网络异常行为检测***及其方法
技术领域
本发明涉及大数据技术领域,具体为一种基于大数据的网络异常行为检测***及其方法。
背景技术
随着互联网的高速发展,视频网站也逐渐被大众熟识和使用。随着视频网站对用户的开放性的提升,很多的视频制作者都会把平时拍摄的一些视频上传到视频网站上去,跟大家一起来分享。但是为了提高知名度或提高经济效益,互联网上经常出现某个视频文件被人为重复刷播放量的点播行为,对于这种恶意刷播放量属于异常播放量,这种异常播放量严重损害了视频网站平台方和其他视频制作者的利益。因此,检测视频播放是否为异常播放是急需解决的问题。
发明内容
本发明的目的在于提供一种基于大数据的网络异常行为检测***及其方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的网络异常行为检测***,所述检测***包括第一疑似异常视频判断模块和预标识添加判断模块,所述第一疑似异常视频判断模块用户在检测到某个视频的播放量满足一定条件时,获取当前时间与视频文件上传的时间的时间间隔,在时间间隔小于等于时间间隔阈值时,判断视频文件为第一疑似异常视频,所述预标识添加判断模块采集第一疑似异常视频的上传者的历史视频的播放情况以及在预设时间段内每次播放第一疑似异常视频的情况,据此判断是否给第一疑似异常视频添加异常预标识。
进一步的,所述第一疑似异常视频判断模块包括播放量参考值计算模块和播放量参考值比较模块,所述播放量参考值计算模块根据视频文件的总播放量Hz和视频文件在预设时间段内的播放量Hf,计算播放量参考值Hc=Hf/Hz,所述播放量参考值比较模块比较播放量参考值和播放量参考阈值的关系,在播放量参考值大于等于播放量参考阈值时,获取当前时间与视频文件上传的时间的时间间隔;所述预标识添加判断模块包括参照视频选取模块、第一异常指数计算模块、第二异常指数计算模块和第二异常指数比较模块,所述参照视频选取模块采集第一疑似异常视频的上传者的历史视频的播放情况,将历史视频按照播放总量从大到小的顺序进行排序,依次选取排序前三的视频作为第一疑似异常视频的第一参照视频、第二参照视频和第三参照视频,所述第一异常指数计算模块采集第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频播放情况,根据播放情况分别计算各个视频的第一异常指数,所述第二异常指数计算模块根据第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频的异常指数计算第一疑似异常视频的第二异常指数,所述第二异常指数比较模块用于判断第二异常指数与第二异常指数阈值的关系,在第二异常指数大于等于第二异常指数阈值时,给播放视频添加视频异常预标识。
进一步的,所述第一异常指数计算模块包括视频播放统计模块和第一异常指数输出模块,视频播放统计模块用于分别统计某个视频的播放总次数Pz、第一存疑播放次数P1、第二存疑播放次数P2、第三存疑播放次数P3、播放该视频的总用户数量Rz以及添加有异常用户标识的用户的数量Ry、所述第一异常指数输出模块根据视频播放统计模块统计的结果计算该视频的第一异常指数,其中,当某次播放该视频时,该视频的播放时长与该视频的总时长之比小于等于第一比值阈值,该次播放视频为第一存疑播放,当某次播放该视频时,该视频被以最大倍速播放时,该次播放视频为第二存疑播放,某次播放该视频的上一级页面的链接,如果上一级页面链接属于视频上传网站以外其他的网站,该次播放视频为第三存疑播放。
进一步的,所述检测***还包括异常用户标识添加模块和异常上传标识添加模块,所述异常用户标识添加模块包括异常参数计算模块和异常参数比较模块,所述异常参数计算模块用于获取某个用户的历史播放视频的总次数Yz、该用户以最大倍速播放视频的次数Yb以及播放某条视频时,播放该条视频时长与该条视频总时长之比小于等于第二比值阈值的次数Yd,并据此计算该用户的异常参数,所述异常参数比较模块用于将异常参数与异常参数阈值进行比较,在异常参数大于等于异常参数阈值时,那么给该用户添加异常用户标识,所述异常上传标识添加模块包括预标识占比计算模块和预标识占比比较模块,所述预标识占比计算模块统计第一疑似异常视频的上传者的所有视频个数Gz以及带有异常预标识的视频个数Gy,并据此计算预标识占比Gb=Gy/Gz,所述预标识占比比较模块将预标识占比与预标识占比阈值进行比较,在预标识占比大于等于预标识占比阈值时,给该上传者添加异常上传标识。
一种基于大数据的网络异常行为检测方法,检测方法包括以下步骤:
步骤S1:当某个视频的播放量满足一定条件时,获取当前时间与视频文件上传的时间的时间间隔,如果时间间隔小于等于时间间隔阈值,视频文件为第一疑似异常视频,
步骤S2:采集第一疑似异常视频的上传者的历史视频的播放情况以及在预设时间段内每次播放第一疑似异常视频的情况,据此判断是否给第一疑似异常视频添加异常预标识。
进一步的,所述步骤S1中当某个视频的播放量满足一定条件时包括以下:
获取某个视频文件的总播放量Hz和视频文件在预设时间段内的播放量Hf,计算播放量参考值Hc=Hf/Hz,当播放量参考值大于等于播放量参考阈值时,获取当前时间与视频文件上传的时间的时间间隔。在初步判断某个视频文件的播放量是否有可能存在异常时,通过同时考虑播放量参考值和时间间隔,达到了提高了判断视频文件是否可能存在异常时的准确率的技术效果;
进一步的,所述步骤S2进一步包括以下:
步骤S21:采集第一疑似异常视频的上传者的历史视频的播放情况,将历史视频按照播放总量从大到小的顺序进行排序,依次选取排序前三的视频作为第一疑似异常视频的第一参照视频、第二参照视频和第三参照视频;
步骤S22:采集第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频播放情况,根据播放情况分别计算各个视频的第一异常指数;
步骤S23:那么第一疑似异常视频的第二异常指数
Wv=0.72*W1a+0.28*(0.5*W1b+0.3*W1c+0.2*W1d),
其中,W1a、W1b、W1c、W1d分别为第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频的异常指数;
步骤S24:判断第二异常指数与第二异常指数阈值的关系,当第二异常指数大于等于第二异常指数阈值时,给播放视频添加视频异常预标识。将历史视频的播放情况与第一疑似异常视频的播放异常情况关联起来,达到了提高了判断视频文件是否存在异常时的准确率的技术效果;
进一步的,所述步骤S22中根据播放情况分别计算各个视频的第一异常指数包括:
分别统计某个视频的播放总次数Pz、第一存疑播放次数P1、第二存疑播放次数P2、第三存疑播放次数P3、播放该视频的总用户数量Rz以及添加有异常用户标识的用户的数量Ry,
那么该视频的第一异常指数W1=0.63*(0.45*P1+0.2*P2+0.35P3)/Pz+0.37*Ry/Rz,
其中,当某次播放该视频时,该视频的播放时长与该视频的总时长之比小于等于第一比值阈值,该次播放视频为第一存疑播放,
当某次播放该视频时,该视频被以最大倍速播放时,该次播放视频为第二存疑播放,
某次播放该视频的上一级页面的链接,如果上一级页面链接属于视频上传网站以外其他的网站,该次播放视频为第三存疑播放。在计算第一异常指数时,从多角度来判断视频播放异常情况,从而达到了防止片面评估播放量异常情况的技术效果;
进一步的,所述检验方法还包括:
获取某个用户的历史播放视频的总次数Yz、该用户以最大倍速播放视频的次数Yb以及播放某条视频时,播放该条视频时长与该条视频总时长之比小于等于第二比值阈值的次数Yd,
计算该用户的异常参数Yy=0.32*Yb/Yz+0.68*Yd/Yz,如果异常参数大于等于异常参数阈值,那么给该用户添加异常用户标识。
进一步的,所述检验方法还包括:
统计第一疑似异常视频的上传者的所有视频个数Gz以及带有异常预标识的视频个数Gy,计算预标识占比Gb=Gy/Gz,当预标识占比大于等于预标识占比阈值时,给该上传者添加异常上传标识。
与现有技术相比,本发明所达到的有益效果是:本发明在检测某个视频的播放量是否异常播放量时,不仅仅检测该视频的播放量情况,还将该视频的视频上传者的其他视频作为该视频的播放量是否异常的参考因素,从而提高了判断视频的播放量是否异常播放量的准确率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明基于大数据的网络异常行为检测***的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供技术方案: 一种基于大数据的网络异常行为检测***,所述检测***包括第一疑似异常视频判断模块和预标识添加判断模块,所述第一疑似异常视频判断模块用户在检测到某个视频的播放量满足一定条件时,获取当前时间与视频文件上传的时间的时间间隔,在时间间隔小于等于时间间隔阈值时,判断视频文件为第一疑似异常视频,所述预标识添加判断模块采集第一疑似异常视频的上传者的历史视频的播放情况以及在预设时间段内每次播放第一疑似异常视频的情况,据此判断是否给第一疑似异常视频添加异常预标识。
所述第一疑似异常视频判断模块包括播放量参考值计算模块和播放量参考值比较模块,所述播放量参考值计算模块根据视频文件的总播放量Hz和视频文件在预设时间段内的播放量Hf,计算播放量参考值Hc=Hf/Hz,所述播放量参考值比较模块比较播放量参考值和播放量参考阈值的关系,在播放量参考值大于等于播放量参考阈值时,获取当前时间与视频文件上传的时间的时间间隔;所述预标识添加判断模块包括参照视频选取模块、第一异常指数计算模块、第二异常指数计算模块和第二异常指数比较模块,所述参照视频选取模块采集第一疑似异常视频的上传者的历史视频的播放情况,将历史视频按照播放总量从大到小的顺序进行排序,依次选取排序前三的视频作为第一疑似异常视频的第一参照视频、第二参照视频和第三参照视频,所述第一异常指数计算模块采集第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频播放情况,根据播放情况分别计算各个视频的第一异常指数,所述第二异常指数计算模块根据第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频的异常指数计算第一疑似异常视频的第二异常指数,所述第二异常指数比较模块用于判断第二异常指数与第二异常指数阈值的关系,在第二异常指数大于等于第二异常指数阈值时,给播放视频添加视频异常预标识。
所述第一异常指数计算模块包括视频播放统计模块和第一异常指数输出模块,视频播放统计模块用于分别统计某个视频的播放总次数Pz、第一存疑播放次数P1、第二存疑播放次数P2、第三存疑播放次数P3、播放该视频的总用户数量Rz以及添加有异常用户标识的用户的数量Ry、所述第一异常指数输出模块根据视频播放统计模块统计的结果计算该视频的第一异常指数,其中,当某次播放该视频时,该视频的播放时长与该视频的总时长之比小于等于第一比值阈值,该次播放视频为第一存疑播放,当某次播放该视频时,该视频被以最大倍速播放时,该次播放视频为第二存疑播放,某次播放该视频的上一级页面的链接,如果上一级页面链接属于视频上传网站以外其他的网站,该次播放视频为第三存疑播放。
所述检测***还包括异常用户标识添加模块和异常上传标识添加模块,所述异常用户标识添加模块包括异常参数计算模块和异常参数比较模块,所述异常参数计算模块用于获取某个用户的历史播放视频的总次数Yz、该用户以最大倍速播放视频的次数Yb以及播放某条视频时,播放该条视频时长与该条视频总时长之比小于等于第二比值阈值的次数Yd,并据此计算该用户的异常参数,所述异常参数比较模块用于将异常参数与异常参数阈值进行比较,在异常参数大于等于异常参数阈值时,那么给该用户添加异常用户标识,所述异常上传标识添加模块包括预标识占比计算模块和预标识占比比较模块,所述预标识占比计算模块统计第一疑似异常视频的上传者的所有视频个数Gz以及带有异常预标识的视频个数Gy,并据此计算预标识占比Gb=Gy/Gz,所述预标识占比比较模块将预标识占比与预标识占比阈值进行比较,在预标识占比大于等于预标识占比阈值时,给该上传者添加异常上传标识。
一种基于大数据的网络异常行为检测方法,检测方法包括以下步骤:
步骤S1:获取某个视频文件的总播放量Hz和视频文件在预设时间段内的播放量Hf,计算播放量参考值Hc=Hf/Hz,当播放量参考值大于等于播放量参考阈值时,获取当前时间与视频文件上传的时间的时间间隔,如果时间间隔小于等于时间间隔阈值,视频文件为第一疑似异常视频;刷播放量的行为往往出现在视频上传发布不久,因此本申请中通过将预设时间段内的播放量和时间间隔综合起来进行判断是否需要对视频文件的播放量情况进行进一步的检测;
步骤S2:采集第一疑似异常视频的上传者的历史视频的播放情况以及在预设时间段内每次播放第一疑似异常视频的情况,据此判断是否给第一疑似异常视频添加异常预标识。
所述步骤S2进一步包括以下:
步骤S21:采集第一疑似异常视频的上传者的历史视频的播放情况,将历史视频按照播放总量从大到小的顺序进行排序,依次选取排序前三的视频作为第一疑似异常视频的第一参照视频、第二参照视频和第三参照视频;
步骤S22:采集第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频播放情况,根据播放情况分别计算各个视频的第一异常指数;
所述步骤S22中根据播放情况分别计算各个视频的第一异常指数包括:
分别统计某个视频的播放总次数Pz、第一存疑播放次数P1、第二存疑播放次数P2、第三存疑播放次数P3、播放该视频的总用户数量Rz以及添加有异常用户标识的用户的数量Ry,
那么该视频的第一异常指数W1=0.63*(0.45*P1+0.2*P2+0.35P3)/Pz+0.37*Ry/Rz,
其中,当某次播放该视频时,该视频的播放时长与该视频的总时长之比小于等于第一比值阈值,该次播放视频为第一存疑播放,一般情况下,当一个视频开始播放就算一个播放量,因此当实际播放该视频的时长较短的情况下有可能为恶意播放;
当某次播放该视频时,该视频被以最大倍速播放时,该次播放视频为第二存疑播放,实际情况中,视频倍速播放最快的速度为两倍速播放,当视频以两倍速播放时,视频中的画面速度和语音速度都是过快的,因此以最大倍速播放并不是一种正常的播放状态,因此视频以最大倍速播放时,有可能是恶意播放;
某次播放该视频的上一级页面的链接,如果上一级页面链接属于视频上传网站以外其他的网站,该次播放视频为第三存疑播放。上一级页面链接是指跳转到播放该视频的页面前的链接,也就是说用户收到别人发送的一个链接,用户点击链接后跳转到播放视频的页面,那么用户A收到别人发送的链接的应用为该播放该视频的上一级页面的链接,如果该应用不是视频上传网站,那么该次播放是第三存疑播放,比如,当用户A在微信上收到别人发送的优酷视频的链接,用户A点击链接后跳转到播放该优酷视频的页面,那么用户A该次播放该优酷视频为第三存疑播放,大多数的情况中用户访问视频时都是通过在视频上传网站上浏览,然后点击某个视频,进入观看视频的页面,此时,播放该视频的上一级页面是属于视频网站的,因此当某个视频的上一级页面不属于视频上传网站时,有可能是恶意播放;本申请中还通过播放该第一异常视频的用户进行分析,当一个用户历史播放视频中存在较多的疑似恶意播放视频的行为时,那么播放该第一异常视频时也很有可能为恶意播放视频;
步骤S23:那么第一疑似异常视频的第二异常指数
Wv=0.72*W1a+0.28*(0.5*W1b+0.3*W1c+0.2*W1d),
其中,W1a、W1b、W1c、W1d分别为第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频的异常指数;
步骤S24:判断第二异常指数与第二异常指数阈值的关系,当第二异常指数大于等于第二异常指数阈值时,给播放视频添加视频异常预标识。
所述检验方法还包括:
统计第一疑似异常视频的上传者的所有视频个数Gz以及带有异常预标识的视频个数Gy,计算预标识占比Gb=Gy/Gz,当预标识占比大于等于预标识占比阈值时,给该上传者添加异常上传标识。给视频上传者添加异常上传标识,便于视频播放监管人员对视频播放异常较多的视频上传者进行管控;
所述检验方法还包括:
获取某个用户的历史播放视频的总次数Yz、该用户以最大倍速播放视频的次数Yb以及播放某条视频时,播放该条视频时长与该条视频总时长之比小于等于第二比值阈值的次数Yd,
计算该用户的异常参数Yy=0.32*Yb/Yz+0.68*Yd/Yz,如果异常参数大于等于异常参数阈值,那么给该用户添加异常用户标识。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于大数据的网络异常行为检测***,其特征在于,所述检测***包括第一疑似异常视频判断模块和预标识添加判断模块,所述第一疑似异常视频判断模块用户在检测到某个视频的播放量满足一定条件时,获取当前时间与视频文件上传的时间的时间间隔,在时间间隔小于等于时间间隔阈值时,判断视频文件为第一疑似异常视频,所述预标识添加判断模块采集第一疑似异常视频的上传者的历史视频的播放情况以及在预设时间段内每次播放第一疑似异常视频的情况,据此判断是否给第一疑似异常视频添加异常预标识;
所述第一疑似异常视频判断模块包括播放量参考值计算模块和播放量参考值比较模块,所述播放量参考值计算模块根据视频文件的总播放量Hz和视频文件在预设时间段内的播放量Hf,计算播放量参考值Hc=Hf/Hz,所述播放量参考值比较模块比较播放量参考值和播放量参考阈值的关系,在播放量参考值大于等于播放量参考阈值时,获取当前时间与视频文件上传的时间的时间间隔;所述预标识添加判断模块包括参照视频选取模块、第一异常指数计算模块、第二异常指数计算模块和第二异常指数比较模块,所述参照视频选取模块采集第一疑似异常视频的上传者的历史视频的播放情况,将历史视频按照播放总量从大到小的顺序进行排序,依次选取排序前三的视频作为第一疑似异常视频的第一参照视频、第二参照视频和第三参照视频,所述第一异常指数计算模块采集第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频播放情况,根据播放情况分别计算各个视频的第一异常指数,所述第二异常指数计算模块根据第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频的异常指数计算第一疑似异常视频的第二异常指数,所述第二异常指数比较模块用于判断第二异常指数与第二异常指数阈值的关系,在第二异常指数大于等于第二异常指数阈值时,给播放视频添加视频异常预标识;
所述第一异常指数计算模块包括视频播放统计模块和第一异常指数输出模块,视频播放统计模块用于分别统计某个视频的播放总次数Pz、第一存疑播放次数P1、第二存疑播放次数P2、第三存疑播放次数P3、播放该视频的总用户数量Rz以及添加有异常用户标识的用户的数量Ry、所述第一异常指数输出模块根据视频播放统计模块统计的结果计算该视频的第一异常指数,其中,当某次播放该视频时,该视频的播放时长与该视频的总时长之比小于等于第一比值阈值,该次播放视频为第一存疑播放,当某次播放该视频时,该视频被以最大倍速播放时,该次播放视频为第二存疑播放,某次播放该视频的上一级页面的链接,如果上一级页面链接属于视频上传网站以外其他的网站,该次播放视频为第三存疑播放;
所述检测***还包括异常用户标识添加模块和异常上传标识添加模块,所述异常用户标识添加模块包括异常参数计算模块和异常参数比较模块,所述异常参数计算模块用于获取某个用户的历史播放视频的总次数Yz、该用户以最大倍速播放视频的次数Yb以及播放某条视频时,播放该条视频时长与该条视频总时长之比小于等于第二比值阈值的次数Yd,并据此计算该用户的异常参数,所述异常参数比较模块用于将异常参数与异常参数阈值进行比较,在异常参数大于等于异常参数阈值时,那么给该用户添加异常用户标识,所述异常上传标识添加模块包括预标识占比计算模块和预标识占比比较模块,所述预标识占比计算模块统计第一疑似异常视频的上传者的所有视频个数Gz以及带有异常预标识的视频个数Gy,并据此计算预标识占比Gb=Gy/Gz,所述预标识占比比较模块将预标识占比与预标识占比阈值进行比较,在预标识占比大于等于预标识占比阈值时,给该上传者添加异常上传标识;
检测方法包括以下步骤:
步骤S1:当某个视频的播放量满足一定条件时,获取当前时间与视频文件上传的时间的时间间隔,如果时间间隔小于等于时间间隔阈值,视频文件为第一疑似异常视频,
步骤S2:采集第一疑似异常视频的上传者的历史视频的播放情况以及在预设时间段内每次播放第一疑似异常视频的情况,据此判断是否给第一疑似异常视频添加异常预标识;
所述步骤S1中当某个视频的播放量满足一定条件时包括以下:
获取某个视频文件的总播放量Hz和视频文件在预设时间段内的播放量Hf,计算播放量参考值Hc=Hf/Hz,当播放量参考值大于等于播放量参考阈值时,获取当前时间与视频文件上传的时间的时间间隔;
所述步骤S2进一步包括以下:
步骤S21:采集第一疑似异常视频的上传者的历史视频的播放情况,将历史视频按照播放总量从大到小的顺序进行排序,依次选取排序前三的视频作为第一疑似异常视频的第一参照视频、第二参照视频和第三参照视频;
步骤S22:采集第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频的播放情况,根据播放情况分别计算各个视频的第一异常指数;
步骤S23:那么第一疑似异常视频的第二异常指数
Wv=0.72*W1a+0.28*(0.5*W1b+0.3*W1c+0.2*W1d),
其中,W1a、W1b、W1c、W1d分别为第一疑似异常视频、第一参照视频、第二参照视频和第三参照视频的第一异常指数;
步骤S24:判断第二异常指数与第二异常指数阈值的关系,当第二异常指数大于等于第二异常指数阈值时,给该第一疑似异常视频添加视频异常预标识;
所述步骤S22中根据播放情况分别计算各个视频的第一异常指数包括:
分别统计某个视频的播放总次数Pz、第一存疑播放次数P1、第二存疑播放次数P2、第三存疑播放次数P3、播放该视频的总用户数量Rz以及添加有异常用户标识的用户的数量Ry,
那么该视频的第一异常指数W1=0.63*(0.45*P1+0.2*P2+0.35*P3)/Pz+0.37*Ry/Rz,
其中,当某次播放该视频时,该视频的播放时长与该视频的总时长之比小于等于第一比值阈值,该次播放视频为第一存疑播放,
当某次播放该视频时,该视频被以最大倍速播放时,该次播放视频为第二存疑播放,
某次播放该视频的上一级页面的链接,如果上一级页面链接属于视频上传网站以外其他的网站,该次播放视频为第三存疑播放;
所述检测方法还包括:
获取某个用户的历史播放视频的总次数Yz、该用户以最大倍速播放视频的次数Yb以及播放某条视频时,播放该条视频时长与该条视频总时长之比小于等于第二比值阈值的次数Yd,
计算该用户的异常参数Yy=0.32*Yb/Yz+0.68*Yd/Yz,如果异常参数大于等于异常参数阈值,那么给该用户添加异常用户标识;
所述检测方法还包括:
统计第一疑似异常视频的上传者的所有视频个数Gz以及带有异常预标识的视频个数Gy,计算预标识占比Gb=Gy/Gz,当预标识占比大于等于预标识占比阈值时,给该上传者添加异常上传标识。
CN202011400161.1A 2020-12-02 2020-12-02 基于大数据的网络异常行为检测***及其方法 Active CN112583801B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210414622.3A CN114979778A (zh) 2020-12-02 2020-12-02 基于大数据的网络异常行为检测***
CN202011400161.1A CN112583801B (zh) 2020-12-02 2020-12-02 基于大数据的网络异常行为检测***及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011400161.1A CN112583801B (zh) 2020-12-02 2020-12-02 基于大数据的网络异常行为检测***及其方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210414622.3A Division CN114979778A (zh) 2020-12-02 2020-12-02 基于大数据的网络异常行为检测***

Publications (2)

Publication Number Publication Date
CN112583801A CN112583801A (zh) 2021-03-30
CN112583801B true CN112583801B (zh) 2022-06-07

Family

ID=75127496

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202011400161.1A Active CN112583801B (zh) 2020-12-02 2020-12-02 基于大数据的网络异常行为检测***及其方法
CN202210414622.3A Pending CN114979778A (zh) 2020-12-02 2020-12-02 基于大数据的网络异常行为检测***

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202210414622.3A Pending CN114979778A (zh) 2020-12-02 2020-12-02 基于大数据的网络异常行为检测***

Country Status (1)

Country Link
CN (2) CN112583801B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515670B (zh) * 2021-08-12 2023-09-26 极米科技股份有限公司 影视资源状态识别方法、设备及存储介质
CN114913509A (zh) * 2022-04-15 2022-08-16 吉林云帆智能工程有限公司 一种轨道车辆司机行为规则库模型
CN115134164B (zh) * 2022-07-18 2024-02-23 深信服科技股份有限公司 一种上传行为检测方法、***、设备及计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102740143A (zh) * 2012-07-03 2012-10-17 合一网络技术(北京)有限公司 一种基于用户行为的网络视频榜单生成***及其方法
CN103327016A (zh) * 2013-06-06 2013-09-25 合一信息技术(北京)有限公司 一种计算网络流媒体异常播放量并对其修正的方法及***
CN107529093A (zh) * 2017-09-05 2017-12-29 北京奇艺世纪科技有限公司 一种视频文件播放量的检测方法及***
CN108366274A (zh) * 2018-01-11 2018-08-03 北京奇艺世纪科技有限公司 一种刷播放量的检测方法和装置
CN109040844A (zh) * 2018-09-25 2018-12-18 有米科技股份有限公司 一种获取视频热度的方法、装置及电子设备
CN110290400A (zh) * 2019-07-29 2019-09-27 北京奇艺世纪科技有限公司 可疑刷量视频的识别方法、真实播放量预估方法及装置
CN111601115A (zh) * 2020-05-12 2020-08-28 腾讯科技(深圳)有限公司 一种视频检测的方法、相关装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105872783A (zh) * 2015-12-14 2016-08-17 乐视网信息技术(北京)股份有限公司 一种视频的连播方法及装置
US20170188095A1 (en) * 2015-12-23 2017-06-29 Le Holdings (Beijing) Co., Ltd. Method and electronic device for web video capturing
CN109275031B (zh) * 2018-09-25 2021-09-28 有米科技股份有限公司 一种视频的热度评估方法、装置及电子设备
CN110225417B (zh) * 2019-05-09 2022-06-10 网宿科技股份有限公司 数据处理方法及服务器、检测卡顿的方法及服务器
CN111526424B (zh) * 2020-04-30 2022-06-03 北京奇艺世纪科技有限公司 一种精彩视频段提取方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102740143A (zh) * 2012-07-03 2012-10-17 合一网络技术(北京)有限公司 一种基于用户行为的网络视频榜单生成***及其方法
CN103327016A (zh) * 2013-06-06 2013-09-25 合一信息技术(北京)有限公司 一种计算网络流媒体异常播放量并对其修正的方法及***
CN107529093A (zh) * 2017-09-05 2017-12-29 北京奇艺世纪科技有限公司 一种视频文件播放量的检测方法及***
CN108366274A (zh) * 2018-01-11 2018-08-03 北京奇艺世纪科技有限公司 一种刷播放量的检测方法和装置
CN109040844A (zh) * 2018-09-25 2018-12-18 有米科技股份有限公司 一种获取视频热度的方法、装置及电子设备
CN110290400A (zh) * 2019-07-29 2019-09-27 北京奇艺世纪科技有限公司 可疑刷量视频的识别方法、真实播放量预估方法及装置
CN111601115A (zh) * 2020-05-12 2020-08-28 腾讯科技(深圳)有限公司 一种视频检测的方法、相关装置、设备及存储介质

Also Published As

Publication number Publication date
CN114979778A (zh) 2022-08-30
CN112583801A (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
CN112583801B (zh) 基于大数据的网络异常行为检测***及其方法
CN112788066B (zh) 物联网设备的异常流量检测方法、***及存储介质
CN117421687B (zh) 一种数字化电力环网柜运行状态监测方法
CN106209862A (zh) 一种盗号防御实现方法及装置
US20060167640A1 (en) Apparatus and method for dynamic smoothing
CN115086378B (zh) 基于云平台的智能物联网监控***及方法
CN111739243B (zh) 一种基于d-s证据理论的火灾状态检测方法
CN107529093B (zh) 一种视频文件播放量的检测方法及***
Greveler et al. Forensic content detection through power consumption
CN107682317A (zh) 建立数据检测模型的方法、数据检测方法及设备
CN111882338A (zh) 在线人数的异常检测方法、装置及电子设备
CN110933115A (zh) 基于动态session的分析对象行为异常检测方法及装置
CN105515888A (zh) 基于多维熵序列分类的智能变电站通信网络异常检测方法
CN110519266B (zh) 一种基于统计学方法的cc攻击检测的方法
CN108366274A (zh) 一种刷播放量的检测方法和装置
CN110211319B (zh) 一种安防监控预警事件跟踪方法和***
CN112488738A (zh) 基于电力大数据的居民空置住户识别方法及设备
CN117149733A (zh) 一种基于大数据的多平台日志审计分析***及方法
CN115409089A (zh) 一种非侵入式负荷识别的自适应阈值事件检测方法
CN116647389A (zh) 一种工业控制***网络访问安全性预警***及方法
CN111092861A (zh) 一种通信网络安全预测***
CN108495150B (zh) 一种视频点击满意度的确定方法及装置
CN113740066B (zh) 一种压缩机轴承早期故障检测方法
CN116307092A (zh) 基于用电信息采集的台区防窃电分析方法
CN108809955A (zh) 一种基于隐马尔可夫模型的电力用户行为深度分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220516

Address after: 518000 room 613, main building, science and technology building, No. 85, Taining Road, cuining community, Cuizhu street, Luohu District, Shenzhen, Guangdong Province

Applicant after: DYXNET OF SHENZHEN COMMUNICATION CO.,LTD.

Address before: No. 198, Tianpu Road, Pukou District, Nanjing City, Jiangsu Province, 210000

Applicant before: Zhang Shiwen

GR01 Patent grant
GR01 Patent grant