CN106022826A - 一种网络直播平台中的作弊用户识别方法与*** - Google Patents
一种网络直播平台中的作弊用户识别方法与*** Download PDFInfo
- Publication number
- CN106022826A CN106022826A CN201610328918.8A CN201610328918A CN106022826A CN 106022826 A CN106022826 A CN 106022826A CN 201610328918 A CN201610328918 A CN 201610328918A CN 106022826 A CN106022826 A CN 106022826A
- Authority
- CN
- China
- Prior art keywords
- user
- cheating
- information
- barrage
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0209—Incentive being awarded or redeemed in connection with the playing of a video game
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于互联网技术领域,公开了一种网络直播平台中的作弊用户识别方法与***。其中,所述方法包括:根据已有的作弊用户和非作弊用户的数据建立训练样本集;利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;利用所述作弊用户识别模型判断待识别用户是否为作弊用户。从而可以在网络直接平台中利用上述方法判断作弊用户,保证直播平台发放免费虚拟奖品活动的本身目的,节约活动资源,有利于网络直播行业的健康发展。
Description
技术领域
本发明属于互联网技术领域,更具体地,涉及一种网络直播平台中的作弊用户识别方法与***。
背景技术
随着网络直播行业的发展,用户可以通过在网络直播平台上观看、做活动等方式领取虚拟奖品,并将获得的虚拟奖品赠送给自己喜欢的主播,进行互动,从而培养用户的观看***台粘性。但目前,有部分用户注册账号通过平台活动获取大量的虚拟奖品,并将免费获得的虚拟奖品进行售卖,获取非法利益。这些作弊用户的存在严重破坏了直播平台发放免费虚拟奖品活动的本身目的,侵占了活动的资源,不利于网络直播行业的健康发展。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种网络直播平台中的作弊用户识别方法与***,其目的在于能够自动识别网络直播平台中的作弊用户,由此解决作弊用户在网络直播平台中刷取虚拟礼物的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种网络直播平台中的作弊用户识别方法,包括:
根据已有的作弊用户和非作弊用户的数据建立训练样本集;其中所述数据至少包括用户的行为信息;
利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;
利用所述作弊用户识别模型判断待识别用户是否为作弊用户。
在本发明的一个实施例中,所述用户的行为信息至少包括观看信息、弹幕信息和交易信息;
其中所述观看信息包括统计月观看天数、观看次数、观看时长、观看房间数、观看设备数以及观看IP数;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数;交易信息包含月虚拟礼物赠送天数、虚拟礼物赠送次数、虚拟礼物赠送量、虚拟礼物赠送房间数、获取虚拟礼物天数、获取虚拟礼物次数、获取虚拟礼物量、分享获得虚拟礼物天数、分享获得虚拟礼物次数、分享获得虚拟礼物量和其他维度获取虚拟礼物指标。
在本发明的一个实施例中,所述数据还包括用户的基础信息,所述用户的基础信息包括用户注册时长、用户等级、用户邮箱认证状态、用户手机认证状态、来源类型以及注册地。
在本发明的一个实施例中,其中所述用户的行为信息还包括登录信息和弹幕信息,其中:
所述登录信息包括统计月登录次数、登录天数;充值信息包括统计月充值次数、充值金额;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数。
在本发明的一个实施例中,所述利用上述训练样本集训练作弊用户识别模型具体包括:
数据处理,对上述训练样本集中的数据进行处理转换,对缺失值进行填充,去除极大值和极小值;
模型构建,将上述处理后得到的数据按照m:n的比例抽样进行拆分,划分成训练集和测试集,利用训练集用户构建识别模型;
模型验证,运用测试集对识别模型进行评估,选择最优的用户识别模型。
按照本发明的另一方面,还提供了一种网络直播平台中的作弊用户识别***,包括训练样本集建立模块、作弊用户识别模型建立模块以及作弊用户识别模块,其中:
所述训练样本集建立模块,用于根据已有的作弊用户和非作弊用户的数据建立训练样本集;其中所述数据至少包括用户的行为信息;
所述作弊用户识别模型建立模块,用于利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;
所述作弊用户识别模块,用于利用所述作弊用户识别模型判断待识别用户是否为作弊用户。
在本发明的一个实施例中,所述用户的行为信息至少包括观看信息、弹幕信息和交易信息;
其中所述观看信息包括统计月观看天数、观看次数、观看时长、观看房间数、观看设备数以及观看IP数;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数;交易信息包含月虚拟礼物赠送天数、虚拟礼物赠送次数、虚拟礼物赠送量、虚拟礼物赠送房间数、获取虚拟礼物天数、获取虚拟礼物次数、获取虚拟礼物量、分享获得虚拟礼物天数、分享获得虚拟礼物次数、分享获得虚拟礼物量和其他维度获取虚拟礼物指标。
在本发明的一个实施例中,所述数据还包括用户的基础信息,所述用户的基础信息包括用户注册时长、用户等级、用户邮箱认证状态、用户手机认证状态、来源类型以及注册地。
在本发明的一个实施例中,其中所述用户的行为信息还包括登录信息和弹幕信息,其中:
所述登录信息包括统计月登录次数、登录天数;充值信息包括统计月充值次数、充值金额;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数。
在本发明的一个实施例中,所述作弊用户识别模型建立模块具体包括数据处理子模块、模型构建子模块以及模型验证子模块,其中:
所述数据处理子模块,用于对上述训练样本集中的数据进行处理转换,对缺失值进行填充,去除极大值和极小值;
所述模型构建子模块,用于将上述处理后得到的数据按照m:n的比例抽样进行拆分,划分成训练集和测试集,利用训练集用户构建识别模型;
所述模型验证子模块,用于运用测试集对识别模型进行评估,选择最优的用户识别模型。
本发明实施例中,根据已有的作弊用户和非作弊用户的数据建立训练样本集;利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;利用所述作弊用户识别模型判断待识别用户是否为作弊用户。从而可以在网络直接平台中利用上述方法判断作弊用户,保证直播平台发放免费虚拟奖品活动的本身目的,节约活动资源,有利于网络直播行业的健康发展。。
附图说明
图1是本发明实施例中一种网络直播平台中的作弊用户识别方法的流程示意图;
图2是本发明实施例中训练作弊用户识别模型的方法流程示意图;
图3是本发明实施例中一种网络直播平台中的作弊用户识别***的结构示意图;
图4是本发明实施例中作弊用户识别模型建立模块的结构示意图;
图5是本发明实施例中一种网络直播平台中的作弊用户识别服务器的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明提供了一种网络直播平台中的作弊用户识别方法,包括:
S1、根据已有的作弊用户和非作弊用户的数据建立训练样本集;其中所述数据至少包括用户的行为信息;
其中所述用户的行为信息至少包括观看信息、弹幕信息和交易信息;
其中所述观看信息包括统计月观看天数、观看次数、观看时长、观看房间数、观看设备数以及观看IP数;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数;交易信息包含月虚拟礼物赠送天数、虚拟礼物赠送次数、虚拟礼物赠送量、虚拟礼物赠送房间数、获取虚拟礼物天数、获取虚拟礼物次数、获取虚拟礼物量、分享获得虚拟礼物天数、分享获得虚拟礼物次数、分享获得虚拟礼物量和其他维度获取虚拟礼物指标;
进一步地,所述用户的行为信息还可以包括登录信息和弹幕信息,其中:所述登录信息包括统计月登录次数、登录天数;充值信息包括统计月充值次数、充值金额;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数。
进一步地,所述数据还可以包括用户的基础信息,所述用户的基础信息包括用户注册时长、用户等级、用户邮箱认证状态、用户手机认证状态、来源类型以及注册地。
需要说明的是,在上述这些信息当中,观看信息、弹幕信息和交易信息等数据对判断是否刷虚拟礼物起关键作用;用户的基础信息、登录信息,可以辅助分析用户是否刷虚拟礼物的特征。
为了建立数据库,可以将已有的作弊用户定义为正样本,将已有的非作弊用户定义为负样本;按照正负样本=1:N的比例抽样构建建模训练样本集。其中N为预设值。具体地:
可以将通过规则识别和反馈的疑似刷虚拟礼物用户,定义为正样本,将“是否刷虚拟礼物用户”(在本发明实施例中,我们以直播平台中刷虚拟礼物的用户定义为作弊用户,在此称为刷虚拟礼物用户)指标标记为1;提取当月其他赠送虚拟礼物的用户,定义为负样本,并将“是否刷虚拟礼物用户”指标标记为0,按照正负样本=1:N的比例抽样构建建模所需的数据。
S2、利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;如图2所示,本步骤具体包括如下子步骤:
S21、数据处理:对上述训练样本集中的数据进行处理转换,对缺失值进行填充,去除极大值和极小值;具体地可以通过如下方式对数据进行处理:
a)并对初始提取的数据进行多维分析,剔除无意义的指标和缺失值多的指标;如剔除用户等级、用户邮箱认证状态,用户手机认证状态、来源类型,注册地等指标;
b)对离散型指标,使用卡方检验,计算指标与目标变量(是否为刷虚拟礼物用户)的卡方值,剔除对目标指标影响不显著的指标;卡方检验的基本原理是通过卡方值的大小来检验实际观察值与理论值之间的偏离程度,判断两个或两个以上指标之间是否具有关联关系的假设检验。
c)对连续性指标,使用方差分析,剔除对目标指标影响不显著的指标;方差分析,是从观察指标的方差入手,研究诸多连续性指标中哪些指标是对目标指标(是否刷虚拟礼物)指标,有显著影响的变量。
d)对剩余的连续性指标,计对与目标指标之间的相关系数,选择与目标指标相关系数大的指标,并剔除输入指标中强相关指标,构建模型的最终输入指标;
如:赠送虚拟礼物房间数与赠送虚拟礼物天数两个指标的相关系数为0.8505,属于强相关指标(一般相关系数大于0.8的,定义为强相关),应剔除一个指标;赠送虚拟礼物房间数与“是否刷虚拟礼物用户“两个指标的相关系数为0.2040,赠送虚拟礼物天数与“是否刷虚拟礼物用户“两个指标的相关系数为0.1657,根据规则,剔除与目标变量相关性小的赠送虚拟礼物天数指标;以此类推,最终选择15个指标进行构建模型。
S22、模型构建:将上述处理后得到的数据按照m:n的比例抽样进行拆分,划分成训练集和测试集,利用训练集用户构建识别模型;
例如,可以将处理好的建模数据按照m:n(,其中所述m,n为预设值)的比例抽样进行拆分,划分成训练集和测试集(如为3:1,75%的数据进行训练,剩余25%的数据进行测试),训练集用户构建识别模型,测试集对构建的模型进行验证,评估模型的效果;分别运用决策树算法,逻辑回归算法分别建立模型,不同的算法修改不同的模型参数,建立每种算法的最优模型。
S23、模型验证:运用测试集对识别模型进行评估,选择最优的用户识别模型;
具体地,在本步骤中,可以运用测试集对每种算法的模型进行预测,评估,计算每种算法模型对应的准确率、查全率、提升度、F-Measure等考核指标,对比评估指标的值,参考模型固化部署的复杂度,选择最优化的作弊用户识别方法。
准确率:正确识别的刷虚拟礼物用户数/识别出刷虚拟礼物的用户数;
查全率:正确识别的刷虚拟礼物用户数/测试集中刷虚拟礼物的用户数;
提升度:准确率/(测试集中刷虚拟礼物用户数/测试集中所有用户数);
F-Measure:正确率*召回率*2/(正确率+召回率)(F值即为正确率和召回率的调和平均值);
通过同比,本发明实施例选择用决策树C5.0算法构建的模型。
S3、利用所述作弊用户识别模型判断待识别用户是否为作弊用户。
具体地,为了方便地对作弊用户进行识别,可以将上述构建的作弊用户识别模型部署到产品中,根据最终的作弊用户识别方法,抽取多条建模规则(如示例:if观看IP数>M and观看时长<N and弹幕发送次数<L then 1If观看IP数>M and观看时长<N and弹幕发送次数>L then 0……),撰写sql脚本,进行自动化部署,每月定期将用户的指标数据输入到模型中,预测该用户为刷虚拟礼物作弊用户的概率,判断用户是否为刷虚拟礼物作弊用户,并输出刷虚拟礼物作弊用户清单。
如图3所示,本发明实施例还提供了一种网络直播平台中的作弊用户识别***,包括训练样本集建立模块1、作弊用户识别模型建立模块2以及作弊用户识别模块3,其中:
所述训练样本集建立模块1,用于根据已有的作弊用户和非作弊用户的数据建立训练样本集;其中所述数据至少包括用户的行为信息;
所述作弊用户识别模型建立模块2,用于利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;
所述作弊用户识别模块3,用于利用所述作弊用户识别模型判断待识别用户是否为作弊用户。
进一步地,所述用户的行为信息至少包括观看信息、弹幕信息和交易信息;
其中所述观看信息包括统计月观看天数、观看次数、观看时长、观看房间数、观看设备数以及观看IP数;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数;交易信息包含月虚拟礼物赠送天数、虚拟礼物赠送次数、虚拟礼物赠送量、虚拟礼物赠送房间数、获取虚拟礼物天数、获取虚拟礼物次数、获取虚拟礼物量、分享获得虚拟礼物天数、分享获得虚拟礼物次数、分享获得虚拟礼物量和其他维度获取虚拟礼物指标。
进一步地,所述数据还包括用户的基础信息,所述用户的基础信息包括用户注册时长、用户等级、用户邮箱认证状态、用户手机认证状态、来源类型以及注册地。
进一步地,所述用户的行为信息还包括登录信息和弹幕信息,其中:
所述登录信息包括统计月登录次数、登录天数;充值信息包括统计月充值次数、充值金额;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数。
进一步地,如图4所示,所述作弊用户识别模型建立模块2具体包括数据处理子模块21、模型构建子模块22以及模型验证子模块23,其中:
所述数据处理子模块21,用于对上述训练样本集中的数据进行处理转换,对缺失值进行填充,去除极大值和极小值;
所述模型构建子模块22,用于将上述处理后得到的数据按照m:n的比例抽样进行拆分,划分成训练集和测试集,利用训练集用户构建识别模型,其中所述m,n为预设值;
所述模型验证子模块23,用于运用测试集对识别模型进行评估,选择最优的用户识别模型。
进一步地,如图5所示,本发明实施例还提供了一种网络直播平台中的作弊用户识别服务器,包括处理器3和存储器4,其中:
所述处理器3,用于根据已有的作弊用户和非作弊用户的数据建立训练样本集;其中所述数据至少包括用户的行为信息;利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;利用所述作弊用户识别模型判断待识别用户是否为作弊用户;
所述存储器4,用于存储所述训练样本集。
在本发明实施例中,处理器为该服务器的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储单元内的软件程序和/或模块,以及调用存储在存储单元内的数据,以执行电子设备的各种功能和/或处理数据。所述处理器可以由集成电路组成,也可以由连接多颗相同功能或不同功能的封表集成芯片而组成。即处理器可以是GPU、数字信号处理器、及通信单元中的控制芯片的组合。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。所述的计算机软件可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种网络直播平台中的作弊用户识别方法,其特征在于,包括:
根据已有的作弊用户和非作弊用户的数据建立训练样本集;其中所述数据至少包括用户的行为信息;
利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;
利用所述作弊用户识别模型判断待识别用户是否为作弊用户。
2.如权利要求1所述的网络直播平台中的作弊用户识别方法,其特征在于,所述用户的行为信息至少包括观看信息、弹幕信息和交易信息;
其中所述观看信息包括统计月观看天数、观看次数、观看时长、观看房间数、观看设备数以及观看IP数;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数;交易信息包含月虚拟礼物赠送天数、虚拟礼物赠送次数、虚拟礼物赠送量、虚拟礼物赠送房间数、获取虚拟礼物天数、获取虚拟礼物次数、获取虚拟礼物量、分享获得虚拟礼物天数、分享获得虚拟礼物次数、分享获得虚拟礼物量和其他维度获取虚拟礼物指标。
3.如权利要求1或2所述的网络直播平台中的作弊用户识别方法,其特征在于,所述数据还包括用户的基础信息,所述用户的基础信息包括用户注册时长、用户等级、用户邮箱认证状态、用户手机认证状态、来源类型以及注册地。
4.如权利要2所述的网络直播平台中的作弊用户识别方法,其特征在于,其中所述用户的行为信息还包括登录信息和弹幕信息,其中:
所述登录信息包括统计月登录次数、登录天数;充值信息包括统计月充值次数、充值金额;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数。
5.如权利要1或2所述的网络直播平台中的作弊用户识别方法,其特征在于,所述利用上述训练样本集训练作弊用户识别模型具体包括:
对上述训练样本集中的数据进行处理转换,对缺失值进行填充,去除极大值和极小值;
将上述处理后得到的数据按照m:n的比例抽样进行拆分,划分成训练集和测试集,利用训练集用户构建识别模型,其中所述m,n为预设值;
运用测试集对识别模型进行评估,选择最优的用户识别模型。
6.一种网络直播平台中的作弊用户识别***,其特征在于,包括训练样本集建立模块、作弊用户识别模型建立模块以及作弊用户识别模块,其中:
所述训练样本集建立模块,用于根据已有的作弊用户和非作弊用户的数据建立训练样本集;其中所述数据至少包括用户的行为信息;
所述作弊用户识别模型建立模块,用于利用上述训练样本集训练作弊用户识别模型,所述作弊用户识别模型用于识别用户是否为作弊用户;
所述作弊用户识别模块,用于利用所述作弊用户识别模型判断待识别用户是否为作弊用户。
7.如权利要求6所述的网络直播平台中的作弊用户识别***,其特征在于,所述用户的行为信息至少包括观看信息、弹幕信息和交易信息;
其中所述观看信息包括统计月观看天数、观看次数、观看时长、观看房间数、观看设备数以及观看IP数;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数;交易信息包含月虚拟礼物赠送天数、虚拟礼物赠送次数、虚拟礼物赠送量、虚拟礼物赠送房间数、获取虚拟礼物天数、获取虚拟礼物次数、获取虚拟礼物量、分享获得虚拟礼物天数、分享获得虚拟礼物次数、分享获得虚拟礼物量和其他维度获取虚拟礼物指标。
8.如权利要求6或7所述的网络直播平台中的作弊用户识别***,其特征在于,所述数据还包括用户的基础信息,所述用户的基础信息包括用户注册时长、用户等级、用户邮箱认证状态、用户手机认证状态、来源类型以及注册地。
9.如权利要7所述的网络直播平台中的作弊用户识别***,其特征在于,其中所述用户的行为信息还包括登录信息和弹幕信息,其中:
所述登录信息包括统计月登录次数、登录天数;充值信息包括统计月充值次数、充值金额;弹幕信息包含统计月发送弹幕天数、发送弹幕次数以及发送弹幕房间数。
10.如权利要6或7所述的网络直播平台中的作弊用户识别***,其特征在于,所述作弊用户识别模型建立模块具体包括数据处理子模块、模型构建子模块以及模型验证子模块,其中:
所述数据处理子模块,用于对上述训练样本集中的数据进行处理转换,对缺失值进行填充,去除极大值和极小值;
所述模型构建子模块,用于将上述处理后得到的数据按照m:n的比例抽样进行拆分,划分成训练集和测试集,利用训练集用户构建识别模型,其中所述m,n为预设值;
所述模型验证子模块,用于运用测试集对识别模型进行评估,选择最优的用户识别模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610328918.8A CN106022826A (zh) | 2016-05-18 | 2016-05-18 | 一种网络直播平台中的作弊用户识别方法与*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610328918.8A CN106022826A (zh) | 2016-05-18 | 2016-05-18 | 一种网络直播平台中的作弊用户识别方法与*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106022826A true CN106022826A (zh) | 2016-10-12 |
Family
ID=57098258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610328918.8A Pending CN106022826A (zh) | 2016-05-18 | 2016-05-18 | 一种网络直播平台中的作弊用户识别方法与*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106022826A (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106843941A (zh) * | 2016-12-31 | 2017-06-13 | 广东欧珀移动通信有限公司 | 信息处理方法、装置和计算机设备 |
CN107153971A (zh) * | 2017-05-05 | 2017-09-12 | 北京京东尚科信息技术有限公司 | 用于识别app推广中设备作弊的方法及装置 |
CN107517394A (zh) * | 2017-09-01 | 2017-12-26 | 北京小米移动软件有限公司 | 识别非法用户的方法、装置及计算机可读存储介质 |
CN107529078A (zh) * | 2017-09-08 | 2017-12-29 | 武汉斗鱼网络科技有限公司 | 防止被刷的验证方法及装置 |
CN107730364A (zh) * | 2017-10-31 | 2018-02-23 | 北京麒麟合盛网络技术有限公司 | 用户识别方法及装置 |
CN107770575A (zh) * | 2017-10-09 | 2018-03-06 | 武汉斗鱼网络科技有限公司 | 一种直播平台中防止刷礼物的方法及装置 |
CN107770161A (zh) * | 2017-10-09 | 2018-03-06 | 武汉斗鱼网络科技有限公司 | 一种直播平台中防止刷礼物的方法及装置 |
CN108243191A (zh) * | 2018-01-10 | 2018-07-03 | 武汉斗鱼网络科技有限公司 | 风险行为识别方法、存储介质、设备及*** |
CN108520438A (zh) * | 2018-03-30 | 2018-09-11 | 北京小米移动软件有限公司 | 行为类型确定方法及装置 |
CN108540431A (zh) * | 2017-03-03 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 账号类型的识别方法、装置和*** |
CN108616491A (zh) * | 2016-12-13 | 2018-10-02 | 北京酷智科技有限公司 | 一种恶意用户的识别方法和*** |
CN108900909A (zh) * | 2018-06-06 | 2018-11-27 | 武汉斗鱼网络科技有限公司 | 作弊用户的判断方法、相关存储介质和电子设备 |
CN108898505A (zh) * | 2018-05-28 | 2018-11-27 | 武汉斗鱼网络科技有限公司 | 作弊团伙的识别方法、相关存储介质和电子设备 |
CN108921581A (zh) * | 2018-07-18 | 2018-11-30 | 北京三快在线科技有限公司 | 一种刷单操作识别方法、装置及计算机可读存储介质 |
CN109086422A (zh) * | 2018-08-08 | 2018-12-25 | 武汉斗鱼网络科技有限公司 | 一种机器弹幕用户的识别方法、装置、服务器和存储介质 |
CN109165691A (zh) * | 2018-09-05 | 2019-01-08 | 北京奇艺世纪科技有限公司 | 用于识别作弊用户的模型的训练方法、装置及电子设备 |
CN109218753A (zh) * | 2017-06-30 | 2019-01-15 | 武汉斗鱼网络科技有限公司 | 一种显示虚拟礼物特效的方法和设备 |
CN109242522A (zh) * | 2017-07-11 | 2019-01-18 | 深圳乐信软件技术有限公司 | 目标用户识别模型建立、目标用户识别方法及装置 |
CN109325883A (zh) * | 2017-07-31 | 2019-02-12 | 深圳市珍爱网信息技术有限公司 | 一种双向匹配的推荐方法及装置 |
WO2019047375A1 (zh) * | 2017-09-08 | 2019-03-14 | 武汉斗鱼网络科技有限公司 | 防止被刷的验证方法、装置、服务器及存储介质 |
WO2019052283A1 (zh) * | 2017-09-13 | 2019-03-21 | 乐蜜有限公司 | 一种防盗刷方法、操作检测方法、装置及电子设备 |
CN110019954A (zh) * | 2017-12-13 | 2019-07-16 | 优酷网络技术(北京)有限公司 | 一种作弊用户的识别方法及*** |
CN110366045A (zh) * | 2018-04-09 | 2019-10-22 | 武汉斗鱼网络科技有限公司 | 机器弹幕用户识别方法、存储介质、电子设备及*** |
CN110516422A (zh) * | 2019-08-30 | 2019-11-29 | 北京字节跳动网络技术有限公司 | 用户身份的识别方法、装置、电子设备及存储介质 |
CN111091408A (zh) * | 2019-10-30 | 2020-05-01 | 北京天元创新科技有限公司 | 用户识别模型创建方法、装置与识别方法、装置 |
CN112101692A (zh) * | 2019-06-18 | 2020-12-18 | ***通信集团浙江有限公司 | 移动互联网质差用户的识别方法及装置 |
CN113553499A (zh) * | 2021-06-22 | 2021-10-26 | 杭州摸象大数据科技有限公司 | 一种基于营销裂变的作弊探测方法、***和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577876A (zh) * | 2013-11-07 | 2014-02-12 | 吉林大学 | 基于前馈神经网络的可信与不可信用户识别方法 |
CN103729678A (zh) * | 2013-12-12 | 2014-04-16 | 中国科学院信息工程研究所 | 一种基于改进dbn模型的水军检测方法及*** |
CN105306495A (zh) * | 2015-11-30 | 2016-02-03 | 百度在线网络技术(北京)有限公司 | 用户识别方法和装置 |
US20160063993A1 (en) * | 2014-09-02 | 2016-03-03 | Microsoft Corporation | Facet recommendations from sentiment-bearing content |
-
2016
- 2016-05-18 CN CN201610328918.8A patent/CN106022826A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577876A (zh) * | 2013-11-07 | 2014-02-12 | 吉林大学 | 基于前馈神经网络的可信与不可信用户识别方法 |
CN103729678A (zh) * | 2013-12-12 | 2014-04-16 | 中国科学院信息工程研究所 | 一种基于改进dbn模型的水军检测方法及*** |
US20160063993A1 (en) * | 2014-09-02 | 2016-03-03 | Microsoft Corporation | Facet recommendations from sentiment-bearing content |
CN105306495A (zh) * | 2015-11-30 | 2016-02-03 | 百度在线网络技术(北京)有限公司 | 用户识别方法和装置 |
Cited By (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108616491A (zh) * | 2016-12-13 | 2018-10-02 | 北京酷智科技有限公司 | 一种恶意用户的识别方法和*** |
CN106843941A (zh) * | 2016-12-31 | 2017-06-13 | 广东欧珀移动通信有限公司 | 信息处理方法、装置和计算机设备 |
CN108540431A (zh) * | 2017-03-03 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 账号类型的识别方法、装置和*** |
CN107153971A (zh) * | 2017-05-05 | 2017-09-12 | 北京京东尚科信息技术有限公司 | 用于识别app推广中设备作弊的方法及装置 |
CN107153971B (zh) * | 2017-05-05 | 2021-02-26 | 北京京东尚科信息技术有限公司 | 用于识别app推广中设备作弊的方法及装置 |
CN109218753A (zh) * | 2017-06-30 | 2019-01-15 | 武汉斗鱼网络科技有限公司 | 一种显示虚拟礼物特效的方法和设备 |
CN109218753B (zh) * | 2017-06-30 | 2021-03-16 | 武汉斗鱼网络科技有限公司 | 一种显示虚拟礼物特效的方法和设备 |
CN109242522A (zh) * | 2017-07-11 | 2019-01-18 | 深圳乐信软件技术有限公司 | 目标用户识别模型建立、目标用户识别方法及装置 |
CN109325883A (zh) * | 2017-07-31 | 2019-02-12 | 深圳市珍爱网信息技术有限公司 | 一种双向匹配的推荐方法及装置 |
CN107517394A (zh) * | 2017-09-01 | 2017-12-26 | 北京小米移动软件有限公司 | 识别非法用户的方法、装置及计算机可读存储介质 |
CN107529078A (zh) * | 2017-09-08 | 2017-12-29 | 武汉斗鱼网络科技有限公司 | 防止被刷的验证方法及装置 |
WO2019047375A1 (zh) * | 2017-09-08 | 2019-03-14 | 武汉斗鱼网络科技有限公司 | 防止被刷的验证方法、装置、服务器及存储介质 |
CN107529078B (zh) * | 2017-09-08 | 2019-08-02 | 武汉斗鱼网络科技有限公司 | 防止被刷的验证方法及装置 |
WO2019052283A1 (zh) * | 2017-09-13 | 2019-03-21 | 乐蜜有限公司 | 一种防盗刷方法、操作检测方法、装置及电子设备 |
CN107770575A (zh) * | 2017-10-09 | 2018-03-06 | 武汉斗鱼网络科技有限公司 | 一种直播平台中防止刷礼物的方法及装置 |
CN107770161B (zh) * | 2017-10-09 | 2019-11-15 | 武汉斗鱼网络科技有限公司 | 一种直播平台中防止刷礼物的方法及装置 |
CN107770575B (zh) * | 2017-10-09 | 2019-11-01 | 武汉斗鱼网络科技有限公司 | 一种直播平台中防止刷礼物的方法及装置 |
CN107770161A (zh) * | 2017-10-09 | 2018-03-06 | 武汉斗鱼网络科技有限公司 | 一种直播平台中防止刷礼物的方法及装置 |
CN107730364A (zh) * | 2017-10-31 | 2018-02-23 | 北京麒麟合盛网络技术有限公司 | 用户识别方法及装置 |
CN110019954A (zh) * | 2017-12-13 | 2019-07-16 | 优酷网络技术(北京)有限公司 | 一种作弊用户的识别方法及*** |
CN108243191A (zh) * | 2018-01-10 | 2018-07-03 | 武汉斗鱼网络科技有限公司 | 风险行为识别方法、存储介质、设备及*** |
WO2019136850A1 (zh) * | 2018-01-10 | 2019-07-18 | 武汉斗鱼网络科技有限公司 | 风险行为识别方法、存储介质、设备及*** |
CN108243191B (zh) * | 2018-01-10 | 2019-08-23 | 武汉斗鱼网络科技有限公司 | 风险行为识别方法、存储介质、设备及*** |
CN108520438A (zh) * | 2018-03-30 | 2018-09-11 | 北京小米移动软件有限公司 | 行为类型确定方法及装置 |
CN108520438B (zh) * | 2018-03-30 | 2021-06-22 | 北京小米移动软件有限公司 | 行为类型确定方法及装置 |
CN110366045A (zh) * | 2018-04-09 | 2019-10-22 | 武汉斗鱼网络科技有限公司 | 机器弹幕用户识别方法、存储介质、电子设备及*** |
CN110366045B (zh) * | 2018-04-09 | 2021-07-23 | 武汉斗鱼网络科技有限公司 | 机器弹幕用户识别方法、存储介质、电子设备及*** |
CN108898505A (zh) * | 2018-05-28 | 2018-11-27 | 武汉斗鱼网络科技有限公司 | 作弊团伙的识别方法、相关存储介质和电子设备 |
CN108900909B (zh) * | 2018-06-06 | 2020-07-17 | 武汉斗鱼网络科技有限公司 | 作弊用户的判断方法、相关存储介质和电子设备 |
CN108900909A (zh) * | 2018-06-06 | 2018-11-27 | 武汉斗鱼网络科技有限公司 | 作弊用户的判断方法、相关存储介质和电子设备 |
CN108921581A (zh) * | 2018-07-18 | 2018-11-30 | 北京三快在线科技有限公司 | 一种刷单操作识别方法、装置及计算机可读存储介质 |
CN108921581B (zh) * | 2018-07-18 | 2021-07-02 | 北京三快在线科技有限公司 | 一种刷单操作识别方法、装置及计算机可读存储介质 |
CN109086422B (zh) * | 2018-08-08 | 2021-02-02 | 武汉斗鱼网络科技有限公司 | 一种机器弹幕用户的识别方法、装置、服务器和存储介质 |
CN109086422A (zh) * | 2018-08-08 | 2018-12-25 | 武汉斗鱼网络科技有限公司 | 一种机器弹幕用户的识别方法、装置、服务器和存储介质 |
CN109165691A (zh) * | 2018-09-05 | 2019-01-08 | 北京奇艺世纪科技有限公司 | 用于识别作弊用户的模型的训练方法、装置及电子设备 |
CN109165691B (zh) * | 2018-09-05 | 2022-04-22 | 北京奇艺世纪科技有限公司 | 用于识别作弊用户的模型的训练方法、装置及电子设备 |
CN112101692A (zh) * | 2019-06-18 | 2020-12-18 | ***通信集团浙江有限公司 | 移动互联网质差用户的识别方法及装置 |
CN112101692B (zh) * | 2019-06-18 | 2023-11-24 | ***通信集团浙江有限公司 | 移动互联网质差用户的识别方法及装置 |
CN110516422A (zh) * | 2019-08-30 | 2019-11-29 | 北京字节跳动网络技术有限公司 | 用户身份的识别方法、装置、电子设备及存储介质 |
CN110516422B (zh) * | 2019-08-30 | 2021-05-07 | 北京字节跳动网络技术有限公司 | 用户身份的识别方法、装置、电子设备及存储介质 |
CN111091408A (zh) * | 2019-10-30 | 2020-05-01 | 北京天元创新科技有限公司 | 用户识别模型创建方法、装置与识别方法、装置 |
CN113553499A (zh) * | 2021-06-22 | 2021-10-26 | 杭州摸象大数据科技有限公司 | 一种基于营销裂变的作弊探测方法、***和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106022826A (zh) | 一种网络直播平台中的作弊用户识别方法与*** | |
CN109800320B (zh) | 一种图像处理方法、设备及计算机可读存储介质 | |
CN107872772B (zh) | 诈骗短信的检测方法及装置 | |
CN109784381A (zh) | 标注信息处理方法、装置及电子设备 | |
US8554910B2 (en) | Method and device for pushing data | |
CN107943583B (zh) | 应用程序的处理方法、装置、存储介质及电子设备 | |
CN109919244B (zh) | 用于生成场景识别模型的方法和装置 | |
CN103647800A (zh) | 推荐应用资源的方法及*** | |
CN109614414B (zh) | 一种用户信息的确定方法及装置 | |
CN109657038A (zh) | 一种问答对数据的挖掘方法、装置及电子设备 | |
CN109146271A (zh) | 绩效管理方法、装置、终端及计算机可读存储介质 | |
CN112365007B (zh) | 模型参数确定方法、装置、设备及存储介质 | |
CN111510368B (zh) | 家庭群组识别方法、装置、设备及计算机可读存储介质 | |
CN107728772B (zh) | 应用程序的处理方法、装置、存储介质及电子设备 | |
CN110489747A (zh) | 一种图像处理方法、装置、存储介质及电子设备 | |
CN109191167A (zh) | 一种目标用户的挖掘方法和装置 | |
CN110163250A (zh) | 基于分布式调度的图像脱敏处理***、方法以及装置 | |
CN106897743B (zh) | 基于贝叶斯模型的移动考勤防作弊大数据检测方法 | |
CN113918806A (zh) | 自动推荐培训课程的方法及相关设备 | |
CN110457601A (zh) | 社交账号的识别方法和装置、存储介质及电子装置 | |
CN108052960A (zh) | 识别终端握持状态的方法、模型训练方法及终端 | |
CN114663705A (zh) | 视频审核模型训练方法、视频审核方法及相关装置 | |
CN110335626A (zh) | 基于音频的年龄识别方法及装置、存储介质 | |
CN116028702A (zh) | 学习资源推荐方法、***及电子设备 | |
CN109446324A (zh) | 样本数据的处理方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161012 |