CN108108912A - 互动低质量用户的判别方法、装置、服务器及存储介质 - Google Patents

互动低质量用户的判别方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN108108912A
CN108108912A CN201810023638.5A CN201810023638A CN108108912A CN 108108912 A CN108108912 A CN 108108912A CN 201810023638 A CN201810023638 A CN 201810023638A CN 108108912 A CN108108912 A CN 108108912A
Authority
CN
China
Prior art keywords
user
low quality
feature
interactive
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810023638.5A
Other languages
English (en)
Inventor
李建明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810023638.5A priority Critical patent/CN108108912A/zh
Publication of CN108108912A publication Critical patent/CN108108912A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种互动低质量用户的判别方法、装置、服务器及存储介质。其中,所述方法包括:从用户历史行为中提取用户行为特征;将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。可以在用户发布互动内容之前确定其是否为互动低质量用户,为后续的处理提供了依据。解决了现有技术中判别互动低质量用户判别缺少时效性的问题,实现了及时准确的判别互动低质量用户的效果。

Description

互动低质量用户的判别方法、装置、服务器及存储介质
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种互动低质量用户的判别方法、装置、服务器及存储介质。
背景技术
随着互联网技术的不断发展,人们日常的娱乐活动也越来越丰富,例如,越来越多的用户喜欢通过直播应用程序在线观看主播提供的视频节目或者音频节目等。在直播过程中,主播与用户、用户与用户之间可以通过聊天或者弹幕形式进行互动。但存在一些互动低质量用户,例如散播广告、恶意骂人的用户等,严重影响互动效果。
目前,对于互动低质量用户通常采用举报和识别关键词两种方法进行识别,但上述两种方法都是基于用户当前发布的互动内容进行识别,具有滞后性,对低质量用户的判别响应不够及时。
发明内容
本发明实施例提供了一种互动低质量用户的判别方法、装置、服务器及存储介质,以实现及时判别互动低质量用户的目的。
第一方面,本发明实施例提供了一种互动低质量用户的判别方法,包括:
从用户历史行为中提取用户行为特征;
将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。第二方面,本发明实施例还提供了一种互动低质量用户的判别装置,包括:
提取模块,用于从用户历史行为中提取用户行为特征;
判别模块,用于将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。。
第三方面,本发明实施例还提供了一种服务器,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述实施例提供的任一所述的互动低质量用户的判别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提供的任一所述的互动低质量用户的判别方法。
本发明实施例提供的互动低质量用户的判别方法、装置、服务器及存储介质,通过从用户的历史互动行为中提取用户的行为特征,并利用预设的逻辑回归模型,根据用户的行为特征对用户进行判别,确定其是否为互动低质量用户。可以在用户发布互动内容之前确定其是否为互动低质量用户,为后续的处理提供了依据。解决了现有技术中判别互动低质量用户判别缺少时效性的问题,实现了及时准确的判别互动低质量用户的效果。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例一提供的互动低质量用户的判别方法的流程图;
图2是本发明实施例二提供的互动低质量用户的判别方法的流程图;
图3是本发明实施例三提供的互动低质量用户的判别方法的流程图;
图4是本发明实施例四提供的互动低质量用户的判别装置的结构图;
图5是本发明实施例五提供的服务器的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的互动低质量用户的判别方法的流程图,本实施例可适用于对互动低质量用户进行判别的情况,该方法可以由互动低质量用户的判别装置来执行,具体包括如下步骤:
步骤110、从用户历史行为中提取至少两种用户行为特征。
在直播网站中用户可以发起多种用户行为。所述用户行为可以是用户在直播网站中所进行的各种操作。示例性的,所述用户行为可以包括:用户选择直播间的行为、用户的消费行为、用户的聊天行为、用户的弹幕发布行为和用户添加好友的行为等。用户的行为可以体现用户自身的一些特性,例如:用户聊天行为比较频繁,则可以体现该用户喜欢积极互动,喜欢和别人交流,希望从交流中获取认同感。或者用户经常选择游戏直播间的行为,则可以体现该用户喜欢游戏。根据这些特性可以综合判断所述用户是否为互动低质量用户。
在本实施例中,可以通过直播服务器获取某一特定用户的历史行为。所述历史行为可以是该用户在该直播服务器的之前的所有操作行为。由于历史行为中可以包括用户的多种信息,但这些信息与用户本身的特性无关。因此,需要从用户历史行为中提取用户行为特征,以实现去除无用信息的目的。所述用户行为特征可以是能够表征用户个人属性的行为特征。示例性的,所述用户行为特征可以包括下述至少两个:在线时长特征、时间分布特征、互动频率特征和互动内容特征。其中,所述在线时长特征,可以是用户一天中在所述直播服务器访问的总时长。其可以是一个数值意义特征,如2小时、3.5小时。利用所述在线时长特征能够表征用户的活跃度属性。所述时间分布特征,可以是每天在线时间的时间段的随机性。可以体现所述用户在线时间随机性强还是固定性强。示例性的,可以采用0-99之间的数值表示所属在线时长特征。所述数值可以根据历史记录中同一在线时间段的次数与总的在线次数之比得到。如果存在多个同一在线时间段,则可以根据每天直播的热度时间段对每个同一在线时间段设置不同的权重值。示例性的,每天20:-22:00为直播最热度时间段,则可以为该时间段设置较高的权重值;相应的,每天6:00-10:00为直播热度最低时间段,则可以为该时间段设置较低的权重值,利用上述方法,可以计算得到所述用户的在线时长特征。优选的,可以将上述0-99之间的数值进行归一化处理。将时间分布标识成0到1之间的浮点数,越接近0越随机、越接近1越固定。所述互动频率特征用于表示所述用户的互动频率。示例性的,可以是用户在单位时间内发送聊天信息或者发布弹幕的次数。所述互动内容特征可以用于表征用户发布的互动内容意义。示例性的,其可以是内容类别。例如:根据所述用户发送的多条消息,可以确定其经常提及动漫内容,所以动漫相关性9.0分;所述用户的发送的多条消息中多次提到颜值,则颜值相关性8.0分;很少聊到体育内容,其体育相关性0.5分;偶然提到影视内容,其影视相关性1.0;很少发布广告内容,则广告相关性0.2;偶尔会发布一些不礼貌言语,则其脏话相关性1.0。可选的,可以采用预设的语义情感分析***,对所述用户的聊天内容进行相应的打分,以得到互动内容特征。所述语义情感分析***可以是经过训练的神经网络,所述神经网络(Neural Networks,NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络***,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习***。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。因此,适用于对所述用户的互动内容进行分类。根据所述预设的语义情感分析***得到的打分结果,可以对所述互动内容相关性进行归一化处理,并对归一化的结果进行四舍五入处理,最后得到互动内容特征。示例性的,通过归一化处理可以确定上述用户的为动漫特征值1、颜值特征值1、体育特征值0、影视特征值0、广告特征值0及脏话特征值0。
步骤120、将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。
在直播间进行直播的过程中,用户可以通过聊天和弹幕等形式与其它用户进行互动交流。但部分用户互动发布的内容为无意义内容、广告内容和不文明语言内容等。这些用户的互动行为严重影响了其它用户的互动性,因此,这些用户可以被称为互动低质量用户。通常互动低质量用户可以包括:灌水用户、发布广告用户和不文明用语用户等。对于互动低质量用户需要进行判别,别对其采用相应的措施进行预防和制止,以提高直播间内用户互动的质量。
由于用户的行为特征可以体现所述用户的特性。因此,可以根据所述用户的行为特征确定所述用户是否为互动低质量用户。在存在多种用户行为特征时,不仅需要考虑每种用户行为特征,并且需要考虑每种用户行为特征对判定互动低质量用户的影响。例如:互动内容特征对判定结果的影响力应该大于时间分布特征。因此,在本实施例中,可以利用逻辑回归模型对互动低质量用户的进行评定。逻辑回归(Logistic Regression)是机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛。回归是一种极易理解的模型,就相当于y=f(x),表明自变量x与因变量y的关系。在模型中,每一个分量,就可以看做一个特征数据。每个特征至少对应一个未知的参数。这样就形成了一个线性模型函数。利用逻辑回归模型可以对多种特征进行综合评价,且评价结果更为准确,能够有效提高互动低质量用户判别的准确性。并且,所述逻辑回归模型相对于其他人工智能模型相对更为简单,可以有效减少判别所需要的时长。利用逻辑回归模型可以方便的利用多个用户行为特征,产生一个准确的判别结果。并且,所述逻辑回归模型相对于其他人工智能模型相对更为简单,可以有效减少判别所需要的时长。可选的,所述逻辑回归模型可以为:y=q1x1+q2x2+……+qnxn,其中,y为评价结果,xn为其中的一种用户行为特征,qn为所述用户行为特征的权重值。
在本实施例中,可以通过样本数据和人工评判结果对逻辑回归模型进行训练,以得到每种用户行为特征的权重值。在训练完成后,将上述方法得到的多种用户行为特征输入训练完成后的逻辑回归模型。并得到所述逻辑回归模型的输出结果。由于所述逻辑回归模型的输出结果取值在(0,1)之间,可以将输出结果与评价阈值进行比较,根据比较结果判定所述用户是否为互动低质量用户。所述评价阈值可以基于经验设定。示例性的,所述评价阈值可以为0.6,如果逻辑回归模型的输出结果大于0.6的,可以判定该用户为互动低质量用户。
本实施例通过从用户的历史互动行为中提取用户行为特征,并利用预设的逻辑回归模型根据用户的行为特征对用户进行判别,确定其是否为互动低质量用户。可以在用户发布互动内容之前确定其是否为互动低质量用户,为后续的处理提供了依据。解决了现有技术中判别互动低质量用户判别缺少时效性的问题,实现了及时准确的判别互动低质量用户的效果。
在本实施例的一个优选实施方式中,在根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户之后,还可增加如下步骤:对所述互动低质量用户采用禁言策略。由于互动低质量用户在直播室内通常以发布广告,或者辱骂其它用户或者主播,严重影响直播效果和其它用户的主观感受。因此,在确定所述用户为互动低质量用户后,可以在其进入直播室后,对其采用禁言策略。以阻止所述互动低质量用户发布低质量的聊天信息或者弹幕信息。与采用举报机制和关键词识别方法相比,可以在互动低质量用户发布信息以前对其预防性的采用禁言策略。提高了禁言的时效性。能够实现对低质量用户发布的信息进行预防性的禁言。
在本实施例的一个优选实施方式中,所述方法还可增加如下步骤:利用样本对所述逻辑回归模型中的特征权重进行调整。由于训练是通过人工输入的判别结果进行训练的,采用的用户行为特征的权重值可能与实际存在着一定的偏差。因此,在本实施例中,可以设定一些样本,并利用样本对所述逻辑回归模型中的特征权重进行调整,以使得所述逻辑回归模型的计算结果更加趋近于理想判别结果。示例性的,可以采用梯度下降法对所述逻辑回归模型中的特征权重进行调整。梯度下降法是一个最优化算法,通常也称为最速下降法。最速下降法是用负梯度方向为搜索方向的,最速下降法越接近目标值,步长越小,前进越慢。其方法可以包括:先确定向下一步的步伐大小,并任意给定一个初始值:确定一个向下的方向,并向下走预先规定的步伐,并更新所述初始值;当下降的高度小于某个定义的值,则停止下降。示例性的,可以首先利用线性搜索算法确定步长,并利用预设的迭代公式计算迭代结果,并将当前计算迭代结果与前次迭代结果进行比较,在二者差值小于预设的阈值时,则说明当前取值即为合适的特征权重值。利用梯度下降法可以确定所述逻辑回归模型的最小损耗值,并根据最小损耗值重新确定所述逻辑回归模型中特征权重,并对原有的特征权重进行调整。
实施例二
图2本发明实施例二提供的互动低质量用户的判别方法的流程示意图。本实施例以上述实施例为基础进行优化,在本实施例中,增加如下步骤:根据所述逻辑回归模型的输出结果对互动低质量用户进行分类;根据所述分类结果对互动低质量用户采用对应的禁言策略。
相应的,本实施例所提供的互动低质量用户的判别方法,具体包括:
步骤210、从用户历史行为中提取用户行为特征。
步骤220、将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。
步骤230、根据所述逻辑回归模型的输出结果对互动低质量用户进行分类。
互动低质量用户可以按照其互动质量分为多个类别。例如:偶尔发布不文明用语的高级级别的互动低质量用户、经常发布广告内容的中级级别的互动低质量用户和经常发布辱骂他人内容的低级级别的互动低质量用户。对于互动低质量用户,需要对其进行分类,并对其进行针对性的管理。在本实施例中,可以根据所述输出结果对互动低质量用户进行分类。所述逻辑回归模的输出结果通常在(0,1)范围之中,可以将输出的结果与预设的每个分类对应的评价范围进行比较,并根据比较结果进行分类。示例性的,所述高级级别的互动低质量用户的评价范围为(0.8,1),所述中级级别的互动低质量用户的评价范围为(0.4,0.8),所述低级级别的互动低质量用户的评价范围为(0,0.4),如果所述逻辑回归模型的输出结果为0.7,则可以确定所述用户为中级级别的互动低质量用户分类。
步骤240、根据所述分类结果对互动低质量用户采用对应的禁言策略。
不同分类的互动低质量用户对于直播室的互动内容的影响程度和造成的恶劣影响都不同。因此,可以根据上述分类结果对所述互动低质量用户采用对应的禁言策略。示例性的,所述禁言策略可以包括:关键词校验禁言、人工审核禁言和完全禁言。其中,所述关键词检验禁言可以是对该类别的互动低质量用户输入的互动内容进行关键词检验,确定其中是否存在广告或者攻击性语言,如果没有检查到相应的关键词,则发布上述输入的互动内容。所述人工审核禁言策略可以是对于该类别的互动低质量用户输入的互动内容进行人工检验,在人工检验确定不存在问题时,则发布输入的互动内容。而完全禁言则是在直播室中禁止所述该类别的互动低质量用户进行任何的互动。
根据上述方法确定的分类结果对每个分类结果中的互动低质量用户进行禁言管理,可以实现分类管理的目的。
本实施例通过增加如下步骤:根据所述逻辑回归模型的输出结果对互动低质量用户进行分类;根据所述分类结果对互动低质量用户采用对应的禁言策略。可以实现对不同影响程度的用户进行分类管理。能够实现在有效管理的前提下,增加用户的互动量,进而提高互动的活跃程度。
实施例三
图3发明实施例三提供的互动低质量用户的判别方法的流程示意图。本实施例以上述实施例为基础进行优化,在本实施例中,可以将用户行为特征增加为:参考行为特征,所述参考行为特征包括:观看起因特征和\或消费习惯特征。
相应的,本实施例所提供的互动低质量用户的判别方法,具体包括:
步骤310、从用户历史行为中提取用户行为特征和参考行为特征,所述参考行为特征包括:观看起因特征和\或消费***均金额作为消费习惯特征,例如:0元、10元、666元等。
步骤320、将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。步骤330、根据所述参考行为特征对判别结果进行修正。
参考行为特征可以用于对互动互动低质量用户的判别提供参考。因此,可以根据所述参考行为特征对判别结果进行修正。
示例性的,如果所述用户的观看起因特征为1>收到关注的主播的开播提醒,则可以说明所述用户发布广告的可能性较小,则可以将所述观看起因特征乘以相应的权重系数,并将乘积与评价结果进行相减运算,并根据运算结果重新对所述用户进行评价。或者,如果所述用的消费习惯特征大于某个消费阈值,则也可说明所述用户为优质用户,如果根据其他用户行为特征判断所述用户为互动低质量用户,则可以直接采用消费习惯特征可以对所述评价结果进行更改,判别所述用户不是互动低质量用户。
本实施例通过将用户行为特征增加为:参考行为特征,所述参考行为特征包括:观看起因特征和\或消费习惯特征。可以综合用户在直播间的所有行为特征对其是否为互动低质量用户进行评判,可以进一步提高判断的准确性。
实施例四
图4是本发明实施例四提供的互动低质量用户的判别装置的结构示意图,如图4所示,所述装置包括:
提取模块410,用于从用户历史行为中提取用户行为特征;
判别模块420,用于将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。
本实施例提供的互动低质量用户的判别装置,通过从用户的历史互动行为中提取用户的行为特征,并利用预设的逻辑回归模型,根据用户的行为特征对用户进行判别,确定其是否为互动低质量用户。可以在用户发布互动内容之前确定其是否为互动低质量用户,为后续的处理提供了依据。解决了现有技术中判别互动低质量用户判别缺少时效性的问题,实现了及时准确的判别互动低质量用户的效果。
在上述各实施例的基础上,所述装置还包括:
分类模块,用于根据所述逻辑回归模型的输出结果对互动低质量用户进行分类;
分类禁言模块,用于根据所述分类结果对互动低质量用户采用对应的禁言策略。
在上述各实施例的基础上,所述装置还包括:
调整模块,用于利用样本对所述逻辑回归模型中的特征权重进行调整。
在上述各实施例的基础上,所述用户行为特征包括下述至少两个:
在线时长特征、时间分布特征、互动频率特征和互动内容特征。
在上述各实施例的基础上,所述提取模块包括:
提取单元,用于从用户历史行为中提取用户行为特征和参考行为特征,所述参考行为特征包括:观看起因特征和\或消费习惯特征;
所述装置还包括:
修正模块,用于根据所述参考行为特征对判别结果进行修正。在上述各实施例的基础上,所述装置还包括:
禁言模块,用于对所述聊天低质量用户采用禁言策略。
本发明实施例所提供的互动低质量用户的判别装置可执行本发明任意实施例所提供的互动低质量用户的判别方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5为本发明实施例5提供的一种服务器的结构示意图。图5示出了适于用来实现本发明实施方式的示例***器12的框图。图5显示的服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,服务器12以通用计算设备的形式表现。服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
服务器12典型地包括多种计算机***可读介质。这些介质可以是任何能够被服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该服务器12交互的设备通信,和/或与使得该服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的互动低质量用户的判别方法。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提供的任一所述的互动低质量用户的判别方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以相互组合,形成本领域技术人员可以理解的其他实施方式。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (12)

1.一种互动低质量用户的判别方法,其特征在于,包括:
从用户历史行为中提取用户行为特征;
将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述逻辑回归模型的输出结果对互动低质量用户进行分类;
根据所述分类结果对互动低质量用户采用对应的禁言策略。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用样本对所述逻辑回归模型中的特征权重进行调整。
4.根据权利要求1所述的方法,其特征在于,所述用户行为特征包括下述至少一个:
在线时长特征、时间分布特征、互动频率特征和互动内容特征。
5.根据权利要求1所述的方法,其特征在于,所述从用户历史行为中提取用户行为特征包括:
从用户历史行为中提取用户行为特征和参考行为特征,所述参考行为特征包括:观看起因特征和\或消费习惯特征;
在所述根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户之后,还包括:
根据所述参考行为特征对判别结果进行修正。
6.根据权利要求1所述的方法,其特征在于,在根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户之后,还包括:
对所述聊天低质量用户采用禁言策略。
7.一种互动低质量用户的判别装置,其特征在于,包括:
提取模块,用于从用户历史行为中提取用户行为特征;
判别模块,用于将所述用户行为特征输入预设的逻辑回归模型,根据所述逻辑回归模型的输出结果判别所述用户是否为互动低质量用户。。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
分类模块,用于根据所述逻辑回归模型的输出结果对互动低质量用户进行分类;
分类禁言模块,用于根据所述分类结果对互动低质量用户采用对应的禁言策略。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
调整模块,用于利用样本对所述逻辑回归模型中的特征权重进行调整。
10.根据权利要求7所述的装置,其特征在于,所述提取模块包括:
提取单元,用于从用户历史行为中提取用户行为特征和参考行为特征,所述参考行为特征包括:观看起因特征和\或消费习惯特征;
所述装置还包括:
修正模块,用于根据所述参考行为特征对判别结果进行修正。
11.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的互动低质量用户的判别方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的互动低质量用户的判别方法。
CN201810023638.5A 2018-01-10 2018-01-10 互动低质量用户的判别方法、装置、服务器及存储介质 Pending CN108108912A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810023638.5A CN108108912A (zh) 2018-01-10 2018-01-10 互动低质量用户的判别方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810023638.5A CN108108912A (zh) 2018-01-10 2018-01-10 互动低质量用户的判别方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN108108912A true CN108108912A (zh) 2018-06-01

Family

ID=62220040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810023638.5A Pending CN108108912A (zh) 2018-01-10 2018-01-10 互动低质量用户的判别方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN108108912A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109729376A (zh) * 2019-01-02 2019-05-07 广州虎牙信息科技有限公司 一种生命周期的处理方法、装置、设备和存储介质
CN110362831A (zh) * 2019-07-17 2019-10-22 武汉斗鱼鱼乐网络科技有限公司 目标用户识别方法、装置、电子设备及存储介质
CN111369029A (zh) * 2018-12-06 2020-07-03 北京嘀嘀无限科技发展有限公司 服务选择预测方法、装置、电子设备及存储介质
CN112070559A (zh) * 2020-09-17 2020-12-11 贝壳技术有限公司 状态获取方法和装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204106A (zh) * 2016-06-28 2016-12-07 武汉斗鱼网络科技有限公司 一种特定用户识别方法及***
CN107169796A (zh) * 2017-05-12 2017-09-15 深圳市浩天投资有限公司 一种用户行为数据的分析方法、***及计算机可读存储介质
CN107220217A (zh) * 2017-05-31 2017-09-29 北京京东尚科信息技术有限公司 基于逻辑回归的特征系数训练方法和装置
CN107220355A (zh) * 2017-06-02 2017-09-29 北京百度网讯科技有限公司 基于人工智能的新闻质量判断方法、设备及存储介质
CN107391760A (zh) * 2017-08-25 2017-11-24 平安科技(深圳)有限公司 用户兴趣识别方法、装置及计算机可读存储介质
CN107491432A (zh) * 2017-06-20 2017-12-19 北京百度网讯科技有限公司 基于人工智能的低质量文章识别方法及装置、设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204106A (zh) * 2016-06-28 2016-12-07 武汉斗鱼网络科技有限公司 一种特定用户识别方法及***
CN107169796A (zh) * 2017-05-12 2017-09-15 深圳市浩天投资有限公司 一种用户行为数据的分析方法、***及计算机可读存储介质
CN107220217A (zh) * 2017-05-31 2017-09-29 北京京东尚科信息技术有限公司 基于逻辑回归的特征系数训练方法和装置
CN107220355A (zh) * 2017-06-02 2017-09-29 北京百度网讯科技有限公司 基于人工智能的新闻质量判断方法、设备及存储介质
CN107491432A (zh) * 2017-06-20 2017-12-19 北京百度网讯科技有限公司 基于人工智能的低质量文章识别方法及装置、设备及介质
CN107391760A (zh) * 2017-08-25 2017-11-24 平安科技(深圳)有限公司 用户兴趣识别方法、装置及计算机可读存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111369029A (zh) * 2018-12-06 2020-07-03 北京嘀嘀无限科技发展有限公司 服务选择预测方法、装置、电子设备及存储介质
CN109729376A (zh) * 2019-01-02 2019-05-07 广州虎牙信息科技有限公司 一种生命周期的处理方法、装置、设备和存储介质
CN109729376B (zh) * 2019-01-02 2021-12-14 广州虎牙信息科技有限公司 一种生命周期的处理方法、装置、设备和存储介质
CN110362831A (zh) * 2019-07-17 2019-10-22 武汉斗鱼鱼乐网络科技有限公司 目标用户识别方法、装置、电子设备及存储介质
CN112070559A (zh) * 2020-09-17 2020-12-11 贝壳技术有限公司 状态获取方法和装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
Medvedev et al. The anatomy of Reddit: An overview of academic research
WO2020228514A1 (zh) 内容推荐方法、装置、设备及存储介质
CN111444357B (zh) 内容信息确定方法、装置、计算机设备及存储介质
Cvijikj et al. Understanding social media marketing: a case study on topics, categories and sentiment on a Facebook brand page
US20150243279A1 (en) Systems and methods for recommending responses
CN108804567A (zh) 提高智能客服应答率的方法、设备、存储介质及装置
CN108108912A (zh) 互动低质量用户的判别方法、装置、服务器及存储介质
CN110892395A (zh) 提供增强的通信会话服务的虚拟助手
CN109033408B (zh) 信息推送方法及装置、计算机可读存储介质、电子设备
Cvijikj et al. Understanding the user generated content and interactions on a Facebook brand page
CN112799747A (zh) 智能助理评价、推荐方法、***、终端及可读存储介质
Bian et al. Predicting trending messages and diffusion participants in microblogging network
CN110474944B (zh) 网络信息的处理方法、装置及存储介质
CN112153426B (zh) 一种内容账号管理方法、装置、计算机设备及存储介质
CN102946331A (zh) 一种社交网络僵尸用户检测方法及装置
JP7488871B2 (ja) 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム
CN106951471A (zh) 一种基于svm的标签发展趋势预测模型的构建方法
Borges et al. On measuring popularity bias in collaborative filtering data
CN110019777A (zh) 一种信息分类的方法及设备
WO2020258773A1 (zh) 确定推送用户群的方法、装置、设备及存储介质
US20240193402A1 (en) Method and apparatus for determining representation information, device, and storage medium
CN111523035A (zh) App浏览内容的推荐方法、装置、服务器和介质
Liu et al. Identifying social roles using heterogeneous features in online social networks
Çakıt et al. Application of soft computing techniques for estimating emotional states expressed in Twitter® time series data
CN114357204B (zh) 媒体信息的处理方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination