CN106777341A - 信息处理方法、装置及计算机设备 - Google Patents

信息处理方法、装置及计算机设备 Download PDF

Info

Publication number
CN106777341A
CN106777341A CN201710026441.2A CN201710026441A CN106777341A CN 106777341 A CN106777341 A CN 106777341A CN 201710026441 A CN201710026441 A CN 201710026441A CN 106777341 A CN106777341 A CN 106777341A
Authority
CN
China
Prior art keywords
comment
queue
user
user comment
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710026441.2A
Other languages
English (en)
Inventor
林海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201710026441.2A priority Critical patent/CN106777341A/zh
Publication of CN106777341A publication Critical patent/CN106777341A/zh
Priority to PCT/CN2017/107191 priority patent/WO2018129978A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种信息处理方法、装置及计算机设备。所述信息处理方法包括:获取用户评论,并遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值,若是,则将用户评论确定为垃圾评论;若否,则将用户评论加入评论队列,并根据所述第二阈值对所述先进先出队列的队尾评论进行处理。本发明实施例可以有效识别出垃圾评论,并当用户评论识别为非垃圾评论时,仅需更新评论队列,避免对数据库中的所有内容进行处理,减轻***运行负担,提高信息处理效率。

Description

信息处理方法、装置及计算机设备
技术领域
本发明涉及通信技术领域,尤其涉及互联网技术领域,具体涉及一种信息处理方法、装置及计算机设备。
背景技术
随着互联网技术的发展,用户可以通过网络在各个论坛、社区、网站等各种公共平台上发表相关评论。然而,基于公共平台的言论开放性,部分用户通过将广告评论、推销评论、其他含有不良影响的评论等垃圾评论大量发布到公共平台上,以此影响用户对有用信息的获取,且给用户带来不良影响。现有的计算机设备在使用的过程中,垃圾评论已经越来越困扰到用户,而如何有效识别垃圾评论已越来越受到业界的普遍关注。
发明内容
本发明实施例提供一种信息处理方法、装置及计算机设备,可以提高信息处理效率。
本发明实施例提供一种信息处理方法,所述方法包括:
获取用户评论;
遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值;
若是,则将所述用户评论确定为垃圾评论;
若否,则将所述用户评论加入评论队列,并根据所述第二阈值对所述先进先出队列的队尾评论进行处理。
本发明实施例还提供一种信息处理装置,所述装置包括:
获取模块,用于获取用户评论;
第一判断模块,用于遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值;
确定模块,用于当判断所述评论队列中与所述用户评论相同或者相似的评论数量达到第一阈值时,将所述用户评论确定为垃圾评论;
处理模块,用于当判断所述评论队列中与所述用户评论相同或者相似的评论数量未达到第一阈值时,将所述用户评论加入评论队列,并根据所述第二阈值对所述先进先出队列的队尾评论进行处理。
本发明实施例还提供一种计算机设备,包括存储器,处理器及存储在存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器调用所述存储器中存储的所述计算机程序,执行本发明任一实施例所述的信息处理方法。
附图说明
下面结合附图,通过对本发明的具体实施方式详细描述,将使本发明的技术方案及其它有益效果显而易见。
图1为本发明实施例提供的一种信息处理方法的流程示意图。
图2为本发明实施例提供的一种信息处理方法的第一使用状态示意图。
图3为本发明实施例提供的一种信息处理方法的第二使用状态示意图。
图4为本发明实施例提供的一种信息处理方法的另一流程示意图。
图5为本发明实施例提供的一种信息处理方法的第三使用状态示意图。
图6为本发明实施例提供的一种信息处理方法的第四使用状态示意图。
图7为本发明实施例提供的一种信息处理装置的结构示意图。
图8为本发明实施例提供的一种信息处理装置的另一结构示意图。
图9为本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、***、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明实施例提供的一种信息处理方法的执行主体,可以为本发明实施例提供的一种信息处理装置,或者集成了所述信息处理装置的计算机设备(譬如台式电脑、笔记本、掌上电脑、平板电脑、智能手机等),所述信息处理装置可以采用硬件或者软件的方式实现。
请参阅图1,图1为本发明实施例提供的一种信息处理方法的流程示意图。所述方法包括:
步骤S101,获取用户评论。
步骤S102,遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且
长度具有第二阈值;若否,则执行步骤S103;若是,则执行步骤S104。
一些实施方式中,可以通过判断所述评论队列中存在的与所述用户评论的相似度达到第三阈值的历史评论的评论数量是否达到第一阈值,来判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值。当判断所述评论队列中存在的与所述用户评论的相似度达到第三阈值的历史评论的评论数量未达到第一阈值时,确定所述评论队列中与所述用户评论相同或者相似的评论数量未达到第一阈值,则执行步骤S103。当判断所述评论队列中存在的与所述用户评论的相似度达到第三阈值的历史评论的评论数量达到第一阈值时,确定所述评论队列中与所述用户评论相同或者相似的评论数量达到第一阈值,则执行步骤S104。
步骤S103,将所述用户评论加入评论队列,并根据所述第二阈值对所述评论队列的队尾评论进行处理。
一些实施方式中,可以将所述用户评论加入所述评论队列作为队首评论,并将溢出所述第二阈值的队尾评论进行删除。
步骤S104,将所述用户评论确定为垃圾评论。
为了更进一步理解本发明技术方案,请参阅图2及图3,图2为本发明实施例提供的一种信息处理方法的第一使用状态示意图,图3为本发明实施例提供的一种信息处理方法的第二使用状态示意图。
如图2所示,在某一论坛中,“会飞的老虎”发表了标题为“手机里的传感器”的文章,用户“码农”在该论坛上提交内容为“争取早日再来个雾霾传感器”的用户评论。该论坛的服务器遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值;若是则将所述用户评论确定为垃圾评论;若否则将所述用户评论确定为非垃圾评论,则将所述用户评论加入评论队列,并根据所述第二阈值对所述先进先出队列的队尾评论进行处理。
例如,所述评论队列是先进先出队列且长度具有1000条。
如图3所示,当所述用户评论确定为非垃圾评论时,对评论队列进行更新,将所述用户评论“争取早日再来个雾霾传感器”添加至所述评论队列中作为评论区所显示的队首评论,并将评论时间最早且溢出第1000条的队尾评论“求甲醛传感器。”进行删除。
本发明实施例通过获取用户评论,并遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值,若是,则将所述用户评论确定为垃圾评论;若否,则将所述用户评论加入评论队列,并根据所述第二阈值对所述先进先出队列的队尾评论进行处理。本发明实施例可以有效识别出垃圾评论,并且当用户评论识别为非垃圾评论时,仅需更新评论队列,避免对数据库中的所有内容进行处理,减轻***运行负担,有效提高信息处理效率。
一些实施方式中,在所述获取用户评论之后,还包括:
判断所述用户评论中的评论信息是否存在黑名单库中,若是则将所述用户评论确定为垃圾评论。
一些实施方式中,所述判断所述用户评论中的评论信息是否存在黑名单库中,包括:
判断所述用户评论中是否包含有与黑名单库中的特征信息相匹配的信息,若是则将所述用户评论确定为垃圾评论。
一些实施方式中,当所述用户评论确定为垃圾评论时,检测所述用户评论中是否含有联系方式,若是则将所述联系方式添加到黑名单库中作为特征信息。
一些实施方式中,所述与所述用户评论相似的评论包括与所述用户评论的相似度达到第三阈值的历史评论。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
请参阅图4,图4为本发明实施例提供的一种信息处理方法的另一流程示意图。所述方法包括:
步骤S201,获取用户评论。
例如,如图2所示,在某一论坛中,“会飞的老虎”发表了标题为“手机里的传感器”的文章,用户“码农”在该论坛上提交内容为“争取早日再来个雾霾传感器”的用户评论,该论坛的服务器从后台获取到该用户评论。
步骤S202,判断所述用户评论中的评论信息是否存在黑名单库中。若否,则执行步骤S203;若是,则执行步骤S205。
可以理解的是,所述用户评论中的评论信息可以包括用户名、用户ID、评论内容、评论发布时间等信息。
一些实施方式中,判断所述用户评论中是否包含有与黑名单库中的特征信息相匹配的信息。若是,则执行步骤S205;若否,则执行步骤S203。
目前,很多公共平台支持用户之间的互动行为,所述公共平台的表现形式可以包括电子商务平台、论坛、社区、网站、微博、贴吧、博客、应用下载平台等。比如,当用户在网站上注册并通过认证之后,拥有该网站的用户身份信息,成为该网站的用户,用户可以在网站中展示其用户行为,例如发布文章、发布产品、发微博、发帖、回复评论等,还可以对其他发布的信息进行评论、点赞等。针对上述评论内容,某些用户可能会发布大量内容相同或相近的垃圾评论,例如广告评论,推销评论,含有反动、暴力、色情、超链接、谩骂、诽谤等不良影响的评论。
可以理解的是,可以预先设置黑名单库,所述黑名单库中包含有多个特征信息。
一些实施方式中,所述特征信息包括用户名、用户ID、联系方式、关键字、关键字的谐音中的任意一种或者多种。
可以理解的是,所述联系方式的格式可以为字母和数字的组合,长度超过7个字节。比如电话号码、手机号码、微信号码、QQ号码。
例如,所述关键字可以包括超链接与广告词、违禁词、特殊符号等。
例如,用户提交的用户评论中包含有超链接与广告词,比如包括产品推销、店铺或网站推荐、公司宣传、业务推广等。所述超链接一般以网址形式出现,会出现多个连续英文字母字符,如http://...,将所述“http”字符设置为关键字,可以通过扫描用户评论中的关键字来检测是否含有超链接;若包含有超链接,即认为所述用户评论可能为垃圾评论,则进一步再判断是否包含有广告词。针对广告词,比如将QQ、特价、热卖、淘宝、包邮等词汇设置为所述公告词的关键字,还包括将任意数字与“元”的组合设置为特征信息。当用户评论中包含有所述关键字时,则确定所述用户评论中的评论信息存在黑名单库中,则执行步骤S205。
例如,所述违禁词为含有人身攻击的词汇。
例如,有些用户在提交用户评论时,可能会在关键字或者评论信息的文字中间加入特殊符号,以此避开相关平台的对垃圾评论的检测。因此,可以将“★”、“*”、“#”、“&”等特殊符号设置为关键字,作为特征信息存储到黑名单库中。
例如,用户可能用谐音或者近音代替原来的关键字,以此避开相关平台的对垃圾评论的检测,比如“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”。因此针对上述包含有谐音或者近音的情形,可以将关键字的谐音设置为特征信息存储到黑名单库中。
例如,在某一论坛上用户提交的用户评论为“代开***,加Q(22222211)”,检测到所述用户评论中包含有与黑名单库中的联系方式相匹配的信息,则执行步骤S205。比如,用户提交的用户评论为“深度好文,值得学习。”,检测到所述用户评论中包未含有与黑名单库中的特征信息相匹配的信息,则执行步骤S203。
如图2所示,在某一论坛中,“会飞的老虎”发表了标题为“手机里的传感器”的文章,用户“码农”在该论坛上提交了内容为“争取早日再来个雾霾传感器”的用户评论。当判断用户提交的用户评论中未包含有与黑名单库中的特征信息相匹配的信息时,则执行步骤S203。
请参阅图5,图5为本发明实施例提供的一种信息处理方法的第三使用状态示意图。
在某一论坛中,“会飞的老虎”发表了标题为“手机里的传感器”的文章,用户在该论坛上提交了内容为“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”的用户评论。当判断用户提交的用户评论中包含有与黑名单库中的特征信息相匹配的信息时,则执行步骤S205。
在一些实施方式中,也可是设置白名单库,判断所述用户评论中的评论信息是否存在白名单库中,若是则可以将所述用户评论确定为非垃圾评论;若否则可以将所述用户评论确定为垃圾评论。
例如,针对产品的用户评论,与产品相关的用户评论通常归类为有用信息,因此可以通过筛选与产品描述相关的关联词,比如主题词或者情感词来确实是否为垃圾评论。例如以电子商务平台上发布的产品为例,所述主题词可以是与产品相关的核心名词,可以预先将关于产品标准描述的主题词存储到白名单库中,如果检测到用户针对该产品提交的评论信息中未含有产品标准描述中的任何主题词,则可以将所述用户评论确定为垃圾评论;如果检测到用户针对该产品提交的评论信息中含有产品标准描述中的任意一个或者多个主题词时,则可以将所述用户评论确定为非垃圾评论。
例如,所述情感词包括用户真实意愿的表达自己的主观性看法、态度、感觉、情绪等的情感词汇。比如以对某一网站销售的产品的评价为例,所述产品的评论是人们对产品相关参数及购买体验的评价和议论,人们通过评论可以真实的表达出自己的主观性看法、态度、感觉、情绪等。因此,产品评论必然包含评论者的情感。情感词词数越少,越有可能属于垃圾评论。
步骤S203,遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值;若否,则执行步骤S204;若是,则执行步骤S205。
可以理解的是,可以通过检测评论队列中是否包含有与所述用户评论相同或相似的历史评论,来确定所述评论队列中与所述用户评论相同或者相似的评论数量。例如,当所述用户评论中的评论信息不存在黑名单库中时,所述评论队列中还存在大量与所述用户评论的内容相同或者相似的历史评论,当内容相同或相似的评论信息的评论数量达到某个阈值时,也会妨碍用户对有用信息的获取,实际上,该重复内容的用户评论也可以归为垃圾评论。因此为了更准确的识别出垃圾评论,可进一步检测评论队列中是否包含有与所述用户评论相同或者相似的历史评论,并判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值。其中,所述评论队列为由历史评论组成的先进先出队列。
一些实施方式中,所述与用户评论相似的评论包括与所述用户评论的相似度达到第三阈值的历史评论。可以通过判断所述评论队列中存在的与所述用户评论的相似度达到第三阈值的历史评论的评论数量是否达到第一阈值,来确定所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值。
比如,可以通过比对用户评论与评论队列中的历史评论中所含有的信息的匹配程度来确定出所述相似度的大小。比如,所述第三阈值可以为80%,当用户评论与评论队列中的历史评论中所含有的信息的匹配程度达到90%时,确定为相似;当用户评论与评论队列中的历史评论中所含有的信息的匹配程度达到100%时,确定为相同。
一些实施方式中,所述评论队列可以包括链式队列、数组队列中的任意一种。
可以理解的是,在程序设计语言中,队列是一种线性表,队列的数据元素又称为队列元素。在队列中***一个队列元素称为入队,从队列中删除一个队列元素成为出队。因为队列只允许在一端***,在另一端删除,即最早进入队列的元素才能最先从队列中删除,故队列又称为先进先出(FIFO—first in first out)线性表。因此,所述评论队列可以称为先进先出队列。
例如,队列可以用数组Q[1…m]来存储,数组的上界m即是队列所容许的最大容量。在队列的运算中需设两个指针:head,队首指针,指向实际队首元素;tail,队尾指针,指向实际队尾元素的下一个位置。一般情况下,两个指针的初值设为0,这时队列为空,没有元素。当队列元素的个数达到数组的上界m时,当有新的队列元素入队时,最早进入队列的队列元素从队列中删除。
例如,队列也可以用链表来存储,把数据在数学逻辑上的先后相邻关系用元素的存储地址的指针来指示,以此形成链式队列,可以动态地进行存储分配。
例如,所述评论队列为数组队列,则所述评论队列的长度所具有的第二阈值即为所述数组队列的最大容量,比如为1000条用户评论。
比如,当检测评论队列中包含有与所述用户评论相同的历史评论时,为了避免评论队列中多次出现重复内容的用户评论,进而影响用户的信息获取效率,可以拒绝对评论队列进行更新,并在记录与所述用户评论相同的历史评论的点赞数组上加1,以表示有其他人发表与所述历史评论的内容相同或相似的用户评论,或者表示有其他人赞同所述历史评论的内容。
如图2所示,比如所述第一阈值为5,所述评论队列中与内容为“争取早日再来个雾霾传感器”的用户评论相同的评论数量为1,则判定述评论队列中与所述用户评论相同或者相似的评论数量未达到第一阈值,则执行步骤S204。
如图5所示,比如所述第一阈值为5,所述评论队列中与内容为“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”的用户评论相同的评论数量为7,判定所述评论队列中与所述用户评论相同或者相似的评论数量已达到第一阈值,则执行步骤S205。
步骤S204,将所述用户评论加入所述评论队列作为队首评论,并将溢出所述第二阈值的队尾评论进行删除。
可以理解的是,所述先进先出队列的长度可以预设为第二阈值。所述长度可以用数组队列中的所能容纳的数据包总数来表示,数组在建立之前需提前设置为固定的大小,即为每个队列元素设置一个合适的字节长度,以满足单个队列元素对字节长度的需求,可以理解为每个队列元素代表一个数据包,每个数据包具有固定的大小,比如数组为N[1…1000],则所述第二阈值为1000个。所述先进先出队列的长度也可以用链式队列中的存储单元的指针个数来表示,链表不需要提前分配固定大小的存储空间,当需要存储数据时,可以为每个队列元素设置一个合适的存储单元用于存储数据,并将所述存储单元通过指针与队列中的其他的存储单元链接在一起。所述评论队列的内容是实时变化的,比如,在评论区所展示的区域有新的用户评论入队列时,将所述用户评论添加至评论队列中作为队首评论,作为队尾评论的历史评论则出队列,其他的历史评论的队列编号分别在原来的基础上加1。
如图3所示,所述评论队列中与所述用户评论相同或者相似的评论数量小于第一阈值时,对所述评论队列进行更新,将所述用户评论“争取早日再来个雾霾传感器”添加至所述评论队列的队首No.1,并删除位于所述评论队列的队尾No.1000的历史评论“求甲醛传感器”。原来编号为No.1的历史评论“好文章!点赞”的编号变为No.2,其显示于编号No.2的显示栏位,其余历史评论均向后移动一个显示栏位。
步骤S205,将所述用户评论确定为垃圾评论。
可以理解的是,当确定所述用户评论为垃圾评论时,可以拒绝对评论队列进行更新。
请参阅图6,图6分别为本发明实施例提供的一种信息处理方法的第四使用状态示意图。
当确定所述内容为“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”的用户评论为垃圾评论时,拒绝对评论队列进行更新。
一些实施方式中,在拒绝对评论队列进行更新时,还可以弹出提示框,以提醒用户其评论信息发表失败的提示信息。如图6所示,当用户点“评论”按钮之后,弹出内容为“评论审核未通过:为垃圾评论!”的提示框,同时拒绝对评论队列进行更新,所述手机界面上显示的发表评论的评论区没有变化。
步骤S206,检测所述用户评论中是否含有联系方式,若是则将所述联系方式添加到黑名单库中作为特征信息。
一些实施方式中,当检测到所述用户评论中包含有联系方式时,且所述联系方式为新的联系方式时,将所述用户评论中提取到的新的联系方式新增至所述黑名单库中作为特征信息。当所述联系方式为旧的联系方式时,可以对所述黑名单库中原有的联系方式进行覆盖,或者不添加到所述黑名单库中。
可以理解的是,当所述用户评论中检测到新的联系方式时,提取所述新的联系方式,并新增至所述黑名单库中作为特征信息,以作为下一个用户评论的检测依据。
如图6所示,比如内容为“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”的用户评论为垃圾评论时,提取所述用户评论中的新的联系方式“a5a7a9”,并将“a5a7a9”新增至所述黑名单库中作为特征信息。
本发明实施例通过检测用户评论中是否包含有与黑名单库中的特征信息相匹配的信息,以确定所述用户评论是否为垃圾评论,在所述用户评论为非垃圾评论时,遍历评论队列,且在判断所述评论队列中与所述用户评论相同或者相似的评论数量未达到第一阈值时,将所述用户评论加入所述评论队列作为队首评论,并将溢出所述第二阈值的队尾评论进行删除。本发明实施例在识别出用户提交的用户评论为非垃圾评论时,进一步检测内容重复的历史评论,以此排除避免加入大量重复内容的用户评论,减轻***运行负担,有效提高信息处理效率,提升用户获取有用信息的效率。
本发明实施例还提供一种信息处理装置,如图7所示,图7为本发明实施例提供的一种信息处理装置的结构示意图。所述信息处理装置30包括获取模块31,第一判断模块33,处理模块34,以及确定模块35。
其中,所述获取模块31,用于获取用户评论。
所述第一判断模块33,用于遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值。
所述确定模块35,用于当判断所述评论队列中与所述用户评论相同或者相似的评论数量达到第一阈值时,将所述用户评论确定为垃圾评论。
所述处理模块34,用于当判断所述评论队列中与所述用户评论相同或者相似的评论数量未达到第一阈值时,将所述用户评论加入评论队列,并根据所述第二阈值对所述评论队列的队尾评论进行处理。
请参阅图8,图8为本发明实施例提供的一种信息处理装置的另一结构示意图。所述信息处理装置30包括获取模块31,第二判断模块32,第一判断模块33,处理模块34,确定模块35,以及检测模块36。
其中所述获取模块31,用于获取用户评论。
例如,如图2所示,在某一论坛中,“会飞的老虎”发表了标题为“手机里的传感器”的文章,用户“码农”在该论坛上提交内容为“争取早日再来个雾霾传感器”的用户评论,所述获取模块31获取到该用户评论。
所述第二判断模块32,用于判断所述用户评论中的评论信息是否存在黑名单库中,若是则将所述用户评论确定为垃圾评论。
可以理解的是,所述用户评论中的评论信息可以包括用户名、用户ID、评论内容、评论发布时间等信息。
一些实施方式中,所述第二判断模块32,还用于判断所述用户评论中是否包含有与黑名单库中的特征信息相匹配的信息,若是则将所述用户评论确定为垃圾评论。
目前,很多公共平台支持用户之间的互动行为,所述公共平台的表现形式可以包括电子商务平台、论坛、社区、网站、微博、贴吧、博客、应用下载平台等。比如,当用户在网站上注册并通过认证之后,拥有该网站的用户身份信息,成为该网站的用户,用户可以在网站中展示其用户行为,例如发布文章、发布产品、发微博、发帖、回复评论等,还可以对其他发布的信息进行评论、点赞等。针对上述评论内容,某些用户可能会发布大量内容相同或相近的垃圾评论,例如广告评论,推销评论,含有反动、暴力、色情、超链接、谩骂、诽谤等不良影响的评论。
可以理解的是,可以预先设置黑名单库,所述黑名单库中包含有多个特征信息。
一些实施方式中,所述特征信息包括用户名、用户ID、联系方式、关键字、关键字的谐音中的任意一种或者多种。
可以理解的是,所述联系方式的格式可以为字母和数字的组合,长度超过7个字节。比如电话号码、手机号码、微信号码、QQ号码。
例如,所述关键字可以包括超链接与广告词、违禁词、特殊符号等。
例如,用户提交的用户评论中包含有超链接与广告词,比如包括产品推销、店铺或网站推荐、公司宣传、业务推广等。所述超链接一般以网址形式出现,会出现多个连续英文字母字符,如http://...,将所述“http”字符设置为关键字,可以通过扫描用户评论中的关键字来检测是否含有超链接;若包含有超链接,即认为所述用户评论可能为垃圾评论,则进一步再判断是否包含有广告词。针对广告词,比如将QQ、特价、热卖、淘宝、包邮等词汇设置为所述公告词的关键字,还包括将任意数字与“元”的组合设置为特征信息。当用户评论中包含有所述关键字时,则所述第二判断模块32判定所述用户评论中的评论信息存在黑名单库中,则将所述用户评论确定为垃圾评论。
例如,所述违禁词为含有人身攻击的词汇。
例如,有些用户在提交用户评论时,可能会在关键字或者评论信息的文字中间加入特殊符号,以此避开相关平台的对垃圾评论的检测。因此,可以将“★”、“*”、“#”、“&”等特殊符号设置为关键字,作为特征信息存储到黑名单库中。
例如,用户可能用谐音或者近音代替原来的关键字,以此避开相关平台的对垃圾评论的检测,比如“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”。因此针对上述包含有谐音或者近音的情形,可以将关键字的谐音设置为特征信息存储到黑名单库中。
例如,在某一论坛上用户提交的用户评论为“代开***,加Q(22222211)”,当所述第二判断模块32判定所述用户评论中包含有与黑名单库中的联系方式相匹配的信息时,则将所述用户评论确定为垃圾评论。
如图5所示,在某一论坛中,“会飞的老虎”发表了标题为“手机里的传感器”的文章,用户在该论坛上提交了内容为“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”的用户评论。当所述第二判断模块32判定用户提交的用户评论中包含有与黑名单库中的特征信息相匹配的信息时,将所述用户评论确定为垃圾评论。
在一些实施方式中,也可是设置白名单库。所述第二判断模块32,也可以用于判断所述用户评论中的评论信息是否存在白名单库中,若是则可以将所述用户评论确定为非垃圾评论;若否则可以将所述用户评论确定为垃圾评论。
例如,针对产品的用户评论,与产品相关的用户评论通常归类为有用信息,因此可以通过筛选与产品描述相关的关联词,比如主题词或者情感词来确实是否为垃圾评论。例如以电子商务平台上发布的产品为例,所述主题词可以是与产品相关的核心名词,可以预先将关于产品标准描述的主题词存储到白名单库中,如果检测到用户针对该产品提交的评论信息中未含有产品标准描述中的任何主题词,则可以将所述用户评论确定为垃圾评论;如果检测到用户针对该产品提交的评论信息中含有产品标准描述中的任意一个或者多个主题词时,则可以将所述用户评论确定为非垃圾评论。
例如,所述情感词包括用户真实意愿的表达自己的主观性看法、态度、感觉、情绪等的情感词汇。比如以对某一网站销售的产品的评价为例,所述产品的评论是人们对产品相关参数及购买体验的评价和议论,人们通过评论可以真实的表达出自己的主观性看法、态度、感觉、情绪等。因此,产品评论必然包含评论者的情感。情感词词数越少,越有可能属于垃圾评论。
所述第一判断模块33,用于遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值。
可以理解的是,可以通过检测评论队列中是否包含有与所述用户评论相同或相似的历史评论,来确定所述评论队列中与所述用户评论相同或者相似的评论数量。例如,当所述用户评论中的评论信息不存在黑名单库中时,所述评论队列中还存在大量与所述用户评论的内容相同或者相似的历史评论,当内容相同或相似的评论信息的评论数量达到某个阈值时,也会妨碍用户对有用信息的获取,实际上,该重复内容的用户评论也可以归为垃圾评论。因此为了更准确的识别出垃圾评论,可进一步检测评论队列中是否包含有与所述用户评论相同或者相似的历史评论,并通过所述第一判断模块33判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值。其中,所述评论队列为由历史评论组成的先进先出队列。
一些实施方式中,所述与用户评论相似的评论包括与所述用户评论的相似度达到第三阈值的历史评论。可以通过所述第一判断模块33判断所述评论队列中存在的与所述用户评论的相似度达到第三阈值的历史评论的评论数量是否达到第一阈值,来确定所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值。
比如,可以通过比对用户评论与评论队列中的历史评论中所含有的信息的匹配程度来确定出所述相似度的大小。比如,所述第三阈值可以为80%,当用户评论与评论队列中的历史评论中所含有的信息的匹配程度达到90%时,确定为相似;当用户评论与评论队列中的历史评论中所含有的信息的匹配程度达到100%时,确定为相同。
一些实施方式中,所述评论队列可以包括链式队列、数组队列中的任意一种。
可以理解的是,在程序设计语言中,队列是一种线性表,队列的数据元素又称为队列元素。在队列中***一个队列元素称为入队,从队列中删除一个队列元素成为出队。因为队列只允许在一端***,在另一端删除,即最早进入队列的元素才能最先从队列中删除,故队列又称为先进先出(FIFO—first in first out)线性表。因此,所述评论队列可以称为先进先出队列。
例如,队列可以用数组Q[1…m]来存储,数组的上界m即是队列所容许的最大容量。在队列的运算中需设两个指针:head,队首指针,指向实际队首元素;tail,队尾指针,指向实际队尾元素的下一个位置。一般情况下,两个指针的初值设为0,这时队列为空,没有元素。当队列元素的个数达到数组的上界m时,当有新的队列元素入队时,最早进入队列的队列元素从队列中删除。
例如,队列也可以用链表来存储,把数据在数学逻辑上的先后相邻关系用元素的存储地址的指针来指示,以此形成链式队列,可以动态地进行存储分配。
例如,所述评论队列为数组队列,则所述评论队列的长度所具有的第二阈值即为所述数组队列的最大容量,比如为1000条用户评论。
比如,当检测评论队列中包含有与所述用户评论相同的历史评论时,为了避免评论队列中多次出现重复内容的用户评论,进而影响用户的信息获取效率,可以拒绝对评论队列进行更新,并在记录与所述用户评论相同的历史评论的点赞数组上加1,以表示有其他人发表与所述历史评论的内容相同或相似的用户评论,或者表示有其他人赞同所述历史评论的内容。
如图2所示,比如所述第一阈值为5,所述评论队列中与内容为“争取早日再来个雾霾传感器”的用户评论相同的评论数量为1,则所述第一判断模块33判定述评论队列中与所述用户评论相同或者相似的评论数量未达到第一阈值。
如图5所示,比如所述第一阈值为5,所述评论队列中与内容为“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”的用户评论相同的评论数量为7,所述第一判断模块33判定所述评论队列中与所述用户评论相同或者相似的评论数量已达到第一阈值。
所述处理模块34,用于将所述用户评论加入所述评论队列作为队首评论,并将溢出所述第二阈值的队尾评论进行删除。
可以理解的是,所述先进先出队列的长度可以预设为第二阈值。所述长度可以用数组队列中的所能容纳的数据包总数来表示,数组在建立之前需提前设置为固定的大小,即为每个队列元素设置一个合适的字节长度,以满足单个队列元素对字节长度的需求,可以理解为每个队列元素代表一个数据包,每个数据包具有固定的大小,比如数组为N[1…1000],则所述第二阈值为1000个。所述先进先出队列的长度也可以用链式队列中的存储单元的指针个数来表示,链表不需要提前分配固定大小的存储空间,当需要存储数据时,可以为每个队列元素设置一个合适的存储单元用于存储数据,并将所述存储单元通过指针与队列中的其他的存储单元链接在一起。所述评论队列的内容是实时变化的,比如,在评论区所展示的区域有新的用户评论入队列时,所述处理模块34将所述用户评论添加至评论队列中作为队首评论,作为队尾评论的历史评论则出队列,其他的历史评论的队列编号分别在原来的基础上加1。
如图3所示,所述评论队列中与所述用户评论相同或者相似的评论数量小于第一阈值时,对所述评论队列进行更新,所述处理模块34将所述用户评论“争取早日再来个雾霾传感器”添加至所述评论队列的队首No.1,并删除位于所述评论队列的队尾No.1000的历史评论“求甲醛传感器”。原来编号为No.1的历史评论“好文章!点赞”的编号变为No.2,其显示于编号No.2的显示栏位,其余历史评论均向后移动一个显示栏位。
所述确定模块35,用于当判断所述评论队列中与所述用户评论相同或者相似的评论数量达到第一阈值时,将所述用户评论确定为垃圾评论。
可以理解的是,当所述确定模块35确定所述用户评论为垃圾评论时,所述处理模块34可以拒绝对评论队列进行更新。
如图6所示,当所述确定模块35确定所述内容为“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”的用户评论为垃圾评论时,所述处理模块34拒绝对评论队列进行更新。
一些实施方式中,所述处理模块34在拒绝对评论队列进行更新时,还可以弹出提示框,以提醒用户其评论信息发表失败的提示信息。如图6所示,当用户点“评论”按钮之后,弹出内容为“评论审核未通过:为垃圾评论!”的提示框,同时拒绝对评论队列进行更新,所述手机界面上显示的发表评论的评论区没有变化。
所述检测模块36,用于当所述用户评论确定为垃圾评论时,检测所述用户评论中是否含有联系方式,若是则将所述联系方式添加到黑名单库中作为特征信息。
一些实施方式中,当所述检测模块36检测到所述用户评论中包含有联系方式时,且所述联系方式为新的联系方式时,将所述用户评论中提取到的新的联系方式新增至所述黑名单库中作为特征信息。当所述联系方式为旧的联系方式时,可以对所述黑名单库中原有的联系方式进行覆盖,或者不添加到所述黑名单库中。
可以理解的是,当所述用户评论中检测到新的联系方式时,提取所述新的联系方式,并新增至所述黑名单库中作为特征信息,以作为下一个用户评论的检测依据。
如图6所示,比如内容为“捕鱼达人3逋鱼提线迦魏新a5a7a9课提线”的用户评论为垃圾评论时,提取所述用户评论中的新的联系方式“a5a7a9”,并将“a5a7a9”新增至所述黑名单库中作为特征信息。
本发明实施例还提供一种计算机设备,如图9所示,图9为本发明实施例提供的一种计算机设备的结构示意图。该计算机设备400可以包括射频(RF,Radio Frequency)电路401、包括有一个或一个以上计算机可读存储介质的存储器402、输入单元403、显示单元404、传感器405、音频电路406、无线保真(WiFi,Wireless Fidelity)模块407、包括有一个或者一个以上处理核心的处理器408、以及电源409等部件。本领域技术人员可以理解,图9中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
射频电路401可用于收发信息,或通话过程中信号的接收和发送。
存储器402可用于存储应用程序和数据。存储器402存储的应用程序中包含有计算机程序。
输入单元403可用于接收输入的数字、字符信息或用户特征信息(比如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
显示单元404可用于显示由用户输入的信息或提供给用户的信息以及计算机设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。
计算机设备还可包括至少一种传感器405,比如光传感器、运动传感器以及其他传感器。
音频电路406可通过扬声器、传声器提供用户与计算机设备之间的音频接口。
无线保真(WiFi)模块407可用于短距离无线传输,可以帮助用户收发电子邮件、浏览网站和访问流式媒体等,它为用户提供了无线的宽带互联网访问。
处理器408是计算机设备的控制中心,利用各种接口和线路链接整个计算机设备的各个部分,通过运行或执行存储在存储器402内的应用程序,以及调用存储在存储器402内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。
计算机设备还包括给各个部件供电的电源409(比如电池)。
尽管图9中未示出,计算机设备还可以包括摄像头、蓝牙模块等,在此不再赘述。
具体在本实施例中,计算机设备中的处理器408会按照如下的指令,将一个或一个以上的应用程序的进程对应的计算机程序加载到存储器402中,并由处理器408来运行存储在存储器402中的应用程序,执行如下操作:
获取用户评论;
遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值;
若是,则将所述用户评论确定为垃圾评论;
若否,则将所述用户评论加入评论队列,并根据所述第二阈值对所述评论队列的队尾评论进行处理。
一些实施方式中,处理器408用于所述将所述用户评论加入评论队列,并根据所述第二阈值对所述评论队列的队尾评论进行处理,包括:
将所述用户评论加入所述评论队列作为队首评论,并将溢出所述第二阈值的队尾评论进行删除。
一些实施方式中,处理器408用于在所述获取用户评论之后,还包括:
判断所述用户评论中的评论信息是否存在黑名单库中,若是则将所述用户评论确定为垃圾评论。
一些实施方式中,处理器408用于所述判断所述用户评论中的评论信息是否存在黑名单库中,包括:
判断所述用户评论中是否包含有与黑名单库中的特征信息相匹配的信息,若是则确定所述用户评论中的评论信息存在黑名单库中。
一些实施方式中,处理器408还用于:
当所述用户评论确定为垃圾评论时,检测所述用户评论中是否含有联系方式,若是则将所述联系方式添加到黑名单库中。
一些实施方式中,处理器408用于所述判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,包括:
判断所述评论队列中存在的与所述用户评论的相似度达到第三阈值的历史评论的评论数量是否达到第一阈值,若是则确定所述评论队列中与所述用户评论相同或者相似的评论数量达到第一阈值。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
本发明实施例中,所述信息处理装置与上文实施例中的一种信息处理方法属于同一构思,在所述信息处理装置上可以运行所述信息处理方法实施例中提供的任一方法,其具体实现过程详见所述信息处理方法实施例,此处不再赘述。
需要说明的是,对本发明所述信息处理方法而言,本领域普通测试人员可以理解实现本发明实施例所述信息处理方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,如存储在计算机设备的存储器中,并被该计算机设备内的至少一个处理器执行,在执行过程中可包括如所述信息处理方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)等。
对本发明实施例的所述信息处理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,所述存储介质譬如为只读存储器,磁盘或光盘等。
以上对本发明实施例所提供的一种信息处理方法、装置及计算机设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想;本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例的技术方案的范围。

Claims (13)

1.一种信息处理方法,其特征在于,所述方法包括:
获取用户评论;
遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值;
若是,则将所述用户评论确定为垃圾评论;
若否,则将所述用户评论加入评论队列,并根据所述第二阈值对所述评论队列的队尾评论进行处理。
2.根据权利要求1所述的信息处理方法,其特征在于,所述将所述用户评论加入评论队列,并根据所述第二阈值对所述评论队列的队尾评论进行处理,包括:
将所述用户评论加入所述评论队列作为队首评论,并将溢出所述第二阈值的队尾评论进行删除。
3.根据权利要求1所述的信息处理方法,其特征在于,在所述获取用户评论之后,还包括:
判断所述用户评论中的评论信息是否存在黑名单库中,若是则将所述用户评论确定为垃圾评论。
4.根据权利要求1所述的信息处理方法,其特征在于,所述判断所述用户评论中的评论信息是否存在黑名单库中,包括:
判断所述用户评论中是否包含有与黑名单库中的特征信息相匹配的信息,若是则将所述用户评论确定为垃圾评论。
5.根据权利要求1-4任一项所述的信息处理方法,其特征在于,所述方法还包括:
当所述用户评论确定为垃圾评论时,检测所述用户评论中是否含有联系方式,若是则将所述联系方式添加到黑名单库中作为特征信息。
6.根据权利要求1所述的信息处理方法,其特征在于,所述与用户评论相似的评论包括与所述用户评论的相似度达到第三阈值的历史评论。
7.一种信息处理装置,其特征在于,所述装置包括:
获取模块,用于获取用户评论;
第一判断模块,用于遍历评论队列,判断所述评论队列中与所述用户评论相同或者相似的评论数量是否达到第一阈值,其中所述评论队列是先进先出队列且长度具有第二阈值;
确定模块,用于当判断所述评论队列中与所述用户评论相同或者相似的评论数量达到第一阈值时,将所述用户评论确定为垃圾评论;
处理模块,用于当判断所述评论队列中与所述用户评论相同或者相似的评论数量未达到第一阈值时,将所述用户评论加入评论队列,并根据所述第二阈值对所述评论队列的队尾评论进行处理。
8.根据权利要求7所述的信息处理装置,其特征在于,所述处理模块,用于将所述用户评论加入所述评论队列作为队首评论,并将溢出所述第二阈值的队尾评论进行删除。
9.根据权利要求7所述的信息处理装置,其特征在于,所述装置还包括:
第二判断模块,用于判断所述用户评论中的评论信息是否存在黑名单库中,若是则将所述用户评论确定为垃圾评论。
10.根据权利要求7所述的信息处理装置,其特征在于,所述第二判断模块,用于判断所述用户评论中是否包含有与黑名单库中的特征信息相匹配的信息,若是则将所述用户评论确定为垃圾评论。
11.根据权利要求7-10任一项所述的信息处理装置,其特征在于,所述装置还包括:
检测模块,用于当所述用户评论确定为垃圾评论时,检测所述用户评论中是否含有联系方式,若是则将所述联系方式添加到黑名单库中作为特征信息。
12.根据权利要求7所述的信息处理装置,其特征在于,所述与用户评论相似的评论包括与所述用户评论的相似度达到第三阈值的历史评论。
13.一种计算机设备,包括存储器,处理器及存储在存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器调用所述存储器中存储的所述计算机程序,执行如权利要求1-6任一项所述的信息处理方法。
CN201710026441.2A 2017-01-13 2017-01-13 信息处理方法、装置及计算机设备 Pending CN106777341A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710026441.2A CN106777341A (zh) 2017-01-13 2017-01-13 信息处理方法、装置及计算机设备
PCT/CN2017/107191 WO2018129978A1 (zh) 2017-01-13 2017-10-21 信息处理方法、装置、存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710026441.2A CN106777341A (zh) 2017-01-13 2017-01-13 信息处理方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN106777341A true CN106777341A (zh) 2017-05-31

Family

ID=58945583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710026441.2A Pending CN106777341A (zh) 2017-01-13 2017-01-13 信息处理方法、装置及计算机设备

Country Status (2)

Country Link
CN (1) CN106777341A (zh)
WO (1) WO2018129978A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018129978A1 (zh) * 2017-01-13 2018-07-19 广东欧珀移动通信有限公司 信息处理方法、装置、存储介质及计算机设备
CN109933775A (zh) * 2017-12-15 2019-06-25 腾讯科技(深圳)有限公司 Ugc内容处理方法及装置
CN110020057A (zh) * 2017-12-29 2019-07-16 ***通信集团陕西有限公司 一种垃圾评论信息识别方法及装置
CN110175851A (zh) * 2019-02-28 2019-08-27 腾讯科技(深圳)有限公司 一种作弊行为检测方法及装置
CN112507146A (zh) * 2020-11-27 2021-03-16 北京达佳互联信息技术有限公司 信息处理方法、装置、电子设备及存储介质
CN114245163A (zh) * 2021-12-15 2022-03-25 四川启睿克科技有限公司 一种过滤机器***幕的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241377B (zh) * 2020-01-02 2023-05-26 华数传媒网络有限公司 具备审核功能的现场直播实时评论***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102315953A (zh) * 2010-06-29 2012-01-11 百度在线网络技术(北京)有限公司 基于帖子的出现规律来检测垃圾帖子的方法及设备
CN103226576A (zh) * 2013-04-01 2013-07-31 杭州电子科技大学 基于语义相似度的垃圾评论过滤方法
US20140122584A1 (en) * 2012-10-25 2014-05-01 Google, Inc. Soft posting to social activity streams
CN104869467A (zh) * 2015-03-26 2015-08-26 腾讯科技(北京)有限公司 媒体播放中的信息输出方法、装置和***
CN104933191A (zh) * 2015-07-09 2015-09-23 广东欧珀移动通信有限公司 一种基于贝叶斯算法的垃圾评论识别方法、***及终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159704A (zh) * 2007-10-23 2008-04-09 浙江大学 基于微内容相似度的反垃圾方法
CN104050195B (zh) * 2013-03-15 2017-11-03 暴风集团股份有限公司 一种广告贴处理方法和***
CN106777341A (zh) * 2017-01-13 2017-05-31 广东欧珀移动通信有限公司 信息处理方法、装置及计算机设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102315953A (zh) * 2010-06-29 2012-01-11 百度在线网络技术(北京)有限公司 基于帖子的出现规律来检测垃圾帖子的方法及设备
US20140122584A1 (en) * 2012-10-25 2014-05-01 Google, Inc. Soft posting to social activity streams
CN103226576A (zh) * 2013-04-01 2013-07-31 杭州电子科技大学 基于语义相似度的垃圾评论过滤方法
CN104869467A (zh) * 2015-03-26 2015-08-26 腾讯科技(北京)有限公司 媒体播放中的信息输出方法、装置和***
CN104933191A (zh) * 2015-07-09 2015-09-23 广东欧珀移动通信有限公司 一种基于贝叶斯算法的垃圾评论识别方法、***及终端

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018129978A1 (zh) * 2017-01-13 2018-07-19 广东欧珀移动通信有限公司 信息处理方法、装置、存储介质及计算机设备
CN109933775A (zh) * 2017-12-15 2019-06-25 腾讯科技(深圳)有限公司 Ugc内容处理方法及装置
CN109933775B (zh) * 2017-12-15 2022-02-18 腾讯科技(深圳)有限公司 Ugc内容处理方法及装置
CN110020057A (zh) * 2017-12-29 2019-07-16 ***通信集团陕西有限公司 一种垃圾评论信息识别方法及装置
CN110020057B (zh) * 2017-12-29 2021-05-25 ***通信集团陕西有限公司 一种垃圾评论信息识别方法及装置
CN110175851A (zh) * 2019-02-28 2019-08-27 腾讯科技(深圳)有限公司 一种作弊行为检测方法及装置
CN110175851B (zh) * 2019-02-28 2023-09-12 腾讯科技(深圳)有限公司 一种作弊行为检测方法及装置
CN112507146A (zh) * 2020-11-27 2021-03-16 北京达佳互联信息技术有限公司 信息处理方法、装置、电子设备及存储介质
CN114245163A (zh) * 2021-12-15 2022-03-25 四川启睿克科技有限公司 一种过滤机器***幕的方法

Also Published As

Publication number Publication date
WO2018129978A1 (zh) 2018-07-19

Similar Documents

Publication Publication Date Title
CN106777341A (zh) 信息处理方法、装置及计算机设备
CN108369709B (zh) 用于基于网络的广告数据业务时延减小的***和方法
KR101863981B1 (ko) 텍스트 메시지를 사용하여 스프레드시트와 상호작용하는 기법
CN108537578A (zh) 基于大数据的广告推送方法及装置
US11010687B2 (en) Detecting abusive language using character N-gram features
CN112434501B (zh) 工单智能生成的方法、装置、电子设备及介质
CN108427761B (zh) 一种新闻事件处理的方法、终端、服务器及存储介质
CN102708453A (zh) 提供终端故障解决方案的方法及装置
CN107577755A (zh) 一种搜索方法
US9613339B2 (en) Information exchange in the social network environment
CN111523035B (zh) App浏览内容的推荐方法、装置、服务器和介质
CN107258072A (zh) 聊天软件的对话内容管理方法和***及记录介质
CN110555172A (zh) 用户关系挖掘方法及装置、电子设备和存储介质
CN107807935B (zh) 应用推荐方法及装置
CN106569860A (zh) 一种应用管理方法及终端
CN114726947B (zh) 消息展示方法、装置、用户终端及可读存储介质
CN106557954A (zh) 客服营销的方法及装置
CN106599759A (zh) 一种终端信息处理方法及装置
CN108304374A (zh) 信息处理方法及相关产品
CN110069769A (zh) 应用标签生成方法、装置及存储设备
Dong et al. The impacts of live chat on service–product purchase: Evidence from a large online outsourcing platform
Novo-Loures et al. Enhancing representation in the context of multiple-channel spam filtering
CN108401005A (zh) 一种表情推荐方法和装置
CN103780592A (zh) 一种用户账号被盗确定方法及装置
CN107659647A (zh) 水帖识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 523860 No. 18, Wu Sha Beach Road, Changan Town, Dongguan, Guangdong

Applicant after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

Address before: 523860 No. 18, Wu Sha Beach Road, Changan Town, Dongguan, Guangdong

Applicant before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication