CN102982047B - 一种对互动平台中的互动信息进行作弊检测的方法与设备 - Google Patents

一种对互动平台中的互动信息进行作弊检测的方法与设备 Download PDF

Info

Publication number
CN102982047B
CN102982047B CN201110264206.1A CN201110264206A CN102982047B CN 102982047 B CN102982047 B CN 102982047B CN 201110264206 A CN201110264206 A CN 201110264206A CN 102982047 B CN102982047 B CN 102982047B
Authority
CN
China
Prior art keywords
interactive information
cheating
information
hot word
interactive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110264206.1A
Other languages
English (en)
Other versions
CN102982047A (zh
Inventor
李彦宏
舒迅
陈楚洁
尹佳
周天
徐文涛
方勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201110264206.1A priority Critical patent/CN102982047B/zh
Publication of CN102982047A publication Critical patent/CN102982047A/zh
Application granted granted Critical
Publication of CN102982047B publication Critical patent/CN102982047B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Storage Device Security (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明的目的是提供一种用于对互动平台中的互动信息进行作弊检测的方法与设备,检测设备获取待进行作弊检测的互动信息;检测所述互动信息是否包括热词库中的热词;当所述互动信息包括所述热词,获取所述互动信息的作弊属性信息;根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。与现有技术相比,本发明检测包含有热词的互动信息,根据该互动信息的作弊属性信息,对该互动信息进行作弊检测,优化了互动平台的网络环境,提升了互动平台用户的使用体验。

Description

一种对互动平台中的互动信息进行作弊检测的方法与设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于对互动平台中的互动信息进行作弊检测的技术。
背景技术
伴随着Web2.0的浪潮,各种互动平台例如社区、贴吧、论坛、博客、微博,购物网站等吸引了越来越多的互动平台用户。相应地,利用互动平台进行作弊,引导用户点击进入各种作弊网站的行为也开始激增,影响人们正常使用和浏览互动平台。
因此,如何对互动平台中互动信息进行作弊检测,优化互动平台的网络环境,提升互动平台用户的使用体验,成为本领域技术人员亟需解决的一个问题。
发明内容
本发明的目的是提供一种用于对互动平台中的互动信息进行作弊检测的方法与设备。
根据本发明的一个方面,提供了一种由计算机实现的用于对互动平台中的互动信息进行作弊检测的方法,其中,该方法包括以下步骤:
a获取待进行作弊检测的互动信息;
b检测所述互动信息是否包括热词库中的热词;
c当所述互动信息包括所述热词,获取所述互动信息的作弊属性信息;
d根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。
根据本发明的另一方面,还提供了一种用于对互动平台中的互动信息进行作弊检测的检测设备,其中,该设备包括:
第一获取装置,用于获取待进行作弊检测的互动信息;
第一检测装置,用于检测所述互动信息是否包括热词库中的热词;
第二获取装置,用于当所述互动信息包括所述热词,获取所述互动信息的作弊属性信息;
第二检测装置,用于根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。
与现有技术相比,本发明检测包含有热词的互动信息,根据该互动信息的作弊属性信息,对该互动信息进行作弊检测,优化了互动平台的网络环境,提升了互动平台用户的使用体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于对互动平台中的互动信息进行作弊检测的设备示意图;
图2示出根据本发明一个方面的用于对互动平台中的互动信息进行作弊检测的***拓扑图;
图3示出根据本发明一个优选实施例的用于对互动平台中的互动信息进行作弊检测的设备示意图;
图4示出根据本发明另一个方面的用于对互动平台中的互动信息进行作弊检测的方法流程图;
图5示出根据本发明一个优选实施例的用于对互动平台中的互动信息进行作弊检测的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于对互动平台中的互动信息进行作弊检测的设备示意图;其中,检测设备1包括第一获取装置11、第一检测装置12、第二获取装置13和第二检测装置14。检测设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述检测设备仅为举例,其他现有的或今后可能出现的检测设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
其中,第一获取装置11获取待进行作弊检测的互动信息。具体地,第一获取装置11例如通过互动平台所对应的服务器等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取待进行作弊检测的互动信息;或者,通过页面技术,如ASP、JSP、PHP等页面技术,从用户设备2获取用户通过该用户设备2在互动平台中输入的互动信息,以作为待进行作弊检测的互动信息。例如,第一获取装置11通过调用互动平台所对应的服务器所提供的应用程序接口(API),从该互动平台中获取到待进行作弊检测的互动信息“功夫熊猫2高清在线观看地址”。在此,互动平台包括但不限于论坛、贴吧、博客、微博等形式的互动社区;互动信息包括但不限于论坛发帖、私信、留言等信息。本领域技术人员应能理解上述获取待进行作弊检测的互动信息的方式仅为举例,其他现有的或今后可能出现的获取待进行作弊检测的互动信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述互动平台与互动信息仅为举例,其他现有的或今后可能出现的互动平台或互动信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第一检测装置12检测所述互动信息是否包括热词库中的热词。具体地,第一检测装置12根据第一获取装置11所获取的待进行作弊检测的互动信息,通过切词技术、热词库匹配查询等方式,检测该互动信息是否包括热词库中的热词。在此,所述热词库中包括大量热词,这些热词可以根据大量的用户网络访问操作来获取,该热词库既可以位于检测设备1中,也可以位于与检测设备1通过网络相连接的第三方设备中。例如,第一获取装置11通过与互动平台的交互,获取待进行作弊检测的互动信息“功夫熊猫2高清在线观看地址”;随后,第一检测装置12通过切词技术,将上述待进行作弊检测的互动信息“功夫熊猫2高清在线观看地址”切分成“功夫熊猫”、“2”、“高清”、“在线”、“观看地址”等,并通过热词库匹配查询等方式,检测出该互动信息中包括热词库中的热词“功夫熊猫”、“高清”、“在线”、“观看地址”。本领域技术人员应能理解上述检测互动信息中是否包括热词库中的热词的方式仅为举例,其他现有的或今后可能出现的检测互动信息中是否包括热词库中的热词的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述对互动信息进行切词的方式仅为举例,其他现有的或今后可能出现的对互动信息进行切词的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明通过检测互动信息中是否包括热词,进一步地,可对包括热词的互动信息进行作弊检测,更精确地打击利用热词进行作弊的作弊行为。
当所述互动信息包括所述热词,第二获取装置13获取所述互动信息的作弊属性信息。具体地,当第一检测装置12检测出互动信息包括热词库中的热词时,第二获取装置13通过与互动平台所对应的服务器等第三方设备的交互,获取所述互动信息的作弊属性信息,如该互动信息的内容属性信息、浏览属性信息、该互动信息中出链的链接属性信息等。接上例,第一获取装置11通过与互动平台的交互,获取待进行作弊检测的互动信息“功夫熊猫2高清在线观看地址”;随后,第一检测装置12通过热词库匹配查询等方式,检测出该互动信息中包括热词库中的热词“功夫熊猫”、“高清”、“在线”、“观看地址”;第二获取装置13通过与互动平台所对应的服务器等第三方设备的交互,获取所述互动信息“功夫熊猫2高清在线观看地址”的作弊属性信息,如用户在该互动信息停留的时间、该互动信息中出链的数量、出链所对应的重定向网页与该互动信息的关联度、重定向网页的质量、用户停留时间、权威度等。本领域技术人员应能理解上述获取作弊属性信息的方式仅为举例,其他现有的或今后可能出现的获取作弊属性信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第二检测装置14根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。具体地,第二检测装置14根据第二获取装置13所获取的互动信息的作弊属性信息,如该互动信息的内容属性信息、浏览属性信息、该互动信息中出链的链接属性信息等,对该互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。接上例,第二获取装置13通过与互动平台所对应的服务器等第三方设备的交互,获取包含有热词的互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”的作弊属性信息,如用户停留在该互动信息的用户停留时间、该互动信息中包含的出链的culture.gmw.cn/2011-06/14/content_2086253.htm所对应的重定向网页与该互动信息的关联度等,假设用户停留在该互动信息的用户停留时间小于第二阈值,而重定向网页与该互动信息不相关,则第二检测装置14检测出该互动信息为作弊信息。在此,所述第二阈值为预置时间阈值,用来判断互动信息是否为作弊信息,如当用户停留在互动信息的用户停留时间小于该第二阈值,该互动信息为作弊信息。优选地,第二检测装置14根据第二获取装置13所获取的互动信息的作弊属性信息,如通过根据作弊属性信息为该互动信息打分并结合预设打分阈值等方式,对该互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。本领域技术人员应能理解上述对互动信息进行作弊检测的方式仅为举例,其他现有的或今后可能出现的对互动信息进行作弊检测的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,检测设备1中的各个装置是持续不断工作的。具体地,第一获取装置11获取待进行作弊检测的互动信息;第一检测装置12检测所述互动信息是否包括热词库中的热词;当所述互动信息包括所述热词,第二获取装置13获取所述互动信息的作弊属性信息;第二检测装置14根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,本领域技术人员应理解“持续”是指检测设备1的各装置分别按照设定的或实时调整的工作模式要求进行互动信息的获取、热词的检测、作弊属性信息的获取及作弊检测结果的获得,直至该第一获取装置11在较长时间内停止获取待进行作弊检测的互动信息。
优选地,所述作弊属性信息包括以下至少任一项:
-所述互动信息的内容属性信息;
-所述互动信息的浏览属性信息;
-所述互动信息中出链的链接属性信息。
具体地,当所述作弊属性信息包括所述互动信息的内容属性信息,第二检测装置14根据该互动信息的内容属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,内容属性信息由该互动信息的内容来确定,如该互动信息的内容包括的联系方式(电话号码、QQ、Email等)的数量、该互动信息的内容与该互动信息的主题的关联度等来确定。例如,当互动信息中包括的联系方式的数量大于第一阈值,或者,该互动信息的内容与该互动信息的主题不相关,第二检测装置14检测出该互动信息为作弊信息。在此,所述第一阈值为预置数量阈值,用来判断互动信息是否为作弊信息,如当互动信息中包括的联系方式的数量大于该第一阈值,该互动信息为作弊信息。当所述作弊属性信息包括所述互动信息的浏览属性信息,第二检测装置14根据该互动信息的浏览属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,浏览属性信息根据用户在该互动信息停留的时间、用户的点击数量等确定。例如,当用户停留在互动信息的用户停留时间小于第二阈值,第二检测装置14检测出该互动信息为作弊信息。在此,所述第二阈值为预置时间阈值,用来判断互动信息是否为作弊信息,如当用户停留在互动信息的用户停留时间小于该第二阈值,该互动信息为作弊信息。当所述作弊属性信息包括所述互动信息中出链的链接属性信息,第二检测装置14根据该互动信息中出链的链接属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,出链的链接属性信息由互动信息中出链的数量、出链所对应的域名的陌生度、出链所对应的重定向网页与互动信息的关联度、重定向网页的质量、用户停留时间、权威度等来确定。例如,当该互动信息中出链的数量大于第三阈值,出链所对应的重定向网页与该互动信息不相关、该重定向网页的质量度小于第四阈值、该重定向网页的用户停留时间小于第五阈值、该重定向网页的权威度小于第六阈值等,第二检测装置14检测出该互动信息为作弊信息。在此,所述第三阈值为预置数量阈值,所述第四阈值为预置质量度阈值,所述第五阈值为预置时间阈值,所述第六阈值为预置权威度阈值,用来判断互动信息是否为作弊信息,如当互动信息中出链的数量大于第三阈值、重定向网页的质量度小于第四阈值、重定向网页的用户停留时间小于第五阈值或重定向网页的权威度小于第六阈值,则该互动信息为作弊信息。优选地,第二检测装置14根据该互动信息的上述多个作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。例如,当互动信息中包括的联系方式等与该互动信息的主题不相关的内容的数量大于第一阈值,而用户停留在该互动信息的用户停留时间小于第二阈值,该互动信息的出链所对应的重定向网页与该互动信息不相关,则第二检测装置14检测出该互动信息为作弊信息。本领域技术人员应能理解上述作弊属性信息仅为举例,其他现有的或今后可能出现的作弊属性信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述第二检测装置14根据所述作弊属性信息,确定所述互动信息的作弊度;根据预设的作弊度阈值,基于所述作弊度,确定所述作弊检测结果。具体地,第二检测装置14根据互动信息的作弊属性信息,如根据该互动信息的内容属性信息、浏览属性信息、该互动信息中出链的链接属性信息等作弊属性信息,例如通过打分的方式为该互动信息进行打分,根据该互动信息的打分值,确定该互动信息的作弊度;或者,通过分别根据上述多个作弊属性信息为该互动信息进行打分,获得候选打分值,将各个作弊属性信息所对应的权值,将多个候选打分值进行加权计算,获取该互动信息的打分值,并根据该打分值,确定该作弊属性信息的作弊度;接着,第二检测装置14再将该作弊度跟预设的作弊度阈值进行比较,当互动信息的作弊度达到或超过该作弊度阈值时,确定该互动信息为作弊信息。本领域技术人员应能理解上述确定作弊检测结果的方式仅为举例,其他现有的或今后可能出现的确定作弊检测结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据互动信息的作弊属性信息确定作弊度,再基于作弊度确定互动信息的作弊检测结果,使得对互动信息的作弊检测更为精确。
更优选地,所述第二检测装置14根据所述作弊属性信息,并结合所述热词的热词相关信息,对所述互动信息进行作弊检测,以获得所述作弊检测结果;其中,所述热词相关信息包括以下至少任一项:
-所述热词的热度信息;
-所述热词在所述互动信息中的数量信息;
-所述热词在所述互动信息中的分布信息。
具体地,第二检测装置14根据互动信息的作弊属性信息,通过诸如与热词库的交互或者根据对互动信息的统计分析,获取该互动信息中所包括的热词的热词相关信息,如该热词的热度信息、该热词在该互动信息中的数量信息、分布信息等,并结合上述热词相关信息,对该互动信息进行作弊检测,以获得作弊检测结果。例如,第二检测装置14根据互动信息的作弊属性信息,为该互动信息进行打分,获得该互动信息的第一候选打分值,再结合该互动信息中包括的热词的热词相关信息,为该互动信息进行打分,获得第二候选打分值,通过将上述第一和第二候选打分值进行简单相加或加权计算等方式,获得该互动信息的打分值,并根据该打分值,对该互动信息进行作弊检测,以获得作弊检测结果。在作弊属性信息相同的情况下,当互动信息所包含的热词的热度越高、数量越多、分布越广,则该互动信息的第二候选打分值越大,该互动信息的为作弊信息的概率越高。在此,热词库中存储了热词与热度信息的映射关系,所述热度信息包括但不限于热词的热度、发布规律等,可以通过与互动平台或搜索引擎等第三方设备的交互获得,该热词库既可以位于检测设备1中,也可以位于与该检测设备1通过网络相连接的第三方设备中。在此,所述热词在互动信息中的数量信息、分布信息等可以通过对互动信息的统计分析获得,如根据对互动信息的内容分析,并结合通过与热词库的交互所检测出的热词,统计该互动信息中的热词的数量;又如,根据对互动信息的内容分析,获得热词在该互动信息中的分布位置,如在互动信息的标题中、在互动信息的正文中等。本领域技术人员应能理解上述热词相关信息仅为举例,其他现有的或今后可能出现的热词相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据互动信息的作弊属性信息,并结合该互动信息所包括的热词的热词相关信息,对互动信息进行作弊检测,使得作弊检测更加精确。
优选地,检测设备1还包括更新装置(未示出),该更新装置根据大量的用户网络访问操作,获取候选热词;根据所述候选热词,建立或更新所述热词库。具体地,更新装置通过与搜索引擎等第三方设备的交互,获取大量的用户网络访问操作,如用户搜索查询、点击浏览、发布互动信息等网络访问操作,根据上述网络访问操作,获取候选热词;随后,更新装置通过数据库更新的方式,将候选热词存入该热词库,以建立或更新该热词库。例如,更新装置通过定期挖掘统计社会热点事件,如通过“百度搜索风云榜”获取候选热词,或者,通过统计候选热词在互动平台中出现的频率、数量等,提取出候选热词,接着,通过数据库更新的方式,将候选热词存入该热词库,以建立或更新该热词库。本领域技术人员应能理解上述建立或更新热词库的方式仅为举例,其他现有的或今后可能出现的建立或更新热词库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图2示出根据本发明一个方面的用于对互动平台中的互动信息进行作弊检测的***拓扑图,其中包括检测设备1、与检测设备1经由网络相连接的多个中间设备3以及多个与上述检测设备1或中间设备3经由网络相连接的用户设备2。其中,检测设备1获取用户通过用户设备2或中间设备3提供的待进行作弊检测的互动信息;检测所述互动信息是否包括热词库中的热词;当所述互动信息包括所述热词,获取所述互动信息的作弊属性信息;根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果;根据所述作弊检测结果,对所述互动信息进行后续处理,以获得后续处理的所述互动信息;将所述后续处理的互动信息提供至所述用户,从而改善了互动平台的网络环境,提升了用户的使用体验。在此,网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。
另外,检测设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。中间设备3同样包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。而用户设备2包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或IPTV等。检测设备1与各中间设备3之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。检测设备1与各用户设备2之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。中间设备3与各用户设备2之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。
本领域技术人员应能理解上述检测设备1、用户设备2、中间设备3以及连接其间的网络、通信方式仅为举例,其他现有的或今后可能出现的检测设备、用户设备、中间设备或网络、通信方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员还应能理解,图2中仅为简明起见而示出的各类网络元素的数量可能小于一个实际网络中的数量,但这种省略无疑地是以不会影响对本发明进行清楚、充分的公开为前提的。
为简明起见,下面以一个检测设备1、一个用户设备2为例进行描述。本领域技术人员应能理解,检测设备1可以同时与多个用户设备2或中间设备3交互,获取不同用户通过不同用户设备2或中间设备3提供的待进行作弊检测的互动信息;检测所述互动信息是否包括热词库中的热词;当所述互动信息包括所述热词,获取所述互动信息的作弊属性信息;根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果;根据所述作弊检测结果,对所述互动信息进行后续处理,以获得后续处理的所述互动信息;将所述后续处理的互动信息提供至相对应的用户。
图3示出根据本发明一个优选实施例的用于对互动平台中的互动信息进行作弊检测的设备示意图;检测设备1还包括处理装置15’和提供装置16’,其中,第一获取装置11’、第一检测装置12’、第二获取装置13’和第二检测装置14’与图1中所示对应装置相同或基本相同,此处不再赘述,并通过引用的方式包含于此。
其中,第一获取装置11’获取用户提供的所述互动信息。具体地,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板或手写设备,在互动平台所对应的浏览器软件、应用程序或客户端软件等的输入框中输入互动信息;第一获取装置11’通过页面技术,如ASP、JSP、PHP等页面技术,获取到用户输入的互动信息,以作为待进行作弊检测的互动信息。例如,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板或手写设备,在百度贴吧所对应的浏览器的输入框中输入互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”;第一获取装置11’通过JSP等页面技术获取到用户输入的互动信息,以作为待进行作弊检测的互动信息。本领域技术人员应能理解上述获取用户提供的互动信息的方式仅为举例,其他现有的或今后可能出现的获取用户提供的互动信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
处理装置15’根据所述作弊检测结果,对所述互动信息进行后续处理,以获得后续处理的所述互动信息。具体地,处理装置15’根据第二检测装置14’所检测出的作弊检测结果,对作弊的互动信息进行后续处理,如删除该互动信息、屏蔽该互动信息中所述作弊属性信息所对应的内容等,以获得后续处理的所述互动信息。接上例,第一获取装置11’获取到用户提供的互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”;第一检测装置12’检测出该互动信息包括热词库中的热词;第二获取装置13’获取该互动信息的作弊属性信息为该互动信息中出链所对应的重定向网页与该互动信息不相关;第二检测装置14’根据该作弊属性信息,检测出该互动信息为作弊检测信息;随后,处理装置15’根据该作弊检测结果,对上述互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”进行后续处理,将该互动信息中包括的出链culture.gmw.cn/2011-06/14/content_2086253.htm进行删除,以获得后续处理的互动信息“功夫熊猫2高清在线观看地址”。本领域技术人员应能理解上述对互动信息进行后续处理的方式仅为举例,其他现有的或今后可能出现的对互动信息进行后续处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
提供装置16’将所述后续处理的互动信息提供至所述用户。具体地,提供装置16’根据处理装置15’后续处理的互动信息,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述后续处理的互动信息提供给所述用户设备2,供用户浏览。以屏幕显示为例,提供装置16’将处理装置15’后续处理的互动信息,利用页面技术,如ASP、JSP或PHP等页面技术,提供给用户设备2,供用户进行浏览。接上例,提供装置16’将经处理装置15’后续处理过后的互动信息“功夫熊猫2高清在线观看地址”,通过页面技术,如ASP、JSP或PHP等页面技术,提供给用户设备2,供用户浏览,如当用户浏览其所发表的互动信息时,在该贴吧中只能看到互动信息“功夫熊猫2高清在线观看地址”这部分内容。通过本实施例,可以实现将互动信息的作弊属性信息所对应的内容进行屏蔽,防止互动平台中作弊信息的泛滥,提升互动平台用户的使用体验。本领域技术人员应能理解上述将后续处理的互动信息提供至用户的方式仅为举例,其他现有的或今后可能出现的将后续处理的互动信息提供至用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明将经后续处理的互动信息提供给用户,改善了互动平台的网络环境,提升了用户的使用体验。
优选地,所述处理装置15’中的后续处理包括以下至少任一项:
-删除所述互动信息;
-屏蔽所述互动信息中所述作弊属性信息所对应的内容。
具体地,当所述处理装置15’中的后续处理包括删除所述互动信息,处理装置15’直接将被检测为作弊信息的互动信息进行删除,用户无法进行发表或其发表的为空信息。当所述处理装置15’中的后续处理包括屏蔽所述互动信息中所述作弊属性信息所对应的内容,互动平台用户无法浏览作弊属性信息所对应的内容。本领域技术人员应能理解上述后续处理仅为举例,其他现有的或今后可能出现的后续处理如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述第二检测装置14’根据所述作弊属性信息,并结合所述用户的用户相关信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。具体地,第二检测装置14’根据第二获取装置13’所获取的互动信息的作弊属性信息,并结合该互动信息所对应的用户的用户相关信息,如用户的基本属性、历史发布记录等,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。例如,第二检测装置14’根据互动信息的作弊属性信息,为该互动信息进行打分,获得该互动信息的第一候选打分值,再根据该互动信息所对应的用户的用户相关信息,为该互动信息进行打分,获得第三候选打分值,通过将上述第一和第三候选打分值进行简单相加或加权计算等方式,获得该互动信息的打分值,并根据该打分值,对该互动信息进行作弊检测,以获得作弊检测结果。优选地,第二检测装置14’根据互动信息的作弊属性信息,并结合该互动信息所对应的用户的用户相关信息与该互动信息中包括的热词的热词相关信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,本发明根据互动信息的作弊属性信息,并结合用户的用户相关信息,对所述互动信息进行作弊检测,进一步优化对互动信息的作弊检测行为,使得作弊检测更加精确。
更优选地,所述用户相关信息包括以下至少任一项:
-所述用户的基本属性;
-所述用户的历史发布记录。
具体地,当所述用户相关信息包括用户的基本属性,第二检测装置14’根据第二获取装置13’所获取的互动信息的作弊属性信息,并结合所述用户的基本属性,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,用户的基本属性包括例如该用户是否为版主、该用户是否为新用户、该用户是否为黑名单用户、用户的信用等级等。例如,对具有同样作弊属性信息的同一个互动信息,当该互动信息对应的用户为版主、或该用户的信用等级较高,则该互动信息为作弊信息的可能性较小;而当该互动信息对应的用户为新用户、或该用户为黑名单用户,则该互动信息为作弊信息的可能性较大。当所述用户相关信息包括用户的历史发布记录,第二检测装置14’根据第二获取装置13’所获取的互动信息的作弊属性信息,并结合所述用户的历史发布记录等,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。例如,对具有同样作弊属性信息的同一个互动信息,当该互动信息对应的用户历史发布多个被检测为作弊信息的互动信息,该互动信息为作弊信息的可能性较大。本领域技术人员应能理解上述用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,所述提供装置16’将所述后续处理的互动信息与所述作弊检测结果提供给所述用户。具体地,提供装置16’根据处理装置15’后续处理的互动信息与第二检测装置14’所检测得出的作弊检测结果,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述后续处理的互动信息与作弊检测结果提供给所述用户设备2,供用户浏览。以屏幕显示为例,提供装置16’根据处理装置15’后续处理的互动信息与第二检测装置14’所检测得出的作弊检测结果,利用页面技术,如ASP、JSP或PHP等页面技术,将所述后续处理的互动信息与所述作弊检测结果提供给用户设备2,供用户进行浏览。例如,第一获取装置11’获取到用户提供的互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”;第一检测装置12’检测出该互动信息包括热词库中的热词;第二获取装置13’获取该互动信息的作弊属性信息为该互动信息中出链所对应的重定向网页与该互动信息不相关;第二检测装置14’根据该作弊属性信息,检测出该互动信息为作弊检测信息;随后,处理装置15’根据该作弊检测结果,对上述互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”进行后续处理,将该互动信息中包括的出链culture.gmw.cn/2011-06/14/content_2086253.htm进行删除,以获得后续处理的互动信息“功夫熊猫2高清在线观看地址”;随后,提供装置16’将经处理装置15’后续处理过后的互动信息“功夫熊猫2高清在线观看地址”,和第二检测装置14’得到的作弊检测结果,如“该作弊信息包含作弊内容,已将作弊内容屏蔽”、“该互动信息为作弊信息”等作弊检测结果,通过页面技术,如ASP、JSP或PHP等页面技术,一起提供给用户设备2,供用户浏览。通过本实施例,用户在得到后续处理的互动信息的同时,也可以获知作弊检测结果,帮助用户发表互动信息,提升了用户的使用体验。
图4示出根据本发明另一个方面的用于对互动平台中的互动信息进行作弊检测的方法流程图。检测设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述检测设备仅为举例,其他现有的或今后可能出现的检测设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S1中,检测设备1获取待进行作弊检测的互动信息。具体地,在步骤S 1中,检测设备1例如通过互动平台所对应的服务器等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取待进行作弊检测的互动信息;或者,通过页面技术,如ASP、JSP、PHP等页面技术,从用户设备2获取用户通过该用户设备2在互动平台中输入的互动信息,以作为待进行作弊检测的互动信息。例如,在步骤S 1中,检测设备1通过调用互动平台所对应的服务器所提供的应用程序接口(API),从该互动平台中获取到待进行作弊检测的互动信息“功夫熊猫2高清在线观看地址”。在此,互动平台包括但不限于论坛、贴吧、博客、微博等形式的互动社区;互动信息包括但不限于论坛发帖、私信、留言等信息。本领域技术人员应能理解上述获取待进行作弊检测的互动信息的方式仅为举例,其他现有的或今后可能出现的获取待进行作弊检测的互动信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述互动平台与互动信息仅为举例,其他现有的或今后可能出现的互动平台或互动信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S2中,检测设备1检测所述互动信息是否包括热词库中的热词。具体地,在步骤S1中,检测设备1根据在步骤S1中所获取的待进行作弊检测的互动信息,通过切词技术、热词库匹配查询等方式,检测该互动信息是否包括热词库中的热词。在此,所述热词库中包括大量热词,这些热词可以根据大量的用户网络访问操作来获取,该热词库既可以位于检测设备1中,也可以位于与检测设备1通过网络相连接的第三方设备中。例如,在步骤S1中,检测设备1通过与互动平台的交互,获取待进行作弊检测的互动信息“功夫熊猫2高清在线观看地址”;随后,在步骤S2中,检测设备1通过切词技术,将上述待进行作弊检测的互动信息“功夫熊猫2高清在线观看地址”切分成“功夫熊猫”、“2”、“高清”、“在线”、“观看地址”等,并通过热词库匹配查询等方式,检测出该互动信息中包括热词库中的热词“功夫熊猫”、“高清”、“在线”、“观看地址”。本领域技术人员应能理解上述检测互动信息中是否包括热词库中的热词的方式仅为举例,其他现有的或今后可能出现的检测互动信息中是否包括热词库中的热词的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述对互动信息进行切词的方式仅为举例,其他现有的或今后可能出现的对互动信息进行切词的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明通过检测互动信息中是否包括热词,进一步地,可对包括热词的互动信息进行作弊检测,更精确地打击利用热词进行作弊的作弊行为。
当所述互动信息包括所述热词,在步骤S3中,检测设备1获取所述互动信息的作弊属性信息。具体地,当检测设备1在步骤S2中检测出互动信息包括热词库中的热词时,在步骤S3中,检测设备1通过与互动平台所对应的服务器等第三方设备的交互,获取所述互动信息的作弊属性信息,如该互动信息的内容属性信息、浏览属性信息、该互动信息中出链的链接属性信息等。接上例,在步骤S1中,检测设备1通过与互动平台的交互,获取待进行作弊检测的互动信息“功夫熊猫2高清在线观看地址”;随后,在步骤S2中,检测设备1通过热词库匹配查询等方式,检测出该互动信息中包括热词库中的热词“功夫熊猫”、“高清”、“在线”、“观看地址”;在步骤S3中,检测设备1通过与互动平台所对应的服务器等第三方设备的交互,获取所述互动信息“功夫熊猫2高清在线观看地址”的作弊属性信息,如用户在该互动信息停留的时间、该互动信息中出链的数量、出链所对应的重定向网页与该互动信息的关联度、重定向网页的质量、用户停留时间、权威度等。本领域技术人员应能理解上述获取作弊属性信息的方式仅为举例,其他现有的或今后可能出现的获取作弊属性信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S4中,检测设备1根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。具体地,在步骤S4中,检测设备1根据在步骤S3中所获取的互动信息的作弊属性信息,如该互动信息的内容属性信息、浏览属性信息、该互动信息中出链的链接属性信息等,对该互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。接上例,在步骤S3中,检测设备1通过与互动平台所对应的服务器等第三方设备的交互,获取包含有热词的互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”的作弊属性信息,如用户停留在该互动信息的用户停留时间、该互动信息中包含的出链的culture.gmw.cn/2011-06/14/content_2086253.htm所对应的重定向网页与该互动信息的关联度等,假设用户停留在该互动信息的用户停留时间小于第二阈值,而重定向网页与该互动信息不相关,则在步骤S4中,检测设备1检测出该互动信息为作弊信息。在此,所述第二阈值为预置时间阈值,用来判断互动信息是否为作弊信息,如当用户停留在互动信息的用户停留时间小于该第二阈值,该互动信息为作弊信息。优选地,在步骤S4中,检测设备1根据在步骤S3中所获取的互动信息的作弊属性信息,如通过根据作弊属性信息为该互动信息打分并结合预设打分阈值等方式,对该互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。本领域技术人员应能理解上述对互动信息进行作弊检测的方式仅为举例,其他现有的或今后可能出现的对互动信息进行作弊检测的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,检测设备1中的各个步骤是持续不断工作的。具体地,在步骤S1中,检测设备1获取待进行作弊检测的互动信息;在步骤S2中,检测设备1检测所述互动信息是否包括热词库中的热词;当所述互动信息包括所述热词,在步骤S3中,检测设备1获取所述互动信息的作弊属性信息;在步骤S4中,检测设备1根据所述作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,本领域技术人员应理解“持续”是指检测设备1的各步骤分别按照设定的或实时调整的工作模式要求进行互动信息的获取、热词的检测、作弊属性信息的获取及作弊检测结果的获得,直至该检测设备1在较长时间内停止获取待进行作弊检测的互动信息。
优选地,所述作弊属性信息包括以下至少任一项:
-所述互动信息的内容属性信息;
-所述互动信息的浏览属性信息;
-所述互动信息中出链的链接属性信息。
具体地,当所述作弊属性信息包括所述互动信息的内容属性信息,在步骤S4中,检测设备1根据该互动信息的内容属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,内容属性信息由该互动信息的内容来确定,如该互动信息的内容包括的联系方式(电话号码、QQ、Email等)的数量、该互动信息的内容与该互动信息的主题的关联度等来确定。例如,当互动信息中包括的联系方式的数量大于第一阈值,或者,该互动信息的内容与该互动信息的主题不相关,在步骤S4中,检测设备1检测出该互动信息为作弊信息。在此,所述第一阈值为预置数量阈值,用来判断互动信息是否为作弊信息,如当互动信息中包括的联系方式的数量大于该第一阈值,该互动信息为作弊信息。当所述作弊属性信息包括所述互动信息的浏览属性信息,在步骤S4中,检测设备1根据该互动信息的浏览属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,浏览属性信息根据用户在该互动信息停留的时间、用户的点击数量等确定。例如,当用户停留在互动信息的用户停留时间小于第二阈值,在步骤S4中,检测设备1检测出该互动信息为作弊信息。在此,所述第二阈值为预置时间阈值,用来判断互动信息是否为作弊信息,如当用户停留在互动信息的用户停留时间小于该第二阈值,该互动信息为作弊信息。当所述作弊属性信息包括所述互动信息中出链的链接属性信息,在步骤S4中,检测设备1根据该互动信息中出链的链接属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,出链的链接属性信息由互动信息中出链的数量、出链所对应的域名的陌生度、出链所对应的重定向网页与互动信息的关联度、重定向网页的质量、用户停留时间、权威度等来确定。例如,当该互动信息中出链的数量大于第三阈值,出链所对应的重定向网页与该互动信息不相关、该重定向网页的质量度小于第四阈值、该重定向网页的用户停留时间小于第五阈值、该重定向网页的权威度小于第六阈值等,在步骤S4中,检测设备1检测出该互动信息为作弊信息。在此,所述第三阈值为预置数量阈值,所述第四阈值为预置质量度阈值,所述第五阈值为预置时间阈值,所述第六阈值为预置权威度阈值,用来判断互动信息是否为作弊信息,如当互动信息中出链的数量大于第三阈值、重定向网页的质量度小于第四阈值、重定向网页的用户停留时间小于第五阈值或重定向网页的权威度小于第六阈值,则该互动信息为作弊信息。优选地,在步骤S4中,检测设备1根据该互动信息的上述多个作弊属性信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。例如,当互动信息中包括的联系方式等与该互动信息的主题不相关的内容的数量大于第一阈值,而用户停留在该互动信息的用户停留时间小于第二阈值,该互动信息的出链所对应的重定向网页与该互动信息不相关,则在步骤S4中,检测设备1检测出该互动信息为作弊信息。本领域技术人员应能理解上述作弊属性信息仅为举例,其他现有的或今后可能出现的作弊属性信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,在步骤S4中,检测设备1根据所述作弊属性信息,确定所述互动信息的作弊度;根据预设的作弊度阈值,基于所述作弊度,确定所述作弊检测结果。具体地,在步骤S4中,检测设备1根据互动信息的作弊属性信息,如根据该互动信息的内容属性信息、浏览属性信息、该互动信息中出链的链接属性信息等作弊属性信息,例如通过打分的方式为该互动信息进行打分,根据该互动信息的打分值,确定该互动信息的作弊度;或者,通过分别根据上述多个作弊属性信息为该互动信息进行打分,获得候选打分值,将各个作弊属性信息所对应的权值,将多个候选打分值进行加权计算,获取该互动信息的打分值,并根据该打分值,确定该作弊属性信息的作弊度;接着,在步骤S4中,检测设备1再将该作弊度跟预设的作弊度阈值进行比较,当互动信息的作弊度达到或超过该作弊度阈值时,确定该互动信息为作弊信息。本领域技术人员应能理解上述确定作弊检测结果的方式仅为举例,其他现有的或今后可能出现的确定作弊检测结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据互动信息的作弊属性信息确定作弊度,再基于作弊度确定互动信息的作弊检测结果,使得对互动信息的作弊检测更为精确。
更优选地,在步骤S4中,检测设备1根据所述作弊属性信息,并结合所述热词的热词相关信息,对所述互动信息进行作弊检测,以获得所述作弊检测结果;其中,所述热词相关信息包括以下至少任一项:
-所述热词的热度信息;
-所述热词在所述互动信息中的数量信息;
-所述热词在所述互动信息中的分布信息。
具体地,在步骤S4中,检测设备1根据互动信息的作弊属性信息,通过诸如与热词库的交互或者根据对互动信息的统计分析,获取该互动信息中所包括的热词的热词相关信息,如该热词的热度信息、该热词在该互动信息中的数量信息、分布信息等,并结合上述热词相关信息,对该互动信息进行作弊检测,以获得作弊检测结果。例如,第二检测装置14根据互动信息的作弊属性信息,为该互动信息进行打分,获得该互动信息的第一候选打分值,再结合该互动信息中包括的热词的热词相关信息,为该互动信息进行打分,获得第二候选打分值,通过将上述第一和第二候选打分值进行简单相加或加权计算等方式,获得该互动信息的打分值,并根据该打分值,对该互动信息进行作弊检测,以获得作弊检测结果。在作弊属性信息相同的情况下,当互动信息所包含的热词的热度越高、数量越多、分布越广,则该互动信息的第二候选打分值越大,该互动信息的为作弊信息的概率越高。在此,热词库中存储了热词与热度信息的映射关系,所述热度信息包括但不限于热词的热度、发布规律等,可以通过与互动平台或搜索引擎等第三方设备的交互获得,该热词库既可以位于检测设备1中,也可以位于与该检测设备1通过网络相连接的第三方设备中。在此,所述热词在互动信息中的数量信息、分布信息等可以通过对互动信息的统计分析获得,如根据对互动信息的内容分析,并结合通过与热词库的交互所检测出的热词,统计该互动信息中的热词的数量;又如,根据对互动信息的内容分析,获得热词在该互动信息中的分布位置,如在互动信息的标题中、在互动信息的正文中等。本领域技术人员应能理解上述热词相关信息仅为举例,其他现有的或今后可能出现的热词相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据互动信息的作弊属性信息,并结合该互动信息所包括的热词的热词相关信息,对互动信息进行作弊检测,使得作弊检测更加精确。
优选地,在步骤S7(未示出)中,检测设备1根据大量的用户网络访问操作,获取候选热词;根据所述候选热词,建立或更新所述热词库。具体地,在步骤S7中,检测设备1通过与搜索引擎等第三方设备的交互,获取大量的用户网络访问操作,如用户搜索查询、点击浏览、发布互动信息等网络访问操作,根据上述网络访问操作,获取候选热词;随后,检测设备1通过数据库更新的方式,将候选热词存入该热词库,以建立或更新该热词库。例如,在步骤S7中,检测设备1通过定期挖掘统计社会热点事件,如通过“百度搜索风云榜”获取候选热词,或者,通过统计候选热词在互动平台中出现的频率、数量等,提取出候选热词,接着,通过数据库更新的方式,将候选热词存入该热词库,以建立或更新该热词库。本领域技术人员应能理解上述建立或更新热词库的方式仅为举例,其他现有的或今后可能出现的建立或更新热词库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图5示出根据本发明一个优选实施例的用于对互动平台中的互动信息进行作弊检测的方法流程图;其中,步骤S1’-S4’与图4所示对应步骤S1-S4相同或基本相同,此处不再赘述,并通过引用的方式包含于此。
其中,在步骤S1’中,检测设备1获取用户提供的所述互动信息。具体地,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板或手写设备,在互动平台所对应的浏览器软件、应用程序或客户端软件等的输入框中输入互动信息;在步骤S1’中,检测设备1通过页面技术,如ASP、JSP、PHP等页面技术,获取到用户输入的互动信息,以作为待进行作弊检测的互动信息。例如,用户通过与用户设备2的交互方式,包括但不限于键盘、鼠标、遥控器、触摸板或手写设备,在百度贴吧所对应的浏览器的输入框中输入互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”;在步骤S1’中,检测设备1通过JSP等页面技术获取到用户输入的互动信息,以作为待进行作弊检测的互动信息。本领域技术人员应能理解上述获取用户提供的互动信息的方式仅为举例,其他现有的或今后可能出现的获取用户提供的互动信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S5’中,检测设备1根据所述作弊检测结果,对所述互动信息进行后续处理,以获得后续处理的所述互动信息。具体地,在步骤S5’中,检测设备1根据在步骤S4’中所检测出的作弊检测结果,对作弊的互动信息进行后续处理,如删除该互动信息、屏蔽该互动信息中所述作弊属性信息所对应的内容等,以获得后续处理的所述互动信息。接上例,在步骤S1’中,检测设备1获取到用户提供的互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”;在步骤S2’中,检测设备1检测出该互动信息包括热词库中的热词;在步骤S3’中,检测设备1获取该互动信息的作弊属性信息为该互动信息中出链所对应的重定向网页与该互动信息不相关;在步骤S4’中,检测设备1根据该作弊属性信息,检测出该互动信息为作弊检测信息;随后,在步骤S5’中,检测设备1根据该作弊检测结果,对上述互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”进行后续处理,将该互动信息中包括的出链culture.gmw.cn/2011-06/14/content_2086253.htm进行删除,以获得后续处理的互动信息“功夫熊猫2高清在线观看地址”。本领域技术人员应能理解上述对互动信息进行后续处理的方式仅为举例,其他现有的或今后可能出现的对互动信息进行后续处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S6’中,检测设备1将所述后续处理的互动信息提供至所述用户。具体地,在步骤S6’中,检测设备1根据在步骤S5’中后续处理的互动信息,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述后续处理的互动信息提供给所述用户。以屏幕显示为例,在步骤S6’中,检测设备1将在步骤S5’中后续处理的互动信息,利用页面技术,如ASP、JSP或PHP等页面技术,提供给用户设备2,供用户进行浏览。接上例,在步骤S6’中,检测设备1将经步骤S5’后续处理过后的互动信息“功夫熊猫2高清在线观看地址”,通过页面技术,如ASP、JSP或PHP等页面技术,提供给用户设备2,供用户浏览,如当用户浏览其所发表的互动信息时,在该贴吧中只能看到互动信息“功夫熊猫2高清在线观看地址”这部分内容。通过本实施例,可以实现将互动信息的作弊属性信息所对应的内容进行屏蔽,防止互动平台中作弊信息的泛滥,提升互动平台用户的使用体验。本领域技术人员应能理解上述将后续处理的互动信息提供至用户的方式仅为举例,其他现有的或今后可能出现的将后续处理的互动信息提供至用户的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明将经后续处理的互动信息提供给用户,改善了互动平台的网络环境,提升了用户的使用体验。
优选地,在步骤S5’中的后续处理包括以下至少任一项:
-删除所述互动信息;
-屏蔽所述互动信息中所述作弊属性信息所对应的内容。
具体地,当在所述步骤S5’中的后续处理包括删除所述互动信息,在步骤S5’中,检测设备1直接将被检测为作弊信息的互动信息进行删除,用户无法进行发表或其发表的为空信息。当在所述步骤S5’中的后续处理包括屏蔽所述互动信息中所述作弊属性信息所对应的内容,互动平台用户无法浏览作弊属性信息所对应的内容。本领域技术人员应能理解上述后续处理仅为举例,其他现有的或今后可能出现的后续处理如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,在步骤S4’中,检测设备1根据所述作弊属性信息,并结合所述用户的用户相关信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。具体地,在步骤S4’中,检测设备1根据在步骤S3’中所获取的互动信息的作弊属性信息,并结合该互动信息所对应的用户的用户相关信息,如用户的基本属性、历史发布记录等,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。例如,在步骤S4’中,检测设备1根据互动信息的作弊属性信息,为该互动信息进行打分,获得该互动信息的第一候选打分值,再根据该互动信息所对应的用户的用户相关信息,为该互动信息进行打分,获得第三候选打分值,通过将上述第一和第三候选打分值进行简单相加或加权计算等方式,获得该互动信息的打分值,并根据该打分值,对该互动信息进行作弊检测,以获得作弊检测结果。优选地,在步骤S4’中,检测设备1根据互动信息的作弊属性信息,并结合该互动信息所对应的用户的用户相关信息与该互动信息中包括的热词的热词相关信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,本发明根据互动信息的作弊属性信息,并结合用户的用户相关信息,对所述互动信息进行作弊检测,进一步优化对互动信息的作弊检测行为,使得作弊检测更加精确。
更优选地,所述用户相关信息包括以下至少任一项:
-所述用户的基本属性;
-所述用户的历史发布记录。
具体地,当所述用户相关信息包括用户的基本属性,在步骤S4’中,检测设备1根据在步骤S3’中所获取的互动信息的作弊属性信息,并结合所述用户的基本属性,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。在此,用户的基本属性包括例如该用户是否为版主、该用户是否为新用户、该用户是否为黑名单用户、用户的信用等级等。例如,对具有同样作弊属性信息的同一个互动信息,当该互动信息对应的用户为版主、或该用户的信用等级较高,则该互动信息为作弊信息的可能性较小;而当该互动信息对应的用户为新用户、或该用户为黑名单用户,则该互动信息为作弊信息的可能性较大。当所述用户相关信息包括用户的历史发布记录,在步骤S4’中,检测设备1根据在步骤S3’中所获取的互动信息的作弊属性信息,并结合所述用户的历史发布记录等,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。例如,对具有同样作弊属性信息的同一个互动信息,当该互动信息对应的用户历史发布多个被检测为作弊信息的互动信息,该互动信息为作弊信息的可能性较大。本领域技术人员应能理解上述用户相关信息仅为举例,其他现有的或今后可能出现的用户相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,在步骤S6’中,检测设备1将所述后续处理的互动信息与所述作弊检测结果提供给所述用户。具体地,在步骤S6’中,检测设备1根据经步骤S5’后续处理的互动信息与在步骤S4’中所检测得出的作弊检测结果,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述后续处理的互动信息与作弊检测结果提供给所述用户。以屏幕显示为例,在步骤S6’中,检测设备1根据经步骤S5’后续处理的互动信息与在步骤S4’中所检测得出的作弊检测结果,利用页面技术,如ASP、JSP或PHP等页面技术,将所述后续处理的互动信息与所述作弊检测结果提供给用户设备2,供用户进行浏览。例如,在步骤S1’中,检测设备1获取到用户提供的互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”;在步骤S2’中,检测设备1检测出该互动信息包括热词库中的热词;在步骤S3’中,检测设备1获取该互动信息的作弊属性信息为该互动信息中出链所对应的重定向网页与该互动信息不相关;在步骤S4’中,检测设备1根据该作弊属性信息,检测出该互动信息为作弊检测信息;随后,在步骤S5’中,检测设备1根据该作弊检测结果,对上述互动信息“功夫熊猫2高清在线观看地址culture.gmw.cn/2011-06/14/content_2086253.htm”进行后续处理,将该互动信息中包括的出链culture.gmw.cn/2011-06/14/content_2086253.htm进行删除,以获得后续处理的互动信息“功夫熊猫2高清在线观看地址”;随后,在步骤S6’中,检测设备1将经步骤S5’后续处理过后的互动信息“功夫熊猫2高清在线观看地址”,和在步骤S4’中得到的作弊检测结果,如“该作弊信息包含作弊内容,已将作弊内容屏蔽”、“该互动信息为作弊信息”等作弊检测结果,通过页面技术,如ASP、JSP或PHP等页面技术,一起提供给用户设备2,供用户浏览。通过本实施例,用户在得到后续处理的互动信息的同时,也可以获知作弊检测结果,帮助用户发表互动信息,提升了用户的使用体验。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (18)

1.一种由计算机实现的用于对互动平台中的互动信息进行作弊检测的方法,其中,该方法包括以下步骤:
a获取待进行作弊检测的互动信息;
b检测所述互动信息是否包括热词库中的热词;
c当所述互动信息包括所述热词,获取所述互动信息的作弊属性信息;
d根据所述作弊属性信息,并结合所述热词的热词相关信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果;
其中,所述热词相关信息包括以下至少任一项:
-所述热词的热度信息;
-所述热词在所述互动信息中的数量信息;
-所述热词在所述互动信息中的分布信息。
2.根据权利要求1所述的方法,其中,所述作弊属性信息包括以下至少任一项:
-所述互动信息的内容属性信息;
-所述互动信息的浏览属性信息;
-所述互动信息中出链的链接属性信息。
3.根据权利要求1或2所述的方法,其中,步骤d还包括:
-根据所述作弊属性信息,确定所述互动信息的作弊度;
-根据预设的作弊度阈值,基于所述作弊度,确定所述作弊检测结果。
4.根据权利要求1或2所述的方法,其中,该方法还包括:
-根据大量的用户网络访问操作,获取候选热词;
-根据所述候选热词,建立或更新所述热词库。
5.根据权利要求1或2所述的方法,其中,步骤a还包括:
-获取用户提供的所述互动信息;
其中,该方法还包括以下步骤:
x根据所述作弊检测结果,对所述互动信息进行后续处理,以获得后续处理的互动信息;
y将所述后续处理的互动信息提供至所述用户。
6.根据权利要求5所述的方法,其中,步骤x中的后续处理包括以下至少任一项:
-删除所述互动信息;
-屏蔽所述互动信息中所述作弊属性信息所对应的内容。
7.根据权利要求5所述的方法,其中,步骤d还包括:
-根据所述作弊属性信息,并结合所述用户的用户相关信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。
8.根据权利要求7所述的方法,其中,所述用户相关信息包括以下至少任一项:
-所述用户的基本属性;
-所述用户的历史发布记录。
9.根据权利要求5所述的方法,其中,步骤y还包括:
-将所述后续处理的互动信息与所述作弊检测结果提供给所述用户。
10.一种用于对互动平台中的互动信息进行作弊检测的检测设备,其中,该检测设备包括:
第一获取装置,用于获取待进行作弊检测的互动信息;
第一检测装置,用于检测所述互动信息是否包括热词库中的热词;
第二获取装置,用于当所述互动信息包括所述热词,获取所述互动信息的作弊属性信息;
第二检测装置,用于根据所述作弊属性信息,并结合所述热词的热词相关信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果;
其中,所述热词相关信息包括以下至少任一项:
-所述热词的热度信息;
-所述热词在所述互动信息中的数量信息;
-所述热词在所述互动信息中的分布信息。
11.根据权利要求10所述的检测设备,其中,所述作弊属性信息包括以下至少任一项:
-所述互动信息的内容属性信息;
-所述互动信息的浏览属性信息;
-所述互动信息中出链的链接属性信息。
12.根据权利要求10或11所述的检测设备,其中,所述第二检测装置还用于:
-根据所述作弊属性信息,确定所述互动信息的作弊度;
-根据预设的作弊度阈值,基于所述作弊度,确定所述作弊检测结果。
13.根据权利要求10或11所述的检测设备,其中,该检测设备还包括更新装置,用于:
-根据大量的用户网络访问操作,获取候选热词;
-根据所述候选热词,建立或更新所述热词库。
14.根据权利要求10或11所述的检测设备,其中,所述第一获取装置还用于:
-获取用户提供的所述互动信息;
其中,该检测设备还包括:
处理装置,用于根据所述作弊检测结果,对所述互动信息进行后续处理,以获得后续处理的互动信息;
提供装置,用于将所述后续处理的互动信息提供至所述用户。
15.根据权利要求14所述的检测设备,其中,所述处理装置中的后续处理包括以下至少任一项:
-删除所述互动信息;
-屏蔽所述互动信息中所述作弊属性信息所对应的内容。
16.根据权利要求14所述的检测设备,其中,所述第二检测装置还用于:
-根据所述作弊属性信息,并结合所述用户的用户相关信息,对所述互动信息进行作弊检测,以获得与所述互动信息相对应的作弊检测结果。
17.根据权利要求16所述的检测设备,其中,所述用户相关信息包括以下至少任一项:
-所述用户的基本属性;
-所述用户的历史发布记录。
18.根据权利要求14所述的检测设备,其中,所述提供装置还用于:
-将所述后续处理的互动信息与所述作弊检测结果提供给所述用户。
CN201110264206.1A 2011-09-07 2011-09-07 一种对互动平台中的互动信息进行作弊检测的方法与设备 Active CN102982047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110264206.1A CN102982047B (zh) 2011-09-07 2011-09-07 一种对互动平台中的互动信息进行作弊检测的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110264206.1A CN102982047B (zh) 2011-09-07 2011-09-07 一种对互动平台中的互动信息进行作弊检测的方法与设备

Publications (2)

Publication Number Publication Date
CN102982047A CN102982047A (zh) 2013-03-20
CN102982047B true CN102982047B (zh) 2017-06-06

Family

ID=47856083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110264206.1A Active CN102982047B (zh) 2011-09-07 2011-09-07 一种对互动平台中的互动信息进行作弊检测的方法与设备

Country Status (1)

Country Link
CN (1) CN102982047B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301979B (zh) * 2015-05-27 2020-04-28 腾讯科技(北京)有限公司 检测异常渠道的方法和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093510A (zh) * 2007-07-25 2007-12-26 北京搜狗科技发展有限公司 一种针对网页作弊的反作弊方法及***
CN101393555A (zh) * 2008-09-09 2009-03-25 浙江大学 一种垃圾博客检测方法
CN101510879A (zh) * 2009-03-26 2009-08-19 腾讯科技(深圳)有限公司 一种垃圾内容过滤的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070067282A1 (en) * 2005-09-20 2007-03-22 Microsoft Corporation Domain-based spam-resistant ranking

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093510A (zh) * 2007-07-25 2007-12-26 北京搜狗科技发展有限公司 一种针对网页作弊的反作弊方法及***
CN101393555A (zh) * 2008-09-09 2009-03-25 浙江大学 一种垃圾博客检测方法
CN101510879A (zh) * 2009-03-26 2009-08-19 腾讯科技(深圳)有限公司 一种垃圾内容过滤的方法及装置

Also Published As

Publication number Publication date
CN102982047A (zh) 2013-03-20

Similar Documents

Publication Publication Date Title
CN102968413B (zh) 一种用于提供搜索结果的方法与设备
JP5451810B2 (ja) 検索情報提供装置、検索情報提供方法および検索情報提供プログラム
CN103049452B (zh) 一种基于预估下载率进行应用排序的方法与设备
US10034135B1 (en) Privacy-sensitive methods, systems, and media for geo-social targeting
CN106133774A (zh) 广告中的广告主标识符的自动验证
US8843619B2 (en) System and method for monitoring visits to a target site
US10108918B2 (en) Method and system for inferring risk of data leakage from third-party tags
US20230419360A1 (en) Systems, methods, and media for detecting suspicious activity
JP5985543B2 (ja) 情報集計装置、情報集計方法及び情報集計プログラム
KR102003664B1 (ko) 장애인진로 제안시스템
CN104408133B (zh) 网页链接区域的热力图的显示方法和装置
US20070094335A1 (en) Systems and methods for providing a visual indicator of magnitude
CN102982047B (zh) 一种对互动平台中的互动信息进行作弊检测的方法与设备
CN110035053A (zh) 用于检测欺诈性的用户-内容提供者对的方法和***
JP2002297619A (ja) 広告情報提供システム、広告情報閲覧装置、広告情報閲覧方法及び広告情報閲覧プログラム
JP5693703B2 (ja) 検索情報提供装置、検索情報提供方法および検索情報提供プログラム
US20160275080A1 (en) Determining a user's rank in a social network
US20170374166A1 (en) Procuring feedback
TW202103023A (zh) 資訊處理裝置、資訊處理方法及程式
JP7249316B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP6177819B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN109885777B (zh) 一种信息推荐方法、装置和设备
CN107273384A (zh) 人群属性的确定方法和装置
JP4469061B2 (ja) 通信システム
TWM600439U (zh) 不動產估價系統

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant