CN106777205A - 游戏类搜索词的搜索方法及装置 - Google Patents

游戏类搜索词的搜索方法及装置 Download PDF

Info

Publication number
CN106777205A
CN106777205A CN201611209248.4A CN201611209248A CN106777205A CN 106777205 A CN106777205 A CN 106777205A CN 201611209248 A CN201611209248 A CN 201611209248A CN 106777205 A CN106777205 A CN 106777205A
Authority
CN
China
Prior art keywords
information
game
ugc
data
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611209248.4A
Other languages
English (en)
Inventor
王艳丽
陈营营
马华蓉
佟思颖
高苏丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201611209248.4A priority Critical patent/CN106777205A/zh
Publication of CN106777205A publication Critical patent/CN106777205A/zh
Priority to PCT/CN2017/117220 priority patent/WO2018113673A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种游戏类搜索词的搜索方法及装置。该方法包括:从存在与N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与N个预设游戏标识相关的数据;对抓取的与N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库;响应用户在搜索引擎上输入的目标搜索词,判断目标搜索词是否为游戏类的搜索词;在判断目标搜索词为游戏类的搜索词的情况下,在从互联网中搜索目标搜索词的同时,在UGC游戏资讯数据库查找与目标搜索词匹配的数据;将与目标搜索词匹配的数据的资讯内容聚合至目标搜索词对应的搜索结果页展现。本发明实施例能够在搜索结果页中聚合UGC游戏类资讯内容,能够提供更多的资讯信息,扩宽内容覆盖面。

Description

游戏类搜索词的搜索方法及装置
技术领域
本发明涉及互联网应用技术领域,特别是一种在游戏类搜索词的搜索方法及装置。
背景技术
随着信息技术的飞速发展,当今社会进入了信息***时代,人们越来越多地借助网络来寻找自己需要的信息,因此,检索成为人们工作、生活不可或缺的一部分。
人们通常使用搜索引擎来进行检索,搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将与用户检索相关的信息展示给用户的***。
现代网络有大量的用户贡献内容,如论坛帖,微信公众号、头条号以及兴趣部落帖子等,这类网站被称为用户原创内容(UGC,User-generated Content)或者专业生产内容(PGC,Professionally-generated Content),在本申请中,这类网站统称为UGC网站。目前,这些UGC网站中也有很多优质资讯,但目前在各家搜索引擎产品中没有充分挖掘UGC网站中的资讯,搜索结果并不能充分包含这些UGC网站中的内容。
发明人在发现本发明的过程中发现,某些优质的UGC网站上的资讯在内容上有它自己的优势,例如,1、数据独家:来源于个人;2、能引起共鸣:类似贴吧,一个好的帖子会有很多人评论;3、与现实搜索结果互补:同一query(搜索词),UGC数据可以补充引擎结果,同时延展阅读性。特别是针对游戏类的query,某些UGC网站的资讯信息更能满足用户的需求。
目前,针对如何为用户提供包括UGC网站上的游戏类资讯信息的搜索结果的问题,还没有有效的解决方案。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的游戏类搜索词的搜索方法及相应的装置。
依据本发明的一方面,提供了一种游戏类搜索词的搜索方法,包括:判断预定的多个用户生成内容UGC网站中是否存在与N个预设游戏标识相关的资讯项,其中,N为整数,且N大于1;根据判断结果,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据;对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,其中,所述UGC游戏资讯数据库中每条数据至少包括:关键词、资讯内容、以及属性;响应用户在搜索引擎上输入的目标搜索词,判断所述目标搜索词是否为游戏类的搜索词;在判断所述目标搜索词为游戏类的搜索词的情况下,在从互联网中搜索所述目标搜索词的同时,在UGC游戏资讯数据库查找与所述目标搜索词匹配的数据;将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现。
可选地,对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,包括:存储抓取的每条数据,并按照所述抓取的每条数据的一个或多个资讯属性进行排序,得到所述UGC游戏资讯数据库。
可选地,所述资讯属性包括:发布时间和/或评论数。
可选地,得到所述UGC游戏资讯数据库之后,所述方法还包括:对于所述UGC游戏资讯数据库中资讯内容包含直播视频的数据项,周期性地检测直播视频是否结束,在检测到直播视频结束的情况下,将对应的数据项从所述UGC游戏资讯库中删除。
可选地,对于专业信息发布平台类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:在所述专业信息发布平台类的UGC网站的搜索框内分别输入所述N个预设游戏标识,从搜索结果中按发布时间抓取所述N个预设游戏标识中各个预设游戏标识相关的资讯信息;或者,在所述专业信息发布平台类的UGC网站发布的资讯信息中标注游戏类资讯,从标注的游戏类资讯中抓取与所述N个预设游戏标识相关的资讯信息。
可选地,对于网络主题社区类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:对于所述N个预设游戏标识中的每个预设游戏标识,在所述网络主题社区类的UGC网站中确定与该预设游戏标识相关的主题社区,从与该预设游戏标识相关的主题社区选择M个主题社区中,从所述M个主题社区中抓取名称title或正文包含该预设游戏标识的资讯信息。
可选地,对于网络问答社区类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:从所述网络问答社区类的UGC网站获取发表问题的类别为游戏类的资讯信息;判断发表问题为游戏类的资讯信息中是否包含所述N个预设游戏标识中的一个或多个,如果有,则抓取该资讯信息作为与所述N个预设游戏标识相关的数据。
可选地,将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页,包括:在所述搜索结果页的左侧展现从互联网上搜索所述目标搜索词的结果;判断所述UGC游戏资讯数据库中与所述目标搜索词匹配的数据中是否有与所述搜索结果页左侧展现的结果中相同的数据,如果有,则将所述相同的数据去除;将去除所述相同的数据后的与目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页的右侧区域。
可选地,将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现,所述方法还包括:统计用户针对所述搜索结果页上展现的与所述目标搜索词匹配的数据的资讯内容的触发操作,得到统计结果;根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容。
可选地,根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容,包括:在所述统计结果为所述触发操作的数量小于指定阈值的情况下,确定在后续搜索请求对应的页面中不再展现与所述目标搜索词匹配的数据的资讯内容。
依据本发明另一个方面,提供了一种游戏类搜索词的搜索装置,包括:第一判断模块,用于判断预定的多个用户生成内容UGC网站中是否存在与N个预设游戏标识相关的资讯项;抓取模块,用于根据判断结果,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据;存储模块,用于对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,其中,所述UGC游戏资讯数据库中每条数据至少包括:关键词、资讯内容、以及属性;响应模块,用于响应用户在搜索引擎上输入的目标搜索词,判断所述目标搜索词是否为游戏类的搜索词;搜索模块,用于在判断所述目标搜索词为游戏类的搜索词的情况下,在从互联网中搜索所述目标搜索词的同时,在UGC游戏资讯数据库查找与所述目标搜索词匹配的数据;展现模块,用于将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现。
可选地,所述存储模块具体用于按照以下方式对抓取的与N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库:存储抓取的每条数据,并按照所述抓取的每条数据的一个或多个资讯属性进行排序,得到所述UGC游戏资讯数据库。
可选地,还包括:更新模块,用于对于所述UGC游戏资讯数据库中资讯内容包含直播视频的数据项,周期性地检测直播视频是否结束,在检测到直播视频结束的情况下,将对应的数据项从所述UGC游戏资讯库中删除。
可选地,对于专业信息发布平台类的UGC网站,所述抓取模块具体用于按照以下方式从存在与N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:在所述专业信息发布平台类的UGC网站的搜索框内分别输入所述N个预设游戏标识,从搜索结果中按发布时间抓取所述N个预设游戏标识中各个游戏标识相关的资讯信息;或者,在所述专业信息发布平台类的UGC网站发布的资讯信息中标注游戏类资讯,从标注的游戏类资讯中抓取与所述N个预设游戏标识相关的资讯信息。
可选地,对于网络主题社区类的UGC网站,所述抓取模块具体用于按照以下方式从存在与N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:对于所述N个预设游戏标识中的每个预设游戏标识,在所述网络主题社区类的UGC网站中确定与该游戏标识相关的主题社区,从与该预设游戏标识相关的主题社区选择M个主题社区中,从所述M个主题社区中抓取名称title或正文包含该预设游戏标识的资讯信息。
可选地,对于网络问答社区类的UGC网站,所述抓取模块具体用于按照以下方式从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:从所述网络问答社区类的UGC网站获取发表问题的类别为游戏类的资讯信息;判断发表问题为游戏类的资讯信息中是否包含所述N个预设游戏标识中的一个或多个,如果有,则抓取该资讯信息作为与所述N个预设游戏标识相关的数据。
可选地,所述展现模块具体用于按照以下方式将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现:在所述搜索结果页的左侧展现从互联网上搜索所述目标搜索词的结果;判断所述UGC游戏资讯数据库中与所述目标搜索词匹配的数据中是否有与所述搜索结果页左侧展现的结果中相同的数据,如果有,则将所述相同的数据去除;将去除所述相同的数据后的与目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页的右侧区域展现。
可选地,还包括:统计模块,用于在将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现给用户之后,统计用户针对所述搜索结果页上展现的与所述目标搜索词匹配的数据的资讯内容的触发操作,得到统计结果;第二判断模块,用于根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容。
可选地,所述第二判断模块具体用于按照以下方式确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容:在所述统计结果为所述触发操作的数量小于指定阈值的情况下,确定在后续搜索请求对应的页面中不再展现与所述目标搜索词匹配的数据的资讯内容。
在本发明实施例中,首先从UGC网站中抓取与预设游戏标识相关的资讯信息,将抓取的资讯信息存储到UGC游戏资讯数据库中,在接收到用户在搜索引擎上输入的与游戏类相关的目标搜索词时,在从互联网中搜索目标搜索词的同时,从UGC游戏资讯数据库中查找与目标搜索词匹配的资讯信息,并将从的UGC游戏资讯数据库中查找到的资讯信息聚合至目标搜索词对应的搜索结果页展现给用户。由此可见,在本发明实施例提供的技术方案中,能够在搜索结果页中聚合UGC网站的游戏类资讯信息,从而可以为用户提供更全面的资讯信息,扩宽内容覆盖面。进一步地,UGC游戏资讯数据库来自各个UGC网站,将各个UGC网站中的数据前置到搜索结果页中进行展现,无需用户通过多次操作去网站查找相关资讯信息,降低了用户的检索成本。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一实施例的游戏类搜索词的搜索方法的流程图;
图2示出了根据本发明另一实施例的聚合有游戏类资讯信息的搜索结果页的示意图;
图3示出了根据本发明一实施例的游戏类搜索词的搜索装置的结构示意图;以及
图4示出了根据本发明另一实施例的游戏类搜索词的搜索装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为解决上述技术问题,本发明实施例提供了一种在搜索结果页中聚合游戏类资讯信息的方法,该方法可以应用在个人电脑、智能手机、平板电脑等终端设备上。图1示出了根据本发明一实施例的在搜索结果页中聚合游戏类资讯信息的方法的流程图。如图1所示,该方法至少可以包括以下步骤S102至步骤S112。
步骤S102,判断预定的多个用户生成内容UGC网站中是否存在与N个预设游戏标识相关的资讯项,其中,N为整数,且N大于1。
在本实施例中,N个预设游戏标识可以是当前热门的N个游戏的名称。
在具体应用中,N个预设游戏标识可以根据预定数据库中各个关键词的点击率和/或搜索率确定。例如,可以为百度风云榜中最靠前的N名游戏名组成所述N个预设游戏标识,其中,N的取值可以根据具体应用确定,在本实施例中并不作限定。
在该步骤中,UGC(User Gernerated Content,用户生产内容),其也被称为UCC(User Created Content,用户创建内容),可以包括用户创作的文字内容,用户拍摄的图片以及用户录制的视频、音频等等。此外,PGC(Professional Generated Content,专业生产内容),它是UGC的衍生概念,UGC的好处是用户可以自由上传内容,丰富网站内容,但不利的方面在于内容的质量良莠不齐。与UGC相比,PGC分类更专业,内容质量也更有保证,其内容设置及产品编辑均非常专业。其实,UGC和PGC两者并不矛盾,不但并行不悖,而且需要相辅相成。一个成熟的互联网内容向产品,不论网站还是社区、视频平台、音频平台、甚至新形态下的媒体,都需要深度和广度两个方面并行。结合自身的特点,UGC负责内容广度,主要贡献流量和参与度,而PGC维持内容深度,主要树立品牌、创造价值,两者缺一不可。由于PGC是UGC的衍生概念,在本发明实施例中不妨将PGC作为UGC的一部分。
在具体应用中,由于UGC提供的内容的质量良莠不齐,本发明实施例为了增加游戏类资讯内容的可信度,在该步骤中从多个UGC网站中抓取游戏类资讯信息时,可以从多个UGC网站中筛选出至少一个优质UGC网站,进而从至少一个优质UGC网站中抓取游戏类资讯信息。
进一步地,在从多个UGC网站中筛选出至少一个优质UGC网站时,可以通过一些衡量因子来筛选。具体地,确定一个或多个衡量因子,根据确定的一个或多个衡量因子衡量出多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。这里的衡量因子可以如网站的可信度、网站上注册的用户数、网站的访问量等等。
当衡量因子包括多个时,在根据多个衡量因子来衡量多个UGC网站的质量情况时,本发明实施例提供了一种可选的方案,在该方案中,可以基于权重策略确定多个衡量因子各自的权重,获取多个UGC网站的多个衡量因子各自的数值;随后将多个UGC网站的多个衡量因子各自的数值与权重进行加权求和,得到综合数值,进而根据多个UGC网站各自的综合数值衡量出多个UGC网站的质量情况。
例如,多个UGC网站为网站1、网站2、网站3、网站4和网站5,多个衡量因子为网站的可信度、网站上注册的用户数、网站的访问量,网站1的多个衡量因子各自的数值分别为p11、p12、p13,网站2的多个衡量因子各自的数值分别为p21、p22、p23,网站3的多个衡量因子各自的数值分别为p31、p32、p33,网站4的多个衡量因子各自的数值分别为p41、p42、p43,网站5的多个衡量因子各自的数值分别为p51、p52、p53。确定多个衡量因子各自的权重为w1、w2、w3,将多个UGC网站的多个衡量因子各自的数值与权重进行加权求和,得到多个UGC网站的综合数值。不妨以网站1和网站2为例,加权求和后网站1的综合数值为p11×w1+p12×w2+p13×w3,网站2的综合数值为p21×w1+p22×w2+p23×w3,网站3、网站4和网站5以此类推,此处不再一一赘述。
在本实施例中,在确定优质UGC网站之后,还可以进一步判断多个优质UGC网站中是否存在有与N个预设游戏标识相关的资讯项,在该步骤中,可以将N个预设游戏标识作为关键词,搜索各个优质UGC网站,如果命中率达到预定值,比如,80%,则将对应的UGC网站作为存在与所述N个预设游戏标识相关的资讯项的UGC网站,即当一个UGC网站中包含有N个预设游戏标识中80%的关键词时,将该UGC网站作为存在与所述N个预设游戏标识相关的资讯项的UGC网站。当然,具体应用中,预定值可以根据实际需要进行设置,具体本实施例不作限定。
步骤S104,根据判断结果,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据;
在本实施例中,可以针对不同类型的UGC网站,采用不同的抓取策略。
例如,在本发明实施例的一个可选实施方案中,对于专业信息发布平台类的UGC网站,例如,头条号、爱奇艺、优酷等视频网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:
在所述专业信息发布平台类的UGC网站的搜索框内分别输入所述N个预设游戏标识,从搜索结果中按发布时间抓取所述N个预设游戏标识中各个预设游戏标识相关的资讯信息;例如,可以在头条号或爱奇艺或优酷等网站的搜索框中分别输入各个预设游戏标识进行搜索,按发布时间抓取各个游戏标识相关的资讯信息;或者,
在所述专业信息发布平台类的UGC网站发布的资讯信息中标注游戏类资讯,从标注的游戏类资讯中抓取与所述N个预设游戏标识相关的资讯信息。例如,可以在头条号上人工标注游戏类的头条号,在这些头条号里进行数据抓取,然后按照抓取的资讯信息的title里包含的人名进行归类。
又例如,在本发明实施例的另一个可选实施方案中,对于网络主题社区类的UGC网站,例如,兴趣部落或豆瓣等,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:对于所述N个预设游戏标识中的每个预设游戏标识,在所述网络主题社区类的UGC网站中确定与该预设游戏标识相关的主题社区,从与该预设游戏标识相关的主题社区选择M个主题社区中,从所述M个主题社区中抓取名称title或正文包含该预设游戏标识的资讯信息。例如,在兴趣部落中,针对各个各个预设游戏标识,例如,“魔兽世界”,先定位目标游戏有多少部落,例如,魔兽社区,然后选择最大部落进行抓取(例如,可以依据关注度),title或文章正文包含关键字(例如,魔兽世界)的资讯信息。
又例如,在本发明实施例的又一个可选实施方案中,对于网络问答社区类的UGC网站,例如,知乎网,
从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:从所述网络问答社区类的UGC网站获取发表问题的类别为游戏类的资讯信息;判断发表问题为游戏类的资讯信息中是否包含所述N个预设游戏标识中的一个或多个,如果有,则抓取该资讯信息作为与所述N个预设游戏标识相关的数据。例如,可以先判断知乎发表问题的类别是否跟游戏有关(例如,问题为:魔兽世界中具有什么样的故事背景),如果有关,则进一步判断该问题及答案中是否包含游戏类预设词表中的游戏类预设词(例如,魔兽世界),如果包含,则抓取该问题及答案作为对应游戏类预设词相关的资讯信息。
步骤S106,对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,其中,所述UGC游戏资讯数据库中每条数据至少包括:关键词、资讯内容、以及属性。
在具体应用中,在执行步骤S106时,优选地,可以存储抓取的每条数据,并按照所述抓取的每条数据的一个或多个资讯属性进行排序,得到所述UGC游戏资讯数据库。
在本实施例的一个可选实施方式中中,在抓取到资讯信息之后,还可以先对抓取的资讯信息按照每条资讯信息相关的游戏类预设词进行分类,生成具有游戏类预设词和资讯信息的资讯属性的结构化的UGC游戏资讯数据库。即,该UGC游戏资讯数据库可以包括三个属性列:预设游戏标识、资讯信息的资讯属性和资讯内容。其中,资讯信息的资讯属性可以包括多项,例如,资讯的发布时间、资讯的评论数等,而资讯内容中可以包括资讯的标题(tittle)及资讯的链接地址。表1为本实施例中UGC游戏资讯数据库的结构的一种示例。
表1
在本发明实施例的一个可选实施方案中,进一步,在步骤S106得到UGC游戏资讯数据库进,还可以根据每条资讯信息的资讯信息的资讯属性进行优化排序。其中,资讯信息的资讯属性可以包括:内容的类型(例如,资讯信息或视频)、发布时间、查看数和/或评论数等,即在UGC游戏资讯数据库可以按照资讯的时效性和/或热度进行排序,以提高后续的搜索效率。
本发明实施例提供了一种可选的方案,在该方案中,可以确定用于对抓取的游戏类资讯信息进行处理的预设游戏标识,进而基于确定的游戏类关键词从抓取的游戏类资讯信息中提取相应的属性内容。在本实施例中,预设游戏标识可以是游戏名、游戏副本名称等等,本发明实施例不限于此。
在本发明实施例的一个可选实施方案中,由于游戏类资讯的特殊性,UGC游戏资讯数据库中包含的资讯内容可能有直播视频,由于直播视频具有一定时效性,为了避免用户检索到不存在的直播视频,在本实施例的一个可选实施方式中,得到所述UGC游戏资讯数据库之后,所述方法还包括:对于所述UGC游戏资讯数据库中资讯内容包含直播视频的数据项,周期性地检测直播视频是否结束,在检测到直播视频结束的情况下,将对应的数据项从所述UGC游戏资讯库中删除。其中,检测周期可以根据实际情况进行设置,例如,1小时或2小时等。
步骤S108,响应用户在搜索引擎上输入的目标搜索词,判断所述目标搜索词是否为游戏类的搜索词,如果是,则执行步骤S110,否则,按照正常的搜索模式进行搜索,只从互联网中搜索所述目标搜索词。;
步骤S110,在从互联网中搜索所述目标搜索词的同时,在UGC游戏资讯数据库查找与所述目标搜索词匹配的数据。
步骤S112,将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现。
在本实施例中,在步骤S110中,在从所述UGC游戏资讯数据库中找到到与所述目标搜索词匹配的直播视频的情况下,在步骤S112中,在向用户展现查找到的所述资讯信息时,如图2所示,可以在所述搜索结果页播放查找到的所述直播视频,并在所述搜索结果页显示查找到的所述资讯信息的文字链接,其中,展现直播视频的画面可以按一定频率与直播画面同步。
在本发明实施例的一个可选实施方案中,如果在从所述UGC游戏资讯数据库中没有查找到与所述目标搜索词匹配的资讯信息的情况下,则在所述目标搜索词对应的搜索结果页展现从互联网搜索到的结果。
在本实施例中,从UGC游戏资讯数据库中查找到的结果可以作为搜索引擎从互联网上进行搜索得到搜索结果的补充,因此,在本发明实施例的一个可选实施方案中,步骤S112可以包括以下步骤:
步骤1,在所述搜索结果页的左侧显示从互联网上搜索所述目标搜索词的结果;
步骤2,判断所述UGC游戏资讯数据库中与所述目标搜索词匹配的数据中是否有与所述搜索结果页左侧展现的结果中相同的数据,如果有,则将所述相同的数据去除;
步骤3,将去除所述相同的数据后的与目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页的右侧区域。即,在上述可选实施方式中,搜索结果页上包括两个区域:左侧区域和右侧区域,在本实施例中,左侧区域用于展现搜索引擎在互联网搜索目标搜索词得到的结果,例如,像现在***、***等搜索引擎的搜索结果页左侧展现的内容,右侧区域用于展现在UGC游戏资讯数据库搜索到的结果,从而可以扩展搜索结果页右侧区域的内容,为用户提供更完整的搜索结果。并且,在该可选实施方式中,左侧和右侧显示的内容没有重合,从而可以保证检索结果的唯一性。
在上述可选实施方式中,为了进一步使得右侧展现的内容能够符合用户的需求,在本发明实施例的一个可选实施方案中,将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现之后,所述方法还包括统计用户针对所述搜索结果页上展现的与所述目标搜索词匹配的数据的资讯内容的触发操作,得到统计结果;根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容。其中,用户针对所述搜索结果页上展现的所述匹配的数据的资讯内容的触发操作可以是展现的所述匹配的数据的资讯内容的CTR(Click To Rate,点击率),即根据UGC游戏资讯数据库中的数据的资讯内容展现后的点击率确定后续在搜索到该条数据的资讯内容时,是否还在搜索页的右侧展现该条数据的资讯内容。
进一步地,在上述可选实施方式中,在根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述匹配的数据的资讯内容时,可以判断所述统计结果是否为所述触发操作的数量小于指定阈值,如果是,则确定在后续搜索请求对应的页面中不再展现所述匹配的数据的资讯内容。
在具体应用中,可以按照指定时间(如1或2小时等)周期判断数据的资讯内容的CTR,并根据判断结果进行相应的处理。
另外,在本实施例中,还可以定期检测抓取的UGC网站中与游戏类预设词表中各个游戏类预设词相关的数据的资讯内容是否为更新,如果有,则抓取新的数据的资讯内容到UGC游戏资讯数据库进行更新,在更新之后,将游戏类资讯内容数据中每条资讯信息的点击率CTR进行清空,即更新之后,再命中UGC游戏资讯数据库中的数据的资讯内容之后,无论该条数据的资讯内容之前的CTR是高还是低,本次都在搜索结果页展现该条数据的资讯内容,并再次统计各条数据的资讯内容的CTR,并在指定时间周期到达之后判断该数据的资讯内容的CTR是否大于阈值,进而判断在后续的检测结果中是否展现该数据的资讯内容。
在本发明实施例中,在接收到用户在搜索引擎上输入的与游戏类相关的目标搜索词时,先判断目标搜索词是否命中预设游戏标识,如果是,则在从UGC网站中抓取的数据组成的结构化的UGC游戏资讯数据库中查找与目标搜索词匹配的数据的资讯内容,并将从结构化的UGC游戏资讯数据库中查找到的数据的资讯内容聚合至目标搜索词对应的搜索结果页展现给用户。由此可见,在本发明实施例提供的技术方案中,能够在搜索结果页中聚合UGC网站的游戏类数据的资讯内容,从而可以为用户提供更全面的数据的资讯内容,扩宽内容覆盖面。并且,由于UGC游戏资讯数据库具有游戏类预设词和数据的资讯内容的资讯属性的结构化特点,具有可读性,能够帮助用户快速地找到需要的信息。进一步地,UGC游戏资讯数据库来自各个UGC网站,将各个UGC网站中的数据前置到搜索结果页中进行展现,无需用户通过多次操作去网站查找相关数据的资讯内容,降低了用户的检索成本。
需要说明的是,实际应用中,上述所有可选实施方式可以采用结合的方式任意组合,形成本发明的可选实施例,在此不再一一赘述。
基于上文各个实施例提供的在搜索结果页中聚合游戏类资讯信息的方法,基于同一发明构思,本发明实施例还提供了一种在搜索结果页中聚合游戏类资讯信息的装置。
图3示出了根据本发明一实施例的游戏搜索词的搜索装置的结构示意图。如图3所示,该装置至少可以包括第一判断模块310、抓取模块320、存储模块330、响应模块340、搜索模块350以及展现模块360。
现介绍本发明实施例的在搜索结果页中聚合游戏类资讯信息的装置的各组成或器件的功能以及各部分间的连接关系:
第一判断模块310,用于判断预定的多个用户生成内容UGC网站中是否存在与N个预设游戏标识相关的资讯项;
抓取模块320,用于根据判断结果,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据;
存储模块330,用于对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,其中,所述UGC游戏资讯数据库中每条数据至少包括:关键词、资讯内容、以及属性;
响应模块340,用于响应用户在搜索引擎上输入的目标搜索词,判断所述目标搜索词是否为游戏类的搜索词
搜索模块350,用于在判断所述目标搜索词为游戏类的搜索词的情况下,在从互联网中搜索所述目标搜索词的同时,在UGC游戏资讯数据库查找与所述目标搜索词匹配的数据;
展现模块360,用于将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现。在本发明实施例的一个可选实施方案中,
所述存储模块330具体用于按照以下方式对抓取的与N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库:
存储抓取的每条数据,并按照所述抓取的每条数据的一个或多个资讯属性进行排序,得到所述UGC游戏资讯数据库。
其中,每条资讯信息的资讯属性可以包括内容发布时间、内容的评论数等,即在UGC游戏资讯数据库可以按照资讯的时效性和/或热度进行排序,以提高搜索效率。
在本发明实施例的一个可选实施方案中,如图4所示,该装置还可以包括:更新模块370,用于对于所述UGC游戏资讯数据库中资讯内容包含直播视频的数据项,周期性地检测直播视频是否结束,在检测到直播视频结束的情况下,将对应的数据项从所述UGC游戏资讯库中删除。通过该可选实施方式,可以保证UGC游戏资讯数据库中的数据的有效性。
另外,在本实施例中,可以针对不同类型的UGC网站,采用不同的抓取策略。
在本发明实施例的一个可选实施方案中对于专业信息发布平台类的UGC网站,所述抓取模块320具体用于按照以下方式从存在与N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:
在所述专业信息发布平台类的UGC网站的搜索框内分别输入所述N个预设游戏标识,从搜索结果中按发布时间抓取所述N个预设游戏标识中各个游戏标识相关的资讯信息;或者,
在所述专业信息发布平台类的UGC网站发布的资讯信息中标注游戏类资讯,从标注的游戏类资讯中抓取与所述N个预设游戏标识相关的资讯信息。
在本发明实施例的一个可选实施方案中,对于网络主题社区类的UGC网站,所述抓取模块320具体用于按照以下方式从存在与N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:
对于所述N个预设游戏标识中的每个预设游戏标识,在所述网络主题社区类的UGC网站中确定与该游戏标识相关的主题社区,从与该预设游戏标识相关的主题社区选择M个主题社区中,从所述M个主题社区中抓取名称title或正文包含该预设游戏标识的资讯信息。例如,在兴趣部落中,针对游戏类预设词表中各个游戏类预设词,例如,魔兽世界,先定位目标游戏有多少部落(例如,魔兽社区),然后选择最大部落进行抓取(例如,可以依据关注度),title或文章正文包含关键字(例如,魔兽)的资讯信息。
在本发明实施例的一个可选实施方案中,对于网络问答社区类的UGC网站,所述抓取模块320具体用于按照以下方式从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:从所述网络问答社区类的UGC网站获取发表问题的类别为游戏类的资讯信息;判断发表问题为游戏类的资讯信息中是否包含所述N个预设游戏标识中的一个或多个,如果有,则抓取该资讯信息作为与所述N个预设游戏标识相关的数据。例如,可以先判断知乎发表问题的类别是否跟娱乐有关,如果有关,则进一步判断该问题及答案中是否包含游戏类预设词表中的游戏类预设词,如果包含,则抓取该问题及答案作为对应游戏类预设词相关的资讯信息。
在本发明实施例的一个可选实施方案中,所述展现模块360具体用于按照以下方式将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现:在所述搜索结果页的左侧展现从互联网上搜索所述目标搜索词的结果;判断所述UGC游戏资讯数据库中与所述目标搜索词匹配的数据中是否有与所述搜索结果页左侧展现的结果中相同的数据,如果有,则将所述相同的数据去除;将去除所述相同的数据后的与目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页的右侧区域展现。
即,在上述可选实施方式中,搜索结果页上包括两个区域:左侧区域和右侧区域,在本实施例中,左侧区域用于展现搜索引擎在互联网搜索目标搜索词得到的结果,例如,像现在***、***等搜索引擎的搜索结果页左侧展现的内容,右侧区域用于展现在UGC游戏资讯数据库搜索到的结果,从而可以扩展搜索结果页右侧区域的内容,为用户提供更完整的搜索结果。
在本发明实施例的一个可选实施方案中,如图4所示,该装置还可以包括:统计模块380,用于在将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现给用户之后,统计用户针对所述搜索结果页上展现的与所述目标搜索词匹配的数据的资讯内容的触发操作,得到统计结果;第二判断模块390,用于根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容。
其中,用户针对所述搜索结果页上展现的所述匹配的资讯信息的触发操作可以是展现的所述匹配的资讯信息的CTR(Click To Rate,点击率),即根据UGC游戏资讯数据库中的资讯信息展现后的点击率确定后续在搜索到该条资讯信息时,是否还在搜索页的右侧展现该条资讯信息。
进一步地,在上述可选实施方式中,所述第二判断模块390具体用于按照以下方式确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容:在所述统计结果为所述触发操作的数量小于指定阈值的情况下,确定在后续搜索请求对应的页面中不再展现与所述目标搜索词匹配的数据的资讯内容。
根据上述任意一个优选实施例或多个优选实施例的组合,本发明实施例能够达到如下有益效果:
在本发明实施例中,首先从UGC网站中抓取预设游戏标识相关的资讯信息,将抓取的资讯信息存储到UGC游戏资讯数据库中,在接收到用户在搜索引擎上输入的与游戏类相关的目标搜索词时,在从互联网中搜索目标搜索词的同时,从UGC游戏资讯数据库中查找与目标搜索词匹配的资讯信息,并将从的UGC游戏资讯数据库中查找到的资讯信息聚合至目标搜索词对应的搜索结果页展现给用户。由此可见,在本发明实施例提供的技术方案中,能够在搜索结果页中聚合UGC网站的游戏类资讯信息,从而可以为用户提供更全面的资讯信息,扩宽内容覆盖面。进一步地,UGC游戏资讯数据库来自各个UGC网站,将各个UGC网站中的数据前置到搜索结果页中进行展现,无需用户通过多次操作去网站查找相关资讯信息,降低了用户的检索成本。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的在搜索结果页中聚合餐饮类资讯信息的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
基于本发明的一个方面,本发明提供了A1、一种游戏类搜索词的搜索方法,包括:
判断预定的多个用户生成内容UGC网站中是否存在与N个预设游戏标识相关的资讯项,其中,N为整数,且N大于1;
根据判断结果,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据;
对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,其中,所述UGC游戏资讯数据库中每条数据至少包括:关键词、资讯内容、以及属性;
响应用户在搜索引擎上输入的目标搜索词,判断所述目标搜索词是否为游戏类的搜索词;
在判断所述目标搜索词为游戏类的搜索词的情况下,在从互联网中搜索所述目标搜索词的同时,在UGC游戏资讯数据库查找与所述目标搜索词匹配的数据;
将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现。
A2、根据A1所述的方法,其中,对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,包括:
存储抓取的每条数据,并按照所述抓取的每条数据的一个或多个资讯属性进行排序,得到所述UGC游戏资讯数据库。
A3、根据A2所述的方法,其中,所述资讯属性包括:发布时间和/或评论数。
A4、根据A1所述的方法,其中,得到所述UGC游戏资讯数据库之后,所述方法还包括:
对于所述UGC游戏资讯数据库中资讯内容包含直播视频的数据项,周期性地检测直播视频是否结束,在检测到直播视频结束的情况下,将对应的数据项从所述UGC游戏资讯库中删除。
A5、根据A1至A4任一项所述的方法,其中,对于专业信息发布平台类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:
在所述专业信息发布平台类的UGC网站的搜索框内分别输入所述N个预设游戏标识,从搜索结果中按发布时间抓取所述N个预设游戏标识中各个预设游戏标识相关的资讯信息;或者,
在所述专业信息发布平台类的UGC网站发布的资讯信息中标注游戏类资讯,从标注的游戏类资讯中抓取与所述N个预设游戏标识相关的资讯信息。
A6、根据A1至A4任一项所述的方法,其中,对于网络主题社区类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:
对于所述N个预设游戏标识中的每个预设游戏标识,在所述网络主题社区类的UGC网站中确定与该预设游戏标识相关的主题社区,从与该预设游戏标识相关的主题社区选择M个主题社区中,从所述M个主题社区中抓取名称title或正文包含该预设游戏标识的资讯信息。
A7、根据A1至A4任一项所述的方法,其中,对于网络问答社区类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:
从所述网络问答社区类的UGC网站获取发表问题的类别为游戏类的资讯信息;
判断发表问题为游戏类的资讯信息中是否包含所述N个预设游戏标识中的一个或多个,如果有,则抓取该资讯信息作为与所述N个预设游戏标识相关的数据。
A8、根据A1至A4任一项所述的方法,其中,将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页,包括:
在所述搜索结果页的左侧展现从互联网上搜索所述目标搜索词的结果;
判断所述UGC游戏资讯数据库中与所述目标搜索词匹配的数据中是否有与所述搜索结果页左侧展现的结果中相同的数据,如果有,则将所述相同的数据去除;
将去除所述相同的数据后的与目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页的右侧区域。
A9、根据A1至A4任一项所述的方法,其中,将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现,所述方法还包括:
统计用户针对所述搜索结果页上展现的与所述目标搜索词匹配的数据的资讯内容的触发操作,得到统计结果;
根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容。
A10、根据A9所述的方法,其中,根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容,包括:
在所述统计结果为所述触发操作的数量小于指定阈值的情况下,确定在后续搜索请求对应的页面中不再展现与所述目标搜索词匹配的数据的资讯内容。
根据本发明的另一个方面,本发明还提供了B11、一种游戏类搜索词的搜索装置,包括:
第一判断模块,用于判断预定的多个用户生成内容UGC网站中是否存在与N个预设游戏标识相关的资讯项;
抓取模块,用于根据判断结果,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据;
存储模块,用于对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,其中,所述UGC游戏资讯数据库中每条数据至少包括:关键词、资讯内容、以及属性;
响应模块,用于响应用户在搜索引擎上输入的目标搜索词,判断所述目标搜索词是否为游戏类的搜索词
搜索模块,用于在判断所述目标搜索词为游戏类的搜索词的情况下,在从互联网中搜索所述目标搜索词的同时,在UGC游戏资讯数据库查找与所述目标搜索词匹配的数据;
展现模块,用于将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现。
B12、根据B11所述的装置,其中,所述存储模块具体用于按照以下方式对抓取的与N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库:
存储抓取的每条数据,并按照所述抓取的每条数据的一个或多个资讯属性进行排序,得到所述UGC游戏资讯数据库。
B13、根据B11所述的装置,其中,还包括:
更新模块,用于对于所述UGC游戏资讯数据库中资讯内容包含直播视频的数据项,周期性地检测直播视频是否结束,在检测到直播视频结束的情况下,将对应的数据项从所述UGC游戏资讯库中删除。
B14、根据B11至13任一项所述的装置,其中,对于专业信息发布平台类的UGC网站,所述抓取模块具体用于按照以下方式从存在与N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:
在所述专业信息发布平台类的UGC网站的搜索框内分别输入所述N个预设游戏标识,从搜索结果中按发布时间抓取所述N个预设游戏标识中各个游戏标识相关的资讯信息;或者,
在所述专业信息发布平台类的UGC网站发布的资讯信息中标注游戏类资讯,从标注的游戏类资讯中抓取与所述N个预设游戏标识相关的资讯信息。
B15、根据B11至B13任一项所述的装置,其中,对于网络主题社区类的UGC网站,所述抓取模块具体用于按照以下方式从存在与N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:
对于所述N个预设游戏标识中的每个预设游戏标识,在所述网络主题社区类的UGC网站中确定与该游戏标识相关的主题社区,从与该预设游戏标识相关的主题社区选择M个主题社区中,从所述M个主题社区中抓取名称title或正文包含该预设游戏标识的资讯信息。
B16、根据B11至B13任一项所述的装置,其中,对于网络问答社区类的UGC网站,所述抓取模块具体用于按照以下方式从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据:
从所述网络问答社区类的UGC网站获取发表问题的类别为游戏类的资讯信息;
判断发表问题为游戏类的资讯信息中是否包含所述N个预设游戏标识中的一个或多个,如果有,则抓取该资讯信息作为与所述N个预设游戏标识相关的数据。
B17、根据B11至B13任一项所述的装置,其中,所述展现模块具体用于按照以下方式将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现:
在所述搜索结果页的左侧展现从互联网上搜索所述目标搜索词的结果;
判断所述UGC游戏资讯数据库中与所述目标搜索词匹配的数据中是否有与所述搜索结果页左侧展现的结果中相同的数据,如果有,则将所述相同的数据去除;
将去除所述相同的数据后的与目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页的右侧区域展现。
B18、根据B11至B13任一项所述的装置,其中,还包括:
统计模块,用于在将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现给用户之后,统计用户针对所述搜索结果页上展现的与所述目标搜索词匹配的数据的资讯内容的触发操作,得到统计结果;
第二判断模块,用于根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容。
B19、根据B18所述的装置,其中,所述第二判断模块具体用于按照以下方式确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容:
在所述统计结果为所述触发操作的数量小于指定阈值的情况下,确定在后续搜索请求对应的页面中不再展现与所述目标搜索词匹配的数据的资讯内容。

Claims (10)

1.一种游戏类搜索词的搜索方法,包括:
判断预定的多个用户生成内容UGC网站中是否存在与N个预设游戏标识相关的资讯项,其中,N为整数,且N大于1;
根据判断结果,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据;
对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,其中,所述UGC游戏资讯数据库中每条数据至少包括:关键词、资讯内容、以及属性;
响应用户在搜索引擎上输入的目标搜索词,判断所述目标搜索词是否为游戏类的搜索词;
在判断所述目标搜索词为游戏类的搜索词的情况下,在从互联网中搜索所述目标搜索词的同时,在UGC游戏资讯数据库查找与所述目标搜索词匹配的数据;
将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现。
2.根据权利要求1所述的方法,其中,对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,包括:
存储抓取的每条数据,并按照所述抓取的每条数据的一个或多个资讯属性进行排序,得到所述UGC游戏资讯数据库。
3.根据权利要求2所述的方法,其中,所述资讯属性包括:发布时间和/或评论数。
4.根据权利要求1所述的方法,其中,得到所述UGC游戏资讯数据库之后,所述方法还包括:
对于所述UGC游戏资讯数据库中资讯内容包含直播视频的数据项,周期性地检测直播视频是否结束,在检测到直播视频结束的情况下,将对应的数据项从所述UGC游戏资讯库中删除。
5.根据权利要求1至4任一项所述的方法,其中,对于专业信息发布平台类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:
在所述专业信息发布平台类的UGC网站的搜索框内分别输入所述N个预设游戏标识,从搜索结果中按发布时间抓取所述N个预设游戏标识中各个预设游戏标识相关的资讯信息;或者,
在所述专业信息发布平台类的UGC网站发布的资讯信息中标注游戏类资讯,从标注的游戏类资讯中抓取与所述N个预设游戏标识相关的资讯信息。
6.根据权利要求1至4任一项所述的方法,其中,对于网络主题社区类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:
对于所述N个预设游戏标识中的每个预设游戏标识,在所述网络主题社区类的UGC网站中确定与该预设游戏标识相关的主题社区,从与该预设游戏标识相关的主题社区选择M个主题社区中,从所述M个主题社区中抓取名称title或正文包含该预设游戏标识的资讯信息。
7.根据权利要求1至4任一项所述的方法,其中,对于网络问答社区类的UGC网站,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据,包括:
从所述网络问答社区类的UGC网站获取发表问题的类别为游戏类的资讯信息;
判断发表问题为游戏类的资讯信息中是否包含所述N个预设游戏标识中的一个或多个,如果有,则抓取该资讯信息作为与所述N个预设游戏标识相关的数据。
8.根据权利要求1至4任一项所述的方法,其中,将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页,包括:
在所述搜索结果页的左侧展现从互联网上搜索所述目标搜索词的结果;
判断所述UGC游戏资讯数据库中与所述目标搜索词匹配的数据中是否有与所述搜索结果页左侧展现的结果中相同的数据,如果有,则将所述相同的数据去除;
将去除所述相同的数据后的与目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页的右侧区域。
9.根据权利要求1至4任一项所述的方法,其中,将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现,所述方法还包括:
统计用户针对所述搜索结果页上展现的与所述目标搜索词匹配的数据的资讯内容的触发操作,得到统计结果;
根据所述统计结果确定在后续搜索请求对应的页面中是否展现与所述目标搜索词匹配的数据的资讯内容。
10.一种游戏类搜索词的搜索装置,包括:
第一判断模块,用于判断预定的多个用户生成内容UGC网站中是否存在与N个预设游戏标识相关的资讯项;
抓取模块,用于根据判断结果,从存在与所述N个预设游戏标识相关的资讯项的一个或多个UGC网站中,抓取与所述N个预设游戏标识相关的数据;
存储模块,用于对抓取的与所述N个预设游戏标识相关的数据进行处理,得到UGC游戏资讯数据库,其中,所述UGC游戏资讯数据库中每条数据至少包括:关键词、资讯内容、以及属性;
响应模块,用于响应用户在搜索引擎上输入的目标搜索词,判断所述目标搜索词是否为游戏类的搜索词
搜索模块,用于在判断所述目标搜索词为游戏类的搜索词的情况下,在从互联网中搜索所述目标搜索词的同时,在UGC游戏资讯数据库查找与所述目标搜索词匹配的数据;
展现模块,用于将与所述目标搜索词匹配的数据的资讯内容聚合至所述目标搜索词对应的搜索结果页展现。
CN201611209248.4A 2016-12-23 2016-12-23 游戏类搜索词的搜索方法及装置 Pending CN106777205A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201611209248.4A CN106777205A (zh) 2016-12-23 2016-12-23 游戏类搜索词的搜索方法及装置
PCT/CN2017/117220 WO2018113673A1 (zh) 2016-12-23 2017-12-19 针对综艺类query的搜索结果的推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611209248.4A CN106777205A (zh) 2016-12-23 2016-12-23 游戏类搜索词的搜索方法及装置

Publications (1)

Publication Number Publication Date
CN106777205A true CN106777205A (zh) 2017-05-31

Family

ID=58920320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611209248.4A Pending CN106777205A (zh) 2016-12-23 2016-12-23 游戏类搜索词的搜索方法及装置

Country Status (1)

Country Link
CN (1) CN106777205A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018113673A1 (zh) * 2016-12-23 2018-06-28 北京奇虎科技有限公司 针对综艺类query的搜索结果的推送方法及装置
CN109874043A (zh) * 2017-12-01 2019-06-11 腾讯科技(深圳)有限公司 视频流发送方法、播放方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034672A (zh) * 2011-09-29 2013-04-10 云壤(北京)信息技术有限公司 社会化搜索***及搜索方法
CN104462364A (zh) * 2014-12-08 2015-03-25 百度在线网络技术(北京)有限公司 搜索推荐方法及装置
CN105354227A (zh) * 2015-09-30 2016-02-24 北京奇虎科技有限公司 基于搜索的提供高质量评论信息的方法及装置
CN105404699A (zh) * 2015-12-29 2016-03-16 广州神马移动信息科技有限公司 一种搜索财经文章的方法、装置及服务器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034672A (zh) * 2011-09-29 2013-04-10 云壤(北京)信息技术有限公司 社会化搜索***及搜索方法
CN104462364A (zh) * 2014-12-08 2015-03-25 百度在线网络技术(北京)有限公司 搜索推荐方法及装置
CN105354227A (zh) * 2015-09-30 2016-02-24 北京奇虎科技有限公司 基于搜索的提供高质量评论信息的方法及装置
CN105404699A (zh) * 2015-12-29 2016-03-16 广州神马移动信息科技有限公司 一种搜索财经文章的方法、装置及服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张玉慧等: ""网络信息检索与利用"", 《网络信息检索与利用》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018113673A1 (zh) * 2016-12-23 2018-06-28 北京奇虎科技有限公司 针对综艺类query的搜索结果的推送方法及装置
CN109874043A (zh) * 2017-12-01 2019-06-11 腾讯科技(深圳)有限公司 视频流发送方法、播放方法及装置
CN109874043B (zh) * 2017-12-01 2021-07-27 腾讯科技(深圳)有限公司 视频流发送方法、播放方法及装置

Similar Documents

Publication Publication Date Title
CN106777206A (zh) 影视剧类关键词搜索展现方法及装置
CN106649738A (zh) 在搜索结果页中聚合人物类资讯信息的方法及装置
WO2017121251A1 (zh) 一种信息推送方法及装置
CN102968413B (zh) 一种用于提供搜索结果的方法与设备
CN103914463B (zh) 一种图片信息的相似性检索方法和装置
CN106776741A (zh) 一种搜索方法和装置
CN109582969A (zh) 实体匹配方法、装置及电子设备
WO2018113673A1 (zh) 针对综艺类query的搜索结果的推送方法及装置
CN104636448B (zh) 一种音乐推荐方法及装置
CN104615631B (zh) 一种信息推荐的方法及装置
CN102521258A (zh) 一种用于提供壁纸图片的方法与设备
CN103631794A (zh) 一种用于对搜索结果进行排序的方法、装置与设备
CN103186666B (zh) 基于收藏进行搜索的方法、装置与设备
CN103744887B (zh) 一种用于人物搜索的方法、装置和计算机设备
CN106649737A (zh) 针对综艺类query的搜索结果的推送方法及装置
CN103955480B (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
CN102682011B (zh) 建立域名描述名称信息表、搜索的方法、装置及***
CN102053960B (zh) 依群需特征构建物联互联双网快准搜索引擎的方法及***
CN106777205A (zh) 游戏类搜索词的搜索方法及装置
CN106681994A (zh) 查询词分类样本自动挖掘以及游戏项目推荐的方法和装置
CN106933864A (zh) 一种搜索引擎***及其搜索方法
JP2013105257A (ja) キーワード取得装置、コンテンツ提供システム、キーワード取得方法、プログラム及びコンテンツ提供方法
CN106919587A (zh) 应用程序搜索***及方法
CN103631793A (zh) 一种用于对搜索结果进行排序的方法、装置与设备
CN106815277A (zh) 搜索引擎优化的评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication