CN106156024B - 一种信息处理方法及服务器 - Google Patents

一种信息处理方法及服务器 Download PDF

Info

Publication number
CN106156024B
CN106156024B CN201510129855.9A CN201510129855A CN106156024B CN 106156024 B CN106156024 B CN 106156024B CN 201510129855 A CN201510129855 A CN 201510129855A CN 106156024 B CN106156024 B CN 106156024B
Authority
CN
China
Prior art keywords
data
retrieval
keywords
server
video data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510129855.9A
Other languages
English (en)
Other versions
CN106156024A (zh
Inventor
廖晗成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510129855.9A priority Critical patent/CN106156024B/zh
Publication of CN106156024A publication Critical patent/CN106156024A/zh
Application granted granted Critical
Publication of CN106156024B publication Critical patent/CN106156024B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种信息处理方法及服务器;所述信息处理方法应用于服务器中;所述方法包括:获得第一检索数据;所述第一检索数据为基于用户检索操作的检索结果数据;所述第一检索数据包括:关键字和所述关键字对应的检索结果数量;分析所述第一检索数据,当所述第一检索数据中包括的所述检索结果数量为零时,提取出所述第一检索数据中的关键字生成第二检索数据;输出所述第二检索数据,基于所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息。

Description

一种信息处理方法及服务器
技术领域
本发明涉及互联网技术,具体涉及一种信息处理方法及服务器。
背景技术
本申请发明人在实现本申请实施例技术方案的过程中,至少发现相关技术中存在如下技术问题:
随着互联网技术的发展,出现了一种视频聚合类站点,这种视频聚合类站点会发现及收录当前热门的及新推出的视频并在页面中展现,这种技术被称为视频追新。视频追新通常会采用以下方案实现:一种方案是通过网络爬虫定时访问视频源站点,获取视频源站点的视频列表、视频详情页信息及播放页信息;另一种方案是通过与内容提供商(CP,Content Provider)合作,基于CP提供的接口获取CP提供的视频数据信息。
但是,以上两种方案分别具有一定的缺陷:
第一种方案在访问视频源站点时,需要对视频源站点中的超文本标记语言(HTML,Hyper Text Markup language)页面进行适配。当视频源站点中的页面由于改版或其他原因导致版面发生改变时,则需要对该视频源站点的页面重新进行适配。页面适配的工作量巨大,并且视频聚合类站点需要定时访问多个视频源站点,并且需要监控各个视频源站点的版面是否发生变化等等,需要消耗大量的人力资源。并且视频源站点的视频列表页、视频详情页或播放页通常都有页数限制,即所有的视频往往不能全部在上述视频列表页、视频详情页或播放页上显示,因此,这种方式获取到的视频信息往往不全面。
第二种方案需要基于CP提供的接口获取CP提供的视频信息,这种方案通常是获取到CP提供的视频信息。而CP方往往处于利益的考虑不会提供或延迟提供最新的视频信息。并且CP提供的接口的稳定性及视频数据的质量都取决于CP,因此,视频数据的能否及时获取以及视频数据的质量难以保证。
当视频聚类站点采用上述两种方案中的任一种方案实现视频追新时,如果有这样一种信息处理方案,能够基于用户的检索行为有针对性的获取视频聚类站点中未包括的视频数据信息,使得当用户再一次进入视频聚类站点时能够将先前未检索到的视频数据信息呈现给用户,方便用户的操作,提升用户的视频浏览体验。然而,相关技术中,对于该问题,尚无有效解决方案。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种信息处理方法及服务器,能够及时且全面的获取到用户所需的视频数据。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明提供了一种信息处理方法,所述信息处理方法应用于服务器中;所述方法包括:
获得第一检索数据;所述第一检索数据为基于用户检索操作的检索结果数据;所述第一检索数据包括:关键字和所述关键字对应的检索结果数量;
分析所述第一检索数据,当所述第一检索数据中包括的所述检索结果数量为零时,提取出所述第一检索数据中的关键字生成第二检索数据;
输出所述第二检索数据,基于所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息。
较佳地,所述输出所述第二检索数据之前,所述方法还包括:识别所述第二检索数据,判断所述第二检索数据是否满足第一预定条件,获得判断结果;当所述判断结果为所述第二检索数据满足第一预定条件时,输出所述第二检索数据。
较佳地,所述判断所述第二检索数据是否满足第一预定条件,包括:
判断所述第二检索数据中的关键字是否表征视频数据,获得第一判断结果;
当所述第一判断结果为所述第二检索数据中的关键字表征视频数据时,确定所述第二检索数据满足预定条件。
较佳地,所述获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息之后,所述方法还包括:
在满足第二预定条件时,输出所述视频数据信息。
较佳地,所述判断所述第二检索数据中的关键字是否表征视频数据之前,所述方法还包括:
判断所述第二检索数据中的关键字是否包含非法标识,获得第二判断结果;当所述第二判断结果为所述第二检索数据不包含非法标识时,进一步判断所述第二检索数据中的关键字是否表征视频数据。
本发明又提供了一种服务器,所述服务器包括:获取单元、分析单元、输出单元和通讯单元;其中,
所述获取单元,用于获得第一检索数据;所述第一检索数据为基于用户检索操作的检索结果数据;所述第一检索数据包括:关键字和所述关键字对应的检索结果数量;
所述分析单元,用于分析所述获取单元获得的所述第一检索数据,当所述第一检索数据中包括的所述检索结果数量为零时,提取出所述第一检索数据中的关键字生成第二检索数据;
所述输出单元,用于输出所述第二检索数据;
所述通讯单元,用于基于所述输出单元输出的所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息。
较佳地,所述服务器还包括识别单元,用于识别所述第二检索数据,判断所述第二检索数据是否满足第一预定条件,获得判断结果;当所述判断结果为所述第二检索数据满足第一预定条件时,输出所述第二检索数据。
较佳地,所述识别单元,用于判断所述第二检索数据中的关键字是否表征视频数据,获得第一判断结果;当所述第一判断结果为所述第二检索数据中的关键字表征视频数据时,确定所述第二检索数据满足预定条件。
较佳地,所述输出单元,还用于获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息之后,在满足第二预定条件时,输出所述视频数据信息。
较佳地,所述识别单元,还用于判断所述第二检索数据中的关键字是否表征视频数据之前,判断所述第二检索数据中的关键字是否包含非法标识,获得第二判断结果;当所述第二判断结果为所述第二检索数据不包含非法标识时,进一步判断所述第二检索数据中的关键字是否表征视频数据。
本发明实施例提供的信息处理方法及服务器,所述信息处理方法应用于服务器中;所述方法包括:获得第一检索数据;所述第一检索数据为基于用户检索操作的检索结果数据;所述第一检索数据包括:关键字和所述关键字对应的检索结果数量;分析所述第一检索数据,当所述第一检索数据中包括的所述检索结果数量为零时,提取出所述第一检索数据中的关键字生成第二检索数据;输出所述第二检索数据,基于所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息。如此,当视频聚类站点采用网络爬虫定时访问视频源站点获取视频数据信息或基于CP提供的接口获取CP提供的视频数据信息实现视频追新时,本发明实施例能够基于用户检索操作的检索结果数据进行视频数据信息的获取,也即通过用户的检索行为有针对性的获取服务器中未包括的视频数据信息,从而弥补了采用网络爬虫定时访问视频源站点获取视频数据信息不全面的问题,并且也无需使用大量人力资源进行页面适配,大大节省了人力资源;而且,本发明实施例也弥补了基于CP提供的接口获取CP提供的视频数据信息所导致的不及时和数据质量难以保证的问题。并且,本发明实施例的技术方案基于用户的检索行为有针对性的获取服务器中未包括的视频数据信息,使得当用户再一次进入视频聚类站点时能够将先前未检索到的视频数据信息呈现给用户,方便用户的操作,提升了用户的视频浏览体验。
附图说明
图1为本发明实施例一的信息处理方法的流程示意图;
图2为本发明实施例中的第一界面呈现示意图;
图3为本发明实施例的信息处理方法应用的***架构示意图;
图4为本发明实施例二的服务器的组成结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细的说明。
实施例一
本发明实施例提供了一种信息处理方法,所述信息处理方法应用于服务器中。图1为本发明实施例一的信息处理方法的流程示意图;如图1所示,所述信息处理方法包括:
步骤101:获得第一检索数据;所述第一检索数据为基于用户检索操作的检索结果数据;所述第一检索数据包括:关键字和所述关键字对应的检索结果数量。
本实施例提供的信息处理方法可应用于以下场景:用户进入视频聚类站点,在所述视频聚类站点中检索想要观看的视频数据。图2为本发明实施例中的第一界面呈现示意图,所述第一界面为用户侧的检索界面;如图2所示,用户进入视频聚类站点,可在所述视频聚类站点的检索框中输入想要观看的视频的关键字,本实施例中,所述视频聚类站点不限于网页类型或专属客户端,所述网页类型的视频聚类站点例如网页版的QQ视频,而专属客户端可如移动终端中的QQ视频客户端。因此,本实施例所述的信息处理方法应用于服务器中,所述服务器可以是网页服务器或视频客户端的专属服务器。用户触发视频数据检索使用的客户端可以是台式电脑、笔记本电脑、智能手机、平板电脑等各种终端设备。
这里,当用户在如图2所示的检索框中输入关键字进行检索时,所述服务器可根据自身资源信息返回检索结果,所述检索结果包括检索结果数量,例如检索到视频数为N个,N为正整数;当然,所述检索结果也可以如图2所示“没有找到XXXXX相关视频”,也即检索到的视频数为零。其中,具体的,所述检索结果数量可以包括长视频检索结果数量和短视频检索结果数量;其中,所述长视频包括电影视频、电视剧视频、动漫视频或综艺视频等视频聚类站点中具有版权的视频,所述长视频通常具有互联网电影资料库(IMDB,Internet MovieDatabase)编码;所述短视频通常为用户生成内容(UGC,User Generated Content)视频,即用户上传到视频聚类站点中的视频数据,所述短视频通常不具有IMDB编码。
则本步骤中,所述第一检索数据为基于用户检索操作的检索结果数据。具体的,服务器记录用户检索时输入的关键字及所述关键字对应的检索结果生成检索日志,所述检索日志中包括N个关键字及所述N个关键字对应的检索结果,也即所述检索日志包括N个关键字及所述N个关键字对应检索结果数量。本实施例中所述的第一检索数据即为所述检索日志,所述第一检索数据包括关键字及所述关键字对应的检索结果数量。
本实施例所述的信息处理方法可应用于流量低谷期,即可以在每日的流量低谷期(如深夜某时间段)触发获取第一检索数据,执行后续的步骤102至步骤104的方法流程。
步骤102:分析所述第一检索数据,当所述第一检索数据中包括的所述检索结果数量为零时,提取出所述第一检索数据中的关键字生成第二检索数据。
这里,当所述第一检索数据中包括N个关键字及所述N个关键字对应检索结果数量时,分别分析每一个关键字对应检索结果数量,提取出检索结果数量为零的M个关键字(M为正整数且M小于等于N),将所述M个关键字生成所述第二检索数据。表1为本发明实施例中的第二检索数据的示意表,如表1所示,关键字所在列表征的信息为检索结果数量为零的关键字,而检索次数表征在预设时间段内所述关键字的搜索次数。如果设定每日的固定时刻触发本发明实施例所述的信息处理方法时,则所述预设时间段为上一次触发所述信息处理方法开始时至本次触发所述信息处理方法开始时,即24小时。
关键字 搜索次数
囍从天降 509
黄X 148
因为爱情有奇迹 134
肖申克的救赎 116
张xx 48
大城市小爱情 35
表1
步骤103:输出所述第二检索数据。
本步骤中,所述输出所述第二检索数据之前,所述方法还包括:识别所述第二检索数据,判断所述第二检索数据是否满足第一预定条件,获得判断结果;当所述判断结果为所述第二检索数据满足第一预定条件时,输出所述第二检索数据。
这里,所述判断所述第二检索数据是否满足第一预定条件,包括:判断所述第二检索数据中的关键字是否表征视频数据,获得第一判断结果;当所述第一判断结果为所述第二检索数据中的关键字表征视频数据时,确定所述第二检索数据满足第一预定条件。
其中,所述第二检索数据中的关键字(如表1所示)可以包括两种类型:一种类型表征人名,另一种类型表征非人名;其中,人名类型的关键字在较大概率上指的是所述人名代表的人,但也存在一定概率为视频数据名称包含的关键字,例如表1中所示的关键字为“黄x”、“张xx”,为用户检索的“黄x”、“张xx”主演的或者表演的视频数据;而如果关键字为“梅兰芳”,则可能是检索梅兰芳出演的视频数据,或者名称为“梅兰芳”的电影视频数据;非人名类型的关键字通常指的是视频数据名称所包含的关键字。因此,本步骤中,所述识别所述第二检索数据,判断所述第二检索数据中的关键字是否表征视频数据,也即判断所述关键字是否是视频数据名称所包含的关键字。
具体的,所述服务器中可预先设置信息数据库,所述信息数据库中包括所有视频数据信息,所述视频数据信息包括:视频数据名称、主要演员名称、主要角色名称、主要职员名称(如导演名称、制片人名称等等)等等。当判断所述关键字是否表征视频数据时,可按照所述关键字查找所述信息数据库;当在所述信息数据库中查找到与所述关键字匹配的视频数据信息时,确定所述关键字表征视频数据,也即确定所述第二检索数据满足预定条件;反之,当在所述信息数据库中未查找到与所述关键字匹配的视频数据信息时,确定所述关键字不表征视频数据,也即确定所述第二检索数据不满足预定条件。当然,上述具体实现过程适用于长视频的判断方法,即适用于具有IMDB编码、具有版权的视频数据。当所述视频数据为短视频(即UGC视频)时,所述短视频通常为用户自行上传,不具有IMDB编码,由于其数量庞大且知名度不高,通常不会被收录于任一数据库中;因此,在另一实施方式中,首先通过上述信息数据库的方式检索所述关键字,当所述信息数据库中检索到所述关键字匹配的视频数据信息时,确定所述关键字表征视频数据,也即确定所述第二检索数据满足预定条件;当所述信息数据库中未检索到所述关键字匹配的视频数据信息时,可通过人工校验方式校验所述关键字是否表征视频数据,所述人工校验方式可通过人工方式在搜索引擎中检索,当检索到所述关键字对应的视频数据时,确定所述关键字表征视频数据,也即确定所述第二检索数据满足预定条件;当未检索到所述关键字对应的视频数据时,确定所述关键字不表征视频数据,也即确定所述第二检索数据不满足预定条件。
进一步地,所述判断所述第二检索数据中的关键字是否表征视频数据之前,所述方法还包括:判断所述第二检索数据中的关键字是否包含非法标识,获得第二判断结果;当所述第二判断结果为所述第二检索数据不包含非法标识时,进一步判断所述第二检索数据中的关键字是否表征视频数据。
本实施例中,所述第二检索数据满足预定条件时,即所述第二检索数据中的关键字表征视频数据时,直接输出所述第二检索数据,这里为所述第二检索数据中仅为一个关键字的情景。当所述第二检索数据中包括M个关键字时,提取出所述第二检索数据中满足预定条件的P个关键字,P为正整数且P小于等于M;将所述P个关键字生成数据集合,所述数据集合可以是如表1所示的表格形式,将所述数据集合输出。
具体的,所述输出所述第二检索数据可以是将所述第二检索数据发送至维护端,维护人员可登陆所述维护端看到所述第二检索数据。其中,所述维护端可与服务器在同一设备上,维护人员可通过账户密码登陆维护端获知所述第二检索数据。另一种实施方式是,所述服务器确定所述第二检索数据满足预定条件时,通过所述服务器的显示设备的预设区域直接显示所述第二检索数据,使维护人员更能直接的获知所述第二检索数据。
本实施例中,采用上述针对关键字的检索方式从而判断所述关键字是否表征视频数据之前,所述服务器首先判断所述第二检索数据是否包括非法标识,也即判断所述第二检索数据中的关键字是否包括非法标识;所述非法标识可以包括:敏感词汇、反动词汇、低俗词汇等等。确定所述第二检索数据中的关键字部包括非法标识时,进一步执行本步骤中的判断所述第二检索数据是否满足预定条件的处理流程。
步骤104:基于所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息。
这里,所述与所述第二检索数据匹配的视频数据信息包括视频数据的地址。
具体的,所述第二服务器可以是搜索引擎服务器,也可以是其他视频聚类站点服务器。则所述与所述关键字匹配的视频数据信息可采用如下两种方式:一种实施方式是,所述服务器基于所述第二检索数据中的关键字定时或依据网络闲忙延迟向所述第二服务器发送查询请求,所述查询请求包括所述关键字;所述第二服务器获取到所述查询请求后,返回查询结果,所述查询结果表征未查找到与所述关键字匹配的视频数据或查找到与所述关键字匹配的视频数据;当所述查询结果表征查找到与所述关键字匹配的视频数据时,所述查询结果中还包括所述视频数据的地址,或者所述服务器进一步请求所述与所述关键字匹配的视频数据的地址,从而获得所述与所述关键字匹配的视频数据的地址。另一种方式是,维护人员根据所述第二检索数据中的关键字人工检索搜索引擎或其他视频聚类站点,通过所述搜索引擎或所述其他视频聚类站点返回的搜索结果直接获得所述关键字匹配的视频数据信息。
在另一实施例中,所述基于所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息,包括:基于所述第二检索数据按预设规则向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息;其中,所述预设规则为获得所述第二检索数据中的关键字的次数,当所述第二检索数据中的关键字的次数达到预设阈值时,基于所述关键字向第二服务器发送查询请求,获得与所述关键字匹配的视频数据信息。
例如,所述第二检索数据如表1所示时,基于所述第二检索数据中的关键字的次数,如关键字为“囍从天降”的搜索次数为509次,关键字为“因为爱情有奇迹”的搜索次数为134次,关键字为“肖申克的救赎”的搜索次数为116次;假定所述预设阈值为100,则上述三个关键字对应的第二检索数据满足上述条件,则获得上述关键字匹配的视频数据信息。而表1中的关键字“大城市小爱情”的搜索次数为35,则所述关键字“大城市小爱情”不满足上述条件,则无需获得与所述关键字“大城市小爱情”匹配的视频数据。这样,当某些第二检索数据中的关键字的搜索次数较少时,说明所述关键字对应的视频数据知名度不高或者也可能是用户无目的或误搜索的,这样就无需浪费过多的人力资源或***资源进行视频数据的获取。
在另一实施例中,所述获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息之后,所述方法还包括:在满足第二预定条件时,输出所述视频数据信息。其中,所述第二预定条件,在一种实施方式中,可以是在预设输出区域输出所述视频数据信息;在另一种实施方式中,可以是按预设规则输出所述视频数据的地址链接。
这里,所述在预设输出区域输出所述视频数据信息;和/或,按预设规则输出所述视频数据的地址链接,为,所述服务器将所述视频数据信息添加在呈现给用户的界面中的预设输出区域,和/或,满足所述预设规则后输出所述视频数据的地址链接。
具体的,以所述视频聚类站点为QQ视频为例,当用户在QQ视频的检索界面检索关键字,返回的检索结果数量为零后,所述QQ视频的服务器获得与所述关键字匹配的视频数据信息,所述视频数据信息包括所述关键字匹配的视频数据的地址,还可以包括所述关键字匹配的视频数据的图片、概要信息等;假设所述关键字匹配的视频数据源存储在XX站点的服务器中。则用户再一次进入QQ视频界面时,一种实施方式是,在所述QQ视频主页的推荐区输出所述关键字匹配的视频数据的图片,所述视频数据的图片为一链接,当检测到针对所述视频数据的图片的触发操作时,打开所述视频数据图片的连接,呈现所述视频数据的地址链接索引,即在预设输出区域输出所述视频数据信息;进一步的,当检测到针对所述视频数据的地址连接索引的触发操作时,基于所述视频数据的地址连接所述XX站点的服务器,从而从所述XX站点的服务器播放所述视频数据。另一种实施方式是,当检测到用户在检索界面的检索框输入所述关键字时,返回包含所述关键字匹配的视频数据的地址链接索引的检索结果,即按预设规则输出所述视频数据的地址链接。
图3为本发明实施例的信息处理方法应用的***架构示意图,本实施例所述的信息处理方法可应用于图3所示的***架构中。所述***架构包括:客户端31、服务器32和第二服务器33;其中,客户端31可以是台式电脑、笔记本电脑、智能手机、平板电脑等终端设备。所述服务器32可依据所述客户端31中的触发方式的不同可以是网页服务器或视频客户端的专属服务器。所述第二服务器33为搜索引擎服务器或其他视频聚类站点服务器。在本示例中以视频聚类站点为QQ视频,且所述QQ视频为专属客户端为例进行说明,则本实施例中,所述服务器32为QQ视频客户端的专属服务器。则基于图3所示的***架构,本实施例所述的信息处理方法具体包括:
步骤1:用户通过客户端31打开QQ视频界面,在所述QQ视频界面的检索框中输出待观看的关键字;所述QQ视频界面的检索框可如图2所示。服务器32获取到所述关键字,在自身资源信息中查询所述关键字,获得所述关键字对应的检索结果,并将所述检索结果返回至客户端31;其中,所述检索结果中包括检索结果数量。所述检索结果数量可以是正整数或零。当所述检索结果数量为正整数时,所述检索结果还包括长视频检索结果数量和短视频检索结果数量。当所述检索结果数量为零时,进一步执行步骤2。
步骤2:服务器32将所述检索结果数据为零的关键字整合作为第一检索数据。分析所述第一检索数据,首先滤除掉包含有非法词汇的关键字,进一步判断其余的关键字是否表征视频数据,当确定其余的关键字表征视频数据时,将满足上述条件的关键字整合为第二检索数据。基于所述第二检索数据向第二服务器33发送查询请求,所述查询请求中包括所述第二检索数据,即所述查询请求包括关键字。这里,所述服务器32可按照预设规则执行本示例所述的方法,如设定每日的固定时刻触发本实施例所述的信息处理方法。所述第二服务器33可以是搜索引擎服务器,如百度(Baidu)、谷歌(Google);也可以是其他视频聚类站点,如优酷网(Youku)、乐视网(Letv)等等。
步骤3:所述第二服务器33获取到所述第二检索数据后,在自身资源库中查找,获得检索结果。通常情况下,在搜索引擎服务器中能够查找到视频数据信息。所述第二服务器33查找到所述第二检索数据对应的视频数据后,将所述视频数据信息发送至所述服务器32。所述视频数据信息可以包括:视频数据地址、视频数据的概要信息、视频数据的图片信息等等。
步骤4:所述服务器32将获取到的所述第二检索数据对应的视频数据信息添加在自身资源信息中,即所述服务器32可将所述第二检索数据对应的视频数据的概要信息、图片信息和视频数据的地址链接添加至自身资源信息中;优选地,所述服务器32可针对不同用户的搜索行为将相应的先前未查找到的视频数据信息添加至所述用户的QQ视频界面,以便用户再一次打开QQ视频界面时,能够方便用户更直观的看到想要观看的视频数据,避免了用户再进行检索操作。
本发明实施例的技术方案可应用于图3所示的***架构,所述***架构中的服务器32可主要采用网络爬虫定时访问视频源站点获取视频数据信息或基于CP提供的接口获取CP提供的视频数据信息实现视频追新。本发明实施例提供的技术方案为上述两种视频追新方案的补充技术方案,即采用本发明实施例的技术方案主要用于解决上述两种视频追新方案的缺陷。本发明实施例能够基于用户检索操作的检索结果数据进行视频数据信息的获取,也即通过用户的检索行为有针对性的获取服务器中未包括的视频数据信息,从而弥补了采用网络爬虫定时访问视频源站点获取视频数据信息不全面的问题,并且也无需使用大量人力资源进行页面适配,大大节省了人力资源;而且,本发明实施例也弥补了基于CP提供的接口获取CP提供的视频数据信息所导致的不及时和数据质量难以保证的问题。并且,本发明实施例的技术方案基于用户的检索行为有针对性的获取服务器中未包括的视频数据信息,使得当用户再一次进入视频聚类站点时能够将先前未检索到的视频数据信息呈现给用户,方便用户的操作,提升了用户的视频浏览体验。
实施例二
基于实施例一,本发明实施例还提供了一种服务器。图4为本发明实施例二的服务器的组成结构示意图;如图4所示,所述服务器包括:获取单元41、分析单元42、输出单元44和通讯单元45;其中,
所述获取单元41,用于获得第一检索数据;所述第一检索数据为基于用户检索操作的检索结果数据;所述第一检索数据包括:关键字和所述关键字对应的检索结果数量;
所述分析单元42,用于分析所述获取单元41获得的所述第一检索数据,当所述第一检索数据中包括的所述检索结果数量为零时,提取出所述第一检索数据中的关键字生成第二检索数据;
所述输出单元44,用于输出所述第二检索数据;
所述通讯单元45,用于基于所述输出单元44输出的所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息。
具体的,所述第一检索数据为基于用户检索操作的检索结果数据。具体的,服务器记录用户检索时输入的关键字及所述关键字对应的检索结果生成检索日志,所述检索日志中包括N个关键字及所述N个关键字对应的检索结果,也即所述检索日志包括N个关键字及所述N个关键字对应检索结果数量。本实施例中所述的第一检索数据即为所述检索日志,所述第一检索数据包括关键字及所述关键字对应的检索结果数量。
当所述第一检索数据中包括N个关键字及所述N个关键字对应检索结果数量时,所述分析单元42分别分析每一个关键字对应检索结果数量,提取出检索结果数量为零的M个关键字(M为正整数且M小于等于N),将所述M个关键字生成所述第二检索数据。
本实施例中,所述输出单元44输出所述第二检索数据可以是将所述第二检索数据发送至维护端,维护人员可登陆所述维护端看到所述第二检索数据。其中,所述维护端可与服务器在同一设备上,维护人员可通过账户密码登陆维护端获知所述第二检索数据。另一种实施方式是,所述输出单元44输出所述第二检索数据还可以是通过所述服务器自身的显示设备的预设区域直接显示所述第二检索数据,使维护人员更能直接的获知所述第二检索数据。
具体的,所述第二服务器可以是搜索引擎服务器,也可以是其他视频聚类站点服务器。则所述与所述关键字匹配的视频数据信息可采用如下两种方式:一种实施方式是:所述通讯单元45基于所述第二检索数据中的关键字定时或依据网络闲忙延迟向所述第二服务器发送查询请求,所述查询请求包括所述关键字;所述第二服务器获取到所述查询请求后,返回查询结果,所述查询结果表征未查找到与所述关键字匹配的视频数据或查找到与所述关键字匹配的视频数据;当所述查询结果表征查找到与所述关键字匹配的视频数据时,所述查询结果中还包括所述视频数据的地址,或者所述通讯单元45进一步请求所述与所述关键字匹配的视频数据的地址,从而获得所述与所述关键字匹配的视频数据的地址。另一种方式是,维护人员根据所述第二检索数据中的关键字通过所述通讯单元45人工检索搜索引擎或其他视频聚类站点,通过所述搜索引擎或所述其他视频聚类站点返回的搜索结果直接获得所述关键字匹配的视频数据信息。
在另一实施方式中,所述服务器还包括识别单元43,用于识别所述第二检索数据,判断所述第二检索数据是否满足第一预定条件,获得判断结果;当所述判断结果为所述第二检索数据满足第一预定条件时,输出所述第二检索数据。
其中,所述识别单元43,用于判断所述第二检索数据中的关键字是否表征视频数据,获得第一判断结果;当所述第一判断结果为所述第二检索数据中的关键字表征视频数据时,确定所述第二检索数据满足预定条件。
具体的,所述第二检索数据中的关键字(如表1所示)可以包括两种类型:一种类型表征人名,另一种类型表征非人名;其中,人名类型的关键字在较大概率上指的是所述人名代表的人,但也存在一定概率为视频数据名称包含的关键字,例如表1中所示的关键字为“黄x”、“张xx”,为用户检索的“黄x”、“张xx”主演的或者表演的视频数据;而如果关键字为“梅兰芳”,则可能是检索梅兰芳出演的视频数据,或者名称为“梅兰芳”的电影视频数据;非人名类型的关键字通常指的是视频数据名称所包含的关键字。因此,本步骤中,所述识别单元43识别所述第二检索数据,判断所述第二检索数据中的关键字是否表征视频数据,也即判断所述关键字是否是视频数据名称所包含的关键字。
其中,所述服务器中可预先设置信息数据库,所述信息数据库中包括所有视频数据信息,所述视频数据信息包括:视频数据名称、主要演员名称、主要角色名称、主要职员名称(如导演名称、制片人名称等等)等等。当所述识别单元43按照所述关键字查找所述信息数据库、在所述信息数据库中查找到与所述关键字匹配的视频数据信息时,确定所述关键字表征视频数据,也即确定所述第二检索数据满足预定条件;反之,当在所述信息数据库中未查找到与所述关键字匹配的视频数据信息时,确定所述关键字不表征视频数据,也即确定所述第二检索数据不满足预定条件。当然,上述具体实现过程适用于长视频的判断方法,即适用于具有IMDB编码、具有版权的视频数据。当所述视频数据为短视频(即UGC视频)时,所述短视频通常为用户自行上传,不具有IMDB编码,由于其数量庞大且知名度不高,通常不会被收录于任一数据库中;因此,在另一实施方式中,所述识别单元43首先通过上述信息数据库的方式检索所述关键字,当所述信息数据库中检索到所述关键字匹配的视频数据信息时,确定所述关键字表征视频数据,也即确定所述第二检索数据满足预定条件;当所述信息数据库中未检索到所述关键字匹配的视频数据信息时,可通过人工校验方式校验所述关键字是否表征视频数据,所述人工校验方式可通过人工方式在搜索引擎中检索,当检索到所述关键字对应的视频数据时,确定所述关键字表征视频数据,也即确定所述第二检索数据满足预定条件;当未检索到所述关键字对应的视频数据时,确定所述关键字不表征视频数据,也即确定所述第二检索数据不满足预定条件。
其中,所述识别单元43,还用于判断所述第二检索数据中的关键字是否表征视频数据之前,判断所述第二检索数据中的关键字是否包含非法标识,获得第二判断结果;当所述第二判断结果为所述第二检索数据不包含非法标识时,进一步判断所述第二检索数据中的关键字是否表征视频数据。所述非法标识可以包括:敏感词汇、反动词汇、低俗词汇等等。所述识别单元43确定所述第二检索数据中的关键字部包括非法标识时,进一步判断所述第二检索数据是否满足预定条件的处理流程。
在另一实施例中,所述输出单元44,还用于获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息之后,在满足第二预定条件时,输出所述视频数据信息。其中,所述第二预定条件,在一种实施方式中,可以是在预设输出区域输出所述视频数据信息;在另一种实施方式中,可以是按预设规则输出所述视频数据的地址链接。
这里,所述输出单元44在预设输出区域输出所述视频数据信息;和/或,按预设规则输出所述视频数据的地址链接,为,所述输出单元44将所述视频数据信息添加在呈现给用户的界面中的预设输出区域,和/或,满足所述预设规则后输出所述视频数据的地址链接。
具体的,以所述视频聚类站点为QQ视频为例,当用户在先在QQ视频的检索界面检索关键字,返回的检索结果数量为零后,所述QQ视频的服务器获得与所述关键字匹配的视频数据信息,所述视频数据信息包括所述关键字匹配的视频数据的地址,还可以包括所述关键字匹配的视频数据的图片、概要信息等;假设所述关键字匹配的视频数据源存储在XX站点的服务器中。则用户再一次进入QQ视频界面时,一种实施方式是,在所述QQ视频主页的推荐区输出所述关键字匹配的视频数据的图片,所述视频数据的图片为一链接,当检测到针对所述视频数据的图片的触发操作时,打开所述视频数据图片的连接,呈现所述视频数据的地址链接索引,即在预设输出区域输出所述视频数据信息;进一步的,当检测到针对所述视频数据的地址连接索引的触发操作时,基于所述视频数据的地址连接所述XX站点的服务器,从而从所述XX站点的服务器播放所述视频数据。另一种实施方式是,当检测到用户在检索界面的检索框输入所述关键字时,返回包含所述关键字匹配的视频数据的地址链接索引的检索结果,即按预设规则输出所述视频数据的地址链接。
本领域技术人员应当理解,本发明实施例的服务器中各处理单元的功能,可参照前述信息处理方法的相关描述而理解,本发明实施例的服务器中各处理单元,可通过实现本发明实施例所述的功能的模拟电路而实现,也可以通过执行本发明实施例所述的功能的软件在智能终端上的运行而实现。
本实施例中,所述服务器中的获取单元41、分析单元42、识别单元43、输出单元44,在实际应用中均可由所述服务器中的中央处理器(CPU,Central Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)或可编程门阵列(FPGA,Field-Programmable Gate Array)实现;所述服务器中的通讯单元45在实际应用中,可由所述服务器中的收发机或收发天线实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (11)

1.一种信息处理方法,所述信息处理方法应用于服务器中;其特征在于,所述方法包括:
获得第一检索数据;所述第一检索数据为基于用户在预设时长内检索操作的检索结果数据;所述第一检索数据包括:N个关键字和所述N个关键字对应的检索结果数量;
分析所述第一检索数据,当所述第一检索数据中包括的所述检索结果数量为零时,提取出所述第一检索数据中检索结果数量为零的M个关键字;
确定所述M个关键字的搜索次数,从所述M个关键字中提取出关键字的搜索次数达到预设阈值的P个关键字,将所述P个关键字生成第二检索数据,其中,N、M和P均为正整数,且P小于等于M,M小于等于N;
输出所述第二检索数据,基于所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息。
2.根据权利要求1所述的方法,其特征在于,所述输出所述第二检索数据之前,所述方法还包括:识别所述第二检索数据,判断所述第二检索数据是否满足第一预定条件,获得判断结果;当所述判断结果为所述第二检索数据满足第一预定条件时,输出所述第二检索数据。
3.根据权利要求2所述的方法,其特征在于,所述判断所述第二检索数据是否满足第一预定条件,包括:
判断所述第二检索数据中的关键字是否表征视频数据,获得第一判断结果;
当所述第一判断结果为所述第二检索数据中的关键字表征视频数据时,确定所述第二检索数据满足预定条件。
4.根据权利要求1所述的方法,其特征在于,所述获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息之后,所述方法还包括:
在满足第二预定条件时,输出所述视频数据信息。
5.根据权利要求3所述的方法,其特征在于,所述判断所述第二检索数据中的关键字是否表征视频数据之前,所述方法还包括:
判断所述第二检索数据中的关键字是否包含非法标识,获得第二判断结果;当所述第二判断结果为所述第二检索数据不包含非法标识时,进一步判断所述第二检索数据中的关键字是否表征视频数据。
6.一种服务器,其特征在于,所述服务器包括:获取单元、分析单元、输出单元和通讯单元;其中,
所述获取单元,用于获得第一检索数据;所述第一检索数据为基于用户在预设时长内检索操作的检索结果数据;所述第一检索数据包括:N个关键字和所述N个关键字对应的检索结果数量;
所述分析单元,用于分析所述获取单元获得的所述第一检索数据,当所述第一检索数据中包括的所述检索结果数量为零时,提取出所述第一检索数据中检索结果数量为零的M个关键字,确定所述M个关键字的搜索次数,从所述M个关键字中提取出关键字的搜索次数达到预设阈值的P个关键字,将所述P个关键字生成第二检索数据,其中,N、M和P均为正整数,且P小于等于M,M小于等于N;
所述输出单元,用于输出所述第二检索数据;
所述通讯单元,用于基于所述输出单元输出的所述第二检索数据向第二服务器发送查询请求,获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息。
7.根据权利要求6所述的服务器,其特征在于,所述服务器还包括识别单元,用于识别所述第二检索数据,判断所述第二检索数据是否满足第一预定条件,获得判断结果;当所述判断结果为所述第二检索数据满足第一预定条件时,输出所述第二检索数据。
8.根据权利要求7所述的服务器,其特征在于,所述识别单元,用于判断所述第二检索数据中的关键字是否表征视频数据,获得第一判断结果;当所述第一判断结果为所述第二检索数据中的关键字表征视频数据时,确定所述第二检索数据满足预定条件。
9.根据权利要求6所述的服务器,其特征在于,所述输出单元,还用于获得所述第二服务器返回的与所述第二检索数据匹配的视频数据信息之后,在满足第二预定条件时,输出所述视频数据信息。
10.根据权利要求8所述的服务器,其特征在于,所述识别单元,还用于判断所述第二检索数据中的关键字是否表征视频数据之前,判断所述第二检索数据中的关键字是否包含非法标识,获得第二判断结果;当所述第二判断结果为所述第二检索数据不包含非法标识时,进一步判断所述第二检索数据中的关键字是否表征视频数据。
11.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的信息处理方法。
CN201510129855.9A 2015-03-24 2015-03-24 一种信息处理方法及服务器 Active CN106156024B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510129855.9A CN106156024B (zh) 2015-03-24 2015-03-24 一种信息处理方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510129855.9A CN106156024B (zh) 2015-03-24 2015-03-24 一种信息处理方法及服务器

Publications (2)

Publication Number Publication Date
CN106156024A CN106156024A (zh) 2016-11-23
CN106156024B true CN106156024B (zh) 2020-04-07

Family

ID=58064299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510129855.9A Active CN106156024B (zh) 2015-03-24 2015-03-24 一种信息处理方法及服务器

Country Status (1)

Country Link
CN (1) CN106156024B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113395584B (zh) * 2020-10-10 2024-03-22 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN112395517B (zh) * 2020-11-16 2023-09-29 贝壳技术有限公司 房源搜索展示方法、装置及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915380A (zh) * 2012-11-19 2013-02-06 北京奇虎科技有限公司 用于对数据进行搜索的方法和***
CN102930054A (zh) * 2012-11-19 2013-02-13 北京奇虎科技有限公司 数据搜索方法及***
CN103473273A (zh) * 2013-08-22 2013-12-25 百度在线网络技术(北京)有限公司 信息搜索方法、装置和服务器
CN103530385A (zh) * 2013-10-18 2014-01-22 北京奇虎科技有限公司 基于垂直搜索频道的信息搜索方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060149713A1 (en) * 2005-01-06 2006-07-06 Sabre Inc. System, method, and computer program product for improving accuracy of cache-based searches

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915380A (zh) * 2012-11-19 2013-02-06 北京奇虎科技有限公司 用于对数据进行搜索的方法和***
CN102930054A (zh) * 2012-11-19 2013-02-13 北京奇虎科技有限公司 数据搜索方法及***
CN103473273A (zh) * 2013-08-22 2013-12-25 百度在线网络技术(北京)有限公司 信息搜索方法、装置和服务器
CN103530385A (zh) * 2013-10-18 2014-01-22 北京奇虎科技有限公司 基于垂直搜索频道的信息搜索方法及装置

Also Published As

Publication number Publication date
CN106156024A (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
CN106331778B (zh) 视频推荐方法和装置
CN110020104B (zh) 新闻处理方法、装置、存储介质及计算机设备
JP6196316B2 (ja) ユーザ投稿に基づいたコンテンツの配信の調整
WO2019085355A1 (zh) 互联网新闻的舆情聚类分析方法、应用服务器及计算机可读存储介质
CN103473273B (zh) 信息搜索方法、装置和服务器
US11188591B2 (en) Video matching service to offline counterpart
US10311038B2 (en) Methods, computer program, computer program product and indexing systems for indexing or updating index
WO2015196910A1 (zh) 基于搜索引擎的摘要信息提取方法、装置以及搜索引擎
US20150019586A1 (en) System and method for sharing tagged multimedia content elements
US10621187B2 (en) Methods, systems, and media for providing a media search engine
KR20160104661A (ko) 온-디맨드 미디어 컨텐츠에 대응하는 보충적인 정보를 제시하기 위한 방법들, 시스템들 및 매체들
KR101252670B1 (ko) 연관 콘텐츠 제공 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
US8938440B2 (en) Method and device for extracting a meta data fragment from a metadata component associated with multimedia data
WO2015188719A1 (zh) 结构化数据与图片的关联方法与关联装置
US8572073B1 (en) Spam detection for user-generated multimedia items based on appearance in popular queries
KR101654151B1 (ko) 컨텐츠 검색을 위한 자동 완성 문장 제공 방법 및 시스템
CN114443928B (zh) 一种网络文本数据爬虫方法与***
CN106156024B (zh) 一种信息处理方法及服务器
JP7395377B2 (ja) コンテンツ検索方法、装置、機器、および記憶媒体
CN113407775B (zh) 视频搜索方法、装置及电子设备
Elsawy et al. Tweetmogaz v2: Identifying news stories in social media
RU2530671C1 (ru) Способ проверки веб-страниц на содержание в них целевого аудио и/или видео (av) контента реального времени
CN112287268A (zh) 网络资源搜索的处理方法及装置
CN108009171B (zh) 一种提取内容数据的方法和装置
US8745056B1 (en) Spam detection for user-generated multimedia items based on concept clustering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant