CN105912545A - 用于媒体资源检索的设备、方法及*** - Google Patents

用于媒体资源检索的设备、方法及*** Download PDF

Info

Publication number
CN105912545A
CN105912545A CN201510930307.6A CN201510930307A CN105912545A CN 105912545 A CN105912545 A CN 105912545A CN 201510930307 A CN201510930307 A CN 201510930307A CN 105912545 A CN105912545 A CN 105912545A
Authority
CN
China
Prior art keywords
inverted index
media file
information
client
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510930307.6A
Other languages
English (en)
Inventor
朱家星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Information Technology Beijing Co Ltd
Original Assignee
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Information Technology Beijing Co Ltd filed Critical LeTV Information Technology Beijing Co Ltd
Priority to CN201510930307.6A priority Critical patent/CN105912545A/zh
Priority to PCT/CN2016/089556 priority patent/WO2017101425A1/zh
Priority to US15/243,179 priority patent/US20170169044A1/en
Publication of CN105912545A publication Critical patent/CN105912545A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用于媒体资源检索的设备、方法及***,该设备包含:接收装置,用于从客户端接收检索指令;处理装置,用于从所述检索指令内提取关键词,并根据该关键词从倒排索引文件内提取具有该关键词的相关信息,并将该信息作为检索结果反馈至所述客户端,其中所述倒排索引文件内存储有有关媒体文件的相关信息。通过上述技术方案,所有有关媒体文件的信息均被预先存入倒排索引文件内,服务器在接收到来自客户端的检索指令之后可直接从该倒排索引文件内提取与该检索指令相符合的信息,并将该信息反馈至客户端。相比于现有的采用like匹配的方式来匹配媒体文件,该方式显著提高了对媒体文件的检索速度,并缓解了服务器的工作负荷。

Description

用于媒体资源检索的设备、方法及***
技术领域
本发明涉及信息技术领域,具体地,涉及一种用于媒体资源检索的设备、方法及***。
背景技术
随着信息技术的发展,各类娱乐影像资料出现了爆发式的增长,现有的媒体资产管理***(Media Asset Management System)存储有海量媒体文件(例如,视频、音频、图片等等)。对于如何快速从该媒体资产管理***检索出用户想要的文件,则成为了本行业亟待解决的问题。
在现有的媒体资产管理***中,媒体文件主要存储于该***的服务器内,用户可通过客户端(例如,个人计算机、手机、平板电脑等)发送检索请求,服务器收到该检索请求之后从中提取关键词(例如,“甄嬛传”),并采用like匹配的方式从所存储的媒体文件中提取相应的信息。由于服务器所存储的媒体文件的数量相当之巨大,采用like匹配的方式来从所存储的大量媒体文件内提取相应的信息速度非常慢,服务器的工作负荷也较大,最终导致对用户的检索请求响度速度偏慢,用户体验较差。
发明内容
本发明的目的是提供一种用于媒体资源检索的设备、方法及***,其可使得媒体资产管理***中的服务器在收到来自客户端的检索请求之后迅速找到相应的信息并反馈给客户端,响应速度较快。
为了实现上述目的,本发明提供一种用于媒体资源检索的设备,该设备包含:接收装置,用于从客户端接收检索指令;处理装置,用于从所述检索指令内提取关键词,并根据该关键词从预置的倒排索引文件内提取具有该关键词的相关信息,并将该信息作为检索结果反馈至所述客户端,其中所述倒排索引文件内存储有有关媒体文件的相关信息。
其中,所述相关信息可包含以下中的一者或多者:媒体文件名称、播放平台、付费平台以及媒体文件类型。
其中,所述接收装置还可用于接收媒体文件;以及所述处理装置还可用于从所述媒体文件提取相关信息,并将该信息存入所述倒排索引文件内。
其中,所述倒排索引文件可存储于所述处理装置的缓存内。
相应地,本发明还提供一种媒体资源检索***,该***包含:客户端,用于发送检索指令;以及服务器,该服务器包含上述用于媒体资源检索的设备。
相应地,本发明还提供一种用于媒体资源检索的方法,该方法包括:从客户端接收检索指令;从所述检索指令内提取关键词,并根据该关键词从预置的倒排索引文件内提取具有该关键词的相关信息,并将该信息作为检索结果反馈至所述客户端,其中所述倒排索引文件内存储有有关媒体文件的相关信息。
其中,所述相关信息可包含以下中的一者或多者:媒体文件名称、播放平台、付费平台以及媒体文件类型。
其中,所述方法还可包括:接收媒体文件;以及从所述媒体文件提取相关信息,并将该信息存入所述倒排索引文件内。
其中,所述倒排索引文件可存储于缓存内。
通过上述技术方案,所有有关媒体文件的信息均被预先存入倒排索引文件内,服务器在接收到来自客户端的检索指令之后可直接从该倒排索引文件内提取与该检索指令相符合的信息,并将该信息反馈至客户端。相比于现有的采用like匹配的方式来匹配媒体文件,该方式显著提高了对媒体文件的检索速度,并缓解了服务器的工作负荷。
本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1为本发明提供的媒体资源检索设备的结构示意图;以及
图2为本发明提供的媒体资源检索方法的流程图。
附图标记说明
100 客户端 200 服务器
210 接收装置 210 处理装置
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
图1为本发明提供的媒体资源检索设备的结构示意图。如图1所示,本发明提供了一种媒体资源检索***,该***包含客户端100,用于发送检索指令;以及服务器200,该服务器200包含用于媒体资源检索的设备。该用于媒体资源检索的设备该设备包含:接收装置210,用于从客户端接收检索指令;处理装置220,用于从所述检索指令内提取关键词,并根据该关键词从预置的倒排索引文件内提取具有该关键词的相关信息(包含诸如媒体文件名称、播放平台、付费平台以及媒体文件类型等等),并将该信息作为检索结果反馈至所述客户端。
其中,所述倒排索引文件内存储有有关媒体文件的相关信息。例如,其可存储有媒体文件的属性值(例如,文件名称、播放平台等)以及具有该属性值的媒体文件的地址。也就是说,倒排索引文件内的每一项记录均包含一个属性值和具有该属性值的各媒体文件的地址。在一般的数据存储及检索方式,均是通过遍历所存储的每一文件,确定该文件的属性,并将该属性与检索关键词进行比较,这样较为费时,而通过本发明的方案,可很轻松得从所存储的所有媒体文件的属性值寻找到符合检索关键词的属性,并确定具有该属性的媒体文件的地址。以检索词为“甄嬛传”为例,处理装置可搜索倒排索引文件,判断是否存在所述媒体文件名称为“甄嬛传”的媒体文件,并根据搜索结果向客户端进行反馈。在存在媒体文件名称为“甄嬛传”的媒体文件的情况下,还可将该媒体文件的地址一同反馈给客户端,以便该客户端进行访问该媒体文件。以检索词为“MP4”为例,处理装置可搜索倒排索引文件,判断是否存在所述媒体文件类型为“MP4”的媒体文件,并根据搜索结果向客户端进行反馈。在存在媒体文件类型为“MP4”的媒体文件的情况下,还可将该媒体文件的地址一同反馈给客户端,以便该客户端进行访问该媒体文件。
所述预置的倒排索引文件可通过以下操作而被生成:所述接收装置可接收媒体文件;以及所述处理装置还针对所述接收装置接收的每一媒体文件,从该媒体文件提取相关信息(即,属性值,例如媒体文件名称、播放平台、付费平台以及媒体文件类型等等),并将该信息存入所述倒排索引文件内。当然,同时存储所述倒排索引文件内的还有所述媒体文件的地址。需要说明的是,所述属性值及相关信息并不限于上述列举的内容,还可例如为媒体文件的码率信息等等,本发明并不限于此。
优选地,所述设备可为基于ElasticSearch技术的搜索平台,该设备可作为实现检索功能的集群中的一节点来提供检索结果。该ElasticSearch技术的搜索平台能够达到实时搜索且稳定、可靠、快速的效果。
优选地,所述倒排索引文件可存储于所述处理装置的缓存内。由于缓存内的数据存取速度要高于对硬盘上的数据进行存取的速度,通过该布置可进一步提升检索速度。
图2为本发明提供的媒体资源检索方法的流程图。如图2所示,本发明还提供一种用于媒体资源检索的方法,该方法包括:从客户端接收检索指令;从所述检索指令内提取关键词,并根据该关键词从预置的倒排索引文件内提取具有该关键词的相关信息(包含诸如媒体文件名称、播放平台、付费平台以及媒体文件类型等等),并将该信息作为检索结果反馈至所述客户端,其中所述倒排索引文件内存储有有关媒体文件的相关信息。藉此,由于所有有关媒体文件的信息均被预先存入倒排索引文件内,且有别于一般的文件存储方式,倒排索引文件内的每一项记录均包含一个属性值和具有该属性值的各媒体文件的地址,因此服务器在接收到来自客户端的检索指令之后可直接从该倒排索引文件内提取与该检索指令相符合的信息,并将该信息反馈至客户端。相比于现有的采用like匹配的方式来匹配媒体文件,该方式显著提高了对媒体文件的检索速度,并缓解了服务器的工作负荷。
所述预置的倒排索引文件可通过以下操作而被生成:接收媒体文件;以及从所述媒体文件提取相关信息(即,属性值,例如媒体文件名称、播放平台、付费平台以及媒体文件类型等等),并将该信息存入所述倒排索引文件内。也就是说,服务器每存储一媒体文件,均会提取该媒体文件的属性信息存入所述倒排索引文件内以用于后续检索之用。当然,同时存储所述倒排索引文件内的还有所述媒体文件的地址。需要说明的是,所述属性值及相关信息并不限于上述列举的内容,还可例如为媒体文件的码率信息等等,本发明并不限于此。
其中,所述方法可基于ElasticSearch技术,该技术可通过具有检索功能的集群来提供检索结果,能够达到实时搜索且稳定、可靠、快速的效果。
其中,所述倒排索引文件可存储于缓存内。由于缓存内的数据存取速度要高于对硬盘上的数据进行存取的速度,通过该布置可进一步提升检索速度。
通过上述技术方案,所有有关媒体文件的信息均被预先存入倒排索引文件内,服务器在接收到来自客户端的检索指令之后可直接从该倒排索引文件内提取与该检索指令相符合的信息,并将该信息反馈至客户端。相比于现有的采用like匹配的方式来匹配媒体文件,该方式显著提高了对媒体文件的检索速度,并缓解了服务器的工作负荷。另外,从技术角度来说,由于媒体文件文件包含很多方面的信息(诸如,码率信息),服务器的数据库在存储这些信息时,为了减少中间表的生成,会产生很多冗余字段,而在采用本申请方案之后,这些信息可以直接存入倒排索引文件内,不需要再对数据库进行扩展,减小了对数据库存储容量的压力。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (9)

1.一种用于媒体资源检索的设备,其特征在于,该设备包含:
接收装置,用于从客户端接收检索指令;
处理装置,用于从所述检索指令内提取关键词,并根据该关键词从预置的倒排索引文件内提取具有该关键词的相关信息,并将该信息作为检索结果反馈至所述客户端,其中所述倒排索引文件内存储有有关媒体文件的相关信息。
2.根据权利要求1所述的设备,其特征在于,所述相关信息包含以下中的一者或多者:媒体文件名称、播放平台、付费平台以及媒体文件类型。
3.根据权利要求1或2所述的设备,其特征在于,
所述接收装置还用于接收媒体文件;以及
所述处理装置还用于从所述媒体文件提取相关信息,并将该信息存入所述倒排索引文件内。
4.根据权利要求1所述的设备,其特征在于,所述倒排索引文件存储于所述处理装置的缓存内。
5.一种媒体资源检索***,其特征在于,该***包含:
客户端,用于发送检索指令;以及
服务器,该服务器包含根据权利要求1-4中任一项权利要求所述的用于媒体资源检索的设备。
6.一种用于媒体资源检索的方法,其特征在于,该方法包括:
从客户端接收检索指令;
从所述检索指令内提取关键词,并根据该关键词从预置的倒排索引文件内提取具有该关键词的相关信息,并将该信息作为检索结果反馈至所述客户端,其中所述倒排索引文件内存储有有关媒体文件的相关信息。
7.根据权利要求6所述的方法,其特征在于,所述相关信息包含以下中的一者或多者:媒体文件名称、播放平台、付费平台以及媒体文件类型。
8.根据权利要求6或7所述的方法,其特征在于,该方法还包括:
接收媒体文件;以及
从所述媒体文件提取相关信息,并将该信息存入所述倒排索引文件内。
9.根据权利要求6所述的方法,其特征在于,所述倒排索引文件存储于缓存内。
CN201510930307.6A 2015-12-15 2015-12-15 用于媒体资源检索的设备、方法及*** Pending CN105912545A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201510930307.6A CN105912545A (zh) 2015-12-15 2015-12-15 用于媒体资源检索的设备、方法及***
PCT/CN2016/089556 WO2017101425A1 (zh) 2015-12-15 2016-07-10 用于媒体资源检索的设备、方法及***
US15/243,179 US20170169044A1 (en) 2015-12-15 2016-08-22 Property retrieval apparatus, method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510930307.6A CN105912545A (zh) 2015-12-15 2015-12-15 用于媒体资源检索的设备、方法及***

Publications (1)

Publication Number Publication Date
CN105912545A true CN105912545A (zh) 2016-08-31

Family

ID=56744170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510930307.6A Pending CN105912545A (zh) 2015-12-15 2015-12-15 用于媒体资源检索的设备、方法及***

Country Status (2)

Country Link
CN (1) CN105912545A (zh)
WO (1) WO2017101425A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326416A (zh) * 2021-06-15 2021-08-31 北京百度网讯科技有限公司 检索数据的方法、向客户端发送检索数据的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101605A (zh) * 2007-07-24 2008-01-09 华为技术有限公司 搜索网页的方法、装置及***和建立索引数据库的装置
CN101655848A (zh) * 2008-08-20 2010-02-24 华为技术有限公司 一种实现内容管理的方法、***及装置
CN102761843A (zh) * 2012-08-10 2012-10-31 上海洲信信息技术有限公司 基于全文检索和wappush的移动终端用户获取邮件的***和获取邮件的方法
CN103744913A (zh) * 2013-12-27 2014-04-23 高新兴科技集团股份有限公司 一种基于搜索引擎技术的数据库检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101605A (zh) * 2007-07-24 2008-01-09 华为技术有限公司 搜索网页的方法、装置及***和建立索引数据库的装置
CN101655848A (zh) * 2008-08-20 2010-02-24 华为技术有限公司 一种实现内容管理的方法、***及装置
CN102761843A (zh) * 2012-08-10 2012-10-31 上海洲信信息技术有限公司 基于全文检索和wappush的移动终端用户获取邮件的***和获取邮件的方法
CN103744913A (zh) * 2013-12-27 2014-04-23 高新兴科技集团股份有限公司 一种基于搜索引擎技术的数据库检索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326416A (zh) * 2021-06-15 2021-08-31 北京百度网讯科技有限公司 检索数据的方法、向客户端发送检索数据的方法及装置

Also Published As

Publication number Publication date
WO2017101425A1 (zh) 2017-06-22

Similar Documents

Publication Publication Date Title
AU2009201232B2 (en) Managing media files from multiple sources
US20130138438A1 (en) Systems and methods for capturing, publishing, and utilizing metadata that are associated with media files
US20090094190A1 (en) Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content
US8380707B1 (en) Session-based dynamic search snippets
WO2006011900A3 (en) Method and system for managing metadata
US8438145B2 (en) Methods, systems, and computer program products for determining availability of presentable content via a subscription service
US20170293689A1 (en) System and Method for Organizing Multimedia Content
US20150066920A1 (en) Media clip sharing on social networks
CN102769638A (zh) 一种下载文件的方法、装置及***
KR20060123508A (ko) 컨텐트를 동기화하고 식별하는 방법 및 장치
US20120215786A1 (en) Server-Side Search Of Email Attachments
CN104090887A (zh) 歌曲搜索方法及装置
JP4894253B2 (ja) メタデータ生成装置およびメタデータ生成方法
US20140059065A1 (en) Management of network-based digital data repository
US9043304B1 (en) Determining geographic areas of interest for a query
US20140032537A1 (en) Apparatus, system, and method for music identification
CN104090878B (zh) 一种多媒体查找方法、终端、服务器及***
US20170169044A1 (en) Property retrieval apparatus, method and system
CN105912545A (zh) 用于媒体资源检索的设备、方法及***
CN106294417A (zh) 一种数据排序方法、装置及电子设备
CN108228101B (zh) 一种管理数据的方法和***
US9142216B1 (en) Systems and methods for organizing and analyzing audio content derived from media files
JP6217075B2 (ja) 配信方法,配信装置および配信プログラム
CN103077218A (zh) 一种用于确定查询请求中查询序列的需求信息的方法与设备
EP2722777A2 (en) Method and apparatus for managing a catalog of media content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160831