CN108829893A

CN108829893A - 确定视频标签的方法、装置、存储介质和终端设备

Info

Publication number: CN108829893A
Application number: CN201810712717.7A
Authority: CN
Inventors: 刘呈祥; 何伯磊; 吴甜
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-06-29
Filing date: 2018-06-29
Publication date: 2018-11-16
Anticipated expiration: 2038-06-29
Also published as: CN108829893B

Abstract

本发明提出一种确定视频标签的方法、装置、存储介质和终端设备，其中，所述方法包括：根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本；从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签；对各所述候选标签进行排序；以及根据排序结果，从所述各候选标签中选择出与所述待处理视频相符合的标签。采用本发明，提高视频标签描述的准确程度。

Description

确定视频标签的方法、装置、存储介质和终端设备

技术领域

本发明涉及计算机技术领域，尤其涉及一种确定视频标签的方法、装置、存储介质和终端设备。

背景技术

随着互联网资讯的发展，基于用户的兴趣点，为用户进行个性化的资讯推荐是资讯消费的新潮流。其中，视频的推荐为个性化推荐的一个重要组成部分。为了实现视频的个性化推荐，需要事先理解视频的内容，实现视频的标签化。标签化是定义视频的标签的过程，视频的标签可以描述视频内容的关注点。

目前，定义视频标签的方案包括：

1、根据视频的标题文本进行提炼分析，从中提取关键词作为视频的标签。

2、通过人工观看视频，人为理解视频的内容，然后给视频打上相应的标签。

但是，上述方案存在以下不足之处：

1、对于方案1来说，视频的标题通常较短，且标题的描述相对口语化，从标题中提取到的关键词较少，没有基于视频内容的理解和校验，所定义的标签难以准确地描述视频内容。

2、对于方案2来说，人为理解视频内容虽然可以提升定义标签的准确性，但是效率低、成本高。

发明内容

本发明实施例提供一种确定视频标签的方法、装置、存储介质和终端设备，以解决或缓解现有技术中的以上一个或多个技术问题。

第一方面，本发明实施例提供了一种确定视频标签的方法，包括：

根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本；

从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签；

对各所述候选标签进行排序；以及

根据排序结果，从所述各候选标签中选择出与所述待处理视频相符合的标签。

结合第一方面，在第一方面的第一种实施方式中，根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本，包括：

如果所述待处理视频属于目标领域，则采用图像识别技术，从所述待处理视频中获取字幕文本；以及

如果所述待处理视频不属于目标领域，则获取所述待处理视频的标题。

结合第一方面的第一种实施方式，在第一方面的第二种实施方式中，从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签，包括：

如果所述关联文本为所述字幕文本，则对所述字幕文本进行结构分析、语义分析和主题分类，获得所述待处理视频的候选标签。

结合第一方面的第二种实施方式，在第一方面的第三种实施方式中，对所述字幕文本进行结构分析，包括：

根据所述字幕文本的文本结构，确定构成所述字幕文本的关键词；

统计各关键词出现在所述字幕文本中的频次；以及

根据所述各关键词的频次，从所述各关键词中选择关键词作为所述视频的候选标签。

结合第一方面的第二种实施方式，在第一方面的第四种实施方式中，对所述字幕文本进行语义分析，包括：

根据语义分析模型，计算预设的标签与所述字幕文本之间的语义相似度；以及

根据预设的标签与所述字幕文本之间的语义相似度，从预设的标签中选取标签作为所述视频的候选标签。

结合第一方面的第二种实施方式，在第一方面的第五种实施方式中，对所述字幕文本进行主题分类，包括：

根据所述视频的候选标签与预设的主题标签之间的相似度，从所述预设的主题标签中获取标签，并作为所述视频的候选标签。

结合第一方面，在第一方面的第六种实施方式中，对各所述候选标签进行排序，包括：

根据各所述候选标签出现在所述关联文本的频次，为所述候选标签设置权重值；

当所述候选标签出现在所述关联文本的频次为零时，根据所述候选标签与所述关联文本的语义相似度，调整所述候选标签的权重值；以及

根据各所述候选标签的权重值，对各所述候选标签进行排序。

结合第一方面及其任一种实施方式，在第一方面的第七种实施方式中，所述方法还包括：

对所述关联文本进行预处理；其中，所述预处理包括：分段、分句、分词、词性标识和命名实体识别中的至少一者；以及

对所述候选标签进行后处理；其中，所述后处理包括：去重、格式统一、消除歧义、标签时效性处理中的至少一者。

结合第一方面，在第一方面的第八种实施方式中，从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签，还包括：

如果所述关联文本为所述标题，则对所述标题进行分词，获得各候选词语；

计算所述各候选词语的权重值；

根据外部较验信息和所述各候选词语的权重值，对所述各候选词语进行排序，获得所述待处理视频的标签；其中，所述外部较验信息包括所述各候选词语在外部***的搜索热度。

第二方面，本发明实施例提供一种确定视频标签的装置，包括：

关联文本抽取模块，用于根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本；

候选标签抽取模块，用于从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签；

候选标签排序模块，用于对各所述候选标签进行排序；以及

标签选择模块，用于根据排序结果，从所述各候选标签中选择出与所述待处理视频相符合的标签。

结合第二方面，在第二方面的第一种实施方式中，所述标签选择模块，包括：

字幕文本获取单元，用于如果所述待处理视频属于目标领域，则采用图像识别技术，从所述待处理视频中获取字幕文本；以及

视频标题获取单元，用于如果所述待处理视频不属于目标领域，则获取所述待处理视频的标题。

结合第二方面的第一种实施方式，在第二方面的第二种实施方式中，所述候选标签抽取模块包括：

字幕文本分析单元，用于如果所述关联文本为所述字幕文本，则对所述字幕文本进行结构分析、语义分析和主题分类，获得所述待处理视频的候选标签。

结合第二方面的第一种实施方式，在第二方面的第三种实施方式中所述候选标签抽取模块还包括：

标题分词单元，用于如果所述关联文本为所述标题，则对所述标题进行分词，获得各候选词语；

权重计算单元，用于计算所述各候选词语的权重值；

词语排序单元，用于根据外部较验信息和所述各候选词语的权重值，对所述各候选词语进行排序，获得所述待处理视频的标签；其中，所述外部较验信息包括所述各候选词语在外部***的搜索热度。

所述装置的功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，确定视频标签的结构中包括处理器和存储器，所述存储器用于确定视频标签的装置执行上述第一方面中确定视频标签的程序，所述处理器被配置为用于执行所述存储器中存储的程序。所述确定视频标签的装置还可以包括通信接口，用于确定视频标签的装置与其他设备或通信网络通信。

第三方面，本发明实施例还提供一种计算机可读存储介质，用于存储确定视频标签的装置所用的计算机软件指令，其中包括用于执行上述第一方面的确定视频标签的方法所涉及的程序。

上述技术方案中的任一个技术方案具有如下优点或有益效果：

本发明实施例可以根据视频所属的领域，来获取视频的关联文本。以及，从关联文本中抽取标签并排序，以选择与视频相符合的标签。相比仅以视频标题来获取标签的方式，本发明实施例可以根据视频领域来获得更全面的视频信息，从中抽取的标签的描述准确性更高。

上述概述仅仅是为了说明书的目的，并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外，通过参考附图和以下的详细描述，本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本发明公开的一些实施方式，而不应将其视为是对本发明范围的限制。

图1是本发明提供的确定视频标签的方法的一个实施例的流程示意图；

图2是本发明提供的基于目标领获取关联文本的方法的一个实施例的流程示意图；

图3是本发明提供的抽取各候选标签的过程的一个实施例的流程示意图；

图4是本发明提供的文本结构分析的一个实施例的流程示意图；

图5是本发明提供的语义分析的一个实施例的流程示意图；

图6是本发明提供的标签排序的一个实施例的流程示意图；

图7至图9分别是本发明提供的确定视频标签的方法的一个应用示例的示意图；

图10是本发明提供的确定视频标签的装置的一个实施例的结构示意图；

图11是本发明提供的终端设备的一个实施例的结构示意图。

具体实施方式

在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本发明的精神或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的而非限制性的。

请参阅图1，本发明实施例提供了一种确定视频标签的方法，可以应用于终端设备。终端设备可以包括智能手机、平板、计算机等。本实施例包括步骤 S100至步骤S400，具体如下：

S100，根据待处理视频所属的领域，确定对待处理视频的关联文本的获取方式，以抽取待处理视频的关联文本。

在本实施例中，视频所属的领域可以包括带字幕视频、无字幕视频、戏曲视频、唱词视频、新闻视频等。关联文本可以包括视频标题、描述视频内容的字幕文本等。视频的关联文本的获取方式可以包括直接获取和间接获取。其中，可以直接获取的文本包括视频标题和视频字幕的文档等，可以间接获取的文本包括视频音频、视频图像中的字幕。例如：对于视频音频，可以通过语音识别转换获得文本。对于视频图像中的字幕，可以通过图像识别技术，从视频中的获取字幕文本。图像识别技术可以包括类似OCR(Optical CharacterRecognition，光学字符识别)技术。

S200，从待处理视频的关联文本中抽取待处理视频的各候选标签。

在本实施例中，标签可以用于描述视频的内容或关注点。候选标签可以包括实体词(人名、地名、时间)、专有名词等。例如：广东省、春季、五月、海军、航母等。

S300，对各候选标签进行排序。

S400，根据排序结果，从各候选标签中选择出与待处理视频相符合的标签。其中，候选标签排列越前，与待处理视频相符合的程度越高。

在本实施例中，可以根据视频所属的领域，来获取视频的关联文本。以及，从关联文本中抽取标签并排序，以选择与视频相符合的标签。相比仅从视频标题中获取标签的方式，本实施例可以根据视频领域来获得其他的视频关联文本，其描述视频的信息更全面，从中抽取的标签来描述视频的准确性更高。

在一种可能的实现方式中，如图2所示，上述步骤S100可以包括步骤S110 和步骤S120，如下：

S110，如果待处理视频属于目标领域，则采用图像识别技术，从待处理视频中获取字幕文本。

S120，如果待处理视频不属于目标领域，则获取待处理视频的标题。

在本实施例中，属于目标领域的视频可以包括适合从视频中获取字幕的视频。例如，军事、历史领域的视频。从字幕内容中获取标签，可以为候选标签补充描述，信息更为准确。不属于目标领域的视频，例如，不带字幕的视频，以及戏曲、唱词等视频。对于戏曲、唱词等视频，如果引入字幕文本，从中抽取的标签会为视频的描述引入干扰。如此，可以考虑从视频的标题中抽取标签。对于不带字幕但有标题的信息可以用来描述视频的内容的视频，则可以采用短文本的关键词分析技术，从视频标题中抽取标签。

在一种可能的实施方式中，如图3所示，上述步骤S200中抽取待处理视频的各候选标签的过程中，可以包括步骤S210，如下：

S210，如果关联文本为字幕文本，则对字幕文本进行结构分析、语义分析和主题分类，获得待处理视频的候选标签。

在本实施例中，通过结构分析、语义分析和主题分类等长文本的处理，可以得到丰富多样的候选标签，可以从多个角度来描述视频。

在一种可能的实现方式中，如图4所示，本实施例可以对字幕文本进行结构分析，包括步骤S510至步骤S530，如下：

S510，根据字幕文本的文本结构，确定构成字幕文本的关键词。

在实施例中，字幕文本的文本结构可以包括句法、词性等结构。可以通过文本结构确定文本中的词语的类型，依此确定字幕文本的关键词。例如，字幕文本包括“A号航母预计于明年春第一次到达XXX地方”，对此字幕文本进行主谓宾的分析，获得实体词：A号、航母、明年和XXX地方，并以此实体词为关键词。

S520，统计各关键词出现在字幕文本中的频次。

S530，根据各关键词的频次，从各关键词中选择关键词作为视频的候选标签。

在本实施例中，关键词出现在字幕文本的频次越高，与视频符合的程度越高。例如，各关键词出现的频次都较高时，选取的阈值可以调高；各关键词出现的频次都较低时，选取的阈值可以调低。再如，各关键词出现的频次差异较大时，从中可以选择出现频次高的关键词。通过上述步骤S510至步骤S530的关键词选择，可以直接从字幕文本中抽取关键词作为视频的候选标签。

在一种可能的实现方式中，如图5所示，本实施例可以对字幕文本进行语义分析，包括步骤S610至步骤S620，如下：

S610，根据语义分析模型，计算预设的标签与字幕文本之间的语义相似度。

S620，根据预设的标签与字幕文本之间的语义相似度，从预设的标签中选取标签作为视频的候选标签。

在本实施例中，语义分析模型可以包括simnet(Simulation Network，模拟网络)算子，可以预先根据训练数据对语义分析模型进行训练获得。训练数据包括经过处理的标签与字幕文本。经过训练的simnet算子可以用来计算预设的标签与字幕文本之间的语义相似度。其中，语义相似度越高，与视频符合的程度越高。

在本实施例中，通过模型预测标签的形式，可以选择字幕文本中未曾出过的关键词作为候选标签。例如，对于自动驾驶的文本，如果文本中没有出现“人工智能”的词语，则从文本中抽取关键词的方式是无法打上“人工智能”的标签的，但是通过模型预测标签的方式是可以实现的。

在一种可能的实现方式中，本实施例可以对字幕文本进行主题分类，包括：根据视频的候选标签与预设的主题标签之间的相似度，从预设的主题标签中获取标签，并作为视频的候选标签。

在本实施例中，可以通过主题模型来计算候选标签与预设的主题标签之间的相似度。主题模型可以预先根据训练数据对语义分析模型进行训练获得，训练数据包括主题标签与视频的候选标签。主题标签可以描述视频的中心思想或主要内容。主题模型可以从视频的候选标签中归纳出视频表达的中心思想或主要内容。

在另一种可能的实现方式中，训练数据可以包括主题标签与视频的文本，模型则可以计算视频的字幕文本与预设的主题标签之间的相似度，从预设的主题标签中获取标签，并作为视频的候选标签。

在一种可能的实现方式中，如图6所示，上述步骤S300对各候选标签进行排序的过程，可以包括步骤S310至步骤S330，如下：

S310，根据各候选标签出现在关联文本的频次，为候选标签设置权重值。

S320，当候选标签出现在关联文本的频次为零时，根据候选标签与字幕文本的语义相似度，调整候选标签的权重值。

S330，根据各候选标签的权重值，对各候选标签进行排序。

在本发明实施例中，候选标签出现在关联文本中的频次越高，候选标签的权重值越高。候选标签所占的权重值越高，候选标签排序越前。为了避免一些可以准确描述视频但未出现在关联文本的标签排序过于落后，以致于被漏选作为视频的标签。对于未出现在关联文本中的标签，可以根据候选标签与关联文本的语义相似度，重新调整其权重值。候选标签与关联文本的语义相似度越高，候选标签的权重值越高。例如，如果标签为“人工智能”，对于自动驾驶的文本来说，以及如果此文本没有出现“人工智能”的词语，则在步骤S310中候选标签“人工智能”的权重值为零。但是，如果候选标签“人工智能”与自动驾驶的文本语义相似度较高，则可以通过步骤S320将候选标签“人工智能”的权重值调高。

在一种可能的实现方式中，本实施例还包括预处理和后处理的过程。其中，预处理包括对关联文本进行预处理。预处理包括：分段、分句、分词、词性标识和命名实体识别中的至少一者。以及后处理包括对候选标签进行后处理。后处理包括：去重、格式统一、消除歧义、标签时效性处理中的至少一者。

示例性地，如果文本之间不分段落，则可以对文本进行分段。如果文本的一句话过长，则可以对文本分成若干子句。分词可以按字典将句子分成若干词语，并对每个词语的词性进行标识。词性可以包括名词、动词、介词或语气词等。命名实体识别(NamedEntity Recognition，NER)是专有名词识别的技术，例如，识别文本中的人名、地名、机构名、时间、货币等。去重可以将相同的内容保留一者。如果候选标签存在格式不统一的标签，可以采用预设或默认的格式对标签进行格式调整。如果存在歧义的标签，可以进行语义的重新识别以确定该标签的语义。例如，对于地名“德州”，需要确定此“德州”是山东省的德州，还是美国的德州。如果标签的时效性已过，可以将该标签去除。

在一种可能的实施方式中，如图3所示，本实施例中的步骤S200中抽取待处理视频的各候选标签的过程，还可以包括步骤S220至步骤S240，如下：

S220，如果关联文本为标题，则对标题进行分词，获得各候选词语。

在本实施例中，假设标题为“B国成为C国新型武器实战试验场”，可以基于字或者词语的粒度对标题进行分词，获得的候选词语可以包括B国、成为、 C国、新型武器、武器、实战、试验、试验场、实战试验场等。

S230，计算各候选词语的权重值。

在本实施例中，可以基于词向量表达的算法为各候选词语计算权重值，词向量表达算法可以包括wordrink(词排名)算法。

S240，根据外部较验信息和各候选词语的权重值，对各候选词语进行排序，获得待处理视频的标签。其中，外部较验信息包括各候选词语在外部***的搜索热度。例如，“B国”这一词各大主流搜索平台的搜索热度。主流搜索平台可以包括百度、谷歌或知网等。候选词语的搜索热度越高，候选词语的排序越靠前。候选词语的权重值越大，候选词语的排序越靠前。

在实施例中，如果关联的文本不适合获取字幕作为视频的关联文本，但存在视频的标题，则可以获取视频的标题来提取标签。可以在为各候选词语计算权重值的基础，充分利用外部的外部校验信息，避免从视频的标题中抽取的标签结果过于泛化。

请参阅图7至图9，是本发明实施例提供的确定视频标签的应用示例的示意图。本应用示例包括对有字幕的视频、无字幕的视频以及有字幕但不适合采用字幕的视频的标签抽取过程，具体如下：

(1)有字幕的视频：可以通过OCR技术识别视频内的字幕，获得的字幕为文本格式的文档。其中，视频的标题对应文档标题，OCR字幕对应文档内容。本实施例可以通过对文档的结构和语义进行分析，得出预测结果。

如图7所示，视频图像中的实线框所框住的内容为文档内容，包括：“三年前A号航母第一次到达XXX地方的时候”和“D国航母要给E国撑腰？打算怎么做？”。通过本实施例对此文本内容的处理，获得图7中虚线所给的预测结果，包括：D国航母、海军、军舰和航母的标签。此标签可以显示在视频中。

如图8所示，本应用示例的预测***包括预处理层、核心算子层和后处理层。

(a)预处理层：主要负责进行通用的文本分析工作，以进行预处理。例如：对文档进行分段、分词、分句、词性标识和命名实体识别以及句法依存分析等。

(b)核心算子层：是预测***中最核心的部分，可以包括多个不同功能的算子。例如：

b1、语义结构分析算子：分析文档的结构以及统计文档中的词语的统计信息，依此从中抽取关注点(前述的候选标签)；

b2、simnet算子：分析文档的语义，预测视频的关注点；

b3、主题模型算子：分析和预测文档的主题所属的类别；

b4、时效性关注点抽取：分析标签的时效性，以从候选的关注点中抽取关注点。

(c)后处理层：主要负责对抽取到的标签的后处理。可以包括合并(去重)、归一化改写(格式统一)、歧义消解、排序和干预功能。

需要注意的是，并不是所有视频都适合采用图8的预测***来进行关注点预测。例如，军事、历史领域的视频是合适的，字幕内容可以为视频的关注点补充有用信息。但在一些视频领域中，例如，戏曲、唱词等视频，视频的OCR 的内容会对关注点的预测引入干扰。因而，对于不适合引入OCR进行关注点预测的视频，可以使用以下无字幕的视频的方案来进行解决。

(1)无字幕的视频：可以利用视频标题的信息进行分析，例如采用短文本的关键词分析技术来进行分析。可以wordrank算法为基础，并利用外部校验信息对标题的关键词进行抽取，可以避免过于泛化抽取结果。

如图9所示，短文本关键词分析的主要逻辑如下：

(a)产出候选：首先对标题进行分词。对于输入的标题为“B国成为C 国新型武器实战试验场”，可以基于字或者词语的粒度对标题进行分词，获得的候选词语可以包括“B国、成为、C国、新型武器、武器、实战、试验、试验场、实战试验场”。然后根据分词结果确定候选的标签结果，可以包含：基于 word(字)粒度的召回策略和phrase(词语)粒度的召回策略。其中，phrase 候选可以通过word的n-gram(汉语语言模型)来产生。也可以利用词性和一些启发式的规则进行候选的初筛。

(b)候选排序：对候选词语进行权重值计算并排序。可以wordrank算法为基础，计算word和phrase的权重值(wordrank得分)。然后，根据各word 和phrase的权重进行排序。

(c)结果校验：利用外部校验信息，例如：关注点图谱、查询热度(querypv)、百科搜索热度(百科pv)、IDF(Inverse Document Frequency，逆文本频率指数) 校验排序后的结果，可以避免过于泛化抽取结果。

本实施例具有以下优点：

1、预测效果好。利用OCR字幕识别技术引入字幕信息，使得预测***可以获取到能更全面描述视频的信息。可以在一定程度上帮助理解视频画面的内容。不仅可以提升了标签的召回率，也提升了标签召回的准确程度。

2、效率高、成本低。在模型完成训练后，利用模型进行预测，不需要人工标注，效率高，且能保持良好的预测效果。

请参阅图10，本发明实施例提供一种确定视频标签的装置，包括：

关联文本抽取模块100，用于根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本；

候选标签抽取模块200，用于从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签；

候选标签排序模块300，用于对各所述候选标签进行排序；以及

标签选择模块400，用于根据排序结果，从所述各候选标签中选择出与所述待处理视频相符合的标签。

在一种可能实现方式中，所述标签选择模块，包括：

在一种可能实现方式中，所述候选标签抽取模块包括：

在一种可能实现方式中，所述候选标签抽取模块还包括：

权重计算单元，用于计算所述各候选词语的权重值；

本发明实施例还提供一种终端设备，如图11所示，该设备包括：存储器 21和处理器22，存储器21内存储有可在处理器22上的计算机程序。处理器 22执行计算机程序时实现上述实施例中的确定视频标签的方法。存储器21和处理器22的数量可以为一个或多个。

该设备还包括：

通信接口23，用于处理器22与外部设备之间的通信。

存储器21可能包含高速RAM存储器，也可能还包括非易失性存储器 (non-volatile memory)，例如至少一个磁盘存储器。

如果存储器21、处理器22和通信接口23独立实现，则存储器21、处理器 22和通信接口23可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(ISA，Industry Standard Architecture)总线、外部设备互连(PCI， Peripheral Component)总线或扩展工业标准体系结构(EISA，Extended Industry Standard Component)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图11中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器21、处理器22及通信接口23集成在一块芯片上，则存储器21、处理器22及通信接口23可以通过内部接口完成相互间的通信。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、 “具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中，“多个” 的含义是两个或两个以上，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***) 使用，或结合这些指令执行***、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行 ***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。

本发明实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质的更具体的示例至少(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式只读存储器(CDROM)。另外，计算机可读存储介质甚至可以是可在其上打印程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序，然后将其存储在计算机存储器中。

在本发明实施例中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于指令执行***、输入法或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、射频(Radio Frequency，RF)等等，或者上述的任意合适的组合。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA) 等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。存储介质可以是只读存储器，磁盘或光盘等。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到其各种变化或替换，这些都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种确定视频标签的方法，其特征在于，包括：

对各所述候选标签进行排序；以及

2.如权利要求1所述的确定视频标签的方法，其特征在于，根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本，包括：

3.如权利要求2所述的确定视频标签的方法，其特征在于，从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签，包括：

4.如权利要求3所述的确定视频标签的方法，其特征在于，对所述字幕文本进行结构分析，包括：

统计各关键词出现在所述字幕文本中的频次；以及

5.如权利要求3所述的确定视频标签的方法，其特征在于，对所述字幕文本进行语义分析，包括：

6.如权利要求3所述的确定视频标签的方法，其特征在于，对所述字幕文本进行主题分类，包括：

7.如权利要求1所述的确定视频标签的方法，其特征在于，对各所述候选标签进行排序，包括：

8.如权利要求1至7任一项所述的确定视频标签的方法，其特征在于，所述方法还包括：

9.如权利要求1所述的确定视频标签的方法，其特征在于，从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签，还包括：

计算所述各候选词语的权重值；

10.一种确定视频标签的装置，其特征在于，包括：

候选标签排序模块，用于对各所述候选标签进行排序；以及

11.如权利要求10所述的确定视频标签的装置，其特征在于，所述标签选择模块，包括：

12.如权利要求11所述的确定视频标签的装置，其特征在于，所述候选标签抽取模块包括：

13.如权利要求10所述的确定视频标签的装置，其特征在于，所述候选标签抽取模块还包括：

权重计算单元，用于计算所述各候选词语的权重值；

14.一种实现确定视频标签的终端设备，其特征在于，所述终端设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-9中任一所述的确定视频标签的方法。

15.一种计算机可读存储介质，其存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-9中任一所述的确定视频标签的方法。