CN112507167A - 一种识别视频合集的方法、装置、电子设备及存储介质 - Google Patents

一种识别视频合集的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112507167A
CN112507167A CN202011454644.XA CN202011454644A CN112507167A CN 112507167 A CN112507167 A CN 112507167A CN 202011454644 A CN202011454644 A CN 202011454644A CN 112507167 A CN112507167 A CN 112507167A
Authority
CN
China
Prior art keywords
video
text information
identified
target text
videos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011454644.XA
Other languages
English (en)
Inventor
迟至真
李思则
李岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202011454644.XA priority Critical patent/CN112507167A/zh
Publication of CN112507167A publication Critical patent/CN112507167A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开公开了一种识别视频合集的方法、装置、电子设备及存储介质,用于解决识别视频合集效率低的问题。该方法为:获得待识别视频集;对待识别视频集中每个视频所对应的文字信息进行分词处理,获得目标文本信息,并确定每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度;对待识别视频集中每个视频对应的视频封面图像进行特征提取处理,获得每个视频对应的特征向量;若待识别视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且第一视频对应的特征向量与第二视频对应的特征向量的距离属于第二预定范围,则确定第一视频和第二视频属于关联视频,以确定待识别视频集内的视频合集。

Description

一种识别视频合集的方法、装置、电子设备及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种识别视频合集的方法、装置、电子设备及存储介质。
背景技术
随着科技的不断发展和互联网的普及,人们喜欢用视频来分享自己的生活或对影视剧的评述等事件,而为了更好的使其他用户观看和喜爱自己的视频,可以将视频剪辑为多个视频,并分几次发布;或者是多次发布对同一事件或同一类型的事件相关的视频。
然而,这样的发布方式,导致其他用户在浏览该视频后,想要识别其它与该视频属于同一视频合集的视频时,需要查找对应的发布记录,才可以到相关的视频。不仅操作步骤繁琐,且识别效率较低。
发明内容
本公开提供一种识别视频合集的方法、装置、电子设备及存储介质,用于解决相关技术中识别视频合集效率低的技术问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种识别视频合集的方法,所述方法包括:
获得待识别视频集;
对所述待识别视频集中每个视频所对应的文字信息进行分词处理,获得所述待识别视频集中每个视频的目标文本信息,并确定所述待识别视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度;
对所述待识别视频集中每个视频对应的视频封面图像进行特征提取处理,获得所述待识别视频集中每个视频对应的特征向量;
若所述待识别视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且所述第一视频对应的特征向量与所述第二视频对应的特征向量的距离属于第二预定范围,则确定所述第一视频和所述第二视频属于关联视频,以根据所述关联视频确定所述待识别视频集内的视频合集。
在一种可能的实施方式中,所述待识别视频集中每个视频所对应的文字信息包括所述每个视频的标题、字幕、背景文字信息以及语音识别文本中的至少一项。
在一种可能的实施方式中,对所述待识别视频集中每个视频所对应的文字信息进行分词处理,获得所述待识别视频集中每个视频的目标文本信息,包括:
将所述待识别视频集中每个视频的标题、字幕、背景文字信息以及语音识别文本中进行分词处理,获得所述待识别视频集中每个视频对应的分词结果;
对所述分词结果进行预设筛选处理,获得所述待识别视频集中每个视频的目标文本信息;其中,所述预设筛选处理至少包括取出停用词处理和过滤低频词处理。
在一种可能的实施方式中,确定所述待识别视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度,包括:
对所述目标文本信息进行向量化处理,并对向量化处理后的目标文本信息进行提取和筛选处理,确定所述待识别视频集中每个视频分别对应的目标特征;
基于所述待识别视频集中每个视频分别对应的目标特征,确定所述待识别视频集中每个视频与除自身外其它视频的相似度。
在一种可能的实施方式中,根据所述关联视频确定所述待识别视频集内的视频合集之后,所述方法还包括:
对所述视频合集进行校验;或者,
对所述视频合集进行关联封装,以对所述视频合集进行关联推送。
在一种可能的实施方式中,根据所述关联视频确定所述待识别视频集内的视频合集之后,所述方法还包括:
若确定用户浏览所述视频合集中的任一视频,则向所述用户推送所述视频合集中的其它视频。
根据本公开实施例的第二方面,提供一种识别视频合集的装置,所述装置包括:
获得单元,被配置为执行获得待识别视频集;
第一处理单元,被配置为执行对所述待识别视频集中每个视频所对应的文字信息进行分词处理,获得所述待识别视频集中每个视频的目标文本信息,并确定所述待识别视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度;
第二处理单元,被配置为执行对所述待识别视频集中每个视频对应的视频封面图像进行特征提取处理,获得所述待识别视频集中每个视频对应的特征向量;
确定单元,被配置为执行若所述待识别视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且所述第一视频对应的特征向量与所述第二视频对应的特征向量的距离属于第二预定范围,则确定所述第一视频和所述第二视频属于关联视频,以根据所述关联视频确定所述待识别视频集内的视频合集。
在一种可能的实施方式中,所述待识别视频集中每个视频所对应的文字信息包括所述每个视频的标题、字幕、背景文字信息以及语音识别文本中的至少一项。
在一种可能的实施方式中,所述第一处理单元被配置为执行:
将所述待识别视频集中每个视频的标题、字幕、背景文字信息以及语音识别文本中进行分词处理,获得所述待识别视频集中每个视频对应的分词结果;
对所述分词结果进行预设筛选处理,获得所述待识别视频集中每个视频分别对应的目标文本信息;其中,所述预设筛选处理至少包括取出停用词处理和过滤低频词处理。
在一种可能的实施方式中,所述第二处理单元被配置为执行:
对所述目标文本信息进行向量化处理,并对向量化处理后的目标文本信息进行提取和筛选处理,确定所述待识别视频集中每个视频分别对应的目标特征;
基于所述待识别视频集中每个视频分别对应的目标特征,确定所述待识别视频集中每个视频与除自身外其它视频的相似度。
在一种可能的实施方式中,所述装置还包括第三处理单元,所述第三处理单元被配置为执行:
对所述视频合集进行校验;或者,
对所述视频合集进行关联封装,以对所述视频合集进行关联推送。
在一种可能的实施方式中,所述装置还包括推送单元,所述推送单元被配置为执行:
若确定用户浏览所述视频合集中的任一视频,则向所述用户推送所述视频合集中的其它视频。
根据本公开实施例的第三方面,提供一种电子设备,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为执行指令,以实现本公开实施例上述第一方面以及第一方面涉及的任一可能涉及的方法。
根据本公开实施例的第四方面,提供一种存储介质,当存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例上述第一方面以及第一方面涉及的任一可能涉及的方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行实现本公开实施例上述第一方面以及第一方面任一可能涉及的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
在本公开实施例中,可以获得待识别视频集,然后可以对视频集中每个视频所对应的文字信息进行分词处理,获得待识别视频集中每个视频的目标文本信息,并确定视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度。也就是说,在本公开实施例中,可以先分析待识别视频集中的视频所包括的文本信息的相似度,即确定待识别视频集中视频对应的文本内容的相似程度。
进一步地,可以对视频集中每个视频对应的视频封面图像进行特征提取处理,获得视频集中每个视频对应的特征向量。可见,本公开实施例中还可以确定视频封面图像的特征向量,为后续准确确定视频集中的视频与其它视频是否属于关联视频增加一个衡量参量。
在本公开实施例中,当确定视频集中每个视频对应的相似度和特征向量之后,可以确定视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且第一视频对应的特征向量与第二视频对应的特征向量的距离属于第二预定范围时,第一视频和第二视频属于关联视频,从而可以根据关联视频确定视频集内的视频合集。可见,在本公开实施例中,还可以增加通过视频封面确定视频集中的视频内容是否相同的判断特征,提高确定视频合集的准确度。
在本公开实施例中,可以根据视频集内各个视频分别对应的文字信息的相似度和封面信息对应的特征向量之间的关系,确定各个视频之间是否互为关联视频,从而可以将关联视频确定为视频合集。这样的方式,无需用户参与识别视频合集,可以更快速准确的确定同种类型的视频对应的视频合集,提高识别视频合集的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用场景的示意图;
图2是根据一示例性实施例示出的一种识别视频合集的方法的流程示意图;
图3是根据一示例性实施例示出的一种识别视频合集的装置的结构框图;
图4为根据一示例性实施例示出的电子设备的结构示意图;
图5为根据一示例性实施例示出的电子设备的另一结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的图像在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
为便于理解本公开实施例提供的技术方案,这里先对本公开实施例使用的一些关键名词进行解释:
视频合集:发布的同种类型的视频作品组成一个视频合集。
例如,发布的针对某个热播电视剧的剧评的视频1、视频2、视频3以及视频4所组成的视频合集;或者,发布的针对不同综艺类节目的剧评的视频8、视频9、视频11以及视频12所组成的视频合集;或者,发布的针对某个城市的美食系列的视频f、视频a以及视频x所组成的视频合集。
停用词:在处理自然语言文本之前或之后会自动过滤掉某些字或词称作停用词。具体的,停用词可以根据实际实施情况确定。
低频词:在视频中出现频率较低的某些字或词称作低频词。具体的,可以将字或词的出现频率与预设频率进行比较,出现频率低于预设频率的词可以称作低频词。
下面对本公开实施例的设计思想进行简要介绍:
目前,越来越多的人喜欢用视频的形式进行信息的传输或日常生活的分享。为了使较多的人喜爱自己发布的视频,用户可以制作多个相关联的视频。这样的方式,可以使得其他用户在浏览到该用户发布的视频时,可以进一步浏览相关联的视频。
然而,相关技术中,其他用户若想要浏览该用户发布的属于同一视频合集的视频时,可以根据用户自己命名的标题进行关键词搜索查找视频合集,也可以点击进入用户发布的所有视频中进行查找,这样的方式,不仅查找效率较低,即对相关联的视频识别效率较低,而且可能由于关键词错误导致识别错误的情况出现。
鉴于此,本公开提供一种识别视频合集的方法,通过该方法可以自动且快速的识别视频合集,提高视频合集的识别效率。
介绍完本公开实施例的设计思想之后,下面对本公开实施例中的识别视频合集的技术方案适用的应用场景做一些简单介绍,需要说明的是,本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。
在本公开实施例中,请参见图1所示的一种应用场景示意图,应用场景图中包括一个终端101和一个电子设备102,可以通过终端101可以浏览视频合集,还可以发布视频。需要说明的是,图1中仅以一个终端101和一个电子设备102进行交互为例进行示出,在具体实施过程中,可以是多个终端101与一个电子设备102之间进行交互,也可以是多个终端101和多个电子设备102之间进行交互,本公开实施例中不做限制。
在具体的实施过程中,终端101和电子设备102之间可以通过一个或者多个通信网络103进行通信连接。该通信网络103可以是有线网络,也可以是无线网络,例如无线网络可以是移动蜂窝网络,或者可以是无线保真(WIreless-Fidelity,WIFI)网络,当然还可以是其他可能的网络,本公开实施例对此不做限定。
在本公开实施例中,用户可以通过终端101登录视频平台的账户并发布或浏览视频,电子设备102可以获取用户发布的视频对应的数据,还可以接收用户通过终端发送的信息,电子设备102可以对获取的视频进行识别视频合集的处理。
下面结合说明书附图介绍本公开实施例提供的技术方案。
图2是本公开实施例提供的一示例性识别视频合集的方法的流程图,如图2所示,该方法可以应用于前述的电子设备。图2所示的流程图描述如下。
步骤201:获得待识别视频集。
在本公开实施例中,可以获得待识别视频集。具体的,待识别的视频集可以是多个用户登录视频平台的账户发布的视频的集合,也可以是一个用户登录平台的账户对应发布的视频的集合。需要说明的是,在本公开实施例中,后文中以待识别视频集为一个用户登录视频平台的账户对应发布的视频集的集合为例进行说明。
在本公开实施例中,可以获得一个用户登录视频平台的账户发布的视频集的集合,即可以获得同一创作者的视频集,需要说明的是,同一创作者的视频集可以是一个创作的人使用一个账户所发布的视频集,也可以是多个人一同创作的视频使用一个账户发布的视频集。具体的,可以是从与发布视频平台对应的数据库中,直接获取所有同一创作者的所有已发布的视频,从而获得所有同一创作者的视频集。例如,创作者A已发布的视频为视频11、视频12、视频13,创作B已发布的视频为视频21、视频22、视频23以及视频24,则可以从对应的数据库中,获得创作者A的视频集1,且视频集1包括视频11、视频12以及视频13;以及,获得创作者B的视频集2,且视频集2包括视频21、视频22、视频23以及视频24。
在本公开实施例中,还可以是从与发布视频平台对应的数据库中,获取特定的同一创作者的所有已发布的视频,从而获得特定的同一创作者的视频集。具体的,特定的同一创作者可以是一个,也可以是多个,本公开实施例中不做限制。
在具体的实施过程中,可以将创作者已发布的视频数量大于预设阈值的创作者确定为特定的同一创作者,例如,预设阈值为30,创作者F已发布的视频数量为23,创作者M已发布的视频数量为40,则可以获取创作者M的所有已发布的视频,从而获得同一创作者M的视频集。
可见,在本公开实施例中,可以基于预设的筛选条件确定待识别的视频集,这样的方式,由于是直接基于预设的筛选条件,可以更加快速高效的确定待识别的视频集。
在本公开实施例中,还可以是基于用户触发的预设操作,且该操作可以确定用户希望浏览当前浏览的视频的创作者的视频合集,去对应的数据库中,确定对应的同一创作者的所有视频,从而获得同一创作者的视频集。也就是说,在本公开实施例中,还可以基于用户实时触发的预设操作,确定待识别的视频集。这样的方式,由于是基于用户的实时需求确定的待识别的视频集,确定的结果更符合用户的实际使用需求。且在前一种确定方式的基础上,还提供了一种方式,增强了方案的可实施性。
步骤202:对待识别视频集中每个视频所对应的文字信息进行分词处理,获得待识别视频集中每个视频的目标文本信息,并确定待识别视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度。
在本公开实施例中,可以确定待识别视频集中每个视频的目标文本信息。具体的,目标文本信息可以理解为包括视频中所涉及到的所有文字信息。在具体的实施过程中,可以提取视频对应的标题、视频中出现的字幕所对应的文字信息以及背景文字信息,还可以对视频中出现的语音信息进行文字提取处理,获得语音识别文本。
可见,本公开实施例中可以获取待识别视频集中每个视频所对应的所有文字信息,即获得的每个视频的文字信息较为全面,从而为后续进行视频合集的确定提供良好的实施基础。
在本公开实施例中,当获得待识别视频集中每个视频的标题、字幕、背景文字信息以及语音识别文本后,可以对待识别视频集中每个视频的标题、字幕、背景文字信息以及语音识别文本中进行分词处理,获得待识别视频集中每个视频对应的分词结果。例如,可以采用结巴分词的方式进行分词处理。进一步地,可以对分词结果进行预设筛选处理,其中,预设筛选处理包括取出停用词处理和过滤低频词处理。
在具体的实施过程中,可以在获得每个视频的分词结果后,从分词结果中取出属于预先确定的通用词词典中的词语或字,获得第一分词结果,然后可以从第一分词结果中过滤属于预先设置的低频词词典中的词语或字,获得第二分词结果。此外还可以对第二分词结果进行归一化处理,获得目标文本信息。
在本公开实施例中,还可以对目标文本信息进行向量化处理,并对向量化处理后的目标文本信息进行筛选处理,确定待识别视频集中每个视频分别对应的目标特征,然后基于待识别视频集中每个视频对应的目标特征,确定待识别视频集中每个视频与除自身外其它视频的相似度。
在具体的实施过程中,可以使用向量空间模型或概率统计模型对目标文本信息进行量化处理,获得处理后的目标文本信息。然后可以对处理后的目标文本信息进行筛选处理,这样的处理方式,可以较为准确的确定目标文本信息对应的具有代表每个视频的文字信息的特征,为后续精准确定两个视频属于关联视频提供更细化的参量。
具体的,在对处理后的目标文本信息进行筛选处理时,可以是用映射或变化的方法对处理后的目标文本信息对应的原始特征降维处理,然后从原始特征中筛选出目标特征;还可以是根据历史经验信息筛选出目标特征;当然,也可以是筛选出最具分类信息的目标特征。此外,还可以是其它方式,本公开实施例中不做限制。
步骤203:对待识别视频集中每个视频对应的视频封面图像进行特征提取处理,获得待识别视频集中每个视频对应的特征向量。
在本公开实施例中,可以对待识别视频集中每个视频对应的视频封面图像进行特征提取处理,从而可以获得待识别视频集中每个视频对应的特征向量。具体的,可以是使用自适应无监督学习的特征提取方法对视频封面图像进行特征提取处理,也可以是使用监督学习的特征提取方法对视频封面图像进行特征提取处理,本公开实施例中不做限制。
在本公开实施例中,可以使用Momentum Contrast(MoCo,动量反差)的无监督视觉表示学习方法,对每个视频对应的视频封面图像进行特征提取处理,获得每个视频对应的特征向量。具体的,MoCo是通过constractive loss和动量更新编码器方法的学习图像embeding的自适应无监督算法。具体来讲,是将输入的图像通过两次随机数据增强(例如颜色抖动、crop等)作为key,query并分别输入key encoder和query encoder中构成正样本对;同时,将key存储在一个先入先出的队列中用于构建负样本对。最后,使用正负样本对之间的内积结合constractive loss进行训练。需要说明的是,key encoder使用的是动量更新的方式,而query encoder使用的是正常的梯度更新。
在本公开实施例中,通过无监督视频表示学习方法提取视频封面的特征向量的方式,不需要额外数据成本实现,可以在保证特征提取准确的基础上,尽量减少额外数据成本的使用,增强方案的可实施性。
步骤204:若待识别视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且第一视频对应的特征向量与第二视频对应的特征向量的距离属于第二预定范围,则确定第一视频和第二视频属于关联视频,以根据关联视频确定待识别视频集内的视频合集。
在本公开实施例中,当确定待识别视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且第一视频对应的特征向量与第二视频对应的特征向量的距离属于第二预定范围,则确定第一视频和第二视频属于关联视频。进一步地,还可以对待识别视频集内所有的视频与其它识别对应的相似度是否属于第一预定范围,以及对应的特征向量所对应的距离是否属于第二预定范围进行判断,获得多个关联视频,从而根据关联视频确定待识别视频集内的视频合集。
在本公开实施例中,可以将多个视频中,每个视频对应的所有文字信息和封面特征信息综合确定多个视频中任意两个视频是否为关联视频,这样的方式,可以更为全面细化的对视频进行比对,从而提高确定关联视频的准确度。并且,由于从确定待识别的视频集到最终确定视频合集,均为自动化进行,提高了确定视频合集的效率。
在一种可能的实施方式中,当确定待识别视频集内的视频合集之后,还可以对视频合集进行校验。具体的,可以采用人工校验的方式对视频合集进行校验,即判断视频合集中是否存在与视频合集内其它视频关联性较低的视频,可以对该视频进行剔除处理。此外,还可以基于人工校验的结果,结合实际实施情况,对前述的第一预定范围和第二预定范围的范围大小进行调整。很显然,本公开实施例中还可以对确定的视频合集进行校验,对确定视频合集中关联视频的准确度提供修正依据,进一步提高确定的视频合集的准确度。
在一种可能的实施方式中,当确定待识别视频集内的视频合集之后,还可以对视频合集进行关联封装,以对视频合集中的视频进行关联推送。具体的,可以给视频合集中的视频打上标记,以实现对视频合集中的视频的关联,还可以将视频合集中视频进行组合封装,从而可以对视频合集中的视频进行关联推送。也就是说,在本公开实施例中,可以将视频合集中的视频进行组合封装,为后续进行视频合集中视频的推荐提供良好的实施基础,增强了视频合集中视频推荐的精准度,且对搜索视频合集中的视频时的搜索质量产生了正向的影响。
在一种可能的实施方式中,若确定用户浏览视频合集中的任一视频,则可以向用户推送所述视频合集中的其它视频。这样的方式,可以较为准确快速的为用户推送视频合集中的视频,增强用户的使用体验。
基于同一发明构思,本公开实施例提供了一种识别视频合集的装置,该识别视频合集的装置能够实现前述的识别视频合集的方法对应的功能。该识别视频合集的装置可以是硬件结构、软件模块、或硬件结构加软件模块。该识别视频合集的装置可以由芯片***实现,芯片***可以由芯片构成,也可以包含芯片和其他分立器件。请参见图3所示,该识别视频合集的装置包括获得单元301、第一处理单元302、第二处理单元303以及确定单元304。其中:
获得单元301,被配置为执行获得待识别视频集;
第一处理单元302,被配置为执行对所述待识别视频集中每个视频的标题、字幕以及语音识别文本进行分词处理,获得所述待识别视频集中每个视频的目标文本信息,并确定所述待识别视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度;
第二处理单元303,被配置为执行对所述待识别视频集中每个视频对应的视频封面图像进行特征提取处理,获得所述待识别视频集中每个视频对应的特征向量;
确定单元304,被配置为执行若所述待识别视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且所述第一视频对应的特征向量与所述第二视频对应的特征向量的距离属于第二预定范围,则确定所述第一视频和所述第二视频属于关联视频,以根据所述关联视频确定所述待识别视频集内的视频合集。
在一种可能的实施方式中,所述待识别视频集中每个视频所对应的文字信息包括所述每个视频的标题、字幕、背景文字信息以及语音识别文本中的至少一项。
在一种可能的实施方式中,所述第一处理单元302被配置为执行:
将所述待识别视频集中每个视频的标题、字幕、背景文字信息以及语音识别文本中进行分词处理,获得所述待识别视频集中每个视频对应的分词结果;
对所述分词结果进行预设筛选处理,获得所述待识别视频集中每个视频分别对应的目标文本信息;其中,所述预设筛选处理至少包括取出停用词处理和过滤低频词处理。
在一种可能的实施方式中,所述第二处理单元303被配置为执行:
对所述目标文本信息进行向量化处理,并对向量化处理后的目标文本信息进行筛选处理,确定所述待识别视频集中每个视频分别对应的目标特征;
基于所述待识别视频集中每个视频分别对应的目标特征,确定所述待识别视频集中每个视频与除自身外其它视频的相似度。
在一种可能的实施方式中,所述装置还包括第三处理单元,所述第三处理单元被配置为执行:
对所述视频合集进行校验;或者,
对所述视频合集进行关联封装,以对所述视频合集进行关联推送。
在一种可能的实施方式中,所述装置还包括推送单元,所述推送单元被配置为执行:
若确定用户浏览所述视频合集中的任一视频,则向所述用户推送所述视频合集中的其它视频。
前述如图2的识别视频合集的方法的实施例涉及的各步骤的所有相关内容均可以援引到本公开实施例中的识别视频合集的装置所对应的功能单元的功能描述,在此不再赘述。
本公开实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本公开各个实施例中的各功能单元可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
基于同一发明构思,本公开实施例还提供一种电子设备,如图4所示,本公开实施例中的电子设备包括至少一个处理器401,以及与至少一个处理器401连接的存储器402和通信接口403,本公开实施例中不限定处理器401与存储器402之间的具体连接介质,图4中是以处理器401和存储器402之间通过总线400连接为例,总线400在图4中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线400可以分为地址总线、图像总线、控制总线等,为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在本公开实施例中,存储器402存储有可被至少一个处理器401执行的指令,至少一个处理器401通过执行存储器402存储的指令,可以执行前述的识别视频合集的方法中所包括的步骤。
其中,处理器401是电子设备的控制中心,可以利用各种接口和线路连接整个故障检测设备的各个部分,通过运行或执行存储在存储器402内的指令以及调用存储在存储器402内的图像,计算设备的各种功能和处理图像,从而对计算设备进行整体监控。可选的,处理器401可包括一个或多个处理单元,处理器401可集成应用处理器和调制解调处理器,其中,处理器401主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。在一些实施例中,处理器401和存储器402可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器401可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本公开实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本公开实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器402作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器402可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器402是能够用于携带或存储具有指令或图像结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本公开实施例中的存储器402还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或图像。
通信接口403是能够用于进行通信的传输接口,可以通过通信接口403接收视频或者发送视频。
参见图5所示的电子设备的进一步地的结构示意图,该电子设备还包括帮助电子设备内的各个器件之间传输信息的基本输入/输出***(I/O***)501、用于存储操作***502、应用程序503和其他程序模块504的大容量存储设备505。
基本输入/输出***501包括有用于显示信息的显示器506和用于用户输入信息的诸如鼠标、键盘之类的输入设备507。其中显示器506和输入设备507都通过连接到***总线400的基本输入/输出***501连接到处理器401。所述基本输入/输出***501还可以包括输入输出控制器以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备505通过连接到***总线400的大容量存储控制器(未示出)连接到处理器401。所述大容量存储设备505及其相关联的计算机可读介质为该服务器包提供非易失性存储。也就是说,大容量存储设备505可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
根据本公开的各种实施例,该计算设备包还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即该计算设备可以通过连接在所述***总线400上的通信接口403连接到网络508,或者说,也可以使用通信接口403来连接到其他类型的网络或远程计算机***(未示出)。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器402,上述指令可由装置的处理器401执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光图像存储设备等。
在一些可能的实施方式中,本公开提供的识别视频合集的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使该电子设备执行本说明书上述描述的根据本公开各种示例性实施方式的识别视频合集的方法中的步骤。
本领域内的技术人员应明白,本公开的实施例可提供为方法、***、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程图像处理设备的处理器以产生一个机器,使得通过计算机或其他可编程图像处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程图像处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程图像处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。

Claims (10)

1.一种识别视频合集的方法,其特征在于,所述方法包括:
获得待识别视频集;
对所述待识别视频集中每个视频所对应的文字信息进行分词处理,获得所述待识别视频集中每个视频的目标文本信息,并确定所述待识别视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度;
对所述待识别视频集中每个视频对应的视频封面图像进行特征提取处理,获得所述待识别视频集中每个视频对应的特征向量;
若所述待识别视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且所述第一视频对应的特征向量与所述第二视频对应的特征向量的距离属于第二预定范围,则确定所述第一视频和所述第二视频属于关联视频,以根据所述关联视频确定所述待识别视频集内的视频合集。
2.如权利要求1所述的方法,其特征在于,所述待识别视频集中每个视频所对应的文字信息包括所述每个视频的标题、字幕、背景文字信息以及语音识别文本中的至少一项。
3.如权利要求2所述的方法,其特征在于,对所述待识别视频集中每个视频所对应的文字信息进行分词处理,获得所述待识别视频集中每个视频的目标文本信息,包括:
将所述待识别视频集中每个视频的标题、字幕、背景文字信息以及语音识别文本中进行分词处理,获得所述待识别视频集中每个视频对应的分词结果;
对所述分词结果进行预设筛选处理,获得所述待识别视频集中每个视频的目标文本信息;其中,所述预设筛选处理至少包括取出停用词处理和过滤低频词处理。
4.如权利要求3所述的方法,其特征在于,确定所述待识别视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度,包括:
对所述目标文本信息进行向量化处理,并对向量化处理后的目标文本信息进行提取和筛选处理,确定所述待识别视频集中每个视频分别对应的目标特征;
基于所述待识别视频集中每个视频分别对应的目标特征,确定所述待识别视频集中每个视频与除自身外其它视频的相似度。
5.如权利要求1-4任一项所述的方法,其特征在于,根据所述关联视频确定所述待识别视频集内的视频合集之后,所述方法还包括:
对所述视频合集进行校验;或者,
对所述视频合集进行关联封装,以对所述视频合集进行关联推送。
6.如权利要求1-4任一项所述的方法,其特征在于,根据所述关联视频确定所述待识别视频集内的视频合集之后,所述方法还包括:
若确定用户浏览所述视频合集中的任一视频,则向所述用户推送所述视频合集中的其它视频。
7.一种识别视频合集的装置,其特征在于,所述装置包括:
获得单元,被配置为执行获得待识别视频集;
第一处理单元,被配置为执行对所述待识别视频集中每个视频所对应的文字信息进行分词处理,获得所述待识别视频集中每个视频的目标文本信息,并确定所述待识别视频集中每个视频的目标文本信息与除自身外其它视频的目标文本信息的相似度;
第二处理单元,被配置为执行对所述待识别视频集中每个视频对应的视频封面图像进行特征提取处理,获得所述待识别视频集中每个视频对应的特征向量;
确定单元,被配置为执行若所述待识别视频集中第一视频的目标文本信息与第二视频的目标文本信息的相似度属于第一预定范围,且所述第一视频对应的特征向量与所述第二视频对应的特征向量的距离属于第二预定范围,则确定所述第一视频和所述第二视频属于关联视频,以根据所述关联视频确定所述待识别视频集内的视频合集。
8.如权利要求7所述的装置,其特征在于,所述待识别视频集中每个视频所对应的文字信息包括所述每个视频的标题、字幕、背景文字信息以及语音识别文本中的至少一项。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至权利要求6中任一项所述的识别视频合集的方法。
10.一种存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至权利要求6中任一项所述的识别视频合集的方法。
CN202011454644.XA 2020-12-10 2020-12-10 一种识别视频合集的方法、装置、电子设备及存储介质 Pending CN112507167A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011454644.XA CN112507167A (zh) 2020-12-10 2020-12-10 一种识别视频合集的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011454644.XA CN112507167A (zh) 2020-12-10 2020-12-10 一种识别视频合集的方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112507167A true CN112507167A (zh) 2021-03-16

Family

ID=74973439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011454644.XA Pending CN112507167A (zh) 2020-12-10 2020-12-10 一种识别视频合集的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112507167A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113486833A (zh) * 2021-07-15 2021-10-08 北京达佳互联信息技术有限公司 多模态特征提取模型训练方法、装置、电子设备
CN113821675A (zh) * 2021-06-30 2021-12-21 腾讯科技(北京)有限公司 视频识别方法、装置、电子设备及计算机可读存储介质
CN114241471A (zh) * 2022-02-23 2022-03-25 阿里巴巴达摩院(杭州)科技有限公司 视频文本识别方法、装置、电子设备及可读存储介质
CN114363660A (zh) * 2021-12-24 2022-04-15 腾讯科技(武汉)有限公司 视频合集确定方法、装置、电子设备及存储介质
CN115052196A (zh) * 2022-05-23 2022-09-13 北京达佳互联信息技术有限公司 一种视频处理方法及相关设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022801A (zh) * 2015-06-30 2015-11-04 北京奇艺世纪科技有限公司 一种热门视频挖掘方法和装置
CN105404698A (zh) * 2015-12-31 2016-03-16 海信集团有限公司 一种教育视频推荐方法及装置
CN106294308A (zh) * 2015-05-19 2017-01-04 深圳市腾讯计算机***有限公司 命名实体识别方法及装置
CN106326371A (zh) * 2016-08-12 2017-01-11 北京奇艺世纪科技有限公司 服务推送方法及装置
CN107404656A (zh) * 2017-06-26 2017-11-28 武汉斗鱼网络科技有限公司 直播视频推荐方法、装置及服务器
CN109033464A (zh) * 2018-08-31 2018-12-18 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN110781347A (zh) * 2019-10-23 2020-02-11 腾讯科技(深圳)有限公司 一种视频处理方法、装置、设备以及可读存储介质
CN111143610A (zh) * 2019-12-30 2020-05-12 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、电子设备和存储介质
CN111225255A (zh) * 2020-01-20 2020-06-02 北京字节跳动网络技术有限公司 目标视频推送播放方法、装置、电子设备及存储介质
CN111767796A (zh) * 2020-05-29 2020-10-13 北京奇艺世纪科技有限公司 一种视频关联方法、装置、服务器和可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294308A (zh) * 2015-05-19 2017-01-04 深圳市腾讯计算机***有限公司 命名实体识别方法及装置
CN105022801A (zh) * 2015-06-30 2015-11-04 北京奇艺世纪科技有限公司 一种热门视频挖掘方法和装置
CN105404698A (zh) * 2015-12-31 2016-03-16 海信集团有限公司 一种教育视频推荐方法及装置
CN106326371A (zh) * 2016-08-12 2017-01-11 北京奇艺世纪科技有限公司 服务推送方法及装置
CN107404656A (zh) * 2017-06-26 2017-11-28 武汉斗鱼网络科技有限公司 直播视频推荐方法、装置及服务器
CN109033464A (zh) * 2018-08-31 2018-12-18 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN110781347A (zh) * 2019-10-23 2020-02-11 腾讯科技(深圳)有限公司 一种视频处理方法、装置、设备以及可读存储介质
CN111143610A (zh) * 2019-12-30 2020-05-12 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、电子设备和存储介质
CN111225255A (zh) * 2020-01-20 2020-06-02 北京字节跳动网络技术有限公司 目标视频推送播放方法、装置、电子设备及存储介质
CN111767796A (zh) * 2020-05-29 2020-10-13 北京奇艺世纪科技有限公司 一种视频关联方法、装置、服务器和可读存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821675A (zh) * 2021-06-30 2021-12-21 腾讯科技(北京)有限公司 视频识别方法、装置、电子设备及计算机可读存储介质
CN113821675B (zh) * 2021-06-30 2024-06-07 腾讯科技(北京)有限公司 视频识别方法、装置、电子设备及计算机可读存储介质
CN113486833A (zh) * 2021-07-15 2021-10-08 北京达佳互联信息技术有限公司 多模态特征提取模型训练方法、装置、电子设备
CN113486833B (zh) * 2021-07-15 2022-10-04 北京达佳互联信息技术有限公司 多模态特征提取模型训练方法、装置、电子设备
CN114363660A (zh) * 2021-12-24 2022-04-15 腾讯科技(武汉)有限公司 视频合集确定方法、装置、电子设备及存储介质
CN114363660B (zh) * 2021-12-24 2023-09-08 腾讯科技(武汉)有限公司 视频合集确定方法、装置、电子设备及存储介质
CN114241471A (zh) * 2022-02-23 2022-03-25 阿里巴巴达摩院(杭州)科技有限公司 视频文本识别方法、装置、电子设备及可读存储介质
CN115052196A (zh) * 2022-05-23 2022-09-13 北京达佳互联信息技术有限公司 一种视频处理方法及相关设备

Similar Documents

Publication Publication Date Title
CN106897428B (zh) 文本分类特征提取方法、文本分类方法及装置
CN112507167A (zh) 一种识别视频合集的方法、装置、电子设备及存储介质
CN110069709B (zh) 意图识别方法、装置、计算机可读介质及电子设备
CN112559800B (zh) 用于处理视频的方法、装置、电子设备、介质和产品
CN109684476B (zh) 一种文本分类方法、文本分类装置及终端设备
CN112749608A (zh) 视频审核方法、装置、计算机设备和存储介质
CN110619051A (zh) 问题语句分类方法、装置、电子设备及存储介质
CN110956037B (zh) 多媒体内容重复判断方法及装置
US20230237255A1 (en) Form generation method, apparatus, and device, and medium
CN112492606A (zh) 垃圾短信的分类识别方法、装置、计算机设备及存储介质
CN113407775B (zh) 视频搜索方法、装置及电子设备
CN113297525A (zh) 网页分类方法、装置、电子设备、及存储介质
CN116010545A (zh) 一种数据处理方法、装置及设备
CN109829043A (zh) 词性确认方法、装置、电子设备及存储介质
CN117009577A (zh) 一种视频数据处理方法、装置、设备及可读存储介质
CN111046232B (zh) 一种视频分类方法、装置及***
CN114579876A (zh) 虚假信息检测方法、装置、设备及介质
CN114625922A (zh) 一种构建词库的方法、装置、电子设备及存储介质
CN114580533A (zh) 特征提取模型的训练方法、装置、设备、介质及程序产品
CN114118087A (zh) 实体确定方法、装置、电子设备及存储介质
CN113704623A (zh) 一种数据推荐方法、装置、设备及存储介质
CN110147488B (zh) 页面内容的处理方法、处理装置、计算设备及存储介质
CN108182191B (zh) 一种热点数据处理方法及其设备
CN113569091A (zh) 视频数据的处理方法、装置
CN111783447B (zh) 基于ngram距离的敏感词检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination