CN111325096A - 直播流采样方法、装置及电子设备 - Google Patents

直播流采样方法、装置及电子设备 Download PDF

Info

Publication number
CN111325096A
CN111325096A CN202010060220.9A CN202010060220A CN111325096A CN 111325096 A CN111325096 A CN 111325096A CN 202010060220 A CN202010060220 A CN 202010060220A CN 111325096 A CN111325096 A CN 111325096A
Authority
CN
China
Prior art keywords
image
sampling
hash code
central point
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010060220.9A
Other languages
English (en)
Other versions
CN111325096B (zh
Inventor
宗显子
何轶
陈扬羽
王鑫宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Douyin Vision Beijing Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010060220.9A priority Critical patent/CN111325096B/zh
Publication of CN111325096A publication Critical patent/CN111325096A/zh
Priority to US17/624,217 priority patent/US12020482B2/en
Priority to PCT/CN2020/124817 priority patent/WO2021143273A1/zh
Application granted granted Critical
Publication of CN111325096B publication Critical patent/CN111325096B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Processing (AREA)

Abstract

本公开实施例中提供了一种直播流采样方法、装置及电子设备,属于图像处理技术领域,该方法包括:从直播流中抽取多帧采样图像;从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。通过本公开的方案,实现了在采用基于FPS的采样操作中有效剔除前向类似图像的方案,避免了漏放情况,且减少了采样审核的总工作量,提高了直播流采样的效率。

Description

直播流采样方法、装置及电子设备
技术领域
本公开涉及图像处理技术领域,尤其涉及一种直播流采样方法、装置及电子设备。
背景技术
在直播过程中,需要对直播的视频内容进行审核,检测是否违规。在审核过程中,要对直播流进行采样,直播流的特点一是数据量非常大,二是对效率要求非常高。常规的基于每秒传输帧数每秒传输帧数(Frames Per Second,简称 FPS)的均匀采样,FPS过高时,会导致数据量过大,给审核增加压力,而FPS 过低时,漏放的情况会比较多。
可见,现有的直播流采样方案存在数据量过大或者漏放情况较多的技术问题。
发明内容
有鉴于此,本公开实施例提供一种直播流采样,至少部分解决现有技术中存在的问题。
第一方面,本公开实施例提供了一种直播流采样方法,包括:
从直播流中抽取多帧采样图像;
从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;
将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。
根据本公开实施例的一种具体实现方式,所述从全部所述采样图像中筛选出前向类似图像的步骤,包括:
计算每帧采样图像的哈希码;
获取每帧采样图像与前一相邻帧采样图像的哈希码;
依据每帧采样图像与前一相邻帧采样图像的哈希码,判断所述采样图像是否为前向类似图像。
根据本公开实施例的一种具体实现方式,所述依据每帧采样图像与前一相邻帧采样图像的哈希码,判断所述采样图像是否为前向类似图像的步骤,包括:
计算所述采样图像的哈希码与前一相邻帧采样图像的哈希码之间的汉明距离;
判断所述汉明距离是否大于或者等于预设阈值;
若所述汉明距离大于或者等于所述预设阈值,则判定所述采样图像不是前向类似图像;
若所述汉明距离小于所述预设阈值,则判定所述采样图像是前向类似图像。
根据本公开实施例的一种具体实现方式,所述计算每帧采样图像的哈希码的步骤,包括:
从所述采样图像中选择预设数量的中心点;
确定每个中心点的邻域点;
计算每个中心点与其全部邻域点之间的预设类型的参数差值,作为所述中心点的哈希码段;
将全部所述中心点的哈希码段组合得到所述采样图像的哈希码。
根据本公开实施例的一种具体实现方式,所述计算每个中心点与其全部邻域点之间的预设类型的参数差值,作为所述中心点的哈希码段的步骤,包括:
计算所述中心点与每一邻域点的像素值对比值;
按照预设的排列顺序,依次排列所述中心点与全部所述邻域点的像素值对比值,得到所述中心点的哈希码段。
根据本公开实施例的一种具体实现方式,所述计算所述中心点与每一邻域点的像素值对比值的步骤,包括:
采集所述中心点与所述邻域点的像素值;
若所述中心点的像素值大于所述领域点的像素值,则将所述中心点与所述领域点的像素值对比值记录为1;
若所述中心点的像素值小于或者等于所述领域点的像素值,则将所述中心点与所述领域点的像素值对比值记录为0。
根据本公开实施例的一种具体实现方式,所述确定每个中心点的邻域点的步骤,包括:
确定在所述采样图像上与所述中心点邻接的全部像素点。
根据本公开实施例的一种具体实现方式,所述计算每帧采样图像的哈希码的步骤,包括:
对所述采样图像进行灰度处理;
计算经过灰度处理后的所述采样图像的哈希码。
根据本公开实施例的一种具体实现方式,所述计算每帧采样图像的哈希码的步骤,包括:
将所述采样图像进行尺度变换,获得固定尺寸的采样图像;
计算所述固定尺寸的采样图像的哈希码。
根据本公开实施例的一种具体实现方式,所述计算所述固定尺寸的采样图像的哈希码的步骤,包括:
将所述固定尺寸的采样图像进行尺度变换,获得至少两个不同预设尺度的采样图像;
获取每个预设尺度的采样图像的哈希码段;
按照预设的排列顺序,依次排列全部预设尺度的采样图像的哈希码段,得到所述采样图像的哈希码。
第二方面,本公开实施例提供了一种直播流采样装置,包括:
抽取模块,用于从直播流中抽取多帧采样图像;
筛选模块,用于从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;
处理模块,用于将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的直播流采样方法。
第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的直播流采样方法。
第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的直播流采样方法。
本公开实施例中的直播流采样方案,包括:从直播流中抽取多帧采样图像;从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。通过本公开的方案,实现了在采用高FPS的采样操作中有效剔除前向类似图像的方案,避免了漏放情况,且减少了采样审核的总工作量,提高了直播流采样的效率。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本公开实施例提供的一种直播流采样方法的流程示意图;
图2为本公开实施例提供的另一种直播流采样方法的部分流程示意图;
图3为本公开实施例提供的另一种直播流采样方法的部分流程示意图;
图4为本公开实施例提供的直播流采样方法所涉及的邻域点选取示意图;
图5为本公开实施例提供的一种直播流采样装置的结构示意图;
图6为本公开实施例提供的电子设备的示意图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
本公开实施例提供一种直播流采样方法。本实施例提供的直播流采样方法可以由一计算装置来执行,该计算装置可以实现为软件,或者实现为软件和硬件的组合,该计算装置可以集成设置在服务器、终端设备等中。
参见图1,本公开实施例提供的一种直播流采样方法,包括:
S101,从直播流中抽取多帧采样图像;
本实施例提供的直播流采样方法,用于在直播流中抽帧图像,对直播的视频内容进行审核,以检测视频内容是否存在违规情况。直播流的数据量非常大,为保证较高的抽样效率,可以采用固定的FPS进行均匀采样,从直播流中抽取多帧采样图像。在FPS较高的情况下,此时抽取的采样图像的数据量也是较大的。
S102,从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;
在上述步骤中,基于FPS均匀采样到多帧采样图像。考虑到相邻的几帧图像的内容可能比较相似,若对全部采样图像均进行审核,就可能造成审核的工作量巨大,且存在重复审核的情况。电子设备可以先将所抽取的多帧采样图像进行筛选,找出来哪些采样图像与其他图像类似。将与前一相邻帧采样图像类似的采样图像定义为前向类似图像,电子设备从全部采样图像中筛选出存在的前向类似图像。需要说明的是,这里的类似可以为内容完全相同,也可以为内容比较接近但不完全相同的情况,前向邻接帧也可以为与前序全部邻接帧中存在内容类似的图像,或者,也可以通过筛选后向类似图像的方式来减少类似图像,不作限定。
S103,将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。
依据上述步骤从全部采样图像中筛选出与前一邻接帧图像类似的前向类似图像后,即可从全部采样图像中除去所筛选出的前向类似图像,将剩余的采样图像作为所述直播流的采样图像,依据该部分剩余的采样图像对直播流进行内容审核。
在一种具体实现方式,如图2所示,步骤S102所述的,从全部所述采样图像中筛选出前向类似图像,可以包括:
S201,计算每帧采样图像的哈希码;
本实施方式中,依据每帧采样图像的哈希码来判断图像之间的类似程度。其中,计算图像的哈希码是指利用哈希算法,让同一组图像中的每个采样图像按照自己不同的特征尽量的有不同的哈希码,但不表示不同的对象哈希码完全不同。
S202,获取每帧采样图像与前一相邻帧采样图像的哈希码;
S203,依据每帧采样图像与前一相邻帧采样图像的哈希码,判断所述采样图像是否为前向类似图像。
计算出全部采样图像中的每帧图像的哈希码之后,就可以将从第二帧采样图像起的每一帧采样图像与其前一相邻帧采样图像进行哈希码比对,以判断这两个图像的类似程度,进而判断当前帧的采样图像是否为前向类似图像。
具体实施时,步骤S203所述的,依据每帧采样图像与前一相邻帧采样图像的哈希码,判断所述采样图像是否为前向类似图像,可以包括:
计算所述采样图像的哈希码与前一相邻帧采样图像的哈希码之间的汉明距离;
判断所述汉明距离是否大于或者等于预设阈值;
若所述汉明距离大于或者等于所述预设阈值,则判定所述采样图像不是前向类似图像;
若所述汉明距离小于所述预设阈值,则判定所述采样图像是前向类似图像。
本实施方式中,在进行采样图像之间的哈希码比对时,计算两个图像哈希码之间的汉明距离,依次来判断当前帧的采样图像是否为前向类似图像。其中,汉明距离是指两个等长字符串之间对应位置上的不同字符的个数,即是将一个字符串变换成另外一个字符串所需要替换的字符个数。通过计算两个采样图像的哈希码之间的汉明距离,就可以推算采样图像之间的类似程度。若汉明距离大于或者等于预设阈值,则表示二者之间的哈希码差别较大,当前帧的采样图像不是前向类似图像。若汉明距离小于预设阈值,则表示二者之间的哈希码差值较小,当前帧的采样图像是前向类似图像。需要说明的是,所设定的预设阈值与过滤需求、采样图像的数量或者选择点数的关联性较大,不作具体数值的限定。
上述实施方式中,如图3所示,步骤S201所述的,计算每帧采样图像的哈希码,可以包括:
S301,从所述采样图像中选择预设数量的中心点;
在具体计算每帧采样图像的哈希码时,先从采样图像中选择预设数量的中心点,作为计算采样图像的哈希码的参考点。
S302,确定每个中心点的邻域点;
本实施方式中计算哈希码的依据是参考点与周围像素点之间的显示参数的差值,在采样图像上选择中心点后,再确定每个中心点的邻域点。
可选的,所述确定每个中心点的邻域点的步骤,可以包括:
确定在所述采样图像上与所述中心点邻接的全部像素点。
若中心点位于采样图像的边缘行列上,则其邻域点为中心点向采样图像内侧延伸过程中邻接的像素点,边缘行列上的中心点通常有5个邻域点(如图4 中所示的A及a),或者3个邻域点(如图4中所示的B及b)。若中心点位于采样图像上的非边缘行列上,则其邻域点为中心点向周围延伸过程中邻接的像素点,非边缘行列上的中心点通常有8个领域点(如图4中所示的C及c)等。
S303,计算每个中心点与其全部邻域点之间的预设类型的参数差值,作为所述中心点的哈希码段;
在采样图像上选择多个中心点,先计算出每个中心点对应的哈希码段,主要是计算每个中心点与其全部邻域点之间的参数差值。
可选的,所述计算每个中心点与其全部邻域点之间的预设类型的参数差值,作为所述中心点的哈希码段的步骤,可以包括:
计算所述中心点与每一邻域点的像素值对比值;
按照预设的排列顺序,依次排列所述中心点与全部所述邻域点的像素值对比值,得到所述中心点的哈希码段。
进一步的,所述计算所述中心点与每一邻域点的像素值对比值的步骤,包括:
采集所述中心点与所述邻域点的像素值;
若所述中心点的像素值大于所述领域点的像素值,则将所述中心点与所述领域点的像素值对比值记录为1;
若所述中心点的像素值小于或者等于所述领域点的像素值,则将所述中心点与所述领域点的像素值对比值记录为0。
S304,将全部所述中心点的哈希码段组合得到所述采样图像的哈希码。
依据上述步骤获得每个中心点对应的哈希码段之后,组合即可得到该采样图像对应的哈希码。
为保证对比效果,在计算哈希码时,预先约定中心点的选择参数、中心点各邻域点的像素值对比值得排列顺序以及全部中心点对应的哈希码段的排列顺序,这样,在一致性操作的情况下,对比效果更准确。
此外,根据本公开实施例的另一种具体实现方式,所述计算每帧采样图像的哈希码的步骤,包括:
对所述采样图像进行灰度处理;
计算经过灰度处理后的所述采样图像的哈希码。
将采样图像经过灰度处理后再计算哈希码,减少RGB参数导致的多余的计算量,简化了哈希码计算过程。
另外,所述计算每帧采样图像的哈希码的步骤,可以包括:
将所述采样图像进行尺度变换,获得固定尺寸的采样图像;
计算所述固定尺寸的采样图像的哈希码。
进一步的,所述计算所述固定尺寸的采样图像的哈希码的步骤,包括:
将所述固定尺寸的采样图像进行尺度变换,获得至少两个不同预设尺度的采样图像;
获取每个预设尺度的采样图像的哈希码段;
按照预设的排列顺序,依次排列全部预设尺度的采样图像的哈希码段,得到所述采样图像的哈希码。
将每个采样图像的初始尺度均变换为固定尺寸,再固定尺寸的基础上再增加同类的尺度变换,这样,得到的哈希码值更丰富和准确,哈希码对比的参考性就更高。
再具体使用时,针对给定的采样图片计算哈希码,计算方法如下:
首先,将给定的RGB图像转换为灰度图,再对给定的原始图片进行尺度变换,Resize到固定大小,可选择多个尺度A1、A2、A3等。尺度越多,计算出的哈希码越精确。
接着,分别针对上述步骤中得到的不同尺度的图片,选取适当的中心点 Center_Point,一般为N*N个,例如4、9、16个等等,同时,选取适合大小的和数量的邻域点Neighbour_Points。
针对其每个中心点Center_Point,分别对比其邻域点与中心点像素值的大小,Center_Point>Neighbour_Points取1,Center_Point<=Neighbour_Points取0。
对于不同尺度的A1、A2、A3等重复这一过程,可以一串哈希码来代表给定的图片,得到一个代表该图像的向量值,例如v=【0001000】;
通过计算不同哈希码的距离,来判断图片之间的相似度。
如图4所示,将原始图片Resize到8*8,选取(2,2)、(2,5)、(5,2)、(5, 5)这四个中心点Center_Point,围绕每个Center_Point,选取其周围1pix的8个 Neighbour_Points来分别计算hashcode,最终可以得到4*8=32的哈希码。、本公开实施例中的直播流采样方案,包括:从直播流中抽取多帧采样图像;从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。通过本公开的方案,实现了在采用高FPS的采样操作中有效剔除前向类似图像的方案,避免了漏放情况,且减少了采样审核的总工作量,提高了直播流采样的效率。
与上面的方法实施例相对应,参见图5,本公开实施例还提供了一种直播流采样装置50,包括:
抽取模块501,用于从直播流中抽取多帧采样图像;
筛选模块502,用于从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;
处理模块503,用于将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。
图5所示装置可以对应的执行上述方法实施例中的内容,本实施例未详细描述的部分,参照上述方法实施例中记载的内容,在此不再赘述。
参见图6,本公开实施例还提供了一种电子设备60,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述方法实施例中的直播流采样方法。
本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述方法实施例中的直播流采样方法。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述方法实施例中的直播流采样方法。
下面参考图6,其示出了适于用来实现本公开实施例的电子设备60的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备60可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备60操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O) 接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备60与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备60,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609 从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM 或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备能够实现上述方法实施例提供的方案。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备能够实现上述方法实施例提供的方案。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、 Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN) —连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

Claims (13)

1.一种直播流采样方法,其特征在于,包括:
从直播流中抽取多帧采样图像;
从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;
将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。
2.根据权利要求1所述的方法,其特征在于,所述从全部所述采样图像中筛选出前向类似图像的步骤,包括:
计算每帧采样图像的哈希码;
获取每帧采样图像与前一相邻帧采样图像的哈希码;
依据每帧采样图像与前一相邻帧采样图像的哈希码,判断所述采样图像是否为前向类似图像。
3.根据权利要求2所述的方法,其特征在于,所述依据每帧采样图像与前一相邻帧采样图像的哈希码,判断所述采样图像是否为前向类似图像的步骤,包括:
计算所述采样图像的哈希码与前一相邻帧采样图像的哈希码之间的汉明距离;
判断所述汉明距离是否大于或者等于预设阈值;
若所述汉明距离大于或者等于所述预设阈值,则判定所述采样图像不是前向类似图像;
若所述汉明距离小于所述预设阈值,则判定所述采样图像是前向类似图像。
4.根据权利要求3所述的方法,其特征在于,所述计算每帧采样图像的哈希码的步骤,包括:
从所述采样图像中选择预设数量的中心点;
确定每个中心点的邻域点;
计算每个中心点与其全部邻域点之间的预设类型的参数差值,作为所述中心点的哈希码段;
将全部所述中心点的哈希码段组合得到所述采样图像的哈希码。
5.根据权利要求4所述的方法,其特征在于,所述计算每个中心点与其全部邻域点之间的预设类型的参数差值,作为所述中心点的哈希码段的步骤,包括:
计算所述中心点与每一邻域点的像素值对比值;
按照预设的排列顺序,依次排列所述中心点与全部所述邻域点的像素值对比值,得到所述中心点的哈希码段。
6.根据权利要求5所述的方法,其特征在于,所述计算所述中心点与每一邻域点的像素值对比值的步骤,包括:
采集所述中心点与所述邻域点的像素值;
若所述中心点的像素值大于所述领域点的像素值,则将所述中心点与所述领域点的像素值对比值记录为1;
若所述中心点的像素值小于或者等于所述领域点的像素值,则将所述中心点与所述领域点的像素值对比值记录为0。
7.根据权利要求4所述的方法,其特征在于,所述确定每个中心点的邻域点的步骤,包括:
确定在所述采样图像上与所述中心点邻接的全部像素点。
8.根据权利要求2至7中任一项所所述的方法,其特征在于,所述计算每帧采样图像的哈希码的步骤,包括:
对所述采样图像进行灰度处理;
计算经过灰度处理后的所述采样图像的哈希码。
9.根据权利要求8所述的方法,其特征在于,所述计算每帧采样图像的哈希码的步骤,包括:
将所述采样图像进行尺度变换,获得固定尺寸的采样图像;
计算所述固定尺寸的采样图像的哈希码。
10.根据权利要求9所述的方法,其特征在于,所述计算所述固定尺寸的采样图像的哈希码的步骤,包括:
将所述固定尺寸的采样图像进行尺度变换,获得至少两个不同预设尺度的采样图像;
获取每个预设尺度的采样图像的哈希码段;
按照预设的排列顺序,依次排列全部预设尺度的采样图像的哈希码段,得到所述采样图像的哈希码。
11.一种直播流采样装置,其特征在于,包括:
抽取模块,用于从直播流中抽取多帧采样图像;
筛选模块,用于从全部所述采样图像中筛选出前向类似图像,其中,所述前向类似图像为与前一相邻帧采样图像类似的采样图像;
处理模块,用于将全部采样图像中除去所述前向类似图像的剩余采样图像作为所述直播流的采样图像。
12.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述权利要求1-10中任一项所述的直播流采样方法。
13.一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述权利要求1-10中任一项所述的直播流采样方法。
CN202010060220.9A 2020-01-19 2020-01-19 直播流采样方法、装置及电子设备 Active CN111325096B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010060220.9A CN111325096B (zh) 2020-01-19 2020-01-19 直播流采样方法、装置及电子设备
US17/624,217 US12020482B2 (en) 2020-01-19 2020-10-29 Live streaming sampling method and apparatus, and electronic device
PCT/CN2020/124817 WO2021143273A1 (zh) 2020-01-19 2020-10-29 直播流采样方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010060220.9A CN111325096B (zh) 2020-01-19 2020-01-19 直播流采样方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111325096A true CN111325096A (zh) 2020-06-23
CN111325096B CN111325096B (zh) 2021-04-20

Family

ID=71167023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010060220.9A Active CN111325096B (zh) 2020-01-19 2020-01-19 直播流采样方法、装置及电子设备

Country Status (2)

Country Link
CN (1) CN111325096B (zh)
WO (1) WO2021143273A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085097A (zh) * 2020-09-09 2020-12-15 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
WO2021143273A1 (zh) * 2020-01-19 2021-07-22 北京字节跳动网络技术有限公司 直播流采样方法、装置及电子设备
CN114419018A (zh) * 2022-01-25 2022-04-29 重庆紫光华山智安科技有限公司 图像采样方法、***、设备及介质
US12020482B2 (en) 2020-01-19 2024-06-25 Beijing Bytedance Network Technology Co., Ltd. Live streaming sampling method and apparatus, and electronic device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114205632A (zh) * 2021-12-17 2022-03-18 深圳Tcl新技术有限公司 视频预览方法、装置、电子设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020181780A1 (en) * 2001-06-05 2002-12-05 Matrox Electronic Systems Ltd. Geometic hashing method for model-based recognition of an object
US8156341B2 (en) * 2007-09-21 2012-04-10 Electronics And Telecommunications Research Institute Pattern recognition method and apparatus for data protection
CN105025392A (zh) * 2015-06-25 2015-11-04 西北工业大学 基于摘要空间特征学习的视频摘要关键帧提取方法
CN107358141A (zh) * 2016-05-10 2017-11-17 阿里巴巴集团控股有限公司 数据识别的方法及装置
CN109670071A (zh) * 2018-10-22 2019-04-23 北京大学 一种序列化多特征指导的跨媒体哈希检索方法和***
CN110188223A (zh) * 2019-06-06 2019-08-30 腾讯科技(深圳)有限公司 图像处理方法、装置及计算机设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887457B (zh) * 2010-07-02 2012-10-03 杭州电子科技大学 基于内容的复制图像检测方法
CN107145487A (zh) * 2016-03-01 2017-09-08 深圳中兴力维技术有限公司 图像搜索方法和装置
CN110472484B (zh) * 2019-07-02 2021-11-09 山东师范大学 基于多视图特征的视频关键帧提取方法、***及设备
CN110505495B (zh) * 2019-08-23 2021-12-07 北京达佳互联信息技术有限公司 多媒体资源抽帧方法、装置、服务器及存储介质
CN111325096B (zh) * 2020-01-19 2021-04-20 北京字节跳动网络技术有限公司 直播流采样方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020181780A1 (en) * 2001-06-05 2002-12-05 Matrox Electronic Systems Ltd. Geometic hashing method for model-based recognition of an object
US8156341B2 (en) * 2007-09-21 2012-04-10 Electronics And Telecommunications Research Institute Pattern recognition method and apparatus for data protection
CN105025392A (zh) * 2015-06-25 2015-11-04 西北工业大学 基于摘要空间特征学习的视频摘要关键帧提取方法
CN107358141A (zh) * 2016-05-10 2017-11-17 阿里巴巴集团控股有限公司 数据识别的方法及装置
CN109670071A (zh) * 2018-10-22 2019-04-23 北京大学 一种序列化多特征指导的跨媒体哈希检索方法和***
CN110188223A (zh) * 2019-06-06 2019-08-30 腾讯科技(深圳)有限公司 图像处理方法、装置及计算机设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DAYONG TIAN ET AL.: "Global Hashing System for Fast Image Search", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 *
张智丰 等: "一种稳健的紧凑图像哈希算法", 《激光与光电子学进展》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021143273A1 (zh) * 2020-01-19 2021-07-22 北京字节跳动网络技术有限公司 直播流采样方法、装置及电子设备
US12020482B2 (en) 2020-01-19 2024-06-25 Beijing Bytedance Network Technology Co., Ltd. Live streaming sampling method and apparatus, and electronic device
CN112085097A (zh) * 2020-09-09 2020-12-15 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN114419018A (zh) * 2022-01-25 2022-04-29 重庆紫光华山智安科技有限公司 图像采样方法、***、设备及介质

Also Published As

Publication number Publication date
WO2021143273A1 (zh) 2021-07-22
US20220383637A1 (en) 2022-12-01
CN111325096B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN111325096B (zh) 直播流采样方法、装置及电子设备
CN110189246B (zh) 图像风格化生成方法、装置及电子设备
CN110413812B (zh) 神经网络模型的训练方法、装置、电子设备及存储介质
CN110213614B (zh) 从视频文件中提取关键帧的方法和装置
CN110365973B (zh) 视频的检测方法、装置、电子设备及计算机可读存储介质
CN110415276B (zh) 运动信息计算方法、装置及电子设备
CN111309962B (zh) 提取音频片段的方法、装置以及电子设备
CN110288549B (zh) 视频修复方法、装置及电子设备
CN112037223B (zh) 图像缺陷检测方法、装置及电子设备
US20230334880A1 (en) Hot word extraction method and apparatus, electronic device, and medium
WO2022105622A1 (zh) 图像分割方法、装置、可读介质及电子设备
CN117541511A (zh) 一种图像处理方法、装置、电子设备及存储介质
CN110321454B (zh) 视频的处理方法、装置、电子设备及计算机可读存储介质
CN110852042A (zh) 字符类型转换方法和装置
CN111832354A (zh) 目标对象年龄识别方法、装置及电子设备
CN110751120A (zh) 一种检测方法、装置及电子设备
US12020482B2 (en) Live streaming sampling method and apparatus, and electronic device
CN111696041B (zh) 图像处理方法、装置及电子设备
CN111402867B (zh) 混合采样率声学模型训练方法、装置及电子设备
CN114972113A (zh) 图像处理方法、装置、电子设备及可读存储介质
CN113033680A (zh) 视频分类方法、装置、可读介质及电子设备
CN111626045A (zh) 字符长度计算方法、装置及电子设备
CN110189279B (zh) 模型训练方法、装置、电子设备及存储介质
CN110674348B (zh) 视频分类方法、装置及电子设备
CN113672675B (zh) 数据检测方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Tiktok vision (Beijing) Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.