CN116708892A - 一种音画同步检测方法、装置、设备和存储介质 - Google Patents

一种音画同步检测方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN116708892A
CN116708892A CN202310813430.4A CN202310813430A CN116708892A CN 116708892 A CN116708892 A CN 116708892A CN 202310813430 A CN202310813430 A CN 202310813430A CN 116708892 A CN116708892 A CN 116708892A
Authority
CN
China
Prior art keywords
video
key frame
audio data
audio
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310813430.4A
Other languages
English (en)
Inventor
戴智勇
接宏恩
王继成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Original Assignee
Douyin Vision Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd filed Critical Douyin Vision Co Ltd
Priority to CN202310813430.4A priority Critical patent/CN116708892A/zh
Publication of CN116708892A publication Critical patent/CN116708892A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43072Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440281Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开实施例提供了一种音画同步检测方法、装置、设备和存储介质。该方法包括:获取待检测的第一视频,第一视频是对音画同步的第二视频进行转码获得的视频;提取第一视频中的第一关键帧和第二视频中的第二关键帧,并对第一关键帧和第二关键帧进行对齐,确定与第一关键帧对齐的目标第二关键帧;提取第一关键帧对应的第一音频数据和目标第二关键帧对应的第二音频数据;将第一音频数据与第二音频数据进行匹配,确定第一视频的音画同步检测结果。通过本公开实施例的技术方案,可以对转码后的视频进行音画同步的自动检测,从而提高了音画同步的检测效率,并且保证了音画同步检测的准确性。

Description

一种音画同步检测方法、装置、设备和存储介质
技术领域
本公开实施例涉及计算机技术,尤其涉及一种音画同步检测方法、装置、设备和存储介质。
背景技术
随着计算机技术的快速发展,往往需要对视频进行转码处理。然而,在视频转码过程中往往会出现音画不同步的情况,也就是音频和视频画面不能准确保持一致。例如,视频画面显示正在说话但没有相应的声音,极大降低了用户观看体验。目前,通常是通过人工观看视频的方式,自主判断是否存在因转码而导致音画不同步的情况。可见,这种人工检测方式费时费力,降低了音画同步的检测效率。
发明内容
本公开提供一种音画同步检测方法、装置、设备和存储介质,以对转码后的视频进行音画同步的自动检测,从而提高了音画同步的检测效率,并且保证了音画同步检测的准确性。
第一方面,本公开实施例提供了一种音画同步检测方法,包括:
获取待检测的第一视频,所述第一视频是对音画同步的第二视频进行转码获得的视频;
提取所述第一视频中的第一关键帧和所述第二视频中的第二关键帧,并对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧;
提取所述第一关键帧对应的第一音频数据和所述目标第二关键帧对应的第二音频数据;
将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果。
第二方面,本公开实施例还提供了一种音画同步检测装置,包括:
第一视频获取模块,用于获取待检测的第一视频,所述第一视频是对音画同步的第二视频进行转码获得的视频;
关键帧对齐模块,用于提取所述第一视频中的第一关键帧和所述第二视频中的第二关键帧,并对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧;
音频数据提取模块,用于提取所述第一关键帧对应的第一音频数据和所述目标第二关键帧对应的第二音频数据;
音画同步检测模块,用于将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例任一所述的音画同步检测方法。
第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例任一所述的音画同步检测方法。
本公开实施例,通过将转码前音画同步的第二视频作为参考,对转码后的第一视频进行检测,并将关键帧对齐后的第一关键帧对应的第一音频数据和目标第二关键帧对应的第二音频数据进行匹配,从而可以准确地确定第一视频是否存在因转码而导致的音画不同步的情况,实现了音画同步的自动检测,并且保证了音画同步检测的准确性。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是本公开实施例所提供的一种音画同步检测方法流程示意图;
图2是本公开实施例所涉及的一种第一音频数据和第二音频数据的波形匹配图;
图3是本公开实施例所提供的另一种音画同步检测方法流程示意图;
图4是本公开实施例所涉及的一种音频数据提取的示例;
图5是本公开实施例所提供的一种音画同步检测装置的结构示意图;
图6是本公开实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1为本公开实施例所提供的一种音画同步检测方法的流程示意图,本公开实施例适用于对转码后的视频进行音画同步检测的情况,该方法可以由音画同步检测装置来执行,该装置可以通过软件和/或硬件的形式实现,可选的,通过电子设备来实现,该电子设备可以是移动终端、PC端或服务器等。
如图1所示,音画同步检测方法具体包括以下步骤:
S110、获取待检测的第一视频,第一视频是对音画同步的第二视频进行转码获得的视频。
其中,第一视频是指转码后的待检测视频。第二视频是指转码前的视频。第二视频中的音频和视频画面是同步的,从而可以将第二视频作为参考视频,对第一视频进行音画同步的检测。
具体地,用户可以在客户端中制作视频并发布视频。服务器在接收到客户端发布上传的视频后,需要对上传视频进行转码处理,比如调整视频分辨率和码率等,从而可以提升画面质量,并将转码后的视频下发至其他客户端中进行播放。在上述应用场景中,可以将上传至服务器的视频作为音画同步的第二视频,转码后的视频作为待检测的第一视频。通过以转码前的第二视频作为音画同步的参考视频,可以准确地检测出第一视频是否存在因视频转码而导致的音画不同步的情况。
S120、提取第一视频中的第一关键帧和第二视频中的第二关键帧,并对第一关键帧和第二关键帧进行对齐,确定与第一关键帧对齐的目标第二关键帧。
其中,关键帧可以是指对视频内容起到决定性作用的视频帧,比如,存在场景切换的视频帧、存在运动变化的视频帧、关键动作所处于的视频帧等。第一关键帧可以是指第一视频中的关键帧。第一关键帧的数量可以为一个或多个。第二关键帧可以是指第二视频中的关键帧。第二关键帧的数量也可以为一个或多个。第一关键帧的数量与第二关键帧的数量可能相同,也可能不同。对齐是指将具有相同画面的关键帧进行对齐的操作。目标第二关键帧是指与第一关键帧具有相同画面的第二关键帧。
具体地,对第一视频和第二视频进行关键帧的检测,提取出第一视频中的所有第一关键帧和第二视频中的所有第二关键帧。可以通过检测第一关键帧与第二关键帧之间的图像相似度的方式,对第一关键帧和第二关键帧进行对齐处理。例如,针对每个第一关键帧而言,可以确定第一关键帧与每个第二关键帧之间的图像相似度,并可以将图像相似度最高且大于或等于预设相似度阈值的第二关键帧作为与该第一关键帧对齐的目标第二关键帧,从而获得与该第一关键帧具有相同画面的目标第二关键帧。
其中,图像相似度可以利用任意一种能够衡量两个图像相似度的指标进行表征。例如,图像相似度利用结构相似性SSIM(Structural Similarity)指标进行表征。SSIM指标的取值范围为0到1,并且SSIM指标越大表明图像相似度越高。
需要说明的是,若所有第二关键帧中不存在与某个第一关键帧相同的目标第二关键帧,则表明无法对该第一关键帧进行对齐,此时可以忽略该第一关键帧,仅便利用能够对齐的第一关键帧进行后续的音画同步检测。
S130、提取第一关键帧对应的第一音频数据和目标第二关键帧对应的第二音频数据。
具体地,针对每个第一关键帧而言,可以在第一视频中的第一关键帧位置处,提取预设音频时长对应的第一音频数据。在第二视频中的目标第二关键帧位置处,也提取该预设音频时长对应的第二音频数据,从而提取出的第一音频数据和第二音频数据具有相同音频时长。例如,提取出的第一音频数据是以第一关键帧的播放时间戳为预设参考时刻,具有预设音频时长的音频数据。提取出的第二音频数据是以目标第二关键帧的播放时间戳为预设参考时刻,具有预设音频时长的音频数据。其中,预设参考时刻可以是指音频数据的开始时刻、中心时刻或者结束时刻。
需要说明的是,对齐后的第一关键帧和目标第二视频帧的画面内容是相同的,但其对应的播放时间戳可能是不同的。在提取出的第一音频数据和第二音频数据具有相同音频时长时,第一音频数据和第二音频数据需要在关键帧的相同位置处提取,以保证后续音画同步检测的准确性。例如,从第一视频中提取以第一关键帧的播放时间戳为开始时刻,具有预设音频时长的第一音频数据。从第二视频中提取以目标第二关键帧的播放时间戳为开始时刻,具有预设音频时长的第二音频数据。
S140、将第一音频数据与第二音频数据进行匹配,确定第一视频的音画同步检测结果。
具体地,图2给出了一种第一音频数据和第二音频数据的波形匹配图。如图2所示,第一音频数据和第二音频数据具有相同的音频时长,针对于此,可以基于图2中两个音频波形之间的相似程度确定第一音频数据与第二音频数据之间的匹配结果。例如,可以将第一音频数据和第二音频数据之间的协方差作为第一音频数据与第二音频数据之间的音频相似度,并在该音频相似度大于或等于预设相似度阈值时,确定第一音频数据与第二音频数据匹配成功。在该音频相似度小于预设相似度阈值时,确定第一音频数据与第二音频数据匹配失败。若匹配成功,则表明在该第一关键帧位置处的音频和视频画面是同步的。若匹配失败,则表明在该第一关键帧位置处的音频和视频画面是不同步的,存在因转码而导致的音画不同步的情况。根据第一视频中的每个第一关键帧对应的匹配结果,可以确定第一视频的音画同步检测结果。例如,若第一视频中所有第一关键帧对应的匹配结果为匹配成功,则确定第一视频的音画同步检测结果为音画同步。若第一视频中存在至少一个第一关键帧对应的匹配结果为匹配失败,则确定第一视频的音画同步检测结果为音画不同步,第一视频中存在因转码而导致的音画不同步的情况。
本公开实施例的技术方案,通过将转码前音画同步的第二视频作为参考对转码后的第一视频进行检测,并将关键帧对齐后的第一关键帧对应的第一音频数据和目标第二关键帧对应的第二音频数据进行匹配,从而可以准确地确定第一视频是否存在因转码而导致的音画不同步的情况,实现了音画同步的自动检测,并且保证了音画同步检测的准确性。
作为一种可选的实施例,S120中的“对第一关键帧和第二关键帧进行对齐,确定与第一关键帧对齐的目标第二关键帧”,可以包括:获取第一关键帧可选的第二关键帧序列;按照第二关键帧序列的顺序,依次获取当前第二关键帧,并确定第一关键帧与当前第二关键帧之间的图像相似度;若图像相似度大于或等于预设相似度阈值,则将当前第二视频帧确定为与第一关键帧对齐的目标第二关键帧。
其中,图像相似度可以利用任意一种能够衡量两个图像相似度的指标进行表征。例如,图像相似度利用结构相似性SSIM(Structural Similarity)指标进行表征。SSIM指标的取值范围为0到1,并且SSIM指标越大表明图像相似度越高。
具体地,提取出的所有第一关键帧可以按照视频播放先后顺序进行排序,获得第一关键帧序列,比如{A1,A2,……,An}。同理,提取出的所有第二关键帧可以按照视频播放先后顺序进行排序,获得第二关键帧序列,比如{B1,B2,……,Bm}。可以按照第一关键帧序列的顺序,依次从第二关键帧序列中确定每个第一关键帧对齐的目标第二关键帧。
例如,第一个第一关键帧A1可选的第二关键帧序列为{B1,B2,……,Bm},此时按照该第二关键帧序列的顺序,可以先将第二关键帧B1作为当前第二关键帧,并检测第一关键帧A1与第二关键帧B1之间的图像相似度是否大于或等于预设相似度阈值;若是,则表明第一关键帧A1与第二关键帧B1画面相似,此时可以直接将第二关键帧B1作为与第一关键帧A1对齐的目标第二关键帧;若否,则将下一个第二关键帧B2作为当前第二关键帧重新检测第一关键帧A1与第二关键帧B2之间的图像相似度是否大于或等于预设相似度阈值,直到确定出与第一关键帧A1相匹配的第二关键帧为止,从而完成第一关键帧A1的对齐。假设与第一关键帧A1对齐的目标第二关键帧为B2,则对第二个第一关键帧A2进行对齐时,由于与第一关键帧A2对齐的目标第二关键帧是出现在第二关键帧B2后面的关键帧中,从而可以将第二关键帧B2之后的第二关键帧作为第一关键帧A2可选的第二关键帧序列,即{B3,B4,……,Bm},并基于上述相同的检测过程,从第二关键帧序列{B3,B4,……,Bm}中确定与第一关键帧A2对齐的目标第二关键帧。同理依次执行,可以更加快速地获得与每个第一关键帧对齐的目标第二关键帧,从而提高了关键帧对齐速度,进一步提高了音画同步的检测效率。
图3为本公开实施例所提供的另一种音画同步检测方法的流程示意图,本公开实施例在上述公开实施例的基础上,提取的第一音频数据的音频时长大于第二音频数据的音频时长,并在此基础上,对步骤“将第一音频数据与第二音频数据进行匹配,确定第一视频的音画同步检测结果”进行了优化。其中与上述各公开实施例相同或相应的术语的解释在此不再赘述。
如图3所示,音画同步检测方法具体包括以下步骤:
S310、获取待检测的第一视频,第一视频是对音画同步的第二视频进行转码获得的视频。
S320、提取第一视频中的第一关键帧和第二视频中的第二关键帧,并对第一关键帧和第二关键帧进行对齐,确定与第一关键帧对齐的目标第二关键帧。
S330、提取第一关键帧对应的第一音频数据和目标第二关键帧对应的第二音频数据。
其中,第一音频数据对应的音频时长为第一预设时长,第二音频数据对应的音频时长为第二预设时长。第一预设时长大于第二预设时长。例如,第一预设时长为500ms,第二预设时长为20ms。
具体地,针对每个第一关键帧而言,可以在第一视频中的第一关键帧位置处,提取第一预设时长对应的第一音频数据。在第二视频中的目标第二关键帧位置处,提取第二预设时长对应的第二音频数据,从而提取出的第一音频数据的音频时长大于第二音频数据的音频时长,以便后续在第一音频数据中进行第二音频数据的匹配。
示例性地,第一音频数据的提取需要在第一关键帧位置处的左右范围内进行提取,以便后续进行准确的音频匹配。例如,第一音频数据可以是以第一关键帧的播放时间戳为中心时刻,具有第一预设时长的音频数据。图4给出了一种第一音频数据提取的示例。参见图4,从第一视频的音频中提取以每个第一关键帧的播放时间戳为中心时刻,具有第一预设时长500ms的第一音频数据。
示例性地,用于作为参考的第二音频数据可以存在多种提取方式,其可以在目标第二关键帧位置处的左面、左面或者左右范围内进行提取。例如,第二音频数据可以是以目标第二关键帧的播放时间戳为预设参考时刻,具有第二预设时长的音频数据。其中,预设参考时刻可以为以下其中之一:开始时刻、中心时刻和结束时刻。图4也给出了一种第二音频数据提取的示例。参见图4,从第二视频的音频中提取以每个目标第二关键帧的播放时间戳为开始时刻,具有第二预设时长20ms的第二音频数据。
S340、从第一音频数据中确定具有第二预设时长且与第二音频数据相匹配的目标音频数据。
其中,目标音频数据可以是指第一音频数据中与第二音频数据匹配成功的音频数据。也就是说,目标音频数据与第二音频数据可以近似于相同数据。
具体地,由于第一音频数据的时长大于第二音频数据的时长,从而可以对第一音频数据进行遍历,提取出多个具有第二预设时长的待选音频数据,比如每隔1ms提取一个具有第二预设时长的待选音频数据。可以确定每个待选音频数据与第二音频数据之间的音频相似度,并将音频相似度最大的待选音频数据作为与第二音频数据相匹配的目标音频数据。
示例性地,S340可以包括:基于预设滑动时长和第二预设时长,对第一音频数据进行滑动,获取当次滑动对应的具有第二预设时长的当前音频数据;确定当前音频数据与第二音频数据之间的音频相似度;基于当前音频数据对应的音频相似度,确定与第二音频数据相匹配的目标音频数据。
具体地,可以基于预设滑动时长,在第一音频数据进行逐次滑动,获得具有第二预设时长的当前音频数据。例如,在预设滑动时长为1ms时,参见图4,第一次滑动获得的当前音频数据为第一音频数据中的第0ms到第20ms的音频数据,第二次滑动获得的当前音频数据为第一音频数据中的第1ms到第21ms的音频数据,依次类推。在每次滑动后,可以确定当次滑动获得的当前音频数据与第二音频数据之间的协方差,并将该协方差作为当前音频数据对应的音频相似度。若该音频相似度大于或等于预设相似度阈值,则可以确定当前音频数据与第二音频数据相匹配,此时将当前音频数据作为目标音频数据。若该音频相似度小于预设相似度阈值,则可以确定当前音频数据与第二音频数据不匹配,此时需要通过滑动更新当前音频数据,并检测下次滑动获得的当前音频数据是否与第二音频数据相匹配,直到确定出相匹配的目标音频数据时,停止滑动。通过上述滑动匹配的方式无需遍历第一音频数据中具有第二预设时长的所有音频数据,可以在保证同步检测准确性的基础上更加快速地获得与第二音频数据相匹配的目标音频数据,从而进一步提高了音画同步检的测效率。
S350、以第二音频数据和目标第二关键帧为音画同步基准,确定目标音频数据和第一关键帧之间的音画偏移量。
其中,音画偏移量可以是指目标音频数据的声音与第一关键帧的画面之间的时间差。
具体地,由于第二视频是音画同步的,从而第二音频数据和目标第二关键帧是音画同步的,因此可以将第二音频数据与目标第二关键帧之间的第一时差作为音画同步的参考时差,对目标音频数据与第一关键帧之间的目标时差进行检测,若目标时差等于参考时差,则表明目标音频数据与第一关键帧是音画同步的,此时的音画偏移量为0。若目标时差不等于参考时差,则可以基于目标时差与参考时差之间的差值,确定具体的音画偏移量。
示例性地,S350可以包括:基于第二音频数据的开始时间戳和目标第二关键帧的播放时间戳,确定音画同步时的参考时差;基于目标音频数据的开始时间戳和第一关键帧的播放时间戳,确定第一关键帧对应的目标时差;基于目标时差和参考时差,确定第一关键帧对应的音画偏移量。
具体地,可以将第二音频数据的开始时间戳减去目标第二关键帧的播放时间戳,获得的时间差值确定为音画同步时的参考时差。对于图4中的第二音频数据的提取方式而言,第二音频数据的开始时间戳即为目标第二关键帧的播放时间戳,从而音画同步时的参考时差为0。将目标音频数据的开始时间戳减去第一关键帧的播放时间戳,获得的时间差值确定为第一关键帧对应的目标时差。将目标时差减去参考时差,获得的时间差值确定为第一关键帧对应的音画偏移量。参见图4,参考视差为0,目标时差即为音画偏移量。若音画偏移量大于0,则表明音频超前视频画面。若音画偏移量小于0,则表明音频滞后视频画面。
S360、基于第一关键帧对应的音画偏移量,确定第一视频的音画同步检测结果。
具体地,基于第一视频中的每个第一关键帧对应的音画偏移量,可以确定第一视频整体上的音画同步检测结果。
示例性地,S360可以包括:若第一视频中每个第一视频帧对应的音画偏移量均处于预设允许范围内,则确定第一视频的音画同步检测结果为音画同步;若第一视频中存在至少一个第一视频帧对应的音画偏移量未处于预设允许范围内,则确定第一视频的音画同步检测结果为音画不同步。
其中,预设允许范围可以是预先基于检测标准设置的,允许音画偏移的时差范围。例如,预设允许范围为:[-185,90],其表明相当于视频画面而言,音频滞后185ms或者超前90ms都是可接受的,认为也是音画同步的。
具体地,检测第一视频中每个第一视频帧对应的音画偏移量是否处于预设允许范围内,若所有的第一视频帧对应的音画偏移量均处于预设允许范围内,则确定第一视频的音画同步检测结果为音画同步,即转码后的第一视频也是音画同步的,视频转码并未导致音画不同步的情况。若存在至少一个第一视频帧对应的音画偏移量未处于预设允许范围内,则确定第一视频的音画同步检测结果为音画不同步,也就是说,在未处于预设允许范围内的第一视频帧位置处出现了因转码而导致的音画不同步的情况,此时可以将未处于预设允许范围内的第一视频帧对应的音画偏移量进行输出,以提醒用户音画不同步的具***置以及音画不同步的程度大小,使得用户进行快速处理。
本公开实施例的技术方案,通过提取音频时长更长的第一音频数据,从第一音频数据中再次提取出与第二音频数据相匹配的目标音频数据,并以第二音频数据和目标第二关键帧为音画同步基准,确定目标音频数据和第一关键帧之间的音画偏移量,并基于第一关键帧对应的音画偏移量,可以更加准确地确定出第一视频的音画同步检测结果,从而进一步提高了音画同步检测的准确性。
图5为本公开实施例所提供的一种音画同步检测装置的结构示意图,如图5所示,该装置具体包括:第一视频获取模块510、关键帧对齐模块520、音频数据提取模块530和音画同步检测模块540。
其中,第一视频获取模块510,用于获取待检测的第一视频,所述第一视频是对音画同步的第二视频进行转码获得的视频;关键帧对齐模块520,用于提取所述第一视频中的第一关键帧和所述第二视频中的第二关键帧,并对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧;音频数据提取模块530,用于提取所述第一关键帧对应的第一音频数据和所述目标第二关键帧对应的第二音频数据;音画同步检测模块540,用于将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果。
本公开实施例所提供的技术方案,通过将转码前音画同步的第二视频作为参考对转码后的第一视频进行检测,并将关键帧对齐后的第一关键帧对应的第一音频数据和目标第二关键帧对应的第二音频数据进行匹配,从而可以准确地确定第一视频是否存在因转码而导致的音画不同步的情况,实现了音画同步的自动检测,并且保证了音画同步检测的准确性。
在上述技术方案的基础上,关键帧对齐模块520,具体用于:
获取所述第一关键帧可选的第二关键帧序列;按照所述第二关键帧序列的顺序,依次获取当前第二关键帧,并确定所述第一关键帧与当前第二关键帧之间的图像相似度;若所述图像相似度大于或等于预设相似度阈值,则将当前第二视频帧确定为与所述第一关键帧对齐的目标第二关键帧。
在上述各技术方案的基础上,所述第一音频数据对应的音频时长为第一预设时长,所述第二音频数据对应的音频时长为第二预设时长,其中,所述第一预设时长大于第二预设时长。
在上述各技术方案的基础上,所述第一音频数据是以所述第一关键帧的播放时间戳为中心时刻,具有第一预设时长的音频数据;
所述第二音频数据是以所述目标第二关键帧的播放时间戳为预设参考时刻,具有第二预设时长的音频数据;其中,所述预设参考时刻为以下其中之一:
开始时刻、中心时刻和结束时刻。
在上述各技术方案的基础上,音画同步检测模块540,包括:
目标音频数据确定单元,用于从所述第一音频数据中确定具有所述第二预设时长且与所述第二音频数据相匹配的目标音频数据;
音画偏移量确定单元,用于以所述第二音频数据和所述目标第二关键帧为音画同步基准,确定所述目标音频数据和所述第一关键帧之间的音画偏移量;
音画同步检测单元,用于基于所述第一关键帧对应的音画偏移量,确定所述第一视频的音画同步检测结果。
在上述各技术方案的基础上,目标音频数据确定单元,具体用于:
基于预设滑动时长和所述第二预设时长,对所述第一音频数据进行滑动,获取当次滑动对应的具有所述第二预设时长的当前音频数据;确定所述当前音频数据与所述第二音频数据之间的音频相似度;基于所述当前音频数据对应的音频相似度,确定与所述第二音频数据相匹配的目标音频数据。
在上述各技术方案的基础上,音画偏移量确定单元,具体用于:
基于所述第二音频数据的开始时间戳和所述目标第二关键帧的播放时间戳,确定音画同步时的参考时差;基于所述目标音频数据的开始时间戳和所述第一关键帧的播放时间戳,确定所述第一关键帧对应的目标时差;基于所述目标时差和所述参考时差,确定所述第一关键帧对应的音画偏移量。
在上述各技术方案的基础上,音画同步检测单元,具体用于:
若所述第一视频中每个第一视频帧对应的音画偏移量均处于预设允许范围内,则确定所述第一视频的音画同步检测结果为音画同步;若所述第一视频中存在至少一个第一视频帧对应的音画偏移量未处于预设允许范围内,则确定所述第一视频的音画同步检测结果为音画不同步。
本公开实施例所提供的音画同步检测装置可执行本公开任意实施例所提供的音画同步检测方法,具备执行音画同步检测方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开实施例的保护范围。
图6为本公开实施例所提供的一种电子设备的结构示意图。下面参考图6,其示出了适于用来实现本公开实施例的电子设备(例如图6中的终端设备或服务器)500的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。编辑/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开实施例提供的电子设备与上述实施例提供的音画同步检测方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的音画同步检测方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取待检测的第一视频,所述第一视频是对音画同步的第二视频进行转码获得的视频;提取所述第一视频中的第一关键帧和所述第二视频中的第二关键帧,并对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧;提取所述第一关键帧对应的第一音频数据和所述目标第二关键帧对应的第二音频数据;将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,【示例一】提供了一种音画同步检测方法,包括:
获取待检测的第一视频,所述第一视频是对音画同步的第二视频进行转码获得的视频;
提取所述第一视频中的第一关键帧和所述第二视频中的第二关键帧,并对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧;
提取所述第一关键帧对应的第一音频数据和所述目标第二关键帧对应的第二音频数据;
将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果。
根据本公开的一个或多个实施例,【示例二】提供了一种音画同步检测方法,还包括:
可选的,对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧,包括:
获取所述第一关键帧可选的第二关键帧序列;
按照所述第二关键帧序列的顺序,依次获取当前第二关键帧,并确定所述第一关键帧与当前第二关键帧之间的图像相似度;
若所述图像相似度大于或等于预设相似度阈值,则将当前第二视频帧确定为与所述第一关键帧对齐的目标第二关键帧。
根据本公开的一个或多个实施例,【示例三】提供了一种音画同步检测方法,还包括:
可选的,所述第一音频数据对应的音频时长为第一预设时长,所述第二音频数据对应的音频时长为第二预设时长,其中,所述第一预设时长大于第二预设时长。
根据本公开的一个或多个实施例,【示例四】提供了一种音画同步检测方法,还包括:
可选的,所述第一音频数据是以所述第一关键帧的播放时间戳为中心时刻,具有第一预设时长的音频数据;
所述第二音频数据是以所述目标第二关键帧的播放时间戳为预设参考时刻,具有第二预设时长的音频数据;其中,所述预设参考时刻为以下其中之一:
开始时刻、中心时刻和结束时刻。
根据本公开的一个或多个实施例,【示例五】提供了一种音画同步检测方法,还包括:
可选的,所述将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果,包括:
从所述第一音频数据中确定具有所述第二预设时长且与所述第二音频数据相匹配的目标音频数据;
以所述第二音频数据和所述目标第二关键帧为音画同步基准,确定所述目标音频数据和所述第一关键帧之间的音画偏移量;
基于所述第一关键帧对应的音画偏移量,确定所述第一视频的音画同步检测结果。
根据本公开的一个或多个实施例,【示例六】提供了一种音画同步检测方法,还包括:
可选的,所述从所述第一音频数据中确定具有所述第二预设时长且与所述第二音频数据相匹配的目标音频数据,包括:
基于预设滑动时长和所述第二预设时长,对所述第一音频数据进行滑动,获取当次滑动对应的具有所述第二预设时长的当前音频数据;
确定所述当前音频数据与所述第二音频数据之间的音频相似度;
基于所述当前音频数据对应的音频相似度,确定与所述第二音频数据相匹配的目标音频数据。
根据本公开的一个或多个实施例,【示例七】提供了一种音画同步检测方法,还包括:
可选的,所述以所述第二音频数据和所述目标第二关键帧为音画同步基准,确定所述目标音频数据和所述第一关键帧之间的音画偏移量,包括:
基于所述第二音频数据的开始时间戳和所述目标第二关键帧的播放时间戳,确定音画同步时的参考时差;
基于所述目标音频数据的开始时间戳和所述第一关键帧的播放时间戳,确定所述第一关键帧对应的目标时差;
基于所述目标时差和所述参考时差,确定所述第一关键帧对应的音画偏移量。
根据本公开的一个或多个实施例,【示例八】提供了一种音画同步检测方法,还包括:
可选的,所述基于所述第一关键帧对应的音画偏移量,确定所述第一视频的音画同步检测结果,包括:
若所述第一视频中每个第一视频帧对应的音画偏移量均处于预设允许范围内,则确定所述第一视频的音画同步检测结果为音画同步;
若所述第一视频中存在至少一个第一视频帧对应的音画偏移量未处于预设允许范围内,则确定所述第一视频的音画同步检测结果为音画不同步。
根据本公开的一个或多个实施例,【示例九】提供了一种音画同步检测装置,包括:
第一视频获取模块,用于获取待检测的第一视频,所述第一视频是对音画同步的第二视频进行转码获得的视频;
关键帧对齐模块,用于提取所述第一视频中的第一关键帧和所述第二视频中的第二关键帧,并对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧;
音频数据提取模块,用于提取所述第一关键帧对应的第一音频数据和所述目标第二关键帧对应的第二音频数据;
音画同步检测模块,用于将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (11)

1.一种音画同步检测方法,其特征在于,包括:
获取待检测的第一视频,所述第一视频是对音画同步的第二视频进行转码获得的视频;
提取所述第一视频中的第一关键帧和所述第二视频中的第二关键帧,并对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧;
提取所述第一关键帧对应的第一音频数据和所述目标第二关键帧对应的第二音频数据;
将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果。
2.根据权利要求1所述的音画同步检测方法,其特征在于,对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧,包括:
获取所述第一关键帧可选的第二关键帧序列;
按照所述第二关键帧序列的顺序,依次获取当前第二关键帧,并确定所述第一关键帧与当前第二关键帧之间的图像相似度;
若所述图像相似度大于或等于预设相似度阈值,则将当前第二视频帧确定为与所述第一关键帧对齐的目标第二关键帧。
3.根据权利要求1所述的音画同步检测方法,其特征在于,所述第一音频数据对应的音频时长为第一预设时长,所述第二音频数据对应的音频时长为第二预设时长,其中,所述第一预设时长大于所述第二预设时长。
4.根据权利要求3所述的音画同步检测方法,其特征在于,所述第一音频数据是以所述第一关键帧的播放时间戳为中心时刻,具有第一预设时长的音频数据;
所述第二音频数据是以所述目标第二关键帧的播放时间戳为预设参考时刻,具有第二预设时长的音频数据;其中,所述预设参考时刻为以下其中之一:
开始时刻、中心时刻和结束时刻。
5.根据权利要求3所述的音画同步检测方法,其特征在于,所述将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果,包括:
从所述第一音频数据中确定具有所述第二预设时长且与所述第二音频数据相匹配的目标音频数据;
以所述第二音频数据和所述目标第二关键帧为音画同步基准,确定所述目标音频数据和所述第一关键帧之间的音画偏移量;
基于所述第一关键帧对应的音画偏移量,确定所述第一视频的音画同步检测结果。
6.根据权利要求5所述的音画同步检测方法,其特征在于,所述从所述第一音频数据中确定具有所述第二预设时长且与所述第二音频数据相匹配的目标音频数据,包括:
基于预设滑动时长和所述第二预设时长,对所述第一音频数据进行滑动,获取当次滑动对应的具有所述第二预设时长的当前音频数据;
确定所述当前音频数据与所述第二音频数据之间的音频相似度;
基于所述当前音频数据对应的音频相似度,确定与所述第二音频数据相匹配的目标音频数据。
7.根据权利要求5所述的音画同步检测方法,其特征在于,所述以所述第二音频数据和所述目标第二关键帧为音画同步基准,确定所述目标音频数据和所述第一关键帧之间的音画偏移量,包括:
基于所述第二音频数据的开始时间戳和所述目标第二关键帧的播放时间戳,确定音画同步时的参考时差;
基于所述目标音频数据的开始时间戳和所述第一关键帧的播放时间戳,确定所述第一关键帧对应的目标时差;
基于所述目标时差和所述参考时差,确定所述第一关键帧对应的音画偏移量。
8.根据权利要求5所述的音画同步检测方法,其特征在于,所述基于所述第一关键帧对应的音画偏移量,确定所述第一视频的音画同步检测结果,包括:
若所述第一视频中每个第一视频帧对应的音画偏移量均处于预设允许范围内,则确定所述第一视频的音画同步检测结果为音画同步;
若所述第一视频中存在至少一个第一视频帧对应的音画偏移量未处于预设允许范围内,则确定所述第一视频的音画同步检测结果为音画不同步。
9.一种音画同步检测装置,其特征在于,包括:
第一视频获取模块,用于获取待检测的第一视频,所述第一视频是对音画同步的第二视频进行转码获得的视频;
关键帧对齐模块,用于提取所述第一视频中的第一关键帧和所述第二视频中的第二关键帧,并对所述第一关键帧和所述第二关键帧进行对齐,确定与所述第一关键帧对齐的目标第二关键帧;
音频数据提取模块,用于提取所述第一关键帧对应的第一音频数据和所述目标第二关键帧对应的第二音频数据;
音画同步检测模块,用于将所述第一音频数据与所述第二音频数据进行匹配,确定所述第一视频的音画同步检测结果。
10.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的音画同步检测方法。
11.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-8中任一所述的音画同步检测方法。
CN202310813430.4A 2023-07-04 2023-07-04 一种音画同步检测方法、装置、设备和存储介质 Pending CN116708892A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310813430.4A CN116708892A (zh) 2023-07-04 2023-07-04 一种音画同步检测方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310813430.4A CN116708892A (zh) 2023-07-04 2023-07-04 一种音画同步检测方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN116708892A true CN116708892A (zh) 2023-09-05

Family

ID=87839105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310813430.4A Pending CN116708892A (zh) 2023-07-04 2023-07-04 一种音画同步检测方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN116708892A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116958331A (zh) * 2023-09-20 2023-10-27 四川蜀天信息技术有限公司 一种音画同步的调整方法、装置和电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116958331A (zh) * 2023-09-20 2023-10-27 四川蜀天信息技术有限公司 一种音画同步的调整方法、装置和电子设备
CN116958331B (zh) * 2023-09-20 2024-01-19 四川蜀天信息技术有限公司 一种音画同步的调整方法、装置和电子设备

Similar Documents

Publication Publication Date Title
US9961398B2 (en) Method and device for switching video streams
EP4262214A1 (en) Screen projection method and apparatus, and electronic device and storage medium
CN111064987B (zh) 信息展示方法、装置及电子设备
CN110418183B (zh) 音视频同步方法、装置、电子设备及可读介质
CN113891132B (zh) 一种音视频同步监控方法、装置、电子设备及存储介质
CN116708892A (zh) 一种音画同步检测方法、装置、设备和存储介质
US20240121349A1 (en) Video shooting method and apparatus, electronic device and storage medium
CN114095671A (zh) 云会议直播***、方法、装置、设备及介质
CN113992926B (zh) 界面显示方法、装置、电子设备和存储介质
CN113144620B (zh) 帧同步游戏的检测方法、装置、平台、可读介质和设备
CN114125358A (zh) 云会议字幕显示方法、***、装置、电子设备和存储介质
CN113259729B (zh) 数据切换的方法、服务器、***及存储介质
CN115209215A (zh) 视频处理方法、装置及设备
CN111669625A (zh) 一种拍摄文件的处理方法、装置、设备及存储介质
CN113839829A (zh) 云游戏延时测试方法、装置、***及电子设备
CN116033199A (zh) 多设备音视频同步方法、装置、电子设备及存储介质
CN112287171A (zh) 信息处理方法、装置和电子设备
CN114125485B (zh) 图像处理方法、装置、设备及介质
CN114584822B (zh) 一种同步播放方法、装置、终端设备和存储介质
CN112437289B (zh) 一种切换时延获取方法
CN114554292A (zh) 视角的切换方法、装置、电子设备、存储介质和程序产品
CN113891057A (zh) 视频的处理方法、装置、电子设备和存储介质
CN113891108A (zh) 字幕优化方法、装置、电子设备和存储介质
CN115150631A (zh) 字幕处理方法、装置、电子设备和存储介质
CN117544814B (zh) 基于执法记录仪的数据处理方法、装置、设备和可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination