CN106067990A

CN106067990A - 音频处理方法、装置以及视频播放器

Info

Publication number: CN106067990A
Application number: CN201610497437.XA
Authority: CN
Inventors: 牛继华; 何美伊; 张子豪; 池宝旺; 李庆燕; 彭伟刚; 林岳; 顾思斌; 潘柏宇; 王冀
Original assignee: Unification Infotech (beijing) Co Ltd
Current assignee: Unification Infotech (beijing) Co Ltd
Priority date: 2016-06-29
Filing date: 2016-06-29
Publication date: 2016-11-02

Abstract

本发明涉及音频处理方法、装置以及视频播放器，该方法包括获取与视频数据相关联的音频信号；根据所述音频信号获得第一音频信号和第二音频信号，其中，所述第二音频信号相对于所述第一音频信号延迟第一时延；将所述第一音频信号提供至耳机接口的第一声道输出端；以及将所述第二音频信号提供至耳机接口的第二声道输出端。能够以较低的成本实现具有立体声音效的视频播放。

Description

音频处理方法、装置以及视频播放器

技术领域

本发明涉及信息技术领域，尤其涉及一种针对视频数据中的音频信号的的音频处理方法和装置，以及应用该方法和装置的视频播放器。

背景技术

用户对视频媒体的视听效果的要求越来越高，越来越多的用户希望在通过智能手机、平板电脑、计算机等终端设备观看视频时，能够享受到立体声音效，然而，很多视频源中的音频信号并非按照立体声模式采集，利用终端设备上装载的现有的视频播放器来播放无法直接产生立体声音效，如果借助于立体声音箱、立体声耳机等外接设备，又会大大增加用户的成本。

发明内容

技术问题

有鉴于此，本发明提出一种音频处理方法、装置和视频播放器，能够以较低的成本实现具有立体声音效的视频播放。

解决方案

一方面，提出一种音频处理方法，包括获取与视频数据相关联的音频信号；根据所述音频信号获得第一音频信号和第二音频信号，其中，所述第二音频信号相对于所述第一音频信号延迟第一时延；将所述第一音频信号提供至耳机接口的第一声道输出端；以及将所述第二音频信号提供至耳机接口的第二声道输出端。

另一方面，提出一种音频处理装置，包括音频获取部件，用于获取与视频数据相关联的音频信号；延迟部件，用于根据所述音频信号获得第一音频信号和第二音频信号，其中，所述第二音频信号相对于所述第一音频信号延迟第一时延；第一提供部件，用于将所述第一音频信号提供至耳机接口的第一声道输出端；以及第二提供部件，用于将所述第二音频信号提供至耳机接口的第二声道输出端。

又一方面，提出一种视频播放器，包括根据以上方面所述的音频处理装置。

有益效果

根据本发明的各方面，将视频数据的相关音频信号分为两路，其中一路相对于另一路延迟后，分别输出至耳机的两个声道输出端，用户可以通过耳机的两个听筒收听到有相对时延的两路音频，模拟了声音在自然状态下到达双耳时间不同的现象，实现了“虚拟环绕立体声”的效果，增强了用户收听时的临场感。这样一来，即便视频中原有的音频信号只是单声道采集的非立体声普通音频信号，耳机也只是普通的、不带有立体声处理模块的耳机，用户也能感受到立体声音效，从而以较低的成本实现了视频的立体声播放效果，大大提高了用户体验。

根据下面参考附图对示例性实施例的详细说明，本发明的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面，并且用于解释本发明的原理。

图1示出根据本发明一实施例的一种音频处理方法的流程图。

图2a和图2b示出了第一音频信号和第二音频信号的一个例子的时域波形图。

图3示出了根据本发明的一个实施例的一个示例的音频处理方法的流程图。

图4示出了根据本发明的一个实施例的一个示例的音频处理方法的流程图。

图5示出了由两个带通滤波器组成的带通滤波器组的幅频特性曲线。

图6示出了根据本发明的一个实施例的一个示例的音频处理方法的流程图。

图7示出了根据本发明的一个实施例的音频处理装置的结构图。

图8示出了根据本发明的一个实施例的一个示例的音频处理装置的结构图。

图9示出了根据本发明的一个实施例的一个示例的音频处理装置的结构图。

图10示出了根据本发明的一个实施例的一个示例的音频处理装置的结构图。

图11示出了本发明的另一个实施例的一种音频处理设备的结构框图。

具体实施方式

以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本发明，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本发明同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本发明的主旨。

实施例1

图1示出根据本发明一实施例的一种音频处理方法的流程图。如图1所示，该方法主要包括：

步骤101，获取与视频数据相关联的音频信号；

步骤102，根据所述音频信号获得第一音频信号和第二音频信号，其中，所述第二音频信号相对于所述第一音频信号延迟第一时延；

步骤103，将所述第一音频信号提供至耳机接口的第一声道输出端；以及

步骤104，将所述第二音频信号提供至耳机接口的第二声道输出端。

根据该实施例的方法，将视频数据的相关音频信号分为两路，其中一路相对于另一路延迟后，分别输出至耳机的两个声道输出端，用户可以通过耳机的两个听筒收听到有相对时延的两路音频，模拟了声音在自然状态下到达双耳时间不同的现象，实现了“虚拟环绕立体声”的效果，增强了用户收听时的临场感。这样一来，即便视频中原有的音频信号只是单声道采集的非立体声普通音频信号，耳机也只是普通的、不带有立体声处理模块的耳机，用户也能感受到立体声音效，从而以较低的成本实现了视频的立体声播放效果，大大提高了用户体验。

以下结合一些具体示例，来对本实施例的各种可能的具体实现方式进行说明。这些示例仅是示例性和说明性的，并非意在限制本发明。

本领域技术人员可通过现有技术手段，获取与视频数据相关联的音频信号，本发明对此不做限制。举例来说，可通过视频播放器中的常规手段对视频数据进行解码，并从解码后的数据中分离出音频信号。视频数据可以是本地存储的视频文件，也可以是基于流媒体格式的视频流，相应地，得到的音频信号可以是音频文件，也可以是基于流媒体格式的音频流。视频数据可以是完整的视频文件或视频流，也可以是视频文件或视频流中的片段。

在一个示例中，所获取的音频信号可以是单声道音频信号、双声道音频信号、或者三声道以上的多声道音频信号。在单声道音频信号的情况下，可以将所获取的单声道音频信号分为两路，一路作为第一音频信号(可看作是原始的、不经延迟的音频信号)，将另一路延迟第一时延后作为第二音频信号，从而获得具有相对时延的两路音频信号。这样可使得原本没有立体声效果的单声道音频信号具有立体声效果。在双声道音频信号的情况下，可将其中一个声道的音频信号(第一声道音频信号)作为第一音频信号，将另一声道的音频信号(第二声道音频信号)延迟第一时延后作为第二音频信号，从而获得具有相对时延的两路音频信号。在多声道音频信号的情况下，可将所述音频信号中的部分声道的音频信号混合作为第一音频信号，将所述音频信号中的其他声道的音频信号混合并延迟所述第一时延后作为第二音频信号。这样，可以使原本有立体声效果的双声道或多声道音频信号在保留其原有的立体声效果的前提下，进一步增强了立体声效果。

图2a和图2b示出了第一音频信号和第二音频信号的一个例子的时域波形图，其中图2a示出了未经延迟的两路原始音频信号，图2b示出对其中一路音频信号延迟第一时间后，得到的具有相对时延的第一音频信号和第二音频信号。

在一个示例中，所获得的第一音频信号和第二音频信号可通过终端设备原有的硬件通道(例如声卡的左、右声道)分别提供至耳机接口的第一、第二声道输出端(例如左、右声道输出端)，从而在耳机***耳机接口时，可以通过耳机的两个听筒分别播放第一、第二音频信号。由于耳机是将第一、第二音频信号直接分别传送至人的左、右耳，保证了双耳同时单独接收有相对时延的音频信号，因此该相对时延的作用能够体现出来，能够实现本实施例带来的立体声播放效果。

本实施例中的第一时延，可以是基于用户的普遍感受而确定的经验值，例如为10ms-30ms之间的值，例如取20ms。该第一时延可以是预设的固定值，也可以是可由用户根据自身需要设置的可变值。在一个示例中，该第一时延也可以是能够根据视频数据的特性来自适应调整的。以下结合图3，给出一个根据所述视频数据的特性确定第一时延的示例。

图3示出了根据本发明的一个实施例的一个示例的音频处理方法的流程图，如图3所示，该方法在图1所示的方法的基础上，还包括：步骤105：根据视频数据的特性，确定第一时延。

视频数据具有不同的特性，这些不同的特性导致了用户在观看视频的时候，需要不同的听觉感受。举例来说，某些视频可能涉及较多的宏大的音效场景(例如战争场面较多的影视剧、交响乐等视频)，此时需要更长的第一时延以增强立体声音效，提供具有较强的纵深感的听觉感受，而某些视频可能涉及较多安静或清脆的音效场景(例如对话较多的影视剧、谈话类节目、轻音乐等的视频)，此时需要更短的第一时延而略降低立体声音效，提供更加清晰的听觉感受。本示例通过根据视频数据的特性确定所述第一时延，能够有针对性地满足用户在观看不同特性的视频时对听觉感受的不同需要，提高了用户体验。

在一个示例中，可以通过如下方式来实现根据视频数据的特性确定第一时延：根据与视频数据相关联的视频信息，确定与视频数据的播放内容有关的特性；以及根据与视频数据的播放内容有关的特性，确定第一时延。

在该示例中，视频数据可以是完整的视频文件或视频流(例如一部完整的电影或电视节目)，与视频数据相关联的视频信息可以是对视频数据播放内容的描述，例如内容的类型，比如战争片、交响乐、谈话节目等。该信息可以例如从存储该信息的服务器中获得。根据该信息，即可确定与视频数据的播放内容有关的特性，例如涉及宏大场面较多，或者涉及安静场面较多等，根据该特性，即可确定第一时延。举例来说，对于播放内容为战争片等涉及宏大场面较多的视频数据，可将第一时延设置得较长(例如20ms以上)，对于播放内容为对话类节目等涉及安静场面较多的视频，可以将第一时延设置的较短(例如20ms一下)，所设置的第一时延可应用于整个视频数据(例如整个节目视频)的播放过程中，以较简便的方式提供有针对性的立体声效果。

在另一个示例中，可以通过如下方式来实现根据视频数据的特性确定第一时延：确定与视频数据的相关联的音频信号的特征(即作为所述视频数据的特性)；根据该特征确定第一时延。

在该示例中，视频数据可以看作是视频文件或视频流中的片段。很多视频通常会在不同特性的场景之间转换，例如，即便是战争片，也会交替出现战争场面和对话场面。因此，该示例的方式能够充分考虑到视频中不同片段的特性而进行适应性调整。

作为示例，音频信号的特征可以包括但不限于音频信号的频率特征，音频信号的平均能量以及音频信号在时域的过零率等等。

例如可分析与视频文件或视频流中各片段(各视频数据)相关联的音频信号的频谱，确定其在哪个频段的声音信号相对较强，例如某片段的音频信号高频相对较强而低频相对较弱，可以针对该片段设置较小的第一时延，某片段的音频信号高频相对较弱而低频相对较强，可以针对该片段设置较大的第一时延。再例如，可以分析与各片段(各视频数据)相关联的音频信号所包含的语音信息(例如语音对白)的多少，例如，可以基于音频信号的平均能量(例如音频信号在预定时长内的短时平均能量)和/或者基于音频信号的过零率(例如音频信号在时域的过零点密度，例如某视频数据的音频信号的总过零点数与该视频数据的时长的比)，来对音频信号中的语音对白进行初步识别，如果平均能量较高和/或过零率较高，则意味着语音对白较多，可以针对相应的视频数据设置较小的第一时延，反之，可设置较大的第一时延，等等。

在一个示例中，可预设多个候选的第一时延，例如5ms、10ms、20ms、25ms等。根据所确定的视频数据的特性或者根据用户的选择，可在这些候选的第一时延之间切换。当然，也可以根据所确定的视频数据的特性实时换算第一时延，本发明对此不做限制。

除了通过时延来产生立体声效果之外，本发明实施例还可进一步通过对第一、第二音频信号在传送至耳机接口之前，分别进行频域调整，来进一步提高播放音效。以下结合图4，对这方面的示例进行说明。

图4示出了根据本发明的一个实施例的一个示例的音频处理方法的流程图，如图4所示，该示例的方法包括：

步骤401，获取与视频数据相关联的音频信号；

步骤402，根据所述音频信号获得第一音频信号和第二音频信号；

步骤403，通过第一带通滤波器对所述第一音频信号进行第一带通滤波处理后，提供给耳机接口的第一声道输出端；以及

步骤404，通过第二带通滤波器对所述第二音频信号进行第二带通滤波处理后，提供给耳机接口的第二声道输出端；

其中，所述第二音频信号相对于所述第一音频信号延迟第一时延。

众所周知，带通滤波器是指能通过某频率范围内的频率分量，而其他范围的频率分量衰减到极低水平的滤波器。本示例中的第一、第二带通滤波器可以是由多个带通滤波器组成的带通滤波器组(例如数字带通滤波器组)，从而提供多个通带。为了示例性地说明带通滤波器的原理，图5示出了由两个带通滤波器组成的带通滤波器组的幅频特性曲线，其中两个通带的中心频率分别是5000Hz和15000Hz，通带增益分别约为14dB。

在一个示例中，第一带通滤波器和第二带通滤波器可以具有相同的频率特性，以对第一、第二音频信号产生同样的频域调整，实现例如增强低音以增强震撼力、增强高音以增强穿透力、或者均衡各频率范围以使声音更加柔和等所需要的效果。

在另一个示例中，第一带通滤波器和第二带通滤波器可以具有不同的频率特性，以对第一、第二音频信号产生不同的频域调整，其中，第一带通滤波器和第二带通滤波器针对第一音频信号和第二音频信号的滤波处理可以是互补的，例如可针对第一音频信号增强低频，相应地针对第二音频信号减弱低频或增强高频，从而模拟高、低频声音分别来自不同方向的自然场景(例如交响音乐会，高、低音乐器设置在不同位置)，以进一步增强现场感，增强立体声效果。

本示例中的第一带通滤波器和第二带通滤波器的频率特性可以是基于用户的普遍感受而确定的。举例来说，可以根据经验来设置第一、第二带通滤波器的通带数量(例如3-15个，例如5个)、各通带的中心频率位置(例如在以60Hz到14000hz为例的预定频率范围内均匀或非均匀分布)、以及各个通带的通带增益。这些参数决定了第一、第二带通滤波器的频率特性。这些参数可以是预设的固定值，也可以是可由用户根据自身需要设置的可变值。在一个示例中，也可以根据视频数据的特性来自适应地调整第一、第二带通滤波器的频率特性。第一、第二带通滤波器的频率特性可以以相同方式调整、以不同方式调整、或者只调整其中一个。以下结合图6，给出一个根据视频数据的特性确定第一和/或第二带通滤波器的频率特性的示例。

图6示出了根据本发明的一个实施例的一个示例的音频处理方法的流程图，如图6所示，该方法在图4所示的方法的基础上，还包括：步骤405：根据视频数据的特性，确定第一带通滤波器和/或第二带通滤波器的频率特性。例如，可以通过分别确定第一带通滤波器和/或第二带通滤波器的各通带的通带增益来确定其频率特性。

正如上文所述，视频数据具有不同的特性，这些不同的特性导致了用户在观看视频的时候，需要不同的听觉感受。本示例通过根据视频数据的特性确定第一带通滤波器和/或第二带通滤波器的频率特性，能够有针对性地满足用户在观看不同特性的视频时对听觉感受的不同需要，提高了用户体验。

在一个示例中，可以通过如下方式来实现根据视频数据的特性确定第一带通滤波器和/或第二带通滤波器的频率特性：根据与所述视频数据相关联的视频信息，确定与所述视频数据的播放内容有关的特性，根据所述与所述视频数据的播放内容有关的特性，确定第一带通滤波器和/或第二带通滤波器的频率特性。

在该示例中，视频数据可以是完整的视频文件或视频流(例如一部完整的电影或电视节目)，关于“与视频数据相关联的视频信息”可参考上文所述。根据该信息，即可确定与视频数据的播放内容有关的特性，例如涉及低沉的场面较多，或者涉及欢快的场面较多，等等，根据该特性，即可确定第一、第二带通滤波器的频率特性。举例来说，对于历史片等涉及低沉场面较多的视频数据，可提高第一和/或第二带通滤波器在低频区域的通带的通带增益以增强低频，对于综艺节目等涉及欢快场面较多的视频，可以提高第一和/或第二带通滤波器在高频区域的通带的通带增益以增强高频，等等。针对整个视频文件或视频流设定统一的第一和/或第二带通滤波器的频率特性，可以以较简便易行的方式有针对性地进一步提高听觉效果。

在另一个示例中，可以通过如下方式来实现根据所述视频数据的特性，确定第一带通滤波器和/或第二带通滤波器的频率特性：确定与所述视频数据相关联的音频信号的特征；根据所述特征确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

在该示例中，视频数据可以看作是视频文件或视频流中的片段。如前文所述，很多视频通常会在不同特性的场景之间转换，因此，该示例充分考虑到视频中不同片段的特性而进行适应性调整。作为示例，该特征可以包括音频信号的频率特征。例如可分析与各片段(各视频数据)相关联的音频信号的频谱，确定其在哪个频段的声音信号相对较强。例如某片段高频相对较强而低频相对较弱，可以针对该片段提高第一和/或第二带通滤波器在高频区域的通带的通带增益以增强高频，再例如某片段低频相对较强而高频相对较弱的，可以针对该片段提高第一和/或第二带通滤波器在低频区域的通带的通带增益以增强低频，等等。

在一个示例中，可预设多个候选的第一和/或第二带通滤波器的频率特性配置，根据所确定的视频数据的特性或者根据用户的选择，可在这些候选的配置之间切换。当然，也可以根据所确定的视频数据的特性实时换算第一和/或第二带通滤波器的频率特性，本发明对此不做限制。

实施例2

图7示出了根据本发明的一个实施例的音频处理装置的结构图。该实施例的装置700可用于实现实施例1中方法各步骤的操作，其中各种具体示例及其有益效果可参见实施例1，为简明起见这里不再重复描述。

如图7所示，该实施例的装置700包括：音频获取部件701，用于获取与视频数据相关联的音频信号；延迟部件702，用于根据所述音频信号获得第一音频信号和第二音频信号，其中，所述第二音频信号相对于所述第一音频信号延迟第一时延；第一提供部件703，用于将所述第一音频信号提供至耳机接口的第一声道输出端；以及第二提供部件704，用于将所述第二音频信号提供至耳机接口的第二声道输出端。

图8示出了根据本发明的一个实施例的一个示例的音频处理装置的结构图。在该示例中，装置700在图7所示的基础上还可包括第一时延确定部件705，用于根据所述视频数据的特性，确定所述第一时延。

在一个示例中，所述第一时延确定部件705可包括：第一内容特性确定部件，用于根据与所述视频数据相关联的视频信息，确定与所述视频数据的播放内容有关的特性，第一确定子部件，用于根据所述与所述视频数据的播放内容有关的特性，确定所述第一时延。

在一个示例中，所述第一时延确定部件705可包括：第一特征确定部件，用于确定与所述视频数据相关联的音频信号的特征；第二确定子部件，用于根据所述特征确定所述第一时延。其中，所述特征可以包括以下中的一个或多个：所述音频信号的频率特征、所述音频信号的平均能量以及所述音频信号在时域的过零率。

图9示出了根据本发明的一个实施例的一个示例的音频处理装置的结构图。在该示例中，装置700在图7所示的基础上，第一提供部件703包括第一带通滤波器7031，用于对所述第一音频信号进行第一带通滤波处理后，提供给耳机接口的第一声道输出端；第二提供部件704包括第二带通滤波器7041，用于对所述第二音频信号进行第二带通滤波处理后，提供给耳机接口的第二声道输出端。

图10示出了根据本发明的一个实施例的一个示例的音频处理装置的结构图。在该示例中，装置700在图9所示的基础上还可包括：频率特性确定部件706，用于根据所述视频数据的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

在一个示例中，所述频率特性确定部件706可包括：第二内容特性确定部件，用于根据与所述视频数据相关联的视频信息，确定与所述视频数据的播放内容有关的特性，第一频率特性确定子部件，用于根据所述与所述视频数据的播放内容有关的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

在一个示例中，所述频率特性确定部件706可包括：第二特征确定部件，用于确定与所述视频数据相关联的音频信号的特征；第二频率特性确定子部件，用于根据所述特征确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。其中，所述特征可以包括音频信号的频率特征。

在一个示例中，所述第一带通滤波器和/或所述第二带通滤波器可分别具有多个通带；所述频率特性确定部件可具体用于：根据所述视频数据的特性，分别确定所述第一带通滤波器和/或所述第二带通滤波器的各通带的通带增益。

在一个示例中，所述第一带通滤波器的频率特性可与所述第二带通滤波器的频率特性不同或相同。

在一个示例中，所述延迟部件702可包括：分路单元，用于将所述音频信号分为两路，其中一路作为所述第一音频信号，第一延迟单元，用于将所述两路中的另一路延迟所述第一时延后作为所述第二音频信号。

在一个示例中，所述延迟部件702可包括：第一混合单元，用于将所述音频信号中的部分声道的音频信号混合作为所述第一音频信号，第二混合单元，用于将所述音频信号中的其他声道的音频信号混合，第二延迟单元，用于将所述第二混合单元的输出延迟所述第一时延后作为所述第二音频信号。

实施例3

本发明另一实施例还提出一种视频播放器，其可包括根据实施例2的音频处理装置。

本发明实施例的方法和装置可以应用于视频播放器，例如可在视频播放器对视频文件或视频流进行解码后，应用本发明实施例的方法，或者将本发明实施例的装置嵌入视频播放器中，这样就可以使用户在观看视频时感受到立体声音效，而无需任何特殊的立体声耳机、音箱等外接设备，对视频文件或视频流中的音频信号本身是否为立体声音频信号、是多声道、双声声道还是单声道音频信号等也没有任何要求。

本发明实施例的方法和装置的各步骤和各模块均可通过软件、硬件、或软件硬件相结合的方式实现，例如，某些模块可嵌入视频播放器应用程序中，某些模块可嵌入声卡等硬件设备中，或者也可全部或部分采用专用软件或硬件实现。

实施例4

图11示出了本发明的另一个实施例的一种音频处理设备的结构框图。所述设备1100可以是具备计算能力的主机服务器、个人计算机PC、或者可携带的便携式计算机或终端等。本发明具体实施例并不对计算节点的具体实现做限定。

所述设备1100包括处理器(processor)1110、通信接口(CommunicationsInterface)1120、存储器(memory)1130和总线1140。其中，处理器1110、通信接口1120、以及存储器1130通过总线1140完成相互间的通信。

通信接口1120用于与网络设备通信，其中网络设备包括例如虚拟机管理中心、共享存储等。

处理器1110用于执行程序。处理器1110可能是一个中央处理器CPU，或者是专用集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。

存储器1130用于存放文件。存储器1130可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1130也可以是存储器阵列。存储器1130还可能被分块，并且所述块可按一定的规则组合成虚拟卷。

在一种可能的实施方式中，上述程序可为包括计算机操作指令的程序代码。该程序具体可用于实现实施例1所述的方法。

本领域普通技术人员可以意识到，本文所描述的实施例中的各示例性单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件形式来实现，取决于技术方案的特定应用和设计约束条件。专业技术人员可以针对特定的应用选择不同的方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

如果以计算机软件的形式来实现所述功能并作为独立的产品销售或使用时，则在一定程度上可认为本发明的技术方案的全部或部分(例如对现有技术做出贡献的部分)是以计算机软件产品的形式体现的。该计算机软件产品通常存储在计算机可读取的非易失性存储介质中，包括若干指令用以使得计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各实施例方法的全部或部分步骤。而前述的存储介质包括U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种音频处理方法，包括

获取与视频数据相关联的音频信号；

根据所述音频信号获得第一音频信号和第二音频信号，其中，所述第二音频信号相对于所述第一音频信号延迟第一时延；

将所述第一音频信号提供至耳机接口的第一声道输出端；以及

将所述第二音频信号提供至耳机接口的第二声道输出端。

2.根据权利要求1所述的音频处理方法，还包括：

根据所述视频数据的特性，确定所述第一时延。

3.根据权利要求2所述的音频处理方法，其中，根据所述视频数据的特性，确定所述第一时延，包括：

根据与所述视频数据相关联的视频信息，确定与所述视频数据的播放内容有关的特性，

根据所述与所述视频数据的播放内容有关的特性，确定所述第一时延。

4.根据权利要求2所述的音频处理方法，其中，根据所述视频数据的特性，确定所述第一时延，包括：

确定与所述视频数据相关联的音频信号的特征；

根据所述特征确定所述第一时延。

5.根据权利要求4所述的音频处理方法，其中，所述特征包括以下中的一个或多个：所述音频信号的频率特征、所述音频信号的平均能量以及所述音频信号在时域的过零率。

6.根据权利要求1所述的音频处理方法，其中，

将所述第一音频信号提供至耳机接口的第一声道输出端，包括：通过第一带通滤波器对所述第一音频信号进行第一带通滤波处理后，提供给耳机接口的第一声道输出端；

将所述第二音频信号提供至耳机接口的第二声道输出端，包括：通过第二带通滤波器对所述第二音频信号进行第二带通滤波处理后，提供给耳机接口的第二声道输出端。

7.根据权利要求6所述的音频处理方法，还包括：

根据所述视频数据的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

8.根据权利要求7所述的音频处理方法，其中，根据所述视频数据的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性，包括：

根据所述与所述视频数据的播放内容有关的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

9.根据权利要求7所述的音频处理方法，其中，根据所述视频数据的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性，包括：

确定与所述视频数据相关联的音频信号的特征；

根据所述特征确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

10.根据权利要求9所述的音频处理方法，其中，所述特征包括所述音频信号的频率特征。

11.根据权利要求7所述的音频处理方法，其中，所述第一带通滤波器和/或所述第二带通滤波器分别具有多个通带；

根据所述视频数据的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性，包括：

根据所述视频数据的特性，分别确定所述第一带通滤波器和/或所述第二带通滤波器的各通带的通带增益。

12.根据权利要求6所述的音频处理方法，其中，所述第一带通滤波器的频率特性与所述第二带通滤波器的频率特性不同或相同。

13.根据权利要求1-12中任意一项所述的音频处理方法，其中，根据所述音频信号获得第一音频信号和第二音频信号，包括：

将所述音频信号分为两路，其中一路作为所述第一音频信号，将另一路延迟所述第一时延后作为所述第二音频信号。

14.根据权利要求1-12中任意一项所述的音频处理方法，其中，根据所述音频信号获得第一音频信号和第二音频信号，包括：

将所述音频信号中的部分声道的音频信号混合作为所述第一音频信号，将所述音频信号中的其他声道的音频信号混合并延迟所述第一时延后作为所述第二音频信号。

15.一种音频处理装置，包括

音频获取部件，用于获取与视频数据相关联的音频信号；

延迟部件，用于根据所述音频信号获得第一音频信号和第二音频信号，其中，所述第二音频信号相对于所述第一音频信号延迟第一时延；

第一提供部件，用于将所述第一音频信号提供至耳机接口的第一声道输出端；以及

第二提供部件，用于将所述第二音频信号提供至耳机接口的第二声道输出端。

16.根据权利要求15所述的音频处理装置，还包括：

第一时延确定部件，用于根据所述视频数据的特性，确定所述第一时延。

17.根据权利要求16所述的音频处理装置，其中，所述第一时延确定部件包括：

第一内容特性确定部件，用于根据与所述视频数据相关联的视频信息，确定与所述视频数据的播放内容有关的特性，

第一确定子部件，用于根据所述与所述视频数据的播放内容有关的特性，确定所述第一时延。

18.根据权利要求16所述的音频处理装置，其中，所述第一时延确定部件，包括：

第一特征确定部件，用于确定与所述视频数据相关联的音频信号的特征；

第二确定子部件，用于根据所述特征确定所述第一时延。

19.根据权利要求18所述的音频处理装置，其中，所述特征包括以下中的一个或多个：所述音频信号的频率特征、所述音频信号的平均能量以及所述音频信号在时域的过零率。

20.根据权利要求15所述的音频处理装置，其中：

所述第一提供部件包括第一带通滤波器，用于对所述第一音频信号进行第一带通滤波处理后，提供给耳机接口的第一声道输出端；

所述第二提供部件包括第二带通滤波器，用于对所述第二音频信号进行第二带通滤波处理后，提供给耳机接口的第二声道输出端。

21.根据权利要求20所述的音频处理装置，还包括：

频率特性确定部件，用于根据所述视频数据的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

22.根据权利要求21所述的音频处理装置，其中，所述频率特性确定部件包括：

第二内容特性确定部件，用于根据与所述视频数据相关联的视频信息，确定与所述视频数据的播放内容有关的特性，

第一频率特性确定子部件，用于根据所述与所述视频数据的播放内容有关的特性，确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

23.根据权利要求21所述的音频处理装置，其中，所述频率特性确定部件包括：

第二特征确定部件，用于确定与所述视频数据相关联的音频信号的特征；

第二频率特性确定子部件，用于根据所述特征确定所述第一带通滤波器和/或所述第二带通滤波器的频率特性。

24.根据权利要求23所述的音频处理装置，其中，所述特征包括所述音频信号的频率特征。

25.根据权利要求21所述的音频处理装置，其中，所述第一带通滤波器和/或所述第二带通滤波器分别具有多个通带；

所述频率特性确定部件具体用于：根据所述视频数据的特性，分别确定所述第一带通滤波器和/或所述第二带通滤波器的各通带的通带增益。

26.根据权利要求20所述的音频处理装置，其中，所述第一带通滤波器的频率特性与所述第二带通滤波器的频率特性不同或相同。

27.根据权利要求15-26中任意一项所述的音频处理装置，其中，所述延迟部件包括：

分路单元，用于将所述音频信号分为两路，其中一路作为所述第一音频信号，

第一延迟单元，用于将所述两路中的另一路延迟所述第一时延后作为所述第二音频信号。

28.根据权利要求15-26中任意一项所述的音频处理装置，其中，所述延迟部件包括：

第一混合单元，用于将所述音频信号中的部分声道的音频信号混合作为所述第一音频信号，

第二混合单元，用于将所述音频信号中的其他声道的音频信号混合，

第二延迟单元，用于将所述第二混合单元的输出延迟所述第一时延后作为所述第二音频信号。

29.一种视频播放器，包括根据权利要求15-28中任意一项所述的音频处理装置。