CN117544893A - 音频调节方法、装置、电子设备和可读存储介质 - Google Patents

音频调节方法、装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN117544893A
CN117544893A CN202311500741.1A CN202311500741A CN117544893A CN 117544893 A CN117544893 A CN 117544893A CN 202311500741 A CN202311500741 A CN 202311500741A CN 117544893 A CN117544893 A CN 117544893A
Authority
CN
China
Prior art keywords
audio
channel
video
adjustment information
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311500741.1A
Other languages
English (en)
Inventor
何茂祥
李俊华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202311500741.1A priority Critical patent/CN117544893A/zh
Publication of CN117544893A publication Critical patent/CN117544893A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

本申请实施例提供了一种音频调节方法、装置、电子设备和可读存储介质,其中,音频调节方法包括:获取音频调整信息;基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节;其中,音频调整信息包括以下至少一项:调整声道音量的输入信息、视频中音源主体的方位信息和与耳机的距离信息,耳机与电子设备之间通信连接。

Description

音频调节方法、装置、电子设备和可读存储介质
技术领域
本申请属于电子设备技术领域,具体涉及一种音频调节方法、音频调节装置、电子设备和可读存储介质。
背景技术
在相关技术中,部分视频并没有很好的立体声效果,在用户播放视频时,只能按照视频已有的音频效果进行播放,影响用户的体验。
发明内容
本申请实施例的目的是提供一种音频调节方法、音频调节装置、电子设备和可读存储介质,能够解决视频声音的左右声道无法调节的技术问题。
第一方面,本申请实施例提供了一种音频调节方法,包括:
获取音频调整信息;
基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节;
其中,音频调整信息包括以下至少一项:调整声道音量的输入信息、视频中音源主体的方位信息和与耳机的距离信息,所述耳机与所述电子设备之间通信连接。
第二方面,本申请实施例提供了一种音频调节装置,包括:
获取模块,用于获取音频调整信息;
调节模块,用于基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节;
其中,音频调整信息包括以下至少一项:调整声道音量的输入信息、视频中音源主体的方位信息和与耳机的距离信息,耳机与电子设备之间通信连接。
第三方面,本申请实施例提供了一种电子设备,包括处理器,存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面提供的音频调节方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,该可读存储介质上存储程序或指令,该程序或指令被处理器执行时实现如第一方面提供的音频调节方法的步骤。
第五方面,本申请实施例提供了一种芯片,该芯片包括处理器和通信接口,该通信接口和该处理器耦合,该处理器用于运行程序或指令,实现如第一方面提供的音频调节方法的步骤。
第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面提供的音频调节方法的步骤。
在本申请实施例中,音频调节方法包括:获取音频调整信息,并根据音频调整信息对视频的左声道和右声道中的至少一项进行调节,从而实现对视频中双声道音频的调节,进而用户可以通过上述方法调节视频的音效效果,使视频符合用户对双声道的需求,提升视频的听觉效果。
附图说明
图1示出了根据本申请实施例的音频调节方法的流程图之一;
图2示出了根据本申请实施例的音频调节方法的实现方式示意图;
图3示出了根据本申请实施例的音频调节方法的流程图之二;
图4示出了根据本申请实施例的音频调节方法由电子设备执行的界面示意图;
图5示出了根据本申请实施例的音频调节装置的结构框图;
图6示出了根据本申请实施例的电子设备的结构框图;
图7示出了实现本申请实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的一种音频调节方法、音频调节装置和电子设备进行详细地说明。
图1示出了根据本申请实施例的音频调节方法的流程图之一,如图1所示,方法包括:
步骤102:获取音频调整信息。
具体地,在加载视频后,获取针对音频的音频调整信息。
步骤104:基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节,其中,音频调整信息包括以下至少一项:调整声道音量的输入信息、视频中音源主体的方位信息、与耳机的距离信息,耳机与电子设备之间通信连接。
具体地,根据音频调整信息,对视频的左声道和右声道中至少一个进行调节。
并且,音频调整信息包括调整声道音量的输入信息,也就是,电子设备可以根据用户发出的调整声道音量的输入,调节左声道和右声道中至少一个的音量。
音频调整信息包括视频中音源主体的方位信息,也就是,电子设备可以根据视频中发出声音的音源主体的方位信息,调节左声道和右声道中至少一个的音量。
音频调整信息包括与耳机的距离信息,耳机与电子设备之间通信连接,也就是电子设备可以根据耳机和电子设备之间的位置,调节左声道和右声道中至少一个的音量。
其中,音频调整信息包括调整声道音量的输入信息、视频中音源主体的方位信息和与耳机的距离信息中的至少一个。
本申请提供的音频调节方法能够调节视频的音频的左右声道,使得视频的音频播放时立体声效果更好,更符合视频中的场景。
并且,其可以在观看视频的过程中调节,用户根据自己的亲身体验来调节左右声道达到用户满意的立体声效果。
作为一种可能的实施方式,音频调整信息包括调整声道音量的输入信息;获取音频调整信息包括:在电子设备的屏幕上显示声道调节控件;接收对声道调节控件的第一输入;基于第一输入,获取对左声道和右声道中至少一项的音量调整信息。
具体地,电子设备包括屏幕,屏幕可以显示视频,还可以进行触控,用户可以通过屏幕对电子设备发出第一输入,电子设备可以接收来自屏幕的针对视频的左声道或右声道调节的第一输入。
其中,在电子设备加载视频后,可以在屏幕上可以显示视频,以及声道调节控件,其中,屏幕上可以显示两个声道调节控件,分别可以控制左声道和右声道,进而用户通过对声道调节控件的触控,达到调节左声道和右声道音量的目的,该方式便于操作。
以及,基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节的步骤,包括:基于左声道和右声道中至少一项的音量调整信息,对视频的左声道和右声道中的至少一项进行调节。
也就是,基于左声道的音量调整信息,对视频的左声道进行调节。基于右声道的音量调整信息,对视频的右声道进行调节。基于左声道的音量调整信息和右声道的音量调整信息,对视频的左声道和右声道进行调节。
如图4所示,在电子设备400加载视频后,在屏幕410上显示,并且,在屏幕410上还显示两个声道调节控件,具体地,在左侧具有左声道调节滑杆,在右侧具有右声道调节滑杆,用户通过触控滑杆,可以得到对相应声道的音量的控制。并且,在底部还可以显示视频帧缩略图,触控滑动该视频帧缩略图可以调节视频的播放进度。
具体操作方式可以是,进入视频的音频声道调节页面,选择一个本地视频,程序会自动加载分析得到视频的音频,然后加载显示视频封面,用户可以点击播放,开始播放后,屏幕的两侧会自动显示左右声道的声道调节控件,也就是两个可以调节左右声道的调节滑杆,滑动左侧的滑杆可以调节当前时间点音频的左声道大小,滑动右侧的滑杆可以调节当前时间点音频的右声道大小,在视频播放过程中,用户可以根据实际听觉感受来调节左右声道,比如在视频中某一个场景,音源来自左侧,播放的过程中用户感受不到或者感受不明显是场景左侧发出的声音,那么用户可以将这一小段时间场景的音频左声道适当增大一些音量,调节方式就是用户在播放这段场景时,滑动左侧调节杆,往上滑动适当调节增大左声道的音量,以达到立体声的效果,视频播放过程中也是可以拖动调节播放进度的,声道可以多次反复调节,直至用户满意为止,最终整个视频都调节完成后,用户点击完成保存,音频会重新编码得到用户调节后的效果,点击视频再次播放就是用户调节左右声道后的立体声效果了。
作为一种可能的实施方式,音频调整信息包括调整声道音量的输入信息;获取音频调整信息包括:接收对耳机的第二输入;基于第二输入的位置信息,获取对左声道和右声道中至少一项的音量调整信息。
具体地,耳机包括触控组件,其中,触控组件可以设置在耳机柄上,左耳耳机柄和右耳耳机柄均具有触控组件,分别对应左声道和右声道的调节。
具体地,音频调节方法由电子设备执行,电子设备和耳机建立通信,耳机包括触控组件,在电子设备加载视频后,用户可以通过耳机发出第二输入,电子设备可以接收来自耳机的针对视频的左声道或右声道调节的第二输入。
其中,在电子设备加载视频后,可以在屏幕上可以显示视频,电子设备和耳机建立通信,左耳耳机可以对应左声道的音量,右耳耳机可以对应右声道的音量,进而用户可以通过触控左耳耳机和右耳耳机进行第二输入,从而达到调节左声道和右声道音量的目的,该方式便于操作。
以及,触控屏幕进行第一输入和触控耳机进行第二输入可以结合在一起,通过触控屏幕和触控耳机都可以对音频进行调节。
以及,基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节的步骤,包括:基于左声道和右声道中至少一项的音量调整信息,对视频的左声道和右声道中的至少一项进行调节。
也就是,基于左声道的音量调整信息,对视频的左声道进行调节。基于右声道的音量调整信息,对视频的右声道进行调节。基于左声道的音量调整信息和右声道的音量调整信息,对视频的左声道和右声道进行调节。
具体操作方式可以是,进入视频音频声道调节页面,选择一个本地视频,程序会自动加载分析得到视频的音频,然后加载显示视频封面,用户可以点击播放,开始播放后,屏幕的两侧会自动显示左右声道的声道调节控件,也就是两个可以调节左右声道的调节滑杆,滑动左侧的滑杆可以调节当前时间点音频的左声道大小,滑动右侧的滑杆可以调节当前时间点音频的右声道大小,若用户连接了蓝牙耳机,也可以通过触摸滑动耳机柄来调节左右声道,在视频播放过程中,根据视频的场景,用户的实际听觉感受来调节左右声道,比如在视频中某一个场景,音源来自右侧,播放的过程中用户感受不到或者感受不明显是场景右侧发出的声音,那么用户可以将这一小段时间场景的音频右声道适当增大一些音量,并且,通过耳机调节音频的方式就是用户在播放这段场景时,触摸滑动右耳耳机柄,向上滑动适当调节增大右声道的音量,以达到立体声的效果,也可以触摸滑动左耳耳机柄,向下滑动调节降低左声道的音量,视频播放过程中也是可以拖动调节播放进度的,声道可以多次反复调节,直至用户满意为止,最终整个视频都调节完成后,用户点击完成保存,音频会重新编码得到用户调节后的效果,点击视频再次播放就是用户调节左右声道后的立体声效果了。
作为一种可能的实施方式,音频调整信息包括视频中音源主体的方位信息;获取音频调整信息包括:获取音频对应的主体在视频画面中的方位信息;基于方位信息,获取对左声道和右声道中至少一项的音量调整信息。
具体地,获取音频调整信息包括:获取音频对应的主体在视频画面中的方位信息,也就是,根据视频中的音频对应的主体在视频的场景的位置来调节左声道和右声道的音量,例如:视频中的音频对应的主***于场景的左侧,则增加左声道的音量,视频中的音频对应的主***于场景的右侧则增加右声道的音量。
具体操作方式可以是,进入视频音频声道调节页面,选择一个本地视频,程序会自动加载分析得到视频的音频,然后加载显示视频封面,用户可以点击播放,开始播放后,屏幕的两侧会自动显示左右声道的声道调节控件,也就是两个可以调节左右声道的调节滑杆,滑动左侧的滑杆可以调节当前时间点音频的左声道大小,滑动右侧的滑杆可以调节当前时间点音频的右声道大小,若用户选择自动调节,在视频播放过程中,根据视频的场景,会自动分析检测视频内容,定位音源主体的位置来调节左右声道,比如在视频中某一个场景,音源主体来自右侧,会自动对比右声道和左声道的声音差值,差值不明显,比如差别小于5%会自动增大右声道的音量,以达到立体声的效果,如果左声道音量比较高,可以调节降低左声道的音量以达到左右声道有差异的立体声效果,视频播放过程中也是可以拖动调节播放进度的,声道可以多次反复调节,直至用户满意为止,最终整个视频都调节完成后,用户点击完成保存,音频会重新编码得到用户调节后的效果,点击视频再次播放就是用户调节左右声道后的立体声效果了。
作为一种可能的实施方式,音频调整信息包括与耳机的距离信息;耳机包括距离传感器,获取音频调整信息包括:获取耳机中左耳耳机和电子设备的第一距离,以及右耳耳机和电子设备的第二距离;基于第一距离和第二距离,获取对左声道和右声道中至少一项的音量调整信息。
具体地,音频调节方法由电子设备执行,电子设备和耳机建立通信,耳机包括距离传感器,电子设备可以获取其和左耳耳机,以及其和右耳耳机的距离,左耳耳机可以对应左声道的音量,右耳耳机可以对应右声道的音量,电子设备和左耳耳机之间的距离为第一距离,电子设备和右耳耳机之间的距离为第二距离,通过左耳耳机和右耳耳机于电子设备之间的距离,实现对音频的调节,在第一距离大于第二距离时,增加左右声道的音量,在第一距离小于第二距离时,增加左声道的音量。
以及,基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节的步骤,包括:基于左声道和右声道中至少一项的音量调整信息,对视频的左声道和右声道中的至少一项进行调节。
也就是,基于左声道的音量调整信息,对视频的左声道进行调节。基于右声道的音量调整信息,对视频的右声道进行调节。基于左声道的音量调整信息和右声道的音量调整信息,对视频的左声道和右声道进行调节。
具体操作方式可以是,进入视频音频声道调节页面,选择一个本地视频,程序会自动加载分析得到视频的音频,然后加载显示视频封面,用户可以点击播放,开始播放后,屏幕的两侧会自动显示左右声道的声道调节控件,也就是两个可以调节左右声道的调节滑杆,滑动左侧的滑杆可以调节当前时间点音频的左声道大小,滑动右侧的滑杆可以调节当前时间点音频的右声道大小,若用户连接了蓝牙耳机,耳机内置有距离传感器,也可以通过左右耳耳机靠近手机来调节左右声道,在视频播放过程中,根据视频的场景,用户根据自己的实际听觉感受来调节左右声道,比如在视频中某一个场景,音源来自右侧,播放的过程中用户感受不到或者感受不明显是场景右侧发出的声音,那么用户可以将这一小段时间场景的音频右声道适当增大一些音量,通过耳机距离调节音量方式为用户在播放这段场景时,右耳耳机适当靠近手机,检测到右耳耳机靠近手机后,会适当调节增大右声道的音量,以达到立体声的效果,也可以左耳耳机远离手机,调节降低左声道的音量,视频播放过程中也是可以拖动调节播放进度的,声道可以多次反复调节,直至用户满意为止,最终整个视频都调节完成后,用户点击完成保存,音频会重新编码得到用户调节后的效果,点击视频再次播放就是用户调节左右声道后的立体声效果了。
作为一种可能的实施方式,在获取音频调整信息的步骤之前,还包括:在音频为单声道的情况下,复制单声道的音频,生成双声道音频。
具体地,在加载视频后,若发现视频为单声道的视频,可以将单声道复制,从而形成两个声道,并将两个声道结合成左右双声道,从而实现单声道视频到立体声视频的转化,提升视频的音效效果。
也就是,本申请提供的音频调节方法,能够将单声道的视频音频转换为双声道的视频音频,实现单声道的视频的立体声听觉效果。
并且,为了有更好的听觉效果,还可以增加使用混响、均衡器和立体声扩展器等音频效果来更好的增加立体声的效果。
具体操作方式可以是,进入视频的音频声道调节页面,选择一个本地视频,程序会自动加载分析得到视频的音频,若视频的音频是单声道的,会将单声道音频复制到左右两个声道上,转换为双声道音频,然后加载显示视频封面。
也就是,用户需要先选择本地的视频,选择视频后,加载分析该视频,若视频的声音音频是单声道的,需要先把单声道转换为双声道,转换方式是复制单声道音频到左右两个声道上,使得这个音频变为双声道音频。
确保视频的音频为双声道音频之后,开始播放视频,播放视频页面的左右两侧分别有两个调节进度条,左右两侧的进度条分别来控制改变左右声道的音量大小,如果用户佩戴了耳机,也可以通过触摸滑动耳机柄来改变左右声道的音量大小。
作为一种可能的实施方式,还包括:接收保存输入;基于调整后的音频,对视频中的音频轨道重新编码。
具体地,在接收到针对视频的保存输入后,对视频中的音频轨道进行重新编码,从而记录调节后的左声道和右声道的音量,进而用户可以通过上述方法调节视频的音效效果,使视频符合用户对双声道的需求,提升视频的听觉效果。
其中,在保存视频时,选择不对视频轨道进行重新编码,而只重新编码音频轨道,可以提升编码速度,降低资源的占用。
在具体实施例中,如图2所示,音频调节方法的主要由视频播放浏览、用户操作输入、控制单元、声道调节器和音频编码进行实现。
视频播放浏览:视频播放浏览是用户选择视频,电子设备加载该视频,进行浏览。
用户操作输入:用户操作输入是用户基于提供的可操作界面(User Interface,UI)页面,操作选择视频,控制视频播放进度,控制视频播放、暂停等。还可以通过具有滑动两侧的进度条调节左右声道大小。
控制单元:控制视频是否需要由单声道变为双声道,根据用户滑动声道调节进度条的距离或者是触摸滑动耳机柄的距离来计算控制声道改变的多少,以及调节声道后音频重新编码的控制。
声道调节器:对音频左右声道进行平衡调节,主要是根据用户滑动距离来确定调节的幅度大小。
音频编码:对视频中的音频进行了左右声道的平衡调节,那么在保存视频时,通常需要重新编码音频和视频,并将它们合成成一个文件,为了减少编码的时间和文件大小,在重新编码时,选择不对视频轨道进行重新编码,而只重新编码音频轨道。
图3示出了根据本申请实施例的音频调节方法的流程图之二,如图3所示,方法包括:
步骤302:加载视频。该步骤可以通过用户选择视频实现。
具体地,用户选择视频,电子设备加载该视频。
步骤304:判断视频是否为单声道。判断结果为是的情况下,执行步骤306,判断结果为否的情况下,执行步骤308。
步骤306:将视频的音频转化为双声道。
具体地,如果视频是单声道,则复制单声道,从而将视频转化为双声道。
步骤308:开始横屏播放。该步骤可以通过用户点击实现。
具体地,采用横屏播放该视频,增加视频的显示面积,并且,电子设备的麦克风通常设置在顶部和底部,因此,横屏播放更利于产生立体声效果。
步骤310:屏幕两侧显示左声道和右声道的调节进度条。该步骤可以通过用户滑动实现。
具体地,在屏幕的两侧会分别显示左声道和右声道的调节进度条,用户滑动调节进度条,可以调节其对应的左声道或右声道。
步骤312:判断是否连接耳机。判断结果为是的情况下,执行步骤314,判断结果为否的情况下,执行步骤316。
具体地,判断电子设备和耳机是否建立通信连接。
步骤314:耳机柄调节声道的音量大小。该步骤可以通过用户触摸滑动耳机的触控组件实现。
具体地,在电子设备和耳机建立通信的情况下,可以通过触控耳机柄的方式,达到对声道的调节,其中,左耳耳机对应左声道,右耳耳机对应右声道,触控左耳耳机柄可以控制左声道的音量的大小,触控右耳耳机柄可以控制右声道的音量的大小。例如:上滑为增加音量,下滑为降低音量。
步骤316:调节完成保存视频。
具体地,调节完成后,可以对音频进行重新编码,并保存视频。
步骤318:用户可以查看视频。
具体地,再次打开视频后,就会播放调节声道后的音频效果。
本申请提供的音频调节方法可以根据具体的场景调节视频声音的左右声道大小,来达到更符合用户听觉体验的立体声效果。
具体操作方式可以是,用户选择一个本地视频,加载这个视频后,检查视频中的音频是不是单声道音频,如果是单声道音频,则复制单声道音频到左右两个声道上,使得这个音频变为双声道音频再进行后面的操作。若视频中的音频是双声道的音频,自动播放该视频,在播放过程中,用户根据视频场景以及当前播放的听觉效果来调节左右声道的大小以达到更好的立体声效果,提供以下几种方式供用户选择如何调节左右声道,一种是提供两个调节进度条,分别可以时时控制音频当前时间点的左右声道的音量大小;一种方式是用户通过佩戴真无线耳机,在用耳机听视频播放的过程中,用户可以触摸滑动耳机柄,在播放过程中通过触摸滑动左右耳耳机的耳机柄来实现声道的音量的调节;一种是用户佩戴内置距离传感器的耳机,根据左右耳距离手机的远近,调整左右声道的音量大小。例如,当左耳耳机靠近手机时,增加左声道音量,减少右声道音量,当右耳耳机靠近手机时,增加右声道音量,减少左声道音量,左右耳耳机同时靠近手机时,同时增加左右声道的音量;一种是识别分析视频的场景,得到声源的方位,自动调整左右声道的音量,也就是,根据视频场景,自动调整左右声道的音量,比如当前画面中有左中右三个人,左边人说话的时候调高左声道的音量,右边人说话的时候调高右声道的音量,中间的人说话的时候左声道和右声道保持一致,即识别画面中发声主体的位置,相应调整左右声道的音量。
本申请实施例提供的音频调节方法,执行主体可以为音频调节装置。本申请实施例中以音频调节装置执行音频调节方法为例,说明本申请实施例提供的音频调节方法的装置。
如图5所示,在本申请的一些实施例中,本申请提供了一种音频调节装置500,应用于电子设备,包括:获取模块502,用于获取音频调整信息;调节模块504,用于基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节;其中,音频调整信息包括以下至少一项:调整声道音量的输入信息、视频中音源主体的方位信息和与耳机的距离信息,耳机与电子设备之间通信连接。
具体地,在加载视频后,获取针对音频的音频调整信息。
根据音频调整信息,对视频的左声道和右声道中至少一个进行调节。
并且,音频调整信息包括调整声道音量的输入信息,也就是,电子设备可以根据用户发出的调整声道音量的输入,调节左声道和右声道中至少一个的音量。
音频调整信息包括视频中音源主体的方位信息,也就是,电子设备可以根据视频中发出声音的音源主体的方位信息,调节左声道和右声道中至少一个的音量。
音频调整信息包括与耳机的距离信息,耳机与电子设备之间通信连接,也就是电子设备可以根据耳机和电子设备之间的位置,调节左声道和右声道中至少一个的音量。
其中,音频调整信息包括调整声道音量的输入信息、视频中音源主体的方位信息和与耳机的距离信息中的至少一个。
作为一种可能的实施方式,音频调整信息包括调整声道音量的输入信息;获取模块包括:第一显示子模块,用于在电子设备的屏幕上显示声道调节控件;第一接收子模块,用于接收对声道调节控件的第一输入;第一获取子模块,用于基于第一输入,获取对左声道和右声道中至少一项的音量调整信息。
具体地,电子设备包括屏幕,屏幕可以显示视频,还可以进行触控,用户可以通过屏幕对电子设备发出第一输入,电子设备可以接收来自屏幕的针对视频的左声道或右声道调节的第一输入。
其中,在电子设备加载视频后,可以在屏幕上可以显示视频,以及声道调节控件,其中,屏幕上可以显示两个声道调节控件,分别可以控制左声道和右声道,进而用户通过对声道调节控件的触控,达到调节左声道和右声道音量的目的,该方式便于操作。
作为一种可能的实施方式,音频调整信息包括调整声道音量的输入信息;获取模块包括:第二接收子模块,用于接收对耳机的第二输入;第二获取子模块,用于基于第二输入的位置信息,获取对左声道和右声道中至少一项的音量调整信息。
具体地,耳机包括触控组件,其中,触控组件可以设置在耳机柄上,左耳耳机柄和右耳耳机柄均具有触控组件,分别对应左声道和右声道的调节。
具体地,音频调节方法由电子设备执行,电子设备和耳机建立通信,耳机包括触控组件,在电子设备加载视频后,用户可以通过耳机发出第二输入,电子设备可以接收来自耳机的针对视频的左声道或右声道调节的第二输入。
其中,在电子设备加载视频后,可以在屏幕上可以显示视频,电子设备和耳机建立通信,左耳耳机可以对应左声道的音量,右耳耳机可以对应右声道的音量,进而用户可以通过触控左耳耳机和右耳耳机进行第二输入,从而达到调节左声道和右声道音量的目的,该方式便于操作。
以及,触控屏幕进行第一输入和触控耳机进行第二输入可以结合在一起,通过触控屏幕和触控耳机都可以对音频进行调节。
作为一种可能的实施方式,音频调整信息包括视频中音源主体的方位信息;获取模块包括:第三获取子模块,用于获取音频对应的主体在视频画面中的方位信息;第四获取子模块,用于基于方位信息,获取对左声道和右声道中至少一项的音量调整信息。
具体地,获取音频调整信息包括:获取音频对应的主体在视频画面中的方位信息,也就是,根据视频中的音频对应的主体在视频的场景的位置来调节左声道和右声道的音量,例如:视频中的音频对应的主***于场景的左侧,则增加左声道的音量,视频中的音频对应的主***于场景的右侧则增加右声道的音量。
作为一种可能的实施方式,音频调整信息包括与耳机的距离信息;耳机包括距离传感器,获取模块包括:第五获取子模块,用于获取耳机中左耳耳机和电子设备的第一距离,以及右耳耳机和电子设备的第二距离;第六获取子模块,用于基于第一距离和第二距离,获取对左声道和右声道中至少一项的音量调整信息。
具体地,音频调节方法由电子设备执行,电子设备和耳机建立通信,耳机包括距离传感器,电子设备可以获取其和左耳耳机,以及其和右耳耳机的距离,左耳耳机可以对应左声道的音量,右耳耳机可以对应右声道的音量,电子设备和左耳耳机之间的距离为第一距离,电子设备和右耳耳机之间的距离为第二距离,通过左耳耳机和右耳耳机于电子设备之间的距离,实现对音频的调节,在第一距离大于第二距离时,增加左右声道的音量,在第一距离小于第二距离时,增加左声道的音量。
作为一种可能的实施方式,还包括:复制模块,用于在音频为单声道的情况下,复制单声道的音频,生成双声道音频。
具体地,在加载视频后,若发现视频为单声道的视频,可以将单声道复制,从而形成两个声道,并将两个声道结合成左右双声道,从而实现单声道视频到立体声视频的转化,提升视频的音效效果。
也就是,本申请提供的音频调节方法,能够将单声道的视频音频转换为双声道的视频音频,实现单声道的视频的立体声听觉效果。
并且,为了有更好的听觉效果,还可以增加使用混响、均衡器和立体声扩展器等音频效果来更好的增加立体声的效果。
作为一种可能的实施方式,还包括:接收模块,用于接收保存输入;编码模块,用于基于调整后的音频,对视频中的音频轨道重新编码。
具体地,在接收到针对视频的保存输入后,对视频中的音频轨道进行重新编码,从而记录调节后的左声道和右声道的音量,进而用户可以通过上述方法调节视频的音效效果,使视频符合用户对双声道的需求,提升视频的听觉效果。
其中,在保存视频时,选择不对视频轨道进行重新编码,而只重新编码音频轨道,可以提升编码速度,降低资源的占用。
本申请实施例中的音频调节装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是电子设备,也可以为除电子设备之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobilepersonal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,还可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的音频调节装置可以为具有操作***的装置。该操作***可以为安卓(Android)操作***,可以为iOS操作***,还可以为其他可能的操作***,本申请实施例不作具体限定。
本申请实施例提供的音频调节装置能够实现上述方法实施例实现的各个过程,达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种电子设备,图6示出了根据本申请实施例的电子设备的结构框图,如图6所示,电子设备600包括处理器602和存储器604,存储在存储器604上并可在处理器602上运行的程序或指令,该程序或指令被处理器602执行时实现上述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
图7为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709以及处理器710等部件。
本领域技术人员可以理解,电子设备700还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理***与处理器710逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器710用于接收针对视频的左声道或右声道调节的第一输入。
处理器710用于获取音频调整信息。
处理器710用于基于音频调整信息,对视频的左声道和右声道中的至少一项进行调节;其中,音频调整信息包括以下至少一项:调整声道音量的输入信息、视频中音源主体的方位信息和与耳机的距离信息,耳机与电子设备之间通信连接。
处理器710用于在电子设备的屏幕上显示声道调节控件。
处理器710用于接收对声道调节控件的第一输入。
处理器710用于基于第一输入,获取对左声道和右声道中至少一项的音量调整信息。
处理器710用于接收对耳机的第二输入。
处理器710用于基于第二输入的位置信息,获取对左声道和右声道中至少一项的音量调整信息。
处理器710用于获取音频对应的主体在视频画面中的方位信息。
处理器710用于基于方位信息,获取对左声道和右声道中至少一项的音量调整信息。
处理器710用于获取耳机中左耳耳机和电子设备的第一距离,以及右耳耳机和电子设备的第二距离。
处理器710用于基于第一距离和第二距离,获取对左声道和右声道中至少一项的音量调整信息。
处理器710用于在音频为单声道的情况下,复制单声道的音频,生成双声道音频。
处理器710用于接收保存输入。
处理器710用于基于调整后的音频,对视频中的音频轨道重新编码。
具体地,在加载视频后,获取针对音频的音频调整信息。
根据音频调整信息,对视频的左声道和右声道中至少一个进行调节。
并且,音频调整信息包括调整声道音量的输入信息,也就是,电子设备可以根据用户发出的调整声道音量的输入,调节左声道和右声道中至少一个的音量。
音频调整信息包括视频中音源主体的方位信息,也就是,电子设备可以根据视频中发出声音的音源主体的方位信息,调节左声道和右声道中至少一个的音量。
音频调整信息包括与耳机的距离信息,耳机与电子设备之间通信连接,也就是电子设备可以根据耳机和电子设备之间的位置,调节左声道和右声道中至少一个的音量。
其中,音频调整信息包括调整声道音量的输入信息、视频中音源主体的方位信息和与耳机的距离信息中的至少一个。
应理解的是,本申请实施例中,输入单元704可以包括图形处理器(GraphicsProcessing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像文件进行处理。显示单元706可包括显示面板7061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072中的至少一种。触控面板7071,也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器709可用于存储软件程序以及各种文件。存储器709可主要包括存储程序或指令的第一存储区和存储文件的第二存储区,其中,第一存储区可存储操作***、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器709可以包括易失性存储器或非易失性存储器,或者,存储器709可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(ProgrammableROM,PROM)、可擦除可编程只读存储器(ErasablePROM,EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍文件速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器709包括但不限于这些和任意其它适合类型的存储器。
处理器710可包括一个或多个处理单元;可选地,处理器710集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作***、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
本申请实施例还提供一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述音频调节方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述音频调节方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为***级芯片、***芯片、芯片***或片上***芯片等。
本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述音频调节方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (10)

1.一种音频调节方法,应用于电子设备,其特征在于,包括:
获取音频调整信息;
基于所述音频调整信息,对视频的左声道和右声道中的至少一项进行调节;
其中,所述音频调整信息包括以下至少一项:调整声道音量的输入信息、所述视频中音源主体的方位信息和与耳机的距离信息,所述耳机与所述电子设备之间通信连接。
2.根据权利要求1所述的音频调节方法,其特征在于,所述音频调整信息包括所述调整声道音量的输入信息;所述获取音频调整信息包括:
在所述电子设备的屏幕上显示声道调节控件;
接收对所述声道调节控件的第一输入;
基于所述第一输入,获取对所述左声道和所述右声道中至少一项的音量调整信息。
3.根据权利要求1所述的音频调节方法,其特征在于,所述音频调整信息包括所述调整声道音量的输入信息;所述获取音频调整信息包括:
接收对所述耳机的第二输入;
基于所述第二输入的位置信息,获取对所述左声道和所述右声道中至少一项的音量调整信息。
4.根据权利要求1所述的音频调节方法,其特征在于,所述音频调整信息包括所述视频中音源主体的方位信息;所述获取音频调整信息包括:
获取音频对应的主体在视频画面中的方位信息;
基于所述方位信息,获取对所述左声道和所述右声道中至少一项的音量调整信息。
5.根据权利要求1所述的音频调节方法,其特征在于,所述音频调整信息包括与耳机的距离信息;所述耳机包括距离传感器,所述获取音频调整信息包括:
获取所述耳机中左耳耳机和所述电子设备的第一距离,以及右耳耳机和所述电子设备的第二距离;
基于所述第一距离和所述第二距离,获取对所述左声道和所述右声道中至少一项的音量调整信息。
6.根据权利要求1至5中任一项所述的音频调节方法,其特征在于,在所述获取音频调整信息的步骤之前,还包括:
在所述音频为单声道的情况下,复制所述单声道的音频,生成双声道音频。
7.根据权利要求1至5中任一项所述的音频调节方法,其特征在于,还包括:
接收保存输入;
基于调整后的所述音频,对所述视频中的音频轨道重新编码。
8.一种音频调节装置,应用于电子设备,其特征在于,包括:
获取模块,用于获取音频调整信息;
调节模块,用于基于所述音频调整信息,对视频的左声道和右声道中的至少一项进行调节;
其中,所述音频调整信息包括以下至少一项:调整声道音量的输入信息、所述视频中音源主体的方位信息和与耳机的距离信息,所述耳机与所述电子设备之间通信连接。
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至7中任一项所述的音频调节方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至7中任一项所述的音频调节方法的步骤。
CN202311500741.1A 2023-11-13 2023-11-13 音频调节方法、装置、电子设备和可读存储介质 Pending CN117544893A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311500741.1A CN117544893A (zh) 2023-11-13 2023-11-13 音频调节方法、装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311500741.1A CN117544893A (zh) 2023-11-13 2023-11-13 音频调节方法、装置、电子设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN117544893A true CN117544893A (zh) 2024-02-09

Family

ID=89789232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311500741.1A Pending CN117544893A (zh) 2023-11-13 2023-11-13 音频调节方法、装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN117544893A (zh)

Similar Documents

Publication Publication Date Title
CN109819313B (zh) 视频处理方法、装置及存储介质
US11670339B2 (en) Video acquisition method and device, terminal and medium
CN112237012B (zh) 用于控制多视点全方位内容中的音频的装置及方法
US8380333B2 (en) Methods, apparatuses and computer program products for facilitating efficient browsing and selection of media content and lowering computational load for processing audio data
US11037600B2 (en) Video processing method and apparatus, terminal and medium
US20140105411A1 (en) Methods and systems for karaoke on a mobile device
CN104885151A (zh) 用于基于感知准则呈现基于对象的音频内容的对象群集
CN102197646A (zh) 用便携式电子装置产生多通道音频的***和方法
CN105260109A (zh) 一种播放速度调节方法及终端
CN106790940B (zh) 录音方法、录音播放方法、装置及终端
KR102640234B1 (ko) 디스플레이 장치의 제어 방법 및 그에 따른 디스플레이 장치
US11570569B2 (en) Associated spatial audio playback
CN112165648B (zh) 一种音频播放的方法、相关装置、设备及存储介质
WO2023029829A1 (zh) 音频处理方法、装置、用户终端及计算机可读介质
CN104918120A (zh) 一种播放进度调节方法及电子设备
CN106851451A (zh) 一种耳机音量控制方法及装置
JP4572615B2 (ja) 情報処理装置および方法、記録媒体、並びにプログラム
CN113079419A (zh) 应用程序的视频处理方法和电子设备
US9779093B2 (en) Spatial seeking in media files
CN112291615A (zh) 音频输出方法、音频输出装置
CN112673651B (zh) 多视点多用户音频用户体验
CN117544893A (zh) 音频调节方法、装置、电子设备和可读存储介质
WO2018155352A1 (ja) 電子機器の制御方法、電子機器、電子機器の制御システム、及び、プログラム
CN113709652B (zh) 音频播放控制方法和电子设备
KR20190081163A (ko) 입체 음향 컨텐츠 저작 툴을 이용한 선택적 광고 제공 방법 및 이를 위한 어플리케이션

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination