CN103714824B - 一种音频处理方法、装置及终端设备 - Google Patents

一种音频处理方法、装置及终端设备 Download PDF

Info

Publication number
CN103714824B
CN103714824B CN201310683731.6A CN201310683731A CN103714824B CN 103714824 B CN103714824 B CN 103714824B CN 201310683731 A CN201310683731 A CN 201310683731A CN 103714824 B CN103714824 B CN 103714824B
Authority
CN
China
Prior art keywords
audio
frequency
tone
frequency characteristics
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310683731.6A
Other languages
English (en)
Other versions
CN103714824A (zh
Inventor
文红
石新明
徐兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201310683731.6A priority Critical patent/CN103714824B/zh
Publication of CN103714824A publication Critical patent/CN103714824A/zh
Application granted granted Critical
Publication of CN103714824B publication Critical patent/CN103714824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephone Function (AREA)

Abstract

本公开是关于一种音频处理方法、装置及终端设备。所述方法包括:接收到音频时,获取所述音频的音频信息;对所述音频的音频信息进行分析,确定所述音频的音频特征;根据所述音频的音频特征,对所述音频进行调节;输出调节后的所述音频。本公开中,接收到音频时即对音频进行处理,实现了音频处理的实时性;通过根据音频的音频特征对音频进行调节,实现了实时根据接收到的音频的音频特征,个性化地动态调整该音频;对于不同的音频,进行不同的调节,从而提高了输出的音频的质量,使得音频的处理结果更能满足用户的需求。

Description

一种音频处理方法、装置及终端设备
技术领域
本公开是关于通信及计算机技术领域,尤其是涉及一种音频处理方法、装置及终端设备。
背景技术
具有通信功能的设备,例如手机平板电脑等,为人们的沟通提供了方便。人们可以与远在千里之外的亲朋好友通过音频进行通话。在进行音频通话时,常常需要对音频进行处理后再进行播放。
通常,采用固态均衡器,对所有的声音做同一处理。
然而,对所有的声音做同一处理后,音频的质量中依然存在问题,例如播放出的声音中仍然存在刺耳的声音等影响用户的听觉***,对用户的健康不利,使得用户体验差。
发明内容
为克服相关技术中存在的问题,本公开提供一种音频处理方法、装置及终端设备,用于提高音频的输出质量,提高用户体验。
一方面,本公开提供了一种音频处理方法,包括:
接收到音频时,获取所述音频的音频信息;
对所述音频的音频信息进行分析,确定所述音频的音频特征;
根据所述音频的音频特征,对所述音频进行调节;
输出调节后的所述音频。
本公开实施例中,接收到音频时即对音频进行处理,实现了音频处理的实时性;通过根据音频的音频特征对音频进行调节,实现了实时根据接收到的音频的音频特征,个性化地动态调整该音频;对于不同的音频,进行不同的调节,从而提高了输出的音频的质量,使得音频的处理结果更能满足用户的需求。
所述音频信息包括:所述音频的时域信息和\或所述音频的频域信息。
当所述音频信息为所述音频的时域信息时,所述对所述音频的音频信息进行分析,确定所述音频的音频特征包括:
通过傅里叶变换,将所述音频的时域信息变换为所述音频的频域信息;
对所述音频的频域信息进行分析,确定所述音频的音频特征。
通过傅里叶变换将复杂的随时间变化的时域信息,分解为若干单一的谐波分量来研究,以获得音频的频率结构以及各谐波的信息,从而提高了对音频分析的准确性,进而有利于根据分析得出的音频特征对音频进行调节。提高输出的音频的质量。
所述对所述音频的音频信息进行分析,确定所述音频的音频特征包括:
根据精神元网络分析法对所述音频的音频信息进行分析,确定所述音频的音频特征。
通过精神元网络分析法的具有高度并行计算能力、自学能力和容错能力的优势,对音频信息进行深层次的分析,能够提高确定音频的音频特征的准确性,进而有利于根据分析得出的音频特征对音频进行调节。提高输出的音频的质量。
所述音频的音频特征包括所述音色、音调、响度中的任一种或多种。
当所述音频特征包括音调时,所述根据所述音频的音频特征,对所述音频进行调节,包括:
根据所述音频的音调,确定所述音频的音调的加权值;
根据所述加权值,调节所述音频的音调。
本公开实施例中,根据音频的音调实时动态的确定该音频的加权值,实现了实时根据音频的音调,动态调整音频的音调,使得音频的处理结果更能满足用户的需求,提高了输出的音频的质量。
当所述音频特征包括音调时,所述方法还包括:
接收设置音调调节范围的指令;
根据所述指令,配置音调调节范围。
本公开实施例实现用户可以根据自己的喜好和自己的听觉习惯对音频的音调调节范围进行设定,从而使音频的处理更能够满足用户的需求,实现根据用户的需求个性化处理音频的音调,提高用户体验。
当所述音频特征包括音色时,所述根据所述音频的音频特征,对所述音频进行调节,包括:
当与联系人进行音频通话时,根据所述联系人对应的音色调节参数,对与联系人进行音频通话时获得的音频进行调节。
本公开实施例实现根据用户自己的喜好和需求,对不同联系人的音频的音色进行调节,实现将音频的音色调节至用户喜好或听觉舒适的音色,提高了用户体验。
另一方面,本公开中还提出一种音频处理装置,所述装置包括:
获取模块,用于接收到音频时,获取所述音频的音频信息;
确定模块,用于对所述音频的音频信息进行分析,确定所述音频的音频特征;
调节模块,用于根据所述音频的音频特征,对所述音频进行调节;
输出模块,用于输出调节后的所述音频。
所述确定模块包括:
变换单元,用于当所述音频信息为所述音频的时域信息时,通过傅里叶变换,将所述音频的时域信息变换为所述音频的频域信息;
第一确定单元,用于对所述音频的频域信息进行分析,确定所述音频的音频特征。
所述确定模块包括:
第二确定单元,用于根据精神元网络分析法对所述音频的音频信息进行分析,确定所述音频的音频特征。
所述调节模块包括:
加权值确定单元,用于当所述音频特征包括音调时,根据所述音频的音调,确定所述音频的音调的加权值;
第一调节单元,用于根据所述加权值,调节所述音频的音调。
所述装置还包括:
接收模块,用于接收设置音调调节范围的指令;
配置模块,用于根据所述指令,配置音调调节范围。
所述调节模块包括:
第二调节单元,用于当所述音频特征包括音色时,当与联系人进行音频通话时,根据所述联系人对应的音色调节参数,对与联系人进行音频通话时获得的音频进行调节。
另一方面,本公开还提出一种终端设备,所述终端设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收到音频时,获取所述音频的音频信息;
对所述音频的音频信息进行分析,确定所述音频的音频特征;
根据所述音频的音频特征,对所述音频进行调节;
输出调节后的所述音频。
本公开的一些有益效果可以包括:接收到音频时即对音频进行处理,实现了音频处理的实时性;通过根据音频的音频特征对音频进行调节,实现了实时根据接收到的音频的音频特征,个性化地动态调整该音频;对于不同的音频,进行不同的调节,从而提高了输出的音频的质量,使得音频的处理结果更能满足用户的需求。
本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
附图用来提供对本公开的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。在附图中:
图1是本公开实施例中的音频处理方法的示例性流程图;
图2是本公开实施例中通过加权值调节音频的音调进行音频处理的方法的示例性流程图;
图3是本公开实施例中通过加权值调节音频的音调前,音调的示意图;
图4是本公开实施例中通过加权值调节音频的音调后,音调的示意图;
图5是本公开实施例中根据音调的调节范围进行配置进行音频处理的方法的示例性流程图;
图6是本公开实施例中提供的用于调节音调调节范围的界面效果图;
图7是本公开实施例中根据音色进行音频处理的方法的示例性流程图;
图8是本公开实施例中音频处理装置的示例性结构示意图;
图9是本公开实施例中确定模块的第一种示例性结构示意图;
图10是本公开实施例中确定模块的第二种示例性结构示意图;
图11是本公开实施例中调节模块的第一种示例性结构示意图;
图12是本公开实施例中音频处理装置的另一种示例性结构示意图;
图13是本公开实施例中调节模块的第二种示例性结构示意图;
图14是本公开实施例中提出的终端设备的示例性结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
以下结合附图对本公开的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本公开,并不用于限定本公开。
本公开实施例提供一种音频处理方法,该音频处理方法可以在终端设备中实现,如手机、平板电脑、电脑等。以下结合附图对本公开进行详细说明。
在一个实施例中,如图1所示,音频处理方法包括:
在步骤S101中,接收到音频时,获取音频的音频信息。
其中,音频信息至少包括该音频的时域信息和该音频的频域信息中的一种信息。
其中,对接收到的音频可以分段依次进行获取,例如将接收到的音频按照10ms(毫秒)为一段进行划分,按照时间先后,依次以10ms为一段获取音频片段,然后对获取的音频片段进行分析和调节。
在步骤S102中,对音频的音频信息进行分析,确定音频的音频特征。
其中,音频特征包括音频的音色、音调、响度中的任一种或多种。音频为由许多频率不同的分量信号组成的复合信号,音频中的基音和泛音决定了音色,音频的频率决定了音调、音频的幅值决定了响度。获取的音频信息中
其中,音频特征还可以是基于时域模型、倒普模型、基于LPC的倒谱系数LPCC、基于Mel频率弯折的倒谱系数MFCC、感知线性预测系数和基于混沌分形理论等确定的音频特征。
其中,确定音频的音频特征,有以下两种实现方式:
方式一:
步骤A:当音频信息为该音频的时域信息时,通过傅里叶变换,将音频的时域信息变换为音频的频域信息。
步骤B:对音频的频域信息进行分析,确定音频的音频特征。
方式一中,通过傅里叶变换将复杂的随时间变化的时域信息,分解为若干单一的谐波分量来研究,以获得音频的频率结构以及各谐波的信息,从而提高了对音频分析的准确性,进而有利于根据分析得出的音频特征对音频进行调节。提高输出的音频的质量。
方式二:
步骤B:根据精神元网络分析法对音频的音频信息进行分析,确定音频的音频特征。
方式二中,通过精神元网络分析法的具有高度并行计算能力、自学能力和容错能力的优势,对音频信息进行深层次的分析,能够提高确定音频的音频特征的准确性,进而有利于根据分析得出的音频特征对音频进行调节。提高输出的音频的质量。
此外,音频的音频特征还可以进一步根据精神元网络分析法结合对音频的频域信息分析确定。
在步骤S103中,根据音频的音频特征,对音频进行调节。
在步骤S104中,输出调节后的音频。
本公开实施例中,接收到音频时即对音频进行处理,实现了音频处理的实时性;通过根据音频的音频特征对音频进行调节,实现了实时根据接收到的音频的音频特征,个性化地动态调整该音频;对于不同的音频,进行不同的调节,从而提高了输出的音频的质量,使得音频的处理结果更能满足用户的需求。
本公开实施例中,可以根据音频特征,自动确定调节参数,根据调节参数改变音频的感觉(如音色、音调或响度)从而,实现对音频的调节;也可以根据用户的设置,对音频进行调节。下面对上述音频调节的方法进行详细说明。
实施例一
本公开实施例中,当音频特征包括音调时,通过加权值,调节音频的音调,如图2所示,该方法包括:
在步骤S201中,接收到音频时,获取音频的音频信息。
在步骤S202中,对音频的音频信息进行分析,确定音频的音频特征,该音频特征中包括音频的音调。
在步骤S203中,根据音频的音调,确定音频的加权值。
在步骤S204中,根据所述加权值,调节所述音频的音调。
例如,可以预先配置一个舒适的音调范围,在该舒适的音调范围内用户感觉舒适,不会觉得声音刺耳也不会觉得声音发闷。当音频的音调不在该舒适的音调范围内时,可以通过对该音频设置一个加权值,将音频的音调调节到该舒适的音调范围内。但调节后不同的音调仍然不同,以便于使得不同的音调输出后也不相同,用户不仅可以听出音调的不同,而且是在舒适的音调范围内听到。如图3所示,为10ms内的音频的音调随时间的变化的示意图,图中虚线a和虚线b代表了听觉舒适的音调范围,其中a的音调小于b的音调。对图3中音频的音调经过加权计算后,音频的音调输出的效果图如图4所示。从图4中可以看出,10ms内音频的音调保留原有的区别,但音频的音调都在舒适的音调范围内。
在步骤S205中,输出调节音调后的音频。
本公开实施例中,根据音频的音调实时动态的确定该音频的加权值,实现了实时根据音频的音调,动态调整音频的音调,使得音频的处理结果更能满足用户的需求,提高了输出的音频的质量。
实施例二
本公开实施例中,当音频特征中包括音调时,可以根据设置的音调调节范围调节音频的音调,如图5所示,该方法包括:
在步骤S501中,接收设置音调调节范围的指令。
其中,用户可以根据自己的需求确定对何种范围内的音调进行调节,例如,音调与频率有关,当用户对高频的音调比较敏感时,可以按自己的需求设置对高频的音频进行调节,可以设置调节的范围为10KHz-20KHz。如果用户对低频的声音不敏感,而又希望听清低频的声音,可以设置低频的调节范围。在实际使用中,为了便于用户操作可以提供调节界面,如图6所示,调节界面中有可供用户选择的“提高低音”“降低高音”的选项,还可以为用户提供高级设置,以便于用户自己设置调节音调的频率范围。
在步骤S502中,根据指令,配置音调调节范围。
在步骤S503中,接收到音频时,获取音频的音频信息。
在步骤S504中,对音频的音频信息进行分析,确定音频的音频特征,该音频特征中包括音频的音调。
在步骤S505中,根据配置的音调调节范围和音频的音调,对音频的音调进行调节。
在步骤S506中,输出调节后的音频。
本公开实施例实现用户可以根据自己的喜好和自己的听觉习惯对音频的音调调节范围进行设定,从而使音频的处理更能够满足用户的需求,实现根据用户的需求个性化处理音频的音调,提高用户体验。
实施例三
本公开实施例中,还可以对音频的音色进行调节。其中,用户可以根据自己的需要和爱好,为进行音频的不同联系人设置不同的音色,当与联系人进行音频通话时,根据该联系人对应的音色调节参数,对与联系人进行音频通话时获得的音频进行调节。下面以将男生的音色调节为女生的音色为例,对本公开实施例中,通过调节音色进行音频处理的方法进行详细说明,如图7所示,包括:
在步骤S701中,接收将男性联系人B的音色调节为女性音色的设置指令。
其中,男声和女声的不同,主要由于基音频率的分布不同引起的,男声的基因频率的均值在50Hz-200Hz范围内,女声的基因频率的均值在200Hz-450Hz范围内,因此可以通过调节联系人的基音频率改变联系人的音色。
在一个实施例中,由于音频的音色与基音和泛音有关,还可以根据其他物体的音色例如乐器的音色对联系人的音色进行调节。例如根据小提琴音色中的基音和泛音组成,将联系人的音色改为小提琴的音色等。
在步骤S702中,将男性联系人B的音色调节参数设置为调节为女性。
在步骤S703中,与男性联系人B进行通话时,获取该男性联系人B的音频信息。
在步骤S704中,对获取的音频信息进行分析,确定该音频的音色为男性。
在步骤S705中,将男性联系人B的音频的音色调节为女性音色。
在步骤S706中,输出调节为女性音色后的男性联系人B的音频。
本公开实施例实现根据用户自己的喜好和需求,对不同联系人的音频的音色进行调节,实现将音频的音色调节至用户喜好或听觉舒适的音色,提高了用户体验。
此外,本公开实施例中,可以通过均衡器调节界面或音效调节界面以便于用户根据自己的喜好调节与联系人通话时的音频效果,提高用户体验。
另一方面,本公开实施例中还提供一种音频处理装置,如图8所示,该装置包括:
获取模块801,用于接收到音频时,获取音频的音频信息;
确定模块802,用于对音频的音频信息进行分析,确定音频的音频特征;
调节模块803,用于根据音频的音频特征,对音频进行调节;
输出模块804,用于输出调节后的音频。
在一个实施例中,如图9所示,确定模块802包括:
变换单元805,用于当音频信息为音频的时域信息时,通过傅里叶变换,将音频的时域信息变换为音频的频域信息;
第一确定单元806,用于对音频的频域信息进行分析,确定音频的音频特征。
在一个实施例中,如图10所示,确定模块802包括:
第二确定单元807,用于根据精神元网络分析法对音频的音频信息进行分析,确定音频的音频特征。
在一个实施例中,如图11所示,调节模块803包括:
加权值确定单元808,用于当音频特征包括音调时,根据音频的音调,确定音频的音调的加权值;
第一调节单元809,用于根据加权值,调节音频的音调。
在一个实施例中,如图12所示,该装置还包括:
接收模块810,用于接收设置音调调节范围的指令;
配置模块811,用于根据指令,配置音调调节范围。
在一个实施例中,如图13所示,调节模块803包括:
第二调节单元812,用于当音频特征包括音色时,当与联系人进行音频通话时,根据联系人对应的音色调节参数,对与联系人进行音频通话时获得的音频进行调节。
另一方面,本公开另一实施例还提供一种终端设备,参见图14结构示意图,该终端设备可以用于实施上述实施例中音频处理方法。其中,该终端可以为手机、平板电脑pad、穿戴式移动设备(如智能手表)等。
图14是本公开实施例中终端设备(可以是请求方终端或者相关联终端)结构示意图。参见图14,该终端可以用于实施上述实施例中提供的音频处理方法。优选的:
终端设备800可以包括通信单元110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、无线通信单元170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解,图中示出的终端设备结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
通信单元110可用于收发信息或通话过程中,信号的接收和发送,该通信单元110可以为RF(Radio Frequency,射频)电路、路由器、调制解调器、等网络通信设备。特别地,当通信单元110为RF电路时,将基站的下行信息接收后,交由一个或者一个以上处理器180处理;另外,将涉及上行的数据发送给基站。通常,作为通信单元的RF电路包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,通信单元110还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯***)、GPRS(GeneralPacket Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband Code Division Multiple Access,宽带码分多址)、LTE(LongTerm Evolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端设备800的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。优选地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。优选地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端设备800的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图14中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
终端设备800还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在终端设备800移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端设备800还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器161,传声器162可提供用户与终端设备800之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一终端设备,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与终端设备800的通信。
为了实现无线通信,该终端设备上可以配置有无线通信单元170,该无线通信单元170可以为WIFI(Wireless Fidelity,无线保真)模块。WIFI属于短距离无线传输技术,终端设备800通过无线通信单元170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图中示出了无线通信单元170,但是可以理解的是,其并不属于终端设备800的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是终端设备800的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端设备800的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
终端设备800还包括给各个部件供电的电源190(比如电池),优选的,电源可以通过电源管理***与处理器180逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。尽管未示出,终端设备800还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本公开实施例中,终端设备还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收到音频时,获取音频的音频信息;
对音频的音频信息进行分析,确定音频的音频特征;
根据音频的音频特征,对音频进行调节;
输出调节后的音频。
存储器还包括执行以下操作的指令:
当音频信息为音频的时域信息时,通过傅里叶变换,将音频的时域信息变换为音频的频域信息;
对音频的频域信息进行分析,确定音频的音频特征。
存储器还包括执行以下操作的指令:
根据精神元网络分析法对音频的音频信息进行分析,确定音频的音频特征。
存储器还包括执行以下操作的指令:
当音频特征包括音调时,根据音频的音调,确定音频的音调的加权值;
根据加权值,调节音频的音调。
存储器还包括执行以下操作的指令:
接收设置音调调节范围的指令;
根据指令,配置音调调节范围。
存储器还包括执行以下操作的指令:
当音频特征包括音色时,当与联系人进行音频通话时,根据联系人对应的音色调节参数,对与联系人进行音频通话时获得的音频进行调节。
本公开实施例中,接收到音频时即对音频进行处理,实现了音频处理的实时性;通过根据音频的音频特征对音频进行调节,实现了实时根据接收到的音频的音频特征,个性化地动态调整该音频;对于不同的音频,进行不同的调节,从而提高了输出的音频的质量,使得音频的处理结果更能满足用户的需求。
此外,典型地,本公开所述的移动终端可为各种手持终端设备,例如手机、个人数字助理(PDA)等,因此本公开的保护范围不应限定为某种特定类型的移动终端。
此外,根据本公开的方法还可以被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本公开的方法中限定的上述功能。
此外,上述方法步骤以及***单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储设备实现。
此外,应该明白的是,本文所述的计算机可读存储设备(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)或快闪存储器。易失性存储器可以包括随机存取存储器(RAM),该RAM可以充当外部高速缓存存储器。作为例子而非限制性的,RA M可以以多种形式获得,比如同步RAM(DRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强SDRAM(ESDR AM)、同步链路DRAM(SLDRAM)以及直接RambusRAM(DRRAM)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个***的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现所述的功能,但是这种实现决定不应被解释为导致脱离本公开的范围。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里所述功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或任何其它这种配置。
结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,所述存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
在一个或多个示例性设计中,所述功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将所述功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DSL或诸如红外先、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(C D)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
尽管前面公开的内容示出了本公开的示例性实施例,但是应当注意,在不背离权利要求限定的本公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本公开的元素可以以个体形式描述或要求,但是也可以设想多个,除非明确限制为单数。
以上所述的具体实施方式,对本公开的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本公开的具体实施方式而已,并不用于限定本公开的保护范围,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (12)

1.一种音频处理方法,其特征在于,所述方法包括:
接收到音频时,获取所述音频的音频信息;
对所述音频的音频信息进行分析,确定所述音频的音频特征;
根据所述音频的音频特征,对所述音频进行调节;包括:根据所述音频的音调,确定所述音频的音调的加权值;根据所述加权值以及配置的音调调节范围,调节所述音频的音调;
输出调节后的所述音频。
2.根据权利要求1所述的方法,其特征在于,
所述音频信息包括:所述音频的时域信息和\或所述音频的频域信息。
3.根据权利要求2所述的方法,其特征在于,
当所述音频信息为所述音频的时域信息时,所述对所述音频的音频信息进行分析,确定所述音频的音频特征包括:
通过傅里叶变换,将所述音频的时域信息变换为所述音频的频域信息;
对所述音频的频域信息进行分析,确定所述音频的音频特征。
4.根据权利要求1所述的方法,其特征在于,
所述对所述音频的音频信息进行分析,确定所述音频的音频特征包括:
根据精神元网络分析法对所述音频的音频信息进行分析,确定所述音频的音频特征。
5.根据权利要求1-4任一所述的方法,其特征在于,
所述音频的音频特征包括音色、音调、响度中的任一种或多种。
6.根据权利要求5所述的方法,其特征在于,
当所述音频特征包括音调时,所述方法还包括:
接收设置音调调节范围的指令;
根据所述指令,配置音调调节范围。
7.根据权利要求5所述的方法,其特征在于,
当所述音频特征包括音色时,所述根据所述音频的音频特征,对所述音频进行调节,包括:
当与联系人进行音频通话时,根据所述联系人对应的音色调节参数,对与联系人进行音频通话时获得的音频进行调节。
8.一种音频处理装置,其特征在于,所述装置包括:
获取模块,用于接收到音频时,获取所述音频的音频信息;
确定模块,用于对所述音频的音频信息进行分析,确定所述音频的音频特征;
调节模块,用于根据所述音频的音频特征,对所述音频进行调节;包括:加权值确定单元,用于当所述音频特征包括音调时,根据所述音频的音调,确定所述音频的音调的加权值;第一调节单元,用于根据所述加权值以及配置的音调调节范围,调节所述音频的音调;
输出模块,用于输出调节后的所述音频。
9.根据权利要求8所述的装置,其特征在于,所述确定模块包括:
变换单元,用于当所述音频信息为所述音频的时域信息时,通过傅里叶变换,将所述音频的时域信息变换为所述音频的频域信息;
第一确定单元,用于对所述音频的频域信息进行分析,确定所述音频的音频特征。
10.根据权利要求8所述的装置,其特征在于,所述确定模块包括:
第二确定单元,用于根据精神元网络分析法对所述音频的音频信息进行分析,确定所述音频的音频特征。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收设置音调调节范围的指令;
配置模块,用于根据所述指令,配置音调调节范围。
12.根据权利要求8所述的装置,其特征在于,所述调节模块包括:
第二调节单元,用于当所述音频特征包括音色时,当与联系人进行音频通话时,根据所述联系人对应的音色调节参数,对与联系人进行音频通话时获得的音频进行调节。
CN201310683731.6A 2013-12-12 2013-12-12 一种音频处理方法、装置及终端设备 Active CN103714824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310683731.6A CN103714824B (zh) 2013-12-12 2013-12-12 一种音频处理方法、装置及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310683731.6A CN103714824B (zh) 2013-12-12 2013-12-12 一种音频处理方法、装置及终端设备

Publications (2)

Publication Number Publication Date
CN103714824A CN103714824A (zh) 2014-04-09
CN103714824B true CN103714824B (zh) 2017-06-16

Family

ID=50407729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310683731.6A Active CN103714824B (zh) 2013-12-12 2013-12-12 一种音频处理方法、装置及终端设备

Country Status (1)

Country Link
CN (1) CN103714824B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021148B (zh) * 2014-05-16 2017-05-03 小米科技有限责任公司 调节音效的方法和装置
CN104200824B (zh) * 2014-08-25 2019-05-03 努比亚技术有限公司 音频录制方法和装置
CN104317548B (zh) * 2014-09-15 2017-08-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN105551482A (zh) * 2015-12-23 2016-05-04 苏州汇莱斯信息科技有限公司 一种基于dsp的声音识别匹配算法
CN105744084B (zh) * 2016-04-29 2019-05-07 青岛海信移动通信技术股份有限公司 移动终端及提升移动终端通话音质的方法
CN106126162B (zh) * 2016-06-16 2019-07-19 Oppo广东移动通信有限公司 一种防止音效突变的方法及终端
CN106205629A (zh) * 2016-07-04 2016-12-07 广东小天才科技有限公司 一种声音制作方法及装置
JP2018159759A (ja) * 2017-03-22 2018-10-11 株式会社東芝 音声処理装置、音声処理方法およびプログラム
CN106782544A (zh) * 2017-03-29 2017-05-31 联想(北京)有限公司 语音交互设备及其输出方法
CN106953962B (zh) * 2017-05-11 2019-10-15 尚云(广州)信息科技有限公司 一种通话录音方法及装置
CN111194545A (zh) * 2017-10-09 2020-05-22 深圳传音通讯有限公司 一种移动通讯设备通话时改变原始声音的方法和***
CN111048107B (zh) * 2018-10-12 2022-09-23 北京微播视界科技有限公司 音频处理方法和装置
CN112750443A (zh) * 2019-10-30 2021-05-04 北京小米移动软件有限公司 通话语音输出方法、装置、存储介质和电子设备
CN111556198B (zh) * 2020-04-24 2022-08-30 深圳传音控股股份有限公司 音效控制方法、终端设备及存储介质
CN111782865B (zh) * 2020-06-23 2024-07-05 腾讯音乐娱乐科技(深圳)有限公司 音频信息的处理方法、装置及存储介质
CN112669872B (zh) * 2021-03-17 2021-07-09 浙江华创视讯科技有限公司 一种音频数据的增益方法及装置
CN115665318B (zh) * 2022-11-30 2023-10-20 荣耀终端有限公司 一种通话音质调整方法和电子设备

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1256000A (zh) * 1998-01-26 2000-06-07 松下电器产业株式会社 增强音调的方法和装置
US6829578B1 (en) * 1999-11-11 2004-12-07 Koninklijke Philips Electronics, N.V. Tone features for speech recognition
CN1719514A (zh) * 2004-07-06 2006-01-11 中国科学院自动化研究所 基于语音分析与合成的高品质实时变声方法
CN1729508A (zh) * 2002-12-27 2006-02-01 国际商业机器公司 跟踪音调信号的方法
CN1748242A (zh) * 2003-02-12 2006-03-15 皇家飞利浦电子股份有限公司 音频再现设备、方法、计算机程序
CN1831940A (zh) * 2006-04-07 2006-09-13 安凯(广州)软件技术有限公司 基于音频解码器的音调和节奏快速调节方法
CN1870130A (zh) * 2005-05-24 2006-11-29 株式会社东芝 音调模式生成方法及其装置
CN101855901A (zh) * 2007-08-16 2010-10-06 Dts(英属维尔京群岛)有限公司 用于压缩数字电视的音频处理
CN101860617A (zh) * 2009-04-12 2010-10-13 比亚迪股份有限公司 一种具有语音处理效果的移动终端及方法
CN102017402A (zh) * 2007-12-21 2011-04-13 Srs实验室有限公司 用于调节音频信号的感知响度的***
CN102413218A (zh) * 2011-08-03 2012-04-11 宇龙计算机通信科技(深圳)有限公司 一种自动调节通话音质的方法、装置及通信终端
CN102760051A (zh) * 2012-03-26 2012-10-31 联想(北京)有限公司 一种获得声音信号的方法及电子设备
EP2411976B1 (en) * 2009-03-26 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device, method and computer program for manipulating an audio signal

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090029011A (ko) * 2007-09-17 2009-03-20 삼성전자주식회사 통화음색 설정기능 이동 음성통화 단말 및 통화음색설정방법
KR101368927B1 (ko) * 2012-01-03 2014-02-28 (주)가온다 오디오 신호 출력 방법 및 장치, 오디오 신호의 볼륨 조정 방법

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1256000A (zh) * 1998-01-26 2000-06-07 松下电器产业株式会社 增强音调的方法和装置
US6829578B1 (en) * 1999-11-11 2004-12-07 Koninklijke Philips Electronics, N.V. Tone features for speech recognition
CN1729508A (zh) * 2002-12-27 2006-02-01 国际商业机器公司 跟踪音调信号的方法
CN1748242A (zh) * 2003-02-12 2006-03-15 皇家飞利浦电子股份有限公司 音频再现设备、方法、计算机程序
CN1719514A (zh) * 2004-07-06 2006-01-11 中国科学院自动化研究所 基于语音分析与合成的高品质实时变声方法
CN1870130A (zh) * 2005-05-24 2006-11-29 株式会社东芝 音调模式生成方法及其装置
CN1831940A (zh) * 2006-04-07 2006-09-13 安凯(广州)软件技术有限公司 基于音频解码器的音调和节奏快速调节方法
CN101855901A (zh) * 2007-08-16 2010-10-06 Dts(英属维尔京群岛)有限公司 用于压缩数字电视的音频处理
CN102017402A (zh) * 2007-12-21 2011-04-13 Srs实验室有限公司 用于调节音频信号的感知响度的***
EP2411976B1 (en) * 2009-03-26 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device, method and computer program for manipulating an audio signal
CN101860617A (zh) * 2009-04-12 2010-10-13 比亚迪股份有限公司 一种具有语音处理效果的移动终端及方法
CN102413218A (zh) * 2011-08-03 2012-04-11 宇龙计算机通信科技(深圳)有限公司 一种自动调节通话音质的方法、装置及通信终端
CN102760051A (zh) * 2012-03-26 2012-10-31 联想(北京)有限公司 一种获得声音信号的方法及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于神经网络的歌唱艺术嗓音客观评价";罗兰娥;《中国优秀硕士学位论文全文库基础科学辑》;20080915(第09期);全文 *

Also Published As

Publication number Publication date
CN103714824A (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
CN103714824B (zh) 一种音频处理方法、装置及终端设备
CN105872253B (zh) 一种直播声音处理方法及移动终端
JP5996783B2 (ja) 声紋特徴モデルを更新するための方法及び端末
CN103440862B (zh) 一种语音与音乐合成的方法、装置以及设备
CN106531149B (zh) 信息处理方法及装置
WO2018045536A1 (zh) 声音信号处理的方法、终端和耳机
CN108430003A (zh) 音效补偿方法和装置、可读存储介质、终端
CN108922537B (zh) 音频识别方法、装置、终端、耳机及可读存储介质
CN108540661A (zh) 信号处理方法、装置、终端、耳机及可读存储介质
CN103702297B (zh) 短信增强方法、装置及***
CN103634717B (zh) 一种利用耳机控制的方法、装置及终端设备
CN108538320A (zh) 录音控制方法和装置、可读存储介质、终端
CN103618514A (zh) 音量调节方法、装置和电子设备
CN111083289B (zh) 音频播放方法、装置、存储介质及移动终端
CN103763112B (zh) 一种用户身份保护方法和装置
CN108540900A (zh) 音量调节方法及相关产品
CN108429969A (zh) 音频播放方法、装置、终端、耳机及可读存储介质
CN106095387A (zh) 一种终端的音效设置方法及终端
CN108540660A (zh) 语音信号处理方法和装置、可读存储介质、终端
CN106384597A (zh) 一种音频数据处理方法、及设备
CN104409081A (zh) 语音信号处理方法和装置
CN106653068A (zh) 一种音频数据的播放方法、装置及终端
CN103687063A (zh) 一种连接网络的方法、装置及终端设备
CN106973168A (zh) 语音播放方法、装置及计算机设备
CN107659708A (zh) 信息提示方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant