CN114615599A - 音频处理方法、装置、计算机设备、存储介质和程序产品 - Google Patents

音频处理方法、装置、计算机设备、存储介质和程序产品 Download PDF

Info

Publication number
CN114615599A
CN114615599A CN202210241700.4A CN202210241700A CN114615599A CN 114615599 A CN114615599 A CN 114615599A CN 202210241700 A CN202210241700 A CN 202210241700A CN 114615599 A CN114615599 A CN 114615599A
Authority
CN
China
Prior art keywords
loudness
audio
distance
determining
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210241700.4A
Other languages
English (en)
Inventor
崔洋洋
王星宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Youmi Technology Shenzhen Co ltd
Original Assignee
Youmi Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Youmi Technology Shenzhen Co ltd filed Critical Youmi Technology Shenzhen Co ltd
Priority to CN202210241700.4A priority Critical patent/CN114615599A/zh
Publication of CN114615599A publication Critical patent/CN114615599A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)

Abstract

本申请涉及一种音频处理方法、装置、计算机设备、存储介质和程序产品。上述方法包括:获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度,以根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度,获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度,进而控制音频播放设备以目标响度播放音频。通过上述方法即可实现音频播放设备对于所播放音频响度的主动调节,以适应于目标对象的位置变化,简化了调节过程,提高了处理效率。

Description

音频处理方法、装置、计算机设备、存储介质和程序产品
技术领域
本申请涉及音频处理技术领域,特别是涉及一种音频处理方法、装置、计算机设备、存储介质和程序产品。
背景技术
随着科技的发展,电脑、手机等电子产品因其智能化程度高、功能丰富多样已成为人们日常生活、办公不可或缺的工具。
在使用传统的电子产品进行音视频播放或者线上会议时,电子产品会根据用户设定的音频播放参数进行音频播放。用户移动到距离电子设备比较远的地方时,会觉得电子设备的播放声音太小。此时,则需要用户返回电子设备所在位置,或者走到控制装置的控制范围内通过控制装置调节电子设备的音频播放参数,以保证用户在移动后的位置处也可以清楚地听到声音。
然而,上述处理方式操作繁琐,处理效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种音频处理方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本申请提供了一种音频处理方法,包括:
获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;
根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;
获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;
控制音频播放设备以目标响度播放音频。
在其中一个实施例中,根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度,包括:
获取第一响度与第二响度之间的第一响度差值;
根据第一响度差值和音频播放设备与响度测试设备之间的距离确定单位距离的损耗响度。
在其中一个实施例中,根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度,包括:
根据当前距离和单位距离的损耗响度,确定音频传播至目标对象所在位置时的第三响度;
基于第三响度对第一响度进行调整,得到目标响度。
在其中一个实施例中,基于第三响度对第一响度进行调整,得到目标响度,包括:
获取第一响度与第三响度之间的第二响度差值,并将第二响度差值与第一响度之和确定为目标响度;或者,
获取预设的参考响度与第三响度之间的第三响度差值,并将第三响度差值与第一响度之和确定为目标响度。
在其中一个实施例中,上述方法还包括:
获取音频的特征参数,并根据特征参数确定音频中的噪声音频;
去除音频中的噪声音频,得到降噪处理后的音频。
在其中一个实施例中,根据特征参数确定音频中的噪声音频,包括:
根据特征参数将音频划分为至少两个子音频;
获取各子音频的特征参数,并根据各子音频的特征参数与预设的噪声特征参数确定音频中的噪声音频。
在其中一个实施例中,根据各子音频的特征参数与预设的噪声特征参数确定音频中的噪声音频,包括:
获取各子音频的特征参数与噪声特征参数的特征相似度;
确定特征相似度大于相似度阈值的特征参数对应的子音频为噪声音频。
第二方面,本申请还提供了一种音频处理装置,包括:
响度收集模块,用于获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;
损耗确定模块,用于根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;
响度调整模块,用于获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;
音频播放模块,用于控制音频播放设备以目标响度播放音频。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;
根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;
获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;
控制音频播放设备以目标响度播放音频。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;
根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;
获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;
控制音频播放设备以目标响度播放音频。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;
根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;
获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;
控制音频播放设备以目标响度播放音频。
上述音频处理方法、装置、计算机设备、存储介质和计算机程序产品,通过获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度,以根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度,获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度,进而控制音频播放设备以目标响度播放音频。通过上述方法即可实现音频播放设备对于所播放音频响度的主动调节,以适应于目标对象的位置变化,简化了调节过程,提高了处理效率。
附图说明
图1为一个实施例中音频处理方法的应用环境图;
图2为一个实施例中音频处理方法的流程示意图;
图3为一个实施例中确定单位距离的损耗响度的流程示意图;
图4为一个实施例中得到目标响度的流程示意图;
图5为另一个实施例中音频处理方法的流程示意图;
图6为一个实施例中确定噪声音频的流程示意图;
图7为另一个实施例中音频处理方法的流程示意图;
图8为一个实施例中音频处理装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的音频处理方法,可以应用于如图1所示的应用环境中。其中,音频播放设备102与响度测试设备104进行通信。音频播放设备102播放音频,响度测试设备104接收音频播放设备所播放的音频,并确定所接收到音频的第二响度。音频播放设备102获取自身输出音频时的第一响度,并获取响度测试设备接收到音频时的第二响度,进而根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度,获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度,以控制音频播放设备102以目标响度播放音频。其中,音频播放设备102为可用于播放音频的设备,可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。响度测试设备104为可用于测量声音响度的设备,可以是分贝仪。
需要说明的是,本申请实施例提供的音频处理方法,还可以应用于音频播放设备、响度测试设备以及控制平台三者之间,音频播放设备和响度测试设备均与控制平台通信,由控制平台实现上述音频处理方法。控制平台为独立于音频播放设备和响度测试设备的数据处理平台,可采用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种音频处理方法,以该方法应用于图1中的音频播放设备为例进行说明,包括以下步骤:
S210、获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度。
其中,音频的响度用于衡量音频的声音强度,具体可采用分贝(dB)表征。
可选地,音频播放设备在输出音频时,可直接对音频进行数据提取和响度分析,得到音频的第一响度,或者,音频播放设备内集成有声音拾取模块,声音拾取模块可拾取音频播放设备正在输出的音频,并测得音频的第一响度。
可选地,响度测试设备固定设置于某一位置,音频播放设备播放音频,响度测试设备则接收音频播放设备所播放的音频,并测得所接收到音频的第二响度,再将该第二响度发送至音频播放设备,或者由音频播放设备从响度测试装置主动获取该第二响度。
S220、根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度。
其中,单位距离的损耗响度即为音频传播单位距离响度的下降量。
可选地,上述单位距离可以是米,下降量就可以具体的数值,也可以是比例值。例如,单位距离的损耗响度为10dB/m,即音频每传播1米,响度就下降10dB;或者,单位距离的损耗响度为20%/m,即音频每传播1米,响度就下降20%。
可选地,在音频播放设备与响度测试设备之间的距离为1米时,音频播放设备则确定第二响度为该音频播放设备在当前环境下播放音频时单位距离的响度损耗,还可以进一步计算第二响度与第一响度的比值作为上述单位距离的响度损耗。
可选地,音频播放设备与响度测试设备之间的距离可以是预先设定好的固定值,如1米,也可以是有效范围内的任意值,可基于音频播放设备内集成的目标检测模块确定,该有效范围即为目标检测模块的检测覆盖范围。
S230、获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度。
S240、控制音频播放设备以目标响度播放音频。
可选地,基于音频播放设备内的目标检测模块不仅可以确定音频播放设备与响度测试设备之间的距离,还可以确定音频播放设备与目标对象之间的当前距离。其中,目标对象即为使用音频播放设备的用户。
可选地,音频播放设备可根据音频播放设备与目标对象之间的当前距离以及单位距离的损耗响度预估音频在整个传播过程(由音频播放设备所在位置传播至目标对象所在位置)中的总损耗响度,以根据总损耗响度在第一响度中的占比(即损耗占比)确定是否需要对第一响度进行调整。其中,若损耗占比大于预设占比,音频播放设备则确定需要对第一响度进行调整;若损耗占比不大于预设占比,音频播放设备则确定不需要对第一响度进行调整。例如,预设占比可以为30%。
可选地,在音频播放设备确定需要对第一响度进行调整时,音频播放设备可直接将第一响度增大上述总损耗响度,即可得到目标响度。音频播放设备则以该目标响度播放后续音频。
需要说明的是,上述音频处理方法不仅适用于目标对象远离音频播放设备,需增大第一响度的应用场景,还适用于目标对象远离音频播放设备后,又靠近音频播放设备,需在先增大后减小第一响度的应用场景,增大或减小的调整原理基本相同。
本实施例中,音频播放设备获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度,以根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度,获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度,进而控制音频播放设备以目标响度播放音频。通过上述方法即可实现音频播放设备对于所播放音频响度的主动调节,以适应于目标对象的位置变化,简化了调节过程,提高了处理效率。
在实际应用中,为提高设备使用的便捷性,使得用户可随意设置音频播放设备和响度测试设备的位置,如图3所示,上述S220、根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度,则包括:
S310、获取第一响度与第二响度之间的第一响度差值。
可选地,用户随意设置音频播放设备和响度测试设备的位置,音频播放设备通过内部集成的目标检测模块得到音频播放设备与响度测试设备之间的距离,在该距离不为1m时,则进一步计算第一响度与第二响度之间的差值即上述第一响度差值。
S320、根据第一响度差值和音频播放设备与响度测试设备之间的距离确定单位距离的损耗响度。
可选地,音频播放设备可计算第一响度差值和音频播放设备与响度测试设备之间距离的比值,即可得到上述单位距离的损耗响度。例如,音频播放设备确定第一响度V1=30dB,第二响度V2=18dB,音频播放设备与响度测试设备之间距离L=1.5m,第一响度差值△V=V1-V2=30-18=12,单位距离的损耗响度V0=△V/L=12/1.5=8dB/m。音频播放设备还可以计算第一响度差值和第一响度的损耗比值,进一步计算该损耗比值与音频播放设备和响度测试设备之间距离的比值,也可作为单位距离的损耗响度。例如,继续上述举例,第一响度差值△V=V1-V2=30-18=12,损耗比值v0=△V/V1=12/30=40%,单位距离的损耗响度V0=v0/L=40%/1.5≈26.67%/m。
本实施例中,音频播放设备获取第一响度与第二响度之间的第一响度差值,进而根据第一响度差值和音频播放设备与响度测试设备之间的距离确定单位距离的损耗响度。通过上述方法提高了设备使用的便捷性,用户可随意设置音频播放设备和响度测试设备的位置,不局限于固定位置,也不受场地约束,扩展了设备的应用场景。
为确保目标对象在当前所处位置处能够清楚的听到音频播放设备所播放的音频,如图4所示,上述S230中根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度,则包括:
S410、根据当前距离和单位距离的损耗响度,确定音频传播至目标对象所在位置时的第三响度。
具体地,音频播放设备根据自身与目标对象的当前距离以及前面所确定的单位距离的损耗响度预估音频传播至目标对象当前所在位置处时的第三响度。
进一步地,音频播放设备可先根据当前距离以及单位距离的损耗响度预估音频在整个传播过程(由音频播放设备所在位置传播至目标对象所在位置)中的总损耗响度,再计算第一响度与总损耗响度之差作为上述第三响度。例如,第一响度V1=30dB,总损耗响度V=12dB,第三响度V3=V1-V=30-12=18dB。
S420、基于第三响度对第一响度进行调整,得到目标响度。
可选地,音频播放设备可获取第一响度与第三响度之间的差值即第二响度差值,并将第二响度差值与第一响度之和确定为目标响度。还可以获取预设的参考响度与第三响度之间的差值即第三响度差值,并将第三响度差值与第一响度之和确定为目标响度。其中,预设的参考响度即为用户预先设置的用户近距离聆听音频的最适宜响度。
本实施例中,音频播放设备根据当前距离和单位距离的损耗响度,确定音频传播至目标对象所在位置时的第三响度,获取第一响度与第三响度之间的第二响度差值,并将第二响度差值与第一响度之和确定为目标响度,这样,无论目标对象距离音频播放设备有多远,听到音频的声音强度都与音频播放设备刚播放音频时的声音强度相当,不会出现距离越远声音越小的情况;音频播放设备还可以获取预设的参考响度与第三响度之间的第三响度差值,并将第三响度差值与第一响度之和确定为目标响度,这样,无论目标对象距离音频播放设备有多远,目标对象均可以听到最适宜响度(即目标响度)的音频,实现了对于音频响度的合理调节。通过上述方法确保了目标对象在当前所处位置处能够清楚的听到音频播放设备所播放的音频,提高了音频响度与目标对象所处位置的适配性。
音频产生的环境不同,导致音频质量(以下简称“音质”)不相同,特别是用户使用上述音频播放设备进行音视频会议时,良好的音质可大大提高会议效率。因此,为提高音频播放设备所播放音频的音质,如图5所示,上述方法还包括:
S510、获取音频的特征参数,并根据特征参数确定音频中的噪声音频。
其中,音频的特征参数即音频自身的数据属性参数。可选地,上述特征参数可以是频段。
可选地,音频播放设备可对接收到的音频进行数据特征分析,确定频段属于预设频段的部分音频为噪声音频。
S520、去除音频中的噪声音频,得到降噪处理后的音频。
具体地,音频播放设备在确定了音频中的噪声音频后,则将音频中上述噪声音频所属频段滤除,即可到降噪处理后的音频。
本实施例中,音频播放设备还可以获取音频的特征参数,并根据特征参数确定音频中的噪声音频,进而去除音频中的噪声音频,得到降噪处理后的音频,以提高音频质量,为用户提供高音质会议渠道,有助于提高会议效率。
为提高所确定的噪声音频的准确性,如图6所示,上述S510中根据特征参数确定音频中的噪声音频,则包括:
S610、根据特征参数将音频划分为至少两个子音频。
可选地,特征参数包括音频的频段、周期、振幅或者音频的数据空间向量中的至少一个。
可选地,音频播放设备获取音频的频率,根据预设的频率幅度将音频的频率划分为多个子音频。例如,音频播放设备获取音频的频率为200~800Hz,以预设的频率幅度为100Hz进行划分说明,可将上述频率200~800Hz划分为200~300Hz,300~400Hz,400~500Hz,500~600Hz,600~700Hz,700~800Hz,共6个子音频;以预设的频率幅度为200Hz进行划分说明,可将上述频率200~800Hz划分为200~400Hz,300~500Hz,400~600Hz,500~700Hz,600~800Hz,共5个子音频。
S620、获取各子音频的特征参数,并根据各子音频的特征参数与预设的噪声特征参数确定音频中的噪声音频。
常见的噪声,如婴儿啼哭声、汽车鸣笛声,与人说话声的特征参数均有所不同,特征参数中音频的数据空间向量可准确反映声音特性。基于此,音频播放设备即可根据各子音频的数据空间向量与特征库中预设的噪声数据空间向量确定音频中的噪声音频。
具体地,音频播放设备获取各子音频的数据空间向量,计算各子音频的数据空间向量与噪声特征库中每一噪声数据空间向量之间的特征相似度,具体可采用两向量之间的余弦值表征上述特征相似度。得到上述特征相似度后,进一步比较各个特征相似度与相似度阈值的大小,并确定特征相似度大于相似度阈值的特征参数(即数据空间向量)对应的子音频为噪声音频。
本实施例中,音频播放设备根据特征参数将音频划分为至少两个子音频,进而获取各子音频的特征参数,以计算各子音频的特征参数与噪声特征参数的特征相似度,确定特征相似度大于相似度阈值的特征参数对应的子音频为噪声音频。上述方法采用子音频的特征参数与噪声特征参数之间的相似程度确定各子音频是否为噪声音频,而噪声特征参数可准确反映噪声音频的特征,因此采用上述方式可准确确定子音频是否为噪声音频,进而提高了所确定的噪声音频的准确性。
为了便于本领域技术人员的理解,以下对本申请提供的闪电数据的音频处理方法进行详细介绍,如图7所示,该方法可以包括:
S701、获取音频的特征参数,根据特征参数将音频划分为至少两个子音频;
S702、获取各子音频的特征参数,并获取各子音频的特征参数与噪声特征参数的特征相似度;
S703、确定特征相似度大于相似度阈值的特征参数对应的子音频为噪声音频;
S704、除音频中的噪声音频,得到降噪处理后的音频;
S705、获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;
S706、获取第一响度与第二响度之间的第一响度差值;
S707、根据第一响度差值和音频播放设备与响度测试设备之间的距离确定单位距离的损耗响度;
S708、获取音频播放设备与目标对象之间的当前距离,根据当前距离和单位距离的损耗响度,确定音频传播至目标对象所在位置时的第三响度;
S709、获取第一响度与第三响度之间的第二响度差值,并将第二响度差值与第一响度之和确定为目标响度;或者,获取预设的参考响度与第三响度之间的第三响度差值,并将第三响度差值与第一响度之和确定为目标响度;
S710、控制音频播放设备以目标响度播放音频。
需要说明的是,针对上述S701-S710中的描述可以参见上述实施例中相关的描述,且其效果类似,本实施例在此不再赘述。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的音频处理方法的音频处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个音频处理装置实施例中的具体限定可以参见上文中对于音频处理方法的限定,在此不再赘述。
在一个实施例中,如图8所示,提供了一种音频处理装置,包括:响度收集模块801、损耗确定模块802、响度调整模块803和音频播放模块804,其中:
响度收集模块801用于获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;
损耗确定模块802用于根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;
响度调整模块803用于获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;
音频播放模块804用于控制音频播放设备以目标响度播放音频。
在其中一个实施例中,损耗确定模块802具体用于:
获取第一响度与第二响度之间的第一响度差值;根据第一响度差值和音频播放设备与响度测试设备之间的距离确定单位距离的损耗响度。
在其中一个实施例中,响度调整模块803具体用于:
根据当前距离和单位距离的损耗响度,确定音频传播至目标对象所在位置时的第三响度;基于第三响度对第一响度进行调整,得到目标响度。
在其中一个实施例中,响度调整模块803具体用于:
获取第一响度与第三响度之间的第二响度差值,并将第二响度差值与第一响度之和确定为目标响度;或者,获取预设的参考响度与第三响度之间的第三响度差值,并将第三响度差值与第一响度之和确定为目标响度。
在其中一个实施例中,上述装置还包括:去噪处理模块;
去噪处理模块用于获取音频的特征参数,并根据特征参数确定音频中的噪声音频;去除音频中的噪声音频,得到降噪处理后的音频。
在其中一个实施例中,去噪处理模块具体用于:
根据特征参数将音频划分为至少两个子音频;获取各子音频的特征参数,并根据各子音频的特征参数与预设的噪声特征参数确定音频中的噪声音频。
在其中一个实施例中,去噪处理模块具体用于:
获取各子音频的特征参数与噪声特征参数的特征相似度;确定特征相似度大于相似度阈值的特征参数对应的子音频为噪声音频。
上述音频处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过***总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种音频处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;控制音频播放设备以目标响度播放音频。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取第一响度与第二响度之间的第一响度差值;根据第一响度差值和音频播放设备与响度测试设备之间的距离确定单位距离的损耗响度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据当前距离和单位距离的损耗响度,确定音频传播至目标对象所在位置时的第三响度;基于第三响度对第一响度进行调整,得到目标响度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取第一响度与第三响度之间的第二响度差值,并将第二响度差值与第一响度之和确定为目标响度;或者,获取预设的参考响度与第三响度之间的第三响度差值,并将第三响度差值与第一响度之和确定为目标响度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取音频的特征参数,并根据特征参数确定音频中的噪声音频;去除音频中的噪声音频,得到降噪处理后的音频。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据特征参数将音频划分为至少两个子音频;获取各子音频的特征参数,并根据各子音频的特征参数与预设的噪声特征参数确定音频中的噪声音频。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取各子音频的特征参数与噪声特征参数的特征相似度;确定特征相似度大于相似度阈值的特征参数对应的子音频为噪声音频。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时还实现以下步骤:
获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;控制音频播放设备以目标响度播放音频。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取第一响度与第二响度之间的第一响度差值;根据第一响度差值和音频播放设备与响度测试设备之间的距离确定单位距离的损耗响度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据当前距离和单位距离的损耗响度,确定音频传播至目标对象所在位置时的第三响度;基于第三响度对第一响度进行调整,得到目标响度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取第一响度与第三响度之间的第二响度差值,并将第二响度差值与第一响度之和确定为目标响度;或者,获取预设的参考响度与第三响度之间的第三响度差值,并将第三响度差值与第一响度之和确定为目标响度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取音频的特征参数,并根据特征参数确定音频中的噪声音频;去除音频中的噪声音频,得到降噪处理后的音频。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据特征参数将音频划分为至少两个子音频;获取各子音频的特征参数,并根据各子音频的特征参数与预设的噪声特征参数确定音频中的噪声音频。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取各子音频的特征参数与噪声特征参数的特征相似度;确定特征相似度大于相似度阈值的特征参数对应的子音频为噪声音频。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取音频播放设备输出音频时的第一响度和响度测试设备接收到音频时的第二响度;根据第一响度、第二响度以及音频播放设备与响度测试设备之间的距离,确定单位距离的损耗响度;获取音频播放设备与目标对象之间的当前距离,并根据当前距离和单位距离的损耗响度对第一响度进行调整得到目标响度;控制音频播放设备以目标响度播放音频。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取第一响度与第二响度之间的第一响度差值;根据第一响度差值和音频播放设备与响度测试设备之间的距离确定单位距离的损耗响度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据当前距离和单位距离的损耗响度,确定音频传播至目标对象所在位置时的第三响度;基于第三响度对第一响度进行调整,得到目标响度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取第一响度与第三响度之间的第二响度差值,并将第二响度差值与第一响度之和确定为目标响度;或者,获取预设的参考响度与第三响度之间的第三响度差值,并将第三响度差值与第一响度之和确定为目标响度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取音频的特征参数,并根据特征参数确定音频中的噪声音频;去除音频中的噪声音频,得到降噪处理后的音频。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据特征参数将音频划分为至少两个子音频;获取各子音频的特征参数,并根据各子音频的特征参数与预设的噪声特征参数确定音频中的噪声音频。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取各子音频的特征参数与噪声特征参数的特征相似度;确定特征相似度大于相似度阈值的特征参数对应的子音频为噪声音频。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (11)

1.一种音频处理方法,其特征在于,所述方法包括:
获取音频播放设备输出音频时的第一响度和响度测试设备接收到所述音频时的第二响度;
根据所述第一响度、所述第二响度以及所述音频播放设备与所述响度测试设备之间的距离,确定单位距离的损耗响度;
获取所述音频播放设备与目标对象之间的当前距离,并根据所述当前距离和所述单位距离的损耗响度对所述第一响度进行调整得到目标响度;
控制所述音频播放设备以所述目标响度播放所述音频。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一响度、所述第二响度以及所述音频播放设备与所述响度测试设备之间的距离,确定单位距离的损耗响度,包括:
获取所述第一响度与所述第二响度之间的第一响度差值;
根据所述第一响度差值和所述音频播放设备与所述响度测试设备之间的距离确定所述单位距离的损耗响度。
3.根据权利要求1所述的方法,其特征在于,所述根据所述当前距离和所述单位距离的损耗响度对所述第一响度进行调整得到目标响度,包括:
根据所述当前距离和所述单位距离的损耗响度,确定所述音频传播至所述目标对象所在位置时的第三响度;
基于所述第三响度对所述第一响度进行调整,得到所述目标响度。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第三响度对所述第一响度进行调整,得到所述目标响度,包括:
获取所述第一响度与所述第三响度之间的第二响度差值,并将所述第二响度差值与所述第一响度之和确定为所述目标响度;或者,
获取预设的参考响度与所述第三响度之间的第三响度差值,并将所述第三响度差值与所述第一响度之和确定为所述目标响度。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
获取所述音频的特征参数,并根据所述特征参数确定所述音频中的噪声音频;
去除所述音频中的噪声音频,得到降噪处理后的音频。
6.根据权利要求5所述的方法,其特征在于,所述根据所述特征参数确定所述音频中的噪声音频,包括:
根据所述特征参数将所述音频划分为至少两个子音频;
获取各所述子音频的特征参数,并根据各所述子音频的特征参数与预设的噪声特征参数确定所述音频中的噪声音频。
7.根据权利要求6所述的方法,其特征在于,所述根据各所述子音频的特征参数与预设的噪声特征参数确定所述音频中的噪声音频,包括:
获取各所述子音频的特征参数与所述噪声特征参数的特征相似度;
确定特征相似度大于相似度阈值的特征参数对应的子音频为所述噪声音频。
8.一种音频处理装置,其特征在于,所述装置包括:
响度收集模块,用于获取音频播放设备输出音频时的第一响度和响度测试设备接收到所述音频时的第二响度;
损耗确定模块,用于根据所述第一响度、所述第二响度以及所述音频播放设备与所述响度测试设备之间的距离,确定单位距离的损耗响度;
响度调整模块,用于获取所述音频播放设备与目标对象之间的当前距离,并根据所述当前距离和所述单位距离的损耗响度对所述第一响度进行调整得到目标响度;
音频播放模块,用于控制所述音频播放设备以所述目标响度播放所述音频。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202210241700.4A 2022-03-11 2022-03-11 音频处理方法、装置、计算机设备、存储介质和程序产品 Pending CN114615599A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210241700.4A CN114615599A (zh) 2022-03-11 2022-03-11 音频处理方法、装置、计算机设备、存储介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210241700.4A CN114615599A (zh) 2022-03-11 2022-03-11 音频处理方法、装置、计算机设备、存储介质和程序产品

Publications (1)

Publication Number Publication Date
CN114615599A true CN114615599A (zh) 2022-06-10

Family

ID=81862090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210241700.4A Pending CN114615599A (zh) 2022-03-11 2022-03-11 音频处理方法、装置、计算机设备、存储介质和程序产品

Country Status (1)

Country Link
CN (1) CN114615599A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0535425A2 (de) * 1991-10-03 1993-04-07 Ascom Audiosys Ag Verfahren zur Verstärkung von akustischen Signalen für Hörbehinderte, sowie Vorrichtung zur Durchführung des Verfahrens
CN103677714A (zh) * 2013-12-09 2014-03-26 联想(北京)有限公司 一种信息处理方法及电子设备
CN104811862A (zh) * 2015-03-31 2015-07-29 广东欧珀移动通信有限公司 一种音箱音量控制方法及终端
CN105487657A (zh) * 2015-11-24 2016-04-13 小米科技有限责任公司 声音响度的确定方法及装置
CN106157963A (zh) * 2015-04-08 2016-11-23 广州质音通讯技术有限公司 一种音频信号的降噪处理方法和装置及电子设备
CN107277268A (zh) * 2017-07-17 2017-10-20 维沃移动通信有限公司 一种音频播放方法及移动终端
CN107438130A (zh) * 2016-05-26 2017-12-05 中兴通讯股份有限公司 语音增益的调整方法、装置及终端
CN107994879A (zh) * 2017-12-04 2018-05-04 北京小米移动软件有限公司 响度控制方法及装置
CN108882115A (zh) * 2017-05-12 2018-11-23 华为技术有限公司 响度调节方法、装置及终端
CN109769191A (zh) * 2017-11-09 2019-05-17 北京小米移动软件有限公司 音频输出检测方法及装置、电子设备
CN110809214A (zh) * 2019-11-21 2020-02-18 Oppo广东移动通信有限公司 音频播放方法、音频播放装置及终端设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0535425A2 (de) * 1991-10-03 1993-04-07 Ascom Audiosys Ag Verfahren zur Verstärkung von akustischen Signalen für Hörbehinderte, sowie Vorrichtung zur Durchführung des Verfahrens
CN103677714A (zh) * 2013-12-09 2014-03-26 联想(北京)有限公司 一种信息处理方法及电子设备
CN104811862A (zh) * 2015-03-31 2015-07-29 广东欧珀移动通信有限公司 一种音箱音量控制方法及终端
CN106157963A (zh) * 2015-04-08 2016-11-23 广州质音通讯技术有限公司 一种音频信号的降噪处理方法和装置及电子设备
CN105487657A (zh) * 2015-11-24 2016-04-13 小米科技有限责任公司 声音响度的确定方法及装置
CN107438130A (zh) * 2016-05-26 2017-12-05 中兴通讯股份有限公司 语音增益的调整方法、装置及终端
CN108882115A (zh) * 2017-05-12 2018-11-23 华为技术有限公司 响度调节方法、装置及终端
CN107277268A (zh) * 2017-07-17 2017-10-20 维沃移动通信有限公司 一种音频播放方法及移动终端
CN109769191A (zh) * 2017-11-09 2019-05-17 北京小米移动软件有限公司 音频输出检测方法及装置、电子设备
CN107994879A (zh) * 2017-12-04 2018-05-04 北京小米移动软件有限公司 响度控制方法及装置
CN110809214A (zh) * 2019-11-21 2020-02-18 Oppo广东移动通信有限公司 音频播放方法、音频播放装置及终端设备

Similar Documents

Publication Publication Date Title
EP3780656A1 (en) Systems and methods for providing personalized audio replay on a plurality of consumer devices
CN106535039B (zh) 基于响度的音频信号补偿
CN109658942B (zh) 一种音频数据处理方法、装置以及相关设备
WO2017215657A1 (zh) 音效处理方法及终端设备
WO2019033438A1 (zh) 音频信号调节方法、装置、存储介质及终端
CN110992963B (zh) 网络通话方法、装置、计算机设备及存储介质
CN110799936B (zh) 音量调节方法、装置、终端设备及存储介质
CN111508510B (zh) 音频处理方法、装置、存储介质及电子设备
WO2021203906A1 (zh) 自动音量调整方法、装置、介质和设备
CN108966114A (zh) 声场重建方法、音频设备、存储介质及装置
CN113038337A (zh) 一种音频播放方法、无线耳机和计算机可读存储介质
US20240214765A1 (en) Signal processing method and apparatus for audio rendering, and electronic device
CN107483734B (zh) 音量调节方法、装置、终端设备及存储介质
WO2019033941A1 (zh) 音量调节方法、装置、终端设备及存储介质
CN110058837B (zh) 一种音频输出方法及终端
CN111343497A (zh) 播放设备的音效调整方法、播放设备以及存储介质
CN107506168B (zh) 音量调节方法、装置、终端设备及存储介质
CN114546325A (zh) 音频处理方法、电子设备和可读存储介质
CN114615599A (zh) 音频处理方法、装置、计算机设备、存储介质和程序产品
US10186279B2 (en) Device for detecting, monitoring, and cancelling ghost echoes in an audio signal
CN115273795A (zh) 模拟冲激响应的生成方法、装置和计算机设备
CN106293607B (zh) 自动切换音频输出模式的方法及***
CN113990363A (zh) 一种音频播放参数调整方法、装置、电子设备和存储介质
CN111739496B (zh) 音频处理方法、装置及存储介质
CN112130664B (zh) 智能降噪方法、智能唤醒方法及使用该方法的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination