CN116193321A - 声音信号处理方法、装置、设备及存储介质 - Google Patents

声音信号处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116193321A
CN116193321A CN202211468994.0A CN202211468994A CN116193321A CN 116193321 A CN116193321 A CN 116193321A CN 202211468994 A CN202211468994 A CN 202211468994A CN 116193321 A CN116193321 A CN 116193321A
Authority
CN
China
Prior art keywords
gain
sound signal
signal
sound
frequency response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211468994.0A
Other languages
English (en)
Inventor
杨征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Xingji Shidai Technology Co Ltd
Original Assignee
Hubei Xingji Shidai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Xingji Shidai Technology Co Ltd filed Critical Hubei Xingji Shidai Technology Co Ltd
Priority to CN202211468994.0A priority Critical patent/CN116193321A/zh
Publication of CN116193321A publication Critical patent/CN116193321A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例提供了一种声音信号处理方法、装置、设备及存储介质,其中方法包括:获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;根据环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,其中,第一增益用于控制第一声音信号的入耳频响大于环境底噪信号的频响,且第一声音信号的泄露频响小于环境底噪信号的频响;根据第一增益对当前增益调控周期内扬声器播放的第一声音信号进行增益调控。由此可以确保声学隐私***露,且佩戴者还可以听清扬声器播放的声音信号。

Description

声音信号处理方法、装置、设备及存储介质
技术领域
本申请涉及信号处理技术领域,尤其涉及一种声音信号处理方法、装置、设备及存储介质。
背景技术
随着人工智能的飞速发展,声音信号处理技术在多个场景中得到了广泛的应用,例如智能眼镜、车载智能终端等,为用户提供了更为方便的人机交互方式,提高了用户的使用体验。
目前主要的采用气传导的方式给予佩戴者音频体验。声音的传播路径依次是扬声器—空气—人耳,在传播到空气时会不可避免的产生声泄露的问题,现有方案中大多采用了声偶极子的声学设计方案,但是仍不能很好的解决声学私密性泄露的难题。
发明内容
本申请实施例提供一种声音信号处理方法、装置、设备及存储介质,用于解决声学私密性泄露的难题。
第一方面,本申请实施例提供一种声音信号处理方法,包括:
获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;
根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,其中,所述第一增益用于控制所述第一声音信号的入耳频响大于所述环境底噪信号的频响,且所述第一声音信号的泄露频响小于所述环境底噪信号的频响;
根据所述第一增益对当前增益调控周期内所述扬声器播放的第一声音信号进行增益调控。
在一些实施例中,所述根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,包括:
获取声隔离度及当前增益调控周期内所述第一声音信号的泄露频响;
根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益。
在一些实施例中,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益,包括:
确定当前增益调控周期内所述环境底噪信号的噪声能量;
根据所述声隔离度、所述第一声音信号的泄露频响及所述噪声能量确定当前增益调控周期内所述第一声音信号的第一增益。
在一些实施例中,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益,包括:
对所述环境底噪信号进行分频,得到多个预设频带的目标环境底噪信号;
确定各所述预设频段的目标声隔离度及各所述预设频段的所述第一声音信号的目标泄露频响;
根据各所述预设频段的所述目标环境底噪信号、所述目标声隔离度及所述目标泄露频响确定当前增益调控周期内各所述预设频段的第一声音信号的第一增益。
在一些实施例中,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益之前,还包括:
确定当前增益调控周期内所述第一声音信号的情景模式;
根据所述情景模式对所述环境底噪信号进行带通滤波。
在一些实施例中,根据当前增益调控周期内扬声器播放的第一声音信号对所述环境声音信号进行回声消除,得到环境底噪信号。
在一些实施例中,所述根据所述第一增益对当前增益调控周期内所述扬声器播放的声音信号进行增益调控,包括:
确定上一增益调控周期的第二增益;
根据所述第二增益对所述第一增益进行平滑,得的第三增益;
根据所述第三增益对当前增益调控周期内所述扬声器播放的声音信号进行增益调控。
第二方面,本申请实施例还提供一种声音信号处理装置,包括:
获取单元,用于获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;
增益单元,用于根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,其中,所述第一增益用于控制所述第一声音信号的入耳频响大于所述环境底噪信号的频响,且所述第一声音信号的泄露频响小于所述环境底噪信号的频响;
调控单元,用于根据所述第一增益对当前增益调控周期内所述扬声器播放的第一声音信号进行增益调控。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的声音信号处理方法。
第四方面,本申请实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的声音信号处理方法。
第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的声音信号处理方法。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的智能穿戴设备的结构示意图;
图2是本申请一个实施例提供的智能穿戴设备的频响曲线的示意图;
图3是本申请一个实施例提供的声音信号处理方法的流程示意图;
图4是本申请一个实施例提供的声音信号处理方法的一个应用场景的声隔离度的示意图;
图5是本申请一个实施例提供的声音信号处理装置的结构示意图;
图6是本申请一个实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。本申请实施例提供的声音信号处理方法,可以应用于智能穿戴设备,或者可以应用于控制智能穿戴设备的终端设备。
在一些实施例中,智能穿戴设备是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称,例如眼镜、手套、手表、服饰和鞋子等。广义的智能穿戴设备包括功能全、可不依赖智能手机实现完整或者部分的功能,例如智能手表或智能眼镜(如增强现实(Augmented Reality,AR)眼镜)等,以及只专注于某一类应用功能,需要和其它终端设备例如智能手机配合使用,例如,各类进行体征监测的智能手环、智能首饰等。随着技术的进步以及用户需求的变迁,智能穿戴设备的形态与应用热点也在不断地变化。
在一些实施例中,终端设备(终端)包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备,例如,手机、平板、台式笔记本以及可以运行应用程序的智能设备,包括智能汽车的中央控制台等。具体可以指用户设备(user equipment,UE)、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。终端设备还可以是卫星电话、蜂窝电话、智能手机、无线数据卡、无线调制解调器、机器类型通信设备、可以是无绳电话、会话启动协议(session initiation protocol,SIP)电话、无线本地环路(wireless local loop,WLL)站、个人数字处理(personal digital assistant,PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备或可穿戴设备,虚拟现实(virtual reality,VR)终端设备、增强现实(augmented reality,AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self-driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端、5G网络或者未来通信网络中的终端设备等。终端可以由电池供电,还可以附接到车辆或者船舶的电源***,并由车辆或者船舶的电源***供电。车辆或者船舶的电源***还可以为终端的电池充电,以延长终端的通信时间。
图1为本申请一个实施例提供的智能穿戴设备的结构示意图。
如图1所示,智能穿戴设备100包括:麦克风110、回声消除模块120、噪声估计模块130、增益控制模块140及扬声器150。
其中,麦克风110用于采集环境声音信号,该环境声音信号包括扬声器150播放的声音信号在当前环境空间内的声学回声信号及当前环境空间内的环境底噪信号。
回声消除模块120用于对麦克风110传输的环境声音信号进行回声消除,消除掉当前环境空间内的声学回声信号,得到所需要的环境底噪信号,其中,作为一种可实施的方式,可以将扬声器160播放的声音信号作为回声消除中的参考信号。
噪声估计模块130用于对环境底噪信号进行噪声估计,即评估出环境底噪信号的噪声能量,进而根据噪声能量估计出扬声器160所需要的增益。
作为一种可实施的方式,参考图2,图2为在一个标准环境空间内控制智能穿戴设备以一个特定音量播放音频时测得的频响曲线的示意图。
其中,图2中横坐标代表信号采样点的频率,纵坐标代表信号采样点的幅值(电平)。虚线代表入耳频响,即表征佩戴者实际可听到的声音信号的频响,其可以通过头和躯干模拟器测试得到。实线代表泄露频响,即表征周围路人可听到的声音信号的频响,其可以通过标准麦克风测试得的。
本实施例中,噪声估计模块130用于根据智能穿戴设备在标准环境空间内测得的频响曲线、智能穿戴设备在当前环境空间内设定的音量及当前环境空间内的噪声能量确定出扬声器160播放的声音信号所需要的增益。
增益控制模块140用于对扬声器160播放的声音信号进行增益调控,使得增益调控后的声音信号的入耳频响大于当前环境空间内的环境底噪信号的频响,且增益调控后的声音信号的泄露频响小于当前环境空间内的环境底噪信号的频响。
扬声器160用于播放经过增益控制模块140增益调控后的声音信号,由此由于播放的声音信号的入耳频响大于当前环境空间内的环境底噪信号的频响,且泄露频响小于当前环境空间内的环境底噪信号的频响,由此确保声学隐私***露,且佩戴者还可以听清扬声器160播放的声音信号。
目前解决智能穿戴设备私密性的方案大多采用纯声学结构方案,例如声偶极子的声学设计方案,虽然声偶极子的声学设计方案能够提供一定的声学私密性保障,但是由于声偶极子的设计原理是设计两个出声孔,其中一个作为主声源,向外发声,另外一个作为辅助声源,消除漏音,两个出声孔向外辐射的声波的相位相差为180°,且它们之间相距很近,频率和振动幅值相同(或者相近)合成最终的声源,从而使得从佩戴者之外的周围人几乎听不到声音,但是无法确保声学隐私是否***露。
为此,本申请实施例提供了一种应用于上述智能穿戴设备的声音信号处理方法,可以确保声学隐私***露,且佩戴者还可以听清扬声器播放的声音信号。
可以理解地,本申请实施例中的信号均指代数据域信号,在此不在具体赘述。
图3为本申请一个实施例提供的声音信号处理方法的流程示意图。如图3所示,该方法包括以下步骤:步骤301、步骤302和步骤303。该方法流程步骤仅仅作为本申请一个可能的实现方式。
步骤301,获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;
其中,环境声音信号指代智能穿戴设备的麦克风在当前环境空间内采集到的声音信号,环境声音信号中包括当前环境空间内的声学回声信号及当前环境空间内的环境底噪信号。
本实施中可以通过一个麦克风采集环境声音信号,也可以通过两个或两个以上的麦克风采集环境声音信号,对此不作限制。
本发明实施例中,增益调控周期的周期时长可以根据智能穿戴设备的音频帧的播放时长来确定,例如,智能穿戴设备播放一帧音频帧的时长为m,则增益调控周期内的周期时长为m*n,其中,n取值可以为正整数。
在一个示例中,在扬声器开始播放第一帧音频帧时,麦克风同步采集环境声音信号,在扬声器开始播放第二帧音频帧时,智能穿戴设备进入第一个增益调控周期,并将扬声器播放第一帧音频帧期间,麦克风采集的环境声音信号作为第一个增益调控周期内的环境声音信号,接着在扬声器开始播放第三帧音频帧时,智能穿戴设备进入第二个增益调控周期,并将扬声器播放第二帧音频帧期间,麦克风采集的环境声音信号作为第二个增益调控周期内的环境声音信号…以此类推。
在一个示例中,在扬声器开始播放第一帧音频帧时,智能穿戴设备同步进入第一个增益调控周期,麦克风同步采集环境声音信号,且麦克风在采集预设时长的环境声音信号后,停止采集,直至扬声器开始播放第二帧音频帧…以此类推。
在一些实施例中,可以根据当前增益调控周期内扬声器播放的第一声音信号对环境声音信号进行回声消除,得到环境底噪信号。
例如,设定自适应滤波器的参考信号为扬声器播放的第一声音信号,之后将环境声音信号输入至自适应滤波器中,自适应滤波器即可输出环境底噪信号。
其中,本实施例中的第一声音信号可以为实时产生的声音信号,比如语音通话过程中产生的声音信号,还可以为预先录制好的声音信号,比如音乐等,对此不作限制。
步骤302,根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益;
其中,第一增益用于控制第一声音信号的入耳频响大于环境底噪信号的频响,且第一声音信号的泄露频响小于环境底噪信号的频响
本实施例中,第一增益指代当前增益调控周期内第一声音信号的幅值的增益。
在得到环境底噪信号后,可以检测出环境底噪信号的幅值,由此可以根据环境底噪信号的幅值来确定出第一声音信号的幅值的增益。
在一个示例中,可以预先设定好每一个环境底噪信号的幅值区间对应的第一声音信号的第一增益,例如,幅值大的环境底噪信号对应的第一增益的数值也越大。
步骤303,根据所述第一增益对当前增益调控周期内所述扬声器播放的第一声音信号进行增益调控;
本实施例中,根据第一增益对当前增益调控周期内扬声器播放的第一声音信号的幅值进行增益调控,进而调整扬声器播放的第一声音信号的音量,由此使得扬声器播放的第一声音信号的入耳频响大于环境底噪信号的频响,且第一声音信号的泄露频响小于环境底噪信号的频响。
其中,在进行增益调控时,可以一次性地将第一声音信号的增益调整至第一增益,还可以平缓地多次将第一声音信号的增益调整至第一增益,对此不作限制。
本申请实施例提供的声音信号处理方法,通过获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;接着根据环境底噪信号确定出使得第一声音信号的入耳频响大于环境底噪信号的频响,且第一声音信号的泄露频响小于环境底噪信号的频响的第一增益,进而实现根据第一增益对扬声器播放的第一声音信号进行增益调控后,可以确保声学隐私***露,且佩戴者还可以听清扬声器播放的声音信号。
在一些实施例中,所述根据所述第一增益对当前增益调控周期内所述扬声器播放的声音信号进行增益调控,包括:
确定上一增益调控周期的第二增益;
根据所述第二增益对所述第一增益进行平滑,得的第三增益;
根据所述第三增益对当前增益调控周期内所述扬声器播放的声音信号进行增益调控。
需要说明的是,本实施例中的第一增益和第二增益为一个固定的数值,第三增益为一个与时间相关的变动的数值,比如,在第0时刻至第2时刻时(上一增益调控周期),其对应的第二增益为10dB,第2时刻至第4时刻(当前增益调控周期),其对应的第一增益为20dB,则在第2时刻时的第三增益为10dB、第(2+T1)时刻时的第三增益为(10+a)dB、第(2+T1+T2)时刻时的第三增益为(10+a+b)dB…以此类推,直至在第4时刻时的第三增益为20dB,其中,T1和T2可以相同,也可以不相同,a和b可以相同也可以不相同。
本实施例中,可以采用指数平滑法确定出第三增益,比如根据第一增益及第二增益之间的增益差,确定当前增益调控周期的指数平滑系数,其中,增益差越大,则指数平滑系数也越大。
本申请实施例提出的声音信号处理方法,通过确定上一增益调控周期的第二增益;根据第二增益对第一增益进行平滑,得的第三增益;根据第三增益对当前增益调控周期内扬声器播放的声音信号进行增益调控,由此使得扬声器播放的第一声音信号可以平滑地过渡,提高了佩戴者的体验感。
在一些实施例中,所述根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,包括:
获取声隔离度及当前增益调控周期内所述第一声音信号的泄露频响;
根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益。
本实施例中的声隔离度指代智能穿戴设备在播放声音信号时,声音信号的入耳频响与泄露频响之间的差值。
需要说明的是,本实施例中的声隔离度是一个与智能穿戴设备的物理声学结构设计有关的固定值,例如参考图4,图4为某一个特定的物理声学结构智能穿戴设备声隔离度的示意图。
在一个示例中,设定一个参考泄露频响,即在一个标准环境空间内控制智能穿戴设备以一个参考音量播放音频时测得的泄露频响。
本实施例中,根据第一声音信号的音量及预设的参考泄露频响,确定出第一声音信号的泄露频响,接着根据声隔离度确定出第一声音信号的入耳频响,由此根据第一声音信号的泄露频响、第一声音信号的入耳频响及环境底噪信号确定出第一增益。
本申请实施提出的声音信号处理方法,通过获取声隔离度及当前增益调控周期内第一声音信号的泄露频响;进而可以根据声隔离度、第一声音信号的泄露频响及环境底噪信号确定出第一声音信号的第一增益。
在一些实施例中,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益,包括:
确定当前增益调控周期内所述环境底噪信号的噪声能量;
根据所述声隔离度、所述第一声音信号的泄露频响及所述噪声能量确定当前增益调控周期内所述第一声音信号的第一增益。
在一个示例中,可以对环境底噪信号进行RMS(root mean square,均方根)处理,得到环境底噪信号的噪声能量(即有效噪声),RMS处理步骤同现有技术中一致,在此不再赘述。
本实施例中,对环境底噪信号进行RMS处理后,可以根据噪声能量获取到环境底噪信号的有效幅值,其中,有效幅值为一个与噪声频率无关的固定幅值。
在一个示例中,可以在同一个频响坐标系中确定出第一声音信号的泄露频响曲线、第一声音信号的入耳频响曲线及环境底噪信号的频响曲线,其中,环境底噪信号的频响曲线中各频率对应的幅值均相等(即均等于有效噪声的幅值),之后同步将泄露频响曲线及入耳频响曲线沿着频响坐标系的纵轴进行上下调整,直至环境底噪信号的频响曲线近似位于第一声音信号的泄露频响曲线及第一声音信号的入耳频响曲线之间,则满足此条件下的泄露频响曲线(入耳频响曲线)与原来的泄露频响曲线(入耳频响曲线)之间的幅值差即为第一声音信号的第一增益。
本申请实施提出的声音信号处理方法,通过获取环境底噪信号的噪声能量,以将环境底噪信号转换成一个可用于衡量的信号,进而确保可以根据声隔离度、泄露频响及噪声能量精准确定出第一声音信号的第一增益。
在一些实施例中,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益,包括:
对所述环境底噪信号进行分频,得到多个预设频带的目标环境底噪信号;
确定各所述预设频段的目标声隔离度及各所述预设频段的所述第一声音信号的目标泄露频响;
根据各所述预设频段的所述目标环境底噪信号、所述目标声隔离度及所述目标泄露频响确定当前增益调控周期内各所述预设频段的第一声音信号的第一增益。
在一个示例中,可以通过分频器对环境底噪信号进行成分分析,通过预先设定好分频器的分频点,将环境底噪信号分频出多个预设频带的目标环境底噪信号。
需要说明的是,由于不同环境场景下的噪声成分差别比较明显,因此通过将环境底噪信号分频出多个预设频带的目标环境底噪信号,去分别进行增益调控,可以提高智能穿戴设备的声学私密性。
本实施例中,分别对各个预设频带的目标声隔离度、目标泄露频响及目标环境底噪信号进行处理,确定出各个预设频带匹配的第一增益,之后结合EQ(Audio equalizerfilter,音频均衡器)滤波器对第一声音信号进行增益调控,其中,EQ滤波器的分频点与分频器的分频点相同。
其中,本实施例中的各预设频段的第一声音信号的第一增益的获取方式同上述实施例中的一致,在此不再赘述。
本申请实施提出的声音信号处理方法,通过各预设频段的第一增益来分别调控各个预设频段的第一声音信号,由此确保各预设频段的第一声音信号的入耳频响均可大于相应频段的环境底噪信号的频响,且泄露频响均可小于相应频段的环境底噪信号的频响,由此提高了智能穿戴设备在不同噪声场景下的适应性,使得智能穿戴设备的声音隐私性更高。
在一些实施例中,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益之前,还包括:
确定当前增益调控周期内所述第一声音信号的情景模式;
根据所述情景模式对所述环境底噪信号进行带通滤波。
本实施例中,情景模式指代声音信号的应用情景,比如该声音信号是用于进行语音通话(即语音通话情景模式),还是用于传递音乐数据(音乐情景模式)。
在一个示例中,预设设定好多个情景模式及各情景模式下的滤波带宽,由此根据预设的各情景模式下的滤波带宽对各情景模式下的环境底噪信号进行带通滤波。
比如,设定语音通话情景模式下的滤波带宽为300HZ至4000HZ,设定音乐情景模式下的滤波带宽为80HZ至1000HZ,则在处于语音通话情景模式下,对环境底噪信号进行300HZ至4000HZ的带通滤波,以保留300HZ至4000HZ的环境底噪信号,在处于音乐情景模式下,对环境底噪信号进行80HZ至1000HZ的带通滤波,以保留80HZ至1000HZ的环境底噪信号。
本实施例提出的声音信号处理方法,通过确定当前增益调控周期内所述第一声音信号的情景模式;根据情景模式对环境底噪信号进行带通滤波,避免了其他频率范围的环境底噪信号对第一增益的结果的干扰,由此提高了第一增益的结果的精准度。
下面对本申请实施例提供的声音信号处理装置进行描述,下文描述的声音信号处理装置与上文描述的声音信号处理方法可相互对应参照。
图5为本申请一个实施例提供的声音信号处理装置的结构示意图,如图5所示,该声音信号处理装置500包括:
获取单元510,用于获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;
增益单元520,用于根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,其中,所述第一增益用于控制所述第一声音信号的入耳频响大于所述环境底噪信号的频响,且所述第一声音信号的泄露频响小于所述环境底噪信号的频响;
调控单元530,用于根据所述第一增益对当前增益调控周期内所述扬声器播放的第一声音信号进行增益调控。
在一些实施例中,增益单元520,还用于获取声隔离度及当前增益调控周期内所述第一声音信号的泄露频响;根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益。
在一些实施例中,增益单元520,还用于确定当前增益调控周期内所述环境底噪信号的噪声能量;根据所述声隔离度、所述第一声音信号的泄露频响及所述噪声能量确定当前增益调控周期内所述第一声音信号的第一增益。
在一些实施例中,增益单元520,还用于对所述环境底噪信号进行分频,得到多个预设频带的目标环境底噪信号;确定各所述预设频段的目标声隔离度及各所述预设频段的所述第一声音信号的目标泄露频响;根据各所述预设频段的所述目标环境底噪信号、所述目标声隔离度及所述目标泄露频响确定当前增益调控周期内各所述预设频段的第一声音信号的第一增益。
在一些实施例中,增益单元520,还用于确定当前增益调控周期内所述第一声音信号的情景模式;根据所述情景模式对所述环境底噪信号进行带通滤波。
在一些实施例中,获取单元510,还用于根据当前增益调控周期内扬声器播放的第一声音信号对所述环境声音信号进行回声消除,得到环境底噪信号。
在一些实施例中,调控单元530,还用于确定上一增益调控周期的第二增益;根据所述第二增益对所述第一增益进行平滑,得的第三增益;根据所述第三增益对当前增益调控周期内所述扬声器播放的声音信号进行增益调控。
在此需要说明的是,本申请实施例提供的声音信号处理装置,能够实现上述声音信号处理方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
图6为本申请提供的电子装置的结构示意图,如图6所示,该电子装置可以包括:处理器(Processor)610、通信接口(Communications Interface)620、存储器(Memory)630和通信总线(Communications Bus)640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑命令,以执行如下方法:
获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,其中,所述第一增益用于控制所述第一声音信号的入耳频响大于所述环境底噪信号的频响,且所述第一声音信号的泄露频响小于所述环境底噪信号的频响;根据所述第一增益对当前增益调控周期内所述扬声器播放的第一声音信号进行增益调控。
此外,上述的存储器630中的逻辑命令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的电子装置中的处理器可以调用存储器中的逻辑指令,实现上述方法,其具体的实施方式与前述方法实施方式一致,且可以达到相同的有益效果,此处不再赘述。
本申请实施例还提供一种计算机可读的存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法。
其具体的实施方式与前述方法实施方式一致,且可以达到相同的有益效果,此处不再赘述。
本申请实施例提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如上述方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种声音信号处理方法,其特征在于,包括:
获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;
根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,其中,所述第一增益用于控制所述第一声音信号的入耳频响大于所述环境底噪信号的频响,且所述第一声音信号的泄露频响小于所述环境底噪信号的频响;
根据所述第一增益对当前增益调控周期内所述扬声器播放的第一声音信号进行增益调控。
2.根据权利要求1所述的声音信号处理方法,其特征在于,所述根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,包括:
获取声隔离度及当前增益调控周期内所述第一声音信号的泄露频响;
根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益。
3.根据权利要求2所述的声音信号处理方法,其特征在于,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益,包括:
确定当前增益调控周期内所述环境底噪信号的噪声能量;
根据所述声隔离度、所述第一声音信号的泄露频响及所述噪声能量确定当前增益调控周期内所述第一声音信号的第一增益。
4.根据权利要求2所述的声音信号处理方法,其特征在于,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益,包括:
对所述环境底噪信号进行分频,得到多个预设频带的目标环境底噪信号;
确定各所述预设频段的目标声隔离度及各所述预设频段的所述第一声音信号的目标泄露频响;
根据各所述预设频段的所述目标环境底噪信号、所述目标声隔离度及所述目标泄露频响确定当前增益调控周期内各所述预设频段的第一声音信号的第一增益。
5.根据权利要求2所述的声音信号处理方法,其特征在于,所述根据所述声隔离度、所述第一声音信号的泄露频响及所述环境底噪信号确定当前增益调控周期内所述第一声音信号的第一增益之前,还包括:
确定当前增益调控周期内所述第一声音信号的情景模式;
根据所述情景模式对所述环境底噪信号进行带通滤波。
6.根据权利要求1至5任一项所述的声音信号处理方法,其特征在于,所述获取当前增益调控周期内环境声音信号中的环境底噪信号,还包括:
根据当前增益调控周期内扬声器播放的第一声音信号对所述环境声音信号进行回声消除,得到环境底噪信号。
7.根据权利要求1至5任一项所述的声音信号处理方法,其特征在于,所述根据所述第一增益对当前增益调控周期内所述扬声器播放的声音信号进行增益调控,包括:
确定上一增益调控周期的第二增益;
根据所述第二增益对所述第一增益进行平滑,得的第三增益;
根据所述第三增益对当前增益调控周期内所述扬声器播放的声音信号进行增益调控。
8.一种声音信号处理装置,其特征在于,包括:
获取单元,用于获取当前增益调控周期内麦克风采集的环境声音信号中的环境底噪信号;
增益单元,用于根据所述环境底噪信号确定当前增益调控周期内扬声器播放的第一声音信号的第一增益,其中,所述第一增益用于控制所述第一声音信号的入耳频响大于所述环境底噪信号的频响,且所述第一声音信号的泄露频响小于所述环境底噪信号的频响;
调控单元,用于根据所述第一增益对当前增益调控周期内所述扬声器播放的第一声音信号进行增益调控。
9.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的声音信号处理方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的声音信号处理方法。
CN202211468994.0A 2022-11-22 2022-11-22 声音信号处理方法、装置、设备及存储介质 Pending CN116193321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211468994.0A CN116193321A (zh) 2022-11-22 2022-11-22 声音信号处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211468994.0A CN116193321A (zh) 2022-11-22 2022-11-22 声音信号处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116193321A true CN116193321A (zh) 2023-05-30

Family

ID=86433327

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211468994.0A Pending CN116193321A (zh) 2022-11-22 2022-11-22 声音信号处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116193321A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117692843A (zh) * 2024-02-02 2024-03-12 江西斐耳科技有限公司 一种声音自动调节方法、***、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117692843A (zh) * 2024-02-02 2024-03-12 江西斐耳科技有限公司 一种声音自动调节方法、***、存储介质及电子设备
CN117692843B (zh) * 2024-02-02 2024-04-16 江西斐耳科技有限公司 一种声音自动调节方法、***、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN113676803B (zh) 一种主动降噪方法及装置
US10685663B2 (en) Enabling in-ear voice capture using deep learning
US8369549B2 (en) Hearing aid system adapted to selectively amplify audio signals
CN105554674A (zh) 一种麦克风校准方法、装置及移动终端
CN109688498B (zh) 一种音量调节方法、耳机及存储介质
CN109727607B (zh) 时延估计方法、装置及电子设备
US9601128B2 (en) Communication apparatus and voice processing method therefor
CN112017687B (zh) 一种骨传导设备的语音处理方法、装置及介质
CN107564538A (zh) 一种实时语音通信的清晰度增强方法及***
US10993047B2 (en) System and method for aiding hearing
CN112565981B (zh) 啸叫抑制方法、装置、助听器及存储介质
CN114666695A (zh) 一种主动降噪的方法、设备及***
CN116193321A (zh) 声音信号处理方法、装置、设备及存储介质
JP2016038513A (ja) 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム
CN116612778B (zh) 回声及噪声抑制方法、相关装置和介质
CN110010117A (zh) 一种语音主动降噪的方法及装置
CN108154886A (zh) 噪声抑制方法及装置、电子装置及计算机可读存储介质
CN116055951B (zh) 信号处理方法和电子设备
CN104348436B (zh) 一种参数调整方法及电子设备
US11109170B1 (en) System and method for aiding hearing
CN109874088A (zh) 一种调整声压值的方法及设备
CN115225998A (zh) 耳机降噪方法、装置、耳机设备及计算机可读存储介质
CN116744169B (zh) 耳机设备、声音信号的处理方法及佩戴贴合度测试方法
CN117915232B (zh) 一种蓝牙耳机自动音频处理方法、终端设备及存储介质
CN112908350B (zh) 一种音频处理方法、通信装置、芯片及其模组设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: No. B1337, Chuanggu Initiation Zone, Taizihu Cultural Digital Creative Industry Park, No. 18 Shenlong Avenue, Wuhan Economic and Technological Development Zone, Wuhan, Hubei Province, 430058

Applicant after: Hubei Xingji Meizu Technology Co.,Ltd.

Address before: 430014 No. b1337, chuanggu startup area, taizihu cultural Digital Creative Industry Park, No. 18, Shenlong Avenue, Wuhan Economic and Technological Development Zone, Wuhan, Hubei Province

Applicant before: Hubei Xingji times Technology Co.,Ltd.

CB02 Change of applicant information