CN106205628B - 声音信号优化方法及装置 - Google Patents

声音信号优化方法及装置 Download PDF

Info

Publication number
CN106205628B
CN106205628B CN201510226844.2A CN201510226844A CN106205628B CN 106205628 B CN106205628 B CN 106205628B CN 201510226844 A CN201510226844 A CN 201510226844A CN 106205628 B CN106205628 B CN 106205628B
Authority
CN
China
Prior art keywords
voice signal
sound source
terminal
specified
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510226844.2A
Other languages
English (en)
Other versions
CN106205628A (zh
Inventor
颜嘉甫
王楠楠
张鹏
张柳军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201510226844.2A priority Critical patent/CN106205628B/zh
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to JP2017516025A priority patent/JP6314286B2/ja
Priority to RU2015155321A priority patent/RU2628473C2/ru
Priority to BR112015031855A priority patent/BR112015031855A2/pt
Priority to MX2015017147A priority patent/MX361588B/es
Priority to KR1020157031849A priority patent/KR20160142217A/ko
Priority to PCT/CN2015/090275 priority patent/WO2016176951A1/zh
Priority to US15/057,639 priority patent/US10499156B2/en
Priority to EP16166152.5A priority patent/EP3091753B1/en
Publication of CN106205628A publication Critical patent/CN106205628A/zh
Application granted granted Critical
Publication of CN106205628B publication Critical patent/CN106205628B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/007Monitoring arrangements; Testing arrangements for public address systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/007Electronic adaptation of audio signals to reverberation of the listening space for PA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Stereophonic System (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本公开揭示了一种声音信号优化方法及装置,属于语音信号处理领域。所述方法用于包含有至少两个声音采集单元的终端中,包括:通过所述至少两个声音采集单元对所述终端周边的声源进行定位;从定位确定的各个声源中筛选出指定声源;根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;对所述指定声源发出的声音信号进行音量优化。本公开在采集声音信号时,通过对周边声源进行筛选,并对筛选出的声源发出的声音信号进行优化,从提高终端对声音信号的采集效果。

Description

声音信号优化方法及装置
技术领域
本公开涉及语音信号处理领域,特别涉及一种声音信号优化方法及装置。
背景技术
随着通讯和电子技术的不断发展,智能手机、平板电脑、电子书阅读器以及电子录音笔等支持语音通话或者录音功能的终端逐渐成为人们生活中不可缺少的工具,为人们的日常生活提供了极大的便利。
在此类终端的一种应用方式中,多个用户可以使用同一个支持录音功能终端进行会议录音,或者,多个用户可以使用同一个支持语音通话的终端与远端的其它用户进行电话会议;终端将录制的声音信号进行存储,或者,发送给语音通话的远端用户。
发明内容
本公开提供了一种声音信号优化方法及装置。所述技术方案如下:
第一方面,提供一种声音信号优化方法,用于包含有至少两个声音采集单元的终端中,所述方法包括:
通过所述至少两个声音采集单元对所述终端周边的声源进行定位;
从定位确定的各个声源中筛选出指定声源;
根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;
对所述指定声源发出的声音信号进行音量优化。
可选的,所述对所述指定声源发出的声音信号进行音量优化,包括:
将所述指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较,所述第一强度阈值大于或者等于所述第二强度阈值;
若所述指定声源发出的声音信号的强度大于所述第一强度阈值,则将所述指定声源发出的声音信号的强度降低至所述第一强度阈值;
若所述指定声源发出的声音信号的强度小于所述第二强度阈值,则将所述指定声源发出的声音信号的强度增加至所述第二强度阈值。
可选的,所述通过所述至少两个声音采集单元对所述终端周边的声源进行定位,包括:
获取一声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差;
根据所述声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差确定所述声源相对于所述终端的空间位置。
可选的,所述从定位确定的声源中筛选出指定声源,包括:
根据所述各个声源的声音信号的强度和/或声音信号的连续性,从所述各个声源中筛选出所述指定声源。
可选的,所述确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前,还包括:
通过所述终端中的姿态传感器获取所述终端的姿态;
根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿;
所述确定所述终端采集到的声音信号中由所述指定声源发出的声音信号,包括:
确定经过增益补偿后的声音信号中,由所述指定声源发出的声音信号。
可选的,所述终端的姿态包括所述终端正面与水平面之间的夹角,所述根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿,包括:
根据所述终端正面与水平面之间的夹角确定补偿数值,所述终端正面与水平面之间的夹角与所述补偿数值之间成正比例关系;
根据所述补偿数值对所述终端采集到的声音信号进行增益补偿。
在第二方面,提供一种声音信号优化装置,用于包含有至少两个声音采集单元的终端中,所述装置包括:
定位模块,用于通过所述至少两个声音采集单元对所述终端周边的声源进行定位;
筛选模块,用于从定位确定的各个声源中筛选出指定声源;
声音信号确定模块,用于根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;
优化模块,用于对所述指定声源发出的声音信号进行音量优化。
可选的,所述优化模块,包括:
比较子模块,用于将所述指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较,所述第一强度阈值大于或者等于所述第二强度阈值;
降低子模块,用于若所述指定声源发出的声音信号的强度大于所述第一强度阈值,则将所述指定声源发出的声音信号的强度降低至所述第一强度阈值;
增加子模块,用于若所述指定声源发出的声音信号的强度小于所述第二强度阈值,则将所述指定声源发出的声音信号的强度增加至所述第二强度阈值。
可选的,所述定位模块,包括:
获取子模块,用于获取一声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差;
定位子模块,用于根据所述声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差确定所述声源相对于所述终端的空间位置。
可选的,所述筛选模块,用于根据所述各个声源的声音信号的强度和/或声音信号的连续性,从所述各个声源中筛选出所述指定声源。
可选的,所述装置还包括:姿态获取模块和补偿模块;
所述姿态获取模块,用于在所述声音信号确定模块确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前,通过所述终端中的姿态传感器获取所述终端的姿态;
所述补偿模块,用于根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿;
所述声音信号确定模块,用于确定经过增益补偿后的声音信号中,由所述指定声源发出的声音信号。
可选的,所述补偿模块,包括:
数值确定子模块,用于根据所述终端正面与水平面之间的夹角确定补偿数值,所述终端正面与水平面之间的夹角与所述补偿数值之间成正比例关系;
补偿子模块,用于根据所述补偿数值对所述终端采集到的声音信号进行增益补偿;
其中,所述终端的姿态包括所述终端正面与水平面之间的夹角。
第三方面,提供一种声音信号优化方法装置,用于包含有至少两个声音采集单元的终端中,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
通过所述至少两个声音采集单元对所述终端周边的声源进行定位;
从定位确定的各个声源中筛选出指定声源;
根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;
对由所述指定声源发出的声音信号进行音量优化。。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过至少两个声音采集单元对终端周边的声源进行定位,从定位确定的各个声源中筛选出指定声源,根据定位获得的该指定声源的空间位置,确定该终端采集到的声音信号中由该指定声源发出的声音信号,对该指定声源发出的声音信号进行音量优化;当终端在采集声音信号时,对周边声源进行筛选,并对筛选出的声源发出的声音信号进行优化,从提高终端对声音信号的采集效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种声音信号优化方法的流程图;
图2是根据另一示例性实施例示出的一种声音信号优化方法的流程图;
图3是根据另一示例性实施例示出的一种定位方法的流程图;
图4是根据另一示例性实施例示出的一种增益补偿方法的流程图;
图5是根据一示例性实施例示出的一种声音信号优化装置的框图;
图6是根据另一示例性实施例示出的一种声音信号优化装置的框图;
图7是根据一示例性实施例示出的一种装置的框图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种声音信号优化方法的流程图。该声音信号优化方法可以用于包含有至少两个声音采集单元的终端中,该终端可以是智能手机、平板电脑、电子书阅读器以及智能录音笔等支持语音通话或者录音功能的智能终端。如图1所示,该声音信号优化方法可以包括以下步骤。
在步骤102中,通过至少两个声音采集单元对终端周边的声源进行定位。
在步骤104中,从定位确定的各个声源中筛选出指定声源。
在步骤106中,根据定位获得的该指定声源的空间位置,确定该终端采集到的声音信号中由该指定声源发出的声音信号。
在步骤108中,对该指定声源发出的声音信号进行音量优化。
可选的,该对采集到的该指定声源发出的声音信号进行音量优化,包括:
将该指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较,该第一强度阈值大于或者等于该第二强度阈值;
若该指定声源发出的声音信号的强度大于该第一强度阈值,则将该指定声源发出的声音信号的强度降低至该第一强度阈值;
若该指定声源发出的声音信号的强度小于该第二强度阈值,则将该指定声源发出的声音信号的强度增加至该第二强度阈值。
可选的,该通过该至少两个声音采集单元对该终端周边的声源进行定位,包括:
获取一声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差;
根据该声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差确定该声源相对于该终端的空间位置。
可选的,该从定位确定的声源中筛选出指定声源,包括:
根据该各个声源的声音信号的强度和/或声音信号的连续性,从该各个声源中筛选出指定声源。
可选的,该确定终端采集到的声音信号中由指定声源发出的声音信号之前,还包括:
通过该终端中的姿态传感器获取该终端的姿态;
根据该终端的姿态对该终端采集到的声音信号进行增益补偿;
该确定终端采集到的声音信号中由指定声源发出的声音信号,包括:
确定经过增益补偿后的声音信号中,由该指定声源发出的声音信号。
可选的,该终端的姿态包括该终端正面与水平面之间的夹角,该根据该终端的姿态对该终端采集到的声音信号进行增益补偿,包括:
根据该终端正面与水平面之间的夹角确定补偿数值,该终端正面与水平面之间的夹角与该补偿数值之间成正比例关系;
根据该补偿数值对该终端采集到的声音信号进行增益补偿。
综上所述,本公开实施例中提供的声音信号优化方法,通过至少两个声音采集单元对终端周边的声源进行定位,从定位确定的各个声源中筛选出指定声源,根据定位获得的该指定声源的空间位置,确定该终端采集到的声音信号中由该指定声源发出的声音信号,对该指定声源发出的声音信号进行音量优化;当终端在采集声音信号时,对周边声源进行筛选,并对筛选出的声源发出的声音信号进行优化,从提高终端对声音信号的采集效果。
图2是根据另一示例性实施例示出的一种声音信号优化方法的流程图。该声音信号优化方法可以用于包含有至少两个声音采集单元的终端中,该终端可以是智能手机、平板电脑、电子书阅读器以及智能录音笔等支持语音通话或者录音功能的智能终端。如图2所示,该声音信号优化方法可以包括以下步骤。
在步骤202中,通过至少两个声音采集单元对终端周边的声源进行定位。
可选的,请参考图3所示的定位方法的流程图,该通过该至少两个声音采集单元对该终端周边的声源进行定位的步骤可以如下:
在步骤202a中,获取一声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差。
其中,终端中包含的至少两个声音采集单元组成一个声音采集单元阵列,由于声源到该声音采集单元阵列中的各个声音采集单元的距离和方向都不相同,因此,该声源发出的声音传递到各个声音采集单元的时间和相位也不相同。终端可以获取该声音采集单元阵列中的各个声音采集单元采集到同一声源发出的声音的时间差和相位差。
在步骤202b中,根据该声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差确定该声源相对于该终端的空间位置。
终端可以利用波束成形技术定位声源的位置,比如,终端可以根据该声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差,通过延迟求和或者特征值分解等算法识别出声源相对于终端的位置。
利用波束成形技术,终端不仅可以准确的定位固定声源的空间位置,还可以对移动中的声源进行追踪,以便对移动中的声源发出的信号持续进行优化处理。
在步骤204中,根据该各个声源的声音信号的强度和/或声音信号的连续性,从该各个声源中筛选出指定声源。
终端在通话或者录音状态下时,通常只有用户说话时发出的声音信号才是有效的声音信号,其它的声音信号大多为噪声,在本公开实施例所示的方案中,终端可以根据各个声源的声音信号的强度和/或声音信号的连续性,从各个声源中筛选出最有可能是用户的声源,后续只对筛选出的最有可能是用户的声源进行优化。
比如,终端可以为声音信号的不同强度设置不同的权重,并为声音信号的不同连续时间也设置不同权重,终端接收到一个声源发出的声音信号后,分别确定其声音强度对应的权重和持续时间对应的权重进行加权,并对各个声源按照对应的加权进行排序,确定出加权最高的指定声源。
可选的,在为声音信号的不同强度设置不同的权重时,可以将最接近人说话声音的强度设置较高的权重,与人说话声音的强度之间的差值越大,对应设置的权重越低。比如,人平时说话正常的声音强度大约为40分贝,则可以对40分贝设置最高的加权,距离40分贝越远的声音强度,其权重越低。
同样的,在为声音信号的持续时间设置不同权重时,可以将最接近人说话时的声音信号的持续时间设置较高的权重,与人说话时的声音信号的持续时间之间的差值越大,对应设置的权重也越低。比如,人说话时,正常一句话的持续时间可能是2s,则可以对2s的持续时间设置最高的加权,与2s之间差距越大的持续时间,其权重越低。
由于录音或者通话时,同一时间通常只有一个或者两个用户在说话,为了避免对过多的声源进行不必要的优化处理,降低优化过程的复杂度,可以设置同时筛选出的指定声源的数量,比如,最多同一时间筛选出3个指定声源,后续同一时间最多只对3个声源发出的声音信号进行优化。
在步骤206中,根据定位获得的该指定声源的空间位置,确定该终端采集到的声音信号中由该指定声源发出的声音信号。
终端对接收到的声音信号进行处理时,可以根据指定声源的空间位置,只对该指定声源发出的声音信号进行处理。
在步骤208中,将指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较,该第一强度阈值大于或者等于该第二强度阈值。
在步骤210中,若该指定声源发出的声音信号的强度大于该第一强度阈值,则将该指定声源发出的声音信号的强度降低至该第一强度阈值。
在步骤212中,若该指定声源发出的声音信号的强度小于该第二强度阈值,则将该指定声源发出的声音信号的强度增加至该第二强度阈值。
可选的,若该指定声源发出的声音信号的强度不小于该第一强度阈值,且不大于该第二强度阈值,则不对指定声源发出的声音信号的强度进行处理。
终端可以按照人正常说话时的声音信号强度设置第一强度阈值和第二强度阈值,若指定声源的声音信号强度较大,则将该指定声源的声音信号的强度降低,若指定声源的声音信号强度较小,则将该指定声源的声音信号的强度提高,若指定声源的声音信号强度适中,则不对指定声源的声音信号的强度进行处理。从而使可能是用户的指定声源发出的声音信号的强度保持在一个预定的范围内,既不会太高,也不会太低,从而使录音或者通话的效果达到最佳。
比如,以用户A和用户B通过智能手机进行远程电话会议,或者,通过手机进行会议录音为例,控制智能手机进入录音状态或者通话状态时,将智能手机切换至会议录音模式,此时,智能手机通过至少两个麦克风采集周围的声音并确定各个声源的位置,当用户A或者用户B发言时,智能手机将发言者筛选为指定声源,并对该发言者说话时发出的声音信号进行优化,当该发言者说话时发出的声音信号强度小于30分贝时,将该发言者说话时发出的声音信号的强度提升为30分贝,当该发言者说话时发出的声音信号大于50分贝时,将该发言者说话时发出的声音信号降低至50分贝,对于30分贝至50分贝之间的声音信号,则不做任何处理。从而保证与智能手机之间的距离不同的各个用户,其录制或者被远端收听到的说话音量都处于一个适当的范围内,从而保证了录音效果或者电话会议的通话效果。
综上所述,本公开实施例中提供的声音信号优化方法,通过至少两个声音采集单元对终端周边的声源进行定位,从定位确定的各个声源中筛选出指定声源,根据定位获得的该指定声源的空间位置,确定该终端采集到的声音信号中由该指定声源发出的声音信号,并将该指定声源发出的声音信号的强度调整至预先设置的两个强度阈值之间,将终端采集到的指定声源发出的声音信号的强度调整到一个合适的范围之内,从提高终端在录音或者通话时,对声音信号的采集效果。
作为另一种可选的实施例,在执行上述图2所示实施例中的步骤206之前,还可以执行如图4所示的增益补偿方法的流程图中的步骤205a~步骤205c。
在步骤205a中,通过该终端中的姿态传感器获取该终端的姿态,该终端的姿态包括该终端正面与水平面之间的夹角。
正常情况下,在进行录音或者电话会议时,终端正面向上水平放置在桌面上,而在某一情况下,终端的姿态可能并不是水平的,比如,当终端搭置在书本或者其它物体上时,其正面并不是水平状态,此时,终端正面与水平面之间会呈一定的夹角,导致终端采集到的声音信号与理想状态之间有一定的偏差,与终端正面处于水平状态时采集到的声音信号相比偏小。
对此,终端从采集到的声音信号中确定出指定声源发出的声音信号之前并做优化处理之前,首先可以根据当前姿态对采集到的声音信号做一些补偿。
在步骤205b中,根据该终端正面与水平面之间的夹角确定补偿数值,该终端正面与水平面之间的夹角与该补偿数值之间成正比例关系。
当终端正面与水平面之间的夹角越大时,终端采集到的声音信号与理想状态(即终端正面处于水平状态)之间的偏差也越大,因此,终端可以根据终端正面与水平面之间的夹角,通过预先设置算法计算补偿数值,或者通过预先存储的对应关系查询需要补偿的数值。
在步骤205c中,根据该补偿数值对该终端采集到的声音信号进行增益补偿。
终端确定出补偿数值后,对采集到的所有声音信号进行增益补偿。
其中,终端在确定该终端采集到的声音信号中由该指定声源发出的声音信号时,可以确定经过增益补偿后的声音信号中,由该指定声源发出的声音信号。
综上所述,本公开实施例中提供的方法,通过在从采集到的声音信号中确定出指定声源的声音信号并做优化之前,获取终端的姿态,根据终端的姿态对终端采集到的声音信号进行增益补偿,进一步提高了终端在录音或者通话时,对声音信号的采集效果。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图5是根据一示例性实施例示出的一种声音信号优化装置的框图,该声音信号优化装置可以用于包含有至少两个声音采集单元的终端中,该终端可以是智能手机、平板电脑、电子书阅读器以及智能录音笔等支持语音通话或者录音功能的智能终端,执行如图1至4任一所示的方法。如图5所示,该声音信号优化装置包括但不限于:定位模块501、筛选模块502、声音信号确定模块503以及优化模块504;
所述定位模块501被设置为用于通过所述至少两个声音采集单元对所述终端周边的声源进行定位;
所述筛选模块502被设置为用于从定位确定的各个声源中筛选出指定声源;
所述声音信号确定模块503被设置为用于根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;
所述优化模块504被设置为用于对所述指定声源发出的声音信号进行音量优化。
综上所述,本公开实施例中提供的声音信号优化装置,通过至少两个声音采集单元对终端周边的声源进行定位,从定位确定的各个声源中筛选出指定声源,根据定位获得的该指定声源的空间位置,确定该终端采集到的声音信号中由该指定声源发出的声音信号,对该指定声源发出的声音信号进行音量优化;当终端在采集声音信号时,对周边声源进行筛选,并对筛选出的声源发出的声音信号进行优化,从提高终端对声音信号的采集效果。
图6是根据一示例性实施例示出的一种声音信号优化装置的框图,该声音信号优化装置可以用于包含有至少两个声音采集单元的终端中,该终端可以是智能手机、平板电脑、电子书阅读器以及智能录音笔等支持语音通话或者录音功能的智能终端,执行如图1至4任一所示的方法。如图6所示,该声音信号优化装置包括但不限于:定位模块501、筛选模块502、声音信号确定模块503以及优化模块504;
所述定位模块501被设置为用于通过所述至少两个声音采集单元对所述终端周边的声源进行定位;
所述筛选模块502被设置为用于从定位确定的各个声源中筛选出指定声源;
所述声音信号确定模块503被设置为用于根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;
所述优化模块504被设置为用于对所述指定声源发出的声音信号进行音量优化。
可选的,所述优化模块504,包括:比较子模块504a、降低子模块504b以及增加子模块504c;
所述比较子模块504a被设置为用于将所述指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较,所述第一强度阈值大于或者等于所述第二强度阈值;
所述降低子模块504b被设置为用于若所述指定声源发出的声音信号的强度大于所述第一强度阈值,则将所述指定声源发出的声音信号的强度降低至所述第一强度阈值;
所述增加子模块504c被设置为用于若所述指定声源发出的声音信号的强度小于所述第二强度阈值,则将所述指定声源发出的声音信号的强度增加至所述第二强度阈值。
可选的,所述定位模块501,包括:获取子模块501a以及定位子模块501b;
所述获取子模块501a被设置为用于获取一声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差;
所述定位子模块501b被设置为用于根据所述声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差确定所述声源相对于所述终端的空间位置。
可选的,所述筛选模块502被设置为用于根据所述各个声源的声音信号的强度和/或声音信号的连续性,从所述各个声源中筛选出所述指定声源。
可选的,所述装置还包括:姿态获取模块505和补偿模块506;
所述姿态获取模块505被设置为用于在所述声音信号确定模块503确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前,通过所述终端中的姿态传感器获取所述终端的姿态;
所述补偿模块506被设置为用于根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿;
所述声音信号确定模块503被设置为用于确定经过增益补偿后的声音信号中,由所述指定声源发出的声音信号。
可选的,所述补偿模块506,包括:数值确定子模块506a以及补偿子模块506b;
所述数值确定子模块506a被设置为用于根据所述终端正面与水平面之间的夹角确定补偿数值,所述终端正面与水平面之间的夹角与所述补偿数值之间成正比例关系;
所述补偿子模块506b被设置为用于根据所述补偿数值对所述终端采集到的声音信号进行增益补偿;
其中,所述终端的姿态包括所述终端正面与水平面之间的夹角。
综上所述,本公开实施例中提供的声音信号优化装置,通过至少两个声音采集单元对终端周边的声源进行定位,从定位确定的各个声源中筛选出指定声源,根据定位获得的该指定声源的空间位置,确定该终端采集到的声音信号中由该指定声源发出的声音信号,并将该指定声源发出的声音信号的强度调整至预先设置的两个强度阈值之间,将终端采集到的指定声源发出的声音信号的强度调整到一个合适的范围之内,从提高终端在录音或者通话时,对声音信号的采集效果。
此外,本公开实施例中提供的装置,通过在从采集到的声音信号中确定出指定声源的声音信号并做优化之前,获取终端的姿态,根据终端的姿态对终端采集到的声音信号进行增益补偿,进一步提高了终端在录音或者通话时,对声音信号的采集效果。
图7是根据一示例性实施例示出的一种装置700的框图。其中,该装置中包含至少两个声音采集单元。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,路由设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器718来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储器704中还存储有一个或多个模块,该一个或多个模块被配置成由该一个或多个处理器720执行,以完成上述图1至4任一所示的方法的全部或部分步骤。
电源组件706为装置700的各种组件提供电力。电源组件706可以包括电源管理***,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器718执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中执行了详细描述,此处将不做详细阐述说明。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (12)

1.一种声音信号优化方法,其特征在于,用于包含有至少两个声音采集单元的终端中,所述方法包括:
通过所述至少两个声音采集单元对所述终端周边的声源进行定位;
从定位确定的各个声源中筛选出指定声源;
根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;
对所述指定声源发出的声音信号进行音量优化;
其中,从定位确定的各个声源中筛选出指定声源,包括:
根据所述各个声源的声音信号的强度和声音信号的连续性,从所述各个声源中筛选出所述指定声源;
其中,所述根据所述各个声源的声音信号的强度和声音信号的连续性,从所述各个声源中筛选出所述指定声源,包括:
根据所述各个声源的加权后的声音信号的强度和加权后的声音信号的持续时间,从所述各个声源中筛选出所述指定声源,在所述加权后的声音信号中所述最接近人说话声音的强度对应最高的权重,在所述加权后的声音信号的持续时间中所述最接近人说话时的声音信号的持续时间对应最高的权重。
2.根据权利要求1所述的方法,其特征在于,所述对所述指定声源发出的声音信号进行音量优化,包括:
将所述指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较,所述第一强度阈值大于或者等于所述第二强度阈值;
若所述指定声源发出的声音信号的强度大于所述第一强度阈值,则将所述指定声源发出的声音信号的强度降低至所述第一强度阈值;
若所述指定声源发出的声音信号的强度小于所述第二强度阈值,则将所述指定声源发出的声音信号的强度增加至所述第二强度阈值。
3.根据权利要求1所述的方法,其特征在于,所述通过所述至少两个声音采集单元对所述终端周边的声源进行定位,包括:
获取一声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差;
根据所述声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差确定所述声源相对于所述终端的空间位置。
4.根据权利要求1所述的方法,其特征在于,所述确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前,还包括:
通过所述终端中的姿态传感器获取所述终端的姿态;
根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿;
所述确定所述终端采集到的声音信号中由所述指定声源发出的声音信号,包括:
确定经过增益补偿后的声音信号中,由所述指定声源发出的声音信号。
5.根据权利要求4所述的方法,其特征在于,所述终端的姿态包括所述终端正面与水平面之间的夹角,所述根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿,包括:
根据所述终端正面与水平面之间的夹角确定补偿数值,所述终端正面与水平面之间的夹角与所述补偿数值之间成正比例关系;
根据所述补偿数值对所述终端采集到的声音信号进行增益补偿。
6.一种声音信号优化装置,其特征在于,用于包含有至少两个声音采集单元的终端中,所述装置包括:
定位模块,用于通过所述至少两个声音采集单元对所述终端周边的声源进行定位;
筛选模块,用于从定位确定的各个声源中筛选出指定声源;
声音信号确定模块,用于根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;
优化模块,用于对所述指定声源发出的声音信号进行音量优化;
所述筛选模块,用于根据所述各个声源的声音信号的强度和声音信号的连续性,从所述各个声源中筛选出所述指定声源;所述根据所述各个声源的声音信号的强度和声音信号的连续性,从所述各个声源中筛选出所述指定声源,包括:根据所述各个声源的加权后的声音信号的强度和加权后的声音信号的持续时间,从所述各个声源中筛选出所述指定声源,在所述加权后的声音信号中所述最接近人说话声音的强度对应最高的权重,在所述加权后的声音信号的持续时间中所述最接近人说话时的声音信号的持续时间对应最高的权重。
7.根据权利要求6所述的装置,其特征在于,所述优化模块,包括:
比较子模块,用于将所述指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较,所述第一强度阈值大于或者等于所述第二强度阈值;
降低子模块,用于若所述指定声源发出的声音信号的强度大于所述第一强度阈值,则将所述指定声源发出的声音信号的强度降低至所述第一强度阈值;
增加子模块,用于若所述指定声源发出的声音信号的强度小于所述第二强度阈值,则将所述指定声源发出的声音信号的强度增加至所述第二强度阈值。
8.根据权利要求6所述的装置,其特征在于,所述定位模块,包括:
获取子模块,用于获取一声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差;
定位子模块,用于根据所述声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差确定所述声源相对于所述终端的空间位置。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:姿态获取模块和补偿模块;
所述姿态获取模块,用于在所述声音信号确定模块确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前,通过所述终端中的姿态传感器获取所述终端的姿态;
所述补偿模块,用于根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿;
所述声音信号确定模块,用于确定经过增益补偿后的声音信号中,由所述指定声源发出的声音信号。
10.根据权利要求9所述的装置,其特征在于,所述补偿模块,包括:
数值确定子模块,用于根据所述终端正面与水平面之间的夹角确定补偿数值,所述终端正面与水平面之间的夹角与所述补偿数值之间成正比例关系;
补偿子模块,用于根据所述补偿数值对所述终端采集到的声音信号进行增益补偿;
其中,所述终端的姿态包括所述终端正面与水平面之间的夹角。
11.一种声音信号优化方法装置,其特征在于,用于包含有至少两个声音采集单元的终端中,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
通过所述至少两个声音采集单元对所述终端周边的声源进行定位;
从定位确定的各个声源中筛选出指定声源;
根据定位获得的所述指定声源的空间位置,确定所述终端采集到的声音信号中由所述指定声源发出的声音信号;
对由所述指定声源发出的声音信号进行音量优化;
其中,从定位确定的各个声源中筛选出指定声源,包括:
根据所述各个声源的声音信号的强度和声音信号的连续性,从所述各个声源中筛选出所述指定声源;
其中,所述根据所述各个声源的声音信号的强度和声音信号的连续性,从所述各个声源中筛选出所述指定声源,包括:
根据所述各个声源的加权后的声音信号的强度和加权后的声音信号的持续时间,从所述各个声源中筛选出所述指定声源,在所述加权后的声音信号中所述最接近人说话声音的强度对应最高的权重,在所述加权后的声音信号的持续时间中所述最接近人说话时的声音信号的持续时间对应最高的权重。
12.一种计算机可读存储介质,其特征在于,所述存储介质中包括指令,所述指令由处理器执行以实现如权利要求1至权利要求5任一所述的声音信号优化方法。
CN201510226844.2A 2015-05-06 2015-05-06 声音信号优化方法及装置 Active CN106205628B (zh)

Priority Applications (9)

Application Number Priority Date Filing Date Title
CN201510226844.2A CN106205628B (zh) 2015-05-06 2015-05-06 声音信号优化方法及装置
RU2015155321A RU2628473C2 (ru) 2015-05-06 2015-09-22 Способ и устройство для оптимизации звукового сигнала
BR112015031855A BR112015031855A2 (pt) 2015-05-06 2015-09-22 método e dispositivo para otimizar um sinal sonoro
MX2015017147A MX361588B (es) 2015-05-06 2015-09-22 Metodo y dispositivo para optimizar señal de sonido.
JP2017516025A JP6314286B2 (ja) 2015-05-06 2015-09-22 音声信号の最適化方法及びその装置、プログラム、及び記録媒体
KR1020157031849A KR20160142217A (ko) 2015-05-06 2015-09-22 음성 신호 최적화 방법 및 그 장치, 프로그램 및 저장매체
PCT/CN2015/090275 WO2016176951A1 (zh) 2015-05-06 2015-09-22 声音信号优化方法及装置
US15/057,639 US10499156B2 (en) 2015-05-06 2016-03-01 Method and device of optimizing sound signal
EP16166152.5A EP3091753B1 (en) 2015-05-06 2016-04-20 Method and device of optimizing sound signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510226844.2A CN106205628B (zh) 2015-05-06 2015-05-06 声音信号优化方法及装置

Publications (2)

Publication Number Publication Date
CN106205628A CN106205628A (zh) 2016-12-07
CN106205628B true CN106205628B (zh) 2018-11-02

Family

ID=55952949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510226844.2A Active CN106205628B (zh) 2015-05-06 2015-05-06 声音信号优化方法及装置

Country Status (9)

Country Link
US (1) US10499156B2 (zh)
EP (1) EP3091753B1 (zh)
JP (1) JP6314286B2 (zh)
KR (1) KR20160142217A (zh)
CN (1) CN106205628B (zh)
BR (1) BR112015031855A2 (zh)
MX (1) MX361588B (zh)
RU (1) RU2628473C2 (zh)
WO (1) WO2016176951A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106791039B (zh) * 2016-11-30 2019-11-15 努比亚技术有限公司 一种移动终端定位装置及方法
KR20180091319A (ko) * 2017-02-06 2018-08-16 삼성에스디에스 주식회사 사운드 공유 장치 및 방법
US10602296B2 (en) 2017-06-09 2020-03-24 Nokia Technologies Oy Audio object adjustment for phase compensation in 6 degrees of freedom audio
CN107846645B (zh) * 2017-11-02 2019-09-06 长沙东玛克信息科技有限公司 一种基于环境噪声及人体定位音响控制调节方法
CN108461084A (zh) * 2018-03-01 2018-08-28 广东美的制冷设备有限公司 语音识别***控制方法、控制装置及计算机可读存储介质
CN108648758B (zh) * 2018-03-12 2020-09-01 北京云知声信息技术有限公司 医疗场景中分离无效语音的方法及***
CN108538320B (zh) * 2018-03-30 2020-09-11 Oppo广东移动通信有限公司 录音控制方法和装置、可读存储介质、终端
CN108766457B (zh) * 2018-05-30 2020-09-18 北京小米移动软件有限公司 音频信号处理方法、装置、电子设备及存储介质
CN111385649B (zh) * 2018-12-28 2022-01-04 深圳Tcl新技术有限公司 一种电视声音传输控制方法、装置、智能电视及存储介质
CN109658758A (zh) * 2019-02-18 2019-04-19 西安科技大学 一种计算机会计教学仿真***
CN110691300B (zh) * 2019-09-12 2022-07-19 连尚(新昌)网络科技有限公司 音频播放设备及用于提供信息的方法
CN110719545B (zh) * 2019-09-12 2022-11-08 连尚(新昌)网络科技有限公司 音频播放设备及用于播放音频的方法
CN110602595A (zh) * 2019-10-16 2019-12-20 南京沁恒微电子股份有限公司 一种分体式蓝牙耳机及其定位方法
CN112185353A (zh) * 2020-09-09 2021-01-05 北京小米松果电子有限公司 音频信号的处理方法、装置、终端及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09252333A (ja) * 1996-03-15 1997-09-22 Kyocera Corp 音声会議装置
CN101455093A (zh) * 2006-05-25 2009-06-10 雅马哈株式会社 语音会议装置
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及***
CN102164328A (zh) * 2010-12-29 2011-08-24 中国科学院声学研究所 一种用于家庭环境的基于传声器阵列的音频输入***
CN102685339A (zh) * 2011-03-04 2012-09-19 米特尔网络公司 音频会议电话的主持人模式
CN103390410A (zh) * 2012-05-10 2013-11-13 宏碁股份有限公司 远程电话会议***及方法
CN103873977A (zh) * 2014-03-19 2014-06-18 惠州Tcl移动通信有限公司 基于多麦克风阵列波束成形的录音***及其实现方法
CN104053107A (zh) * 2014-06-06 2014-09-17 重庆大学 用于噪声环境下声源分离和定位的助听装置及方法

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US13075A (en) * 1855-06-19 Horatio allen
US288864A (en) * 1883-11-20 Grate
US4864627A (en) * 1986-11-07 1989-09-05 Dugan Daniel W Microphone mixer with gain limiting and proportional limiting
JPS63262576A (ja) * 1987-04-20 1988-10-28 Sony Corp マイクロホン装置
US6001131A (en) * 1995-02-24 1999-12-14 Nynex Science & Technology, Inc. Automatic target noise cancellation for speech enhancement
JPH0946400A (ja) 1995-07-27 1997-02-14 Nec Corp 音声出力レベルの自動調整機能を備えた音声入出 力装置
WO2002011438A1 (en) * 2000-08-01 2002-02-07 Koninklijke Philips Electronics N.V. Aiming a device at a sound source
US6594368B2 (en) * 2001-02-21 2003-07-15 Digisonix, Llc DVE system with dynamic range processing
WO2006027707A1 (en) * 2004-09-07 2006-03-16 Koninklijke Philips Electronics N.V. Telephony device with improved noise suppression
RU2312405C2 (ru) * 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US8135148B2 (en) * 2006-04-26 2012-03-13 Microsemi Semiconductor Corp. Automatic gain control for mobile microphone
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
JP2008048342A (ja) * 2006-08-21 2008-02-28 Yamaha Corp 収音装置
JP4854533B2 (ja) * 2007-01-30 2012-01-18 富士通株式会社 音響判定方法、音響判定装置及びコンピュータプログラム
US7742746B2 (en) * 2007-04-30 2010-06-22 Qualcomm Incorporated Automatic volume and dynamic range adjustment for mobile audio devices
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
JP4811475B2 (ja) * 2009-02-27 2011-11-09 ソニー株式会社 録音装置、録音方法、音声信号補正回路及びプログラム
US9094645B2 (en) * 2009-07-17 2015-07-28 Lg Electronics Inc. Method for processing sound source in terminal and terminal using the same
KR101166612B1 (ko) 2009-08-19 2012-07-18 엘지전자 주식회사 단말기에서의 음원 처리 방법 및 이를 적용한 단말기
JP2011066805A (ja) * 2009-09-18 2011-03-31 Oki Electric Industry Co Ltd 収音装置および収音方法
JP5246120B2 (ja) 2009-09-29 2013-07-24 沖電気工業株式会社 収音装置、利得制御方法、およびプログラム
JP5391999B2 (ja) * 2009-10-23 2014-01-15 株式会社Jvcケンウッド ポータブル録音装置、録音自動調整方法、及びプログラム
EP2339574B1 (en) * 2009-11-20 2013-03-13 Nxp B.V. Speech detector
JP5407848B2 (ja) * 2009-12-25 2014-02-05 富士通株式会社 マイクロホンの指向性制御装置
US8502837B2 (en) * 2010-03-04 2013-08-06 Research In Motion Limited System and method for activating components on an electronic device using orientation data
CH703440B1 (it) * 2010-07-12 2014-06-30 Supsi Scuola Universitaria Professionale Della Svizzera Italiana Icimsi Sistema per il trattamento delle acque reflue.
US8711736B2 (en) 2010-09-16 2014-04-29 Apple Inc. Audio processing in a multi-participant conference
US9031256B2 (en) * 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US20120148075A1 (en) 2010-12-08 2012-06-14 Creative Technology Ltd Method for optimizing reproduction of audio signals from an apparatus for audio reproduction
US8525868B2 (en) 2011-01-13 2013-09-03 Qualcomm Incorporated Variable beamforming with a mobile platform
US9549251B2 (en) 2011-03-25 2017-01-17 Invensense, Inc. Distributed automatic level control for a microphone array
GB2491173A (en) 2011-05-26 2012-11-28 Skype Setting gain applied to an audio signal based on direction of arrival (DOA) information
US8588434B1 (en) * 2011-06-27 2013-11-19 Google Inc. Controlling microphones and speakers of a computing device
KR20130061935A (ko) * 2011-12-02 2013-06-12 삼성전자주식회사 고도 정보 기반의 사용자 기능 제어 방법 및 이를 지원하는 단말기
JP2013168878A (ja) * 2012-02-16 2013-08-29 Olympus Imaging Corp 録音機器
US20130332156A1 (en) * 2012-06-11 2013-12-12 Apple Inc. Sensor Fusion to Improve Speech/Audio Processing in a Mobile Device
TWI578755B (zh) * 2012-07-06 2017-04-11 鴻海精密工業股份有限公司 遠端多方會議音量調整系統及方法
JP5930900B2 (ja) * 2012-07-24 2016-06-08 日東電工株式会社 導電性フィルムロールの製造方法
US9001672B2 (en) * 2012-07-27 2015-04-07 Alcatel Lucent System, method and apparatus conforming path cost criteria across multiple ABRs
US9294859B2 (en) * 2013-03-12 2016-03-22 Google Technology Holdings LLC Apparatus with adaptive audio adjustment based on surface proximity, surface type and motion
KR102127640B1 (ko) * 2013-03-28 2020-06-30 삼성전자주식회사 휴대 단말 및 보청기와 휴대 단말에서 음원의 위치를 제공하는 방법
US9225815B2 (en) * 2013-07-23 2015-12-29 Google Technology Holdings LLC Method and device for loudness level determination
GB2520305A (en) * 2013-11-15 2015-05-20 Nokia Corp Handling overlapping audio recordings
DE112015000640T5 (de) * 2014-02-04 2017-02-09 Tp Vision Holding B.V. Handgerät mit Mikrofon
WO2016053019A1 (ko) * 2014-10-01 2016-04-07 삼성전자 주식회사 잡음이 포함된 오디오 신호를 처리하는 방법 및 장치

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09252333A (ja) * 1996-03-15 1997-09-22 Kyocera Corp 音声会議装置
CN101455093A (zh) * 2006-05-25 2009-06-10 雅马哈株式会社 语音会议装置
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及***
CN102164328A (zh) * 2010-12-29 2011-08-24 中国科学院声学研究所 一种用于家庭环境的基于传声器阵列的音频输入***
CN102685339A (zh) * 2011-03-04 2012-09-19 米特尔网络公司 音频会议电话的主持人模式
CN103390410A (zh) * 2012-05-10 2013-11-13 宏碁股份有限公司 远程电话会议***及方法
CN103873977A (zh) * 2014-03-19 2014-06-18 惠州Tcl移动通信有限公司 基于多麦克风阵列波束成形的录音***及其实现方法
CN104053107A (zh) * 2014-06-06 2014-09-17 重庆大学 用于噪声环境下声源分离和定位的助听装置及方法

Also Published As

Publication number Publication date
EP3091753B1 (en) 2020-01-08
KR20160142217A (ko) 2016-12-12
JP2017521024A (ja) 2017-07-27
CN106205628A (zh) 2016-12-07
RU2628473C2 (ru) 2017-08-17
BR112015031855A2 (pt) 2017-07-25
EP3091753A1 (en) 2016-11-09
JP6314286B2 (ja) 2018-04-18
MX361588B (es) 2018-12-11
US20160330548A1 (en) 2016-11-10
WO2016176951A1 (zh) 2016-11-10
US10499156B2 (en) 2019-12-03
RU2015155321A (ru) 2017-06-29
MX2015017147A (es) 2017-04-06

Similar Documents

Publication Publication Date Title
CN106205628B (zh) 声音信号优化方法及装置
US11375329B2 (en) Systems and methods for equalizing audio for playback on an electronic device
CN108510987A (zh) 语音处理方法及装置
CN110970057B (zh) 一种声音处理方法、装置与设备
US10142483B2 (en) Technologies for dynamic audio communication adjustment
CN104991754B (zh) 录音方法及装置
US20130190041A1 (en) Smartphone Speakerphone Mode With Beam Steering Isolation
CN104378715B (zh) 降低耳机pop音的装置和方法
CN109360549B (zh) 一种数据处理方法、穿戴设备和用于数据处理的装置
CN105451056B (zh) 音视频同步方法及装置
CN106657585B (zh) 对讲机的频率调节方法及装置
AU2013211541A1 (en) Mobile apparatus and control method thereof
CN106157952A (zh) 声音识别方法及装置
CN108845787A (zh) 音频调节的方法、装置、终端及存储介质
CN106899869A (zh) 调整电子设备音量的方法、装置及***
CN111698593B (zh) 主动降噪方法及装置、终端
CN110392334A (zh) 一种麦克风阵列音频信号自适应处理方法、装置及介质
CN104469648A (zh) 音频校准方法及装置
CN106210247A (zh) 终端控制方法及装置
CN109429152A (zh) 扬声器装置、电子设备、音效调节方法及装置
CN207117943U (zh) 扬声器装置及电子设备
CN106101441A (zh) 终端控制方法及装置
CN105635378A (zh) 通话质量调整方法、装置及移动终端
CN104902054B (zh) 滤除移动终端的干扰频点的方法及装置
CN108735212A (zh) 语音控制方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant