CN115499761A - 音频处理设备和音频处理*** - Google Patents

音频处理设备和音频处理*** Download PDF

Info

Publication number
CN115499761A
CN115499761A CN202211104274.6A CN202211104274A CN115499761A CN 115499761 A CN115499761 A CN 115499761A CN 202211104274 A CN202211104274 A CN 202211104274A CN 115499761 A CN115499761 A CN 115499761A
Authority
CN
China
Prior art keywords
audio data
audio
bluetooth
chip
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211104274.6A
Other languages
English (en)
Inventor
吴叶富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anker Innovations Co Ltd
Original Assignee
Anker Innovations Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anker Innovations Co Ltd filed Critical Anker Innovations Co Ltd
Priority to CN202211104274.6A priority Critical patent/CN115499761A/zh
Publication of CN115499761A publication Critical patent/CN115499761A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B5/00Near-field transmission systems, e.g. inductive or capacitive transmission systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B5/00Near-field transmission systems, e.g. inductive or capacitive transmission systems
    • H04B5/70Near-field transmission systems, e.g. inductive or capacitive transmission systems specially adapted for specific purposes
    • H04B5/72Near-field transmission systems, e.g. inductive or capacitive transmission systems specially adapted for specific purposes for local intradevice communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/19Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6058Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone
    • H04M1/6066Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone including a wireless connection

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种音频处理设备和音频处理***,该音频处理设备包括蓝牙芯片,所述蓝牙芯片用于接收至少两路音频数据,其中,所述至少两路音频数据是至少两个麦克风分别对同一通话场景拾音得到的;所述蓝牙芯片还用于基于所接收的所有路所述音频数据进行音频降噪处理,得到所述通话场景的降噪后语音信号,并将所述降噪后语音信号传送至终端设备。该音频处理设备和音频处理***能够提高语音通话的质量,提高用户体验。

Description

音频处理设备和音频处理***
技术领域
本申请涉及音频处理技术领域,更具体地涉及一种音频处理设备和音频处理***。
背景技术
在信息时代的今天,人们的工作生活节奏越来越快。人们在日常生活中,对于产品的体验越来越注重。由于疫情等原因,更多的人居家办公、居室生活,逐渐频繁使用电脑、会议***等进行通话。
随着科学与技术的快速发展,真无线通话***目前已被成功开发出来。但是目前市面上的无线音频产品,例如耳机或音响,只能单纯的利用一只耳机或一个麦克风进行音频输入。上述原因造成通话***近年来面市后,出现了用户对通话体验不佳等问题。因此,需要提供能够提高通话体验的方案。
发明内容
根据本申请一方面,提供了一种音频处理设备,所述音频处理设备包括蓝牙芯片,所述蓝牙芯片用于接收至少两路音频数据,其中,所述至少两路音频数据是至少两个麦克风分别对同一通话场景拾音得到的;所述蓝牙芯片还用于基于所接收的所有路所述音频数据进行音频降噪处理,得到所述通话场景的降噪后语音信号,并将所述降噪后语音信号传送至终端设备。
在本申请的一个实施例中,所述蓝牙芯片至少包括主芯片和从芯片,所述主芯片用于接收一路所述音频数据,所述从芯片用于接收另外的一路所述音频数据,其中:所述从芯片还用于将自身接收的一路所述音频数据传送至所述主芯片;所述主芯片还用于在接收到所述从芯片传送的所述音频数据后,根据接收到的所有所述音频数据进行所述音频降噪处理;或者,所述从芯片还用于根据其自身接收的一路所述音频数据进行所述音频降噪处理,以及将降噪后得到的第一降噪后语音信号传送至所述主芯片;所述主芯片还用于根据其自身接收的一路所述音频数据进行所述音频降噪处理,以得到降噪后的第二降噪后语音信号,以及在接收到所述从芯片传送的所述第一降噪后语音信号后,与所述第二降噪后语音信号进行语音融合。
在本申请的一个实施例中,所述蓝牙芯片至少包括支持下一代蓝牙技术的LE-audio蓝牙芯片,所述支持下一代蓝牙技术的LE-audio蓝牙芯片用于接收所述至少两路音频数据,并根据所接收的所有路所述音频数据执行所述音频降噪处理。
在本申请的一个实施例中,所述蓝牙芯片执行的所述音频降噪处理的步骤具体包括:针对所接收的所有路所述音频数据,分别计算其语音能量值;对所有路所述音频数据各自的语音能量值进行比较,得到比较结果;基于所述比较结果将所有路所述音频数据中的多路所述音频数据,合成为一路音频数据后进行所述音频降噪处理,或者选择语音能量值最大的一路音频数据进行所述音频降噪处理,得到所述通话场景的降噪后语音信号。
在本申请的一个实施例中,所述蓝牙芯片进一步还用于:对于所述一路音频数据,当所述一路音频数据的语音能量值小于第一阈值,或者另一路音频数据的语音能量值与所述一路音频数据的语音能量值之差大于第二阈值时,向采集所述一路音频数据的麦克风所在的蓝牙拾音设备发送控制信号,以控制采集所述一路音频数据的麦克风关闭。
在本申请的一个实施例中,所述至少两个麦克风包括至少三个麦克风,且其中两个麦克风是设置在同一个蓝牙拾音设备上的不同位置处的麦克风。
在本申请的一个实施例中,所述至少两个麦克风包括两个分别设置在不同的两个蓝牙拾音设备上的麦克风。
在本申请的一个实施例中,所述两个蓝牙拾音设备包括蓝牙耳机的左耳耳机和右耳耳机,或者包括两个蓝牙音响设备。
在本申请的一个实施例中,所述音频处理设备包括蓝牙适配器或者蓝牙耳机的充电仓。
根据本申请另一方面,还提供了一种音频处理***,所述音频处理***包括至少两个上述的音频处理设备,至少两个所述音频处理设备中的每一个处理至少两路的音频数据,以配合实现对同一通话场景拾音得到的多路音频数据的降噪处理。
根据本申请实施例的音频处理设备和音频处理***能够提高语音通话的质量,提高用户体验。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1示出根据本申请实施例的音频处理设备的示意性结构框图以及其与麦克风和终端设备的数据交互示意图。
图2示出根据本申请一个更具体实施例的音频处理设备的示意性结构框图以及其与麦克风和终端设备的数据交互示意图。
图3示出根据本申请另一个更具体实施例的音频处理设备的示意性结构框图以及其与麦克风和终端设备的数据交互示意图。
图4示出根据本申请实施例的音频处理***的示意性结构框图。
具体实施方式
为了使得本申请的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。基于本申请中描述的实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其他实施例都应落入本申请的保护范围之内。
图1示出了根据本申请实施例的音频处理设备100的示意性结构框图以及其与麦克风和终端设备的数据交互示意图,其中,麦克风设置在蓝牙拾音设备上。如图1所示,音频处理设备100包括蓝牙芯片110,蓝牙芯片110用于接收至少两路音频数据,其中,至少两路音频数据是至少两个麦克风分别对同一通话场景拾音得到的(为了简洁,在图1中仅示出两个麦克风和对应的两路音频数据)。蓝牙芯片110还用于基于所接收的所有路音频数据进行音频降噪处理,得到通话场景的降噪后语音信号,并将降噪后语音信号传送至终端设备。
在本申请的实施例中,蓝牙芯片110接收来自至少两个麦克风的音频数据,每个麦克风均针对当前通话场景进行拾音得到一路音频数据;相应地,蓝牙芯片110从这至少两个麦克风接收到对应的至少两路音频数据,对其进行音频降噪处理,得到通话场景的降噪后语音信号;由于蓝牙芯片110基于针对同一通话场景拾音得到的至少两路音频数据进行音频降噪处理,不同路音频数据彼此之间互为参考,相对于仅基于一路音频数据进行音频降噪处理,能够提高降噪可靠性,从而提高语音信号的质量;相应地,该语音信号被传送至终端设备,再由终端设备传送至通话另一方,能够提高通话质量,从而提高通话场景的用户体验。此外,终端设备也可以用于将获取到的语音信号进行实时转录、实时对话、实时翻译等操作,还可以上传云端等。
在本申请的实施例中,蓝牙芯片110执行的音频降噪处理的步骤可以具体包括:针对所接收的所有路音频数据,分别计算其语音能量值(诸如通过傅里叶变换、A计权等方式);对所有路音频数据各自的语音能量值进行比较,得到比较结果;基于比较结果将所有路音频数据中的多路音频数据,合成为一路音频数据后进行音频降噪处理,或者选择语音能量值最大的一路音频数据进行音频降噪处理,得到通话场景的降噪后语音信号。
例如,当所有路音频数据的语音能量值在各个频率点上的差别不大时,表明各路音频数据的拾音效果相当,此时可以将所有路音频数据合成为一路音频数据后进行音频降噪处理;再如,当不同路音频数据的语音能量在一些频率点上差别较大时,表明不同路音频数据的拾音效果差别较大,此时可以将选择语音能量值最大的一路音频数据进行所述音频降噪处理;这样有利于得到质量更好的语音信号。
在本申请的实施例中,蓝牙芯片110还可以进一步用于:对于一路音频数据,当一路音频数据的语音能量值小于第一阈值(该阈值可以根据需要来设置),或者另一路音频数据的语音能量值与一路音频数据的语音能量值之差大于第二阈值(该阈值可以根据需要来设置)时,向采集该一路音频数据的麦克风所在的蓝牙拾音设备发送控制信号,以控制采集该一路音频数据的麦克风关闭。
例如,通过比较,确定一个麦克风(例如麦克风A)针对当前通话场景的拾音语音能量值显著大于另一个麦克风(例如麦克风B)针对当前通话场景的拾音语音能量值,这表明在当前通话场景中,说话者距离其中麦克风A更近,距离麦克风B较远,或者麦克风A所处位置附近没有其他噪声源,而麦克风B所处位置附近有其他噪声源;基于此,蓝牙芯片110可控制麦克风A和B的拾音,例如,控制在当前通话场景的后续通话中,仅采用麦克风A进行拾音,而控制麦克风B关闭(例如通过向麦克风B所在蓝牙拾音设备发送控制信号来控制麦克风B关闭),这样可以在节约蓝牙拾音设备电量的同时获得高质量拾音结果(例如麦克风A和麦克风B位于同一蓝牙拾音设备的不同位置处,此时关闭麦克风B,仅采用麦克风A拾音可节约该蓝牙拾音设备的电量的同时获得高质量拾音结果)。
在本申请的一个实施例中,音频处理设备100可以实现为具有上述结构的蓝牙适配器(dongle)或者蓝牙耳机的充电仓。前述的至少两个麦克风例如可以包括至少三个麦克风,且其中两个麦克风是设置在同一个蓝牙拾音设备上的不同位置处的麦克风。或者,前述的至少两个麦克风可以包括两个分别设置在不同的两个蓝牙拾音设备上的麦克风,该两个蓝牙拾音设备例如包括蓝牙耳机的左耳耳机和右耳耳机,且左耳耳机上设置有至少一个麦克风,右耳耳机上设置有另外的至少一个麦克风;或者包括两个独立的蓝牙音响设备,且每个蓝牙音响设备各设置有一个麦克风。
下面以蓝牙拾音设备为无线蓝牙耳机,音频处理设备100为蓝牙dongle为例来描述能够提高通话语音质量的它们之间的交互(蓝牙拾音设备为无线蓝牙音响时,交互过程也是相似的,下文中不再赘述)。
例如,在一个通话场景中,通话者甲通过无线蓝牙耳机与通话者乙打电话,在通话过程中,通话者甲的左侧有其他同事在说话,而右侧比较安静。在该通话场景中,通话者甲的无线蓝牙耳机的左、右耳机均进行拾音得到双路音频数据,分别为左路音频数据和右路音频数据;蓝牙拾音设备和蓝牙dongle在蓝牙连接后,左路音频数据和右路音频数据可分别被传送至蓝牙dongle的蓝牙芯片110中;接着,蓝牙芯片110通过比较左路音频数据和右路音频数据,确定左路音频数据中存在较多噪声(来自通话者甲左侧同事的说话声),而右路音频数据的语音较为纯净,故选择右路音频数据进行音频降噪处理,得到该通话场景的降噪后语音信号,降噪后语音信号通过有线或无线方式被传送至终端设备(在该场景中为手机),这样,通话者乙将听到具有较高质量的语音,从而具有较好用户体验。相对于现有方案中无线蓝牙耳机仅采用一个麦克风的拾音,例如刚好采用了左耳机拾音得到了噪声很多的音频数据,本申请方案能够更大程度地降低通话场景下的干扰噪声,有效提高语音通话质量。在该场景中,利用蓝牙耳机的两只耳机各自的至少一个麦克风融合成拾音阵列,多路拾音后择优进行降噪处理,提高通话质量;此外,利用dongle实现了多路语音采集,而且,通过dongle也可以实现对两个耳机各自的单独控制和数据处理,如前文所述的。
在上述通话场景示例中,将音频处理设备100从蓝牙dongle更换为充电仓,过程也是一样的,此处不再赘述。下面描述另一个通话场景示例中无线蓝牙耳机与充电仓之间的数据交互。
在另一个通话场景示例中,无线蓝牙耳机没有佩戴在用户耳朵上,而是放在充电仓里进行收纳和充电,此时无线蓝牙耳机和充电仓可以组成一个会议拾音***。也就是说,在该示例中,无线蓝牙耳机不再作为听音设备,而仅作为拾音设备,充电仓上可设置扬声器来播放声音。在该示例中,无线蓝牙耳机的左、右耳机对参会者进行拾音,得到双路音频数据,分别为左路音频数据和右路音频数据;在耳机和充电仓的引脚连接或者蓝牙连接时,左路音频数据和右路音频数据可分别被传送至充电仓的蓝牙芯片110中;接着,蓝牙芯片110通过比较左路音频数据和右路音频数据,确定左路音频数据的语音能量值较小,而右路音频数据的语音能量值较大(例如左耳机距离参会的说话者更远一些,而右耳机距离参会的说话者更近一些),此时可以选择右路音频数据进行音频降噪处理,得到该通话场景的降噪后语音信号,之后,降噪后语音信号通过有线或无线方式被传送至终端设备(在该场景中可能为电脑),这样,远程参会者将听到具有较高质量的语音,从而具有较好用户体验。在上述示例中,充电仓也可以将降噪得到的语音信号进行数字化处理,转换成录音文件存储在本地,形成本地录音***。录音文件可以实时或非实时(通过蓝牙HID/BLE/SPP/A2DP/HFP或USB等方式)传送至终端设备,终端设备可以进行转录、对话或者翻译等功能或者上传到云端等等。
以上示例性地描述了根据本申请一个实施例的音频处理设备以及其与蓝牙拾音设备和终端设备的数据交互。基于上面的描述,根据本申请实施例的音频处理设备100能够获取来自至少一个蓝牙拾音设备上的至少两个麦克风针对同一通话场景的至少两路音频数据,基于该至少两路音频数据进行音频降噪处理,得到通话场景的降噪后语音信号并传送至终端设备,能够提高降噪可靠性,从而提高语音通话的质量,提高用户体验。
在本申请的一个实施例中,蓝牙芯片110可以至少包括支持下一代蓝牙技术的LE-audio蓝牙芯片,支持下一代蓝牙技术的LE-audio蓝牙芯片用于接收至少两路音频数据,并根据所接收的所有路音频数据执行音频降噪处理。
在本申请的另一个实施例中,蓝牙芯片110可以至少包括主芯片和从芯片(未示出,稍后结合图2来描述),主芯片用于接收一路音频数据,从芯片用于接收另外的一路音频数据,其中:从芯片还用于将自身接收的一路音频数据传送至主芯片;主芯片还用于在接收到从芯片传送的音频数据后,根据接收到的所有音频数据进行音频降噪处理。在该实施例中,音频处理设备100包括至少两个蓝牙芯片110,每个蓝牙芯片110可以接收一路音频数据,从芯片将接收的一路音频数据传送至主芯片,由主芯片进行降噪处理。由于不同路音频数据是针对同一通话场景拾音得到的,主芯片可以将不同路音频数据彼此之间互为参考,相对于仅基于一路音频数据进行音频降噪处理,能够提高降噪可靠性,从而提高语音信号的质量;相应地,该语音信号被传送至终端设备,再由终端设备传送至通话另一方,能够提高通话质量,从而提高通话场景的用户体验。此外,由于每个蓝牙芯片接收一路音频数据,因此相对于一个蓝牙芯片接收至少两路音频数据,可以提高数据传输率和满足数据处理的多样化需求。稍后结合图2来描述该实施例。
在本申请的再一个实施例中,蓝牙芯片110可以至少包括主芯片和从芯片(未示出,稍后结合图3来描述),主芯片用于接收一路音频数据,从芯片用于接收另外的一路音频数据。其中,从芯片还用于根据其自身接收的一路音频数据进行音频降噪处理,以及将降噪后得到的第一降噪后语音信号传送至主芯片;主芯片还用于根据其自身接收的一路音频数据进行音频降噪处理,以得到降噪后的第二降噪后语音信号,以及在接收到从芯片传送的第一降噪后语音信号后,与第二降噪后语音信号进行语音融合。
在该实施例中,音频处理设备100包括至少两个蓝牙芯片110,每个蓝牙芯片110可以接收一路音频数据,从芯片和主芯片各自对其接收的一路音频数据进行音频降噪处理后,各自得到降噪后语音信号,从芯片将其处理后得到的降噪后语音信号传送至主芯片,主芯片将来自从芯片的降噪后语音信号与自身处理得到的降噪后语音信号进行语音融合,得到最终的被拾音通话场景的降噪后语音信号传送至终端设备。由于不同路音频数据是针对同一通话场景拾音得到的,主从芯片各自将其降噪处理后,得到的不同降噪后语音信号进行语音融合后,相对于仅基于一路音频数据进行音频降噪处理,能够提高降噪可靠性,从而提高语音信号的质量;相应地,该语音信号被传送至终端设备,再由终端设备传送至通话另一方,能够提高通话质量,从而提高通话场景的用户体验。此外,由于每个蓝牙芯片接收一路音频数据,因此相对于一个蓝牙芯片接收至少两路音频数据,可以提高数据传输率和满足数据处理的多样化需求。进一步地,由于每个蓝牙芯片仅对一路音频数据进行降噪处理,因此可提高单个蓝牙芯片的数据处理效率。稍后结合图3来描述该实施例。
现在结合图2描述根据本申请一个更具体实施例的音频处理设备200的示意性结构框图以及其与蓝牙拾音设备上的麦克风和终端设备的数据交互示意图。如图2所示,音频处理设备200包括至少两个蓝牙芯片,每个蓝牙芯片用于接收一路音频数据,使得音频处理设备200接收至少两路音频数据,其中,至少两路音频数据是至少两个麦克风分别对同一通话场景拾音得到的。其中,至少两个蓝牙芯片中包括从芯片210和主芯片220(为了简洁,图2中仅示出一个从芯片,实际中可以包括多个从芯片),其中:主芯片220用于接收一路音频数据,从芯片210用于接收另外的一路音频数据,从芯片210还用于将自身接收的一路音频数据传送至主芯片220;主芯片220还用于在接收到从芯片210传送的音频数据后,基于所接收的所有路音频数据进行音频降噪处理,得到通话场景的降噪后语音信号,并将降噪后语音信号传送至终端设备。
在本申请的实施例中,音频处理200包括至少两个蓝牙芯片,每个蓝牙芯片从蓝牙拾音设备接收一路音频数据;从芯片210将其接收到的一路音频数据传送至主芯片220;作为主芯片220接收到来自从芯片210的音频数据后,基于来自从芯片210的音频数据和自身接收到的音频数据进行音频降噪处理,得到通话场景的降噪后语音信号;由于主芯片220基于针对同一通话场景拾音得到的至少两路音频数据进行音频降噪处理,不同路音频数据彼此之间互为参考,相对于仅基于一路音频数据进行音频降噪处理,能够提高降噪可靠性,从而提高语音信号的质量;相应地,该语音信号被传送至终端设备,再由终端设备传送至通话另一方,能够提高通话质量,从而提高通话场景的用户体验。此外,终端设备也可以用于将获取到的语音信号进行实时转录、实时对话、实时翻译等操作,还可以上传云端等。此外,由于包括至少两个蓝牙芯片,主芯片220和从芯片110各自接收一路音频数据,因此相对于一个蓝牙芯片接收至少两路音频数据,可以提高数据传输率。
在本申请的实施例中,主芯片220可以进一步用于:针对所接收的所有路音频数据分别计算其语音能量值(诸如通过傅里叶变换、A计权等方式);对所有路音频数据各自的语音能量值进行比较,得到比较结果;基于比较结果将所有路音频数据中的多路音频数据合成为一路音频数据后进行音频降噪处理,或者选择语音能量值最大的一路音频数据进行音频降噪处理,得到通话场景的降噪后语音信号。
例如,当所有路音频数据的语音能量值在各个频率点上的差别不大时,表明各路音频数据的拾音效果相当,此时可以将所有路音频数据合成为一路音频数据后进行音频降噪处理;再如,当不同路音频数据的语音能量在一些频率点上差别较大时,表明不同路音频数据的拾音效果差别较大,此时可以将选择语音能量值最大的一路音频数据进行所述音频降噪处理;这样有利于得到质量更好的语音信号。
进一步地,主芯片220还可以用于:对于一路音频数据,当一路音频数据的语音能量值小于第一阈值(该阈值可以根据需要来设置),或者另一路音频数据的语音能量值与一路音频数据的语音能量值之差大于第二阈值(该阈值可以根据需要来设置)时,向采集该一路音频数据的麦克风所在的蓝牙拾音设备发送控制信号,以控制采集该一路音频数据的麦克风关闭。
例如,通过比较,确定一个麦克风(例如麦克风A)针对当前通话场景的拾音语音能量值显著大于另一个麦克风(例如麦克风B)针对当前通话场景的拾音语音能量值,这表明在当前通话场景中,说话者距离其中麦克风A更近,距离麦克风B较远,或者麦克风A所处位置附近没有其他噪声源,而麦克风B所处位置附近有其他噪声源;基于此,主芯片220可控制蓝牙拾音设备的拾音,例如,控制在当前通话场景的后续通话中,仅采用麦克风A进行拾音,而控制麦克风B关闭,这样可以在节约蓝牙拾音设备电量的同时获得高质量拾音结果。
在本申请的一个实施例中,音频处理设备200可以实现为具有上述结构的蓝牙适配器(dongle)或者蓝牙耳机的充电仓。前述的至少两个麦克风例如可以包括至少三个麦克风,且其中两个麦克风是设置在同一个蓝牙拾音设备上的不同位置处的麦克风。或者,前述的至少两个麦克风可以包括两个分别设置在不同的两个蓝牙拾音设备上的麦克风,该两个蓝牙拾音设备例如包括蓝牙耳机的左耳耳机和右耳耳机,且左耳耳机上设置有至少一个麦克风,右耳耳机上设置有另外的至少一个麦克风;或者包括两个独立的蓝牙音响设备,且每个蓝牙音响设备各设置有一个麦克风。
下面以蓝牙拾音设备为无线蓝牙耳机,音频处理设备200为蓝牙dongle为例来描述能够提高通话语音质量的它们之间的交互(蓝牙拾音设备为无线蓝牙音响时,交互过程也是相似的,下文中不再赘述)。
例如,在一个通话场景中,通话者甲通过无线蓝牙耳机与通话者乙打电话,在通话过程中,通话者甲的左侧有其他同事在说话,而右侧比较安静。在该通话场景中,通话者甲的无线蓝牙耳机的左、右耳机均进行拾音得到双路音频数据,分别为左路音频数据和右路音频数据;蓝牙拾音设备和蓝牙dongle在蓝牙连接后,左路音频数据和右路音频数据可分别被传送至蓝牙dongle的两个蓝牙芯片中,例如从芯片210接收左路音频数据,主芯片220接收右路音频数据;接着,从芯片210将左路音频数据传送至主芯片220;主芯片220通过比较左路音频数据和右路音频数据,确定左路音频数据中存在较多噪声(来自通话者甲左侧同事的说话声),而右路音频数据的语音较为纯净,故选择右路音频数据进行音频降噪处理,得到该通话场景的降噪后语音信号,降噪后语音信号通过有线或无线方式被传送至终端设备(在该场景中为手机),这样,通话者乙将听到具有较高质量的语音,从而具有较好用户体验。相对于现有方案中无线蓝牙耳机仅采用一个麦克风的拾音,例如刚好采用了左耳机拾音得到了噪声很多的音频数据,本申请方案能够更大程度地降低通话场景下的干扰噪声,有效提高语音通话质量。在该场景中,利用蓝牙耳机的两只耳机各自的至少一个麦克风融合成拾音阵列,多路拾音后择优进行降噪处理,提高通话质量;此外,利用dongle实现了多路语音采集,而且,通过dongle也可以实现对两个耳机各自的单独控制和数据处理,如前文所述的。
在上述通话场景示例中,将音频处理设备200从蓝牙dongle更换为充电仓,过程也是一样的,此处不再赘述。下面描述另一个通话场景示例中无线蓝牙耳机与充电仓之间的数据交互。
在另一个通话场景示例中,无线蓝牙耳机没有佩戴在用户耳朵上,而是放在充电仓里进行收纳和充电,此时无线蓝牙耳机和充电仓可以组成一个会议拾音***。也就是说,在该示例中,无线蓝牙耳机不再作为听音设备,而仅作为拾音设备,充电仓上可设置扬声器来播放声音。在该示例中,无线蓝牙耳机的左、右耳机对参会者进行拾音,得到双路音频数据,分别为左路音频数据和右路音频数据;在耳机和充电仓的引脚连接或者蓝牙连接时,左路音频数据和右路音频数据可分别被传送至充电仓的两个蓝牙芯片中,例如从芯片210接收左路音频数据,主芯片220接收右路音频数据;接着,从芯片210将左路音频数据传送至主芯片220;主芯片220通过比较左路音频数据和右路音频数据,确定左路音频数据的语音能量值较小,而右路音频数据的语音能量值较大(例如可能左耳机距离参会的说话者更远一些,而右耳机距离参会的说话者更近一些),此时可以选择右路音频数据进行音频降噪处理,得到该通话场景的降噪后语音信号,之后,降噪后语音信号通过有线或无线方式传送至终端设备(在该场景中可能为电脑),这样,远程参会者将听到具有较高质量的语音,从而具有较好用户体验。在上述示例中,充电仓也可以将降噪得到的语音信号进行数字化处理,转换成录音文件存储在本地,形成本地录音***。录音文件可以实时或非实时(通过蓝牙HID/BLE/SPP/A2DP/HFP或USB等方式)传送至终端设备,终端设备可以进行转录、对话或者翻译等功能或者上传到云端等等。
以上示例性地描述了根据本申请一个更具体实施例的音频处理设备以及其与蓝牙拾音设备和终端设备的数据交互。基于上面的描述,根据本申请实施例的音频处理设备200能够获取来自至少一个蓝牙拾音设备上的至少两个麦克风针对同一通话场景的至少两路音频数据,基于该至少两路音频数据进行音频降噪处理,得到通话场景的降噪后语音信号并传送至终端设备,能够提高降噪可靠性,从而提高语音通话的质量,提高用户体验。此外,由于每个蓝牙芯片接收一路音频数据,因此相对于一个蓝牙芯片接收至少两路音频数据,可以提高数据传输率。
现在结合图3描述根据本申请另一个更具体实施例的音频处理设备300的示意性结构框图以及其与蓝牙拾音设备上的麦克风和终端设备的数据交互示意图。如图3所示,音频处理设备300包括至少两个蓝牙芯片,每个蓝牙芯片用于接收一路音频数据,使得音频处理设备300接收至少两路音频数据,其中,至少两路音频数据是至少两个麦克风分别对同一通话场景拾音得到的。其中,至少两个蓝牙芯片中包括从芯片310和主芯片320(为了简洁,图3中仅示出一个从芯片,实际中可以包括多个从芯片),其中:主芯片320用于接收一路音频数据,从芯片310用于接收另外的一路音频数据,从芯片310还用于根据其自身接收的一路音频数据进行音频降噪处理,以及将降噪后得到的第一降噪后语音信号传送至主芯片320;主芯片320还用于根据其自身接收的一路音频数据进行音频降噪处理,以得到降噪后的第二降噪后语音信号,以及在接收到从芯片310传送的第一降噪后语音信号后,与第二降噪后语音信号进行语音融合。
在本申请的实施例中,音频处理300包括至少两个蓝牙芯片,每个蓝牙芯片从蓝牙拾音设备接收一路音频数据;从芯片310和主芯片320各自对其接收的一路音频数据进行音频降噪处理后,各自得到降噪后语音信号,从芯片310将其处理后得到的降噪后语音信号传送至主芯片320,主芯片320将来自从芯片310的降噪后语音信号与自身处理得到的降噪后语音信号进行语音融合,得到最终的被拾音通话场景的降噪后语音信号传送至终端设备。由于不同路音频数据是针对同一通话场景拾音得到的,从芯片310和主芯片320各自将其降噪处理后,得到的不同降噪后语音信号由主芯片320进行语音融合后,相对于仅基于一路音频数据进行音频降噪处理,能够提高降噪可靠性,从而提高语音信号的质量;相应地,该语音信号被传送至终端设备,再由终端设备传送至通话另一方,能够提高通话质量,从而提高通话场景的用户体验。此外,由于每个蓝牙芯片接收一路音频数据,因此相对于一个蓝牙芯片接收至少两路音频数据,可以提高数据传输率和满足数据处理的多样化需求。进一步地,由于每个蓝牙芯片仅对一路音频数据进行降噪处理,因此可提高单个蓝牙芯片的数据处理效率。
在本申请的一个实施例中,音频处理设备300可以实现为具有上述结构的蓝牙适配器(dongle)或者蓝牙耳机的充电仓。前述的至少两个麦克风例如可以包括至少三个麦克风,且其中两个麦克风是设置在同一个蓝牙拾音设备上的不同位置处的麦克风,以形成麦克风阵列。或者,前述的至少两个麦克风可以包括两个分别设置在不同的两个蓝牙拾音设备上的麦克风,该两个蓝牙拾音设备例如包括蓝牙耳机的左耳耳机和右耳耳机,或者包括两个蓝牙音响设备。
根据本申请另一方面,还提供了一种音频处理***,其可以包括至少两个前文所述的音频处理设备100、音频处理设备200或音频处理设备300,下面结合图4来描述。
图4示出了根据本申请实施例的音频处理***400的示意性结构框图。如图4所示,音频处理***400包括至少两个上述音频处理设备(为了简洁,仅在图4中示出两个音频处理设备410和420),至少两个音频处理设备中的每一个处理至少两路的音频数据,以配合实现对同一通话场景拾音得到的多路音频数据的降噪处理。其中,音频处理设备410和420可以为前文所述的根据本申请实施例的音频处理设备100、音频处理设备200或音频处理设备300。前文已经将音频处理设备100、音频处理设备200或音频处理设备300的结构和操作进行了详细描述,本领域技术人员可以结合前文所述理解音频处理设备410和420的结构和操作,并应用在例如更为复杂的多人通话场景下。此处为了简洁,不再赘述。
总体地,根据本申请实施例的音频处理***400包括至少两个上述音频处理设备,由于每个音频处理设备均能如前文所述的提高降噪可靠性,从而提高语音信号的质量,因而音频处理***400中多音频处理设备相互配合,能够实现对更为复杂情景下的同一通话场景拾音得到的多路音频数据的降噪处理,并显著提高语音信号的质量。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本申请的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本申请的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本申请的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其他的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本申请的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其他实施例中所包括的某些特征而不是其他特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的一些模块的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本申请的具体实施方式或对具体实施方式的说明,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种音频处理设备,其特征在于,所述音频处理设备包括蓝牙芯片,所述蓝牙芯片用于接收至少两路音频数据,其中,所述至少两路音频数据是至少两个麦克风分别对同一通话场景拾音得到的;
所述蓝牙芯片还用于基于所接收的所有路所述音频数据进行音频降噪处理,得到所述通话场景的降噪后语音信号,并将所述降噪后语音信号传送至终端设备。
2.根据权利要求1所述的音频处理设备,其特征在于,所述蓝牙芯片至少包括主芯片和从芯片,所述主芯片用于接收一路所述音频数据,所述从芯片用于接收另外的一路所述音频数据,其中:
所述从芯片还用于将自身接收的一路所述音频数据传送至所述主芯片;所述主芯片还用于在接收到所述从芯片传送的所述音频数据后,根据接收到的所有所述音频数据进行所述音频降噪处理;或者,
所述从芯片还用于根据其自身接收的一路所述音频数据进行所述音频降噪处理,以及将降噪后得到的第一降噪后语音信号传送至所述主芯片;所述主芯片还用于根据其自身接收的一路所述音频数据进行所述音频降噪处理,以得到降噪后的第二降噪后语音信号,以及在接收到所述从芯片传送的所述第一降噪后语音信号后,与所述第二降噪后语音信号进行语音融合。
3.根据权利要求1所述的音频处理设备,其特征在于,所述蓝牙芯片至少包括支持下一代蓝牙技术的LE-audio蓝牙芯片,所述支持下一代蓝牙技术的LE-audio蓝牙芯片用于接收所述至少两路音频数据,并根据所接收的所有路所述音频数据执行所述音频降噪处理。
4.根据权利要求1-3中的任一项所述的音频处理设备,其特征在于,所述蓝牙芯片执行的所述音频降噪处理的步骤具体包括:
针对所接收的所有路所述音频数据,分别计算其语音能量值;
对所有路所述音频数据各自的语音能量值进行比较,得到比较结果;
基于所述比较结果将所有路所述音频数据中的多路所述音频数据,合成为一路音频数据后进行所述音频降噪处理,或者选择语音能量值最大的一路音频数据进行所述音频降噪处理,得到所述通话场景的降噪后语音信号。
5.根据权利要求4所述的音频处理设备,其特征在于,所述蓝牙芯片进一步还用于:
对于所述一路音频数据,当所述一路音频数据的语音能量值小于第一阈值,或者另一路音频数据的语音能量值与所述一路音频数据的语音能量值之差大于第二阈值时,向采集所述一路音频数据的麦克风所在的蓝牙拾音设备发送控制信号,以控制采集所述一路音频数据的麦克风关闭。
6.根据权利要求1-3中的任一项所述的音频处理设备,其特征在于,所述至少两个麦克风包括至少三个麦克风,且其中两个麦克风是设置在同一个蓝牙拾音设备上的不同位置处的麦克风。
7.根据权利要求1-3中的任一项所述的音频处理设备,其特征在于,所述至少两个麦克风包括两个分别设置在不同的两个蓝牙拾音设备上的麦克风。
8.根据权利要求7所述的音频处理设备,其特征在于,所述两个蓝牙拾音设备包括蓝牙耳机的左耳耳机和右耳耳机,或者包括两个蓝牙音响设备。
9.根据权利要求1-3中的任一项所述的音频处理设备,其特征在于,所述音频处理设备包括蓝牙适配器或者蓝牙耳机的充电仓。
10.一种音频处理***,其特征在于,所述音频处理***包括至少两个如权利要求1-9中的任一项所述的音频处理设备,至少两个所述音频处理设备中的每一个处理至少两路的音频数据,以配合实现对同一通话场景拾音得到的多路音频数据的降噪处理。
CN202211104274.6A 2022-09-09 2022-09-09 音频处理设备和音频处理*** Pending CN115499761A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211104274.6A CN115499761A (zh) 2022-09-09 2022-09-09 音频处理设备和音频处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211104274.6A CN115499761A (zh) 2022-09-09 2022-09-09 音频处理设备和音频处理***

Publications (1)

Publication Number Publication Date
CN115499761A true CN115499761A (zh) 2022-12-20

Family

ID=84469193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211104274.6A Pending CN115499761A (zh) 2022-09-09 2022-09-09 音频处理设备和音频处理***

Country Status (1)

Country Link
CN (1) CN115499761A (zh)

Similar Documents

Publication Publication Date Title
US9756422B2 (en) Noise estimation in a mobile device using an external acoustic microphone signal
CN104521247B (zh) 蓝牙耳机助听及抗噪方法和装置
CN103874000B (zh) 一种听力仪器
US9866947B2 (en) Dual-microphone headset and noise reduction processing method for audio signal in call
CN112735462B (zh) 分布式麦克风阵列的降噪方法和语音交互方法
CN111464905A (zh) 基于智能穿戴设备的听力增强方法、***和穿戴设备
CN108549206A (zh) 一种带具有语音交互功能耳机的智能手表
CN101163354A (zh) 用于运行助听器的方法以及助听器
CN106716526A (zh) 用于增强声源的方法和装置
CN106604167B (zh) 一种自动调整耳机左右声道输出音量的方法及移动终端
CN111683319A (zh) 一种通话拾音降噪方法及耳机、存储介质
CN111491228A (zh) 降噪耳机及其控制方法
CN111402915A (zh) 信号处理方法、装置及***
CN112954530B (zh) 一种耳机降噪方法、装置、***及无线耳机
WO2021170061A1 (zh) 无线扩音***及终端
CN113207056B (zh) 一种无线耳机及其透传方法、装置及***
CN110265056A (zh) 音源的控制方法以及扬声设备、装置
CN113411726A (zh) 一种音频处理方法、装置及***
CN105847566A (zh) 移动终端音频的音量调节方法及装置
CN108235165B (zh) 一种麦克风颈环耳机
CN111081238B (zh) 一种蓝牙音箱语音交互控制方法、装置及***
CN113038318B (zh) 一种语音信号处理方法及装置
CN210297835U (zh) 一种实现高品质级联的会议电话机及会议***
CN112394771A (zh) 通信方法、装置、穿戴设备及可读存储介质
CN208597147U (zh) 一种蓝牙耳机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination