CN112349291A - 基于ai降噪模型的扩声***及方法 - Google Patents

基于ai降噪模型的扩声***及方法 Download PDF

Info

Publication number
CN112349291A
CN112349291A CN202011048301.3A CN202011048301A CN112349291A CN 112349291 A CN112349291 A CN 112349291A CN 202011048301 A CN202011048301 A CN 202011048301A CN 112349291 A CN112349291 A CN 112349291A
Authority
CN
China
Prior art keywords
voice
audio
model
analog
noise reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011048301.3A
Other languages
English (en)
Inventor
吴道远
迟景立
阳涌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Qianli Network Technology Co ltd
Original Assignee
Chengdu Qianli Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Qianli Network Technology Co ltd filed Critical Chengdu Qianli Network Technology Co ltd
Priority to CN202011048301.3A priority Critical patent/CN112349291A/zh
Publication of CN112349291A publication Critical patent/CN112349291A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明涉及语音数据处理技术领域,本发明旨在解决现有的室内扩声方式噪声较大的问题,提出一种基于AI降噪模型的扩声***及方法,技术方案概括为:采集音频模拟信号,将音频模拟信号转换为音频数字信号;通过AI降噪模型对音频数字信号降噪后得到语音数字信号;将语音数字信号转换为语音模拟信号;对语音模拟信号进行模拟放大;播放放大后的语音模拟信号。本发明能达到较好的噪声抑制效果,对非平稳噪声起到较好的抑制作用,适用于教室和会议室等场景。

Description

基于AI降噪模型的扩声***及方法
技术领域
本发明涉及语音数据处理技术领域,具体来说涉及一种基于AI降噪模型的扩声***及方法。
背景技术
在教室或会议室场景,通常需要对语音信号进行扩声。室内扩声一般有两种方式,一种是采用手持麦克风采集声音,然后放大声音,手持麦克风的优点是灵敏度低,指向性强,采集到的噪声较少,因此需要人非常靠近麦克风才会采集到人的声音,但手持麦克风的缺点是携带不方便。
另一种是采用吊装麦克风,吊装麦克风的灵敏度较高,采集的覆盖范围较广,能将一个区域内的所有声音都采集到麦克风,因此采集到的声音就包括人声和声场内的其它声音,而这些其它声音就是噪声,如果不经过处理,声音直接通过功放和音箱输出,就会导致噪声也放大。
发明内容
本发明旨在解决现有的室内扩声方式噪声较大的问题,提出一种基于AI降噪模型的扩声***及方法。
本发明解决上述技术问题所采用的技术方案是:基于AI降噪模型的扩声***,包括:音频采集模块、第一模数转换模块、第二模数转换模块、AI降噪模型、功放模块和音箱设备;
所述音频采集模块,用于采集音频模拟信号,并将所述音频模拟信号发送至第一模数转换模块;
所述第一模数转换模块,用于接收音频模拟信号,将所述音频模拟信号转换为音频数字信号,并将所述音频数字信号输入至AI降噪模型;
所述AI降噪模型,用于接收音频数字信号,对所述音频数字信号降噪后输出语音数字信号,并将所述语音数字信号输入至第二模数转换模型;
所述第二模数转换模块,用于接收语音数字信号,将所述语音数字信号转换为语音模拟信号,并将所述语音模拟信号输入至功放模块;
所述功放模块,用于接收语音模拟信号,对所述语音模拟信号进行模拟放大,并将模拟放大后的语音模拟信号输入至音箱设备;
所述音箱设备,用于接收并播放放大后的语音模拟信号。
进一步的,所述AI降噪模型通过以下方法得到:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
进一步的,所述神经网络模型为RNN模型、DNN模型或CNN模型。
进一步的,所述音频采集模块为吊装麦克风。
本发明还提出一种基于AI降噪模型的扩声方法,包括以下步骤:
步骤1、采集音频模拟信号;
步骤2、将所述音频模拟信号转换为音频数字信号;
步骤3、通过AI降噪模型对所述音频数字信号降噪后得到语音数字信号;
步骤4、将所述语音数字信号转换为语音模拟信号;
步骤5、对所述语音模拟信号进行模拟放大;
步骤6、播放放大后的语音模拟信号。
进一步的,所述AI降噪模型通过以下方法得到:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
进一步的,步骤3中,所述神经网络模型为RNN模型、DNN模型或CNN模型。
进一步的,步骤1中,所述音频模拟信号为通过吊装麦克风采集的音频模拟信号。
本发明的有益效果是:本发明所述的基于AI降噪模型的扩声***及方法,通过AI智能识别的方法进行噪声处理,通过训练噪声样本,得到训练模型,将训练模型应用到吊麦扩声***中,能达到较好的噪声抑制效果,对非平稳噪声起到较好的抑制作用。
附图说明
图1为本发明实施例所述的基于AI降噪模型的扩声***的结构示意图;
图2为本发明实施例所述的基于AI降噪模型的扩声方法的流程示意图。
具体实施方式
下面将结合附图对本发明的实施方式进行详细描述。
本发明所述的基于AI降噪模型的扩声***,包括:音频采集模块、第一模数转换模块、第二模数转换模块、AI降噪模型、功放模块和音箱设备;所述音频采集模块,用于采集音频模拟信号,并将所述音频模拟信号发送至第一模数转换模块;所述第一模数转换模块,用于接收音频模拟信号,将所述音频模拟信号转换为音频数字信号,并将所述音频数字信号输入至AI降噪模型;所述AI降噪模型,用于接收音频数字信号,对所述音频数字信号降噪后输出语音数字信号,并将所述语音数字信号输入至第二模数转换模型;所述第二模数转换模块,用于接收语音数字信号,将所述语音数字信号转换为语音模拟信号,并将所述语音模拟信号输入至功放模块;所述功放模块,用于接收语音模拟信号,对所述语音模拟信号进行模拟放大,并将模拟放大后的语音模拟信号输入至音箱设备;所述音箱设备,用于接收并播放放大后的语音模拟信号。
在应用之前,需要训练一个AI降噪模型并将其应用到扩声***中,在具体使用时,首先采集用户输入的音频模拟信号,对采集的音频模拟信号的处理流程为:将音频模拟信号转换为音频数字信号;通过AI降噪模型对音频数字信号降噪后得到语音数字信号;将语音数字信号转换为语音模拟信号;对语音模拟信号进行模拟放大;播放放大后的语音模拟信号。在AI降噪模型中,将数字音频帧进行AI识别,如果识别为噪声,则对音频数据帧进行降噪处理,进而得到纯净的语音数字信号,进而实现对噪声的抑制。
实施例
本发明实施例所述的基于AI降噪模型的扩声***,如图1所示,包括:音频采集模块、第一模数转换模块、第二模数转换模块、AI降噪模型、功放模块和音箱设备;
所述音频采集模块,用于采集音频模拟信号,并将所述音频模拟信号发送至第一模数转换模块;
其中,音频采集模块可以是麦克风,对于距离用户较远的吊装麦克风来说,本实施例能够取得更好的噪声抑制效果。
所述第一模数转换模块,用于接收音频模拟信号,将所述音频模拟信号转换为音频数字信号,并将所述音频数字信号输入至AI降噪模型;
所述AI降噪模型,用于接收音频数字信号,对所述音频数字信号降噪后输出语音数字信号,并将所述语音数字信号输入至第二模数转换模型;
具体而言,AI降噪模型可以采用RNN、DNN或CNN等神经网络模型得到,神经网络模型的识别精确度主要依赖于通过样本训练得到一个模型数据,本实施例中可以通过如下方式获取到用于噪声识别的AI降噪模型:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
音频数字信号输入至AI降噪模型后,AI降噪模型对该音频数字信号每一帧进行噪声识别,如果判定该帧语音信号为噪声信号,则进行降噪处理,降噪处理如减小音量。最后输出较为纯净的语音数字信号。
所述第二模数转换模块,用于接收语音数字信号,将所述语音数字信号转换为语音模拟信号,并将所述语音模拟信号输入至功放模块;
所述功放模块,用于接收语音模拟信号,对所述语音模拟信号进行模拟放大,并将模拟放大后的语音模拟信号输入至音箱设备;
所述音箱设备,用于接收并播放放大后的语音模拟信号。
基于上述技术方案,本实施例还提出一种基于AI降噪模型的扩声方法,如图2所示,包括以下步骤:
步骤S1、采集音频模拟信号;
步骤S2、将所述音频模拟信号转换为音频数字信号;
步骤S3、通过AI降噪模型对所述音频数字信号降噪后得到语音数字信号;
步骤S4、将所述语音数字信号转换为语音模拟信号;
步骤S5、对所述语音模拟信号进行模拟放大;
步骤S6、播放放大后的语音模拟信号。
可以理解,由于本发明实施例所述的基于AI降噪模型的扩声方法是基于实施例所述基于AI降噪模型的扩声***实现的方法,对于实施例公开的方法而言,由于其与实施例公开的***相对应,所以描述的较为简单,相关之处参见***的部分说明即可。

Claims (8)

1.基于AI降噪模型的扩声***,其特征在于,包括:音频采集模块、第一模数转换模块、第二模数转换模块、AI降噪模型、功放模块和音箱设备;
所述音频采集模块,用于采集音频模拟信号,并将所述音频模拟信号发送至第一模数转换模块;
所述第一模数转换模块,用于接收音频模拟信号,将所述音频模拟信号转换为音频数字信号,并将所述音频数字信号输入至AI降噪模型;
所述AI降噪模型,用于接收音频数字信号,对所述音频数字信号降噪后输出语音数字信号,并将所述语音数字信号输入至第二模数转换模型;
所述第二模数转换模块,用于接收语音数字信号,将所述语音数字信号转换为语音模拟信号,并将所述语音模拟信号输入至功放模块;
所述功放模块,用于接收语音模拟信号,对所述语音模拟信号进行模拟放大,并将模拟放大后的语音模拟信号输入至音箱设备;
所述音箱设备,用于接收并播放放大后的语音模拟信号。
2.如权利要求1所述的基于AI降噪模型的扩声***,其特征在于,所述AI降噪模型通过以下方法得到:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
3.如权利要求2所述的基于AI降噪模型的扩声***,其特征在于,所述神经网络模型为RNN模型、DNN模型或CNN模型。
4.如权利要求1所述的基于AI降噪模型的扩声***,其特征在于,所述音频采集模块为吊装麦克风。
5.基于AI降噪模型的扩声方法,其特征在于,包括以下步骤:
步骤1、采集音频模拟信号;
步骤2、将所述音频模拟信号转换为音频数字信号;
步骤3、通过AI降噪模型对所述音频数字信号降噪后得到语音数字信号;
步骤4、将所述语音数字信号转换为语音模拟信号;
步骤5、对所述语音模拟信号进行模拟放大;
步骤6、播放放大后的语音模拟信号。
6.如权利要求5所述的基于AI降噪模型的扩声方法,其特征在于,所述AI降噪模型通过以下方法得到:
获取噪声样本数据和纯净语音样本数据;
创建神经网络模型,将所述噪声样本数据和纯净语音样本数据输入至神经网络模型中训练,得到AI降噪模型。
7.如权利要求6所述的基于AI降噪模型的扩声方法,其特征在于,步骤3中,所述神经网络模型为RNN模型、DNN模型或CNN模型。
8.如权利要求5所述的基于AI降噪模型的扩声方法,其特征在于,步骤1中,所述音频模拟信号为通过吊装麦克风采集的音频模拟信号。
CN202011048301.3A 2020-09-29 2020-09-29 基于ai降噪模型的扩声***及方法 Pending CN112349291A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011048301.3A CN112349291A (zh) 2020-09-29 2020-09-29 基于ai降噪模型的扩声***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011048301.3A CN112349291A (zh) 2020-09-29 2020-09-29 基于ai降噪模型的扩声***及方法

Publications (1)

Publication Number Publication Date
CN112349291A true CN112349291A (zh) 2021-02-09

Family

ID=74361309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011048301.3A Pending CN112349291A (zh) 2020-09-29 2020-09-29 基于ai降噪模型的扩声***及方法

Country Status (1)

Country Link
CN (1) CN112349291A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113490115A (zh) * 2021-08-13 2021-10-08 广州市迪声音响有限公司 一种基于声纹识别技术的声反馈抑制方法及***
CN117241202A (zh) * 2023-11-07 2023-12-15 深圳市维尔晶科技有限公司 一种降噪型户外便携式扩音器及使用方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060233390A1 (en) * 2002-03-29 2006-10-19 Everest Biomedical Instruments Company Fast Wavelet Estimation of Weak Bio-signals Using Novel Algorithms for Generating Multiple Additional Data Frames
CN201294092Y (zh) * 2008-11-18 2009-08-19 苏州大学 一种耳语音噪声消除器
CN103761973A (zh) * 2013-12-31 2014-04-30 南宁市公安局 一种音频信号处理方法
CN107801141A (zh) * 2017-10-10 2018-03-13 江苏中协智能科技有限公司 一种厅堂扩声***
CN108022597A (zh) * 2017-12-15 2018-05-11 北京远特科技股份有限公司 一种声音处理***、方法及车辆
CN108766454A (zh) * 2018-06-28 2018-11-06 浙江飞歌电子科技有限公司 一种语音噪声抑制方法及装置
CN109785852A (zh) * 2018-12-14 2019-05-21 厦门快商通信息技术有限公司 一种增强说话人语音的方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060233390A1 (en) * 2002-03-29 2006-10-19 Everest Biomedical Instruments Company Fast Wavelet Estimation of Weak Bio-signals Using Novel Algorithms for Generating Multiple Additional Data Frames
CN201294092Y (zh) * 2008-11-18 2009-08-19 苏州大学 一种耳语音噪声消除器
CN103761973A (zh) * 2013-12-31 2014-04-30 南宁市公安局 一种音频信号处理方法
CN107801141A (zh) * 2017-10-10 2018-03-13 江苏中协智能科技有限公司 一种厅堂扩声***
CN108022597A (zh) * 2017-12-15 2018-05-11 北京远特科技股份有限公司 一种声音处理***、方法及车辆
CN108766454A (zh) * 2018-06-28 2018-11-06 浙江飞歌电子科技有限公司 一种语音噪声抑制方法及装置
CN109785852A (zh) * 2018-12-14 2019-05-21 厦门快商通信息技术有限公司 一种增强说话人语音的方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡学钢等: "《单片机原理及应用》", 30 June 2019, 安徽大学出版社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113490115A (zh) * 2021-08-13 2021-10-08 广州市迪声音响有限公司 一种基于声纹识别技术的声反馈抑制方法及***
CN117241202A (zh) * 2023-11-07 2023-12-15 深圳市维尔晶科技有限公司 一种降噪型户外便携式扩音器及使用方法
CN117241202B (zh) * 2023-11-07 2024-03-01 深圳市维尔晶科技有限公司 一种降噪型户外便携式扩音器及使用方法

Similar Documents

Publication Publication Date Title
CN106782591B (zh) 一种在背景噪音下提高语音识别率的装置及其方法
CN103873977B (zh) 基于多麦克风阵列波束成形的录音***及其实现方法
US8504360B2 (en) Automatic sound recognition based on binary time frequency units
CN205249484U (zh) 一种麦克风线性阵列增强指向性拾音器
CN108235181B (zh) 在音频处理装置中降噪的方法
CN103124165A (zh) 自动增益控制
CN105741849A (zh) 数字助听器中融合相位估计与人耳听觉特性的语音增强方法
CN204482023U (zh) 一种啸叫抑制***
CN106504762B (zh) 鸟类群落数量估计***及其方法
CN102223428A (zh) 一种降低噪声的方法及移动终端
CN112349291A (zh) 基于ai降噪模型的扩声***及方法
CN107124647A (zh) 一种全景视频录制时自动生成字幕文件的方法及装置
CN113490115A (zh) 一种基于声纹识别技术的声反馈抑制方法及***
US20080219457A1 (en) Enhancement of Speech Intelligibility in a Mobile Communication Device by Controlling the Operation of a Vibrator of a Vibrator in Dependance of the Background Noise
CN106340306A (zh) 一种提高语音识别度的方法及装置
EP4371112A1 (en) Speech enhancement
CN113573212B (zh) 扩声***、及麦克风通道数据选择方法
CN100407293C (zh) 一种无线终端语音处理的方法及装置
CN111182416B (zh) 处理方法、装置及电子设备
CN109920433B (zh) 嘈杂环境下电子设备的语音唤醒方法
CN106161780A (zh) 具有扬声器降噪功能的通信装置及其降噪方法
WO2020238703A1 (zh) 获取语音信号的方法及装置
CN103050119A (zh) 一种灯光或电机与声音同步的自适应检测方法
CN110099328A (zh) 一种智能音箱
CN205028650U (zh) 一种音频相位反向干扰声传播的噪音治理设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination