CN108053827A - 一种智能语音交互装置 - Google Patents
一种智能语音交互装置 Download PDFInfo
- Publication number
- CN108053827A CN108053827A CN201711368634.2A CN201711368634A CN108053827A CN 108053827 A CN108053827 A CN 108053827A CN 201711368634 A CN201711368634 A CN 201711368634A CN 108053827 A CN108053827 A CN 108053827A
- Authority
- CN
- China
- Prior art keywords
- sound
- loud speaker
- interactive device
- pick
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 29
- 230000003321 amplification Effects 0.000 claims description 10
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 2
- 230000007423 decrease Effects 0.000 claims 2
- 230000000694 effects Effects 0.000 abstract description 2
- 101100236764 Caenorhabditis elegans mcu-1 gene Proteins 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供了一种智能语音交互装置,其包括扬声器、设置于所述扬声器一侧的第一拾音器和设置于所述扬声器另一侧的第二拾音器,所述第一拾音器与所述扬声器的声音距离和所述第二拾音器与所述扬声器的声音距离相同,所述第一拾音器拾取到的外界声音的衰减幅度大于所述第二拾音器拾取到的外界声音的衰减幅度。本发明的智能语音交互装置成本低且语音识别效果好。
Description
技术领域
本发明涉及语音处理领域,具体涉及一种智能语音交互装置。
背景技术
随着科技的发展,智能交互设备越来越深入的进入了人们的生活,比如可以通过语音控制的智能电视、智能音响等。这些设备可以识别人发出的语音控制指令,从而进行相应的操作。
然而,这些设备本身也会发出声音,为区别设备本身的声音和人发出的控制指令,需要对声音进行采样和识别。
现有技术的方案是通过DSP取样并与双MIC采样的信号比较,DSP通常比较贵,而且还需要编程进行处理,导致产品成本增加。
发明内容
本发明的目的是提供一种智能语音交互装置,其可以降低产品的成本,同时具有较好的语音识别效果。
本发明实施例中,提供了一种智能语音交互装置,其包括扬声器、设置于所述扬声器一侧的第一拾音器和设置于所述扬声器另一侧的第二拾音器,所述第一拾音器与所述扬声器的声音距离和所述第二拾音器与所述扬声器的声音距离相同,所述第一拾音器拾取到的外界声音的衰减幅度大于所述第二拾音器拾取到的外界声音的衰减幅度。
本发明实施例中,所述第一拾音器拾取到的外界声音的衰减幅度比所述第二拾音器拾取到的外界声音的衰减幅度大20DB以上。
本发明实施例中,所述智能语音交互装置还包括差分模块,所述差分模块用于对所述第一拾音器和所述第二拾音器的声音进行差分运算,从而提取出外界语音指令。
本发明实施例中,所述智能语音交互装置还包括语音识别模块,用于识别所述差分模块提取出的语音指令。
本发明实施例中,所述智能语音交互装置还包括设置于所述语音识别模块和所述差分模块之间的放大模块,用于放大所述差分模块提取出的语音指令。
本发明实施例中,所述智能语音交互装置还包括与所述语音识别模块相连接的MCU。
本发明实施例中,所述智能语音交互装置还包括设置于所述扬声器和所述MCU之间的功放模块。
本发明实施例中,所述第一拾音器设置于所述智能语音交互装置外壳中相对于所述第二拾音器靠内的位置。
与现有技术相比较,本发明的通过在扬声器的一侧设置一个拾音器拾取扬声器发出的声音信号,扬声器的一侧设置一个拾音器拾取扬声器发出的声音信号及外部人发出语音信号,通过差分比较放大即可实现抵消扬声器发出的声音信号,从面达到去除喇叭发出的声音的干扰,通过差分放大后取得的人声语音信号送到语音识别芯片,从而保证送入到语音识别芯片的信号不会含有喇叭发出的音乐成份,从面实现语音交互的功能。
附图说明
图1为本发明的智能语音交互装置的结构示意图。
图2为本发明的智能语音交互装置的扬声器部分的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不,用于限定本发明。
以下结合具体实施例对本发明的实现进行详细描述。
如图1所示,本发明实施例中,提供了一种智能语音交互装置,其包括MCU1、功放模块2、扬声器3、第一拾音器4、第二拾音器5、差分模块6、放大模块7和语音识别模块8。所述MCU1为智能语音交互装置的主控芯片。所述功放模块2用于将所述MCU1提供的语音信号放大后发送给所述扬声器3进行播放。所述扬声器3为所述智能语音交互装置的发声装置。所述第一拾音器4和所述第二拾音器5分别设置于所述扬声器的两侧,用于拾取所述扬声器3的声音以及外界的声音。所述差分模块6用于对所述第一拾音器2和所述第二拾音器3拾取的声音进行差分运算,从而提取出外界语音指令。所述语音识别模块7,用于识别所述差分模块6提取出的语音指令,并将提取出的语音指令发送给所述MCU1。所述放大模块7设置于所述语音识别模块8和所述差分模块6之间,用于放大所述差分模块6提取出的语音指令。
如图2所示,所述第一拾音器4与所述扬声器3的声音距离和所述第二拾音器5与所述扬声器3的声音距离相同,所述第一拾音器4设置于所述扬声器3的外壳9中相对于所述第二拾音器5靠内的位置,所述第一拾音器4拾取到的外界声音的衰减幅度大于所述第二拾音器5拾取到的外界声音的衰减幅度。
本实施例中,所述第一拾音器拾取到的外界声音的衰减幅度比所述第二拾音器拾取到的外界声音的衰减幅度大20DB以上。
本发明的智能语音交互装置的原理如下:
所述第一拾音器4主要拾取扬声器发出的声音信号,所述第二拾音器5主要拾取扬声器发出的声音信号及外部人发出语音信号,所述差分模块6将所述第一拾音器4和所述第二拾音器5的声音信号进行差分比较,因为所述第一拾音器4和所述第二拾音器5与所述扬声器3具有相同的声音距离,所以差分过程中刚好抵消扬声器发出的声音信号,保留了外部人发出语音信号,经过所述放大模块7放大后,送入到所述语音识别模块8中进行识别,所述语音识别模块8将识别到的语音指令发送给所述MCU1进行处理。
综上所述,本发明的通过在扬声器的一侧设置一个拾音器拾取扬声器发出的声音信号,扬声器的一侧设置一个拾音器拾取扬声器发出的声音信号及外部人发出语音信号,通过差分比较放大即可实现抵消扬声器发出的声音信号,从面达到去除喇叭发出的声音的干扰,通过差分放大后取得的人声语音信号送到语音识别芯片,从而保证送入到语音识别芯片的信号不会含有喇叭发出的音乐成份,从面实现语音交互的功能。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种智能语音交互装置,其特征在于,包括扬声器、设置于所述扬声器一侧的第一拾音器和设置于所述扬声器另一侧的第二拾音器,所述第一拾音器与所述扬声器的声音距离和所述第二拾音器与所述扬声器的声音距离相同,所述第一拾音器拾取到的外界声音的衰减幅度大于所述第二拾音器拾取到的外界声音的衰减幅度。
2.如权利要求1所述的智能语音交互装置,其特征在于,所述第一拾音器拾取到的外界声音的衰减幅度比所述第二拾音器拾取到的外界声音的衰减幅度大20DB以上。
3.如权利要求1所述的智能语音交互装置,其特征在于,还包括差分模块,所述差分模块用于对所述第一拾音器和所述第二拾音器的声音进行差分运算,从而提取出外界语音指令。
4.如权利要求3所述的智能语音交互装置,其特征在于,还包括语音识别模块,用于识别所述差分模块提取出的语音指令。
5.如权利要求4所述的智能语音交互装置,其特征在于,还包括设置于所述语音识别模块和所述差分模块之间的放大模块,用于放大所述差分模块提取出的语音指令。
6.如权利要求4所述的智能语音交互装置,其特征在于,还包括与所述语音识别模块相连接的MCU。
7.如权利要求6所述的智能语音交互装置,其特征在于,还包括设置于所述扬声器和所述MCU之间的功放模块。
8.如权利要求1所述的智能语音交互装置,其特征在于,所述第一拾音器设置于所述智能语音交互装置外壳中相对于所述第二拾音器靠内的位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711368634.2A CN108053827A (zh) | 2017-12-18 | 2017-12-18 | 一种智能语音交互装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711368634.2A CN108053827A (zh) | 2017-12-18 | 2017-12-18 | 一种智能语音交互装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108053827A true CN108053827A (zh) | 2018-05-18 |
Family
ID=62133622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711368634.2A Pending CN108053827A (zh) | 2017-12-18 | 2017-12-18 | 一种智能语音交互装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108053827A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109487492A (zh) * | 2018-10-12 | 2019-03-19 | 南京创维电器研究院有限公司 | 洗衣机、洗衣机语音控制智能模型设计***及其运行方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1809105A (zh) * | 2006-01-13 | 2006-07-26 | 北京中星微电子有限公司 | 适用于小型移动通信设备的双麦克语音增强方法及*** |
CN105719644A (zh) * | 2014-12-04 | 2016-06-29 | 中兴通讯股份有限公司 | 一种自适应调整语音识别率的方法及装置 |
CN106297815A (zh) * | 2016-07-27 | 2017-01-04 | 武汉诚迈科技有限公司 | 一种语音识别场景中回音消除的方法 |
CN106679326A (zh) * | 2017-01-25 | 2017-05-17 | 北京通远科技有限公司 | 基于语音识别进行控制的智能冰箱 |
CN107426391A (zh) * | 2016-05-24 | 2017-12-01 | 展讯通信(上海)有限公司 | 免提通话终端及其语音信号处理方法、装置 |
CN107481729A (zh) * | 2017-09-13 | 2017-12-15 | 百度在线网络技术(北京)有限公司 | 一种将智能终端升级为远场语音智能设备的方法及*** |
-
2017
- 2017-12-18 CN CN201711368634.2A patent/CN108053827A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1809105A (zh) * | 2006-01-13 | 2006-07-26 | 北京中星微电子有限公司 | 适用于小型移动通信设备的双麦克语音增强方法及*** |
CN105719644A (zh) * | 2014-12-04 | 2016-06-29 | 中兴通讯股份有限公司 | 一种自适应调整语音识别率的方法及装置 |
CN107426391A (zh) * | 2016-05-24 | 2017-12-01 | 展讯通信(上海)有限公司 | 免提通话终端及其语音信号处理方法、装置 |
CN106297815A (zh) * | 2016-07-27 | 2017-01-04 | 武汉诚迈科技有限公司 | 一种语音识别场景中回音消除的方法 |
CN106679326A (zh) * | 2017-01-25 | 2017-05-17 | 北京通远科技有限公司 | 基于语音识别进行控制的智能冰箱 |
CN107481729A (zh) * | 2017-09-13 | 2017-12-15 | 百度在线网络技术(北京)有限公司 | 一种将智能终端升级为远场语音智能设备的方法及*** |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109487492A (zh) * | 2018-10-12 | 2019-03-19 | 南京创维电器研究院有限公司 | 洗衣机、洗衣机语音控制智能模型设计***及其运行方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN204390737U (zh) | 一种家庭语音处理*** | |
CN205249484U (zh) | 一种麦克风线性阵列增强指向性拾音器 | |
CN206349145U (zh) | 音频信号处理设备 | |
WO2018095035A1 (zh) | 耳机及其语音识别方法 | |
CN201243374Y (zh) | 耳机音量调节控制装置 | |
CN112992169A (zh) | 语音信号的采集方法、装置、电子设备以及存储介质 | |
CN102104815A (zh) | 自动调音耳机及耳机调音方法 | |
CN112532266A (zh) | 智能头盔及智能头盔的语音交互控制方法 | |
CN206312566U (zh) | 一种车载智能音频装置 | |
CN107452375A (zh) | 蓝牙耳机 | |
CN214226506U (zh) | 声音处理电路、电声器件和声音处理*** | |
WO2023284402A1 (zh) | 音频信号处理方法、***、装置、电子设备和存储介质 | |
TWI581255B (zh) | 前端音頻處理系統 | |
CN108053827A (zh) | 一种智能语音交互装置 | |
CN101980547A (zh) | 一种耳机 | |
CN111182416B (zh) | 处理方法、装置及电子设备 | |
CN103974168A (zh) | 一种信息处理方法及电子设备 | |
CN112349291A (zh) | 基于ai降噪模型的扩声***及方法 | |
CN105430543A (zh) | 数字麦克风和电子设备 | |
CN107948870A (zh) | 基于立体麦克风阵列的便携式音频降噪*** | |
CN110099328B (zh) | 一种智能音箱 | |
CN106331917A (zh) | 一种远程拾音器 | |
CN204465850U (zh) | 一种抗干扰耳机电路 | |
CN106935246A (zh) | 一种基于麦克风阵列的人声获取方法及电子设备 | |
CN205666067U (zh) | 麦克风阵列语音增强电路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180518 |