CN110136710A - 人工耳蜗控制方法 - Google Patents

人工耳蜗控制方法 Download PDF

Info

Publication number
CN110136710A
CN110136710A CN201910352855.3A CN201910352855A CN110136710A CN 110136710 A CN110136710 A CN 110136710A CN 201910352855 A CN201910352855 A CN 201910352855A CN 110136710 A CN110136710 A CN 110136710A
Authority
CN
China
Prior art keywords
artificial cochlea
characteristic parameter
command signal
signal
control method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910352855.3A
Other languages
English (en)
Inventor
吴瑞安
樊伟
孙增军
刘新东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lishengte Medical Science & Tech Co Ltd
Original Assignee
Lishengte Medical Science & Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lishengte Medical Science & Tech Co Ltd filed Critical Lishengte Medical Science & Tech Co Ltd
Priority to CN201910352855.3A priority Critical patent/CN110136710A/zh
Publication of CN110136710A publication Critical patent/CN110136710A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61NELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
    • A61N1/00Electrotherapy; Circuits therefor
    • A61N1/02Details
    • A61N1/08Arrangements or circuits for monitoring, protecting, controlling or indicating
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61NELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
    • A61N1/00Electrotherapy; Circuits therefor
    • A61N1/18Applying electric currents by contact electrodes
    • A61N1/32Applying electric currents by contact electrodes alternating or intermittent currents
    • A61N1/36Applying electric currents by contact electrodes alternating or intermittent currents for stimulation
    • A61N1/36036Applying electric currents by contact electrodes alternating or intermittent currents for stimulation of the outer, middle or inner ear
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明公开了一种人工耳蜗控制方法,其包括如下步骤:(A)采集声音信号;(B)将声音信号进行预处理;(C)将预处理后的声音信号进行特征参数提取;(D)将特征提取后的特征参数与预设的特征参数进行声纹对比,判断声音是否来自于预设用户;(E)将特征提取后的特征参数转化为命令信号;(F)将语义识别后的命令信号与预设的命令信号进行匹配;(G)处理命令信号,调节对应的工作参数。该人工耳蜗控制方法通过设置语音控制模组,解放了双手,使得使用者能声控人工耳蜗,实时调节人工耳蜗的工作参数,达到较佳的听觉效果,也提高了控制的准确性,避免了误操作,同时,不会影响人工耳蜗正常的声音处理工作。

Description

人工耳蜗控制方法
技术领域
本发明涉及一种控制方法,尤其涉及一种人工耳蜗控制方法。
背景技术
人工耳蜗由于使用场景的复杂性,为了达到较佳的使用效果,有时需要对人工耳蜗的工作参数(音量大小、场景选择、关机等)进行实时调节。但在特定场景下,比如开车、骑车等,使用者的双手会被占用,无法方便地手动调节人工耳蜗的工作参数,如强行操作则会造成安全隐患。同时,手动调节时通常不会将人工耳蜗摘下,只能凭经验进行盲操作,容易导致误操作。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种人工耳蜗控制方法,其能通过声音控制人工耳蜗。
为实现上述目的,本发明提供了一种人工耳蜗控制方法,其包括如下步骤:(A)拾音单元采集声音信号;(B)预处理程序模块将声音信号进行分帧、加窗及预加重;(C)特征提取程序模块将预处理后的声音信号进行特征参数提取;(D)声纹对比程序模块将特征提取后的特征参数与预设的特征参数进行声纹对比,判断声音是否来自于预设用户,若是来自于预设用户,则进入下一步,若不是来自于预设用户,则忽略此段声音信号;(E)语义识别程序模块将特征提取后的特征参数转化为命令信号;(F)命令匹配程序模块将语义识别后的命令信号与预设的命令信号进行匹配,若匹配成功,则进入下一步,若匹配不成功,则忽略此段声音信号;(G)人工耳蜗策略处理单元处理命令信号,调节对应的工作参数。
在步骤B中,该加窗使用Hamming窗或Hanning窗。
在步骤C中,该特征参数提取采用LPCC或MFCC。
本发明人工耳蜗控制方法通过设置语音控制模组,解放了双手,使得使用者能声控人工耳蜗,实时调节人工耳蜗的工作参数,达到较佳的听觉效果,也提高了控制的准确性,避免了误操作,同时,不会影响人工耳蜗正常的声音处理工作。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明人工耳蜗控制方法的流程示意图。
图2是本发明人工耳蜗的模块工作示意图。
具体实施方式
本发明提供了一种人工耳蜗控制方法,用于控制人工耳蜗,以达到能实时调节人工耳蜗工作参数的目的。
如图1所示,该人工耳蜗控制方法包括声音采集,预处理,特征提取,声纹对比,语义识别,命令匹配,命令执行七个步骤。
声音采集:拾音单元(比如麦克风)采集声音信号。
预处理:预处理程序模块将声音信号进行分帧、加窗及预加重,其中,该加窗使用Hamming窗或Hanning窗。
特征提取:特征提取程序模块将预处理后的声音信号进行特征参数提取,其中,该特征参数提取采用LPCC(LinearPredictionCepstrumCoefficient,线性预测倒谱系数)或MFCC(Mel-FrequencyCepstrumCoefficient,梅尔频率倒谱系数)。
声纹对比:声纹对比程序模块将特征提取后的特征参数与预设的特征参数进行声纹对比,判断声音是否来自于预设用户,若是来自于预设用户(通常为使用者本人),则进入下一步,若不是来自于预设用户,则忽略此段声音信号。
语义识别:语义识别程序模块将特征提取后的特征参数转化为命令信号。
命令匹配:命令匹配程序模块将语义识别后的命令信号与预设的命令信号进行匹配,若匹配成功,则进入下一步,若匹配不成功,则忽略此段声音信号。
命令执行:人工耳蜗策略处理单元处理命令信号,调节对应的工作参数。
如图2所示,值得提醒的是,该拾音单元、该预处理程序模块及该人工耳蜗策略处理单元均为人工耳蜗现有的功能单元,该特征提取程序模块、该声纹对比程序模块、该语义识别程序模块及该命令匹配程序模块均为新设置的语音控制模组,即,只需对现有的人工耳蜗进行一定的改进就可实现该人工耳蜗控制方法,实现成本较低。同时,声音采集及预处理两个步骤可与人工耳蜗正常的声音处理共用,即,预处理后的声音信号可同时输送至该人工耳蜗策略处理单元以进行声音处理,使得该人工耳蜗控制方法与人工耳蜗正常的声音处理能相互兼容、同时进行。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (3)

1.一种人工耳蜗控制方法,其包括如下步骤:(A)拾音单元采集声音信号;(B)预处理程序模块将声音信号进行分帧、加窗及预加重;(C)特征提取程序模块将预处理后的声音信号进行特征参数提取;(D)声纹对比程序模块将特征提取后的特征参数与预设的特征参数进行声纹对比,判断声音是否来自于预设用户,若是来自于预设用户,则进入下一步,若不是来自于预设用户,则忽略此段声音信号;(E)语义识别程序模块将特征提取后的特征参数转化为命令信号;(F)命令匹配程序模块将语义识别后的命令信号与预设的命令信号进行匹配,若匹配成功,则进入下一步,若匹配不成功,则忽略此段声音信号;(G)人工耳蜗策略处理单元处理命令信号,调节对应的工作参数。
2.如权利要求1所述的人工耳蜗控制方法,其特征在于:在步骤B中,该加窗使用Hamming窗或Hanning窗。
3.如权利要求1所述的人工耳蜗控制方法,其特征在于:在步骤C中,该特征参数提取采用LPCC或MFCC。
CN201910352855.3A 2019-04-29 2019-04-29 人工耳蜗控制方法 Withdrawn CN110136710A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910352855.3A CN110136710A (zh) 2019-04-29 2019-04-29 人工耳蜗控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910352855.3A CN110136710A (zh) 2019-04-29 2019-04-29 人工耳蜗控制方法

Publications (1)

Publication Number Publication Date
CN110136710A true CN110136710A (zh) 2019-08-16

Family

ID=67575523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910352855.3A Withdrawn CN110136710A (zh) 2019-04-29 2019-04-29 人工耳蜗控制方法

Country Status (1)

Country Link
CN (1) CN110136710A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111383639A (zh) * 2020-03-06 2020-07-07 湖南快乐车行露营地投资发展有限公司 水电桩解锁控制方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2381702A2 (en) * 2010-04-22 2011-10-26 Siemens Corporation Systems and methods for own voice recognition with adaptations for noise robustness
CN106060235A (zh) * 2016-05-05 2016-10-26 广东小天才科技有限公司 一种应用于移动设备的开关机控制方法及装置、移动设备
CN107785013A (zh) * 2016-08-24 2018-03-09 中兴通讯股份有限公司 语音控制方法及装置
CN107801138A (zh) * 2016-08-29 2018-03-13 奥迪康有限公司 具有语音控制功能的助听器装置
CN109545221A (zh) * 2019-01-23 2019-03-29 努比亚技术有限公司 参数调整方法、移动终端及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2381702A2 (en) * 2010-04-22 2011-10-26 Siemens Corporation Systems and methods for own voice recognition with adaptations for noise robustness
CN106060235A (zh) * 2016-05-05 2016-10-26 广东小天才科技有限公司 一种应用于移动设备的开关机控制方法及装置、移动设备
CN107785013A (zh) * 2016-08-24 2018-03-09 中兴通讯股份有限公司 语音控制方法及装置
CN107801138A (zh) * 2016-08-29 2018-03-13 奥迪康有限公司 具有语音控制功能的助听器装置
CN109545221A (zh) * 2019-01-23 2019-03-29 努比亚技术有限公司 参数调整方法、移动终端及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111383639A (zh) * 2020-03-06 2020-07-07 湖南快乐车行露营地投资发展有限公司 水电桩解锁控制方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN108564942B (zh) 一种基于敏感度可调的语音情感识别方法及***
CN105009204B (zh) 语音识别功率管理
CN107767861B (zh) 语音唤醒方法、***及智能终端
EP1868183B1 (en) Speech-activated control system and method
CN111341325A (zh) 声纹识别方法、装置、存储介质、电子装置
CN110570873B (zh) 声纹唤醒方法、装置、计算机设备以及存储介质
CN102543073B (zh) 一种沪语语音识别信息处理方法
KR20160098771A (ko) 음성 기능 운용 방법 및 이를 지원하는 전자 장치
CN109564759A (zh) 说话人识别
CN108766441A (zh) 一种基于离线声纹识别和语音识别的语音控制方法及装置
CN109036395A (zh) 个性化的音箱控制方法、***、智能音箱及存储介质
CN1856820A (zh) 语音识别方法和通信设备
CN111798850B (zh) 用语音操作设备的方法和***及服务器
CN113129867B (zh) 语音识别模型的训练方法、语音识别方法、装置和设备
CN110097875A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110525379A (zh) 一种纯电动汽车语音解锁***及方法
CN113192535B (zh) 一种语音关键词检索方法、***和电子装置
CN109215634A (zh) 一种多词语音控制通断装置的方法及其***
CN111326152A (zh) 语音控制方法及装置
CN111554302A (zh) 基于声纹识别的策略调整方法、装置、终端及存储介质
CN110970020A (zh) 一种利用声纹提取有效语音信号的方法
CN109065026B (zh) 一种录音控制方法及装置
CN116343797A (zh) 语音唤醒方法及相应装置
CN110136710A (zh) 人工耳蜗控制方法
CN111276156A (zh) 一种实时语音流监控的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190816

WW01 Invention patent application withdrawn after publication