CN106920548A - 语音控制装置、语音控制***和语音控制方法 - Google Patents

语音控制装置、语音控制***和语音控制方法 Download PDF

Info

Publication number
CN106920548A
CN106920548A CN201510989140.0A CN201510989140A CN106920548A CN 106920548 A CN106920548 A CN 106920548A CN 201510989140 A CN201510989140 A CN 201510989140A CN 106920548 A CN106920548 A CN 106920548A
Authority
CN
China
Prior art keywords
voice
phonetic
feature
speech
vocal print
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510989140.0A
Other languages
English (en)
Other versions
CN106920548B (zh
Inventor
吴世杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BYD Co Ltd
Original Assignee
BYD Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BYD Co Ltd filed Critical BYD Co Ltd
Priority to CN201510989140.0A priority Critical patent/CN106920548B/zh
Publication of CN106920548A publication Critical patent/CN106920548A/zh
Application granted granted Critical
Publication of CN106920548B publication Critical patent/CN106920548B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种语音控制装置、语音控制***和语音控制方法,装置包括:语音采集模块,用于接收语音信号;语音识别模块,用于根据语音信号生成语音特征,以及根据语音控制装置的当前工作模式对语音特征进行判断,并在判断语音特征与当前工作模式对应的语音范本匹配时生成语音命令;第一通信模块,用于与智能终端进行无线通信;控制模块,用于根据语音命令生成控制指令,并通过第一无线通信模块将控制指令发送给智能终端,以使智能终端根据控制指令进行工作。由此,可根据用户的选择工作在满足用户语音情况的工作模式,提高语音识别准确度,也可满足不同用户对语音控制的不同需求,而且还可对智能终端进行语音控制例如语音唤醒。

Description

语音控制装置、语音控制***和语音控制方法
技术领域
本发明涉及通信技术领域,特别涉及一种语音控制装置、一种语音控制***和一种语音控制装置的语音控制方法。
背景技术
随着电子产品技术的发展,用户对电子产品的附加要求也越来越高,语音识别控制技术愈来愈被提上日程。在相关技术中,电子产品采用语音识别技术不能准确地对用户发出的语音进行识别,例如无法对发音不标准的语音或方言等进行识别,因此无法满足不同用户对语音控制的不同需求。另外,相关电子产品在待机时通常需要按下机械按键才能唤醒,影响用户的使用。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种语音控制装置,该装置能够满足不同用户对语音控制的不同需求。
本发明的另一个目的在于提出一种语音控制***,本发明的又一个目的在于提出一种语音控制装置的语音控制方法。
为达到上述目的,本发明一方面实施例提出的一种语音控制装置,包括:语音采集模块,所述语音采集模块用于接收语音信号;语音识别模块,所述语音识别模块用于根据所述语音信号生成语音特征,以及根据所述语音控制装置的当前工作模式对所述语音特征进行判断,并在判断所述语音特征与所述当前工作模式对应的语音范本匹配时生成语音命令;第一通信模块,所述第一通信模块用于与智能终端进行无线通信;控制模块,所述控制模块用于根据所述语音命令生成控制指令,并通过所述第一无线通信模块将所述控制指令发送给所述智能终端,以使所述智能终端根据所述控制指令进行工作。
根据本发明实施例提出的语音控制装置,语音识别模块可根据语音控制装置的当前工作模式对语音特征进行判断,并在判断语音特征与当前工作模式对应的语音范本匹配时生成语音命令,控制模块再根据语音命令生成控制指令并发送给智能终端,以使智能终端根据控制指令进行工作。由此,该装置可根据用户选择工作在满足用户语音情况的工作模式,提高语音识别准确度,也可满足不同用户对语音控制的不同需求。
为达到上述目的,本发明另一方面实施例提出了一种语音控制***,包括:所述的语音控制装置;与所述语音控制装置进行通信的智能终端。
根据本发明实施例提出的语音控制***,通过上述语音控制装置可提高语音识别准确度,并对智能终端进行语音控制例如语音唤醒。
为达到上述目的,本发明另一方面实施例提出了一种语音控制装置的语音控制方法,包括以下步骤:接收语音信号,并根据所述语音信号生成语音特征;获取语音控制装置的当前工作模式,并根据所述当前工作模式对所述语音特征进行判断;在判断所述语音特征与所述当前工作模式对应的语音范本匹配时生成语音命令,并根据所述语音命令生成控制指令;将所述控制指令发送给与所述语音控制装置进行通信的智能终端,以使所述智能终端根据所述控制指令进行工作。
根据本发明实施例提出的语音控制装置的语音控制方法,可根据语音控制装置的当前工作模式对语音特征进行判断,并在判断语音特征与当前工作模式对应的语音范本匹配时生成语音命令,再根据语音命令生成控制指令并发送给智能终端,以使智能终端根据控制指令进行工作。由此,该方法可根据用户选择工作在满足用户语音情况的工作模式,提高语音识别准确度,也可满足不同用户对语音控制的不同需求。
附图说明
图1是根据本发明实施例的语音控制装置的方框示意图;
图2是根据本发明一个实施例的语音识别模块的方框示意图;
图3是根据本发明一个实施例的语音控制装置的工作原理示意图;
图4是根据本发明一个实施例的语音控制装置的工作电流示意图;
图5是根据本发明一个具体实施例的语音控制装置的方框示意图;
图6是根据本发明实施例的语音控制***的方框示意图;
图7是根据本发明实施例的语音控制装置的语音控制方法的流程图;
图8是根据本发明一个实施例的语音控制装置的语音控制方法的流程图;以及
图9是根据本发明一个实施例的智能终端的语音录制方法的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图来描述本发明实施例的语音控制装置、语音控制***和语音控制装置的语音控制方法,其中,该语音控制装置可根据用户发出的声音控制智能终端。
图1是根据本发明实施例的语音控制装置的方框示意图。如图1所示,该语音控制装置100包括:语音采集模块10、语音识别模块20、第一通信模块30和控制模块40。
其中,语音采集模块10用于接收语音信号,具体地,语音采集模块10可为数字麦克风;语音识别模块20与语音采集模块10相连,语音识别模块20用于根据语音信号生成语音特征,以及根据语音控制装置100的当前工作模式对语音特征进行判断,并在判断语音特征与当前工作模式对应的语音范本匹配时生成语音命令;第一通信模块30用于与智能终端200进行无线通信;控制模块40分别与语音识别模块20和第一通信模块30相连,控制模块40用于根据语音命令生成控制指令,并通过第一无线通信模块30将控制指令发送给智能终端200,以使智能终端200根据控制指令进行工作。
具体来说,语音采集模块10可实时监测外界的声音,当语音采集模块10接收到外界的语音信号之后,语音识别模块20可先对该语音信号即模拟语音信号进行调理、模数转换以生成数字语音信号,再根据当前工作模式对数字语音信号进行处理以识别出该语音信号对应的语音命令。然后,语音识别模块20就可将对应的语音命令传送给控制模块40,控制模块40接收到语音命令后启动并根据语音命令生成控制指令,以及将控制指令传送到智能终端200,智能终端200接收到控制指令后执行该控制指令,从而可通过声音对智能终端200进行控制,无需手动操作。
应当理解的是,控制指令可包括唤醒控制指令、待机控制指令以及拨号控制指令等指令,这样,当智能终端200接收到唤醒控制指令时,可控制人机交互界面点亮;当智能终端200接收到待机控制指令时,可控制人机交互界面熄灭;当智能终端200接收到拨号控制指令时,可显示拨号界面以向拨号控制指令中指定的终端拨号。
需要说明的是,语音命令可为十六进制或二进制的编码信号。
举例来说,语音采集模块10可接收到用户发出的“开启”语音信号,当语音识别模块20识别出该“开启”语音信号的语音特征与当前工作模式对应的语音范本中“开启”语音特征匹配时,语音识别模块20可将语音范本中“开启”语音特征对应的语音命令发送给控制模块40,控制模块40接收到该语音命令之后发送唤醒控制指令给智能终端200,智能终端200接收到唤醒控制指令后可显示人机交互界面。同理,语音采集模块10也可接收到用户发出的“关闭”语音信号,控制模块40在语音识别模块20识别出“关闭”语音信号之后可发送待机控制指令给智能终端200,智能终端200将不显示人机交互界面,从而通过语音控制智能终端实现待机或唤醒等操作,无需手动触发按键,解放双手。
根据本发明的一个具体示例,语音识别模块20可为iM401D语音识别芯片,控制模块40可为CSR8670控制芯片。语音识别模块20与控制模块40之间可以I2C总线(Inter-Integrated Circuit,集成电路总线)方式进行通信。语音控制装置100与智能终端200之间可以蓝牙通信方式进行通信。
根据本发明的一个实施例,控制模块40在语音控制装置100处于待机状态时关闭,并在接收到语音命令时开启。
具体而言,在语音控制装置100中的第一通信模块30与智能终端建立通信连接之后,语音控制装置100和智能终端200进入待机状态,其中,当语音控制装置100处于待机状态时,第一通信模块30和控制模块40关闭。而语音采集模块10和语音识别模块20依然开启,语音识别模块20对语音采集模块10接收到的语音信号进行识别,并在识别出语音信号之后生成语音命令,控制模块40接收到语音命令之后开启并且控制模块40也控制第一通信模块30及其他***电路开启,语音控制装置100进入唤醒状态,当然,控制模块40还根据语音命令生成控制指令并向智能终端200发送控制指令,智能终端200接收到控制指令进入唤醒状态。
由此,控制芯片及其他相关电路在接收到语音命令才开启,可大大降低功耗。
根据本发明的一个实施例,语音控制装置100的工作模式包括声纹模式、语音模式和复合模式,其中,复合模式由声纹模式和语音模式组成。
需要说明的是,在声纹模式下,语音控制装置100可对个人声纹进行识别,声纹识别只能识别出声纹录制本人的语音命令,其它人说出同样的语音命令是不起作用的,具有特殊语音命令权限。简单来说,个人声纹识别就是确认某段语音是否是指定的某个人所说的识别过程,个人声纹识别需要对说话人的声纹进行建模,这就是所谓的“训练”或“学习”过程。在语音模式下,语音控制装置100可对每个人的语音进行识别,语音识别可识别出任何人说出同样的语音命令,不限制于某个人的语音命令,具有普通语音命令权限。
进一步地,根据本发明的一个实施例,当当前工作模式为声纹模式时,语音识别模块20根据声纹模式对应的声纹识别算法和由用户声纹信息建立的个人声纹范本对语音特征进行判断。需要说明的是,个人声纹范本包括多个声纹信息,每个声纹信息对应一个语音命令,这样语音识别模块20可根据声纹识别算法从语音特征中提取声纹信息,并判断提取出的声纹信息与个人声纹范本中的一个声纹信息相匹配时,即可识别出语音信号。
当当前工作模式为语音模式时,语音识别模块20根据语音模式对应的标准语音识别算法和预先存储的标准语音范本对语音特征进行判断。需要说明的是,标准语音范本可普通话语音范本、方言语音范本等,标准语音范本可根据语音数据库中的语音数据建立,并且标准语音范本可生产时预先存储在语音控制装置100内,并且标准语音范本包括多个语音内容信息,每个语音内容信息对应一个语音命令,这样根据的标准语音识别算法可从语音特征中提取语音内容,并判断提取出的语音内容与标准语音范本中的一个语音内容信息相匹配时,即可识别出语音信号。
当当前工作模式为复合模式时,语音识别模块20先根据声纹模式对应的声纹识别算法和由用户声纹信息建立的个人声纹范本对语音特征进行判断,并在语音特征与由用户声纹信息建立的个人声纹范本不匹配时再根据语音模式对应的标准语音识别算法和预先存储的标准语音范本对语音特征进行判断。
需要说明的是,语音识别模块20可设置模式标志位ID,并根据模式标志位ID的值判断语音控制装置的当前工作模式,例如当ID=1时,当前工作模式为声纹模式;当ID=2时,当前工作模式为语音模式;当ID=3时,当前工作模式为复合模式,其中,在初始设定时可设定ID=1。
具体地,语音识别模块20检测模式标志位ID。当检测到ID=1时,语音识别模块20判断语音控制装置处于声纹模式,之后语音控制装置100和智能终端200进入待机状态。语音采集模块10接收语音信号,语音识别模块20根据语音信号生成语音特征并从语言特征中提取声纹信息,并将提取出的声纹信息与个人声纹范本进行比较,如果该语音信号的声纹信息与个人声纹范本中的一个声纹信息相匹配,语音识别模块20根据个人声纹范本中声纹信息与语音命令之间的对应关系,即可获取该语音信号对应的语音命令,控制模块40接收到语音命令后开启并向智能终端200发送对应的控制指令,智能终端200接收到控制指令可由待机状态进入唤醒状态并进入相关应用场景,例如启动录音或关闭录音等应用场景。当然,如果该语音信号的声纹信息与个人声纹范本中的每个声纹信息均不匹配,语音识别模块20继续识别语音信号。
应当理解的是,不同人具有不同的声纹,在声纹模式下,仅有录制个人声纹范本的用户发出的语音信号才能控制智能终端200,其他非录制个人声纹范本的用户发出的语音信号不能控制智能终端200。
当检测到ID=2时,语音识别模块20判断语音控制装置处于语音模式,在语音模式下可根据用户输入的指令选择语言,例如普通话、方言等。之后语音控制装置100和智能终端200进入待机状态。语音采集模块10接收语音信号,语音识别模块20根据语音信号生成语音特征并从语言特征中提取语音内容,并将提取出的语音内容与标准语音范本进行比较,如果该语音信号的语音内容与标准语音范本中的一个语音内容信息相匹配,语音识别模块20根据标准语音范本中语音内容信息与语音命令之间的对应关系,即可获取该语音信号对应的语音命令,控制模块40接收到语音命令后开启并向智能终端200发送对应的控制指令,智能终端200接收到控制指令可由待机状态进入唤醒状态并进入相关应用场景,例如启动录音或关闭录音等应用场景。当然,如果该语音信号的语音内容与标准语音范本中的每个语音内容信息均不匹配,语音识别模块20继续识别语音信号。
应当理解的是,在语音模式下,只要语音信号的语音内容正确、且发出语音信号的用户发音准确,任何人发出的语音信号均可控制智能终端200。
当检测到ID=3时,语音识别模块20判断语音控制装置处于声纹加语音的复合模式,此模式下语音识别模块20优先按照ID=1时的声纹模式对语音信号的声纹信息进行识别,如果无法识别出语音信号的声纹信息,则再按照ID=2时语音模式对语音信号的语音内容进行识别。
举例来说,在当前工作模式处于声纹模式时,如果语音采集模块10接收到用户发出的“您好”语音信号,则语音识别模块20识别“您好”语音信号的声纹信息是否与个人声纹范本中的“您好”声纹信息相匹配,并在匹配时获取“您好”声纹信息对应的语音指令,此时因不同人具有不同的声纹,语音识别模块20识别准确度将不受发音不标准、带有方言等影响。
在当前工作模式处于语音模式时,如果语音采集模块10接收到用户以普通话发出的“您好”语音信号,则语音识别模块20识别“您好”语音信号的语音内容“您好”是否与个人声纹范本中的“您好”语音内容信息相匹配,并在匹配时获取“您好”语音内容信息对应的语音指令,此时语音识别模块20可识别出每个人以比较标准的普通话说出的“您好”。
在当前工作模式处于复合模式时,语音识别模块20优先以声纹模式进行识别,声纹识别不通过,再以语音模式进行识别。
由此,本发明实施例的声音控制装置,可以准确地识别出个人声纹或标准语音,兼容性强,可以方便用户使用,又可以实现语音控制例如语音唤醒,节省机械按键。
进一步地,语音识别模块20还用于根据智能终端200发出的录制指令控制语音控制装置100进入录制状态,并根据录制的语音信号生成声纹信息,并根据声纹信息建立个人声纹范本。
也就是说,智能终端200接收到用户输入的录制指令之后,可将录制指令转发给语音控制装置100,语音控制装置100进入录制状态并开始录制,语音识别模块20可从语音采集模块10接收的语音信号中提取声纹信息,并根据提取出的声纹信息建立个人声纹范本。
在本发明的另一个实施例中,语音识别模块20可根据智能终端200发送的个人语音样本生成声纹信息,并根据生成的声纹信息建立个人声纹范本。举例来说,在初次使用时,语音控制装置100与智能终端200蓝牙配对成功之后,控制模块40可向智能终端200发送录制提示指令,智能终端200接收录制提示指令向用户进行提示,智能终端200接收到用户的确认录制指令之后开始进行录制用户发出的语音信号,当接收到录制完成指令之后停止录制,并将录制完成的个人语音样本发送给语音控制装置100,语音识别模块20可从智能终端200发送的个人语音样本中提取声纹信息,并根据提取出的声纹信息建立个人声纹范本。
根据本发明的一个实施例,如图2所示,语音识别模块20包括特征生成单元201和信号处理单元202。
其中,特征生成单元201用于根据语音信号生成语音特征;信号处理单元202用于根据当前工作模式对语音特征进行判断,并在判断语音特征与当前工作模式对应的语音范本匹配时生成语音命令。在本发明的一个具体示例中,信号处理单元202为数字信号处理DSP(Digital Signal Processing)芯片或微处理器MCU(Micro Control Unit)。
具体来说,如图3所示,语音识别模块20的工作过程如下:语音采集模块接收到语音信号例如人的声音(频率范围为20Hz到20kHz)之后将输出模拟语音信号,语音识别模块20中的特征生成单元201可对模拟语音信号进行滤波、加窗(1-20ms)和模数转换等处理以生成语音特征(数字语音信号),此时特征生成单元201直接从模拟语音信号中提取语音特征,而该语音特征无法用来重建原始信号,可实现隐私保护。在生成语音特征之后,语音识别模块20中的信号处理单元202可对语音特征进行模式识别、跟踪等处理,例如将语音特征与当前工作模式对应的语音范本进行比对以生成语音命令,并将生成的语音命令通过I2C通信方式发送给控制模块40。控制模块40接收到语音命令之后即可生成控制指令,并向智能终端200发送控制指令。
其中,特征生成单元201还用于从语音特征提取字节语音特征,根据当前工作模式对提取出的字节语音特征进行判断,并在判断字节语音特征与当前工作模式对应的关键字信息匹配时输出唤醒信号至信号处理单元202,以控制信号处理单元202进行工作。
需要说明的是,字节语音特征可指一段语音中每个字节对应的语音特征,例如在“开启”语音信号中,“开”字对应的语音特征和“启”字对应的语音特征均为字节语音特征。关键字信息是指从语音范本中选择每段语音的关键字对应的语音特征进而构成关键字信息,例如,在“开启”语音信号中,可选择“开”字作为关键字,将“开”对应的语音特征进入到关键字信息中。如此,当特征生成单元201提取出的字节语音特征与“开”对应的语音特征一致时,控制信号处理单元202进行工作。
上电初始化、控制模块10下发驱动到语音识别模块20,然后控制模块10处于待机状态,而语音采集模块10和语音识别模块20仍然进行工作。结合图4的示例,在信号处理单元202未工作时,语音采集模块10和语音识别模块20中的特征生成单元201以270uA最大的工作电流工作;当信号处理单元202工作时,语音信号经过C1部分进行模数转换,最大工作电流可达2mA,模数转换后语音信号送入信号处理单元202进行计算,最大工作电流瞬间可达到10mA,这样10ms内可以完成计算,全过程最大电流瞬间将达到13mA。
由此,通过在检测到关键字时再控制信号处理单元202开启,可大大节省了长时间使用信号处理单元计算时的功耗,节省功耗可达到85%。
另外,根据本发明的一个实施例,如图5所示,语音控制装置100还可包括:锂电池50,锂电池50用于为语音采集模块10、语音识别模块20、第一通信模块30和控制模块40供电。语音控制装置100进一步可包括与控制模块40相连的指示灯60、按键70和USB接口80等组件,其中,指示灯60用于对语音控制装置100的状态进行提示,按键70用于接收用户输入的指令以进行功能选择,USB接口80作为充电接口。语音控制装置100包括图5所示的其他组件,这里不再一一赘述。
根据本发明的一个示例,语音控制装置100中每个器件之间连接的载体为印刷PCB(Printed Circuit Board,印刷电路板),印刷PCB经贴片加工形成PCBA(Printed Circuit Board+Assembly,装配印刷电路板)。
综上,根据本发明实施例提出的语音控制装置,语音识别模块可根据语音控制装置的当前工作模式对语音特征进行判断,并在判断语音特征与当前工作模式对应的语音范本匹配时生成语音命令,控制模块再根据语音命令生成控制指令并发送给智能终端,以使智能终端根据控制指令进行工作。由此,该装置可根据用户选择工作在满足用户语音情况的工作模式,提高语音识别准确度,也可满足不同用户对语音控制的不同需求。而且,该装置还可对智能终端进行语音控制例如语音唤醒。
本发明还提出了一种语音控制***。
图6是根据本发明实施例的语音控制***的方框示意图。如图6所示,该语音控制***包括上述的语音控制装置100和智能终端200,智能终端200用于与语音控制装置100进行通信,以接收语音控制装置100发送的控制指令;语音控制装置100可根据接收到的语音信号生成控制指令。
根据本发明的一个具体示例,语音控制装置100可为智能耳机或智能手表等便携式数码产品,智能终端200可为手机、平板或车载终端。
根据本发明实施例提出的语音控制***,通过上述语音控制装置可提高语音识别准确度,并对智能终端进行语音控制例如语音唤醒。
本发明又提出了一种语音控制装置的语音控制方法。
图7是根据本发明实施例的语音控制装置的语音控制方法的流程图。如图7所示,该语音控制装置的语音控制方法包括以下步骤:
S1:接收语音信号,并根据语音信号生成语音特征。
S2:获取语音控制装置的当前工作模式,并根据当前工作模式对语音特征进行判断。
S3:在判断语音特征与当前工作模式对应的语音范本匹配时生成语音命令,并根据语音命令生成控制指令。
S4:将控制指令发送给与语音控制装置进行通信的智能终端,以使智能终端根据控制指令进行工作。
根据本发明的一个实施例,语音控制装置的工作模式包括声纹模式、语音模式和复合模式,其中,复合模式由声纹模式和语音模式组成。
进一步地,根据本发明的一个实施例,当当前工作模式为声纹模式时,根据声纹模式对应的声纹识别算法和由用户声纹信息建立的个人声纹范本对语音特征进行判断;当当前工作模式为语音模式时,根据语音模式对应的标准语音识别算法和预先存储的标准语音范本对语音特征进行判断;当当前工作模式为复合模式时,先根据声纹模式对应的声纹识别算法和由用户声纹信息建立的个人声纹范本对语音特征进行判断,并在语音特征与由用户声纹信息建立的个人声纹范本不匹配时再根据语音模式对应的标准语音识别算法和预先存储的标准语音范本对语音特征进行判断。
具体地,如图8所示,本发明实施例的语音控制装置的语音控制方法具体包括以下步骤:
S101:与智能终端蓝牙配对成功。
S102:与智能终端连接并检测语音控制装置的工作模式。
S103:判断模式标志位ID的数值。
当ID=1时,执行步骤S104;当ID=2时,执行步骤S105;当ID=3时,执行步骤S106。
S104:工作在声纹模式,执行步骤S107。
S105:工作在语音模式,执行步骤S107。
S106:工作在声纹加语音的复合模式。
S107:判断是否接收到语音信号。如果是,则执行步骤S108;如果否,则继续执行步骤S107。
S108:判断所述语音信号的语音特征是否与语音范本相匹配。如果是,则执行步骤S109;如果否,则返回步骤S107。
S109:获取语音信号对应的控制指令,并将控制指令发送给智能终端。
根据本发明的一个实施例,语音控制装置的语音控制方法还包括:根据智能终端发送的个人语音样本生成声纹信息,并根据声纹信息建立个人声纹范本。
具体地,如图9所示,智能终端的语音录制过程包括以下步骤:
S201:与语音控制装置蓝牙配对成功。
S202:获取语音控制装置的信息并同步设置时间、地点等。
S203:检测并判断是否需要录制个人声纹信息。
如果是,则执行步骤S204;如果否,则执行步骤S206。
S204:录制个人语音样本,并判断录制是否成功。
如果是,则执行步骤S205;如果否,则继续执行步骤S204。
S205:将个人语音样本发送给语音控制装置。
S206:进入人机交互界面。
另外,根据本发明的一个实施例,语音控制装置的语音控制方法还包括:
从语音特征提取字节语音特征,并根据当前工作模式对提取出的字节语音特征进行判断;
在判断字节语音特征与当前工作模式对应的关键字信息匹配时控制语音控制装置中的信号处理单元进行工作。
由此,通过在检测到关键字时再控制信号处理单元开启,可大大节省了长时间使用信号处理单元计算时的功耗,节省功耗可达到85%。
综上,根据本发明实施例提出的语音控制装置的语音控制方法,可根据语音控制装置的当前工作模式对语音特征进行判断,并在判断语音特征与当前工作模式对应的语音范本匹配时生成语音命令,再根据语音命令生成控制指令并发送给智能终端,以使智能终端根据控制指令进行工作。由此,该方法可根据用户选择工作在满足用户语音情况的工作模式,提高语音识别准确度,也可满足不同用户对语音控制的不同需求。而且,该方法还可对智能终端进行语音控制例如语音唤醒。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种语音控制装置,其特征在于,包括:
语音采集模块,所述语音采集模块用于接收语音信号;
语音识别模块,所述语音识别模块用于根据所述语音信号生成语音特征,以及根据所述语音控制装置的当前工作模式对所述语音特征进行判断,并在判断所述语音特征与所述当前工作模式对应的语音范本匹配时生成语音命令;
第一通信模块,所述第一通信模块用于与智能终端进行无线通信;
控制模块,所述控制模块用于根据所述语音命令生成控制指令,并通过所述第一无线通信模块将所述控制指令发送给所述智能终端,以使所述智能终端根据所述控制指令进行工作。
2.根据权利要求1所述的语音控制装置,其特征在于,其中,所述语音控制装置的工作模式包括声纹模式、语音模式和复合模式,其中,所述复合模式由所述声纹模式和语音模式组成。
3.根据权利要求2所述的语音控制装置,其特征在于,
当所述当前工作模式为所述声纹模式时,所述语音识别模块根据所述声纹模式对应的声纹识别算法和由用户声纹信息建立的个人声纹范本对所述语音特征进行判断;
当所述当前工作模式为所述语音模式时,所述语音识别模块根据所述语音模式对应的标准语音识别算法和预先存储的标准语音范本对所述语音特征进行判断;
当所述当前工作模式为所述复合模式时,所述语音识别模块先根据所述声纹模式对应的声纹识别算法和由用户声纹信息建立的个人声纹范本对所述语音特征进行判断,并在所述语音特征与所述由用户声纹信息建立的个人声纹范本不匹配时,再根据所述语音模式对应的标准语音识别算法和预先存储的标准语音范本对所述语音特征进行判断。
4.根据权利要求3所述的语音控制装置,其特征在于,所述语音识别模块还用于根据所述智能终端发送的个人语音样本生成声纹信息,并根据所述声纹信息建立所述个人声纹范本。
5.根据权利要求1所述的语音控制装置,其特征在于,所述控制模块在所述语音控制装置处于待机状态时关闭,并在接收到所述语音命令时开启。
6.根据权利要求1所述的语音控制装置,其特征在于,所述语音识别模块包括:
特征生成单元,所述特征生成单元用于根据所述语音信号生成所述语音特征;
信号处理单元,所述信号处理单元用于根据所述当前工作模式对所述语音特征进行判断,并在判断所述语音特征与所述当前工作模式对应的语音范本匹配时生成语音命令;
其中,所述特征生成单元还用于从所述语音特征提取字节语音特征,根据所述当前工作模式对提取出的所述字节语音特征进行判断,并在判断所述字节语音特征与所述当前工作模式对应的关键字信息匹配时输出唤醒信号至所述信号处理单元以控制所述信号处理单元进行工作。
7.一种语音控制***,其特征在于,包括:
根据权利要求1-6中任一项所述的语音控制装置;
与所述语音控制装置进行通信的智能终端。
8.根据权利要求7所述的语音控制***,其特征在于,其中,所述语音控制装置为智能耳机或智能手表,所述智能终端为手机、平板或车载终端。
9.一种语音控制装置的语音控制方法,其特征在于,包括以下步骤:
接收语音信号,并根据所述语音信号生成语音特征;
获取语音控制装置的当前工作模式,并根据所述当前工作模式对所述语音特征进行判断;
在判断所述语音特征与所述当前工作模式对应的语音范本匹配时生成语音命令,并根据所述语音命令生成控制指令;
将所述控制指令发送给与所述语音控制装置进行通信的智能终端,以使所述智能终端根据所述控制指令进行工作。
10.根据权利要求9所述的语音控制装置的语音控制方法,其特征在于,所述语音控制装置的工作模式包括声纹模式、语音模式和复合模式,其中,所述复合模式由所述声纹模式和语音模式组成。
11.根据权利要求10所述的语音控制装置的语音控制方法,其特征在于,
当所述当前工作模式为所述声纹模式时,根据所述声纹模式对应的声纹识别算法和由用户声纹信息建立的个人声纹范本对所述语音特征进行判断;
当所述当前工作模式为所述语音模式时,根据所述语音模式对应的标准语音识别算法和预先存储的标准语音范本对所述语音特征进行判断;
当所述当前工作模式为所述复合模式时,先根据所述声纹模式对应的声纹识别算法和由用户声纹信息建立的个人声纹范本对所述语音特征进行判断,并在所述语音特征与所述由用户声纹信息建立的个人声纹范本不匹配时,再根据所述语音模式对应的标准语音识别算法和预先存储的标准语音范本对所述语音特征进行判断。
12.根据权利要求11所述的语音控制装置的语音控制方法,其特征在于,还包括:
根据所述智能终端发送的个人语音样本生成声纹信息,并根据所述声纹信息建立所述个人声纹范本。
CN201510989140.0A 2015-12-25 2015-12-25 语音控制装置、语音控制***和语音控制方法 Active CN106920548B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510989140.0A CN106920548B (zh) 2015-12-25 2015-12-25 语音控制装置、语音控制***和语音控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510989140.0A CN106920548B (zh) 2015-12-25 2015-12-25 语音控制装置、语音控制***和语音控制方法

Publications (2)

Publication Number Publication Date
CN106920548A true CN106920548A (zh) 2017-07-04
CN106920548B CN106920548B (zh) 2020-06-19

Family

ID=59456686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510989140.0A Active CN106920548B (zh) 2015-12-25 2015-12-25 语音控制装置、语音控制***和语音控制方法

Country Status (1)

Country Link
CN (1) CN106920548B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107393531A (zh) * 2017-07-20 2017-11-24 Tcl医疗核磁技术(无锡)有限公司 一种医疗检测***的语音控制装置和方法
CN107426069A (zh) * 2017-08-23 2017-12-01 南京中感微电子有限公司 基于蓝牙的智能家居***及其控制方法
CN107444318A (zh) * 2017-07-26 2017-12-08 奇瑞汽车股份有限公司 汽车后尾门控制方法及***
CN107591152A (zh) * 2017-08-30 2018-01-16 百度在线网络技术(北京)有限公司 基于耳机的语音控制方法、装置及其设备
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN108062950A (zh) * 2017-12-20 2018-05-22 歌尔科技有限公司 一种语音唤醒的Dongle设备及语音唤醒方法
CN108182941A (zh) * 2017-12-28 2018-06-19 重庆柚瓣家科技有限公司 用于嘈杂环境下的人机交互模块
CN108200492A (zh) * 2017-07-12 2018-06-22 北京金锐德路科技有限公司 语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备
CN109151637A (zh) * 2018-08-21 2019-01-04 歌尔科技有限公司 无线耳机、用于无线耳机的智能语音控制***及方法
CN109461439A (zh) * 2019-01-08 2019-03-12 深圳市高觉科技有限公司 一种语音信息指令的采集方法
CN109545231A (zh) * 2019-01-08 2019-03-29 深圳市高觉科技有限公司 一种便携式控制智能设备的方法
CN110400568A (zh) * 2018-04-20 2019-11-01 比亚迪股份有限公司 智能语音***的唤醒方法、智能语音***及车辆
CN111105796A (zh) * 2019-12-18 2020-05-05 杭州智芯科微电子科技有限公司 无线耳机控制装置及控制方法、语音控制设置方法和***
CN111199725A (zh) * 2018-10-31 2020-05-26 南京智能仿真技术研究院有限公司 基于人工智能的电子设备多语音控制***
WO2020134062A1 (zh) * 2018-12-25 2020-07-02 广东乐芯智能科技有限公司 一种智能手表语音识别控制的方法及手表
CN111508490A (zh) * 2020-04-16 2020-08-07 程霖锋 一种塔吊智能语音控制***
CN111816183A (zh) * 2020-07-15 2020-10-23 前海人寿保险股份有限公司 基于音视频录制的语音识别方法、装置、设备及存储介质
CN112190240A (zh) * 2020-09-21 2021-01-08 四川大学华西医院 一种基于物联网的老年人健康监测报警设备及方法
CN113467342A (zh) * 2021-08-09 2021-10-01 重庆宗灿科技发展有限公司 一种基于物联网技术的智慧养老***及智能腕表
CN115223552A (zh) * 2021-04-21 2022-10-21 博泰车联网科技(上海)股份有限公司 语音控制方法、终端及计算机存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103594089A (zh) * 2013-11-18 2014-02-19 联想(北京)有限公司 一种语音识别方法及电子设备
CN103841248A (zh) * 2012-11-20 2014-06-04 联想(北京)有限公司 一种信息处理的方法及电子设备
CN104110779A (zh) * 2013-10-22 2014-10-22 广东美的制冷设备有限公司 一种语音空调器及其控制方法以及一种空调器控制***
CN104978958A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和***
CN104978957A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 基于声纹识别的语音控制方法和***
US20150350396A1 (en) * 2012-12-07 2015-12-03 Baidu Online Network Technology (Beijing) Co., Ltd Method for controlling background through voice and mobile terminal
CN105138882A (zh) * 2015-07-30 2015-12-09 广东欧珀移动通信有限公司 一种终端解锁方法和装置
CN105141768A (zh) * 2015-08-31 2015-12-09 努比亚技术有限公司 多用户识别方法、装置及移动终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103841248A (zh) * 2012-11-20 2014-06-04 联想(北京)有限公司 一种信息处理的方法及电子设备
US20150350396A1 (en) * 2012-12-07 2015-12-03 Baidu Online Network Technology (Beijing) Co., Ltd Method for controlling background through voice and mobile terminal
CN104110779A (zh) * 2013-10-22 2014-10-22 广东美的制冷设备有限公司 一种语音空调器及其控制方法以及一种空调器控制***
CN103594089A (zh) * 2013-11-18 2014-02-19 联想(北京)有限公司 一种语音识别方法及电子设备
CN104978958A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和***
CN104978957A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 基于声纹识别的语音控制方法和***
CN105138882A (zh) * 2015-07-30 2015-12-09 广东欧珀移动通信有限公司 一种终端解锁方法和装置
CN105141768A (zh) * 2015-08-31 2015-12-09 努比亚技术有限公司 多用户识别方法、装置及移动终端

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108200492A (zh) * 2017-07-12 2018-06-22 北京金锐德路科技有限公司 语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备
CN107393531A (zh) * 2017-07-20 2017-11-24 Tcl医疗核磁技术(无锡)有限公司 一种医疗检测***的语音控制装置和方法
CN107444318A (zh) * 2017-07-26 2017-12-08 奇瑞汽车股份有限公司 汽车后尾门控制方法及***
CN107426069A (zh) * 2017-08-23 2017-12-01 南京中感微电子有限公司 基于蓝牙的智能家居***及其控制方法
CN107591152A (zh) * 2017-08-30 2018-01-16 百度在线网络技术(北京)有限公司 基于耳机的语音控制方法、装置及其设备
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN108062950A (zh) * 2017-12-20 2018-05-22 歌尔科技有限公司 一种语音唤醒的Dongle设备及语音唤醒方法
CN108182941A (zh) * 2017-12-28 2018-06-19 重庆柚瓣家科技有限公司 用于嘈杂环境下的人机交互模块
CN110400568A (zh) * 2018-04-20 2019-11-01 比亚迪股份有限公司 智能语音***的唤醒方法、智能语音***及车辆
CN109151637A (zh) * 2018-08-21 2019-01-04 歌尔科技有限公司 无线耳机、用于无线耳机的智能语音控制***及方法
CN111199725A (zh) * 2018-10-31 2020-05-26 南京智能仿真技术研究院有限公司 基于人工智能的电子设备多语音控制***
WO2020134062A1 (zh) * 2018-12-25 2020-07-02 广东乐芯智能科技有限公司 一种智能手表语音识别控制的方法及手表
CN109545231A (zh) * 2019-01-08 2019-03-29 深圳市高觉科技有限公司 一种便携式控制智能设备的方法
CN109461439A (zh) * 2019-01-08 2019-03-12 深圳市高觉科技有限公司 一种语音信息指令的采集方法
CN111105796A (zh) * 2019-12-18 2020-05-05 杭州智芯科微电子科技有限公司 无线耳机控制装置及控制方法、语音控制设置方法和***
CN111508490A (zh) * 2020-04-16 2020-08-07 程霖锋 一种塔吊智能语音控制***
CN111816183A (zh) * 2020-07-15 2020-10-23 前海人寿保险股份有限公司 基于音视频录制的语音识别方法、装置、设备及存储介质
CN111816183B (zh) * 2020-07-15 2024-05-07 前海人寿保险股份有限公司 基于音视频录制的语音识别方法、装置、设备及存储介质
CN112190240A (zh) * 2020-09-21 2021-01-08 四川大学华西医院 一种基于物联网的老年人健康监测报警设备及方法
CN115223552A (zh) * 2021-04-21 2022-10-21 博泰车联网科技(上海)股份有限公司 语音控制方法、终端及计算机存储介质
CN113467342A (zh) * 2021-08-09 2021-10-01 重庆宗灿科技发展有限公司 一种基于物联网技术的智慧养老***及智能腕表

Also Published As

Publication number Publication date
CN106920548B (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN106920548A (zh) 语音控制装置、语音控制***和语音控制方法
CN103700371B (zh) 一种基于声纹识别的来电身份识别***及其识别方法
CN110428810B (zh) 一种语音唤醒的识别方法、装置及电子设备
CN108766441A (zh) 一种基于离线声纹识别和语音识别的语音控制方法及装置
CN102999161B (zh) 一种语音唤醒模块的实现方法及应用
CN104986040B (zh) 一种语音识别汽车车速控制器及其控制方法
CN107767861B (zh) 语音唤醒方法、***及智能终端
CN110182155B (zh) 车载控制***的语音控制方法、车载控制***和车辆
CN208044735U (zh) 智能交互式充电桩和智能交互式充电***
CN111105796A (zh) 无线耳机控制装置及控制方法、语音控制设置方法和***
CN106128475A (zh) 基于异常情绪语音辨识的可穿戴智能安全设备及控制方法
CN205354646U (zh) 一种应用于车载设备的智能语音识别***
CN102404278A (zh) 一种基于声纹识别的点歌***及其应用方法
CN202124017U (zh) 基于嵌入式***的语音直接启动汽车与防盗的装置
CN106155621B (zh) 可识别声源位置的关键词语音唤醒***及方法及移动终端
CN103886236A (zh) 声控解锁屏方法和移动终端
CN110834590A (zh) 汽车门开欢迎语***及其控制方法
CN102815279A (zh) 基于嵌入式***的语音直接启动汽车与防盗的方法及装置
CN103198829A (zh) 一种降低车内噪音提高语音识别率的方法、装置和设备
CN102855875A (zh) 基于外部开启控制语音输入的网络语音转换控制***和方法
CN110930643A (zh) 一种防止婴幼儿遗落车内的智能安全***及方法
CN110539721A (zh) 一种车辆控制方法及其装置
CN112634897A (zh) 设备唤醒方法、装置和存储介质及电子装置
CN111445909A (zh) 带语音控制功能的智能锁及其控制方法
CN102868740A (zh) 基于移动通讯终端及互联网语音交互的玩具控制方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant