CN111261142A

CN111261142A - 一种基于单片机的非特定语音识别智能开关***

Info

Publication number: CN111261142A
Application number: CN202010055134.9A
Authority: CN
Inventors: 黄晓明
Original assignee: Binzhou University
Current assignee: Binzhou University
Priority date: 2020-01-17
Filing date: 2020-01-17
Publication date: 2020-06-09

Abstract

本公开提供了一种基于单片机的非特定语音识别智能开关***，包括语音识别模块、主控模块和继电器开关模块；所述语音识别模块用于根据接收到的声音进行频谱分析和提取语音特征，将提取的语音特征与关键词列表中的关键词进行匹配，得到语音识别结果；所述主控模块根据接收到的语音识别结果向继电器开关模块发出控制指令，继电器开关模块根据接收到的指令进行开关动作；本公开实现了家电控制命令的准确识别，避免了复杂的人工训练；通过两种指令的相互配合，降低了其他音源影响，提高了识别率，极大的提高了家电控制的精度。

Description

一种基于单片机的非特定语音识别智能开关***

技术领域

本公开涉及语音识别技术领域，特别涉及一种基于单片机的非特定语音识别智能开关***。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术，并不必然构成现有技术。

“智能家居”是以住宅为平台，集***、结构、控制于一体，利用先进的电力自动化技术、计算机技术、无线电传感技术，将与居家生活有关的各种设备有机地结合起来，通过网络化的综合管理家中设备，来创造一个优质、便利、高效、节能、健康、环保的居住生活环境空间,在大力倡导低碳经济和能源日益短缺的今天，智能家居灯光控制***节约能源，优质环保的优点，越来越突出，随着中国人民生活水平和环保意识的提高，以及中国城镇化的迅速发展，基于单片机的语音智能控制家电设计***必将在中国迎来迅速发展的良机。

本公开发明人发现，传统的家电控制方式，包括开关按键和红外遥控两种，其主要存在如下问题：存在需要人去直接触碰，有强电泄露的安全隐患；控制不方便；不安全，有时为了方便开关进行私接电线这样很不安全；控制地点少，最多只能实现两地控制；控制距离短，不能穿墙；当遥控器型号过多时，信号容易混淆。

发明内容

为了解决现有技术的不足，本公开提供了一种基于单片机的非特定语音识别智能开关***，实现了家电控制命令的准确识别，避免了复杂的人工训练；通过两种指令的相互配合，降低了其他音源影响，提高了识别率，提高了家电控制的精度。

为了实现上述目的，本公开采用如下技术方案：

一种基于单片机的非特定语音识别智能开关***，包括语音识别模块、主控模块和继电器开关模块；

所述语音识别模块用于根据接收到的声音进行频谱分析和提取语音特征，将提取的语音特征与关键词列表中的关键词进行匹配，得到语音识别结果；

所述主控模块根据接收到的语音识别结果向继电器开关模块发出控制指令，继电器开关模块根据接收到的指令进行开关动作。

作为可能的一些实现方式，所述语音识别模块将提取的语音特征与关键词列表中的关键词进行匹配，找出得分最高的关键词语作为识别结果输出。

作为可能的一些实现方式，所述语音识别模块采用多重口令语音识别控制模式，至少包括第一口令和第二口令，当第一口令正确时，才进行第二口令的识别。

作为进一步的限定，所述开关***还包括多个指示灯，至少包括口令指示灯和继电器开关动作指示灯，当主控模块接识别到第一口令且第一口令正确时，控制口令指示灯亮，当主控模块识别到第二口令且第二口令正确时，控制口令指示灯逐渐熄灭，此时继电器执行开关动作，继电器开关动作指示灯亮。

作为进一步的限定，所述主控模块中预设需要识别的关键词语列表，并动态的将关键词语以字符的形式传送到语音识别模块，用于对关键词语进行识别。

作为更进一步的限定，所述关键词语列表设置有多项候选识别句，每个识别句为单字、词组或短句，所述短句为长度为不超过预设字数的汉字或者预设字母数的拼音串。

作为可能的一些实现方式，所述语音识别模块包括信号处理与特征提取模块、发音词典、统计声学模型、语言模型和解码器，所述解码器用于根据提取的输入信号特征，根据统计声学模型、语言模型和发音词典寻找能够以最大概率输出该信号的词串。

作为进一步的限定，所述统计声学模型利用声学语料，采用基于一阶隐马尔科夫模型进行建模。

作为进一步的限定，所述发音词典包含***所能处理的词汇集及其发音，所述发音词典提供声学建模单元与语言模型建模单元间的映射。

作为进一步的限定，所述语言模型用于对***所针对的语言进行建模，包括正则语言，采用基于统计的N元文法及其变体。

与现有技术相比，本公开的有益效果是：

1、本公开实现了家电控制命令的高效和精准识别，不必人工训练即可轻松使用，实现了声音和家电之间的沟通和控制，具有抗干扰能力强、一语多关、安全、方便(老年人和残疾人使用)、灵活等特点，应用前景广阔。

2、本公开采用非特定ASR语音识别和提取关键字技术与STC12LE5A60S2型单片机相结合的方式，ASR技术语音识别芯片把通过MIC输入的声音进行频谱分析、提取语音特征，与关键词列表中的关键词进行匹配，由单片机将命令处理成对家用电器的相应操作指令，实现对家电开关***的控制操作，增加了识别的准确率。

3、本公开所述的语音识别模块预先设定好要识别的关键词语列表，并动态地把这些关键词语以字符的形式传送到芯片内部，就可以对用户说出的关键词语进行识别，不需要用户事先训练和录音的非特定人语音识别模块，本公开可由一个***支持多种场景，并且可以根据当地一些口音，适当加入方言的拼音组合，这样一来还可以识别当地方言，增加了个性化，实用性和推广性强。

4、本公开通过采用两级口令完成对家用电器的控制，极大的降低了其他音源影响，提高了识别率，识别准确率高达95％，且识别列表的关键词可以动态编辑，与别的语音识别***相比有明显优势，便于大力推广和应用。

5、本公开通过特定的语音识别***设计，通过信号处理与特征提取模块、发音词典、统计声学模型、语言模型和解码器的配合，结合可编辑的识别列表，极大的提高了语音识别的准确度，有效的避免的错误识别，而且通过拼音编辑的方式，能够多各种方言进行识别，进一步的提高了识别准确性。

附图说明

图1为本公开实施例1提供的基于单片机的非特定语音识别智能开关***的整体控制流程示意图。

图2为本公开实施例1提供的负载电路整体流程示意图。

图3为本公开实施例1提供的语音识别模块工作流程示意图。

图4为本公开实施例1提供的统计模式识别流程示意图。

具体实施方式

应该指出，以下详细说明都是例示性的，旨在对本公开提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本公开的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

实施例1：

本公开实施例1提供了一种基于单片机的非特定语音识别智能开关***，利用LD3320语音芯片，设计麦克风偏置、单片机控制器、模拟电源辅助等接口电路，编写驱动程序，设计的“语音识别模块”，实现了“家电控制命令”的识别，识别率高，不必人工训练，都可轻松使用。实现了“声音和家电”沟通、控制，安全、方便、灵活。具有抗干扰能力强、一语多关、方便(老年人和残疾人使用)、安全等特点，应用前景广阔。

(1)控制策略设计

具体控制方式如下：

(1-1)非特定ASR语音识别和提取关键字技术与STC12LE5A60S2型单片机结合

本实施例的主要技术关键是语音信号的采集以及处理与判断与语音播放，语音芯片LD3320提供的语音识别技术是基于关键词列表的识别技术。ASR技术语音识别芯片完成的工作就是：把通过MIC输入的声音进行频谱分析、提取语音特征，与关键词列表中的关键词进行匹配，由单片机将命令处理成对家用电器的相应“操作指令”，实现对家电开关***的控制操作，增加了识别的准确率。

(1-2)采用双重口令语音识别控制模式(口令模式+IO控制模式)

在使用语音识别指令之前，都必须先说出：一级口令“白天鹅”，然后才能进行二级口令识别：打开灯光，关闭灯光；打开风扇，关闭风扇；播放音乐，停止播放；打开窗帘，关闭窗帘；全部打开，全部关闭。从而实现控制电路板上面LED灯的开关、风扇的开关、音乐的播放与停止、窗帘的打开与关闭，从而模拟智能家居电器开关控制。(所有口令都可以自定义设置)。

(1-3)多路继电器负载电路产生控制信号控制继电器的关闭

如图2所示，在操作人发出语音指令，***接受后在内部进行处理、查询，产生响应控制信号，从而控制继电器的开关，从而实现家电开关的控制。实现功能为接收语音指令“白天鹅”时，开发板3个红绿蓝LED指示灯点亮，继而接收二级语音指令“开灯”或者“关灯”，3个红绿蓝LED指示灯逐渐熄灭，此时继电器控制的负载LED电灯“点亮”或者“关闭”，通过多路继电器去输出可以去控制家里的家电。

Voice Recognition LD3320语音识别芯片是一款只需要在主控MCU的程序中设定好要识别的关键词语列表，并动态地把这些关键词语以字符的形式传送到芯片内部，就可以对用户说出的关键词语进行识别，不需要用户事先训练和录音的非特定人语音识别模块。该模块可以设置50项候选识别句，每个识别句可以是单字，词组或短句，所述短句为长度为不超过10个汉字或者79个字母的拼音串，可由一个***支持多种场景，并且可以根据当地一些口音，适当加入方言的拼音组合，这样一来还可以识别当地方言，增加了个性化。

(2)硬件设计

本实施例采用STC12LE5A60S2 1T增强型单片机，语音识别采用LD3320语音识别模块，***可通过语音模块和单片机并行通信，整个***的硬件电路主要包括核心主控制和语音识别两个部分主控制部分为STC12LE5A60S2单片机，语音识别部分为LD3320语音识别芯片***，在用户的语音进入语音识别部分后，LD3320将把处理过的数据并行传输到主控制器，主控制器处理后，发送命令数据到可扩展***串行设备实现控制操作。

(2-1)非特定人语音识别模块设计，如图3所示。

(2-1-1)语音识别分三个步骤：频谱分析、特征提取、匹配识别。LD3320已把各部分硬件集成在单芯片上，主要对LD3320进行二次开发；

(2-1-2)LD3320芯片采用并行方式直接与STC12型单片机相接，并均采用10K电阻上拉，A0用于判断是数据段还是地址段控制信号RDBWRBCSBRSTB(复位信号)以及中断返回信号INTB与STC12型单片机直接相连；

(2-1-3)设计步骤：确定寄存器读写操作方式(并行或串行SPI)，熟悉寄存器的功能，确定所需寄存器的地址，编写驱动程序(初始化→写入识别列表→开始识别→响应中断)；

(2-1-4)为了辅助***稳定工作，均采用10k电阻上拉LD3320芯片和单片机采用同一个外部24MHz时钟；

(2-1-5)MBS作为麦克风偏置，并且加接RC电路，以保证能输出一个浮动电压给麦克风。

(2-2)STC12LE5A60S2型单片机控制器

本实施例所述的***选用主控制器STC12LE5A60S2单片机的工作电压为3.3V，拥有8K的FLASH，512字节的SRAM，含有异步串行接口，40个I/O接口，因此足以满足主控制***对资源的需要。

通过MIC输入的声音进行频谱分析->提取语音特征->和关键词语列表中的关键词语进行对比匹配->找出得分最高的关键词语作为识别结果输出。

确定寄存器读写操作方式(并行或串行SPI)，熟悉寄存器的功能，确定所需寄存器的地址，编写驱动程序(初始化→写入识别列表→开始识别→响应中断)；最后由主单片机完成智能开关的控制。

(2-3)多路负载电路控制家居开关

L9110是为控制和驱动电机设计的两通道推挽式功率放大专用集成电路器件，将分立电路集成在单片IC之中，使***器件成本降低，整机可靠性提高。该芯片有两个TTL/CMOS兼容电平的输入，具有良好的抗干扰性；两个输出端能直接驱动电机的正反向运动，它具有较大的电流驱动能力，每通道能通过800mA的持续电流，峰值电流能力可达1.5A；同时它具有较低的输出饱和压降；内置的钳位二极管能释放感性负载的反向冲击电流，使它在驱动继电器、直流电机、步进电机或开关功率管的使用安全可靠。

为了实现对家电电器的控制，本实施例中采用LED灯和继电器模拟实物电灯或者家电，通过语音识别去控制电灯和家电的开关，为降低其他音源影响，提高识别率，本***采用两级指令完成对***的控制。

向LD模块添加关键词时，通过编辑程序定义二维数组设定一级语音指令为“白天鹅”，二级语音指令为“开灯”、“关灯”，设定指令时，添加拼音的输入方式作为关键词数组，例如添加“白天鹅”命令，则写入“bai tian e”，汉字间的拼音用空格隔开。实现功能为接收语音指令“白天鹅”时，开发板3个红绿蓝LED指示灯点亮，继而接收二级语音指令“开灯”或者“关灯”，3个红绿蓝LED指示灯逐渐熄灭，此时继电器控制的负载LED电灯“点亮”或者“关闭”。通过4路继电器去输出可以去控制家电，比如风扇，电视，音响强电控制等等，可以说：“打开风扇”，“关闭风扇”或者“打开音乐”，“关闭音乐”等等，一系列的二级语音口令可以自定义设置去实现对家电的开关控制。

(2-4)典型的基于统计模式识别方法的语音识别***

(2-4-1)信号处理及特征提取模块

该模块的主要任务是从输入信号中提取特征，供声学模型处理。同时，它一般也包括了一些信号处理技术，以尽可能降低由于环境噪声、信道、扬声器等因素对特征造成的影响。

(2-4-2)统计声学模型

典型***多采用基于一阶隐马尔科夫模型进行建模。

(2-4-3)发音词典

发音词典包含***所能处理的词汇集及其发音。发音词典实际提供了声学建模单元与语言模型建模单元间的映射。

(2-4-4)语言模型

语音模型针对***所需要识别的语言进行建模，理论上，包括正则语言，上下文无关文法在内的各种语言模型都可以作为语言模型。但目前各种***普遍采用的还是基于统计的N元文法及其变体。

(2-4-5)解码器

解码器是语音识别***的核心之一，其任务是对输入的信号，根据声学，语言模型及词典寻找能够以最大概率输出该信号的词串。

本实施例实现了非特定人语音对家用电器的远程控制，其意义不光在智能家居上得以体现，同时，它也可以应用于公共照明***、卫生***、楼宇对话、导航仪等多种领域。本实施例所述的基于LD3320的智能识别电器控制***，家居语音智能开关***为非特定人语音识别，结构简单，识别准确率高达95％，性价比高，且识别列表的关键词可以动态编辑，与别的语音识别***相比有明显优势，便于大力推广和应用。

通过MIC麦克风说特定的语音识别指令，从而实现控制家居LED灯光照明的打开和关闭，以及风扇的开关等从来模拟智能家居的控制。

本实施例的硬件模块选型合理，程序功能设计完善，***识别率高，稳定性好，方便集成，较理想地实现了非特定人通过语音指令控制家电***开关的功能，在工业自动控制、医疗***以及智能家居等很多领域具有广阔的市场前景。

以上所述仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述，但并非对本公开保护范围的限制，所属领域技术人员应该明白，在本公开的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims

1.一种基于单片机的非特定语音识别智能开关***，其特征在于，包括语音识别模块、主控模块和继电器开关模块；

2.如权利要求1所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述语音识别模块将提取的语音特征与关键词列表中的关键词进行匹配，找出得分最高的关键词语作为识别结果输出。

3.如权利要求1所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述语音识别模块采用多重口令语音识别控制模式，至少包括第一口令和第二口令，当第一口令正确时，才进行第二口令的识别。

4.如权利要求3所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述开关***还包括多个指示灯，至少包括口令指示灯和继电器开关动作指示灯，当主控模块接识别到第一口令且第一口令正确时，控制口令指示灯亮，当主控模块识别到第二口令且第二口令正确时，控制口令指示灯逐渐熄灭，此时继电器执行开关动作，继电器开关动作指示灯亮。

5.如权利要求3所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述主控模块中预设需要识别的关键词语列表，并动态的将关键词语以字符的形式传送到语音识别模块，用于对关键词语进行识别。

6.如权利要求5所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述关键词语列表设置有多项候选识别句，每个识别句为单字、词组或短句，所述短句为长度为不超过预设字数的汉字或者预设字母数的拼音串。

7.如权利要求1所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述语音识别模块包括信号处理与特征提取模块、发音词典、统计声学模型、语言模型和解码器，所述解码器用于根据提取的输入信号特征，根据统计声学模型、语言模型和发音词典寻找能够以最大概率输出该信号的词串。

8.如权利要求7所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述统计声学模型利用声学语料，采用基于一阶隐马尔科夫模型进行建模。

9.如权利要求7所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述发音词典包含***所能处理的词汇集及其发音，所述发音词典提供声学建模单元与语言模型建模单元间的映射。

10.如权利要求7所述的基于单片机的非特定语音识别智能开关***，其特征在于，所述语言模型用于对***所针对的语言进行建模，包括正则语言，采用基于统计的N元文法及其变体。