WO2017050120A1

WO2017050120A1 - 儿童锁启动方法及装置

Info

Publication number: WO2017050120A1
Application number: PCT/CN2016/098070
Authority: WO
Inventors: 龚松
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-09-21
Filing date: 2016-09-05
Publication date: 2017-03-30
Also published as: CN106548779A

Abstract

一种儿童锁启动方法及装置，其中，该方法包括：提取受限用户的预定时间长度的声音特征（S102）；判断该声音特征与预先设置的声音特征是否匹配（S104）；在判断结果为是的情况下，启动儿童锁模式（S106），解决了相关技术中对儿童锁启动方式不够智能的问题，能够根据声音启动儿童锁，提高了用户体验。

Description

儿童锁启动方法及装置

技术领域

本发明涉及通信领域，具体而言，涉及一种儿童锁启动方法及装置。

背景技术

目前市面上的机顶盒已广泛使用于用户家庭的客厅布局中，其中针对儿童锁的操作方式基本都是通过家长每次去主动设置儿童锁的开关或者密码而进行的，这种操作方式存在的缺陷在于家长在观看结束时，要靠自身意志来控制儿童锁的开关，这样的做法是不够完善的，完全取决于家长是否记得这件事情，不够智能。

针对相关技术中对儿童锁的启动方式不够智能的问题，还未提出有效的解决方案。

发明内容

本发明实施例提供了一种儿童锁启动方法及装置，以至少解决相关技术中对儿童锁的启动方式不够智能的问题。

根据本发明实施例的一个方面，提供了一种儿童锁启动方法，包括：提取受限用户的预定时间长度的声音特征；判断所述声音特征与预先设置的声音特征是否匹配；在判断结果为是的情况下，启动儿童锁模式。

可选地，提取受限用户的预定时间长度的声音特征包括：在机顶盒的儿童锁界面通过录音设备获取所述受限用户的预定时间长度的声音文件；根据所述声音文件提取所述声音特征。

可选地，根据所述声音文件提取所述声音特征包括：对所述声音文件的语音信号进行预处理，包括：去除非语音信号和静默语音信号，对所述语音信号进行分帧；提取每一帧语音信号的梅尔频率倒谱(Mel Frequency Cepstrum Coefficient，简称为MFCC)参数并保存；使用提取的所述MFCC参数训练所述受限用户的高斯混合模型，得到所述受限用户的声音特征。

可选地，判断所述声音特征与预先设置的声音特征是否匹配包括：计算当前采集到的高斯混合模型匹配数据库中预先保存的高斯混合模型的概率，并控制一个概率阈值，得出当前提取的声音特征与预先储存的声音特征是否匹配。

可选地，在启动所述儿童锁模式之后，所述方法还包括：通过重启所述机顶盒关闭所述儿童锁模式。

根据本发明实施例的另一方面，还提供了一种儿童锁启动装置，包括：提取模块，设置为提取受限用户的预定时间长度的声音特征；判断模块，设置为判断所述声音特征与预先设置的声音特征是否匹配；启动模块，设置为在判断结果为是的情况下，启动儿童锁模式。

可选地，所述提取模块包括：获取单元，设置为在机顶盒的儿童锁界面通过录音设备获取所述受限用户的预定时间长度的声音文件；提取单元，设置为根据所述声音文件提取所述声音特征。

可选地，所述提取单元包括：预处理子单元，设置为对所述声音文件的语音信号进行预处理，包括：去除非语音信号和静默语音信号，对所述语音信号进行分帧；提取子单元，设置为提取每一帧语音信号的梅尔频率倒谱MFCC参数并保存；训练子单元，设置为使用提取的所述MFCC参数训练所述受限用户的高斯混合模型，得到所述受限用户的声音特征。

可选地，所述判断模块包括：计算单元，设置为计算当前采集到的高斯混合模型匹配数据库中预先保存的高斯混合模型的概率，并控制一个概率阈值，得出当前提取的声音特征与预先储存的声音特征是否匹配。

可选地，所述装置还包括：关闭模块，设置为通过重启所述机顶盒关闭所述儿童锁模式。

根据本发明的又一个实施例，还提供了一种存储介质。该存储介质设置为存储用于执行以下步骤的程序代码：

提取受限用户的预定时间长度的声音特征；判断所述声音特征与预先设置的声音特征是否匹配；在判断结果为是的情况下，启动儿童锁模式。

可选地，存储介质还设置为存储用于执行以下步骤的程序代码：

提取受限用户的预定时间长度的声音特征包括：在机顶盒的儿童锁界面通过录音设备获取所述受限用户的预定时间长度的声音文件；根据所述声音文件提取所述声音特征。

根据所述声音文件提取所述声音特征包括：对所述声音文件的语音信号进行预处理，包括：去除非语音信号和静默语音信号，对所述语音信号进行分帧；提取每一帧语音信号的梅尔频率倒谱(Mel Frequency Cepstrum Coefficient，简称为MFCC)参数并保存；使用提取的所述MFCC参数训练所述受限用户的高斯混合模型，得到所述受限用户的声音特征。

判断所述声音特征与预先设置的声音特征是否匹配包括：计算当前采集到的高斯混合模型匹配数据库中预先保存的高斯混合模型的概率，并控制一个概率阈值，得出当前提取的声音特征与预先储存的声音特征是否匹配。

在启动所述儿童锁模式之后，所述方法还包括：通过重启所述机顶盒关闭所述儿童锁模式。

通过本发明实施例，采用提取受限用户的预定时间长度的声音特征；判断所述声音特征与预先设置的声音特征是否匹配；在判断结果为是的情况下，启动儿童锁模式，解决了相关技术中对儿童锁的启动方式不够智能的问题，能够根据声音启动儿童锁，提高了用户体验。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的儿童锁启动方法的流程图一；

图2是根据本发明实施例的儿童锁启动装置的框图；

图3是根据本发明优选实施例的儿童锁启动装置的框图一；

图4是根据本发明优选实施例的儿童锁启动装置的框图二；

图5是根据本发明优选实施例的儿童锁启动装置的框图三；

图6是根据本发明优选实施例的儿童锁启动装置的框图四；

图7是根据本发明实施例的机顶盒开机阶段的流程图；

图8是根据本发明实施例的机顶盒日常后台监听的流程图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明实施例提供了一种儿童锁启动方法，图1是根据本发明实施例的儿童锁启动方法的流程图一，如图1所示，包括：

步骤S102，提取受限用户的预定时间长度的声音特征；

步骤S104，判断该声音特征与预先设置的声音特征是否匹配；

步骤S106，在判断结果为是的情况下，启动儿童锁模式。

通过上述步骤，提取受限用户的预定时间长度的声音特征；判断该声音特征与预先设置的声音特征是否匹配；在判断结果为是的情况下，启动儿童锁模式，解决了相关技术中对儿童锁的启动方式不够智能的问题，能够根据声音启动儿童锁，提高了用户体验。

可选地，在机顶盒的儿童锁界面通过录音设备获取该受限用户的预定时间长度的声音文件；根据该声音文件提取该声音特征。

可选地，根据该声音文件提取该声音特征包括：对该声音文件的语音信号进行预处理，包括：去除非语音信号和静默语音信号，对该语音信号进行分帧；提取每一帧语音信号的梅尔频率倒谱MFCC参数并保存；使用提取的该MFCC参数训练该受限用户的高斯混合模型，得到该受限用户的声音特征。

可选地，判断该声音特征与预先设置的声音特征是否匹配可以包括：计算当前采集到的高斯混合模型匹配数据库中预先保存的高斯混合模型的概率，并控制一个概率阈值，得出当前提取的声音特征与预先储存的声音特征是否匹配。

可选地，在启动该儿童锁模式之后，通过重启该机顶盒关闭该儿童锁模式。

本发明实施例还提供了一种儿童锁启动装置，图2是根据本发明实施例的儿童锁启动装置的框图，如图2所示，包括：

提取模块22，设置为提取受限用户的预定时间长度的声音特征；

判断模块24，设置为判断该声音特征与预先设置的声音特征是否匹配；

启动模块26，设置为在判断结果为是的情况下，启动儿童锁模式。

图3是根据本发明优选实施例的儿童锁启动装置的框图一，如图3所示，提取模块22包括：

获取单元32，设置为在机顶盒的儿童锁界面通过录音设备获取该受限用户的预定时间长度的声音文件；

提取单元34，设置为根据该声音文件提取该声音特征。

图4是根据本发明优选实施例的儿童锁启动装置的框图二，如图4所示，提取单元34包括：

预处理子单元42，设置为对该声音文件的语音信号进行预处理，包括：去除非语音信号和静默语音信号，对该语音信号进行分帧；

提取子单元44，设置为提取每一帧语音信号的梅尔频率倒谱MFCC参数并保存；

训练子单元46，设置为使用提取的该MFCC参数训练该受限用户的高斯混合模型，得到该受限用户的声音特征。

图5是根据本发明优选实施例的儿童锁启动装置的框图三，如图5所示，判断模块24包括：

计算单元52，设置为计算当前采集到的高斯混合模型匹配数据库中预先保存的高斯混合模型的概率，并控制一个概率阈值，得出当前提取的声音特征与预先储存的声音特征是否匹配。

图6是根据本发明优选实施例的儿童锁启动装置的框图四，如图6所示，该装置还包括：

关闭模块62，设置为通过重启该机顶盒关闭该儿童锁模式。

下面结合优选实施例对本发明实施例进行进一步说明。

本发明实施例提出了一种儿童锁的自动激活机制，即通过声纹识别的方法来完成这个功能，首先家长进入机顶盒的儿童锁界面，通过麦克风设备将儿童10秒的声音录入机顶盒中，保存以后该功能就立即生效，除非家里新增了儿童否则无需再修改，该功能在机顶盒正常开机后会检查当前盒子是否已录入了童音声纹文件，如有的话便立即启动后台声纹监听模式，通过即时声纹特征提取来和之前录入的声音特征进行对比，如判断为一致则自动打开童锁，整个用户操作除了第一次的儿童声音数据提取和童锁相关功能设置外，后续都无需其他的人为控制，达到家庭客厅的儿童模式自动值守功能。需要说明的是，该功能可以单独使用或配合传统手动设置童锁功能一起使用均可。

图7是根据本发明实施例的机顶盒开机阶段的流程图，如图7所示，开机阶段，机顶盒开机后，监听到开机成功的广播后，声纹监听服务被***启动，启动后检查当前是否已存在声纹特征文件，如已存在则将其读出，自身常驻于后台即时通过麦克采集环境中的声音数据，如检查到当前并不存在任何声纹特征文件，则立即退出。

声纹首次输入阶段，家长在机顶盒的设置界面通过麦克录入儿童的声音，盒子的设置模块将此时采集到的10秒声音，通过声纹特征提取，声纹建模最后生成声纹特征文件保存于盒子中。

图8是根据本发明实施例的机顶盒日常后台监听的流程图，如图8所示，日常监听阶段，声纹监听服务在盒子日常运行中，每隔半分钟采集一次环境中的10秒音频数据，对其中的声音数据进行声纹特征提取，提取完成后，和盒子之前录入的儿童声纹数据进行对比，如判断一致的话则立即打开童锁，启动童锁模式。

上述的声纹特征提取包括以下步骤：

1、首先对录音设备采集到的码流进行预处理，即先通过固定时间内采样个数为一帧的方式对音频数据进行分帧，然后对其每帧的语音信号做平方求和运算的方式，去除静默(没声音的时间段)声音；

2、然后对每帧信号加窗减少吉布斯效应信号重复，屏蔽掉；

3、通过FFT(快速傅里叶变换)将难以看出特性的时域信号变换为信号的功率谱，通过功率谱上的不同能量分布，就能代表不同语音的特性；

4、使用三角带通滤波器，模拟人耳的掩蔽效应(屏蔽掉人耳听不到的声音)，将频谱平滑化，消除谐波；

5、通过离散余弦变换，将信号最终变换成一组描述语音特征的MFCC梅尔频率倒谱参数；

6、最后对上述的MFCC参数建立高斯混合模型，保存于数据库中。

上述的声纹特征匹配的步骤是，通过后验概率计算当前采集到的说话者的语音序列匹配上数据中语音高斯混合模型的概率，并控制一个概率阀值，来得出当前收集的语音信号和数据库中是否有匹配数据，若匹配则自动启动童锁，达到目的。

需要说明的是，上述的声纹特征提取以及声纹特征匹配的过程与相关技术中相同，具体细节不再赘述。

下面对儿童锁启动的几种场景进行进一步说明。

1、只有家长观看电视：启动机顶盒后，只有家长在观看电视时，儿童锁由于声纹监听服务采集到的声音数据并不能和已保存的儿童声音数据匹配，故此处家长无需操作，儿童锁也不会被打开。

2、只有儿童在看电视：启动机顶盒后，只有儿童在观看电视时，儿童锁由于声纹监听服务采集到的声音数据和已保存的儿童声音数据相匹配，故儿童锁会被打开，儿童使用机顶盒受到了保护。

3、家长和儿童一块在看电视，之后家长走了，剩下儿童一个人，这时由于声纹监听服务是常驻后台的，所以家长一旦走了后，短时间内盒子就会进入儿童模式。

4、家长和儿童一块在看电视，之后儿童走了之后，电视可能仍处于儿童模式中，这时家长只需重启机顶盒即可关闭儿童模式。

5、家长和儿童一块在看电视：启动机顶盒后，由于有家长在，此时声纹监听服务采集到的声音数据并不一定能匹配上，所以儿童锁并不一定会打开，不过由于此时家长在场，此时是否打开了儿童锁并没有关系。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

工业实用性

Claims

一种儿童锁启动方法，包括：

提取受限用户的预定时间长度的声音特征；

判断所述声音特征与预先设置的声音特征是否匹配；

在判断结果为是的情况下，启动儿童锁模式。
根据权利要求1所述的方法，其中，提取受限用户的预定时间长度的声音特征包括：

在机顶盒的儿童锁界面通过录音设备获取所述受限用户的预定时间长度的声音文件；

根据所述声音文件提取所述声音特征。
根据权利要求2所述的方法，其中，根据所述声音文件提取所述声音特征包括：

对所述声音文件的语音信号进行预处理，包括：去除非语音信号和静默语音信号，对所述语音信号进行分帧；

提取每一帧语音信号的梅尔频率倒谱MFCC参数并保存；

使用提取的所述MFCC参数训练所述受限用户的高斯混合模型，得到所述受限用户的声音特征。
根据权利要求3所述的方法，其中，判断所述声音特征与预先设置的声音特征是否匹配包括：

计算当前采集到的高斯混合模型匹配数据库中预先保存的高斯混合模型的概率，并控制一个概率阈值，得出当前提取的声音特征与预先储存的声音特征是否匹配。
根据权利要求1至4中任一项所述的方法，其中，在启动所述儿童锁模式之后，所述方法还包括：

通过重启所述机顶盒关闭所述儿童锁模式。
一种儿童锁启动装置，包括：

提取模块，设置为提取受限用户的预定时间长度的声音特征；

判断模块，设置为判断所述声音特征与预先设置的声音特征是否匹配；

启动模块，设置为在判断结果为是的情况下，启动儿童锁模式。
根据权利要求6所述的装置，其中，所述提取模块包括：

获取单元，设置为在机顶盒的儿童锁界面通过录音设备获取所述受限用户的预定时间长度的声音文件；

提取单元，设置为根据所述声音文件提取所述声音特征。
根据权利要求7所述的装置，其中，所述提取单元包括：

预处理子单元，设置为对所述声音文件的语音信号进行预处理，包括：去除非语音信号和静默语音信号，对所述语音信号进行分帧；

提取子单元，设置为提取每一帧语音信号的梅尔频率倒谱MFCC参数并保存；

训练子单元，设置为使用提取的所述MFCC参数训练所述受限用户的高斯混合模型，得到所述受限用户的声音特征。
根据权利要求8所述的装置，其中，所述判断模块包括：

计算单元，设置为计算当前采集到的高斯混合模型匹配数据库中预先保存的高斯混合模型的概率，并控制一个概率阈值，得出当前提取的声音特征与预先储存的声音特征是否匹配。
根据权利要求6至9中任一项所述的装置，其中，所述装置还包括：

关闭模块，设置为通过重启所述机顶盒关闭所述儿童锁模式。