CN110309693B

CN110309693B - 多层次状态侦测***与方法

Info

Publication number: CN110309693B
Application number: CN201810306046.4A
Authority: CN
Inventors: 林昭源
Original assignee: Wistron Corp
Current assignee: Wistron Corp
Priority date: 2018-03-27
Filing date: 2018-04-08
Publication date: 2021-06-11
Anticipated expiration: 2038-04-08
Also published as: TW201943263A; TWI666941B; US10621424B2; US20190303656A1; CN110309693A

Abstract

本申请涉及一种多层次状态侦测***与方法，该多层次状态侦测***，包含影像撷取装置，用以撷取侦测对象的影像；位置侦测单元，决定影像当中是否侦测到人；人脸识别单元，通过人脸识别数据库以侦测决定影像当中是否包含有人脸；多层次状态辨识器，接收人脸识别单元的侦测结果，据以决定侦测对象的相应状态及机率；神经网络预测模型数据库，存储已训练的神经网络预测模型，其相关于多个状态类别，如果人脸识别单元未侦测到人脸，则多层次状态辨识器通过神经网络预测模型数据库以辨识得到侦测对象的相应状态；及多层次状态更新器，接收多层次状态辨识器所产生的目前状态与至少一先前状态的机率，据以产生最终状态。

Description

多层次状态侦测***与方法

技术领域

本发明涉及一种监视器，特别涉及一种多层次状态侦测***与方法。

背景技术

婴儿监视器(baby monitor)是一种无线***，用以从远端听到婴儿的声音或/且看到婴儿的影像。例如，使用麦克风置于婴儿附近以接收婴儿的声音，并于远端通过扬声器即时听到所接收的声音。又例如，使用摄影机(video camera)近距拍摄婴儿的影像，将其即时传送至远端的显示器，因此又称为婴儿摄影机(baby cam)。

传统婴儿监视器仅传送未处理的影像或/且声音给父母，因此能够提供的信息极为有限。较先进的婴儿监视器使用穿戴式感测器，例如重力感测器(g-sensor)，但其穿戴会造成婴儿的不舒适。有些婴儿床使用监控式感测器，例如压力感测器(pressure sensor)，然而，这类感测器仅能用以判断婴儿的睡眠品质，并无法真正的侦测出睡眠状态。此外，传统婴儿监视器无法侦测得知一些急迫的状态，例如脸部被覆盖，因此无法借此尽速排除危险情况。

因此亟需提出一种状态侦测机制，用以克服传统婴儿监视器的缺失。

发明内容

鉴于上述，本发明实施例的目的之一在于提出一种多层次状态侦测***与方法，其使用深度(deep)神经网络以进行多层次机器学习(machine learning)，用以侦测被测对象(例如婴儿)的各种状态，且能提供更准确的状态机率。

根据本发明实施例，多层次状态侦测***包含影像撷取装置、位置侦测单元、人脸识别单元、多层次状态辨识器、神经网络预测模型数据库及多层次状态更新器。影像撷取装置用以撷取侦测对象的影像。位置侦测单元决定影像当中是否侦测到人。人脸识别单元通过人脸识别数据库以侦测决定影像当中是否包含有人脸。多层次状态辨识器接收人脸识别单元的侦测结果，据以决定侦测对象的相应状态及机率。神经网络预测模型数据库存储已训练的神经网络预测模型，其相关于多个状态类别，如果人脸识别单元未侦测到人脸，则多层次状态辨识器通过神经网络预测模型数据库以辨识得到侦测对象的相应状态。多层次状态更新器接收多层次状态辨识器所产生的目前状态与至少一先前状态的机率，据以产生最终状态。

附图说明

图1显示本发明实施例的多层次状态侦测***的方框图。

图2显示本发明实施例的多层次状态侦测方法的流程图。

图3显示多层次状态更新器产生最终状态的例子。

图4显示多层次状态更新器产生最终状态的另一例子。

附图标记说明：

100 多层次状态侦测***

10 影像撷取装置

11 影像接口(介面)

12 位置侦测单元

13 人脸识别单元

14 人脸识别数据库

15 多层次状态辨识器

16 神经网络预测模型数据库

17 多层次状态更新器

200 多层次状态侦测方法

20 撷取影像

21 通过影像接口传送影像

22 是否侦测到人

23 侦测人脸

24 是否侦测到人脸

25 眼睛是否张开

26 通过神经网络预测模型数据库以辨识状态

27 状态机率是否超过或等于阈值

28 根据目前与先前状态机率以产生最终状态

α 权重

具体实施方式

图1显示本发明实施例的多层次(multi-level)状态侦测***100的方框图。本实施例可适用以侦测婴儿的睡眠状态，但也可应用于婴儿以外(例如老年人)，或者应用于睡眠以外的状态侦测。图1的方块可使用硬件或/且软件来实施。图2显示本发明实施例的多层次状态侦测方法200的流程图。

在本实施例中，多层次状态侦测***100(以下简称侦测***)可包含影像撷取装置10，用以撷取侦测对象(例如婴儿)的影像(步骤20)。在一例子中，影像撷取装置10可为摄影机(video camera)，用以撷取得到一序列影像，其中至少一部分的影像会进行后续的处理。摄影机可为红绿蓝-红外光(RGB-IR)摄影机，较一般可见光摄影机可撷取得到范围更广的影像，且不受周围光线的影响。在另一例子中，影像撷取装置10可为相机，可依固定时间间隔(或排定时程)撷取影像，每次可撷取得到一张影像以进行后续的处理。

本实施例的侦测***100可包含影像接口11，设于影像撷取装置10与侦测***100的其他元件之间，用以传送影像撷取装置10所撷取的(单张或多张)影像(步骤21)。影像接口11可用以支援影像撷取装置10的各种应用功能，例如选择(selecting)、安装(installing)、配置(configuring)、设定参数(setting parameters)及存取数据，但不限定于此。因此，影像接口11可让影像撷取装置10有效地进行影像的撷取与传送。在本实施例中，影像接口11包含V4L2(Video4Linux version 2)影像接口，其为支援Linus作业***的一种即时影像撷取的驱动程序(device driver)与应用程序接口(applicationprogramming interface(API))。

本实施例的侦测***100可包含位置侦测单元12，其接收影像接口11所传送的影像，并据以决定影像当中是否侦测到人(例如婴儿)(步骤22)及其位置。如果未侦测到人，则表示所要侦测的对象(例如婴儿)不在场；如果侦测到人，则进入步骤23。

在本实施例中，位置侦测单元12使用You Only Look Once(YOLO)物件侦测(object detection)技术，其使用单一神经网络以处理整张影像。相较于传统物件侦测技术于影像的不同区域进行个别训练，YOLO物件侦测技术可加快运算速度。YOLO物件侦测技术的细节可参阅Joseph Redmon等人所发表的“You Only Look Once:Unified,Real-TimeObject Detection”，发表于2016IEEE Conference on Computer Vision and PatternRecognition(CVPR)。

本实施例的侦测***100可包含人脸识别(face recognition)单元13与人脸识别数据库(或函式库)14。其中，人脸识别单元13接收影像接口11所传送的影像，萃取(extract)得到影像当中的人脸特征(facial feature)，并与人脸识别数据库14所存储的人脸特征作比较(步骤23)，以侦测决定影像当中是否包含有人脸。在本实施例中，人脸识别数据库14是使用(但不限定于)多工串接卷积神经网络(multi-task cascadedconvolutional neural network,MTCNN)技术产生的，其对于自然环境中的光线、角度和人脸表情变化较为强健(robust)，因此识别效果优于传统的人脸识别方法，例如开源电脑视觉(Open Source Computer Vision,OpenCV)或dlib。其中，开源电脑视觉(OpenCV)使用基于Haar特征的分类器(Haar feature-based classifiers)，但无法识别侧面/歪斜/光线不足的人脸；dlib虽然改善了开源电脑视觉(OpenCV)的识别效果，但无法实现即时的人脸识别。多工串接卷积神经网络(MTCNN)由于存储量不大，因此可以实现即时的人脸识别。多工串接卷积神经网络(MTCNN)的技术细节可参阅Kaipeng Zhang等人所发表的“Joint FaceDetection and Alignment using Multi-task Cascaded Convolutional Networks”，发表于2016IEEE Signal Processing Letters。

本实施例的侦测***100可包含多层次状态辨识(identification)器15，其接收人脸识别单元13的侦测结果，并对其作进一步的辨识，以决定相应的状态(例如婴儿的睡眠状态)。在一例子中，如果人脸识别单元13侦测得到人脸(步骤24)，则多层次状态辨识器15对所侦测到的人脸进一步辨识其眼睛的闭合或张开(步骤25)，以决定相应状态为睡着或醒着。此外，根据眼睛的闭合或张开程度，多层次状态辨识器15可产生睡着或醒着的机率。

本实施例的侦测***100可包含神经网络预测模型数据库16，其存储已训练的神经网络预测模型，其相关于多个状态类别。在一例子中，神经网络预测模型数据库16的状态类别包含脸部被覆盖及侧趴睡。在本实施例中，如果多层次状态辨识器15自人脸识别单元13所接收的侦测结果是未侦测到人脸(步骤24)，则多层次状态辨识器15会通过神经网络预测模型数据库16以辨识得到影像的相应状态类别(步骤26)，例如脸部被覆盖或侧趴睡。此外，根据影像与神经网络预测模型数据库16的符合程度，多层次状态辨识器15可产生各个状态类别(例如脸部被覆盖及侧趴睡)的机率。如果各个状态类别的机率皆未超过或等于预设阈值(步骤27)，则多层次状态辨识器15可将影像归为未知(undetermined)。本实施例的神经网络预测模型数据库16使用(但不限定于)

提出的Inception module来实施。Inception module的技术细节可参阅Christian Szegedy等人所发表的“Going Deeperwith Convolutions”，发表于2015IEEE Conference on Computer Vision and PatternRecognition(CVPR)。

在一例子中，婴儿的状态类别包含脸部被覆盖、侧趴睡、不在场、醒着、睡着，其中脸部被覆盖、侧趴睡来自步骤27，不在场来自步骤22，醒着、睡着来自步骤25。状态机率可表示为阵列形式：

[脸部被覆盖侧趴睡不在场醒着睡着]

其中所有状态的机率值之和为1。

举例而言，如果人脸识别单元13侦测到人脸，且多层次状态辨识器15辨识得到眼睛为张开，则状态的机率阵列可能为[0 0 0 0.7 0.3]。如果多层次状态辨识器15通过神经网络预测模型数据库16而辨识得到状态为脸部被覆盖，则状态的机率阵列可能为[0.6 0.20.2 0 0]。如果人脸识别单元13未侦测到人脸，且各个状态类别的机率皆未超过或等于预设阈值0.6，则多层次状态辨识器15可将影像归为未知。

本实施例的侦测***100可包含多层次状态更新器17，其接收多层次状态辨识器15所产生的目前与先前状态机率，据以产生最终状态(步骤28)。因此，多层次状态更新器17所产生的最终状态，其准确度较多层次状态辨识器15所决定的状态来得高。

在一例子中，多层次状态更新器17对先前状态机率S1与目前状态机率S0，产生加权和(weighted sum)作为最终状态机率，可表示如下：

S1*α+S0*(1-α)

其中α为权重。

将上述推广至多个先前状态机率，产生加权和作为最终状态机率，可表示如下：

其中S0为目前状态机率，S1为前一次状态机率，Si为S1之前的(n-1)次状态机率，α为权重。

图3显示多层次状态更新器17产生最终状态的例子。对于一般的状态(例如醒着状态)，由于目前状态为醒着与先前状态为醒着为强连结(亦即，若目前为醒着，则先前很可能也是醒着)，因此分派较大的权重α(例如0.3)给先前的相同状态的状态机率，但分派较小的权重(例如0.2)给先前的相异状态的状态机率。

图4显示多层次状态更新器17产生最终状态的另一例子。对于急迫的状态(例如脸部被覆盖状态)，为了避免漏失掉状态为脸部被覆盖的侦测机会，因此分派较小的权重α(例如0.1)给先前的相同状态的状态机率，但分派较大的权重给先前的相异状态的状态机率。

在一例子中，先前的相异状态对应的权重α可以是不同的。例如，取决于目前状态与每一该先前的相异状态各自的连结强度，越大的连结强度对应至越大的权重α。

以上所述仅为本发明的优选实施例而已，并非用以限定本发明的权利要求；凡其它未脱离发明所公开的精神下所完成的等效改变或修饰，均应包含在下述的权利要求内。

Claims

1.一种多层次状态侦测***，包含：

一影像撷取装置，用以撷取侦测对象的影像；

一位置侦测单元，决定该影像当中是否侦测到人；

一人脸识别单元，通过人脸识别数据库以侦测决定该影像当中是否包含有人脸；

一多层次状态辨识器，接收该人脸识别单元的侦测结果，据以决定侦测对象的相应状态及机率；

一神经网络预测模型数据库，存储已训练的神经网络预测模型，其相关于多个状态类别，如果该人脸识别单元未侦测到人脸，则该多层次状态辨识器通过该神经网络预测模型数据库以辨识得到侦测对象的相应状态；及

一多层次状态更新器，接收该多层次状态辨识器所产生的目前状态与至少一先前状态的机率，据以产生最终状态。

2.根据权利要求1所述的多层次状态侦测***，其中该侦测对象为婴儿。

3.根据权利要求1所述的多层次状态侦测***，其中该影像撷取装置包含红绿蓝-红外光摄影机。

4.根据权利要求1所述的多层次状态侦测***，还包含一影像接口，用以传送该影像撷取装置所撷取的影像。

5.根据权利要求1所述的多层次状态侦测***，其中该位置侦测单元使用You OnlyLook Once物件侦测技术以侦测人。

6.根据权利要求1所述的多层次状态侦测***，其中该人脸识别数据库是使用多工串接卷积神经网络技术产生的。

7.根据权利要求1所述的多层次状态侦测***，其中如果该人脸识别单元侦测到人脸，则该多层次状态辨识器对所侦测到的人脸辨识其眼睛的闭合或张开，以决定相应状态为睡着或醒着。

8.根据权利要求1所述的多层次状态侦测***，其中该神经网络预测模型数据库的状态类别包含脸部被覆盖及侧趴睡。

9.根据权利要求1所述的多层次状态侦测***，其中如果所有状态的机率皆未超过或等于预设阈值，则该多层次状态辨识器将该影像归为未知。

10.根据权利要求1所述的多层次状态侦测***，其中该神经网络预测模型数据库是使用

提出的Inception module技术产生的。

11.根据权利要求1所述的多层次状态侦测***，其中该多层次状态更新器对先前状态的机率S1与目前状态的机率S0，产生加权和作为最终状态机率，表示如下：

S1*α+S0*(1-α)

其中α为权重。

12.根据权利要求11所述的多层次状态侦测***，其中对于急迫的状态，分派较小的权重给先前的相同状态的机率，但分派较大的权重给先前的相异状态的机率。

13.根据权利要求11所述的多层次状态侦测***，其中该多层次状态更新器分派不同的权重给先前的相异状态的机率，其中该目前状态与每一该先前的相异状态的连结强度越大，则对应越大的权重。

14.根据权利要求1所述的多层次状态侦测***，其中该多层次状态更新器对多个先前状态的机率与目前状态的机率，产生加权和作为最终状态机率，表示如下：

15.一种多层次状态侦测方法，包含：

(a)撷取侦测对象的影像；

(b)决定该影像当中是否侦测到人；

(c)通过人脸识别数据库以侦测决定该影像当中是否包含有人脸；

(d)根据步骤(c)的侦测结果，据以决定侦测对象的相应状态及机率；

(e)提供一神经网络预测模型数据库，存储已训练的神经网络预测模型，其相关于多个状态类别，如果步骤(c)未侦测到人脸，则通过该神经网络预测模型数据库以辨识得到侦测对象的相应状态；及

(f)根据目前状态与至少一先前状态的机率，据以产生最终状态。

16.根据权利要求15所述的多层次状态侦测方法，其中该侦测对象为婴儿。

17.根据权利要求15所述的多层次状态侦测方法，还包含一步骤：通过影像接口以传送步骤(a)所撷取的影像。

18.根据权利要求15所述的多层次状态侦测方法，其中该步骤(b)使用You Only LookOnce物件侦测技术以侦测人。

19.根据权利要求15所述的多层次状态侦测方法，其中该人脸识别数据库是使用多工串接卷积神经网络技术产生的。

20.根据权利要求15所述的多层次状态侦测方法，其中如果步骤(c)侦测到人脸，则对所侦测到的人脸辨识其眼睛的闭合或张开，以决定相应状态为睡着或醒着。

21.根据权利要求15所述的多层次状态侦测方法，其中该神经网络预测模型数据库的状态类别包含脸部被覆盖及侧趴睡。

22.根据权利要求15所述的多层次状态侦测方法，其中如果所有状态的机率皆未超过或等于预设阈值，则将该影像归为未知。

23.根据权利要求15所述的多层次状态侦测方法，其中该神经网络预测模型数据库是使用

提出的Inception module技术产生的。

24.根据权利要求15所述的多层次状态侦测方法，其中该步骤(f)对先前状态的机率S1与目前状态的机率S0，产生加权和作为最终状态机率，表示如下：

S1*α+S0*(1-α)

其中α为权重。

25.根据权利要求24所述的多层次状态侦测方法，其中对于急迫的状态，分派较小的权重给先前的相同状态的机率，但分派较大的权重给先前的相异状态的机率。

26.根据权利要求24所述的多层次状态侦测方法，其中该步骤(f)分派不同的权重给先前的相异状态的机率，其中该目前状态与每一该先前的相异状态的连结强度越大，则对应越大的权重。

27.根据权利要求15所述的多层次状态侦测方法，其中该步骤(f)对多个先前状态的机率与目前状态的机率，产生加权和作为最终状态机率，表示如下：