CN113066263A - 一种预防疲劳驾驶的方法及装置 - Google Patents

一种预防疲劳驾驶的方法及装置 Download PDF

Info

Publication number
CN113066263A
CN113066263A CN202010002665.1A CN202010002665A CN113066263A CN 113066263 A CN113066263 A CN 113066263A CN 202010002665 A CN202010002665 A CN 202010002665A CN 113066263 A CN113066263 A CN 113066263A
Authority
CN
China
Prior art keywords
driver
behavior
test
voice
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010002665.1A
Other languages
English (en)
Inventor
熊群芳
胡云卿
林军
岳伟
刘悦
肖罡
袁浩
游俊
丁驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CRRC Zhuzhou Institute Co Ltd
Original Assignee
CRRC Zhuzhou Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CRRC Zhuzhou Institute Co Ltd filed Critical CRRC Zhuzhou Institute Co Ltd
Priority to CN202010002665.1A priority Critical patent/CN113066263A/zh
Publication of CN113066263A publication Critical patent/CN113066263A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/06Alarms for ensuring the safety of persons indicating a condition of sleep, e.g. anti-dozing alarms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Ophthalmology & Optometry (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Signal Processing (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种预防疲劳驾驶的方法及装置,应用于轨道交通。上述方法包括:响应于轨道列车运行,按预设频率输出语音指令,以指令轨道列车的驾驶员执行语音指令对应的测试行为;响应于语音指令的输出,根据该语音指令对应的测试行为从对应的采集装置获取输出语音指令后预设时间段内的驾驶员行为数据;基于测试行为对驾驶员行为数据进行关键特征提取;基于驾驶员行为数据中的关键特征判断驾驶员是否执行测试行为;以及响应于驾驶员未执行测试行为,输出报警信号。本发明还提供改了用以实现上述方法的装置。根据本发明所提供的预防疲劳驾驶的方法及装置与司机无接触,安全、可靠、实时、有效地预防司机疲劳驾驶。

Description

一种预防疲劳驾驶的方法及装置
技术领域
本发明涉及应用于轨道交通的交互方法,尤其是涉及一种预防疲劳驾驶的方法与装置。
背景技术
疲劳驾驶是指在一段时间的驾车之后所产生的反应水平下降,反应迟钝,判断迟缓,节奏缓慢等是驾驶员疲劳驾驶的主要表现,疲劳驾驶是引发交通事故的重要因素,随着人们的生活水平不断提高,铁路运输日益繁忙,列车运行密度更为拥挤,稍有大意就会发生车毁人亡的事故,根据有关部门统计,建国以来全国火车发生的交通事故,其中司机疲劳驾驶导致发生事故的比例占整个事故的40%以上,对此各机务段加大了对司机的安全教育和处罚,但仍有一部分人,我行我素疲劳驾车,严重影响了铁路运输秩序和人民生命财产的安全。
目前国内外预防疲劳驾驶方法主要包括定制专门的防瞌睡安全仪、智能眼镜和震动头带设备、智能手环等传统方法,大部分预防方法都需要和驾驶员身体直接接触,轻者易使驾驶员身体不适,重者将影响驾驶员驾驶,从而导致交通事故的发生。
因此,亟需要一种新型的预防驾驶员疲劳驾驶的方法与装置,能够不需要和驾驶员有身体解除,从而确保驾驶员能在舒适状态下驾驶,同时又能够保证起到预防驾驶员疲劳驾驶的作用,提高驾驶安全性。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
为了解决现有技术中存在的问题,本发明提出了一种预防疲劳驾驶的方法,应用于轨道交通,具体包括:
响应于轨道列车运行,按预设频率输出语音指令,以指令上述轨道列车的驾驶员执行上述语音指令对应的测试行为;
响应于语音指令的输出,根据该语音指令对应的测试行为从对应的采集装置获取输出语音指令后预设时间段内的驾驶员行为数据;
基于上述测试行为对上述驾驶员行为数据进行关键特征提取;
基于上述驾驶员行为数据中的关键特征判断上述驾驶员是否执行上述测试行为;以及
响应于上述驾驶员未执行上述测试行为,输出报警信号。
在上述方法的一实施例中,可选的,上述测试行为为动作行为;
获取驾驶员行为数据进一步包括:获取摄像头模块采集的在上述预设时间段内的连续多帧图像为上述驾驶员行为数据。
在上述方法的一实施例中,可选的,上述动作行为进一步包括眨眼行为;
进行关键特征提取进一步包括:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取眼部特征点为上述关键特征;
判断上述驾驶员是否执行上述测试行为进一步包括:基于上述连续多帧图像中上述眼部特征点的纵横比判断上述驾驶员是否执行眨眼行为。
在上述方法的一实施例中,可选的,上述动作行为进一步包括张嘴行为;
进行关键特征提取进一步包括:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取嘴部特征点为上述关键特征;
判断上述驾驶员是否执行上述测试行为进一步包括:基于上述连续多帧图像的上述嘴部特征点拟合的嘴唇内轮廓曲线判断上述驾驶员是否执行张嘴行为。
在上述方法的一实施例中,可选的,上述动作行为进一步包括执行手势行为;
进行关键特征提取进一步包括:对每一帧图像,判断并提取该图像中的手部特征点为上述关键特征;
判断上述驾驶员是否执行上述测试行为进一步包括:基于预设的手势模型比对上述连续多帧图像中的上述手部特征点以判断上述驾驶员是否执行手势行为。
在上述方法的一实施例中,可选的,上述测试行为为跟读行为;
获取驾驶员行为数据进一步包括:获取拾音器模块采集的上述预设时间段内的语音音频为上述驾驶员行为数据;
进行关键特征提取进一步包括:判断并提取上述语音音频中的语音信号为上述关键特征;
判断上述驾驶员是否执行上述测试行为进一步包括:对上述语音信号进行语音识别以判断上述驾驶员是否执行跟读行为。
本发明还提供了一种预防疲劳驾驶的装置,应用于轨道交通,具体包括:
存储器;和
与上述存储器耦接的处理器,上述处理器配置为:
响应于轨道列车运行,按预设频率输出语音指令,以指令上述轨道列车的驾驶员执行上述语音指令对应的测试行为;
响应于语音指令的输出,根据该语音指令对应的测试行为从对应的采集装置获取输出语音指令后预设时间段内的驾驶员行为数据;
基于上述测试行为对上述驾驶员行为数据进行关键特征提取;
基于上述驾驶员行为数据中的关键特征判断上述驾驶员是否执行上述测试行为;以及
响应于上述驾驶员未执行上述测试行为,输出报警信号。
在上述装置的一实施例中,可选的,上述测试行为为动作行为;
上述处理器获取驾驶员行为数据进一步包括:获取摄像头模块采集的在上述预设时间段内的连续多帧图像为上述驾驶员行为数据。
在上述装置的一实施例中,可选的,上述动作行为进一步包括眨眼行为;
上述处理器进行关键特征提取进一步包括:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取眼部特征点为上述关键特征;
上述处理器判断上述驾驶员是否执行上述测试行为进一步包括:基于上述连续多帧图像中上述眼部特征点的纵横比判断上述驾驶员是否执行眨眼行为。
在上述装置的一实施例中,可选的,上述动作行为进一步包括张嘴行为;
上述处理器进行关键特征提取进一步包括:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取嘴部特征点为上述关键特征;
上述处理器判断上述驾驶员是否执行上述测试行为进一步包括:基于上述连续多帧图像的上述嘴部特征点拟合的嘴唇内轮廓曲线判断上述驾驶员是否执行张嘴行为。
在上述装置的一实施例中,可选的,上述动作行为进一步包括执行手势行为;
上述处理器进行关键特征提取进一步包括:对每一帧图像,判断并提取该图像中的手部特征点为上述关键特征;
上述处理器判断上述驾驶员是否执行上述测试行为进一步包括:基于预设的手势模型比对上述连续多帧图像中的上述手部特征点以判断上述驾驶员是否执行手势行为。
在上述装置的一实施例中,可选的,上述测试行为为跟读行为;
上述处理器获取驾驶员行为数据进一步包括:获取拾音器模块采集的上述预设时间段内的语音音频为上述驾驶员行为数据;
上述处理器进行关键特征提取进一步包括:判断并提取上述语音音频中的语音信号为上述关键特征;
上述处理器判断上述驾驶员是否执行上述测试行为进一步包括:对上述语音信号进行语音识别以判断上述驾驶员是否执行跟读行为。
本发明还提供了一种计算机可读介质,其上存储有计算机可读指令,上述计算机可读指令在由处理器执行时实施如上述的预防疲劳驾驶的方法的任一实施例中的步骤。
根据本发明所提供的预防疲劳驾驶的方法及装置,不需要和驾驶员有身体解除,从而确保驾驶员能在舒适状态下驾驶,同时通过语音***实现与驾驶员的人机交互,不仅能够保证起到预防驾驶员疲劳驾驶的作用,同时由于驾驶员不需要使用眼睛去看,只需要用耳朵去听,能够进一步提高驾驶安全性。
附图说明
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
图1示出了本发明所提供的预防疲劳驾驶方法的总流程图。
图2示出了本发明所提供的预防疲劳驾驶方法一实施例的部分流程图。
图3示出了本发明所提供的预防疲劳驾驶方法另一实施例的部分流程图。
图4示出了本发明所提供的预防疲劳驾驶方法另一实施例的部分流程图。
图5示出了本发明所提供的预防疲劳驾驶方法另一实施例的部分流程图。
图6示出了本发明所提供的预防疲劳驾驶的装置的示意图。
附图标记
600 装置
610 处理器
620 存储器
具体实施方式
给出以下描述以使得本领域技术人员能够实施和使用本发明并将其结合到具体应用背景中。各种变型、以及在不同应用中的各种使用对于本领域技术人员将是容易显见的,并且本文定义的一般性原理可适用于较宽范围的实施例。由此,本发明并不限于本文中给出的实施例,而是应被授予与本文中公开的原理和新颖性特征相一致的最广义的范围。
在以下详细描述中,阐述了许多特定细节以提供对本发明的更透彻理解。然而,对于本领域技术人员显而易见的是,本发明的实践可不必局限于这些具体细节。换言之,公知的结构和器件以框图形式示出而没有详细显示,以避免模糊本发明。
请读者注意与本说明书同时提交的且对公众查阅本说明书开放的所有文件及文献,且所有这样的文件及文献的内容以参考方式并入本文。除非另有直接说明,否则本说明书(包含任何所附权利要求、摘要和附图)中所揭示的所有特征皆可由用于达到相同、等效或类似目的的可替代特征来替换。因此,除非另有明确说明,否则所公开的每一个特征仅是一组等效或类似特征的一个示例。
注意,在使用到的情况下,标志左、右、前、后、顶、底、正、反、顺时针和逆时针仅仅是出于方便的目的所使用的,而并不暗示任何具体的固定方向。事实上,它们被用于反映对象的各个部分之间的相对位置和/或方向。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
注意,在使用到的情况下,进一步地、较优地、更进一步地和更优地是在前述实施例基础上进行另一实施例阐述的简单起头,该进一步地、较优地、更进一步地或更优地后带的内容与前述实施例的结合作为另一实施例的完整构成。在同一实施例后带的若干个进一步地、较优地、更进一步地或更优地设置之间可任意组合的组成又一实施例。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“耦接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
首先,请参考图1来理解本发明所提供的预防疲劳驾驶方法的步骤。如图1所示出的,本发明所提供的预防疲劳驾驶方法具体包括:步骤S100:判断列车是否处于运行状态;响应于列车处于运行状态,执行步骤S200:按照预设频率输出语音指令;步骤S300:根据该语音指令对应的测试行为从对应的采集装置获取输出语音指令后预设时间段内的驾驶员行为数据;步骤S400:基于测试行为对驾驶员行为数据进行关键特征提取;步骤S500:基于驾驶员行为数据中的关键特征判断驾驶员是否执行测试行为;以及响应于驾驶员执行测试行为,重复执行步骤S100-S500;响应于驾驶员没有执行测试行为,执行步骤S600:输出报警信号,随后再重复执行步骤S100-S500。
对于步骤S100,如上所描述的,为了保证铁路运输秩序和人民生命财产的安全,本发明所提供的预防疲劳驾驶的方法贯穿于列车运行的整个过程中,从而确保列车的驾驶员能够在列车运行过程中始终保持清醒的状态。因此,本发明所提供的预防疲劳驾驶的方法首先包括步骤S100,判断列车是否处于运行状态。
响应于列车处于运行状态,执行步骤S200:按照预设频率输出语音指令,以指令轨道列车的驾驶员执行语音指令对应的测试行为。具体的,在上述步骤S200中,如上所描述的,语音指令的输出是贯穿整个列车运行过程中的,因此,需要按照预设的频率时刻提醒驾驶员。上述的预设频率可以根据实际需要设定,例如,在一实施例中,每隔3分钟进行一次语音播报。
更进一步的,在步骤S200中,按照预设频率每次所播放的语音指令以指令驾驶员执行语音指令对应的测试行为是随机的。在本发明中,所输出的语音指令所对应的测试行为主要分为动作行为和语音行为。其中,动作行为又进一步包括眨眼行为、张嘴行为和手势行为。语音行为主要包括跟读行为。在步骤S200中,按照预设频率播放语音指令以每次随机使驾驶员执行上述行为中的一个行为来使驾驶员保持清醒,并且也能够判断驾驶员是否处于疲劳驾驶状态。
请一并结合图2-图5来理解不同的测试行为所对应的本发明所提供的预防疲劳驾驶的不同实施例。
首先,请结合图2,在图2中,步骤S200进一步具体为步骤S210:输出语音指令对应眨眼行为。因此,步骤S300进一步具体为步骤S310:获取摄像头模块采集的在预设时间段内的连续多帧图像为驾驶员行为数据。
具体的,对于动作类的行为,可以通过摄像头模块来采集驾驶员的行为数据,从而能够根据所采集的驾驶员行为数据判断驾驶员是否执行了预定的行为。进一步的,响应于语音指令的输出,即可以控制摄像头模块采集驾驶员的行为数据,为了使整个预防疲劳驾驶的方法顺利进行,可以采集在语音指令输出后的一段预设时间内的图像,例如,上述的预设时间可以是30s,也就是说,驾驶员在语音指令输出后,需要及时执行语音指令对应的行为,才能被认为没有处于疲劳驾驶状态。
可以理解的是,为了获取驾驶员的行为数据,摄像头模块需要安装在能够拍摄到驾驶员正脸图像以及手部手势图像的位置,摄像头模块的安装位置可以视情况而定。同时,本发明所提及到的摄像头模块可以通过现有或将有的技术实现,对于摄像头模块的具体设置和实现方法不应不当地限制本发明的保护范围。
在采集了驾驶员的行为数据后,执行步骤S400,从驾驶员行为数据中提取关键特征,进一步的,对应于眨眼行为,步骤S400进一步具体为步骤S410:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取眼部特征点为关键特征。
更为具体的,在一实施例中,对摄像头采集的每一帧图像使用SSD人脸检测算法,通过将待检测图片的RGB图像作为网络的输入,训练网络模型。训练中将一张完整的图片送进网络获得各个特征层,在特征层回归目标窗口,判断窗口是否存在人脸。一旦检测到人脸特征,使用landmark算法实现眼部特征点提取,根据特征点坐标截取眼睛区域,然后将获得的眼睛区域图像输入到采用卷积神经网络训练好的眼睛分类模型中,最终判定当前眼睛区域图像的状态。
因此,在如图2所示出的实施例中,步骤S500基于关键特征判断驾驶员是否执行相应的测试行为进一步具体为步骤S510:基于连续多帧图像中眼部特征点的纵横比判断驾驶员是否执行眨眼动作。
具体的,在步骤S510中,采用基于眼睛周围特征点纵横比(eye aspect ratio(EAR))概念实现眼部眨眼判断。可以理解的是,对于睁开的眼睛而言,其纵横比是大于闭着的眼睛的。也就是说,对于所得到的眼睛分类模型而言,如果多帧图像中的眼睛分类模型的纵横比经历了从大到小,再从小到大的过程,则可以认为在该连续多帧图像中,驾驶员执行了眨眼行为。反之,如果没有检测到人脸,或者没有提取到眼睛特征比,或者所提取到的眼睛特征比的纵横比始终保持基本相同的数值,则认为驾驶员并没有执行眨眼行为,可以认为驾驶员可能存在疲劳驾驶,需要执行步骤S600:输出报警信号。
请结合图3来理解本发明所提供的预防疲劳驾驶的方法的另一实施例。,在图3中,步骤S200进一步具体为步骤S220:输出语音指令对应张嘴行为。因此,步骤S300进一步具体为步骤S310:获取摄像头模块采集的在预设时间段内的连续多帧图像为驾驶员行为数据。
具体的,对于动作类的行为,可以通过摄像头模块来采集驾驶员的行为数据,从而能够根据所采集的驾驶员行为数据判断驾驶员是否执行了预定的行为。进一步的,响应于语音指令的输出,即可以控制摄像头模块采集驾驶员的行为数据,为了使整个预防疲劳驾驶的方法顺利进行,可以采集在语音指令输出后的一段预设时间内的图像,例如,上述的预设时间可以是30s,也就是说,驾驶员在语音指令输出后,需要及时执行语音指令对应的行为,才能被认为没有处于疲劳驾驶状态。
可以理解的是,为了获取驾驶员的行为数据,摄像头模块需要安装在能够拍摄到驾驶员正脸图像以及手部手势图像的位置,摄像头模块的安装位置可以视情况而定。同时,本发明所提及到的摄像头模块可以通过现有或将有的技术实现,对于摄像头模块的具体设置和实现方法不应不当地限制本发明的保护范围。
在采集了驾驶员的行为数据后,执行步骤S400,从驾驶员行为数据中提取关键特征,进一步的,对应于张嘴行为,步骤S400进一步具体为步骤S420:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取嘴部特征点为关键特征。
更为具体的,在一实施例中,对摄像头采集的每一帧图像使用SSD人脸检测算法,通过将待检测图片的RGB图像作为网络的输入,训练网络模型。训练中将一张完整的图片送进网络获得各个特征层,在特征层回归目标窗口,判断窗口是否存在人脸。一旦检测到人脸特征,使用landmark算法实现嘴部特征点提取,根据特征点坐标截取嘴巴区域,然后将获得的嘴巴区域图像输入到采用卷积神经网络训练好的嘴巴分类模型中,最终判定当前嘴巴区域图像的状态。
因此,在如图3所示出的实施例中,步骤S500基于关键特征判断驾驶员是否执行相应的测试行为进一步具体为步骤S520:基于连续多帧图像的嘴部特征点拟合的嘴唇内轮廓曲线判断驾驶员是否执行张嘴动作。
具体的,在步骤S520中,采用基于特征点曲线拟合的嘴唇内轮廓检测方法实现嘴部张开程度计算,实现嘴部是否张开判断。可以理解的是,对于张开的嘴巴而言,其嘴唇内轮廓曲线的曲率是大于闭着的嘴巴的。也就是说,对于所得到的嘴巴分类模型而言,如果多帧图像中的嘴巴分类模型的内轮廓曲线的曲率经历了从大到小,再从小到大的过程,则可以认为在该连续多帧图像中,驾驶员执行了张嘴行为。反之,如果没有检测到人脸,或者没有提取到嘴巴特征比,或者所提取到的嘴部特征比的嘴唇内轮廓曲线始终保持基本一致,则认为驾驶员并没有执行张嘴行为,可以认为驾驶员可能存在疲劳驾驶,需要执行步骤S600:输出报警信号。
请结合图4来理解本发明所提供的预防疲劳驾驶的方法的另一实施例。,在图4中,步骤S200进一步具体为步骤S230:输出语音指令对应手势行为。因此,步骤S300进一步具体为步骤S310:获取摄像头模块采集的在预设时间段内的连续多帧图像为驾驶员行为数据。
具体的,对于动作类的行为,可以通过摄像头模块来采集驾驶员的行为数据,从而能够根据所采集的驾驶员行为数据判断驾驶员是否执行了预定的行为。进一步的,响应于语音指令的输出,即可以控制摄像头模块采集驾驶员的行为数据,为了使整个预防疲劳驾驶的方法顺利进行,可以采集在语音指令输出后的一段预设时间内的图像,例如,上述的预设时间可以是30s,也就是说,驾驶员在语音指令输出后,需要及时执行语音指令对应的行为,才能被认为没有处于疲劳驾驶状态。
可以理解的是,为了获取驾驶员的行为数据,摄像头模块需要安装在能够拍摄到驾驶员正脸图像以及手部手势图像的位置,摄像头模块的安装位置可以视情况而定。同时,本发明所提及到的摄像头模块可以通过现有或将有的技术实现,对于摄像头模块的具体设置和实现方法不应不当地限制本发明的保护范围。
在采集了驾驶员的行为数据后,执行步骤S400,从驾驶员行为数据中提取关键特征,进一步的,对应于手势行为,步骤S400进一步具体为步骤S430:对每一帧图像,判断并提取手部特征点为关键特征。
更为具体的,在一实施例中,对摄像头采集的每一帧图像对摄像头采集的帧图像使用YOLOV3算法检测手部位置。可以理解的是,对于手部姿态的检测,并不限于上述的YOLOV3算法,还可以通过例如SSD、openpose检测方法实现,更进一步的,亦可以通过将有的算法实现,具体的手部特征点的提取算法不应不当地限制本发明的保护范围。
因此,在如图4所示出的实施例中,步骤S500基于关键特征判断驾驶员是否执行相应的测试行为进一步具体为步骤S530:基于预设的手势模型比对连续多帧图像中的手部特征点判断驾驶员是否执行手势行为。
具体的,在步骤S530中,首先需要获取与语音指令对应的标准手势行为的标准手势模型。上述标准手势模型可以预先设置在手势特征数据库中。可以理解的是,上述的手势行为可以包括某些静态的手势比划,例如比出数字“5”等,也可以包括某些动态的手势,例如执行握拳的动作。因此标准手势模型可以包括静态模型,也可以包括动态模型。可以理解的是,上述的静态模型也可以以每一帧均相同的动态模型的形式来表示。可以通过将动态模块中的标准帧中的手部特征点与连续多帧图像中的每一帧的手部特征点做比对,通过设置预设的比对阈值来判断驾驶员是否执行了相关的手势行为。可以理解的是,上述比对标准手势模型的方法的描述仅为示意性,不应不当地限制本发明的保护范围。如果认为驾驶员没有执行相关手势行为,则需要执行步骤S600:输出报警信号。
请结合图5来理解本发明所提供的预防疲劳驾驶的方法的另一实施例。,在图5中,步骤S200进一步具体为步骤S230:输出语音指令对应跟读行为。因此,步骤S300进一步具体为步骤S320:获取拾音器模块采集的在预设时间段内的语音音频为驾驶员行为数据。
具体的,对于语音类的行为,可以通过拾音器模块(麦克风)来采集驾驶员的行为数据,从而能够根据所采集的驾驶员行为数据判断驾驶员是否执行了预定的行为。进一步的,响应于语音指令的输出,即可以控制拾音器模块采集驾驶员的行为数据,为了使整个预防疲劳驾驶的方法顺利进行,可以采集在语音指令输出后的一段预设时间内的语音音频,例如,上述的预设时间可以是30s,也就是说,驾驶员在语音指令输出后,需要及时执行语音指令对应的行为,才能被认为没有处于疲劳驾驶状态。
可以理解的是,本发明所提及到的拾音器模块可以通过现有或将有的技术实现,对于拾音器模块的具体设置和实现方法不应不当地限制本发明的保护范围。
在采集了驾驶员的行为数据后,执行步骤S400,从驾驶员行为数据中提取关键特征,进一步的,对应于跟读行为,步骤S400进一步具体为步骤S440:判断并提取语音音频中的语音信号作为关键特征。
可以理解的是,在一段语音音频中,驾驶员并非时刻都在进行跟读行为,因此所获取的语音音频并非都是有效地可以被用来进行语音识别的信号,因此需要对于有效的语音信号进行提取,以部分消除噪声和不同说话人带来的影响,使处理后的语音信号更能反映语音的本质特征。可以通过端点检测和语音增强来实现上述目的。端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高模型的精确度和识别正确率有重要作用。语音增强的主要任务就是消除环境噪声对语音的影响,目前通用的方法是采用维纳滤波,该方法在噪声较大的情况下效果好于其它滤波器。可以理解的是,上述对于语音信号的提取方法可以采用现有或将有的其他方法进行,语音信号的提取方法不应不当地限制本发明的保护范围。
因此,在如图5所示出的实施例中,步骤S500基于关键特征判断驾驶员是否执行相应的测试行为进一步具体为步骤S540:对语音信号进行语音识别以判断驾驶员是否执行了跟读行为。上述对于语音信号进行语音识别的方法可以通过现有或将有的方法去实现,关于语音识别的实现方法不应不当地限制本发明的保护范围。如果在语音识别后认为驾驶员没有执行相关跟读行为,则需要执行步骤S600:输出报警信号。
在步骤S600中,响应于判断出驾驶员没有执行语音指令所对应的行为,则认为驾驶员可能存在疲劳驾驶的情况,因此,可以输出报警信号以提醒驾驶员保持清醒。
可以理解的是,上述的报警信号可以通过扬声器输出一段警示声,也可以通过预设在座位上的震动器来震动以提醒驾驶员保持清醒。本领域技术人员应当明白的是,上述的报警信号包括但不限于上述的警示声或震动信号,可以根据实际需要、实际硬件条件调整。
在一较优的实施例中,在步骤S600中,还进一步包括判断一段时间内驾驶员的状态,例如,统计驾驶员在一定时间内做眨眼、张嘴、手部握拳及数据比划等相关动作的次数,如果驾驶员做动作次数大于等于总次数60%以上,则判断驾驶员做了相关动作,没有处于疲劳驾驶状态。对应地,如果驾驶员执行相关行为的总次数低于一定阈值,则认为驾驶员处于非常严重的疲劳驾驶状态,此时,所输出的报警信号可以一并包括通知后台监控工作人员、对列车进行限速等等强制措施,以优先保证列车的安全运行。
据此,已经描述了本发明所提供的预防疲劳驾驶的方法,在本发明中,通过语音***不断地发出语音指令,从而使得驾驶员需要始终保持人机交互状态,能够有效地预防驾驶员的疲劳驾驶。同时通过检测驾驶员是否执行了相关行为来预判驾驶员是否已经处于疲劳驾驶状态,从而能够通过输出报警信号来提醒驾驶员保持清醒,从而能够保证驾驶安全。
进一步的,本发明所提供的预防疲劳驾驶的方法并不需要与驾驶员有任何的肢体解除,能够保证驾驶员在舒适状态下驾驶。并且由于采用的语音***,所有的人机交互的实现并不需要驾驶员用眼睛去看,只需要用耳朵去听,从而能够进一步保证驾驶的安全性能。
本发明还提供了一种预防疲劳驾驶的装置,请参考图6,图6示出了该预防疲劳驾驶的装置的示意图。如图6所示,上述预防疲劳驾驶的装置600包括处理器610和存储器620。上述预防疲劳驾驶的装置600的处理器610在执行存储器620上存储的计算机程序时能够实现上述所描述的预防疲劳驾驶的方法,具体请参考上述关于预防疲劳驾驶的方法的描述,在此不再赘述。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现如上述预防疲劳驾驶的方法的任一实施例所描述的步骤。
根据本发明所提供的预防疲劳驾驶的方法及装置,不需要和驾驶员有身体解除,从而确保驾驶员能在舒适状态下驾驶,同时通过语音***实现与驾驶员的人机交互,不仅能够保证起到预防驾驶员疲劳驾驶的作用,同时由于驾驶员不需要使用眼睛去看,只需要用耳朵去听,能够进一步提高驾驶安全性。
结合本文所公开的实施例描述的各种解说性逻辑模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。
提供之前的描述是为了使本领域中的任何技术人员均能够实践本文中所描述的各种方面。但是应该理解,本发明的保护范围应当以所附权利要求书为准,而不应被限定于以上所解说实施例的具体结构和组件。本领域技术人员在本发明的精神和范围内,可以对各实施例进行各种变动和修改,这些变动和修改也落在本发明的保护范围之内。

Claims (13)

1.一种预防疲劳驾驶的方法,应用于轨道交通,其特征在于,包括:
响应于轨道列车运行,按预设频率输出语音指令,以指令所述轨道列车的驾驶员执行所述语音指令对应的测试行为;
响应于语音指令的输出,根据该语音指令对应的测试行为从对应的采集装置获取输出语音指令后预设时间段内的驾驶员行为数据;
基于所述测试行为对所述驾驶员行为数据进行关键特征提取;
基于所述驾驶员行为数据中的关键特征判断所述驾驶员是否执行所述测试行为;以及
响应于所述驾驶员未执行所述测试行为,输出报警信号。
2.如权利要求1所述的方法,其特征在于,所述测试行为为动作行为;
获取驾驶员行为数据进一步包括:获取摄像头模块采集的在所述预设时间段内的连续多帧图像为所述驾驶员行为数据。
3.如权利要求2所述的方法,其特征在于,所述动作行为进一步包括眨眼行为;
进行关键特征提取进一步包括:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取眼部特征点为所述关键特征;
判断所述驾驶员是否执行所述测试行为进一步包括:基于所述连续多帧图像中所述眼部特征点的纵横比判断所述驾驶员是否执行眨眼行为。
4.如权利要求2所述的方法,其特征在于,所述动作行为进一步包括张嘴行为;
进行关键特征提取进一步包括:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取嘴部特征点为所述关键特征;
判断所述驾驶员是否执行所述测试行为进一步包括:基于所述连续多帧图像的所述嘴部特征点拟合的嘴唇内轮廓曲线判断所述驾驶员是否执行张嘴行为。
5.如权利要求2所述的方法,其特征在于,所述动作行为进一步包括手势行为;
进行关键特征提取进一步包括:对每一帧图像,判断并提取该图像中的手部特征点为所述关键特征;
判断所述驾驶员是否执行所述测试行为进一步包括:基于预设的手势模型比对所述连续多帧图像中的所述手部特征点以判断所述驾驶员是否执行手势行为。
6.如权利要求1所述的方法,其特征在于,所述测试行为为跟读行为;
获取驾驶员行为数据进一步包括:获取拾音器模块采集的所述预设时间段内的语音音频为所述驾驶员行为数据;
进行关键特征提取进一步包括:判断并提取所述语音音频中的语音信号为所述关键特征;
判断所述驾驶员是否执行所述测试行为进一步包括:对所述语音信号进行语音识别以判断所述驾驶员是否执行跟读行为。
7.一种预防疲劳驾驶的装置,应用于轨道交通,其特征在于,包括:
存储器;和
与所述存储器耦接的处理器,所述处理器配置为:
响应于轨道列车运行,按预设频率输出语音指令,以指令所述轨道列车的驾驶员执行所述语音指令对应的测试行为;
响应于语音指令的输出,根据该语音指令对应的测试行为从对应的采集装置获取输出语音指令后预设时间段内的驾驶员行为数据;
基于所述测试行为对所述驾驶员行为数据进行关键特征提取;
基于所述驾驶员行为数据中的关键特征判断所述驾驶员是否执行所述测试行为;以及
响应于所述驾驶员未执行所述测试行为,输出报警信号。
8.如权利要求7所述的装置,其特征在于,所述测试行为为动作行为;
所述处理器获取驾驶员行为数据进一步包括:获取摄像头模块采集的在所述预设时间段内的连续多帧图像为所述驾驶员行为数据。
9.如权利要求8所述的装置,其特征在于,所述动作行为进一步包括眨眼行为;
所述处理器进行关键特征提取进一步包括:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取眼部特征点为所述关键特征;
所述处理器判断所述驾驶员是否执行所述测试行为进一步包括:基于所述连续多帧图像中所述眼部特征点的纵横比判断所述驾驶员是否执行眨眼行为。
10.如权利要求8所述的装置,其特征在于,所述动作行为进一步包括张嘴行为;
所述处理器进行关键特征提取进一步包括:对每一帧图像,判断该图像中是否包含人脸特征,响应于检测到包含人脸特征,提取嘴部特征点为所述关键特征;
所述处理器判断所述驾驶员是否执行所述测试行为进一步包括:基于所述连续多帧图像的所述嘴部特征点拟合的嘴唇内轮廓曲线判断所述驾驶员是否执行张嘴行为。
11.如权利要求8所述的装置,其特征在于,所述动作行为进一步包括手势行为;
所述处理器进行关键特征提取进一步包括:对每一帧图像,判断并提取该图像中的手部特征点为所述关键特征;
所述处理器判断所述驾驶员是否执行所述测试行为进一步包括:基于预设的手势模型比对所述连续多帧图像中的所述手部特征点以判断所述驾驶员是否执行手势行为。
12.如权利要求7所述的装置,其特征在于,所述测试行为为跟读行为;
所述处理器获取驾驶员行为数据进一步包括:获取拾音器模块采集的所述预设时间段内的语音音频为所述驾驶员行为数据;
所述处理器进行关键特征提取进一步包括:判断并提取所述语音音频中的语音信号为所述关键特征;
所述处理器判断所述驾驶员是否执行所述测试行为进一步包括:对所述语音信号进行语音识别以判断所述驾驶员是否执行跟读行为。
13.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令在由处理器执行时实施如权利要求1-6中任意一项所述预防疲劳驾驶的方法的步骤。
CN202010002665.1A 2020-01-02 2020-01-02 一种预防疲劳驾驶的方法及装置 Pending CN113066263A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010002665.1A CN113066263A (zh) 2020-01-02 2020-01-02 一种预防疲劳驾驶的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010002665.1A CN113066263A (zh) 2020-01-02 2020-01-02 一种预防疲劳驾驶的方法及装置

Publications (1)

Publication Number Publication Date
CN113066263A true CN113066263A (zh) 2021-07-02

Family

ID=76559346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010002665.1A Pending CN113066263A (zh) 2020-01-02 2020-01-02 一种预防疲劳驾驶的方法及装置

Country Status (1)

Country Link
CN (1) CN113066263A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792663A (zh) * 2021-09-15 2021-12-14 东北大学 一种驾驶员酒驾以及疲劳驾驶的检测方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256706A (zh) * 2007-02-26 2008-09-03 株式会社电装 睡眠告警装置
US20130188838A1 (en) * 2012-01-19 2013-07-25 Utechzone Co., Ltd. Attention detection method based on driver's reflex actions
CN103247149A (zh) * 2012-02-08 2013-08-14 由田信息技术(上海)有限公司 依据驾驶员反射动作之注意力侦测装置及其方法
CN103253275A (zh) * 2012-02-17 2013-08-21 由田新技股份有限公司 交互式语音提问的驾驶注意力侦测装置及其方法
CN104828095A (zh) * 2014-09-02 2015-08-12 北汽福田汽车股份有限公司 检测驾驶员驾驶状态的方法、装置及***
CN107126224A (zh) * 2017-06-20 2017-09-05 中南大学 一种基于Kinect的轨道列车驾驶员状态的实时监测和预警方法与***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256706A (zh) * 2007-02-26 2008-09-03 株式会社电装 睡眠告警装置
US20130188838A1 (en) * 2012-01-19 2013-07-25 Utechzone Co., Ltd. Attention detection method based on driver's reflex actions
CN103247149A (zh) * 2012-02-08 2013-08-14 由田信息技术(上海)有限公司 依据驾驶员反射动作之注意力侦测装置及其方法
CN103253275A (zh) * 2012-02-17 2013-08-21 由田新技股份有限公司 交互式语音提问的驾驶注意力侦测装置及其方法
CN104828095A (zh) * 2014-09-02 2015-08-12 北汽福田汽车股份有限公司 检测驾驶员驾驶状态的方法、装置及***
CN107126224A (zh) * 2017-06-20 2017-09-05 中南大学 一种基于Kinect的轨道列车驾驶员状态的实时监测和预警方法与***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792663A (zh) * 2021-09-15 2021-12-14 东北大学 一种驾驶员酒驾以及疲劳驾驶的检测方法、装置及存储介质
CN113792663B (zh) * 2021-09-15 2024-05-14 东北大学 一种驾驶员酒驾以及疲劳驾驶的检测方法、装置及存储介质

Similar Documents

Publication Publication Date Title
US10657945B2 (en) Noise control method and device
US11227638B2 (en) Method, system, medium, and smart device for cutting video using video content
CN101593425B (zh) 一种基于机器视觉的疲劳驾驶监控方法及***
WO2021159987A1 (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
WO2021169742A1 (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
CN103530912A (zh) 一种具有情绪识别功能的考勤***及方法
US20220084529A1 (en) Method and apparatus for awakening wearable device
WO2021151310A1 (zh) 语音通话的噪声消除方法、装置、电子设备及存储介质
CN109558788B (zh) 静默语音输入辨识方法、计算装置和计算机可读介质
US20230260535A1 (en) A computer-implemented method of providing data for an automated baby cry assessment
CN112078590B (zh) 一种驾驶行为监测方法及***
CN112754498B (zh) 驾驶员的疲劳检测方法、装置、设备及存储介质
CN116386277A (zh) 疲劳驾驶检测方法、装置、电子设备及介质
CN104078051A (zh) 一种人声提取方法、***以及人声音频播放方法及装置
CN104361887A (zh) 行车噪声环境下的快速声学事件检测***
CN113331841A (zh) 一种公交车危险系数评定方法、算法盒子及***
CN113066263A (zh) 一种预防疲劳驾驶的方法及装置
CN106531195A (zh) 一种对话冲突检测方法及装置
CN111028838A (zh) 一种语音唤醒方法、设备及计算机可读存储介质
Reddy et al. Soft Computing Techniques for Driver Alertness
CN112489363A (zh) 基于智能无线耳机的后方来车预警方法、设备及存储介质
CN105989328A (zh) 检测人员使用手持装置的方法及装置
CN205210978U (zh) 行车记录仪
Aboagye et al. Design and Development of Computer Vision-Based Driver Fatigue Detection and Alert System
WO2023284813A1 (zh) 一种基于深度学习算法的鼾声监测方法与***以及相应的电动床控制方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210702