CN103118227A - 一种基于kinect的摄像机PTZ控制方法、装置和*** - Google Patents

一种基于kinect的摄像机PTZ控制方法、装置和*** Download PDF

Info

Publication number
CN103118227A
CN103118227A CN201210488406XA CN201210488406A CN103118227A CN 103118227 A CN103118227 A CN 103118227A CN 201210488406X A CN201210488406X A CN 201210488406XA CN 201210488406 A CN201210488406 A CN 201210488406A CN 103118227 A CN103118227 A CN 103118227A
Authority
CN
China
Prior art keywords
palm
action
gesture
kinect
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210488406XA
Other languages
English (en)
Inventor
魏建程
丁保剑
高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PCI Suntek Technology Co Ltd
Original Assignee
PCI Suntek Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PCI Suntek Technology Co Ltd filed Critical PCI Suntek Technology Co Ltd
Priority to CN201210488406XA priority Critical patent/CN103118227A/zh
Publication of CN103118227A publication Critical patent/CN103118227A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于kinect的摄像机PTZ控制方法、装置和***,可以达到通过人体动作,就可以对安防监控的摄像机进行PTZ控制,不需要复杂的操作界面,让视频监控***对摄像机的PTZ控制操作更简易更方便;该方法、装置和***包括:通过kinect捕捉人体动作,并将人体动作向量数据输入到行为识别软件,经过相应的数据优化、数据转换和行为判断后,再把人体动作转换成监控摄像机的PTZ控制命令,如上移、下移、左移、右移、画面放大、画面缩小、切换预设位、启动雨刷等,发送控制命令到摄像机进行PTZ控制,让摄像机执行相应的动作,并通过实时视频画面实时地展现操作结果。

Description

一种基于kinect的摄像机PTZ控制方法、装置和***
技术领域
本发明涉及安防技术领域,更具体地说,涉及基于kinect的摄像机PTZ控制方法、装置和***。
背景技术
Kinect是美国微软公司于2010年11月4日推出的XBOX360游戏机体感周边外设的正式名称,起初名为Nata1,意味初生。它实际上是一种3D体感摄影机,利用即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能让玩家摆脱传统游戏手柄的束缚,通过自己的肢体控制游戏,并且实现与互联网玩家互动,分享图片、影音信息。
PTZ在安防监控是Pan/Tilt/Zoom简写,代表云台全方位(上下、左右)移动及镜头变倍、变焦控制。以普通监控控制PTZ,一般采用多芯连线,控制器以开关触点控制云台、镜头各个方向的连接供电,以达到云台移动、镜头变倍的目的。目前数字硬盘录像机(DVR)控制云台及镜头则多采用RS485通讯,仅需二线(或二芯带屏蔽线)即能实现。
传统的PTZ控制方法,都是通过专用键盘,或在软件上点击相应的PTZ控制按钮进行PTZ控制,控制方式都要依赖于相应的设备,并进行物理的接触操作,方能实现PTZ的控制。控制方式不灵活,也不方便,不够人性化。现在通过和kinect设备的融合,通过人体的手势既可以实现对PTZ进行云台控制,不但符合普通人操作习惯,也可以更直观的进行摄像头的控制。
发明内容
本发明所要解决的技术问题是提供一种基于kinect的摄像机PTZ控制方法、装置和***,实现通过人的手势即可对摄像机的PTZ进行云台控制,以减少现有技术中PTZ控制需通过专用控制键盘的弊端。
为实现上述发明目的,本发明提供一种基于Kinect的摄像机PTZ控制***,包括Kinect装置、监控摄像机。
所述Kinect装置,用于:获取深度数据,从而提取出人体的骨骼点并跟踪,返回骨骼点的坐标信息给计算机。
所述监控摄像机,用于:安防上的视频监控。
本发明还提供基于隐马尔科夫模型的动作识别方法,包括:
先用大量的动作数据对模型进行训练,求取各个合适的参数值;
将动作转化为一段时间内的点的轨迹,找出这段轨迹的最佳匹配,确定动作含义。
优选的有,上述方法中,还包括:
由上述方案可以看出,本发明中通过Kinect跟踪人体的骨骼点,在一段时间内获取人体某些骨骼点的移动轨迹,根据这些轨迹找到动作的最佳匹配,获取该动作的指令含义,生成相应的PTZ控制指令,把PTZ控制指令发送给摄像机,从而进行PTZ控制。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明***结构示意图;
图2为本发明***处理信息流程示意图;
图3为本发明流程示意图;
图4为本发明装置结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一,参见图1,图2。
本发明提供一种基于kinect的摄像机PTZ控制方法、装置和***,所述***包括手势识别装置和PTZ命令转换器,所述手势识别装置有kinect和动作识别器,所述PTZ命令转换器PZT控制平台和摄像机视频,其中:
所述kinect,用于:捕捉人体动作,并转换动作为矩阵数据,并提供部分简单动作识别判断;
所述动作识别器,用于:接受kinect发送过来的手势数据和初步动作判断结果,再通过对数据的优化和最佳匹配算法,结合上下动作语境,从预先定义的动作库中获取最符合的手势命令;
所述PZT控制平台,用于:获取手势命令数据后,根据摄像机的实际支持状况,发送对应的操作命令给摄像机;
所述摄像机视频,用于:用于实时显示摄像机的画面和工作状态,包括执行的操作提示和各种状态数据的叠加;
上述***的工作过程参见图3,具体包括以下步骤:
步骤S301,kinect通过图像摄像头和深度摄像头捕获人体动作;
步骤S302,调用kinect提供的SDK从kinect中获取动作向量数据,并作初步动作判断;
步骤S303,动作识别器判断初步识别的手势是否符合预设动作;
步骤S304,动作识别器判断动作合法,则直接转换为手势命令;
步骤S305,动作识别器根据手势动作的速度生成控制命令的步长;
步骤S306,PTZ控制平台根据要操作的摄像机生成具体的操作命令;
步骤S307,PTZ控制平台发送控制命令到指定的摄像机;
步骤S308,摄像机视频实时展现控制命令的接受和执行状态。
步骤S309,动作识别器判定初步手势动作无法识别,则对手势数据进行智能修复;
步骤S310,动作识别器对修复完的手势数据再做一次动作识别;
步骤S311,动作识别器判定修复完的数据符合预定动作的许可范围之内,并选择最符合的手势命令。
步骤S311,动作识别器判定修复完的数据不符合预定动作的许可范围之内,则直接发送提示数据到摄像机视频,提示手势无法识别。
本发明所述***适合在有一定活动场合的室内和室外使用。
实施例二,参见图4。
本发明还提供一种基于模块化划分的装置,包括:
动作识别装置11,用于捕获人体动作并转换为响应的控制命令:
人体动作获取模块110,通过kinect捕捉人体动作视频数据;
动作数据化模块111,将人体动作获取模块110人体动作视频数据转换为可以为计算机能识别的向量数据;
转换控制命令模块112,用于识别动作数据化模块111的动作数据为具体的动作命令;
动作识别模块113,用于解析动作识别模块112的动作命令为PTZ控制命令;
PTZ控制装置21,用于接受动作识别装置的控制命令,并控制摄像机:
命令接受模块210,接受动作识别装置的控制命令;
命令转换模块211,解析命令接受模块210的命令为对应摄像机可以识别的命令格式;
命令发送模块212,转发命令转换模块211的控制命令到指定的摄像机,从而实现对摄像机的控制。
由上可见,本发明提供的一种基于kinect的摄像机PTZ控制方法、装置和***,有以下优点。
(1)便于控制操作
本发明让对摄像机的PTZ控制只需要简单的人体动作就可以完成,省去了专用键盘或软件,而且通过人体动作来控制也使得用户使用起来更加自然,用户体验更好。
(2)适用范围广
只要有Kinect以及相应的软件,就可以对任意的摄像机进行PTZ控制。
(3)可拓展性强
由于人体的动作有很多,可以各自赋给不一样的含义,当想加一些控制功能的时候只需要把这个相应的动作判断添加到软件中即可,无需更改硬件。
(4)操作范围广
由于Kinect有一个相对较大的操作范围,不必站在某个操作仪器前,只需要在范围内即可操作。
(5)增加了趣味性
用身体去控制设备,这不但让人眼前一亮,相比起枯燥的键盘操作能给使用者带来更多的愉悦感。
通过以上的方法实施例的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于kinect的摄像机PTZ控制方法,其特征在于,包括Kinect捕获人体动作,根据Kinect捕获人体动作分析人体动作,从中判断所述人体动作是否符合***要求;
所述Kinect捕获人体动作,是通过Kinect获取深度数据,然后通过算法提取出人体的骨骼点并跟踪,以坐标的形式返回骨骼点位置,根据骨骼点的轨迹可以分析出人体动作;
所述分析人体动作,本质上是找一段时间里点的轨迹的最佳匹配,根据匹配的结果判断出动作的含义。
2.根据权利要求1所述的方法,其特征在于,还包括:
用户操作交互方式,通过虚拟人物实时显示用户手势动作,根据手势含义,提示用户正在进行的控制命令,并通过视频画面,实时展现手势操作的结果;如果出现设备无法实现该手势对应的控制命令,则提示用户该设备无法实现该手势命令;对于非规范化手势,通过智能匹配算法,确定用户操作指令,若该手势匹配率不够,即手势无法识别,则提示用户动作无法识别。
3.根据权利要求1所述的方法,其特征在于:动作轨迹的最佳匹配;
所述动作轨迹的最佳匹配步骤具体为:通过Kinect实时获取人体骨骼数据和深度数据,提取出人体手势动作数据,利用智能手势动作算法,判断人体手势有一定幅度的运动,并识别单位时间内该运动的连续轨迹,然后通过智能匹配算法,与预定好的动作数据进行符合率匹配,更具匹配结果选择最佳结果,若所有动作匹配率低于预定义参数时,则选择无法匹配,并抛弃改手势数据;为了针对不同场合下手势动作的识别,事先要先用大量的动作数据训练,构建手势动作识别库。
4.根据权利要求2所述的方法,其特征在于,还包括:人体手势动作预设定规则;
移动摄像头动作,双手掌竖直于胸前,掌心相对,同时同方向移动,如同双手握住摄像头移动;
摄像头焦距放大,双手掌竖直于胸前,掌心相对,两手同时反方向缓慢移动,扩大手掌之间的距离;
摄像头焦距缩小,单手掌竖直于胸前,掌心相对,缓慢靠近两掌,缩小手掌之间的距离;
摄像头焦点放大,单手掌竖直于胸前,掌心朝前,向前推动;
摄像头焦点缩小,单手掌竖直于胸前,掌心朝前,向后移动;
摄像头光圈放大,单手掌竖直于胸前,掌心朝前,顺时针划圈;
摄像头光圈缩小,单手掌竖直于胸前,掌心朝前,逆时针划圈;
摄像头雨刷开启,单手掌竖直于胸前,掌心朝前,左右来回反复移动三次;
摄像头雨刷关闭,单手掌竖直于胸前,掌心朝前,左右移动一个来回后,静止三秒钟。
CN201210488406XA 2012-11-16 2012-11-16 一种基于kinect的摄像机PTZ控制方法、装置和*** Pending CN103118227A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210488406XA CN103118227A (zh) 2012-11-16 2012-11-16 一种基于kinect的摄像机PTZ控制方法、装置和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210488406XA CN103118227A (zh) 2012-11-16 2012-11-16 一种基于kinect的摄像机PTZ控制方法、装置和***

Publications (1)

Publication Number Publication Date
CN103118227A true CN103118227A (zh) 2013-05-22

Family

ID=48416488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210488406XA Pending CN103118227A (zh) 2012-11-16 2012-11-16 一种基于kinect的摄像机PTZ控制方法、装置和***

Country Status (1)

Country Link
CN (1) CN103118227A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103529944A (zh) * 2013-10-17 2014-01-22 合肥金诺数码科技股份有限公司 一种基于Kinect的人体动作识别方法
CN103647944A (zh) * 2013-11-30 2014-03-19 山东信通电器有限公司 基于lte网络的多模工业智能穿戴装置
CN103869986A (zh) * 2014-04-02 2014-06-18 中国电影器材有限责任公司 一种基于kinect的动感数据生成方法
CN104461524A (zh) * 2014-11-27 2015-03-25 沈阳工业大学 基于Kinect的点歌方法
CN104714649A (zh) * 2015-03-31 2015-06-17 王子强 一种基于kinect的裸眼3D UI交互方法
CN105204629A (zh) * 2015-09-02 2015-12-30 成都上生活网络科技有限公司 一种3d手势识别方法
CN106095087A (zh) * 2016-06-02 2016-11-09 深圳奥比中光科技有限公司 体感交互***以及方法
CN106095083A (zh) * 2016-06-02 2016-11-09 深圳奥比中光科技有限公司 体感指令的确定方法以及体感交互装置
CN106095082A (zh) * 2016-06-02 2016-11-09 深圳奥比中光科技有限公司 体感交互方法、***以及装置
CN106658038A (zh) * 2016-12-19 2017-05-10 广州虎牙信息科技有限公司 基于视频流的直播交互方法及其相应的装置
CN106713767A (zh) * 2014-05-30 2017-05-24 张琴 智能手机、平板电脑或上网本的照相机的调焦方法
CN108127673A (zh) * 2017-12-18 2018-06-08 东南大学 一种基于多传感器融合的非接触式机器人人机交互***
CN108307107A (zh) * 2017-01-13 2018-07-20 佳能株式会社 摄像控制设备及其控制方法和计算机可读存储介质
WO2021026782A1 (zh) * 2019-08-13 2021-02-18 深圳市大疆创新科技有限公司 手持云台的控制方法、控制装置、手持云台及存储介质
CN112738407A (zh) * 2021-01-06 2021-04-30 富盛科技股份有限公司 一种操控多摄像机的方法和装置
CN115134506A (zh) * 2021-03-26 2022-09-30 阿里巴巴新加坡控股有限公司 摄像画面调整方法、视频画面处理方法以及装置和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102316260A (zh) * 2010-07-06 2012-01-11 鸿富锦精密工业(深圳)有限公司 Ptz摄影机控制***、方法及ptz摄影机调整装置
CN102356373A (zh) * 2009-03-20 2012-02-15 微软公司 虚拟对象操纵
CN102749990A (zh) * 2011-04-08 2012-10-24 索尼电脑娱乐公司 通过追踪用户视线和姿态提供反馈的***和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102356373A (zh) * 2009-03-20 2012-02-15 微软公司 虚拟对象操纵
CN102316260A (zh) * 2010-07-06 2012-01-11 鸿富锦精密工业(深圳)有限公司 Ptz摄影机控制***、方法及ptz摄影机调整装置
CN102749990A (zh) * 2011-04-08 2012-10-24 索尼电脑娱乐公司 通过追踪用户视线和姿态提供反馈的***和方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103529944A (zh) * 2013-10-17 2014-01-22 合肥金诺数码科技股份有限公司 一种基于Kinect的人体动作识别方法
CN103529944B (zh) * 2013-10-17 2016-06-15 合肥金诺数码科技股份有限公司 一种基于Kinect的人体动作识别方法
CN103647944A (zh) * 2013-11-30 2014-03-19 山东信通电器有限公司 基于lte网络的多模工业智能穿戴装置
CN103869986A (zh) * 2014-04-02 2014-06-18 中国电影器材有限责任公司 一种基于kinect的动感数据生成方法
CN106713767A (zh) * 2014-05-30 2017-05-24 张琴 智能手机、平板电脑或上网本的照相机的调焦方法
CN106713767B (zh) * 2014-05-30 2019-07-23 深圳市秋然科技发展有限公司 一种智能手机、平板电脑或上网本
CN104461524A (zh) * 2014-11-27 2015-03-25 沈阳工业大学 基于Kinect的点歌方法
CN104714649A (zh) * 2015-03-31 2015-06-17 王子强 一种基于kinect的裸眼3D UI交互方法
CN105204629A (zh) * 2015-09-02 2015-12-30 成都上生活网络科技有限公司 一种3d手势识别方法
CN105204629B (zh) * 2015-09-02 2018-11-13 成都上生活网络科技有限公司 一种3d手势识别方法
CN106095082A (zh) * 2016-06-02 2016-11-09 深圳奥比中光科技有限公司 体感交互方法、***以及装置
CN106095083A (zh) * 2016-06-02 2016-11-09 深圳奥比中光科技有限公司 体感指令的确定方法以及体感交互装置
CN106095087A (zh) * 2016-06-02 2016-11-09 深圳奥比中光科技有限公司 体感交互***以及方法
CN106658038A (zh) * 2016-12-19 2017-05-10 广州虎牙信息科技有限公司 基于视频流的直播交互方法及其相应的装置
CN108307107A (zh) * 2017-01-13 2018-07-20 佳能株式会社 摄像控制设备及其控制方法和计算机可读存储介质
US10771679B2 (en) 2017-01-13 2020-09-08 Canon Kabushiki Kaisha Image capturing control apparatus, method of controlling the same and computer readable storage medium
CN108127673A (zh) * 2017-12-18 2018-06-08 东南大学 一种基于多传感器融合的非接触式机器人人机交互***
WO2021026782A1 (zh) * 2019-08-13 2021-02-18 深圳市大疆创新科技有限公司 手持云台的控制方法、控制装置、手持云台及存储介质
CN112738407A (zh) * 2021-01-06 2021-04-30 富盛科技股份有限公司 一种操控多摄像机的方法和装置
CN112738407B (zh) * 2021-01-06 2022-08-30 富盛科技股份有限公司 一种操控多摄像机的方法和装置
CN115134506A (zh) * 2021-03-26 2022-09-30 阿里巴巴新加坡控股有限公司 摄像画面调整方法、视频画面处理方法以及装置和***

Similar Documents

Publication Publication Date Title
CN103118227A (zh) 一种基于kinect的摄像机PTZ控制方法、装置和***
CN110083202B (zh) 与近眼显示器的多模交互
CN104410883B (zh) 一种移动可穿戴非接触式交互***与方法
CN111580652B (zh) 视频播放的控制方法、装置、增强现实设备及存储介质
CN111158469A (zh) 视角切换方法、装置、终端设备及存储介质
CN106681354B (zh) 无人机的飞行控制方法和装置
CN107185232B (zh) 虚拟对象运动控制方法、装置、电子设备及存储介质
CN102939578A (zh) 用于接收用户输入的方法、设备和***
US20140068526A1 (en) Method and apparatus for user interaction
US20210081029A1 (en) Gesture control systems
CN202150897U (zh) 一种体感控制游戏电视机
CN104463119A (zh) 基于超声与视觉的复合式手势识别设备及其控制方法
CN103605466A (zh) 一种基于面部识别操控终端的方法
CN104063039A (zh) 一种穿戴式计算机智能终端的人机交互方法
CN102929547A (zh) 智能终端无接触交互方法
WO2012119371A1 (zh) 一种用户交互***和方法
WO2018045669A1 (zh) 一种电子设备界面的控制方法及电子设备
CN102830891A (zh) 一种非接触式手势控制设备及其锁定和解锁方法
KR20150097049A (ko) 네추럴 ui를 이용한 자율서빙 로봇 시스템
JP6841232B2 (ja) 情報処理装置、情報処理方法、及びプログラム
WO2019155735A1 (ja) 情報処理装置、情報処理方法及びプログラム
CN106774824A (zh) 虚拟现实交互方法及装置
KR101100240B1 (ko) 멀티모달 상호작용을 이용한 로봇의 물체 학습 시스템 및 방법
CN103218124B (zh) 基于深度摄像头的菜单控制方法及***
CN106774833A (zh) 虚拟现实交互方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130522