CN106817577A - 一种基于rgb‑d相机和立体声的视障人士障碍物预警眼镜 - Google Patents

一种基于rgb‑d相机和立体声的视障人士障碍物预警眼镜 Download PDF

Info

Publication number
CN106817577A
CN106817577A CN201611051636.4A CN201611051636A CN106817577A CN 106817577 A CN106817577 A CN 106817577A CN 201611051636 A CN201611051636 A CN 201611051636A CN 106817577 A CN106817577 A CN 106817577A
Authority
CN
China
Prior art keywords
infrared
depth
color
camera
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611051636.4A
Other languages
English (en)
Other versions
CN106817577B (zh
Inventor
于红雷
胡伟健
孙俊伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changxing Shikrypton Technology Co., Ltd.
Original Assignee
Hangzhou Vision Krypton Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Vision Krypton Technology Co Ltd filed Critical Hangzhou Vision Krypton Technology Co Ltd
Priority to CN201611051636.4A priority Critical patent/CN106817577B/zh
Publication of CN106817577A publication Critical patent/CN106817577A/zh
Application granted granted Critical
Publication of CN106817577B publication Critical patent/CN106817577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/25Image signal generators using stereoscopic image cameras using two or more image sensors with different characteristics other than in their location or field of view, e.g. having different resolutions or colour pickup characteristics; using image signals from one sensor to control the characteristics of another sensor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61FFILTERS IMPLANTABLE INTO BLOOD VESSELS; PROSTHESES; DEVICES PROVIDING PATENCY TO, OR PREVENTING COLLAPSING OF, TUBULAR STRUCTURES OF THE BODY, e.g. STENTS; ORTHOPAEDIC, NURSING OR CONTRACEPTIVE DEVICES; FOMENTATION; TREATMENT OR PROTECTION OF EYES OR EARS; BANDAGES, DRESSINGS OR ABSORBENT PADS; FIRST-AID KITS
    • A61F9/00Methods or devices for treatment of the eyes; Devices for putting-in contact lenses; Devices to correct squinting; Apparatus to guide the blind; Protective devices for the eyes, carried on the body or in the hand
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/165Anti-collision systems for passive traffic, e.g. including static obstacles, trees
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft, e.g. air-traffic control [ATC]
    • G08G5/04Anti-collision systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/207Image signal generators using stereoscopic image cameras using a single 2D image sensor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Vascular Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Biomedical Technology (AREA)
  • Ophthalmology & Optometry (AREA)
  • Measurement Of Optical Distance (AREA)

Abstract

本发明公开了一种基于RGB‑D相机和立体声的视障人士障碍物预警眼镜。该眼镜利用红外投射器投射不可见的近红外静态散斑,利用两个红外相机和一个RGB相机采集图像,小型处理器对采集的图像进行处理,计算获得深度图像,并对深度图像进行分块,将分块获得的深度信息,转化为立体声信号,最后利用骨传导耳机传递给视障人士进行辅助,可以很好地满足视障人士障碍物预警的要求。

Description

一种基于RGB-D相机和立体声的视障人士障碍物预警眼镜
技术领域
本发明属于视障人士辅助技术、双目视觉技术、三维环境感知技术、立体声交互技术领域。本发明包含一种基于RGB-D相机和立体声的视障人士障碍物预警眼镜,涉及一种利用利用红外投射器投射不可见的近红外静态散斑,利用两个红外相机和一个RGB相机采集图像,小型处理器对采集的图像进行处理,获取深度图像,并对深度图像进行分块,最后将分块的深度信息,转化为立体声信号,最后利用骨传导耳机传递给视障人士进行辅助的障碍物预警眼镜。
背景技术
根据世界健康组织统计,全世界有2.85亿视觉障碍人士。视障人士损失了正常的视觉,对颜色、形状、距离、运动的理解都很困难,他们的生活在起居、出行等方面都受到了巨大的影响。
传统的视障人士辅助工具比如盲人手杖,视障人士需要反复移动手杖,才能获知面前的情况,既费时也费力。盲人手杖的探测距离有限,只能检测脚边的障碍物,也无法反映远处和空中的状况。导盲犬可以为视障人士提供帮助,但是导盲犬的训练和养护费用是高昂的,普通家庭难以承担。有些场合,导盲犬不能陪同盲人进入,比如公交车和火车站,因此导盲犬的辅助是有局限性的。仿生眼可以帮助视障人士恢复部分视觉,但仿生眼的植入需要手术,费用高昂。仿生眼只适用于视网膜色素变性或老年性黄斑变性导致失明的盲人。视觉神经损坏的视障人士无法通过植入仿生眼来恢复部分视觉。
电子式的视障辅助工具主要运用超声波技术、激光测距技术、双目视觉技术、激光散斑编码技术、激光雷达技术、毫米波雷达技术、热成像技术、全球定位***(GPS)。基于超声波技术和激光测距技术的测距范围有限,只能实现单点测距,获取的信息量太少,且耗电多,设备笨重,只能实现报警功能,容易受环境干扰。基于双目视觉技术的辅助依赖于环境中特征点和纹理的丰富程度,对于一些纹理单一的场景失效,如室内的白墙,光滑地面等。双目视觉技术会受镜面反射等特殊情形的欺骗,从而造成漏判或者误判。基于激光散斑编码技术的辅助在室外失效,因为主动投射的结构光被阳光淹没,从而无法识别编码的散斑。激光散斑编码技术由于受到功率限制,存在最远距离,超过最远距离的物体无法对其测距。基于激光雷达技术的辅助成本高,通常采样率低,对灰尘、雾霾、雨水敏感,而且无法获取颜色和纹理信息。基于毫米波雷达的辅助分辨率低,信号处理过程难。基于热成像技术的辅助分辨率低,标定过程复杂,且只能检测人和动物等发热物体。基于GPS的辅助精度低,会有信号损失,不能在室内使用,而且无法获取局部动态的障碍物信息。
传统视障人士辅助的交互方式主要有语音提示、触觉震动。语义提示通常播报障碍物的距离和方向,需要一定的时间播放,造成延迟和事故风险,而且可传递的信息量少。触觉震动通过震动腰带或者震动背心为硬件,以震动来提示障碍物的方位,震动装置可以解决延迟的问题,但给视障人士带来负担,不同人的穿戴感受不同。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于RGB-D相机和立体声的视障人士障碍物预警眼镜。
本发明的目的是通过以下技术方案实现的:一种基于RGB-D相机和立体声的视障人士障碍物预警眼镜,所述眼镜包含眼镜本体、一个红外投射器,两个相同的红外相机,一个彩色相机,一个USB集线器,一个小型处理器,一个骨传导耳机模块,两个骨传导震动模块,一个电池模块。所述一个红外投射器,两个相同的红外相机,一个彩色相机,一个USB集线器,一个小型处理器,一个骨传导耳机模块,两个骨传导震动模块,一个电池模块均固定在镜架上,其中,两个相同的红外相机,一个彩色相机的光轴彼此平行,两个相同的红外相机分别固定在两个镜片的正上方,彩色相机和红外投射器均安装在两个红外相机之间;两个骨传导震动模位于两个镜脚中间偏后处,贴合盲人耳朵前方颅骨处;USB集线器和小型处理器嵌于一个镜脚内;骨传导耳机模块和电池模块嵌于另一个镜脚内;红外投射器、两个红外相机、彩色相机通过USB集线器与小型处理器相连,电池模块与小型处理器相连;两个骨传导震动模块均通过骨传导耳机模块与小型处理器相连。彩色相机和红外投射器位于两个红外相机之间。两个红外相机、彩色相机的光轴彼此平行。小型处理器控制红外投射器向前方三维场景投射不可见的静态近红外散斑,两个红外相机实时地采集经投射后的三维场景的两幅红外图像,彩色相机实时地采集三维场景的彩色图像。USB集线器将两幅红外图像和一幅彩色图像传给小型处理器。小型处理器对获取的两幅红外图像、一幅彩色图像进行处理,获取三维场景的深度图像。小型处理器对深度图像进行分块,并将分块后的深度信息转化为立体声信号,并传给骨传导耳机模块。骨传导耳机模块将立体声信号转为骨传导震动信号,传给两个骨传导震动模块。两个骨传导震动模块,传递骨传导震动信号给视障用户,实现障碍物预警。
进一步地,上述眼镜通过以下方法实现障碍物预警:
(1)对两个红外相机进行一次双目相机标定,获取两个红外相机的焦距fIR,左红外相机的主点位置(cIR-x,cIR-y),两个红外相机的基线距离BIR-IR
(2)对彩色相机进行一次相机标定,获取彩色相机的焦距fcolor,主点位置(cCOLOR-x,cCOLOR-y)。
(3)对彩色相机和左侧的红外相机进行一次双目相机标定,获取左红外相机与彩色相机的基线距离BIR-COLOR
(4)红外投射器实时地投射不可见的静态近红外散斑到三维场景中。
(5)两个红外相机采集三维场景的两张红外图像IRleft和IRright
(6)彩色相机三维场景的彩色图像Color。
(7)USB集线器将两幅红外图像IRleft和IRright,一幅彩色图像Color传给小型处理器。
(8)小型处理器对两张红外图像IRleft和IRright提取Sobel边缘,获取两张Sobel边缘图像Sobelleft和Sobelright
(9)以左Sobel边缘图像Sobelleft为基准,对两张Sobel边缘图像Sobelleft和Sobelright进行基于图像块的图像匹配,获取一系列匹配好的有效点E={e1,e2,e3,...,eM}。在左Sobel边缘图像Sobelleft中,每一个有效点为e=(u,v,d)T,u为横坐标像素值,v为纵坐标像素值,d为视差值。
(10)以匹配好的有效点E为基准,每三个有效点可构成一个视差平面,第i个视差平面的方程为d=aiu+biv+ci,其中ai,bi,ci为第i个视差平面的系数。
(11)在这些视差平面的基础上,将未匹配的像素点(u',v',d')T转换为匹配的有效点(u,v,d)T;具体为:该像素点(u',v',d')T到第i视差平面的距离为设能量函数为其中ε,σ为常数。对该像素点,遍历视差搜索范围所有的视差值d'={d'min,...,d'max},求出使得能量函数Energy(d')最小的视差值,当成该像素点的视差值d。另外,u=u',v=v'。
(12)遍历所有未匹配的像素点,获取每个未匹配的像素点的视差值,得到以左红外相机为基准的视差图像Disparityleft
(13)根据两个红外相机的焦距fIR和基线距离BIR-IR,遍历视差图像中的每一点(u,v,d),其深度值为因此深度图像Depthleft中每一点对应为(u,v,depth),从而获得左红外相机为基准的深度图像Depthleft
(14)利用深度图像Depthleft和彩色图像Color,两个红外相机的焦距fIR,左红外相机的主点位置(cIR-x,cIR-y),彩色相机的焦距fcolor,主点位置(cCOLOR-x,cCOLOR-y),以及左红外相机和彩色相机的基线距离BIR-COLOR,可对深度图像和彩色图像进行对齐,获取彩色相机视场的深度图像Depthcolor
(15)将彩色相机视场的深度图像Depthcolor从左到右分成K块,计算每一块深度图像DepthK的平均深度depthK。(K的取值一般在2至10之间)
(16)用不同音色的乐器的合奏来表示K块深度图像DepthK:不同块的深度图像DepthK用不同音色的乐器发声。乐器声音的响度Volume与每一块图像的平均深度depthK成反比,即:障碍物越近,平均深度depthK越小,响度Volume越大;障碍物越远,平均深度depthK越大,响度Volume越小。每个方向的乐器声都为立体声。乐器可选钢琴、小提琴、锣、小号、木琴等有特别音色并悦耳的。
(17)小型处理器将立体声信号传给骨传导耳机模块。
(18)骨传导耳机模块将立体声信号转为骨传导震动信号。
(19)骨传导震动模块将骨传导震动信号传递给视障用户。
本方法相比以往的视障人士辅助方法的优势主要在于:
1、环境适用性。由于使用红外投射器和两个红外相机,该方法在室内、室外环境都可以兼容使用。在室内时,红外投射器投射的静态近红外光斑给三维场景增加了纹理,有利于获取稠密的深度图像。在室外时,阳光的近红外部分和三维场景结合,有利于获取稠密的深度图像。稠密的深度图像可以保证分块深度的准确性和辅助交互的体验效果。
2、白天黑夜适用性。由于使用红外投射器和两个红外相机,该方法在白天、黑夜都可以兼容使用。在白天时,红外投射器投射的静态近红外光斑和日光中的近红外成分都可以给三维场景增加纹理,有利于稠密的深度图像。在黑夜时,红外投射器投射的静态近红外光斑给近处三维场景增加纹理,也可以获取近处三维场景的深度图像。该方法在白天黑夜都可以获取可靠的深度图像,从而保证分块深度的准确性和辅助交互的体验效果。
3、可检测空中的障碍物。传统的盲人手杖只能探测脚边的路况,不能照顾前方空中的情况,该方法可以预警空中的障碍物,从而防止视障用户碰撞空中的树枝或门梁等物体。
4、不占用双耳。本方法采用骨传导耳机传递信号给视障用户,不妨碍用户听取外界的声音。视障人士大多都依赖外界的声音来进行一些判读,如根据车流声音判断马路的朝向等。
5、不占用双手。本方法的辅助装置可穿戴,小型处理器便携,可以放在口袋或者小包里,既不会给视障带来很大的负担,也无需视障人士用手拿辅助工具。
6、不会烦扰用户。本方法的立体声交互方式,使用悦耳的乐器发声,不会给视障用户造成烦扰,让视障用户在使用时听着悦耳的音乐就能避障通行。
7、反馈充分的信息量。相比语义式的语音播报,立体声的交互反馈利用不同响度,不同音色的乐器表示障碍物的远近,可以同时地、充分地传递前方不同方向的路况,预警障碍物的存在。
8、易学性和易理解性。相比复杂形式的声音编码,本发明中立体声的交互基于深度图的分块,分块处理后的深度信息不会非常冗杂,视障用户可以迅速学习并理解立体声信号的含义,并根据立体声信号避开障碍物。
9、及时的反馈。相比语义式的语音播报,立体声的交互反馈是及时的,没有延迟。从而视障人士可以及时的避开障碍物,保证了该方法的安全性。
10、对近处的障碍物有很好的预警作用。当靠近障碍物时,对应方向的平均深度小,因此对应乐器的响度大,可以帮助视障用户很好的预知障碍物的迫近,从而避开紧急的障碍物。
11、可检测到细小的障碍物。当出现细小障碍物时,对应方向的平均深度有变化,因此对应乐器的响度大,可以帮助视障用户很好的预知细小障碍物的存在,从而避免细小的障碍物。
附图说明
图1为视障人士障碍物预警***的模块连接示意图;
图2为视障人士障碍物预警***的结构示意图;
图3为彩色图像Color与彩色相机视场的深度图像Depthcolor,深度图像用伪彩色表示,颜色越蓝,深度越大,颜色越红,深度越小。
图4为K块深度图像DepthK,每一块的颜色表示每一块深度图像DepthK的平均深度depthK,平均深度越大,颜色越蓝,平均深度越近,颜色越红。
图5为乐器立体声合奏表示障碍物的示意图。
具体实施方式
如同2所示,一种基于RGB-D相机和立体声的视障人士障碍物预警眼镜,所述眼镜包含眼镜本体、一个红外投射器,两个相同的红外相机,一个彩色相机,一个USB集线器,一个小型处理器,一个骨传导耳机模块,两个骨传导震动模块,一个电池模块。所述一个红外投射器,两个相同的红外相机,一个彩色相机,一个USB集线器,一个小型处理器,一个骨传导耳机模块,两个骨传导震动模块,一个电池模块均固定在镜架上,其中,两个相同的红外相机,一个彩色相机的光轴彼此平行,两个相同的红外相机分别固定在两个镜片的正上方,彩色相机和红外投射器均安装在两个红外相机之间;两个骨传导震动模位于两个镜脚中间偏后处,贴合盲人耳朵前方颅骨处;USB集线器和小型处理器嵌于一个镜脚内;骨传导耳机模块和电池模块嵌于另一个镜脚内;
如图1所示,红外投射器、两个红外相机、彩色相机通过USB集线器与小型处理器相连,电池模块与小型处理器相连;两个骨传导震动模块均通过骨传导耳机模块与小型处理器相连。彩色相机和红外投射器位于两个红外相机之间。小型处理器控制红外投射器向前方三维场景投射不可见的静态近红外散斑,两个红外相机实时地采集经投射后的三维场景的两幅红外图像,彩色相机实时地采集三维场景的彩色图像。USB集线器将两幅红外图像和一幅彩色图像传给小型处理器。小型处理器对获取的两幅红外图像、一幅彩色图像进行处理,获取三维场景的深度图像。小型处理器对深度图像进行分块,并将分块后的深度信息转化为立体声信号,并传给骨传导耳机模块。骨传导耳机模块将立体声信号转为骨传导震动信号,传给两个骨传导震动模块。两个骨传导震动模块,传递骨传导震动信号给视障用户,实现障碍物预警。
上述***的预警方法包括以下步骤:
(1)对两个红外相机进行一次双目相机标定,获取两个红外相机的焦距fIR,左红外相机的主点位置(cIR-x,cIR-y),两个红外相机的基线距离BIR-IR
(2)对彩色相机进行一次相机标定,获取彩色相机的焦距fcolor,主点位置(cCOLOR-x,cCOLOR-y)。
(3)对彩色相机和左侧的红外相机进行一次双目相机标定,获取左红外相机与彩色相机的基线距离BIR-COLOR
(4)红外投射器实时地投射不可见的静态近红外散斑到三维场景中。
(5)两个红外相机采集三维场景的两张红外图像IRleft和IRright
(6)彩色相机三维场景的彩色图像Color。
(7)USB集线器将两幅红外图像IRleft和IRright,一幅彩色图像Color传给小型处理器。
(8)小型处理器对两张红外图像IRleft和IRright提取Sobel边缘,获取两张Sobel边缘图像Sobelleft和Sobelright
(9)以左Sobel边缘图像Sobelleft为基准,对两张Sobel边缘图像Sobelleft和Sobelright进行基于图像块的图像匹配,获取一系列匹配好的有效点E={e1,e2,e3,...,eM}。在左Sobel边缘图像Sobelleft中,每一个有效点为e=(u,v,d)T,u为横坐标像素值,v为纵坐标像素值,d为视差值。
(10)以匹配好的有效点E为基准,每三个有效点可构成一个视差平面,第i个视差平面的方程为d=aiu+biv+ci,其中ai,bi,ci为第i个视差平面的系数。
(11)在这些视差平面的基础上,将未匹配的像素点(u',v',d')T转换为匹配的有效点(u,v,d)T;具体为:该像素点(u',v',d')T到第i视差平面的距离为设能量函数为其中ε,σ为常数。对该像素点,遍历视差搜索范围所有的视差值d'={d'min,...,d'max},求出使得能量函数Energy(d')最小的视差值,当成该像素点的视差值d。另外,u=u',v=v'。
(12)遍历所有未匹配的像素点,获取每个未匹配的像素点的视差值,得到以左红外相机为基准的视差图像Disparityleft
(13)根据两个红外相机的焦距fIR和基线距离BIR-IR,遍历视差图像中的每一点(u,v,d),其深度值为因此深度图像Depthleft中每一点对应为(u,v,depth),从而获得左红外相机为基准的深度图像Depthleft
(14)利用深度图像Depthleft和彩色图像Color,两个红外相机的焦距fIR,左红外相机的主点位置(cIR-x,cIR-y),彩色相机的焦距fcolor,主点位置(cCOLOR-x,cCOLOR-y),以及左红外相机和彩色相机的基线距离BIR-COLOR,可对深度图像和彩色图像进行对齐,获取彩色相机视场的深度图像Depthcolor
(15)将彩色相机视场的深度图像Depthcolor从左到右分成K块,计算每一块深度图像DepthK的平均深度depthK。(K的取值一般在2至10之间)
(16)用不同音色的乐器的合奏来表示K块深度图像DepthK:不同块的深度图像DepthK用不同音色的乐器发声。乐器声音的响度Volume与每一块图像的平均深度depthK成反比,即:障碍物越近,平均深度depthK越小,响度Volume越大;障碍物越远,平均深度depthK越大,响度Volume越小。每个方向的乐器声都为立体声。乐器可选钢琴、小提琴、锣、小号、木琴等有特别音色并悦耳的。
(17)小型处理器将立体声信号传给骨传导耳机模块。
(18)骨传导耳机模块将立体声信号转为骨传导震动信号。
(19)骨传导震动模块将骨传导震动信号传递给视障用户。

Claims (2)

1.一种基于RGB-D相机和立体声的视障人士障碍物预警眼镜,所述眼镜包含眼镜本体、一个红外投射器,两个相同的红外相机,一个彩色相机,一个USB集线器,一个小型处理器,一个骨传导耳机模块,两个骨传导震动模块,一个电池模块。所述一个红外投射器,两个相同的红外相机,一个彩色相机,一个USB集线器,一个小型处理器,一个骨传导耳机模块,两个骨传导震动模块,一个电池模块均固定在镜架上,其中,两个相同的红外相机,一个彩色相机的光轴彼此平行,两个相同的红外相机分别固定在两个镜片的正上方,彩色相机和红外投射器均安装在两个红外相机之间;两个骨传导震动模位于两个镜脚中间偏后处,贴合盲人耳朵前方颅骨处;USB集线器和小型处理器嵌于一个镜脚内;骨传导耳机模块和电池模块嵌于另一个镜脚内;红外投射器、两个红外相机、彩色相机通过USB集线器与小型处理器相连,电池模块与小型处理器相连;两个骨传导震动模块均通过骨传导耳机模块与小型处理器相连。彩色相机和红外投射器位于两个红外相机之间。两个红外相机、彩色相机的光轴彼此平行。小型处理器控制红外投射器向前方三维场景投射不可见的静态近红外散斑,两个红外相机实时地采集经投射后的三维场景的两幅红外图像,彩色相机实时地采集三维场景的彩色图像。USB集线器将两幅红外图像和一幅彩色图像传给小型处理器。小型处理器对获取的两幅红外图像、一幅彩色图像进行处理,获取三维场景的深度图像。小型处理器对深度图像进行分块,并将分块后的深度信息转化为立体声信号,并传给骨传导耳机模块。骨传导耳机模块将立体声信号转为骨传导震动信号,传给两个骨传导震动模块。两个骨传导震动模块,传递骨传导震动信号给视障用户,实现障碍物预警。
2.根据权利要求1所述的眼镜,其特征在于,通过以下方法实现障碍物预警:
(1)对两个红外相机进行一次双目相机标定,获取两个红外相机的焦距fIR,左红外相机的主点位置(cIR-x,cIR-y),两个红外相机的基线距离BIR-IR
(2)对彩色相机进行一次相机标定,获取彩色相机的焦距fcolor,主点位置(cCOLOR-x,cCOLOR-y)。
(3)对彩色相机和左侧的红外相机进行一次双目相机标定,获取左红外相机与彩色相机的基线距离BIR-COLOR
(4)红外投射器实时地投射不可见的静态近红外散斑到三维场景中。
(5)两个红外相机采集三维场景的两张红外图像IRleft和IRright
(6)彩色相机三维场景的彩色图像Color。
(7)USB集线器将两幅红外图像IRleft和IRright,一幅彩色图像Color传给小型处理器。
(8)小型处理器对两张红外图像IRleft和IRright提取Sobel边缘,获取两张Sobel边缘图像Sobelleft和Sobelright
(9)以左Sobel边缘图像Sobelleft为基准,对两张Sobel边缘图像Sobelleft和Sobelright进行基于图像块的图像匹配,获取一系列匹配好的有效点E={e1,e2,e3,...,eM}。在左Sobel边缘图像Sobelleft中,每一个有效点为e=(u,v,d)T,u为横坐标像素值,v为纵坐标像素值,d为视差值。
(10)以匹配好的有效点E为基准,每三个有效点可构成一个视差平面,第i个视差平面的方程为d=aiu+biv+ci,其中ai,bi,ci为第i个视差平面的系数。
(11)在这些视差平面的基础上,将未匹配的像素点(u',v',d')T转换为匹配的有效点(u,v,d)T;具体为:该像素点(u',v',d')T到第i视差平面的距离为设能量函数为其中ε,σ为常数。对该像素点,遍历视差搜索范围所有的视差值d'={d'min,...,d'max},求出使得能量函数Energy(d')最小的视差值,当成该像素点的视差值d。另外,u=u',v=v'。
(12)遍历所有未匹配的像素点,获取每个未匹配的像素点的视差值,得到以左红外相机为基准的视差图像Disparityleft
(13)根据两个红外相机的焦距fIR和基线距离BIR-IR,遍历视差图像中的每一点(u,v,d),其深度值为因此深度图像Depthleft中每一点对应为(u,v,depth),从而获得左红外相机为基准的深度图像Depthleft
(14)利用深度图像Depthleft和彩色图像Color,两个红外相机的焦距fIR,左红外相机的主点位置(cIR-x,cIR-y),彩色相机的焦距fcolor,主点位置(cCOLOR-x,cCOLOR-y),以及左红外相机和彩色相机的基线距离BIR-COLOR,可对深度图像和彩色图像进行对齐,获取彩色相机视场的深度图像Depthcolor
(15)将彩色相机视场的深度图像Depthcolor从左到右分成K块,计算每一块深度图像DepthK的平均深度depthK
(16)用不同音色的乐器的合奏来表示K块深度图像DepthK:不同块的深度图像DepthK用不同音色的乐器发声。乐器声音的响度Volume与每一块图像的平均深度depthK成反比,即:障碍物越近,平均深度depthK越小,响度Volume越大;障碍物越远,平均深度depthK越大,响度Volume越小。每个方向的乐器声都为立体声。
(17)小型处理器将立体声信号传给骨传导耳机模块。
(18)骨传导耳机模块将立体声信号转为骨传导震动信号。
(19)骨传导震动模块将骨传导震动信号传递给视障用户。
CN201611051636.4A 2016-11-23 2016-11-23 一种基于rgb-d相机和立体声的视障人士障碍物预警眼镜 Active CN106817577B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611051636.4A CN106817577B (zh) 2016-11-23 2016-11-23 一种基于rgb-d相机和立体声的视障人士障碍物预警眼镜

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611051636.4A CN106817577B (zh) 2016-11-23 2016-11-23 一种基于rgb-d相机和立体声的视障人士障碍物预警眼镜

Publications (2)

Publication Number Publication Date
CN106817577A true CN106817577A (zh) 2017-06-09
CN106817577B CN106817577B (zh) 2018-05-08

Family

ID=59107011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611051636.4A Active CN106817577B (zh) 2016-11-23 2016-11-23 一种基于rgb-d相机和立体声的视障人士障碍物预警眼镜

Country Status (1)

Country Link
CN (1) CN106817577B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108693532A (zh) * 2018-03-29 2018-10-23 浙江大学 基于增强型双目相机与3d毫米波雷达的可穿戴避障方法及装置
CN108917650A (zh) * 2018-05-17 2018-11-30 北京林业大学 一种可折叠结构光三维扫描设备
CN109085926A (zh) * 2018-08-21 2018-12-25 华东师范大学 一种多模态成像与多感知交融的增强现实***及其应用
CN109784132A (zh) * 2017-11-10 2019-05-21 秀育企业股份有限公司 分时式多光谱侦测装置及方法
WO2020019345A1 (zh) * 2018-07-27 2020-01-30 合刃科技(深圳)有限公司 基于相干光的避障装置及方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784132A (zh) * 2017-11-10 2019-05-21 秀育企业股份有限公司 分时式多光谱侦测装置及方法
CN108693532A (zh) * 2018-03-29 2018-10-23 浙江大学 基于增强型双目相机与3d毫米波雷达的可穿戴避障方法及装置
CN108917650A (zh) * 2018-05-17 2018-11-30 北京林业大学 一种可折叠结构光三维扫描设备
WO2020019345A1 (zh) * 2018-07-27 2020-01-30 合刃科技(深圳)有限公司 基于相干光的避障装置及方法
CN111213069A (zh) * 2018-07-27 2020-05-29 合刃科技(深圳)有限公司 基于相干光的避障装置及方法
CN111213069B (zh) * 2018-07-27 2023-09-12 合刃科技(深圳)有限公司 基于相干光的避障装置及方法
CN109085926A (zh) * 2018-08-21 2018-12-25 华东师范大学 一种多模态成像与多感知交融的增强现实***及其应用

Also Published As

Publication number Publication date
CN106817577B (zh) 2018-05-08

Similar Documents

Publication Publication Date Title
CN106203390B (zh) 一种智能盲人辅助***
CN106846350B (zh) 一种基于rgb-d相机和立体声的视障人士障碍物预警***及方法
CN106817577B (zh) 一种基于rgb-d相机和立体声的视障人士障碍物预警眼镜
CN106597690B (zh) 一种基于rgb-d相机和立体声的视障人士通路预知眼镜
CN107341789A (zh) 一种基于rgb‑d相机和立体声的视障人士通路预知***和方法
US9792501B1 (en) Method and device for visually impaired assistance
CN106859929B (zh) 一种基于双目视觉的多功能导盲仪
CN106214437B (zh) 一种智能盲人辅助眼镜
CN108245385B (zh) 一种帮助视障人士出行的装置
US9370459B2 (en) System and method for alerting visually impaired users of nearby objects
CN104036488B (zh) 一种基于双目视觉的人体姿态动作研究方法
CN106389078A (zh) 一种智能导盲眼镜***及其导盲方法
CN106843491A (zh) 带增强现实的智能设备及电子设备
CN106651873B (zh) 一种基于rgb-d相机和立体声的视障人士斑马线检测眼镜
CN106157731B (zh) 一种具有混合现实功能的模拟飞行座舱***及其处理方法
KR20140033009A (ko) 시각 장애인을 위한 광학 디바이스
CN203746012U (zh) 一种三维虚拟场景人机交互立体显示***
CN206460410U (zh) 带增强现实的智能设备
CN105686936A (zh) 一种基于rgb-ir相机的声音编码交互***
CN106821692A (zh) 一种基于rgb‑d相机和立体声的视障人士楼梯检测***及方法
WO2018066352A1 (ja) 画像生成システム、プログラム及び方法並びにシミュレーションシステム、プログラム及び方法
Sharma et al. International journal of engineering sciences & research technology a review on obstacle detection and vision
CN105701811A (zh) 一种基于rgb-ir相机的声音编码交互方法
WO2018016928A1 (ko) 가상 현실 구현 시스템 및 그의 가상 현실 구현 방법
CN106920260A (zh) 立体惯性导盲方法及装置和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 9, 181, 310000, Wuchang Road, Wuchang Street, Yuhang District, Zhejiang, Hangzhou, 202-7

Applicant after: Hangzhou vision krypton Technology Co., Ltd.

Address before: Room 589, C building, No. 525 Xixi Road, Xihu District, Zhejiang, Hangzhou 310012, China

Applicant before: Hangzhou vision krypton Technology Co., Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190912

Address after: 313100 North Side of 1st Floor of National University Science Park Complex Building, 669 High Speed Road, Changxing County Economic and Technological Development Zone, Huzhou City, Zhejiang Province

Patentee after: Changxing Shikrypton Technology Co., Ltd.

Address before: 9, 181, 310000, Wuchang Road, Wuchang Street, Yuhang District, Zhejiang, Hangzhou, 202-7

Patentee before: Hangzhou vision krypton Technology Co., Ltd.

TR01 Transfer of patent right