CN105069754B - 基于在图像上无标记增强现实的***和方法 - Google Patents
基于在图像上无标记增强现实的***和方法 Download PDFInfo
- Publication number
- CN105069754B CN105069754B CN201510471459.4A CN201510471459A CN105069754B CN 105069754 B CN105069754 B CN 105069754B CN 201510471459 A CN201510471459 A CN 201510471459A CN 105069754 B CN105069754 B CN 105069754B
- Authority
- CN
- China
- Prior art keywords
- image
- database
- retrieved
- characteristic point
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于在图像上无标记增强现实的***和方法,它包括图像检索***,即使用手机摄像头扫描场景,在数据库中检索场景中出现的图像,寻找与之一致的图像作为检索结果;和增强现实***,即将与该图像对应的视频介绍渲染到场景中该图像的位置,进行现实增强;其具有在图像上无标记增强现实,且准确率高、适应距离较大、适应较多图像源的优点。
Description
技术领域
本发明涉及数码应用技术领域,涉及一种图像识别技术,特别是涉及一种基于在图像上无标记增强现实的***和方法。
背景技术
众所周知,图像识别技术是目前应用非常广泛的一种技术,其通过对图像的特征进行识别从而判断图像对应的相关信息。如条码加载技术,每种条码有其特定的字符集;每个字符占有一定的宽度;具有一定的校验功能;同时还具有对不同行的信息自动识别功能、及处理图形旋转变化点。如二维码加载技术,二维码是用某种特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间的图形记录数据符号信息的;在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理。尽管条码加载技术和二维码加载技术在现实生活中得到了广泛地应用,给人们生产、生活带来了极大的便利,但是存在有痕迹这一先天的缺陷,一是会会破坏画面的美感;二是可以被仿制。
增强现实(Augmented Reality ,简称AR)简单来说是通过电脑技术,将虚拟的信息应用到真实世界,真实的环境和虚拟的物体实时地叠加到了同一个画面或空间同时存在。增强现实提供了在一般情况下,不同于人类可以感知的信息。它不仅展现了真实世界的信息,而且将虚拟的信息同时显示出来,两种信息相互补充、叠加。增强现实有多种定义,为大家广为接受的定义是将虚拟物体添加到现实世界中,为用户提供更为丰富的体验和信息,通过增强现实技术把计算机生成的图形叠加到真实世界中。AR(Augmented Reality,增强现实)技术是一种全新的人机交互技术,通过智能终端设备和可视化技术将虚拟信息应用到真实世界,使得虚拟信息和真实世界同时叠加到同一个画面或空间呈现给用户。随着智能终端的普及,AR技术的应用愈加广泛,可以通过在智能终端上安装AR应用进行体验。具体的,AR应用的工作流程如下:终端通过摄像头拍摄图像帧;对图像帧进行识别,确定AR目标物体;对图像帧中的AR目标物体进行跟踪,确定AR目标物体的位置;获取与所述AR目标物体相关联的AR虚拟信息,对图像帧进行渲染,将所 述AR虚拟信息叠加在AR目标物体上进行显示,在终端屏幕上同时显示AR目标物体和AR虚拟内容以供用户进行交互。现有AR应用技术存在计算量较大、视频增强效果不稳定、***检测准确率不高的缺限。
发明内容
本发明的目的在于克服现有在图像上无标记增强现实技术中的不足,提供一种基于在图像上无标记增强现实的***和方法。
为了实现上述目的,本发明是通过以下技术方案来实现的:基于在图像上无标记增强现实的***,其特征在于:它包括图像检索***,即使用手机摄像头扫描场景,在数据库中检索场景中出现的图像,寻找与之一致的图像作为检索结果;和增强现实***,即将与该图像对应的视频介绍渲染到场景中该图像的位置,进行现实增强。
所述的图像检索采用不变性描述子ORB来对图像进行特征点检测和描述,具体过程检索流程如下:
步骤1、利用不变性描述子ORB特征点检测器对数据库中的每一张图像和待检索图像进行特征点检测,(ORB是Oriented FAST and Rotated BRIEF的缩写, ORB特征是将FAST特征点的检测方法与BRIEF特征描述子结合起来,并在它们原来的基础上做了改进与优化,FAST是features from accelerated segment test的缩写,BRIEF是Binary RobustIndependent Elementary Features的缩写)并使用不变性ORB描述子来描述每个特征点,得到256bit的二值特征。
步骤2、对数据库中的某张图像,对待检索图像的每一个特征点,通过特征点描述子的比较,在数据库的这个图像中寻找近邻的特征点。
步骤3、对得到的特征点匹配对进行初筛选,去除误匹配的特征点;原则是:⑴、特征点匹配对的欧式距离大于一定阈值的去除(本文中的距离都是欧式距离);⑵、最近邻和次近邻的特征点匹配对的欧式距离比值小于一定阈值的去除;如果筛选后的匹配对少于一定阈值,则表明数据库中该图像和待检索图像非一致图像。
步骤4、对经过筛选后的匹配点对,运用RANSAC算法进行仿射矩阵的计算和内点的查找即对匹配点对的二次筛选(内点是通过RANSAC算法对匹配点对的二次筛选后得到的匹配点对,库中图像的特征点经过仿射变换后在检索图像上的投影图像就是内点;RANSAC为RANdom SAmple Consensus的缩写,它是根据一组包含异常数据的样本数据集,计算出数据的数学模型参数,得到有效样本数据的算法。)
步骤5、统计内点个数,如果二次筛选后的匹配对少于一定阈值,则表明数据库中该图像和待检索图像非一致图像。
步骤6、利用步骤4得到的仿射矩阵,对库中图像的五个参考点,四角和中心点进行仿射变换,得到变换后的五个点;如果变换后的五个点不满足以下关系,则表明数据库中该图像和待检索图像非一致图像。原则是:⑴、变换后,中心点依然在四个角中心。⑵、待检索特征点在变换后四个角点内部的数目要大于一定的阈值。⑶、面积要在一定的允许范围。
步骤7、将对边的差异作为几何校验误差。库中图像都是矩形,经过步骤6的仿射变换,得到库中图像在检索图像上的投影图像,该图像是四边形,四条边依次是:edge1,edge2,edge3,edge4. 其中edge1和edge3是对边,edge2和edge4是对边. Error表示几何校验误差,则:
Error = max(abs(edge1 -edge3) / (edge1 +edge3),abs(edge2 - edge4) /(edge2 + edge4));
Max表示最大值,abs表示绝对值。
步骤8、对数据库中的每一个图像,重复步骤2-7,取具有最小几何校验误差的图像作为最终的检索结果。
由图像检索可以获得估计的仿射矩阵A,为了获得更加稳定的仿射矩阵,需要对其仿射矩阵进行调优;具体调优步骤如下:
步骤1、将仿射矩阵A应用到待检索图像中(即用仿射矩阵A对待检索图像进行仿射变换),获得变换后的图像(仿射矩阵A和待检索图像进行矩阵乘法的结果)。
步骤2、对步骤1中获得的变换图像重新提取特征点和描述子。
步骤3、估计变换图像与库中图像的仿射矩阵B。
步骤4、将矩阵A与矩阵B相乘,得到最终调优后的仿射矩阵C。
步骤5、读入检索结果对应的视频的每一帧,将每一帧图像应用仿射矩阵C,通过OpenGL渲染到场景中该图像的位置,进行现实增强。(OpenGL,全写Open Graphics Library是个定义了一个跨编程语言、跨平台的编程接口规格的专业的图形程序接口。它用于三维图像或二维图像,是一个功能强大,调用方便的底层图形库。)
本发明中,对特征点匹配对通过简单的方法进行初筛选,以去除误匹配的点,大大的减少了后续仿射矩阵估计的计算量,误匹配的特征点匹配对包括:距离大于一定阈值的特征点匹配对,最近邻特征点匹配对的距离和次近邻的特征点匹配对的距离的比值小于一定阈值的特征点匹配对。
通过简单的几何校验策略对估计的仿射矩阵进行校验,取具有最小几何校验误差的图像作为最终的检索结果,获得了非常有效的检索效果。
通过求解变换后的图像的仿射变换,以获得调优后的仿射矩阵。得到了更稳定的视频增强效果。
本发明基于在图像上无标记增强现实的***和方法与现有技术相比,具有如下优点:
1、增强现实技术,将真实世界信息和虚拟世界信息“无缝”集成起来,获得了超越现实的感官体验。增强现实技术是把原本在现实世界的一定时间空间范围内很难体验到的视觉信息,通过电脑等科学技术,模拟仿真后再叠加,将虚拟的信息应用到真实世界,被人类感官所感知,从而达到超越现实的感官体验。真实的环境和虚拟的物体实时地叠加到了同一个画面或空间同时存在。
2、本***巧妙设计了基于局部特征的算法,准确率高达98%以上。
3、获得实时渲染效果。
4、本***可适应距离较大:目标图像离摄像头10cm-100cm(目标图像出现在摄像头的尺寸为64x64像素到略大于摄像头分辨率大小)都可以有效检测。
5、本***可适应360全角度的图像平面旋转。
6、可适应较多图像源,包括打印黑白图、彩色图、显示屏显示图像(手机、平板)等。
附图说明
图1是本发明检索流程图。
具体实施方式
下面下结合附图对本发明的具体实施方式作进一步描述,理解本发明。
参见附图1,一种基于在图像上无标记增强现实的***,它包括图像检索***,即使用手机摄像头扫描场景,在数据库中检索场景中出现的图像,寻找与之一致的图像作为检索结果;和增强现实***,即将与该图像对应的视频介绍渲染到场景中该图像的位置,进行现实增强。
种基于在图像上无标记增强现实的方法,所述的图像检索采用不变性描述子ORB来对图像进行特征点检测和描述,具体过程检索流程如下:
步骤1、利用不变性描述子ORB特征点检测器对数据库中的每一张图像和待检索图像进行特征点检测,并使用不变性ORB描述子来描述每个特征点,得到256bit的二值特征。
步骤2、对数据库中的某张图像,对待检索图像的每一个特征点,通过特征点描述子的比较,在数据库的这个图像中寻找近邻的特征点。
步骤3、对得到的特征点匹配对进行初筛选,去除误匹配的特征点;原则是:⑴、特征点匹配对的欧式距离大于一定阈值的去除;⑵、最近邻和次近邻的特征点匹配对的欧式距离比值小于一定阈值的去除;如果筛选后的匹配对少于一定阈值,则表明数据库中该图像和待检索图像非一致图像。
步骤4、对经过筛选后的匹配点对,运用RANSAC算法进行仿射矩阵的计算和内点的查找即对匹配点对的二次筛选。
步骤5、统计内点个数,如果二次筛选后的匹配对少于一定阈值,则表明数据库中该图像和待检索图像非一致图像。
步骤6、利用步骤4得到的仿射矩阵,对库中图像的五个参考点,四角和中心点进行仿射变换,得到变换后的五个点;如果变换后的五个点不满足以下关系,则表明数据库中该图像和待检索图像非一致图像。原则是:⑴、变换后,中心点依然在四个角中心。⑵、待检索特征点在变换后四个角点内部的数目要大于一定的阈值。⑶、面积要在一定的允许范围。
步骤7、将对边的差异作为几何校验误差。库中图像都是矩形,经过步骤6的仿射变换,得到库中图像在检索图像上的投影图像,该图像是四边形,四条边依次是:edge1,edge2,edge3,edge4. 其中edge1和edge3是对边,edge2和edge4是对边. Error表示几何校验误差,则:
Error = max(abs(edge1 -edge3) / (edge1 +edge3),abs(edge2 - edge4) /(edge2 + edge4));
Max表示最大值,abs表示绝对值。
步骤8、对数据库中的每一个图像,重复步骤2-7,取具有最小几何校验误差的图像作为最终的检索结果。
由上述图像检索可以获得估计的仿射矩阵A,为了获得更加稳定的仿射矩阵,需要对其仿射矩阵进行调优;具体调优步骤如下:
步骤1、将仿射矩阵A应用到待检索图像中,获得变换后的图像。
步骤2、对步骤1中获得的变换图像重新提取特征点和描述子。
步骤3、估计变换图像与库中图像的仿射矩阵B。
步骤4、将矩阵A与矩阵B相乘,得到最终调优后的仿射矩阵C。
步骤5、读入检索结果对应的视频的每一帧,将每一帧图像应用仿射矩阵C,通过OpenGL渲染到场景中该图像的位置,进行现实增强。
实施例只是为了便于理解本发明的技术方案,并不构成对本发明保护范围的限制,凡是未脱离本发明技术方案的内容或依据本发明的技术实质对以上方案所作的任何简单修改、等同变化与修饰,均仍属于本发明保护范围之内。
Claims (2)
1.基于在图像上无标记增强现实的***,其特征在于:它包括图像检索***,即使用手机摄像头扫描场景,在数据库中检索场景中出现的图像,寻找与之一致的图像作为检索结果;和增强现实***,即将与该图像对应的视频介绍渲染到场景中该图像的位置,进行现实增强;其中,所述的图像检索采用不变性描述子ORB来对图像进行特征点检测和描述,具体过程检索流程如下:
步骤1、利用不变性描述子ORB特征点检测器对数据库中的每一张图像和待检索图像进行特征点检测,并使用不变性ORB描述子来描述每个特征点,得到256bit的二值特征;
步骤2、对数据库中的某张图像,对待检索图像的每一个特征点,通过特征点描述子的比较,在数据库的这个图像中寻找近邻的特征点;
步骤3、对得到的特征点匹配对进行初筛选,去除误匹配的特征点;原则是:⑴、特征点匹配对的欧式距离大于一定阈值的去除;⑵、最近邻和次近邻的特征点匹配对的欧式距离比值小于一定阈值的去除;如果筛选后的匹配对少于一定阈值,则表明数据库中该图像和待检索图像非一致图像;
步骤4、对经过筛选后的匹配点对,运用RANSAC算法进行仿射矩阵的计算和内点的查找;
步骤5、统计内点个数,如果二次筛选后的匹配对少于一定阈值,则表明数据库中该图像和待检索图像非一致图像;
步骤6、利用步骤4得到的仿射矩阵,对库中图像的五个参考点,四角和中心点进行仿射变换,得到变换后的五个点;如果变换后的五个点不满足以下关系,则表明数据库中该图像和待检索图像非一致图像;原则是:⑴、变换后,中心点依然在四个角中心;⑵、待检索特征点在变换后四个角点内部的数目要大于一定的阈值;⑶、面积要在一定的允许范围;
步骤7、将对边的差异作为几何校验误差;库中图像都是矩形,经过步骤6的仿射变换,得到库中图像在检索图像上的投影图像,该图像是四边形,四条边依次是:edge1,edge2,edge3,edge4.其中edge1和edge3是对边,edge2和edge4是对边.Error表示几何校验误差,则:
Error=max(abs(edge1-edge3)/(edge1+edge3),
abs(edge2-edge4)/(edge2+edge4));
Max表示最大值,abs表示绝对值;
步骤8、对数据库中的每一个图像,重复步骤2-7,取具有最小几何校验误差的图像作为最终的检索结果。
2.根据权利要求1所述的基于在图像上无标记增强现实的***,其特征在于:还包括对由所述的图像检索获得估计的仿射矩阵A进行调优的步骤;具体调优步骤如下:
步骤1、将仿射矩阵A应用到待检索图像中,获得变换后的图像;
步骤2、对步骤1中获得的变换图像重新提取特征点和描述子;
步骤3、估计变换图像与库中图像的仿射矩阵B;
步骤4、将矩阵A与矩阵B相乘,得到最终调优后的仿射矩阵C;以及
步骤5、读入检索结果对应的视频的每一帧,将每一帧图像应用仿射矩阵C,通过OpenGL渲染到场景中该图像的位置,进行现实增强。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510471459.4A CN105069754B (zh) | 2015-08-05 | 2015-08-05 | 基于在图像上无标记增强现实的***和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510471459.4A CN105069754B (zh) | 2015-08-05 | 2015-08-05 | 基于在图像上无标记增强现实的***和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105069754A CN105069754A (zh) | 2015-11-18 |
CN105069754B true CN105069754B (zh) | 2018-06-26 |
Family
ID=54499112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510471459.4A Expired - Fee Related CN105069754B (zh) | 2015-08-05 | 2015-08-05 | 基于在图像上无标记增强现实的***和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105069754B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488541A (zh) * | 2015-12-17 | 2016-04-13 | 上海电机学院 | 增强现实***中基于机器学习的自然特征点识别方法 |
CN105719522A (zh) * | 2016-01-25 | 2016-06-29 | 成都趣动力教育科技有限公司 | 一种双客户端语音通信方法、装置及*** |
CN106204743B (zh) * | 2016-06-28 | 2020-07-31 | Oppo广东移动通信有限公司 | 一种增强现实功能的控制方法、装置及移动终端 |
CN106251404B (zh) * | 2016-07-19 | 2019-02-01 | 央数文化(上海)股份有限公司 | 方位跟踪方法、实现增强现实的方法及相关装置、设备 |
CN106250938B (zh) * | 2016-07-19 | 2021-09-10 | 易视腾科技股份有限公司 | 目标跟踪方法、增强现实方法及其装置 |
CN106447643A (zh) * | 2016-09-19 | 2017-02-22 | 西安你的主意电子商务有限公司 | 一种基于ar技术的互动影像处理方法 |
CN106845435A (zh) * | 2017-02-10 | 2017-06-13 | 深圳前海大造科技有限公司 | 一种基于实物检测追踪算法的扩增实境技术实现方法 |
CN106874865A (zh) * | 2017-02-10 | 2017-06-20 | 深圳前海大造科技有限公司 | 一种基于图像识别的扩增实境实现方法 |
CN106897982B (zh) * | 2017-02-23 | 2019-06-14 | 淮阴工学院 | 基于图像无标记识别的现实增强方法 |
CN109614859B (zh) * | 2018-11-01 | 2021-01-12 | 清华大学 | 视觉定位特征提取和匹配方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010142896A1 (fr) * | 2009-06-08 | 2010-12-16 | Total Immersion | Procédés et dispositifs d'identification d'objets réels, de suivi de la représentation de ces objets et de réalité augmentée, dans une séquence d'images, en mode client-serveur |
CN102142005A (zh) * | 2010-01-29 | 2011-08-03 | 株式会社泛泰 | 提供增强现实的***、终端、服务器及方法 |
CN103218854A (zh) * | 2013-04-01 | 2013-07-24 | 成都理想境界科技有限公司 | 在增强现实过程中实现部件标注的方法及增强现实*** |
CN103389978A (zh) * | 2012-05-07 | 2013-11-13 | 联想(北京)有限公司 | 一种通过增强现实技术获取信息的方法及*** |
CN104508697A (zh) * | 2012-05-31 | 2015-04-08 | 英特尔公司 | 用于提供增强现实服务的方法、服务器和计算机可读记录介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2751483C (en) * | 2009-02-06 | 2017-08-08 | Magna International Inc. | Module load enabling bracket |
-
2015
- 2015-08-05 CN CN201510471459.4A patent/CN105069754B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010142896A1 (fr) * | 2009-06-08 | 2010-12-16 | Total Immersion | Procédés et dispositifs d'identification d'objets réels, de suivi de la représentation de ces objets et de réalité augmentée, dans une séquence d'images, en mode client-serveur |
CN102142005A (zh) * | 2010-01-29 | 2011-08-03 | 株式会社泛泰 | 提供增强现实的***、终端、服务器及方法 |
CN103389978A (zh) * | 2012-05-07 | 2013-11-13 | 联想(北京)有限公司 | 一种通过增强现实技术获取信息的方法及*** |
CN104508697A (zh) * | 2012-05-31 | 2015-04-08 | 英特尔公司 | 用于提供增强现实服务的方法、服务器和计算机可读记录介质 |
CN103218854A (zh) * | 2013-04-01 | 2013-07-24 | 成都理想境界科技有限公司 | 在增强现实过程中实现部件标注的方法及增强现实*** |
Non-Patent Citations (2)
Title |
---|
ORB: an efficient alternative to SIFT or SURF;Rublee E 等;《New York:IEEE》;20111231;2564-2571 * |
基于改进ORB的图像特征点匹配;许宏科 等;《科学技术与工程》;20140628;第14卷(第18期);105-128 * |
Also Published As
Publication number | Publication date |
---|---|
CN105069754A (zh) | 2015-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105069754B (zh) | 基于在图像上无标记增强现实的***和方法 | |
CN112581629B (zh) | 增强现实显示方法、装置、电子设备及存储介质 | |
CN109753885B (zh) | 一种目标检测方法、装置以及行人检测方法、*** | |
US5247583A (en) | Image segmentation method and apparatus therefor | |
Dash et al. | Designing of marker-based augmented reality learning environment for kids using convolutional neural network architecture | |
Dutta et al. | A color edge detection algorithm in RGB color space | |
US8442327B2 (en) | Application of classifiers to sub-sampled integral images for detecting faces in images | |
CN109064525B (zh) | 一种图片格式转换方法、装置、设备和存储介质 | |
CN111539238B (zh) | 二维码图像修复方法、装置、计算机设备和存储介质 | |
CN106897982B (zh) | 基于图像无标记识别的现实增强方法 | |
CN111667005A (zh) | 一种采用rgbd视觉传感的人体交互*** | |
CN108960012B (zh) | 特征点检测方法、装置及电子设备 | |
CN112651953A (zh) | 图片相似度计算方法、装置、计算机设备及存储介质 | |
CN114758145A (zh) | 一种图像脱敏方法、装置、电子设备及存储介质 | |
KR20110087620A (ko) | 레이아웃 기반의 인쇄매체 페이지 인식방법 | |
TWI536280B (zh) | 街景影像之文字區域偵測系統及裝置 | |
CN111179281A (zh) | 人体图像提取方法及人体动作视频提取方法 | |
CN104331912B (zh) | 一种基于边缘矩阵的服装面料快速填充方法 | |
CN116862920A (zh) | 一种人像分割方法、装置、设备及介质 | |
CN114820681A (zh) | 一种基于rgb相机的库位检测方法及*** | |
CN111105394B (zh) | 一种检测发光小球特征信息的方法及装置 | |
JP7144384B2 (ja) | オブジェクト検出装置、方法及びプログラム | |
Lee et al. | Hand gesture recognition using blob detection for immersive projection display system | |
CN111325194B (zh) | 一种文字识别方法、装置及设备、存储介质 | |
CN113240611A (zh) | 一种基于图片序列的异物检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180626 Termination date: 20200805 |
|
CF01 | Termination of patent right due to non-payment of annual fee |