CN102789489A - 基于手持终端的图像检索方法和*** - Google Patents
基于手持终端的图像检索方法和*** Download PDFInfo
- Publication number
- CN102789489A CN102789489A CN2012102287115A CN201210228711A CN102789489A CN 102789489 A CN102789489 A CN 102789489A CN 2012102287115 A CN2012102287115 A CN 2012102287115A CN 201210228711 A CN201210228711 A CN 201210228711A CN 102789489 A CN102789489 A CN 102789489A
- Authority
- CN
- China
- Prior art keywords
- paster
- picture
- space
- rightarrow
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000006243 chemical reaction Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 38
- 239000011159 matrix material Substances 0.000 claims description 18
- 230000003595 spectral effect Effects 0.000 claims description 12
- 239000004744 fabric Substances 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 238000005303 weighing Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 2
- 230000006855 networking Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000000631 nonopiate Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明实现一个图像检索***。该***允许用户通过手持终端对感兴趣的物体或者场景进行拍照。照片上传服务器后,***使用数据库中的已有图片与用户所拍摄的图片进行匹配,以发现用户所拍摄的物体或者场景,从而确认用户的兴趣点或拍摄位置,然后将相关信息返回给用户的手持终端。本发明开发的图片匹配算法具有抗拍摄角度、尺度、旋转、光照变换的特点,匹配精度达95.34%以上,已经达到应用水平。
Description
技术领域
本发明涉及图像搜索技术领域,提供了一种基于手持终端的图像检索方法和***。
背景技术
目前的主流搜索引擎都是基于文字的,然而,普通用户在很多情况下都不能或者不方便用文字来描述自己查询的请求。本发明允许用户通过手持终端拍照的方式,用图片来表达自己的查询请求,直观而方便,满足了人民生活的实际需求。目前较成功的类似图像检索算法大都是基于局部兴趣点(LocalInteresting Points,LIPS)的。然而,由于提取所需LIPs的算法时间复杂度非常高,已有的算法很难用于实时的网络图片检索。本发明的算法在精度上大致趋近于基于LIPs的传统算法,但在时间复杂度上远远小于传统方法,满足了实时网络环境的图片检索需要。
发明内容
本发明的目的是克服现有技术的不足,提出一种抗拍摄角度、尺度、旋转、光照变换的图像匹配方法。
本发明为实现上述目的采用以下技术方案:
1、一种基于手持终端的图像检索方法,其特征在于包括以下步骤:
1)调用手持终端的摄像头程序接口进行照片采集;
2)调用手持终端的网路传输接口将图片传送至服务器;
3)最后将服务器返回的结果在用户界面中显示出来。
上述方案中,所述步骤2中服务器处理接收到图片后采用处理步骤包括:
21)接受客户端程序上传的图片;
22)将图片进行贴片分解;
23)将贴片映射到贴片空间中;
24)与库中已有图片进行匹配;
25)根据匹配结果预测用户的兴趣点或拍照位置;
26)将相关信息发送给客户端程序。
上述方案中,所述步骤22)中贴片分解方法包括以下步骤:
31)构建正交贴片空间模型:
a、将每幅图片建模成一组贴片的组合,在一幅图片所含的所有成员贴片上得出的统计特征用来代表该图片的特征;
b、通过搜集大规模的图片,并将所有图片的贴片汇总并进行聚类分析,找到一个最紧致的贴片集合通过衡量中所有贴片对的相似度,构造一个相似度矩阵R,对R进行谱分解之后得到一组特征向量,这组向量是中贴片的向量表达,这组特征向量张成的空间即为所求贴片空间;
其中Ru是m维向量,表达了贴片u与中所有参考贴片的关系。此时任意图片T在贴片空间中能表达为该图片对应的所有贴片在贴片空间中形成的向量的向量和,即
33)自适应匹配算法:将与源图片相似度超过一定阈值的图片视为候选的图片,使用隐马尔可夫模型(Hidden Markov Model)对贴片间的空间位置关系进行建模,来自动识别到图片中包含的模式,然后,在所有候选图片集合中搜索这些模式以发现最终的结果。
相对于传统的图像匹配技术,本发明提出的模型具有以下几项优势:
一、速度与精度的平衡:相对于全局特征的方法(如:分格提取的颜色矩),本发明提出的特征表达具有一定的抗变换能力,因而精度更高;相对传统局部特征方法(如:SIFT,SURF等),本发明提出的方法算法时间复杂度更低,检测速度更快,更适宜于大规模网络计算。
二、可扩展性:本发明构建的贴片空间里的向量可以互相计算,为进一步的挖掘算法留下了发展空间。加上空间的构建考虑了正交性(即各基向量都不线性相关),可以保证在空间里的相关计算更趋近线性空间的数学模型,因而更加精确。
三、本发明的核心为基于贴片空间的图像匹配模型。该模型构建一个贴片空间来进行图像特征表达,改进了传统方法中对两幅目标图片中的所有贴片(或者特征点)进行一一比对的方式,从而降低了副本图片检测算法的时间复杂度。同时,对图片进行贴片分解的方法打破了图片中局部特征点间的空间位置强约束,减小了各种副本图片编辑方式对特征表达的影响,从而提高了算法的鲁棒性。
附图说明
图1为本发明的***方框图;
图2为本发明的图像贴片分解示意图;
图3为本发明的***流程示意图。
具体实施方式
本发明的实施方案由客户端算法和服务器端算法两部分构成。
本发明的目的是克服现有技术的不足,提出一种抗拍摄角度、尺度、旋转、光照变换的图像匹配方法。
本发明的技术方案是:
首先构建一个能表达图片的贴片空间模型,让图片在该空间的表达能尽量不受各种图片变换的影响,然后在此基础上产生在速度和精度上都能满足网络(主要为手机网络)图片匹配的算法。所以相关研究分为三个部分:正交贴片空间模型、独立于变换的特征表达技术,以及自适应匹配算法。以下分别做简要介绍:
正交贴片空间模型:本模型将每幅图片建模成一组贴片(一个小的图像块)的组合(如图2所示),因此在一幅图片所含的所有成员贴片上得出的统计特征可以用来代表该图片的特征。
通过搜集大规模的图片,并将所有图片的贴片汇总并进行聚类分析,可以找到一个最紧致的贴片集合该集合包含最具有代表性一组贴片,反应了图片可能携带的各种细节特征。通过衡量中所有贴片对的相似度,可以构造一个相似度矩阵R。对R进行谱分解之后可以得到一组特征向量。这组向量是中贴片的向量表达。这组特征向量张成的空间即为所求贴片空间。由于是最具有代表性的贴片组,因此任何贴片(即使不在中),都可以通过衡量与中所有贴片的相似度来衡量它所携带的细节类别。例如,如果一个贴片X跟中的两贴片ui和uj最为相似,则说明X所携带的细节是ui和uj所携带细节特征的组合。所以,每个图片与中所有贴片的相似度构成的向量x表达了它所携带细节统计的分布。
但由于参考贴片(即中所有贴片)之间也具有一定的相似度,理论上来说直接用贴片与它们的相似度来构建空间的方法得到的结果是非正交的。这种非正交性会影响最终结果的精确性。因此可以使用谱分解(Spectral Decomposition)对空间的正交性进行优化。过程如下:首先,计算中所有贴片对(ui,uj)的余弦相似度并放入矩阵R=[rij]m×m,其中
R=VΛVT=(VΛ1/2VT)(VΛ1/2VT)=CTC (2)
CT为矩阵C的转置矩阵,其中Λ是包含了R特征值的对角矩阵,V是对应的特征向量矩阵。矩阵C包含了中所有贴片对应的向量,可以表示为C实际包含了一组线性空间的基向量。这些基向量所张开的空间就是我们要求的正交贴片空间。它的正交性可以保证贴片在空间中的表达具有全局一致性(Global Consistency)。最后任一非参考贴片可以在贴片空间中表达为:
其中Ru是m维向量,表达了贴片u与中所有参考贴片的关系(即式1所示余弦相似度)。任意图片T在贴片空间中可表达为该图片对应的所有贴片在贴片空间中形成的向量的向量和,即
通过上述模型,任意图片都可以映射到贴片空间中并表达成一个向量。图像间的相似度因此可以简单地通过计算它们对应向量的相似度(或距离)来判定。这种相似度计算方式避免了多点特征两两匹配的方式,算法的时间复杂度从O(N2)减低到O(cN)(其中c为一常数,代表贴片空间的维数)。
独立于变换的特征表达技术:贴片空间模型对图像进行的贴片分解将图片上各局部特征的强位置约束打散。因为局部细节受各种编辑特征改变带来的影响非常小,所以在贴片空间得到的向量表达鲁棒性较高,能更有效应付图像的旋转、位移、剪接及小规模缩放等编辑操作的影响。
自适应图像匹配算法:判断两幅图片是否包含统一对象或者场景,可以简单地根据它们的相似度进行衡量。但是,由于打散了局部特征的位置约束,使得某些物体的本身具有的模式(Pattern)也随之丢失。因此,研究中只把相似度作为一种选择候选副本的参考值,即:将与源图片相似度超过一定阈值的图片视为候选的图片。在进一步的匹配算法中,使用隐马尔可夫模型对贴片间的空间位置关系进行建模,这样可以自动识别到图片中包含的模式。然后,在所有候选图片集合中搜索这些模式以发现最终的结果。这些模式的发现不需要提前训练,是自适应的。
在贴片空间摸型的基础上所构建的图像匹配***运行流程如图3所示。***分为离线训练和在线匹配两个部分。离线部分中,首先搜集大量的图片作为训练集,再对训练集的所有贴片进行贴片提取后进行聚类分析,然后使用上述方法构造贴片空间。在线匹配部分中,当各测试图片到达时,首先进行贴片提取,再使用训练好的贴片空间对各测试图片进行贴片表达和图片级别的矢量化表达。然后根据矢量表达进行相似度计算,其结果作为副本(即包含同一物体或场景的图片对)判定的依据。
Claims (3)
1.一种基于手持终端的图像检索方法,其特征在于包括以下步骤:
1)调用手持终端的摄像头程序接口进行照片采集;
2)调用手持终端的网路传输接口将图片传送至服务器;
3)最后将服务器返回的结果在用户界面中显示出来。
2.根据权利要求1所述的一种基于手持终端的图像检索方法,其特征在于:所述步骤2中服务器处理接收到图片后采用处理步骤包括:
21)接受客户端程序上传的图片;
22)将图片进行贴片分解;
23)将贴片映射到贴片空间中;
24)与库中已有图片进行匹配;
25)根据匹配结果预测用户的兴趣点或拍照位置;
26)将相关信息发送给客户端程序。
3.根据权利要求2所述的一种基于手持终端的图像检索方法,其特征在于:所述步骤22)中贴片分解方法包括以下步骤:
31)构建正交贴片空间模型:
a、将每幅图片建模成一组贴片的组合,在一幅图片所含的所有成员贴片上得出的统计特征用来代表该图片的特征;
b、通过搜集大规模的图片,并将所有图片的贴片汇总并进行聚类分析,找到一个最紧致的贴片集合通过衡量中所有贴片对的相似度,构造一个相似度矩阵R,对R进行谱分解之后得到一组特征向量,这组向量是中贴片的向量表达,这组特征向量张成的空间即为所求贴片空间;
R=VΛVT=(VΛ1/2VT)(VΛ1/2VT)=CTC
33)自适应匹配算法:将与源图片相似度超过一定阈值的图片视为候选的图片,使用隐马尔可夫模型(Hidden Markov Model)对贴片间的空间位置关系进行建模,来自动识别到图片中包含的模式,然后,在所有候选图片集合中搜索这些模式以发现最终的结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210228711.5A CN102789489B (zh) | 2012-07-04 | 2012-07-04 | 基于手持终端的图像检索方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210228711.5A CN102789489B (zh) | 2012-07-04 | 2012-07-04 | 基于手持终端的图像检索方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102789489A true CN102789489A (zh) | 2012-11-21 |
CN102789489B CN102789489B (zh) | 2014-08-27 |
Family
ID=47154892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210228711.5A Expired - Fee Related CN102789489B (zh) | 2012-07-04 | 2012-07-04 | 基于手持终端的图像检索方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102789489B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103347032A (zh) * | 2013-08-01 | 2013-10-09 | 赵频 | 一种交友的方法和*** |
WO2014114144A1 (en) * | 2013-01-25 | 2014-07-31 | Tencent Technology (Shenzhen) Company Limited | Method, server and terminal for information interaction |
CN104125487A (zh) * | 2013-04-28 | 2014-10-29 | 腾讯科技(深圳)有限公司 | 一种上传图像数据的方法和装置 |
CN104933602A (zh) * | 2015-06-26 | 2015-09-23 | 南京鹰眼传媒科技有限公司 | 移动户外广告监测服务***及方法 |
CN106156252A (zh) * | 2015-04-28 | 2016-11-23 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN110262503A (zh) * | 2019-07-01 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 无人售卖车调度方法、装置、设备和可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101847154A (zh) * | 2010-02-26 | 2010-09-29 | 宇龙计算机通信科技(深圳)有限公司 | 一种查询信息的方法、***及移动终端查询信息的方法 |
CN101924992A (zh) * | 2010-07-30 | 2010-12-22 | 中国电信股份有限公司 | 通过移动终端获取景物资讯的方法、***和设备 |
CN101945327A (zh) * | 2010-09-02 | 2011-01-12 | 郑茂 | 基于数字图像识别和检索的无线定位方法、*** |
-
2012
- 2012-07-04 CN CN201210228711.5A patent/CN102789489B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101847154A (zh) * | 2010-02-26 | 2010-09-29 | 宇龙计算机通信科技(深圳)有限公司 | 一种查询信息的方法、***及移动终端查询信息的方法 |
CN101924992A (zh) * | 2010-07-30 | 2010-12-22 | 中国电信股份有限公司 | 通过移动终端获取景物资讯的方法、***和设备 |
CN101945327A (zh) * | 2010-09-02 | 2011-01-12 | 郑茂 | 基于数字图像识别和检索的无线定位方法、*** |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014114144A1 (en) * | 2013-01-25 | 2014-07-31 | Tencent Technology (Shenzhen) Company Limited | Method, server and terminal for information interaction |
US9832614B2 (en) | 2013-01-25 | 2017-11-28 | Tencent Technology (Shenzhen) Company Limited | Method, server and terminal for information interaction |
US10863310B2 (en) | 2013-01-25 | 2020-12-08 | Tencent Technology (Shenzhen) Company Limited | Method, server and terminal for information interaction |
CN104125487A (zh) * | 2013-04-28 | 2014-10-29 | 腾讯科技(深圳)有限公司 | 一种上传图像数据的方法和装置 |
CN104125487B (zh) * | 2013-04-28 | 2016-05-11 | 腾讯科技(深圳)有限公司 | 一种上传图像数据的方法和装置 |
CN103347032A (zh) * | 2013-08-01 | 2013-10-09 | 赵频 | 一种交友的方法和*** |
CN106156252A (zh) * | 2015-04-28 | 2016-11-23 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN104933602A (zh) * | 2015-06-26 | 2015-09-23 | 南京鹰眼传媒科技有限公司 | 移动户外广告监测服务***及方法 |
CN110262503A (zh) * | 2019-07-01 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 无人售卖车调度方法、装置、设备和可读存储介质 |
CN110262503B (zh) * | 2019-07-01 | 2022-06-03 | 百度在线网络技术(北京)有限公司 | 无人售卖车调度方法、装置、设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102789489B (zh) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102789489B (zh) | 基于手持终端的图像检索方法和*** | |
Cai et al. | Treepedia 2.0: applying deep learning for large-scale quantification of urban tree cover | |
CN110245709B (zh) | 基于深度学习和自注意力的3d点云数据语义分割方法 | |
CN104221054B (zh) | 人物属性推定***及学习用数据生成装置 | |
CN107133325B (zh) | 一种基于街景地图的互联网照片地理空间定位方法 | |
JP7412847B2 (ja) | 画像処理方法、画像処理装置、サーバ、及びコンピュータプログラム | |
Cheng et al. | A data-driven point cloud simplification framework for city-scale image-based localization | |
CN110969648B (zh) | 一种基于点云序列数据的3d目标跟踪方法及*** | |
CN114241464A (zh) | 基于深度学习的跨视角影像实时匹配地理定位方法及*** | |
CN108537887A (zh) | 基于3d打印的草图与模型库三维视图匹配方法 | |
CN110070573A (zh) | 关节图确定方法、装置、设备和存储介质 | |
CN110659369A (zh) | 在轨高精度轻量化全球影像控制点数据库构建方法及*** | |
CN111566700A (zh) | 用于借助多任务学习确定对象在对象的周围环境中的姿势的方法和控制设备 | |
CN112668662B (zh) | 基于改进YOLOv3网络的野外山林环境目标检测方法 | |
CN110852263A (zh) | 一种基于人工智能的手机拍照识别垃圾分类方法 | |
CN106250396A (zh) | 一种图像标签自动生成***及方法 | |
CN117711066A (zh) | 一种三维人体姿态估计方法、装置、设备及介质 | |
US11138785B2 (en) | Method and system for generating 3D image of character | |
WO2023214093A1 (en) | Accurate 3d body shape regression using metric and/or semantic attributes | |
CN112015937B (zh) | 一种图片地理定位方法及*** | |
Zhu et al. | Potentials of RGB-D cameras in as-built indoor environment modeling | |
CN114842508A (zh) | 一种基于深度图匹配的可见光-红外行人重识别方法 | |
CN114239250A (zh) | 一种国土空间规划设计的***和方法 | |
CN107133284A (zh) | 一种基于流行学习的视图三维模型检索方法 | |
CN113158035A (zh) | 一种顾及用户偏好的航天资源搜索方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140827 |