CN105095215B - 信息获取装置、方法以及服务器 - Google Patents
信息获取装置、方法以及服务器 Download PDFInfo
- Publication number
- CN105095215B CN105095215B CN201410163389.1A CN201410163389A CN105095215B CN 105095215 B CN105095215 B CN 105095215B CN 201410163389 A CN201410163389 A CN 201410163389A CN 105095215 B CN105095215 B CN 105095215B
- Authority
- CN
- China
- Prior art keywords
- images
- recognized
- database
- cluster
- cluster frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种信息获取装置、方法以及服务器,该装置包括:训练单元,训练数据库中的多个数据库图像,获得有关聚类频率的索引;接收单元,接收待识别图像;第一提取单元,提取待识别图像的特征;第一计算单元,根据提取的特征计算待识别图像的聚类频率分布;第二计算单元,根据聚类频率分布以及索引,计算待识别图像与数据库图像的聚类频率分布的距离;识别单元,根据该距离识别出与待识别图像相似的图像,并获得待识别图像的相关信息;发送单元,发送待识别图像的相关信息。通过将地点的图像作为待识别图像进行识别并获取相关信息,不需要知晓关于地点的关键词,就能够快速且准确的获取与该地点相关的信息。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种信息获取装置、方法以及服务器。
背景技术
随着智能设备和移动网络的快速发展,近年来,基于地点的服务成为一个研究的热点。比如,在外地旅游或出差时,如果需要获取某个地点(例如建筑物或者景点)的信息,现有的获取相关信息的方法是利用该建筑物或景点的名称等关键词,在互联网上进行搜索。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
上述现有的获取相关信息的方法,由于在互联网上搜索时需要输入例如建筑物或景点等地点的关键词(例如名称),在不清楚该建筑物或景点的名称、或者无法使用本国语言拼写出该名称的情况下,则无法通过在互联网进行搜索的手段获得相关信息。
本发明实施例提供一种信息获取装置、方法以及服务器,通过将地点的图像作为待识别图像进行识别并获取相关信息,不需要知晓关于地点的关键词,就能够快速且准确的获取与该地点相关的信息。
根据本发明实施例的第一方面,提供一种信息获取装置,所述装置包括:
训练单元,所述训练单元用于训练数据库中的多个数据库图像,获得有关聚类频率的索引,其中,所述索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;接收单元,所述接收单元用于接收待识别图像;第一提取单元,所述第一提取单元用于提取所述待识别图像的特征;第一计算单元,所述第一计算单元用于根据提取的特征计算所述待识别图像的聚类频率分布;第二计算单元,所述第二计算单元用于根据所述待识别图像的聚类频率分布、所述多个数据库图像的聚类频率分布以及所述索引,计算所述待识别图像与所述多个数据库图像的聚类频率分布的距离;识别单元,所述识别单元用于根据所述待识别图像与所述多个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像,并获得所述待识别图像的相关信息;发送单元,所述发送单元用于发送所述待识别图像的相关信息。
根据本发明实施例的第二方面,提供一种服务器,所述服务器包括根据本发明实施例的第一方面所述的信息获取装置。
根据本发明实施例的第三方面,提供一种信息获取方法,所述方法包括:接收待识别图像;提取所述待识别图像的特征;根据提取的特征计算所述待识别图像的聚类频率分布;根据所述待识别图像的聚类频率分布、多个数据库图像的聚类频率分布以及有关聚类频率的索引,计算所述待识别图像与所述多个数据库图像的聚类频率分布的距离;其中,所述索引通过训练数据库中的多个图像而获得,所述索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;根据所述待识别图像与所述多个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像,并获得所述待识别图像的相关信息;发送所述待识别图像的相关信息。
本发明的有益效果在于:通过将地点的图像作为待识别图像进行识别并获取相关信息,不需要知晓关于地点的关键词,就能够快速且准确的获取与该地点相关的信息。
参照后文的说明和附图,详细公开了本发明的特定实施方式,指明了本发明的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。
针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
附图说明
所包括的附图用来提供对本发明实施例的进一步的理解,其构成了说明书的一部分,用于例示本发明的实施方式,并与文字描述一起来阐释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例1的信息获取装置的结构示意图;
图2是本发明实施例1的训练单元的结构示意图;
图3是本发明实施例1的训练单元对数据库图像进行训练以获得上述索引的方法流程图;
图4是本发明实施例1的识别单元的结构示意图;
图5是本发明实施例1的识别图像并获得相关信息的方法流程图;
图6是本发明实施例2的服务器的***构成的一示意框图;
图7是本发明实施例3的通信***的结构示意图;
图8是本发明实施例4的信息获取方法的流程图。
具体实施方式
参照附图,通过下面的说明书,本发明的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本发明的特定实施方式,其表明了其中可以采用本发明的原则的部分实施方式,应了解的是,本发明不限于所描述的实施方式,相反,本发明包括落入所附权利要求的范围内的全部修改、变型以及等同物。
实施例1
图1是本发明实施例1的信息获取装置的结构示意图。如图1所示,该装置100包括:训练单元101、接收单元102、第一提取单元103、第一计算单元104、第二计算单元105、识别单元106以及发送单元107,其中,
训练单元101用于训练数据库中的多个数据库图像,获得有关聚类频率的索引,其中,该索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;
接收单元102用于接收待识别图像;
第一提取单元103用于提取该待识别图像的特征;
第一计算单元104用于根据提取的特征计算该待识别图像的聚类频率分布;第二计算单元105用于根据该待识别图像的聚类频率分布、该多个数据库图像的聚类频率分布以及该索引,计算该待识别图像与该多个数据库图像的聚类频率分布的距离;
识别单元106单元用于根据该待识别图像与该多个数据库图像的聚类频率分布的距离识别出与该待识别图像相似的图像,并获得该待识别图像的相关信息;
发送单元107用于发送该待识别图像的相关信息。
在本实施例中,训练单元101用于训练数据库图像,其中,该数据库图像是预先存储在数据库中的,该数据库可以利用现有的任一种方法建立。例如,搜集全球各个国家和地区的著名建筑物和景点的图像,并将这些图像进行分类和编号。但是,本发明实施例不限于这种方法。另外,该数据库可以存储在本装置中,也可以另行存储,本发明实施例不对数据库的存储位置进行限制。
在本实施例中,训练单元101可使用现有的任一种方法对数据库图像进行训练。以下对本发明实施例的训练单元对数据库图像进行训练以获得上述索引的方法进行示例性的说明。
图2是本实施例的训练单元的结构示意图。如图2所示,该训练单元101包括:第二提取单元201、第三计算单元202以及第四计算单元203,其中,
第二提取单元201用于提取各个数据库图像的特征;
第三计算单元202用于根据提取的特征计算各个数据库图像的聚类频率分布;
第四计算单元203用于根据各个数据库图像的聚类频率分布,计算上述索引。
图3是本实施例的训练单元对数据库图像进行训练以获得上述索引的方法流程图。如图3所示,该方法包括:
步骤301:提取各个数据库图像的特征;
步骤302:根据提取的特征计算各个数据库图像的聚类频率分布;
步骤303:根据各个数据库图像的聚类频率分布,计算上述索引。
在本实施例中,可以使用现有的任一种方法提取各个数据库图像的特征。例如,可使用梯度方向直方图法(Histogram of Oriented Gradient,HOG)、尺度不变特征转换法(Scale-invariant Feature Transform,SIFT)、快速鲁棒性特征法(Speeded Up RobustFeature,SURF)等现有方法。但本发明实施例不限于上述方法。
在本实施例中,数据库图像的各个特征表示该图像的某一部分的特性,各个特征在图像中的位置可以由密集样本或者兴趣点而决定。在提取特征之后,各个数据库图像可以用一系列的特征表示,其中,各个特征用固定长度的矢量表示。例如,对于数据库图像Xi,提取出的特征可用下式(1)表示:
其中,N表示数据库图像Xi的特征个数,i,N均为正整数。
在本实施例中,在提取出各个数据库图像的特征之后,可使用现有的任一种方法计算各个数据库图像的聚类频率分布。例如,可使用C-均值(C-Means)聚类算法将数据库图像的所有特征进行聚类,并以此分别得到各个数据库图像的特征所对应的聚类频率。
例如,使用C-均值聚类算法将各个数据库图像的各个特征归类为K个聚类,可用下式(2)表示:
C={C1,…,CK} (2)
其中,K为正整数。
对于数据库图像Xi的N个特征,可利用现有的任一种方法将其归类至上述K个聚类中,可用下式(3)和(4)表示:
Fi→Gi={C2,C1,CK,…,C5} (4)
其中,特征属于聚类C2,特征属于聚类C1,特征属于聚类CK,……,特征属于聚类C5。
在本实施例中,在将各个数据库图像的各个特征进行归类之后,可以计算各个数据库图像的聚类频率分布。以下对本实施例的计算各个数据库图像的聚类频率分布的方法进行示例性的说明。
例如设定了5个聚类,即:C={C1,C2,C3,C4,C5},数据库图像Xi具有10个特征,根据上式(4),数据库图像Xi的10个特征的聚类分别是:Gi={2,1,3,5,2,1,1,1,3,3},因此,数据库图像Xi的特征中有4个特征属于聚类C1,有2个特征属于聚类C2,有3个特征属于聚类C3,有0个特征属于聚类C4,有1个特征属于聚类C5。那么,数据库图像Xi的聚类频率分布可以计算如下:Hi={4,2,3,0,1}/10={0.4,0.2,0.3,0,0.1}。
在本实施例中,对于每个数据库图像都采用上述方法计算聚类频率分布,从而获得各个数据库图像的聚类频率分布。在获得各个图像的聚类频率分布之后,利用该聚类频率分布,计算有关聚类频率的索引,其中,该索引是对应于各个聚类的、各个数据库图像的聚类频率的集合。以下对本实施例的计算该索引的方法进行示例性的说明。
例如,同样设定了5个聚类,即:C={C1,C2,C3,C4,C5}。例如一共有4个数据库图像,且各个数据库图像的聚类频率分布用下式(5)如下:
那么,有关聚类频率的索引可用下式(6)表示如下:
从而获得了对应于各个聚类的、各个数据库图像的聚类频率的集合,即获得了上述索引。
在本实施例中,接收单元102可以使用现有的任一种方法接收待识别图像。例如,可通过无线通信的方式接收该待识别图像。其中,该待识别图像可以是用户拍摄的关于某个地点的图像,例如,该待识别图像是某个建筑物或者景点的图像。
在本实施例中,第一提取单元103可以使用现有的任一种方法提取该待识别图像的特征。例如,该方法可与训练单元101使用的提取特征的上述方法相同,此处不再赘述。
在本实施例中,第一计算单元104可以使用现有的任一种方法计算该待识别图像的聚类频率分布。例如,该方法可与训练单元101使用的计算聚类频率分布的上述方法相同,此处不再赘述。
在本实施例中,在获得该待识别图像和各个数据库图像的聚类频率分布以及上述有关聚类频率的索引之后,第二计算单元105根据该待识别图像和多个数据库图像的聚类频率分布以及该索引,计算该待识别图像与各个数据库图像的聚类频率分布的距离。通过利用上述索引计算该待识别图像与各个数据库图像的聚类频率分布的距离,能够有效的提高计算速度和图像识别速度,从而提高获取相关信息的速度。
其中,可使用现有的任一种方法进行计算。以下对本发明实施例利用该待识别图像和多个数据库图像的聚类频率分布以及该索引计算上述距离的方法进行示例性的说明。
例如,可以使用下式(7)计算待识别图像与各个数据库图像的聚类频率分布的距离:
Di=D0-Fi-FQ-w|Fi-FQ| (7)
其中,Di表示待识别图像与第i个数据库图像的聚类频率分布的距离,D0表示初始距离,Fi表示上述索引中的第i个数据库图像的聚类频率,FQ表示待识别图像的聚类频率,w表示权值,w>0,其根据实际需要进行设定。
例如,初始距离D0=2.0,权值w=1,数据库图像有4个,分别是X1、X2、X3和X4,各个数据库图像的聚类频率分布用上式(5)表示,待识别图像的聚类频率分布为:HQ={0.4,0.0,0.6,0.0,0.0},并且,采用上式(6)表示的索引进行计算。但本发明实施例不限于上述取值。
对于聚类C1至C5,根据上式(6)和(7)依次计算待识别图像与各个数据库图像的聚类频率分布的距离,并且,在计算过程中,将对于该聚类计算得到的识别图像与各个数据库图像的聚类频率分布的距离作为计算下一个聚类的各个距离时使用的初始距离,具体计算过程如下:
对于聚类C1,根据上式(6)和(7),待识别图像与数据库图像X1、X2、X3的距离分别计算如下:
Dist_1=2.0-0.4-0.4+|0.4-0.4|=1.2
Dist_2=2.0-0.4-0.1+|0.4-0.1|=1.8
Dist_3=2.0-0.4-0.2+|0.4-0.2|=1.6
而由于数据库图像X4中聚类C1的频率为0,因此,待识别图像与数据库图像X4的距离仍然为初始距离,即2.0。
对于聚类C2,将对于聚类C1计算得到的待识别图像与各个数据库图像的距离作为初始距离,而由于待识别图像中对于聚类C2的相应频率为0,因此不对初始距离进行更新,待识别图像与数据库图像X1、X2、X3、X4的距离分别是1.2、1.8、1.6和2.0。
对于聚类C3,将对于聚类C2计算得到的待识别图像与各个数据库图像的距离作为初始距离,根据上式(6)和(7),待识别图像与数据库图像X1、X2、X3、X4的距离分别计算如下:
Dist_1=1.2-0.6-0.3+|0.6-0.3|=0.9
Dist_2=1.8-0.6-0.8+|0.6-0.8|=0.6
Dist_3=1.6-0.6-0.8+|0.6-0.8|=0.4
Dist_4=2.0-0.6-0.2+|0.6-0.2|=1.6
对于聚类C4,将对于聚类C3计算得到的待识别图像与各个数据库图像的距离作为初始距离,而由于待识别图像中对于聚类C4的相应频率为0,因此不对初始距离进行更新,待识别图像与数据库图像X1、X2、X3、X4的距离分别是0.9、0.6、0.4和1.6。
对于聚类C5,将对于聚类C4计算得到的待识别图像与各个数据库图像的距离作为初始距离,同样的,由于待识别图像中对于聚类C5的相应频率为0,因此不对初始距离进行更新,最后得到的待识别图像与数据库图像X1、X2、X3、X4的距离分别是0.9、0.6、0.4和1.6。
在本实施例中,识别单元106根据该待识别图像与各个数据库图像的聚类频率分布的距离识别出与该待识别图像相似的图像,并获得所述待识别图像的相关信息。其中,可使用现有的任一种方法根据上述距离识别出与该待识别图像相似的图像并获得待识别图像的相关信息。例如,可采用k-NN投票法进行识别并获得相关信息。以下对本发明实施例的识别图像并获得相关信息的方法进行示例性的说明。
图4是本实施例的识别单元的结构示意图。如图4所述,识别单元106包括:第二过滤单元401以及第三过滤单元402,其中,
第二过滤单元401用于根据该待识别图像与各个数据库图像的聚类频率分布的距离,对各个数据库图像进行过滤,获得与该待识别图像相似的图像;
第三过滤单元402用于对与所述待识别图像相似的图像进行过滤,获得与该待识别图像相似的图像中出现次数最多的图像类别,并将其作为该待识别图像的图像类别。
图5是本实施例的识别图像并获得相关信息的方法流程图。如图5所示,该方法包括:
步骤501:根据该待识别图像与各个数据库图像的聚类频率分布的距离,对各个数据库图像进行过滤,获得与该待识别图像相似的图像;
步骤502:对与该待识别图像相似的图像进行过滤,获得与该待识别图像相似的图像中出现次数最多的图像类别,并将其作为该待识别图像的图像类别。
在本实施例中,例如可将上述距离小于某个预先设定的阈值的k个数据库图像作为与该待识别图像相似的图像,然后在该k个数据库图像中确定出现次数最多的图像类别,作为该待识别图像的图像类别。
在本实施例中,获取了该待识别图像的图像类别,根据该图像类别,还可以从数据库中获取相应图像的其他信息,例如,该数据库图像中地点的名称。利用该地点名称,还可以进一步的搜索与该地点相关的更多信息。其中,该搜索可以在本装置中进行,也可以在互联网上进行,本发明实施例不对搜索的位置进行限制。
在本实施例中,在获得了待识别图像的相关信息之后,发送单元107用于该相关信息,其中,可使用现有的任一种方法发送该信息。例如,可使用无线通信的方式发送该信息。本发明实施例不对发送该信息的方法进行限制。
在本实施例中,该装置还可以包括:第一过滤单元108,其用于根据该待识别图像的位置信息对该数据库中的图像进行过滤,以获得用于计算上述距离的多个数据库图像。其中,第一过滤单元108为可选部件,在图1中用虚线框表示。
在本实施例中,该位置信息可与该待识别图像一起接收,也可以分别接收,本发明实施例不对此进行限制。利用该位置信息对数据库图像进行过滤可使用现有的任一种方法。例如,将位置坐标与待识别图像的位置坐标接近的数据库图像作为过滤后的图像。
在本实施例中,将过滤后的数据库图像用于计算距离,能够缩小图像识别的范围,进一步提高图像的识别速度。
在本实施例中,该装置还可以包括:剪切单元109,其用于对训练单元101计算出的各个数据库图像的聚类频率分布中大于预先设定的阈值的聚类频率进行剪切处理,并对剪切后的聚类频率分布进行归一化处理,并将归一化处理后的聚类频率分布用于计算上述索引。其中,剪切单元109为可选部件,在图1中用虚线框表示。
在本实施例中,该预先设定的阈值可以根据实际需要而设定。例如,可以将该阈值设为该数据库图像的聚类频率的平均值的两倍。本发明实施例不对该阈值的取值进行限制。
例如,对于聚类频率分布H={0.2,0.2,0.5,0,0.1},其中聚类频率的平均值为0.2,那么将该聚类频率分布中的聚类频率超过0.4的部分进行剪切处理,即将0.5置为0.4,获得剪切处理的结果:H={0.2,0.2,0.4,0,0.1}。然后,对该结果进行归一化处理,获得归一化后的结果:H={0.22,0.22,0.44,0,0.11}。
在本实施例中,对于聚类频率过高的部分进行剪切并进行归一化处理,并将处理后的结果用于计算数据库图像的聚类频率分布,能够进一步提高图像识别的准确度。
由上述实施例可知,通过将地点的图像作为待识别图像进行识别并获取相关信息,不需要知晓关于地点的关键词,就能够快速且准确的获取与该地点相关的信息。
实施例2
本发明实施例提供一种服务器,该服务器包括如实施例1所述的信息获取装置。
图6是本发明实施例2的服务器600的***构成的一示意框图。如图6所示,服务器600可以包括中央处理器601和存储器602;存储器602耦合到中央处理器601。该图是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
如图6所示,该服务器600还可以包括:通信模块603、输入单元604、显示器605、电源606。
在一个实施方式中,信息获取装置的功能可以被集成到中央处理器601中。其中,中央处理器601可以被配置为:接收待识别图像;提取所述待识别图像的特征;根据提取的特征计算所述待识别图像的聚类频率分布;根据所述待识别图像的聚类频率分布、多个数据库图像的聚类频率分布以及有关聚类频率的索引,计算所述待识别图像与所述多个数据库图像的聚类频率分布的距离;其中,所述索引通过训练数据库中的多个图像而获得,所述索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;根据所述待识别图像与所述多个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像,并获得所述待识别图像的相关信息;发送所述待识别图像的相关信息。
其中,所述根据所述待识别图像与各个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像并获得所述待识别图像的相关信息,包括:根据所述待识别图像与各个数据库图像的聚类频率分布的距离,对各个数据库图像进行过滤,获得与所述待识别图像相似的图像;对与所述待识别图像相似的图像进行过滤,获得与所述待识别图像相似的图像中出现次数最多的图像类别,并将其作为所述待识别图像的图像类别。
其中,中央处理器601还可以被配置为:根据所述待识别图像的位置信息,对所述数据库中的图像进行过滤,以获得用于计算所述距离的所述多个数据库图像。
其中,中央处理器601还可以被配置为:训练数据库中的多个数据库图像,获得所述索引;其中,训练数据库中的多个数据库图像,获得所述索引,包括:提取各个数据库图像的特征;根据提取的特征计算各个数据库图像的聚类频率分布;根据各个数据库图像的聚类频率分布,计算所述索引。
其中,中央处理器601还可以被配置为:对各个数据库图像的聚类频率分布中大于预先设定的阈值的聚类频率进行剪切处理,并对剪切后的聚类频率分布进行归一化处理。
在另一个实施方式中,信息获取装置可以与中央处理器601分开配置,例如可以将信息获取装置配置为与中央处理器601连接的芯片,通过中央处理器的控制来实现图像处理装置的功能。
在本实施例中服务器600也并不是必须要包括图6中所示的所有部件
如图6所示,中央处理器601有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,中央处理器601接收输入并控制服务器600的各个部件的操作。
存储器602,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器601可执行该存储器602存储的该程序,以实现信息存储或处理等。其他部件的功能与现有类似,此处不再赘述。服务器600的各部件可以通过专用硬件、固件、软件或其结合来实现,而不偏离本发明的范围。
由上述实施例可知,通过将地点的图像作为待识别图像进行识别并获取相关信息,不需要知晓关于地点的关键词,就能够快速且准确的获取与该地点相关的信息。
实施例3
图7是本发明实施例3的通信***的结构示意图。如图7所示,该通信***700包括用户设备701以及服务器702,其中,服务器的结构和功能与实施例2中的记载相同,此处不再赘述。
在本实施例中,用户设备701在某个地点拍摄图像,并将其作为待识别图像发送给服务器702,也可以将拍摄地点的位置信息与图像一起或者与图像分别发送给服务器702,服务器702在识别出与该待识别图像相似的图像,并获得待识别图像的相关信息后,将该相关信息发送给用户设备701。
在本实施例中,该用户设备例如是便携式无线电通信设备,包括所有诸如移动电话、智能手机、个人数字助理(PDA)、智能电话等的设备。另外,该用户设备还可以是具有摄像功能的设备,例如包括:照相机、摄像机等。本发明实施例并不对用户设备的种类进行限制。
由上述实施例可知,通过将地点的图像作为待识别图像进行识别并获取相关信息,不需要知晓关于地点的关键词,就能够快速且准确的获取与该地点相关的信息。
实施例4
图8是本发明实施例4的信息获取方法的流程图,对应于实施例1的信息获取装置。如图8所示,该方法包括:
步骤801:接收待识别图像;
步骤802:提取该待识别图像的特征;
步骤803:根据提取的特征计算所述待识别图像的聚类频率分布;
步骤804:根据该待识别图像的聚类频率分布、多个数据库图像的聚类频率分布以及有关聚类频率的索引,计算该待识别图像与多个数据库图像的聚类频率分布的距离;其中,该索引通过训练数据库中的多个图像而获得,该索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;
步骤805:根据该待识别图像与多个数据库图像的聚类频率分布的距离识别出与该待识别图像相似的图像,并获得该待识别图像的相关信息;
步骤806:发送该待识别图像的相关信息。
在本实施例中,该方法还可以包括:根据所述待识别图像的位置信息,对所述数据库中的图像进行过滤,以获得用于计算所述距离的多个数据库图像。
在本实施例中,该方法还可以包括:训练数据库中的多个数据库图像,获得所述索引;其中,训练数据库中的多个数据库图像,获得所述索引,包括:提取各个数据库图像的特征;根据提取的特征计算各个数据库图像的聚类频率分布;根据各个数据库图像的聚类频率分布,计算所述索引。
在本实施例中,该方法还可以包括:对各个数据库图像的聚类频率分布中大于预先设定的阈值的聚类频率进行剪切处理,并对剪切后的聚类频率分布进行归一化处理。
在本实施例中,训练数据库图像的方法、进行剪切处理和归一化处理的方法、接收待识别图像的方法、根据所述待识别图像的位置信息对该数据库中的图像进行过滤的方法、提取特征的方法、计算聚类频率分布的方法、计算待识别图像与各个数据库图像的聚类频率分布的距离的方法、根据该距离识别出与待识别图像相似的图像,并获得待识别图像的相关信息的方法以及发送相关信息的方法与实施例1的记载相同,此处不再赘述。
由上述实施例可知,通过将地点的图像作为待识别图像进行识别并获取相关信息,不需要知晓关于地点的关键词,就能够快速且准确的获取与该地点相关的信息。
本发明实施例还提供一种计算机可读程序,其中当在信息获取装置或服务器中执行所述程序时,所述程序使得计算机在所述信息获取装置或服务器中执行实施例4所述的信息获取方法。
本发明实施例还提供一种存储有计算机可读程序的存储介质,其中所述计算机可读程序使得计算机在信息获取装置或服务器中执行实施例4所述的信息获取方法。
本发明以上的装置和方法可以由硬件实现,也可以由硬件结合软件实现。本发明涉及这样的计算机可读程序,当该程序被逻辑部件所执行时,能够使该逻辑部件实现上文所述的装置或构成部件,或使该逻辑部件实现上文所述的各种方法或步骤。本发明还涉及用于存储以上程序的存储介质,如硬盘、磁盘、光盘、DVD、flash存储器等。
以上结合具体的实施方式对本发明进行了描述,但本领域技术人员应该清楚,这些描述都是示例性的,并不是对本发明保护范围的限制。本领域技术人员可以根据本发明的精神和原理对本发明做出各种变型和修改,这些变型和修改也在本发明的范围内。
关于包括以上实施例的实施方式,还公开下述的附记:
附记1、一种信息获取装置,所述装置包括:
训练单元,所述训练单元用于训练数据库中的多个数据库图像,获得有关聚类频率的索引,其中,所述索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;接收单元,所述接收单元用于接收待识别图像;
第一提取单元,所述第一提取单元用于提取所述待识别图像的特征;
第一计算单元,所述第一计算单元用于根据提取的特征计算所述待识别图像的聚类频率分布;
第二计算单元,所述第二计算单元用于根据所述待识别图像的聚类频率分布、所述多个数据库图像的聚类频率分布以及所述索引,计算所述待识别图像与所述多个数据库图像的聚类频率分布的距离;
识别单元,所述识别单元用于根据所述待识别图像与所述多个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像,并获得所述待识别图像的相关信息;
发送单元,所述发送单元用于发送所述待识别图像的相关信息。
附记2、根据附记1所述的装置,其中,所述装置还包括:
第一过滤单元,所述第一过滤单元用于根据所述待识别图像的位置信息,对所述数据库中的图像进行过滤,以获得用于计算所述距离的所述多个数据库图像。
附记3、根据附记1所述的装置,其中,所述训练单元包括:
第二提取单元,所述第二提取单元用于提取各个数据库图像的特征;
第三计算单元,所述第三计算单元用于根据提取的特征计算各个数据库图像的聚类频率分布;
第四计算单元,所述第四计算单元用于根据各个数据库图像的聚类频率分布,计算所述索引。
附记4、根据附记3所述的装置,其中,所述装置还包括:
剪切单元,所述剪切单元用于对各个数据库图像的聚类频率分布中大于预先设定的阈值的聚类频率进行剪切处理,并对剪切后的聚类频率分布进行归一化处理。
附记5、根据附记1所述的装置,其中,所述识别单元包括:
第二过滤单元,第二过滤单元用于根据所述待识别图像与各个数据库图像的聚类频率分布的距离,对各个数据库图像进行过滤,获得与所述待识别图像相似的图像;
第三过滤单元,所述第三过滤单元用于对与所述待识别图像相似的图像进行过滤,获得与所述待识别图像相似的图像中出现次数最多的图像类别,并将其作为所述待识别图像的图像类别。
附记6、根据附记1所述的装置,其中,所述第二计算单元利用下式(1)计算所述待识别图像与各个数据库图像的聚类频率分布的距离:
Di=D0-Fi-FQ-w|Fi-FQ| (1)
其中,Di表示待识别图像与第i个数据库图像的聚类频率分布的距离,D0表示初始距离,Fi表示所述索引中的第i个数据库图像的聚类频率,FQ表示待识别图像的聚类频率;w表示权值,w>0,其根据实际需要进行设定。
附记7、一种服务器,包括如附记1至6任一项所述的信息获取装置。
附记8、一种信息获取方法,所述方法包括:
接收待识别图像;
提取所述待识别图像的特征;
根据提取的特征计算所述待识别图像的聚类频率分布;
根据所述待识别图像的聚类频率分布、多个数据库图像的聚类频率分布以及有关聚类频率的索引,计算所述待识别图像与所述多个数据库图像的聚类频率分布的距离;其中,所述索引通过训练数据库中的多个图像而获得,所述索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;
根据所述待识别图像与所述多个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像,并获得所述待识别图像的相关信息;
发送所述待识别图像的相关信息。
附记9、根据附记8所述的方法,其中,所述方法还包括:
根据所述待识别图像的位置信息,对所述数据库中的图像进行过滤,以获得用于计算所述距离的所述多个数据库图像。
附记10、根据附记8所述的方法,其中,所述方法还包括:训练数据库中的多个数据库图像,获得所述索引;
其中,训练数据库中的多个数据库图像,获得所述索引,包括:
提取各个数据库图像的特征;
根据提取的特征计算各个数据库图像的聚类频率分布;
根据各个数据库图像的聚类频率分布,计算所述索引。
附记11、根据附记10所述的方法,其中,所述方法还包括:
对各个数据库图像的聚类频率分布中大于预先设定的阈值的聚类频率进行剪切处理,并对剪切后的聚类频率分布进行归一化处理。
附记12、根据附记8所述的方法,其中,所述根据所述待识别图像与所述多个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像并获得所述待识别图像的相关信息,包括:
根据所述待识别图像与各个数据库图像的聚类频率分布的距离,对各个数据库图像进行过滤,获得与所述待识别图像相似的图像;
对与所述待识别图像相似的图像进行过滤,获得与所述待识别图像相似的图像中出现次数最多的图像类别,并将其作为所述待识别图像的图像类别。
附记13、根据附记8所述的方法,其中,利用下式(1)计算所述待识别图像与所述多个数据库图像的聚类频率分布的距离:
Di=D0-Fi-FQ-w|Fi-FQ| (1)
其中,Di表示待识别图像与第i个数据库图像的聚类频率分布的距离,D0表示初始距离,Fi表示所述索引中的第i个数据库图像的聚类频率,FQ表示待识别图像的聚类频率,w表示权值,w>0,其根据实际需要进行设定。
Claims (9)
1.一种信息获取装置,所述装置包括:
训练单元,所述训练单元用于训练数据库中的多个数据库图像,获得有关聚类频率的索引,其中,所述索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;
接收单元,所述接收单元用于接收待识别图像;
第一提取单元,所述第一提取单元用于提取所述待识别图像的特征;
第一计算单元,所述第一计算单元用于根据提取的特征计算所述待识别图像的聚类频率分布;
第二计算单元,所述第二计算单元用于根据所述待识别图像的聚类频率分布、所述多个数据库图像的聚类频率分布以及所述索引,计算所述待识别图像与所述多个数据库图像的聚类频率分布的距离;
识别单元,所述识别单元用于根据所述待识别图像与所述多个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像,并获得所述待识别图像的相关信息;
发送单元,所述发送单元用于发送所述待识别图像的相关信息,
其中,所述第二计算单元利用下式(1)计算所述待识别图像与各个数据库图像的聚类频率分布的距离:
Di=D0-Fi-FQ-w|Fi-FQ| (1)
其中,Di表示待识别图像与第i个数据库图像的聚类频率分布的距离,D0表示初始距离,Fi表示所述索引中的第i个数据库图像的聚类频率,FQ表示待识别图像的聚类频率;w表示权值,w>0,其根据实际需要进行设定。
2.根据权利要求1所述的装置,其中,所述装置还包括:
第一过滤单元,所述第一过滤单元用于根据所述待识别图像的位置信息,对所述数据库中的图像进行过滤,以获得用于计算所述距离的所述多个数据库图像。
3.根据权利要求1所述的装置,其中,所述训练单元包括:
第二提取单元,所述第二提取单元用于提取各个数据库图像的特征;
第三计算单元,所述第三计算单元用于根据提取的特征计算各个数据库图像的聚类频率分布;
第四计算单元,所述第四计算单元用于根据各个数据库图像的聚类频率分布,计算所述索引。
4.根据权利要求3所述的装置,其中,所述装置还包括:
剪切单元,所述剪切单元用于对各个数据库图像的聚类频率分布中大于预先设定的阈值的聚类频率进行剪切处理,并对剪切后的聚类频率分布进行归一化处理。
5.根据权利要求1所述的装置,其中,所述识别单元包括:
第二过滤单元,第二过滤单元用于根据所述待识别图像与各个数据库图像的聚类频率分布的距离,对各个数据库图像进行过滤,获得与所述待识别图像相似的图像;
第三过滤单元,所述第三过滤单元用于对与所述待识别图像相似的图像进行过滤,获得与所述待识别图像相似的图像中出现次数最多的图像类别,并将其作为所述待识别图像的图像类别。
6.一种服务器,包括如权利要求1至5任一项所述的信息获取装置。
7.一种信息获取方法,所述方法包括:
接收待识别图像;
提取所述待识别图像的特征;
根据提取的特征计算所述待识别图像的聚类频率分布;
根据所述待识别图像的聚类频率分布、多个数据库图像的聚类频率分布以及有关聚类频率的索引,计算所述待识别图像与所述多个数据库图像的聚类频率分布的距离;其中,所述索引通过训练数据库中的多个图像而获得,所述索引是对应于各个聚类的、各个数据库图像的聚类频率的集合;
根据所述待识别图像与所述多个数据库图像的聚类频率分布的距离识别出与所述待识别图像相似的图像,并获得所述待识别图像的相关信息;
发送所述待识别图像的相关信息,
其中,利用下式(1)计算所述待识别图像与各个数据库图像的聚类频率分布的距离:
Di=D0-Fi-FQ-w|Fi-FQ| (1)
其中,Di表示待识别图像与第i个数据库图像的聚类频率分布的距离,D0表示初始距离,Fi表示所述索引中的第i个数据库图像的聚类频率,FQ表示待识别图像的聚类频率;w表示权值,w>0,其根据实际需要进行设定。
8.根据权利要求7所述的方法,其中,所述方法还包括:
根据所述待识别图像的位置信息,对所述数据库中的图像进行过滤,以获得用于计算所述距离的所述多个数据库图像。
9.根据权利要求7所述的方法,其中,所述方法还包括:训练数据库中的多个数据库图像,获得所述索引;
其中,训练数据库中的多个数据库图像,获得所述索引,包括:
提取各个数据库图像的特征;
根据提取的特征计算各个数据库图像的聚类频率分布;
根据各个数据库图像的聚类频率分布,计算所述索引。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410163389.1A CN105095215B (zh) | 2014-04-22 | 2014-04-22 | 信息获取装置、方法以及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410163389.1A CN105095215B (zh) | 2014-04-22 | 2014-04-22 | 信息获取装置、方法以及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105095215A CN105095215A (zh) | 2015-11-25 |
CN105095215B true CN105095215B (zh) | 2019-05-10 |
Family
ID=54575684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410163389.1A Active CN105095215B (zh) | 2014-04-22 | 2014-04-22 | 信息获取装置、方法以及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105095215B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930499B (zh) * | 2016-05-09 | 2019-11-22 | 深圳市数极科技有限公司 | 一种图片搜索方法及*** |
CN110912933B (zh) * | 2019-12-17 | 2021-04-02 | 中国科学院信息工程研究所 | 一种基于被动测量的设备识别方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324677A (zh) * | 2013-05-24 | 2013-09-25 | 西安交通大学 | 一种可分级的快速图像gps位置估计方法 |
-
2014
- 2014-04-22 CN CN201410163389.1A patent/CN105095215B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324677A (zh) * | 2013-05-24 | 2013-09-25 | 西安交通大学 | 一种可分级的快速图像gps位置估计方法 |
Non-Patent Citations (1)
Title |
---|
基于LSI和软加权的视频语义概念检测;张瑞杰 等;《信息工程大学学报》;20130415;第14卷(第2期);第196-201页 |
Also Published As
Publication number | Publication date |
---|---|
CN105095215A (zh) | 2015-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12001475B2 (en) | Mobile image search system | |
US10025950B1 (en) | Systems and methods for image recognition | |
EP3028184B1 (en) | Method and system for searching images | |
CN109284729B (zh) | 基于视频获取人脸识别模型训练数据的方法、装置和介质 | |
CN110362677B (zh) | 文本数据类别的识别方法及装置、存储介质、计算机设备 | |
CN107633066B (zh) | 一种信息展示方法、装置、电子设备及存储介质 | |
CN109213882B (zh) | 图片排序方法及终端 | |
CN103995889A (zh) | 图片分类方法及装置 | |
CN103927387A (zh) | 图像检索***及其相关方法和装置 | |
CN106933867B (zh) | 一种图像查询方法和装置 | |
US20100250539A1 (en) | Shape based picture search | |
CN103793697A (zh) | 一种人脸图像的身份标注方法及人脸身份识别方法 | |
US20220383053A1 (en) | Ephemeral content management | |
CN103324677B (zh) | 一种可分级的快速图像gps位置估计方法 | |
CN102591868A (zh) | 用于拍照指南自动生成的***和方法 | |
CN107562742A (zh) | 一种图像数据处理方法及装置 | |
JP5018614B2 (ja) | 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム | |
CN108255915A (zh) | 一种文件管理方法、装置及机器可读存储介质 | |
JP2015046071A (ja) | 画像認識装置、画像認識方法及び画像認識プログラム | |
Elharrouss et al. | FSC-set: counting, localization of football supporters crowd in the stadiums | |
Kim et al. | m CLOVER: mobile content-based leaf image retrieval system | |
CN110169055A (zh) | 一种生成镜头信息的方法和装置 | |
Zhang et al. | Dataset-driven unsupervised object discovery for region-based instance image retrieval | |
CN105095215B (zh) | 信息获取装置、方法以及服务器 | |
CN103744903A (zh) | 一种基于草图的场景图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |