CN104021228B - 一种融合对象语义的商标图像匹配方法 - Google Patents
一种融合对象语义的商标图像匹配方法 Download PDFInfo
- Publication number
- CN104021228B CN104021228B CN201410292722.9A CN201410292722A CN104021228B CN 104021228 B CN104021228 B CN 104021228B CN 201410292722 A CN201410292722 A CN 201410292722A CN 104021228 B CN104021228 B CN 104021228B
- Authority
- CN
- China
- Prior art keywords
- similarity
- matching
- semantic
- value
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
一种融合对象语义的商标图像匹配方法,涉及图像搜索。提供融合了对象的语义匹配,使得对象匹配过程是在语义相似的对象间进行匹配,并且匹配结果体现了语义相似度,可在保证准确率的同时可以较大程度上缩短图像检索时间,提高匹配性能的一种融合对象语义的商标图像匹配方法。步骤一:关键词组语义的匹配;步骤二:高语义相关对象的提取;步骤三:融合语义与对象底层特征的综合匹配。将两幅商标图像的相似度看作是它们语义相似度最高的若干对象在底层空间上的相似度乘以语义偏差值,对于其中任意一组相似对象而言,对象的语义偏差越大,对对象底层特征相似度的影响就越大。
Description
技术领域
本发明涉及图像搜索,尤其是涉及一种融合对象语义的商标图像匹配方法。
背景技术
商标注册前的查询,可以大大减少商标注册的风险,提高商标注册的成功率。商标查询,是指在商标注册前,通过商标局的官方网站,或者向商标局下属的通达服务中心提交查询申请,查询本次所申请的商标与原先已申请或已注册的商标有无相同或近似的情况。
商标之间相似程度主要以人眼的视觉判断为基准,但数据库内注册商标的数量十分庞大,判别工作若全部由人工完成,不仅复杂而且效率低下。因此,建立商标图像的自动检索***就变得极为必要。先由计算机检索出与待注册商标相似的图像,再人工决定是否予以注册,可以大幅度提高商标管理工作的效率。鉴于上述原因,对商标图像匹配检索的研究具有重要的科学和实用价值。
在基于内容的图像检索中,图像特征索引技术主要研究的是图像的视觉和形象特征,包括颜色及其分布关系、纹理、对象形状以及它们之间的空间关系等方面。以图像的底层视觉为索引对图像进行检索具有计算简单、性能稳定的特点,但目前这些特征都有一定的局限性。
语义分析是图像理解中高层认知的难点和重点。“语义鸿沟”的存在是目前基于内容图像检索***还难以被普通用户所接收的根本原因。为了实现更为贴近用户理解能力的自然而简洁的查询方式,并提高图像检索的精度,在基于内容的图像检索技术领域进行包含语义的检索方法的研究是十分必要的。因此,近几年的研究逐渐转向基于区域和目标对象的高层图像语义描述特征的提取,尝试由图像的底层次特征推知高层次语义,从而使用高层语义特征计算图像相似程度。如何从图像的底层特征中自动提取语义特征,成为基于内容的图像检索领域的难题。
基于形状匹配的商标图像检索主要思想是通过图像分割技术提取出商标图像中的感兴趣目标,然后对目标进行形状描述,最后使用与形状描述方法相适应的相似性度量标准进行商标图像的检索。
然而,当商标图像分割结果包含多个目标对象时,传统的方式是将多个目标对象逐一与另一商标图像的对象进行比较,最后加权求和。但是,图像中多个目标对象间的完全匹配方式比较耗时,并且包含了多个无意义匹配,因为在匹配过程中,多个不相关的对象也进行了匹配操作。
发明内容
本发明的目的在于针对现有商标图像匹配的不足,提供融合了对象的语义匹配,使得对象匹配过程是在语义相似的对象间进行匹配,并且匹配结果体现了语义相似度,可在保证准确率的同时可以较大程度上缩短图像检索时间,提高匹配性能的一种融合对象语义的商标图像匹配方法。
本发明包括以下步骤:
步骤一:关键词组语义的匹配;
步骤二:高语义相关对象的提取;
步骤三:融合语义与对象底层特征的综合匹配。
在步骤一中,所述关键词组语义匹配,具体步骤如下:
(a)对输入的两个关键词组进行匹配,对关键词组的匹配是基于关键词的匹配,具体方法如下:
利用知网(HowNet)提供的计算方式,得到两个关键词语义的相似度,计算方式如下所示:
similarity(key1,key2)=maxi=1...n,j=1...msimilarity(S1i,S2j) (1)
其中key1和key2为两个关键词,key1由概念集合{S11,S12,...,S1m}组成,key2由概念集合{S21,S22,...,S2n}组成;
(b)把两个关键词之间的相似度问题归结为两个概念之间的相似度问题,两个概念语义表达式的整体相似度由下式获得:
其中,βi是可调节的参数,表示以下4个特征:第一基本义原描述、其它基本义原描述、关系义原描述、关系符号描述,其满足:β1≥β2≥β3≥β4;
(c)把两个关键词之间的相似度问题最终归结为义原之间的相似度问题,根据义原之间的路径距离来计算两者的相似度,两个关键词组的匹配度由下式获得:
其中,函数f定义如下:
σ为阈值,σ∈[0,1],N为关键词匹配相似度值大于σ的个数。
在步骤二中,所述高语义相关对象的提取的具体步骤如下:
首先,对于两幅商标图像的分割对象对应的关键词组,利用步骤一关键词组语义匹配方法计算对象之间语义的相似度,可以得到如下的相似度矩阵:
其中,该矩阵为对称矩阵,M(w1i,w2j)为利用上述关键词组语义匹配方法计算所得值,M(w1i,w2j)∈[0,1],并且当i=j时,有M(w1i,w2j)=1,即矩阵对角线上的值为1;
然后,基于得到的相似度矩阵,获取高语义相关对象,其具体步骤如下:
1)对相似度值M(w11,w22),M(w12,w22),…,M(w1m,w2n)序列从大到小排序,并记录值对应于矩阵的位置;
2)设定一个阈值α,α∈[0.5,1],对于相似度排序序列的每个值,若大于α,则取出对应的矩阵位置i和j,从分割商标图像向量T1,T2取得相应对象,记录相应语义相似度值;同时划掉第i行和第j列;
最后,得到k对最高语义相似对象组合构成的对象向量T′1,T′2,及其对应的语义相似度向量V′12,即:
T′1={t′11,t′12,...,t′1k}
T′2={t′21,t′22,...,t′2k}
V′12={M′11,M′22,...,w′kk}
其中M′ii代表两幅商标各自第i个对象的语义相似度匹配值。
在步骤三中,所述融合语义与对象特征的综合匹配,即对高语义相关对象进行底层特征的匹配,其具体步骤如下:
令已有两个目标对象t1,t2,已有的对象底层特征匹配方法定义为F(t1,t2),结合步骤一、二得到的结果,得到两幅商标图像相似度为:
其中,F(t′1i,t′2i)为对象的底层特征相似度函数,F的取值范围为[0,1]。
本发明所述匹配方法的应用是基于对原有商标图像库进行了较好的图像分割并进行人工标注。其中,所述商标图像分割是指把图像分割成若干区域子集,区域子集不相交并且区域内部连通。所述人工标注过程是指对分割后的对象进行标注,以人工的方式对对象区域进行关键字描述。
本发明将两幅商标图像的相似度看作是它们语义相似度最高的若干对象在底层空间上的相似度乘以语义偏差值,对于其中任意一组相似对象而言,对象的语义偏差越大,对对象底层特征相似度的影响就越大。如果这些相似对象组在语义上是完全相同的,那么在底层空间中就是可替换的。
附图说明
图1为本发明提供的融合对象语义与对象特征的匹配流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
如图1所示,本发明实施例包括以下步骤:
步骤一:关键词组语义的匹配;
步骤二:高语义相关对象的提取;
步骤三:融合语义与对象底层特征的综合匹配。
在步骤一中,所述关键词组语义匹配,具体步骤如下:
假设现有两幅已经完成分割的商标图像T1,T2,分别为:
T1={t11,t12,...,t1m}
T2={t21,t22,...,t2n}
对应于每个分割区域有相应的关键字组进行描述,分别为:
W1={w11,w12,...,w1m}
W2={w21,w22,...,w2n}
wij代表第i幅商标图像的第j个区域对应的关键词组,
wij={keyij1,keyij2,...,keyijk}
则关键词组语义匹配的具体过程中,首先对输入的两个关键词组进行匹配:
假设两个关键词组分别为:
keys1={key11,key12,...,key1k}
keys2={key21,key22,...,key2l}
对关键词组的匹配是基于关键词的匹配,关键词语义相似度通过以下公式计算得到:
similarity(key1,key2)=maxi=1...n,j=1...msimilarity(S1i,S2j)
这样,就把两个关键词之间的相似度问题归结为两个概念之间的相似度问题。由于对实词的描述表示为一个特征结构,该特征结构含有以下四个特征:第一基本义原描述、其它基本义原描述、关系义原描述、关系符号描述。于是,两个概念语义表达式的整体相似度记为上述四个特征的部分相似度的加权和,即
其中,βi是可调节的参数,满足:β1≥β2≥β3≥β4。而所有的概念又都是由义原来描述的,所以该问题最终归结为义原之间的相似度问题。由于所有的义原根据上下位关系构成了一个树状层次体系,对于树型结构,任何两个结点之间有且只有一条路径,因此可以根据义原之间的路径距离来计算两者的相似度,即两个关键词组的匹配度定义为:
其中,函数f定义如下:
σ为阈值,σ∈[0,1]。N为关键词匹配相似度值大于σ的个数。也就是说,关键词组的匹配值定义为两两关键词相似度大于σ的值的平均值。
在步骤二中,所述高语义相关对象提取过程,具体步骤如下:
对于两幅商标图像的分割对象对应的关键词组,利用上述关键词组语义匹配方法计算对象之间语义的相似度,可以得到如下的相似度矩阵:
该矩阵为对称矩阵,M(w1i,w2j)为利用上述关键词组语义匹配方法计算所得值,M(w1i,w2j)∈[0,1],并且当i=j时,有M(w1i,w2j)=1,即矩阵对角线上的值为1。
基于得到的相似度矩阵,获取高语义相关对象。基本思想是:遍历矩阵,取出相似度最大的值对应的对象组合,然后将其所属行和列从矩阵中删除,依次取余下矩阵中相似度最大的组合,直到矩阵为空,最后得到由k对相似对最高的对象组合构成的向量。具体步骤如下:
1)由于矩阵的对称性,对矩阵左下部分的相似度值进行排序,即对相似度值M(w11,w22),M(w12,w22),…,M(w1m,w2n)序列从大到小排序,并记录值对应于矩阵的位置;
2)设定一个阈值α,α∈[0.5,1],对于相似度排序序列的每个值,如果大于α,则执行如下操作:取出对应的矩阵位置i和j,从分割商标图像向量T1,T2取得相应对象,记录相应语义相似度值;同时划掉第i行和第j列。
最后得到k对最高语义相似对象组合构成的对象向量T′1,T′2,及其对应的语义相似度向量V′12,即:
T′1={t′11,t′12,...,t′1k}
T′2={t′21,t′22,...,t′2k}
V′12={M′11,M′22,...,w′kk}
M′ii代表两幅商标各自第i个对象的语义相似度匹配值。
在步骤三中,所述融合语义与对象特征的综合匹配过程,具体步骤如下:
根据步骤二,获得了商标分割对象的高语义相似对象集合、对象间的一一对应关系以及相应的语义相似度值。接下来可对高语义相关对象进行底层特征的匹配。对象的底层特征匹配可以从颜色、纹理、形状等方面进行描述。作为一个通用框架,这边可以采用已有的一些对象特征描述方法,假设已有两个目标对象t1,t2,已有的对象底层特征匹配方法定义为F(t1,t2),结合上一步骤得到的结果,最终的两幅商标图像相似度定义为:
其中,F(t′1i,t′2i)为对象的底层特征相似度函数,F的取值范围为[0,1]。
该步骤将两幅商标图像的相似度看作是它们语义相似度最高的若干对象在底层空间上的相似度乘以语义偏差值,对于其中任意一组相似对象而言,对象的语义偏差越大,对对象底层特征相似度的影响就越大。如果这些相似对象组在语义上是完全相同的,那么在底层空间中就是可替换的。
本发明融合了对象的语义匹配,使得对象匹配过程是在语义相似的对象间进行匹配,并且匹配结果体现了语义相似度。这种方法在保证准确率的同时可以较大程度上缩短图像检索时间,提高匹配性能。
Claims (1)
1.一种融合对象语义的商标图像匹配方法,其特征在于包括以下步骤:
步骤一:关键词组语义的匹配;
所述关键词组语义匹配,具体步骤如下:
(a)对输入的两个关键词组进行匹配,对关键词组的匹配是基于关键词的匹配,具体方法如下:
利用知网提供的计算方式,得到两个关键词语义的相似度,计算方式如下所示:
similarity(key1,key2)=maxi=1...n,j=1...msimilarity(S1i,S2j) (1)
其中key1和key2为两个关键词,key1由概念集合{S11,S12,…,S1m}组成,key2由概念集合{S21,S22,…,S2n}组成;
(b)把两个关键词之间的相似度问题归结为两个概念之间的相似度问题,两个概念语义表达式的整体相似度由下式获得:
其中,βi是可调节的参数,表示以下4个特征:第一基本义原描述、其它基本义原描述、关系义原描述、关系符号描述,其满足:β1≥β2≥β3≥β4;
(c)把两个关键词之间的相似度问题最终归结为义原之间的相似度问题,根据义原之间的路径距离来计算两者的相似度,两个关键词组的匹配度由下式获得:
其中,函数f定义如下:
σ为阈值,σ∈[0,1],N为关键词匹配相似度值大于σ的个数;
步骤二:高语义相关对象的提取;所述高语义相关对象的提取的具体步骤如下:
首先,对于两幅商标图像的分割对象对应的关键词组,利用步骤一关键词组语义匹配方法计算对象之间语义的相似度,得到如下的相似度矩阵:
其中,该矩阵为对称矩阵,M(w1i,w2j)为利用上述关键词组语义匹配方法计算所得值,M(w1i,w2j)∈[0,1],并且当i=j时,有M(w1i,w2j)=1,即矩阵对角线上的值为1;
然后,基于得到的相似度矩阵,获取高语义相关对象,其具体步骤如下:
1)对相似度值M(w11,w22),M(w12,w22),…,M(w1m,w2n)序列从大到小排序,并记录值对应于矩阵的位置;
2)设定一个阈值α,α∈[0.5,1],对于相似度排序序列的每个值,若大于α,则取出对应的矩阵位置i和j,从分割商标图像向量T1,T2取得相应对象,记录相应语义相似度值;同时划掉第i行和第j列;
最后,得到k对最高语义相似对象组合构成的对象向量T′1,T′2,及其对应的语义相似度向量V′12,即:
T′1={t′11,t′12,...,t′1k}
T′2={t′21,t′22,...,t′2k}
V′12={M′11,M′22,...,w′kk}
其中M′ii代表两幅商标各自第i个对象的语义相似度匹配值;
步骤三:融合语义与对象底层特征的综合匹配;
所述融合语义与对象特征的综合匹配,即对高语义相关对象进行底层特征的匹配,其具体步骤如下:
令已有两个目标对象t1,t2,已有的对象底层特征匹配方法定义为F(t1,t2),结合步骤一、二得到的结果,得到两幅商标图像相似度为:
其中,F(t′1i,t′2i)为对象的底层特征相似度函数,F的取值范围为[0,1]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410292722.9A CN104021228B (zh) | 2014-06-25 | 2014-06-25 | 一种融合对象语义的商标图像匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410292722.9A CN104021228B (zh) | 2014-06-25 | 2014-06-25 | 一种融合对象语义的商标图像匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104021228A CN104021228A (zh) | 2014-09-03 |
CN104021228B true CN104021228B (zh) | 2017-05-24 |
Family
ID=51437982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410292722.9A Active CN104021228B (zh) | 2014-06-25 | 2014-06-25 | 一种融合对象语义的商标图像匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104021228B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199931B (zh) * | 2014-09-04 | 2018-11-20 | 厦门大学 | 一种商标图像一致语义提取方法及商标检索方法 |
CN107766394B (zh) * | 2016-08-23 | 2021-12-21 | 阿里巴巴集团控股有限公司 | 业务数据处理方法及其*** |
CN108984649A (zh) * | 2018-06-27 | 2018-12-11 | 广州朝舜网络科技有限公司 | 一种近似商标智能判断方法、装置、终端及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101329677A (zh) * | 2008-05-07 | 2008-12-24 | 裴亚军 | 基于图像内容的图像搜索引擎 |
CN101901249A (zh) * | 2009-05-26 | 2010-12-01 | 复旦大学 | 一种图像检索中基于文本的查询扩展与排序方法 |
CN103186538A (zh) * | 2011-12-27 | 2013-07-03 | 阿里巴巴集团控股有限公司 | 一种图像分类方法和装置、图像检索方法和装置 |
CN103744683A (zh) * | 2014-01-24 | 2014-04-23 | 中科创达软件股份有限公司 | 一种信息融合方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120239655A1 (en) * | 2011-03-15 | 2012-09-20 | Ronald Steven Cok | Distributed storage and metadata system |
-
2014
- 2014-06-25 CN CN201410292722.9A patent/CN104021228B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101329677A (zh) * | 2008-05-07 | 2008-12-24 | 裴亚军 | 基于图像内容的图像搜索引擎 |
CN101901249A (zh) * | 2009-05-26 | 2010-12-01 | 复旦大学 | 一种图像检索中基于文本的查询扩展与排序方法 |
CN103186538A (zh) * | 2011-12-27 | 2013-07-03 | 阿里巴巴集团控股有限公司 | 一种图像分类方法和装置、图像检索方法和装置 |
CN103744683A (zh) * | 2014-01-24 | 2014-04-23 | 中科创达软件股份有限公司 | 一种信息融合方法和装置 |
Non-Patent Citations (3)
Title |
---|
"专利信息检索***中本体半自动构建的研究与应用";伊雯雯;《中国优秀硕士学位论文全文数据库信息科技辑》;20081115 * |
"基于形状匹配的商标图像检索技术研究";洪志令;《中国博士学位论文全文数据库信息科技辑》;20090815 * |
"基于知网的概念匹配细粒度化研究";杨喜权 等;《计算机应用》;20081130 * |
Also Published As
Publication number | Publication date |
---|---|
CN104021228A (zh) | 2014-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Learning to assemble neural module tree networks for visual grounding | |
CN107562812B (zh) | 一种基于特定模态语义空间建模的跨模态相似性学习方法 | |
CN109977413B (zh) | 一种基于改进cnn-lda的情感分析方法 | |
CN109829104B (zh) | 基于语义相似度的伪相关反馈模型信息检索方法及*** | |
CN109241255B (zh) | 一种基于深度学习的意图识别方法 | |
CN105205096B (zh) | 一种跨文本模态和图像模态的数据检索方法 | |
CN104346440A (zh) | 一种基于神经网络的跨媒体哈希索引方法 | |
CN110489523B (zh) | 一种基于网购评价的细粒度情感分析方法 | |
CN112966091B (zh) | 一种融合实体信息与热度的知识图谱推荐*** | |
CN106294344A (zh) | 视频检索方法和装置 | |
CN102750347B (zh) | 一种用于图像或视频搜索重排序的方法 | |
CN106844518B (zh) | 一种基于子空间学习的不完整跨模态检索方法 | |
CN109033433B (zh) | 一种基于卷积神经网络的评论数据情感分类方法及*** | |
CN103810299A (zh) | 基于多特征融合的图像检索方法 | |
CN114332680A (zh) | 图像处理、视频搜索方法、装置、计算机设备和存储介质 | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
CN103186538A (zh) | 一种图像分类方法和装置、图像检索方法和装置 | |
CN108509521A (zh) | 一种自动生成文本索引的图像检索方法 | |
Malinowski et al. | A pooling approach to modelling spatial relations for image retrieval and annotation | |
CN111291177A (zh) | 一种信息处理方法、装置和计算机存储介质 | |
CN110929498A (zh) | 一种短文本相似度的计算方法及装置、可读存储介质 | |
US20130052619A1 (en) | Method for building information on emotion lexicon and apparatus for the same | |
CN112100212A (zh) | 一种基于机器学习和规则匹配的案件情节抽取方法 | |
CN104021228B (zh) | 一种融合对象语义的商标图像匹配方法 | |
CN110969005B (zh) | 一种确定实体语料之间的相似性的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Wu Meihong Inventor after: Hong Zhiling Inventor before: Hong Zhiling Inventor before: Wu Meihong |