CN109034248B - 一种基于深度学习的含噪声标签图像的分类方法 - Google Patents

一种基于深度学习的含噪声标签图像的分类方法 Download PDF

Info

Publication number
CN109034248B
CN109034248B CN201810846627.7A CN201810846627A CN109034248B CN 109034248 B CN109034248 B CN 109034248B CN 201810846627 A CN201810846627 A CN 201810846627A CN 109034248 B CN109034248 B CN 109034248B
Authority
CN
China
Prior art keywords
data set
vectors
data
baseline
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810846627.7A
Other languages
English (en)
Other versions
CN109034248A (zh
Inventor
杨国武
秦晓明
何沂娟
陈祥
陈浩
鲁品肃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201810846627.7A priority Critical patent/CN109034248B/zh
Publication of CN109034248A publication Critical patent/CN109034248A/zh
Application granted granted Critical
Publication of CN109034248B publication Critical patent/CN109034248B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于深度学习的含噪声标签图像的分类方法,涉及图像分类技术领域,本发明的方法包括如下步骤:步骤1,对语义元数据集和图像数据集进行数据提纯得到baseline数据集;步骤2,基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;步骤3,通过层次聚类对特征信息进行聚类,得到新的数据类别;步骤4,基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;步骤5,最后基于data数据集使用short_inception网络训练出最终的分类模型;步骤6,根据最终的分类模型对含噪声标签图像进行分类。本发明解决了现有的含噪声标签图像的分类方法无法适用于大数据集的问题。

Description

一种基于深度学习的含噪声标签图像的分类方法
技术领域
本发明涉及图像分类技术领域,尤其涉及一种基于深度学习的含噪声标签图像的分类方法。
背景技术
卷积神经网络(CNN)指的是一类用来处理具有已知网格状拓扑结构数据的深度学习算法,特指那些使用一种称作“卷积”运算的网络,其中卷积是一种特殊形式的线性运算,具体指在不止一层的网络层进行就地矩阵乘法。RNN是一种用于处理序列数据的深度学习算法,近些年来循环神经网络(RNN)成功应用于语音识别、机器翻译、语言模型等任务中,可以说是处理文本类数据的标配网络。层次聚类指的是通过合并或者分割数据集相继生成嵌套的类簇;主要的分类策略有两种:自上而下的***法和自下而上的集聚法。
半监督学习是监督学习和无监督学习相结合的一种学习方法,同时使用大量无标签数据和少量的有标签数据来进行学习,由于所需带标签数据比较少,只需要很少的时间和精力就可以获得一部分高精准的带标签数据,然后基于这部分高精准的带标签数据作为监督信号进行建模迭代分类,在某些分类任务中可以获得不错的效果,并且可以大大减少学习成本。但是缺陷也是显而易见的,由于具有高精度带标签的数据只有很少一部分,当带标签数据所占总体数据量过小(可能只是全部数据的千分之一、万分之一等),并且带标签的数据在总体数据中分布不均匀的时候,基于这部分带标签数据来对整个数据集建立好的模型,显然是不可能的。
发明内容
本发明的目的在于:为解决现有的含噪声标签图像的分类方法无法适用于大数据集的问题,本发明提供一种基于深度学习的含噪声标签图像的分类方法。
为解决上述问题,本发明的技术方案如下:
一种基于深度学习的含噪声标签图像的分类方法,包括如下步骤:
步骤1:对语义元数据集和图像数据集进行数据提纯得到baseline数据集;数据提纯的具体步骤包括获取词向量和图片向量、将这两个向量进行权值连接得到综合向量、将综合向量传入混合距离相似度算法中、最后计算得到各个数据的相似度;其中词向量为所有子词向量、词均值向量串联而成;
步骤2:基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;
步骤3:通过层次聚类对特征信息进行聚类,得到新的数据类别;
步骤4:基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;
步骤5:最后基于data数据集使用short_inception网络训练出最终的分类模型;short_inception网络结构包括输入层、三层s_inception块、全连接层fc和输出层,s_inception块与s_inception块之间使用了的短连接层short_cut,s_inception块包括输入层、卷积核、池化层和concat层;
步骤6:根据最终的分类模型对含噪声标签图像进行分类。
具体地,所述步骤1的具体步骤为:
步骤1.1:获取语义元数据集的n维词向量;获取图片数据的m维图片向量;
步骤1.2:将n维词向量和m维图片向量进行权值连接,串联得到一个p*m+q*n维向量,其中,p和q是权值系数;
步骤1.3:将这p*m+q*n维向量传入混合距离相似度算法中,计算得到各个向量的相似度;
步骤1.4:剔除相似度距离大的数据,得到噪声小的baseline数据集。
具体地,所述混合距离相似度算法的具体步骤为:
(1)对这p*m+q*n维向量通过排序策略得到在欧式距离上最相似的前K个向量;
(2)对筛选出的K个向量,计算相应的余弦相似度并结合欧氏距离得到最终的混合相似度,具体计算如公式为:
Figure GDA0003326905560000021
Figure GDA0003326905560000022
其中,α为欧氏距离影响因子,α取值范围为[0,1],混合距离相似度的取值范围为[0,1],b和c为偏值因素,范围为[0,1],euc(x,y)为通过归一化后的最终欧氏距离,
Figure GDA0003326905560000023
为通过归一化后的原始欧氏距离,
Figure GDA0003326905560000024
为混合相似度。
采用上述方案后,本发明的有益效果如下:
(1)文本词向量表示中,传统的方法是简单的将各个词的词向量相加求均值从而得到元数据的词向量表示,但是会损失句子的语序信息,本发明的方法是将每个词的词向量串联得到一个包含语序的向量,并同时串联自传统方法中得到的均值向量,从而得到一个新的向量,由该方法得到的向量一方面能够保留原始文本的语序信息,另一方面能够比较全面的囊括原始文本的语义信息;
(2)传统的方法是简单将词向量之间的欧式距离或者余弦距离作为相似度值,这种方法固然简单,但是却忽略了文本的复杂性,文本数据是复杂的,涉及很多的语义和语法等信息,简单使用欧式或余弦度量并不能含括这些语义语法属性,本发明采用了一种混合距离相似性算法,此算法在兼顾向量在数值和方向维度的同时,引入权值和偏值因素,能够更好的考虑到文本数据的语义和语法信息,更适合进行相似性度量;
(3)SD距离弥补了欧几里得距离和曼哈顿距离在样本方向上的缺失,并且计算量远小于马氏距离的计算量;
(4)short_inception的网络结构,使得训练出的分类模型性能更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本发明的主旨。
图1为本发明的流程示意图;
图2为本发明的数据提纯流程示意图;
图3本发明的short_inception网络结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面,将结合本发明最优选的一个实施例对本发明进行更加清楚、完整的说明。
本实施例的一种基于深度学习的含噪声标签图像的分类方法,如图1所示,包括如下步骤:
步骤1:对语义元数据集和图像数据集进行数据提纯得到baseline数据集;数据提纯的具体步骤包括获取词向量和图片向量、将这两个向量进行权值连接得到综合向量、将综合向量传入混合距离相似度算法中,最后计算得到各个数据的相似度;其中词向量为所有子词向量、词均值向量串联而成;原始数据集是混含许多噪声数据(与正常数据不符的干扰数据)的图片数据集,所以需要先对这部分数据进行数据提纯,即剔除原始数据集中的噪声数据,得到提纯后的含有噪声少的数据集,因为在噪声少的数据集上建立模型才能更准确的反映数据的真实分布情况,即建立的模型性能更高更准确;这里进行提纯操作的过程中需要借助元数据的辅助,所谓元数据这里指的是网络中对于每个图片数据内容的文本描述,例如图片标题、图片内容的文字表达等,这些元数据在网络中丰富且易获取;如图2所示,所述步骤1的具体步骤为:
步骤1.1:获取语义元数据集的n维词向量,具体地,借用网络中已有的训练好的词向量词典,这个词典将每个词和其对应的词向量以字典的方式存储,形如dog:[1.09,…,0.12],cat:[-1.02,…,2.97]等,这样通过这个词向量字典就可以将原始的文本元数据转换成其对应的词向量表示;同时,获取图片数据的m维图片向量,仅仅用图片的像素值组成的m维向量来表示图片。
步骤1.2:将n维词向量和m维图片向量进行权值连接得到p*m+q*n维向量,p和q为权值系数。
步骤1.3:将这p*m+q*n维向量传入混合距离相似度算法中,计算得到各个向量的相似度;所述混合距离相似度算法的具体步骤为:
(1)对这p*m+q*n维向量通过排序策略得到在欧式距离上最相似的前K个向量。
(2)对筛选出的K个向量,计算相应的余弦相似度并结合欧氏距离得到最终的混合相似度,具体计算如公式为:
Figure GDA0003326905560000051
Figure GDA0003326905560000052
其中,α为欧氏距离影响因子,α取值范围为[0,1],混合距离相似度的取值范围为[0,1],b和c为偏值因素,范围为[0,1],euc(x,y)为通过归一化后的最终欧氏距离,
Figure GDA0003326905560000053
为通过归一化后的原始欧氏距离,
Figure GDA0003326905560000054
为混合相似度。
步骤2:基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息。
步骤3:通过层次聚类对特征信息进行聚类,得到新的数据类别;所述步骤3中,层次聚类的方法采用SD距离法。
一般层次聚类的策略主要有两种:自上而下的***法和自下而上的集聚法,***法开始将所有样本当作一个类,然后迭代的逐步进行分割;而集聚法开始时将每个样本当作一个类,然后迭代的逐步进行合并,层级聚类的一般都是贪婪方式进行合并或分割。为了确定哪些类簇能够合并或***,需要定义一种衡量样本间相似度的方法,在大多数层次聚类算法中,这是通过定义合适的样本间距离矩阵和联结准则实现的,距离矩阵一般有欧几里得距离、曼哈顿距离以及马氏距离,联结准则有完全联结、平均联结以及Ward联结,通过3种距离矩阵和3种联结准则来实现层次聚类的,但是距离矩阵中,马氏距离需要计算协方差矩阵的逆,计算量大,资源占有量太大,欧几里得距离和曼哈顿距离忽略了样本方向上的信息,因此,本发明采用SD距离方法,同时考虑了余弦距离和欧式距离,也就是考虑了向量在方向和大小维度上的信息,比欧几里得距离和曼哈顿距离要信息更全面;同时,SD距离公式中并不涉及求矩阵逆这种大规模的计算,所以计算量比马氏距离要小得多。
步骤4:基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data。
步骤5:最后基于data数据集使用short_inception网络训练出最终的分类模型;short_inception网络结构包括输入层、三层s_inception块、全连接层fc和输出层,s_inception块与s_inception块之间使用了的短连接层short_cut,s_inception块包括输入层、大小为1和3的卷积核、池化层和concat层。这里的卷积核大小可以为其他的值,本发明中,1和3为优选值。
具体地,如图3所示,左边是整个short_inception网络的框架,依次为输入层、三层s_inception块、全连接层fc、输出,其中该网络使用了短连接short_cut,该连接的作用是将某层的输出跳过下一层直接连接到更底层中去;而右边就是s_inception的详细结构,base为输入,1x1和3x3分别是大小为1和3的卷积核,起特征提取的作用,Pool为池化层,起特征筛选的作用,最终的concat层是将所有的特征进行串联得到新的融合之后的特征向量。
在short_inception网络中s_inception块与s_inception块之间使用了的短连接层short_cut,并且在细化s_inception块的时候,简化了原有的块结构,其中1x1和3x3是不同尺寸的卷积核大小,Pool指的是池化操作,这种块的结构减少了计算量。
步骤6:根据最终的分类模型对含噪声标签图像进行分类。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (1)

1.一种基于深度学习的含噪声标签图像的分类方法,其特征在于,包括如下步骤:
步骤1:对语义元数据集和图像数据集进行数据提纯得到baseline数据集;数据提纯的具体步骤包括获取词向量和图片向量、将这两个向量进行权值连接得到综合向量、将综合向量传入混合距离相似度算法中、最后计算得到各个数据的相似度;其中词向量为所有子词向量、词均值向量串联而成;
步骤2:基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;
步骤3:通过层次聚类对特征信息进行聚类,得到新的数据类别;
步骤4:基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;
步骤5:最后基于data数据集使用short_inception网络训练出最终的分类模型;short_inception网络结构包括输入层、三层s_inception块、全连接层fc和输出层,s_inception块与s_inception块之间使用了的短连接层short_cut,s_inception块包括输入层、卷积核、池化层和concat层;
步骤6:根据最终的分类模型对含噪声标签图像进行分类;
所述步骤1的具体步骤为:
步骤1.1:获取语义元数据集的n维词向量;获取图片数据的m维图片向量;
步骤1.2:将n维词向量和m维图片向量进行权值连接,串联得到一个p*m+q*n维向量,其中,p和q是权值系数;
步骤1.3:将这p*m+q*n维向量传入混合距离相似度算法中,计算得到各个向量的相似度;
步骤1.4:剔除相似度距离大的数据,得到噪声小的baseline数据集;
所述混合距离相似度算法的具体步骤为:
(1)对这p*m+q*n维向量通过排序策略得到在欧式距离上最相似的前K个向量;
(2)对筛选出的K个向量,计算相应的余弦相似度并结合欧氏距离得到最终的混合相似度,具体计算如公式为:
Figure FDA0003326905550000011
Figure FDA0003326905550000021
其中,α为欧氏距离影响因子,α取值范围为[0,1],混合距离相似度的取值范围为[0,1],b和c为偏值因素,范围为[0,1],euc(x,y)为通过归一化后的最终欧氏距离,
Figure FDA0003326905550000022
为通过归一化后的原始欧氏距离,
Figure FDA0003326905550000023
为混合相似度。
CN201810846627.7A 2018-07-27 2018-07-27 一种基于深度学习的含噪声标签图像的分类方法 Active CN109034248B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810846627.7A CN109034248B (zh) 2018-07-27 2018-07-27 一种基于深度学习的含噪声标签图像的分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810846627.7A CN109034248B (zh) 2018-07-27 2018-07-27 一种基于深度学习的含噪声标签图像的分类方法

Publications (2)

Publication Number Publication Date
CN109034248A CN109034248A (zh) 2018-12-18
CN109034248B true CN109034248B (zh) 2022-04-05

Family

ID=64646275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810846627.7A Active CN109034248B (zh) 2018-07-27 2018-07-27 一种基于深度学习的含噪声标签图像的分类方法

Country Status (1)

Country Link
CN (1) CN109034248B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738264A (zh) * 2019-10-18 2020-01-31 上海眼控科技股份有限公司 异常样本筛选、清洗、训练方法、装置、设备和存储介质
CN110991149A (zh) * 2019-11-12 2020-04-10 广州爱学信息科技有限公司 一种多模态实体链接方法和实体链接***
CN111126470B (zh) * 2019-12-18 2023-05-02 创新奇智(青岛)科技有限公司 基于深度度量学习的图片数据迭代聚类分析方法
CN112214630B (zh) * 2020-09-10 2022-03-08 武汉纺织大学 基于膨胀卷积残差网络的服装图像检索***及方法
TR202015269A1 (tr) * 2020-09-25 2022-04-21 Aselsan Elektroni̇k Sanayi̇ Ve Ti̇caret Anoni̇m Şi̇rketi̇ Ki̇rli̇ eti̇ketlerden öğrenme i̇çi̇n meta eti̇ket üreti̇m yöntemi̇
CN113095397A (zh) * 2021-04-03 2021-07-09 国家计算机网络与信息安全管理中心 一种基于层次聚类法的图像数据压缩方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199822A (zh) * 2014-07-11 2014-12-10 五八同城信息技术有限公司 一种识别搜索对应的需求分类的方法和***
CN104424302A (zh) * 2013-09-04 2015-03-18 阿里巴巴集团控股有限公司 一种同类数据对象的匹配方法和装置
CN106021362A (zh) * 2016-05-10 2016-10-12 百度在线网络技术(北京)有限公司 查询式的图片特征表示的生成、图片搜索方法和装置
CN106021364A (zh) * 2016-05-10 2016-10-12 百度在线网络技术(北京)有限公司 图片搜索相关性预测模型的建立、图片搜索方法和装置
CN106339502A (zh) * 2016-09-18 2017-01-18 电子科技大学 一种基于用户行为数据分片聚类的建模推荐方法
CN106649818A (zh) * 2016-12-29 2017-05-10 北京奇虎科技有限公司 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN106844346A (zh) * 2017-02-09 2017-06-13 北京红马传媒文化发展有限公司 基于深度学习模型Word2Vec的短文本语义相似性判别方法和***
CN106850333A (zh) * 2016-12-23 2017-06-13 中国科学院信息工程研究所 一种基于反馈聚类的网络设备识别方法及***
CN106845528A (zh) * 2016-12-30 2017-06-13 湖北工业大学 一种基于K‑means与深度学习的图像分类算法
CN107357889A (zh) * 2017-07-11 2017-11-17 北京工业大学 一种基于内容或情感相似性的跨社交平台图片推荐算法
CN107736894A (zh) * 2017-09-24 2018-02-27 天津大学 一种基于深度学习的心电信号情绪识别方法
CN107944480A (zh) * 2017-11-16 2018-04-20 广州探迹科技有限公司 一种企业行业分类方法
CN108229506A (zh) * 2016-12-13 2018-06-29 上海安维尔信息科技股份有限公司 基于层次聚类和深度学习的箱号识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
US9767381B2 (en) * 2015-09-22 2017-09-19 Xerox Corporation Similarity-based detection of prominent objects using deep CNN pooling layers as features

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424302A (zh) * 2013-09-04 2015-03-18 阿里巴巴集团控股有限公司 一种同类数据对象的匹配方法和装置
CN104199822A (zh) * 2014-07-11 2014-12-10 五八同城信息技术有限公司 一种识别搜索对应的需求分类的方法和***
CN106021362A (zh) * 2016-05-10 2016-10-12 百度在线网络技术(北京)有限公司 查询式的图片特征表示的生成、图片搜索方法和装置
CN106021364A (zh) * 2016-05-10 2016-10-12 百度在线网络技术(北京)有限公司 图片搜索相关性预测模型的建立、图片搜索方法和装置
CN106339502A (zh) * 2016-09-18 2017-01-18 电子科技大学 一种基于用户行为数据分片聚类的建模推荐方法
CN108229506A (zh) * 2016-12-13 2018-06-29 上海安维尔信息科技股份有限公司 基于层次聚类和深度学习的箱号识别方法
CN106850333A (zh) * 2016-12-23 2017-06-13 中国科学院信息工程研究所 一种基于反馈聚类的网络设备识别方法及***
CN106649818A (zh) * 2016-12-29 2017-05-10 北京奇虎科技有限公司 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN106845528A (zh) * 2016-12-30 2017-06-13 湖北工业大学 一种基于K‑means与深度学习的图像分类算法
CN106844346A (zh) * 2017-02-09 2017-06-13 北京红马传媒文化发展有限公司 基于深度学习模型Word2Vec的短文本语义相似性判别方法和***
CN107357889A (zh) * 2017-07-11 2017-11-17 北京工业大学 一种基于内容或情感相似性的跨社交平台图片推荐算法
CN107736894A (zh) * 2017-09-24 2018-02-27 天津大学 一种基于深度学习的心电信号情绪识别方法
CN107944480A (zh) * 2017-11-16 2018-04-20 广州探迹科技有限公司 一种企业行业分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition;K He等;《IEEE Transactions on Pattern Analysis & Machine Intelligence》;20151231;第37卷(第9期);第1904-1916页 *
基于深度学习编码模型的图像分类方法;赵永威等;《工程科学与技术》;20170120;第49卷(第1期);第213-220页 *

Also Published As

Publication number Publication date
CN109034248A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN109034248B (zh) 一种基于深度学习的含噪声标签图像的分类方法
Zhang et al. Vector of locally and adaptively aggregated descriptors for image feature representation
Picard et al. Improving image similarity with vectors of locally aggregated tensors
WO2017052791A1 (en) Semantic multisensory embeddings for video search by text
Zhang et al. Panorama: a data system for unbounded vocabulary querying over video
Belhi et al. A machine learning framework for enhancing digital experiences in cultural heritage
CN113836992B (zh) 识别标签的方法、训练标签识别模型的方法、装置及设备
CN111475622A (zh) 一种文本分类方法、装置、终端及存储介质
Zhang et al. Automatic discrimination of text and non-text natural images
Sitaula et al. Content and context features for scene image representation
Hamreras et al. Content based image retrieval by convolutional neural networks
Li A deep learning-based text detection and recognition approach for natural scenes
CN116796288A (zh) 一种面向工业文档的多模态信息提炼方法和***
Xu et al. Stacked autoencoder based weak supervision for social image understanding
Bibi et al. Deep features optimization based on a transfer learning, genetic algorithm, and extreme learning machine for robust content-based image retrieval
US20220277194A1 (en) Storage medium and inference method
CN114896962A (zh) 多视角句子匹配模型、应用方法和相关装置
CN114970467A (zh) 基于人工智能的作文初稿生成方法、装置、设备及介质
Liu et al. Data cleaning of irrelevant images based on transfer learning
CN112633394A (zh) 一种智能用户标签确定方法、终端设备及存储介质
Grzeszick Partially supervised learning of models for visual scene and object recognition
Zhang et al. Image retrieval using compact deep semantic correlation descriptors
Ito et al. The effects of unimodal representation choices on multimodal learning
CN116304019B (zh) 一种争议焦点体系构建与识别方法
ADIL et al. Deep Supervised Hashing by Fusing Multiscale Deep Features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant