CN111080551A - 基于深度卷积特征和语义近邻的多标签图像补全方法 - Google Patents

基于深度卷积特征和语义近邻的多标签图像补全方法 Download PDF

Info

Publication number
CN111080551A
CN111080551A CN201911286325.XA CN201911286325A CN111080551A CN 111080551 A CN111080551 A CN 111080551A CN 201911286325 A CN201911286325 A CN 201911286325A CN 111080551 A CN111080551 A CN 111080551A
Authority
CN
China
Prior art keywords
label
image
labels
semantic
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911286325.XA
Other languages
English (en)
Other versions
CN111080551B (zh
Inventor
张素兰
邓建国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan University of Science and Technology
Original Assignee
Taiyuan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan University of Science and Technology filed Critical Taiyuan University of Science and Technology
Priority to CN201911286325.XA priority Critical patent/CN111080551B/zh
Publication of CN111080551A publication Critical patent/CN111080551A/zh
Application granted granted Critical
Publication of CN111080551B publication Critical patent/CN111080551B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度卷积特征和语义近邻的多标签图像补全方法,首先,通过改进卷积神经网络的损失函数,构建一个融合深度卷积特征和语义近邻的卷积神经网络(CNN‑KNN)模型,然后,将CNN的预分类结果输入到语义近邻算法中利用图像标注词间的依赖或共生关系对网络模型输出结果进行改善,最后,优化多标签重要性排序算法,将改善的结果按此算法排序并分配与图像内容表述一致的标注词预测图像的最终标注结果。采用基准数据集iaprtc12进行实验,验证了该方法能有效地补全图像标签语义。

Description

基于深度卷积特征和语义近邻的多标签图像补全方法
技术领域
本文发明一种基于深度卷积特征和语义近邻的多标签图像补全方法,属于图像处理领域。
背景技术
随着移动互联网的迅猛发展与智能移动设备的不断普及,图像数据产生和获取的成本逐渐降低,基于图像标注的算法也获得了蓬勃发展。在传统的图像标注算法中,每个样本只标注一个标签。然而在一些实际应用中,图像往往包含复杂多样的语义信息,加上图像的视觉特征与人类图像识别之间存在着巨大语义鸿沟,使得多标签分类比传统的分类问题更为复杂。
近年来,在图像标注领域出现了大量的多标签标注算法,如:组合分类器链(ECC)算法、Binary relevance(BR)算法、多类标注算法(Supervised Multiclass Labeling,SML)、多标签SVM等。尽管这些多标签学习算法在某些领域有着较好的应用,但也存在着一些不足:如待定参数过多、标签不完备和泛化能力差。其中,标签不完备对图像标注和检索影响尤为明显,主要表现在用户只能获取到与关键词匹配的部分图像。在图像数量不大的情况下这种不足表现的不是很明显,但是在图像数量***式增长、图像来源不断扩大、图像种类日益繁多的现实条件下,这种不足尤为明显。因此,完备的图像文本标签在图像标注和图像检索领域起着关键性的作用,如何快速有效地提高图像标签的完备性,成为大数据时代图像自动标注研究的新挑战。
随着大数据时代的到来,含更多隐含层的深度卷积神经网络具有更复杂的网络结构,与传统机器学习方法相比具有更强大的特征学习和特征表达能力。使用深度学习算法训练的卷积神经网络模型,自提出以来就在计算机视觉领域的多个大规模识别任务上取得了令人瞩目的成绩。
卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deeplearning)的代表算法之一。现在,CNN已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,从图像像素中提取图像特征,这种处理方式更加接近人类大脑视觉***的处理方式。另外,卷积神经网络的权值共享属性和池化层使网络需要训练的参数大大减小,简化了网络模型,提高了训练的效率,因而在图像多标签标注领域得到了更为广泛的应用。
K最近邻(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。由于KNN方法主要依靠周围有限邻近的样本,而不是靠判别类域的方法来确定所属类别,因此对于标签之间的依赖或共生来说,KNN方法较其他方法更为适合。
因此,基于卷积神经网络的特征提取,融合KNN标签间的依赖共生关系,结合多标签重要性排序算法,在多标签图像补全问题上具有重要的研究价值。
发明内容
针对社会化图像初始标注不完备、不准确的问题,通过融合深度卷积特征和语义近邻的方法实现社会化图像的标签补全工作,解决了由于标签不完备导致基于图像的检索结果不完整问题。
本发明首先,在AlexNex通用模型基础上,改进AlexNex模型参数并设计多标签损失函数,同时基于K最近邻(k-Nearest Neighbor,KNN)构建语义近邻模型;接着,融合前面构建的两个模型构建融合深度卷积特征和语义近邻的CNN-KNN模型;然后,将等补全社会化图像输入到CNN-KNN,模型输出的标签集依次经带权无向图邻接矩阵滤噪算法、多标签重要性排序算法过滤噪声标签后输出候选标签集;最后,从候选标签集中选择排序前5的标签作为最终补全结果。
一种基于深度卷积特征和语义近邻的多标签图像补全方法,其内容包括改进AlexNex模型参数,设计AlexNex模型的损失函数;构建基于KNN的语义近邻模型;融合AlexNex和KNN构建CNN-KNN模型;优化多标签重要性排序算法。
1、在AlexNex通用模型基础上,改进AlexNex模型参数并设计多标签损失函数
(1)所有卷积层中卷积核的间隔与池化间隔都设置为2,同时加入一个动量项为0.9的异步随机梯度,并将网络初始的学习速率设为0.001;
(2)设计多标签损失函数,假设每个标签之间都是相互独立的,那么这些标签可以组成一个标签向量y∈R1×c,其中c为图像集中标签的总数,R∈{0,1},yj=1表示图像包含第j个标签,yj=0表示图像不包含第j个标签,通过正则化y得到图像xi与标签j的概率
Figure BDA0002318071110000031
设计损失函数
Figure BDA0002318071110000032
其中n为图像数量;
2、构建基于KNN的语义近邻模型
(1)划分语义组构建语义近邻,将每个标签包含的所有图像看成一个语义组,所有标签对应的语义组集表示为
Figure BDA0002318071110000033
其中wi表示标签,
Figure BDA0002318071110000034
表示与标签wi关联的所有图像,
Figure BDA0002318071110000035
(2)将图像补全预测问题转化为求后验概率问题,定义条件概率p(I|wi)表示标签wi和图像I的概率关系,由概率转换公式可知,图像标签的预测值为
Figure BDA0002318071110000036
其中p(wi)和p(I)为先验概率;
(3)构建待补全图像的邻域图像集,令
Figure BDA0002318071110000037
表示标签wi对应的语义组,对于待标注图像I,从Gi中选出与图像I视觉相似度最高的k幅图像得到局部子集
Figure BDA0002318071110000039
其中k为正整数,当所有语义组的局部子集都获取后,合并子集,最终得到待标注图像I的邻域图像集
Figure BDA00023180711100000310
(4)对贡献值排序完成标签预测,对于给定标签
Figure BDA00023180711100000311
它与图像I构成的概率关系表示为
Figure BDA0002318071110000038
其中
Figure BDA00023180711100000312
表示图像Ii对于图像I的贡献值,p(wi|Ii)∈{0,1}用于控制在图像Ii中标签需要增加的贡献值。
3、带权无向图的邻接矩阵滤噪
(1)定义候选标签间关系,标签与标签之间的关系表示为Rn×n:label×label,其中label为候选标签列表,Rn×n(ci)={w1,w2,w3},其中ci∈label,n为候选标签数量,wi为标签来源权重的平均值,其中cnn输出权重为4,knn输出权重为3,原标注权重为3;
(2)确定多标签候选比,在邻接矩阵Rn×n中,对于第i个标签,在多标签中的候选比为
Figure BDA0002318071110000041
其中Hi表示第i标签在所有标签中的候选比,wij表示邻接矩阵中第i个标签的权重;
(3)根据固定阈值过滤掉候选比小的标签,选取
Figure BDA0002318071110000043
的标签作为候选标签,其中
Figure BDA0002318071110000044
为固定阈值,取值为0.4。
4、多标签重要性排序并确定最终补全结果
(1)使用数据集中图像与标签的关系,构建标签关系矩阵,对其进行非负矩阵分解,得到标签的社团关系矩阵,令Wn×k表示标签节点所属社团关系矩阵,对于第i个标签节点,多标签社团的结点贡献比表示为
Figure BDA0002318071110000042
其中n表示标签总数,Ci表示标签对构成各个社团的支持力度,wij表示标签所属社团的关系矩阵中第i个标签的贡献,k表示社团个数;
(2)根据标签间的社团关系及各个标签的重要性程度对候选标签排序,从排序结果选择排序前5的标签作为最终标签结果。
5、本发明的有益效果
对于社会化图像,由于标注者情感、文化背景等原因导致互联网上的图像存在标签不完备、不准确的问题。社会化图像标签不完备致使基于图像的检索结果不全面,不完整,甚至出现检索错误的情形,这往往给图像检索者带来困扰。
针对社会化图像标签不完备的问题,本发明基于深度卷积特征和语义近邻算法构建CNN-KNN模型,利用CNN在图像特征抽取方面的优势,保障模型对待补全图像分类结果的准确性,基于KNN利用标签之间语义的共生依赖关系,进一步丰富图像的标签内容。在CNN-KNN标签补全过程中会产生噪声标签,利用带权无向图的邻接矩阵滤噪方法进行粗粒度噪声标签过滤;经粗粒度过滤后的结果在多标签重要性排序中进行细粒度二次过滤,并选择排序前5的标签作为最终补全结果。
社会化图像经过CNN-KNN模型补全后基本上能表达图像的整体内容和细节内容,为检索者理解、检索图像带来方便。
附图说明
下面结合附图和实施方式对本发明进一步说明。
图1CNN-KNN模型结构示意图。
图2为社会化图像标签补全过程。
图3为本发明中的方法(CNN-KNN)在iaprtc12数据集上的测试准确率趋势图。
图4为本发明中的方法(CNN-KNN)中改进的损失值在整个训练过程中的变化趋势图。
具体实施方式
输入:有初始正确标签的图像(初始标签集合W0)或无标签的图像I0
输出:给输入图像分配指定数量的标注词集合W0'。
Step1.调整AlexNet模型参数并改进损失函数用于度量模型预测值与样本真实值之间的差异;
Step2.构建一个基于AlexNet的卷积神经网络模型,使用iaprtc12数据集训练模型,将待补全图像及原始标签输入到训练好的CNN模型,输入图像经卷积、池化后在全连接层输出待补全图像的候选标签集1;
Step3.构建一个基于标签语义相关的语义近邻算法,将待补全图像及原始标签输入到语义近邻算法中,利用标签间语义的共生依赖关系输出待补全图像的候选标签集2;
Step4.将候选标签集1和候选标签集2组合为候选标签集,并将CNN模型和近邻算法融合为CNN-KNN模型,利用CNN-KNN模型的带权无向图的邻接矩阵滤噪算法从候选标签集初步筛选出指定数量的待补全标签集;
Step5.将初选的待补全标签集经CNN-KNN的多标签重要性排序算法再次过滤噪声标签,并从中选择排序前5的标签作为最终的补全结果。

Claims (5)

1.一种基于深度卷积特征和语义近邻的多标签图像补全方法,其特征是包括下述内容:
(1)在AlexNex通用模型基础上,改进AlexNex模型参数并设计多标签损失函数;
(2)基于K最近邻构建语义近邻模型;
(3)融合上述两个模型构建的模型构建融合深度卷积特征和语义近邻的CNN-KNN模型,将等补全社会化图像输入到CNN-KNN,模型输出候选标签集经带权无向图邻接矩阵滤噪算法过滤噪声标签,输出粗选标签集;
(4)利用CNN-KNN的多标签重要性排序算法对第3步输出的粗选标签集再次过滤噪声标签,并确定最终补全结果。
2.根据权利要求1所述一种基于深度卷积特征和语义近邻的多标签图像补全方法,其特征是改进AlexNex模型参数并设计多标签损失函数步骤是:
步骤1:所有卷积层中卷积核的间隔与池化间隔都设置为2,同时加入一个动量项为0.9的异步随机梯度,并将网络初始的学习速率设为0.001;
步骤2:设计多标签损失函数,假设每个标签之间都是相互独立的,那么这些标签可以组成一个标签向量y∈R1×c,其中c为图像集中标签的总数,R∈{0,1},yj=1表示图像包含第j个标签,yj=0表示图像不包含第j个标签,通过正则化y得到图像xi与标签j的概率
Figure FDA0002318071100000011
设计损失函数
Figure FDA0002318071100000012
其中n为图像数量。
3.根据权利要求1所述一种基于深度卷积特征和语义近邻的多标签图像补全方法,其特征是构建基于KNN的语义近邻模型方法是:
针对社会化图像中存在视觉相似但语义不相同的问题,本文从语义上对图像特征加以区分,以提高图像的补全效果。首先,划分语义组构建语义近邻;然后,通过视觉相似度构建视觉近邻;最后,根据距离值确定各标签的贡献值,通过对贡献值排序完成标签预测。
符号定义为,图像集I={I1,I2,...,In},Ii∈Rd表示图像,其中n为图像数量,d为标签数量,R为d维向量,R∈{0,1}d;标签集W={w1,w2,...,wm},其中m为标签数量,wi为标签;训练集Ω={(I1,W1),(I2,W2),...,(In,Wn)},其中Wi为m维向量,Wi∈{0,1}M,当Wi j=1时,表示图像i包含标签wj,当Wi j=0时,表示图像i不含标签wj,步骤包括:
步骤1:划分语义组构建语义近邻,将每个标签包含的所有图像看成一个语义组,所有标签对应的语义组集表示为
Figure FDA0002318071100000021
其中wi表示标签,
Figure FDA0002318071100000022
表示与标签wi关联的所有图像,
Figure FDA0002318071100000023
步骤2:将图像补全预测问题转化为求后验概率问题,定义条件概率p(I|wi)表示标签wi和图像I的概率关系,由概率转换公式可知,图像标签的预测值为
Figure FDA0002318071100000024
其中p(wi)和p(I)为先验概率;
步骤3:构建待补全图像的邻域图像集,令
Figure FDA0002318071100000025
表示标签wi对应的语义组,对于待标注图像I,从Gi中选出与图像I视觉相似度最高的k幅图像得到局部子集
Figure FDA0002318071100000026
其中k为正整数,当所有语义组的局部子集都获取后,合并子集,最终得到待标注图像I的邻域图像集
Figure FDA0002318071100000027
步骤4:对贡献值排序完成标签预测,对于给定标签
Figure FDA0002318071100000028
它与图像I构成的概率关系表示为
Figure FDA0002318071100000029
其中
Figure FDA00023180711000000210
表示图像Ii对于图像I的贡献值,p(wi|Ii)∈{0,1}用于控制在图像Ii中标签需要增加的贡献值。
4.根据权利要求1所述一种基于深度卷积特征和语义近邻的多标签图像补全方法,其特征是带权无向图的邻接矩阵滤噪方法为:
步骤1:定义候选标签间关系,标签与标签之间的关系表示为Rn×n:label×label,其中label为候选标签列表,Rn×n(ci)={w1,w2,w3},其中ci∈label,n为候选标签数量,wi为标签来源权重的平均值,其中cnn输出权重为4,knn输出权重为3,原标注权重为3;
步骤2:确定多标签候选比,在邻接矩阵Rn×n中,对于第i个标签,在多标签中的候选比为
Figure FDA0002318071100000031
其中Hi表示第i标签在所有标签中的候选比,wij表示邻接矩阵中第i个标签的权重;
步骤3:根据固定阈值过滤掉候选比小的标签,选取
Figure FDA0002318071100000032
的标签作为候选标签,其中
Figure FDA0002318071100000033
为固定阈值,取值为0.4。
5.根据权利要求1所述一种基于深度卷积特征和语义近邻的多标签图像补全方法,其特征是优化多标签重要性排序算法为:
步骤1:使用数据集中图像与标签的关系,构建标签关系矩阵,对其进行非负矩阵分解,得到标签的社团关系矩阵,令Wn×k表示标签节点所属社团关系矩阵,对于第i个标签节点,多标签社团的结点贡献比表示为
Figure FDA0002318071100000034
其中n表示标签总数,Ci表示标签对构成各个社团的支持力度,wij表示标签所属社团的关系矩阵中第i个标签的贡献,k表示社团个数;
步骤2:根据标签间的社团关系及各个标签的重要性程度对候选标签排序,从排序结果选择排序前5的标签作为最终标签结果。
CN201911286325.XA 2019-12-13 2019-12-13 基于深度卷积特征和语义近邻的多标签图像补全方法 Active CN111080551B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911286325.XA CN111080551B (zh) 2019-12-13 2019-12-13 基于深度卷积特征和语义近邻的多标签图像补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911286325.XA CN111080551B (zh) 2019-12-13 2019-12-13 基于深度卷积特征和语义近邻的多标签图像补全方法

Publications (2)

Publication Number Publication Date
CN111080551A true CN111080551A (zh) 2020-04-28
CN111080551B CN111080551B (zh) 2023-05-05

Family

ID=70314545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911286325.XA Active CN111080551B (zh) 2019-12-13 2019-12-13 基于深度卷积特征和语义近邻的多标签图像补全方法

Country Status (1)

Country Link
CN (1) CN111080551B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232374A (zh) * 2020-09-21 2021-01-15 西北工业大学 基于深度特征聚类和语义度量的不相关标签过滤方法
CN112269889A (zh) * 2020-09-23 2021-01-26 上海市刑事科学技术研究院 交互式疑难人像检索的方法、客户端及***
CN114170484A (zh) * 2022-02-11 2022-03-11 中科视语(北京)科技有限公司 图片属性预测方法、装置、电子设备和存储介质
CN114299633A (zh) * 2021-12-28 2022-04-08 中国电信股份有限公司 汽车驾驶事故预测方法、装置、电子设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298605A (zh) * 2011-06-01 2011-12-28 清华大学 基于有向图非等概率随机搜索的图像自动标注方法及装置
US20160358337A1 (en) * 2015-06-08 2016-12-08 Microsoft Technology Licensing, Llc Image semantic segmentation
CN106250915A (zh) * 2016-07-22 2016-12-21 福州大学 一种融合深度特征和语义邻域的自动图像标注方法
WO2017134519A1 (en) * 2016-02-01 2017-08-10 See-Out Pty Ltd. Image classification and labeling
CN107564025A (zh) * 2017-08-09 2018-01-09 浙江大学 一种基于深度神经网络的电力设备红外图像语义分割方法
CN108062756A (zh) * 2018-01-29 2018-05-22 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法
CN108073941A (zh) * 2016-11-17 2018-05-25 江南大学 一种基于深度学习的图像语义生成方法
CN108416384A (zh) * 2018-03-05 2018-08-17 苏州大学 一种图像标签标注方法、***、设备及可读存储介质
CN109271539A (zh) * 2018-08-31 2019-01-25 华中科技大学 一种基于深度学习的图像自动标注方法及装置
CN109740451A (zh) * 2018-12-17 2019-05-10 南京理工大学 基于重要性加权的道路场景图像语义分割方法
CN109858487A (zh) * 2018-10-29 2019-06-07 温州大学 基于分水岭算法和图像类别标签的弱监督语义分割方法
CN110084296A (zh) * 2019-04-22 2019-08-02 中山大学 一种基于特定语义的图表示学习框架及其多标签分类方法
CN110378911A (zh) * 2019-07-11 2019-10-25 太原科技大学 基于候选区域和邻域分类器的弱监督图像语义分割方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298605A (zh) * 2011-06-01 2011-12-28 清华大学 基于有向图非等概率随机搜索的图像自动标注方法及装置
US20160358337A1 (en) * 2015-06-08 2016-12-08 Microsoft Technology Licensing, Llc Image semantic segmentation
WO2017134519A1 (en) * 2016-02-01 2017-08-10 See-Out Pty Ltd. Image classification and labeling
CN106250915A (zh) * 2016-07-22 2016-12-21 福州大学 一种融合深度特征和语义邻域的自动图像标注方法
CN108073941A (zh) * 2016-11-17 2018-05-25 江南大学 一种基于深度学习的图像语义生成方法
CN107564025A (zh) * 2017-08-09 2018-01-09 浙江大学 一种基于深度神经网络的电力设备红外图像语义分割方法
CN108062756A (zh) * 2018-01-29 2018-05-22 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法
CN108416384A (zh) * 2018-03-05 2018-08-17 苏州大学 一种图像标签标注方法、***、设备及可读存储介质
CN109271539A (zh) * 2018-08-31 2019-01-25 华中科技大学 一种基于深度学习的图像自动标注方法及装置
CN109858487A (zh) * 2018-10-29 2019-06-07 温州大学 基于分水岭算法和图像类别标签的弱监督语义分割方法
CN109740451A (zh) * 2018-12-17 2019-05-10 南京理工大学 基于重要性加权的道路场景图像语义分割方法
CN110084296A (zh) * 2019-04-22 2019-08-02 中山大学 一种基于特定语义的图表示学习框架及其多标签分类方法
CN110378911A (zh) * 2019-07-11 2019-10-25 太原科技大学 基于候选区域和邻域分类器的弱监督图像语义分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI G 等: "Community discovery and importance analysis in social network" *
黎健成;袁春;宋友;: "基于卷积神经网络的多标签图像自动标注" *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232374A (zh) * 2020-09-21 2021-01-15 西北工业大学 基于深度特征聚类和语义度量的不相关标签过滤方法
CN112232374B (zh) * 2020-09-21 2023-04-07 西北工业大学 基于深度特征聚类和语义度量的不相关标签过滤方法
CN112269889A (zh) * 2020-09-23 2021-01-26 上海市刑事科学技术研究院 交互式疑难人像检索的方法、客户端及***
CN114299633A (zh) * 2021-12-28 2022-04-08 中国电信股份有限公司 汽车驾驶事故预测方法、装置、电子设备及存储介质
CN114170484A (zh) * 2022-02-11 2022-03-11 中科视语(北京)科技有限公司 图片属性预测方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN111080551B (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
Wu et al. Unsupervised Deep Hashing via Binary Latent Factor Models for Large-scale Cross-modal Retrieval.
Yang et al. Visual sentiment prediction based on automatic discovery of affective regions
Zhang et al. Multi-pathway generative adversarial hashing for unsupervised cross-modal retrieval
Cheng et al. A survey and analysis on automatic image annotation
CN106649715B (zh) 一种基于局部敏感哈希算法和神经网络的跨媒体检索方法
WO2020249961A1 (en) Optimised machine learning
CN111783831B (zh) 基于多源多标签共享子空间学习的复杂图像精确分类方法
Yang et al. Improving multi-label learning with missing labels by structured semantic correlations
CN111080551A (zh) 基于深度卷积特征和语义近邻的多标签图像补全方法
CN107683469A (zh) 一种基于深度学习的产品分类方法及装置
JP2010165348A (ja) アノテーション付けを行う方法およびそのためのコンピュータプログラム
Zhang et al. Semi-supervised multi-view discrete hashing for fast image search
Chen et al. Structure-aware deep learning for product image classification
Rad et al. Image annotation using multi-view non-negative matrix factorization with different number of basis vectors
CN110008365B (zh) 一种图像处理方法、装置、设备及可读存储介质
CN116304066B (zh) 一种基于提示学习的异质信息网络节点分类方法
Zamiri et al. MVDF-RSC: Multi-view data fusion via robust spectral clustering for geo-tagged image tagging
CN110598022B (zh) 一种基于鲁棒深度哈希网络的图像检索***与方法
Xu et al. Enhancing semantic image retrieval with limited labeled examples via deep learning
Chen et al. Visual-based deep learning for clothing from large database
CN111985548A (zh) 一种标签引导的跨模态深度哈希方法
Zhu et al. Cross-modal retrieval: a systematic review of methods and future directions
Kakarash et al. Multi-label feature selection using density-based graph clustering and ant colony optimization
Bahrami et al. Automatic image annotation using an evolutionary algorithm (IAGA)
He et al. Multilabel classification by exploiting data‐driven pair‐wise label dependence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant